2 - Henning Brand

Werbung
Dr. Henning Brand
Diplom-Psychologe
Mk 1.2
Universität zu Köln
SS 06
Meine Anforderungen:
Regelmässige Teilnahme (max. zwei Fehltermine)
Credit Points:
2 = Regelmässige Teilnahme und aktive Mitarbeit,
inklusive der kleinen Übungsaufgaben
3 = wie 2 plus Klausur
4 = wie 3 plus eine schriftliche Ausarbeitung über
eine im Seminar behandelte Originalarbeit
Seminarmaterialien unter:
www.henningbrand.de/uni/seminar.html
e-mail: [email protected]
Sprechzeiten:
Donnerstag 12.00 nach Vereinbarung
Was bisher geschah:
Bei ethnologischen Studien in Riesenland und Zwergenland haben wir festgestellt, daß sich die Bewohner der
beiden Länder durch ihre Körpergröße unterscheiden.
Die beste Angabe zur Körpergröße einer Nation ist
der Mittelwert M. Wir erhalten die mittlere Körpergrösse,
indem wir die Summe ∑ der Einzelwerte xi bilden und
durch die Anzahl N der Einzelwerte dividieren:
∑ xi
M=
N
“Körpergröße” ist eine Variable. Das heißt: sie ändert
ihre Werte. Es gibt verschiedene Ausprägungen der
Variablen “Körpergröße”.
Der Mittelwert M ist der Wert, den eine Variable am
wahrscheinlichsten annimmt. Wir können uns diesen
Wert als “Schwerpunkt” oder “Gravitationszentrum”
vorstellen.
Der Mittelwert ist das Gleichbleibende an einer
Variablen.
Es reicht nicht aus, nur den Mittelwert einer Variablen
zu kennen. Denn wir müssen auch wissen, wie stark
sie sich verändert (variiert). Das Mass dafür heißt
Varianz.
Berechnung der Varianz:
a) Bestimme die Abweichung jedes Einzelwertes xi vom
Mittelwert M.
b) Es gilt immer: ∑ (M - xi) = 0
V
M
M = Mittelwert / „Wasserstand“
V = Varianz / „Seegang“
Lösung des Problems:
c) Quadriere die Abweichungen (M - xi)!
d) Die Varianz s2 ist dann:
s2 =
∑ (M - xi)2
N
e) Die Standardabweichung s ist die Wurzel aus der
Varianz.
Frage: Warum? Wieso wird nicht statt dessen mit dem
Betrag der Abweichung gerechnet?
Antwort: Pythagoras
x2
M - x2
M
-x
M
√(
2
)
-x 2
M
(
)2 +
M - x1
x1
Dividieren wir vor dem Wurzelziehen durch N, so entspricht √(M-x)2+(M-x2)2 der Standardabweichung s.
Messen in der Statistik
=> Skalierung einer Variablen
Nominalskalierung
Kategoriale Daten / qualitative Unterschiede z.B.Männer/Frauen
Es gibt keine Abstände zwischen Kategorien, Unterschiede sind
nicht interpretierbar im Sinne von „mehr“ oder „weniger“
Ordinalskalierung
Ordinale Daten / quantitative Unterschiede z.B. Schulnoten. Es
gibt Abstände zwischen Kategorien, Unterschiede sind interpretierbar,
im Sinne von „mehr“ oder „weniger“, die Abstände sind nicht gleich.
Intervallskalierung
metrische Daten, quantitative Unterschiede z.B. Testleistung in einem
Konzentrationstest, Unterschiede interpretierbar, Abstände sind gleich,
denn: 4 Fehler sind doppelt soviel wie 2 Fehler
Statistik
(„Bestandsaufnahme“)
Zusammenhänge
beschreiben
Unterschiede
erklären
„Es gibt einen Zusammenhang zwischen Verhaltensauffälligkeiten bei Kindern und dem Erziehungsstil
der Eltern“
„Kinder, die mit Erziehungsstil X erzogen werden,
zeigen mehr Verhaltensauffälligkeiten als Kinder,
die mit Erziehungsstil Y erzogen werden.“
VA (X) > VA (Y)
⇒
Eine Aussage über Zusammenhänge ist
immer beschreibend.
⇒
Ziel der Wissenschaft: Erklärung
Auch Unterschiede lassen sich beschreiben - wir verstehen
unter VA (X) > VA (Y) jedoch mehr :
Der Erziehungsstil erklärt die Verhaltensauffälligkeiten
Wann kann ich sagen, dass der
Erziehungsstil VA erklärt?
Erklärung impliziert, Zusammenhänge zu vergleichen;
um den Einfluss von Erziehungsstil auf Verhalten zu
erklären, muss ich mindestens zwei Erziehungsstile
miteinander vergleichen.
Kausalität
“For X to be a cause of Y, two conditions must hold:
first, that X and Y both happen; and second, that Y
would not have happened if X had been otherwise.”
from David Deutsch: “The Fabric of Reality”, p. 274
Unterschiede
X
Y
Xdiff
non Y
Zusammenhänge
Bildzeitung:
“Wissenschaftler zeigen: Kinderlose haben Erfolg
im Beruf.”
Die Grundannahme des Induktivismus
Beobachtungen
Vorhersage
Verallgemeinerung
„Theorie“
Hühner & andere Problem des Induktivismus
Wissenschaftliches Problemlösen
Problem
Lösungsvorschlag / Theorie
Kritik /experimentelles Testen
Verwerfen falscher Theorien
neues Problem
Voraussetzung jeder Beobachtung: Ich habe schon eine
Annahme / Frage / Theorie.
Beobachtung ist nie „einfach so“
Rolle der statistischen Methoden
Kritik / Testen von Annahmen:
=> Bestehen erwartete (Kausal-)zusammenhänge?
=> Bestehen erwartete Unterschiede?
Die statistische Sprache kann sowohl Zusammenhänge
als auch Unterschiede ausdrücken - kann sie auch
erklären?
Nein - wenn gilt VA (X) > VA (Y), dann ist die Erklärung
dafür in inhaltlichen Merkmalen von X und Y zu suchen.
Thema 1 : Beschreibung von Zusammenhängen
In einer Schulklasse von 15 Kindern werden drei Grössen
untersucht:
a) Erziehungsstil der Eltern 0=liberal bis 10=autoritär
b) Motorische Unruhe der Kinder 0=ruhig bis 10=unruhig
c) Selbstvertrauen der Kinder 0=gering bis 10=sehr hoch
Annahme: Es besteht ein Zusammenhang zwischen
Autoritarismus (A) und Selbstvertrauen (S).
Es wird vermutet, daß autoritärer Erziehungsstil mit
geringem Selbstvertrauen der betroffenen Kinder
einhergeht.
Bei Autoritarismus (A) und Selbstvertrauen (S) handelt
es sich um Variablen.
Fragen bei einer Variablen:
⇒ Wie stark ändert sie sich?
⇒Was verändert sich nicht?
⇒ M - „Wie autoritär sind sie insgesamt?“
⇒ V - „Wie stark schwanken die Einzelwerte?“
V
M
M = Mittelwert / „Wasserstand“
V = Varianz / „Seegang“
Grundidee der Korrelation
X
Y
Wenn ein Zusammenhang der Schwankungen von X und
Y besteht, dann muss sich die Variabilität
∑(Mx - xi)2 bzw. ∑(My - yi)2
ausdrücken lassen
durch:
∑(Mx - xi)*(My - yi)
Ist der Zusammenhang perfekt, dann gilt :
∑(Mx - xi)2 = ∑(My - yi)2
=
∑(Mx - xi)*(My - yi)
so dass:
r=
∑ (Mx - xi)*( My - yi)
√ ∑(M - x )2 * ∑(M - y )2
x
i
y
i
=1
Wenn der Zusammenhang nicht perfekt ist, wird
∑(Mx - xi)*(My - yi) < √∑(Mx - xi)2 * ∑(My - yi)2
so dass r < 1 wird.
Wenn die Wellen im Aquarium 2 genau entgegengesetzt
ausschlagen, ist r = - 1 wird.
∑(Mx - xi) = ∑ (My - yi)
so dass
Vpn
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Sum
Mean
Aut
7
2
1
3
9
4
0
3
3
6
8
1
9
2
2
60
4
M-x
-3
2
3
1
-5
0
4
1
1
-2
-4
3
-5
2
2
0
(M-x)2 Selb
9
3
4
8
9
9
1
7
25
3
0
5
16
9
1
6
1
6
4
3
16
2
9
5
25
7
4
8
4
9
128
90
6
M-x (M-x)2 Mot
3
9
5
-2
4
0
-3
9
0
-1
1
0
3
9
8
1
1
1
-3
9
2
0
0
4
0
0
4
3
9
7
4
16
6
1
1
1
-1
1
5
-2
4
1
-3
9
1
0
82
45
3
M -x (M-x)2
-2
4
3
9
3
9
3
9
-5
25
2
4
1
1
-1
1
-1
1
-4
16
-3
9
2
4
-2
4
2
4
2
4
0
104
Berechnung der Covarianz
Sum
Aut
7
2
1
3
9
4
0
3
3
6
8
1
8
2
2
60
M-x
-3
2
3
1
-5
0
4
1
1
-2
-4
3
-5
2
2
0
(M-x)2
9
4
9
1
25
0
16
1
1
4
16
9
25
4
4
128
Selb
3
8
9
7
3
5
9
6
6
3
2
5
7
8
9
90
M-y (M-x)(M-y)
3
-9
-2
-4
-3
-9
-1
-1
3
-15
1
0
-3
-12
0
0
0
0
3
-6
4
-16
1
3
-1
5
-2
-4
-3
-6
0
-74
Bivariate Korrelation
Autoritarismus / Selbstvertrauen
r=
-74
√128*82
= -.72
Autoritarismus / Motorische Unruhe
95
r=
= .82
√128*104
Selbstvertrauen / Motorische Unruhe
r=
-70
√82*104
= -.76
Daraus folgt: Der Korrelationskoeffizient r ist abhängig
von den Parametern M (Mittelwert) und S2 (Varianz).
Er heisst daher parametrischer Korrelationskoeffizient.
Er kann Werte zwischen 1 und - 1 annehmen.
Dieser Koeffizient wird auch Pearson-Korrelation genannt.
Er setzt intervallskalierte Variablen voraus.
Der Korrelationskoeffizient ist ein gängiges statistisches
Mass, um Zusammenhänge zu beschreiben.
Problem:
⇒ Ich habe in der Praxis oft kleine Gruppen.
⇒ Ich interessiere mich für Merkmale, die ich
nur qualitativ messen kann.
Aufgabe:
Finden Sie eine Fragestellung aus Ihrem Studium,
bei der Ihnen der Korrelationskoeffizient hilft und
eine, bei der Sie einen Zusammenhang zwischen
qualitativen Merkmalen untersuchen würden!
Beispiele für Korrelationen in der Praxis:
⇒Testverfahren (basieren auf korrelativen Methoden)
⇒Diagnostik in der Schulpraxis
⇒Sonderpädagogische Forschung z. B. zur Studienund Arbeitsmotivation
Beispiele für qualitative Variablen:
⇒ Geschlecht
⇒ Ausbildung der Eltern
⇒ Kategoriensysteme zur Verhaltensbeobachtung
24.11.05 - Themen des Tages
Freiheitsgrade
Quantitative vs. Qualitative Methoden
Hypothesentest
Erwartungswert
Wahrscheinlichkeitsverteilungen
… an einem schulpraktischen Beispiel
Quantitative Variablen beschreiben, wieviel Einheiten einer
Größe vorhanden sind.
Qualitative Variablen beschreiben, wie etwas beschaffen
ist.
Beispiel 1: quantitativ
Vpn
1
2
3
4
5
6
7
Sum
Mean
X
5
3
8
6
3
8
2
35
5
(M-x)
0
2
-3
-1
2
-3
3
0
Beispiel 2:qualitativ
Männer
Frauen
Freischütz : “Sechse treffen, sieben äffen”
Vpn
1
2
3
4
5
6
7
Sum
Mean
X
5
3
8
6
3
8
2
35
5
(M-x)
0
2
-3
-1
2
-3
3
0
Freiheitsgrade
degrees of freedom
df
Würfel
Würfel
1
Sum
2
1
1
2
1
2
3
1
3
4
1
4
5
1
5
6
1
6
7
2
1
3
2
2
4
2
3
5
2
4
6
2
5
7
2
6
8
3
1
4
3
2
5
3
3
6
3
4
7
3
5
8
3
6
9
4
1
5
4
2
6
4
3
7
4
4
8
4
5
9
4
6
10
5
1
6
5
2
7
5
3
8
5
4
9
5
5
10
5
6
11
6
1
7
6
2
8
6
3
9
6
4
10
6
5
11
6
6
12
A
A
A
B
B
B
A
A
B
B
B
B
A
B
B
B
B
C
B
B
B
B
C
C
B
B
B
C
C
C
B
B
C
C
C
C
Erwartungswert: 7
A (Sum = 1- 4): 6
B (Sum = 5- 8): 20
C (Sum = 9-12): 10
Die Standardnormalverteilung
Eigenschaften
68% der Fälle innerhalb einer Standardabweichung von µ.
10% der Fälle sind mehr als 1.65 Standardabweichungen
von µ entfernt.
5% > 1.96 Standardabweichungen von µ.
Warum ist die Normalverteilung so wichtig?
⇒Größen (IQ, Körpergröße u.a.) können normalverteilt sein.
⇒Der Messfehler, den wir bei jeder Messung in
Pädagogik / Psychologie machen ist ein Zufallsereignis
und folgt der Normalverteilung
⇒Wenn wir von einer normalverteilten Größe Stichproben
ziehen, sind Mittelwerte und Varianzen der Stichproben
normalverteilt egal wie gross (oder klein) die Stichproben
sind.
⇒Wenn, und nur wenn eine Population normalverteilt
ist, sind bei unabhängigen Stichproben die Varianzen
und Mittelwerte unabhängig voneinander.
Der zentrale Grenzwertsatz
Die Normalverteilung kann angewendet werden, auch
wenn eine Variable in der Population nicht normalverteilt ist.
Wenn eine Population eine endliche Varianz σ2 und
einen endlichen Mittelwert µ hat, dann wird mit steigendem Stichprobenumfang N die Stichprobenverteilung
des Mittelwerts und der Varianz annähernd normal.
Erwartungswert der Stichprobenmittelwerte ist µ.
Erwartungswert der Stichprobenvarianz ist σ2 /N.
Bei N=30 ist diese Annäherung bereits sehr gut.
Der zentrale Grenzwertsatz
Die Untersuchung von Unterschieden: Gruppenvergleiche
Frage 1: Wie können wir Unterschiede untersuchen?
Grundüberlegung: Wahrscheinlichkeitsverteilungen
Beispiel: IQ-Test
Ein IQ-Test ist so normiert, dass der Mittelwert µ = 100
und die Standardabweichung σ = 10 ist.
Das bedeutet: Die Population, auf die sich der Test
bezieht, hat den Mittelwert µ = 100 und die Standardabweichung σ = 10.
Sie haben in einer vierten Klasse einen Intelligenztest
durchgeführt. Der Test ist so normiert, daß µ=100
und σ=10 ist. Sie haben zwei Schüler, Dieter und
Thomas.
Dieter hat einen Testwert von 120.
Thomas hat einen Testwert von 80.
Wie können wir solche Ergebnisse interpretieren?
Grundannahme: Die Verteilung der Testwerte folgt
einer Gesetzmäßigkeit, wonach Werte, die weit vom
Mittelwert entfernt liegen, seltener (d.h. unwahrscheinlicher) sind, als solche, die nah am Mittelwert liegen.
Grundmodell: Normalverteilung
Thema 2 - Hypothesentest
Ein Referendar glaubt, dass mathematische Begabung
geschlechtsspezifisch und invariant sei. Er hält seine männlichen Schüler daher für grundsätzlich begabt und seine
Schülerinnen für unbegabt. Als Fachleiterin beobachten
Sie den Unterricht der Lehrkraft und beobachten, dass
die Jungen in der Klasse anders behandelt werden als die
Mädchen. Während der Lehrer die Jungen eher mit Lob
aufbaut und ermutigt, scheint er die Mädchen eher zu
tadeln und zu entmutigen. Um dem Problem auf den Grund
zu gehen, bilden Sie Kategorien für lobendes und tadelndes Lehrerverhalten, filmen eine Unterrichtssequenz und
lassen diese durch zwei unabhängige Beobachter be urteilen.
Die Beobachter kommen zu folgendem Ergebnis:
(N = 15 beobachtete Verhaltenseinheiten)
Tadel
Lob
Jungen
1
8
Mädchen
4
2
Der Referendar behauptet, sein Unterricht sei fair, die
Wahrscheinlichkeit für Lob und Tadel sei für Jungen und
Mädchen gleich, und nur von der fachlichen Leistung
abhängig.
Wir erforschen hypothesengeleitet den Wahrheits gehalt dieser Aussage:
Hypothesentestende Forschung
H0 = Lob/Tadel sind unabhängig vom Geschlecht
(Nullhypothese)
H1 = Lob/Tadel sind abhängig vom Geschlecht
(Alternativhypothese)
Beachten Sie:
⇒ Die Forschungshypothese, die wir inhaltlich formulieren, ist die Alternativhypothese H1.
⇒Wir gehen also zunächst davon aus, dass die
Nullhypothese H0 zutrifft. Wir testen konservativ.
⇒Die Forschungshypothese lässt sich als Zusammenhangshypothese formulieren: Es gibt einen Zusammenhang zwischen dem Geschlecht der Schüler und dem
Lehrerverhalten.
⇒Die Forschungshypothese lässt sich als Unterschiedshypothese formulieren: Jungen werden gegenüber
Mädchen bevorzugt
Erster Schritt: Wir ermitteln die Erwartungswerte
Tadel
Lob
Jungen
1
8
9
Mädchen
4
2
6
5
10
N = 15
Randsummen
Tadel
Lob
Jungen
9*5
15
=3
9*10
15
=6
Mädchen
6*5
15
=2
6*10
15
=4
5
10
9
6
Erwartungswert : = Ausprägung einer Variablen,
oder einer Kombination von
Variablen, die wir erwarten
zu beobachten, falls bestimmte
Annahmen bezüglich dieser
Variablen zutreffen.
Hier:
Häufigkeiten von Lob / Tadel bei Jungen
und Mädchen, die wir erwarten, falls
„Lehrerverhalten“und „Geschlecht der
Schüler“ unabhängige Ereignisse sind.
Tadel
Jungen
Mädchen
Lob
beobachtet: 1
erwartet: (3)
1-3=-2
beobachtet: 8
erwartet: (6)
8-6=2
9
beobachtet: 4
erwartet: (2)
4-2=2
beobachtet: 2
erwartet: (4)
2-4=-2
6
5
10
N = 15
χ2 =
=
(1-3)2
(8-6)2
(4-2)2 (2-4)2
+
+ 4
+ 6
3
2
1,3 +
0,7 +
2
+
1
=5
ν = 1 Freiheitsgrade / df (degrees of freedom)
χ2
p < .05
0
3.84
∞
Die Chi-Quadrat Funktion in Abhängigkeit von ihren
Freiheitsgraden (df)
Chi-Quadrat Anpassungstest
Prüfgröße:
χ2 =5
χ2 = 5 > χ2krit = 3.84
Der Test ist signifikant.
Die Nullhypothese Ho wird verworfen.
Es besteht ein signifikanter Zusammenhang zwischen
dem Lehrerverhalten (Lob/Tadel) und dem Geschlecht
der Schüler.
Jungen werden gegenüber Mädchen bevorzugt.
Die Wahrscheinlichkeit, dass dieses Ergebnis zufällig
beobachtet wurde (Irrtumswahrscheinlichkeit) ist p<.05.
Sie können die Zahlen aus diesem Beispiel auch erhalten,
wenn sie auf unsere erste Studie zurückgreifen:
ja
Autoritär nein
ja
1
8
nein
4
2
Selbstvertrauen
Wir haben eine Menge getan:
⇒Gezeigt, dass sich Zusammenhänge ganz einfach
messen lassen (kategoriale, dichotome Variablen)
⇒Wir haben eine Wahrscheinlichkeitsverteilung eingesetzt, um zu entscheiden, ob ein Zusammenhang
„überzufällig“ ist, oder nicht.
⇒Wir haben die Hypothesen getestet.
⇒Wir haben die wichtigste Wahrscheinlichkeitsverteilung kennengelernt.
⇒Wir haben den Unterschied von Deskriptiv- und
Inferenzstatistik erarbeitet.
Statistische Grundbegriffe, die wir kennengelernt haben
!Klausurtraining!
⇒bivariate Korrelation (Pearson-Korrelation)
⇒Variable
⇒arithmetisches Mittel
⇒Varianz / Standardabweichung
⇒Nominalskala/kategoriale Daten/dichotome Variable
⇒Ordinalskala
⇒Intervallskala (metrische Skala)
⇒Hypothese (Nullhypothese H0, Alternativhypothese H1)
⇒Hypothesentest
⇒Prüfgrösse
⇒Zusammenhangshypothese
⇒Unterschiedshypothese
⇒Veränderungshypothese (wichtig für Evaluation)
⇒gerichtete / ungerichtete Hypothese
⇒Erwartungswert
⇒Wahrscheinlichkeitsverteilung
⇒Freiheitsgrade
⇒Chi-Quadrat Test
⇒Deskriptivstatistik
⇒Inferenzstatistik
Lesen Sie für die nächste Sitzung:
Borchert, J., & Runow, V. (2003). Effektive Intervention im
sonderpädagogischen Arbeitsfeld- ein Vergleich zwischen
Forschungsergebnissen und Lehrereinschätzungen.
Zeitschrift für Heilpädagogische Forschung,4, 189-203.
(Bibliothek und Raum 329 bei Frau Murawski)
1.) Inwiefern sind die Lehrkräfte über den aktuellen
Forschungsstand bezüglich effektiver Intervention
informiert?
2.) Welche Interventionen halten Lehrkräfte für
sehr effektiv?
3.) Welche Interventionen erweisen sich in der
pädagogischen Forschung als sehr effektiv?
Welche als wenig effektiv?
4.) Wie erklären Sie sich die Ergebnisse dieser
Untersuchung?
5.) Überlegen Sie sich Beispiele für den Unterrichtseinsatz von Interventionen mit sehr hoher Effektivität!
Die Vier - Punkte Aufgabe
Abgabe: Klausurtermin am 02.02.05
Ritalin statt Peer-Tutoring und Training sozialer
Kompetenzen?
a)
Nach Borchert und Runow ist Ritalin wirksamer als o.g. Interventionsmethoden.
Welche Methodischen Probleme könnten für die unterschiedliche Wirksam keit der Interventionsmethoden verantwortlich sein, die in dem Artikel
besprochen werden?
b)
Informieren Sie sich über Training sozialer Kompetenzen. Welche Methoden
und Möglichkeiten gibt es? Wie wirksam sind diese Methoden?
c)
Vergleichen Sie das Training sozialer Kompetenzen mit den hoch wirksamen
Interventionsmethoden. Diskutieren Sie dabei die praktischen Einsatzmöglichkeiten der verschiedenen Interventionsmethoden im Unterricht.
d)
Sind die Ergebnisse von Borchert und Runow wirklich so “katastrophal” für
SonderschullehrerInnen? Begründen Sie Ihre Position!
Der Solomon - Vier-Gruppenplan
Gruppe 1: O - T - O
Gruppe 2: O
Gruppe 3:
Gruppe 4:
O
T-O
O
Gruppe 1
Gruppe 3
Gruppe 2
Gruppe 4
Messung 1
Messung 2
Merkmale des Experiments
⇒Kontrolle von Störfaktoren
⇒Wiederholbarkeit
⇒Reproduzierbarkeit
⇒kontrollierte Manipulation der
unabhängigen Variablen
⇒Zufallsaufteilung der Teilnehmer auf die
Versuchsbedingungen (Randomisierung)
Multiplikation soll im Mathematikunterricht nach zwei
verschiedenen Methoden unterrichtet werden:
a) In Addition umwandeln (z.B. 3*3 = 3+3+3)
b) Geometrisch (3*3 ist Fläche mit neun Kästchen)
Je drei Klassen werden nach einer der beiden Methoden
unterrichtet. Nach einiger Zeit wird als Erfolgskontrolle
ein Test geschrieben, der zehn Aufgaben hat.
Wir betrachten im folgenden, wie sich die Ergebnisse
auswerten lassen.
Methode:
Addition
Methode:
Graphisch
Klasse 1
Klasse 2
Klasse 3
2
3
1
6
7
5
Mean
Sum of Squares (SS)
2
2
6
2
Overall Mean
Overall SS
4
28
Methode 1: t-Test für unabhängige Stichproben
H0: µ1 = µ2
H1: µ1 ≠ µ2
Problem: Die Standardabweichung der Population ist unbekannt. Wir können nicht die Normalverteilung
zum testen nehmen, da wir z nicht bestimmen
können. Wir schätzen daher σ und benutzen die
t-Verteilung.
4*0.67 * 6
estσ =
4
9
4
t=
= 8,51
0,47
= 0,47
Die Freiheitsgrade für den t-Test für Differenzen sind
N1 + N2 - 2 = 4 in diesem Beispiel.
Der kritische t - Wert in unserem Beispiel ist t = 2.78
für perror < .05
Die Prüfgrösse t = 8,51 ist grösser als tkrit = 2.78
⇒Die Nullhypothese wird verworfen.
⇒Es besteht ein signifikanter Unterschied zwischen den
Gruppen.
Zusammenfassung:
Der t-Test vergleicht Unterschiede zwischen zwei
Gruppen. Dabei wird die Populationsvarianz aus
der Stichprobenvarianz geschätzt. Dies ist besonders
bei kleinen Stichproben erforderlich.
Methode 2 : Die Varianzanalyse (ANOVA)
Methode:
Addition
Methode:
Graphisch
Klasse 1
Klasse 2
Klasse 3
2
3
1
6
7
5
Mean
Sum of Squares (SS)
2
2
6
2
Overall Mean
Overall SS
4
28
Grundidee 1: Es gibt Unterschiede innerhalb der Gruppen.
Grundidee 2: Es gibt Unterschiede zwischen den Gruppen.
Die Quadratsummen (SS) innerhalb der Gruppen sind
Fehlerterme. Sie geben die zufällige Abweichung der
einzelnen Klassen im Test wieder.
Die Quadratsummen zwischen den Gruppen sind die
interessanten: Sie geben an, wie stark der Unterschied
ist, der auf die Unterrichtsmethode zurückzuführen ist.
Varianzanalyse
Haupteffekt
SS
Effect 24,0
Error
4,0
df
1
4
MS
F
24,0 24,0
1,0
p
.008
Die Varianzanalyse kann alles, was der t-Test leistet.
Sie kann aber noch mehr als der t-Test, und ist deshalb
als Methode zu bevorzugen.
⇒Sie zeigt die verschiedenen Varianzquellen auf.
⇒Sie ist geeignet, mehr als zwei Gruppen miteinander
zu vergleichen.
Beispiel:
In unserem Beispiel haben wir gemischte Klassen. Dabei
werden Kinder mit Lernstörungen zusammen mit Kindern
unterrichtet, die keine Schwierigkeiten, speziell nicht im
Mathematikunterricht haben.
Ein mögliches Ergebnis der Studie:
Methode:
Addition
Methode:
Graphisch
Lernstörung
2
3
1
6
7
5
M
2
6
keine
Lernstörung
5
6
4
6
7
5
M
5
6
Interpretation:
Die Wirkung der Unterrichtsmethode ist abhängig
von der Schülergruppe (LB + / LB -). Die Schüler mit
Lernstörungen profitieren stärker von der graphischen
Methode.
M
6
2
Addition
Graphisch
Definition: Interaktion in der Varianzanalyse
Die Wirksamkeit der Unterrichtsmethode ist abhängig
von der Schülergruppe, die unterrichtet wird. Die
Schüler mit Lernstörung profitieren stärker.
Die Auswirkung der Variablen „Unterrichtsmethode“
ist abhängig von der Ausprägung der Variablen „Lernstörung“
Allgemein:
Die Auswirkung einer unabhängigen Variablen ist
abhängig von der Ausprägung einer anderen unabhängigen Variablen.
Unabhängige Variable:
Wird in einer Untersuchung kontrolliert verändert.
Frage ist diese Schulstudie ein Experiment?
Merkmale des Experiments:
Das Experiment ermöglicht das Testen von kausalen
Hypothesen durch:
⇒kontrollierte Veränderung der unabhängigen Variablen
⇒zufällige Verteilung der Versuchsteilnehmer auf die
Bedingungen (Randomisierung)
⇒Kontrolle von Störvariablen
In der Schulstudie werden die Schüler nicht zufällig
auf die Unterrichtsmethoden „Addition“/„Graphisch“
verteilt.
Es handelt sich daher um eine quasiexperimentelle
Studie.
Unterschied zwischen Experiment und QuasiExperiment:
Fehlende Randomisierung
Fehlende Parallelisierung
Schüler/-in
Testwert vorher
Testwert nachher
01.) Horst- Kevin
12
20
02.) Dennis
15
19
03.) Yvonne
10
13
04.) Hulk
1
10
05.) Henk
7
1
06.) Karl
12
18
07.) Peter
10
12
08.) Bart
4
6
09.) Livia
19
19
10.) Nicole
17
18
11.) Hoss
3
4
12.) Tara
10
4
Karl Josef Klauer (2002):
Wie viele haben denn nun wirklich vom Training profitiert?
Eine noch nicht eindeutig zu beantwortende Frage.
1.) Was ist die Fragestellung des Textes?
2.) Welche Methoden stehen zur Verfügung, um die
Wirksamkeit eines Trainings auf Einzelfallebene
zu prüfen?
3.) Welchen Versuchsplan benötigt man, um die Wirksamkeit eines Trainings zu testen, und warum?
4.) Welche Vorteile hat es, mehrere abhängige Variablen
zu untersuchen?
5.) Welche Fehlerquellen sind zu bedenken?
Ein Überblick über die Wahrscheinlichkeitsverteilungen:
Normalverteilung
nähert sich bei df=50 an
χ2
Zufallsvariable
Quadratsummen
Abweichungen von
Mittelwerten /
Erwartungswerten
nähert sich bei df=50 an
F
Quotient aus
2 χ2 - Verteilungen, jeweils dividiert durch ihre
df. Einsatz:
Mittelwertvergleiche
ANOVA u.a.
t-Verteilung
Zufallsvariable
wird eingesetzt für
Gruppenvergleiche
wenn Populationsvarianz unbekannt
Herunterladen