xy - Methodenlehre - Johannes Gutenberg

Werbung
Statistik &
Methodenlehre
e ode e e
Prof. Dr. G. Meinhardt
6. Stock, Wallstr. 3
((Raum 06-206))
Sprechstunde jederzeit
nach Vereinbarung und
nach der Vorlesung.
g
Mathematische und
statistische Methoden II
Dr. Malte Persike
} [email protected]
http://psymet03.sowi.uni-mainz.de/methods/
SS 2010
Fachbereich Sozialwissenschaften
Psychologisches Institut
Johannes Gutenberg Universität Mainz
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test – Grundlagen
– Der 2-Stichproben
2 Stichproben tt-Test
Test für abhängige Stichproben
beantwortet die Frage, ob zwei Messungen an einer
Stichprobe aus einer Population mit demselben
Erwartungswert stammen können.
– Die Stichproben müssen dieselben (bzw. gepaarte)
Merkmalsträger
g enthalten.
– Beispiele: „Verschlechtert sich die Konzentrationsleistung
nach Alkoholgabe“, „Verringert sich der Grad einer
psychischen Erkrankung durch Verhaltenstherapie“, „Ist
die Hörschwelle 24h nach einem Diskobesuch noch
verändert?“
Statistik &
Methodenlehre
e ode e e
Einführung
Tests für Ordinaldaten
Tests für Intervalldaten
Population zu Messzeitpunkt 1
Kennwerteverteilung
des Mittelwerts von
Differenzen
Sti h b ((n))
Stichprobe
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Δxy = 1 n ∑ ( x − y )
x
Δxy1 = x1 − y1
Wiederhole dies
k - mal
Δxy 2 = x2 − y2
Population zu Messzeitpunkt 2
Δxy k = xk − yk
y
Stichprobe (n)
{Δxy
1
Δxy 2 … Δxy k
– Wenn die Wahrscheinlichkeitsverteilung
g der Differenzen
und ihre Parameter bestimmt werden können, lässt sich
ein Test für den Mittelwert der Differenzen ableiten.
}
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test – Grundlagen
– Frage 1: Wie ist die Verteilung des Mittelwertes der
Differenzen zweier Zufallsvariablen X und Y?
– Die Differenz ist nichts anderes als eine Summe von
Summen von Zufallsvariablen und sollte gemäß des ZGS
normalverteilt sein.
– Frage
F
2
2: Wie
Wi ist
i t der
d Erwartungswert?
E
t
t?
2-Stichproben
t T t (abh.)
t-Test
( bh )
– Wenn beide Zufallsvariablen eigentlich dieselbe Population
abbilden (H0),
) so sollte gelten
μ X = μY
womit
μ X = μY ⇒ Δ μ
X μY
= μΔ
XY
denn der Mittelwert von Differenzen ist gleich der
Differenz von Mittelwerten.
=0
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test – Grundlagen
– Frage 3: Wie ist die Varianz?
– Für die Summe zweier Zufallsvariablen X und Y galt:
σ X2 +Y = σ X2 + σ Y2 + 2σ XY
– Für die Differenz zweier Zufallsvariablen X und Y galt:
σ X2 −Y = σ X2 + σ Y2 − 2σ XY
2-Stichproben
t T t (abh.)
t-Test
( bh )
– Dabei bezeichnet
be eichnet σXY die Kovarianz zwischen
ischen X und
nd Y
– Für abhängige Zufallsvariablen kann die Kovarianz jeden
beliebigen Wert annehmen.
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test – Grundlagen
– Wir haben gesehen,
gesehen dass der Mittelwert von Stichproben
einer Zufallsvariablen X selbst eine Zufallsvariable ist.
– Diese Zufallsvariable ist gemäß des ZGS normalverteilt:
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
X ~ NV ( μ X , σ X )
– Die Parameter gehen unmittelbar aus der Verteilung der
zugrunde liegenden Zufallsvariablen hervor:
μX = μX
1
σX =
⋅σ X
n
bzw. σ X2 =
σ X2
n
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test – Grundlagen
– Daraus kann nun direkt die Varianz der Differenz von
Mittelwerten berechnet werden
σ Δ2 =
σ Δ2
XY
n
XY
=
σ X2 + σ Y2 − 2σ XY
n
– Problem: Wir kennen die Populationsvarianzen zu den
nicht, sondern müssen sie aus Stichprobendaten schätzen.
2-Stichproben
t T t (abh.)
t-Test
( bh )
σˆ
2
Δ XY
und damit
n 2
n 2
=
sΔ XY =
s X + sY2 − 2s XY
n −1
n −1
σ
2
Δ XY
s X2 + sY2 − 2 s XY
=
n −1
Kovarianz
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test – Grundlagen
– Hinweis: Die Berechnung der Varianz der Differenzen aus
den Varianzen der Einzelstichproben
sΔ2 XY = s X2 + sY2 − 2s XY
ist mathematisch äquivalent
q
zur tatsächlichen Berechnung
g
der Varianz der Differenzen der Stichprobendaten
(
1 n
s = ∑ Δxyi − Δxy
n i =1
mit Δxyi = xi − yi
2
Δ XY
)
2
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test – Übersicht
Ü
– Für die Schätzung des Erwartungswertes der
Wahrscheinlichkeitsverteilung der Differenz von
Mittelwerten gilt:
μˆ Δ = μˆ X − μˆY = μˆ X − μˆY = x − y
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
XY
– Für die Schätzung der Populationsvarianz der
Wahrscheinlichkeitsverteilung von Mittelwerten gilt
σˆ Δ2
σˆ Δ2
XY
2
2
s
+
s
XY
X
Y − 2 s XY
=
=
n
n −1
– Daraus ergibt sich
der geschätzte
Standardfehler
σΔ =
XY
s X2 + sY2 − 2 s XY
n −1
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test
– Datenlage: Gegeben sind ein Populationsparameter μ
(Erwartungswert) sowie Daten aus einer Stichprobe der
Größe n zu 2 Messzeitpunkten x1…xn und y1…yn
– Frage: Können die Stichproben aus
einer Population stammen, in der gilt
μ = μ X = μY
– Es können dann folgende Hypothesen geprüft werden:
a) H 0 : μˆ X = μˆY ; H1 : μˆ X ≠ μˆY
b) H 0 : μˆ X ≤ μˆY ; H1 : μˆ X > μˆY
c)) H 0 : μˆ X ≥ μˆY ; H1 : μˆ X < μˆY
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test
– Datenlage: Gegeben sind ein Populationsparameter μ
(Erwartungswert) sowie Daten aus einer Stichprobe der
Größe n zu 2 Messzeitpunkten x1…xn und y1…yn
– Frage: Können die Stichproben aus
einer Population stammen, in der gilt
μ = μ X = μY
– Der t-Test
t Test für 2 abhängige Stichproben prüft diese
Hypothesen in abgewandelter Form:
a) H 0 : Δ μˆ X μˆY = 0; H1 : Δ μˆ X μˆY ≠ 0
b) H 0 : Δ μˆ X μˆY ≤ 0; H1 : Δ μˆ X μˆY > 0
c) H 0 : Δ μˆ X μˆY ≥ 0; H1 : Δ μˆ X μˆY < 0
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test
– Die Prüfung μ = μX = μY ist
gleichbedeutend ist mit
μˆ Δ = Δ μˆ μˆ = x − y = 0
XY
x Y
weil μ x = μ X und μY = μY
– Wir fragen
g also,, mit welcher Wahrscheinlichkeit ein so
extremer Mittelwert von Differenzen wie der beobachtete
oder ein noch extremerer aufträte, wenn die Stichproben
in Wahrheit aus derselben Population
p
stammen.
(
– Die Wahrscheinlichkeitsverteilung
der Differenz ist bekannt
x ~ NV μΔ , σ Δ
– Wenn μ = μX = μY, ist dies
x ~ NV 0, σ Δ
– Alle benötigten Parameter können aus den
Stichprobendaten geschätzt werden
(
XY
XY
)
XY
)
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
Der abhängige 2-Stichproben t-Test
– Daraus ließe sich ein dem z-Test analoger Test
konstruieren.
– Die Prüfgröße
z=
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
μˆ Δ − 0
XY
σˆ Δ
XY
μˆ X − μˆY
=
σˆ Δ
XY
ist standardnormalverteilt, wenn gilt
μˆ = μˆX = μˆY
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test
– Aber: Wieder zeigte Student für die Prüfgröße
μˆ x − μˆ x
t=
σΔ
XY
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
dass sie nur für Stichproben mit großen Umfängen n
gegen die Normalverteilung geht
– Die tatsächliche Verteilung von t ist wieder eine tVerteilung
– Die t-Verteilung hat genau einen Parameter, die so
genannten Freiheitsgrade (df)
– Dieser ist df = n – 1
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test
– Die Prüfgröße für den 2-Stichproben t-Test für
abhängige Stichproben berechnet sich als
μˆ X − μˆY
t=
=
σΔ
XY
x−y
s X2 + sY2 − 2 s XY
n −1
wobei sX und sY die Standardabweichungen der
Stichprobendaten sind und sXY die Kovarianz
– Sie ist t-verteilt mit df = n – 1.
– Für n ≤ 30 muss die Zufallsvariable in der Population
normalverteilt sein, damit die Annahme der t-Verteilung
gehalten werden kann.
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test –
Voraussetzungen
1-Stichproben
p
t-Test
– Normalverteilung des Merkmals in der Population für
Stichprobengrößen von n ≤ 30.
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
– Abhängigkeit der Stichproben bzw. der
g darin,, so dass diese paarweise
p
Merkmalsträger
zugeordnet werden können.
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
Tests für Intervalldaten
Der abhängige 2-Stichproben t-Test
Beobachtung im Experiment:
x, y
Frage: Stammen die Stichproben aus derselben Population?
Geht die Größe der Mittelwertsdifferenz auf einen Stichprobenfehler zurück?
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
(1) Festlegung von Signifikanzniveau α Achtung: Vorher
und Gerichtetheit
immer Prüfung der
Voraussetzungen!
g
(2) Berechnung der Prüfgröße t
(3) Berechnung
e ec u g de
der Wahrscheina sc e
lichkeit für dieses oder ein
extremeres z: z. B. p(X≥ t)
(4) Vergleich von p mit α und
Treffen der Signifikanzaussage
Aber: Bei dieser
Aussage irrt man
sich mit einer
Wahrscheinlichkeit
von α·100%
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Unabhängig vs. abhängig
– Frage:
g Sollte ein Experimentaldesign
p
g eher auf einen tTest für unabhängige Stichproben oder für abhängige
Stichproben abzielen?
– Der t-Test für unabhängige Stichproben scheint zunächst
testschärfer, weil seine Prüfgröße einer Verteilung mit
doppelt so vielen Freiheitsgraden folgt, die damit
schmaler ist.
– Dieser Unterschied wirkt sich jedoch bei normalen
Sti h b
Stichprobengrößen
öß (n>30)
( 30) kaum
k
mehr
h aus
– Wesentlich relevanter ist die Höhe des
Standardfehlers der beim t-Test
Standardfehlers,
t Test für abhängige
Stichproben kleiner ist, sobald die Kovarianz größer 0 ist.
Statistik &
Methodenlehre
e ode e e
Tests für Ordinaldaten
Einführung
Tests für Intervalldaten
1-Stichproben
p
t-Test
2-Stichproben
t-Test (unabh.)
2-Stichproben
t T t (abh.)
t-Test
( bh )
Tests für Intervalldaten
Unabhängig vs. abhängig
– In der Praxis ist der abhängige
g g Fall dem unabhängigen
gg
Fall hinsichtlich der Teststärke deshalb zumeist klar
überlegen.
– Aber: Für jedes Untersuchungsdesign mit abhängigen
Stichproben gelten dieselben kritische Punkte, u.a.
•
Carry-Over
Carry
Over Effekte zwischen den
Messzeitpunkten (z.B. Lerneffekte)
•
Drop-Outs zu späteren Messzeitpunkten
reduzieren die gesamte Stichprobe
•
Das Untersuchungsdesign sollte nicht auf eine
negative Kovarianz zwischen den Messzeitpunkten
abzielen
Statistik &
Methodenlehre
e ode e e
Relevante Excel Funktionen
– Tests für Intervalldaten
• KOVAR()
Herunterladen