Statistik & Methodenlehre e ode e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 ((Raum 06-206)) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. g Mathematische und statistische Methoden II Dr. Malte Persike } [email protected] http://psymet03.sowi.uni-mainz.de/methods/ SS 2010 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Grundlagen Der 2-Stichproben 2 Stichproben tt-Test Test für abhängige Stichproben beantwortet die Frage, ob zwei Messungen an einer Stichprobe aus einer Population mit demselben Erwartungswert stammen können. Die Stichproben müssen dieselben (bzw. gepaarte) Merkmalsträger g enthalten. Beispiele: „Verschlechtert sich die Konzentrationsleistung nach Alkoholgabe“, „Verringert sich der Grad einer psychischen Erkrankung durch Verhaltenstherapie“, „Ist die Hörschwelle 24h nach einem Diskobesuch noch verändert?“ Statistik & Methodenlehre e ode e e Einführung Tests für Ordinaldaten Tests für Intervalldaten Population zu Messzeitpunkt 1 Kennwerteverteilung des Mittelwerts von Differenzen Sti h b ((n)) Stichprobe 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Δxy = 1 n ∑ ( x − y ) x Δxy1 = x1 − y1 Wiederhole dies k - mal Δxy 2 = x2 − y2 Population zu Messzeitpunkt 2 Δxy k = xk − yk y Stichprobe (n) {Δxy 1 Δxy 2 … Δxy k Wenn die Wahrscheinlichkeitsverteilung g der Differenzen und ihre Parameter bestimmt werden können, lässt sich ein Test für den Mittelwert der Differenzen ableiten. } Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Grundlagen Frage 1: Wie ist die Verteilung des Mittelwertes der Differenzen zweier Zufallsvariablen X und Y? Die Differenz ist nichts anderes als eine Summe von Summen von Zufallsvariablen und sollte gemäß des ZGS normalverteilt sein. Frage F 2 2: Wie Wi ist i t der d Erwartungswert? E t t? 2-Stichproben t T t (abh.) t-Test ( bh ) Wenn beide Zufallsvariablen eigentlich dieselbe Population abbilden (H0), ) so sollte gelten μ X = μY womit μ X = μY ⇒ Δ μ X μY = μΔ XY denn der Mittelwert von Differenzen ist gleich der Differenz von Mittelwerten. =0 Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Grundlagen Frage 3: Wie ist die Varianz? Für die Summe zweier Zufallsvariablen X und Y galt: σ X2 +Y = σ X2 + σ Y2 + 2σ XY Für die Differenz zweier Zufallsvariablen X und Y galt: σ X2 −Y = σ X2 + σ Y2 − 2σ XY 2-Stichproben t T t (abh.) t-Test ( bh ) Dabei bezeichnet be eichnet σXY die Kovarianz zwischen ischen X und nd Y Für abhängige Zufallsvariablen kann die Kovarianz jeden beliebigen Wert annehmen. Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Grundlagen Wir haben gesehen, gesehen dass der Mittelwert von Stichproben einer Zufallsvariablen X selbst eine Zufallsvariable ist. Diese Zufallsvariable ist gemäß des ZGS normalverteilt: 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) X ~ NV ( μ X , σ X ) Die Parameter gehen unmittelbar aus der Verteilung der zugrunde liegenden Zufallsvariablen hervor: μX = μX 1 σX = ⋅σ X n bzw. σ X2 = σ X2 n Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Grundlagen Daraus kann nun direkt die Varianz der Differenz von Mittelwerten berechnet werden σ Δ2 = σ Δ2 XY n XY = σ X2 + σ Y2 − 2σ XY n Problem: Wir kennen die Populationsvarianzen zu den nicht, sondern müssen sie aus Stichprobendaten schätzen. 2-Stichproben t T t (abh.) t-Test ( bh ) σˆ 2 Δ XY und damit n 2 n 2 = sΔ XY = s X + sY2 − 2s XY n −1 n −1 σ 2 Δ XY s X2 + sY2 − 2 s XY = n −1 Kovarianz Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Grundlagen Hinweis: Die Berechnung der Varianz der Differenzen aus den Varianzen der Einzelstichproben sΔ2 XY = s X2 + sY2 − 2s XY ist mathematisch äquivalent q zur tatsächlichen Berechnung g der Varianz der Differenzen der Stichprobendaten ( 1 n s = ∑ Δxyi − Δxy n i =1 mit Δxyi = xi − yi 2 Δ XY ) 2 Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Übersicht Ü Für die Schätzung des Erwartungswertes der Wahrscheinlichkeitsverteilung der Differenz von Mittelwerten gilt: μˆ Δ = μˆ X − μˆY = μˆ X − μˆY = x − y 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) XY Für die Schätzung der Populationsvarianz der Wahrscheinlichkeitsverteilung von Mittelwerten gilt σˆ Δ2 σˆ Δ2 XY 2 2 s + s XY X Y − 2 s XY = = n n −1 Daraus ergibt sich der geschätzte Standardfehler σΔ = XY s X2 + sY2 − 2 s XY n −1 Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test Datenlage: Gegeben sind ein Populationsparameter μ (Erwartungswert) sowie Daten aus einer Stichprobe der Größe n zu 2 Messzeitpunkten x1…xn und y1…yn Frage: Können die Stichproben aus einer Population stammen, in der gilt μ = μ X = μY Es können dann folgende Hypothesen geprüft werden: a) H 0 : μˆ X = μˆY ; H1 : μˆ X ≠ μˆY b) H 0 : μˆ X ≤ μˆY ; H1 : μˆ X > μˆY c)) H 0 : μˆ X ≥ μˆY ; H1 : μˆ X < μˆY Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test Datenlage: Gegeben sind ein Populationsparameter μ (Erwartungswert) sowie Daten aus einer Stichprobe der Größe n zu 2 Messzeitpunkten x1…xn und y1…yn Frage: Können die Stichproben aus einer Population stammen, in der gilt μ = μ X = μY Der t-Test t Test für 2 abhängige Stichproben prüft diese Hypothesen in abgewandelter Form: a) H 0 : Δ μˆ X μˆY = 0; H1 : Δ μˆ X μˆY ≠ 0 b) H 0 : Δ μˆ X μˆY ≤ 0; H1 : Δ μˆ X μˆY > 0 c) H 0 : Δ μˆ X μˆY ≥ 0; H1 : Δ μˆ X μˆY < 0 Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test Die Prüfung μ = μX = μY ist gleichbedeutend ist mit μˆ Δ = Δ μˆ μˆ = x − y = 0 XY x Y weil μ x = μ X und μY = μY Wir fragen g also,, mit welcher Wahrscheinlichkeit ein so extremer Mittelwert von Differenzen wie der beobachtete oder ein noch extremerer aufträte, wenn die Stichproben in Wahrheit aus derselben Population p stammen. ( Die Wahrscheinlichkeitsverteilung der Differenz ist bekannt x ~ NV μΔ , σ Δ Wenn μ = μX = μY, ist dies x ~ NV 0, σ Δ Alle benötigten Parameter können aus den Stichprobendaten geschätzt werden ( XY XY ) XY ) Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) Der abhängige 2-Stichproben t-Test Daraus ließe sich ein dem z-Test analoger Test konstruieren. Die Prüfgröße z= 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten μˆ Δ − 0 XY σˆ Δ XY μˆ X − μˆY = σˆ Δ XY ist standardnormalverteilt, wenn gilt μˆ = μˆX = μˆY Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test Tests für Intervalldaten Der abhängige 2-Stichproben t-Test Aber: Wieder zeigte Student für die Prüfgröße μˆ x − μˆ x t= σΔ XY 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) dass sie nur für Stichproben mit großen Umfängen n gegen die Normalverteilung geht Die tatsächliche Verteilung von t ist wieder eine tVerteilung Die t-Verteilung hat genau einen Parameter, die so genannten Freiheitsgrade (df) Dieser ist df = n – 1 Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Der abhängige 2-Stichproben t-Test Die Prüfgröße für den 2-Stichproben t-Test für abhängige Stichproben berechnet sich als μˆ X − μˆY t= = σΔ XY x−y s X2 + sY2 − 2 s XY n −1 wobei sX und sY die Standardabweichungen der Stichprobendaten sind und sXY die Kovarianz Sie ist t-verteilt mit df = n – 1. Für n ≤ 30 muss die Zufallsvariable in der Population normalverteilt sein, damit die Annahme der t-Verteilung gehalten werden kann. Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten Tests für Intervalldaten Der abhängige 2-Stichproben t-Test – Voraussetzungen 1-Stichproben p t-Test Normalverteilung des Merkmals in der Population für Stichprobengrößen von n ≤ 30. 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Abhängigkeit der Stichproben bzw. der g darin,, so dass diese paarweise p Merkmalsträger zugeordnet werden können. Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test Tests für Intervalldaten Der abhängige 2-Stichproben t-Test Beobachtung im Experiment: x, y Frage: Stammen die Stichproben aus derselben Population? Geht die Größe der Mittelwertsdifferenz auf einen Stichprobenfehler zurück? 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) (1) Festlegung von Signifikanzniveau α Achtung: Vorher und Gerichtetheit immer Prüfung der Voraussetzungen! g (2) Berechnung der Prüfgröße t (3) Berechnung e ec u g de der Wahrscheina sc e lichkeit für dieses oder ein extremeres z: z. B. p(X≥ t) (4) Vergleich von p mit α und Treffen der Signifikanzaussage Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α·100% Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Unabhängig vs. abhängig Frage: g Sollte ein Experimentaldesign p g eher auf einen tTest für unabhängige Stichproben oder für abhängige Stichproben abzielen? Der t-Test für unabhängige Stichproben scheint zunächst testschärfer, weil seine Prüfgröße einer Verteilung mit doppelt so vielen Freiheitsgraden folgt, die damit schmaler ist. Dieser Unterschied wirkt sich jedoch bei normalen Sti h b Stichprobengrößen öß (n>30) ( 30) kaum k mehr h aus Wesentlich relevanter ist die Höhe des Standardfehlers der beim t-Test Standardfehlers, t Test für abhängige Stichproben kleiner ist, sobald die Kovarianz größer 0 ist. Statistik & Methodenlehre e ode e e Tests für Ordinaldaten Einführung Tests für Intervalldaten 1-Stichproben p t-Test 2-Stichproben t-Test (unabh.) 2-Stichproben t T t (abh.) t-Test ( bh ) Tests für Intervalldaten Unabhängig vs. abhängig In der Praxis ist der abhängige g g Fall dem unabhängigen gg Fall hinsichtlich der Teststärke deshalb zumeist klar überlegen. Aber: Für jedes Untersuchungsdesign mit abhängigen Stichproben gelten dieselben kritische Punkte, u.a. • Carry-Over Carry Over Effekte zwischen den Messzeitpunkten (z.B. Lerneffekte) • Drop-Outs zu späteren Messzeitpunkten reduzieren die gesamte Stichprobe • Das Untersuchungsdesign sollte nicht auf eine negative Kovarianz zwischen den Messzeitpunkten abzielen Statistik & Methodenlehre e ode e e Relevante Excel Funktionen Tests für Intervalldaten • KOVAR()