Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Ruhr-Universität Bochum 15. April 2011 1 / 68 Methodenlehre II Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests I Prof. Dr. Holger Dette NA 3/73 I Telefon: 0234 322 8284 I Email: [email protected] I Internet: www.ruhr-uni-bochum.de/mathematik3/index.html I Vorlesung: Montag, 8.30–10.00 Uhr, HGA 10 I Thema: Das allgemeine lineare Modell und seine Anwendungen in der Psychologie I 2 / 68 Statistik-Team Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I Übung: Dienstag, 12.15–13.00 Uhr, HGA 30 Tobias Kley: [email protected] I Tutorium: SPSS 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests Lars Kuchinke: [email protected] GAFO 04/615 Mo. 10.00–12.00 Uhr GAFO 04/615 Mo. 12.00–14.00 Uhr Marco Grabemann: [email protected] GA 1/128 Mo. 12.00–14.00 Uhr GAFO 04/271 Fr. 12.00–14.00 Uhr Cäcilia Werschmann: cilly [email protected] GAFO 04/615 Fr. 12.00–14.00 Uhr Igor Ivanov: [email protected] 3 / 68 Das allgemeine lineare Modell: Ein mathematisches Modell - viele statistische ” Verfahren“ Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests Inhaltsverzeichnis 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 2. Das lineare Regressionsmodell, multiple Regression und Korrelation 3. Das allgemeine“ lineare Modell ” 4 / 68 Literatur Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests A. Aron, E.N. Aron, E.J. Coups, Statistics for Psychology, 5th Edition, Pearson Prentice Hall J. Bortz, Statistik, 6. Auflage, Springer M. Rudolf, J. Müller, Multivariate Verfahren, Hogrefe P. Zöfel, Statistik für Psychologen, Pearson Studium 5 / 68 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 1.4 Einfaktorielle Varianzanalyse 6 / 68 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 1.1 Schätzer und Konfidenzintervalle 7 / 68 1.1 Beispiel: Intelligenzquotient Fragestellung: Haben (15-jährige) Kinder aus Bochum einen höheren Intelligenzquotienten als 100? I 10 Kinder (zufällig ausgewählt) machen einen IQ-Test Daten: y1 , . . . , y10 Stichprobe i yi i yi I 1 104 6 107 2 98 7 100 3 106 8 97 4 99 9 108 5 110 10 112 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Hypothese (IQ der Kinder ist niedriger als 100): H0 : µ ≤ 100 Alternative (IQ ist höher als 100): H1 : µ > 100 Dabei ist µ der (unbekannte) Erwartungswert der Gesamtpopulation der (15-jährigen) Kinder aus Bochum 8 / 68 Prinzip der schließenden Statistik Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Auf Grund der Stichprobe y1 , . . . , y10 sollen Aussagen über das Merkmal der Grundgesamtheit getroffen werden. Zum Beispiel 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle I Wie groß ist µ (Schätzung)? I Kann man ein Intervall bestimmen, in dem µ liegt (Konfidenzintervall)? I Gilt 1.2 t-Test für eine Stichprobe H0 : µ ≤ 100 (IQ ist nicht höher) H1 : µ > 100 (IQ ist höher)? 1.3 Zweistichprobenprobleme oder gilt (statistischer Test) 9 / 68 Grundlegende Schwierigkeit: Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I µ ist der Erwartungswert der Population der 15-jährigen Kinder I Auf Basis der Stichprobe soll auf die Grundgesamtheit geschlossen werden −→ Fehler, Unsicherheiten sind möglich! I Beispiel: zufällig“ wählen wir 5 hochbegabte Kinder (IQ ≥ 130) ” für die Stichprobe aus. Vermutlich wird dadurch µ überschätzt! I Ziel der schließenden Statistik: Quantifizierung der Unsicherheit, z. B. mit welcher Wahrscheinlichkeit macht ein statistischer Test einen Fehler, falls (aufgrund von Daten) für H1 (IQ ist höher als 100) entschieden wird, obwohl in Wirklichkeit H0 gilt? I Notwendig für diese Quantifizierung: Mathematische Modellannahmen 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 10 / 68 Zusätzliche Modellannahme: Normalverteilung Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I Allgemein gängige Annahme: Intelligenz in einer bestimmten Altersgruppe der Bevölkerung ist normalverteilt 1 1 x −µ 2 ϕ(x ) = √ ) exp − ( 2 σ 2πσ 2 µ : Erwartungswert 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme σ 2 : Varianz I Deutung: Ist Y der IQ eines zufällig aus der Population ausgewählten Individuums, so gilt Z P(a ≤ Y ≤ b) = b ϕ(x )dx a I Diese Modellannahme sollte man stets rechtfertigen (wie man das machen kann, sehen wir später) 11 / 68 Interpretation der Wahrscheinlichkeiten: Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme a I I b Die Wahrscheinlichkeit, dass eine Beobachtung zwischen den Werten a und b liegt, entspricht der Fläche unter der Kurve im Intervall [a, b]. In Formeln: Z b P(a ≤ Y ≤ b) = ϕ(x )dx a 12 / 68 Verschiedene Normalverteilungen N(µ, σ 2 ) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Dichten der Normalverteilung mit verschiedenen Parametern 0.5 N(0,0.707) N(0,1) N(1,1.25) N(2,2) 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 0.4 1.2 t-Test für eine Stichprobe 0.0 0.1 0.2 0.3 1.3 Zweistichprobenprobleme -4 -2 0 2 4 6 I µ: Erwartungswert I σ 2 : Varianz I Beachte: unter jeder Kurve ist die Fläche genau 1 13 / 68 Motivation der Modellannahme der Normalverteilung Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 14 / 68 Zusätzliche Modellannahme: Normalverteilung I Mathematisches Modell (hier n = 10): y1 , . . . , yn sind Realisierungen von Zufallsvariablen Yi = µ + εi , i = 1, . . . , m Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe I I I I yi : IQ-Messung für i-tes Kind (Realisation der Zufallsvariablen Yi ) µ: (unbekannter) Erwartungswert der Population (hier der 15-jährigen Kinder aus Bochum) ε1 , . . . , εn : unabhängige Zufallsvariable, normalverteilt mit Erwartungswert 0 und Varianz σ 2 . Interpretation: Messfehler, genetische Variabilität, Tagesform ... Mathematische Statistik z. B. Maximum Likelihood (in diesem Beispiel auch der gesunde Menschenverstand) liefert Schätzer für µ: n 1X yi = 104.1 µ̂ = y · = n 1.3 Zweistichprobenprobleme i=1 I Wie genau ist diese Schätzung? Wie sehr streut diese Schätzung? 15 / 68 Zusätzliche Modellannahme: Normalverteilung I I I Maß für die Genauigkeit: Varianz (je kleiner die Varianz, desto genauer“ die Schätzung) ” Mathematische Statistik (Methodenlehre I): die Varianz des Schätzers µ̂ ist: σ2 Var (µ̂) = n Beachte: I I I Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Je größer der Stichprobenumfang n, desto kleiner die Varianz von µ̂. D.h. desto genauer ist die Schätzung. Für die Beurteilung der Genauigkeit muss man die Varianz σ 2 der Population kennen. Mathematische Statistik: Schätzung für den Parameter σ 2 n σ̂ 2 = 1 X (yi − y · )2 = 28.32 n − 1 i=1 σ̂µ2 = σ̂ 2 = 2.832 n 16 / 68 Zusätzliche Modellannahme: Normalverteilung I Oft wird der Schätzer zusammen mit dem Standardfehler angegeben µ̂ = 104.1 I I I Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle µ̂ + σ̂µ = 105.78 1.2 t-Test für eine Stichprobe µ̂ − σ̂µ = 102.42 1.3 Zweistichprobenprobleme q 2 σ̂µ = √σ̂n = σ̂n = 1.683 ist der Standardfehler des Schätzers µ̂ (Schätzung für Streuung des arithmetischen Mittels) σ̂ = 5.322 ist die aus den Daten geschätzte Standardabweichung (Schätzung für die Streuung einer einzelnen Beobachtung) Deutung: Vor der Datenerhebung ist µ̂ zufällig. Falls die Normalverteilungsannahme korrekt ist, ist auch µ̂ normalverteilt mit: - Erwartungswert µ 2 - Varianz σn 17 / 68 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 0.14 Verschiedene Normalverteilungen Y1 ~ N (104.1, 28.32) 0.12 (Y1 + Y2) 2 ~ N (104.1, 28.32/2) 10 ( ∑ Yi) 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 0.02 0.04 0.06 0.08 1.3 Zweistichprobenprobleme 0.00 Dichte 0.10 i= =1 10 ~ N (104.1, 2.832) 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 40 60 80 100 120 140 160 x 18 / 68 Methodenlehre II, SS 2009 1.2 Schätzverfahren (Erwartungswert einer Population unter Normalverteilungsannahme) I Daten y1 , . . . , yn (Stichprobe) mit Erwartungswert µ I Rechtfertigung der Unabhängigkeits- und Normalverteilungsannahme Pn µ̂ = n1 i=1 yi Schätzung für den Erwartungswert µ der Population Pn 1 2 σ̂ 2 = n−1 i=1 (yi − y · ) Schätzung für die Varianz der Population (σ̂ Schätzung für die Standardabweichung) I I σ̂ 2 n I σ̂µ2 = I Schätzung für den Standardfehler von µ̂ : σ̂µ = Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Schätzung für die Varianz von µ̂ q σ̂ 2 n = σ̂ √ n 19 / 68 SPSS-Output: die Schätzer für die Daten aus Beispiel 1.1 (Intelligenzquotient) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle Deskriptive Statistik N Mittelwert Statistik Statistik Standardfehler Intelligenzquotient 10 104,10 1,683 Gültige Werte (Listenweise) 10 Standardabweichung Varianz Statistik Statistik 5,322 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 28,322 µ̂ = 104.1(Mittelwert) σ̂µ = 1.683(Standardfehler) σ̂ 2 = 28.322(empirische Varianz) σ̂ = 5.322(Standardabweichung) 20 / 68 Beachte: Methodenlehre II, SS 2009 I Prof. Dr. Holger Dette µ̂ = n 1X yi ; n i=1 n σ̂ 2 = 1 X (yi − y · )2 ; n − 1 i=1 r σ̂µ = σ̂ 2 n hängen von den Daten y1 , . . . , yn ab (sind also vor Datenerhebung zufällig) I µ̂ − a σ̂µ , µ̂ + a σ̂µ 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme ist (vor der Datenerhebung) ein zufälliges Intervall, das mit einer bestimmten Wahrscheinlichkeit den Erwartungswert µ enthält I a −→ 0 =⇒ Wahrscheinlichkeit ≈ 0 a −→ ∞ =⇒ Wahrscheinlichkeit ≈ 1 Gesucht: zufälliges Intervall, das den unbekannten Erwartungswert mit einer vorgegebenen Wahrscheinlichkeit enthält: Konfidenzintervall 21 / 68 Das Konfidenzintervall Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I Gebe eine Wahrscheinlichkeit 1 − α vor (z. B. 1 − α = 95%) I Bestimme a so, dass das zufällige Intervall (µ̂ − a σ̂µ , µ̂ + a σ̂µ ) den Parameter µ mit Wahrscheinlichkeit 1 − α enthält. I 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Mathematische Statistik liefert a = tn−1,1− α2 (1 − α2 )-Quantil der t-Verteilung mit n − 1 Freiheitsgraden I Diese Werte sind tabelliert oder durch Software verfügbar. I Das Intervall I = µ̂ − tn−1,1− α2 σ̂µ , µ̂ + tn−1,1− α2 σ̂µ heißt (1 − α) Konfidenzintervall für µ. 22 / 68 Methodenlehre II, SS 2009 Verschiedene t-Verteilungen Prof. Dr. Holger Dette 0.4 Dichten der t– Verteilung mit verschiedenen Freiheitsgraden t 100 t4 t1 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 0.3 1.2 t-Test für eine Stichprobe 0.0 0.1 0.2 1.3 Zweistichprobenprobleme -4 -2 0 1 Γ((n + 1)/2) fn (t) = √ Γ(n/2) πn 2 4 −(n+1)/2 t2 1+ n 23 / 68 Methodenlehre II, SS 2009 Das Quantil der t-Verteilung mit n Freiheitsgraden Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests Dichte der t4 -Verteilung 1.1 Schätzer und Konfidenzintervalle 0.4 1.2 t-Test für eine Stichprobe 0.3 1.3 Zweistichprobenprobleme 0.0 0.1 0.2 0.95 t -4 -2 0 Z 2 4, 0.95 = 2.132 4 t4,0.95 P(T4 ≤ t4,0.95 ) = f4 (t)dt = 0.95 −∞ 24 / 68 Beispiel 1.3 (Fortsetzung von Beispiel 1.1) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I I Berechnung eines 90% Konfidenzintervalls für µ µ̂ = 104.1, σ̂ 2 = 28.32 I n = 10, I α = 10% I (aus Tabelle bzw. Software) t9,0.95 = 1.833 I 90% Konfidenzintervall für µ = (101.02, 107.18) 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Beachte: I I Ein (1 − α)-Konfidenzintervall ist ein zufälliges“ Intervall, das ” den (unbekannten) Erwartungswert mit Wahrscheinlichkeit 1 − α enthält. Die Aussage das Intervall (101.02, 107.18) enthält den ” unbekannten Erwartungswert der Population mit Wahrscheinlichkeit 90%“ hat keinen Sinn! 25 / 68 Erklärung des Begriffs zufälliges“ Intervall durch ” ein fiktives“ Experiment ” I I Annahme: das Experiment (Untersuchung des IQ von 10 Kindern) kann N mal (unabhängig) wiederholt werden (z. B. 1000 mal) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme jeweils 10 Daten liefern ein (1 − α)-Konfidenzintervall (z. B. 95 % Konfidenzintervall) Datensatz 1 −→ Konfidenzintervall I1 Datensatz 2 −→ Konfidenzintervall I2 .. . Datensatz N −→ Konfidenzintervall IN I ca. (1 − α) · N (z. B. 95% · 1000 = 950) Intervalle enthalten den (unbekannten) Erwartungswert µ der Population 26 / 68 Methodenlehre II, SS 2009 1.4 Konfidenzbereich für den Erwartungswert einer Population unter Normalverteilungsannahme I Daten y1 , . . . , yn (Stichprobe) mit Erwartungswert µ I Rechtfertigung der Unabhängigkeits- und Normalverteilungsannahme I Bestimme das tn−1,1− α2 Quantil der t-Verteilung mit n − 1 Freiheitsgraden (aus Tabelle oder Software) I Das Intervall Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme (µ̂ − tn−1,1− α2 σ̂µ , µ̂ + tn−1,1− α2 σ̂µ ) ist ein (1 − α) Konfidenzintervall für µ I In vielen Softwarepaketen erhält man direkt das Konfidenzintervall als Ausgabe (z. B. in SPSS) 27 / 68 SPSS-Output: Konfidenzintervall für die Daten aus Beispiel 1.1 (Intelligenzquotient) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle Test bei einer Sichprobe 1.2 t-Test für eine Stichprobe Testwert = 100 90% Konfidenzintervall der Differenz T Intelligenzquotient 2,436 df Sig. (2-seitig) 9 ,038 Mittlere Differenz 4,100 Untere 1,02 1.3 Zweistichprobenprobleme Obere 7,18 Beachte: I SPSS liefert nur ein Konfidenzintervall für die Differenz µ − 100 =⇒ 90% Konfidenzintervall für den Erwartungswert µ (101.02, 107.18) 28 / 68 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 1.2 t-Test für eine Stichprobe 29 / 68 Beispiel 1.5 (Fortsetzung von Beispiel 1.1) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Frage: Ist der IQ der Kinder aus Bochum höher als 100? H0 : µ ≤ 100 H1 : µ > 100 H0 nennt man Nullhypothese und H1 heißt Alternative. I I I Intuitiv würde man für H1 entscheiden, falls der Mittelwert der Stichprobe 10 1 X µ̂ = yi 10 i=1 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme groß“ ist ” Beachte: µ̂ ändert sich, falls man die Daten anders skaliert! Besser: entscheide für H1 , falls µ̂ groß im Verhältnis zu dem Standardfehler σ̂µ ist (Invarianz bzgl. unterschiedlicher Skalierungen) 30 / 68 Methodenlehre II, SS 2009 Die Nullhypothese H0 : µ ≤ 100 wird abgelehnt falls µ̂ − 100 T = >c σ̂µ Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe Fragen: I Wie legt man den kritischen Wert c fest? I Bei dem Verfahren können 2 Fehler auftreten I Fehler erster Art: Die Nullhypothese H0 wird abgelehnt, obwohl H0 in Wirklichkeit stimmt (d. h. der IQ ist nicht höher als 100) I Fehler zweiter Art: Die Nullhypothese H0 wird nicht abgelehnt, obwohl in Wirklichkeit die Alternative H1 zutrifft (d. h. der IQ ist höher als 100) 1.3 Zweistichprobenprobleme Ziel: kleine“ Wahrscheinlichkeiten für Fehler erster und zweiter Art ” 31 / 68 Grundlegendes Prinzip der Testtheorie Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I Der kritische Wert c wird festgelegt, indem man eine maximal tolerierbare Wahrscheinlichkeit α für einen Fehler erster Art vorgibt (α-Fehler)! I Diese Wahrscheinlichkeit heißt Niveau des Tests. I Damit hat man keine Kontrolle über die Wahrscheinlichkeit eines Fehlers zweiter Art (β-Fehler) I Z. B. soll die Wahrscheinlichkeit für Fehler erster Art maximal α = 5% = 0.05 sein. 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme =⇒ (mathematische Statistik, Tabelle, Software) n = 10, c = tn−1,1−α = t9,0.95 = 1.833 µ̂ − 100 104.1 − 100 T = = 2.436 > 1.833 = √ σ̂µ 2.832 D. h. die Nullhypothese H0 : µ ≤ 100 wird zum Niveau α = 5% zu Gunsten der Alternative H1 : µ > 100 verworfen (signifikantes Ergebnis zum Niveau 5 %) 32 / 68 Erklärung des Begriffs Niveau durch ein fiktives“ ” Experiment I I Annahme: Das Experiment (Untersuchung des IQ von 10 Kindern) kann N mal (unabhängig) wiederholt werden (z. B. 1000 mal) jeweils 10 Daten liefern ein Ergebnis für den Test zum Niveau α (z.B. Niveau 5 %) Datensatz 1 −→ Testergebnis 1 Datensatz 2 −→ Testergebnis 2 .. . Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Datensatz N −→ Testergebnis N I Falls die Nullhypothese H0 : µ ≤ 100 wahr“ ist, so wird ” maximal in ca. αN (z. B. 5% 1000 = 50) Fällen für die Alternative H1 : µ > 100 entschieden. 33 / 68 Fehler erster und zweiter Art Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Entscheidung aufgrund der Stichprobe zugunsten von: H0 H1 in der Population gilt H0 H1 richtige β-Fehler Entscheidung richtige α-Fehler Entscheidung 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Beachte: I Die Wahrscheinlichkeiten für α-Fehler und β-Fehler verändern sich gegenläufig. I Bei festem Niveau (Wahrscheinlichkeit für α-Fehler) kann die Wahrscheinlichkeit für einen β-Fehler durch Vergrößerung des Stichprobenumfangs verkleinert werden. I Bei festem Stichprobenumfang wird nur“ der Fehler erster Art ” kontrolliert. 34 / 68 Die Verteilung von T falls µ = 100 ist. Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Dichte der t9 -Verteilung 0.4 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 0.3 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 0.2 1.3 Zweistichprobenprobleme 0.1 p– Wert 0.0 α=5% t -3 I I I I -2 -1 0 9, 0.95 1 = 1.833 T n = 2.436 2 3 Kritischer Wert: tn−1,0.95 = 1.833 (H0 wird verworfen, falls T größer als der kritische Wert ist) Blaue Fläche: Niveau (α) Rote Fläche: p-Wert: Wahrscheinlichkeit einen Wert größer als 2.436 zu beobachten: P(T > 2.436) = 0.0188 Beachte: Ist der p-Wert < α (wie in diesem Beispiel) dann wird H0 abgelehnt (signifikantes Ergebnis) 35 / 68 Testverfahren für den Erwartungswert einer Stichprobe unter Normalverteilungsannahme 1.6 Einstichproben t-Test für rechtsseitige Hypothesen I Hypothesen: H0 : µ ≤ µ0 ; Hypothese) H1 : µ > µ0 (rechtsseitige I Daten y1 , . . . , yn (Stichprobe) mit Erwartungswert µ I Rechtfertigung der Unabhängigkeits- und Normalverteilungsannahme I H0 wird zum Niveau α verworfen, falls T = Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme µ̂ − µ0 > tn−1,1−α σ̂µ gilt, bzw. falls der p-Wert < α ist. I µ̂: Schätzer für µ; σ̂µ : Schätzer für den Standardfehler von µ̂ 36 / 68 Vertauschen der Hypothesen Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1.7 Einstichproben t-Test für linksseitige Hypothesen I Hypothesen: H0 : µ ≥ µ0 ; Hypothese) H1 : µ < µ0 (linksseitige I Daten y1 , . . . , yn (Stichprobe) mit Erwartungswert µ I Rechtfertigung der Unabhängigkeits- und Normalverteilungsannahme I H0 wird zum Niveau α verworfen, falls T = 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme µ̂ − µ0 < −tn−1,1−α = tn−1,α σ̂µ gilt, bzw. falls der p-Wert < α ist. I µ̂: Schätzer für µ; σ̂µ : Schätzer für den Standardfehler von µ̂ 37 / 68 Tests für zweiseitige Hypothesen Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1.8 Einstichproben t-Test für zweiseitige Hypothesen I Hypothesen: H0 : µ = µ0 ; Hypothese) H1 : µ 6= µ0 (zweiseitige I Daten y1 , . . . , yn (Stichprobe) mit Erwartungswert µ I Rechtfertigung der Unabhängigkeits- und Normalverteilungsannahme I H0 wird zum Niveau α verworfen, falls |T | = | 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme µ̂ − µ0 | > tn−1,1−α/2 σ̂µ gilt, bzw. falls der p-Wert kleiner als α ist. I µ̂: Schätzer für µ; σ̂µ : Schätzer für den Standardfehler von µ̂ 38 / 68 Die Verteilung von T , falls µ = 100 ist. Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Dichte der t9 -Verteilung 0.4 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 0.3 1.2 t-Test für eine Stichprobe 0.2 1.3 Zweistichprobenprobleme p– Wert 0.1 p– Wert α = 2,5 % 0.0 α = 2,5 % -T n = -2.436 -3 I I t 9, 0.025 -2 = -2.262 -1 t 0 1 9, 0.975 = 2.262 2 T n = 2.436 3 Blaue Fläche: Niveau α; Rote Fläche: p-Wert (Wahrscheinlichkeit einen Wert zu beobachten, dessen Betrag größer als 2.436 ist P(|T | > 2.436) = 0.038 Beachte: Ist der p-Wert < α (wie in diesem Beispiel), dann wird H0 abgelehnt! 39 / 68 SPSS-Output bei Anwendung des t-Tests auf die Daten aus Beispiel 1.1 (Intelligenzquotient) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe Test bei einer Sichprobe 1.3 Zweistichprobenprobleme Testwert = 100 90% Konfidenzintervall der Differenz T Intelligenzquotient 2,436 df Sig. (2-seitig) 9 ,038 Mittlere Differenz 4,100 Untere Obere 1,02 7,18 Beachte: I SPSS liefert nur den p-Wert für den zweiseitigen t-Test aus Beispiel 1.8! I Den p-Wert für den einseitigen Test erhält man als 0.038/2 = 0.019. 40 / 68 Methodenlehre II, SS 2009 Beispiel: t-Test für den Vergleich von zwei verbundenen“ Stichproben ” I I Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests Eine der wichtigsten Anwendungen der in 1.6, 1.7 und 1.8 vorgestellten Verfahren besteht in dem Vergleich von verbundenen“ Stichproben (vorher - nachher Untersuchungen) ” Beispiel: Untersuchung der Einstellungen von 9 Jungen gegenüber neutralen Personen vor und nach einem Frustrationserlebnis (Sündenbockfunktion). Einstellung VPn vorher nachher ∆ 1 38 33 -5 2 32 28 -4 3 33 34 1 4 28 26 -2 5 29 27 -2 6 37 31 -6 7 35 32 -3 8 35 36 1 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 9 34 30 -4 41 / 68 Prinzip: Differenzenbildung“ ” I Prinzip: I I I I Falls kein Unterschied zwischen den Einstellungen vor und nach dem Frustrationserlebnis besteht sollten die Differenzen (nachher - vorher) klein“ sein. ” Durch Differenzenbildung (nachher - vorher) erhält man die Daten“ ∆1 , . . . , ∆9 ” Rechtfertigung der Voraussetzungen für den t-Test aus 1.8 für diese Daten“. ” Wende den t-Test für eine Stichprobe auf die Daten“ ” ∆1 , . . . , ∆9 an und teste die Hypothesen Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme H0 : µ = 0, H1 : µ 6= 0 I Wegen −2.667 = 3.27 > 2.31 = t8,0.975 |T | = 0.816 besteht zum Niveau α = 0.05 ein signifikanter Unterschied. 42 / 68 SPSS Output: t-Test für gepaarte Stichproben Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Statistik bei gepaarten Stichproben Mittelwert Paaren 1 N Standardabweichung Standardfehler des Mittelwertes vorher 33,44 9 3,358 1,119 nachher 30,78 9 3,346 1,115 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Korrelationen bei gepaarten Stichproben N Paaren 1 vorher & nachher 9 Korrelation Signifikanz ,733 ,025 Test bei gepaarten Stichproben Gepaarte Differenzen 95% Konfidenzintervall der Differenz Paaren 1 Mittelwert Standardabweichung Standardfehler des Mittelwertes Untere Obere 2,667 2,449 ,816 ,784 4,550 vorher - nachher Test bei gepaarten Stichproben T Paaren 1 vorher - nachher 3,266 df 8 Sig. (2-seitig) ,011 43 / 68 1.9 Bemerkungen (zu den statistischen Verfahren 1.2, 1.4, 1.6, 1.7, 1.8) I Mathematische Statistik ⇒ unter der Normalverteilungsannahme sind alle hier vorgestellten Verfahren optimal I Die Normalverteilungsannahme kann (und sollte) man rechtfertigen. Mögliche Verfahren sind: I Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme statistische Tests für die Hypothese H0 : Y1 , . . . , Yn normalverteilt In SPSS üblich sind - Kolmogorov-Smirnov-Test - Shapiro-Wilk Test I I Explorative Verfahren. In SPSS üblich: QQ-Plot Besteht die Normalverteilungsannahme diese Überprüfung nicht, so sind z. B. nichtparametrische Verfahren anzuwenden. 44 / 68 Methodenlehre II, SS 2009 SPSS Output: QQ-Plot für die Daten aus Beispiel 1.1 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests Q-Q-Diagramm von Normal von Intelligenzquotient 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 115 Erwarteter Wert von Normal 1.3 Zweistichprobenprobleme 110 105 100 95 95 100 105 Beobachteter Wert 110 115 45 / 68 Methodenlehre II, SS 2009 Der QQ-Plot I I Unter der Modellannahme gilt: die Größen Yi sind normalverteilt mit Erwartungswert µ und Varianz σ 2 Der QQ-Plot vergleicht grafisch die empirischen Quantile der Daten“ y1 , . . . , yn mit den Quantilen der Normalverteilung mit ” Erwartungswert µ̂ und Varianz σ̂ 2 . (1) 1/n-Quantil der Stichprobe y1 , . . . yn =⇒ kleinste der Beobachtungen y(1) (in Beispiel 1.1 ist y(1) = 97) (1 − 1/2)/n-Quantil der Normalverteilung mit Erwartungswert µ̂ und Varianz σ̂ 2 =⇒ (im Beispiel 1.1 ist z(1) = 104.1 − 1.64 · 5.32 = 95.37) (2) 2/n-Quantil der Stichprobe y1 , . . . , yn =⇒ zweitkleinste der Beobachtungen y(2) (in Beispiel 1.1 ist y(2) = 98) (2 − 1/2)/n-Quantil der Normalverteilung mit Erwartungswert µ̂ und Varianz σ̂ 2 =⇒ (in Beispiel 1.1 ist z(2) = 104.1 − 1.04 · 5.32 = 98.57) (3) usw. I Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Der QQ-Plot ist das Streudiagramm der Daten (y(1) , z(1) ), . . . , (y(n) , z(n) ) I In in vielen Fällen enthält dieses Diagramm noch die Winkelhalbierende des entsprechenden Quadranten. 46 / 68 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 1.3 Zweistichprobenprobleme 47 / 68 1.10 Beispiel: Erkennen von Zahlenreihen Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I I Studierende der Fachrichtungen Mathematik (M) und Psychologie (P) machen einen Zahlengedächtnistest I Wie viele Ziffern können sich maximal gemerkt werden I Wiedergabe in Original und umgekehrter Reihenfolge 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Daten (P. Zöfel: Statistik für Psychologen) M P M P I 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 14 13 14 14 14 17 15 13 15 12 12 13 13 16 16 19 16 13 17 10 13 16 Frage: Haben Studierende der Mathematik ein besseres Zahlengedächtnis als Studierende der Psychologie? 48 / 68 Mathematisches Modell (n1 = 14, n2 = 8) I Yij := µi + εij ; j = 1, . . . , ni ; i = 1, 2 Yij : Ergebnis der j-ten Versuchsperson in Gruppe i (Mathematik: i = 1, Psychologie i = 2) µi : unbekannter Erwartungswert in der Population i (Mathematik: i = 1, Psychologie: i = 2) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme εij : Messfehler, Tagesform ... ni : Stichprobenumfang in Gruppe i I Normalverteilungs- und Unabhängigkeitsannahme I in jeder Gruppe (i = 1, 2) liegt eine Normalverteilung mit Erwartungswert µi und Varianz σi2 vor I in jeder Gruppe sind die Beobachtungen unabhängig I unabhängige Stichproben 49 / 68 Methodenlehre II, SS 2009 Schätzer I Schätzer werden wie in 1.2 für jede Gruppe Pn1 durchgeführt Mathematiker (i = 1): µ̂1 = y 1· = n11 j=1 y1j = 14.64 s n1 X 1 σ̂12 = 0.53 σ̂12 = (y1j − y 1· )2 = 3.94 ⇒ σ̂µ1 = n1 − 1 j=1 n1 Psychologen (i = 2): µ̂2 = y 2· = 1 σ̂22 = n2 − 1 I n2 X j=1 1 n2 n2 P Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme y2j = 13.75 j=1 s (y2j − y 2· )2 = 4.79 ⇒ σ̂µ2 = σ̂22 = 0.77 n2 Auch Konfidenzbereiche werden gruppenweise bestimmt z. B. ist unter Normalverteilungsannahme µ̂1 − tn1 −1,1− α2 σ̂µ1 , µ̂1 + tn1 −1,1− α2 σ̂µ1 ein 90% Konfidenzintervall für µ1 . Für das spezielle Datenbeispiel ergibt sich [n1 = 14, α = 10%, t13,0.95 = 1.77 (aus Tabelle)] (13.70, 15.58) als 90% Konfidenzintervall für µ1 50 / 68 SPSS-Output für die Daten aus Beispiel 1.10 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Schätzer für die Parameter in den einzelnen Gruppen 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle Gemerkte Zahlen Studienfach Mathematik Mittelwert Varianz 14,64 3,940 Psychologie 13,75 4,786 Insgesamt 14,32 4,227 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Beachte: I SPSS liefert hier die Schätzer für Erwartungswert und Varianz der einzelnen Gruppen I SPSS liefert außerdem Schätzer für Erwartungswert und Varianz der gesamten Stichprobe 51 / 68 Tests zum Vergleich der Erwartungswerte Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I Nullhypothese: Zahlengedächtnis der Psychologiestudenten ist nicht schlechter als das der Mathematikstudenten H0 : µ1 ≤ µ2 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme I Alternative: Zahlengedächtnis der Mathematikstudenten ist besser als das der Psychologiestudenten H1 : µ1 > µ2 I Rezept: Verwerfe die Nullhypothese H0 zu Gunsten der Alternative H1 , falls die Differenz y 1· − y 2· der Schätzer für die Erwartungswerte groß“ ist. ” 52 / 68 Rezept im Fall von Varianzhomogenität, d. h. (σ12 = σ22 ) I I Verwerfe H0 zu Gunsten von H1 , falls y 1· − y 2· groß“ ist. ” Normiere diese Größe mit einem Schätzer für die Standardfehler der Mittelwertdifferenz: q I I I 1 )σ̂ 2 n2 1 {(n1 − 1)σ̂12 n1 +n2 −2 σ̂µ1 −µ2 = ( n11 + + (n2 − 1)σ̂22 }: Schätzer für Varianz σ̂ 2 = (die in beiden Gruppen dieselbe ist) Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Entscheide für die Alternative H1 : µ1 > µ2 , falls Tn1 ,n2 = I Methodenlehre II, SS 2009 y 1· − y 2· > tn1 +n2 −2,1−α σ̂µ1 −µ2 gilt. Dabei ist tn1 +n2 −2,1−α das (1 − α)-Quantil der t-Verteilung mit n1 + n2 − 2 Freiheitsgraden Im Beispiel ergibt sich für einen Test zum Niveau α = 5% σ̂ 2 = 4.24, t20,0.95 = 1.725 =⇒ T14,8 = 0.979 d. h. die Hypothese H0 kann nicht verworfen werden. 53 / 68 Testverfahren für die Erwartungswerte von zwei Stichproben unter Normalverteilungsannahme 1.11(a) Einseitiger t-Test für zwei unabhängige Stichproben (rechtsseitige Hypothese) I I Daten y11 , . . . , y1n1 (Gruppe 1; Erwartungswert µ1 ; Varianz σ12 ) y21 , . . . , y2n2 (Gruppe 2; Erwartungswert µ2 ; Varianz σ22 ) Rechtfertigung der Voraussetzungen I I I I Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Unabhängigkeit in und zwischen den Gruppen Normalverteilungsannahme (in beiden Gruppen) Varianzhomogenität, d. h. σ12 = σ22 Die Hypothese H0 : µ1 ≤ µ2 wird zu Gunsten der Alternative H1 : µ1 > µ2 verworfen, falls y 1· − y 2· > tn1 +n2 −2,1−α σ̂µ1 −µ2 q gilt, bzw. der p-Wert < α ist. σ̂µ1 −µ2 = ( n11 + n12 )σ̂ 2 ist der Schätzer für den Standardfehler der Mittelwertdifferenz. Tn1 ,n2 = 54 / 68 Methodenlehre II, SS 2009 1.11(b) Einseitiger t-Test für zwei unabhängige Stichproben (linksseitige Hypothese) I I Daten y11 , . . . , y1n1 (Gruppe 1; Erwartungswert µ1 ; Varianz σ12 ) y21 , . . . , y2n2 (Gruppe 2; Erwartungswert µ2 ; Varianz σ22 ) Rechtfertigung der Voraussetzungen I I I I Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Unabhängigkeit in und zwischen den Gruppen Normalverteilungsannahme (in beiden Gruppen) Varianzhomogenität, d. h. σ12 = σ22 Die Hypothese H0 : µ1 ≥ µ2 wird zu Gunsten der Alternative H1 : µ1 < µ2 verworfen, falls y 1· − y 2· < −tn1 +n2 −2,1−α = tn1 +n2 −2,α σ̂µ1 −µ2 q gilt, bzw. der p-Wert < α ist. σ̂µ1 −µ2 = ( n11 + n12 )σ̂ 2 ist der Schätzer für den Standardfehler der Mittelwertdifferenz. Tn1 ,n2 = 55 / 68 1.11(c) t-Test für zwei unabhängige Stichproben (zweiseitige Hypothesen) I I Daten y11 , . . . , y1n1 (Gruppe 1; Erwartungswert µ1 ; Varianz σ12 ) y21 , . . . , y2n2 (Gruppe 2; Erwartungswert µ2 ; Varianz σ22 ) Rechtfertigung der Voraussetzungen I I I I Unabhängigkeit in und zwischen den Gruppen Normalverteilungsannahme (in beiden Gruppen) Varianzhomogenität, d. h. σ12 = σ22 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Die Nullhypothese H0 : µ1 = µ2 (kein Unterschied der Erwartungswerte in beiden Gruppen) wird zu Gunsten der Alternative H1 : µ1 6= µ2 verworfen, falls |y 1· − y 2· | > tn1 +n2 −2,1− α2 σ̂µ1 −µ2 q gilt, bzw. der p-Wert < α ist. σ̂µ1 −µ2 = ( n11 + n12 )σ̂ 2 ist der Schätzer für den Standardfehler der Mittelwertdifferenz. |Tn1 ,n2 | = 56 / 68 Bemerkung zur Varianzhomogenität Methodenlehre II, SS 2009 Prof. Dr. Holger Dette Ist die Annahme der Varianzhomogenität σ12 = σ22 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe nicht erfüllt, so 1.3 Zweistichprobenprobleme I wird die vorgegebene Wahrscheinlichkeit für einen α-Fehler nicht eingehalten (der Test hält sein Niveau nicht) I ist die Wahrscheinlichkeit für einen β-Fehler größer I von Interesse ist daher auch ein Test für die Hypothesen H0 : σ12 = σ22 H1 : σ12 6= σ22 und ein Verfahren, das ohne die Annahme der Varianzhomogenität auskommt. 57 / 68 Rezept (für Test auf Varianzhomogenität) Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I Die Nullhypothese H0 : σ12 = σ22 gilt genau dann, wenn F = σ12 =1 σ22 I Schätze den Quotienten der beiden Varianzen, durch Pn1 1 2 σ̂12 j=1 (y1j − y 1· ) n1 −1 Fn1 −1,n2 −1 = 2 = 1 Pn2 2 σ̂2 j=1 (y2j − y 2· ) n2 −1 I Die Nullhypothese H0 wird zu Gunsten der Alternative H1 : σ12 6= σ22 verworfen, falls Fn1 −1,n2 −1 > c2 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme oder Fn1 −1,n2 −1 < c1 gilt I Die kritischen Werte c1 und c2 werden so festgelegt, dass die Wahrscheinlichkeit für einen Fehler erster Art maximal α ist! 58 / 68 1.12 F -Max-Test für den Vergleich von zwei Stichprobenvarianzen I Teststatistik Fn1 −1,n2 −1 = I σ̂12 σ̂2 Die Nullhypothese H0 : σ12 = σ22 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme (die Varianzen sind gleich) wird zu Gunsten der Alternative H1 : σ12 6= σ22 verworfen, falls mindestens eine der Ungleichungen Fn1 −1,n2 −1 < Fn1 −1,n2 −1, α2 Fn1 −1,n2 −1 > Fn1 −1,n2 −1,1− α2 erfüllt ist I Fn1 −1,n2 −1,β bezeichnet das β-Quantil der F -Verteilung mit (n1 − 1, n2 − 1) Freiheitsgraden 59 / 68 Methodenlehre II, SS 2009 Verschiedene F -Verteilungen Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.0 Dichten der F– Verteilung mit verschiedenen Freiheitsgraden F2, 10 F4, 4 F10, 1 F20, 20 1.1 Schätzer und Konfidenzintervalle 0.8 1.2 t-Test für eine Stichprobe 0.0 0.2 0.4 0.6 1.3 Zweistichprobenprobleme 0 1 2 3 4 5 m fm,n (x ) = m m2 Γ( m+n x 2 −1 2 ) m+n m n Γ( 2 )Γ( 2 ) 2 (1 + mn x ) 2 (x ≥ 0) 60 / 68 Das Quantil der F -Verteilung mit (n1 , n2 ) Freiheitsgraden Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests Dichte der F4, 4 -Verteilung 1.1 Schätzer und Konfidenzintervalle 0.6 1.2 t-Test für eine Stichprobe 0.4 0.5 1.3 Zweistichprobenprobleme 0.0 0.1 0.2 0.3 0.9 F 0 1 2 3 Z 4, 4; 0.9 4 = 4.107 5 F4,4,0.9 P(F4,4 , ≤ F4,4,0.9 ) = fm,n (x ) dx = 0.90 −∞ 61 / 68 Der F -Test auf Varianzhomogenität für die Daten aus Beispiel 1.10 (n1 = 14, n2 = 8) I σ̂ 2 1 = 3.94 σ̂22 = 4.79 ⇒ F13,7 = 0.823 Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle I Für das Niveau α = 10% erhält man F13,7,0.05 = 0.3531 F13,7,0.95 = 3.5503 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme und damit kann die Nullhypothese zum Niveau 10% nicht verworfen werden I Beachte: Oft wird der Test 1.12 verwendet, um die Voraussetzungen für den t-Test zu überprüfen I I I In diesem Fall wählt man oft ein größeres Niveau (→ kleinere Wahrscheinlichkeit für β-Fehler) Der Gesamttest (erst F -Test, falls H0 nicht verworfen wird, dann t-Test) hat nicht das Niveau α. Was macht man, falls F -Test H0 verwirft? 62 / 68 Methodenlehre II, SS 2009 1.13(a) t-Test für zwei unabhängige Stichproben mit nicht notwendig gleichen Varianzen (Welch-Test) I I Daten y11 , . . . , y1n1 (Gruppe 1; Erwartungswert µ1 ; Varianz σ12 ) y21 , . . . , y2n2 (Gruppe 2; Erwartungswert µ2 ; Varianz σ22 ) Rechtfertigung der Voraussetzungen I I 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Unabhängigkeit in und zwischen den Gruppen Normalverteilungsannahme (in beiden Gruppen) I Varianzen in den Gruppen sind nicht notwendig gleich I Teststatistik TnW1 ,n2 = I Prof. Dr. Holger Dette Dabei ist √ τ̂ = y 1· − y 2· τ̂ s τ̂ 2 = σ̂12 σ̂ 2 + 2 n1 n2 die Schätzung für den Standardfehler von y 1· − y 2· 63 / 68 Methodenlehre II, SS 2009 1.13(b) t-Test für zwei unabhängige Stichproben mit nicht notwendig gleichen Varianzen (Welch-Test) I Die Nullhypothese H0 : µ1 ≤ µ2 (Erwartungswert der ersten Population nicht größer als der der Zweiten) wird zu Gunsten der Alternative Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme H1 : µ1 > µ2 falls TnW1 ,n2 > tfˆ,1−α gilt, bzw. der p-Wert < α ist. Dabei bezeichnet fˆ = (σ̂µ2 1 + σ̂µ2 2 )2 4 σ̂µ 1 n1 −1 + 4 σ̂µ 2 n2 −1 die geschätzten Freiheitsgrade der t-Verteilung. 64 / 68 1.13(c) t-Test für zwei unabhängige Stichproben mit nicht notwendig gleichen Varianzen (Welch-Test) I Die Nullhypothese H0 : µ1 ≥ µ2 (Erwartungswert der ersten Population nicht kleiner als der der Zweiten) wird zu Gunsten der Alternative Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme H1 : µ1 < µ2 verworfen, falls TnW1 ,n2 < tfˆ,α = −tfˆ,1−α gilt, bzw. der p-Wert < α ist. Dabei bezeichnet fˆ = (σ̂µ2 1 + σ̂µ2 2 )2 4 σ̂µ 1 n1 −1 + 4 σ̂µ 2 n2 −1 die geschätzten Freiheitsgrade der t-Verteilung. 65 / 68 1.13(d) t-Test für zwei unabhängige Stichproben mit nicht notwendig gleichen Varianzen (Welch-Test) I Die Nullhypothese Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests H0 : µ1 = µ2 (kein Unterschied der Erwartungswerte in beiden Gruppen) wird zu Gunsten der Alternative 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme H1 : µ1 6= µ2 (es besteht ein Unterschied) verworfen, falls |TnW1 ,n2 | > tfˆ,1− α 2 gilt, bzw. der p-Wert < α ist. Dabei bezeichnet fˆ = (σ̂µ2 1 + σ̂µ2 2 )2 4 σ̂µ 1 n1 −1 + 4 σ̂µ 2 n2 −1 die geschätzten Freiheitsgrade der t-Verteilung. 66 / 68 Bemerkung: t-Test oder Welch-Test? Methodenlehre II, SS 2009 Prof. Dr. Holger Dette I Sind die Voraussetzungen für den t-Test erfüllt (Normalverteilung, Unabhängigkeit, Varianzhomogenität), so ist dieses Verfahren optimal, d. h. dieser Test minimiert unter allen Tests zum Niveau α die Wahrscheinlichkeit für einen β-Fehler. I Ist die Voraussetzungen der Varianzhomogenität beim t-Test nicht erfüllt, so wird die vorgegebene Wahrscheinlichkeit für einen α-Fehler nicht eingehalten. I Der Welch-Test ist eine Näherungslösung“, d. h. die ” Wahrscheinlichkeit für einen α-Fehler ist nur“ ” näherungsweise α. I Der Welch-Test hat im Fall der Varianzhomogenität eine größere Wahrscheinlichkeit für einen β-Fehler als der t-Test. 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme 67 / 68 Methodenlehre II, SS 2009 SPSS-Output für die Daten aus Beispiel 1.10 Prof. Dr. Holger Dette Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit F Gemerkte Zahlen Varianzen sind gleich Signifikanz ,103 ,752 Varianzen sind nicht gleich 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests T-Test für die Mittelwertgleichheit T df Sig. (2-seitig) ,979 20 ,339 ,952 13,523 ,358 1.1 Schätzer und Konfidenzintervalle 1.2 t-Test für eine Stichprobe 1.3 Zweistichprobenprobleme Test bei unabhängigen Stichproben T-Test für die Mittelwertgleichheit 95% Konfidenzintervall der Differenz Mittlere Differenz Gemerkte Zahlen Standardfehler der Differenz Untere Obere Varianzen sind gleich ,893 ,912 -1,010 2,796 Varianzen sind nicht gleich ,893 ,938 -1,125 2,911 Beachte: I SPSS liefert nicht den in 1.12 dargestellten F -Max Test auf Varianzhomogenität sondern ein robustes“ Verfahren (Levene-Test) ” I SPSS liefert nur einen p-Wert für den zweiseitigen t-Test aus Beispiel 1.11(c) bzw. zweiseitigen Welch-Test aus Beispiel 1.13(iv) I SPSS liefert ein Konfidenzintervall für die Differenz µ1 − µ2 =⇒ 95% Konfidenzintervall für die Differenz der Erwartungswerte (unter der Annahme gleicher Varianzen) (−1.01, 2.796) 68 / 68