7. Hypothesentests Ausgangssituation erneut: • ZV X repräsentiere einen Zufallsvorgang • X habe die unbekannte VF FX (x) • Interessieren uns für einen unbekannten Parameter θ der Verteilung von X 350 Bisher: • Versuch, unbekannten Parameter θ mit einer Stichprobe X1, . . . , Xn zu schätzen (Punktschätzung, Intervallschätzung) Jetzt: • Testen von Hypothesen über unbekanntes θ anhand einer Stichprobe X1, . . . , Xn Man beachte: • Testprobleme spielen in der empirischen Wirtschaftsforschung eine zentrale Rolle 351 Beispiel 1: • In einer Studentenkneipe sollen geeichte Biergläser im Ausschank 0.4 Liter Bier enthalten. Wir haben die Vermutung, dass der Wirt häufig ’zu wenig’ ausschenkt. • X repräsentiere den Zufallsvorgang ’Füllen eines 0.4-Liter Bierglases durch den Wirt’ • Es bezeichne θ = E(X) die erwartete Füllmenge eines Glases • Durch eine Stichprobe X1, . . . , Xn soll getestet werden θ = 0.4 gegen θ < 0.4 352 Beispiel 2: • Wir wissen aus der Vergangenheit, dass das Risiko einer Aktie (die Standardabweichung der Aktienrenditen) bei 25 % lag. Im Unternehmen wird nun das Management ausgetauscht. Verändert sich dadurch das Risiko der Aktie? • X sei die Aktienrendite • θ = σ(X) sei die Standardabweichung der Renditen • Durch eine Stichprobe X1, . . . , Xn soll getestet werden θ = 0.25 gegen θ 6= 0.25 353 7.1 Grundbegriffe des Testens Definition 7.1: (Parametertest) Es sei X eine Zufallsvariable und θ ein unbekannter Parameter der Verteilung von X. Ein Parametertest ist ein statistisches Verfahren, mit dem eine Hypothese über den unbekannten Parameter θ anhand einer einfachen Zufallsstichprobe X1, . . . , Xn aus X überprüft wird. Formulierung eines statistischen Testproblems: [I] • Es sei Θ die Menge aller möglichen Parameterwerte (d.h. θ ∈ Θ) • Es sei Θ0 ⊂ Θ eine Teilmenge der Parametermenge 354 Formulierung eines statistischen Testproblems: [II] • Betrachte folgende Aussagen: H0 : θ ∈ Θ0 gegen H1 : θ ∈ Θ/Θ0 = Θ1 • H0 heißt Nullhypothese, H1 Gegenhypothese oder Alternative Wichtig: • Bei der Formulierung eines Testproblems müssen sich Nullhypothese und Alternative gegenseitig ausschließen 355 Arten von Hypothesen: • Sind |Θ0| = 1 (d.h. Θ0 = {θ0}) und H0 : θ = θ0, so nennt man H0 einfach • Andernfalls bezeichnet man H0 als zusammengesetzt • Analoge Bezeichnungen gelten für H1 356 Arten von Testproblemen: • Es sei θ0 ∈ Θ eine feste reelle Zahl. Dann heißt H0 : θ = θ 0 gegen H1 : θ = 6 θ0 H0 : θ ≤ θ 0 gegen H1 : θ > θ0 H0 : θ ≥ θ 0 gegen H1 : θ < θ0 zweiseitiges Testproblem • Die Testprobleme bzw. heißen einseitig (rechts- bzw. linksseitig) 357 Jetzt: • Betrachte das allgemeine Testproblem H 0 : θ ∈ Θ0 gegen H1 : θ ∈ Θ1 = Θ/Θ0 Allgemeine Vorgehensweise: • Entscheide anhand einer Stichprobe X1, . . . , Xn aus X, ob H0 zugunsten von H1 abgelehnt wird oder nicht 358 Explizites Vorgehen: • Wähle ’geeignete’ Teststatistik T (X1, . . . , Xn) und bestimme einen ’geeigneten’ kritischen Bereich K ⊂ R • Testentscheidung: T (X1, . . . , Xn) ∈ K =⇒ H0 wird abgelehnt / K =⇒ H0 wird nicht abgelehnt T (X1, . . . , Xn) ∈ Man beachte: • T (X1, . . . , Xn) ist eine ZV (Stichprobenfunktion) −→ Die Testentscheidung ist zufällig −→ Fehlentscheidungen sind möglich 359 Mögliche Fehlentscheidungen: Realität H0 richtig H0 falsch Testergebnis H0 ablehnen H0 nicht ablehnen Fehler 1. Art kein Fehler Fehler 2. Art kein Fehler Fazit: • Fehler 1. Art: Test lehnt H0 ab, obwohl H0 richtig • Fehler 2. Art: Test lehnt H0 nicht ab, obwohl H0 falsch 360 Wann treten die Fehlentscheidungen auf? • Der Fehler 1. Art tritt auf, falls T (X1, . . . , Xn) ∈ K, obwohl für den wahren Parameter gilt θ ∈ Θ0 • Der Fehler 2. Art tritt auf, falls / K, T (X1, . . . , Xn) ∈ obwohl für den wahren Parameter gilt θ ∈ Θ1 361 Frage: • Wann besitzt ein statistischer Test für das Problem H0 : θ ∈ Θ 0 ’gute’ Eigenschaften? gegen H1 : θ ∈ Θ1 = Θ/Θ0 Intuitive Vorstellung: • Test ist ’gut’, wenn er möglichst geringe Wahrscheinlichkeiten für die Fehler 1. und 2. Art aufweist Jetzt: • Formales Instrument zur Messung der Fehlerwahrscheinlichkeiten 1. und 2. Art 362 Definition 7.2: (Gütefunktion eines Tests) Man betrachte einen statistischen Test für das obige Testproblem mit der Teststatistik T (X1, . . . , Xn) und einem ’geeignet gewählten’ kritischen Bereich K. Unter der Gütefunktion des Tests versteht man die Funktion G, die, in Abhängigkeit des wahren Parameters θ ∈ Θ, die Wahrscheinlichkeit dafür angibt, dass der Test H0 ablehnt: G : Θ −→ [0, 1] mit G(θ) = P (T (X1, . . . , Xn) ∈ K). 363 Bemerkung: • Mit der Gütefunktion sind die Wahrscheinlichkeiten für den Fehler 1. Art gegeben durch G(θ) für alle θ ∈ Θ0 sowie für den Fehler 2. Art durch 1 − G(θ) für alle θ ∈ Θ1 Intuitive Vorstellung eines idealen Tests: • Ein Test ist ideal, wenn die Fehlerwahrscheinlichkeiten 1. und 2. Art stets (konstant) gleich Null sind −→ Test trifft mit Wskt. 1 die richtige Entscheidung 364 Beispiel: • Es sei θ0 ∈ Θ. Betrachte das Testproblem H 0 : θ ≤ θ0 gegen H1 : θ > θ 0 Gütefunktion eines idealen Tests 365 Leider: • Es kann mathematisch gezeigt werden, dass ein solcher idealer Test im allgemeinen nicht existiert Praktische Vorgehnsweise: [I] • Betrachte für eine geeignete Teststatistik T (X1, . . . , Xn) die maximale Fehlerwahrscheinlichkeit 1. Art α = max {P (T (X1, . . . , Xn) ∈ K)} = max {G(θ)} θ∈Θ0 θ∈Θ0 • Lege den kritischen Bereich K dann so fest, dass α einen vorgegebenen kleinen Wert animmt 366 Praktische Vorgehnsweise: [II] −→ Alle Fehlerwahrscheinlichkeiten 1. Art sind dann durch α begrenzt (d.h. kleiner oder gleich α) • Häufig benutzte α-Werte sind α = 0.01, α = 0.05, α = 0.1 Definition 7.3: (Signifikanzniveau eines Tests) Man betrachte einen statistischen Test für das Testproblem auf Folie 358 mit der Teststatistik T (X1, . . . , Xn) und einem geeignet gewählten kritischen Bereich K. Dann bezeichnet man die maximale Fehlerwahrscheinlichkeit 1. Art α = max {P (T (X1, . . . , Xn) ∈ K)} = max {G(θ)} θ∈Θ0 θ∈Θ0 als das Signifikanzniveau des Tests. 367 Konsequenzen dieser Testkonstruktion: [I] • Die Wskt., H0 aufgrund des Tests abzulehmen, obwohl H0 richtig ist (d.h. die Wskt. für den Fehler 1. Art) ist höchstens α (mit α = 0.01, 0.05, 0.1) −→ Wird H0 aufgrund einer Testrealisation abgelehnt, so kann man ziemlich sicher davon ausgehen, dass H0 tatsächlich falsch ist (Man sagt auch: H1 ist statistisch gesichert) 368 Konsequenzen dieser Testkonstruktion: [II] • Die Wskt. für den Fehler 2. Art (d.h. H0 nicht abzulehnen, obwohl H0 falsch ist), kann man dagegen nicht kontrollieren −→ Wird H0 aufgrund einer Testrealisation nicht abgelehnt, so hat man keinerlei Wahrscheinlichkeitsaussage über eine mögliche Fehlentscheidung (Nichtablehung von H0 heißt nur: Die Daten sind nicht unvereinbar mit H0) Wichtig deshalb: • Es ist entscheidend, wie man H0 und H1 formuliert • Das, was man zu zeigen hofft, formuliert man in H1 (in der Hoffnung, H0 anhand des konkreten Tests ablehnen zu können) 369 Beispiel: • Betrachte Beispiel 1 auf Folie 352 • Kann man anhand eines konkreten Tests H0 verwerfen, so kann man ziemlich sicher sein, dass der Wirt in der Regel zu wenig ausschenkt • Kann man H0 nicht verwerfen, so kann man nichts explizites über die Ausschankgewohnheiten des Wirtes sagen. (Die Daten stehen lediglich nicht im Widerspruch zu H0) 370 7.2 Tests für Erwartungswerte Situation: • Der interessierende Zufallsvorgang X sei normalverteilt, d.h. X ∼ N (µ, σ 2), wobei µ unbekannt und σ 2 bekannt sein sollen (vgl. Konfindenzintervall 1, Folie 338) • Betrachte für gegebenes µ0 ∈ R das Testproblem: H0 : µ = µ0 gegen H1 : µ 6= µ0 371 Testkonstruktion: • Suche eine geeignete Teststatistik T (X1, . . . , Xn) • Lege den kritischen Bereich K fest Geeignete Teststatistik lautet: T (X1, . . . , Xn) = √ X − µ0 n· σ Begründungen: • T (X1, . . . , Xn) misst im wesentlichen den Abstand zwischen dem unbekannten Parameter µ und dem Vergleichswert µ0 • Wenn H0 gültig ist (d.h. falls µ = µ0), dann gilt T (X1, . . . , Xn) ∼ N (0, 1) (vgl. Satz 5.5(b), Folie 310) 372 N (0, 1)-Dichte der Teststatistik T (X1 , . . . , Xn ) im Falle der Gültigkeit von H0 N(0,1)-Dichte von T unter H0 α/2 α/2 uα / 2 (= − u1−α / 2) 0 u1−α / 2 373 Explizite Testregel: • Lege das Signifikanzniveau α fest • Wähle den kritischen Bereich als K = (−∞, −u1−α/2) ∪ (u1−α/2, +∞) = {t ∈ R : |t| > u1−α/2} d.h. Lehne H0 ab, falls T (X1, . . . , Xn) ∈ K /K Lehne H0 nicht ab, falls T (X1, . . . , Xn) ∈ 374 Beispiel: [I] • Es sei X ∼ N (µ, 4) das tatsächliche Gewicht (in Gramm) einer 200g-Tafel Schokolade (vgl. Beispiel auf Folie 342) • Statistisches Testproblem H0 : µ = 200 gegen H1 : µ = 6 200 • Wert der Teststatistik: √ 200.7625 − 200 √ x − µ0 = 8· = 1.078 T (x1, . . . , xn) = n · σ 2 375 Beispiel: [II] • Für das Signifikanzniveau α = 0.05 gilt: u1−α/2 = u0.975 = 1.96 • Offensichtlich ist T (x1, . . . , xn) = 1.078 ∈ / (−∞, −1.96) ∪ (1.96, +∞) = K −→ Für α = 0.05 wird H0 nicht abgelehnt (Daten sind nicht unvereinbar mit H0) 376 Gütefunktion des Tests zum Signifikanzniveau α = 0.05 1.0 n = 1000 0.8 n = 20 0.6 G(µ) 0.4 0.2 0.0 198 n=8 199 200 201 202 µ Bemerkungen: • Test wird mit zunehmendem n immer trennschärfer • Der vorgestellte Test heißt zweiseitiger Gaußtest 377 Jetzt: • 2 zweiseitige Tests für den Erwartungswert in der Situation X ∼ N (µ, σ 2), bei bekannter Varianz σ 2 (ohne Herleitung) 1. Rechtsseitiger Gaußtest: [I] (µ0 ∈ R fest gegeben) H0 : µ ≤ µ0 gegen H1 : µ > µ 0 • Teststatistik ist erneut √ X − µ0 T (X1, . . . , Xn) = n · σ 378 1. Rechtsseitiger Gaußtest: [II] • Kritischer Bereich zum Signifikanzniveau α ist K = (u1−α, +∞) (u1−α ist (1 − α)-Quantil der N (0, 1)-Verteilung) −→ Lehne H0 zum Signifikanzniveau α ab, falls T (X1, . . . , Xn) > u1−α 379 2. Linksseitiger Gaußtest: (µ0 ∈ R fest gegeben) H0 : µ ≥ µ0 gegen H1 : µ < µ0 • Teststatistik ist wiederum √ X − µ0 T (X1, . . . , Xn) = n · σ • Kritischer Bereich zum Signifikanzniveau α ist K = (−∞, −u1−α) (−u1−α = uα ist α-Quantil der N (0, 1)-Verteilung) −→ Lehne H0 zum Signifikanzniveau α ab, falls T (X1, . . . , Xn) < −u1−α = uα 380 Beispiel: [I] • Es sei X ∼ N (µ, 4) das tatsächliche Gewicht (in Gramm) einer 200g-Tafel Schokolade mit der konkreten Stichprobe von Folie 342 • Statistisches Testproblem: H0 : µ ≤ 198 gegen H1 : µ > 198 • Für die konkrete Stichprobe gilt √ 200.7625 − 198 √ x − µ0 T (x1, . . . , xn) = n · = 8· = 3.9068 σ 2 381 Beispiel: [II] • Zum Signifikanzniveau α = 0.05 ergibt sich der kritische Bereich als K = (u0.95, +∞) = (1.6449, +∞) • Also folgt T (x1, . . . , xn) = 3.9068 > 1.6449 = u0.95 −→ Lehne H0 zum Signifikanzniveau α = 0.05 ab 382 Jetzt: • Tests für den Erwartungswert einer Normalverteilung bei unbekannter Varianz, d.h. X ∼ N (µ, σ 2) mit unbekannten µ und σ 2 • Betrachte für µ0 ∈ R zunächst den 2-seitgen Test H 0 : µ = µ0 gegen H1 : µ 6= µ0 383 Geeignete Teststatistik: T (X1, . . . , Xn) = √ X − µ0 n−1· S Begründungen: • T (X1, . . . , Xn) schätzt im wesentlichen den Abstand zwischen unbekanntem µ und dem Vergleichswert µ0 • Wenn H0 richtig ist (d.h. falls µ = µ0), dann gilt T (X1, . . . , Xn) ∼ t(n − 1) (vgl. Satz 5.5(c), Folie 311) 384 Herleitung des kritischen Bereiches: • Analoges Vorgehen wie beim zweiseitigen Gaußtest, nur mit t(n − 1)- anstatt mit der N (0, 1)-Verteilung • Kritischer Bereich ist K = (−∞, −tn−1,1−α/2) ∪ (tn−1,1−α/2, +∞) = {t ∈ R : |t| > tn−1,1−α/2} d.h. Lehne H0 ab, falls T (X1, . . . , Xn) ∈ K Lehne H0 nicht ab, falls T (X1, . . . , Xn) ∈ /K 385 Bemerkungen: [I] • Dieser Test heißt zweiseitiger t-Test • Für den rechtsseitigen t-Test H0 : µ ≤ µ0 gegen H1 : µ > µ 0 ergibt sich bei Benutzung der Teststatistik √ X − µ0 T (X1, . . . , Xn) = n − 1 · S zum Signifikanzniveau α der kritische Bereich K = (tn−1,1−α, +∞) 386 Bemerkungen: [II] • Für den linksseitigen t-Test H0 : µ ≥ µ 0 gegen H1 : µ < µ 0 ergibt sich bei Benutzung der Teststatistik √ X − µ0 T (X1, . . . , Xn) = n − 1 · S zum Signifikanzniveau α der kritische Bereich K = (−∞, −tn−1,1−α) 387 Beispiel: • Es sei X ∼ N (µ, σ 2) mit unbekannten µ und σ 2 • Betrachte zweiseitigen t-Test mit µ0 = 6 z.N. α = 0.05 • Einfache Stichprobe mit n = 8 Werten ergibt: 1.6611 3.6215 4.5674 7.6635 1.2770 2.6660 5.3406 3.8029 • Wert der Teststatistik: √ 3.8250 − 6 √ x − µ0 = −2.9633 = 7· t= n−1· s 1.9411 • Es gilt: |t| = 2.9633 > 2.3646 = t7,0.975 −→ Ablehnung von H0 388 7.3 Tests für Varianzen Situation: • Der interessierende Zufallsvorgang sei normalverteilt, d.h. X ∼ N (µ, σ 2), wobei sowohl µ als auch σ 2 unbekannt sein sollen • Betrachte für geg. σ02 ∈ R das zweiseitige Testproblem H0 : σ 2 = σ02 gegen H1 : σ 2 6= σ02 389 Geeignete Teststatistik lautet: T (X1, . . . , Xn) = n · S2 σ02 = !2 n X Xi − X i=1 σ0 Begründungen: • T (X1, . . . , Xn) schätzt im wesentlichen das Verhältnis zwischen unbekannter Varianz σ 2 und dem Vergleichswert σ02 • Wenn H0 gültig ist (d.h. falls σ 2 = σ02), dann gilt: T (X1, . . . , Xn) ∼ χ2(n − 1) (vgl. Satz 5.5(e), Folie 311) 390 χ2(3)-Dichte von T (X1, . . . , Xn) bei Gültigkeit von H0 0.25 0.20 χ2-Dichte von T unter H0 0.15 0.10 0.05 0.00 0 2 4 6 8 10 12 14 391 Bezeichnung: • Das p-Quantil der χ2(ν)-Verteilung wird in Mosler / Schmid mit χ2 ν,p bezeichnet • Kritischer Bereich ist 2 K = [0, χ2 ∪ ) (χ n−1,α/2 n−1,1−α/2 , +∞) d.h. 2 oder Lehne H0 ab, falls T < χ2 T > χ n−1,1−α/2 n−1,α/2 2 Lehne H0 nicht ab, falls T ∈ [χ2 , χ n−1,α/2 n−1,1−α/2 ] 392 Bemerkungen: [I] • Die Dichte der χ2(ν)-Verteilung ist nicht symmetrisch, d.h. 2 χ2 ν,p 6= −χν,1−p • Für den rechtsseitigen Varianztest H0 : σ 2 ≤ σ02 gegen H1 : σ 2 > σ02 ergibt sich bei Benutzung der Teststatistik T (X1, . . . , Xn) = n · S2 σ02 = !2 n X Xi − X i=1 σ0 zum Signifikanzniveau α der kritische Bereich 2 , +∞) K = (χn−1,1−α (d.h. verwerfe H0, falls T > χ2 n−1,1−α) 393 Bemerkungen: [II] • Für den linksseitigen Varianztest H0 : σ 2 ≥ σ02 H1 : σ 2 < σ02 gegen ergibt sich bei Benutzung der Teststatistik T (X1, . . . , Xn) = n · S2 σ02 = !2 n X Xi − X i=1 σ0 zum Signifikanzniveau α der kritische Bereich 2 K = (−∞, χn−1,α ) 2 ) (d.h. verwerfe H0, falls T < χn−1,α 394 Bemerkungen: [III] • Falls der E-Wert µ der Normalverteilung bekannt ist, verwende die Teststatistik T (X1, . . . , Xn) = !2 n X Xi − µ i=1 σ0 und die Quantile der χ2(n)-Verteilung (vgl. Satz 5.5(d), Folie 311) 395 Beispiel: [I] • Gegeben seien folgende Messungen aus einer Normalverteilung (µ, σ 2 unbekannt): 1001, 1003, 1035, 998, 1010, 1007, 1012 • Man betrachte den folgenden Test z.N. α = 0.05: H0 : σ 2 ≤ 100 • Es gilt: gegen H1 : σ 2 > 100 n · S2 7 · 129.96 T (x1, . . . , xn) = = = 9.0972 2 100 σ0 396 Beispiel: [II] • Für α = 0.05 findet man das Quantil χ2 6,0.95 = 12.592 • Es folgt: T (x1, . . . , xn) = 9.0972 < 12.592 = χ2 6,0.95 −→ H0 kann nicht verworfen werden 397