Schlieÿende Statistik (Teschl/Teschl Kap. 30) Vorgehensweise: I Stichproben werden als Realisierungen von Zufallsvariablen mit unbekannter oder nur teilweise bekannter Verteilung betrachtet. I Anhand des Stichprobenergebnisses wird versucht, Informationen über die zugrunde liegende Verteilung zu gewinnen. Dabei kommen in der Regel Methoden der Wahrscheinlichkeitsrechnung zum Einsatz. test13.pdf, Seite 1 Drei betrachtete Fälle I Parameterschätzungen: Eine Stichprobe dient dazu, eine Schätzung für den Wert eines Parameters einer Verteilung wie z. B. Erwartungswert, Varianz, Erfolgswahrscheinlichkeit, etc. zu bekommen. I Hypothesentests: Prüfen, ob die Daten dafür sprechen, ob eine bestimmte Hypothese zutrit. Beispiel: Würfel ist gezinkt, oder Medikament B wirkt besser als A I Kondenzintervalle: Angabe eines Intervalls, in dem ein unbekannter Parameter vermutlich liegt. test13.pdf, Seite 2 Modellierung von Zufallsstichproben Eine Stichprobe Werte von n x1 , ..., xn vom Umfang n wird interpretiert als unabhängigen, identisch verteilten Zufallsvariablen X1 , X2 , ..., Xn . Parametrische und nichtparametrische Statisitk In vielen Anwendungen wird angenommen, dass die Xk einer bestimmten Verteilung genügen wie z. B. Normal- oder Binomialverteilung, deren Parameter (µ, σ, p, ...) jedoch nicht oder nicht alle bekannt sind. In diesem Fall spricht man von parametrischer Statistik. In der nichtparametrischen Statistik werden im Gegensatz dazu a proiri keine Annahmen über die Verteilung der untersuchten Gröÿen gemacht. test13.pdf, Seite 3 Schätzfunktionen dienen dazu, den Wert eines Parameters oder einer Kenngröÿe zu schätzen. Beispiel Nach dem Gesetz der groÿen Zahlen gilt lim n→∞ n (X1 + ... + Xn ) = µ, Xk ist. Somit kann das arithmetische Mittel x = (x1 + ... + xn ) einer Stichprobe (für n hinreichend groÿe n ) als Schätzung für den Erwartungswert wobei µ 1 der Erwartungswert der 1 der zugrunde liegenden Verteilung interpretiert werden. test13.pdf, Seite 4 Beispiel 2 Ist der Erwartungswert µ der Xk bekannt, so folgt aus dem Gesetz der groÿen Zahlen angewandt auf die unabhängigen und identisch verteilten Zufallsvariabeln lim n→∞ 1 n (Xk − µ)2 (X1 − µ)2 + ... + (Xn − µ)2 = E (Xk − µ)2 = V (Xk ). Man erhält also für hinreichend groÿe n eine Schätzung der Varianz (und damit auch der Standardabweichung). test13.pdf, Seite 5 Mathematische Beschreibung Zu einer Stichprobe x1 , ..., xn ∈ R ist eine Stichprobenfunktion eine Abbildung T : Rn → R : (x1 , ..., xn ) 7→ T (x1 , ..., xn ). Beispiel: T (x1 , ..., xn ) = Tn (x1 , ..., xn ) = n1 (x1 + ... + xn ). Sind die xk Werte von (unabhängigen und identische verteilten) Zufallsvariabeln, so ist auch T (X1 , ..., Xn ) wieder eine Zufallsvariable. Man spricht von einer Schätzfunktion oder einem Schätzer, wenn ihr Wert als Schätzung eines Parameters der Verteilung der Xk verwandt wird. Beispiel: Die Zufallsvariable T (X1 , ..., Xn ) = X = n1 (X1 + ... + Xn ) Erwartungswert der Xk . ist ein Schätzer für den test13.pdf, Seite 6 Konsistenz von Schätzern Im Beispiel T (X1 , ..., Xn ) = X gilt nach dem Gesetz der groÿen Zahlen limn→∞ T (X1 , ..., Xn ) = EX = µ. Diese Eigenschaft bedeutet, dass das arithmetische Mittel X als Schätzfunktion für den Erwartungswert einer (unbekannten) Verteilung Interpretation: konsistent ist. Eine konsistente Schätzfunktion liefert eine gute Schätzung des gesuchten Parameters, wenn der Stichprobenumfang n hinreichend groÿ ist. test13.pdf, Seite 7 Weitere Beispiele für konsistente Schätzfunktionen I T =P = (Zahl der Erfolge)/(Zahl der Versuche) als Schätzer für die Erfolgswahrscheinlichkeit bei einer Binomialverteilung I T =X als Schätzer für den Parameter λ einer PoissonVerteilung I 1 (Zahl der xk mit xk ≤ x ) n als Schätzer für den Wert der Verteilungsfunktion F (x) = der Stelle F an x, verallgemeinert: Die empirische Verteilungsfunktion F ist eine Schätzung der zugrunde liegenden tatsächlichen Verteilungsfunktion F. I Für eine beliebige reelle Funktion 1 g ist g (X1 ) + ... + g (Xn ) ein konsistenter Schätzer für den n Erwartungswert von g (X ) (folgt aus dem Gesetz der groÿen Zahlen). test13.pdf, Seite 8 Empirische und theoretische Verteilungsfunktion einer Stichprobe vom Umfang n = 50 einer exponentialverteilten Zufallsgröÿe test13.pdf, Seite 9 Schätzer für die Varianz µ ist (X1 − µ) + ... + (Xn − µ)2 I bei bekanntem Erwartungswert T = 1 n 2 ein konsistenter Schätzer für die Varianz der Verteilung der Xk . I Ist der Erwartungswert nicht bekannt, so erhält man einen konsistenten Schätzer, indem manµ durch T̂ = 1 n 2 (X1 −X ) +...+(Xn −X ) 2 = X ersetzt, also 2 (X12 +...Xn2 )−X . n 1 T − T̂ = (X − µ)2 → 0 für n → ∞. Ist x 6= µ, so gilt T̂ (x1 , ..., xn ) < T (x1 , ..., xn ). Dies hat zur Folge, dass T̂ im Durchschnitt zu kleine Werte für die Varianz liefert. T̂ ist als Schätzfunktion der Varianz nicht erwartungstreu. Die Konsistenz folgt aus I test13.pdf, Seite 10 Empirische Varianz Um diese tendenzielle Abweichung auszugleichen, betrachtet man die empirische Varianz 1 n (X1 − X )2 + ... + (Xn − X )2 T̂ = n−1 n−1 2 Wird das so denierte S als Zufallsvariable betrachtet, so ist 2 2 2 für jedes feste n der Erwartungswert ES = σ , wobei σ die (unbekannte) Varianz der Xk bezeichnet. S2 = Somit ist die empirische Varianz ein erwartungstreuer Schätzer für die Varianz einer Verteilung mit unbekanntem Erwartungswert. Wegen limn→∞ ist S2 S 2 = limn→∞ n T̂ n−1 = limn→∞ n n−1 · limn→∞ T̂ = 1 · σ 2 als Schätzer auch konsistent. Bemerkung: √ S2 ist als Schätzer für die Standardabweichung konsistent, jedoch nicht erwartungstreu. test13.pdf, Seite 11 Hypothesentests liefern anhand einer Stichprobe eine Entscheidung zwischen einer H0 Nullhypothese H0 und H1 und einer Alternative H1 . müssen sich gegenseitig ausschlieÿen. Beispiel Würfel H0 : alle Augenzahlen sind gleich wahrscheinlich H1 : die Wahrscheinlichkeit der 6 ist > 1 6. Vorgehensweise Wenn sich die Stichprobe hinreichend durch die Verteilung von H0 erklären lässt, wird die Nullhypothese H0 beibehalten. Wenn die Stichprobe signikant darauf hindeutet, dass zutrit, wird H0 verworfen angenommen. und die Alternative H1 H1 test13.pdf, Seite 12 Fehler 1. und 2. Art Bei einem Hypothesentest gibt es grundsätzlich 5 Möglichkeiten: I H0 trit zu und der Test führt dazu, H0 (zu Recht) H0 (zu Recht) zu beizubehalten. I H1 trit zu und der Test führt dazu, H1 anzunehmen. H0 noch H1 trit zu. Dieser verwerfen und I Weder Fall kann durch geeignete Formulierung der Hypothesen ausgeschlossen werden und wird im Folgenden nicht weiter betrachtet. I I H0 H0 trit zu und wird zu Unrecht verworfen (Fehler 1. Art). trit nicht zu und wird trotzdem (zu Unrecht) beibehalten (Fehler 2. Art). test13.pdf, Seite 13 Aufbau eines Tests Der Test wird so konstruiert, dass die Wahrscheinlichkeit für einen Fehler 1. Art kleiner gleich einem vorgegebenen Signikanzniveau α (typischerweise 1%, 2%, 5% oder 10%) ist. Dazu berechnet man eine T = T (x1 , ..., xn ) ∈ R Teststatistik oder Prüfgröÿe als Funktion einer Zufallsstichprobe H0 (z. B. Mittelwert, Anteil der Sechsen). Unter x1 , ..., xn ist die Verteilung der Teststatistik bekannt. Man wählt nun einen Bereich P(T (x) ∈ W ) ≥ 1 − α, Sechsen < 25%). T (x) 6∈ W falls W ⊂ R, sodass H0 zutrit (Beispiel sollte darauf hindeuten, dass H0 Anteil der falsch ist und H1 zutrit. V =R\W ist dann der Verwerfungsbereich des Tests. d. h. man verwirft H0 und nimmt oder H1 kritische Bereich an, falls T (x) in V liegt. test13.pdf, Seite 14 Im Würfelbeispiel T = T (x) = Unter H0 Zahl der Sechsen beim 100maligen Würfeln (fairer Würfel) ist P(T ≥ 24) ≈ 3, 8 %. d. h. bei einem fairen Würfel treten mit über 96prozentiger Wahrscheinlichkeit nicht mehr als 23 Sechsen auf. Damit kann zum Niveau 5% die Menge {24, 25, ..., 100} als kritischer Bereich gewählt werden. Wenn 24 oder mehr Sechsen gewürfelt werden, wird H0 verworfen und H1 angenommen. In diesem Fall wird aus dem Test geschlossen, dass der Würfel gezinkt sein muss. Damit wird jedoch mit Wahrscheinlichkeit 3, 8 % auch ein fairer Würfel fälschlicherweise als gezinkt betrachtet (Fehler 1. Art). Bei bis zu 23 Sechsen ist die Abweichung vom Erwartungwert 1 6 dagegen noch nicht signikant genug, um daraus zu schlieÿen, dass der Würfel gezinkt ist, d. h. H0 wird 16 beibehalten. test13.pdf, Seite 15 Zum Fehler 2. Art Je kleiner das Signikanzniveau wird die Hürde, steigt, H0 H0 α gewählt wird, desto höher zu verwerfen, d. h. die Wahrscheinlichkeit zu Unrecht beizubehalten. Hängt die Verteilung von einem Parameter θ ab und haben die Hypothesen die Form H0 : θ = θ0 und H1 : θ > θ0 so kann für jedes θ θ = θ0 θ < θ0 oder θ 6= θ0 ), die Wahrscheinlichkeit β(θ) = Pθ (X ∈ V ) Für (oder berechnet werden. muss gelten β(θ0 ) ≤ α. Ein Fehler 2. Art ist umso unwahrscheinlicher, je näher an 1 liegt für die zu β(θ) wird als H1 gehörenden Gütefunktion β(θ) θ. des Tests bezeichnet. test13.pdf, Seite 16 Gütefunktion zum 100maligen Würfeln test13.pdf, Seite 17 Beispiel mit Normalverteilung Bei den Füllmengen einer Packung wird davon ausgegangen, dass sie normalverteilt sind mit Erwartungswert Varianz 2 und σ = 4. Eine Stichprobe vom Umfang Mittel µ0 = 100 x = 99. n = 25 ergibt ein arithmetisches Kann davon ausgegangen werden, dass dies eine zufällige Abweichung ist oder liegt eine systematische Abweichung vor? (d. h. der Erwartungswert ist in Wirklichkeit < 100) Um dies zu testen, formuliert man die Hypothese H0 : µ = 100 und die Alternative H1 : µ < 100. X wird als Zufallsvariable interpretiert, unter H0 bekannt ist (siehe nächste Seite). Das Stichprobenmittel deren Verteilung test13.pdf, Seite 18 Fortsetzung Beispiel X1 , ..., X25 ∼ N(100; 4) unabhängige Zufallsvariablen, S25 = X1 + ... + X25 normalverteilt mit Erwartungswert 2 25 · 100 = 2500 und Varianz 25 · σ = 100. Sind so ist Für X = 1 2 25 σX2 = Unter 1 25 S25 folgt H0 · σS2n = E X = 100, 4 25 und σX = q 4 25 = 2 5 = 0, 4. gilt somit P(X ≤ 99) = Φ 99−100 0,4 = Φ(−2, 5) = 1 − Φ(2, 5) = 1 − 0, 9938 = 0, 62 %, d. h. das beobachtete Ereignis ist unter unwahrscheinlich (< 1 könnte, H0 %), H0 relativ was zum Anlass genommen werden zu verwerfen. In diesem Fall lässt sich jedoch ein Fehler 1. Art nicht ganz ausschlieÿen. test13.pdf, Seite 19 Der (einseitige) GauÿTest Die Überlegungen im letzten Beispiel führen zum GauÿTest für den Erwartungswert einer Normalverteilung bei bekannter Varianz. Gegeben ist eine normalverteilte Zufallsgröÿe mit bekannter Standardabweichung σ . Zu Nullhypothese H0 : µ = µ0 gegen die Alternative Erwartungswert testen ist die µ und H1 : µ < µ0 . Zu einer Stichprobe vom Umfang berechnet man die √ H0 mit Mittelwert x Teststatistik n z= · (x − µ0 ) = σ die unter n r n · (x − µ0 ), σ2 standardisiert und somit standardnormalverteilt ist. test13.pdf, Seite 20 Entscheidungsregel im GauÿTest Man gibt ein Signikanznivaeu α > 0 vor, welches als Wahrscheinlichkeit für einen Fehler 1. Art in Kauf genommen wird (typische Werte liegen im Bereich 0 vergleicht z mit dem < α ≤ 0, 1), αQuantil zα = −z1−α und der Standardnormalverteilung: I Ist z < −z1−α , so wird H0 verworfen und H1 angenommen, d. h. die Abweichung des Mittelwertes von µ0 ist signikant genug, um von einer systematischen Abweichung auszugehen. I Ist z > −z1−α , so wird H1 abgelehnt und d. h. die Dierenz zwischen x und µ0 H0 beibehalten, wird durch eine zufällige Abweichung erklärt. (Im (theoretisch) mit Wahrscheinlichkeit 0 auftretenden Grenzfall z = −z1−α ist die Entscheidungsregel uneinheitlich.) test13.pdf, Seite 21 Verteilung der Teststatistik z H0 : µ = µ0 und kritischer Bereich im Fall α = 0, 01 = 1 % beim einseitigen GauÿTest mit Alternative H1 : µ < µ0 unter Hat z einen Wert im kritischen Bereich, so wird bei einem Wert im grünen Bereich wird H0 der H0 verworfen, beibehalten. test13.pdf, Seite 22 Verteilung von im Fall z µ0 = 100, µ = 99, σ = 2 und n = 25 Hier führt die Entscheidungsregel dazu, dass Wahrscheinlichkeit 56, 9 % H0 mit zu Recht verworfen wird. Die Wahrscheinlichkeit eines Fehlers 2. Art beträgt dann 43, 1 %. test13.pdf, Seite 23 Im Beispiel H0 : µ = µ0 = 100, H1 : µ < 100 mit σ2 = 4 ⇔ σ = 2 und einer Stichprobe vom Umfang n = 25 mit Mittelwert x = 99 erhält man die Teststatistik q pn 5 z = σ · (x − µ0 ) = 25 4 · (99 − 100) = 2 · (−1) = −2, 5. 2 mit dem Quantil α = 0, 01 vorgegeben, so vergleicht z0,01 = −z0,99 = −2, 32635. z < −z0,99 H0 Ist das Signikanzniveau man z Wegen wird verworfen und Würde man dagegen das Niveau H1 α = 0, 005 angenommen. vorgeben, so ist z = −2, 5 > z0,005 = −z0,995 = −2, 57583, d. h. in diesem Fall müsste H0 beibehalten und H1 abgelehnt werden. test13.pdf, Seite 24 Alternative H1 : µ > µ 0 In diesem Fall berechnet man wieder die unter pn standardnormalverteilte Teststatistik z = σ2 H0 : µ = µ 0 · (x − µ0 ). Der kritische Bereich wird jetzt am rechten Rand gewählt, d. h. bei gegebenem Niveau I Ist I Ist z > z1−α , z < z1−α , so wird so wird α H0 H0 lautet die Entscheidungsregel H1 angenommen. und H1 abgelehnt. verworfen und beibehalten test13.pdf, Seite 25 Beim zweiseitigen GauÿTest mit H1 : µ 6= µ0 wird der kritische Bereich symmetrisch aufgeteilt, so dass der linke und der rechte Teil unter α Wahrscheinlichkeit haben. H0 : µ = µ 0 jeweils die 2 Mit der Teststatistik z= pn σ2 · (x − µ0 ) ergibt sich die Entscheidungsregel H0 und nehme H1 an, falls z < z α = −z1− α oder z > z1− α , d. h. falls |z| > z1− α . Behalte H0 bei und lehne H1 ab, falls |z| < z1− α . I Verwerfe 2 2 2 2 I 2 test13.pdf, Seite 26 Zweiseitiger kritischer Bereich graphisch Im Beispiel H0 : µ = 100, σ = 2, n = 25 und x = 99 ⇒ z = −2, 5 Führt man einen zweiseitigen Test mit der Alternative H1 : µ 6= 100 zum Niveau α = 1 % = 0, 01 durch, so ist |z| = | − 2, 5| = 2, 5 mit dem 1 − α2 Quantil z0,995 = 2, 576 zu vergleichen. Wegen 2, 5 = |z| < z0,995 = 2, 576 wird H0 beibehalten und H1 abgelehnt. test13.pdf, Seite 27 Weiteres Beispiel Betrachte die Stichprobe 38, 41, 43, 48, 53, 62, 64, 71, 81 einer normalverteilten Grundgesamtheit mit bekannter Standardabweichung H0 : µ = 50 gegen α = 0, 1 = 10 %. σ = 20. Zu testen sei die Nullhypothese die Alternative H1 : µ > 50 zum Niveau √ Es ist x = 55, 7 Mit dem ist und 9 20 z= (1 − α)Quantil · (55, 7 − 50) = 0, 855. der Normalverteilung z0,9 = 1, 2816 z < z0,9 . Somit ist die Alternative H1 abzulehnen und H0 Die Abweichung des beobachteten Mittelwertes Sollwert µ0 = 50 beizubehalten. x = 55, 7 vom ist nicht groÿ genug, um mit hinreichender Sicherheit zu schlieÿen, dass µ > 50 ist. Im Fall eines zweiseitigen Tests erhält man |z| = z = 0, 855 < z0,95 = 1, 6449, H10 : µ 6= 50 wäre abzulehnen. d. h. auch die Alternative test13.pdf, Seite 28 Der t Test ist ein Test für den Erwartungswert einer normalverteilten Zufallsgröÿe mit unbekannter Varianz. Man betrachtet wie beim GauÿTest die Nullhypothese H0 : µ = µ0 . Bei der Berechnung der Teststatistik wird dann 2 2 die Varianz σ durch die Stichprobenvarianz s ersetzt, d. h. man erhält für eine Stichprobe vom Umfang n mit Mittelwert x und empirischer Varianz s 2 die Teststatistik r √ n n t= · (x − µ0 ) = · (x − µ0 ). s s2 Man kann zeigen, dass m =n−1 t unter H0 einer t Verteilung mit Freiheitsgraden genügt. Daher sind bei der Entscheidungsregel die Quantile der Normalverteilung durch die entsprechenden Quantile der tn−1 Verteilung zu ersetzen, welche ebenfalls in Tabellen aufgeführt sind. test13.pdf, Seite 29 Entscheidungsregel beim Mit H 0 : µ = µ0 t Test und der Teststatistik r t= n · (x − µ0 ) s2 betrachtet man bei vorgegebenem Signikanzniveau α wie beim GauÿTest drei Fälle: I Einseitiger t Test H1 : µ < µ0 und H1 angenommen, mit H0 wird verworfen falls t < tn−1;α = −tn−1;1−α . I Einseitiger t Test mit H1 : µ > µ0 H0 wird verworfen und H1 angenommen, falls t > tn−1;1−α . I Zweiseitiger t Test mit H1 : µ 6= µ0 H0 wird verworfen und H1 angenommen, falls |t| > tn−1;1− α . Ansonsten wird H1 abgelehnt und H0 beibehalten. 2 test13.pdf, Seite 30 Beispiel Ist im letzten Beispiel (zum GauÿTest) die Varianz unbekannt, so berechnet man die empirische Varianz s 2 = 217, 5 ⇒ s = √ t= n s s 2 = 14, 7 und die Teststatistik √ √ · (x − µ0 ) = 9 14,7 · (55, 7 − 50) ≈ 1, 16. Im Fall α = 0, 1 und H1 : µ > 50 wird t mit dem (1 − α)Quantil der t8 Verteilung (wegen n = 9 ⇔ n − 1 = 8) verglichen: t = 1, 16 < t8; 0,1 = 1, 397 (aus Tabelle) Damit ist auch hier ist die Alternative und H0 : µ = 50 H1 : µ > 50 abzulehnen beizubehalten. 0 Im Fall H1 : µ 6= µ0 betrachtet man 0 H1 wegen |t| < t8; 0,95 ebenfalls ab. t8; 0,95 = 1, 860 und lehnt test13.pdf, Seite 31 Zusammenfassung: Tests für den Erwartungswert einer Normalverteilung Gegeben sei eine normalverteilte Gröÿe mit Erwartungswert und Varianz σ 2 und die Nullhypothese Zu einer Stichprobe vom Umfang 2 n µ H0 : µ = µ 0 . mit Mittelwert x und empirischer Varianz s berechnet man die Teststatistik √ pn n I z = · (x − µ0 ), falls σ 2 bekannt ist, · (x − µ ) = 0 σ σ2 √ p n I t = · (x − µ0 ) = sn2 · (x − µ0 ), falls σ 2 unbekannt ist. s Entscheidungsregel Bei einem Signikanzniveau anzunehmen und H0 α ist die Alternative H1 zu verwerfen, falls z < −z1−α bzw. t < −tn−1; 1−α im Fall H1 : µ < µ0 , I z > z1−α bzw. t > tn−1; 1−α im Fall H1 : µ > µ0 , I |z| > z1− α bzw. |t| > tn−1; 1− α im Fall H1 : µ 6= µ0 . Andernfalls wird H1 abgelehnt und H0 beibehalten. I 2 2 test13.pdf, Seite 32 Bemerkungen I Wegen des zentralen Grenzwertsatzes können der GauÿTest und der t Test auch bei nicht normalverteilten Merkmalen benutzt werden, so lange der n ≥ 30). p Wert das Stichprobenumfang groÿ genug ist (Faustregel I Zu einer gegebenen Stichprobe gibt der kleinstmögliche Niveau α an, zu dem die Nullhypothese verworfen wird. Beispiel 1: Im ersten Beispiel zum GauÿTest (µ0 = 100, x = 99, σ = 2, n = 25 und H1 : µ < 100) liegt der p Wert bei 0, 62 %. Er entspricht der Wahrscheinlichkeit unter H0 , dass das Stichprobemittel kleiner oder gleich dem beobachteten Wert ist. Beispiel 2: Beim 100maligen Würfeln liegt der p Wert für 24 Sechsen bei 3, 8% (Wahrscheinlichkeit für 24 oder mehr Sechsen unter H0 ). test13.pdf, Seite 33 Der χ2 (Streuungs-)Test ist ein Test für die Varianz (ChiQuadratTest) σ2 einer normalverteilten Zufallsgröÿe. H0 : σ 2 = σ02 und als 2 2 2 2 Fälle σ < σ0 oder σ > σ0 Man betrachtet die Nullhypothese Alternative σ 2 6= σ02 . H1 einen der drei Mit der empirischen Varianz Umfang n s2 einer Stichprobe vom berechnet man die Teststatistik y = (n − 1) · s2 , σ02 von der sich zeigen lässt, dass sie unter mit m =n−1 χ H0 einer χ2 Verteilung Freiheitsgraden genügt. Die Entscheidungsregel vergleicht 2 oder y mit Quantilen der Verteilung, die ebenfalls in Tabellen aufgeführt sind. test13.pdf, Seite 34 Entscheidungsregel beim Die Alternative H1 χ2 Test wird angenommen und H0 : σ 2 = σ02 verworfen, falls I I I y < χ2n−1; α y > χ2n−1; 1−α y < χ2n−1; α oder y > χ2n−1; 1− α 2 Dabei sind n−1 χ2n−1; α 2 etc. die Quantile der im Fall im Fall im Fall H1 : σ 2 < σ02 . H1 : σ 2 > σ02 , H1 : σ 2 6= σ02 , χ2 Verteilung mit Freiheitsgraden. Zu beachten ist, dass die χ2 Verteilung im Gegensatz zur t Verteilung nicht symmetrisch ist. Somit gilt 2 nicht χm; α = −χ2m; 1−α . Insbesondere ist beim zweiseitigen χ2 Test die Teststatistik y immer mit zwei verschiedenen Normal- und Quantilen zu vergleichen. Tabellen der kleine χ2 Verteilung enthalten immer auch Quantile für α. test13.pdf, Seite 35 Beispiel Kritischer Bereich (rot) eines zweiseitigen H1 : σ 2 6= σ02 ) zum Niveau α = 0, 1 ⇔ α Stichprobenumfang 2 χ2 Tests (d. h. mit = 0, 05 bei einem n = 9 ⇔ n − 1 = 8. H0 : σ 2 = σ02 wird verworfen, wenn entweder y < χ28; 0,05 = 2, 73 oder y > χ28; 0,95 = 15, 51 (Werte aus Tabelle). Liegt die Teststatistik y zwischen beiden Quantilen (im grünen Bereich), so wird H0 beibehalten. test13.pdf, Seite 36 Zahlenbeispiel H0 : σ = 20 ⇔ σ 2 = 400 gegen H1 : σ 6= 20 zum Niveau α = 10% anhand einer Stichprobe vom Umfang n = 9 mit empirischer Varianz s 2 = 217, 5 (vergleiche Beispiel Zu testen sei zum GauÿTest). Man erhält y = (n − 1) · s2 σ02 =8· 217,5 400 was mit den Quantilen χ28; = 4, 35, 0,05 = 2, 73 und χ28; 0,95 = 15, 51 zu vergleichen ist. Wegen 2, 73 < y < 15, 51 Bei der Alternative 2 10%Quantil χ8; 0,1 Wegen y = 4, 35 H10 abgelehnt. wird H0 beibehalten. H10 : σ 2 < σ02 = 202 = 400 = 3, 49 verglichen. > 3, 49 wird auch hier H0 wird y mit dem beibehalten und test13.pdf, Seite 37 Bemerkungen I Erwartungswert und Stichprobenmittel spielen für die Varianz keine Rolle und gehen nicht in die Berechnung ein. I Der χ2 Test setzt grundsätzlich (auch bei groÿem n) eine Normalverteilung voraus, da der zentale Grenzwertsatz auf die empirische Varianz Teststatistik y s2 und somit auf die nicht anwendbar ist. test13.pdf, Seite 38 Der χ2 Anpassungstest testet, ob ein diskretes Merkmal eine vorgegebene Verteilung P(X = ai ) = pi a1 , ..., am für die möglichen p1 , ..., pm für die zugehörigen hat. Dabei stehen Ausprägungen des Merkmals und Wahrscheinlichkeiten. Hat man eine Stichprobe vom Umfang Häugkeiten h1 , ..., hm , n mit den absoluten so ist die Teststatistik m X (hi − npi )2 y= npi i=1 für hinreichend groÿe alle n) n näherungsweise n · pi ≥ 5 ⇔ n ≥ p5i für mit m − 1 Freiheitsgraden. (Faustregel χ2 verteilt test13.pdf, Seite 39 χ2 Anpassungstest, Durchführung H0 : P(X = ai ) = pi für i = 1, ..., m, H1 : P(X = ai ) 6= pi für mindestens ein H0 wird beim Niveau α verworfen, falls i. y > χ2m−1; 1−α . Beispiel h1 = 22 Einsen, h2 = 10 Zweien, h5 = 15 Fünfen und h6 = 25 mit p1 = ... = p6 = 1/6 hat dann 100maliges Würfeln ergibt h3 = 16 Dreien, h4 = 12 Vieren, Sechsen. Die Teststatistik den Wert y ≈ 10, 04. y < χ25; 0,95 = 11, 07 kann die Nullhypothese H0 , dass der Würfel fair ist, bei einem Niveau von α = 5% nicht Wegen verworfen werden. Bei α = 10% dagegen wird H0 wegen y > χ25; 0,9 = 9, 236 verworfen. test13.pdf, Seite 40 Bemerkung Bei stetigen Merkmalen (oder bei diskreten Merkmalen, die zu viele verschiedene Werte annehmen) teilt man die Merkmale in Klassen ein. Auf die Wahrscheinlichkeitsverteilung der Klassen kann dann ein χ2 Anpassungstest durchgeführt werden, wenn die Klassen so gewählt sind, dass die Bedingung npi ≥ 5 für jede Klasse erfüllt ist. In der Praxis wird der χ2 Anpassungstest oft benutzt, um festzustellen, ob ein Merkmal einer bestimmten Verteilung (z. B. Normalverteilung) genügt. Der Ansatz kann auch dazu benutzt werden, zu testen, ob zwei Merkmale unabhängig sind. test13.pdf, Seite 41 Kondenzintervalle: Beispiel Gegeben sei eine Stichprobe von Umfang n = 20 eines normalverteilten Merkmals mit unbekanntem Erwartungswert µ und bekannter Varianz arithmetische Mittel (das eine Schätzung Stichprobe sei σ 2 = 5. Das für µ liefert) der x = 9. Jetzt kann für verschiedene Werte für µ0 getestet werden, ob sie als Erwartungswert in Frage kommen. Dazu prüft man, ob die Hypothese H0 : µ = µ0 einen GauÿTest zu einem α besteht, d. h. nicht verworfen vorgegebenen Niveau Dazu wählen wir α = 0, 1 wird. (als Toleranz, mit der eine Fehlentscheidung in Kauf genommen wird) und berechnen die Teststatistik z= pn σ2 · (x − µ0 ) = q 20 5 für verschiedene Werte von · (9 − µ0 ) = 2 · (9 − µ0 ) µ0 . test13.pdf, Seite 42 Fortsetzung Beispiel Für µ0 = 9 z =1 erhält man beispielsweise und für µ0 = 10 ist z = 0, für µ0 = 8 , 5 ist z = −2. Beim zweiseitigen GauÿTest wird |z| mit dem α 1− Quantil z0,95 = 1, 645 verglichen. 2 Bei µ0 = 9 und µ0 = 8, 5 wird H 0 : µ = µ0 jeweils beibehalten, d. h. beide Werte kommen als Erwartungswert in Frage. Dagegen wir die Hypothese α = 0, 1 verworfen, d. h. µ0 = 10 µ = 10 zum Niveau kommt als Erwartungswert eher nicht in Frage. Man kann nun die Menge aller Nullhypothese H0 : µ = µ0 µ∈R bestimmen, für die die beibehalten wird. test13.pdf, Seite 43 Fortsetzung Beispiel H 0 : µ = µ0 wird zum Niveau α = 0, 1 beibehalten ⇔ |z| ≤ z0,95 ⇔ |2 · (9 − µ0 )| ≤ 1, 645 ⇔ |9 − µ0 | = |µ0 − 9| ≤ 1 2 · 1, 645 = 0, 822. H0 genau dann beibehalten, wenn |9 − µ0 | ≤ 0, 822 ⇔ 8, 178 ≤ µ0 ≤ 9, 822. Somit wird Diese Werte bilden das für den Erwartungswert 1 Kondenzintervall I = [8, 178; 9, 822] µ zum Vertrauensniveau − α = 0, 9 = 90 %. Man kann also bei einer Irrtumswahrscheinlichkeit von 10 % davon ausgehen, dass der unbekannte Erwartungswert in diesem Intervall liegt. test13.pdf, Seite 44 Verallgemeinerung Gegeben sei eine normalverteilte Zufallsgröÿe mit unbekanntem Erwatungswert µ und bekannter Varianz sowie eine Stichprobe vom Umfang Mittel x. n mit arithmetischem Zu einem vorgegebeben Vertrauensniveau 1 α 1− Quantil z1− α der betrachtet wählt man das 2 c= q σ2 n · z1− α 2 Dann gilt dann unabhängig vom konkreten Wert für P(|x − µ| ≤ c) = 1 − α, d. h. bei einer Irrtumswahrscheinlichkeit α µ −α 2 Standardnormalverteilung und berechnet dass σ2 µ kann davon ausgegangen werden, im (zweiseitigen) Kondenzintervall I = [x − c; x + c] = x − q σ2 n · z1− α ; x + 2 q σ2 n · z1− α 2 liegt. test13.pdf, Seite 45 Bemerkung Die vereinfachende Aussage, dass 1 −α µ mit Wahrscheinlichkeit im berechneten Kondenzintervall liegt, ist nicht ganz korrekt, da der der Verteilung zugrunde liegende unbekannte Parameter µ keine Zufallsgröÿe ist. Somit ergeben Aussagen über Wahrscheinlichkeiten für die Lage von µ eigentlich keinen Sinn. Die bei der Herleitung des Kondenzintervalls betrachtete Zufallsgröÿe ist das Stichprobenmittel x, für welches sich die Verteilung berechnen lässt. Dadurch wird die Aussage, dass mit Wahrscheinlichkeit 1 die Abschätzung P(|x − µ| ≤ c) x −c liegt, sinnvoll. und x +c gilt und somit µ −α zwischen test13.pdf, Seite 46 Einseitige Kondenzintervalle (1α)Quantil z1−α als i σ √ bzw. −∞; x + n z1−α erhält man analog mit dem h σ √ x − n z1−α ; ∞ Bemerkungen I Da mit Wahrscheinlichkeiten einer stetigen Verteilung gerechnet wird, kann man auch jeweils oene Intervalle mit den gleichen Grenzen als Kondenzintervalle betrachten. I Je kleiner α gewählt wird, desto breiter werden die Kondenzintervalle. I Je gröÿer σ ist, desto breiter werden die Kondenzintervalle. I Je gröÿer n wird, desto schmaler werden die Kondenzintervalle. test13.pdf, Seite 47 Beispiel Gegeben sei eine Stichprobe vom Umfang arithmetischem Mittel x = 11, 5. n = 16 und σ 2 = 1 sei Die Varianz bekannt. Ein einseitiges Kondenzintervall der Form Niveau 1 − α = 0, 95 a=x− √1 16 also gilt µ ≥ 11, 089 I = [a; ∞) zum erhält man mit · z0,95 = 11, 5 − 14 · 1, 6449 ≈ 11, 089, bei einer Irrtumswahrscheinlichkeit von 5%. Ist ein nach oben beschränktes einseitiges Kondenzintervall der Form (−∞; b] zum Niveau 1 − α = 99% gesucht, so erhält man b=x+ √1 also gilt µ ≤ 12, 082 16 · z0,99 = 11, 5 + 41 · 2, 3263 ≈ 12, 082, bei einer Irrtumswahrscheinlichkeit von 1%. test13.pdf, Seite 48 Kondenzintervalle bei unbekannter Varianz Wie bei den Test wird in diesem Fall die Varianz Stichprobenvarianz s 2 σ2 durch die ersetzt. Statt der Quantile der Normalverteilung werden die entsprechenden Quantile bzw. tn−1;1− α 2 der t Verteilung mit n−1 tn−1;1−α Freiheitsgraden benutzt, die ebenfalls einer Tablle entnommen werden können. Ein zweiseitiges Kondenzintervall für den Erwartungswert µ einer normalverteilten Gröÿe mit unbekannter Varianz zum − α hat dann die Form s s I = [x − c; x + c] = x − √ · tn−1;1− α ; x + √ · tn−1;1− α n n q s mit c = · tn−1;1− α , wobei n der Stichprobenumfang, x n 2 das arithmetische Mittel und s die empirische Varianz ist. Vertrauensniveau 1 2 2 2 2 test13.pdf, Seite 49 Beispiel Eine Stichprobe vom Umfang n=9 aus einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert unbekannter Varianz σ 2 µ und ergebe folgende (geordneten und gerundeten) Werte: 19, 29, 36, 38, 47, 52, 57, 59, 62 x = 44 13 , die empirische √ s 2 = 217, 5 ⇒ s = s 2 ≈ 14, 7. Der Mittelwert ist Varianz Ein zweiseitiges Kondenzintervall zum Niveau 90% für erhält man damit als c= √s 9 Es folgt · t8; 0,95 = 1 3 I = [x − c, x + c] µ mit · 14, 7 · 1, 86 ≈ 9, 1. I = [44, 3 − 9, 1; 44, 3 + 9, 1] = [35, 2; 53, 4], also kann bei einer Irrtumswahrscheinlichkeit von 10% davon ausgegangen werden, dass µ zwischen 35,2 und 53,4 liegt. test13.pdf, Seite 50 Einseitige Kondenzintervalle erhält man analog mit den entsprechenden h x− √s n · tn−1;1−α ; ∞ bzw. (1α)Quantilen: −∞; x + √s n · tn−1;1−α i Bemerkungen I Der zentrale Grenzwertsatz erlaubt es, die vorgestellten Formeln für eine beliebige Verteilung der unbekanntem Erwartungswert unbekannter) Varianz σ2 µ Xk mit und (bekannter oder zu benutzen, da für groÿe n n ≥ 30) X annähernd normalverteilt ist. Verteilungen der Xk , deren Typ bekannt ist (z. B. (Faustregel I Für Binomialverteilung, PoissonVerteilung), gibt es eine Reihe weiterer Formeln zur Bestimmung von Kondenzintervallen. Dabei wird oft ausgenutzt, dass es einen Zusammenhang zwischen Erwartungswert und Varianz gibt. test13.pdf, Seite 51 Einseitige Kondenzintervalle im Beispiel erhält man als (−∞, x + c̃] s c̃ = √ · tn−1; n und 1−α = [x − c̃, ∞) 14, 7 3 Ist also eine untere Abschätzung für mit · 1, 397 ≈ 6, 9. µ gesucht, so kann man mit einer Irrtumswahrscheinlichkeit von 10% davon ausgehen, dass µ ≥ 44, 3 − 6, 9 = 37, 4. Eine obere Abschätzung erhält man durch µ ≤ 44, 3 + 6, 9 = 51, 2. Bemerkung/Warnung: Die Wahrscheinlichkeit, dass beide Abschätzungen gleichzeitig stimmen, liegt nur noch bei 80%, denn dies entspricht einem zweiseitigen Kondenzintervall zum Niveau 0,8. test13.pdf, Seite 52 Kondenzintervall für die Varianz einer Normalverteilung Sind die Xk normalverteilt mit beliebigem Erwartungswert und unbekannter Varianz σ2, Kondenzintervall zum Vertrauensniveau 1 Quantile der wobei s2 Umfang 2 µ so erhält man ein zweiseitiges −α mit Hilfe der χn−1 Verteilung: " # (n − 1)s 2 (n − 1)s 2 ; , I = χ2n−1;1−α/2 χ2n−1;α/2 die empirische Varianz einer Stichprobe vom n ist. test13.pdf, Seite 53 Beispiel Hat eine Stichprobe vom Umfang Varianz s 2 = 4, 6, n = 21 die empirische so erfolgt die Bestimmung eines Kondenzintervalls I zum Niveau 1 − α = 95% (⇔ α = 0, 05) in folgenden Schritten: I Aus einer Tabelle sind die benötigten Quantile für α = 0, 025 und 1 − α = 0, 975 der χ2 Verteilung mit 2 2 n − 1 = 20 Freiheitsgraden zu entnehmen: χ220; 0,025 = 9, 591 und χ220; 0,975 = 34, 17 I Das gesuchte Kondenzintervall erhält man durch Einsetzen in die Formel mit I = h 92 92 34,17 ; 9,591 i ≈ [2, 69; (n − 1) · s 2 = 20 · 4, 6 = 92: 9, 59], d. h. bei einer Irrtumswahrscheinlichkeit von 5 % liegt die Varianz zwischen 2, 69 und 9, 59 und die Standardabweichung σ= √ σ2 zwischen 1, 64 und 3, 10. test13.pdf, Seite 54 Einseitige Kondenzintervalle für die Varianz − α erhält man durch Betrachtung der α bzw. − αQuantile der χ2 Verteilung: (n − 1)s 2 (n − 1)s 2 ; ∞ bzw. I = 0; I = χ2n−1;1−α χ2n−1;α zum Niveau 1 1 Im zweiten Fall ist die untere Grenze 0, da die Varianz nicht negativ werden kann. Kondenzintervalle für die Standardabweichung erhält man in allen betrachteten Fällen, indem man die Wurzeln der Intervallgrenzen der Varianz zieht. test13.pdf, Seite 55 Im Beispiel n = 21, s 2 = 4, 6 und 1 − α = 0, 95 χ220; 0,05 = 10, 85 und = 31, 41 und erhält die einseitigen Konfdenzintervalle h 20·4,6 I1 = 31,41 ; ∞ = [2, 93; ∞) sowie i h 20·4,6 I2 = 0; 10,85 = [0; 8, 48]. betrachtet man die Quantile χ220; 0,95 Bemerkung / Warnung Auf die Voraussetzung, dass die Xk normalverteilt sind, kann bei der Angabe eines Kondenzintervalls für die Varianz nicht verzichtet werden, da der zentrale Grenzwertsatz auf s2 nicht anwendbar ist. test13.pdf, Seite 56