Parameterfreie Tests Statistische Tests für unbekannten Anteil Binomialtest Vergleich von unbekannten Anteilen nicht verbundener Zufallsgrößen U - Test Mittelwertvergleich zweier nicht normalverteilter, nicht verbundener Zufallsgrößen Wilcoxon - Vorzeichenrangtest Mittelwertvergleich zweier nicht normalverteilter, verbunderer Stichproben Tests für Parameter p der Binomialverteilung Schätzung der Wahrscheinlichkeit p, mit der ein Ereignisses A eintritt: In n Versuchen beobachtet man Ereignis A genau k mal Anteil k/n ist dann eine Punktschätzung für Wahrscheinlichkeit P(A) Bezeichnungen im Modell 1 Stichprobe X 1 ,..., X n mit X i = 0 Anzahl der Einsen in der Stichprobe, entspricht der absoluten Häufigkeit des Eintretens von A bei n Versuchen k: Test auf Unabhängigkeit von zwei Zufallsgrößen pˆ = χ ²- Anpassungstest Test auf Vorliegen einer bestimmten Verteilung Prof. Dr. J. Schütze, FB GW eingetreten P( Xi = 1) = P(A) = p, (in jedem Versuch konstante) unbekannte Wahrscheinlichkeit χ ²- Unabhängigkeitstest SS 2016 falls A sonst k n relative Häufigkeit von A (Punktschätzung für p ) Ziel: Test der Nullhypothese p = p0 Parameterfreie Tests 1 Statistische Tests für unbekannten Anteil SS 2015 Prof. Dr. J. Schütze, FB GW Bin_Tests 2 Statistische Tests für unbekannten Anteil Beispiel Untersuchung der Regelmäßigkeit eines Würfels, d.h. jede Zahl fällt mit Wkt. 1/6 Man testet z.B. folgende Nullhypothese für das Würfeln einer ‚6‘ H0: p = 1/6 Experiment: 20 mal würfeln, dabei nur zweimal ‚6' Zweifel an der Regelmäßigkeit des Würfels ??? Im Mittel sollte man n·p = 20 · (1/6), also etwa 3.3 Sechsen beobachten. Theoretische Wahrscheinlichkeit: p0 = 1 / 6 = 0.198 Beobachtete relative Häufigkeit: p̂ = 2 / 20 = 0.1 Ist der Unterschied zwischen p und pˆ bei vorgegebener Sicherheit noch zufällig, oder sollte man die Regelmäßigkeit des Würfels anzweifeln? Regelmäßigkeit des Würfels entspricht der Nullhypothese Bei einem regelmäßigen Würfel ist die Anzahl X der Sechsen bei 20 Versuchen binomialverteilt mit Parametern n = 20, p0 = 1/6. H0: p =1/6 k n−k 20 1 5 P ( X = k ) = , 0 ≤ k ≤ 20 k 6 6 Bei welcher beobachteten Anzahl von Sechsen beginnt der Ablehnbereich für die Nullhypothese zu vorgegebener Irrtumswahrscheinlichkeit α? Wahrscheinlichkeit für genau 2 Sechsen bei 20 Versuchen: 20 1 5 P ( X = 2) = = 0.198 2 6 6 2 SS 2015 18 Prof. Dr. J. Schütze, FB GW Bin_Tests 3 SS 2015 Prof. Dr. J. Schütze, FB GW Bin_Tests 4 Statistische Tests für unbekannten Anteil Statistische Tests für unbekannten Anteil Konstruktion eines zweiseitigen Ablehnbereichs für H0: p = 1/6 bei Risiko α Verteilung der Anzahl Sechsen bei 20 Versuchen unter H0 : p = 1/6 k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Wkt. ,026 ,104 ,198 ,238 ,202 ,129 ,065 ,026 ,008 ,002 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 S-kt. ,026 Sehr unwahrscheinlich ,130 ist keine Sechs (p = 0.026) ,329 ,567 Am wahrscheinlichsten ,769 sind 3 Sechsen (p = 0.238). ,898 ,963 ,989 ,997 Sehr unwahrscheinlich ,999 sind 20 Sechsen, ebenso 1,000 1,000 19 Sechsen,… 1,000 für mehr als 6 Sechsen gilt 1,000 p = 0.026+0.08+0.02+0.000... 1,000 1,000 1,000 1,000 1,000 1,000 1,000 SS 2015 Aus den einzelnen Wahrscheinlichkeiten definiert man den Ablehnbereich so, dass X dort bei Gültigkeit der Nullhypothese nur mit Wahrscheinlichkeit < α liegt. Dazu summiert man beim zweiseitigen Test von H0: p =1/6 beidseitig von außen die Wahrscheinlichkeiten solange auf, wie je α/2 noch nicht überschritten wird. Anzahl Sechsen Anzahl Sechsen Prof. Dr. J. Schütze, FB GW Bin_Tests 5 Statistische Tests für unbekannten Anteil 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Wkt. ,026 ,104 ,198 ,238 ,202 ,129 ,065 ,026 ,008 ,002 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 S-Wkt. ,026 ,130 ,329 ,567 ,769 ,898 ,963 ,989 ,997 ,999 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 SS 2015 Ablehnbereich bei zweiseitigem Test: {0} ∪ {7,8,9,10,..., 20} Die Irrtumswahrscheinlichkeit ist dabei 0.026 + 0.026 + 0.008 + 0.002 + 0.000 + ... ≈ 0.062 somit kleiner als α = 0.10 Nullhypothese H 0 : p = p0 H 0 : p ≥ p0 Alternativhypothese H 1 : p ≠ p0 H 1 : p < p0 H 0 : p ≤ p0 H 1 : p > p0 k ~Bin(n, p0) Ablehnbereich k < k u oder k > k o k < ku ' k > ko ' zweiseitig ku −1 ku : P ( X = i ) ≤ α / 2 und i =0 Testentscheidung im Beispiel: k = 2 ist nicht im Ablehnbereich, die Nullhypothese p =1/6 kann nicht abgelehnt werden (Risiko α = 0.10). Bin_Tests Testgröße n i n −1 Schranken k bzw. ku, ko des Ablehnbereichs mit Testparameter p0 und P( X = i ) = p0 (1 − p0 ) i jeweils so berechnen, dass die Wahrscheinlichkeit < α ist Die Hinzunahme eines weiteren Werts zum Ablehnbereich würde zur Überschreitung von α = 0.10 führen. Prof. Dr. J. Schütze, FB GW 6 Exakter Test für Parameter p der Binomialverteilung (unbekannte Wahrscheinlichkeit)) 7 n ku P( X = i) > α / 2 und ko : P( X = i ) > α / 2 und i = ko i =0 n P( X = i ) ≤ α / 2 i = ko +1 einseitig ku ' −1 ku ' : P ( X = i ) ≤ α und i =0 SS 2015 Bin_Tests Prof. Dr. J. Schütze, FB GW Statistische Tests für unbekannten Anteil Zweiseitiger Ablehnbereich bei Risiko α = 0.10 k In diese äußeren Bereiche fällt dann X nur mit maximaler Wahrscheinlichkeit α, wenn p = 1/6 ist. Daher bilden sie den Ablehnbereich für H0: p = 1/6 gegen H1: p ≠ 1/6 bei Irrtumswahrscheinlichkeit α α/2 α/2 SS 2015 n ku ' P( X = i ) ≤ α i =0 bzw. ko ' : P( X = i ) > α und Prof. Dr. J. Schütze, FB GW i = ko ' n P( X = i) ≤ α i = ko ' +1 Bin_Tests 8 Statistische Tests für unbekannten Anteil Statistische Tests für unbekannte Anteile Asymptotischer Test für Parameter p der Binomialverteilung (bei großen Stichproben) Asymptotische Tests für Vergleich der Parameter von zwei Binomialverteilungen (Vergleich unbekannter Anteile) Einstichprobentest Zweistichprobentest Vergleich p mit p 0 (Referenzwert) Nicht verbundene Stichproben Nullhypothes e H 0 : p = p0 Alt ernativhypothese H 1 : p ≠ p0 H 0 : p ≥ p0 H 0 : p ≤ p0 H 1 : p < p0 H 1 : p > p0 Testgröße T = ( k − np 0 ) / np 0 (1 − p 0 ) ~ N(0, 1) (asymptotisch) Ablehnbereich T > z1− α / 2 Bezeichnungen A wird beobachtet in zwei unabhängigen Grundgesamtheiten G1 und G 2 T < − z1− α T > z1− α G1 : Stichprobenumfang n1 , k1 : Anzahl des Eintretens von A, pˆ 1 = k1 / n1 Schätzung für P ( A ) = p1 in G1 Der Test basiert auf der Näherung der Binomial- durch die Normalverteilung, daher sollte er nur angewandt werden, wenn eine der folgenden Faustregeln erfüllt ist (analog zu Konfidenzintervall) k > 50 und n - k > 50 bzw. np(1-p) > 9. 7.1 SS 2015 Bin_Tests Prof. Dr. J. Schütze, FB GW 9 G 2 : Stichprobenumfan g n 2 , k 2 : Anzahl des Eintretens von A, pˆ 2 = k 2 / n 2 Schätzung für P ( A ) = p 2 in G 2 SS 2015 Statistische Tests für unbekannte Anteile Prof. Dr. J. Schütze, FB GW Bin_Tests 10 Statistische Tests für unbekannte Anteile Zweistichprobentest nach McNemar Zweistichprobentest Nicht verbundene Stichproben (asymptotischer Test) Verbundene Stichproben (asymptotischer Test) Nullhypothese H0 : p1 = p2 Alternativhypothese H1 : p1 ≠ p2 Testgröße H0 : p1 ≥ p2 H1 : p1 < p2 H0 : p1 ≤ p2 H1 : p1 > p2 (1/ n1 + 1/ n2 ) pˆ (1 − pˆ ) T < −z 1−α ~ N(0, 1) asymptotisch T > z1−α mit pˆ = T= pˆ1 − pˆ 2 Untersuchung 2 Untersuchung 1 A eingetreten A nicht eingetreten A eingetreten a b A nicht eingetreten c d Ablehnbereich T > z1−α / 2 Anteile (a+b)/n bzw. (a+c)/n schätzen die Erfolgswahrscheinlichkeiten bei Untersuchung 1 bzw. 2. Ihre Differenz ist (a+b)/n - (a+c)/n = (b-c)/n Nullhypothese: k1 + k 2 n1 + n 2 Testgröße: Der Test basiert auf der Näherung der Binomial- durch die Normalverteilung, daher sollte er nur angewandt werden, wenn beide Stichprobenumfänge > 30 sind und k und n - k > 50 bzw. npˆ (1 − pˆ ) > 9 gilt (Faustregeln). SS 2015 Prof. Dr. J. Schütze, FB GW Bin_Tests a, b, c, d entsprechende Häufigkeiten 11 Ablehnbereich: Erfolgswahrscheinlichkeiten sind gleich (b − c ) 2 b + c T = 2 ( b − c − 1) b + c falls b + c ≥ 30 falls b + c < 30 2 T > χ1,1 −α Sind die erwarteten Zellhäufigkeiten für die Zellen b, c kleiner als 5, ist dieser Test nicht anwendbar. Man rechnet dann einen exakten Binomialtest auf p0 = ½ mit N = b + c, k = b 7.2 SS 2015 Prof. Dr. J. Schütze, FB GW Bin_Tests 12 7.3 U –Test (Rangsummentest) U -Test U -Test (Wilcoxon-Rangsummentest) für nicht verbundene Stichproben Berechnung der Testgröße für den U-Test n x Stichprobenum fang von X , n y Stichprobenumfang von Y , n x + n y = n Mittelwertvergleich ohne Voraussetzung der Normalverteilung (Analogon zum doppelten T-Test) Voraussetzung: Beide Stichproben werden zusammengenommen und der Größe nach geordnet. Dabei erhalten gleiche Stichprobenwerte jeweils den Durchschnittswert der ihnen entsprechenden Rangzahlen (Rangbindungen). Dann bildet man für jede Stichprobe die Summe der Rangzahlen, n( n + 1) man erhält die Rangsummen T1 , T2 . Kontrolle: T1 + T2 = 2 n ( n + 1) U1 = n x × n y + x x - T1 , 2 n y ( n y + 1) U 2 = nx × n y + - T2 , Kontrolle: U1 + U 2 = n x × n y 2 stetige Verteilungen, wird aber auch bei ordinalem Skalenniveau verwendet nicht verbundene Stichproben Der Test setzt die Gleichheit der Form der Verteilungen voraus. Es wird getestet, ob die Mediane beider Verteilungen übereinstimmen, d.h. die Mittelwerte werden hier durch die Mediane geschätzt. Nullhypothese: μx = μ y aus U = min(U1 ,U 2 ) berechnet man die Testgröße in Abhängigkeit vom Stichprobenumfang. SS 2016 Parameterfreie Tests Prof. Dr. J. Schütze, FB GW 13 U -Test SS 2016 Parameterfreie Tests Prof. Dr. J. Schütze, FB GW 14 U -Test U nn U− x y Testgröße T = 2 n n ( n + n + 1) x y x y 12 falls max( nx , n y ) < 20 Bsp. zum U-Test X falls nx ≥ 20, oder n y ≥ 20 Y Werte 7 14 22 36 40 48 49 52 3 5 6 10 17 18 22 39 Ränge 4 6 9.5 11 13 14 15 16 1 2 3 5 7 8 9.5 12 Testentscheidung bei Risiko α falls max( nx , n y ) < 20 Ablehnbereich U ≤ U n ,n ,α / 2 x y Nullhypothese H 0 : μ x = μ y falls n x ≥ 20, oder n y ≥ 20 Ablehnbereich n(n + 1) 2 16 ⋅ 17 136 = 2 n x = n y = 8, n = n x + n y = 16 T > z1−α / 2 Kontrolle: T1 + T2 = T1 = 88.5 T2 = 47.5 (U nx , ny , α / 2 Quantil Tab. für U-Test) Der U-Test kann auch für einseitige Hypothesen berechnet werden. Bei vielen Rangbindungen ist eine Korrektur der Testgröße erforderlich. (vgl. Lit.) SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 15 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 16 U -Test Vorzeichenrangtest Bsp. zum U-Test (Fortsetzung) Vorzeichenrangtest für verbundene Stichproben Mittelwertvergleich ohne Voraussetzung der Normalverteilung (Analogon zum t-Test für verbundene Stichproben) T1 = 88.5, T2 = 47.5 n x ( n x + 1) 8⋅9 - T1 = 64 + − 88.5 = 11.5, 2 2 n ( n + 1) 8⋅9 − T2 = 64 + − 47.5 = 52.5 U 2 = nx × n y + y y 2 2 U1 = n x × n y + Voraussetzung: stetige Verteilungen, wird aber auch bei ordinalem Skalenniveau verwendet verbundene Stichproben mindestens n = 6 Messwertpaare U = min(U1 ,U 2 ) = 11.5 Nullhypothese: Testgröße T = U =11.5, da max(nx,ny) = 8 < 20 Die Mittelwerte werden analog zum U -Test durch die Mediane geschätzt. H0 : μx = μ y Ablehnbereich bei Risiko α = 0.05: T ≤ U8,8 = 13, somit wegen T = 11.5 ≤ 13 Ablehnung von H0 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 17 Vorzeichenrangtest Parameterfreie Tests Prof. Dr. J. Schütze, FB GW 18 Vorzeichenrangtest Testgröße bei Vorzeichenrangtest Berechnung der Testgröße Rn ' T = Rn ' − n '( n '+ 1) / 4 ( n '2 + n ')(2n '+ 1) / 24 Aus den n Wertepaaren ( xi , yi ) bildet man d i = xi − yi Die Beträge dieser Differenzen werden aufsteigend mit Rangzahlen versehen, dabei werden Nulldifferenzen weggelassen (es bleiben dann n' Paare übrig). Bei betragsgleichen Differenzen vergibt man mittlere Rangzahlen. Rn+' : Summe der Ränge bei d i > 0 falls n ' ≤ 25 falls n ' > 25 Ablehnbereich bei Risiko α Rn−' : Summe der Ränge bei d i < 0 Rechenkontrolle: Rn+' + Rn−' = n '( n ' + 1) / 2 Rn ' = min( Rn+' , Rn−' ) SS 2016 SS 2016 falls n ' ≤ 25 falls n ' > 25 Ablehnbereich T ≤ ku Ablehnbereich T > z1−α / 2 ku Quantil aus Tab. für Vorzeichenrangtest Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 19 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 20 Vorzeichenrangtest Vorzeichenrangtest Beispiel Beispiel (Fortsetzung) Zur Prüfung der Wirksamkeit eines Schlafmittels erhielten 15 Probanden in zufälliger Reihenfolge und nach hinreichend langer Wash-Out-Pause das Schlafmittel bzw. ein Placebo. Gemessen wurde jeweils die Schlafdauer. R15+ = 22, R15− = 98 Placebo 6.0 6.0 9.0 5.3 7.3 7.0 7.1 4.2 4.4 7.9 6.0 5.8 9.5 6.9 4.2 Verum 6.2 7.1 8.9 7.1 9.6 6.1 6.9 5.7 4.0 8.9 5.5 6.6 10.2 7.8 5.0 Differenz - - + - - + + - + - + - - - - 0.2 1.1 0.1 1.8 2.3 0.9 0.2 1.5 0.4 1.0 0.5 0.8 0.7 0.9 0.8 9.5 2.5 7.5 6 9.5 7.5 1 + Ränge - Ränge 2.5 12 14 15 4 13 wegen n' = 15 keine Approximation der Testgrößenverteilung durch NV Ablehnbereich bei Risiko α = 0.05: T ≤ 25 ( = W15,0.025) ) Testentscheidung Wegen T = 22 ≤ 25 erfolgt eine Ablehnung der Nullhypothese, eine Wirksamkeit des Schlafmittels kann mit 95%iger Sicherheit nachgewiesen werden. 5 11 T = min( R15+ , R15− ) = 22 R15+ = 22, R15− = 98 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 21 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 22 χ² - Unabhängigkeitstest Bemerkungen χ ²-Unabhängigkeitstest Bei ordinalen Daten erhält man schnell viele Rangbindungen. Dann ist die Testgröße geeignet zu modifizieren (s. Sachs, Statistische Verfahren). Ziel Es wird getestet, ob zwei Zufallsgrößen unabhängig sind. Die parameterfreien Mittelwertvergleiche beziehen sich auf die Mediane, daher sollten die Mittelwerte hier stets durch die Mediane geschätzt werden. Für diskrete, insbesondere nominale Zufallsgrößen basiert er direkt auf dem Chi-Quadrat-Maß, das aus der Kontingenztafel berechnet wird. Prinzipiell können die parameterfreien Tests auch einseitig gerechnet werden. Dann darf man bei den Testgrößen keine Bildung des Minimums vornehmen. Man vergleicht dann in Richtung der Alternativhypothese mit den Quantilen der Ordnung 1-α. Bei stetigen Zufallsgrößen ist dieser Test ebenfalls anwendbar. Es erfolgt zunächst eine Klasseneinteilung für beide Stichproben. Mit den dabei ermittelten Klassenhäufigkeiten erstellt man eine Kontingenztafel und verfährt dann analog wie bei diskreten Merkmalen. Als Alternative für Untersuchung der Abhängigkeit stetiger Zufallsgrößen stehen Tests der Korrelationskoeffizienten auf Null zur Verfügung. Bei Normalverteilung testet man mit der Pearson-Korrelation auf einen linearen, sonst mit der Spearman-Korrelation auf einen monotonen Zusammenhang, s. z.B. Storm. SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 23 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 24 χ² - Unabhängigkeitstest χ² - Unabhängigkeitstest Kontingenztafel für 2 diskrete Merkmale χ ²-Unabhängigkeitstest Bezeichnungen Nullhypothese: X, Y unabhängig Testgröße χ²-Maß X , Y Zufallsgrößen mit diskreten W ertebereichen x1 ,..., x p bzw. y1 ,..., y q Stichprobe mit n Messwertpaaren ( xi , y j ) nij : Anzahl des Auftretens der Kombination ( xi , y j ) in der Stichprobe y1 x1 ... n11 xp np1 npq np. n.1 n.q n Erwartete Zellinhalte bei Unabhängigkeit SS 2016 q p j =1 i =1 ni. = nij , n. j = nij n1. Gesamtzahl q p n = n.. = nij Prof. Dr. J. Schütze, FB GW ( nij − nˆij ) 2 nˆij H0 ~ χ (2 p −1) ⋅ ( q −1),1− α Ablehnbereich bei Risiko α T > χ (2 p −1)⋅( q −1),1− α Achtung: Da die Testgröße nur näherungsweise χ ²-verteilt ist, sollte keine der erwarteten j =1 i =1 nˆij = q i = 1 j =1 Randwerte: yp n1q p T = ni . ⋅ n. j Klassenhäufigkeiten 0 und höchstens 25% kleiner als 5 sein. n (sonst benachbarte Klassen zusammenlegen, wenn inhaltlich sinnvoll) Parameterfreie Tests 25 χ² - Anpassungstest SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 26 7.4 χ² - Anpassungstest χ ²-Anpassungstest χ ²-Anpassungstest bei diskreten Verteilungen Problem Die Zufallsgröße nehme k verschiedene Werte x1 ,...xk mit den Wahrscheinlichkeiten p1 ,... pk an. Entstammt eine beobachtete Zufallsgröße einer bestimmten Verteilung? Das Verfahren ist zur Prüfung auf stetige und diskrete Verteilungen anwendbar. Bei stetigen Verteilungen ist vorher eine Klasseneinteilung vorzunehmen. In einer Stichprobe werden die absoluten Häufigkeiten des Auftretens von x1 ,...xk bezeichnet mit Oi (observed), 1 ≤ i ≤ k . Man berechnet durch Multiplikation der Wahrscheinlichkeiten p1 ,... pk Besonderheit der Anpassungstests Nullhypothese: es liegt NV vor An dieser Hypothese möchte man festhalten, d.h. es ist keine Ablehnung erwünscht. Allerdings 'beweist' eine Nichtablehnung der Nullhypothese nicht das Vorliegen der vermuteten Verteilung, man hat dafür keine statistische Sicherheit. mit dem Stichprobenumfang n die erwarteten Klassenhäufigkeiten Ei (expected). k (O − Ei ) 2 Testgröße T = i Ei i =1 Die Testgröße ist unter der Nullhypothese näherungsweise χ²-verteilt, wobei die Anzahl der Freiheitsgrade aus der Klassenanzahl k und der Anzahl p der Eventuell geschätzten Parameter der Verteilung berechnet wird, FG = k - 1 - p 2 Ablehnbereich bei Risiko α: T > χ k −1− p ,1−α 7.5 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 27 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 28 χ² - Anpassungstest χ² - Anpassungstest χ ²-Anpassungstest bei stetigen Verteilungen Beispiel Entstammen folgende Blutgerinnungszeiten von 30 Patienten (in s) einer NV? Man nimmt eine Einteilung der Stichprobe in k Klassen vor, wobei die Randklassen halboffen gewählt werden. Die Klassenhäufigkeiten seien Oi (observed), 1 ≤ i ≤ k . Dann berechnet man unter NV die Wahrscheinlichkeiten dieser Klassen und erhält nach Multiplikation mit dem Stichprobenumfang n die erwarteten Klassenhäufigkeiten Ei (expected). (Oi − Ei ) 2 Ei i =1 k Testgröße T = Die Testgröße ist unter der Nullhypothese näherungsweise χ²-verteilt, wobei die Anzahl der Freiheitsgrade aus der Klassenanzahl k und der Anzahl p der geschätzten Parameter der Verteilung berechnet wird, FG = k - 1 - p 29 χ² - Anpassungstest 22,70 24,00 24,40 25,80 25,90 26,00 26,40 26,60 26,60 26,80 27,00 27,70 27,80 28,00 28,00 28,10 28,70 28,70 28,80 29,00 29,00 29,00 30,00 30,10 30,10 31,80 32,00 33,00 33,70 35,00 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 30 Grafisches Verfahren: Histogramm untere obere Grenze Grenze absolute Häufigkeit 22 24 1 24 26 4 26 28 8 28 30 9 30 32 4 32 34 3 34 36 1 Histogramm Dabei gehört die Untergrenze stets zur Klasse dazu, die Obergrenze nicht (willkürliche Festlegung). SS 2016 29,00 29,00 30,00 30,10 30,10 31,80 32,00 33,00 33,70 35,00 Kompromiss: Wahl von 7 Klassen der Breite 2, beginnend bei 22 Parameterfreie Tests Prof. Dr. J. Schütze, FB GW Blutgerinnungszeiten 27,00 27,70 27,80 28,00 28,00 28,10 28,70 28,70 28,80 29,00 Klassenanzahl (Faustregel) k = n : ergibt bei n = 30 etwa k = 5 oder k = 6 x − xmin 35.0 − 22,7 Alternative Faustregel mit Klassenbreite b ≈ max = ≈2 1 + 3.32 log n 1 + 3.32 log 30 2 Ablehnbereich bei Risiko α: T > χ k −1− p ,1−α SS 2016 22,70 24,00 24,40 25,80 25,90 26,00 26,40 26,60 26,60 26,80 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests Abweichung von NV Testidee: die Flächen der Balken werden mit den entsprechenden Flächen unter der Dichte verglichen. 31 SS 2016 Kann die Grafik nicht per Computer erstellt werden, schätzt man aus der Stichprobe die Parameter der NV. Das Maximum der Kurve liegt bei μ, die Wendepunkte bei μ ± σ. Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 32 Testverfahren: χ²-Test Testverfahren: χ²-Test Bsp. (Fortsetzung) Bsp. (Fortsetzung) Blutgerinnungszeiten, dabei Modifizierung der Randklassen als halboffen Blutgerinnungszeiten, dabei Modifizierung der Randklassen untere Grenze obere Grenze absolute Häufigkeit -∞ 24 1 24 26 4 26 28 8 28 30 9 30 32 4 32 34 3 34 ∞ 1 Schätzung der Parameter der NV durch Mittelwert und empirische Streuung untereG obere renze Grenze x = 28.36 für μ s = 2.816 für σ Berechnung der Klassenwahrscheinlichkeiten als Intervallwktn. der NV mit diesen Parametern: b−μ a −μ P ( a < X < b) = φ − φ σ σ z.B. 24 − 28.36 P ( −∞, 24) = Φ − Φ ( −∞ ) = 0.0606 2.816 26 − 28.36 24 − 28.36 = 0.1399 P (24,26) = Φ −Φ 2.816 2.816 SS 2016 Parameterfreie Tests Prof. Dr. J. Schütze, FB GW 33 Testverfahren: χ²-Test Wkt. der Klassen erwartete Häufigkeit -∞ 24 0.0606 1.82 24 26 0.1399 4.20 26 28 0.2478 7.43 28 30 0.2707 8.12 30 32 0.1825 5.48 32 34 0.0757 2.27 34 ∞ 0.0228 0.68 Aus den Klassenwahrscheinlichkeiten erhält man nach Multiplikation mit dem Stichprobenumfang n = 30 die erwarteten Klassenhäufigkeiten, z.B. 0.0606·30 = 1.82 Der Test arbeitet unzuverlässig, wenn viele zu dünn besetzte Klassen mit erwarteter Häufigkeit Ei < 5 auftreten (Faustregel: maximal 25%). Daher legt man hier die ersten und die letzten beiden Klassen jeweils zusammen. SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 34 Testverfahren: χ²-Test Bsp. (Fortsetzung) Blutgerinnungszeiten, jeweils zusammengelegte Randklassen Klasse i beob. Häuf. Oi erwart. Häuf. (Oi - Ei)²/Ei Ei 1+4 = 5 6.02 0.1728 3 8 7.43 0.0427 4 9 8.12 0.0954 5 4 5.48 0.3997 3+1 = 4 2.95 0.3737 1/2 6/7 S 30 Ablehnung der NV bei 30 1.0853 T > χ 2 k − p −1,1−α Achtung Berechnung der Testgröße T = Σ (Oi - Ei)²/Ei Freiheitsgrade: Bei k = 5 Klassen und p = 2 geschätzten Parametern ergibt sich FG = k - 1 - p = 2. Damit ist der Schwellwert für den Test bei Risiko 2 α = 0.05 gleich χ 2,0.95 = 5.991 Die Testgröße ist unter der Nullhypothese nur näherungsweise χ²-verteilt, und zwar mit k -1 - p Freiheitsgraden bei p geschätzten Parametern. Bei Test auf NV werden oft die beiden Parameter μ, σ² geschätzt, daher hat man bei k Klassen k - 3 Freiheitsgrade. Man braucht also mindestens 4 Klassen, die eine erwartete Besetzung Ei ≥ 5 haben sollten (mindestens in 75% der Klassen). Für zu kleine Stichproben funktioniert der Test also nicht. Besser ist dann der Kolmogorov-Smirnov-Test, bei geschätzten Parametern mit Korrektur nach Lilliefors. Entscheidung: wegen T = 1.0853 < 5.991 wird die Normalverteilungsannahme nicht verworfen. SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 7.6 35 SS 2016 Prof. Dr. J. Schütze, FB GW Parameterfreie Tests 36