Statistik R. Frühwirth Statistik R. Frühwirth [email protected] VO 142.090 http://tinyurl.com/TU142090 Februar 2010 R. Frühwirth Statistik 1/453 Übersicht über die Vorlesung Statistik R. Frühwirth Teil 1: Deskriptive Statistik Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung R. Frühwirth Statistik 2/453 Übersicht über die Vorlesung Statistik R. Frühwirth Teil 5: Testen von Hypothesen Teil 6: Regressionsanalyse Teil 7: Simulation von Experimenten R. Frühwirth Statistik 3/453 Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Teil 5 Testen von Hypothesen Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 376/453 Übersicht Teil 5 Statistik R. Frühwirth Einleitung Parametrische Tests 16 Einleitung 17 Parametrische Tests Nichtparametrische Tests 18 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 19 Anpassungstests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 377/453 Abschnitt 16: Einleitung Statistik R. Frühwirth Einleitung Parametrische Tests 16 Einleitung 17 Parametrische Tests Nichtparametrische Tests 18 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 19 Anpassungstests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 378/453 Einleitung Statistik R. Frühwirth Wir beobachten eine Stichprobe X1 , . . . , Xn aus einer Verteilung F . Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Ein Test soll feststellen, ob die Beobachtungen mit einer gewissen Annahme über F verträglich sind. Die Annahme wird als Nullhypothese H0 bezeichnet. Ist die Form von F bis auf einen oder mehrere Parameter spezifiziert, heißt der Test parametrisch. Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Ist die Form von F nicht spezifiziert, heißt der Test nichtparametrisch oder parameterfrei. Der Test entscheidet, ob die Stichprobe mit der Hypothese vereinbar ist, nicht ob die Hypothese richtig ist! R. Frühwirth Statistik 379/453 Einleitung Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Allgemeine Vorgangsweise Aus der Stichprobe wird eine Testgröße (Teststatistik) T berechnet. Der Wertebereich von T wird, in Abhängigkeit von H0 , in einen Ablehnungsbereich (kritischen Bereich) C und einen Annahmebereich C 0 unterteilt. Fällt der Wert von T in den Ablehnungsbereich, wird H0 verworfen. Andernfalls wird H0 vorläufig beibehalten. Das ist jedoch keine Bestätigung von H0 . Es heißt lediglich, dass die Daten mit der Hypothese vereinbar sind. R. Frühwirth Statistik 380/453 Einleitung Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Signifikanz und Güte Bei jedem Testverfahren sind zwei Arten von Fehlern möglich. 1 Fehler 1. Art: Die Hypothese H0 wird abgelehnt, obwohl sie zutrifft. 2 Fehler 2. Art: Die Hypothese H0 wird beibehalten, obwohl sie nicht zutrifft. Die Verteilung von T unter Annahme von H0 wird bestimmt. Der Ablehnungsbereich wird so festgelegt, dass die Wahrscheinlichkeit eines Fehlers 1. Art maximal gleich einem Wert α ist. α heißt das Signifikanzniveau des Tests. Gängige Werte sind α = 0.05, 0.01, 0.005. R. Frühwirth Statistik 381/453 Einleitung Statistik R. Frühwirth Einleitung Ist der Ablehnungsbereich festgelegt, kann für eine Gegenhypothese H1 die Wahrscheinlichkeit β(H1 ) eines Fehlers 2. Art berechnet werden. Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 1 − β(H1 ) heißt die Güte des Tests für H1 . Die Güte sollte nie kleiner als α sein. Ist die Güte nie kleiner als α, heißt der Test unverzerrt. Ein Ziel der Testtheorie ist es, unverzerrte Tests mit maximaler Güte (UMPU) zu konstruieren. Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 382/453 Abschnitt 17: Parametrische Tests Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 18 Nichtparametrische Tests 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 383/453 Unterabschnitt: Grundlagen Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 18 Nichtparametrische Tests 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 384/453 Grundlagen Statistik R. Frühwirth Einleitung Wir betrachten eine Stichprobe X1 , . . . , Xn aus einer Verteilung F , die bis auf einen oder mehrere Parameter spezifiziert ist. Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Tests von Hypothesen über F heißen parametrisch. Eine Nullhypothese H0 kann als eine Teilmenge des Parameterraums Θ aufgefasst werden. Der Test entscheidet, ob die Stichprobe mit der Hypothese vereinbar ist. Vor der Anwendung ist zu klären, ob die angenommene parametrische Form plausibel ist. Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 385/453 Grundlagen Statistik R. Frühwirth Zunächst wird die Teststatistik T und das Signifikanzniveau α gewählt. Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Dann wird der kritische Bereich C so festgelegt, dass W (T ∈ C|ϑ ∈ H0 ) ≤ α Zu einer Nullhypothese H0 kann eine Gegenhypothese H1 formuliert werden. H1 kann ebenfalls als Teilmenge des Parameterraums Θ aufgefasst werden. Ist das Signifikanzniveau α festgelegt, kann für jedes ϑ ∈ H1 die Güte berechnet werden: 1 − β(ϑ) = W (T ∈ C|ϑ ∈ H1 ) 1 − β(ϑ) heißt die Gütefunktion des Tests. R. Frühwirth Statistik 386/453 Grundlagen Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Beispiel mit Exponentialverteilung X1 , . . . , Xn ist eine exponentialverteilte Stichprobe aus Ex(τ ). Die Hypothese H0 : τ = τ0 soll anhand der Stichprobe getestet werden. Als Teststatistik T wählen wir das Stichprobenmittel: T = X. Unter Annahme von H0 hat T die folgende Dichte: t tn−1 exp − f (t) = (τ0 /n)n Γ(n) τ0 /n T ist also verteilt gemäß Ga(n, τ0 /n). H0 wird abgelehnt, wenn T von seinem Erwartungswert weit entfernt“, also relativ klein oder relativ groß ist. ” R. Frühwirth Statistik 387/453 Grundlagen Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Ein Verwerfungsbereich mit Signifikanzniveau α ist die Menge C = [0, Qα/2 ] ∪ [Q1−α/2 , ∞[ wo Qp das Quantil der Ga(n, τ0 /n)-Verteilung zum Niveau p ist. Die Gütefunktion für einen Wert τ ergibt sich durch: 1 − β(τ ) = W (T ∈ C) = G(Qα/2 ) + 1 − G(Q(1−α)/2 ) wo G die Verteilungsfunktion der Ga(n, τ /n)-Verteilung ist. Der Test ist nicht unverzerrt, da z.B. für τ0 = 1 und n = 25 1 − β(0.986) = 0.0495 < α Matlab: make test exponential mean.m R. Frühwirth Statistik 388/453 Grundlagen Statistik Gütefunktion (τ0=1) R. Frühwirth 1 Einleitung 0.9 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 0.7 0.6 1−β(τ) Nichtparametrische Tests 0.8 0.5 0.4 0.3 0.2 0.1 0 0.5 n=25 n=100 0.6 0.7 0.8 R. Frühwirth 0.9 Statistik 1 τ 1.1 1.2 1.3 1.4 1.5 389/453 Unterabschnitt: Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 18 Nichtparametrische Tests 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 390/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Erwartungswert bei bekannter Varianz X1 , . . . , Xn ist eine normalverteilte Stichprobe aus No(µ, σ 2 ) mit bekanntem σ 2 . Die Hypothese H0 : µ = µ0 soll anhand der Stichprobe gegen die Alternativhypothese H1 : µ 6= µ0 getestet werden. Als Teststatistik T wählen wir das Standardscore des Stichprobenmittels: √ n(X − µ0 ) T = σ Unter Annahme von H0 ist T verteilt gemäß No(0, 1). H0 wird abgelehnt, wenn T von seinem Erwartungswert weit entfernt“, also relativ klein oder relativ groß ist. ” R. Frühwirth Statistik 391/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Ein Verwerfungsbereich mit Signifikanzniveau α ist die Menge C =] − ∞, zα/2 ] ∪ [z1−α/2 , ∞[ wo zp das Quantil der Standardnormalverteilung zum Niveau p ist. Die Hypothese H0 wird also abgelehnt, wenn √ n X − µ0 |T | = > z1−α/2 σ Die Gütefunktion für einen Wert µ ergibt sich durch: Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 1 − β(µ) = W (T ∈ C) = G(zα/2 ) + 1 − G(z(1−α)/2 ) √ wo G die Verteilungsfunktion der No( n(µ − µ0 )/σ, 1)Verteilung ist. Der Test ist unverzerrt. Matlab: make test normal mean.m R. Frühwirth Statistik 392/453 Tests für normalverteilte Stichproben Statistik Gütefunktion des zweiseitigen Tests (µ0=1) R. Frühwirth 1 Einleitung 0.9 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 0.7 0.6 1−β(µ) Nichtparametrische Tests 0.8 0.5 0.4 0.3 0.2 0.1 0 0.5 n=25 n=100 0.6 0.7 0.8 R. Frühwirth 0.9 Statistik 1 µ 1.1 1.2 1.3 1.4 1.5 393/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Einseitiger Test Die Hypothese H0 : µ = µ0 soll mit der Teststatistik T gegen die Alternativhypothese H1 : µ > µ0 getestet werden. H0 wird abgelehnt, wenn T zu groß“ ist. ” Ein Verwerfungsbereich mit Signifikanzniveau α ist die Menge C = [z1−α , ∞[ Die Hypothese H0 wird also abgelehnt, wenn √ n X − µ0 > z1−α T = σ R. Frühwirth Statistik 394/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Die Gütefunktion für einen Wert µ > µ0 ergibt sich durch: 1 − β(τ ) = W (T ∈ C) = 1 − G(z1−α ) √ wo G die Verteilungsfunktion der No( n(µ − µ0 )/σ, 1)Verteilung ist. Analog verläuft der Test mit H1 : µ < µ0 . Matlab: make test normal mean.m Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 395/453 Tests für normalverteilte Stichproben Statistik Gütefunktion des einseitigen Tests (µ0=1) R. Frühwirth 1 Einleitung 0.9 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 0.7 0.6 1−β(µ) Nichtparametrische Tests 0.8 0.5 0.4 0.3 0.2 0.1 0 1 n=25 n=100 1.1 1.2 1.3 R. Frühwirth 1.4 Statistik 1.5 µ 1.6 1.7 1.8 1.9 2 396/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Erwartungswert bei unbekannter Varianz: t-Test X1 , . . . , Xn ist eine normalverteilte Stichprobe aus No(µ, σ 2 ) mit unbekanntem σ 2 . Die Hypothese H0 : µ = µ0 soll anhand der Stichprobe gegen die Alternativhypothese H1 : µ 6= µ0 getestet werden. Als Teststatistik T wählen wir das Standardscore des Stichprobenmittels, unter Benützung der Stichprobenvarianz S2: √ n(X − µ0 ) T = S Unter Annahme von H0 ist T verteilt gemäß t(n − 1). R. Frühwirth Statistik 397/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test H0 wird abgelehnt, wenn T von seinem Erwartungswert weit entfernt“, also relativ klein oder relativ groß ist. ” Ein Verwerfungsbereich mit Signifikanzniveau α ist die Menge n−1 C =] − ∞, tn−1 α/2 ] ∪ [t1−α/2 , ∞[ wo tn−1 das Quantil der t-Verteilung mit n − 1 p Freiheitsgraden zum Niveau p ist. Die Hypothese H0 wird also abgelehnt, wenn √ n X − µ0 |T | = > tn−1 1−α/2 S R. Frühwirth Statistik 398/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Die Gütefunktion für einen Wert µ ergibt sich durch: 1 − β(τ ) = W (T ∈ C) = G(zα/2 ) + 1 − G(z(1−α)/2 ) Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben wo G die Verteilungsfunktion der nichtzentralen t(n − 1, δ)-Verteilung mit √ δ = n(µ − µ0 )/σ Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test ist. Der Test ist unverzerrt. Matlab: make test normal mean.m R. Frühwirth Statistik 399/453 Tests für normalverteilte Stichproben Statistik Gütefunktion des zweiseitigen t−Tests (µ0=1) R. Frühwirth 1 Einleitung 0.9 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 0.7 0.6 1−β(µ) Nichtparametrische Tests 0.8 0.5 0.4 0.3 0.2 0.1 0 0.5 n=25 n=100 0.6 0.7 0.8 R. Frühwirth 0.9 Statistik 1 µ 1.1 1.2 1.3 1.4 1.5 400/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Gleichheit von zwei Erwartungswerten X1 , . . . , Xn und Y1 , . . . , Ym sind zwei unabhängige normalverteilte Stichprobe aus No(µx , σx2 ) bzw. No(µy , σy2 ). Die Hypothese H0 : µx = µy soll anhand der Stichproben gegen die Alternativhypothese H1 : µx 6= µy getestet werden. Sind die Varianzen bekannt, wählen wir als Teststatistik T die Differenz der Stichprobenmittel: T =X −Y Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Unter Annahme von H0 ist T verteilt gemäß No(0, σx2 /n + σy2 /m). R. Frühwirth Statistik 401/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Das Standardscore Einleitung Z=q Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben T σx2 /n + σy2 /m ist dann standardnormalverteilt. Die Hypothese H0 wird also abgelehnt, wenn Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest |Z| > z1−α/2 oder |X − Y | Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test q R. Frühwirth σx2 /n + σy2 /m Statistik > z1−α/2 402/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Sind die Varianzen unbekannt und gleich, kann die Varianz aus der kombinierten ( gepoolten“) Stichprobe ” geschätzt werden: Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben S2 = (n − 1)Sx2 + (m − 1)Sy2 n+m−2 Unter Annahme von H0 ist X −Y Nichtparametrische Tests T =p Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test S 2 (1/n + 1/m) t-verteilt mit n + m − 2 Freiheitsgraden. Die Hypothese H0 wird also abgelehnt, wenn |T | > tn+m−2 1−α/2 wo tn+m−2 1−α/2 das Quantil der t-Verteilung mit n + m − 2 Freiheitsgraden ist. R. Frühwirth Statistik 403/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test t-Test für gepaarte Stichproben Gepaarte Stichproben (X1 , Y1 ), . . . , (Xn , Yn ) entstehen, wenn für jedes beobachtete Objekt die selbe Größe zweimal gemessen wird, vor und nach einer bestimmten Intervention. Die Wirkung der Intervention wird durch die Differenzen Wi = Yi − Xi , i = 1, . . . , n beschrieben. Wir nehmen an, dass W1 , . . . , Wn normalverteilt mit Mittel 2 µw und unbekannter Varianz σw ist. Die Hypothese H0 : µw = 0 (keine Wirkung der Intervention) soll anhand der Stichprobe gegen die Alternativhypothese H1 : µw 6= 0 getestet werden. Dies erfolgt mit dem t-Test für einzelne Stichproben. R. Frühwirth Statistik 404/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Test der Varianz X1 , . . . , Xn ist eine normalverteilte Stichprobe mit unbekanntem Erwartungswert µ und unbekannter Varianz σ2 . Die Hypothese H0 : σ 2 = σ02 soll anhand der Stichprobe gegen die Alternativhypothese H1 : σ 2 6= σ02 getestet werden. Als Teststatistik T wählen wir: T = Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test (n − 1)S 2 σ02 Unter Annahme von H0 ist T χ2 -verteilt mit n − 1 Freiheitsgraden. R. Frühwirth Statistik 405/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Die Hypothese H0 wird also abgelehnt, wenn T < χ2α/2,n−1 oder T > χ21−α/2,n−1 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test wo χ2p,k das Quantil der χ2 -Verteilung mit k Freiheitsgraden zum Niveau p ist. Die Gütefunktion für einen Wert σ 2 ergibt sich durch: 1 − β(σ 2 ) = G(σ02 /σ 2 · χ2α/2 ) + 1 − G(σ02 /σ 2 · χ2(1−α)/2 ) wo G die Verteilungsfunktion der χ2 (n − 1)Verteilung ist. Der Test ist nicht unverzerrt. Matlab: make test normal variance.m R. Frühwirth Statistik 406/453 Tests für normalverteilte Stichproben Statistik Gütefunktion des zweiseitigen Tests (σ20=1) R. Frühwirth 1 Einleitung 0.9 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 0.7 0.6 1−β(σ2) Nichtparametrische Tests 0.8 0.5 0.4 0.3 0.2 0.1 0 0.5 n=25 n=100 0.6 0.7 0.8 R. Frühwirth 0.9 Statistik 1 σ2 1.1 1.2 1.3 1.4 1.5 407/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Gleichheit von zwei Varianzen X1 , . . . , Xn und Y1 , . . . , Ym sind zwei unabhängige normalverteilte Stichprobe aus No(µx , σx2 ) bzw. No(µy , σy2 ). Die Hypothese H0 : σx2 = σy2 soll anhand der Stichproben gegen die Alternativhypothese H1 : σx2 6= σy2 getestet werden. Die Teststatistik T ist das Verhältnis der Stichprobenvarianzen: Anpassungstests T = Der Chiquadrat-Test Der KolmogorovSmirnov-Test Sx2 Sy2 Unter Annahme von H0 ist T F-verteilt gemäß F(n − 1, m − 1). R. Frühwirth Statistik 408/453 Tests für normalverteilte Stichproben Statistik R. Frühwirth Einleitung Die Hypothese H0 wird also abgelehnt, wenn T < Fα/2 oder T > F1−α/2 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test wo Fp das Quantil der F-Verteilung mit n − 1 bzw. m − 1 Freiheitsgraden zum Niveau p ist. Ist σy2 = kσx2 , ergibt sich die Gütefunktion für einen Wert k ergibt durch: 1 − β(τ ) = G(σ02 /σ 2 · Fα/2 ) + 1 − G(σ02 /σ 2 · F(1−α)/2 ) wo G die Verteilungsfunktion der F(n − 1, m − 1)Verteilung ist. Der Test ist unverzerrt. Matlab: make test normal variance.m R. Frühwirth Statistik 409/453 Tests für normalverteilte Stichproben Statistik Gütefunktion des zweiseitigen Tests (σ2x =σ2y ) R. Frühwirth 1 Einleitung 0.9 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 0.7 0.6 1−β(k) Nichtparametrische Tests 0.8 0.5 0.4 0.3 0.2 0.1 0 n=25 n=100 −0.6 −0.4 R. Frühwirth −0.2 0 ln k=ln(σ2y /σ2x ) Statistik 0.2 0.4 0.6 410/453 Unterabschnitt: Tests für alternativverteilte Stichproben Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 18 Nichtparametrische Tests 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 411/453 Tests für alternativverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einseitiger Test auf Erwartungswert X1 , . . . , Xn ist eine alternativverteilte Stichprobe aus Al(p). Die Hypothese H0 : p ≤ p0 soll anhand der Stichprobe gegen die Alternativhypothese H1 : p > p0 getestet werden. Als Teststatistik T wählen wir die Anzahl der Versuchsausgänge 1: Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest T = Xi i=1 Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test n X T ist binomialverteilt gemäß Bi(n, p). H0 wird abgelehnt, wenn T zu groß“ ist. ” R. Frühwirth Statistik 412/453 Tests für alternativverteilte Stichproben Statistik R. Frühwirth Ist p ≤ p0 , gilt Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest W (T ≥ k) ≤ n X n i=k i pi0 (1 − p0 )n−i Die Hypothese H0 wird abgelehnt, wenn n X n i p (1 − p0 )n−i ≤ α i 0 i=T Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 413/453 Tests für alternativverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Beispiel Ein Hersteller behauptet, dass nicht mehr als 2 Prozent eines gewissen Bauteils fehlerhaft sind. In einer Stichprobe vom Umfang 300 sind 9 Stück defekt. Kann die Behauptung des Herstellers widerlegt werden? Es gilt: ! 300 X 300 0.02i 0.98300−i = 0.1507 i i=9 Die Behauptung des Herstellers lässt sich also auf einem Signifikanzniveau von 5 Prozent nicht widerlegen. Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Matlab: make test alternative mean.m R. Frühwirth Statistik 414/453 Tests für alternativverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Näherung durch Normalverteilung Ist n genügend groß, kann die Verteilung von T durch eine Normalverteilung No(np, np(1 − p) angenähert werden. H0 wird abgelehnt, wenn das Standardscore größer als das (1 − α)-Quantil der Standardnormalverteilung ist: Z=p Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test T − np0 np(1 − p0 ) ≥ z1−α Beispiel Mit der Angabe des letzten Beispiels ergibt die Näherung: Z = 1.2372 < z0.95 = 1.6449 Die Hypothese kann also nicht abgelehnt werden. Matlab: make test alternative mean.m R. Frühwirth Statistik 415/453 Unterabschnitt: Tests für Poissonverteilte Stichproben Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 18 Nichtparametrische Tests 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 416/453 Tests für Poissonverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Einseitiger Test auf Erwartungswert X1 , . . . , Xn ist eine Poissonverteilte Stichprobe aus Po(λ). Die Hypothese H0 : λ ≤ λ0 soll anhand der Stichprobe gegen die Alternativhypothese H1 : λ > λ0 getestet werden. Als Teststatistik T wählen wir die Stichprobensumme: Nichtparametrische Tests T = Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test n X Xi i=1 T ist Poissonverteilt gemäß Po(nλ). H0 wird abgelehnt, wenn T zu groß“ ist, also wenn ” ∞ X (nλ0 )k e−nλ0 ≤α k! k=T R. Frühwirth Statistik 417/453 Tests für Poissonverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Beispiel Ein Hersteller strebt an, dass in einer Fabrik täglich im Mittel nicht mehr als 25 defekte Bauteile hergestellt werden. Eine Stichprobe von 5 Tagen ergibt 28,34,32,38 und 22 defekte Bauteile. Hat der Hersteller sein Ziel erreicht? Es gilt: T = 154, ∞ X (125)k e−125 = 0.0067 k! k=T Die Hypothese lässt sich also auf einem Signifikanzniveau von 1 Prozent widerlegen. Matlab: make test poisson mean.m R. Frühwirth Statistik 418/453 Tests für Poissonverteilte Stichproben Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Näherung durch Normalverteilung Ist n genügend groß, kann die Verteilung von T durch eine Normalverteilung No(nλ, nλ angenähert werden. H0 wird abgelehnt, wenn das Standardscore größer als das (1 − α)-Quantil der Standardnormalverteilung ist: T − nλ0 ≥ z1−α Z= √ nλ0 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Beispiel Mit der Angabe des letzten Beispiels ergibt die Näherung: Z = 2.5938 > z0.99 = 1.6449 Die Hypothese kann also auf einem Signifikanzniveau von 1 Prozent abgelehnt werden. Matlab: make test poisson mean.m R. Frühwirth Statistik 419/453 Abschnitt 18: Nichtparametrische Tests Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 420/453 Unterabschnitt: Einleitung Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 421/453 Einleitung Statistik R. Frühwirth Wir betrachten wieder Stichproben X1 , . . . , Xn aus einer stetigen Verteilung F , deren Form nicht spezifiziert ist. Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Tests von Hypothesen über F heißen nichtparametrisch oder parameterfrei. Solche Tests sind immer anwendbar, auch wenn über F nichts bekannt ist. Ist eine bestimmte parametrische Form von F plausibel, sollten parametrische Tests angewendet werden, da sie aussagekräftiger sind. Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 422/453 Unterabschnitt: Der Vorzeichentest Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 423/453 Der Vorzeichentest Statistik R. Frühwirth Wir testen die Hypothese, dass der unbekannte Median m von F gleich m0 ist: Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test H0 : m = m0 gegen H1 : m 6= m0 Die Zufallsvariable Ii sei definiert durch ( 1, wenn Xi ≤ m0 Ii = 0, wenn Xi > m0 Für jedes Xi gilt: W (Xi ≤ m0 ) = F (m0 ) = p. Pn I = i=1 Ii ist daher binomialverteilt gemäß Bi(n, p). Es soll also getestet werden, ob p = 0.5. R. Frühwirth Statistik 424/453 Der Vorzeichentest Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Unter der Nullhypothese ist I verteilt gemäß Bi(n, 0.5). Die Hypothese wird verworfen, wenn I signifikant kleiner oder größer als der Erwartungswert n/2 ist. Der p-Wert wird berechnet durch p = 2 min(G(I), 1 − G(I)) wobei G die Verteilungsfunktion der Bi(n, 0.5)-Verteilung ist. Ist p ≤ α, wird die Hypothese verworfen. Matlab: Funktion signtest R. Frühwirth Statistik 425/453 Unterabschnitt: Der Vorzeichenrangtest Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 426/453 Der Vorzeichenrangtest Statistik R. Frühwirth Wir testen die Hypothese, dass die Stichprobe aus einer symmetrischen Verteilung F mit Median m0 stammt: Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben H0 : W (X ≤ m0 − a) = W (X ≥ m0 + a) für alle a > 0 Dazu berechnen wir Yi = Xi − m0 und sortieren die absoluten Werte |Yi | aufsteigend: Zj = |Yπ(j) | Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test wo π eine Permutation der Zahlen {1, . . . , n} ist. Die Zufallsvariable Ij sei definiert durch ( 1, wenn Xπ(j) ≤ m0 Ij = 0, sonst R. Frühwirth Statistik 427/453 Der Vorzeichenrangtest Statistik R. Frühwirth Die Testgröße ist T = Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben n X jIj j=1 Unter der Nullhypothese ist W (Ij = 1) = W (Ij = 0) = 1 2 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Daraus folgt i Xj n(n + 1) jIj = = 4 hX i X2 2 var[T ] =var jIj = j var[Ij ] = E[T ] =E = R. Frühwirth hX X j2 4 = Statistik n(n + 1)(2n + 1) 24 428/453 Der Vorzeichenrangtest Statistik R. Frühwirth Einleitung Ist genügend groß (etwa n > 25), wird die Verteilung von T durch eine Normalverteilung mit Mittel µ = E[T ] und Varianz σ 2 = var[T ] angenähert. Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Die Nullhypothese wird verworfen, wenn T signifikant kleiner oder größer als µ ist. Der p-Wert wird berechnet durch p = 2 min(G(I), 1 − G(I)) wobei G die Verteilungsfunktion der No(µ, σ 2 )-Verteilung ist. Ist p ≤ α, wird die Hypothese verworfen. Für kleinere n ist auch ein exakte Berechnung des p-Werts möglich. Matlab: Funktion signrank R. Frühwirth Statistik 429/453 Unterabschnitt: Der Rangsummentest Statistik R. Frühwirth Einleitung 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest 19 Anpassungstests Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 430/453 Der Rangsummentest Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Wir betrachten nun eine Stichprobe X = {X1 , . . . , Xm } mit der Verteilungsfunktion F (x) und eine davon unabhängige Stichprobe Y = {Y1 , . . . , Yn } aus der zu F verschobenen Verteilung G(x) = F (x − a). Wir testen die Hypothese, dass die Stichprobe aus der selben Verteilung stammen, also H0 : a = 0 gegen H1 : a 6= 0 Die Testgröße U nach Mann-Whitney ist definiert durch: Anpassungstests U= Der Chiquadrat-Test Der KolmogorovSmirnov-Test m X n X s(Xi , Yj ) i=1 j=1 wobei s(X, Y ) = 1 wenn Y < X und s(X, Y ) = 0 sonst. Die Hypothese wird abgelehnt, wenn U zu klein oder zu groß ist. R. Frühwirth Statistik 431/453 Der Rangsummentest Statistik R. Frühwirth Für genügend große Stichproben ist U annähernd normalverteilt gemäß No(µ, σ 2 ) mit Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test µ= mn , 2 σ2 = nm(m + n + 1) 12 Der p-Wert wird berechnet durch p = 2 min(G(U ), 1 − G(U )) wobei G die Verteilungsfunktion der No(µ, σ 2 )-Verteilung ist. Ist p ≤ α, wird die Hypothese verworfen. R. Frühwirth Statistik 432/453 Der Rangsummentest Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Alternativ kann die Testgröße T nach Wilcoxon definiert werden durch: n X T = R(Xi ) i=1 wobei R(Xi ) die Rangzahl von Xi in der kombinierten geordneten Stichprobe ist. Es gilt: n(n + 1) 2 Die Verteilungsfunktion von T kann rekursiv exakt berechnet werden. T =U+ Der Test wird auch als Mann-Whitney-Wilcoxon-Test bezeichnet. Matlab: Funktion ranksum R. Frühwirth Statistik 433/453 Abschnitt 19: Anpassungstests Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests 19 Anpassungstests Der Chiquadrat-Test Der Kolmogorov-Smirnov-Test Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 434/453 Anpassungstests Statistik R. Frühwirth Einleitung Ein Test, der die Hypothese überprüft, ob die Daten einer gewissen Verteilung entstammen können, heißt ein Anpassungstest. Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Die Verteilung kann völlig oder bis auf unbekannte Parameter bestimmt sein. Ein Anpassungstest kann einem parametrischen Test vorausgehen, um dessen Anwendbarkeit zu überprüfen. Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 435/453 Unterabschnitt: Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests 19 Anpassungstests Der Chiquadrat-Test Der Kolmogorov-Smirnov-Test Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 436/453 Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Der Chiquadrat-Test für diskrete Beobachtungen Die Stichprobe X1 , . . . , Xn entstammt einer diskreten Verteilung mit Wertebereich {1, . . . , k}. Wir testen die Hypothese H0 , dass die Dichte f die Werte f (j) = pj , j = 1, . . . , k hat: H0 : W (Xi = j) = pj , j = 1, . . . , k Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test gegen H1 : W (Xi = j) 6= pj , für ein j Es sei Yj die Zahl der Beobachtungen, die gleich j sind. Unter der Nullhypothese ist Y1 , . . . , Yk multinomial verteilt gemäß Mu(n, p1 , . . . , pk ) und E[Yj ] = npj . R. Frühwirth Statistik 437/453 Der Chiquadrat-Test Statistik R. Frühwirth Die Testgröße vergleicht die beobachteten Häufigkeiten Yj mit ihren Erwartungswerten: Einleitung k X (Yj − npj )2 T = npj j=1 Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Die Nullhypothese wird verworfen, wenn T groß ist. Der kritische Bereich kann nach dem folgenden Ergebnis bestimmt werden. Satz Unter Annahme der Nullhypothese ist die Zufallsvariable T asymptotisch, d.h. für n → ∞, χ2 -verteilt mit k − 1 Freiheitsgraden. R. Frühwirth Statistik 438/453 Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Soll der Test Signifikanzniveau α haben, wird H0 abgelehnt, wenn T ≥ χ21−α,k−1 wo χ21−α,k das Quantil der χ2 -Verteilung mit k − 1 Freiheitsgraden zum Niveau 1 − α ist. Der Grund dafür, dass T nur k − 1 Freiheitsgrade hat, ist der lineare Zusammenhang zwischen den Yj : Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest k X Der Chiquadrat-Test Der KolmogorovSmirnov-Test Yj = n j=1 Anpassungstests Als Faustregel gilt: n sollte so groß sein, dass npj > 5, j = 1, . . . , k. Ist das nicht erfüllt, sollte der Ablehnungsbereich durch Simulation bestimmt werden. R. Frühwirth Statistik 439/453 Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Beispiel Wir testen anhand einer Stichprobe vom Umfang 50, ob ein Würfel symmetrisch ist, d.h. ob die Augenzahl X folgende Verteilung hat: W (X = 1) = . . . = W (X = 6) = Eine Simulation von N = 100000 Stichproben ergibt: Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test 1 6 T = 5.000, ST2 = 9.789 Das 0.95-Quantil der χ2 -Verteilung mit fünf Freiheitsgraden ist χ20.95,5 = 11.07, und W (T ≥ 11.07) = 0.048 Matlab: make chi2test wuerfel.m R. Frühwirth Statistik 440/453 Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test für stetige Beobachtungen Die Stichprobe X1 , . . . , Xn entstammt einer stetigen Verteilung F . Wir testen die Hypothese H0 : F (x) = F0 (x). Dazu wird der Wertebereich von X in k Gruppen G1 , . . . , Gk eingeteilt. Es sei Yj die Zahl der Beobachtungen in Gruppe Gj . Unter der Nullhypothese ist Y1 , . . . , Yk multinomial verteilt gemäß Mu(n, p1 , . . . , pk ) und E[Yj ] = npj , mit Der Chiquadrat-Test Der KolmogorovSmirnov-Test pj = W (X ∈ Gj |H0 ) Der Test verläuft weiter wie im diskreten Fall. R. Frühwirth Statistik 441/453 Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Unbekannte Parameter Die Nullhypothese muss nicht vollständig spezifiziert sein. Wir betrachten den Fall, dass die pj noch von unbekannten Parametern ϑ abhängen: W (X ∈ Gj ) = pj (ϑ) Die Statistik T ist nun eine Funktion der unbekannten Parameter: k X (Yj − npj (ϑ))2 T (ϑ) = npj (ϑ) j=1 Zunächst werden die Parameter geschätzt, durch ML-Schätzung oder Minimierung von T : ϑ̃ = arg min T (ϑ) ϑ R. Frühwirth Statistik 442/453 Der Chiquadrat-Test Statistik Der kritische Bereich kann nach dem folgenden Ergebnis bestimmt werden. R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Satz Werden m Parameter aus der Stichprobe geschätzt, so ist T (ϑ̃) asymptotisch χ2 -verteilt mit k − 1 − m Freiheitsgraden. Soll der Test Signifikanzniveau α haben, wird H0 abgelehnt, wenn T ≥ χ21−α,k−1−m wo χ21−α,k das Quantil der χ2 -Verteilung mit k − 1 − m Freiheitsgraden zum Niveau 1 − α ist. R. Frühwirth Statistik 443/453 Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Beispiel Angabe: Die Zahl der Arbeitsunfälle wurde in einem großen Betrieb über 30 Wochen erhoben. Es ergaben sich folgende Werte: X ={8, 0, 0, 1, 3, 4, 0, 2, 12, 5, 1, 8, 0, 2, 0, 1, 9, 3, 4, 5, 3, 3, 4, 7, 4, 0, 1, 2, 1, 2} Es soll die Hypothese überprüft werden, dass die Beobachtungen Poisson-verteilt gemäß Po(λ) sind. Lösung: Die Beobachtungen werden in fünf Gruppen eingeteilt: Gruppe 1 2 3 4 5 X 0 1 2–3 4–5 >5 Die Häufigkeiten der Gruppen sind: Y1 = 6, Y2 = 5, Y3 = 8, Y4 = 6, Y5 = 5 R. Frühwirth Statistik 444/453 Der Chiquadrat-Test Statistik R. Frühwirth Einleitung Beispiel (Fortsetzung) Der Schätzwert für λ ist das Stichprobenmittel: Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest λ̃ = 3.1667 Die Erwartungswerte der Yj unter Annahme von H0 = Po(λ̃) sind: j 1 2 3 4 5 E[Y1 ] 1.2643 4.0037 13.0304 8.6522 3.0493 Die Testgröße T ist gleich Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test T = 21.99 Das 99%-Quantil der χ2 -Verteilung mit drei Freiheitsgraden ist gleich χ20.99,3 = 11.35. Die Hypothese, dass die Beobachtungen Poisson-verteilt sind, ist also abzulehnen. Matlab: make chi2test poisson.m R. Frühwirth Statistik 445/453 Unterabschnitt: Der Kolmogorov-Smirnov-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben 16 Einleitung 17 Parametrische Tests 18 Nichtparametrische Tests 19 Anpassungstests Der Chiquadrat-Test Der Kolmogorov-Smirnov-Test Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 446/453 Der Kolmogorov-Smirnov-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Eine Stichprobe Die Stichprobe X1 , . . . , Xn ist aus der stetigen Verteilung mit Verteilungsfunktion F . Wir testen die Hypothese H0 : F (x) = F0 (x). Die Testgröße Dn ist die maximale absolute Abweichung der empirischen Verteilungsfunktion Fn (x) der Stichprobe von der hypothetischen Verteilungsfunktion F0 (x): Dn = max |Fn (x) − F0 (x)| x Für Stichproben aus F0 ist die Verteilung von Dn unabhängig von F0 ! Für √ Stichproben aus F0 strebt die Verteilungsfunktion von nD für n → ∞ gegen: K(x) = 1 − 2 ∞ X (−1)k−1 e−2k 2 x2 k=1 R. Frühwirth Statistik 447/453 Der Kolmogorov-Smirnov-Test Statistik R. Frühwirth Aus der asymptotischen Verteilungsfunktion können Quantile K1−α berechnet werden. Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Die Nullhypothese wird abgelehnt, wenn √ nDn > K1−α Werden vor dem Test Parameter von F0 geschätzt, sind die Quantile nicht mehr gültig. In diesem Fall muss der Ablehnungsbereich durch Simulation ermittelt werden. Matlab: Funktion kstest Der Chiquadrat-Test Der KolmogorovSmirnov-Test R. Frühwirth Statistik 448/453 Der Kolmogorov-Smirnov-Test Statistik R. Frühwirth Einleitung Parametrische Tests Grundlagen Tests für normalverteilte Stichproben Tests für alternativverteilte Stichproben Tests für Poissonverteilte Stichproben Nichtparametrische Tests Einleitung Der Vorzeichentest Der Vorzeichenrangtest Der Rangsummentest Anpassungstests Der Chiquadrat-Test Der KolmogorovSmirnov-Test Zwei Stichproben Wir testen, ob zwei Stichproben vom Umfang n bzw. m aus der gleichen Verteilung F stammen. Die Testgröße ist die maximale absolute Differenz der empirischen Verteilungsfunktionen: 2 Dn,m = max |Fn1 (x) − Fm (x)| x Die Nullhypothese wird abgelehnt, wenn r nm Dn,m > K1−α n+m Matlab: Funktion kstest2 R. Frühwirth Statistik 449/453