Statistik

Werbung
Statistik
R. Frühwirth
Statistik
R. Frühwirth
[email protected]
VO 142.090
http://tinyurl.com/TU142090
Februar 2010
R. Frühwirth
Statistik
1/453
Übersicht über die Vorlesung
Statistik
R. Frühwirth
Teil 1: Deskriptive Statistik
Teil 2: Wahrscheinlichkeitsrechnung
Teil 3: Zufallsvariable
Teil 4: Parameterschätzung
R. Frühwirth
Statistik
2/453
Übersicht über die Vorlesung
Statistik
R. Frühwirth
Teil 5: Testen von Hypothesen
Teil 6: Regressionsanalyse
Teil 7: Simulation von Experimenten
R. Frühwirth
Statistik
3/453
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Teil 5
Testen von Hypothesen
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
376/453
Übersicht Teil 5
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
16
Einleitung
17
Parametrische Tests
Nichtparametrische Tests
18
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
19
Anpassungstests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
377/453
Abschnitt 16: Einleitung
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
16
Einleitung
17
Parametrische Tests
Nichtparametrische Tests
18
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
19
Anpassungstests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
378/453
Einleitung
Statistik
R. Frühwirth
Wir beobachten eine Stichprobe X1 , . . . , Xn aus einer
Verteilung F .
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Ein Test soll feststellen, ob die Beobachtungen mit einer
gewissen Annahme über F verträglich sind.
Die Annahme wird als Nullhypothese H0 bezeichnet.
Ist die Form von F bis auf einen oder mehrere Parameter
spezifiziert, heißt der Test parametrisch.
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Ist die Form von F nicht spezifiziert, heißt der Test
nichtparametrisch oder parameterfrei.
Der Test entscheidet, ob die Stichprobe mit der Hypothese
vereinbar ist, nicht ob die Hypothese richtig ist!
R. Frühwirth
Statistik
379/453
Einleitung
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Allgemeine Vorgangsweise
Aus der Stichprobe wird eine Testgröße (Teststatistik) T
berechnet.
Der Wertebereich von T wird, in Abhängigkeit von H0 , in
einen Ablehnungsbereich (kritischen Bereich) C und einen
Annahmebereich C 0 unterteilt.
Fällt der Wert von T in den Ablehnungsbereich, wird H0
verworfen.
Andernfalls wird H0 vorläufig beibehalten.
Das ist jedoch keine Bestätigung von H0 . Es heißt lediglich,
dass die Daten mit der Hypothese vereinbar sind.
R. Frühwirth
Statistik
380/453
Einleitung
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Signifikanz und Güte
Bei jedem Testverfahren sind zwei Arten von Fehlern
möglich.
1
Fehler 1. Art: Die Hypothese H0 wird abgelehnt,
obwohl sie zutrifft.
2
Fehler 2. Art: Die Hypothese H0 wird beibehalten,
obwohl sie nicht zutrifft.
Die Verteilung von T unter Annahme von H0 wird
bestimmt.
Der Ablehnungsbereich wird so festgelegt, dass die
Wahrscheinlichkeit eines Fehlers 1. Art maximal gleich
einem Wert α ist.
α heißt das Signifikanzniveau des Tests. Gängige Werte
sind α = 0.05, 0.01, 0.005.
R. Frühwirth
Statistik
381/453
Einleitung
Statistik
R. Frühwirth
Einleitung
Ist der Ablehnungsbereich festgelegt, kann für eine
Gegenhypothese H1 die Wahrscheinlichkeit β(H1 ) eines
Fehlers 2. Art berechnet werden.
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
1 − β(H1 ) heißt die Güte des Tests für H1 .
Die Güte sollte nie kleiner als α sein.
Ist die Güte nie kleiner als α, heißt der Test unverzerrt.
Ein Ziel der Testtheorie ist es, unverzerrte Tests mit
maximaler Güte (UMPU) zu konstruieren.
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
382/453
Abschnitt 17: Parametrische Tests
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
Grundlagen
Tests für normalverteilte Stichproben
Tests für alternativverteilte Stichproben
Tests für Poissonverteilte Stichproben
18
Nichtparametrische Tests
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
383/453
Unterabschnitt: Grundlagen
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
Grundlagen
Tests für normalverteilte Stichproben
Tests für alternativverteilte Stichproben
Tests für Poissonverteilte Stichproben
18
Nichtparametrische Tests
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
384/453
Grundlagen
Statistik
R. Frühwirth
Einleitung
Wir betrachten eine Stichprobe X1 , . . . , Xn aus einer
Verteilung F , die bis auf einen oder mehrere Parameter
spezifiziert ist.
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Tests von Hypothesen über F heißen parametrisch.
Eine Nullhypothese H0 kann als eine Teilmenge des
Parameterraums Θ aufgefasst werden.
Der Test entscheidet, ob die Stichprobe mit der Hypothese
vereinbar ist.
Vor der Anwendung ist zu klären, ob die angenommene
parametrische Form plausibel ist.
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
385/453
Grundlagen
Statistik
R. Frühwirth
Zunächst wird die Teststatistik T und das Signifikanzniveau
α gewählt.
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Dann wird der kritische Bereich C so festgelegt, dass
W (T ∈ C|ϑ ∈ H0 ) ≤ α
Zu einer Nullhypothese H0 kann eine Gegenhypothese H1
formuliert werden.
H1 kann ebenfalls als Teilmenge des Parameterraums Θ
aufgefasst werden.
Ist das Signifikanzniveau α festgelegt, kann für jedes ϑ ∈ H1
die Güte berechnet werden:
1 − β(ϑ) = W (T ∈ C|ϑ ∈ H1 )
1 − β(ϑ) heißt die Gütefunktion des Tests.
R. Frühwirth
Statistik
386/453
Grundlagen
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Beispiel mit Exponentialverteilung
X1 , . . . , Xn ist eine exponentialverteilte Stichprobe aus
Ex(τ ).
Die Hypothese H0 : τ = τ0 soll anhand der Stichprobe
getestet werden.
Als Teststatistik T wählen wir das Stichprobenmittel:
T = X.
Unter Annahme von H0 hat T die folgende Dichte:
t
tn−1
exp
−
f (t) =
(τ0 /n)n Γ(n)
τ0 /n
T ist also verteilt gemäß Ga(n, τ0 /n).
H0 wird abgelehnt, wenn T von seinem Erwartungswert
weit entfernt“, also relativ klein oder relativ groß ist.
”
R. Frühwirth
Statistik
387/453
Grundlagen
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Ein Verwerfungsbereich mit Signifikanzniveau α ist die
Menge
C = [0, Qα/2 ] ∪ [Q1−α/2 , ∞[
wo Qp das Quantil der Ga(n, τ0 /n)-Verteilung zum Niveau
p ist.
Die Gütefunktion für einen Wert τ ergibt sich durch:
1 − β(τ ) = W (T ∈ C) = G(Qα/2 ) + 1 − G(Q(1−α)/2 )
wo G die Verteilungsfunktion der Ga(n, τ /n)-Verteilung ist.
Der Test ist nicht unverzerrt, da z.B. für τ0 = 1 und n = 25
1 − β(0.986) = 0.0495 < α
Matlab: make test exponential mean.m
R. Frühwirth
Statistik
388/453
Grundlagen
Statistik
Gütefunktion (τ0=1)
R. Frühwirth
1
Einleitung
0.9
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
0.7
0.6
1−β(τ)
Nichtparametrische Tests
0.8
0.5
0.4
0.3
0.2
0.1
0
0.5
n=25
n=100
0.6
0.7
0.8
R. Frühwirth
0.9
Statistik
1
τ
1.1
1.2
1.3
1.4
1.5
389/453
Unterabschnitt: Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
Grundlagen
Tests für normalverteilte Stichproben
Tests für alternativverteilte Stichproben
Tests für Poissonverteilte Stichproben
18
Nichtparametrische Tests
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
390/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Erwartungswert bei bekannter Varianz
X1 , . . . , Xn ist eine normalverteilte Stichprobe aus
No(µ, σ 2 ) mit bekanntem σ 2 .
Die Hypothese H0 : µ = µ0 soll anhand der Stichprobe
gegen die Alternativhypothese H1 : µ 6= µ0 getestet werden.
Als Teststatistik T wählen wir das Standardscore des
Stichprobenmittels:
√
n(X − µ0 )
T =
σ
Unter Annahme von H0 ist T verteilt gemäß No(0, 1).
H0 wird abgelehnt, wenn T von seinem Erwartungswert
weit entfernt“, also relativ klein oder relativ groß ist.
”
R. Frühwirth
Statistik
391/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Ein Verwerfungsbereich mit Signifikanzniveau α ist die
Menge
C =] − ∞, zα/2 ] ∪ [z1−α/2 , ∞[
wo zp das Quantil der Standardnormalverteilung zum Niveau
p ist.
Die Hypothese H0 wird also abgelehnt, wenn
√ n X − µ0 |T | =
> z1−α/2
σ
Die Gütefunktion für einen Wert µ ergibt sich durch:
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
1 − β(µ) = W (T ∈ C) = G(zα/2 ) + 1 − G(z(1−α)/2 )
√
wo G die Verteilungsfunktion der No( n(µ − µ0 )/σ, 1)Verteilung ist.
Der Test ist unverzerrt.
Matlab: make test normal mean.m
R. Frühwirth
Statistik
392/453
Tests für normalverteilte Stichproben
Statistik
Gütefunktion des zweiseitigen Tests (µ0=1)
R. Frühwirth
1
Einleitung
0.9
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
0.7
0.6
1−β(µ)
Nichtparametrische Tests
0.8
0.5
0.4
0.3
0.2
0.1
0
0.5
n=25
n=100
0.6
0.7
0.8
R. Frühwirth
0.9
Statistik
1
µ
1.1
1.2
1.3
1.4
1.5
393/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Einseitiger Test
Die Hypothese H0 : µ = µ0 soll mit der Teststatistik T
gegen die Alternativhypothese H1 : µ > µ0 getestet werden.
H0 wird abgelehnt, wenn T zu groß“ ist.
”
Ein Verwerfungsbereich mit Signifikanzniveau α ist die
Menge
C = [z1−α , ∞[
Die Hypothese H0 wird also abgelehnt, wenn
√
n X − µ0
> z1−α
T =
σ
R. Frühwirth
Statistik
394/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Die Gütefunktion für einen Wert µ > µ0 ergibt sich durch:
1 − β(τ ) = W (T ∈ C) = 1 − G(z1−α )
√
wo G die Verteilungsfunktion der No( n(µ − µ0 )/σ, 1)Verteilung ist.
Analog verläuft der Test mit H1 : µ < µ0 .
Matlab: make test normal mean.m
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
395/453
Tests für normalverteilte Stichproben
Statistik
Gütefunktion des einseitigen Tests (µ0=1)
R. Frühwirth
1
Einleitung
0.9
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
0.7
0.6
1−β(µ)
Nichtparametrische Tests
0.8
0.5
0.4
0.3
0.2
0.1
0
1
n=25
n=100
1.1
1.2
1.3
R. Frühwirth
1.4
Statistik
1.5
µ
1.6
1.7
1.8
1.9
2
396/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Erwartungswert bei unbekannter Varianz: t-Test
X1 , . . . , Xn ist eine normalverteilte Stichprobe aus
No(µ, σ 2 ) mit unbekanntem σ 2 .
Die Hypothese H0 : µ = µ0 soll anhand der Stichprobe
gegen die Alternativhypothese H1 : µ 6= µ0 getestet werden.
Als Teststatistik T wählen wir das Standardscore des
Stichprobenmittels, unter Benützung der Stichprobenvarianz
S2:
√
n(X − µ0 )
T =
S
Unter Annahme von H0 ist T verteilt gemäß t(n − 1).
R. Frühwirth
Statistik
397/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
H0 wird abgelehnt, wenn T von seinem Erwartungswert
weit entfernt“, also relativ klein oder relativ groß ist.
”
Ein Verwerfungsbereich mit Signifikanzniveau α ist die
Menge
n−1
C =] − ∞, tn−1
α/2 ] ∪ [t1−α/2 , ∞[
wo tn−1
das Quantil der t-Verteilung mit n − 1
p
Freiheitsgraden zum Niveau p ist.
Die Hypothese H0 wird also abgelehnt, wenn
√ n X − µ0 |T | =
> tn−1
1−α/2
S
R. Frühwirth
Statistik
398/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Die Gütefunktion für einen Wert µ ergibt sich durch:
1 − β(τ ) = W (T ∈ C) = G(zα/2 ) + 1 − G(z(1−α)/2 )
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
wo G die Verteilungsfunktion der nichtzentralen
t(n − 1, δ)-Verteilung mit
√
δ = n(µ − µ0 )/σ
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
ist.
Der Test ist unverzerrt.
Matlab: make test normal mean.m
R. Frühwirth
Statistik
399/453
Tests für normalverteilte Stichproben
Statistik
Gütefunktion des zweiseitigen t−Tests (µ0=1)
R. Frühwirth
1
Einleitung
0.9
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
0.7
0.6
1−β(µ)
Nichtparametrische Tests
0.8
0.5
0.4
0.3
0.2
0.1
0
0.5
n=25
n=100
0.6
0.7
0.8
R. Frühwirth
0.9
Statistik
1
µ
1.1
1.2
1.3
1.4
1.5
400/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Gleichheit von zwei Erwartungswerten
X1 , . . . , Xn und Y1 , . . . , Ym sind zwei unabhängige
normalverteilte Stichprobe aus No(µx , σx2 ) bzw. No(µy , σy2 ).
Die Hypothese H0 : µx = µy soll anhand der Stichproben
gegen die Alternativhypothese H1 : µx 6= µy getestet
werden.
Sind die Varianzen bekannt, wählen wir als Teststatistik T
die Differenz der Stichprobenmittel:
T =X −Y
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Unter Annahme von H0 ist T verteilt gemäß
No(0, σx2 /n + σy2 /m).
R. Frühwirth
Statistik
401/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Das Standardscore
Einleitung
Z=q
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
T
σx2 /n + σy2 /m
ist dann standardnormalverteilt.
Die Hypothese H0 wird also abgelehnt, wenn
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
|Z| > z1−α/2
oder
|X − Y |
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
q
R. Frühwirth
σx2 /n
+ σy2 /m
Statistik
> z1−α/2
402/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Sind die Varianzen unbekannt und gleich, kann die
Varianz aus der kombinierten ( gepoolten“) Stichprobe
”
geschätzt werden:
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
S2 =
(n − 1)Sx2 + (m − 1)Sy2
n+m−2
Unter Annahme von H0 ist
X −Y
Nichtparametrische Tests
T =p
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
S 2 (1/n
+ 1/m)
t-verteilt mit n + m − 2 Freiheitsgraden.
Die Hypothese H0 wird also abgelehnt, wenn
|T | > tn+m−2
1−α/2
wo tn+m−2
1−α/2 das Quantil der t-Verteilung mit n + m − 2
Freiheitsgraden ist.
R. Frühwirth
Statistik
403/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
t-Test für gepaarte Stichproben
Gepaarte Stichproben (X1 , Y1 ), . . . , (Xn , Yn ) entstehen,
wenn für jedes beobachtete Objekt die selbe Größe zweimal
gemessen wird, vor und nach einer bestimmten Intervention.
Die Wirkung der Intervention wird durch die Differenzen
Wi = Yi − Xi , i = 1, . . . , n beschrieben.
Wir nehmen an, dass W1 , . . . , Wn normalverteilt mit Mittel
2
µw und unbekannter Varianz σw
ist.
Die Hypothese H0 : µw = 0 (keine Wirkung der
Intervention) soll anhand der Stichprobe gegen die
Alternativhypothese H1 : µw 6= 0 getestet werden.
Dies erfolgt mit dem t-Test für einzelne Stichproben.
R. Frühwirth
Statistik
404/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Test der Varianz
X1 , . . . , Xn ist eine normalverteilte Stichprobe mit
unbekanntem Erwartungswert µ und unbekannter Varianz
σ2 .
Die Hypothese H0 : σ 2 = σ02 soll anhand der Stichprobe
gegen die Alternativhypothese H1 : σ 2 6= σ02 getestet
werden.
Als Teststatistik T wählen wir:
T =
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
(n − 1)S 2
σ02
Unter Annahme von H0 ist T χ2 -verteilt mit n − 1
Freiheitsgraden.
R. Frühwirth
Statistik
405/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Die Hypothese H0 wird also abgelehnt, wenn
T < χ2α/2,n−1
oder T > χ21−α/2,n−1
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
wo χ2p,k das Quantil der χ2 -Verteilung mit k Freiheitsgraden
zum Niveau p ist.
Die Gütefunktion für einen Wert σ 2 ergibt sich durch:
1 − β(σ 2 ) = G(σ02 /σ 2 · χ2α/2 ) + 1 − G(σ02 /σ 2 · χ2(1−α)/2 )
wo G die Verteilungsfunktion der χ2 (n − 1)Verteilung ist.
Der Test ist nicht unverzerrt.
Matlab: make test normal variance.m
R. Frühwirth
Statistik
406/453
Tests für normalverteilte Stichproben
Statistik
Gütefunktion des zweiseitigen Tests (σ20=1)
R. Frühwirth
1
Einleitung
0.9
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
0.7
0.6
1−β(σ2)
Nichtparametrische Tests
0.8
0.5
0.4
0.3
0.2
0.1
0
0.5
n=25
n=100
0.6
0.7
0.8
R. Frühwirth
0.9
Statistik
1
σ2
1.1
1.2
1.3
1.4
1.5
407/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Gleichheit von zwei Varianzen
X1 , . . . , Xn und Y1 , . . . , Ym sind zwei unabhängige
normalverteilte Stichprobe aus No(µx , σx2 ) bzw. No(µy , σy2 ).
Die Hypothese H0 : σx2 = σy2 soll anhand der Stichproben
gegen die Alternativhypothese H1 : σx2 6= σy2 getestet
werden.
Die Teststatistik T ist das Verhältnis der
Stichprobenvarianzen:
Anpassungstests
T =
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Sx2
Sy2
Unter Annahme von H0 ist T F-verteilt gemäß
F(n − 1, m − 1).
R. Frühwirth
Statistik
408/453
Tests für normalverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Die Hypothese H0 wird also abgelehnt, wenn
T < Fα/2
oder T > F1−α/2
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
wo Fp das Quantil der F-Verteilung mit n − 1 bzw. m − 1
Freiheitsgraden zum Niveau p ist.
Ist σy2 = kσx2 , ergibt sich die Gütefunktion für einen Wert k
ergibt durch:
1 − β(τ ) = G(σ02 /σ 2 · Fα/2 ) + 1 − G(σ02 /σ 2 · F(1−α)/2 )
wo G die Verteilungsfunktion der F(n − 1, m − 1)Verteilung ist.
Der Test ist unverzerrt.
Matlab: make test normal variance.m
R. Frühwirth
Statistik
409/453
Tests für normalverteilte Stichproben
Statistik
Gütefunktion des zweiseitigen Tests (σ2x =σ2y )
R. Frühwirth
1
Einleitung
0.9
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
0.7
0.6
1−β(k)
Nichtparametrische Tests
0.8
0.5
0.4
0.3
0.2
0.1
0
n=25
n=100
−0.6
−0.4
R. Frühwirth
−0.2
0
ln k=ln(σ2y /σ2x )
Statistik
0.2
0.4
0.6
410/453
Unterabschnitt: Tests für alternativverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
Grundlagen
Tests für normalverteilte Stichproben
Tests für alternativverteilte Stichproben
Tests für Poissonverteilte Stichproben
18
Nichtparametrische Tests
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
411/453
Tests für alternativverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einseitiger Test auf Erwartungswert
X1 , . . . , Xn ist eine alternativverteilte Stichprobe aus Al(p).
Die Hypothese H0 : p ≤ p0 soll anhand der Stichprobe
gegen die Alternativhypothese H1 : p > p0 getestet werden.
Als Teststatistik T wählen wir die Anzahl der
Versuchsausgänge 1:
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
T =
Xi
i=1
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
n
X
T ist binomialverteilt gemäß Bi(n, p).
H0 wird abgelehnt, wenn T zu groß“ ist.
”
R. Frühwirth
Statistik
412/453
Tests für alternativverteilte Stichproben
Statistik
R. Frühwirth
Ist p ≤ p0 , gilt
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
W (T ≥ k) ≤
n X
n
i=k
i
pi0 (1 − p0 )n−i
Die Hypothese H0 wird abgelehnt, wenn
n X
n i
p (1 − p0 )n−i ≤ α
i 0
i=T
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
413/453
Tests für alternativverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Beispiel
Ein Hersteller behauptet, dass nicht mehr als 2 Prozent eines gewissen
Bauteils fehlerhaft sind. In einer Stichprobe vom Umfang 300 sind 9
Stück defekt. Kann die Behauptung des Herstellers widerlegt werden?
Es gilt:
!
300
X
300
0.02i 0.98300−i = 0.1507
i
i=9
Die Behauptung des Herstellers lässt sich also auf einem
Signifikanzniveau von 5 Prozent nicht widerlegen.
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Matlab: make test alternative mean.m
R. Frühwirth
Statistik
414/453
Tests für alternativverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Näherung durch Normalverteilung
Ist n genügend groß, kann die Verteilung von T durch eine
Normalverteilung No(np, np(1 − p) angenähert werden.
H0 wird abgelehnt, wenn das Standardscore größer als das
(1 − α)-Quantil der Standardnormalverteilung ist:
Z=p
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
T − np0
np(1 − p0 )
≥ z1−α
Beispiel
Mit der Angabe des letzten Beispiels ergibt die Näherung:
Z = 1.2372 < z0.95 = 1.6449
Die Hypothese kann also nicht abgelehnt werden.
Matlab: make test alternative mean.m
R. Frühwirth
Statistik
415/453
Unterabschnitt: Tests für Poissonverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
Grundlagen
Tests für normalverteilte Stichproben
Tests für alternativverteilte Stichproben
Tests für Poissonverteilte Stichproben
18
Nichtparametrische Tests
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
416/453
Tests für Poissonverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Einseitiger Test auf Erwartungswert
X1 , . . . , Xn ist eine Poissonverteilte Stichprobe aus Po(λ).
Die Hypothese H0 : λ ≤ λ0 soll anhand der Stichprobe
gegen die Alternativhypothese H1 : λ > λ0 getestet werden.
Als Teststatistik T wählen wir die Stichprobensumme:
Nichtparametrische Tests
T =
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
n
X
Xi
i=1
T ist Poissonverteilt gemäß Po(nλ).
H0 wird abgelehnt, wenn T zu groß“ ist, also wenn
”
∞
X
(nλ0 )k e−nλ0
≤α
k!
k=T
R. Frühwirth
Statistik
417/453
Tests für Poissonverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Beispiel
Ein Hersteller strebt an, dass in einer Fabrik täglich im Mittel nicht
mehr als 25 defekte Bauteile hergestellt werden. Eine Stichprobe von 5
Tagen ergibt 28,34,32,38 und 22 defekte Bauteile. Hat der Hersteller
sein Ziel erreicht?
Es gilt:
T = 154,
∞
X
(125)k e−125
= 0.0067
k!
k=T
Die Hypothese lässt sich also auf einem Signifikanzniveau von 1
Prozent widerlegen.
Matlab: make test poisson mean.m
R. Frühwirth
Statistik
418/453
Tests für Poissonverteilte Stichproben
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Näherung durch Normalverteilung
Ist n genügend groß, kann die Verteilung von T durch eine
Normalverteilung No(nλ, nλ angenähert werden.
H0 wird abgelehnt, wenn das Standardscore größer als das
(1 − α)-Quantil der Standardnormalverteilung ist:
T − nλ0
≥ z1−α
Z= √
nλ0
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Beispiel
Mit der Angabe des letzten Beispiels ergibt die Näherung:
Z = 2.5938 > z0.99 = 1.6449
Die Hypothese kann also auf einem Signifikanzniveau von 1 Prozent
abgelehnt werden.
Matlab: make test poisson mean.m
R. Frühwirth
Statistik
419/453
Abschnitt 18: Nichtparametrische Tests
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
420/453
Unterabschnitt: Einleitung
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
421/453
Einleitung
Statistik
R. Frühwirth
Wir betrachten wieder Stichproben X1 , . . . , Xn aus einer
stetigen Verteilung F , deren Form nicht spezifiziert ist.
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Tests von Hypothesen über F heißen nichtparametrisch
oder parameterfrei.
Solche Tests sind immer anwendbar, auch wenn über F
nichts bekannt ist.
Ist eine bestimmte parametrische Form von F plausibel,
sollten parametrische Tests angewendet werden, da sie
aussagekräftiger sind.
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
422/453
Unterabschnitt: Der Vorzeichentest
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
423/453
Der Vorzeichentest
Statistik
R. Frühwirth
Wir testen die Hypothese, dass der unbekannte Median m
von F gleich m0 ist:
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
H0 : m = m0 gegen H1 : m 6= m0
Die Zufallsvariable Ii sei definiert durch
(
1, wenn Xi ≤ m0
Ii =
0, wenn Xi > m0
Für jedes Xi gilt: W (Xi ≤ m0 ) = F (m0 ) = p.
Pn
I = i=1 Ii ist daher binomialverteilt gemäß Bi(n, p).
Es soll also getestet werden, ob p = 0.5.
R. Frühwirth
Statistik
424/453
Der Vorzeichentest
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Unter der Nullhypothese ist I verteilt gemäß Bi(n, 0.5).
Die Hypothese wird verworfen, wenn I signifikant kleiner
oder größer als der Erwartungswert n/2 ist.
Der p-Wert wird berechnet durch
p = 2 min(G(I), 1 − G(I))
wobei G die Verteilungsfunktion der Bi(n, 0.5)-Verteilung
ist.
Ist p ≤ α, wird die Hypothese verworfen.
Matlab: Funktion signtest
R. Frühwirth
Statistik
425/453
Unterabschnitt: Der Vorzeichenrangtest
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
426/453
Der Vorzeichenrangtest
Statistik
R. Frühwirth
Wir testen die Hypothese, dass die Stichprobe aus einer
symmetrischen Verteilung F mit Median m0 stammt:
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
H0 : W (X ≤ m0 − a) = W (X ≥ m0 + a) für alle a > 0
Dazu berechnen wir Yi = Xi − m0 und sortieren die
absoluten Werte |Yi | aufsteigend:
Zj = |Yπ(j) |
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
wo π eine Permutation der Zahlen {1, . . . , n} ist.
Die Zufallsvariable Ij sei definiert durch
(
1, wenn Xπ(j) ≤ m0
Ij =
0, sonst
R. Frühwirth
Statistik
427/453
Der Vorzeichenrangtest
Statistik
R. Frühwirth
Die Testgröße ist
T =
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
n
X
jIj
j=1
Unter der Nullhypothese ist
W (Ij = 1) = W (Ij = 0) =
1
2
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Daraus folgt
i Xj
n(n + 1)
jIj =
=
4
hX i X2
2
var[T ] =var
jIj =
j var[Ij ] =
E[T ] =E
=
R. Frühwirth
hX
X j2
4
=
Statistik
n(n + 1)(2n + 1)
24
428/453
Der Vorzeichenrangtest
Statistik
R. Frühwirth
Einleitung
Ist genügend groß (etwa n > 25), wird die Verteilung von T
durch eine Normalverteilung mit Mittel µ = E[T ] und
Varianz σ 2 = var[T ] angenähert.
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Die Nullhypothese wird verworfen, wenn T signifikant
kleiner oder größer als µ ist.
Der p-Wert wird berechnet durch
p = 2 min(G(I), 1 − G(I))
wobei G die Verteilungsfunktion der No(µ, σ 2 )-Verteilung
ist.
Ist p ≤ α, wird die Hypothese verworfen.
Für kleinere n ist auch ein exakte Berechnung des p-Werts
möglich.
Matlab: Funktion signrank
R. Frühwirth
Statistik
429/453
Unterabschnitt: Der Rangsummentest
Statistik
R. Frühwirth
Einleitung
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
19
Anpassungstests
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
430/453
Der Rangsummentest
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Wir betrachten nun eine Stichprobe X = {X1 , . . . , Xm }
mit der Verteilungsfunktion F (x) und eine davon
unabhängige Stichprobe Y = {Y1 , . . . , Yn } aus der zu F
verschobenen Verteilung G(x) = F (x − a).
Wir testen die Hypothese, dass die Stichprobe aus der
selben Verteilung stammen, also
H0 : a = 0 gegen H1 : a 6= 0
Die Testgröße U nach Mann-Whitney ist definiert durch:
Anpassungstests
U=
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
m X
n
X
s(Xi , Yj )
i=1 j=1
wobei s(X, Y ) = 1 wenn Y < X und s(X, Y ) = 0 sonst.
Die Hypothese wird abgelehnt, wenn U zu klein oder zu
groß ist.
R. Frühwirth
Statistik
431/453
Der Rangsummentest
Statistik
R. Frühwirth
Für genügend große Stichproben ist U annähernd
normalverteilt gemäß No(µ, σ 2 ) mit
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
µ=
mn
,
2
σ2 =
nm(m + n + 1)
12
Der p-Wert wird berechnet durch
p = 2 min(G(U ), 1 − G(U ))
wobei G die Verteilungsfunktion der No(µ, σ 2 )-Verteilung
ist.
Ist p ≤ α, wird die Hypothese verworfen.
R. Frühwirth
Statistik
432/453
Der Rangsummentest
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Alternativ kann die Testgröße T nach Wilcoxon definiert
werden durch:
n
X
T =
R(Xi )
i=1
wobei R(Xi ) die Rangzahl von Xi in der kombinierten
geordneten Stichprobe ist.
Es gilt:
n(n + 1)
2
Die Verteilungsfunktion von T kann rekursiv exakt
berechnet werden.
T =U+
Der Test wird auch als Mann-Whitney-Wilcoxon-Test
bezeichnet.
Matlab: Funktion ranksum
R. Frühwirth
Statistik
433/453
Abschnitt 19: Anpassungstests
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
19
Anpassungstests
Der Chiquadrat-Test
Der Kolmogorov-Smirnov-Test
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
434/453
Anpassungstests
Statistik
R. Frühwirth
Einleitung
Ein Test, der die Hypothese überprüft, ob die Daten einer
gewissen Verteilung entstammen können, heißt ein
Anpassungstest.
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Die Verteilung kann völlig oder bis auf unbekannte
Parameter bestimmt sein.
Ein Anpassungstest kann einem parametrischen Test
vorausgehen, um dessen Anwendbarkeit zu überprüfen.
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
435/453
Unterabschnitt: Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
19
Anpassungstests
Der Chiquadrat-Test
Der Kolmogorov-Smirnov-Test
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
436/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Der Chiquadrat-Test für diskrete Beobachtungen
Die Stichprobe X1 , . . . , Xn entstammt einer diskreten
Verteilung mit Wertebereich {1, . . . , k}.
Wir testen die Hypothese H0 , dass die Dichte f die Werte
f (j) = pj , j = 1, . . . , k hat:
H0 : W (Xi = j) = pj , j = 1, . . . , k
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
gegen
H1 : W (Xi = j) 6= pj , für ein j
Es sei Yj die Zahl der Beobachtungen, die gleich j sind.
Unter der Nullhypothese ist Y1 , . . . , Yk multinomial verteilt
gemäß Mu(n, p1 , . . . , pk ) und E[Yj ] = npj .
R. Frühwirth
Statistik
437/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Die Testgröße vergleicht die beobachteten Häufigkeiten Yj
mit ihren Erwartungswerten:
Einleitung
k
X
(Yj − npj )2
T =
npj
j=1
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Die Nullhypothese wird verworfen, wenn T groß ist.
Der kritische Bereich kann nach dem folgenden Ergebnis
bestimmt werden.
Satz
Unter Annahme der Nullhypothese ist die Zufallsvariable T
asymptotisch, d.h. für n → ∞, χ2 -verteilt mit k − 1
Freiheitsgraden.
R. Frühwirth
Statistik
438/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Soll der Test Signifikanzniveau α haben, wird H0 abgelehnt,
wenn
T ≥ χ21−α,k−1
wo χ21−α,k das Quantil der χ2 -Verteilung mit k − 1
Freiheitsgraden zum Niveau 1 − α ist.
Der Grund dafür, dass T nur k − 1 Freiheitsgrade hat, ist
der lineare Zusammenhang zwischen den Yj :
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
k
X
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Yj = n
j=1
Anpassungstests
Als Faustregel gilt: n sollte so groß sein, dass
npj > 5, j = 1, . . . , k.
Ist das nicht erfüllt, sollte der Ablehnungsbereich durch
Simulation bestimmt werden.
R. Frühwirth
Statistik
439/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Beispiel
Wir testen anhand einer Stichprobe vom Umfang 50, ob ein Würfel
symmetrisch ist, d.h. ob die Augenzahl X folgende Verteilung hat:
W (X = 1) = . . . = W (X = 6) =
Eine Simulation von N = 100000 Stichproben ergibt:
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
1
6
T = 5.000,
ST2 = 9.789
Das 0.95-Quantil der χ2 -Verteilung mit fünf Freiheitsgraden ist
χ20.95,5 = 11.07, und
W (T ≥ 11.07) = 0.048
Matlab: make chi2test wuerfel.m
R. Frühwirth
Statistik
440/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test für stetige Beobachtungen
Die Stichprobe X1 , . . . , Xn entstammt einer stetigen
Verteilung F .
Wir testen die Hypothese H0 : F (x) = F0 (x).
Dazu wird der Wertebereich von X in k Gruppen
G1 , . . . , Gk eingeteilt.
Es sei Yj die Zahl der Beobachtungen in Gruppe Gj .
Unter der Nullhypothese ist Y1 , . . . , Yk multinomial verteilt
gemäß Mu(n, p1 , . . . , pk ) und E[Yj ] = npj , mit
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
pj = W (X ∈ Gj |H0 )
Der Test verläuft weiter wie im diskreten Fall.
R. Frühwirth
Statistik
441/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Unbekannte Parameter
Die Nullhypothese muss nicht vollständig spezifiziert sein.
Wir betrachten den Fall, dass die pj noch von unbekannten
Parametern ϑ abhängen:
W (X ∈ Gj ) = pj (ϑ)
Die Statistik T ist nun eine Funktion der unbekannten
Parameter:
k
X
(Yj − npj (ϑ))2
T (ϑ) =
npj (ϑ)
j=1
Zunächst werden die Parameter geschätzt, durch
ML-Schätzung oder Minimierung von T :
ϑ̃ = arg min T (ϑ)
ϑ
R. Frühwirth
Statistik
442/453
Der Chiquadrat-Test
Statistik
Der kritische Bereich kann nach dem folgenden Ergebnis
bestimmt werden.
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Satz
Werden m Parameter aus der Stichprobe geschätzt, so ist T (ϑ̃)
asymptotisch χ2 -verteilt mit k − 1 − m Freiheitsgraden.
Soll der Test Signifikanzniveau α haben, wird H0 abgelehnt,
wenn
T ≥ χ21−α,k−1−m
wo χ21−α,k das Quantil der χ2 -Verteilung mit k − 1 − m
Freiheitsgraden zum Niveau 1 − α ist.
R. Frühwirth
Statistik
443/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Beispiel
Angabe: Die Zahl der Arbeitsunfälle wurde in einem großen Betrieb
über 30 Wochen erhoben. Es ergaben sich folgende Werte:
X ={8, 0, 0, 1, 3, 4, 0, 2, 12, 5, 1, 8, 0, 2, 0,
1, 9, 3, 4, 5, 3, 3, 4, 7, 4, 0, 1, 2, 1, 2}
Es soll die Hypothese überprüft werden, dass die Beobachtungen
Poisson-verteilt gemäß Po(λ) sind.
Lösung: Die Beobachtungen werden in fünf Gruppen eingeteilt:
Gruppe
1
2
3
4
5
X
0
1
2–3
4–5
>5
Die Häufigkeiten der Gruppen sind:
Y1 = 6, Y2 = 5, Y3 = 8, Y4 = 6, Y5 = 5
R. Frühwirth
Statistik
444/453
Der Chiquadrat-Test
Statistik
R. Frühwirth
Einleitung
Beispiel (Fortsetzung)
Der Schätzwert für λ ist das Stichprobenmittel:
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
λ̃ = 3.1667
Die Erwartungswerte der Yj unter Annahme von H0 = Po(λ̃) sind:
j
1
2
3
4
5
E[Y1 ]
1.2643
4.0037
13.0304
8.6522
3.0493
Die Testgröße T ist gleich
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
T = 21.99
Das 99%-Quantil der χ2 -Verteilung mit drei Freiheitsgraden ist gleich
χ20.99,3 = 11.35. Die Hypothese, dass die Beobachtungen
Poisson-verteilt sind, ist also abzulehnen.
Matlab: make chi2test poisson.m
R. Frühwirth
Statistik
445/453
Unterabschnitt: Der Kolmogorov-Smirnov-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
16
Einleitung
17
Parametrische Tests
18
Nichtparametrische Tests
19
Anpassungstests
Der Chiquadrat-Test
Der Kolmogorov-Smirnov-Test
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
446/453
Der Kolmogorov-Smirnov-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Eine Stichprobe
Die Stichprobe X1 , . . . , Xn ist aus der stetigen Verteilung
mit Verteilungsfunktion F .
Wir testen die Hypothese H0 : F (x) = F0 (x).
Die Testgröße Dn ist die maximale absolute Abweichung der
empirischen Verteilungsfunktion Fn (x) der Stichprobe von
der hypothetischen Verteilungsfunktion F0 (x):
Dn = max |Fn (x) − F0 (x)|
x
Für Stichproben aus F0 ist die Verteilung von Dn
unabhängig von F0 !
Für
√ Stichproben aus F0 strebt die Verteilungsfunktion von
nD für n → ∞ gegen:
K(x) = 1 − 2
∞
X
(−1)k−1 e−2k
2
x2
k=1
R. Frühwirth
Statistik
447/453
Der Kolmogorov-Smirnov-Test
Statistik
R. Frühwirth
Aus der asymptotischen Verteilungsfunktion können
Quantile K1−α berechnet werden.
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Die Nullhypothese wird abgelehnt, wenn
√
nDn > K1−α
Werden vor dem Test Parameter von F0 geschätzt, sind die
Quantile nicht mehr gültig.
In diesem Fall muss der Ablehnungsbereich durch Simulation
ermittelt werden.
Matlab: Funktion kstest
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
R. Frühwirth
Statistik
448/453
Der Kolmogorov-Smirnov-Test
Statistik
R. Frühwirth
Einleitung
Parametrische Tests
Grundlagen
Tests für normalverteilte
Stichproben
Tests für
alternativverteilte
Stichproben
Tests für Poissonverteilte
Stichproben
Nichtparametrische Tests
Einleitung
Der Vorzeichentest
Der Vorzeichenrangtest
Der Rangsummentest
Anpassungstests
Der Chiquadrat-Test
Der KolmogorovSmirnov-Test
Zwei Stichproben
Wir testen, ob zwei Stichproben vom Umfang n bzw. m aus
der gleichen Verteilung F stammen.
Die Testgröße ist die maximale absolute Differenz der
empirischen Verteilungsfunktionen:
2
Dn,m = max |Fn1 (x) − Fm
(x)|
x
Die Nullhypothese wird abgelehnt, wenn
r
nm
Dn,m > K1−α
n+m
Matlab: Funktion kstest2
R. Frühwirth
Statistik
449/453
Herunterladen