Parameterfreie Tests Statistische Tests für unbekannten

Werbung
Parameterfreie Tests
Statistische Tests für unbekannten Anteil
Binomialtest
Vergleich von unbekannten Anteilen
nicht verbundener Zufallsgrößen
U - Test
Mittelwertvergleich zweier nicht normalverteilter,
nicht verbundener Zufallsgrößen
Wilcoxon - Vorzeichenrangtest
Mittelwertvergleich zweier nicht normalverteilter,
verbunderer Stichproben
Tests für Parameter p der Binomialverteilung
Schätzung der Wahrscheinlichkeit p, mit der ein Ereignisses A eintritt:
In n Versuchen beobachtet man Ereignis A genau k mal
Anteil k/n ist dann eine Punktschätzung für Wahrscheinlichkeit P(A)
Bezeichnungen im Modell
1
Stichprobe
X 1 ,..., X n mit X i = 
0
Anzahl der Einsen in der Stichprobe,
entspricht der absoluten Häufigkeit des Eintretens von A bei n Versuchen
k:
Test auf Unabhängigkeit von zwei Zufallsgrößen
pˆ =
χ ²- Anpassungstest
Test auf Vorliegen einer bestimmten Verteilung
Prof. Dr. J. Schütze, FB GW
eingetreten
P( Xi = 1) = P(A) = p, (in jedem Versuch konstante) unbekannte Wahrscheinlichkeit
χ ²- Unabhängigkeitstest
SS 2016
falls A
sonst
k
n
relative Häufigkeit von A (Punktschätzung für p )
Ziel: Test der Nullhypothese p = p0
Parameterfreie Tests
1
Statistische Tests für unbekannten Anteil
SS 2015
Prof. Dr. J. Schütze, FB GW
Bin_Tests
2
Statistische Tests für unbekannten Anteil
Beispiel
Untersuchung der Regelmäßigkeit eines Würfels, d.h. jede Zahl fällt mit Wkt. 1/6
Man testet z.B. folgende Nullhypothese für das Würfeln einer ‚6‘
H0: p = 1/6
Experiment: 20 mal würfeln, dabei nur zweimal ‚6'
Zweifel an der Regelmäßigkeit des Würfels ???
Im Mittel sollte man n·p = 20 · (1/6), also etwa 3.3 Sechsen beobachten.
Theoretische Wahrscheinlichkeit:
p0 = 1 / 6 = 0.198
Beobachtete relative Häufigkeit:
p̂ = 2 / 20 = 0.1
Ist der Unterschied zwischen p und pˆ bei vorgegebener Sicherheit noch zufällig,
oder sollte man die Regelmäßigkeit des Würfels anzweifeln?
Regelmäßigkeit des Würfels entspricht der Nullhypothese
Bei einem regelmäßigen Würfel ist die Anzahl X der Sechsen bei 20 Versuchen
binomialverteilt mit Parametern n = 20, p0 = 1/6.
H0: p =1/6
k
n−k
 20   1   5 
P ( X = k ) =       , 0 ≤ k ≤ 20
 k  6   6 
Bei welcher beobachteten Anzahl von Sechsen beginnt der Ablehnbereich für
die Nullhypothese zu vorgegebener Irrtumswahrscheinlichkeit α?
Wahrscheinlichkeit für genau 2 Sechsen bei 20 Versuchen:
 20  1
5
P ( X = 2) =       = 0.198
 2  6   6 
2
SS 2015
18
Prof. Dr. J. Schütze, FB GW
Bin_Tests
3
SS 2015
Prof. Dr. J. Schütze, FB GW
Bin_Tests
4
Statistische Tests für unbekannten Anteil
Statistische Tests für unbekannten Anteil
Konstruktion eines zweiseitigen Ablehnbereichs für H0: p = 1/6 bei Risiko α
Verteilung der Anzahl Sechsen bei 20 Versuchen unter H0 : p = 1/6
k
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Wkt.
,026
,104
,198
,238
,202
,129
,065
,026
,008
,002
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
S-kt.
,026
Sehr unwahrscheinlich
,130
ist keine Sechs (p = 0.026)
,329
,567
Am wahrscheinlichsten
,769
sind 3 Sechsen (p = 0.238).
,898
,963
,989
,997
Sehr unwahrscheinlich
,999
sind 20 Sechsen, ebenso
1,000
1,000
19 Sechsen,…
1,000
für mehr als 6 Sechsen gilt
1,000
p = 0.026+0.08+0.02+0.000...
1,000
1,000
1,000
1,000
1,000
1,000
1,000
SS 2015
Aus den einzelnen Wahrscheinlichkeiten
definiert man den Ablehnbereich so, dass
X dort bei Gültigkeit der Nullhypothese
nur mit Wahrscheinlichkeit < α liegt.
Dazu summiert man beim zweiseitigen
Test von H0: p =1/6 beidseitig von außen
die Wahrscheinlichkeiten solange auf,
wie je α/2 noch nicht überschritten wird.
Anzahl Sechsen
Anzahl Sechsen
Prof. Dr. J. Schütze, FB GW
Bin_Tests
5
Statistische Tests für unbekannten Anteil
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Wkt.
,026
,104
,198
,238
,202
,129
,065
,026
,008
,002
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
S-Wkt.
,026
,130
,329
,567
,769
,898
,963
,989
,997
,999
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
SS 2015
Ablehnbereich bei zweiseitigem Test:
{0} ∪ {7,8,9,10,..., 20}
Die Irrtumswahrscheinlichkeit ist dabei
0.026 + 0.026 + 0.008 + 0.002 + 0.000 + ... ≈ 0.062
somit kleiner als α = 0.10
Nullhypothese
H 0 : p = p0
H 0 : p ≥ p0
Alternativhypothese
H 1 : p ≠ p0
H 1 : p < p0
H 0 : p ≤ p0
H 1 : p > p0
k
~Bin(n, p0)
Ablehnbereich
k < k u oder k > k o
k < ku '
k > ko '
zweiseitig
ku −1
ku :  P ( X = i ) ≤ α / 2 und
i =0
Testentscheidung im Beispiel:
k = 2 ist nicht im Ablehnbereich, die Nullhypothese p =1/6
kann nicht abgelehnt werden (Risiko α = 0.10).
Bin_Tests
Testgröße
n i
n −1
Schranken k bzw. ku, ko des Ablehnbereichs mit Testparameter p0 und P( X = i ) =   p0 (1 − p0 )
i 
jeweils so berechnen, dass die Wahrscheinlichkeit < α ist
Die Hinzunahme eines weiteren Werts zum Ablehnbereich
würde zur Überschreitung von α = 0.10 führen.
Prof. Dr. J. Schütze, FB GW
6
Exakter Test für Parameter p der Binomialverteilung (unbekannte Wahrscheinlichkeit))
7
n
ku
 P( X = i) > α / 2
und
ko :  P( X = i ) > α / 2 und
i = ko
i =0
n
 P( X = i ) ≤ α / 2
i = ko +1
einseitig
ku ' −1
ku ' :  P ( X = i ) ≤ α und
i =0
SS 2015
Bin_Tests
Prof. Dr. J. Schütze, FB GW
Statistische Tests für unbekannten Anteil
Zweiseitiger Ablehnbereich bei Risiko α = 0.10
k
In diese äußeren Bereiche fällt dann X
nur mit maximaler Wahrscheinlichkeit α,
wenn p = 1/6 ist.
Daher bilden sie den Ablehnbereich für
H0: p = 1/6 gegen H1: p ≠ 1/6
bei Irrtumswahrscheinlichkeit α
α/2
α/2
SS 2015
n
ku '
 P( X = i ) ≤ α
i =0
bzw.
ko ' :  P( X = i ) > α und
Prof. Dr. J. Schütze, FB GW
i = ko '
n

P( X = i) ≤ α
i = ko ' +1
Bin_Tests
8
Statistische Tests für unbekannten Anteil
Statistische Tests für unbekannte Anteile
Asymptotischer Test für Parameter p der Binomialverteilung (bei großen Stichproben)
Asymptotische Tests für Vergleich der Parameter von zwei Binomialverteilungen
(Vergleich unbekannter Anteile)
Einstichprobentest
Zweistichprobentest
Vergleich p mit p 0 (Referenzwert)
Nicht verbundene Stichproben
Nullhypothes e
H 0 : p = p0
Alt ernativhypothese
H 1 : p ≠ p0
H 0 : p ≥ p0
H 0 : p ≤ p0
H 1 : p < p0
H 1 : p > p0
Testgröße
T = ( k − np 0 ) / np 0 (1 − p 0 )
~ N(0, 1) (asymptotisch)
Ablehnbereich
T > z1− α / 2
Bezeichnungen
A
wird beobachtet in zwei unabhängigen Grundgesamtheiten G1 und G 2
T < − z1− α
T > z1− α
G1 : Stichprobenumfang n1 , k1 : Anzahl des Eintretens von A,
pˆ 1 = k1 / n1 Schätzung für P ( A ) = p1 in G1
Der Test basiert auf der Näherung der Binomial- durch die Normalverteilung,
daher sollte er nur angewandt werden, wenn eine der folgenden Faustregeln erfüllt ist
(analog zu Konfidenzintervall)
k > 50 und n - k > 50 bzw.
np(1-p) > 9.
 7.1
SS 2015
Bin_Tests
Prof. Dr. J. Schütze, FB GW
9
G 2 : Stichprobenumfan g n 2 , k 2 : Anzahl des Eintretens von A,
pˆ 2 = k 2 / n 2 Schätzung für P ( A ) = p 2 in G 2
SS 2015
Statistische Tests für unbekannte Anteile
Prof. Dr. J. Schütze, FB GW
Bin_Tests
10
Statistische Tests für unbekannte Anteile
Zweistichprobentest nach McNemar
Zweistichprobentest
Nicht verbundene Stichproben (asymptotischer Test)
Verbundene Stichproben (asymptotischer Test)
Nullhypothese
H0 : p1 = p2
Alternativhypothese
H1 : p1 ≠ p2
Testgröße
H0 : p1 ≥ p2
H1 : p1 < p2
H0 : p1 ≤ p2
H1 : p1 > p2
(1/ n1 + 1/ n2 ) pˆ (1 − pˆ ) T < −z
1−α
~ N(0, 1) asymptotisch
T > z1−α
mit pˆ =
T=
pˆ1 − pˆ 2
Untersuchung 2
Untersuchung 1
A eingetreten
A nicht eingetreten
A eingetreten
a
b
A nicht eingetreten
c
d
Ablehnbereich
T > z1−α / 2
Anteile (a+b)/n bzw. (a+c)/n schätzen die Erfolgswahrscheinlichkeiten bei Untersuchung 1 bzw. 2.
Ihre Differenz ist (a+b)/n - (a+c)/n = (b-c)/n
Nullhypothese:
k1 + k 2
n1 + n 2
Testgröße:
Der Test basiert auf der Näherung der Binomial- durch die Normalverteilung,
daher sollte er nur angewandt werden, wenn beide Stichprobenumfänge > 30 sind
und k und n - k > 50 bzw. npˆ (1 − pˆ ) > 9 gilt (Faustregeln).
SS 2015
Prof. Dr. J. Schütze, FB GW
Bin_Tests
a, b, c, d
entsprechende Häufigkeiten
11
Ablehnbereich:
Erfolgswahrscheinlichkeiten sind gleich
 (b − c ) 2
 b + c
T =
2
 ( b − c − 1)
 b + c
falls b + c ≥ 30
falls b + c < 30
2
T > χ1,1
−α
Sind die erwarteten Zellhäufigkeiten für die Zellen b, c kleiner als 5, ist dieser Test nicht anwendbar.
Man rechnet dann einen exakten Binomialtest auf p0 = ½ mit N = b + c, k = b
 7.2
SS 2015
Prof. Dr. J. Schütze, FB GW
Bin_Tests
12
 7.3
U –Test (Rangsummentest)
U -Test
U -Test (Wilcoxon-Rangsummentest) für nicht verbundene Stichproben
Berechnung der Testgröße für den U-Test
n x Stichprobenum fang von X , n y Stichprobenumfang von Y , n x + n y = n
Mittelwertvergleich ohne Voraussetzung der Normalverteilung
(Analogon zum doppelten T-Test)
Voraussetzung:
Beide Stichproben werden zusammengenommen und der Größe nach geordnet.
Dabei erhalten gleiche Stichprobenwerte jeweils den Durchschnittswert der ihnen
entsprechenden Rangzahlen (Rangbindungen).
Dann bildet man für jede Stichprobe die Summe der Rangzahlen,
n( n + 1)
man erhält die Rangsummen T1 , T2 .
Kontrolle: T1 + T2 =
2
n ( n + 1)
U1 = n x × n y + x x
- T1 ,
2
n y ( n y + 1)
U 2 = nx × n y +
- T2 ,
Kontrolle: U1 + U 2 = n x × n y
2
stetige Verteilungen,
wird aber auch bei ordinalem Skalenniveau verwendet
nicht verbundene Stichproben
Der Test setzt die Gleichheit der Form der Verteilungen voraus.
Es wird getestet, ob die Mediane beider Verteilungen übereinstimmen, d.h. die
Mittelwerte werden hier durch die Mediane geschätzt.
Nullhypothese:
μx = μ y
aus U = min(U1 ,U 2 ) berechnet man die Testgröße in Abhängigkeit
vom Stichprobenumfang.
SS 2016
Parameterfreie Tests
Prof. Dr. J. Schütze, FB GW
13
U -Test
SS 2016
Parameterfreie Tests
Prof. Dr. J. Schütze, FB GW
14
U -Test
U

nn

U− x y
Testgröße T = 
2
 n n ( n + n + 1)
x y
x
y


12
falls max( nx , n y ) < 20
Bsp. zum U-Test
X
falls nx ≥ 20, oder n y ≥ 20
Y
Werte
7
14
22
36
40
48
49
52
3
5
6
10
17
18
22
39
Ränge
4
6
9.5
11
13
14
15
16
1
2
3
5
7
8
9.5
12
Testentscheidung bei Risiko α
falls
max( nx , n y ) < 20
Ablehnbereich U ≤ U n ,n ,α / 2
x y
Nullhypothese H 0 : μ x = μ y
falls n x ≥ 20, oder n y ≥ 20
Ablehnbereich
n(n + 1)
2
16 ⋅ 17
136 =
2
n x = n y = 8, n = n x + n y = 16
T > z1−α / 2
Kontrolle: T1 + T2 =
T1 = 88.5
T2 = 47.5
(U nx , ny , α / 2 Quantil Tab. für U-Test)
Der U-Test kann auch für einseitige Hypothesen berechnet werden.
Bei vielen Rangbindungen ist eine Korrektur der Testgröße erforderlich. (vgl. Lit.)
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
15
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
16
U -Test
Vorzeichenrangtest
Bsp. zum U-Test (Fortsetzung)
Vorzeichenrangtest für verbundene Stichproben
Mittelwertvergleich ohne Voraussetzung der Normalverteilung
(Analogon zum t-Test für verbundene Stichproben)
T1 = 88.5, T2 = 47.5
n x ( n x + 1)
8⋅9
- T1 = 64 +
− 88.5 = 11.5,
2
2
n ( n + 1)
8⋅9
− T2 = 64 +
− 47.5 = 52.5
U 2 = nx × n y + y y
2
2
U1 = n x × n y +
Voraussetzung:
stetige Verteilungen,
wird aber auch bei ordinalem Skalenniveau verwendet
verbundene Stichproben
mindestens n = 6 Messwertpaare
U = min(U1 ,U 2 ) = 11.5
Nullhypothese:
Testgröße T = U =11.5, da max(nx,ny) = 8 < 20
Die Mittelwerte werden analog zum U -Test durch die Mediane geschätzt.
H0 : μx = μ y
Ablehnbereich bei Risiko α = 0.05: T ≤ U8,8 = 13,
somit wegen T = 11.5 ≤ 13 Ablehnung von H0
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
17
Vorzeichenrangtest
Parameterfreie Tests
Prof. Dr. J. Schütze, FB GW
18
Vorzeichenrangtest
Testgröße bei Vorzeichenrangtest
Berechnung der Testgröße
 Rn '

T =  Rn ' − n '( n '+ 1) / 4
 ( n '2 + n ')(2n '+ 1) / 24

Aus den n Wertepaaren ( xi , yi ) bildet man d i = xi − yi
Die Beträge dieser Differenzen werden aufsteigend mit Rangzahlen versehen,
dabei werden Nulldifferenzen weggelassen (es bleiben dann n' Paare übrig).
Bei betragsgleichen Differenzen vergibt man mittlere Rangzahlen.
Rn+' : Summe der Ränge bei d i > 0
falls n ' ≤ 25
falls n ' > 25
Ablehnbereich bei Risiko α
Rn−' : Summe der Ränge bei d i < 0
Rechenkontrolle: Rn+' + Rn−' = n '( n ' + 1) / 2
Rn ' = min( Rn+' , Rn−' )
SS 2016
SS 2016
falls n ' ≤ 25
falls
n ' > 25
Ablehnbereich T ≤ ku
Ablehnbereich T > z1−α / 2
ku Quantil aus Tab. für
Vorzeichenrangtest
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
19
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
20
Vorzeichenrangtest
Vorzeichenrangtest
Beispiel
Beispiel (Fortsetzung)
Zur Prüfung der Wirksamkeit eines Schlafmittels erhielten 15 Probanden in zufälliger
Reihenfolge und nach hinreichend langer Wash-Out-Pause das Schlafmittel bzw. ein Placebo.
Gemessen wurde jeweils die Schlafdauer.
R15+ = 22, R15− = 98
Placebo
6.0
6.0
9.0
5.3
7.3
7.0
7.1
4.2
4.4
7.9
6.0
5.8
9.5
6.9
4.2
Verum
6.2
7.1
8.9
7.1
9.6
6.1
6.9
5.7
4.0
8.9
5.5
6.6
10.2
7.8
5.0
Differenz
-
-
+
-
-
+
+
-
+
-
+
-
-
-
-
0.2
1.1
0.1
1.8
2.3
0.9
0.2
1.5
0.4
1.0
0.5
0.8
0.7
0.9
0.8
9.5
2.5
7.5
6
9.5
7.5
1
+ Ränge
- Ränge
2.5
12
14
15
4
13
wegen n' = 15 keine Approximation der Testgrößenverteilung durch NV
Ablehnbereich bei Risiko α = 0.05:
T ≤ 25 ( = W15,0.025) )
Testentscheidung
Wegen T = 22 ≤ 25 erfolgt eine Ablehnung der Nullhypothese,
eine Wirksamkeit des Schlafmittels kann mit 95%iger Sicherheit nachgewiesen
werden.
5
11
T = min( R15+ , R15− ) = 22
R15+ = 22, R15− = 98
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
21
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
22
χ² - Unabhängigkeitstest
Bemerkungen
χ ²-Unabhängigkeitstest
Bei ordinalen Daten erhält man schnell viele Rangbindungen.
Dann ist die Testgröße geeignet zu modifizieren (s. Sachs, Statistische Verfahren).
Ziel
Es wird getestet, ob zwei Zufallsgrößen unabhängig sind.
Die parameterfreien Mittelwertvergleiche beziehen sich auf die Mediane, daher
sollten die Mittelwerte hier stets durch die Mediane geschätzt werden.
Für diskrete, insbesondere nominale Zufallsgrößen basiert er direkt auf dem
Chi-Quadrat-Maß, das aus der Kontingenztafel berechnet wird.
Prinzipiell können die parameterfreien Tests auch einseitig gerechnet werden.
Dann darf man bei den Testgrößen keine Bildung des Minimums vornehmen.
Man vergleicht dann in Richtung der Alternativhypothese mit den Quantilen der
Ordnung 1-α.
Bei stetigen Zufallsgrößen ist dieser Test ebenfalls anwendbar.
Es erfolgt zunächst eine Klasseneinteilung für beide Stichproben.
Mit den dabei ermittelten Klassenhäufigkeiten erstellt man eine Kontingenztafel
und verfährt dann analog wie bei diskreten Merkmalen.
Als Alternative für Untersuchung der Abhängigkeit stetiger Zufallsgrößen stehen
Tests der Korrelationskoeffizienten auf Null zur Verfügung.
Bei Normalverteilung testet man mit der Pearson-Korrelation auf einen linearen,
sonst mit der Spearman-Korrelation auf einen monotonen Zusammenhang, s. z.B. Storm.
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
23
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
24
χ² - Unabhängigkeitstest
χ² - Unabhängigkeitstest
Kontingenztafel für 2 diskrete Merkmale
χ ²-Unabhängigkeitstest
Bezeichnungen
Nullhypothese:
X, Y unabhängig
Testgröße
χ²-Maß
X , Y Zufallsgrößen mit diskreten W ertebereichen x1 ,..., x p bzw. y1 ,..., y q
Stichprobe mit n Messwertpaaren ( xi , y j )
nij : Anzahl des Auftretens der Kombination ( xi , y j ) in der Stichprobe
y1
x1
...
n11

xp
np1
npq
np.
n.1
n.q
n
Erwartete Zellinhalte bei Unabhängigkeit
SS 2016
q
p
j =1
i =1
ni. =  nij , n. j =  nij
n1.
Gesamtzahl
q
p
n = n.. =  nij
Prof. Dr. J. Schütze, FB GW

( nij − nˆij ) 2
nˆij
H0
~ χ (2 p −1) ⋅ ( q −1),1− α
Ablehnbereich bei Risiko α
T > χ (2 p −1)⋅( q −1),1− α
Achtung:
Da die Testgröße nur näherungsweise χ ²-verteilt ist, sollte keine der erwarteten
j =1 i =1
nˆij =
q
i = 1 j =1
Randwerte:
yp
n1q
p
T =
ni . ⋅ n. j
Klassenhäufigkeiten 0 und höchstens 25% kleiner als 5 sein.
n
(sonst benachbarte Klassen zusammenlegen, wenn inhaltlich sinnvoll)
Parameterfreie Tests
25
χ² - Anpassungstest
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
26
 7.4
χ² - Anpassungstest
χ ²-Anpassungstest
χ ²-Anpassungstest bei diskreten Verteilungen
Problem
Die Zufallsgröße nehme k verschiedene Werte x1 ,...xk mit den Wahrscheinlichkeiten
p1 ,... pk an.
Entstammt eine beobachtete Zufallsgröße einer bestimmten Verteilung?
Das Verfahren ist zur Prüfung auf stetige und diskrete Verteilungen anwendbar.
Bei stetigen Verteilungen ist vorher eine Klasseneinteilung vorzunehmen.
In einer Stichprobe werden die absoluten Häufigkeiten des Auftretens von x1 ,...xk
bezeichnet mit Oi (observed), 1 ≤ i ≤ k .
Man berechnet durch Multiplikation der Wahrscheinlichkeiten p1 ,... pk
Besonderheit der Anpassungstests
Nullhypothese: es liegt NV vor
An dieser Hypothese möchte man festhalten, d.h. es ist keine Ablehnung erwünscht.
Allerdings 'beweist' eine Nichtablehnung der Nullhypothese nicht das Vorliegen
der vermuteten Verteilung, man hat dafür keine statistische Sicherheit.
mit dem Stichprobenumfang n die erwarteten Klassenhäufigkeiten Ei (expected).
k
(O − Ei ) 2
Testgröße T =  i
Ei
i =1
Die Testgröße ist unter der Nullhypothese näherungsweise χ²-verteilt, wobei
die Anzahl der Freiheitsgrade aus der Klassenanzahl k und der Anzahl p der
Eventuell geschätzten Parameter der Verteilung berechnet wird, FG = k - 1 - p
2
Ablehnbereich bei Risiko α: T > χ k −1− p ,1−α
 7.5
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
27
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
28
χ² - Anpassungstest
χ² - Anpassungstest
χ ²-Anpassungstest bei stetigen Verteilungen
Beispiel
Entstammen folgende Blutgerinnungszeiten von 30 Patienten (in s) einer NV?
Man nimmt eine Einteilung der Stichprobe in k Klassen vor, wobei die Randklassen
halboffen gewählt werden. Die Klassenhäufigkeiten seien Oi (observed), 1 ≤ i ≤ k .
Dann berechnet man unter NV die Wahrscheinlichkeiten dieser Klassen und erhält
nach Multiplikation mit dem Stichprobenumfang n die erwarteten Klassenhäufigkeiten
Ei (expected).
(Oi − Ei ) 2
Ei
i =1
k
Testgröße
T =
Die Testgröße ist unter der Nullhypothese näherungsweise χ²-verteilt, wobei
die Anzahl der Freiheitsgrade aus der Klassenanzahl k und der Anzahl p der
geschätzten Parameter der Verteilung berechnet wird, FG = k - 1 - p
29
χ² - Anpassungstest
22,70
24,00
24,40
25,80
25,90
26,00
26,40
26,60
26,60
26,80
27,00
27,70
27,80
28,00
28,00
28,10
28,70
28,70
28,80
29,00
29,00
29,00
30,00
30,10
30,10
31,80
32,00
33,00
33,70
35,00
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
30
Grafisches Verfahren: Histogramm
untere obere
Grenze Grenze
absolute
Häufigkeit
22
24
1
24
26
4
26
28
8
28
30
9
30
32
4
32
34
3
34
36
1
Histogramm
Dabei gehört die Untergrenze stets zur Klasse dazu, die Obergrenze nicht
(willkürliche Festlegung).
SS 2016
29,00
29,00
30,00
30,10
30,10
31,80
32,00
33,00
33,70
35,00
Kompromiss: Wahl von 7 Klassen der Breite 2, beginnend bei 22
Parameterfreie Tests
Prof. Dr. J. Schütze, FB GW
Blutgerinnungszeiten
27,00
27,70
27,80
28,00
28,00
28,10
28,70
28,70
28,80
29,00
Klassenanzahl (Faustregel) k = n : ergibt bei n = 30 etwa k = 5 oder k = 6
x − xmin
35.0 − 22,7
Alternative Faustregel mit Klassenbreite b ≈ max
=
≈2
1 + 3.32 log n 1 + 3.32 log 30
2
Ablehnbereich bei Risiko α: T > χ k −1− p ,1−α
SS 2016
22,70
24,00
24,40
25,80
25,90
26,00
26,40
26,60
26,60
26,80
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
Abweichung von NV
Testidee:
die Flächen der Balken werden mit
den entsprechenden Flächen unter
der Dichte verglichen.
31
SS 2016
Kann die Grafik nicht per Computer erstellt
werden, schätzt man aus der Stichprobe
die Parameter der NV. Das Maximum der
Kurve liegt bei μ, die Wendepunkte bei
μ ± σ.
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
32
Testverfahren: χ²-Test
Testverfahren: χ²-Test
Bsp. (Fortsetzung)
Bsp. (Fortsetzung)
Blutgerinnungszeiten, dabei Modifizierung der Randklassen als halboffen
Blutgerinnungszeiten, dabei Modifizierung der Randklassen
untere
Grenze
obere
Grenze
absolute
Häufigkeit
-∞
24
1
24
26
4
26
28
8
28
30
9
30
32
4
32
34
3
34
∞
1
Schätzung der Parameter der NV durch
Mittelwert und empirische Streuung
untereG obere
renze
Grenze
x = 28.36 für μ
s = 2.816 für σ
Berechnung der Klassenwahrscheinlichkeiten
als Intervallwktn. der NV mit diesen Parametern:
b−μ
 a −μ
P ( a < X < b) = φ 
 − φ

 σ 
 σ 
z.B.
24 − 28.36 
P ( −∞, 24) = Φ 
 − Φ ( −∞ ) = 0.0606
 2.816 
26 − 28.36 
 24 − 28.36  = 0.1399
P (24,26) = Φ 
 −Φ

 2.816 
 2.816 
SS 2016
Parameterfreie Tests
Prof. Dr. J. Schütze, FB GW
33
Testverfahren: χ²-Test
Wkt. der
Klassen
erwartete
Häufigkeit
-∞
24
0.0606
1.82
24
26
0.1399
4.20
26
28
0.2478
7.43
28
30
0.2707
8.12
30
32
0.1825
5.48
32
34
0.0757
2.27
34
∞
0.0228
0.68
Aus den Klassenwahrscheinlichkeiten
erhält man nach Multiplikation mit dem
Stichprobenumfang n = 30 die
erwarteten Klassenhäufigkeiten,
z.B. 0.0606·30 = 1.82
Der Test arbeitet unzuverlässig, wenn viele zu dünn besetzte Klassen mit
erwarteter Häufigkeit Ei < 5 auftreten (Faustregel: maximal 25%).
Daher legt man hier die ersten und die letzten beiden Klassen jeweils zusammen.
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
34
Testverfahren: χ²-Test
Bsp. (Fortsetzung)
Blutgerinnungszeiten, jeweils zusammengelegte Randklassen
Klasse
i
beob. Häuf.
Oi
erwart. Häuf. (Oi - Ei)²/Ei
Ei
1+4 = 5
6.02
0.1728
3
8
7.43
0.0427
4
9
8.12
0.0954
5
4
5.48
0.3997
3+1 = 4
2.95
0.3737
1/2
6/7
S
30
Ablehnung der NV bei
30
1.0853
T > χ 2 k − p −1,1−α
Achtung
Berechnung der Testgröße
T = Σ (Oi - Ei)²/Ei
Freiheitsgrade:
Bei k = 5 Klassen und
p = 2 geschätzten
Parametern ergibt sich
FG = k - 1 - p = 2.
Damit ist der Schwellwert
für den Test bei Risiko
2
α = 0.05 gleich χ 2,0.95 = 5.991
Die Testgröße ist unter der Nullhypothese nur näherungsweise χ²-verteilt,
und zwar mit k -1 - p Freiheitsgraden bei p geschätzten Parametern.
Bei Test auf NV werden oft die beiden Parameter μ, σ² geschätzt, daher hat
man bei k Klassen k - 3 Freiheitsgrade.
Man braucht also mindestens 4 Klassen, die eine erwartete Besetzung Ei ≥ 5
haben sollten (mindestens in 75% der Klassen).
Für zu kleine Stichproben funktioniert der Test also nicht.
Besser ist dann der Kolmogorov-Smirnov-Test, bei geschätzten Parametern mit
Korrektur nach Lilliefors.
Entscheidung:
wegen T = 1.0853 < 5.991 wird die Normalverteilungsannahme nicht verworfen.
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
 7.6
35
SS 2016
Prof. Dr. J. Schütze, FB GW
Parameterfreie Tests
36
Zugehörige Unterlagen
Herunterladen