Kapitel 10: Testtheorie

Werbung
Kapitel 10:
Testtheorie
Kapitel 10: Testtheorie
Statistische Tests
• In vielen praktischen Situationen sind keine Schätzwerte
gefragt, sondern es müssen
JA-NEIN-Entscheidungen
getroffen werden, z.B. über Medikamentenzulassung.
• Solche Entscheidungsverfahren können mit Hilfe statistischer
Tests durchgeführt werden. (Test oder Signifikanztest)
• Es handelt sich dabei um “Entscheidungen unter
Unsicherheit”, bei denen Fehler nicht ausgeschlossen werden
können. Die Wahrscheinlichkeit für das Auftreten solcher
Fehler soll dabei aber klein gehalten werden.
• Ziele: Experimente kompetent auswerten, Hypothesen
statistisch absichern.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
295
Kapitel 10: Testtheorie
Tests bei binomialverteilten Beobachtungen
Zur Motivation betrachten wir folgendes Beispiel:
Beispiel 10.1 (Nebenwirkung eines Medikaments): Bei 60
Patienten wird nach Einnahme eines bestimmten Medikaments in
k = 12 Fällen eine Nebenwirkung festgestellt. Toleriert werden
kann das Auftreten einer Nebenwirkung mit einer Wahrscheinlichkeit p ≤ 0.1.
Frage: Ist das Ergebnis k = 12
– durch zufällige Schwankungen einer B60,p -Verteilung mit
p ≤ 0.1 oder
– durch eine systematische Abweichung p > 0.1 des
unbekannten Parameters p
hervorgerufen worden oder erklärbar?
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
296
Kapitel 10: Testtheorie
Tests bei binomialverteilten Beobachtungen
Binomialmodell:
1 Nebenwirkung beim i-ten Patienten
Xi =
0 keine Nebenwirkung beim i-ten Patienten
X =
60
X
Xi
Anzahl Patienten mit Nebenwirkungen
i=1
PX = B60,p = Pp
mit
p ∈ (0, 1) unbekannt
Setze p0 = 0.1
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
297
Kapitel 10: Testtheorie
Tests bei binomialverteilten Beobachtungen
Ziel: Eine Verbraucherorganisation möchte aufgrund der Datenlage
z.B. vor Gericht mit großer Sicherheit“ behaupten können, dass
”
der Grenzwert p0 überschritten wird. Man möchte “absichern” , ob
p > p0 gilt.(Eine zufällig entstandene zu große Anzahl von
Nebenwirkungen soll also mit großer Wahrscheinlichkeit
ausgeschlossen werden).
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
298
Kapitel 10: Testtheorie
Testen von Hypothesen
• Dazu betrachtet man die Gegenhypothese
H1 : p > p 0
(auch Alternative oder Alternativhypothese genannt) und
testet hierzu die Nullhypothese
H0 : p ≤ p0 .
• Intuitive Entscheidungsvorschrift:
Falls X > c (kritischer Wert c) ist,
entscheidet man sich für H1 (oder genauer gegen H0 , H0
wird verworfen)
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
299
Kapitel 10: Testtheorie
Testentscheidung
Fragen: Wie muss c gewählt werden?
• Zur Beantwortung lege folgende Priorität fest:
Begrenze Fehlentscheidungen zugunsten von H1 ,
falls p ∈ H0 vorliegt.
d.h. die Verbraucherorganisation muss sichere Daten“
”
vorliegen haben, bevor vor Gericht behauptet wird, der
Grenzwert p0 wird nicht eingehalten“.
”
• Somit soll die Wahrscheinlichkeit einer Fehlentscheidung
zugunsten von H1 , also einer fälschlichen Ablehnung von H0 ,
kontrolliert klein gehalten werden. Hier:
Pp (X > c) ≤ α für p ≤ p0
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
300
Kapitel 10: Testtheorie
Testentscheidung
• Dabei ist α ∈ (0, 1) ein vorgegebenes Sicherheitsrisiko, das
man bereit ist zu tragen. Man nennt α das (Signikanz-)
Niveau des Tests.
• Üblicherweise wählt man α = 0.05 oder α = 0.01, so dass die
Wahrscheinlichkeit, die H0 fälschlicherweise abzulehnen,
kleiner als 0.05 bzw. 0.01 ist.
• Damit das Verfahren leistungsfähig ist, wählt man für den
kritischen Wert c den kleinsten Wert, für den
Pp (X > c) ≤ α für p ≤ p0
gilt. Es kann gezeigt werden, dass hier bei
Binomialverteilungen die Bedingung nur für p = p0
nachzuweisen ist.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
301
Kapitel 10: Testtheorie
Durchführung eines Tests
Beispiel 10.1 (Fortsetzung): Für α = 0.05 und p0 = 0.1 gilt:
60
X
60 k
P(X > c) =
p (1 − p0 )60−k
Auszug aus einer Tabelle der
k B(n, 0p)-Verteilung
n
P
k=c + 1
n i
n−i )
( Angegeben sind jeweils
die Werte von
|{z}
i p (1 − p)
r
i=r
n
r
p = 0.09
p = 0.10
p = 0.11
p = 0.12
p = 1/8
p = 0.13
p = 0.14
p = 0.15
p = 0.16
p = 1/6
60
0
1
2
3
4
1.00000
0.99651
0.97582
0.91544
0.80000
1.00000
0.99820
0.98622
0.94695
0.86260
1.00000
0.99908
0.99226
0.96741
0.90802
1.00000
0.99953
0.99572
0.98036
0.93987
1.00000
0.99967
0.99683
0.98485
0.95178
1.00000
0.99976
0.99766
0.98837
0.96153
1.00000
0.99988
0.99874
0.99323
0.97588
1.00000
0.99994
0.99933
0.99612
0.98517
1.00000
0.99997
0.99964
0.99781
0.99104
1.00000
0.99998
0.99977
0.99851
0.99365
5
6
7
8
9
0.63730
0.45708
0.29370
0.16904
0.08737
0.72904
0.56283
0.39355
0.24845
0.14164
0.80343
0.65864
0.49461
0.33821
0.21014
0.86119
0.74103
0.59083
0.43282
0.29008
0.88445
0.77673
0.63567
0.48021
0.33308
0.90439
0.80876
0.67778
0.52679
0.37732
0.93566
0.86231
0.75286
0.61542
0.46718
0.95763
0.90320
0.81516
0.69530
0.55518
0.97266
0.93346
0.86502
0.76445
0.63754
0.97981
0.94879
0.89193
0.80420
0.68795
10
11
12
13
14
0.04069
0.01715
0.00657
0.00229
0.00073
0.07307
0.03421
0.01458
0.00568
0.00203
0.11869
0.06105
0.02866
0.01232
0.00486
0.17762
0.09940
0.05092
0.02393
0.01034
0.21163
0.12315
0.06570
0.03219
0.01451
0.24828
0.14993
0.08314
0.04239
0.01990
0.32776
0.21200
0.12635
0.06941
0.03519
0.41230
0.28371
0.18057
0.10625
0.05782
0.49788
0.36220
0.24474
0.15337
0.08912
0.55363
0.41661
0.29206
0.19033
0.11522
15
16
0.00022
0.00006
0.00067
0.00020
0.00176
0.00059
0.00411
0.00151
0.00603
0.00232
0.00862
0.00345
0.01649
0.00715
0.00287
0.02913
0.01360
0.00589
0.04803
0.02403
0.01117
0.06478
0.03385
0.01645
PD Dr. M. Pauly17, Mathematik
für Pharmazeuten,
WS 2013/2014
0.00001
0.00006
0.00018
0.00051
0.00082 0.00128
302
Kapitel 10: Testtheorie
Durchführung eines Tests
• Aus der Tabelle für die B60,0.1 -Verteilung folgt für c = r − 1:
...
...
c =9
0.07307
c = 10
0.03421
...
...
• Somit ist c = 10 die kleinste natürliche Zahl, so dass
P(X > c) ≤ α = 0.05
eingehalten wird.
• Da X = 12 Patienten Nebenwirkungen zeigen, lehnen wir die
Nullhypothese H0 : p ≤ 0.1 zum Niveau α = 0.05 ab (die
Entscheidung wird also zugunsten der H1 getroffen).
• D.h. wir gehen davon aus, dass eine systematische
Abweichung von H0 vorliegt.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
303
Kapitel 10: Testtheorie
Testvorschrift
Definition 10.1 (Test): Ein Test ist eine Entscheidungsvorschrift
d, die in Abhängigkeit von Daten x1 , . . . , xn für H1 oder H0
getroffen wird:
dH0 : Entscheidung zugunsten von H0
dH1 : Entscheidung zugunsten von H1
P
Beispiel 10.1 (Fortsetzung): In unserem Beispiel ist k = 60
i=1 xi
die Anzahl der Patienten mit Nebenwirkung. Somit ist hier die
Entscheidungsvorschrift:
P
dH1 falls 60
i=1 xi > c = 10
d(x1 , . . . , x60 ) =
P60
dH0 falls i=1 xi ≤ c = 10
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
304
Kapitel 10: Testtheorie
Fehler 1. und 2. Art
Definition 10.2 (Fehler 1. und 2. Art): Bei jeder Entscheidung
können folgende Fehler auftreten:
(a) Fehler 1. Art: Entscheidung dH1 für H1 , obwohl H0 vorliegt.
(b) Fehler 2. Art: Entscheidung dH0 für H0 , obwohl H1 vorliegt.
```
```
``` Entscheidung
```
realer Sachverhalt
``
`
dH0
dH1
H0
Richtig
Fehler 1. Art
H1
Fehler 2. Art
Richtig
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
305
Kapitel 10: Testtheorie
Fehler 1. und 2. Art
• Konvention: Das Testproblem H0 gegen H1 wird so
formuliert, dass ein Fehler 1. Art schwerer wiegt. Diesen
kontrollieren wir durch die Angabe einer Irrtumswahrscheinlichkeit α ∈ (0, 1). In diesem Fall heißt d ein Test
zum Niveau α. Also
P(d = dH1 ) ≤ α,
falls H0 vorliegt.
Die Hypothese, die statistisch abgesichert werden soll, muss
als H1 gewählt werden.
• Besonderheit beim Binomialtest: Das Niveau α wird im
Allgmeinen nicht voll ausgeschöpft. Man nennt
α0 = Bn,p0 (d = dH1 )
die effektive Irrtumswahrscheinlichkeit.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
306
Kapitel 10: Testtheorie
Testprobleme beim Binomialtest
Gegeben sind n unabhängige B1,p -verteilte ZV X1 , . . . , Xn mit
unbekanntem Parameter p ∈ (0, 1). Ferner sei p0 ∈ (0, 1) und α ∈ (0, 1)
vorgegeben. Seien die Werte x1 , . . . , xn Realisierungen der ZV X1 , . . . , Xn .
Dann gibt es drei Testprobleme:
1. Möchte man überprüfen (und jeweils absichern), ob p größer als p0
ist, so testet man
H0 : p ≤ p0
gegen
H 1 : p > p0 .
2. Möchte man überprüfen, ob p kleiner als p0 ist, so testet man
H0 : p ≥ p0
gegen
H 1 : p < p0 .
3. Möchte man testen, ob p und p0 ungleich sind, so testet man
H0 : p = p0
gegen
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
H1 : p 6= p0 .
307
Kapitel 10: Testtheorie
Binomialtests für den Erwartungswert binomialverteilter Zufallsvariab
Testprobleme beim Binomialtest
Situation: Gegeben sind unabhängige B(1, p)-verteilte ZV X1 , . . . , Xn mit unbekanntem Parame
]0, 1[. Ferner sei p0 ∈]0, 1[ und α ∈]0, 1[ vorgegeben. Die Werte x1 , . . . , xn seien Realisierungen
X1 , . . . , Xn .
1. Testproblem: H0 : p ≤ p0 gegen H1 : p > p0 .
Testverfahren: Einseitiger (oberer) Binomialtest zum Niveau α:
d(x1 , . . . , xn ) :=

 dH1

falls
dH0
Pn
i=1
>c
xi
≤c
Die Konstante c ist dabei so zu wählen, dass gilt:
α0 :=
µ ¶
n
n µ ¶
X
X
n k
n k
p0 (1 − p0 )n−k ≤ α und
p (1 − p0 )n−k > α
k
k 0
k=c+1
k=c
2. Testproblem: H0 : p ≥ p0 gegen H1 : p < p0 .
Testverfahren:
Binomialtest zum Niveau α:
Dabei
ist α0 dieEinseitiger
effektive (unterer)
Irrtumswahrscheinlichkeit.

 dH1
d(x1 , .WS
. . ,2013/2014
xn ) :=
PD Dr. M. Pauly , Mathematik für Pharmazeuten,
falls
Pn
i=1
<c
xi
308
Die Konstante c ist dabei soKapitel
zu wählen,
dass gilt:
10: Testtheorie
µ ¶
n
n µ ¶
X
X
n k beim
n k
Testprobleme
Binomialtest
α0 :=
p0 (1 − p0 )n−k ≤ α und
p0 (1 − p0 )n−k > α
k=c+1
k
k=c
k
2. Testproblem: H0 : p ≥ p0 gegen H1 : p < p0 .
Testverfahren: Einseitiger (unterer) Binomialtest zum Niveau α:
d(x1 , . . . , xn ) :=

 dH1

falls
dH0
Pn
<c
i=1
xi
≥c
Die Konstante c ist dabei so zu wählen, dass gilt:
α0 :=
c−1 µ ¶
c µ ¶
X
X
n k
n k
p0 (1 − p0 )n−k ≤ α und
p (1 − p0 )n−k > α
k
k 0
k=0
k=0
3. Testproblem: H0 : p = p0 gegen H1 : p 6= p0 .
Testverfahren: Zweiseitiger α/2 − α/2-Binomialtest zum Niveau α :
Dabei ist α0 die effektive Irrtumswahrscheinlichkeit.
d(x1 , . . . , xn ) :=
½
dH1
dH0
falls
sonst
Pn
i=1
xi
< c1 oder > c2
Die Konstanten c1 und c2 sind dabei so zu wählen, dass gilt:
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
309
α0 :=
Kapitel 10: Testtheorie
c−1 µ ¶
c µ ¶
X
X
n k
n k
p0 (1 − p0 )n−k ≤ α und
p (1 − p0 )n−k > α
k
k 0
k=0
k=0
Testprobleme
beim Binomialtest
3. Testproblem: H0 : p = p0 gegen H1 : p 6= p0 .
Testverfahren: Zweiseitiger α/2 − α/2-Binomialtest zum Niveau α :
d(x1 , . . . , xn ) :=
½
dH1
dH0
falls
sonst
Pn
i=1
xi
< c1 oder > c2
Die Konstanten c1 und c2 sind dabei so zu wählen, dass gilt:
cX
1 −1 µ
¶
c1 µ ¶
X
n k
n k
p0 (1 − p0 )n−k ≤ α/2 und
p (1 − p0 )n−k > α/2
k
k 0
k=0
k=0
µ ¶
n
n µ ¶
X
X
n k
n k
n−k
p0 (1 − p0 )
≤ α/2 und
p (1 − p0 )n−k > α/2
k
k 0
k=c2 +1
k=c2
Hierbei setzt man
α0 :=
cX
1 −1 µ
k=0
¶
µ ¶
n
X
n k
n k
p0 (1 − p0 )n−k +
p (1 − p0 )n−k .
k
k 0
k=c2 +1
α0 heisst in allen 3 Fällen die effektive Irrtumswahrscheinlichkeit.
Hinweis: Im zweiseitigen Fall werden zwei einseitige Tests zum Niveau α/2 durchgeführt.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
310
Kapitel 10: Testtheorie
Durchführung eines Binomialtests
(Zusammenfassung)
Beispiel 10.1 (Fortsetzung): Formalisierung von Beispiel 10.1:
• n = 60 Patienten
• p0 = 0.1 (Toleranzgrenze für die Nebenwirkung)
• Testproblem:
H0 : p ≤ p0
gegen
H1 : p > p0
• (Signifikanz-)Niveau: α = 0.05
• Entscheidungsregel:
P60
dH1 , falls
i=1 xi > c
d(x1 , . . . , x60 ) =
P60
dH0 , falls
i=1 xi ≤ c
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
311
Kapitel 10: Testtheorie
Durchführung eines Binomialtests
• Bestimmung des kritischen Werts: Bestimme kleinstes c mit
!
60
60 X
X
60 k
P
Xi > c =
p0 (1 − p0 )60−k ≤ 0.05
k
i=1
k=c+1
• Aus der Binomialtabelle für B60,0.1 ermittelt: c = 10
• Effektive Irrtumswahrscheinlichkeit:
k 60−k
60 X
60
1
1
α0 =
1−
= 0.03421
k
10
10
k=11
• Beobachtung: X = 12 Patienten mit Nebenwirkung
• Entscheidung: Zum Niveau α = 5% haben wir signifikant
nachgewiesen, dass die Toleranzgrenze überschritten wurde. Die
(Null-)Hypothese, dass die beobachteten Nebenwirkungen noch
tolerabel sind, muss verworfen werden.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
312
Kapitel 10: Testtheorie
Vorgehen bei Testproblem
Motivation des unteren Binomialtests:
• Bei der Zulassung von Medikamenten muss ein
Pharma-Unternehmen nachweisen, dass der Grenzwert p < p0
eingehalten wird.
• Daher muss zur Absicherung das umgekehrte Testproblem
H0 : p ≥ p 0
gegen
H1 : p < p0
betrachtet werden.
• Die Alternative H1 wird damit statistisch abgesichert, da wir
nur den Fehler 1. Art kontrollieren.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
313
Kapitel 10: Testtheorie
Praktische Anweisungen zur Testtheorie
1. Aufstellen des wahrscheinlichkeitstheoretischen Modells für ein
Zufallsexperiment, in dem ein oder mehrere unbekannte Parameter
auftreten.
2. Formulierung der Nullhypothese H0 und der Gegenhypothese/
Alternative H1 (über die unbekannten Parameter) sowie Festlegung
eines Signifikanzniveaus α mit dem Ziel der “Absicherung” der
Alternative H1 zum Niveau α, siehe auch 5.
3. Festlegung des Entscheidungsverfahrens, d.h. des Tests, für das
Testproblem (mit dem Ziel, dass die Fehlerwahrscheinlichkeit 1. Art
≤ α ist und die Fehlerwahrscheinlichkeit 2. Art klein wird).
4. Durchführung des Zufallsexperiments und der Entscheidungsfindung
gemäß Punkt 3 mit den ermittelten Daten.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
314
Kapitel 10: Testtheorie
Praktische Anweisungen zur Testtheorie
5. Interpretation:
• Gelangt man zur Entscheidung für H1 , so hat man H1
signifikant zum Niveau α nachgewiesen. Man sagt auch:
“Die Hypothese H0 wird verworfen.”
• Eine Entscheidung für H0 liefert hingegen kein brauchbares
Ergebnis. Man kann höchstens sagen:
“H0 kann zum Niveau α nicht verworfen werden.”
Damit ist H0 aber keinesfalls abgesichert.
6. Zu beachten ist, dass die Ergebnisse eines Zufallsexperiments nur
für ein Testproblem und nicht für eine Folge von mehreren Testproblemen verwendet werden dürfen, da sich sonst die Irrtumswahrscheinlichkeiten addieren und man das Niveau α nicht einhält.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
315
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
Liegt keine Tabelle für Bn,p0 vor, so lässt sich aufgrund des
Zentralen Grenzwertsatzes für großes n der kritische Wert mithilfe
einer Normalapproximation berechnen:
Satz 10.1 (Normalapproximation): Für den Binomialtest
H0 : p ≤ p0
gegen
H1 : p > p0
gilt unter der Voraussetzung
n · p0 · (1 − p0 ) ≥ 9
(Faustregel für die Normalapproximation)
für den kritischen Wert c, dass
p
c ≈ n · p0 + n · p0 · (1 − p0 ) · u1−α ,
wobei u1−α das 100 · (1 − α)%-Quantil der N (0, 1)-Verteilung ist,
d.h. φ(u1−α ) = 1 − α.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
316
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
P
Begründung: Sei X = ni=1 Xi Bn,p0 -verteilt. Nach dem Zentralen
Grenzwertsatz gilt
p
P X > n · p0 + n · p0 · (1 − p0 ) · u1−α
p
= P X − n · p0 > n · p0 · (1 − p0 ) · u1−α
=P
X − n · p0
p
> u1−α
n · p0 · (1 − p0 )
!
≈ 1 − φ(u1−α )
= 1 − (1 − α) = α
Für kleine Werte von n kann die Normalanpassung durch die
Stetigkeitskorrektur verbessert werden.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
317
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
Ähnlich kann auch bei den beiden anderen Testproblemen eine Normalapproximation vorgenommen werden: Ersetze in Satz 10.1 u1−α durch
• −u1−α , falls der untere Test H0 : p ≥ p0 vs. H1 : p < p0 ,
• ±u1−α/2 , falls der zweiseitige Test H0 : p = p0 vs. H1 : p 6= p0
0.2
α
2
0.0
0.1
f(x)
0.3
0.4
betrachtet wird.
−4
α
2
− u1−α2
0
x
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
u1−α2
4
318
Kapitel 10: Testtheorie
Quantile der Standardnormalverteilung
Der (ungefähre) Wert des 100 · (1 − α)%-Quantils u1−α = Φ−1 (1 − α)
kann aus derselben Tabelle abgelesen werden wie die Werte von Φ(u).
Diesen Wert erhält man, indem man innerhalb der Tabelle nach dem
Wert sucht, der 1 − α am nächsten kommt. Die dazugehörigen
Randwerte geben dann den (ungefähren) Wert von u1−α an.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
319
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
Beispiel 10.2 (Simulation des 2-fachen Würfelns): In mehreren Vorlesungen
wurden Studenten gebeten, dass zweifache Werfen eines Würfels zu simulieren,
indem sie jeweils Paare von Zahlen zwischen 1 und 6 aufschreiben sollten. Die
folgende Grafik zeigt die Differenzen der Zahlenpaare in diesem Experiment.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
320
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
• Eine Differenz von 0 bedeutet ein Pasch, d.h. eine identische
Augenzahl bei beiden Würfen.
• Es gibt nun sechs Möglichkeiten für einen Pasch und
insgesamt 36 mögliche Paare von Augenzahlen, so dass die
Wahrscheinlichkeit für eine Differenz von 0 eigentlich
6/36 = 1/6 ist.
• Im Vorfeld trat (aus Erfahrung) die Vermutung auf, dass bei
den Studierenden das Ereignis Pasch“, d.h. die Differenz 0,
”
zu selten auftritt.
• Dies wollen wir nun überprüfen.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
321
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
• Hinweis: Die Hypothesen müssen vor Gewinnung der Daten
festgelegt werden. Wird aus der Darstellung der Daten eine
Hypothese generiert, so muss das Experiment wiederholt
werden und der Test wird dann mit neuen Daten ausgeführt.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
322
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
• Testproblem:
1
1
gegen H1 : p < p0 =
6
6
• Wir nehmen an, dass die n = 1628 Augenpaare unabhängig
voneinander aufgeschrieben wurden.
H0 : p ≥ p 0 =
• Falls X die Anzahl der Päsche ist, ist X B1628, 1 -verteilt unter
6
der Annahme, dass die Wahrscheinlichkeit für einen Pasch
ist.
1
6
• Festlegung des Signifikanzniveaus: α = 0.01.
• Testentscheidung:
d(x1 , . . . , x1628 ) =
dH1 .
falls x =
dH0 ,
falls x =
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
P1628
i=1
xi < c
i=1
xi ≥ c
P1628
323
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
Mit der Normalapproximation für den unteren Binomialtest folgt, dass
p
c ≈ n · p0 − n · p0 · (1 − p0 ) · u1−α
| {z }
u0.99
= 1628 ·
1
−
6
r
1628 ·
1 5
· · 2.3263
| {z } ≈ 236.35
6 6
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
aus Tabelle
324
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
Der untere Binomialtest verwirft die Hypothese H0 : p ≥ 16 , da im
Beispiel 10.2 nur 154 mal ein Pasch“ auftritt, 154 < 236.
”
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
325
Kapitel 10: Testtheorie
Normalapproximation beim Binomialtest
Der untere Binomialtest verwirft die Hypothese H0 : p ≥ 16 , da im
Beispiel 10.2 nur 154 mal ein Pasch“ auftritt, 154 < 236.
”
Pn
Sei X = i=1 Xi die Summe aus n unabhängigen B1,p0 -verteilten ZVs
X1 , . . . , Xn mit Erwartungswert E (Xi ) = µ und Varianz Var (Xi ) = σ2 .
P
n = 1 n Xi ist dann die zugehörige standardisierte
Mit X
i=1
n
Summenvariable darstellbar als
Pn
1
Xi − p0
n
n
p
= √ · p i=1
n
n · p0 · (1 − p0 )
p0 · (1 − p0 )
X − n · p0
=
√
n·
n − µ
X
.
σ
Dies führt uns direkt zum Gaußtest für den Erwartungswert
normalverteilter Zufallsvariablen.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
325
Kapitel 10: Testtheorie
Gaußtest
Definition
10.3 (Gaußtest): Gegeben seien n unabhängige
N µ, σ20 -verteilte ZVs X1 , . . . , Xn mit unbekanntem Parameter µ ∈ R
und bekannter Varianz σ20 > 0. Ferner seien µ0 ∈ R und das
Signifikanzniveau α ∈ (0, 1) vorgegeben. Seien x1 , . . . , xn die
P
n = 1 n Xi . Dann wird der
Realisierungen der ZVs X1 , . . . , Xn und X
i=1
n
Test für den unbekannten Erwartungswert µ basierend auf der
Teststatistik
n − µ0
√ X
Z = n·
,
σ0
die unter N(µ0 , σ20 ) standardnormalverteilt ist, Gaußtest genannt. Die
Testentscheidung trifft man dabei basierend auf dem beobachteten Wert
z=
√
n·
xn − µ0
σ0
von Z und dem 100 · (1 − α)%-Quantil u1−α der N (0, 1)- Verteilung.
Hinweis: xn ist der Schätzwert für den Erwartungswert µ. Darauf wird ein
Test aufgebaut.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
326
Kapitel 10: Testtheorie
Gaußtest
Analog zum Binomialtest betrachtet man beim Gaußtest auch drei
unterschiedliche Testprobleme: (z wie oben)
1. Testproblem: H0 : µ ≤ µ0 gegen H1 : µ > µ0
Testverfahren: Einseitiger (oberer) Gaußtest zum Niveau α:
d x1 , . . . , xn =
dH1 ,
dH0 ,
falls z > u1−α
falls z ≤ u1−α
2. Testproblem: H0 : µ ≥ µ0 gegen H1 : µ < µ0
Testverfahren: Einseitiger (unterer) Gaußtest zum Niveau α:
d x1 , . . . , xn =
dH1 ,
dH0 ,
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
falls z < −u1−α
falls z ≥ −u1−α
327
Kapitel 10: Testtheorie
Gaußtest
3. Testproblem: H0 : µ = µ0 gegen H1 : µ 6= µ0
Testverfahren: Zweiseitiger Gaußtest zum Niveau α:
falls z > u1−α/2
dH1 ,
d x1 , . . . , xn =
falls z ≤ u1−α/2
dH ,
0
Begründung: Da Z unter N(µ0 , σ20 ) standardnormal ist, ist jeder
Test ein Test mit dem Fehlerniveau α 1.Art.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
328
Kapitel 10: Testtheorie
Gaußtest
3. Testproblem: H0 : µ = µ0 gegen H1 : µ 6= µ0
Testverfahren: Zweiseitiger Gaußtest zum Niveau α:
falls z > u1−α/2
dH1 ,
d x1 , . . . , xn =
falls z ≤ u1−α/2
dH ,
0
Begründung: Da Z unter N(µ0 , σ20 ) standardnormal ist, ist jeder
Test ein Test mit dem Fehlerniveau α 1.Art.
Problem: Im Gaußtest wird vorausgesetzt, dass die Varianz σ2
bekannt ist. In einer realen Situation ist dies aber häufig nicht der
Fall.
Lösung: Ersetze σ2 durch die Schätzung
n
1 X
n 2 .
Sn2 =
Xi − X
n−1
i=1
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
328
Kapitel 10: Testtheorie
t-Test
Definition 10.4 (t-Test): Gegeben seien n ≥ 2 unabhängige
N µ, σ2 -verteilte ZVs X1 , . . . , Xn mit unbekannten Parametern
µ ∈ R und σ2 > 0. Ferner seien µ0 ∈ R und α ∈ (0, 1) vorgegeben.
Die Werte x1 , . . . , xn seien Realisierungen der ZVs X1 , . . . , Xn und
X
n = 1
X
Xi
n
n
1 X
n 2 .
Xi − X
n−1
n
sowie
Sn2 =
i=1
i=1
Dann wird der Test für den unbekannten Erwartungswert µ
basierend auf der Teststatistik
n − µ0
X
Sn
t-Test genannt. Unter der Annahme, dass µ = µ0 , folgt T einer
(Studentischen) t-Verteilung mit n − 1 Freiheitsgraden (man
schreibt auch tn−1 -Verteilung).
T =
√
n·
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
329
Kapitel 10: Testtheorie
t-Test
N(0,1)
t1
t5
t10
t20
0.2
0.0
0.1
Dichte
0.3
0.4
Pn
1
Sind nicht alle Werte xi gleich, so ist sn2 = n−1
n − xi )2 positiv.
i=1 (x
Die Testentscheidung trifft man somit basierend auf dem beobachteten
Wert
√ xn − µ0
t = n·
sn
der Teststatistik T und dem 100 · (1 − α)%-Quantil tn−1,1−α der
tn−1 -Verteilung.
−4
−2
0
2
4
u
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
330
Kapitel 10: Testtheorie
t-Test
Die tn−1 -Verteilung ist eine spezielle Verteilung deren
Verteilungsfunktion bzw. Quantile vertafelt oder in einem
Statistikprogramm enthalten sind.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
331
Kapitel 10: Testtheorie
t-Test
Analog zum Binomial- und Gaußtest betrachtet man beim t-Test
auch drei unterschiedliche Testprobleme:
1. Testproblem: H0 : µ ≤ µ0 gegen H1 : µ > µ0
Testverfahren: Einseitiger (oberer) t-Test zum Niveau α:
d x1 , . . . , xn =
dH1 ,
dH0 ,
falls t > tn−1,1−α
falls t ≤ tn−1,1−α
2. Testproblem: H0 : µ ≥ µ0 gegen H1 : µ < µ0
Testverfahren: Einseitiger (unterer) t-Test zum Niveau α:
d x1 , . . . , xn =
dH1 ,
dH0 ,
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
falls t < −tn−1,1−α
falls t ≥ −tn−1,1−α
332
Kapitel 10: Testtheorie
t-Test
3. Testproblem: H0 : µ = µ0 gegen
Testverfahren: Zweiseitiger t-Test
dH1 ,
d x1 , . . . , xn =
dH0 ,
H1 : µ 6= µ0
zum Niveau α:
falls t > tn−1,1−α/2
falls t ≤ tn−1,1−α/2
Auch die Tabelle:
100 · (1t −
α)%-Quantile
der tq -Verteilung sind tabelliert.
-Verteilung
(Student Verteilung)
(q)
q
α = 0.1
α = 0.05
1
3.078
2
1.886
3
1.638
4
1.533
5
1.476
6
1.440
7
1.415
8
1.397
9
1.383
10
1.372
11
1.363
12
1.356
13
1.350
14
1.345
15
1.341
16
1.337
PD Dr. M. Pauly , Mathematik für Pharmazeuten,
α = 0.025
α = 0.01
α = 0.005
6.314
12.706
2.920
4.303
2.353
3.182
2.132
2.776
2.015
2.571
1.943
2.447
1.895
2.365
1.860
2.306
1.833
2.262
1.812
2.228
1.796
2.201
1.782
2.179
1.771
2.160
1.761
2.145
1.753
2.131
1.7462013/2014
2.120
WS
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
333
Kapitel 10: Testtheorie
t-Test
Beispiel 10.3 (Arzeiwirkstoff): Bei 9 Messungen der
Wirkstoffmenge in einer Arznei haben sich folgende Werte (in mg)
ergeben:
2.9
3.1
2.2
3.8
2.7
2.3
2.4
2.3
2.6
Laut Packungsbeilage soll der mittlere Wirksoffanteil mehr als 2.4
mg betragen.
Wir gehen von Realisierungen von normalverteilten Zufallsvariablen
mit unbekanntem Erwartungswert µ und unbekannter Varianz σ2
aus. Als Schätzer für µ und σ2 erhalten wir aus obiger Stichprobe
1X
xi = 2.7
9
9
x9 =
1X
(xi − 2.7)2 = 0.26.
8
9
und s92 =
i=1
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
i=1
334
Kapitel 10: Testtheorie
t-Test
Wir wollen nun zum Niveau α = 0.05 testen (und gegebenenfalls
signifikant nachweisen), ob der wahre Wirkstoffanteil größer als 2.4
mg ist.
• Testproblem zum Niveau α = 0.05:
H0 : µ ≤ 2.4
• Unter N (2.4, σ2 ) ist
T =
gegen
√
9·
t8 -verteilt.
• Testentscheidung:
d(x1 , . . . , x9 ) =
dH1 ,
dH0 ,
H1 : µ > 2.4
9 − 2.4
X
q
S92
falls t > t8,1−0.05 = t8,0.95
falls t ≤ t8,1−0.05 = t8,0.95
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
335
Kapitel 10: Testtheorie
t-Test
• In unserem Beispiel ist
√
x9 − 2.4 √ 2.7 − 2.4
= 9· √
≈ 1.765.
s9
0.26
• Außerdem ist t8,0.95 = t8,1−0.05 = 1.860 (siehe Tabelle).
t=
9·
• Da somit t = 1.765 < 1.860 = t8,0.95 , kann die Nullhypothese,
dass die wahre Wirkstoffmenge geringer als 2.4 mg ist, zum
5%-Niveau
nicht(Student
verworfen
werden.
Tabelle:
t(q) -Verteilung
Verteilung)
q
PD Dr.
α = 0.1
α = 0.05
α = 0.025
α = 0.01
α = 0.005
1
3.078
6.314
12.706
2
1.886
2.920
4.303
3
1.638
2.353
3.182
4
1.533
2.132
2.776
5
1.476
2.015
2.571
6
1.440
1.943
2.447
7
1.415
1.895
2.365
8
1.397
1.860
2.306
9
1.383
1.833
2.262
M. Pauly , Mathematik
für
Pharmazeuten,
WS 2013/2014
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
336
Kapitel 10: Testtheorie
p-Wert
• Alternativ kann diese Testentscheidung auch basierend auf dem
p-Wert des t-Tests getroffen werden (analog können auch bei den
anderen Tests p-Werte betrachtet werden).
• Die Angabe von p-Werten ist z.B. in wissenschaftlichen
Publikationen von Interesse, wenn häufig nur ein Ergebnis mitgeteilt
wird aber nicht unmittelbar eine Ja/Nein Entscheidung getroffen
wird.
• Hierzu berechnet man für den obigen Wert t der Teststatistik und
den Wert Fn−1 (t) der zur Teststatistik gehörenden
Verteilungsfunktion Fn−1 an der Stelle t.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
337
Kapitel 10: Testtheorie
p-Wert
• Wichtige Werte von Fn sind vertafelt. Für die exakte
Berechnung von Fn (t) benötigt man aber meistens statistische
Software.
x\n
1.00
1.05
1.10
1.15
1.20
1
.75000
.75776
.76515
.77217
.77886
2
.78868
.79806
.80698
.81545
.82350
3
.80450
.81458
.82416
.83325
.84187
4
.81305
.82352
.83346
.84289
.85182
5
.81839
.82910
.83927
.84892
.85805
6
.82204
.83292
.84325
.85305
.86232
7
.82469
.83569
.84614
.85604
.86541
8
.82670
.83780
.84834
.85832
.86777
9
.82828
.83945
.85006
.86011
.86961
14
.83286
.84425
.85506
.86530
.87497
19
.83506
.84655
.85746
.86779
.87756
1.25
1.30
1.35
1.40
1.45
.78522
.79129
.79706
.80257
.80782
.83113
.83838
.84525
.85176
.85794
.85004
.85777
.86508
.87200
.87853
.86028
.86827
.87582
.88295
.88967
.86669
.87485
.88255
.88980
.89663
.87108
.87935
.88714
.89448
.90138
.87427
.88262
.89048
.89788
.90483
.87669
.88510
.89302
.90046
.90745
.87859
.88705
.89501
.90249
.90950
.88410
.89270
.90078
.90836
.91545
.88676
.89542
.90356
.91118
.91832
1.50
1.55
1.60
1.65
1.70
.81283
.81762
.82219
.82656
.83075
.86380
.86936
.87463
.87964
.88438
.88471
.89054
.89605
.90125
.90615
.89600
.90196
.90758
.91286
.91782
.90305
.90908
.91475
.92007
.92506
.90786
.91394
.91964
.92498
.92998
.91135
.91746
.92318
.92854
.93354
.91400
.92013
.92587
.93122
.93622
.91607
.92222
.92797
.93333
.93833
.92209
.92828
.93404
.93940
.94439
.92498
.93118
.93695
.94231
.94728
1.75
1.80
1.85
1.90
1.95
.83475
.83859
.84226
.84579
.84917
.88889
.89317
.89723
.90109
.90476
.91079
.91516
.91929
.92318
.92686
.92249
.92688
.93101
.93488
.93852
.92974
.93412
.93823
.94207
.94566
.93465
.93902
.94310
.94692
.95047
.93820
.94256
.94662
.95040
.95392
.94088
.94522
.94926
.95302
.95650
.94298
.94730
.95132
.95506
.95852
.94900
.95328
.95723
.96089
.96425
.95187
.95612
.96004
.96364
.96696
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
338
Kapitel 10: Testtheorie
p-Wert
• Der p-Wert p des t-Tests berechnet sich zum
Stichprobenumfang n und dem ermittelten Wert t für die drei
Testproblem wie folgt:
1. H0 : µ ≤ µ0 gegen H1 : µ > µ0 :
p = 1 − Fn−1 (t)
2. H0 : µ ≥ µ0 gegen H1 : µ < µ0 :
p = Fn−1 (t)
3. H0 : µ = µ0 gegen H1 : µ 6= µ0 :
p = 2 · 1 − Fn−1 |t|
• Ist nun p ≤ α, so lehnt man die Nullhypothese H0 zum
Niveau α ab.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
339
Kapitel 10: Testtheorie
p-Wert
Beispiel 10.2 (Fortsetzung):
X
1
1
xi .
vs. H1 : p < p0 = , X =
6
6
960
H 0 : p ≥ p0 =
i=1
Sei F960, 61 die Verteilungsfunktion der B960, 16 -Verteilung, dann ist der
p-Wert gegeben durch p = F960, 16 (X ) = 0.0000009133 < α = 0.05
(Berechnet mit dem Statistikprogramm R).
Somit kann die Nullhypothese verworfen und die Alternative signifikant
bestätigt werden.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
340
Kapitel 10: Testtheorie
p-Wert
Beispiel 10.3 (Fortsetzung): In unserem Beispiel ist t = 1.765 und
nach der Fn -Tabelle ist 0.94088 < F8 (1.765) < 0.94522. Genauer ist
F8 (1.765) = 0.9422, so dass p = 1 − 0.9422 = 0.0578 ist. Da somit
p > 0.05 = α, kann die Nullhypothese nicht verworfen werden.
x\n
1.00
1.05
1.10
1.15
1.20
1
.75000
.75776
.76515
.77217
.77886
2
.78868
.79806
.80698
.81545
.82350
3
.80450
.81458
.82416
.83325
.84187
4
.81305
.82352
.83346
.84289
.85182
5
.81839
.82910
.83927
.84892
.85805
6
.82204
.83292
.84325
.85305
.86232
7
.82469
.83569
.84614
.85604
.86541
8
.82670
.83780
.84834
.85832
.86777
9
.82828
.83945
.85006
.86011
.86961
14
.83286
.84425
.85506
.86530
.87497
19
.83506
.84655
.85746
.86779
.87756
1.25
1.30
1.35
1.40
1.45
.78522
.79129
.79706
.80257
.80782
.83113
.83838
.84525
.85176
.85794
.85004
.85777
.86508
.87200
.87853
.86028
.86827
.87582
.88295
.88967
.86669
.87485
.88255
.88980
.89663
.87108
.87935
.88714
.89448
.90138
.87427
.88262
.89048
.89788
.90483
.87669
.88510
.89302
.90046
.90745
.87859
.88705
.89501
.90249
.90950
.88410
.89270
.90078
.90836
.91545
.88676
.89542
.90356
.91118
.91832
1.50
1.55
1.60
1.65
1.70
.81283
.81762
.82219
.82656
.83075
.86380
.86936
.87463
.87964
.88438
.88471
.89054
.89605
.90125
.90615
.89600
.90196
.90758
.91286
.91782
.90305
.90908
.91475
.92007
.92506
.90786
.91394
.91964
.92498
.92998
.91135
.91746
.92318
.92854
.93354
.91400
.92013
.92587
.93122
.93622
.91607
.92222
.92797
.93333
.93833
.92209
.92828
.93404
.93940
.94439
.92498
.93118
.93695
.94231
.94728
1.75
1.80
1.85
1.90
1.95
.83475
.83859
.84226
.84579
.84917
.88889
.89317
.89723
.90109
.90476
.91079
.91516
.91929
.92318
.92686
.92249
.92688
.93101
.93488
.93852
.92974
.93412
.93823
.94207
.94566
.93465
.93902
.94310
.94692
.95047
.93820
.94256
.94662
.95040
.95392
.94088
.94522
.94926
.95302
.95650
.94298
.94730
.95132
.95506
.95852
.94900
.95328
.95723
.96089
.96425
.95187
.95612
.96004
.96364
.96696
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
341
Kapitel 10: Testtheorie
Tests
Bemerkungen:
1. Alle angegebenen Tests sind so ausgelegt, dass für die Alternative
H1 die Wahrscheinlichkeit für den Fehler 2. Art möglichst gering
unter allen Niveau-α-Tests wird.
2. Einmal getestete Daten dürfen nicht weiter verwendet werden, da
dies sonst zur Verfälschung des Signifikanzniveaus führt.
3. Falsch ist auch die Suche nach “optischen” Unregelmäßigkeiten in
den Daten, um Hypothesen zu generieren. D.h. insb., dass die
Datenerhebung erst nach Aufstellung der Hypothese und Festlegung
des Niveaus erfolgen soll.
4. Wollen wir bei einer diskreten Verteilung nicht einen unbekannten
Parameter dieser gegebenen Verteilung testen, sondern direkt die
Verteilungsannahme überprüfen, so führt uns das zum
χ2 -Anpassungstest.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
342
Kapitel 10: Testtheorie
χ2 -Anpassungstest
• Ein Experiment habe r ≥ 2 verschiedene Ausgänge, wobei das i-te
Pr
Ereignis mit Wahrscheinlichkeit pi auftrete, 1 ≤ i ≤ r , i=1 pi = 1.
• In n unabhängigen Versuchswiederholungen sei ki die absolute
Häufigkeit des i-ten Ereignisses, k1 + . . . + kr = n
• Es besteht der Verdacht, dass die angegebenen Parameter nicht
einer
vorgegebenen
mit den Besetzungswahrscheinlichkeiten
(0)
(0)
p1 , . . . , pr
folgen.
• Testproblem:
(0)
p1 , . . . , pr = p1 , . . . , pr(0)
gegen
(0)
H1 : p1 , . . . , pr 6= p1 , . . . , pr(0) .
H0 :
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
343
Kapitel 10: Testtheorie
χ2 -Anpassungstest
• Zum Testen dieser Hypothese verwendet man die χ2 -Statistik
χ2 =
(0) 2
r
ki − n · pi
X
(0)
i=1
.
n · pi
• Testentscheidung: Zum vorgegebenen Niveau α erfolgt die
Entscheidung nach dem χ2 -Test mit r − 1 Freiheitsgraden,
falls n genügend groß ist, durch
dH1 , falls χ2 > χ2r −1,1−α
d(k1 . . . , kr ) =
,
dH0 , falls χ2 ≤ χ2r −1,1−α
wobei χ2r −1,1−α das 100 · (1 − α)%-Quantil der
χ2r −1 -Verteilung ist.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
344
Kapitel 10: Testtheorie
χ2 -Anpassungstest
(0)
(0)
• Liegt unter H0 der Parameter (p1 , . . . , pr ) vor, so kann
gezeigt werden, dass die angegebene χ2 -Statistik für große
Stichprobenumfänge n einer sogenannten χ2r −1 -Verteilung mit
r − 1 Freiheitsgraden folgt.
• Auch die (100 · α)%-Quantile χ2n,α der χ2 -Verteilung mit n
Freiheitsgraden sind für wichtige Werte vertafelt (und für alle
T5
der χ -Verteilung
Werte Quantile
in Statistik-Softwaren
implementiert).
Tabelliert ist das α-Quantil χ2n; α der χ2 -Verteilung mit n Freiheitsgraden.
n\α
1
2
3
4
5
0.01
.0002
.0201
.1148
.2971
.5543
0.025
.0010
.0507
.2158
.4844
.8312
0.050
.0039
.1026
.3518
.7107
1.145
0.100
.0158
.2107
.5844
1.064
1.610
0.250
.1015
.5754
1.213
1.923
2.675
0.500
.4549
1.386
2.366
3.357
4.351
0.750
1.323
2.773
4.108
5.385
6.626
0.900
2.706
4.605
6.251
7.779
9.236
0.950
3.841
5.991
7.815
9.488
11.07
0.975
5.024
7.378
9.348
11.14
12.83
0.990
6.635
9.210
11.34
13.28
15.09
0.995
7.879
10.60
12.84
14.86
16.75
6
7
8
9
10
.8721
1.239
1.646
2.088
2.558
1.237
1.690
2.180
2.700
3.247
1.635
2.167
2.733
3.325
3.940
2.204
2.833
3.490
4.168
4.865
3.455
4.255
5.071
5.899
6.737
5.348
6.346
7.344
8.343
9.342
7.841
9.037
10.22
11.39
12.55
10.64
12.02
13.36
14.68
15.99
12.59
14.07
15.51
16.92
18.31
14.45
16.01
17.53
19.02
20.48
16.81
18.48
20.09
21.67
23.21
18.55
20.28
21.95
23.59
25.19
7.584 10.34 13.70
8.438 11.34 14.85
9.299 12.34 15.98
10.17
13.34 17.12
WS
2013/2014
17.28
18.55
19.81
21.06
19.68
21.03
22.36
23.68
21.92
23.34
24.74
26.12
24.72
26.22
27.69
29.14
26.76
28.30
29.82
31.32
11 3.053 3.816 4.575 5.578
12 3.571 4.404 5.226 6.304
13 4.107 5.009 5.892 7.042
14 4.660 5.629
6.571 7.790
PD Dr. M. Pauly , Mathematik
für Pharmazeuten,
345
Kapitel 10: Testtheorie
χ2 -Anpassungstest
Beispiel 10.4 (Randkreuze beim Lotto): Besitzen alle Lotto-Tips die
gleiche Wahrscheinlichkeit, so ist die Anzahl der Kreuze in den
Randfeldern eines 7 × 7 Lottoblocks, wie in Beispiel 4.5 bestimmt,
hypergeometrisch verteilt. Es wurde nun ein Experiment durchgeführt, in
dem 59 Personen unabhängig voneinander jeweils einen Lottoblock
ausgefüllt haben. Die relativen Häufigkeiten der Anzahlen angekreuzter
Randfelder in diesem Experiment und die zugehörigen theoretischen
Wahrscheinlichkeiten sind gegeben durch
Randzahlen
0
1
2
3
4
5
6
Insgesamt
relative Häufigkeit
0.01
0.14
0.35
0.33
0.15
0.02
0
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
theoretische W-keit
0.01
0.09
0.25
0.33
0.23
0.08
0.01
59
346
Kapitel 10: Testtheorie
χ2 -Anpassungstest
• Wir wollen nun zum Niveau α = 0.05 testen, ob die
erhobenen Daten von dieser hypergeometrischen Verteilung
abweichen (und somit ob Randfelder mit einer anderen
Wahrscheinlichkeit angekreuzt werden als zentrale Felder).
• Aus den erhobenen Daten ergibt sich für die Teststatistik der
Wert
χ2 =
(0) 2
r
ki − n · pi
X
(0)
i=1
n · pi
= 59 ·
7
X
i=1
ki
n
(0) 2
− pi
(0)
pi
= 20.1033.
• Da nun das 95%-Quantil χ26,0.95 = 12.59 ist (siehe Tabelle),
kann die Nullypothese zum Niveau 5% verworfen werden.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
347
Kapitel 10: Testtheorie
Zufallsexperiment: Zufallszahlen
Ziffern
Anzahl
0
4
1
2
2
4
3
7
4
9
5
8
6
9
7
14
8
5
9
1
Wir wollen nun zum Niveau α = 0.05 testen, ob die erhobenen
Daten von der
Gleichverteilung
abweichen.
(0) 2
k
−n·p
P
i
i
χ2 = ri=1
= 21.6032
(0)
n·pi
Da das 95%-Quantil χ29,0.95 = 16.91898 ist kann die Nullhypothese
zum Niveau α = 0.05 verworfen werden.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
348
Kapitel 10: Testtheorie
1-faktorielle Varianzanalyse (ANOVA)
• Bisher: Nur Tests für ein oder zwei Stichproben.
• Häufig hat man aber mehr als zwei Stichproben vorliegen. Für
die statistische Auswertung solcher Fälle gibt es
selbstverständlich auch Testverfahren. Wir stellen
exemplarisch eines vor, die ANOVA:
• Gegeben seien also k > 2 Stichproben mit Beobachtungen
xi,1 , . . . , xi,ni in Gruppe i, i = 1, . . . , k.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
349
Kapitel 10: Testtheorie
Modell
• Wir nehmen an, dass die Beobachtungen Realisierungen von
unabhängigen ZVen
Xi,1 , . . . , Xi,ni ∼ N(µi , σ2 ), i = 1, . . . , k
sind.
• Das Testproblem von Interesse ist
H0 : {µ1 = . . . = µk } gegen
H1 : {µi 6= µj für eine Kombination 1 ≤ i 6= j ≤ k}.
• n = n1 + . . . + nk =
b Gesamtstichprobenumfang.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
350
Kapitel 10: Testtheorie
Bemerkungen
• Die Varianz wird in allen Gruppen als gleich angenommen
(Varianzhomogenität = Homoskedastizität).
• Alle Stichproben sind unabhängig.
• Die ZVen einer Gruppe (=Faktorstufen) sind
i.i.d. N(µi , σ2 )-verteilt.
Diese Voraussetzungen sind in praktischen Situationen zu
überprüfen (später mehr).
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
351
Kapitel 10: Testtheorie
Sei xij die j-te Beobachtung der i-ten Stichprobe und x das
Gesamtmittel, sowie xi das i-te Gruppenmittel. Dann gilt :
xij = x +
(xi − x)
| {z }
Abweichung Gruppenmittel
vom Gesamtmittel
+
(xij − xi )
| {z }
Abweichung Beobachtung
vom Gruppenmittel
Idee: Gilt H0 nicht, wird die Abweichung der Gruppenmittel zum
Gesamtmittel hoch sein im Vergleich zur Abweichung der
Beobachtungen zum Gruppenmittel.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
352
Kapitel 10: Testtheorie
• Hieraus folgt:
SStotal = SSwithin + SSbetween
X
X
X
(xij − x)2 =
(xij − xi. )2 +
ni (xi. − x)2
i,j
i,j
i
und die vorangegangenen Überlegungen motivieren die
Teststatistik des F-Tests
F =
1
k−1 SSbetween
1
n−k SSwithin
welche mit dem (1 − α)-Quantil einer Fk−1,n−k - Verteilung
verglichen wird.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
353
Kapitel 10: Testtheorie
Diskussion
Je weiter die Mittelwerte der einzelnen Faktorstufen vom
Gesamtmittel abweichen, desto größer wird der Wert für SSbetween ,
im Vergleich zum Wert für SSwithin . Unter H0 sollte also der
between
Quotient SS
SSwithin nahe bei Null liegen. Je größer SSbetween wird und somit auch je größer der Quotient wird - desto
unwahrscheinlicher ist die Gültigkeit von H0 . Bei Werten von F
größer Fk−1,n−k,(1−α) wird H0 verworfen.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
354
Kapitel 10: Testtheorie
Beispiel
Vier verschiedene Lehrmethoden sollen untersucht werden. Dazu werden
32 Personen zufällig auf vier Gruppen á 8 Personen aufgeteilt. Am Ende
des Kurses wird eine Abschlussprüfung durchgeführt und die Punkte jedes
Teilnehmers dokumentiert :
Gruppe 1
Gruppe 2
Gruppe 3
Gruppe 4
x1,1
x1,2
x1,3
x1,4
x1,5
x1,6
x1,7
x1,8
x2,1
x2,2
x2,3
x2,4
x2,5
x2,6
x2,7
x2,8
x3,1 = 2
x3,2 = 10
x3,3 = 9
x3,4 = 10
x3,5 = 11
x3,6 = 9
x3,7 = 10
x3,8 = 9
x4,1 = 5
x4,2 = 8
x4,3 = 8
x4,4 = 11
x4,5 = 1
x4,6 = 9
x4,7 = 5
x4,8 = 9
x3 = 8.75
x4 = 7.00
= 16
= 18
= 20
= 15
= 20
= 15
= 23
= 19
x1 = 18.25
= 16
= 12
= 10
= 14
= 18
= 15
= 12
= 13
x2 = 13.75
Gibt es siginifikante Unterschiede zwischen den Gruppen ?
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
355
Kapitel 10: Testtheorie
• Gruppenmittel:
x1 =
1
8
P
i
x1,i = 18.25, x2 = 13.75, x3 = 8.75, x4 = 7
• Gesamtmittel: x = 18.25+13.75+8.75+7
= 11.9375
4
P4
− x)2 =
318.7812 + 26.28125 + 81.28125 + 195.0312 = 621.375
P
• SSwithin = i,j (xij − xi. )2 =
(16−18.25)2 +. . .+(19−18.25)2 +(16−13.75)2 +. . . = 226.5
• SSbetween =
• Also F =
i=1 ni (xi
1
SSbetween
k−1
1
SSwithin
n−k
=
1
621.375
4−1
1
226.5
32−4
= 25.60486 > 2.946685 =
F0.95,3,28 .
D.h. wir können die Nullhypothese zum Niveau α = 0.05
verwerfen.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
356
Kapitel 10: Testtheorie
Eine Auswahl von Statistikprogrammen
R
• freie Software(GNU GPL),
• Programmiersprache, kann mittels eines Editors komfortabel verwendet
werden,
• erhältlich unter http://www.r-project.org,
Editoren/graphische Oberfläche unter http://www.sciviews.org/rgui/
• häufige Verwendung an Hochschulen.
SPSS
• kommerzielles Programm,
• (meist) Menü-basierte Steuerung,
• weit verbreitet, z.B. in der Medizin, Psychologie und in den
Sozialwissenschaften,
• Lizenzen sind im Hochschul-Rechenzentrum (ZIM) vorhanden.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
357
Kapitel 10: Testtheorie
SAS
• kommerzielles Programm
• Menü-basierte Steuerung, eigene Programmiersprache
• weit verbreitet, z.B. in der Medizin, Biometrie, erfüllt industrielle
Standards,
• Lizenzen sind im Hochschul-Rechenzentrum (ZIM) vorhanden.
Alle Statistikprogramme verfügen über umfangreiche Bibliotheken.
PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014
358
Herunterladen