Schlieÿende Statistik (Teschl/Teschl Kap. 30)

Werbung
Schlieÿende Statistik (Teschl/Teschl Kap. 30)
Vorgehensweise:
I Stichproben werden als Realisierungen von
Zufallsvariablen mit unbekannter oder nur teilweise
bekannter Verteilung betrachtet.
I Anhand des Stichprobenergebnisses wird versucht,
Informationen über die zugrunde liegende Verteilung zu
gewinnen.
Dabei kommen in der Regel Methoden der
Wahrscheinlichkeitsrechnung zum Einsatz.
test13.pdf, Seite 1
Drei betrachtete Fälle
I
Parameterschätzungen:
Eine Stichprobe dient dazu, eine
Schätzung für den Wert eines Parameters einer Verteilung
wie z. B. Erwartungswert, Varianz,
Erfolgswahrscheinlichkeit, etc. zu bekommen.
I
Hypothesentests:
Prüfen, ob die Daten dafür sprechen, ob
eine bestimmte Hypothese zutrit.
Beispiel: Würfel ist gezinkt, oder
Medikament B wirkt besser als A
I
Kondenzintervalle:
Angabe eines Intervalls, in dem ein
unbekannter Parameter vermutlich liegt.
test13.pdf, Seite 2
Modellierung von Zufallsstichproben
Eine Stichprobe
Werte von
n
x1 , ..., xn
vom Umfang
n
wird interpretiert als
unabhängigen, identisch verteilten
Zufallsvariablen
X1 , X2 ,
...,
Xn .
Parametrische und nichtparametrische Statisitk
In vielen Anwendungen wird angenommen, dass die
Xk
einer
bestimmten Verteilung genügen wie z. B. Normal- oder
Binomialverteilung, deren Parameter (µ,
σ, p,
...) jedoch nicht
oder nicht alle bekannt sind. In diesem Fall spricht man von
parametrischer Statistik.
In der
nichtparametrischen Statistik
werden im Gegensatz dazu
a proiri keine Annahmen über die Verteilung der untersuchten
Gröÿen gemacht.
test13.pdf, Seite 3
Schätzfunktionen
dienen dazu, den Wert eines Parameters oder einer Kenngröÿe
zu schätzen.
Beispiel
Nach dem Gesetz der groÿen Zahlen gilt
lim
n→∞
n
(X1 + ... + Xn ) = µ,
Xk ist. Somit kann das
arithmetische Mittel x = (x1 + ... + xn ) einer Stichprobe (für
n
hinreichend groÿe n ) als Schätzung für den Erwartungswert
wobei
µ
1
der Erwartungswert der
1
der zugrunde liegenden Verteilung interpretiert werden.
test13.pdf, Seite 4
Beispiel 2
Ist der Erwartungswert
µ
der
Xk
bekannt, so folgt aus dem
Gesetz der groÿen Zahlen angewandt auf die unabhängigen
und identisch verteilten Zufallsvariabeln
lim
n→∞
1
n
(Xk − µ)2
(X1 − µ)2 + ... + (Xn − µ)2 = E (Xk − µ)2 = V (Xk ).
Man erhält also für hinreichend groÿe
n
eine Schätzung der
Varianz (und damit auch der Standardabweichung).
test13.pdf, Seite 5
Mathematische Beschreibung
Zu einer Stichprobe
x1 , ..., xn ∈ R
ist eine
Stichprobenfunktion
eine Abbildung
T : Rn → R : (x1 , ..., xn ) 7→ T (x1 , ..., xn ).
Beispiel:
T (x1 , ..., xn ) = Tn (x1 , ..., xn ) = n1 (x1 + ... + xn ).
Sind die
xk
Werte von (unabhängigen und identische
verteilten) Zufallsvariabeln, so ist auch
T (X1 , ..., Xn )
wieder
eine Zufallsvariable.
Man spricht von einer
Schätzfunktion
oder einem
Schätzer,
wenn ihr Wert als Schätzung eines Parameters der Verteilung
der
Xk
verwandt wird.
Beispiel:
Die Zufallsvariable
T (X1 , ..., Xn ) = X = n1 (X1 + ... + Xn )
Erwartungswert der Xk .
ist ein Schätzer für den
test13.pdf, Seite 6
Konsistenz von Schätzern
Im Beispiel
T (X1 , ..., Xn ) = X
gilt nach dem Gesetz der
groÿen Zahlen
limn→∞
T (X1 , ..., Xn ) = EX = µ.
Diese Eigenschaft bedeutet, dass das arithmetische Mittel
X
als Schätzfunktion für den Erwartungswert einer
(unbekannten) Verteilung
Interpretation:
konsistent
ist.
Eine konsistente Schätzfunktion liefert eine
gute Schätzung des gesuchten Parameters, wenn der
Stichprobenumfang
n
hinreichend groÿ ist.
test13.pdf, Seite 7
Weitere Beispiele für konsistente Schätzfunktionen
I
T =P =
(Zahl der Erfolge)/(Zahl der Versuche)
als Schätzer für die Erfolgswahrscheinlichkeit bei einer
Binomialverteilung
I
T =X
als Schätzer für den Parameter
λ
einer
PoissonVerteilung
I
1
(Zahl der xk mit xk ≤ x )
n
als Schätzer für den Wert der Verteilungsfunktion
F (x) =
der Stelle
F
an
x,
verallgemeinert: Die empirische Verteilungsfunktion
F
ist
eine Schätzung der zugrunde liegenden tatsächlichen
Verteilungsfunktion
F.
I Für eine beliebige reelle Funktion
1
g
ist
g (X1 ) + ... + g (Xn ) ein konsistenter Schätzer für den
n
Erwartungswert von g (X )
(folgt aus dem Gesetz der groÿen Zahlen).
test13.pdf, Seite 8
Empirische und theoretische Verteilungsfunktion
einer Stichprobe vom Umfang
n = 50
einer
exponentialverteilten Zufallsgröÿe
test13.pdf, Seite 9
Schätzer für die Varianz
µ ist
(X1 − µ) + ... + (Xn − µ)2
I bei bekanntem Erwartungswert
T =
1
n
2
ein konsistenter
Schätzer für die Varianz der Verteilung der
Xk .
I Ist der Erwartungswert nicht bekannt, so erhält man einen
konsistenten
Schätzer, indem manµ durch
T̂ =
1
n
2
(X1 −X ) +...+(Xn −X )
2
=
X
ersetzt, also
2
(X12 +...Xn2 )−X .
n
1
T − T̂ = (X − µ)2 → 0 für n → ∞.
Ist x 6= µ, so gilt T̂ (x1 , ..., xn ) < T (x1 , ..., xn ).
Dies hat zur Folge, dass T̂ im Durchschnitt zu kleine
Werte für die Varianz liefert. T̂ ist als Schätzfunktion der
Varianz nicht erwartungstreu.
Die Konsistenz folgt aus
I
test13.pdf, Seite 10
Empirische Varianz
Um diese tendenzielle Abweichung auszugleichen, betrachtet
man die empirische Varianz
1
n
(X1 − X )2 + ... + (Xn − X )2
T̂ =
n−1
n−1
2
Wird das so denierte S als Zufallsvariable betrachtet, so ist
2
2
2
für jedes feste n der Erwartungswert ES = σ , wobei σ die
(unbekannte) Varianz der Xk bezeichnet.
S2 =
Somit ist die empirische Varianz ein erwartungstreuer Schätzer
für die Varianz einer Verteilung mit unbekanntem
Erwartungswert. Wegen
limn→∞
ist
S2
S 2 = limn→∞
n
T̂
n−1
= limn→∞
n
n−1
· limn→∞ T̂ = 1 · σ 2
als Schätzer auch konsistent.
Bemerkung:
√
S2
ist als Schätzer für die Standardabweichung
konsistent, jedoch nicht erwartungstreu.
test13.pdf, Seite 11
Hypothesentests
liefern anhand einer Stichprobe eine Entscheidung zwischen
einer
H0
Nullhypothese H0
und
H1
und einer
Alternative H1 .
müssen sich gegenseitig ausschlieÿen.
Beispiel Würfel
H0 :
alle Augenzahlen sind gleich wahrscheinlich
H1 :
die Wahrscheinlichkeit der 6 ist
>
1
6.
Vorgehensweise
Wenn sich die Stichprobe hinreichend durch die Verteilung
von
H0
erklären lässt, wird die Nullhypothese
H0 beibehalten.
Wenn die Stichprobe signikant darauf hindeutet, dass
zutrit, wird
H0 verworfen
angenommen.
und die Alternative
H1
H1
test13.pdf, Seite 12
Fehler 1. und 2. Art
Bei einem Hypothesentest gibt es grundsätzlich 5
Möglichkeiten:
I
H0
trit zu und der Test führt dazu,
H0
(zu Recht)
H0
(zu Recht) zu
beizubehalten.
I
H1
trit zu und der Test führt dazu,
H1 anzunehmen.
H0 noch H1 trit zu. Dieser
verwerfen und
I Weder
Fall kann durch
geeignete Formulierung der Hypothesen ausgeschlossen
werden und wird im Folgenden nicht weiter betrachtet.
I
I
H0
H0
trit zu und wird zu Unrecht verworfen (Fehler
1. Art).
trit nicht zu und wird trotzdem (zu Unrecht)
beibehalten (Fehler
2. Art).
test13.pdf, Seite 13
Aufbau eines Tests
Der Test wird so konstruiert, dass die Wahrscheinlichkeit für einen
Fehler 1. Art kleiner gleich einem vorgegebenen
Signikanzniveau α
(typischerweise 1%, 2%, 5% oder 10%) ist.
Dazu berechnet man eine
T = T (x1 , ..., xn ) ∈ R
Teststatistik
oder
Prüfgröÿe
als Funktion einer Zufallsstichprobe
H0
(z. B. Mittelwert, Anteil der Sechsen). Unter
x1 , ..., xn
ist die Verteilung
der Teststatistik bekannt.
Man wählt nun einen Bereich
P(T (x) ∈ W ) ≥ 1 − α,
Sechsen < 25%).
T (x) 6∈ W
falls
W ⊂ R, sodass
H0 zutrit (Beispiel
sollte darauf hindeuten, dass
H0
Anteil der
falsch ist und
H1
zutrit.
V =R\W
ist dann der
Verwerfungsbereich
des Tests. d. h. man verwirft
H0
und nimmt
oder
H1
kritische Bereich
an, falls
T (x)
in
V
liegt.
test13.pdf, Seite 14
Im Würfelbeispiel
T = T (x) =
Unter
H0
Zahl der Sechsen beim 100maligen Würfeln
(fairer Würfel) ist
P(T ≥ 24) ≈ 3, 8 %.
d. h. bei
einem fairen Würfel treten mit über 96prozentiger
Wahrscheinlichkeit nicht mehr als 23 Sechsen auf.
Damit kann zum Niveau 5% die Menge
{24, 25, ..., 100}
als
kritischer Bereich gewählt werden. Wenn 24 oder mehr
Sechsen gewürfelt werden, wird
H0
verworfen und
H1
angenommen. In diesem Fall wird aus dem Test geschlossen,
dass der Würfel gezinkt sein muss. Damit wird jedoch mit
Wahrscheinlichkeit 3, 8
%
auch ein fairer Würfel
fälschlicherweise als gezinkt betrachtet (Fehler 1. Art).
Bei bis zu 23 Sechsen ist die Abweichung vom Erwartungwert
1
6 dagegen noch nicht signikant genug, um daraus zu
schlieÿen, dass der Würfel gezinkt ist, d. h. H0 wird
16
beibehalten.
test13.pdf, Seite 15
Zum Fehler 2. Art
Je kleiner das Signikanzniveau
wird die Hürde,
steigt,
H0
H0
α
gewählt wird, desto höher
zu verwerfen, d. h. die Wahrscheinlichkeit
zu Unrecht beizubehalten.
Hängt die Verteilung von einem Parameter
θ
ab und haben die
Hypothesen die Form
H0 : θ = θ0
und
H1 : θ > θ0
so kann für jedes
θ
θ = θ0
θ < θ0
oder
θ 6= θ0 ),
die Wahrscheinlichkeit
β(θ) = Pθ (X ∈ V )
Für
(oder
berechnet werden.
muss gelten
β(θ0 ) ≤ α.
Ein Fehler 2. Art ist umso unwahrscheinlicher, je näher
an 1 liegt für die zu
β(θ)
wird als
H1
gehörenden
Gütefunktion
β(θ)
θ.
des Tests bezeichnet.
test13.pdf, Seite 16
Gütefunktion zum 100maligen Würfeln
test13.pdf, Seite 17
Beispiel mit Normalverteilung
Bei den Füllmengen einer Packung wird davon ausgegangen,
dass sie normalverteilt sind mit Erwartungswert
Varianz
2
und
σ = 4.
Eine Stichprobe vom Umfang
Mittel
µ0 = 100
x = 99.
n = 25
ergibt ein arithmetisches
Kann davon ausgegangen werden, dass dies
eine zufällige Abweichung ist oder liegt eine systematische
Abweichung vor?
(d. h. der Erwartungswert ist in Wirklichkeit
< 100)
Um dies zu testen, formuliert man die Hypothese
H0 : µ = 100
und die Alternative
H1 : µ < 100.
X wird als Zufallsvariable interpretiert,
unter H0 bekannt ist (siehe nächste Seite).
Das Stichprobenmittel
deren Verteilung
test13.pdf, Seite 18
Fortsetzung Beispiel
X1 , ..., X25 ∼ N(100; 4) unabhängige Zufallsvariablen,
S25 = X1 + ... + X25 normalverteilt mit Erwartungswert
2
25 · 100 = 2500 und Varianz 25 · σ = 100.
Sind
so
ist
Für
X =
1 2
25
σX2 =
Unter
1
25 S25 folgt
H0
· σS2n =
E X = 100,
4
25 und
σX =
q
4
25
=
2
5
= 0, 4.
gilt somit
P(X ≤ 99) = Φ
99−100
0,4
= Φ(−2, 5) = 1 − Φ(2, 5)
= 1 − 0, 9938 = 0, 62 %,
d. h. das beobachtete Ereignis ist unter
unwahrscheinlich (< 1
könnte,
H0
%),
H0
relativ
was zum Anlass genommen werden
zu verwerfen.
In diesem Fall lässt sich jedoch ein Fehler 1. Art nicht ganz
ausschlieÿen.
test13.pdf, Seite 19
Der (einseitige) GauÿTest
Die Überlegungen im letzten Beispiel führen zum
GauÿTest
für den Erwartungswert einer Normalverteilung bei bekannter
Varianz.
Gegeben ist eine normalverteilte Zufallsgröÿe mit
bekannter Standardabweichung σ . Zu
Nullhypothese H0 : µ = µ0 gegen die Alternative
Erwartungswert
testen ist die
µ
und
H1 : µ < µ0 .
Zu einer Stichprobe vom Umfang
berechnet man die
√
H0
mit Mittelwert
x
Teststatistik
n
z=
· (x − µ0 ) =
σ
die unter
n
r
n
· (x − µ0 ),
σ2
standardisiert und somit standardnormalverteilt
ist.
test13.pdf, Seite 20
Entscheidungsregel im GauÿTest
Man gibt ein
Signikanznivaeu α > 0
vor, welches als
Wahrscheinlichkeit für einen Fehler 1. Art in Kauf genommen
wird (typische Werte liegen im Bereich 0
vergleicht
z
mit dem
< α ≤ 0, 1),
αQuantil zα = −z1−α
und
der
Standardnormalverteilung:
I Ist
z < −z1−α ,
so wird
H0
verworfen und
H1
angenommen,
d. h. die Abweichung des Mittelwertes von
µ0
ist
signikant genug, um von einer systematischen
Abweichung auszugehen.
I Ist
z > −z1−α ,
so wird
H1
abgelehnt und
d. h. die Dierenz zwischen
x
und
µ0
H0
beibehalten,
wird durch eine
zufällige Abweichung erklärt.
(Im (theoretisch) mit Wahrscheinlichkeit 0 auftretenden Grenzfall
z = −z1−α
ist die Entscheidungsregel uneinheitlich.)
test13.pdf, Seite 21
Verteilung der Teststatistik
z
H0 : µ = µ0 und kritischer Bereich im Fall
α = 0, 01 = 1 % beim einseitigen GauÿTest mit
Alternative H1 : µ < µ0
unter
Hat
z
einen Wert im kritischen Bereich, so wird
bei einem Wert im grünen Bereich wird
H0
der
H0
verworfen,
beibehalten.
test13.pdf, Seite 22
Verteilung von
im Fall
z
µ0 = 100, µ = 99, σ = 2
und
n = 25
Hier führt die Entscheidungsregel dazu, dass
Wahrscheinlichkeit 56, 9
%
H0
mit
zu Recht verworfen wird. Die
Wahrscheinlichkeit eines Fehlers 2. Art beträgt dann 43, 1
%.
test13.pdf, Seite 23
Im Beispiel
H0 : µ = µ0 = 100, H1 : µ < 100
mit
σ2 = 4 ⇔ σ = 2
und einer Stichprobe vom Umfang n = 25 mit Mittelwert
x = 99 erhält man die Teststatistik
q
pn
5
z = σ · (x − µ0 ) = 25
4 · (99 − 100) = 2 · (−1) = −2, 5.
2
mit dem Quantil
α = 0, 01 vorgegeben, so vergleicht
z0,01 = −z0,99 = −2, 32635.
z < −z0,99
H0
Ist das Signikanzniveau
man
z
Wegen
wird
verworfen und
Würde man dagegen das Niveau
H1
α = 0, 005
angenommen.
vorgeben, so ist
z = −2, 5 > z0,005 = −z0,995 = −2, 57583,
d. h. in diesem Fall müsste
H0
beibehalten und
H1
abgelehnt
werden.
test13.pdf, Seite 24
Alternative
H1 : µ > µ 0
In diesem Fall berechnet man wieder die unter
pn
standardnormalverteilte Teststatistik z =
σ2
H0 : µ = µ 0
· (x − µ0 ).
Der kritische Bereich wird jetzt am rechten Rand gewählt,
d. h. bei gegebenem Niveau
I Ist
I Ist
z > z1−α ,
z < z1−α ,
so wird
so wird
α
H0
H0
lautet die Entscheidungsregel
H1 angenommen.
und H1 abgelehnt.
verworfen und
beibehalten
test13.pdf, Seite 25
Beim zweiseitigen GauÿTest mit
H1 : µ 6= µ0
wird der kritische Bereich symmetrisch aufgeteilt, so dass der
linke und der rechte Teil unter
α
Wahrscheinlichkeit
haben.
H0 : µ = µ 0
jeweils die
2
Mit der Teststatistik
z=
pn
σ2
· (x − µ0 )
ergibt sich die
Entscheidungsregel
H0 und nehme H1 an, falls
z < z α = −z1− α oder z > z1− α ,
d. h. falls |z| > z1− α .
Behalte H0 bei und lehne H1 ab, falls |z| < z1− α .
I Verwerfe
2
2
2
2
I
2
test13.pdf, Seite 26
Zweiseitiger kritischer Bereich graphisch
Im Beispiel
H0 : µ = 100, σ = 2, n = 25
und
x = 99 ⇒ z = −2, 5
Führt man einen zweiseitigen Test mit der Alternative
H1 : µ 6= 100 zum Niveau α = 1 % = 0, 01 durch, so ist
|z| = | − 2, 5| = 2, 5 mit dem 1 − α2 Quantil z0,995 = 2, 576
zu vergleichen.
Wegen 2, 5
= |z| < z0,995 = 2, 576
wird
H0
beibehalten und
H1
abgelehnt.
test13.pdf, Seite 27
Weiteres Beispiel
Betrachte die Stichprobe 38, 41, 43, 48, 53, 62, 64, 71, 81
einer normalverteilten Grundgesamtheit mit bekannter
Standardabweichung
H0 : µ = 50 gegen
α = 0, 1 = 10 %.
σ = 20.
Zu testen sei die Nullhypothese
die Alternative
H1 : µ > 50
zum Niveau
√
Es ist
x = 55, 7
Mit dem
ist
und
9
20
z=
(1 − α)Quantil
· (55, 7 − 50) = 0, 855.
der Normalverteilung
z0,9 = 1, 2816
z < z0,9 .
Somit ist die Alternative
H1
abzulehnen und
H0
Die Abweichung des beobachteten Mittelwertes
Sollwert
µ0 = 50
beizubehalten.
x = 55, 7
vom
ist nicht groÿ genug, um mit hinreichender
Sicherheit zu schlieÿen, dass
µ > 50
ist.
Im Fall eines zweiseitigen Tests erhält man
|z| = z = 0, 855 < z0,95 = 1, 6449,
H10 : µ 6= 50 wäre abzulehnen.
d. h. auch die Alternative
test13.pdf, Seite 28
Der
t Test
ist ein Test für den Erwartungswert einer normalverteilten
Zufallsgröÿe mit
unbekannter
Varianz.
Man betrachtet wie beim GauÿTest die Nullhypothese
H0 : µ = µ0 . Bei der Berechnung der Teststatistik wird dann
2
2
die Varianz σ durch die Stichprobenvarianz s ersetzt, d. h.
man erhält für eine Stichprobe vom Umfang n mit Mittelwert
x und empirischer Varianz s 2 die Teststatistik
r
√
n
n
t=
· (x − µ0 ) =
· (x − µ0 ).
s
s2
Man kann zeigen, dass
m =n−1
t
unter
H0
einer
t Verteilung
mit
Freiheitsgraden genügt.
Daher sind bei der Entscheidungsregel die Quantile der
Normalverteilung durch die entsprechenden Quantile der
tn−1 Verteilung
zu ersetzen, welche ebenfalls in Tabellen
aufgeführt sind.
test13.pdf, Seite 29
Entscheidungsregel beim
Mit
H 0 : µ = µ0
t Test
und der Teststatistik
r
t=
n
· (x − µ0 )
s2
betrachtet man bei vorgegebenem Signikanzniveau
α
wie
beim GauÿTest drei Fälle:
I Einseitiger
t Test
H1 : µ < µ0
und H1 angenommen,
mit
H0 wird verworfen
falls
t < tn−1;α = −tn−1;1−α .
I Einseitiger t Test mit H1 : µ > µ0
H0 wird verworfen und H1 angenommen, falls
t > tn−1;1−α .
I Zweiseitiger t Test mit H1 : µ 6= µ0
H0 wird verworfen und H1 angenommen, falls
|t| > tn−1;1− α .
Ansonsten wird H1 abgelehnt und H0 beibehalten.
2
test13.pdf, Seite 30
Beispiel
Ist im letzten Beispiel (zum GauÿTest) die Varianz
unbekannt, so berechnet man die empirische Varianz
s 2 = 217, 5 ⇒ s =
√
t=
n
s
s 2 = 14, 7
und die Teststatistik
√
√
· (x − µ0 ) =
9
14,7
· (55, 7 − 50) ≈ 1, 16.
Im Fall α = 0, 1 und H1 : µ > 50 wird t mit dem
(1 − α)Quantil der t8 Verteilung (wegen n = 9 ⇔ n − 1 = 8)
verglichen:
t = 1, 16 < t8; 0,1 = 1, 397
(aus Tabelle)
Damit ist auch hier ist die Alternative
und
H0 : µ = 50
H1 : µ > 50
abzulehnen
beizubehalten.
0
Im Fall H1 : µ 6= µ0 betrachtet man
0
H1 wegen |t| < t8; 0,95 ebenfalls ab.
t8;
0,95
= 1, 860
und lehnt
test13.pdf, Seite 31
Zusammenfassung: Tests für den Erwartungswert
einer Normalverteilung
Gegeben sei eine normalverteilte Gröÿe mit Erwartungswert
und Varianz
σ
2
und die Nullhypothese
Zu einer Stichprobe vom Umfang
2
n
µ
H0 : µ = µ 0 .
mit Mittelwert
x
und
empirischer Varianz s berechnet man die Teststatistik
√
pn
n
I z =
· (x − µ0 ), falls σ 2 bekannt ist,
·
(x
−
µ
)
=
0
σ
σ2
√
p
n
I t =
· (x − µ0 ) = sn2 · (x − µ0 ), falls σ 2 unbekannt ist.
s
Entscheidungsregel
Bei einem Signikanzniveau
anzunehmen und
H0
α
ist die Alternative
H1
zu verwerfen, falls
z < −z1−α bzw. t < −tn−1; 1−α im Fall H1 : µ < µ0 ,
I z > z1−α bzw. t > tn−1; 1−α im Fall H1 : µ > µ0 ,
I |z| > z1− α bzw. |t| > tn−1; 1− α im Fall H1 : µ 6= µ0 .
Andernfalls wird H1 abgelehnt und H0 beibehalten.
I
2
2
test13.pdf, Seite 32
Bemerkungen
I Wegen des zentralen Grenzwertsatzes können der
GauÿTest und der
t Test
auch bei nicht normalverteilten
Merkmalen benutzt werden, so lange der
n ≥ 30).
p Wert das
Stichprobenumfang groÿ genug ist (Faustregel
I Zu einer gegebenen Stichprobe gibt der
kleinstmögliche Niveau
α
an, zu dem die Nullhypothese
verworfen wird.
Beispiel 1: Im ersten Beispiel zum GauÿTest (µ0
= 100,
x = 99, σ = 2, n = 25 und H1 : µ < 100) liegt der
p Wert bei 0, 62 %. Er entspricht der Wahrscheinlichkeit
unter H0 , dass das Stichprobemittel kleiner oder gleich
dem beobachteten Wert ist.
Beispiel 2: Beim 100maligen Würfeln liegt der
p Wert
für 24 Sechsen bei 3, 8% (Wahrscheinlichkeit für 24 oder
mehr Sechsen unter
H0 ).
test13.pdf, Seite 33
Der
χ2 (Streuungs-)Test
ist ein Test für die Varianz
(ChiQuadratTest)
σ2
einer normalverteilten
Zufallsgröÿe.
H0 : σ 2 = σ02 und als
2
2
2
2
Fälle σ < σ0 oder σ > σ0
Man betrachtet die Nullhypothese
Alternative
σ 2 6= σ02 .
H1
einen der drei
Mit der empirischen Varianz
Umfang
n
s2
einer Stichprobe vom
berechnet man die Teststatistik
y = (n − 1) ·
s2
,
σ02
von der sich zeigen lässt, dass sie unter
mit
m =n−1
χ
H0
einer
χ2 Verteilung
Freiheitsgraden genügt.
Die Entscheidungsregel vergleicht
2
oder
y
mit Quantilen der
Verteilung, die ebenfalls in Tabellen aufgeführt sind.
test13.pdf, Seite 34
Entscheidungsregel beim
Die Alternative
H1
χ2 Test
wird angenommen und
H0 : σ 2 = σ02
verworfen, falls
I
I
I
y < χ2n−1; α
y > χ2n−1; 1−α
y < χ2n−1; α oder y > χ2n−1; 1− α
2
Dabei sind
n−1
χ2n−1; α
2
etc. die Quantile der
im Fall
im Fall
im Fall
H1 : σ 2 < σ02 .
H1 : σ 2 > σ02 ,
H1 : σ 2 6= σ02 ,
χ2 Verteilung
mit
Freiheitsgraden.
Zu beachten ist, dass die
χ2 Verteilung
im Gegensatz zur
t Verteilung nicht symmetrisch ist. Somit gilt
2
nicht χm; α = −χ2m; 1−α . Insbesondere ist beim zweiseitigen
χ2 Test die Teststatistik y immer mit zwei verschiedenen
Normal- und
Quantilen zu vergleichen.
Tabellen der
kleine
χ2 Verteilung
enthalten immer auch Quantile für
α.
test13.pdf, Seite 35
Beispiel
Kritischer Bereich (rot) eines zweiseitigen
H1 : σ 2 6= σ02 ) zum Niveau α = 0, 1 ⇔ α
Stichprobenumfang
2
χ2 Tests (d. h. mit
= 0, 05 bei einem
n = 9 ⇔ n − 1 = 8.
H0 : σ 2 = σ02 wird verworfen, wenn entweder
y < χ28; 0,05 = 2, 73 oder y > χ28; 0,95 = 15, 51
(Werte aus Tabelle).
Liegt die Teststatistik
y
zwischen beiden Quantilen (im
grünen Bereich), so wird
H0
beibehalten.
test13.pdf, Seite 36
Zahlenbeispiel
H0 : σ = 20 ⇔ σ 2 = 400 gegen H1 : σ 6= 20
zum Niveau α = 10% anhand einer Stichprobe vom Umfang
n = 9 mit empirischer Varianz s 2 = 217, 5 (vergleiche Beispiel
Zu testen sei
zum GauÿTest). Man erhält
y = (n − 1) ·
s2
σ02
=8·
217,5
400
was mit den Quantilen
χ28;
= 4, 35,
0,05
= 2, 73
und
χ28;
0,95
= 15, 51
zu
vergleichen ist.
Wegen 2, 73
< y < 15, 51
Bei der Alternative
2
10%Quantil χ8; 0,1
Wegen y = 4, 35
H10 abgelehnt.
wird
H0
beibehalten.
H10 : σ 2 < σ02 = 202 = 400
= 3, 49 verglichen.
> 3, 49
wird auch hier
H0
wird
y
mit dem
beibehalten und
test13.pdf, Seite 37
Bemerkungen
I Erwartungswert und Stichprobenmittel spielen für die
Varianz keine Rolle und gehen nicht in die Berechnung
ein.
I Der
χ2 Test
setzt grundsätzlich (auch bei groÿem
n)
eine
Normalverteilung voraus, da der zentale Grenzwertsatz
auf die empirische Varianz
Teststatistik
y
s2
und somit auf die
nicht anwendbar ist.
test13.pdf, Seite 38
Der
χ2 Anpassungstest
testet, ob ein diskretes Merkmal eine vorgegebene Verteilung
P(X = ai ) = pi
a1 , ..., am für die möglichen
p1 , ..., pm für die zugehörigen
hat. Dabei stehen
Ausprägungen des Merkmals und
Wahrscheinlichkeiten.
Hat man eine Stichprobe vom Umfang
Häugkeiten
h1 , ..., hm ,
n
mit den absoluten
so ist die Teststatistik
m
X
(hi − npi )2
y=
npi
i=1
für hinreichend groÿe
alle
n)
n
näherungsweise
n · pi ≥ 5 ⇔ n ≥ p5i für
mit m − 1 Freiheitsgraden.
(Faustregel
χ2 verteilt
test13.pdf, Seite 39
χ2 Anpassungstest,
Durchführung
H0 : P(X = ai ) = pi
für
i = 1, ..., m,
H1 : P(X = ai ) 6= pi
für mindestens ein
H0
wird beim Niveau
α
verworfen, falls
i.
y > χ2m−1; 1−α .
Beispiel
h1 = 22 Einsen, h2 = 10 Zweien,
h5 = 15 Fünfen und h6 = 25
mit p1 = ... = p6 = 1/6 hat dann
100maliges Würfeln ergibt
h3 = 16
Dreien,
h4 = 12
Vieren,
Sechsen. Die Teststatistik
den Wert
y ≈ 10, 04.
y < χ25;
0,95 = 11, 07 kann die Nullhypothese H0 , dass
der Würfel fair ist, bei einem Niveau von α = 5% nicht
Wegen
verworfen werden.
Bei
α = 10%
dagegen wird
H0
wegen
y > χ25;
0,9
= 9, 236
verworfen.
test13.pdf, Seite 40
Bemerkung
Bei stetigen Merkmalen (oder bei diskreten Merkmalen, die
zu viele verschiedene Werte annehmen) teilt man die
Merkmale in Klassen ein.
Auf die Wahrscheinlichkeitsverteilung der Klassen kann dann
ein
χ2 Anpassungstest
durchgeführt werden, wenn die Klassen
so gewählt sind, dass die Bedingung
npi ≥ 5
für jede Klasse
erfüllt ist.
In der Praxis wird der
χ2 Anpassungstest
oft benutzt, um
festzustellen, ob ein Merkmal einer bestimmten Verteilung
(z. B. Normalverteilung) genügt.
Der Ansatz kann auch dazu benutzt werden, zu testen, ob
zwei Merkmale unabhängig sind.
test13.pdf, Seite 41
Kondenzintervalle: Beispiel
Gegeben sei eine Stichprobe von Umfang
n = 20
eines
normalverteilten Merkmals mit unbekanntem
Erwartungswert
µ
und bekannter Varianz
arithmetische Mittel (das eine Schätzung
Stichprobe sei
σ 2 = 5. Das
für µ liefert)
der
x = 9.
Jetzt kann für verschiedene Werte für
µ0
getestet werden, ob
sie als Erwartungswert in Frage kommen. Dazu prüft man, ob
die Hypothese
H0 : µ = µ0 einen GauÿTest zu einem
α besteht, d. h. nicht verworfen
vorgegebenen Niveau
Dazu wählen wir
α = 0, 1
wird.
(als Toleranz, mit der eine
Fehlentscheidung in Kauf genommen wird) und berechnen die
Teststatistik
z=
pn
σ2
· (x − µ0 ) =
q
20
5
für verschiedene Werte von
· (9 − µ0 ) = 2 · (9 − µ0 )
µ0 .
test13.pdf, Seite 42
Fortsetzung Beispiel
Für
µ0 = 9
z =1
erhält man beispielsweise
und für
µ0 = 10
ist
z = 0,
für
µ0 = 8 , 5
ist
z = −2.
Beim zweiseitigen GauÿTest wird |z| mit dem
α
1−
Quantil z0,95 = 1, 645 verglichen.
2
Bei
µ0 = 9
und
µ0 = 8, 5
wird
H 0 : µ = µ0
jeweils
beibehalten, d. h. beide Werte kommen als Erwartungswert in
Frage. Dagegen wir die Hypothese
α = 0, 1
verworfen, d. h.
µ0 = 10
µ = 10
zum Niveau
kommt als Erwartungswert
eher nicht in Frage.
Man kann nun die Menge aller
Nullhypothese
H0 : µ = µ0
µ∈R
bestimmen, für die die
beibehalten wird.
test13.pdf, Seite 43
Fortsetzung Beispiel
H 0 : µ = µ0
wird zum Niveau
α = 0, 1
beibehalten
⇔ |z| ≤ z0,95 ⇔ |2 · (9 − µ0 )| ≤ 1, 645
⇔ |9 − µ0 | = |µ0 − 9| ≤
1
2
· 1, 645 = 0, 822.
H0 genau dann beibehalten, wenn
|9 − µ0 | ≤ 0, 822 ⇔ 8, 178 ≤ µ0 ≤ 9, 822.
Somit wird
Diese Werte bilden das
für den Erwartungswert
1
Kondenzintervall I = [8, 178; 9, 822]
µ zum Vertrauensniveau
− α = 0, 9 = 90 %.
Man kann also bei einer Irrtumswahrscheinlichkeit von 10 %
davon ausgehen, dass der unbekannte Erwartungswert in
diesem Intervall liegt.
test13.pdf, Seite 44
Verallgemeinerung
Gegeben sei eine normalverteilte Zufallsgröÿe mit
unbekanntem Erwatungswert
µ
und bekannter Varianz
sowie eine Stichprobe vom Umfang
Mittel
x.
n
mit arithmetischem
Zu einem vorgegebeben Vertrauensniveau 1
α
1−
Quantil z1− α der
betrachtet wählt man das
2
c=
q
σ2
n
· z1− α
2
Dann gilt dann unabhängig vom konkreten Wert für
P(|x − µ| ≤ c) = 1 − α,
d. h. bei einer
Irrtumswahrscheinlichkeit
α
µ
−α
2
Standardnormalverteilung und berechnet
dass
σ2
µ
kann davon ausgegangen werden,
im (zweiseitigen) Kondenzintervall
I = [x − c; x + c] = x −
q
σ2
n
· z1− α ; x +
2
q
σ2
n
· z1− α
2
liegt.
test13.pdf, Seite 45
Bemerkung
Die vereinfachende Aussage, dass
1
−α
µ
mit Wahrscheinlichkeit
im berechneten Kondenzintervall liegt, ist nicht ganz
korrekt, da der der Verteilung zugrunde liegende unbekannte
Parameter
µ
keine Zufallsgröÿe ist. Somit ergeben Aussagen
über Wahrscheinlichkeiten für die Lage von
µ
eigentlich keinen
Sinn.
Die bei der Herleitung des Kondenzintervalls betrachtete
Zufallsgröÿe ist das Stichprobenmittel
x,
für welches sich die
Verteilung berechnen lässt.
Dadurch wird die Aussage, dass mit Wahrscheinlichkeit 1
die Abschätzung
P(|x − µ| ≤ c)
x −c
liegt, sinnvoll.
und
x +c
gilt und somit
µ
−α
zwischen
test13.pdf, Seite 46
Einseitige Kondenzintervalle
(1α)Quantil z1−α als
i
σ
√
bzw.
−∞; x + n z1−α
erhält man analog mit dem
h
σ
√
x − n z1−α ; ∞
Bemerkungen
I Da mit Wahrscheinlichkeiten einer stetigen Verteilung
gerechnet wird, kann man auch jeweils oene Intervalle
mit den gleichen Grenzen als Kondenzintervalle
betrachten.
I Je kleiner
α
gewählt wird, desto breiter werden die
Kondenzintervalle.
I Je gröÿer
σ
ist, desto breiter werden die
Kondenzintervalle.
I Je gröÿer
n
wird, desto schmaler werden die
Kondenzintervalle.
test13.pdf, Seite 47
Beispiel
Gegeben sei eine Stichprobe vom Umfang
arithmetischem Mittel
x = 11, 5.
n = 16 und
σ 2 = 1 sei
Die Varianz
bekannt.
Ein einseitiges Kondenzintervall der Form
Niveau 1
− α = 0, 95
a=x−
√1
16
also gilt
µ ≥ 11, 089
I = [a; ∞)
zum
erhält man mit
· z0,95 = 11, 5 − 14 · 1, 6449 ≈ 11, 089,
bei einer Irrtumswahrscheinlichkeit von 5%.
Ist ein nach oben beschränktes einseitiges Kondenzintervall
der Form
(−∞; b]
zum Niveau 1
− α = 99%
gesucht, so
erhält man
b=x+
√1
also gilt
µ ≤ 12, 082
16
· z0,99 = 11, 5 + 41 · 2, 3263 ≈ 12, 082,
bei einer Irrtumswahrscheinlichkeit von 1%.
test13.pdf, Seite 48
Kondenzintervalle bei unbekannter Varianz
Wie bei den Test wird in diesem Fall die Varianz
Stichprobenvarianz
s
2
σ2
durch die
ersetzt. Statt der Quantile der
Normalverteilung werden die entsprechenden Quantile
bzw.
tn−1;1− α
2
der
t Verteilung
mit
n−1
tn−1;1−α
Freiheitsgraden
benutzt, die ebenfalls einer Tablle entnommen werden können.
Ein zweiseitiges Kondenzintervall für den Erwartungswert
µ
einer normalverteilten Gröÿe mit unbekannter Varianz zum
− α hat dann die Form
s
s
I = [x − c; x + c] = x − √ · tn−1;1− α ; x + √ · tn−1;1− α
n
n
q
s
mit c =
· tn−1;1− α , wobei n der Stichprobenumfang, x
n
2
das arithmetische Mittel und s die empirische Varianz ist.
Vertrauensniveau 1
2
2
2
2
test13.pdf, Seite 49
Beispiel
Eine Stichprobe vom Umfang
n=9
aus einer normalverteilten
Grundgesamtheit mit unbekanntem Erwartungswert
unbekannter Varianz
σ
2
µ
und
ergebe folgende (geordneten und
gerundeten) Werte: 19, 29, 36, 38, 47, 52, 57, 59, 62
x = 44 13 , die empirische
√
s 2 = 217, 5 ⇒ s = s 2 ≈ 14, 7.
Der Mittelwert ist
Varianz
Ein zweiseitiges Kondenzintervall zum Niveau 90% für
erhält man damit als
c=
√s
9
Es folgt
· t8;
0,95
=
1
3
I = [x − c, x + c]
µ
mit
· 14, 7 · 1, 86 ≈ 9, 1.
I = [44, 3 − 9, 1;
44, 3
+ 9, 1] = [35, 2;
53, 4],
also kann bei einer Irrtumswahrscheinlichkeit von 10% davon
ausgegangen werden, dass
µ
zwischen 35,2 und 53,4 liegt.
test13.pdf, Seite 50
Einseitige Kondenzintervalle
erhält man analog mit den entsprechenden
h
x−
√s
n
· tn−1;1−α ; ∞
bzw.
(1α)Quantilen:
−∞; x +
√s
n
· tn−1;1−α
i
Bemerkungen
I Der zentrale Grenzwertsatz erlaubt es, die vorgestellten
Formeln für eine beliebige Verteilung der
unbekanntem Erwartungswert
unbekannter) Varianz
σ2
µ
Xk
mit
und (bekannter oder
zu benutzen, da für groÿe
n
n ≥ 30) X annähernd normalverteilt ist.
Verteilungen der Xk , deren Typ bekannt ist (z. B.
(Faustregel
I Für
Binomialverteilung, PoissonVerteilung), gibt es eine
Reihe weiterer Formeln zur Bestimmung von
Kondenzintervallen. Dabei wird oft ausgenutzt, dass es
einen Zusammenhang zwischen Erwartungswert und
Varianz gibt.
test13.pdf, Seite 51
Einseitige Kondenzintervalle im Beispiel
erhält man als
(−∞, x + c̃]
s
c̃ = √ · tn−1;
n
und
1−α
=
[x − c̃, ∞)
14, 7
3
Ist also eine untere Abschätzung für
mit
· 1, 397 ≈ 6, 9.
µ
gesucht, so kann man
mit einer Irrtumswahrscheinlichkeit von 10% davon ausgehen,
dass
µ ≥ 44, 3 − 6, 9 = 37, 4.
Eine obere Abschätzung erhält man durch
µ ≤ 44, 3 + 6, 9 = 51, 2.
Bemerkung/Warnung:
Die Wahrscheinlichkeit, dass beide
Abschätzungen gleichzeitig stimmen, liegt nur noch bei 80%,
denn dies entspricht einem zweiseitigen Kondenzintervall zum
Niveau 0,8.
test13.pdf, Seite 52
Kondenzintervall für die Varianz einer
Normalverteilung
Sind die
Xk
normalverteilt mit beliebigem Erwartungswert
und unbekannter Varianz
σ2,
Kondenzintervall zum Vertrauensniveau 1
Quantile der
wobei
s2
Umfang
2
µ
so erhält man ein zweiseitiges
−α
mit Hilfe der
χn−1 Verteilung:
"
#
(n − 1)s 2
(n − 1)s 2
;
,
I =
χ2n−1;1−α/2
χ2n−1;α/2
die empirische Varianz einer Stichprobe vom
n
ist.
test13.pdf, Seite 53
Beispiel
Hat eine Stichprobe vom Umfang
Varianz
s 2 = 4, 6,
n = 21
die empirische
so erfolgt die Bestimmung eines
Kondenzintervalls
I
zum Niveau 1
− α = 95% (⇔ α = 0, 05)
in folgenden Schritten:
I Aus einer Tabelle sind die benötigten Quantile für
α
= 0, 025 und 1 − α = 0, 975 der χ2 Verteilung mit
2
2
n − 1 = 20 Freiheitsgraden zu entnehmen:
χ220; 0,025 = 9, 591 und χ220; 0,975 = 34, 17
I Das gesuchte Kondenzintervall erhält man durch
Einsetzen in die Formel mit
I =
h
92
92
34,17 ; 9,591
i
≈ [2, 69;
(n − 1) · s 2 = 20 · 4, 6 = 92:
9, 59],
d. h. bei einer Irrtumswahrscheinlichkeit von 5 % liegt die
Varianz zwischen 2, 69 und 9, 59 und die
Standardabweichung
σ=
√
σ2
zwischen 1, 64 und 3, 10.
test13.pdf, Seite 54
Einseitige Kondenzintervalle für die Varianz
− α erhält man durch Betrachtung der α bzw.
− αQuantile der χ2 Verteilung:
(n − 1)s 2
(n − 1)s 2
; ∞
bzw.
I = 0;
I =
χ2n−1;1−α
χ2n−1;α
zum Niveau 1
1
Im zweiten Fall ist die untere Grenze 0, da die Varianz nicht
negativ werden kann.
Kondenzintervalle für die Standardabweichung erhält man in
allen betrachteten Fällen, indem man die Wurzeln der
Intervallgrenzen der Varianz zieht.
test13.pdf, Seite 55
Im Beispiel
n = 21, s 2 = 4, 6
und 1
− α = 0, 95
χ220;
0,05 = 10, 85 und
= 31, 41 und erhält die einseitigen Konfdenzintervalle
h
20·4,6
I1 = 31,41 ; ∞ = [2, 93; ∞) sowie
i
h
20·4,6
I2 = 0; 10,85 = [0; 8, 48].
betrachtet man die Quantile
χ220; 0,95
Bemerkung / Warnung
Auf die Voraussetzung, dass die
Xk
normalverteilt sind, kann
bei der Angabe eines Kondenzintervalls für die Varianz nicht
verzichtet werden, da der zentrale Grenzwertsatz auf
s2
nicht
anwendbar ist.
test13.pdf, Seite 56
Herunterladen