Kapitel 6 : Punkt – und Intervallschätzer

Werbung
– 107 –
Kapitel 6 : Punkt – und Intervallschätzer
§1 Punktschätzungen
1.1 In der Statistik wollen wir Rückschlüsse auf das Wahrscheinlichkeitsgesetz ziehen, nach dem ein von uns beobachtetes Zufallsexperiment abläuft. Hierzu beobachten wir unabhängige Wiederholungen einer
Zufallsvariablen X , d.h. iid. Zufallsvariable X1, X2, . . ., Xn , die gemäß
F, dem Zufallsgesetz von X , verteilt sind. : = (X1, X2, . . ., Xn)
bezeichnet man als Stichprobe aus F der Länge n und die hierfür
beobachteten Werte : = (x1, x2, . . ., xn) als Daten. Mit Hilfe der Daten
wollen wir dann gewisse Parameter θ schätzen, d.h. gewisse unbe-
kannte reelle Zahlen, die das spezielle Gesetz F charakterisieren.
Wäre z.B. X =d N(µ, σ2), wobei µ ∈ IR und 0 < σ2 < ∞, dann sind µ und
σ2 solche Parameter.
1.2 Das Grundanliegen des Schätzens besteht nun darin, daß man für
jeden der Parameter θ eine „geeignete“ Statistik T: IRn → IR sucht, so
daß der den Daten = (x1, x2, . . ., xn) zugeordnete Wert T() (be-
kannte reelle Zahl) gerade das „Wesentliche“ von θ numerisch widerspiegelt.
Jeder solche Wert T() heißt Schätzwert von θ und wird mit be-
zeichnet. Man kann einen Schätzwert von θ intuitiv erhalten oder mit
Hilfe von konkreten Methoden.
Die zugehörige Schätzprozedur T() heißt Schätzer von θ .
Zwei „wünschenswerte“ Eigenschaften eines Schätzers T() von θ sind:
– 108 –
1) Erwartungstreue (oder Unverzerrtheit) :
E(T()) = θ .
Bzw. mindestens asymptotische Erwartungstreue:
lim→
= θ ,
(„im Mittel“ schätzt den Parameter θ richtig).
2) Asymptotisches Verschwinden der Varianz :
lim→
= 0 .
(Im Falle der Erwartungstreue bedeutet dies, daß die
„mittlere quadratische Abweichung“ − für wachsenden Stichprobenumfang gegen Null strebt.)
Sind beide Eigenschaften erfüllt, dann gilt sogar (wegen der Tschebyscheffschen Ungleichung) die (schwache) Konsistenz:
konvergiert stochastisch gegen θ , d.h.
− ≥ ≤
→
0
∀ >0.
Beispiel 1.3 : X besitze einen Erwartungswert µ = E(X) und eine
Varianz σ2 = Var(X).
Da man µ als Mittelwert der Verteilung F von X verstehen kann, liegt es
nahe, µ mit Hilfe des Stichprobenmittelwerts =
d.h.
= =
&
&
∑()& ( zu schätzen,
&
∙ - ∙ . = µ,
∑()& ( ist ein Schätzer für µ.
1) ist erwartungstreu: =
&
∑()& (( ) =
da X1, X2, . . ., Xn iid.
– 109 –
2) →
0 : = ∑()& ( =
&
∙ - ∙ 0 =
/
&
1/
0,
→
da X1, X2, . . ., Xn iid.
P
⇒ n
→ E(X),
→∞
dies ist gerade das schwache Gesetz der großen Zahlen.
ist also ein konsistenter Schätzer von µ .
Beispiel 1.4 : X wie in Beispiel 1.3. Es liegt nahe, σ2 = Var (X) durch die
Stichprobenvarianz S2 = ∑()&( − zu schätzen. Da jedoch
&
E(S2) =
2&
0 ,
ist dieser Schätzer für σ2 verzerrt, aber immer noch asymptotisch
erwartungstreu.
()&
()&
1
1
(3 ) = 5( − = 5 ( − - ∙ =
&
1
5( − . − - ∙ − . =
()&
- ∙ ( − - ∙ =
Bemerkung 1.5 :
&
∙ - ∙ 0 −
1/
=
2&
Aus diesem Grund definiert man die
unverzerrte Stichprobenvarianz : 36 ∶=
2&
3 =
Offensichtlich ist 36 erwartungstreu für σ 2:
&
2&
0 .
∑()&( − .
(36 ) = 0 .
In der Praxis wird fast ausschließlich mit 36 gearbeitet und meistens
wird 36 als Stichprobenvarianz bezeichnet und als S2 geschrieben.
– 110 –
§2 Die χ2– und die t – Verteilung; Quantile
Für das Weitere benötigen wir noch zwei neue Verteilungen.
2.1 Es seien X1, X2, . . ., Xn =d N(0,1) iid. Dann ist
Y:=
∑
n
j=1
d
X 2j = χ 2n
gemäß einer χ2 – Verteilung mit n Freiheitsgraden (d.h. χ 2n ) verteilt.
χ 2n hat die Dichte:
0

x<0
1
f(x) = 
 ( 2 ) Γ( n2 )
n
⇒
∫
∞
0
x
n
−1
2
e
− 12 x
x≥0 ,
wobei
Γ(a) =
∫
∞
0
x a −1e −x dx , für a > 0.
f ( x )dx = 1.
Weiter gilt:
Γ(n) = (n – 1)! für alle n ∈ IN , und deshalb ist
χ 22 = Exp( 12 ).
xn;β mit
∫
x n ;β
0
Γ(n+½) =
()!
! ∙ /9
∙ √; für alle n ∈ IN 0 .
f ( x )dx = β, 0 < β < 1, heißt β – Quantil von χ 2n .
Das Quantil ist die Umkehrfunktion der Verteilungsfunktion.
2.2 Es seien X0, X1, . . ., Xn =d N(0,1) iid. Dann ist
X0
Z:=
d
= tn
n
1
n
∑X
gemäß einer Studentschen t – Verteilung
2
j
j=1
mit n Freiheitsgraden (d.h. gemäß tn) verteilt.
– 111 –
Allgemein: Y =d N(0,1) und V =d < seien unabhängig ⇒
tn hat die Dichte: f(x) =
n +1
1 Γ( n2+1 )
2 −
(1 + xn ) 2
n
nπ Γ( 2 )
, x ∈ IR . ⇒
=
?
> @
9
∫
∞
−∞
d
= tn .
f ( x )dx = 1.
f(x) ist symmetrisch um die y – Achse.
tn;β mit
2.3
∫
t n ;β
−∞
f ( x )dx = β, 0 < β < 1, ist das β – Quantil von tn.
Für die Standard – Normalverteilung N(0, 1) bezeichnet man das
β – Quantil mit zβ , 0 < β < 1 :
2.4
/
F G 2D
C /
B
√A 2
&
E = β .
Für n ≥ 20 ist die zentrale Region der tn – Verteilung einer
N(0, 1) – Dichte ähnlich. Im Grenzfall (n → ∞) fällt diese Dichte mit φ(x)
zusammen. (Für die Anwendung unterscheiden sich die üblichen Wahrscheinlichkeiten von t120 und Φ nicht mehr.)
– 112 –
Bemerkung 2.5 : Gegeben sei die Stichprobe:
X1, . . ., Xn =d N(µ,σ2) iid.
∶=
Betrachte den Stichprobenmittelwert
die unverzerrte Stichprobenvarianz
(i)
=d H .,
1/
und deshalb
J2K
1
&
36 ∶=
∑()& (
und
∑ − .
2& ()& (
&
d
√- = N(0,1)
(siehe Kapitel 5, Beispiel 2.5 c), Bemerkung).
(ii) Ist σ2 unbekannt, so muß es durch 36 geschätzt werden.
Man kann zeigen, daß in diesem Fall
(2&)LM/
1/
unabhängig ist. Wegen 2.2 ergibt sich, daß
J2K
LM
√- =
NOP
√
Q
/
M
> ? ∙ (9O?)R
9O?
Q/
= <2&
und von
d
J2K
1
√-
=d tn – 1 .
Den Verlust des einen Freiheitsgrades kann man sich folgendermaßen
plausibel machen:
Zur Berechnung von 36 muß aus den Daten
geschätzt werden. Bei bekanntem sind dann aber nur noch (n – 1)
der Variablen X1, X2, . . ., Xn frei wählbar.
§3 Konfidenzintervall für den Erwartungswert µ einer Normalverteilung
bei bekannter und bei unbekannter Varianz σ2
X1, . . ., Xn =d N(µ,σ2) iid.
sei eine normalverteilte Stichprobe.
3.1 σ2 = σ 02 bekannt :
Wir wollen den Erwartungswert µ schätzen und gleichzeitig einen
Hinweis auf die Genauigkeit und die Vertrauenswürdigkeit des
Schätzwertes erhalten.
– 113 –
Es liegt nahe, den Mittelwert µ durch den Stichprobenmittelwert zu
schätzen. Weiter wählt man eine Größe C so, daß das
Intervall
S − T, + TV
zufällige
µ mit hoher Wahrscheinlichkeit überdeckt,
d.h. daß dann der Schätzfehler − . ≤ C.
Hierzu gibt man sich eine Wahrscheinlichkeit γ nahe bei 1 vor
(typische Werte sind: γ = 0,9; γ = 0,95; γ = 0,99 ) und bestimmt C so,
daß
S − T, + TV ∋ . ≥ γ .
Da σ0 = X0Y die Standardabweichung unserer Normalverteilung ist,
wählt man C = b⋅σ0 für eine geeignete Konstante b > 0.
Wir wissen, daß
J2K
1Z
d
√- = N(0, 1). Deshalb ergibt sich:
S − [ ∙ 0Y , + [ ∙ 0Y V ∋ . ⇔ − . ≤ b⋅σ0
⇔
und deshalb
S − [ ∙ 0Y , + [ ∙ 0Y V ∋ . = P( – b⋅ n ≤
X −µ
σ0
\
J2K
1Z
√- \ ≤ b⋅ n
n ≤ b⋅ n ) =
= Φ (b⋅ n ) – Φ (– b⋅ n ) = Φ (b⋅ n ) – (1 – Φ (b⋅ n )),
da φ(x) symmetrisch um die y – Achse ist :
= 2⋅ Φ (b⋅ n ) – 1 =! γ ⇔ Φ (b⋅ n ) =
&]^
⇔ b⋅ n = _?`a ⇔ b =
/
&
√
∙ _?`a
/
– 114 –
Als Ergebnis erhält man
Iγ = b −
1Z
√
∙ _?`a , +
/
1Z
√
∙ _?`a c = : ±
/
1Z
√
∙ _?`a
/
ist das gesuchte γ – Konfidenzintervall (bzw. γ⋅100% – KI) für µ .
γ heißt Konfidenzniveau.
3.2 σ2 unbekannt :
In diesem Fall müssen wir σ durch Su = >
d.h. wir wählen C = b⋅Su .
Nach Bemerkung 2.5 wissen wir, daß
Deshalb ergibt sich nun :
&
2&
J2K
LM
∑()&( − schätzen,
d
√- = tn – 1 .
S − [ ∙ 36 , + [ ∙ 36 V ∋ . ⇔ − . ≤ b⋅Su
und deshalb
S − [ ∙ 36 , + [ ∙ 36 V ∋ . = P( – b⋅ n ≤
⇔ \
J2K
LM
√- \ ≤ b⋅ n
X −µ
n ≤ b⋅ n ) =
Su
= tn – 1(b⋅ n ) – tn – 1(– b⋅ n ) = tn – 1(b⋅ n ) – (1 – tn – 1(b⋅ n )),
da f(x) symmetrisch um die y – Achse ist :
= 2⋅ tn – 1(b⋅ n ) – 1 =! γ ⇔ tn – 1(b⋅ n ) =
b =
&
√
∙ e2&; ?`a .
/
&]^
⇔ b⋅ n = e2&; ?`a
/
⇔
– 115 –
Als Ergebnis erhält man
Iγ = b −
LM
√
∙ e2&; ?`a , +
/
LM
√
∙ e2&; ?`a c = ±
/
ist das gesuchte γ – Konfidenzintervall für µ .
LM
√
∙ e2&; ?`a
/
Beispiel 3.3 : Wir haben die Körperlängen von n = 6 Exemplaren der
Drosophila melanogaster in Rheinhessen gemessen und einen
Stichprobenmittelwert = 2,5 (mm) sowie eine Standardabweichung
su = 0,30 (mm) errechnet. In einer Zeitschrift haben wir gelesen, daß der
„richtige“ Wert 2,3 (mm) ist. Ist dies mit unserem Ergebnis vereinbar?
Zur Beantwortung dieser Frage nehmen wir an, daß die Körperlängen
N(µ, σ2) – verteilt sind, und konstruieren das 95% – Konfidenzintervall
für µ: γ = 0,95 ⇒
⇒ I0,95 = 2,5 ±
Y,gY
√h
1+ γ
2
= 0,975; (n – 1) = 5; t5; 0,975 = 2,571
⋅2,571 = 2,5 ± 0,31 = [2,19; 2,81] ∋ 2,3 ;
d.h. die Angabe in der Zeitschrift ist mit unseren Beobachtungen auf
einem Konfidenzniveau von 95% vereinbar.
Herunterladen