3 Statistische Schätzungen

Werbung
3
Statistische Schätzungen
In der Wahrscheinlichkeitstheorie geht es darum, über Modelle Ereignisse zu bewerten
bzw. Voraussagen über ihr Eintreten zu treffen. Sind nun umgekehrt Daten bekannt, und
wollen wir aus diesen entweder Parameter für die statistischen Verteilungen berechnen
oder Voraussagen über Ereignisse treffen, so müssen wir diese aus den Daten schätzen.
Wir unterscheiden dabei Punktschätzer, das sind Schätzungen von (unbekannten) Parametern einer bekannten Verteilung, und Intervallschätzer, das sind Schätzer, die ein
Intervall angeben, in dem der unbekannte Parameter mit einer bestimmten Wahrscheinlichkeit liegt.
3.1
Punktschätzungen
Wir wollen aus Beobachtungen einen uns unbekannten Parameter einer bekannten Verteilung schätzen.
Beispiel 3.1
Daten Xi : 27.3
31.5
28.4
30.1
31.0
Wir nehmen an, dass Xi ∼ N (µ, σ 2 )
Welcher Schätzwert µ
b ist nun sinnvoll für das unbekannte µ?
Welcher Schätzwert σ
b2 ist sinnvoll für das unbekannte σ 2 ?
Für den unbekannten Erwartungswert µ wird meist der Mittelwert
n
1X
µ
b=X =
Xi = 29.66
n i=1
genommen. Eine andere Wahl wäre aber auch µ
b = med(X) = 30.1.
Welcher dieser beiden Schätzer ist sinnvoll?
Als Schätzer für die Varianz nehmen wir die Stichprobenvarianz
n
1 X
σ
b =s =
(Xi − X)2 = 1.77.
n − 1 i=1
2
2
Ist dies gerechtfertigt?
Was muss für einen Schätzer gelten? Sinnvoll ist doch, dass der Erwartungswert des
Schätzers dem tatsächlichen Wert entsprechen soll, und nicht von diesem abweichen
soll. Noch dazu soll der geschätzte Wert den tatsächlichen möglichst genau treffen. Eine
Grundvoraussetzung ist die Konsistenz des Schätzers, d. h., je mehr Daten zur Verfügung
stehen, desto genauer soll er den geschätzten Wert bestimmen. Dazu dienen folgende Definitionen.
1
Definition 3.1 (erwartungstreu, unverzerrt)
Ein Schätzwert ϑb heißt erwartungstreu (unverzerrt, unbiased ),
b = ϑ für alle ϑ.
falls Eϑ (ϑ)
Definition 3.2 (effizient)
Seien ϑb1 und ϑb2 zwei erwartungstreue Schätzwerte. Falls Varϑ (ϑb1 ) ≤ Varϑ (ϑb2 ) für alle
möglichen Parameter ϑ, so heißt ϑb1 besser als ϑb2 .
Der Schätzer mit der kleinsten Varianz heißt effizient (efficient).
Beispiel
Pn 3.2
1
µ
b = n i=1 Xi ist erwartungstreu für den Mittelwert µ der Normalverteilung.
Pn
1
2
s2 = n−1
i=1 (Xi − X) ist erwartungstreu für die Varianz, da
P
1
E(s2 ) = n−1
E( ni=1 (Xi − X)2 )
P
1
= n−1
E( ni=1 [(Xi − µ) − (X − µ)]2 )
P
1
= n−1
E( ni=1 [(Xi − µ)2 − 2(Xi − µ)(X − µ) + (X − µ)2 ])
P
P
1
E( ni=1 (Xi − µ)2 − 2(X − µ) ni=1 (Xi − µ) + n(X − µ)2 )
= n−1
P
P
1
= n−1
E( ni=1 (Xi − µ)2 − 2(X − µ)n n1 ni=1 (Xi − µ) + n(X − µ)2 )
P
1
= n−1
E( ni=1 (Xi − µ)2 − 2n(X − µ)2 + n(X − µ)2 )
P
1
= n−1
E( ni=1 (Xi − µ)2 − n(X − µ)2 )
P
1
= n−1
[ ni=1 E((Xi − µ)2 ) − nE((X − µ)2 )]
2
1
= n−1
[nσ 2 − n σn ]
= σ2
Das Maximum-Likelihood Prinzip
Es ist das wichtigste Konstruktionsprinzip von Schätzern, es funktioniert aber nur dann,
wenn die den Daten zu Grunde liegende Verteilung bekannt ist.
Sei f (x, ϑ) eine Familie von Dichten, wobei ϑ ein Parameter (oder Parametervektor) ist,
der die Dichten näher bestimmt. Wir schreiben Pϑ für die Wahrscheinlichkeit, Eϑ für den
Erwartungswert und Varϑ für die Varianz.
Da die Zufallsvariablen Xi unabhängig sind, ist die gemeinsame Dichte
f (X1 , . . . , Xn ; ϑ)
gleich dem Produkt der einzelnen Dichten f (Xi , ϑ)
Vorgangsweise:
• Setze die Daten in die Dichte ein:
`(ϑ) +
n
Y
f (Xi , ϑ) = f (X1 , ϑ) · · · f (Xn , ϑ)
i=1
2
b welches die Likelihood-Funktion
• Finde jenes ϑ,
`(ϑ) =
n
Y
f (Xi , ϑ)
i=1
oder die Log-Likelihood
log(`(ϑ)) =
n
X
log f (Xi , ϑ)
i=1
maximiert (Logarithmieren von Dichten verändert die Lage des Maximums nicht,
da der Logarithmus eine streng monoton wachsende Funktion ist und die Dichten
positive Funktionen sind).
• ϑb ist der Maximum–Likelihood Schätzer .
Beispiel 3.3 (Parameter der Poissonverteilung)
X1 , . . . , Xn ∼ Poisson(λ)
x
Wahrscheinlichkeitsfunktion: f (x, λ) = e−λ λ , x = 0, 1, 2, 3, . . .
x!
Maximum nun direkt ausrechnen, d.h., die Wahrscheinlichkeitsfunktion
f (x1 = X1 , x2 = X2 , . . . , xn = Xn ; λ) = Πni=1 f (Xi , λ)
= e−λ
λX1
λXn
λX1 +···+Xn
· · · e−λ
= e−nλ
X1 !
Xn !
X1 ! · · · Xn !
maximieren (Likelihood), oder einfach über die log-Likelihood
log
Qn
i=1
X +···+Xn
f (Xi , λ) = log e−nλ λX11 !···Xn !
= −nλ + (X1 + · · · + Xn ) log λ − log(X1 ! · · · Xn !)
Wir erhalten den Schätzer durch Maximieren in λ, d. h., durch Differenzieren nach λ:
−n + (X1 + · · · + Xn )
1
=0
b
λ
b = X1 + · · · + Xn = X
λ
n
b=
λ
1
n
Pn
i=1
Xi ist erwartungstreu für den Parameter λ der Poissonverteilung:
b = E( 1 (X1 + · · · + Xn ) = 1 · n · E(Xi ) = E(Xi ) = λ.
E(λ)
n
n
Beispiel 3.4 (Parameter der Normalverteilung)
X1 , . . . , Xn ∼ N (µ, σ 2 )
3
Wahrscheinlichkeitsdichte f (x, µ, σ) = √1 exp − 1 2 (x − µ)2
2σ
σ 2π
n
n
Y
√
1 X
n
log
f (Xi , µ, σ) = − 2
(Xi − µ)2 − n log( 2π) − log σ 2 .
2σ i=1
2
i=1
Maximieren in µ und σ 2 :
∂
:
∂µ
n
1 P 2(X − µ
b) = 0
i
2σ 2 i=1
n
P
Xi = nb
µ
i=1
n
1 PX = X
µ
b= n
i
i=1
∂
:
∂σ 2
n
1 P (X − µ
b)2 − n 2 = 0
i
4
2b
σ i=1
2b
σ
n
P
1 (X − µ
σ
b2 = n
b)2
i
i=1
Der obige ML-Schätzer σ
b2 ist nicht erwartungstreu (vgl. Beispiel 3.2)!
Beispiel 3.5 (Anteilswert einer Binomialverteilung)
Sei X eine binomial verteilte Zufallsvariable, X ∼ B(n, p).
Welche Wahrscheinlichkeit p ist am wahrscheinlichsten, wenn eine Anzahl x von Ausfällen
”
des Experiments beobachtet wurde?“
Likelihood `(p) = f (x, p) = nx px (1 − p)n−x
n
∂
log
+ x log p + (n − x) log(1 − p) = 0
∂p
x
x n−x
−
=0
pb 1 − pb
x(1 − pb) = (n − x)b
p
x
pb =
n
Beispiel 3.6
Seien X1 , X2 unabhängig exponential-verteilt mit E(Xi ) = γ.
Für das unbekannte γ stehen folgende Schätzer zur Auswahl:
X1 + X2
γ
b1 =
oder
γ
b2 = 2 · min(X1 , X2 ).
2
Wir wissen: Var(Xi ) = γ 2 , E(Xi ) = γ ⇒ E(b
γ1 ) = γ, Var(b
γ1 ) = γ2 .
2 min(X1 , X2 ) ∼ exponential-verteilt mit E(b
γ2 ) = γ, Var(b
γ2 ) = γ 2 .
Wir sehen, dass γ
b1 besser (effizienter, genauer) als γ
b2 ist (γ ≥ 12 ), da weniger Schwankungsbreite (Varianz) gegeben ist.
4
3.2
Intervallschätzungen, Konfidenzintervalle
Ein Punktschätzer ϑb eines Parameters alleine enthält noch keine Information über dessen
Genauigkeit. Durch einen Intervallschätzer wird ein Unsicherheitsbereich angegeben, der
als Maß für die Genauigkeit gelten kann, d. h., der geschätzte Parameter ϑb liegt mit einer
gewissen Wahrscheinlichkeit in dem geschätzte Intervall.
Definition 3.3
Ein ermitteltes Intervall Ib heißt Konfidenzbereich (confidence region) zum Niveau 1 − α,
falls für alle Parameter ϑ gilt:
b ≥ 1 − α.
Pϑ {ϑ ∈ I}
Der Konfidenzbereich (das Konfidenzintervall, der Intervallschätzer) überdeckt den wahren Parameter ϑ mit einer Wahrscheinlichkeit von mindestens 1 − α. Dies ist das sogenannte Signifikanzniveau, α ist die Irrtumswahrscheinlichkeit.
Je nach Verwendung sprechen wir auch von Toleranz- oder von Prognose-Intervallen. Die
gesuchten Parameter liegen mit Wahrscheinlichkeit 1 − α in diesen Intervallen.
Da eine Vollerhebung oft teuer bis unmöglich ist, sollen Voraussagen, etwa Wahlprognosen, auch mit Teilerhebungen getroffen werden. Dabei ist es wichtig zu wissen, wie viele
Daten NL erhoben werden müssen (Stichprobenumfang, sample size), um ein Prognoseintervall der Länge L zu erhalten, d. h., eine maximale Abweichung um L/2.
Achtung! Je sicherer wir ein Intervall angeben wollen, d. h., α klein, desto größer wird
das Intervall, desto ungenauer also die Schätzung für den Parameter.
Üblich:
α = 0.05 Ökonomie, Soziologie
α = 0.01 Biologie, Psychologie, Naturwissenschaften
α = 0.001 Medizin
Im Abschnitt über das statistische Testen werden wir uns noch genauer mit dieser Thematik beschäftigen.
Mittelwert einer Normalverteilung (Varianz bekannt)
X1 , . . . , Xn ∼ N (µ, σ 2 ) oder n > 30
σ 2 bekannt
X −µ √ X −µ
X −µ
Statistik:
σ = σX = n σ ∼ N (0, 1)
√
n
α 2
−1
Stichprobenumfang: NL ≥ ( 2σ
L Φ (1 − 2 ))
Voraussetzung:
Wurde die Stichprobe mit Zurücklegen“ gezogen und ist Nn > 0.05, wobei N die Größe
”
der Grundgesamtheit ist, so wird σX mit einer Endlichkeitskorrektur versehen, d. h.,
r
σ
N −n
σ
σX = √
statt σX = √
n N −1
n
5
wird in den Berechnungen verwendet.
√ X − µ α
−1
1−
=1−α
Pµ n
≤Φ
σ 2
Umrechnen in ein Konfidenzintervall:
√ X −µ
α
α
−1
−1
−Φ
1− 2
≤
≤ Φ
1− 2
n σ
√σ Φ−1 1 − α
√σ Φ−1 1 − α
X
≥
−
≥
µ
−
2
2
n
n
α
α
σ
σ
−1
−1
√
√
1− 2
1− 2
Φ
Φ
X+
≥
µ
≥ X−
n
n
Konfidenzintervall:
σ −1 σ −1 α
α
b
I= X−√ Φ
1−
,X + √ Φ
1−
2
2
n
n
Der Intervallschätzer kann auch kurz durch
σ
α
X ± √ Φ−1 1 −
2
n
angegeben werden.
Bemerkung 3.1 (Stichprobenumfang)
Ein Intervall der Länge L erhalten wir, falls wir das Intervall X ± L2 betrachten. Daraus
ergibt sich
α
2σ
α
2σ
Φ−1 (1 − )
also
NL ≥ ( Φ−1 (1 − ))2 .
L= √
2
L
2
NL
Bemerkung 3.2
X −µ √ X −µ
Wir wollen zeigen, dass σ = n σ ∼ N (0, 1).
√
n
P P
P
P
Xi ∼ N (µ, σ 2 ) heißt, dass i Xi ∼ N ( µ, σ 2 ), also i Xi ∼ N (nµ, nσ 2 ).
P
Da X = n1
Xi ist, folgt
1 X
E(X) = E(
Xi ) = µ
n
und
1 P X ) = P Var( 1 X )
Var(X) = Var( n
i
n i
P
1 X )2 ) − E( 1 X )2 ]
=
[E(( n
i
n i
P
1 X )2 ]
=
[E( 12 Xi2 ) − E( n
i
P 1 n
1 P σ2 = 1 σ2.
2
2
=
2 [E(Xi ) − E(Xi ) ] = 2
n
n
n
2
2
Es wird auch oft die Bezeichnung σX
= σn verwendet.
2
D. h., X ∼ N (µ, σn ), also folgt die Behauptung nach Standardisierung.
6
Mittelwert einer Normalverteilung (Varianz unbekannt)
X1 , . . . , Xn ∼ N (µ, σ 2 ) oder n > 30
σ 2 unbekannt
n
2
P
1
2
(Xi − X)2 , sX
= sn .
s2 = n−1
i=1
X −µ √ X −µ
Statistik:
sX = n s ∼ t(n − 1)
2
Stichprobenumfang: NL ≥ ( 2σ
L tn0 −1,1−α/2 )
Voraussetzung:
Das n0 in obiger Formel für den Stichprobenumfang ist nicht leicht zu ermitteln, der
kritische t-Wert kann aber bei großen Stichproben durch den entsprechenden Wert der
Normalverteilung ersetzt werden.
Wurde die Stichprobe mit Zurücklegen“ gezogen und ist Nn > 0.05, wobei N die Größe
”
der Grundgesamtheit ist, so wird σX mit einer Endlichkeitskorrektur versehen, d. h.,
r
σ
N −n
σX = √
N
n
wird in den Berechnungen verwendet.
√ X − µ ≤ tn−1;1−α/2 = 1 − α
Pµ n
s Wir rechnen dies in ein Konfidenzintervall um
−tn−1,1− α2 ≤
− √s tn−1,1− α2 ≤
n
X + √s tn−1,1− α2 ≥
n
Konfidenzintervall:
√ X −µ
n s
≤ tn−1,1− α2
X −µ
µ
≤ √s tn−1,1− α2
n
≥ X − √s tn−1,1− α2
n
s
s
Ib = X − √ tn−1,1− α2 , X + √ tn−1,1− α2
n
n
Beispiel 3.7
Verteilungsmodell : Xi ∼ N (µ, σ 2 )
Daten Xi : 27.3 31.5 28.4
α = 0.05, t4,0.975 = 2.77.
30.1
31.0
X = 29.66
Das 95% Konfidenzintervall für µ ist
1.77
1.77
[29.66 − √ · 2.77, 29.66 + √ · 2.77] = [27.47, 31.85]
5
5
7
Varianz einer Normalverteilung
Voraussetzung: X1 , . . . , Xn ∼ N (µ, σ 2 )
n
P
1
(Xi − X)2
s2 = n−1
i=1
Statistik:
(n − 1)s2
∼ χ2 (n − 1)
σ2
P {χ2n−1, α ≤
2
(n − 1)s2
≤ χ2n−1,1− α } = 1 − α
2
2
σ
Das zugehörige Konfidenzintervall für σ 2 ergibt sich zu
#
"
2
2
(n
−
1)s
(n
−
1)s
,
Ib =
χ2n−1,1− α χ2n−1, α
2
2
Anteilswert p einer Binomialverteilung
X ∼ B(n, p), np(1 − p) ≥ 9
beobachten m Erfolge bei n Versuchen
p(1 − p)
2
pb = m
n , σp = n − 1
m
−p
n
Statistik:
σp ≈ N (0, 1)
1 Φ−1 (1 − α ))2
Stichprobenumfang NL ≥ ( L
2
 m

 − p 
≤ Φ−1 1 − α
Pp n
≈1−α
 σp 2 
Voraussetzung:
Wir rechnen in ein Konfidenzintervall für p um
α
−1
pm − np
≤
−Φ−1 1 − α
≤
Φ
1
−
2
2
np(1 − p)
p
p
α
α
−1
−1
m − np(1 − p)Φ
1− 2
≤
np
≤ m + np(1 − p)Φ
1− 2
q
q
p(1 − p) −1
p(1−p) −1
α
α
pb −
Φ
1
−
≤
p
≤
p
b
+
Φ
1
−
n
n
2
2
Da das unbekannte p in den Intervallgrenzen vorkommt, muss es dort durch den Schätzwert pb ersetzt werden.
Also ergibt sich das Konfidenzintervall:
"
#
r
r
p
b
(1
−
p
b
)
α
p
b
(1
−
p
b
)
α
Ib = pb −
Φ−1 1 −
, pb +
Φ−1 1 −
n
2
n
2
Da dieses Konfidenzintervall auf einer Approximation beruht, hält es nur für große n das
Niveau.
8
p
Da für 0 ≤ pb ≤ 1 stets pb(1 − pb) ≤ 12 , wird auch oft das größere, aber schneller zu
berechnende Konfidenzintervall
1
1
α
α
−1
−1
b
, pb + √ Φ
I = pb − √ Φ
1−
1−
2
2
2 n
2 n
verwendet.
Bemerkung 3.3
Eigentlich betrachten wir ein Binomial-Experiment, d. h., Ziehen mit Zurücklegen. Falls
nb
p > 5 und n(1 − pb) > 5 ist, kann obige Approximation durch die Normalverteilung
verwendet werden.
Bei großen Grundgesamtheiten kann dieses Konfidenzintervall auch im Fall der hypergeometrischen Verteilung verwendet werden, d. h., bei einem Experiment ohne Zurücklegen.
Beispiel 3.8
Vor einer Volksabstimmung erklären 316 von 1000 befragten Leuten mit Nein“ stimmen
”
zu wollen. Wir suchen das 99% Konfidenzintervall für den erwarteten Anteil p der NeinStimmen.
Antwort:
r
Ib = [0.316 −
0.316 · 0.684
· 2.57, 0.316 +
1000
r
0.316 · 0.684
· 2.57] = [0.278, 0.353]
1000
Bemerkung 3.4
Die Wilson-Score-Methode gibt ein auch schon bei kleinen p besseres Intervall [p1 , p2 ],
das durch
r
α
α
m
α 2
−1
−1
2m + (Φ (1 − )) ± Φ (1 − ) (Φ−1 (1 − ))2 + 4m(1 − )
2
2
2
n
p1/2 =
α
2[n + (Φ−1 (1 − ))2 ]
2
berechnet werden kann. Ebenso können die Pearson-Clopper Werte
mF2m,2(n−m+1);α/2
(n − m + 1) + mF2m,2(n−m+1);α/2
(m + 1)F2(m+1),2(n−m);1−α/2
=
(n − m) + mF2(m+1),2(n−m);1−α/2
p1 =
p2
verwendet werden.
9
Differenz zweier Erwartungswerte (Vor-Nach Vergleiche)
Wir gehen von verbundenen Stichproben aus und betrachten gepaarte Differenzen. Etwa
Ergebnisse von Sehtests am rechten und am linken Auge.
Mit den Differenzen di = Xi − Yi wird dann so wie im Falle eines Mittelwertes bei
bekannter bzw. unbekannter Varianz verfahren.
2
Voraussetzung: X1 , . . . , Xn ∼ N (µX , σX
)
Y1 , . . . , Yn ∼ N (µY , σY2 )
2
2
σX
, σY2 bekannt, σd2 = σX
+ σY2 − 2 Cov(X, Y )
di = Xi − Yi ∼ N (µx − µy , σd2 )
Statistik:
√ (X − Y ) − (µX − µY )
n
∼ N (0, 1)
σd
α
α
σd
σd
Ib = [(X − Y ) − √ Φ−1 (1 − ), (X − Y ) + √ Φ−1 (1 − )]
2
2
n
n
2
Sind die Varianzen σX
und σY2 unbekannt, so gilt:
2
)
Voraussetzung: X1 , . . . , Xn ∼ N (µx , σX
2
Y1 , . . . , Yn ∼ N (µy , σY )
2
σX
, σY2 unbekannt
P
1
di = Xi − Yi , s2d = n−1
(di − d)2
Statistik:
√ (X − Y ) − (µX − µY )
n
∼ t(n − 1)
sd
sd
sd
Ib = [(X − Y ) − √ tn−1,1− α2 , (X − Y ) + √ tn−1,1− α2 ]
n
n
Differenz zweier Erwartungswerte (Varianzen bekannt)
2
Voraussetzung: X1 , . . . , Xn ∼ N (µX , σX
) oder n > 30
2
Y1 , . . . , Ym ∼ N (µY , σY ) oder m > 30
Xi , Yi unabhängig
σ2
σ2
2
2
und σY2 bekannt, σD
= nX + mY
σX
(X − Y ) − (µX − µY )
Statistik:
∼ N (0, 1)
σD
α
α
Ib = [(X − Y ) − σD Φ−1 (1 − ), (X − Y ) + σD Φ−1 (1 − )]
2
2
Differenz zweier Erwartungswerte (Varianzen unbekannt)
Hier unterscheiden wir wiederum zwei Fälle: unbekannte aber gleiche Varianzen, und
unbekannte und verschiedene Varianzen der unabhängigen Stichproben.
10
2
Voraussetzung: X1 , . . . , Xn ∼ N (µX , σX
)
2
Y1 , . . . , Yn ∼ N (µY , σY )
Xi , Yi unabhängig
2
σX
und σY2 unbekannt und σX = σY
2
2
1 + 1 ) (n − 1)sX + (m − 1)sY
s2D = ( n
m
n+m−2
(X − Y ) − (µX − µY )
∼ t(n + m − 2)
Statistik:
sD
Ib = [(X − Y ) − sD tn+m−2,1− α2 , (X − Y ) + sD tn+m−2,1− α2 ]
2
Sind die unbekannten Varianzen σX
und σY2 verschieden, so gilt:
2
Voraussetzung: X1 , . . . , Xn ∼ N (µX , σX
)
2
Y1 , . . . , Yn ∼ N (µY , σY )
Xi , Yi unabhängig
2
2
σX
und σY2 unbekannt und σX
6= σY2
2
2
sY
s4D
s
), nD = 2
s2D = ( nX + m
s
s2
( X )2
( Y )2
n + m
n−1
m−1
(X − Y ) − (µX − µY )
Statistik:
∼ t(nD )
sD
Falls n, m > 30 können wir statt der t-Verteilung die Standardnormalverteilung verwenden.
Ib = [(X − Y ) − sD tnD ,1− α2 , (X − Y ) + sD tnD ,1− α2 ]
Differenz zweier Anteilswerte
2
Voraussetzung: X1 , . . . , Xn ∼ N (µX , σX
)
2
Y1 , . . . , Ym ∼ N (µY , σY )
Xi , Yi unabhängig
beobachtete Anteile pbX und pbY
pb (1 − pb ) pb (1 − pb )
s2p = X n X + Y m Y
(b
pX − pbY ) − (pX − pY )
Statistik:
∼ N (0, 1)
sp
α
α
Ib = [(b
pX − pbY ) − sp Φ−1 (1 − ), (b
pX − pbY ) + sp Φ−1 (1 − )]
2
2
11
Aufgaben zum Schätzen
Projekt Schätzen:
Generiere 1000 Standard-normalverteilte Samples (N (0, 1)) und transformiere diese so,
dass bei Angabe zweier beliebiger Parameter µ und σ 2 aus diesen N (µ, σ 2 )-verteilte Samples werden.
Generiere damit N (17, 25)-verteilte Samples und wähle (extrahiere) aus diesen zufällig
n Daten (n zufällige Indizes aus den Indizes 1–1000). Berechne sodann den Mittelwert
und die Sample-Varianz dieser n Daten. Berechne weiters ein Konfidenzintervall für den
Erwartungswert (einmal mit Kenntnis der Varianz der Grundgesamtheit, einmal ohne),
und ebenfalls ein Konfidenzintervall für die Varianz der Grundgesamtheit (natürlich unter der Annahme, dass diese unbekannt ist). Setze n = 10, 25, 70, 120 und vergleiche die
Ergebnisse.
3.1
Die Stichprobenvariablen X1 , X2 , X3 , X4 seien stochastisch unabhängig und identisch
verteilt mit E(Xj ) = µ. Zur Schätzung des arithmetischen Mittels µ wird eine Stichprobenfunktion der allgemeinen Form
X = f (X1 , X2 , X3 , X4 ) = g1 X1 + g2 X2 + g3 X3 + g4 X4
verwendet.
Es sei:
a)
b)
c)
d)
g1
g1
g1
g1
= − 21
= − 13
1
=
8
1
=
4
g2
g2
g2
g2
= 0
= 13
= 38
= 14
g3
g3
g3
g3
= 12
= 1
= 38
= 14
g4
g4
g4
g4
= 1
= 35
= 18
= 14
Welches der Gewichtssysteme a) bis d) liefert unverzerrte Schätzer ?
Ordne die erwartungstreuen Schätzer nach ihrer relativen Effizienz !
3.2
/
Gegeben sei eine Stichprobe (x1 , · · · , xn ) von unabhängigen Realisierungen einer Zufallsvariablen X. Wir betrachten folgende Schätzfunktion für µ:
n
1X
G=
ai x i
n i=1
a)
Unter welchen Bedingungen ist G erwartungstreu ?
b)
Für welche ai ist G der effizienteste Schätzer?
/
12
3.3
Ein Werkstück zerbricht bei der Verarbeitung mit einer konstanten Wahrscheinlichkeit
von p. Die Zufallsvariable X sei die Anzahl der verarbeiteten Werkstücke vor dem ersten
Bruch.
a)
Begründe, dass die Wahrscheinlichkeitsfunktion von X folgende Formel hat:
f (x) = q x p
mit q = 1 − p
b)
Bei einer Stichprobe wurde beobachtet, dass n Stücke vor dem ersten Bruch
verarbeitet wurden. Leite die Formel für den Maximum-Likelihood-Schätzer von
p her !
c)
Wie groß ist die P (x > 3) bei p = 0.10 ?
/
3.4
In einer Telefonzentrale wird zu zehn zufällig gewählten Zeitpunkten jeweils festgestellt,
wie viele Verbindungen innerhalb einer Minute hergestellt werden. Dabei ergeben sich
folgende Werte:
1 0 2 1 1 0 2 3 1 0
X sei die Zufallsgröße ‘Anzahl Anrufe innerhalb einer Minute’. Es wird angenommen,
dass X Poisson-verteilt ist (Begründung?) mit unbekanntem Erwartungswert µ.
a)
Bestimme eine Maximum-Likelihood-Schätzung für µ !
b)
Ist diese Schätzung erwartungstreu ?
c)
Beweise, dass die Varianz der Stichprobe eine erwartungstreue Schätzung von µ
ist, und berechne ihren Wert für das angegebene Beispiel !
/
3.5
Eine Taxifirma hat ihre Taxis mit Nummern von 1 bis n versehen, n ist unbekannt. Alle
Taxis gelangen mit gleicher Wahrscheinlichkeit zum Einsatz. Zur Schätzung von n wird
an einem bestimmten Ort der Verkehr solange beobachtet, bis zum ersten Mal ein Taxi
der betreffenden Firma auftaucht. Die beobachtete Nummer dieses Taxis sei x. Es liegt
also eine Stichprobe mit einem einzigen Element, nämlich x vor.
a)
Bestimme eine Maximum-Likelihood-Schätzung für n für diese Stichprobe !
b)
Ist diese Schätzung erwartungstreu ?
c)
Wenn nein, bestimme eine erwartungstreue Schätzung für n !
/
13
3.6
Gegeben ist folgende Stichprobe aus einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert µ:
88.2 91.6 93.9 90.4 91.2 91.0 87.9 89.4 91.8
Gesucht sind:
a)
ein 90 % Konfidenzintervall für µ bei bekannter Varianz σ 2 = 4.
b)
ein 90 % Konfidenzintervall für µ bei unbekannter Varianz σ 2 .
c)
Wie groß muss der Stichprobenumfang n in Aufgabe a) gewählt werden, damit
das Konfidenzintervall bei gleichem α = 90% nur noch ein Viertel so lang ist?
/
3.7
Bei einer Wahlumfrage (Stichprobenerhebung) wird eine Konfidenzschätzung für den Anteil eines Kandidaten angestrebt, deren maximaler Fehler 4 % betragen soll. Wie groß
ist der Stichprobenumfang zu wählen, wenn ein Konfidenzniveau von 95 % voraussetzt
wird ?
Wie ändert sich das Ergebnis, wenn aus einer Vorerhebung bekannt ist, dass der Anteil
des Kandidaten etwa um die 20 % beträgt ?
/
3.8
Bei der Produktion von Lebensmittelkonserven werden in gewissen Zeitabständen Kontrollen des Dosengewichts vorgenommen:
1. Stichprobe
2. Stichprobe
Umfang
100
120
mittl. Dosengewicht
300 g
310 g
Aus langjährigen Beobachtungen ist bekannt, dass die gemeinsame Varianz der Dosengewichte 64g 2 beträgt.
Berechne ein symmetrisches Konfidenzintervall für den Unterschied der Mittelwerte in
den beiden Grundgesamtheiten, denen die Stichproben entnommen wurden !
/
3.9
Vor Beginn einer Werbekampagne kennen von 1000 Befragten 120 eine bestimmte Marke.
Nach der Werbekampagne kennen 160 von 1000 Befragten eine bestimmte Marke.
Berechne ein 99 % Konfidenzintervall für die Differenz der Anteile !
/
14
3.10
Von der Zufallsvariable X mit Var(X) = 36 wird eine Stichprobe vom Umfang n = 36
gezogen. Daraus ergibt sich ein Mittelwert von X = 108.
a)
Gib ein 95 % (99 %) Konfidenzintervall für den Mittelwert an !
b)
Wie groß muss der Stichprobenumfang gewählt werden, damit das Konfidenzintervall eine Länge von höchstens 2 hat (95 % und 99 %) ?
/
3.11
In einer Zementfabrik wird der laufende Abfüllvorgang von Zementsäcken durch die
fallweise Entnahme von Stichproben überwacht. Bei einer Stichprobe wurden folgende
Abfüllgewichte festgestellt:
101.0 100.0 99.0 102.5 102.0 103.0 97.5 97.0 98.0
a)
Berechne ein symmetrisches Konfidenzintervall für das mittlere Abfüllgewicht
unter der Voraussetzung, dass die Abfüllgewichte normalverteilt sind (α=99 %) !
b)
Berechne ein symmetrisches Konfidenzintervall für σ 2 !
/
3.12
Aus einer laufenden Produktion von Transistoren wird eine Stichprobe vom Umfang 400
Stück entnommen und einer Funktionsprüfung unterzogen. 40 der geprüften Transistoren erwiesen sich als defekt. Bestimme ein 95 % Konfidenzintervall für den Anteil der
funktionstüchtigen Transistoren !
/
3.13
In seinem Buch “The Advanced Theory of Language as Choice and Chances” bringt
G. Herdan zwei Statistiken über die Länge von Wörtern, gemessen durch die Silbenanzahl,
bei Goethe und Lichtenberg:
Anzahl
der Silben
1
2
3
4
5
n
Goethe
Lichtenberg
587
410
146
49
8
1200
539
317
136
49
7
1048
a)
Berechne ein Konfidenzintervall für die mittlere Wortlänge (95 %) !
b)
Berechne ein Konfidenzintervall für die Differenz der mittleren Wortlänge, wenn
gleiche Varianz der Datenreihen vorausgesetzt wird (95 %) !
15
c)
Berechne die 95 % Konfidenzintervalle für die Anteile der einsilbigen Wörter bei
Lichtenberg und Goethe !
d)
Berechne das 95 % Konfidenzintervall für die Differenz der Anteilswerte der einsilbigen Wörter bei Goethe und Lichtenberg !
/
16
Herunterladen