Konfidenzintervall für µX einer NV bei unbe- kannter

Werbung
Konfidenzintervall für µX einer NV bei unbekannter Varianz
Zur Erstellung eines Konfidenzintervalls für den Erwartungswert einer Normalverteilung benötigt man die Populationsvarianz. Im besten
Fall kennt man diese bereits, das KI lässt sich dann einfach berechnen (siehe Abschnitt 2.4. Konfidenzintervall für µx einer Normalverteilung bei bekannter Varianz). Ist die Varianz jedoch nicht bekannt,
so muss diese ebenfalls anhand der vorliegenden Stichprobendaten geschätzt werden:
1
(xi − x̄)2
n−1 ∑
i
s
1
σ̂X =
(xi − x̄)2
n−1 ∑
i
σ̂2X =
Statt
Z=
X̄ − µX
X̄ − µX̄
= σX
√
σX̄
n
verwendet man nun also:
T=
X̄ − µX̄
X̄ − µX
= σ̂
σ̂X̄
√X
n
Z war standardnormalverteilt, für die Varianz war die Zufallsschwankung von X̄ verantwortlich. Da aber die Varianzschätzung ebenfalls einem Stichprobenfehler unterworfen ist, muss die Varianz von T größer
als jene von Z sein. Folglich kann T nicht standardnormalverteilt sein.
Allerdings wird der Unterschied für sehr große Stichproben (n → ∞) immer kleiner, da die Schätzung immer genauer wird.
1
W ELCHE V ERTEILUNG HAT T?
Aus Abschnitt 2.5. Die Verteilung von Stichprobenvarianzen einer
normalverteilten Variablen wissen wir:
SX2 =
σ2X
· χ2 [n − 1]
n−1
Verwendet man SX2 als Schätzung für σ2X , also
SX2 = σ̂2X
SX = σ̂X
so ergibt sich für T :
T=
X̄ − µX
σX
q
χ2 [n−1]
√ n−1
n
Nach Umformung zu
T=
X̄ − µX
·q
σX
√
n
1
χ2 [n−1]
n−1
erkennt man:
T=q
Z
χ2 [n−1]
n−1
Da χ2 [n − 1] den Erwartungswert n − 1 hat, gilt:
χ2 [n − 1]
≈1
n−1
⇒T ≈Z
2
Dennoch weist T eine andere Verteilung als Z auf. Die Variable
!
r
x̄ − µX
1
mit sX =
t = sX
∑(xi − x̄)2
√
n
−
1
n
hat „t-Verteilung“ (oft auch als „Student-Verteilung“ bezeichnet) mit
d f = n − 1 Freiheitsgraden. Kritische Werte dieser Verteilung sind für
verschiedene d f und für verschiedene Irrtumswahrscheinlichkeiten α
tabelliert.
Anmerkungen
t ist symmetrisch.
E(t) = 0
Für d f → ∞ strebt die t-Verteilung gegen N(0, 1).
B ERECHNEN DES KI
Mit Wahrscheinlichkeit 1 − α gilt:
|t| ≤ t1− α2
Dies gilt auch für unser T :
X̄ − µX |X̄ − µX |
=
|T | = σ̂
≤ t1− α2 , d f = n − 1
σ̂X
√
√Xn n
σ̂X
|X̄ − µX | ≤ t1− α2 · √ , d f = n − 1
n
Die Grenzen des KI
basierend auf einem Stichprobenmittelwert x̄ und der Varianzschätzung σ̂X sind:
σ̂X
µ1,2 = x̄ ± t1− α2 · √ , d f = n − 1
n
3
Herunterladen