Konfidenzintervall für µX einer NV bei unbekannter Varianz Zur Erstellung eines Konfidenzintervalls für den Erwartungswert einer Normalverteilung benötigt man die Populationsvarianz. Im besten Fall kennt man diese bereits, das KI lässt sich dann einfach berechnen (siehe Abschnitt 2.4. Konfidenzintervall für µx einer Normalverteilung bei bekannter Varianz). Ist die Varianz jedoch nicht bekannt, so muss diese ebenfalls anhand der vorliegenden Stichprobendaten geschätzt werden: 1 (xi − x̄)2 n−1 ∑ i s 1 σ̂X = (xi − x̄)2 n−1 ∑ i σ̂2X = Statt Z= X̄ − µX X̄ − µX̄ = σX √ σX̄ n verwendet man nun also: T= X̄ − µX̄ X̄ − µX = σ̂ σ̂X̄ √X n Z war standardnormalverteilt, für die Varianz war die Zufallsschwankung von X̄ verantwortlich. Da aber die Varianzschätzung ebenfalls einem Stichprobenfehler unterworfen ist, muss die Varianz von T größer als jene von Z sein. Folglich kann T nicht standardnormalverteilt sein. Allerdings wird der Unterschied für sehr große Stichproben (n → ∞) immer kleiner, da die Schätzung immer genauer wird. 1 W ELCHE V ERTEILUNG HAT T? Aus Abschnitt 2.5. Die Verteilung von Stichprobenvarianzen einer normalverteilten Variablen wissen wir: SX2 = σ2X · χ2 [n − 1] n−1 Verwendet man SX2 als Schätzung für σ2X , also SX2 = σ̂2X SX = σ̂X so ergibt sich für T : T= X̄ − µX σX q χ2 [n−1] √ n−1 n Nach Umformung zu T= X̄ − µX ·q σX √ n 1 χ2 [n−1] n−1 erkennt man: T=q Z χ2 [n−1] n−1 Da χ2 [n − 1] den Erwartungswert n − 1 hat, gilt: χ2 [n − 1] ≈1 n−1 ⇒T ≈Z 2 Dennoch weist T eine andere Verteilung als Z auf. Die Variable ! r x̄ − µX 1 mit sX = t = sX ∑(xi − x̄)2 √ n − 1 n hat „t-Verteilung“ (oft auch als „Student-Verteilung“ bezeichnet) mit d f = n − 1 Freiheitsgraden. Kritische Werte dieser Verteilung sind für verschiedene d f und für verschiedene Irrtumswahrscheinlichkeiten α tabelliert. Anmerkungen t ist symmetrisch. E(t) = 0 Für d f → ∞ strebt die t-Verteilung gegen N(0, 1). B ERECHNEN DES KI Mit Wahrscheinlichkeit 1 − α gilt: |t| ≤ t1− α2 Dies gilt auch für unser T : X̄ − µX |X̄ − µX | = |T | = σ̂ ≤ t1− α2 , d f = n − 1 σ̂X √ √Xn n σ̂X |X̄ − µX | ≤ t1− α2 · √ , d f = n − 1 n Die Grenzen des KI basierend auf einem Stichprobenmittelwert x̄ und der Varianzschätzung σ̂X sind: σ̂X µ1,2 = x̄ ± t1− α2 · √ , d f = n − 1 n 3