Inhaltsverzeichnis

Werbung
Inhaltsverzeichnis
1 Vorbemerkungen
1
2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften
2
3 Wahrscheinlichkeitsaxiome
4
4 Laplace-Experimente
6
5 Hilfsmittel aus der Kombinatorik
7
6 Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen
10
7 Zufallsvariable und Verteilungsfunktion
16
8 Diskrete Zufallsvariablen
18
9 Stetige Zufallsvariable
28
10 Funktionen von einer oder mehreren Zufallsvariablen
39
11 Grenzwertsätze
46
12 Parameterschätzungen und Schätzfunktionen
49
13 Konfidenzintervalle
51
11
Grenzwertsätze
Bei vielen in der Praxis vorkommenden Zufallsvariablen kann man davon ausgehen, dass sie additiv aus
vielen unabhängigen nichtdominierenden Einzeleinflüssen zusammengesetzt sind. In diesem Zusammenhang
interessiert die Wahrscheinlichkeitsverteilung der Summe Zn = X1 + X2 + . . . + Xn . Gilt E(Xi ) = µ und
V ar(Xi ) = σ 2 für alle i = 1, 2, . . . , n, so gilt E(Zn ) = nµ und V ar(Zn ) = nσ 2 . Für n −→ ∞ sind dies
unendliche Größen (falls µ 6= 0 bzw. σ 6= 0). Man betrachtet daher die standardisierte Zufallsvariable
Zn − nµ
Zn − E(Zn )
√
,
=
Yn = p
σ n
V ar(Zn )
womit dann
E(Yn ) = 0 und V ar(Yn ) = 1
gilt.
Der folgende zentrale Grenzwertsatz besagt, dass Yn näherungsweise normalverteilt ist. Die Normalverteilung spielt daher in der Statistik eine besondere Rolle.
11.1 Satz (Zentraler Grenzwertsatz)
Die Zufallsvariablen X1 , X2 , . . . , Xn seien für jedes n ∈ N unabhängig mit derselben Verteilung, d. h. insbesondere E(Xi ) = µ und V ar(Xi ) = σ 2 für alle i. Dann gilt für die Verteilungsfunktion der sogenannten
standardisierten Summen
Pn
Xi − nµ
Zn − nµ
√
Yn = i=1 √
=
σ n
σ n
1
lim P (Yn ≤ x) = Φ(x) = √
n→∞
2π
Z
x
e−
u2
2
du
−∞
11.2 Bemerkung
Pn
Für große n (Faustregel n ≥ 30) ist Yn ungefähr N (0, 1)-verteilt, die Summe Zn =
i=1 Xi ungefähr
P
2
n
N (nµ, nσ 2 )-verteilt und das arithmetische Mittel X = n1 i=1 Xi ungefähr N (µ, σn )-verteilt.
11.3 Beispiel
Ein Autohaus hat ermittelt, dass bei einer Standardabweichung von σ = 1, 6 durchschnittlich alle 2, 4 Werktage ein PKW des Typs Fiasko verkauft wird.
Mit welcher Wahrscheinlichkeit werden im Laufe eines Quartals (75 Werktage) mindestens 35 Fiaskos verkauft?
Sei Xi , i = 1,
P2,n . . . , n, die zufällige Zeitspanne zwischen dem Verkauf des (i−1)-ten und des i-ten Fiaskos.
Dann ist Zn = i=1 Xi die zufällige Zeitspanne bis zum Verkauf des n-ten Fiaskos.
Gesucht ist also P (Z35 ≤ 75).
Wir gehen davon aus, dass die Xi unabhängig sind. Es gilt E(Z35 ) = 35·2, 4 = 84 und V ar(Z35 ) = 35·1, 62 =
89, 6.
Wegen n = 35 können wir nach Bemerkung 11.2 annehmen, dass Z35 näherungsweise N (84; 89, 6)-verteilt
ist. Somit ist
75 − 84
P (Z35 ≤ 75) = Φ( √
) ≈ Φ(−0, 95) ≈ 0, 171
89, 6
Für grobe Abschätzungen ohne große Vorinformationen dient die folgende Tschebyscheffsche Ungleichung.
46
11.4 Satz (Tschebyscheffsche Ungleichung)
Sei X Zufallsvariable mit E(X) = µ und V ar(X) = σ 2 . Dann lässt sich für jedes c > 0 die Wahrscheinlichkeit
für die Abweichung vom Erwartungswert abschätzen durch
P (|X − µ| ≥ c) ≤
σ2
c2
denn: Für eine stetige Zufallsvariable X mit der Dichte f (x) gilt:
V ar(X)
= σ2
Z ∞
=
(x − µ)2 f (x) dx
{z
}
−∞ |
≥0
≥
Z
(x − µ)2 f (x) dx
{x:|x−µ|≥c} | {z }
≥c2
≥ c2
Z
f (x) dx
{x:|x−µ|≥c}
= c2 P (|X − µ| ≥ c)
Der Beweis für den diskreten Fall geht analog.
11.5 Beispiel
Der Nennwert der Kapazität von Kondensatoren sei 300µF . Die tatsächlichen Kapazitäten X streuen jedoch
mit einer Standardabweichung von σ = 12µF um den Nennwert.
Eine obere Schranke für die Wahrscheinlichkeit, dass die Kapazität um mindestens 5% vom Nennwert abweicht ist
122
P (|X − 300| ≥ 15) ≤ 2 = 0, 64 .
15
Wissen wir, dass die Kapazität N (300, 122 )-verteilt ist, so erhalten wir für die Wahrscheinlichkeit einer
Abweichung von mindestens 5%
P (|X − 300| ≥ 15)
= 1 − P (−15 ≤ X − 300 ≤ 15)
15
X − 300
15
≤
≤
)
= 1 − P (−
12
12
12
= 1 − (Φ(1, 25) − Φ(−1, 25))
= 2 − 2Φ(1, 25)
≈ 0, 2113
Man sieht, dass die zusätzliche Kenntnis der Wahrscheinlichkeitsverteilung mit erheblichem Informationsgewinn verbunden ist.
Wegen des folgenden schwachen Gesetzes der großen Zahlen liegt für große n das arithmetische Mittel (aus
Messungen, Stichproben) in der Nähe des Erwartungswertes. Man nimmt daher das arithmetische Mittel
auch als Schätzwert für den Erwartungswert.
11.6 Satz (Schwaches Gesetz der großen Zahlen)
Die Zufallsvariablen X1 , X2 , . . . , Xn seien alle untereinander unabhängig mit gleichem Erwartungswert µ
und gleicher Varianz σ 2 . Dann gilt für jedes ε > 0
n
0 ≤ P (|
1X
σ2
Xi − µ| ≥ ε) ≤
n i=1
n · ε2
47
und damit
n
lim P (|
n→∞
1X
Xi − µ| ≥ ε) = 0
n i=1
11.7 Beispiel
Jemand geht an 250 Tagen stets zu einem zufällig gewählten Zeitpunkt zur Bushaltestelle. Die zufällige
Wartezeit Xi am i-ten Tag bis zum Eintreffen des nächsten Busses habe den Erwartungswert µ = 3 Minuten
und eine Varianz von σ 2 = 1, 5 Minuten2 .
Gesucht ist eine untere Schranke für die Wahrscheinlichkeit, dass die mittlere Wartezeit zwischen 2, 5 und
3, 5 Minuten liegt.
250
P (|
1 X
Xi − 3| < 0, 5) =
250 i=1
250
1 − P (|
≥ 1−
48
1 X
Xi − 3| ≥ 0, 5)
250 i=1
1, 5
= 0, 976
250 · 0, 52
12
Parameterschätzungen und Schätzfunktionen
Für unbekannte Parameter, z. B. Erwartungswert, Varianz, Erfolgswahrscheinlichkeit etc., sollen ausgehend
von einer konkreten Stichprobe Schätzwerte konstruiert werden. Dies geschieht mit Hilfe von Schätzfunktionen.
Ist θ ein unbekannter Parameter, {X1 , X2 , . . . , Xn } eine mathematische Stichprobe und {x1 , x2 , . . . , xn }
eine konkrete Realisierung einer solchen Stichprobe, so bezeichnen wir mit θ̂ = θ̂(X1 , X2 , . . . , Xn ) die zufällige
Schätzfunktion und mit θ̂ = θ̂(x1 , x2 , . . . , xn ) den auf der Grundlage der konkreten Stichprobe berechneten
Schätzwert. Von einer Schätzfunktion erwartet man, daß ihre Realisierungen im Mittel um den Erwartungswert streuen und nicht einseitige Abweichungen nach oben oder unten aufweisen. Das führt zu folgender
Definition.
12.1 Definition
Eine Schätzfunktion θ̂ für den Parameter θ heißt erwartungstreu, wenn
E(θ̂(X1 , X2 , . . . , Xn )) = θ
gilt. Sie heißt asymptotisch erwartungstreu, wenn
lim E(θ̂(X1 , X2 , . . . , Xn )) = θ
n→∞
Wir geben im folgenden eine tabellarische Übersicht.
Unbekannter
Schätzfunktion
Parameter
für unbekannten
Parameter
1
n
Pn
Erwartungswert E(X)
X=
Varianz V ar(X)
S2 =
Erfolgswahrscheinlichkeit p bei einem
Bernoulli-Experiment
P̂ = X
n , wobei X die
zufällige Anzahl der
Erfolge bei n-facher
Ausführung eines
Bernoulli-Exp. bez.
1
n−1
i=1
Xi
Pn
i=1 (Xi
− X)2
Schätzwert für
unbekannten Parameter
(aus konkreter Stichprobe)
Mittelwert der konkreten
Stichprobe
Pn x1 , x2 , . . . , xn
x = n1 i=1 xi
Varianz der konkreten
Stichprobe x1 , x2 , . . . , xn
Pn
1
2
s2 = n−1
i=1 (xi − x)
Relative Häufigkeit für
Erfolg bei n-facher
Ausführung eines BernoulliExp. p̂ = nk mit k Anzahl
der Erfolge
12.2 Beispiel
Mit drei verschiedenen Würfeln wird je 50 mal gewürfelt. Die Verteilung der Augenzahlen und die Schätzwerte
für die jeweiligen Erwartungswerte sind in der folgenden Tabelle angegeben.
1
2
3 4 5
6 Schätzwert
Würfel 1
6
7
7 6 10 14 x = 3, 98
Laplace Würfel
Würfel 2 14 10 5 2 9 10 x = 3, 24
E(X) = 3, 5
Würfel 3
9
7 13 7 7
7 x = 3, 34
Geht es um die Frage, ob eine 6 gewürfelt wurde oder nicht, so haben wir folgende Zusammenhänge.
6 keine 6 Schätzwert
Würfel 1 14
36
p̂ = 14
Laplace Würfel
50 = 0, 28
Würfel 2 10
40
p̂ = 10
=
0,
2
p = 16 = 0, 16
50
7
Würfel 3
7
43
p̂ = 43 = 0, 14
49
12.3 Bemerkung
X, S 2 und P̂ sind erwartungstreu, S =
tungstreu.
√
S 2 als Schätzfunktion für die Standardabweichung ist nicht erwar-
In der folgenden Tabelle sind die Schätzwerte für die Parameter spezieller Wahrscheinlichkeitsverteilungen,
die insbesonders für technische Anwendungen wichtig sind zusammengestellt.
Verteilung/Dichte
Schätzwert
Bemerkungen
Binomialverteilung
Parameter
k: Anzahl der Erfolge bei
n i
k
(n−i)
pi = i p (1 − p)
p̂ = n
n-facher Durchführung
i = 0, 1, . . . , n
eines Bernoulli-Experimentes
Poisson-Verteilung
Erwartungswert x: Mittelwert der
i
pi = λi! e−λ ,
λ̂ = x
Stichprobe
i=0,1,. . .
Exponentialverteilung Parameter λ
x: Mittelwert der
f (x) = λe−λx ,
λ̂ = x1
Stichprobe
x≥0
Normalverteilung
Erwartungswert x: Mittelwert der
µ̂ = x
Stichprobe
f (x) =
√ 1 e−
2πσ
(x−µ)2
2σ 2
s2 : Varianz der
Stichprobe
Varianz
σ̂ 2 = s2
12.4 Beispiel
Die Lebensdauer T eines elektronischen Bauteils sei exponentialverteilt mit dem unbekannten Parameter λ.
Es liege folgende Stichprobe vom Umfang 8 vor.
Bauteil i
1
2
3
4
5
6
7
8
Lebensdauer ti 950 980 1150 770 1230 1210 990 1120
in Stunden
Der Mittelwert für die Lebensdauer beträgt
8
t=
der Schätzwert für λ somit
λ̂ =
1X
ti = 1050 ,
8 i=1
1
1
≈ 9, 52381̇0−4 .
=
1050
t
12.5 Beispiel
Wir geben eine Schätzung für den Ausschußanteil p bei der Serienproduktion von Glühlampen. Bei Stichproben vom Umfang n = 300 waren k = 6 defekt. Somit ist
p̂ =
k
6
=
= 0, 02 = 2% .
n
300
50
13
Konfidenzintervalle
Schätzungen für die Parameter und Werte von Wahrscheinlichkeitsverteilungen entstehen in der Regel aus
Stichproben. Ein Schätzwert kann daher (insbesondere bei zu kleinem Stichprobenumfang) erheblich vom
tatsächlichen Wert abweichen. Man konstruiert daher sogenannte Intervallschätzungen, d. h. es werden Intervalle bestimmt, bei denen man mit einer gewissen Wahrscheinlichkeit davon ausgehen kann, daß sie den
tatsächlichen Parameterwert enthalten.
Wir interessieren uns z. B. für einen bestimmten Parameter θ der Wahrscheinlichkeitsverteilung einer
Zufallsvariablen X.
Ziel ist es, auf der Grundlage einer Stichprobe {X1 , X2 , . . . , Xn } zufällige Grenzen Gu und Go zu konstruieren, so daß θ ∈ [Gu , Go ] mit einer vorgegebenen Wahrscheinlichkeit 1 − α.
13.1 Definition (Konfidenzintervall)
Ein Intervall [Gu , Go ] mit der Eigenschaft
P (Gu ≤ θ ≤ Go ) = 1 − α
heißt zufälliges Konfidenz- oder Vertrauensintervall für den Parameter θ zum Konfidenzniveau 1 − α.
Gu und Go heißen untere und obere Konfidenz- oder Vertrauensgrenze.
L = Go − Gu ist die Länge des Konfidenzintervalls.
Mit α bezeichnet man die Irrtumswahrscheinlichkeit und mit (1 − α) die Sicherheitswahrscheinlichkeit.
13.2 Beispiel
Ist für den mittleren Durchmesser θ von Kugeln [Gu , Go ] = [100, 103] zum Konfidenzniveau 0.9, so bedeutet
dies:
Der wahre Wert von θ liegt mit einer Sicherheitswahrscheinlichkeit von 90% im Intervall [100, 103].
Konfidenzintervalle lassen sich folgendermaßen interpretieren. Konstruiert man viele solcher Intervalle (durch
voneinander unabhängige, unter gleichen Voraussetzungen erhobene Stichproben), so enthalten durchschnittlich 90% der so konstruierten Intervalle den wahren Wert von θ.
Konfidenzintervalle werden mit Hilfe zufälliger Stichproben konstruiert. Die jeweilige Wahrscheinlichkeitsverteilung muß bekannt sein. Wir betrachten im folgenden konkrete Fragestellungen, wobei sich 1. bis
4. auf normalverteilte und 5. auf binomialverteilte Zufallsvariablen beziehen.
a) Konfidenzintervall für den Erwartungswert bei bekannter Varianz (normalverteilten Zufallsvariable)
Die Zufallvariablen X1 , X2 , . . . , Xn seien alle N (µ, σ 2 )- verteilt mit bekanntem σ und unbekanntem µ.
Das Ziel ist die Bestimmung eines Konfidenzintervalls für den Erwartungswert µ zum Konfidenzniveau
1 − α bei vorgegebenem α, d. h. eines Intervalls, in dem mit einer Sicherheitswahrscheinlichkeit von
1 − α der tatsächliche Parameter µ enthalten ist.
Pn
√
2
Das arithmetische Mittel X = n1 i=1 Xi ist N (µ, σn )-verteilt d. h. (vgl. Satz 9.6) U = X−µ
n ist
σ ·
N (0, 1)-verteilt.
qε und q1−ε seien das ε- und das (1 − ε)-Quantil der Standardnormalverteilung, d. h. es gilt Φ(qε ) = ε
und Φ(q1−ε ) = 1 − ε. Wegen der Symmetrie der Dichte der Standardnormalverteilung gilt q1−ε = −qε .
Wir setzen für das folgende zweckmäßigerweise uε = −qε = q1−ε für 0 < ε < 1/2.
Für ε = α/2 gilt nun:
P (−u α2 ≤ U ≤ u α2 ) = Φ(u α2 ) − Φ(−u α2 ) = 1 − α
Durch Ersetzen von U erhält man:
P (−u α2 ≤
X −µ √
· n ≤ u α2 )
σ
σ
σ
= P (X − u α2 · √ ≤ µ ≤ X + u α2 · √ )
n
n
= 1−α
51
Also ist
σ
σ
[X − u α2 · √ , X + u α2 · √ ]
n
n
ein Konfidenzintervall für den Parameter µ zum Konfidenzniveau 1 − α.
Die Länge des Konfidenzintervalls beträgt:
σ
2u α2 · √
n
Wegen des Faktors √1n muß also zur Halbierung der Länge des Konfidenzintervalls der Stichprobenumfang n vervierfacht werden.
13.3 Beispiel (Zahlenwerte Quantile)
α = 0, 1 : u0,05
α = 0, 05 : u0,025
α = 0, 01 : u0,005
= q0,95
= q0,975
= q0,995
≈ 1, 64 Irrtumswahrscheinlichkeit:
≈ 1, 96
≈ 2, 58
10%
5%
1%
13.4 Beispiel (Schmelzpunkt unbekannte Legierung)
Die Messungen des Schmelzpunktes einer unbekannten Legierung in ◦ C ergaben folgende Werte:
464, 4 469, 7 469, 2 469, 5 461, 8 468, 7 469, 5 463, 9
Die Varianz σ 2 = 6, 25 sei bekannt. Der Schätzwert für µ für die konkrete Stichprobe vom Umfang 8
beträgt x ≈ 467, 09.
Für die Bestimmung des Konfidenzintervalls zum Konfidenzniveau 0, 95 ergibt sich:
α = 0, 05, u α2 = u0,025 ≈ 1, 96, d. h.
√
6, 25
√
≈ 465, 36
8
√
6, 25
σ
α
√
≈ 468, 82
≈ 467, 09 + 1, 96 · √
go = x + u 2 ·
n
8
σ
gu = x − u · √ ≈ 467, 09 − 1, 96 ·
n
α
2
Insgesamt erhalten wir somit das Konfidenzintervall
[465, 36; 468, 82]
mit einer Sicherheitswahrscheinlichkeit von 95%.
13.5 Bemerkung
In der Praxis kennt man üblicherweise auch die Varianz nicht und muß sich mit einem entsprechenden
√
Schätzwert behelfen, d. h. wir betrachten τn−1 = X−µ
n, wobei
S
n
1 X
S =
(Xi − X)2
n − 1 i=1
2
eine Schätzfunktion für die Varianz ist.
Für die folgenden Überlegungen benötigen wir zunächst noch weitere Verteilungen, die bisher noch
nicht behandelt wurden.
52
• Chi-Quadrat-Verteilung
Eine Zufallsvariable χ2n genügt einer Chi-Quadrat-Verteilung (χ2 -Verteilung) mit n Freiheitsgraden, wenn sie die Gestalt χ2n = X12 + X22 + · · · + Xn2 hat, wobei X1 , X2 , . . . , Xn unabhängige
N (0, 1)-verteilte Zufallsgrößen sind.
13.6 Bemerkung
i) Die Dichte der χ2 -Verteilung ist definiert durch
n−2
x
Kn · x 2 · e − 2
fχ2n (x) =
0
wobei
1
n
Kn = n · Γ( ) mit Γ(α) =
2
22
Z
∞
falls x > 0
sonst
e−t · tα−1 dt , α > 0 .
0
Für n ∈ N ist speziell: Γ(n + 1) = n!
ii) Die Quantile der χ2 -Verteilung sind für verschiedene Werte von n tabelliert.
iii) E(χ2n ) = n, da
V ar(Xi ) = 1 = E(Xi2 ) − (E(Xi ))2 ,
| {z }
=0
also E(Xi2 ) = 1 für alle i = 1, 2, . . . , n.
• t-Verteilung von Student
Diese Verteilung stammt von dem Mathematiker Gosset, wurde von ihm aber unter dem Pseudonym Student veröffentlicht.
Eine Zufallsvariable τn genügt einer t-Verteilung (Student-Verteilung), wenn sie von der Form
X
τn = q
χ2n
n
ist. Dabei sind X und χ2n unabhängige Zufallsvariablen, X ist N (0, 1)-verteilt und χ2n ist χ2 verteilt mit n Freiheitsgraden.
13.7 Bemerkung
i) Die Dichte der t-Verteilung ist gegeben durch:
fτn (t) =
Γ( n+1
1
t2 n+1
2 )
·√
· (1 + ) 2
n
Γ( 2 )
n
n·π
ii) Die Quantile der t-Verteilung sind in Abhängigkeit von n tabelliert.
2
iii) E(τn ) = 0 für n ≥ 2 und V ar(τn ) = n−2
für n ≥ 3
iv) Für n → ∞ konvergiert die t-Verteilung gegen die N (0, 1)-Verteilung.
Faustregel: Für n > 100 kann man die Standardnormalverteilung statt der t-Verteilung
benutzen.
v) Die Dichte der t-Verteilung ist symmetrisch zur y-Achse.
13.8 Satz
Die oben definierte Zufallsvariable τn−1 =
(ohne Beweis)
X−µ √
n
S
53
genügt einer t-Verteilung mit n − 1 Freiheitsgraden.
b) Konfidenzintervall für den Erwartungswert bei unbekannter Varianz
√
n. Wir gehen genauso vor wie im Fall der bekannten Varianz.
Sei nun τn−1 = X−µ
S
Setze tn−1, α2 = q1− α2 mit dem (1 − α2 )-Quantil q1− α2 . Dann ist −tn−1, α2 = q α2
Somit:
X − µ√
n ≤ tn−1, α2 ) =
S
S
S
· √ ≤ µ ≤ X + tn−1, α2 √ ) =
n
n
P (−tn−1, α2 ≤
⇐⇒
P (X − tn−1, α2
Also ist
1−α
1−α
S
S
[X − tn−1, α2 √ , X + tn−1, α2 √ ]
n
n
ein Konfidenzintervall für den Parameter µ zum Konfidenzniveau 1 − α. Für n > 100 (vgl. Bemerkung
13.7) kann man u α2 statt tn−1, α2 verwenden.
13.9 Beispiel (Fortsetzung von Beispiel 13.4)
x =
s2
t7;0,025
467, 09
8
1X
=
(xi − x)2 ≈ 10, 12 =⇒ s ≈ 3, 18
7 i=1
= q0,975 = 2, 365
d. h. das Konfidenzintervall ist [464, 44; 469, 74] mit einer Sicherheitswahrscheinlichkeit von 95%. Das
Konfidenzintervall ist durch die Schätzung der Varianz breiter.
c) Einseitige Konfidenzintervalle
Manchmal möchte man wissen, ob der Erwartungswert einen bestimmten Wert nicht unter- oder überschreitet (z. B. Mindestlebensdauer einer Glühlampe).
Die Aufgabe ist in solchen Fällen die Bestimmung einer unteren bzw. oberen Schranke für E(X), d. h.
eines Konfidenzintervalls der Form [Gu , ∞) bzw. (−∞, Go ].
Unteres (nach unten beschränktes) einseitiges Konfidenzintervall für den Erwartungswert bei unbekannter Varianz mit Konfidenzniveau 1 − α ist
S
[X − tn−1,α √ ; ∞) .
n
Oberes (nach oben beschränktes) einseitiges Konfidenzintervall für den Erwartungswert bei unbekannter Varianz mit Konfidenzniveau 1 − α ist
S
(−∞; X + tn−1,α √ ] .
n
13.10 Beispiel (Fortsetzung von Beispiel 13.4)
Bestimme unteres einseitiges Konfidenzintervall mit 95% Sicherheitswahrscheinlichkeit.
x ≈ 467, 09
s ≈ 3, 18
t7;0,05 = q0,95 = 1, 895
Also ist
[464, 96; ∞)
ein unteres einseitiges Konfidenzintervall mit 95% Sicherheitswahrscheinlichkeit.
54
d) Konfidenzintervall für die Varianz einer N (µ, σ 2 )- verteilten Zufallsvariablen
2
Sei X N (µ, σ 2 )-verteilt. Dann ist χ2n−1 = (n−1)S
eine χ2 -verteilte Zufallsvariable mit n − 1 Freiheitsσ2
2
2
graden (ohne Beweis). Seien χn−1, α bzw. χn−1,1− α das α2 - bzw. (1 − α2 )-Quantil der χ2 - Verteilung.
2
2
Dann gilt
(n − 1)S 2
P (χ2n−1, α2 ≤
≤ χ2n−1,1− α2 ) = 1 − α
σ2
Umformung der Ungleichung im Argument von P ergibt:
(n − 1)S 2
(n − 1)S 2
und
≤ χ2n−1,1− α2
σ2
σ2
(n − 1)S 2
(n − 1)S 2
σ2 ≤
und
≤ σ2
χ2n−1, α
χ2n−1,1− α
χ2n−1, α2 ≤
⇐⇒
2
Also
P(
2
(n − 1)S 2
(n − 1)S 2
2
≤
σ
≤
)=1−α
χ2n−1,1− α
χ2n−1, α
2
2
Also ist das Konfidenzintervall zum Konfidenzniveau 1 − α für die Varianz:
"
#
(n − 1)S 2 (n − 1)S 2
;
χ2n−1,1− α χ2n−1, α
2
2
Für die Standardabweichung erhält man:
"s
#
s
(n − 1)s2
(n − 1)s2
;
χ2n−1,1− α
χ2n−1, α
2
2
e) Konfidenzintervall für die Erfolgswahrscheinlichkeit
Hierbei geht es um den Parameter p bei Bernoulli-Experimenten.
Die Schätzfunktion ist P̂ = X
n , wobei X die Anzahl der Erfolge bei n-facher Durchführung eines
Bernoulli-Experimentes bezeichnet.
X ist binomialverteilt mit den Parametern n und p und (vgl. Kap. 8) E(X) = np, V ar(X) = np(1 − p).
Im folgenden setzen wir eine umfangreiche Stichprobe voraus.
Wegen des zentralen Grenzwertsatzes ist X näherungsweise N (np, np(1 − p))-verteilt, d. h. U =
√X−np ist näherungsweise N (0, 1)-verteilt.
np(1−p)
Mit der Schätzfunktion P̂ =
X
n
ist also U = √nP̂ −np
np(1−p)
ungefähr N (0, 1)-verteilt.
Wir bestimmen ein Konfidenzintervalls für U mit Konfidenzniveau 1 − α.
Sei u α2 = q1− α2 das (1 − α2 )- Quantil von Φ. Dann ist
P (−u α2 ≤ U ≤ u α2 ) ≈ 1 − α
⇐⇒
n(P̂ − p)
P (−u α2 ≤ p
≤ u α2 ) ≈ 1 − α
np(1 − p)
Wir bringen die Ungleichung im Argument von P in die Form Gu ≤ p ≤ Go . Zur Abkürzung schreiben
wir im folgenden u statt u α2 .
1.Fall: P̂ − p ≥ 0
Dann ist die erste Ungleichung automatisch erfüllt. Die zweite Ungleichung ist äquivalent zu
⇐⇒
⇐⇒
p2 (1 +
(P̂ − p)2
≤
P̂ 2 − 2pP̂ + p2
≤
u2
u2
) − p(2P̂ + ) + P̂ 2
n
n
55
u2
· p(1 − p)
n
u2
u2
· p − ·p2
n
n
≤ 0
Die linke Seite beschreibt eine nach oben geöffnete Parabel, d. h. die Ungleichung ist für diejenigen
p-Werte erfüllt, die zwischen den Nullstellen der linken Seite der Ungleichung liegen. Wir bestimmen
daher diese Nullstellen.
p2 − p
u2
n
u2
n
2P̂ +
|
1+
{z
n+u
= 2P̂n+u
2
⇐⇒
p1,2
=
⇐⇒
p1,2
=
⇐⇒
p1,2
=
}
2
+
P̂ 2
2 = 0
1 + un
| {z }
2
nP̂
= n+u
2
s
1 2P̂ n + u2
1 (2P̂ n + u2 )2
nP̂ 2
·
±
·
−
2
n + u2
4
(n + u2 )2
n + u2
(
)
r
4
u2
u
1
P̂ n +
− n2 P̂ 2 − nP̂ 2 u2
± P̂ 2 n2 + P̂ nu2 +
n + u2
2
4
(
)
r
u2
u2
1
P̂ n +
± u nP̂ (1 − P̂ ) +
n + u2
2
4
2. Fall: P̂ − p < 0
Analoge Betrachtungen wie im 1. Fall führen auf dieselben Werte für p.
Insgesamt erhält man also als (ungefähres) Konfidenzintervall [P− , P+ ] für die Erfolgswahrscheinlichkeit
p zum Konfidenzniveau 1 − α mit
s



u2α 
u2α
1
P± =
P̂ n + 2 ± u α2 nP̂ (1 − P̂ ) + 2
n + u2α 
2
4 
2
Für großes n (n ≥ 1000) kann man näherungsweise mit P±∗ = P̂ ±
uα
√2
n
q
P̂ (1 − P̂ ) rechnen.
13.11 Beispiel
Ein Würfel zeigt bei 1000 Würfen 188 mal die 6. Gesucht ist ein Konfidenzintervall für die Wahrscheinlichkeit eine 6 zu würfeln zum Konfidenzniveau von 80% (d. h. 1 − α = 0, 8; α = 0, 2).
188
Es gilt p̂ = 1000
= 0, 188, u0,1 = q0,9 = 1, 28 d. h.
[p− , p+ ] = [0, 17270; 0, 20432] bzw. [p∗− , p∗+ ] = [0, 17219; 0, 20381]
13.12 Bemerkung
Bei einem homogenen Würfel ist p = 0, 16.
Bei einem Konfidenzniveau von 99% (d. h. 1 − α = 0, 99; α = 0, 01) erhält man mit u0,005 = q0,995 =
2, 58
[p− , p+ ] = [0, 15822; 0, 22190] bzw. [p∗− , p∗+ ] = [0, 15612; 0, 21988]
Bei einem Konfidenzniveau von 99% würde man nicht behaupten, daß der Würfel unfair ist.
13.13 Bemerkung
Auch hier können wieder untere bzw. obere Konfidenzintervalle [P− , 1], [0, P+ ] bzw. [P−∗ , 1], [0, P+∗ ]
bestimmt werden. Für ein Konfidenzniveau von 1 − α ist dann aber wieder uα zu nehmen.
56
Herunterladen