Kap. 11 (Teil I): Intervall

Werbung
Die Schätzung eines Parameters der Grundgesamtheit (wie z.B. dem Erwartungswert
oder der Varianz) mit einer einzigen Zahl bezeichnet man als Punktschätzung.
Die Schätzung eines Grundgesamtheitsparameters durch zwei Zahlen, zwischen denen
der Parameter mit einer gewissen Wahrscheinlichkeit liegt, nennt man
Intervallschätzung eines Parameters
Die Angabe des Fehlers einer Schätzung wird als ihre Verlässlichkeit bezeichnet.
Eine Entfernung wurde mehrmals gemessen als Mittelwert der Messung erhielt man den
Wert:
x = 5 , 28 [m]
diesen Wert bezeichnen wir als Punktschätzung.
Wenn wir aber die Entfernung in einem Intervall angeben wie z.B.
x = 5,28 ± 0,03 [m]
so handelt es sich um eine Intervallschätzung.
Um einen unbekannten Parameter einer Gesamtheit zu bestimmen, kann dieser durch
Berechnung von Kenngrößen einer Stichprobe aus dieser Gesamtheit geschätzt werden.
Wird eine Stichproben-Statistik (Stichprobenfunktion) zur Schätzung eines
unbekannten Parameter einer Gesamtheit verwendet, so heißt diese Schätzer
∧
(Schätzfunktion) und wird mit θ bezeichnet.
Um das mittlere Gewicht von Studenten einer Vorlesung zu schätzen, wurde aus der
Grundgesamtheit der Studenten der Vorlesung eine zufällige Stichprobe vom Umfang
N = 8 gezogen. Die Messergebnisse sind in der folgenden Tabelle dargestellt.
i
x i [kg]
1
70
2
65
3
87
4
84
5
90
6
75
7
62
8
82
1
!"
#
Mittelwert der Stichprobe: x
=
1
N
N
⋅
i = 1
xi
= 76,875 [kg]
Somit lautet die Schätzung des mittleren Gewichts der Studenten aus der Vorlesung
(Grundgesamtheit):
∧
Schätzwert für den Mittelwert der Gesamtheit: µ ≈ x = 76,75 [kg]
Bei der Schätzung von Parametern einer Gesamtheit durch die Punktschätzung muss
man meistens damit rechnen, dass der Schätzwert vom wahren Wert des Parameters
mehr oder weniger abweicht.
Punktschätzung für den Mittelwert
Der Mittelwert µ einer Grundgesamtheit kann durch den Mittelwert x einer
∧
Stichprobe aus der Grundgesamtheit durch den Schätzwert µ geschätzt werden.
∧
µ ≈ x
Punktschätzung für die Varianz
2
Die Varianz
2
einer Grundgesamtheit kann durch die Varianz s einer Stichprobe
∧
2
aus der Grundgesamtheit durch den Schätzwert σ
∧
2
σ
s
geschätzt werden.
2
Punktschätzung für den Anteilswert
Sei p der Anteilswert einer beliebigen Eigenschaft A einer endlichen
Grundgesamtheit bzw. sei p = P ( A ) die Wahrscheinlichkeit, dass bei einer
zufälligen Auswahl eines Elements aus einer unendlichen Gesamtheit dieses die
Eigenschaft A hat. Dann kann der Anteilswert p der Grundgesamtheit durch den
∧
Schätzwert p einer Stichprobe des Umfangs N wie folgt geschätzt werden.
∧
p ≈
Dabei sind:
M
N
M : Anzahl der Elemente in der Stichprobe mit der Eigenschaft A
N : Gesamtzahl der Elemente in der Stichprobe
2
∧
Ein Schätzer θ ist eine zufällige Variable, da dieser bei jedem Versuch bzw. jeder
∧
Stichproben anders ausfallen kann. Man kann also nicht erwarten, dass der Schätzer θ
∧
den zu schätzenden Parameter genau trifft. Hingegen sollte ein guter Schätzer θ im
Mittel den Parameter richtig schätzen. D.h. der Erwartungswert sollte gleich dem
Parameter sein. Im vorigen Kapitel haben wir gesehen, dass die Verteilung der
Stichproben-Mittelwerte den gleichen Mittelwert, wie den wahren Mittelwert der
Gesamtheit hat. Somit definieren wir folgenden Begriff
Erwartungstreu Schätzung
∧
Ein Schätzer θ heißt Erwartungstreu (unbiased), wenn der Mittelwert der
Stichproben-Verteilung der Schätzer gleich dem Parameter der Gesamtheit ist.
Im vorigen Kapitel haben wir gesehen, dass für die Verteilung von Stichproben-Statistiken
wie z.B. der Mittelwerte die Streuung der Verteilung der Stichproben-Mittelwerte kleiner
wird, je größer der Stichprobenumfang ist.
Konsistente Schätzung
∧
Ein Schätzer θ heißt konsistent, wenn seine Varianz mit wachsender
Stichprobengröße N gegen Null strebt.
Nicht Erwartungstreu
(systemtisch falsch)
Geringe Varianz
Erwartungstreu
Hohe Varianz
Nicht Erwartungstreu
(systemtisch falsch)
Hohe Varianz
Erwartungstreu
Geringe Varianz
Die Punkte stellen unterschiedliche Schätzer
Stichproben dar
aus verschiedenen
3
$
Um Parameter einer Grundgesamtheit (wie, z.B. den Erwartungswert) angeben zu
können, entnehmen wir der Grundgesamtheit eine Stichprobe. Da Stichproben kleiner als
die Grundgesamtheit sind und daher nicht alle Elemente der Grundgesamtheit enthalten,
ist die Wahrscheinlichkeit sehr gering, anhand der Stichprobe die Parameter der
Grundgesamtheit genau zu bestimmen. Wenn wir den Umfang N der Stichprobe groß
wählen, können wir die Parameter der Grundgesamtheit genauer abschätzen.
%&
Vier identische und homogene Münzen werden geworfen. Wir interessieren uns in
diesem Experiment für das Eintreten des Ereignisses: A: „Wappen“. Da es sich hier um
ein Bernoulli-Experiment handelt, genügt der Zufallsvariable:
X: („Anzahl „Wappen“ bei n = 4 Würfen“.)
die Wahrscheinlichkeitsfunktion der Binomialverteilung. Daher lautet der Erwartungswert:
µ = n p = 4 ½ = 2
Fünf verschiedene Experimentatoren führten jeweils Zufallsexperimente mit 100 Würfen
von 4 identischen und homogenen Münzen (4-stufiges Experiment) durch. Es ergaben
sich folgende Ergebnisse:
Die Merkmalausprägung a k = k bezeichnet die Anzahl von Wappen.
Und h k bezeichnet die absoluten Häufigkeiten h k beim N = 100-maligem Wurf von
n = 4 identischen homogen Münzen.
ak= k
0
1
2
3
4
1) Alice
hk
12
22
42
18
6
2) Bob
hk
7
16
41
24
12
Experimentator
3) Clara
hk
4
20
46
25
5
4) Daniel
hk
5
19
53
16
7
5) Eli
hk
9
24
39
19
9
Berechnen Sie jeweils die Mittelwerte x für die 5 verschiedenen Stichproben vom
Umfang N = 100 und vergleichen Sie diese geschätzten Mittelwerte mit dem
Erwartungswert µ (Mittelwert) der Grundgesamtheit.
!"
x =
#
1 n=4
1 n=4
⋅
a k ⋅ hk =
⋅
a k ⋅ hk
N k= 0
N k= 0
Stichproben-Nr.
Mittelwert der
Stichprobe: x
1) Alice
2) Bob
3) Clara
4) Daniel
5) Eli
1,84
2,18
2,07
2,01
1,95
4
'(
$
*
)
$
+
)
Wir können den Mittelwert µ der Grundgesamtheit mit Hilfe von Stichproben nicht ganz
genau ermitteln. Aber wir können erwarten, dass dieser Mittelwert µ in einem Intervall
um die Schätzfunktion X des Mittelwerts der Stichprobe liegt.
X − ∆x ≤ µ ≤ X + ∆x
Sei X die Schätzfunktion des Mittelwerts einer Stichprobe der Größe N aus einer
Grundgesamtheit mit dem Mittelwert µ und der Varianz ² . Wenn darüber hinaus die
Stichprobenverteilung annähernd einer Normalverteilung entspricht (Dies gilt, wenn
die Grundgesamtheit normalverteilt ist, oder, wenn sie nicht normalverteilt ist aber die
Stichprobegröße N 30 beträgt.), können wir erwarten, dass der Mittelwert µ mit einer
gewissen Wahrscheinlichkeit γ = 1 –
in einem Intervall um X liegt. Folglich liegt
nach dem Zentralen-Grenzwert-Satz die standardisierte Zufallsvariable
Z =
X − µ
σ
N
mit der Wahrscheinlichkeit γ = 1 –
zwischen zwei Werten – z 0 und z 0, welche wir für
eine vorgegebene Wahrscheinlichkeit bestimmen können. Somit gilt:
P ( − z0 ≤ Z ≤ z0
P
( X − ∆x
)=
1− α
≤ µ ≤ X + ∆x
)=
1− α
wobei ∆ x = z 0 ⋅
σ
ist.
N
(z)
= 1– α
Fehler
– z0
0
z0
z
µ
x − ∆x
x
x + ∆x
5
Konfidenzintervall für den unbekannten Mittelwert µ mit bekannter Varianz
²
Sei x der Mittelwert einer Stichprobe der Größe N aus einer Grundgesamtheit mit dem
unbekannten Mittelwert µ und der bekannten Varianz ². Sei ferner die
Stichprobenverteilung der Mittelwerte annähernd normalverteilt, so ist das
Konfidenzintervall (Vertrauensintervall) für den Mittelwert µ mit dem
Vertrauensniveau γ = 1 – , gegeben durch:
x − z0 ⋅
σ
≤ µ ≤ x +
N
z0 ⋅
σ
N
Das Vertrauensniveau gibt an mit welcher Wahrscheinlichkeit das Vertrauensintervall den
wahren Mittelwert µ überdeckt. Der Wert für z 0 wird in Abhängigkeit vom Wert der
Wahrscheinlichkeit γ = 1 – aus der Standard-Normal-Verteilung bestimmt.
#
Das Vertrauensintervall für den Mittelwert µ einer nicht-normalverteilten
Grundgesamtheit kann näherungsweise dann mit der obigen Formel bestimmt
werden, wenn die Stichprobengröße N > 30 ist. Je größer der Stichprobenumfang ist,
umso besser ist diese Näherung.
Der maximale Fehler E bei der Intervall-Schätzung mit einem Vertrauensniveau
γ = 1 – beträgt:
σ
E = z0 ⋅
N
Für einen vorgebenen Fehler E mit einem Vertrauensniveau γ = 1 – kann die
Größe N der Stichprobe bestimmt werden durch:
N =
z0 ⋅σ
2
E
Konstruktion eines Konfidenzintervalls für unbekanntem µ bei normalverteilter
Zufallsvariable X mit bekannter Standardabweichung
der Grundgesamtheit
Wählen eines Vertrauensniveau γ = 1 – ( z.B. 90% ; 95% ; 99%)
Entnahme einer Stichprobe vom Umfang N und Berechnung von x
Bestimmung von z 0 mit Φ ( z 0 ) = 1 –
2,
(wobei Φ ( z ) die Verteilungsfunktion der Standard-Normal-Verteilung ist.)
Berechnung von ∆ x = z 0 ⋅
σ
N
Angabe des Konfidenzintervalls für µ .
6
%&
Im Beispiel 3-I) haben wir die Mittelwerte für 5 verschiedene Stichproben bestimmt. Wir
möchten jetzt mit Hilfe dieser Mittelwerte die Konfidenzintervalle für den unbekannten
Mittelwert µ zu einem Vertrauensniveau von 99% bestimmen, wenn wir wissen, dass
die Varianz ² = 1 ist.
!"
#
(z)
0,99
0,005
0,005
–z
0
0
+z
0
z
Vertrauensniveau: 1 – = 0,99
Umfang der Stichprobe: N = 100
Bestimmung von z 0 : Φ ( z 0 ) = 1 – 0,01 2 = 0,995
1
Berechnung von x : ∆ x = 2 , 575
= 0 , 2575
100
z0
2,575
Angabe der Vertrauensintervalle für µ durch die ermittelten Mittelwerten x aus den
5 verschiedenen Stichproben (hier 5 verschiedene Experimente)
Alice:
, Bob:
x = 1,84
1 , 84 − 0 , 2575 ≤ µ ≤ 1 , 84 + 0 , 2575
1 , 5825 ≤ µ ≤ 2 , 0975
x = 2,18
2 , 18 − 0 , 2575 ≤ µ ≤ 2 , 18 + 0 , 2575
1 , 9225 ≤ µ ≤ 2 , 4375
Clara:
x = 2,07
1,8125 ≤ µ ≤ 2,3275
Daniel:
x = 2,01
1,7525 ≤ µ ≤ 2,2675
Eli:
x = 1,95
1,6925 ≤ µ ≤ 2,2075
Aus der Theorie des Bernoulli-Experiments ist bekannt, dass beim Wurf von 4
identischen Münzen der Mittelwert µ = n p = 4 ½ = 2 ist. Folgende Abb. zeigt
die Vertrauensintervalle für die 5 Stichproben (Experimenten)
Stichprobe
e
d
c
b
a
Mittelwert
1,7425
µ=2
2,2575
x
7
,
&
An einer Fakultät einer Universität mit 150 Studenten sollte zum Thema „Angebot an
Fachtutoren“ eine Umfrage durchgeführt werden. Es wurden 36 Studenten zufällig
ausgewählt, damit sie dieses Thema bewerten. Es ergab die Durchschnittsnote 2,6.
Anhand dieser Stichprobe soll nun die wahre Durchschnittsnote geschätzt werden.
Angenommen sei die Standardabweichung der wahren Durchschnittsnote 0,3.
Bestimmen Sie das Vertrauensintervall für die wahre Durchschnittsnote mit einem
Vertrauensniveau von 95%.
Lösung:
1–
= 0,95 ,
N = 36 ,
= 0,3
x = 2,6
Φ ( z 0 ) = 1 – 0,05 / 2 = 0,975
∆x = 1 , 96
2 ,6
−
1,96
0,3
36
0,3
36
z 0 = 1,96
= 0,098
≤ µ ≤ 2 ,6 +
1,96
0,3
36
⇔
2,5 ≤ µ ≤ 2,7
,
&,
Wie groß muss der Stichprobenumfang für die vorige Aufgabe gewählt werden, damit mit
einem Vertrauensniveau von 95% für die Intervallschätzung von µ der maximale Fehler
0,05 beträgt?
8
'(
$
*
+
)
Wenn die Varianz ² der Grundgesamtheit nicht bekannt ist, müssen wir diese durch
die Schätzfunktion der Varianz S ² der Stichprobe ersetzen.
X − µ
Z =
σ
T =
N
X − µ
S
N
Somit können erwarten, dass der Mittelwert µ mit einer gewissen Wahrscheinlichkeit
γ=1–
in einem Intervall um die Schätzfunktion des Mittelwerts der Stichprobe X mit
der Standardabweichung S liegt. Dabei wird aber die Wahrscheinlichkeitsverteilung
durch die Studentsche-t-Verteilung gegeben. Somit gilt:
P ( − t0 ≤ T ≤ t0
P
(X
)
= 1− α
)=1−α
− ∆X ≤ µ ≤ X + ∆X
wobei ∆ X = t 0 ⋅
S
ist
N
fν (t)
Fehler
= 1– α
x
x − ∆x
– t0
0
µ
x + ∆x
t
t0
Konfidenzintervall für den unbekannten Mittelwert µ mit unbekannter Varianz
einer normalverteilten Zufallsvariable
²
Sei x der Mittelwert und s die Standardabweichung einer Stichprobe der Größe N aus
einer Grundgesamtheit mit dem unbekannten Mittelwert µ und der unbekannten
Varianz ². Sei ferner die Grundgesamtheit normalverteilt, so ist das
Konfidenzintervall (Vertrauensintervall) für den Mittelwert
mit dem
Vertrauensniveau γ = 1 – , gegeben durch:
x − t0 ⋅
s
N
≤ µ ≤ x + t0 ⋅
s
N
Der Wert für t 0 wird in Abhängigkeit von der Wahrscheinlichkeit γ = 1 –
Student-t-Verteilung mit der Freiheitsgerade v = N – 1 bestimmt.
aus der
9
#
Das Vertrauensintervall für den Mittelwert µ einer nicht-normalverteilten
Grundgesamtheit kann näherungsweise dann mit der obigen Formel bestimmt
werden, wenn die Stichprobengröße N > 30 ist. Je größer der Stichprobenumfang ist,
umso besser ist diese Näherung.
Für einen Stichprobenumfang von N 30 kann mit einer ausreichenden Genauigkeit
die Studentsche-t-Verteilung durch die Standard-Normal-Verteilung ersetzet
werden.
Der maximale Fehler E bei der Intervall-Schätzung mit einem Vertrauensniveau
γ = 1 – beträgt:
s
E = t0 ⋅
N
Konstruktion eines Konfidenzintervalls für unbekanntem
Zufallsvariable X mit unbekannter Standardabweichung
bei normalverteilter
der Grundgesamtheit
Wählen eines Vertrauensniveau γ = 1 – ( z.B. 90% ; 95% ; 99%)
Entnahme einer Stichprobe vom Umfang N und Berechnung von x und s
Bestimmung von t 0 mit F v ( t 0 ) = 1 –
2
( wobei F v ( t ) die Verteilungsfunktion der Student-t-Verteilung mit der
Freiheitsgerade v = N – 1 ist.
s
Berechnung von ∆ x = t 0 ⋅
N
Angabe des Konfidenzintervalls für µ .
10
.
Aus einem Container wurden 7 Bierfässer der gleichen Sorte entnommen. Die Inhalte in
Liter der 7 Fässer sind:
9,8 ;
10,2 ; 10,4 ; 9,8 ; 10,0 ; 10,2 und 9,6
Sei der Inhalt der Bierfässer eine normalverteilte Zufallsvariable. Geben Sie den
Konfidenzintervall für den wahren Mittelwert des Inhalts der Bierfässer im Container mit
einem Vertrauensniveau von 95% an.
!"
#
Studentsche-t-Verteilung
fν (t)
0,95
–
0,025
0,025
– t0
γ=1–
t0
0
= 0,95 ;
x = 10,0
t
N = 7
s = 0,283
F 6 (t 0) = 1 – 0,05 2 = 0,975
∆ x = 2 , 447
9,74
ν =6
µ
0 , 283
7
10,26
t 0 = 2,447
= 0 , 262
11
% '(
$
)
Wir können die Varianz σ ² der Grundgesamtheit mit Hilfe von Stichproben nicht ganz
genau ermitteln. Aber wir können erwarten, dass diese in einem Intervall um S ² (um die
Schätzfunktion der Varianz der Stichprobe) liegt.
Sei S ² die Schätzfunktion der Varianz der Stichprobe der Größe N aus einer
normalverteilten Grundgesamtheit, so liegt ihre Zufallsvariable
Χ
2
=
2
( N − 1 )S
σ
mit der Wahrscheinlichkeit γ = 1 –
2
zwischen zwei Werten χ 12 und χ 22 , welche wir für
die vorgegebenen Wahrscheinlichkeit 1 –
P
( χ 12 ≤
Χ
2
)=
1− α
wobei
S u2
≤ χ 22
bestimmen können. Somit gilt:
(
P S u2 ≤ σ
( N − 1 )S
=
2
χ 22
und
S o2
2
≤ S o2
)=
1− α
( N − 1 )S
=
,
2
χ 12
sind
f ν ( χ ²)
=α
1–α
= 1–
χ²
χ12
σ²
s²u
s²o
χ22
Konfidenzintervall für die unbekannte Varianz
Zufallsvariable
² für eine normalverteilte
Sei s die Standardabweichung einer Stichprobe vom Umfang N aus einer
Grundgesamtheit mit dem (bekannten oder unbekannten) Mittelwert . Sei ferner die
Grundgesamtheit normalverteilt, so ist das Konfidenzintervall (Vertrauensintervall) für
die unbekannte Varianz σ ² mit dem Vertrauensniveau γ = 1 – , gegeben durch:
( N − 1 )s
χ 22
2
≤
σ
2
≤
( N − 1 )s
2
χ 12
Die Werte für χ 12 und χ 22 werden in Abhängigkeit von der Wahrscheinlichkeit
γ=1–
aus der Chi-Quadrat-Verteilung mit der Freiheitsgerade ν = N – 1 bestimmt.
12
Konstruktion eines Konfidenzintervalls für die unbekannte Varianz
normalverteilter Zufallsvariable X
Wählen eines Vertrauensniveau γ = 1 – ( z.B. 90% ; 95% ; 99%)
Entnahme einer Stichprobe vom Umfang N und Berechnung von x und s² bzw.
s
α
1
bzw. χ 12 aus
Bestimmung von χ 22 aus F v χ 22
= (1+ γ ) = 1−
2
2
α
1
F v χ 12 = ( 1 − γ ) =
2
2
(wobei F v ( χ ² ) die Verteilungsfunktion der Chi-Quadrat-Verteilung mit der
Freiheitsgerade ν = N – 1 ist.)
( N − 1 )s 2
( N − 1 )s 2
2
2
Berechnung von s u =
bzw. s o =
(
(
)
)
² bei
)
)
χ 12
χ 22
Angabe des Konfidenzintervalls für σ ² oder σ =
σ
2
.
/
Die Gewichte von Zement-Packungen einer Abfüllanlage sei eine normalverteilte
Zufallsvariable. Die Gewichte (in [kg]) von 10 zufällig aus der Produktion entnommenen
Packungen sind wie folgt:
46,4 ; 46,1 ; 45,8 ; 47,0 ; 46,1 ; 45,9 ; 45,8 ; 46,9 ; 45,2 ; 46, 0
Bestimmen Sie das Vertrauensintervall für die wahre Standardabweichung mit einem
Vertrauensniveau von 95%.
!"
#
f ν ( χ ²)
0,025
0,95
=– 1–α
0,025
χ²
χ1 2
γ=1–
χ 22
= 0,95 ;
x = 46,12
N = 10
ν = 9
s ² = 0,286
F 9 ( χ 22 ) = 1 – 0,05 / 2 = 0,975
χ 22 = 19,023
F 9 ( χ 12 ) = 0,05 / 2 = 0,025
χ 12 = 2,700
s u2 =
0,135
( N − 1 )s
2
χ 22
σ ²
0,953
s o2 =
= 0,135 ;
0,367
σ
( N − 1 )s
χ 12
2
= 0,953
0,976
13
.
'(
$
-
+
Für die Wahrscheinlichkeit (Anteilswert) p einer beliebigen Eigenschaft (eines
Ereignisses) A einer Grundgesamtheit können wir eine Stichprobe vom Umfang N
ziehen. Wegen der Unabhängigkeit der einzelnen Züge liegt ein N-faches BernouliExperiment vor, so dass aus der Anzahl X der Elemente mit der Eigenschaft A bei den
N Ziehungen die Schätzfunktion
X
Pˆ =
N
für die Erfolgswahrscheinlichkeit p bestimmen werden kann. Leider gibt P̂ nicht den
ganz genauen Wert für die Wahrscheinlichkeit p der Eigenschaft A in der
Grundgesamtheit an. Wir können aber erwarten, dass p mit einer gewissen
Wahrscheinlichkeit γ = 1 –
( Pˆ
in einem Intervall um P̂ liegt.
− ∆ Pˆ ≤ p ≤ Pˆ + ∆ Pˆ
)
= 1− α
Erhält man für eine konkrete Stichprobe vom Umfang N die Anzahl X = k0 Erfolge für
das Eintreten des Ereignisses A , so erhält man den Schätzwert p̂ = k0 / N . Falls die
Bedingung
N · p̂ · q̂ > 9
mit
q̂ = 1 – p̂
erfüllt ist, kann die binomialverteilte Stichproben-Verteilung für X bzw. für P̂ als
normalverteilt betrachtet werden. Dann liegt die standardisierte Zufallsvariable
Z =
X − µ
σ
( N ⋅ Pˆ ) − ( N ⋅ p )
=
N⋅p⋅q
=
Pˆ − p
p⋅q
N
zwischen zwei Werten – z 0 und z 0, welche wir für
mit der Wahrscheinlichkeit γ = 1 –
eine vorgegebene Wahrscheinlichkeit bestimmen können. Wenn wir näherungsweise
σ = N ⋅ pˆ ⋅ qˆ setzen, gilt dann:
P ( − z0 ≤ Z ≤ z0
( Pˆ
)=
1− α
− ∆ pˆ ≤ p ≤ Pˆ + ∆ pˆ
)
= 1− α
wobei ∆ pˆ = z 0 ⋅
pˆ ⋅ qˆ
N
ist
14
(z)
Fehler
= 1–α
p̂
pˆ − ∆ pˆ
0
– z0
p
pˆ + ∆ pˆ
z
z0
Konfidenzintervall für den unbekannten Anteilswert p einer binomialverteilten
Zufallsvariable
Sei pˆ =
k0
der Anteilswert für die Anzahl k0 der Erfolge für das Eintreten eines
N
Ereignisses A in einer Stichprobe der Größe N aus einer Grundgesamtheit. Falls ferner
die Bedingung
N· p̂ · q̂ > 9
mit
p̂ = 1 – p̂
erfüllt ist, dann ist das Konfidenzintervall (Vertrauensintervall) für die unbekannten
Wahrscheinlichkeit (Anteilswert) p = P(A) der Binomial-Verteilung einer
Grundgesamtheit mit dem Vertrauensniveau γ = 1 – α , gegeben durch:
pˆ − z 0 ⋅
pˆ ⋅ qˆ
≤ p ≤ pˆ + z 0 ⋅
N
pˆ ⋅ qˆ
N
Der Wert für z 0 wird in Abhängigkeit vom Wert der Wahrscheinlichkeit γ = 1 –
der Standard-Normal-Verteilung bestimmt.
aus
#
Der maximale Fehler E bei der Intervall-Schätzung mit einem Vertrauensniveau
γ = 1 – α beträgt:
pˆ ⋅ qˆ
E = z0 ⋅
N
Für einen vergebenen Fehler E mit einem Vertrauensniveau γ = 1 – α kann die
Größe N der Stichprobe bestimmt werden durch:
N =
1
4
⋅
z0
2
E
15
Konstruktion eines Konfidenzintervalls für unbekanntem p einer binomialverteilten
Grundgesamtheit
)
)
)
Wählen eines Vertrauensniveau γ = 1 – α ( z.B. 90% ; 95% ; 99%)
Entnahme einer Stichprobe vom Umfang N und Berechnung des Anteils
k0
, wobei k0 die Anzahl der Elemente mit der Eigenschaft A (der Erfolge
pˆ =
N
für das Ereignis A) ist.
Überprüfung der Bedingung: N· p̂ · q̂ > 9 , (wobei q̂ = 1 – p̂ ist)
Bestimmung von z 0 mit Φ ( z 0 ) = 1 – α / 2 ,
(wobei Φ ( z ) die Verteilungsfunktion der Standard-Normal-Verteilung ist.)
pˆ ⋅ qˆ
Berechnung von ∆ pˆ = z 0 ⋅
N
Angabe des Konfidenzintervalls für p .
0
Eine Firma stellt Bolzen in großer Stückzahl her. Mit Hilfe einer Stichprobe soll der
Ausschuss-Anteil p der Produktion geschätzt werden. In einer Stichprobe vom Umfang
400 befanden sich 40 defekte Bolzen. Bestimmen Sie für den wahren Ausschussanteil
ein Vertrauensintervall mit einem Vertrauensniveau von 95%.
!"
#
0,95
0,025
0,025
–z
0
+– z 0
0
z
Da das Ziehen aus der großen Produktion durch ein Bernouli-Experiment beschrieben
werden kann, ist die Verteilung der Stichproben-Anteilswerte binomialverteilt.
γ = 1 – α = 0,95 ,
N = 400 ,
k0 = 40
p̂ = 0,1
N· p̂ · q̂ = 400 · 0,1 · 0,9 = 36 > 9
Φ ( z 0 ) = 1 – 0,05 2 = 0,975
∆ pˆ = 1 , 96 ⋅
0,1 – 0,0294
z 0 = 1,96
0 ,1 ⋅ 0 , 9
= 0,0294
400
p
0,1 + 0,0294
⇔
0,0706
p
0,1294
16
Herunterladen