Kap. 10 weiter (Teil II) Stichproben

Werbung
In diesem Abschnitt wird die Stichprobenverteilung der Varianz aus einer Gesamtheit
untersucht. Da die Varianz immer eine nicht-negative Größe ist, kann also die Verteilung
der Stichproben-Varianzen nicht normalverteilt sein.
Die Längen (in Millimetern) von 32 serienmäßig hergestellten Bolzen einer Lieferung sind in
der folgenden Datenreihe dargestellt. Die Längen der Bolzen sind normalverteilt.
2,8
3,8
4,9
6,2
2,8
4,2
5,2
6,3
2,9
4,4
5,2
3,1
4,6
5,5
3,2
4,6
5,6
xi
3,5
4,6
5,6
3,6
4,6
5,7
3,7
4,7
5,7
3,8
4,8
6,1
3,8
4,9
6,1
Es wurden alle möglichen Stichproben vom Umfang N = 5 mit Zurücklegen aus dieser
Gesamtheit entnommen. Dabei wurde für jede Stichprobe die Varianz berechnet. Einige
der Ergebnisse sind in der folgenden Tabelle bzw. Abb. angezeigt.
0,0
0,0
0,0
si²
. . . . . . .
0,0
3,675
3,675
3,675
1048576 Varianzen
1
s² =
f(x)
Einige Stichproben
vom Umfang N = 5
aus der Gesamtheit
N
(xi – x)²
N–1 i
s² = 0,72
s² = 2, 49
3,1
6,1
3,2
6,1
4,6
6,1
4,6
s² = 3,675
4,6
6,1
4,2
6,3
6,3
6,3
2,8
1
2
3
4
5
6
7
x
2,8
15
f(s²)
f(x)
0.6
0.5
Stichproben
der Größen:
N=5
0.3
0.25
0.2
0.4
Χ² =
(N – 1) S ²
²
0.3
0.15
0.2
0.1
0.1
0.05
s²
x
2
3
4
5
6
1
7
2
3
4
f v ( χ ²)
ν = N –1
Die Verteilung von StichprobenVarianzen aus einer normalverteilten
Gesamtheit entspricht einer NichtNormalverteilung.
ν = 4
0.2
0.15
0.1
0.05
2
0
4
6
8
χ²
Theorem
Sei S ² die Varianz einer Stichprobe der Größe N aus einer normalverteilten
Grundgesamtheit mit der Varianz ² , so folgt die Variable
Χ2 =
( N − 1) S 2
σ
2
einer Chi-Quadrat-Verteilung mit ν = N – 1 Freiheitsgeraden.
Chi-Qudrat-Verteilung
Die Verteilung der stetigen Zufallsvariable Χ ² mit der Dichtefunktion:
(
f χ2
)=
ν
1
2ν 2
Γ (ν 2 )
(χ 2 )2
−1
e
−
χ2
2
für
χ2 > 0
mit
ν > 0
heißt Chi-Qudrat-Verteilung mit ν Freiheitsgeraden.
Ihre Verteilungsfunktion ist:
Fν
(χ )
2
= P
(Χ
2
≤ χ
2
)
χ2
=
0
1
2ν 2
Γ (ν 2 )
ν
u
2
−1
e
−
u
2
du
16
! "
#
Im Anhang befindet sich eine Tabelle mit den Werten der Verteilungsfunktion F ν ( χ ² )
der Chi-Quadrat-Verteilung für beliebige χ ² ≥ 0.
f
ν
Dichtefunktionen verschiedener
Chi-Quadrat-Verteilungen
(χ²)
ν = 1
ν = 5
ν = 9
χ²
$
Die Verteilung der Längen der Bolzen in der Lieferung des vorigen Beispiels (Bsp. 5)
entspricht einer Normalverteilung mit einer Varianz von 1,12. Wie groß ist die
Wahrscheinlichkeit, dass man eine Stichprobe vom Umfang N = 5 (mit Zurücklegen), aus
der Lieferung erhält, deren Varianz für die Länge der Bolzen kleiner als 0,2 [mm] ist?
%&
#
χ 02
=
( N − 1 ) s 02
σ
2
=
( 5 − 1) ⋅ 0 , 2
1 , 12
Anzahl der Freiheitsgeraden:
= 0 , 714
ν=N–1 = 5–1=4
Also ist die Wahrscheinlichkeit:
(
P S 2 ≤ 0,2
)
=
P
( Χ2
≤ 0 , 714
)
= F4
( 0 , 714 ) ≈ 0 , 05
'
(
Sei p der Anteilswert einer beliebigen Eigenschaft A einer Grundgesamtheit. Und sei
X die Anzahl der Elemente mit Eigenschaft A in einer Stichprobe vom Umfang N aus
∧
einer Gesamtheit. Dann gibt P den Anteilswert in einer Stichprobe an.
∧
P =
X
N
Wegen der Unabhängigkeit der einzelnen Züge liegt ein N-faches Bernouli-Experiment
vor. Somit ist X binomialverteilt. Folglich ist die Stichproben-Verteilung von
Anteilswerten auch binomialverteilt.
17
)
Eine Universität hat 4 Studenten (Grundgesamtheitsgröße: NG = 4 ). Die Noten der 4
Studenten sind jeweils A ; B ; C bzw. D .
Geben Sie den Anteilswert (die Wahrscheinlichkeit) für die Note „A“ bzw. für die Note
„kein A“ in der Grundgesamtheit an.
Es sollen Stichproben vom Umfang N = 2 mit Zurücklegen entnommen werden. Geben
Sie alle möglichen Stichproben an.
Geben Sie für jede Stichprobe an, wie oft man 0-mal, 1-mal bzw. 2-mal die Note „A“
erhält. Und berechnen Sie die jeweiligen Anteilswerte dafür.
%&
#
Gesamtheit: { A ; B; C ; D } ; NG = 4
p=P(A)=¼
A : „Note A“
; q = P (A ) = ¾
Alle möglichen verschiedenen Stichproben vom Umfang N = 2 lauten:
A
{A;A}
{B;A}
{C;A}
{D;A}
A
B
C
D
B
{A;B}
{B;B}
{C;B}
{D;B}
C
{A;C}
{B;C}
{C;C}
{D;C}
D
{A;D}
{B;D}
{C;D}
{D;D}
∧
P = X
N
X=0;1;2
x
x
x
x
=
=
=
=
2
1
1
1
x
x
x
x
=
=
=
=
1
0
0
0
x
x
x
x
=
=
=
=
1
0
0
0
x
x
x
x
=
=
=
=
1
0
0
0
∧
= 1
p
∧
p
∧
p
∧
∧
= ½
p
= ½
p
= ½
p
∧
p
∧
∧
p
= ½
∧
p
∧
= 0
p
= 0
p
= 0
∧
∧
p
= ½
∧
p
∧
= 0
p
= 0
p
= 0
∧
∧
p
= ½
= 0
= 0
= 0
' *
+
Ergänzen Sie aus dem vorigen Beispiel die erste Tabelle für die
Wahrscheinlichkeitsverteilung der Treffer für die Note „A“ in den Stichproben. Und
ergänzen Sie die zweite Tabelle für die Wahrscheinlichkeitsverteilung der Anteilswerte
der Stichproben.
Zeichnen Sie die Wahrscheinlichkeitsverteilung für beide Verteilungen.
%&
#
∧
X=k
P(X=k)
0
9 16
1
P
0
½
∧
f( P )
18
P( X = k )
Stichproben-Verteilung der
Treffer X für die Note A
f(p)
9 16
9 16
6 16
6 16
X=k
1 16
01
12
Stichproben-Verteilung der
Anteilswerte für die Note A
1 16
01
2
½2
1
p
' *
+
Zeigen Sie, dass die Wahrscheinlichkeitsverteilung der Stichproben der X-Werte für die
Note „A“ und folglich die Verteilung der Stichproben-Anteilswerte für die Note „A“ einer
Binomial-Verteilung mit dem Anteilswert für die Note „A“ aus der Gesamtheit gehorchen.
%&
#
Stichproben-Verteilung des Anteilswertes
Sei p der Anteilswert einer beliebigen Eigenschaft A einer Grundgesamtheit und sei
∧
X
der Anteilswert für die Anzahl X von Treffer für das Eintreten einer Eigenschaft
P =
N
(eines Ereignisses) A in Stichproben der Größe N aus der Grundgesamtheit. Dann
gehorchen die Stichproben-Verteilung von X sowie die von den Anteilswerten einer
Binomialverteilung mit p = P ( A ).
Da die Stichproben-Verteilung von X einer Binomilaverteilung mit p gehorcht, gelten
folgende Formeln für den Erwartungswert bzw. die Standardabweichung:
µ = Np
bzw.
σ =
N pq
Für sehr große N kann die Binomial-Verteilung durch die Normal-Vertetilung angenähert
werden.
19
Approximation der Stichproben-Verteilung von Anteilswerten durch die NormalVerteilung
Sei p der Anteilswert einer beliebigen Eigenschaft A einer Grundgesamtheit und sei
∧
X
der Anteilswert für die Anzahl X von Treffern für das Eintreten einer
P =
N
Eigenschaft A in Stichproben der Größe N aus der Grundgesamtheit. Für große N und
p-Werte die sich deutlich von 0 und 1 unterscheiden gehorcht dann in guter Näherung die
standardisierte Zufallsvariable
∧
Z =
N ⋅P − N ⋅ p
N⋅ p⋅q
einer Normal-Verteilung.
! "
#
Die Näherung ist zulässig, wenn die Bedingung: N p q > 9 erfüllt ist.
Für Werte von p , die sich nicht sehr von ½ unterscheiden, ist die Näherung auch
zulässig, wenn die Bedingungen: N p ≥ 5 UND N q ≥ 5 erfüllt sind.
' *
In einer großen Serienproduktion von Chips sind von den 5000 hergestellten Chips 1000
defekt. Es soll eine Stichprobe vom Umfang 100 (ohne Zurücklegen) gezogen werden.
Wegen der großen Gesamtheit kann die Entnahme als Ziehen mit Zurücklegen betrachtet
werden. Wie groß ist die Wahrscheinlichkeit, dass in der Stichprobe weniger als 30% der
Chips defekt sind?
%&
#
20
Herunterladen