Kennwerteverteilungen von Hфufigkeiten und Anteilen Die

Werbung
Kennwerteverteilungen von
Häufigkeiten und Anteilen
SS2001
6.Sitzung vom 29.05.2001
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Die hypergeometrische
Verteilung
• Wahrscheinlichkeitsverteilung der Häufigkeit
eines binären Merkmals bei
– Einfacher Zufallsauswahl
– Ohne Zurücklegen
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Die hypergeometrische
Verteilung II
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
N
O
O
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
`
[
a
[
b
[
_
c
d
[
\
e
[
f
g
[
h
\
`
]
^
_
[
Z
[
\
h
[
`
i
j
b
e
!

&
s
t
u
v
s
t
u
'
€
"
#
b
!
$
%

+
v
{
[
&
'
*
&
'
)
|
}
|
~
1
‚

ƒ
./0
o
p
q
r
s
w
t
x
~
&
'
(
s
y
v
t
„
k
l
m
n
s
y
w
‡
&
&
(
)
*
'
2
#
!
"
#
!

2
#
%
>
—
™
8
F
I
8
F
H
8
F
G
8
F
7
*

–
—
…
ˆ
,
?
@
A
B
C
A
B
D
E
™
„
'
…
+
-
+
&
†
„
&
…
z
˜

–
—
Œ
†

„
Œ
†

˜
=
=
&
'
)
:;<
:;<
„
&

'
(
‘
‘
“

‘
’
’

‘
”
•

‘
”
•

‘
’
’

‘
‘
“
„


‘
‘
’


‘
‘
†
ˆ
Š
‹
„
ˆ
Š
‹
‰
„
†
‰
Ž
’
„
&
…
…
…
†
&
„
…
…
†
8
(
)
*
+
,
3
4
5
6
7
8
8
7
9
G
H
I
J
K
L
M
6
7
8
9
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Abbildung aus Kühnel/Krebs, 2001: 165
Verteilungsfunktion der
hypergeometrischen Verteilung
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Erwartungswert und Varianz der
Hypergeometrischen Verteilung
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Die Binomialverteilung
• Wahrscheinlichkeit der Häufigkeit eines
binären Merkmals bei
– Einfacher Zufallsauswahl
– Mit Zurücklegen
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
• Wahrscheinlichkeit der Stichprobenzusammensetzung:
(π1 ) *(π2 )
n1
n2
= (π1 ) *(1−π1 )
n1
n-n1
– N=Anzahl der Elemente der Gesamtmenge
– N1=Häufigkeit der Ausprägung 1
– N2=Häufigkeit der Ausprägung 0
π
π
1
0
=
N
=
N6. Sitzung
N
32
0 /Kennwerteverteilungen
1
/ N
S.Peter Schmidt 2001
Binomialverteilung
• Die Wahrscheinlichkeit der Zufallsvariablen X
„Häufigkeit der Ausprägung 1 bzw. 0 eines binären
Merkmals in einer einfachen Zufallsauswahl mit
Zurücklegen“ heißt Binomialverteilung.
Die Realisierungswahrscheinlichkeit für die Häufigkeit
n1 bei einer Binomialverteilung entspricht .
n 
n − n1
n1
  * π 1 * (1 − π 1 )
 n1 
• P(X = n1) =
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
š
›
›
œ

ž
Ÿ
¡
¢
£
¤
¥
¦
§
¼
Ã
Ä
½
¨
¾
¿
©
À
ª
Á
«
¾
¬
§
­
§
®
§
¯
°
±
²
³
°
±
´
µ
¶
·
¸
ï
ð
·
°
µ
º
±
»
·
±
Â
Õ
È
í
¹
ï
í
ï
ð
Ý
Þ
â
Ö
×
Ä
Ç
Ý
Þ
á
Ã
Ä
Æ
Ý
Þ
à
Ý
Þ
ß
í
í
í
ð
ñ
ò
í
ð
ñ
ò
Ä
Å
í
í
î
ï
Ø
Ú
Û
Ü
ô
ð
ô
ñ
ð
ñ
í
ô
î
ð
éêëì
í
Ã
Ù
ï
Ã
ËÌÍÎ
Ø
ð
í
î
ï
î
ó
ð
ô
ð
í
ð
ð
ô
î
ð
í
í
î
î
î
ó
ï
ò
í
î
ð
Ý
Ã
Å
Æ
Ç
È
É
Ý
ß
à
á
â
ã
Ê
¼
Ã
Ä
È
Ã
Ä
Ç
½
Ï
À
¿
À
Á
ä
å
¾
Â
¼
Ã
Ä
È
Ã
Ä
Ç
Ã
Ä
Æ
Ã
Ä
Å
½
Ï
À
¿
À
Á
Ô
ô
î
î
ô
í
î
î
ç
ð
ß
Ý
Â
ô
ó
ô
ò
õ
ò
í
í
Ä
î
æ
è
í
í
Ã
ð
í
Ã
ñ
í
ô
î
ñ
í
Æ
ËÌÍÎ
ô
î
ô
ï
ó
î
ËÌÍÎ
í
ð
ð
õ
í
ð
ð
õ
í
Ã
Ä
Å
í
í
í
Ã
Ã
î
î
î
ð
î
ó
ó
í
î
ó
ó
î
í
î
ð
ð
î
Å
í
ö
Æ
Ç
È
É
Ð
Ñ
Ò
Ó
î
î
Å
ð
Ã
Ã
ö
Ã
í
í
î
î
î
î
ð
í
î
î
ð
í
î
î
÷
í
î
ï
ð
î
ï
í
ð
ô
ð
õ
í
î
ô
ø
ð
Å
Ê
Æ
Ç
È
É
Ð
Ñ
Ò
Ó
Å
Ã
Ê
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Abbildung aus Kühnel/Krebs, 2001: 170
Binomialverteilung
• Die Verteilungsfunktion (die kumulierte
Wahrscheinlichkeitsverteilung) für die
Binomialverteilung kann wie folgt
berechnet werden:
 n j
n− j
P( X ≤ n1 ) = ∑  *π1 * (1 − π1 )
j =0  j 
n1
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Die Binomialverteilung
• Erwartungswert und Varianz der
Binomialverteilung
Erwartungswert : µ x = n * π 1
Varianz : n * π 1 * (1 − π 1 )
• Die Bernoulliverteilung
– Spezialfall der Binomialverteilung
– Stichprobenumfang n = 1
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Relative Häufigkeiten
• Der Erwartungswert für den Anteil p1 der
Ausprägungen 1 eines binären Merkmals ist gelich
den Erwartungswert der absoluten Häufigkeiten,
dividiert durch den Stichprobenumfang n:
1
1
µ ( p1 ) = 0 + * µ x = *(n *π 1 ) = π 1
n
n
Bei einer einfachen Zufallsauswahl ist der
Erwartungswert des Stichprobenanteils gleich
dem Populationsanteil. Dies gilt für einfache
6. Sitzung
Kennwerteverteilungen
32
Zufallsauswahlen
mit
und ohne Zurücklegen.
S.Peter Schmidt 2001
Relative Häufigkeit
• Varianz eines Stichprobenanteils σ 2 (p1)
– Bei einer einfachen Zufallsauswahl mit
Zurücklegen (Binomialverteilung)
1
*σ
2
n
π 1 * (1 − π 1 )
=
n
σ
2
( p1 ) =
2
x
=
1
* ( n * π 1 * (1 − π 1 ) =
2
n
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Relative Häufigkeit
• Varianz eines Stichprobenanteils σ 2(p1)
– Bei einer einfachen Zufallsauswahl ohne
Ersetzung (hypergeometrische Verteilung)
π1 *(1 − π1) N − n
1
2
*
σ ( p1 ) = 2 *σ X = ... =
n
n
N −1
2
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Beziehungen hypergeometrischer
Verteilung und Binomialverteilung
• Beide Verteilungen haben identische
Erwartungswerte
• Die Varianzen nähern sich für große
Stichproben aneinander an
• Verteilungen werden sich insgesamt für
große Stichproben (bzw. Populationen)
ähnlicher:
– Sog. Asymptotische Annäherung
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
%
&
&
'
(
)
*
+
,
-
.
/
0
1
2
9
ý
þ
ÿ
ú
û
ü
?
2
3
5
4
E
?
5
2
6
<
7
2
=
8
?
9
2
D
5
C
6
F
4
5
6
:
>
;
5
5
?
C
7
6
2
8
5
<
=
5
>
6
?
@
A
4
5
2
B
5
6
>
5
?
C
7
2
8
D
2
8
ù
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
!
"
#
$
Abbildung aus Kühnel/Krebs, 2001: 176
Die Normalverteilung und
verwandte
Wahrscheinlichkeitsverteilungen
Kennwertverteilungen von
Mittelwerten und Varianzen
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Wahrscheinlichkeitsdichten
kontinuierlicher Zufallsvariablen
• Diskrete Zufallsvariable
– Die Ausprägungen sind abzählbar also durch
ganze Zahlen erfassbar.
– Z.B. die absolute Häufigkeit einer Ausprägung.
• Kontinuierliche Zufallsvariable
– Die Ausprägungen liegen beliebig dicht
beieinander und können nur ducrh reelle Zahlen
erfasst werden.
– Z.B.die exakt gemessene durchschnittliche
Körpergröße in einer Population.
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Dichte
• Häufigkeitsdichte
– Wird als Quotient aus der relativen Häufigkeit
einer Klasse dividiert durch die Klassenbreite
berechnet.
• Wahrscheinlichkeitsdichte
– Die Wahrscheinlichkeitsverteilung einer
kontinuierlichen Zufallsvariable kann in Intervalle
aufgeteilt werden. Die Wahrscheinlichkeitsdichte
ist definiert als die Höhe eines Intervalls dessen
Breite gegen null geht.
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Dichte
• Über die Wahrscheinlichkeitsdichten
können die Wahrscheinlichkeiten von
Intervallen berechnet werden.
a
∫
P (a ≤ x ≤ b) =
f ( x)dx
a
b
m it ∫ f ( x ) d x = b e s tim m te s In te g ra l v o n a b is b
a
ü b e r d ie D ic h te d e r Z u fa lls v a ria b le n X
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
G
H
H
I
J
K
L
M
N
O
P
Q
R
S
T
b
c
U
d
e
V
W
f
g
X
U
h
Y
i
Z
f
[
g
\
f
X
c
Z
j
U
g
k
]
Y
l
Z
m
^
n
Y
o
[
_
p
p
i
[
`
q
o
S
k
c
T
o
r
p
«
t
u
v
w
‡
‘
—
ˆ
x
y
w
‰
Š
z
{
ˆ
‹
|
Œ
z

}
Ž

w

~


€

x
~
‚

w
ƒ
|
y
ƒ
‚

„
w
ƒ
…
~
x
€
{
†
V
g
W
X
U
Y
Z
[
\
Z
X
U
]
Y
Z
^
W
a
h
¬
­
®
¯
°
½
¼
±
¯
°
²
³
À
Á
´
®
µ
°
²
®
°
¶
·
®
¯
°
±
¸
¹
³
³
¶
²
®
~
Œ
º
’
Ä
Ê
Å
Ä
É
Æ
Ä
É
Å
Ä
È
Æ
Ä
È
Å
Ä
Ç
Æ
Ä
Ç
Å
Ä
Å
Æ
Ä
Å
Å
»
¼
¾
¿
»
Â
½
½
»
Ò
¤
×
©
Î
U
‘
–
“
Ó
¥
Ø
ª
Ñ
£
¥
©
‘
Ó
–
¢
×
’
Ð
Ò
¤
ÎÖ
¨
‘
•
“
Ó
¥
Õ
§
Ñ
£
¥
Ó
Ô
¦
‘
•
’
‘
”
“
Î
Ò
¤
¡
ž
¢£
Î
Ï
Ì
Ÿ
‘
”
’
‘
’
“
‘
’
’
˜
™
˜
š
˜
›
˜
œ

œ
›
š
™
ÐÑ
Í
Ë
Ê
Ë
É
s
Ë
È
Ë
Ç
Å
Ç
È
É
Ê
Ã
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Abbildung aus Kühnel/Krebs, 2001: 184
Verteilungsfunktion
• Die Verteilungsfunktion F(x) einer
kontinuierlichen Zufallsvariable ist ist definiert
als das bestimmte Integral der
wahrscheinlichkeitsdichte von minus
unendlich bis zur Stelle x:
F ( x) = P(−∞ ≤ X ≤ x) = ∫ f (u)du
x
−∞
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Ù
Ú
Ú
Û
Ü
Ý
Þ
ß
à
á
â
ã
ä
å
æ
ô
.
C
/
0
1
2
3
4
5
0
6
7
8
9
6
:
3
1
4
í
ç
3
è
9
ñ
6
é
ê
ø
;
:
ç
3
ù
2
ë
ú
E
F
G
ì
û
í
H
F
ü
î
I
ý
J
þ
ì
K
ÿ
ê
ÿ
ç
ï
ý
û
ë
ÿ
ì
ð
é
ñ
ì
ü
ÿ
ê
ç
ü
ý
ð
ÿ
ë
ò
ë
û
ó
è
ù
ð
L
ë
,
-
ú
þ
.
M
W
mn
]
î
ô
þ
/
í
õ
0
é
ú
1
2
ö
3
ý
4
5
ô
ú
0
í
6
ï
7
þ
8
9
ÿ
ð
ì
÷
í
û
6
:
3
1
4
3
9
6
;
:
3
2
0
4
8
<
1
=
:
7
8
:
D
>
p
ì
N
O
P
Q
R
P
Q
S
T
U
V
O
:
7
?
:
7
2
:
3
4
/
1
@
8
A
/
1
;
2
3
B
1
P
X
o
+
W
\
Y
f
k
b
()
*
"
g
W
\
X
W
[
Y
l
e
g
k
'
d
&
"
f
bj
%
!
g
W
[
X
i
"
#$
e
g
h
b
f
W
Z
Y
16%
!
b
c
de
W
Z
−
X
`
a
W
X
Y
W
X
X
q
^
r
^
]
^
\
[
−∞
Z
z
{
|
=
x
=−
∫
X
−
s
v
y
^
t
Z
[
\
]
_
u
w
=−∞
}
z
~
|
⋅

~
=
€

‚
ƒ
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Abbildung aus Kühnel/Krebs, 2001: 186
Erwartungswert und Varianz
• Erwartungswert einer kontinuierlichen
Zufallsvariable:
+∞
µx = ∫ x * f (x)dx
−∞
wobei µx = Erwartungswert einer
Zufallsvariablen X
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Erwartungswert und Varianz
• Die Varianz einer stetigen Zufallsvariablen
X ist gleich:
σ
2
X
=
+∞
∫
(x − µ
X
)2 * f ( x)dx =
−∞



+ ∞
∫
x
2
-∞
w o b e i (x -µ
X

* f ( x )dx  − µ

)2
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
2
x
Normalverteilungen:
Die Gauß´sche Normalverteilung
• Symmetrische, unimodale,
glockenförmige Verteilung, deren
Ausprägungen von −∞ bis +∞reichen.
• Kennzeichnend:
– feste Realisierungswahrscheinlichkeiten in
Intervallen, die ±k Standardabweichungen
σ xum den Erwartungswert µ x liegen;
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
„
…
…
†
‡
ˆ
‰
Š
‹
Œ

Ž

¬
­
¨
£
¢
§
¤
¢
§
‘
µ − ⋅
«
¢

®
’
“
”
­
≤
¯
•
–
—
≤µ
˜
°
™
­
š
“
”
“
²
⋅
±
‘
”
“
›
œ

›
ž
˜
Ÿ
“
›
š
“
‘
Ÿ
¡
”
Ç
’
³
´
µ
¶
·
¸
¹
º
¸
È
µ − ⋅
É
½
Ä
À
½
Ã
Á
½
Ã
À
½
¾
Á
½
¾
À
½
Â
Á
½
Â
À
½
À
Á
½
À
À
Ê
Ë
É
≤
≤µ
Ì
É
Í
Ê
⋅
Ë
É
Î
Ï
Ð
Ñ
Ò
Ó
Ó
¢
£
¦
¤
¢
¦
£
¢
¥
¤
¢
¥
£
»
¼
½
¾
»
¿
Ô
¢
£
Á
½
Ä
Ä
¿
¢
¤
£
£
Ä
ª
ª
¨
ª
§
ª
¦
¥
£
¥
¦
¨
Æ
§
Ã
Æ
©
Ç
È
µ − ⋅
É
½
Ä
À
½
Ã
Á
½
Ã
À
½
¾
Á
½
¾
À
½
Â
Á
½
Â
À
½
À
Á
½
À
À
Ë
Õ
É
≤
Ô
Ä
Æ
Ã
Æ
¾
Æ
Â
À
Â
¾
Ã
Ä
Æ
Å
≤µ
Ì
Ô
¾
Æ
½
Â
À
×
¾
É
Í
Õ
⋅
Ë
É
Î
Ï
Ð
Ñ
Ñ
Ö
Ê
¿
Â
¾
Ã
Ä
Æ
Å
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Abbildung aus Kühnel/Krebs, 2001: 190
Wahrscheinlichkeitsdichte
der Normalverteilung
f ( x) =
1
2πσ 2x
*e
( x − µ x )2
−2σ 2x
π = Kreiskonstante Pi
e = Eulersche Zahl
(Basis des Natürlichen Logarithmus)
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Standardnormalverteilung und
Z-Transformation
• Jede Normalverteilte Zufallsvariable X kann mit Hilfe
der Z-Transformation (auch Standardisierung
genannt) in eine Standardnormalverteilte Variable
überführt werden.
• Standardisierte (d.h. standardnormalverteilte)
Variablen haben einen Erwartungswertµ x = 0, und
eine Standardabweichung σ x = 1
• Die Wahrscheinlichkeitsdichte einer std.Norm.verteilten Variable wird mit Φ( z ) bezeichnet.
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Z-Transformation
Standardisiert eine Normalverteilte
Zufallsvariable (weist ihr einen Quantilwert
der Standardnormalverteilung zu)
qα − µ X
zα =
σx
zα = Quantilwert der standardisierten Zufallsvariablen X
qα = Quantilwert der normalverteilten Zufallsvariablen X
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Quantilwerte und
Quantilwahrscheinlichkeiten
• Quantilwerte können als Ausprägungen von
Standardnormalverteilungen betrachtet
werden
• Diesen Quantilwerten können
Auftretenswahrscheinlichkeiten zugewiesen
werden:
Dies geschieht über die sogenannte „ZTabelle“ der Quantile der Normalverteilung.
(S.642)
6. Sitzung Kennwerteverteilungen 32
S.Peter Schmidt 2001
Herunterladen