Kennwerteverteilungen von Häufigkeiten und Anteilen Die

Werbung
Kennwerteverteilungen von
Häufigkeiten und Anteilen
6. Sitzung 32 S., SoSe 2003
1
Die hypergeometrische
Verteilung
• Wahrscheinlichkeitsverteilung der Häufigkeit
eines binären Merkmals bei
– Einfacher Zufallsauswahl
– Ohne Zurücklegen
6. Sitzung 32 S., SoSe 2003
2
1
Die hypergeometrische
Verteilung II
6. Sitzung 32 S., SoSe 2003
3
#%$ & ' (*) + ,.- / 0 1 243 5 6 7 8 9 3 : 3 ; 3<8 = >*3 5 ? 3 @ AB3 C 5 9 6 7 8 3D243 5 C 3 9 E F ; ? 3 ;
GK M NOGK M N GK P K GK N Q GI Q J
GH I J GI K L GI K L GH I J GH N K
GH P R GH I GP K R GK M GP K R GK P LSGK P L
T
GH I GH LUGH I *GH Q N GH Q NVGH I GH L T GH I GH P GH P Q GI M J GI M J GP Q N GH P
!"
!"
6. Sitzung 32 S., SoSe 2003
4
Abbildung aus Kühnel/Krebs, 2001: 165
2
Verteilungsfunktion der
hypergeometrischen Verteilung
6. Sitzung 32 S., SoSe 2003
5
Erwartungswert und Varianz der
Hypergeometrischen Verteilung
6. Sitzung 32 S., SoSe 2003
6
3
Die Binomialverteilung
• Wahrscheinlichkeit der Häufigkeit eines
binären Merkmals bei
– Einfacher Zufallsauswahl
– Mit Zurücklegen
6. Sitzung 32 S., SoSe 2003
7
• Wahrscheinlichkeit der Stichprobenzusammensetzung:
(π 1 )
n1
* (π 2 ) 2 = (π 1 ) 1 * (1 − π 1 )
n
n
n-n1
– N=Anzahl der Elemente der Gesamtmenge
– N1=Häufigkeit der Ausprägung 1
– N2=Häufigkeit der Ausprägung 0
π
π
1
0
=
N
=
N
/ N
1
0
/ N
6. Sitzung 32 S., SoSe 2003
8
4
Binomialverteilung
• Die Wahrscheinlichkeit der Zufallsvariablen X
„Häufigkeit der Ausprägung 1 bzw. 0 eines binären
Merkmals in einer einfachen Zufallsauswahl mit
Zurücklegen“ heißt Binomialverteilung.
Die Realisierungswahrscheinlichkeit für die Häufigkeit
n1 bei einer Binomialverteilung entspricht .
• P(X = n1) =
n 
n − n1
n1
π
−
π
*
*
1
1)
  1 (
n
 1
6. Sitzung 32 S., SoSe 2003
9
! " # $ %& '( )& *
< = > ? @ ? AN C
+ ,0
+ ,0
O Q R QUO Q R Q
+ ,/
+ ,/
OW R S OW S R OW P R
9:;8 + , .
OR S T
OR S T
89:; + , .
OR R W
+ ,- OP Q R
+ ,- OP V P OR W R
O
P
Q
R
O P V Q O P R R O P P WXO P P R
O
P
P
T
+
+
+1-2.3/4065
+D-E.D/F0D5FGIHFJFKL- +
7
7
< = > ? @? AB C
< = > ? @ ? AM C
+ ,0
+ ,0
+ ,/
+ ,/
OW T Y OW Q V
OW V T OW P S
O
W
P
S
O
W
P
P
+
,
.
+
,
.
89:;
89:;
OR R Y OP V V
OR W R
+ ,- OP R P OP V V OR R Y
+ , - Z O P P R O P P R[O P P \]O P Q Y O R P Q
O
P
R
P
OP W ^
O P P R1+ Z O P P R
+ OP P R
+D-E.D/F0D5FGIHFJFKL- +
+D-E.D/F0D5FGIHFJFKL- +
7
7
6. Sitzung 32 S., SoSe 2003
10
Abbildung aus Kühnel/Krebs, 2001: 170
5
Binomialverteilung
• Die Verteilungsfunktion (die kumulierte
Wahrscheinlichkeitsverteilung) für die
Binomialverteilung kann wie folgt
berechnet werden:
 n j
n− j
P( X ≤ n1 ) = ∑  *π1 * (1 − π1 )
j =0  j 
n1
6. Sitzung 32 S., SoSe 2003
11
Die Binomialverteilung
• Erwartungswert und Varianz der
Binomialverteilung
Erwartungswert : µ x = n * π 1
Varianz : n * π 1 * (1 − π 1 )
• Die Bernoulliverteilung
– Spezialfall der Binomialverteilung
– Stichprobenumfang n = 1
6. Sitzung 32 S., SoSe 2003
12
6
Relative Häufigkeiten
• Der Erwartungswert für den Anteil p1 der
Ausprägungen 1 eines binären Merkmals ist gelich
den Erwartungswert der absoluten Häufigkeiten,
dividiert durch den Stichprobenumfang n:
1
1
µ ( p1 ) = 0 + * µ x = *(n *π 1 ) = π1
n
n
Bei einer einfachen Zufallsauswahl ist der
Erwartungswert des Stichprobenanteils gleich
dem Populationsanteil. Dies gilt für einfache
Zufallsauswahlen mit und ohne Zurücklegen.
6. Sitzung 32 S., SoSe 2003
13
Relative Häufigkeit
• Varianz eines Stichprobenanteils σ 2 (p1)
– Bei einer einfachen Zufallsauswahl mit
Zurücklegen (Binomialverteilung)
1
*σ
n2
π * (1 − π 1 )
= 1
n
σ 2 ( p1 ) =
2
x
=
1
* ( n * π 1 * (1 − π 1 ) =
n2
6. Sitzung 32 S., SoSe 2003
14
7
Relative Häufigkeit
• Varianz eines Stichprobenanteils σ 2(p1)
– Bei einer einfachen Zufallsauswahl ohne
Ersetzung (hypergeometrische Verteilung)
π1 *(1 − π1) N − n
1
2
σ ( p1 ) = 2 *σ X = ... =
*
n
n
N −1
2
6. Sitzung 32 S., SoSe 2003
15
Beziehungen hypergeometrischer
Verteilung und Binomialverteilung
• Beide Verteilungen haben identische
Erwartungswerte
• Die Varianzen nähern sich für große
Stichproben aneinander an
• Verteilungen werden sich insgesamt für
große Stichproben (bzw. Populationen)
ähnlicher:
– Sog. Asymptotische Annäherung
6. Sitzung 32 S., SoSe 2003
16
8
& / "78/! " + # ,-$ / %'6 & 5 9" "#(# ! . ") /*5 $" # % % " + ,-" . # / 0 1 ! " 324" # . " / 5 $ %'6 ? AN
?A
?A
? A>
?
?
>
N
=> ? @ ? @> ? C
=> ? @> ? ? @B ? C
B
M
=> ? @ ? ? @> ? ? C
>?
< = > ? @? AB C
6. Sitzung 32 S., SoSe 2003
17
Abbildung aus Kühnel/Krebs, 2001: 176
Die Normalverteilung und
verwandte
Wahrscheinlichkeitsverteilungen
Kennwertverteilungen von
Mittelwerten und Varianzen
6. Sitzung 32 S., SoSe 2003
18
9
Wahrscheinlichkeitsdichten
kontinuierlicher Zufallsvariablen
• Diskrete Zufallsvariable
– Die Ausprägungen sind abzählbar also durch
ganze Zahlen erfassbar.
– Z.B. die absolute Häufigkeit einer Ausprägung.
• Kontinuierliche Zufallsvariable
– Die Ausprägungen liegen beliebig dicht
beieinander und können nur durch reelle Zahlen
erfasst werden.
– Z.B. die exakt gemessene durchschnittliche
Körpergröße in einer Population.
6. Sitzung 32 S., SoSe 2003
19
Dichte
• Häufigkeitsdichte
– Wird als Quotient aus der relativen Häufigkeit
einer Klasse und der Klassenbreite berechnet.
• Wahrscheinlichkeitsdichte
– Die Wahrscheinlichkeitsverteilung einer
kontinuierlichen Zufallsvariable kann in Intervalle
aufgeteilt werden. Die Wahrscheinlichkeitsdichte
ist definiert als die Höhe eines Intervalls dessen
Breite gegen null geht.
6. Sitzung 32 S., SoSe 2003
20
10
Dichte
• Über die Wahrscheinlichkeitsdichten
können die Wahrscheinlichkeiten von
Intervallen berechnet werden.
a
∫
P (a ≤ x ≤ b ) =
f ( x )dx
a
b
m it ∫ f ( x ) d x = b e s tim m te s In te g ra l v o n a b is b
a
ü b e r d ie D ic h te d e r Z u fa lls v a ria b le n X
6. Sitzung 32 S., SoSe 2003
& / 16 !! .# "0 31 ! 0 " . "/ . /5 %/ 1 " ! # " $/ . " 6 5 $0 9 6 & # / 6 6 5 !" # 0 1 ! " / 5 / 1 ! " / . 0
75
74
73
1
3
4
5
E FG ! * * ( ! ( ! # . ! * / % # ( !
H ((! * / % ! " # $ % & # ' & ( ! ( ' & ) ( * # % ,+ #
( ! - . ! * / % 06 1
:? C > 0 5 2
D=
? C <> 0 5 1
:B? 0 4 2
A? [email protected]
: > 04 1
:8 ;<=9 0 3 2
03 1
01 2
01 1 7 6
21
6
06 1
:? C > 0 5 2
D=
? C <> 0 5 1
:B? 0 4 2
A? [email protected]
: > 04 1
:8 ;<=9 0 3 2
03 1
01 2
01 1 7 6
6. Sitzung 32 S., SoSe 2003
75
74
73
I1
3
4
5
6
22
Abbildung aus Kühnel/Krebs, 2001: 184
11
Verteilungsfunktion
• Die Verteilungsfunktion F(x) einer
kontinuierlichen Zufallsvariable ist definiert
als das bestimmte Integral der
Wahrscheinlichkeitsdichte von minus
unendlich bis zur Stelle x:
x
F ( x) = P(−∞ ≤ X ≤ x) = ∫ f (u)du
−∞
6. Sitzung 32 S., SoSe 2003
23
! " # ! $ ! &
&
% ! ' ( " *) ! # + , j T UV W X Y e Z [ \ W ] ^ _ ` ] a Z X [ Z ` ] b a Z Y W [ _ k [ l ` ] a
V X Y a ^ a ^ mnZ ` ] Y a
~†ƒ
Œ‰Š ‹
~ƒ ‡ ‚
ˆ
ƒ ‡ €‚
…ƒ „
~‚
~| €}
ou p
ot q
ot p
os q
os p
or q
or p
op q
op p v u v t
 Ž −∞
S T UV W X Y Z [ \ W ] ^ _ ` ] a Z X [ Z ` ] b a Z Y W [ _ c X d a ^ _ a
e a ^ f a ^ Y a Z[V X g _ hV X b Y Zi X
RPO Q
FM E NI
L HIJK
FG E HIC
B CD
16%
vs
v r pwrxsytzu
 Ž −r {
/8
/7
/6
/5
/4
/3
/2
/1
/ .0
0
; < = > ? @ −A
93
92
 =−‘
’
“ ” • –˜— ” ™ –š ™œ›  ž Ÿ
=
∫
=−∞
⋅
=
91
90
-.
0:1:2:3
Abbildung aus Kühnel/Krebs, 2001: 186
6. Sitzung 32 S., SoSe 2003
24
12
Erwartungswert und Varianz
• Erwartungswert einer kontinuierlichen
Zufallsvariable:
+∞
µx = ∫ x * f (x)dx
−∞
wobei µx = Erwartungswert einer
Zufallsvariablen X
6. Sitzung 32 S., SoSe 2003
25
Erwartungswert und Varianz
• Die Varianz einer stetigen Zufallsvariablen
X ist gleich:
σ
2
X
=
+∞
∫
(x − µ
X
)2 * f (x )dx =
−∞



+ ∞
∫
2
f
-∞
w o b e i (x -µ
X

x dx  − µ

2
x
x
*
)2
6. Sitzung 32 S., SoSe 2003
26
13
(
)
Normalverteilungen:
Die Gauß´sche Normalverteilung
• Symmetrische, unimodale,
glockenförmige Verteilung, deren
Ausprägungen von −∞ bis +∞ reichen.
• Kennzeichnend:
– feste Realisierungswahrscheinlichkeiten in
Intervallen, die +/- k σ x
Standardabweichungen um den
Erwartungswert µ x liegen;
6. Sitzung 32 S., SoSe 2003
27
"
! # $ # % &, '
&+ (
&+ '
&* (
&* '
&) (
&) '
&' (
&' ' . ,
@G C
@F D
@F C
@A D
@A C
@E D
@E C
@C D
@C C G
I
/ 0 µ1 − 2 ⋅ 3 4 ≤ 5
≤µ
4762 ⋅ 3 4 8 9: ; < = ;
> ? @A > B
@G C
@F D
@F C
@A D
@A C
@E D
@E C
@C D
@C C G
I
.+
.*
.)
J K µ4 − Q ⋅ 3 4 ≤ 5
IF
IA
'-
)
≤µ
*
+
,
J K µ4 − = ⋅ 3 4 ≤ 5
IF
IA
≤µ
476L= ⋅ 3 4 8 9: M N O O
P D @G G B
I E HC E
A
F
G
476LQ ⋅ 3 4 8 9: M M R =
P P @S A B
I E CH E
A
Abbildung aus Kühnel/Krebs, 2001: 190
F
G
6. Sitzung 32 S., SoSe 2003
28
14
Wahrscheinlichkeitsdichte
der Normalverteilung
f ( x) =
1
2πσ
2
x
*e
( x− µ x )2
−2σ 2x
π = Kreiskonstante Pi
e = Eulersche Zahl
(Basis des Natürlichen Logarithmus)
6. Sitzung 32 S., SoSe 2003
29
Standardnormalverteilung und
Z-Transformation
• Jede Normalverteilte Zufallsvariable X kann mit Hilfe
der Z-Transformation (auch Standardisierung
genannt) in eine Standardnormalverteilte Variable
überführt werden.
• Standardisierte (d.h. standardnormalverteilte)
Variablen haben einen Erwartungswertµ x = 0, und
eine Standardabweichung σ x = 1
• Die Wahrscheinlichkeitsdichte einer
standardnormalverteilten Variablen wird mit Φ( z )
bezeichnet.
6. Sitzung 32 S., SoSe 2003
30
15
Z-Transformation
Standardisiert eine normalverteilte
Zufallsvariable (weist ihr einen Quantilwert
der Standardnormalverteilung zu)
zα =
qα − µ X
σx
zα = Quantilwert der standardisierten Zufallsvariablen X
qα = Quantilwert der normalverteilten Zufallsvariablen X
6. Sitzung 32 S., SoSe 2003
31
Quantilwerte und
Quantilwahrscheinlichkeiten
• Quantilwerte können als Ausprägungen von
Standardnormalverteilungen betrachtet
werden
• Diesen Quantilwerten können
Auftretenswahrscheinlichkeiten zugewiesen
werden:
Dies geschieht über die sogenannte „ZTabelle“ der Quantile der Normalverteilung.
(S.642-Kühnel/Krebs)
6. Sitzung 32 S., SoSe 2003
32
16
Herunterladen