Kennwerteverteilungen von Häufigkeiten und Anteilen 6. Sitzung 32 S., SoSe 2003 1 Die hypergeometrische Verteilung • Wahrscheinlichkeitsverteilung der Häufigkeit eines binären Merkmals bei – Einfacher Zufallsauswahl – Ohne Zurücklegen 6. Sitzung 32 S., SoSe 2003 2 1 Die hypergeometrische Verteilung II 6. Sitzung 32 S., SoSe 2003 3 #%$ & ' (*) + ,.- / 0 1 243 5 6 7 8 9 3 : 3 ; 3<8 = >*3 5 ? 3 @ AB3 C 5 9 6 7 8 3D243 5 C 3 9 E F ; ? 3 ; GK M NOGK M N GK P K GK N Q GI Q J GH I J GI K L GI K L GH I J GH N K GH P R GH I GP K R GK M GP K R GK P LSGK P L T GH I GH LUGH I *GH Q N GH Q NVGH I GH L T GH I GH P GH P Q GI M J GI M J GP Q N GH P !" !" 6. Sitzung 32 S., SoSe 2003 4 Abbildung aus Kühnel/Krebs, 2001: 165 2 Verteilungsfunktion der hypergeometrischen Verteilung 6. Sitzung 32 S., SoSe 2003 5 Erwartungswert und Varianz der Hypergeometrischen Verteilung 6. Sitzung 32 S., SoSe 2003 6 3 Die Binomialverteilung • Wahrscheinlichkeit der Häufigkeit eines binären Merkmals bei – Einfacher Zufallsauswahl – Mit Zurücklegen 6. Sitzung 32 S., SoSe 2003 7 • Wahrscheinlichkeit der Stichprobenzusammensetzung: (π 1 ) n1 * (π 2 ) 2 = (π 1 ) 1 * (1 − π 1 ) n n n-n1 – N=Anzahl der Elemente der Gesamtmenge – N1=Häufigkeit der Ausprägung 1 – N2=Häufigkeit der Ausprägung 0 π π 1 0 = N = N / N 1 0 / N 6. Sitzung 32 S., SoSe 2003 8 4 Binomialverteilung • Die Wahrscheinlichkeit der Zufallsvariablen X „Häufigkeit der Ausprägung 1 bzw. 0 eines binären Merkmals in einer einfachen Zufallsauswahl mit Zurücklegen“ heißt Binomialverteilung. Die Realisierungswahrscheinlichkeit für die Häufigkeit n1 bei einer Binomialverteilung entspricht . • P(X = n1) = n n − n1 n1 π − π * * 1 1) 1 ( n 1 6. Sitzung 32 S., SoSe 2003 9 ! " # $ %& '( )& * < = > ? @ ? AN C + ,0 + ,0 O Q R QUO Q R Q + ,/ + ,/ OW R S OW S R OW P R 9:;8 + , . OR S T OR S T 89:; + , . OR R W + ,- OP Q R + ,- OP V P OR W R O P Q R O P V Q O P R R O P P WXO P P R O P P T + + +1-2.3/4065 +D-E.D/F0D5FGIHFJFKL- + 7 7 < = > ? @? AB C < = > ? @ ? AM C + ,0 + ,0 + ,/ + ,/ OW T Y OW Q V OW V T OW P S O W P S O W P P + , . + , . 89:; 89:; OR R Y OP V V OR W R + ,- OP R P OP V V OR R Y + , - Z O P P R O P P R[O P P \]O P Q Y O R P Q O P R P OP W ^ O P P R1+ Z O P P R + OP P R +D-E.D/F0D5FGIHFJFKL- + +D-E.D/F0D5FGIHFJFKL- + 7 7 6. Sitzung 32 S., SoSe 2003 10 Abbildung aus Kühnel/Krebs, 2001: 170 5 Binomialverteilung • Die Verteilungsfunktion (die kumulierte Wahrscheinlichkeitsverteilung) für die Binomialverteilung kann wie folgt berechnet werden: n j n− j P( X ≤ n1 ) = ∑ *π1 * (1 − π1 ) j =0 j n1 6. Sitzung 32 S., SoSe 2003 11 Die Binomialverteilung • Erwartungswert und Varianz der Binomialverteilung Erwartungswert : µ x = n * π 1 Varianz : n * π 1 * (1 − π 1 ) • Die Bernoulliverteilung – Spezialfall der Binomialverteilung – Stichprobenumfang n = 1 6. Sitzung 32 S., SoSe 2003 12 6 Relative Häufigkeiten • Der Erwartungswert für den Anteil p1 der Ausprägungen 1 eines binären Merkmals ist gelich den Erwartungswert der absoluten Häufigkeiten, dividiert durch den Stichprobenumfang n: 1 1 µ ( p1 ) = 0 + * µ x = *(n *π 1 ) = π1 n n Bei einer einfachen Zufallsauswahl ist der Erwartungswert des Stichprobenanteils gleich dem Populationsanteil. Dies gilt für einfache Zufallsauswahlen mit und ohne Zurücklegen. 6. Sitzung 32 S., SoSe 2003 13 Relative Häufigkeit • Varianz eines Stichprobenanteils σ 2 (p1) – Bei einer einfachen Zufallsauswahl mit Zurücklegen (Binomialverteilung) 1 *σ n2 π * (1 − π 1 ) = 1 n σ 2 ( p1 ) = 2 x = 1 * ( n * π 1 * (1 − π 1 ) = n2 6. Sitzung 32 S., SoSe 2003 14 7 Relative Häufigkeit • Varianz eines Stichprobenanteils σ 2(p1) – Bei einer einfachen Zufallsauswahl ohne Ersetzung (hypergeometrische Verteilung) π1 *(1 − π1) N − n 1 2 σ ( p1 ) = 2 *σ X = ... = * n n N −1 2 6. Sitzung 32 S., SoSe 2003 15 Beziehungen hypergeometrischer Verteilung und Binomialverteilung • Beide Verteilungen haben identische Erwartungswerte • Die Varianzen nähern sich für große Stichproben aneinander an • Verteilungen werden sich insgesamt für große Stichproben (bzw. Populationen) ähnlicher: – Sog. Asymptotische Annäherung 6. Sitzung 32 S., SoSe 2003 16 8 & / "78/! " + # ,-$ / %'6 & 5 9" "#(# ! . ") /*5 $" # % % " + ,-" . # / 0 1 ! " 324" # . " / 5 $ %'6 ? AN ?A ?A ? A> ? ? > N => ? @ ? @> ? C => ? @> ? ? @B ? C B M => ? @ ? ? @> ? ? C >? < = > ? @? AB C 6. Sitzung 32 S., SoSe 2003 17 Abbildung aus Kühnel/Krebs, 2001: 176 Die Normalverteilung und verwandte Wahrscheinlichkeitsverteilungen Kennwertverteilungen von Mittelwerten und Varianzen 6. Sitzung 32 S., SoSe 2003 18 9 Wahrscheinlichkeitsdichten kontinuierlicher Zufallsvariablen • Diskrete Zufallsvariable – Die Ausprägungen sind abzählbar also durch ganze Zahlen erfassbar. – Z.B. die absolute Häufigkeit einer Ausprägung. • Kontinuierliche Zufallsvariable – Die Ausprägungen liegen beliebig dicht beieinander und können nur durch reelle Zahlen erfasst werden. – Z.B. die exakt gemessene durchschnittliche Körpergröße in einer Population. 6. Sitzung 32 S., SoSe 2003 19 Dichte • Häufigkeitsdichte – Wird als Quotient aus der relativen Häufigkeit einer Klasse und der Klassenbreite berechnet. • Wahrscheinlichkeitsdichte – Die Wahrscheinlichkeitsverteilung einer kontinuierlichen Zufallsvariable kann in Intervalle aufgeteilt werden. Die Wahrscheinlichkeitsdichte ist definiert als die Höhe eines Intervalls dessen Breite gegen null geht. 6. Sitzung 32 S., SoSe 2003 20 10 Dichte • Über die Wahrscheinlichkeitsdichten können die Wahrscheinlichkeiten von Intervallen berechnet werden. a ∫ P (a ≤ x ≤ b ) = f ( x )dx a b m it ∫ f ( x ) d x = b e s tim m te s In te g ra l v o n a b is b a ü b e r d ie D ic h te d e r Z u fa lls v a ria b le n X 6. Sitzung 32 S., SoSe 2003 & / 16 !! .# "0 31 ! 0 " . "/ . /5 %/ 1 " ! # " $/ . " 6 5 $0 9 6 & # / 6 6 5 !" # 0 1 ! " / 5 / 1 ! " / . 0 75 74 73 1 3 4 5 E FG ! * * ( ! ( ! # . ! * / % # ( ! H ((! * / % ! " # $ % & # ' & ( ! ( ' & ) ( * # % ,+ # ( ! - . ! * / % 06 1 :? C > 0 5 2 D= ? C <> 0 5 1 :B? 0 4 2 A? =@ : > 04 1 :8 ;<=9 0 3 2 03 1 01 2 01 1 7 6 21 6 06 1 :? C > 0 5 2 D= ? C <> 0 5 1 :B? 0 4 2 A? =@ : > 04 1 :8 ;<=9 0 3 2 03 1 01 2 01 1 7 6 6. Sitzung 32 S., SoSe 2003 75 74 73 I1 3 4 5 6 22 Abbildung aus Kühnel/Krebs, 2001: 184 11 Verteilungsfunktion • Die Verteilungsfunktion F(x) einer kontinuierlichen Zufallsvariable ist definiert als das bestimmte Integral der Wahrscheinlichkeitsdichte von minus unendlich bis zur Stelle x: x F ( x) = P(−∞ ≤ X ≤ x) = ∫ f (u)du −∞ 6. Sitzung 32 S., SoSe 2003 23 ! " # ! $ ! & & % ! ' ( " *) ! # + , j T UV W X Y e Z [ \ W ] ^ _ ` ] a Z X [ Z ` ] b a Z Y W [ _ k [ l ` ] a V X Y a ^ a ^ mnZ ` ] Y a ~ ~ ~ ~| } ou p ot q ot p os q os p or q or p op q op p v u v t −∞ S T UV W X Y Z [ \ W ] ^ _ ` ] a Z X [ Z ` ] b a Z Y W [ _ c X d a ^ _ a e a ^ f a ^ Y a Z[V X g _ hV X b Y Zi X RPO Q FM E NI L HIJK FG E HIC B CD 16% vs v r pwrxsytzu −r { /8 /7 /6 /5 /4 /3 /2 /1 / .0 0 ; < = > ? @ −A 93 92 =− = ∫ =−∞ ⋅ = 91 90 -. 0:1:2:3 Abbildung aus Kühnel/Krebs, 2001: 186 6. Sitzung 32 S., SoSe 2003 24 12 Erwartungswert und Varianz • Erwartungswert einer kontinuierlichen Zufallsvariable: +∞ µx = ∫ x * f (x)dx −∞ wobei µx = Erwartungswert einer Zufallsvariablen X 6. Sitzung 32 S., SoSe 2003 25 Erwartungswert und Varianz • Die Varianz einer stetigen Zufallsvariablen X ist gleich: σ 2 X = +∞ ∫ (x − µ X )2 * f (x )dx = −∞ + ∞ ∫ 2 f -∞ w o b e i (x -µ X x dx − µ 2 x x * )2 6. Sitzung 32 S., SoSe 2003 26 13 ( ) Normalverteilungen: Die Gauß´sche Normalverteilung • Symmetrische, unimodale, glockenförmige Verteilung, deren Ausprägungen von −∞ bis +∞ reichen. • Kennzeichnend: – feste Realisierungswahrscheinlichkeiten in Intervallen, die +/- k σ x Standardabweichungen um den Erwartungswert µ x liegen; 6. Sitzung 32 S., SoSe 2003 27 " ! # $ # % &, ' &+ ( &+ ' &* ( &* ' &) ( &) ' &' ( &' ' . , @G C @F D @F C @A D @A C @E D @E C @C D @C C G I / 0 µ1 − 2 ⋅ 3 4 ≤ 5 ≤µ 4762 ⋅ 3 4 8 9: ; < = ; > ? @A > B @G C @F D @F C @A D @A C @E D @E C @C D @C C G I .+ .* .) J K µ4 − Q ⋅ 3 4 ≤ 5 IF IA '- ) ≤µ * + , J K µ4 − = ⋅ 3 4 ≤ 5 IF IA ≤µ 476L= ⋅ 3 4 8 9: M N O O P D @G G B I E HC E A F G 476LQ ⋅ 3 4 8 9: M M R = P P @S A B I E CH E A Abbildung aus Kühnel/Krebs, 2001: 190 F G 6. Sitzung 32 S., SoSe 2003 28 14 Wahrscheinlichkeitsdichte der Normalverteilung f ( x) = 1 2πσ 2 x *e ( x− µ x )2 −2σ 2x π = Kreiskonstante Pi e = Eulersche Zahl (Basis des Natürlichen Logarithmus) 6. Sitzung 32 S., SoSe 2003 29 Standardnormalverteilung und Z-Transformation • Jede Normalverteilte Zufallsvariable X kann mit Hilfe der Z-Transformation (auch Standardisierung genannt) in eine Standardnormalverteilte Variable überführt werden. • Standardisierte (d.h. standardnormalverteilte) Variablen haben einen Erwartungswertµ x = 0, und eine Standardabweichung σ x = 1 • Die Wahrscheinlichkeitsdichte einer standardnormalverteilten Variablen wird mit Φ( z ) bezeichnet. 6. Sitzung 32 S., SoSe 2003 30 15 Z-Transformation Standardisiert eine normalverteilte Zufallsvariable (weist ihr einen Quantilwert der Standardnormalverteilung zu) zα = qα − µ X σx zα = Quantilwert der standardisierten Zufallsvariablen X qα = Quantilwert der normalverteilten Zufallsvariablen X 6. Sitzung 32 S., SoSe 2003 31 Quantilwerte und Quantilwahrscheinlichkeiten • Quantilwerte können als Ausprägungen von Standardnormalverteilungen betrachtet werden • Diesen Quantilwerten können Auftretenswahrscheinlichkeiten zugewiesen werden: Dies geschieht über die sogenannte „ZTabelle“ der Quantile der Normalverteilung. (S.642-Kühnel/Krebs) 6. Sitzung 32 S., SoSe 2003 32 16