Kennwerteverteilungen von Häufigkeiten und Anteilen SS2001 6.Sitzung vom 29.05.2001 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Die hypergeometrische Verteilung • Wahrscheinlichkeitsverteilung der Häufigkeit eines binären Merkmals bei – Einfacher Zufallsauswahl – Ohne Zurücklegen 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Die hypergeometrische Verteilung II 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 N O O P Q R S T U V W X Y Z [ \ ] ^ _ ` [ a [ b [ _ c d [ \ e [ f g [ h \ ` ] ^ _ [ Z [ \ h [ ` i j b e ! & s t u v s t u ' " # b ! $ % + v { [ & ' * & ' ) | } | ~ 1 ./0 o p q r s w t x ~ & ' ( s y v t k l m n s y w & & ( ) * ' 2 # ! " # ! 2 # % > 8 F I 8 F H 8 F G 8 F 7 * , ? @ A B C A B D E ' + - + & & z = = & ' ) :;< :;< & ' ( & & 8 ( ) * + , 3 4 5 6 7 8 8 7 9 G H I J K L M 6 7 8 9 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Abbildung aus Kühnel/Krebs, 2001: 165 Verteilungsfunktion der hypergeometrischen Verteilung 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Erwartungswert und Varianz der Hypergeometrischen Verteilung 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Die Binomialverteilung • Wahrscheinlichkeit der Häufigkeit eines binären Merkmals bei – Einfacher Zufallsauswahl – Mit Zurücklegen 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 • Wahrscheinlichkeit der Stichprobenzusammensetzung: (π1 ) *(π2 ) n1 n2 = (π1 ) *(1−π1 ) n1 n-n1 – N=Anzahl der Elemente der Gesamtmenge – N1=Häufigkeit der Ausprägung 1 – N2=Häufigkeit der Ausprägung 0 π π 1 0 = N = N6. Sitzung N 32 0 /Kennwerteverteilungen 1 / N S.Peter Schmidt 2001 Binomialverteilung • Die Wahrscheinlichkeit der Zufallsvariablen X „Häufigkeit der Ausprägung 1 bzw. 0 eines binären Merkmals in einer einfachen Zufallsauswahl mit Zurücklegen“ heißt Binomialverteilung. Die Realisierungswahrscheinlichkeit für die Häufigkeit n1 bei einer Binomialverteilung entspricht . n n − n1 n1 * π 1 * (1 − π 1 ) n1 • P(X = n1) = 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 ¡ ¢ £ ¤ ¥ ¦ § ¼ Ã Ä ½ ¨ ¾ ¿ © À ª Á « ¾ ¬ § ­ § ® § ¯ ° ± ² ³ ° ± ´ µ ¶ · ¸ ï ð · ° µ º ± » · ± Â Õ È í ¹ ï í ï ð Ý Þ â Ö × Ä Ç Ý Þ á Ã Ä Æ Ý Þ à Ý Þ ß í í í ð ñ ò í ð ñ ò Ä Å í í î ï Ø Ú Û Ü ô ð ô ñ ð ñ í ô î ð éêëì í Ã Ù ï Ã ËÌÍÎ Ø ð í î ï î ó ð ô ð í ð ð ô î ð í í î î î ó ï ò í î ð Ý Ã Å Æ Ç È É Ý ß à á â ã Ê ¼ Ã Ä È Ã Ä Ç ½ Ï À ¿ À Á ä å ¾ Â ¼ Ã Ä È Ã Ä Ç Ã Ä Æ Ã Ä Å ½ Ï À ¿ À Á Ô ô î î ô í î î ç ð ß Ý Â ô ó ô ò õ ò í í Ä î æ è í í Ã ð í Ã ñ í ô î ñ í Æ ËÌÍÎ ô î ô ï ó î ËÌÍÎ í ð ð õ í ð ð õ í Ã Ä Å í í í Ã Ã î î î ð î ó ó í î ó ó î í î ð ð î Å í ö Æ Ç È É Ð Ñ Ò Ó î î Å ð Ã Ã ö Ã í í î î î î ð í î î ð í î î ÷ í î ï ð î ï í ð ô ð õ í î ô ø ð Å Ê Æ Ç È É Ð Ñ Ò Ó Å Ã Ê 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Abbildung aus Kühnel/Krebs, 2001: 170 Binomialverteilung • Die Verteilungsfunktion (die kumulierte Wahrscheinlichkeitsverteilung) für die Binomialverteilung kann wie folgt berechnet werden: n j n− j P( X ≤ n1 ) = ∑ *π1 * (1 − π1 ) j =0 j n1 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Die Binomialverteilung • Erwartungswert und Varianz der Binomialverteilung Erwartungswert : µ x = n * π 1 Varianz : n * π 1 * (1 − π 1 ) • Die Bernoulliverteilung – Spezialfall der Binomialverteilung – Stichprobenumfang n = 1 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Relative Häufigkeiten • Der Erwartungswert für den Anteil p1 der Ausprägungen 1 eines binären Merkmals ist gelich den Erwartungswert der absoluten Häufigkeiten, dividiert durch den Stichprobenumfang n: 1 1 µ ( p1 ) = 0 + * µ x = *(n *π 1 ) = π 1 n n Bei einer einfachen Zufallsauswahl ist der Erwartungswert des Stichprobenanteils gleich dem Populationsanteil. Dies gilt für einfache 6. Sitzung Kennwerteverteilungen 32 Zufallsauswahlen mit und ohne Zurücklegen. S.Peter Schmidt 2001 Relative Häufigkeit • Varianz eines Stichprobenanteils σ 2 (p1) – Bei einer einfachen Zufallsauswahl mit Zurücklegen (Binomialverteilung) 1 *σ 2 n π 1 * (1 − π 1 ) = n σ 2 ( p1 ) = 2 x = 1 * ( n * π 1 * (1 − π 1 ) = 2 n 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Relative Häufigkeit • Varianz eines Stichprobenanteils σ 2(p1) – Bei einer einfachen Zufallsauswahl ohne Ersetzung (hypergeometrische Verteilung) π1 *(1 − π1) N − n 1 2 * σ ( p1 ) = 2 *σ X = ... = n n N −1 2 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Beziehungen hypergeometrischer Verteilung und Binomialverteilung • Beide Verteilungen haben identische Erwartungswerte • Die Varianzen nähern sich für große Stichproben aneinander an • Verteilungen werden sich insgesamt für große Stichproben (bzw. Populationen) ähnlicher: – Sog. Asymptotische Annäherung 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 % & & ' ( ) * + , - . / 0 1 2 9 ý þ ÿ ú û ü ? 2 3 5 4 E ? 5 2 6 < 7 2 = 8 ? 9 2 D 5 C 6 F 4 5 6 : > ; 5 5 ? C 7 6 2 8 5 < = 5 > 6 ? @ A 4 5 2 B 5 6 > 5 ? C 7 2 8 D 2 8 ù 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 ! " # $ Abbildung aus Kühnel/Krebs, 2001: 176 Die Normalverteilung und verwandte Wahrscheinlichkeitsverteilungen Kennwertverteilungen von Mittelwerten und Varianzen 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Wahrscheinlichkeitsdichten kontinuierlicher Zufallsvariablen • Diskrete Zufallsvariable – Die Ausprägungen sind abzählbar also durch ganze Zahlen erfassbar. – Z.B. die absolute Häufigkeit einer Ausprägung. • Kontinuierliche Zufallsvariable – Die Ausprägungen liegen beliebig dicht beieinander und können nur ducrh reelle Zahlen erfasst werden. – Z.B.die exakt gemessene durchschnittliche Körpergröße in einer Population. 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Dichte • Häufigkeitsdichte – Wird als Quotient aus der relativen Häufigkeit einer Klasse dividiert durch die Klassenbreite berechnet. • Wahrscheinlichkeitsdichte – Die Wahrscheinlichkeitsverteilung einer kontinuierlichen Zufallsvariable kann in Intervalle aufgeteilt werden. Die Wahrscheinlichkeitsdichte ist definiert als die Höhe eines Intervalls dessen Breite gegen null geht. 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Dichte • Über die Wahrscheinlichkeitsdichten können die Wahrscheinlichkeiten von Intervallen berechnet werden. a ∫ P (a ≤ x ≤ b) = f ( x)dx a b m it ∫ f ( x ) d x = b e s tim m te s In te g ra l v o n a b is b a ü b e r d ie D ic h te d e r Z u fa lls v a ria b le n X 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 G H H I J K L M N O P Q R S T b c U d e V W f g X U h Y i Z f [ g \ f X c Z j U g k ] Y l Z m ^ n Y o [ _ p p i [ ` q o S k c T o r p « t u v w x y w z { | z } w ~ x ~ w | y w ~ x { V g W X U Y Z [ \ Z X U ] Y Z ^ W a h ¬ ­ ® ¯ ° ½ ¼ ± ¯ ° ² ³ À Á ´ ® µ ° ² ® ° ¶ · ® ¯ ° ± ¸ ¹ ³ ³ ¶ ² ® ~ º Ä Ê Å Ä É Æ Ä É Å Ä È Æ Ä È Å Ä Ç Æ Ä Ç Å Ä Å Æ Ä Å Å » ¼ ¾ ¿ » Â ½ ½ » Ò ¤ × © Î U Ó ¥ Ø ª Ñ £ ¥ © Ó ¢ × Ð Ò ¤ ÎÖ ¨ Ó ¥ Õ § Ñ £ ¥ Ó Ô ¦ Î Ò ¤ ¡ ¢£ Î Ï Ì ÐÑ Í Ë Ê Ë É s Ë È Ë Ç Å Ç È É Ê Ã 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Abbildung aus Kühnel/Krebs, 2001: 184 Verteilungsfunktion • Die Verteilungsfunktion F(x) einer kontinuierlichen Zufallsvariable ist ist definiert als das bestimmte Integral der wahrscheinlichkeitsdichte von minus unendlich bis zur Stelle x: F ( x) = P(−∞ ≤ X ≤ x) = ∫ f (u)du x −∞ 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Ù Ú Ú Û Ü Ý Þ ß à á â ã ä å æ ô . C / 0 1 2 3 4 5 0 6 7 8 9 6 : 3 1 4 í ç 3 è 9 ñ 6 é ê ø ; : ç 3 ù 2 ë ú E F G ì û í H F ü î I ý J þ ì K ÿ ê ÿ ç ï ý û ë ÿ ì ð é ñ ì ü ÿ ê ç ü ý ð ÿ ë ò ë û ó è ù ð L ë , - ú þ . M W mn ] î ô þ / í õ 0 é ú 1 2 ö 3 ý 4 5 ô ú 0 í 6 ï 7 þ 8 9 ÿ ð ì ÷ í û 6 : 3 1 4 3 9 6 ; : 3 2 0 4 8 < 1 = : 7 8 : D > p ì N O P Q R P Q S T U V O : 7 ? : 7 2 : 3 4 / 1 @ 8 A / 1 ; 2 3 B 1 P X o + W \ Y f k b () * " g W \ X W [ Y l e g k ' d & " f bj % ! g W [ X i " #$ e g h b f W Z Y 16% ! b c de W Z − X ` a W X Y W X X q ^ r ^ ] ^ \ [ −∞ Z z { | = x =− ∫ X − s v y ^ t Z [ \ ] _ u w =−∞ } z ~ | ⋅ ~ = 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Abbildung aus Kühnel/Krebs, 2001: 186 Erwartungswert und Varianz • Erwartungswert einer kontinuierlichen Zufallsvariable: +∞ µx = ∫ x * f (x)dx −∞ wobei µx = Erwartungswert einer Zufallsvariablen X 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Erwartungswert und Varianz • Die Varianz einer stetigen Zufallsvariablen X ist gleich: σ 2 X = +∞ ∫ (x − µ X )2 * f ( x)dx = −∞ + ∞ ∫ x 2 -∞ w o b e i (x -µ X * f ( x )dx − µ )2 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 2 x Normalverteilungen: Die Gauß´sche Normalverteilung • Symmetrische, unimodale, glockenförmige Verteilung, deren Ausprägungen von −∞ bis +∞reichen. • Kennzeichnend: – feste Realisierungswahrscheinlichkeiten in Intervallen, die ±k Standardabweichungen σ xum den Erwartungswert µ x liegen; 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 ¬ ­ ¨ £ ¢ § ¤ ¢ § µ − ⋅ « ¢ ® ­ ≤ ¯ ≤µ ° ­ ² ⋅ ± ¡ Ç ³ ´ µ ¶ · ¸ ¹ º ¸ È µ − ⋅ É ½ Ä À ½ Ã Á ½ Ã À ½ ¾ Á ½ ¾ À ½ Â Á ½ Â À ½ À Á ½ À À Ê Ë É ≤ ≤µ Ì É Í Ê ⋅ Ë É Î Ï Ð Ñ Ò Ó Ó ¢ £ ¦ ¤ ¢ ¦ £ ¢ ¥ ¤ ¢ ¥ £ » ¼ ½ ¾ » ¿ Ô ¢ £ Á ½ Ä Ä ¿ ¢ ¤ £ £ Ä ª ª ¨ ª § ª ¦ ¥ £ ¥ ¦ ¨ Æ § Ã Æ © Ç È µ − ⋅ É ½ Ä À ½ Ã Á ½ Ã À ½ ¾ Á ½ ¾ À ½ Â Á ½ Â À ½ À Á ½ À À Ë Õ É ≤ Ô Ä Æ Ã Æ ¾ Æ Â À Â ¾ Ã Ä Æ Å ≤µ Ì Ô ¾ Æ ½ Â À × ¾ É Í Õ ⋅ Ë É Î Ï Ð Ñ Ñ Ö Ê ¿ Â ¾ Ã Ä Æ Å 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Abbildung aus Kühnel/Krebs, 2001: 190 Wahrscheinlichkeitsdichte der Normalverteilung f ( x) = 1 2πσ 2x *e ( x − µ x )2 −2σ 2x π = Kreiskonstante Pi e = Eulersche Zahl (Basis des Natürlichen Logarithmus) 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Standardnormalverteilung und Z-Transformation • Jede Normalverteilte Zufallsvariable X kann mit Hilfe der Z-Transformation (auch Standardisierung genannt) in eine Standardnormalverteilte Variable überführt werden. • Standardisierte (d.h. standardnormalverteilte) Variablen haben einen Erwartungswertµ x = 0, und eine Standardabweichung σ x = 1 • Die Wahrscheinlichkeitsdichte einer std.Norm.verteilten Variable wird mit Φ( z ) bezeichnet. 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Z-Transformation Standardisiert eine Normalverteilte Zufallsvariable (weist ihr einen Quantilwert der Standardnormalverteilung zu) qα − µ X zα = σx zα = Quantilwert der standardisierten Zufallsvariablen X qα = Quantilwert der normalverteilten Zufallsvariablen X 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001 Quantilwerte und Quantilwahrscheinlichkeiten • Quantilwerte können als Ausprägungen von Standardnormalverteilungen betrachtet werden • Diesen Quantilwerten können Auftretenswahrscheinlichkeiten zugewiesen werden: Dies geschieht über die sogenannte „ZTabelle“ der Quantile der Normalverteilung. (S.642) 6. Sitzung Kennwerteverteilungen 32 S.Peter Schmidt 2001