15.4 Diskrete Zufallsvariablen Von besonderem Interesse sind Zufallsexperimente, bei denen die Ergebnismenge aus reellen Zahlen besteht bzw. jedem Elementarereignis eine reelle Zahl zugeordnet werden kann. Solche Zufallsexperiment heißen Zufallsvariable ( ZV ) . Definition 7 1.) Ein Zufallsexperiment, dessen Ergebnismenge M aus reellen Zahlen besteht und bei dem die Wahrscheinlichkeit eines jeden Elementarereignisses größer als 0 ist, heißt diskrete Zufallsvariable. 2.) Bei einer diskreten Zufallsvariablen heißt die Funktion p:M 0;1 mit p ( m ) = 1 , die jedem Elementarereignis m seine Wahrscheinlichkeit mεM zuordnet, Wahrscheinlichkeitsfunktion der diskreten Zufallsvariablen. Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 1 Beispiel Würfeln mit zwei Würfeln Betrachtet man dieses Zufallsexperiment mit der Ergebnismenge M = ( 1/ 1 ) ; ( 1/ 2 ) ; ( 1/ 3 ) ; ( 1/ 4 ) ; ( 1/ 5 ) ; ( 1/ 6 ) ; ( 2/ 1 ) ; ( 2/ 2 ) ; ( 2/ 3 ) ; ( 2/ 4 ) ; ( 2/ 5 ) ; ( 2/ 6 ) ; ( 3/ 1 ) ; ( 3/ 2 ) ; ( 3/ 3 ) ; ( 3/ 4 ) ; ( 3/ 5 ) ; ( 3/ 6 ) ; ( 4/ 1 ) ; ( 4/ 2 ) ; ( 4/ 3 ) ; ( 4/ 4 ) ; ( 4/ 5 ) ; ( 4/ 6 ) ; ( 5/ 1 ) ; ( 5/ 2 ) ; ( 5/ 3 ) ; ( 5/ 4 ) ; ( 5/ 5 ) ; ( 5/ 6 ) ; ( 6/ 1 ) ; ( 6/ 2 ) ; ( 6/ 3 ) ; ( 6/ 4 ) ; ( 6/ 5 ) ; ( 6/ 6 ) , so liegt keine Zufallsvariable vor, da die Ergebnisse keine reellen Zahlen sind. Betrachtet man jedoch z.B. die Summe bzw. Differenz der beiden Augenzahlen, so erhält man Zufallsvariablen mit den Ergebnismengen bzw. M = 2 ; 3 ; 4 ; 5 ; 6 ; 7 ; 8 ; 9 ; 10 ; 11 ; 12 Summe M = 0; 1; 2; 3; 4; 5 Differenz Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 2 Wertetabellen und Graphen der zugehörigen Wahrscheinlichkeitsfunktionen: Summe m Wahrscheinlichkeit p ( m ) Differenz m Wahrscheinlichkeit p ( m ) M = 2 3 4 5 6 7 8 9 10 11 12 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 0 1 2 3 4 5 6 36 10 36 8 36 6 36 4 36 2 36 ( 1/ 1 ) ; ( 1/ 2 ) ; ( 1/ 3 ) ; ( 1/ 4 ) ; ( 1/ 5 ) ; ( 1/ 6 ) ; ( 2/ 1 ) ; ( 2/ 2 ) ; ( 2/ 3 ) ; ( 2/ 4 ) ; ( 2/ 5 ) ; ( 2/ 6 ) ; ( 3/ 1 ) ; ( 3/ 2 ) ; ( 3/ 3 ) ; ( 3/ 4 ) ; ( 3/ 5 ) ; ( 3/ 6 ) ; ( 4/ 1 ) ; ( 4/ 2 ) ; ( 4/ 3 ) ; ( 4/ 4 ) ; ( 4/ 5 ) ; ( 4/ 6 ) ; ( 5/ 1 ) ; ( 5/ 2 ) ; ( 5/ 3 ) ; ( 5/ 4 ) ; ( 5/ 5 ) ; ( 5/ 6 ) ; ( 6/ 1 ) ; ( 6/ 2 ) ; ( 6/ 3 ) ; ( 6/ 4 ) ; ( 6/ 5 ) ; ( 6/ 6 ) Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 3 Wertetabellen und Graphen der zugehörigen Wahrscheinlichkeitsfunktionen: Summe m Wahrscheinlichkeit p ( m ) Differenz m Wahrscheinlichkeit p ( m ) 2 3 4 5 6 7 8 9 10 11 12 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 0 1 2 3 4 5 6 36 10 36 8 36 6 36 4 36 2 36 p(m) p(m) 10 36 Summe 10 36 1 2 3 4 5 6 7 8 9 10 11 12 m Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Differenz 1 2 3 4 5 m Analysis 15.4 Folie 4 Definition 8 ( Erwartungswert, Varianz und Standardabweichung einer diskreten ZV ) Für eine diskrete Zufallsvariable mit Ergebnismenge M und Wahrscheinlichkeitsfunktion p ( m ) definiert man den Erwartungswert µ , die Varianz σ 2 sowie die Standardabweichung σ als Quadratwurzel aus der Varianz wie folgt: 1.) µ Erwartungswert µ einer diskreten Zufallsvariablen m . p(m) = mεM 2 2.) σ 2 Varianz σ einer diskreten Zufallsvariablen 2 (m - µ) . p(m) = mεM 3.) σ 2 (m - µ) . p(m) = mεM Institut für Automatisierungstechnik ( µ = „mü“ ) ( σ = „sigma“ ) Standardabeichung σ einer diskreten Zufallsvariablen Prof. Dr. Ch. Bold Analysis 15.4 Folie 5 Beispiel 1: Würfeln Die Wahrscheinlichkeitsfunktion lautet m 1 2 3 4 5 6 p(m) 1 6 1 6 1 6 1 6 1 6 1 6 Der Erwartungswert beträgt µ = m . p(m) = 1. 1 1 1 1 1 1 + 3. + 4. + 5. + 6. + 2. 6 6 6 6 6 6 = 3,5 mεM Die Varianz beträgt σ 2 2 (m - µ) . p(m) = = mεM 2 1 2 1 2 1 ( 1 - 3,5 ) . + ( 2 - 3,5 ) . + ( 3 - 3,5 ) . 6 6 6 2 1 2 1 2 1 + ( 4 - 3,5 ) . + ( 5 - 3,5 ) . + ( 6 - 3,5 ) . 6 6 6 = 2,916 Die Standardabweichung beträgt daher Institut für Automatisierungstechnik σ = 2,916 Prof. Dr. Ch. Bold = 1,708 . Analysis 15.4 Folie 6 . Beispiel 2: Augendifferenz beim Würfeln mit 2 Würfeln m Die Wahrscheinlichkeitsfunktion lautet p(m) 0 1 2 3 4 5 6 36 10 36 8 36 6 36 4 36 2 36 . Der Erwartungswert beträgt µ = m . p(m) = 0. 6 10 8 6 2 4 + 2. + 3. + 4. + 5. + 1. 36 36 36 36 36 36 = 1,94 mεM Die Varianz beträgt σ 2 2 (m - µ) . p(m) = = mεM = = 2 6 2 ( 0 - 1,94 ) . + ( 1 - 1,94 ) . 36 2 6 2 ( 3 - 1,94 ) . + ( 4 - 1,94 ) . 36 10 2 + ( 2 - 1,94 ) . 36 4 2 + ( 5 - 1,94 ) . 36 8 36 2 36 2,052 Die Standardabweichung beträgt daher Institut für Automatisierungstechnik σ = 2,052 Prof. Dr. Ch. Bold = 1,433 . Analysis 15.4 Folie 7 Bemerkungen 1.) Der Erwartungswert einer Zufallsvariablen ist der Wert, der „im Durchschnitt“ unter Berücksichtigung der jeweiligen Wahrscheinlichkeiten zu erwarten ist. Bei Laplace - Experimenten ( wenn also alle Elementarereignisse die gleiche Wahrscheinlichkeit haben ) entspricht der Erwartungswert dem arithmetischen Mittel aller Elementarereignisse. 2.) Die Standardabweichung einer Zufallsvariablen ist ein Maß für die Streuung der Elementarereignisse um den Erwartungswert, also dafür, wie stark sich die Elementarereignisse „im Durchschnitt“ unter Berücksichtigung der jeweiligen Wahrscheinlichkeiten vom Erwartungswert unterscheiden. Die Standardabweichung ist aber nicht das arithmetische Mittel der auftretenden Abweichungen ( auch nicht bei Laplace - Experimenten ) , sondern wegen der besonderen Art der Durchschnittsberechnung stets mindestens so groß wie dieses arithmetische Mittel ( jeweils unter Berücksichtigung der jeweiligen Wahrscheinlichkeiten ) . Beispielsweise beträgt die Standardabweichung beim Würfeln σ = 1,708 ( siehe Beispiel 1 ) , während die durchschnittliche Abweichung nur den Wert 1,5 hat. Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 8 n n 3 n .( n + 1 ) i = 2 Beispiel 3: Roulette 2 i i=1 = 2 2n + 3n + n 6 i=1 Das Roulette - Spiel ist ein Laplace - Experiment mit M = 0 ; 1 ; 2 ; . . . ; 35 ; 36 als 1 Ergebnismenge, bei dem jedes Elementarereignis die Wahrscheinlichkeit hat. 37 Der Erwartungswert beträgt daher µ = 36 1 = m. 37 m . p(m) = mεM 2 36 mεM 18 2 1 ( m - 18 ) . = 37 2 (m - µ) . p(m) = = = 18 m=0 Die Varianz beträgt σ 36 . 37 . 1 2 37 1 . . 2 37 m=0 i=1 3 = Die Standardabweichung beträgt damit Institut für Automatisierungstechnik σ = 2 i 2 2 . 2 . 18 + 3 . 18 + 18 37 6 = 114 114 = 10,677 . Prof. Dr. Ch. Bold Analysis 15.4 Folie 9 Bemerkungen 1.) Der Erwartungswert und damit auch Varianz und Standardabweichungen sind nicht für alle Zufallsexperimente definiert, sondern nur für Zufallsvariablen, da mit den Elementarereignissen gerechnet wird und diese daher reelle Zahlen sein müssen. Es gibt also z.B. keinen Erwartungswert beim Würfeln mit einem Farbenwürfel. 2.) Andererseits ist es nicht bei jeder Zufallsvariablen sinnvoll, den Erwartungswert sowie Varianz und Standardabweichung zu bestimmen. So ist es z.B. für einen Roulettespieler völlig nutzlos zu wissen, dass der Erwartungswert 18 ist ( siehe Beispiel 3 ) , und es wäre absolut sinnlos, deswegen vermehrt auf die Zahl 18 zu setzen. Dies liegt daran, dass die Elementarereignisse beim Roulette nur formal reelle Zahlen sind; diese reellen Zahlen werden aber nicht zur Angabe der Größe der jeweiligen Elementarereignisse, sondern nur zu ihrer Unterscheidung benutzt. Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 10 Beispiel 4: Roulette Mit wie viel Gewinn kann man durchschnittlich rechen, wenn man beim Roulette 37 € auf „Rot“ setzt ? Dies kann man als Zufallsvariable auffassen mit der Ergebnismenge M = und den Wahrscheinlichkeiten p ( 0 ) = Der Erwartungswert beträgt daher 19 37 und p ( 74 ) = µ = 0. 0 ; 74 18 . 37 19 18 + 74 . 37 37 = 36 € . Setzt man hingegen 37 € auf die Zahl 0 ( oder eine beliebige andere Zahl ) , so kann man auch dies als Zufallsvariable auffassen mit der Ergebnismenge M = und den Wahrscheinlichkeiten p ( 0 ) = Der Erwartungswert beträgt dann 36 37 und p ( 1332 ) = µ = 0. 1 . 37 36 1 + 1332 . 37 37 0 ; 1332 = 36 . 37 = 36 € . Der Erwartungswert beim Roulette ist also bei beiden Spielarten ( und auch allen anderen ) gleich. Unterschiedlich sind aber die Standardabweichungen: Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 11 Beispiel 4: Roulette Beim Setzen von 37 € auf „Rot“ beträgt die Varianz σ 2 2 (m - µ) . p(m) = = 2 19 2 18 ( 0 - 36 ) . + ( 74 - 36 ) . 37 37 = 1 368 mεM und damit die Standardabweichung σ = 1368 = 36,986 € . Beim Setzen von 37 € auf die Zahl 0 beträgt die Varianz σ 2 2 (m - µ) . p(m) = = 2 36 2 1 ( 0 - 36 ) . + ( 1332 - 36 ) . 37 37 = 46 656 mεM und damit die Standardabweichung Institut für Automatisierungstechnik σ = 46656 = 216 € . Prof. Dr. Ch. Bold Analysis 15.4 Folie 12 Beispiel 5: Würfeln, bis eine „6“ gewürfelt wird Wie oft muss man „erwartungsgemäß“ würfeln, wenn man so lange würfelt, bis man eine „6“ gewürfelt hat ? Dies ist eine diskrete Zufallsvariable mit der Ergebnismenge M = N+ . Die Wahrscheinlichkeitsfunktion lautet p ( m ) = 5 6 m-1 . 1 6 Anzahl Würfe 1 2 3 4 Wahrscheinlichkeit 1 6 5 . 1 6 6 5 . 5 . 1 6 6 6 5 . 5 . 5 . 1 6 6 6 6 = 1 . 5 5 6 ... ... m . m 5 6 m-1 . 1 6 Wahrscheinlichkeit, im zweiten Wurf eine „6“ zu würfeln Wahrscheinlichkeit, im ersten Wurf keine „6“ zu würfeln Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 13 Die Wahrscheinlichkeitsfunktion lautet p ( m ) = 5 6 m-1 . 1 6 = 1 . 5 5 6 m 8 Der Erwartungswert beträgt daher µ = 8 mεM n .(x-3) n x- 3 = (4 - x) Mit x=3 für x ε 5 6 m. gilt daher 2;4 5 6 1 5 . 5 6 m = 6 m=1 ( 11.2 , Beispiel 6 ) 8 n=1 2 m. m . p(m) = . m = m=1 5 6 1 6 2 = 30 Bemerkung Ist die Ergebnismenge unendlich, so muss bei der Bestimmung des Erwartungswerts der Grenzwert einer unendlichen Reihe berechnet werden. Dabei ist zu beachten: • Falls dies nicht möglich ist, kann der Erwartungswert nicht bestimmt werden. • Falls die Reihe divergent ist, hat die Zufallsvariable keinen Erwartungswert. Gleiches gilt auch für die Varianz und damit auch für die Standardabweichung. Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 14 Beispiel 6: Lebenserwartung In der Bundesrepublik Deutschland beträgt die durchschnittliche Lebenserwartung für neugeborene Jungen 76,6 Jahre und für neugeborene Mädchen 82,1 Jahre. Ein Jahr zuvor waren es 76,2 beziehungsweise 81,8 Jahre. ( Statistisches Bundesamt , Februar 2008 ) Auch die Lebenserwartung ist der Erwartungswert einer diskreten Zufallsvariablen. Das zugrundeliegende Zufallsexperiment besteht in der Geburt eines Kindes: • die Elementarereignisse sind z.B. die natürlichen Zahlen bis ( etwa ) 115 ; sie bedeuten das Sterbealter in Jahren ( evtl. genauere Datenerhebung ) • die Wahrscheinlichkeit für die Elementarereignisse wird statistisch ermittelt Die Bestimmung dieser Wahrscheinlichkeiten ist aber offenbar erst möglich, wenn alle im Jahr 2008 geborenen Kinder gestorben sind ! Was bedeutet die obige Statistik für einen 85-jährigen Mann? a) Er ist seit 9 Jahren tot b) Er sollte kein großes Bier mehr bestellen c) Er sollte auch kein kleines Bier mehr bestellen d) Er sollte keinerlei besondere Maßnahmen ergreifen ( evtl. Statistik studieren ) Richtig ist d), da seine weitere Lebenserwartung als bedingte Wahrscheinlichkeit berechnet werden muss und ihm wahrscheinlich noch einige Lebensjahre bleiben. Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 15 Binomialverteilung Ein beliebiges Zufallsexperiment wird n - mal durchgeführt. Bei jeder dieser n Durchführungen achtet man darauf, ob ein Ereignis A eintritt oder nicht. Dann erhält man eine Zufallsvariable mit Ergebnismenge M = 0; 1; 2; . . . ; n , bei der jedes Elementarereignis für die Anzahl steht, mit der das Ereignis A bei den n Durchführungen des obigen Zufallsexperiments eingetreten ist. Ist p = p ( A ) die Wahrscheinlichkeit des Ereignisses A , so heißt diese neue Zufallsvariable binomialverteilt mit Parametern n und p oder kurz B ( n ; p ) - verteilt. Zur Bestimmung der Wahrscheinlichkeitsfunktion einer Binomialverteilung betrachten das folgende Beispiel: Wie groß ist die Wahrscheinlichkeit, dass bei 4 - maliger Durchführung des Zufallexperiments das Ereignis A genau 3 - mal eintritt ? Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 16 Zufallsexperiment 4 - mal durchführen p 1-p A A p 1-p A A p 1-p A A A A A A p 1-p p 1-p p 1-p p 1-p A A A A A A A A A A A A A A A A A A A A A A A A p p p p p p p p 1-p AAAA AAAA 1-p AAAA 1-p AAAA AAAA AAAA 1-p AAAA 1-p AAAA AAAA 1-p AAAA AAAA AAAA 1-p AAAA AAAA 1-p AAAA AAAA 4 = 4 Möglichkeiten, aus den 4 Durchführungen des Zu3 fallsexperiments die 3 Durchführungen auszuwählen, in denen das Ereignis A eintritt. Nach 15.2 gibt es genau () 3 1 Jede dieser 3 Durchführungen hat die Wahrscheinlichkeit p . p . p . ( 1 - p ) = p . ( 1 - p ) . 4 . 3. 1 Das Ereignis A tritt also mit Wahrscheinlichkeit p ( 1 - p ) genau 3 - mal auf. 3 () Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 17 Wie groß ist die Wahrscheinlichkeit, dass bei 4 - maliger Durchführung des Zufallexperiments das Ereignis A genau 3 - mal eintritt ? Das Ereignis A tritt also mit Wahrscheinlichkeit 4 3 () . p3 . ( 1 - p )1 genau 3 - mal auf. Allgemein gilt: Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments p = p ( A ) ) für eine beliebige Anzahl k n . k. n-k zwischen 0 und n genau k - mal eintritt, beträgt p(k) = p (1-p) . k ein Ereignis A ( mit Wahrscheinlichkeit () Beispiel Die Wahrscheinlichkeit, dass bei 60 - maligem Würfeln genau 10 - mal die Zahl „6“ gewürfelt wird, beträgt p ( 10 ) = 60 10 ( ) Institut für Automatisierungstechnik 10 60 - 10 1 1 . . 1= 0,137 = 13,7 % 6 6 Prof. Dr. Ch. Bold Analysis 15.4 Folie 18 Bemerkungen zur Binomialverteilung 1.) Wie bei jedem Zufallsexperiment ( vgl. Satz 2a aus 15.1 ) hat die Summe der Wahrscheinlichkeiten aller Elementarereignisse auch bei der Binomialverteilung den Wert 1 : n p(m) mεM 2.) n k () = . pk . ( 1 - p ) n - k = k=0 (p + ( 1 - p )) n n = 1 = 1 binomischer Satz Eine B ( n ; p ) - verteilte Zufallsvariable hat den Erwartungswert n . p , denn: n n . pk . ( 1 - p ) n - k k. µ = m . p(m) = k () mεM k=0 n = k. n! . pk . ( 1 - p ) n - k k! . (n-k)! k=1 Institut für Automatisierungstechnik Prof. Dr. Ch. Bold Analysis 15.4 Folie 19 n k. = n! . pk . ( 1 - p ) n - k k! . (n-k)! k=1 n n . (n-1)! = ( k - 1 ) ! . (( n - 1 ) - ( k - 1 )) ! . p . pk - 1 . ( 1 - p ) n - k k=1 n n-1 k-1 . pk - 1 . ( 1 - p ) (n - 1) - (k - 1 n-1 j . p j . ( 1 - p ) ( n - 1 ) - j = n . p . (p + ( 1 - p )) n - 1 = n . p ( ) . . = ) n p k=1 n-1 ( ) = n.p. j=k-1 j=0 Institut für Automatisierungstechnik binomischer Satz Prof. Dr. Ch. Bold Analysis 15.4 Folie 20 Bemerkungen zur Binomialverteilung 3.) Mit ähnlichen Umformungen wie in Bemerkung 2 kann man auch die Varianz einer B ( n ; p ) - verteilten Zufallsvariablen berechnen; sie beträgt n . p . ( 1 - p ) . Es gilt damit allgemein für jede B ( n ; p ) - verteilte Zufallsvariable : Wahrscheinlichkeitsfunktion: Erwartungswert: Varianz: Standardabeichung: Institut für Automatisierungstechnik p(k) = n . pk . ( 1 - p ) n - k k () µ = n.p σ 2 = n.p.(1-p) σ = n.p.(1-p) Prof. Dr. Ch. Bold Analysis 15.4 Folie 21 Graph der Wahrscheinlichkeitsfunktion einer Binomialverteilung Beispiel: n = 14 , p = 0,3 k 0 1 2 14 . 0,3k . 0,7 n - k k () , also p ( k ) = 3 4 5 6 7 8 9 10 11 p ( k ) 0,007 0,041 0,113 0,194 0,229 0,196 0,126 0,062 0,023 0,007 0,001 0,0002 k p(k) 12 p(k) 13 14 0,00002 0,000002 0,00000005 0,2 1 2 3 4 5 6 Institut für Automatisierungstechnik 7 8 9 10 Prof. Dr. Ch. Bold 11 12 13 Analysis 15.4 14 k Folie 22 p(k) Erwartungswert: 0,2 µ = n.p µ = 14 . 0,3 = 4,2 1 2 3 4 4,2 5 kmax µ 6 7 8 9 10 11 12 13 14 k Ist kmax das Elementarereignis mit der größten Wahrscheinlichkeit, so liegt der Erwartungswert µ stets zwischen kmax - p ( A ) und kmax + p ( A ) : kmax - p < µ < kmax + 1 - p 4 - 0,3 < µ < 4 + 0,7 Institut für Automatisierungstechnik bzw. µ+p-1 < bzw. 4,2 - 0,7 < kmax < 4,2 + 0,3 Prof. Dr. Ch. Bold kmax < µ + p Analysis 15.4 Folie 23