5.4 Verteilungsfunktion Die Verteilungsfunktion gibt an welche Wahrscheinlichkeit sich bis zu einem bestimmten Wert x der Zufallsvarialben X kumuliert Die Verteilungsfunktion F(x) gibt an, wie groß die die Wahrscheinlichkeit ist, dass die Zufallsvariable X einen Wert annimmt, der kleiner oder gleich x ist: F(x) = P(X x). Bei diskreten Zufallsvariablen erhält man sie durch Aufsummieren von Wahrscheinlichkeiten, bei stetigen Zufallsvariablen durch Integration. Abbildung: Form der Verteilungsfunktion bei diskreten und stetigen Zufallsvariablen Verteilungsfunktion diskrete Zufallsvariable stetige Zufallsvariable "Treppenfunktion" monoton steigende Funktion Diskrete Zufallsvariablen Es sei X eine diskrete Zufallsvariable. Dann ist ihre Verteilungsfunktion F(x) durch (5.9) F( x ) P(X x ) f ( x j ) p j x j x x j x gegeben. Die Summation erstreckt sich über alle Ausprägungen xj, die kleiner oder gleich x sind. Bei einer endlichen Zufallsvariablen X mit m möglichen Realisationen x1, x2, …, xm lässt sich die Verteilungsfunktion formal in der Form 0 p1 Fx p1 p 2 1 darstellen. für für für x x1 x1 x x 2 x2 x x3 für x x m Tabellarische Darstellung: xj F(xj) x1 p1 x2 p1 + p2 xm 1 Grafische Darstellung: Treppenfunktion Erläuterung Der fette Punkt bei der Sprungstelle gibt an, dass der x-Wert jeweils den Funktionswert (= kumulierte Wahrscheinlichkeit) der oberen Sprunggrenze annimmt. An jeder Sprungstelle nimmt die Verteilungsfunktion F(x) um die Wahrscheinlichkeit pj zu. Treppenfunktion Fx p1 p2 p3 1 p1 p 2 p1 x1 x2 x3 x Kumulierte Wahrscheinlichkeiten bei einer diskreten Zufallsvariablen X Wahrscheinlichkeit für… höchstens a Formaler Ausdruck PX a Fa weniger als a PX a Fa P(X a ) mindestens a PX a 1 Fa P(X a ) mehr als a PX a 1 PX a 1 Fa Beispiel 5.8: Die Wahrscheinlichkeitsfunktion im Beispiel des Produktionsprozesses, bei dem zwei Teile entnommen werden, ist gegeben durch 1 p 2 2p1 p f x 2 p 0 für x 0 für x 1 für x 2 sonst Für die Verteilungsfunktion ergibt sich daraus wegen (5.9) für ausgewählte x-Werte z.B. F(-1) P(X -1) 0 F(0) P(X 0) P(X 0) (1 - p) 2 F(0,2) P(X 0,2) P(X 0) (1 - p) 2 F(1) P(X 1) P(X 0) P(X 1) (1 - p) 2 2p(1 - p) 1 - 2p p 2 2p - 2p 2 1 - p 2 F(2) P(X 2) P(X 0) P(X 1) P(X 2) (1 - p) 2 2p(1 - p) p 2 1 - p 2 p 2 1 Die Verteilungsfunktion lässt sich damit kompakt schreiben als 0 1 p 2 Fx PX x 2 1 p 1 für x 0 für 0 x 1 für 1 x 2 für x 2 Sie hat Sprungstellen in den Punkten x=0, x=1 und x=2. Die Höhe der Sprünge addiert sich insgesamt zu 1. ♦ Stetige Zufallsvariablen Die Verteilungsfunktion F(x) entspricht bei einer stetigen Zufallsvariablen X der Fläche unterhalb der Dichtefunktion f(u), die sich bis zum Wert x kumuliert hat. Man erhält sie durch Integration: x (5.10) Fx f u du . Die Größe u wird hierbei als Integrationsvariable verwendet. Mit der Verteilungsfunktion F(x) lassen sich ebenso wie mit der Dichtefunktion f(x) Wahrscheinlichkeiten bestimmen. Bei stetigen Zufallsvariablen ist dabei unerheblich, ob die Intervallgrenze zum Intervall gezählt wird oder nicht, weil Punktwahrscheinlichkeiten gleich null sind. Kumulierte Wahrscheinlichkeiten bei einer stetigen Zufallsvariablen X Wahrscheinlichkeit für… Formaler Ausdruck höchstens a PX a Fa weniger als a PX a Fa mindestens a PX a 1 PX a 1 Fa mehr als a PX a 1 PX a 1 Fa Wahrscheinlichkeiten für geschlossene und offene Intervalle bei einer stetigen Zufallsvariablen X (5.11) Pa X b Pa X b Pa X b Pa X b Fb Fa Abbildung: Intervallwahrscheinlichkeiten f x f x PX b x b f x F(a) F(b) Pa X b a b x Fb PX b 1 Fb x Beispiel 5.9: Wir betrachten die in Beispiel 5.7 verwendete Dichtefunktion für x 0 0 f x 1 2 x für 0 x 2 0 für x 2 . a) Welche Verteilungsfunktion hat die Zufallsvarialbe X? 1. Schritt: Bildung des Integrals im Intervall 0x2 x x x 1 1 2 1 2 1 2 1 2 f u du u du u x 0 x 2 4 4 4 4 0 0 2. Schritt: Ausweisen der Verteilungsfunkton für x 0 0 1 2 Fx x für 0 x 2 4 1 für x 2 Grafische Darstelllung der Dichte- und Verteilungsfunktion: Dichtefunktion Verteilungsfunktion f(x) -1 F(x) 1 1 1/2 1/2 0 1 2 x -1 0 1 2 x b) Wie groß ist die Wahrscheinlichkeit, dass die Zufallsvariable X Werte annimmt, die kleiner oder gleich 1,6 sind? ● Berechnung mit Hilfe der Dichtefunktion f(x) f(x) 1,6 1,6 1 PX 1,6 f x dx 0 2 x dx 1 1,6 1 1 1 x 2 1,6 2 0 2 4 0 4 4 0,64 1/2 0,64 -1 0 2 1 x ● Berechnung mit Hilfe der Verteilungsfunktion F(x) F(x) 1 PX 1,6 F1,6 1,62 4 1 2,56 0,64 4 1 F(1,6) =0,64 1/2 -1 0 1 2 x Der Punkt x=1,6 heißt 0,64-Quantil der Wahrscheinlichkeitsverteilung. c) Welchen Wert nimmt die Wahrscheinlichkeit für 0,6< X<1,2 an? ● Berechnung mit Hilfe der Dichtefunktion f(x) 1,2 1,2 1 P0,6 X 1,2 f x dx 0,6 2 0,6 f(x) x dx 1 1,2 1 x2 4 0,6 1 1 1,22 0,62 4 4 0,270 0,27 1/2 -1 0 x 2 1 ● Berechnung mit Hilfe der Verteilungsfunktion F(x) F(x) P0,6 X 1,2 F1,2 F0,6 1 1 1,22 0,62 4 4 0,36 0,09 0,270 1 F(1,2) =0,36 0,36-0,09=0,27 F(0,6) =0,09 -1 0 1 2 x d) Schließlich fragen wir noch nach der Wahrscheinlichkeit, dass X größer als 1,3 ist. ● Berechnung mit Hilfe der Dichtefunktion f(x) f(x) 2 1 x dx 1,3 2 PX 1,3 f x dx 1,3 1 0,577 2 1 1 1 x 2 2 2 1,32 4 1,3 4 4 1/2 0,577 -1 0 1 x 2 ● Berechnung mit Hilfe der Verteilungsfunktion F(x) F(x) PX 1,3 1 F1,3 1 1 1,32 1 0,423 4 0,577 1 1-0,423 =0,577 F(1,3) =0,423 -1 0 1 2 x ♦ 5.5 Erwartungswert und Varianz Erwartungswert und Varianz einer Zufallsvariablen sind Maßzahlen (Kenngrößen), mit denen die Wahrscheinlichkeitsverteilung einer Zufallsvariablen genauer beschrieben werden kann. Übersicht: Wichtige Maßzahlen einer Zufallsvariablen Maßzahlen einer Zufallsvariablen Erwartungswert Durchschnittswert aus einer Vielzahl von Zufallsexperimenten Varianz Durchschnittliche quadratische Abweichung vom Erwartungswert ● Erwartungswert einer Zufallsvariablen Der Erwartungswert E(X) einer Zufallsvariablen X gibt an, welchen Wert sie bei einer unbegrenzten Wiederholung im Durchschnitt annehmen wird. Praktisch lässt er sich als Durchschnittswert bei einer großen Anzahl von Wiederholungen des Zufallsvorgangs interpretieren. Der Erwartungswert von X, E(X), wird auch als arithmetisches Mittel der Grundgesamtheit, , bezeichnet. Erwartungswert bei diskreten Zufallsvariablen: (5.12) m m j1 j1 EX x j p j x j f x j (bei m möglichen Realisationen) Erwartungswert bei stetigen Zufallsvariablen: (5.13) EX x f x dx Beispiel 5.10: Bei einem Würfelwurf gewinnt man das Fünffache der gewürfelten ungeraden Augenzahl und verliert das Vierfache der geraden Augenzahl. Die Gewinn- und Verlustbeträge werden in Euro gemessen. Von welchem Erwartungswert des Gewinns können Sie ausgehen, wenn Sie an diesem Glücksspiel teilnehmen? Mit Hilfe der Angaben in der Wahrscheinlichkeitsfunktion der diskreten Zufallsvariable X 1 6 1 6 1 6 1 f x 6 1 6 1 6 0 für x 24 für x 16 für x 8 für x 5 für x 15 für x 25 sonst lässt sich der Erwartungswert unter Verwendung von (5.12) bestimmen: 6 EX x j p j j1 1 1 1 1 1 1 24 16 8 5 15 25 6 6 6 6 6 6 3 1 . 6 2 Sie müssen also im Schnitt mit einem Verlust pro Spiel von ½ Euro rechnen. Beispiel 5.11: Wir betrachten die bereits bekannte Dichtefunktion für x 0 0 f x 1 2 x für 0 x 2 0 für x 2 Wie groß ist sein Erwartungswert der Zufallsvariablen X? Da die Zufallsvariable X stetig ist, ziehen wir zur Berechnung des Erwartungswerts die Formel (5.13) heran. Wir integrieren hier über das Intervall zwischen 0 und 2, da die Dichte nur in diesem Bereich ungleich 0 ist: 2 2 0 0 EX x f x dx x 1 x dx 1 x 2 dx 2 2 1 32 8 4 x 0 . 6 3 0 6 ♦ ● Varianz und Standardabweichung einer Zufallsvariablen Varianz und Standardabweichung einer Zufallsvariablen X sind Streuungsmaße, die angeben, wie stark ihre Realisationen um den Erwartungswert streuen. Die Varianz V(X) gibt die durchschnittliche quadrierte Abweichung wieder. Sie wird auch durch das Symbol ² gekennzeichnet. Varianz bei diskreten Zufallsvariablen (bei m möglichen Realisationen): (5.14) V(X) EX 2 2 m xj j1 2 m pj xj 2 f xj j1 Varianz bei stetigen Zufallsvariablen: (5.15) V(X) EX 2 2 x 2 f x dx Die Standardabweichung gibt als Wurzel aus der Varianz an, wie stark die Werte der Zufallsvariablen X durchschnittlich von ihrem Erwartungswert E(X) abweichen. Standardabweichung: (5.16) V( X) 2 Beispiel 5.12: Wie groß sind Varianz und Standardabweichung beim einmaligen Werfen mit einem fairen Würfel? Mit der Wahrscheinlichkeitsfunktion 1 / 6 für x 1,2,...,6 f ( x ) 0 sonst ergibt sich der Erwartungswert 6 1 1 1 1 1 1 EX x j p j 1 2 3 4 5 6 6 6 6 6 6 6 j1 1 1 1 2 3 4 5 6 21 3,5 . 6 6 Für die Varianz erhält man mit (5.14) 2 6 xj 2 pj j1 1 1 1 1 1 3,52 2 3,52 3 3,52 4 3,52 6 6 6 6 1 1 5 3,52 6 3,52 6 6 1 1 6,25 2,25 0,25 0,25 2,25 6,25 17,5 2,917. 6 6 Die Würfelwürfe weichen damit durchschnittlich um 2 17,5 1,708 6 vom arithmetischen Mittel von 3,5 ab. Beispiel 5.13: Für die Dichtefunktion, für x 0 0 f x 1 2 x für 0 x 2 0 für x 2 hatten wir bereits den Erwartungswert von 4/3 in Beispiel 5.11 bestimmt. Damit lassen sich Varianz 2 4 2 1 2 2 x f x dx x x dx 3 2 0 2 x 3 4 16 1 2 8 2 8 x x x dx x x dx 3 9 2 9 0 0 2 3 2 2 x4 4 3 4 2 32 16 2 x x 2 0,222 8 9 9 9 9 9 0 und Standardabweichung 2 0,471 9 berechnen. Die Werte, die die Zufallsvariable X annehmen kann, weichen also im Mittel um 0,471 vom Erwartungswert ab. ● Eigenschaften von Erwartungswert und Varianz Es werden nun die allgemeinen Eigenschaften von Erwartungswert und Varianz einer Zufallsvariablen diskutiert. Übersicht: Diskutierte Eigenschaften Diskutierte Eigenschaften Varianzverschiebungssatz Lineartransformation Standardisierung ● Varianzverschiebungssatz Zur Varianzermittlung gibt es eine vereinfachte Berechnungsformel, den Varianzverschiebungssatz. Hier werden nur der Erwartungswert von der quadrierten Zufallsvariablen sowie der einfache Erwartungswert benötigt: (5.17) 2 E X 2 EX 2 diskreter Fall (5.18) E X 2 m stetiger Fall m 2 2 xj pj xj f xj j1 j1 (5.19) E X x 2 f x dx 2 Beweis von (5.17): Nach (5.14) und (5.15) ist die Varianz von X durch 2 = E{[X – E(X)]2} gegeben. Die Formel lässt sich durch einfache algebraische Umformung zeigen: EX 2 2 X EX EX 2 2 E X EX 2 EX EX X EX E(X 2 ) 2 EX EX EX 2 E(X 2 ) 2 EX 2 EX 2 E(X 2 ) EX 2 . ⃞ Beispiel 5.14: Für die Wahrscheinlichkeitsfunktion beim einmaligen Würfelwurf ermitteln wir zunächst den Erwartungswert von X2: x 2j p j EX 2 6 j1 1 1 1 1 1 1 12 22 32 42 52 62 6 6 6 6 6 6 1 91 1 4 9 16 25 36 15,167 . 6 6 Mit dem Varianzverschiebungssatz (5.17) erhält man das mit der originären Varianzformel (5.14) berechnete Ergebnis: 2 E X2 EX 2 15,167 3,52 15,167 12,25 2,917. ♦ Beispiel 5.15: Bei der Dichtefunktion für x 0 0 f x 1 2 x für 0 x 2 0 für x 2 nimmt der Erwartungswert von X2 den Wert EX 2 2 2 1 4 2 3 1 1 x f x dx x x dx x dx x 2 2 8 0 0 0 0 2 2 2 16 0 2 8 an. Unter Verwendung des bereits ermittelten Erwartungswerts von X, 4/3, erhält man denselben Wert für die Varianz der Zufallsvariablen X: E X EX 2 2 2 2 4 18 16 2 2 0,222. 9 9 9 3 ♦ ● Lineartransformation In verschiedenen Anwendungen wird von einer Lineartransformation Gebrauch gemacht, indem X um einen konstanten Betrag a und einen multiplikativen Faktor b verändert wird:: (5.20) Y a bX Man erhält den neuen Erwartungswert E(Y), indem man die Lineartransformation (5.20) in gleicher Form auf den ursprünglichen Erwartungswert E(X) anwendet: (5.21) EY Ea b X a b EX Beweis von (5.21): Wir beschränken uns hier darauf, (5.21) für den Fall einer stetigen Zufallsvariablen zu beweisen. Es gilt E(Y) a b x f x dx a f x dx b x f x dx a f x dx b x f x dx. Wegen f x dx 1 und x f x dx EX folgt EY a b EX . ⃞ Wie sich gezeigt hat, lässt sich der neue Erwartungswert durch eine lineare Transformation, E(Y) = E(a+b·X) = a + b·E(X), aus dem ursprünglichen Erwartungswert E(X) erhalten. Aufgrund der in dieser Gleichung wiedergegebenen Transformationseigenschaften bezeichnet man den Erwartungswert auch als linearen Operator. Folgerung: Speziell folgt aus (5.21), dass der Erwartungswert einer Konstanten gleich der Konstanten ist: (5.22) E(a) = a Beispiel 5.16: In Bespiel 5.10 hatten wir die Zufallsvariable Gewinn (in €) bei einem Würfelwurf betrachtet. Der Spieler gewinnt man das Fünffache der gewürfelten ungeraden Augenzahl und verliert das Vierfache der geraden Augenzahl. Die Gewinn- und Verlustbeträge werden in Euro gemessen. Angenommen, der Glücksspieler möchte seinen Gewinn, der in Euro ausgezahlt wird, in Dollar [$] umtauschen. Für einen Euro erhält er 1,30 Dollar. Zusätzlich fallen Umtauschgebühren unabhängig von der Höhe des Gewinns von 2 Dollar an. Alle Gewinne werden also um 2 Dollar vermindert. Wie hoch ist der erwartete Gewinn in Dollar? Die Formel für die Lineartransformation lautet: $ Yin $ 2 $ 1,30 Xin € . € Wir berechnen den erwarteten Dollar-Gewinn durch a) Anwendung der Lineartransformation (5.20) auf die in Euro ausgezahlten Einzelgewinne, b) Anwendung der Lineartransformation (5.21) auf den Erwartungswert des Gewinns in Euro. Ad a) Berechnung des Erwartungswerts (in $) aus den Einzelgewinnen Gewinne in Dollar: y1 = -2 + 1,30·(-x1=24) = -33,20; y3 = -2 + 1,30·(x3=-8) = -12,40; y5 = -2 + 1,30·(x5=15) = 17,50; y2 = -2 + 1,30·(x2=-16) = -22,80; y4 = -2 + 1,30·(x4=5) = 4,50; y6 = -2 + 1,30·(x6=25) = 30,5; Wahrscheinlichkeitsfunktion der Gewinne (in $): 1 6 1 6 1 6 1 f y 6 1 6 1 6 0 für y 33,20 für y 22,80 für y 12,40 für y 4,50 für y 17,50 für y 30,50 sonst Erwarteter Dollar-Gewinn: 6 EY y j p j j1 1 1 33,20 22,80 6 6 1 1 12,40 4,50 6 6 1 1 17,50 30,50 6 6 2,65 $ . Ad b) Berechnung des Erwartungswerts (in $) aus dem erwartetem Euro-Gewinn Erwartungswert in Euro (aus Beispiel 5.10): 1 EX € 2 Erwartungswert in Dollar (mit Lineartransformation 5.21): EY a b EX 2 1,30 0,5 2,65 $ ♦ Im Falle einer linearen Transformation der Zufallsvariablen X werden bei der Varianzbildung multiplikative Konstanten quadriert. Die Varianz ändert sich dagegen nicht, wenn zu der Zufallsvariablen eine Konstante addiert wird. Daraus folgt, dass die Varianz einer Konstanten stets gleich 0 ist. Man erhält damit die neue Varianz V(Y) aus der ursprünglichen Varianz V(X) aus (5.23) V(Y) V a bX b2 V(X). Beweis von (5.23): Die Varianz ist definiert als quadrierte Abweichung der Zufallsvariablen von ihrem Erwartungswert: V(Y) EY EY 2 Ea b X Ea b X 2 Ea b X Ea b X 2 . Mit (5.21), EY E(a b X) a b EX , erhält man V(Y) Ea b X a b EX 2 Eb X b EX 2 und daraus schließlich V(Y) Eb X EX 2 b2 EX EX 2 b2 V(X). ♦ Beispiel 5.17: Wie hoch ist die Varianz des Spielergewinns in Dollar? Wir berechnen die Lösung wiederum auf zwei Wegen: Durch a) Anwendung der Lineartransformation (5.20) auf die in Euro ausgezahlten Einzelgewinne, b) Anwendung der Transformation (5.23) auf die Varianz des Gewinns in Euro. Ad a) Berechnung der Varianz (in $) aus den Einzelgewinnen Unter Verwendung der in Beispiel 5.16 ermittelten Wahrscheinlichkeitsfunktion f(y) der Gewinne in Dollar, 1 6 für y 33,20 1 für y 22,80 6 1 für y 12,40 6 1 f y für y 4,50 , 6 1 für y 17,50 6 1 6 für y 30,50 0 sonst und dem dort berechneten Erwartungswert der Gewinne in Dollar, EY 2,65 $ , erhält man die Varianz der Gewinne in Dollar 6 V(Y) y j E(Y) j1 2 6 p j y j (2,65) 2 p j j1 33,2 2,65 2 1 6 22,8 2,65 2 1 6 12,4 2,65 2 1 6 4,5 2,65 2 1 6 17,5 2,65 2 1 6 30,5 2,65 2 1 6 155,550 67,670 15,844 8,520 67,670 183,154 498,408 $2 . Ad b) Berechnung der Varianz in Dollar aus der Varianz in Euro In Anwendungen ist die alte Varianz in der Regel bekannt. In unserem Fall ist sie unter Verwendung der Wahrscheinlichkeitsfunktion f(x) der Gewinne in Euro, 1 6 für x 24 1 für x 16 6 1 für x 8 6 1 f x für x 5 , 6 1 für x 15 6 1 6 für x 25 0 sonst und dem Erwartungswert der Gewinne in Euro, EX 0,5 € , zu erst noch berechnen: 6 6 V(X) x j E(X) 2 p j x j (0,5) 2 p j j1 j1 24 0,5 2 1 6 16 0,5 2 1 6 8 0,5 2 1 6 5 0,5 2 1 6 15 0,5 2 1 6 25 0,5 2 1 6 92,042 40,042 9,375 5,042 40,042 108,375 294,917. Mit Hilfe der Transformationsformel (5.23) erhalten wir für die Varianz der Gewinne in dollar den Wert VY b 2 VX 1,32 294,917 498,410 $2 , der bis auf eine Rundungsungenauigkeit mit dem in Teil a) errechneten Wert übereinstimmt. ♦