5.4 Verteilungsfunktion Die Verteilungsfunktion gibt an welche Wahrscheinlichkeit sich bis zu einem bestimmten Wert x der Zufallsvarialben X kumuliert („angehäuft“, „angesammelt“) hat. Die Verteilungsfunktion F(x) gibt an, wie groß die Wahrscheinlichkeit ist, dass die Zufallsvariable X einen Wert annimmt, der kleiner oder gleich x ist: F(x) = P(X x). Bei diskreten Zufallsvariablen erhält man sie durch Aufsummieren von Wahrscheinlichkeiten, bei stetigen Zufallsvariablen durch Integration. Abbildung: Form der Verteilungsfunktion bei diskreten und stetigen Zufallsvariablen Verteilungsfunktion diskrete Zufallsvariable stetige Zufallsvariable "Treppenfunktion" monoton steigende Funktion 24 Verteilungsfunktion bei diskreten Zufallsvariablen Es sei X eine diskrete Zufallsvariable. Dann ist ihre Verteilungsfunktion F(x) durch f ( x ) P X x p j j j x j x x x x j j x gegeben. Die Summation erstreckt sich über alle Ausprägungen xj, die kleiner oder gleich x sind. (5.9) F( x ) P(X x ) Anmerkung: Die Definition (5.9) setzt nicht voraus, dass die xj aufsteigend sortiert sind. Im Folgenden unterstellen wir aber der Übersichtlichkeit halber immer die Sortierung x1 < x2 < …< xm . 25 0 Bei einer endlichen Zufallsvariable X mit m denkbaren Ausprägungen x1, x2, …, xm lässt p1 sich die Verteilungsfunktion formal p1 p 2 folgendermaßen darstellen: Fx p1 p 2 p3 1 Graphische Darstellung: Treppenfunktion Erläuterung An den „Sprungstellen“, also bei den Werten xj, kennzeichnet man durch einen leeren Kreis und einen gefüllten Kreis, dass die Funktion F dort immer den oberen Wert annimmt („für xj ≤ x …“). Der leere Kreis gehört nicht mehr zum Graphen der Funktion („für … x < xj“). An jeder Sprungstelle xj nimmt die Verteilungsfunktion F(x) um die Wahrscheinlichkeit pj zu. x x1 für für x1 x x 2 für x 2 x x 3 für x 3 x x 4 für x m x (bzw . x x m ) Treppenfunktion (Beispiel: m = 3) Fx p1 p 2 p3 1 p1 p 2 p1 x1 x2 x3 x26 Kumulierte Wahrscheinlichkeiten bei einer diskreten Zufallsvariable X Wir betrachten kumulierte Wahrscheinlichkeiten im Hinblick auf eine konkrete Zahl a: Wahrscheinlichkeit für… Formaler Ausdruck PX a Fa höchstens a weniger als a PX a Fa P(X a ) mindestens a PX a 1 Fa P(X a ) PX a 1 PX a 1 Fa mehr als a Beispiel 5.8: Die Wahrscheinlichkeitsfunktion im Beispiel 5.5 des Produktionsprozesses, bei dem zwei Teile entnommen werden (X: Anzahl der defekten Teile), ist gegeben durch 1 p 2 2p1 p f x 2 p 0 für x 0 für x 1 für x 2 sonst 27 Für die Verteilungsfunktion ergibt sich daraus wegen (5.9) für ausgewählte x-Werte z.B. F(-1) P(X -1) 0 F(0) P(X 0) P(X 0) (1 - p) 2 F(0,2) P(X 0,2) P(X 0) (1 - p) 2 F(1) P(X 1) P(X 0) P(X 1) (1 - p) 2 2p(1 - p) 1 - 2p p 2 2p - 2p 2 1 - p 2 F(2) P(X 2) P(X 0) P(X 1) P(X 2) 1 - p 2 p 2 1 Die Verteilungsfunktion lässt sich damit kompakt schreiben als 0 1 p 2 Fx PX x 2 1 p 1 für x 0 für 0 x 1 für 1 x 2 für x 2 Sie hat Sprungstellen bei den Werten x=0, x=1 und x=2. Die Höhe der Sprünge addiert sich insgesamt zu 1. 28 Verteilungsfunktion bei stetigen Zufallsvariablen Die Verteilungsfunktion F(x) entspricht bei einer stetigen Zufallsvariable X der Fläche unterhalb der Dichtefunktion f(u), die sich bis zum Wert x kumuliert hat. Man erhält sie durch Integration: (5.10) Fx x f u du . Die Variable u „vertritt“ hierbei das x als Integrationsvariable, da wir x als obere Integralgrenze benötigen. Mit der Verteilungsfunktion F(x) lassen sich ebenso wie mit der Dichtefunktion f(x) Wahrscheinlichkeiten bestimmen. Bei stetigen Zufallsvariablen ist dabei – anders als bei den diskreten – unerheblich, ob die Intervallgrenze zum Intervall gezählt wird oder nicht, weil Punktwahrscheinlichkeiten gleich null sind. Kumulierte Wahrscheinlichkeiten bei einer stetigen Zufallsvariable X Wahrscheinlichkeit für… Formaler Ausdruck höchstens a PX a Fa weniger als a PX a Fa mindestens a mehr als a F(a ) P(X a ) F(a ) 0 PX a 1 PX a 1 Fa PX a 1 PX a 1 Fa 29 Wahrscheinlichkeiten für geschlossene und offene Intervalle bei einer stetigen Zufallsvariable X (5.11) Pa X b Pa X b Pa X b Pa X b Fb Fa Abbildung: Intervallwahrscheinlichkeiten f x f x PX b x b Fb PX b 1 Fb x f x zusammen: F(a) F(b) F(b) Pa X b a b x 30 Beispiel 5.9: Wir betrachten die in Beispiel 5.7 verwendete Dichtefunktion. a) Welche Verteilungsfunktion hat die Zufallsvarialbe X? für x 0 0 . f x 12 x für 0 x 2 0 für x 2 1. Schritt: Bildung der Integrale in den relevanten Bereichen: x < 0: 0 ≤ x ≤ 2: x x x 0 x 0 f u du 0 du 0 f u du 0 du x 1 1 1 1 1 u du u 2 x 2 02 x 2 2 4 0 4 4 4 0 2 < x: x 0 2 0 f u du 0 du 2 x 1 1 1 u du 0 du 0 u 2 0 22 1 2 4 0 4 2 für x 0 2. Schritt: Ausweisen der Verteilungsfunkton 0 1 2 Fx x für 0 x 2 4 1 für x 2 31 Graphische Darstelllung der Dichte- und Verteilungsfunktion: Dichtefunktion Verteilungsfunktion f(x) -1 F(x) 1 1 1/2 1/2 0 1 2 x -1 0 1 2 x 32 b) Wie groß ist die Wahrscheinlichkeit, dass die Zufallsvariable X Werte annimmt, die kleiner oder gleich 1,6 sind? ● Berechnung mit Hilfe der Dichtefunktion f(x) 1,6 PX 1,6 f x dx 0 1,6 f(x) 1 x 2 dx 0 1 1,6 0,64 1 1 1 x 2 1,62 02 4 0 4 4 0,64 1/2 -1 0 2 1 x ● Berechnung mit Hilfe der Verteilungsfunktion F(x) F(x) 1 PX 1,6 F1,6 1,62 4 1 2,56 0,64 4 1 F(1,6) =0,64 1/2 -1 0 1 2 x 33 Der Punkt x=1,6 heißt 64%-Quantil / 0,64-Quantil der Wahrscheinlichkeitsverteilung. c) Welchen Wert nimmt die Wahrscheinlichkeit für 0,6< X<1,2 an? ● Berechnung mit Hilfe der Dichtefunktion f(x) 1, 2 P0,6 X 1,2 f x dx 0, 6 1, 2 1x 2 0, 6 f(x) dx 1 1, 2 1 x2 4 0, 6 1 1 1,22 0,62 4 4 0,270 0,27 1/2 -1 0 x 2 1 ● Berechnung mit Hilfe der Verteilungsfunktion F(x) F(x) P0,6 X 1,2 F1,2 F0,6 1 1 1,22 0,62 4 4 0,36 0,09 0,270 1 F(1,2) =0,36 0,36-0,09=0,27 F(0,6) =0,09 -1 0 1 2 x 34 d) Schließlich fragen wir noch nach der Wahrscheinlichkeit, dass X größer als 1,3 ist. ● Berechnung mit Hilfe der Dichtefunktion f(x) PX 1,3 f x dx 1,3 2 1x 2 f(x) dx 0 1,3 1 0,577 2 1 1 1 x 2 22 1,32 4 1,3 4 4 0,577 1/2 -1 0 1 x 2 ● Berechnung mit Hilfe der Verteilungsfunktion F(x) F(x) PX 1,3 1 F1,3 1 1 1,32 1 0,423 4 0,577 1 1-0,423 =0,577 F(1,3) =0,423 -1 0 1 2 x 35 5.5 Erwartungswert und Varianz Erwartungswert und Varianz einer Zufallsvariable sind Maßzahlen (Kenngrößen, Parameter), mit denen die Wahrscheinlichkeitsverteilung einer Zufallsvariable genauer beschrieben werden kann. Übersicht: Wichtige Maßzahlen einer Zufallsvariable Maßzahlen einer Zufallsvariablen Erwartungswert Erwartungswert μ: „im Mittel erwarteter Wert“ einer Durchschnittswert aus einer VielZufallsvariable (Lagemaß) zahl von Zufallsexperimenten Varianz Varianz σ2: „im Mittel erwarteter Wert“ Durchschnittliche quadratische der quadratischen Abweichung einer Abweichung Erwartungswert Zufallsvariable von vom μ (Streuungsmaß) 36 ● Erwartungswert einer Zufallsvariable Der Erwartungswert E(X) einer Zufallsvariable X gewichtet alle denkbaren Ausprägungen von X mit ihren jeweiligen Wahrscheinlichkeiten und liefert so den „im Mittel erwarteten Wert“ von X. Praktisch lässt er sich als Durchschnittswert bei einer sehr großen Anzahl von Wiederholungen des Zufallsvorgangs interpretieren. Der Erwartungswert von X wird auch mit dem griechischen Buchstaben µ (my, gesprochen: „mü“, englisch: mu oder mju) bezeichnet. Erwartungswert bei diskreten Zufallsvariablen: EX x j p j x j f x j m (5.12) j1 m (bei m möglichen Ausprägungen) j1 Der Erwartungswert muss dabei nicht immer eine der denkbaren Ausprägungen sein, er kann auch zwischen zwei Ausprägungen liegen. Erwartungswert bei stetigen Zufallsvariablen: (5.13) EX x f x dx 37 Beispiel 5.10: Bei einem Würfelwurf gewinnt man das Fünffache der gewürfelten ungeraden Augenzahl und verliert das Vierfache der geraden Augenzahl. Die Gewinn- und Verlustbeträge werden in Euro gemessen. Von welchem Erwartungswert des Gewinns können Sie ausgehen, wenn Sie an diesem Glücksspiel teilnehmen? 16 für x 24 1 6 für x 16 16 für x 8 Mit Hilfe der Angaben in der Wahrscheinlich f x 16 für x 5 keitsfunktion der diskreten Zufallsvariable X, 1 für x 15 6 16 für x 25 0 sonst , lässt sich der Erwartungswert unter Verwendung von 6 (5.12) bestimmen: EX x j p j j1 1 1 1 1 1 1 24 16 8 5 15 25 6 6 6 6 6 6 3 1 . 6 2 Sie müssen also im Mittel mit einem Verlust pro Spiel von ½ Euro rechnen. 38 Beispiel 5.11: Wir betrachten die bereits bekannte Dichtefunktion 0 für x 0 f x 12 x für 0 x 2 0 für x 2 Wie groß ist sein Erwartungswert der Zufallsvariable X? Da die Zufallsvariable X stetig ist, ziehen wir zur Berechnung des Erwartungswerts die Formel (5.13) heran. Wir integrieren hier über das Intervall zwischen 0 und 2, da die Dichte nur in diesem Bereich ungleich 0 ist: 0 2 2 EX x f x dx 0 dx x x dx 0 dx 12 x 2 dx 2 0 0 1 2 0 0 2 1 8 4 x3 0 . 6 6 3 0 39 ● Erwartungswert einer Lineartransformation In verschiedenen Anwendungen wird von einer Lineartransformation Gebrauch gemacht, indem X um einen konstanten Betrag a und einen multiplikativen Faktor b verändert wird: (5.20) Y a bX (Formeln 5.20 bis 5.22 und 5.S vor 5.14 eingeschoben) Man erhält den neuen Erwartungswert E(Y), indem man die Lineartransformation (5.20) in gleicher Form auf den ursprünglichen Erwartungswert E(X) anwendet: (5.21) EY Ea b X a b EX Beweis von (5.21): Wir beschränken uns hier darauf, (5.21) für den Fall einer stetigen Zufallsvariable zu beweisen. Es gilt E(Y) a b x f x dx a f x dx b x f x dx a Wegen f x dx b x f x dx. f x dx 1 und x f x dx EX folgt EY a b EX . 40 Wie sich gezeigt hat, lässt sich der neue Erwartungswert durch eine lineare Transformation, E(Y) = E(a+b·X) = a + b·E(X), aus dem ursprünglichen Erwartungswert E(X) erhalten. Aufgrund der in dieser Gleichung wiedergegebenen Transformationseigenschaften bezeichnet man den Erwartungswert auch als linearen Operator. Folgerung: Speziell folgt aus (5.21), dass der Erwartungswert einer Konstanten gleich der Konstanten ist: (5.22) E(a) = a Weitere wichtige Rechenregel (ohne Beweis): Für die Summe zweier Zufallsvariablen X und Y gilt (5.S) E(X + Y) = E(X) + E(Y) und damit auch E(X + Y + Z) = E(X) + E(Y + Z) = E(X) + E(Y) + E(Z) 41 Beispiel 5.12: In Bespiel 5.10 hatten wir die Zufallsvariable Gewinn (in €) bei einem Würfelwurf betrachtet. Der Spieler gewinnt man das Fünffache der gewürfelten ungeraden Augenzahl und verliert das Vierfache der geraden Augenzahl. Die Gewinn- und Verlustbeträge werden in Euro gemessen. Angenommen, der Glücksspieler möchte seinen Gewinn, der in Euro ausgezahlt wird, in Dollar [$] umtauschen. Für einen Euro erhält er 1,30 Dollar. Zusätzlich fallen Umtauschgebühren unabhängig von der Höhe des Gewinns von 2 Dollar an. Alle Gewinne werden also um 2 Dollar vermindert. Wie hoch ist der erwartete Gewinn in Dollar? Die Formel für die Lineartransformation lautet: $ Yin $ 2 $ 1,30 Xin € . € Wir berechnen den erwarteten Dollar-Gewinn durch a) Anwendung der Lineartransformation (5.20) auf die in Euro ausgezahlten Einzelgewinne, b) Anwendung der Lineartransformation (5.21) auf den Erwartungswert des Gewinns in Euro. 42 Ad a) Berechnung des Erwartungswerts (in $) aus den Einzelgewinnen Gewinne in Dollar: y1 = -2 + 1,30·(-x1=24) = -33,20; y3 = -2 + 1,30·(x3=-8) = -12,40; y5 = -2 + 1,30·(x5=15) = 17,50; y2 = -2 + 1,30·(x2=-16) = -22,80; y4 = -2 + 1,30·(x4=5) = 4,50; y6 = -2 + 1,30·(x6=25) = 30,5; Wahrscheinlichkeitsfunktion der Gewinne (in $): für y 33,20 für y 22,80 für y 12,40 für y 4,50 f y für y 17,50 für y 30,50 0 sonst 16 1 6 16 1 6 1 6 16 Erwarteter Dollar-Gewinn: 6 EY y j p j j1 1 1 33,20 22,80 6 6 1 1 12,40 4,50 6 6 1 1 17,50 30,50 6 6 2,65 $ . 43 Ad b) Berechnung des Erwartungswerts (in $) aus dem erwartetem Euro-Gewinn Erwartungswert in Euro (aus Beispiel 5.10): 1 EX € 2 Erwartungswert in Dollar (mit Lineartransformation 5.21): EY a b EX 2 1,30 0,5 2,65 $ 44 ● Varianz und Standardabweichung einer Zufallsvariable Die Varianz und die Standardabweichung einer Zufallsvariable X sind Streuungsmaße, die angeben, wie stark die Ausprägungen von X um ihren Erwartungswert streuen. Die Varianz V(X) gibt den Erwartungswert der quadrierten Abweichung der XAusprägungen von E(X) an, also die “im Mittel erwartete quadrierte Abweichung” der X-Ausprägungen von E(X) (praktisch: durchschnittliche quadrierte Abweichung bei vielen Wiederholungen). Sie wird auch durch das Symbol ² (sigma-Quadrat) gekennzeichnet. Varianz bei diskreten Zufallsvariablen (bei m möglichen Ausprägungen): 2 (5.14) V(X) E [X E(X) ] E [X ] [ x j ] p j [ x j ] f x j 2 2 2 Varianz bei stetigen Zufallsvariablen: m j1 2 m j1 (5.15) V(X) E [X E(X) ] E [X ] [ x ]2 f x dx 2 2 2 Die Standardabweichung (sigma) gibt als Wurzel aus der Varianz an, wie stark die Werte der Zufallsvariable X “im erwarteten Mittel” von ihrem Erwartungswert E(X) abweichen. (Vorteil gegenüber ²: wird in der gleichen Einheit gemessen wie X.) Standardabweichung: (5.16) V(X) 2 45 Beispiel 5.13: Wie groß sind Varianz und Standardabweichung beim einmaligen Werfen mit einem fairen Würfel? Mit der Wahrscheinlichkeitsfunktion 16 für x 1,2,...,6 f (x) 0 sonst ergibt sich der Erwartungswert 6 1 1 1 1 1 1 EX x j p j 1 2 3 4 5 6 6 6 6 6 6 6 j1 1 1 1 2 3 4 5 6 21 3,5 . 6 6 Für die Varianz erhält man mit (5.14) x j 2 p j 2 6 j1 1 1 1 1 1 1 1 3,52 2 3,52 3 3,52 4 3,52 5 3,52 6 3,52 6 6 6 6 6 6 1 1 6,25 2,25 0,25 0,25 2,25 6,25 17,5 2,917. 6 6 Die Würfelwürfe weichen damit im erwarteten Mittel um 2 17,5 1,708 6 vom Erwartungswert 3,5 ab. 46 Beispiel 5.14: Für die Dichtefunktion, für x 0 0 f x 12 x für 0 x 2 0 für x 2 hatten wir bereits den Erwartungswert von 4/3 in Beispiel 5.11 bestimmt. Damit lassen sich Varianz 2 0 2 4 1 2 2 x f x dx 0 dx x x dx 0 dx 3 2 0 2 0 0 2 x3 4 2 8 16 1 2 8 x x x dx x x dx 3 9 2 3 9 0 0 2 2 2 x4 4 3 4 2 32 16 2 x x 2 0 0 0 0,222 9 9 9 9 8 9 0 und Standardabweichung 2 0,471 9 berechnen. Die Werte, die die Zufallsvariable X annehmen kann, weichen also im 47 erwarteten Mittel um 0,471 vom Erwartungswert ab. ● Varianzverschiebungssatz Zur Varianzermittlung gibt es eine vereinfachte Berechnungsformel, den Varianzverschiebungssatz. Hier werden nur der Erwartungswert der quadrierten Zufallsvariable sowie der einfache Erwartungswert benötigt: 2 E X 2 EX 2 (5.17) diskreter Fall stetiger Fall 2 2 2 (5.18) E X x j p j x j f x j m m j1 j1 (5.19) E X x 2 f x dx 2 Beweis von (5.17): Nach (5.14) und (5.15) ist die Varianz von X durch 2 = E( [X – E(X)]2 ) gegeben. Für die Herleitung benötigen wir die Regeln (5.21) und (5.S): E X 2 E X EX 2 E X EX X EX 2 2 X EX EX mit (5.21) 2 E(X ) E 2 EX X (Folie 18) Konstante mit (5.S) 2 E(X 2 ) 2 EX EX EX E(X 2 ) EX (Folie 17) 2 E X 2 2 E EX 2 Konstante 48 Beispiel 5.15: Für die Wahrscheinlichkeitsfunktion beim einmaligen Würfelwurf ermitteln wir zunächst den Erwartungswert von X2: x 2j p j EX 2 6 j1 1 1 1 1 1 1 12 22 32 42 52 62 6 6 6 6 6 6 1 91 1 4 9 16 25 36 15,167 . 6 6 Mit dem Varianzverschiebungssatz (5.17) erhält man das mit der originären Varianzformel (5.14) berechnete Ergebnis: 2 E X 2 EX 2 15,167 3,52 15,167 12,25 2,917. 49 Beispiel 5.16: Bei der Dichtefunktion für x 0 0 1 f x 2 x für 0 x 2 für x 2 0 nimmt der Erwartungswert von X2 den Wert 2 2 2 1 E X 2 x 2 f x dx 0 x 2 1 x dx 0 1 x 3 dx x 4 2 2 8 0 0 0 16 0 2 8 an. Unter Verwendung des bereits ermittelten Erwartungswerts von X, 4/3, erhält man denselben Wert für die Varianz der Zufallsvariable X: 2 EX 2 2 4 18 16 2 2 EX 2 0,222. 3 9 9 9 50 Varianz einer Lineartransformation Im Falle einer linearen Transformation der Zufallsvariable X werden bei der Varianzbildung multiplikative Konstanten quadriert. Die Varianz ändert sich dagegen nicht, wenn zu der Zufallsvariable eine Konstante addiert wird. Daraus folgt, dass die Varianz einer Konstanten stets gleich 0 ist. ● Man erhält damit die neue Varianz V(Y) aus der ursprünglichen Varianz V(X) aus V (Y ) V a bX b 2 V (X ). (5.23) Beweis von (5.23): Die Varianz ist definiert als quadrierte Abweichung der Zufallsvariable von ihrem Erwartungswert: V(Y) E Y EY 2 E a b X Ea b X 2 Ea b X Ea b X . 2 Mit (5.21) (Folie 17), EY E(a b X) a b EX , erhält man V(Y) E a b X a b EX 2 E b X b EX 2 und daraus schließlich (die geschweiften Klammern sind hier keine Mengenklammern) V(Y) E b X EX 2 E b 2 X EX 2 b 2 E X EX 2 b 2 V(X). 51 Beispiel 5.17: Wie hoch ist die Varianz des Spielergewinns aus Beispiel 5.12 in Dollar? Wir berechnen die Lösung wiederum auf zwei Wegen: Durch a) Anwendung der Lineartransformation (5.20) auf die in Euro ausgezahlten Einzelgewinne, b) Anwendung der Transformation (5.23) auf die Varianz des Gewinns in Euro. Ad a) Berechnung der Varianz (in $) aus den Einzelgewinnen Unter Verwendung der in Beispiel 5.16 ermittelten Wahrscheinlichkeitsfunktion f(y) der Gewinne in Dollar, 16 1 6 1 6 f y 16 1 6 1 6 0 für y 33,20 für y 22,80 für y 12,40 für y 4,50 , für y 17,50 für y 30,50 sonst 52 und dem dort berechneten Erwartungswert der Gewinne in Dollar, EY 2,65 $ , erhält man die Varianz der Gewinne in Dollar 6 6 2 V(Y) y j E(Y) p j y j (2,65) p j j1 2 j1 33,2 2,65 2 1 6 22,8 2,65 2 1 6 12,4 2,65 2 1 6 4,5 2,65 2 1 6 17,5 2,65 2 1 6 30,5 2,65 2 1 6 155,550 67,670 15,844 8,520 67,670 183,154 498,408 $2 . 53 Ad b) Berechnung der Varianz in Dollar aus der Varianz in Euro In Anwendungen ist die alte Varianz in der Regel bekannt. In unserem Fall ist sie unter Verwendung der Wahrscheinlichkeitsfunktion f(x) der Gewinne in Euro, 16 1 6 1 6 f x 16 1 6 1 6 0 für x 24 für x 16 für x 8 für x 5 , für x 15 für x 25 sonst und dem Erwartungswert der Gewinne in Euro, EX 0,5 € , zu erst noch berechnen: 54 6 V(X) x j E(X) j1 2 6 p j x j (0,5) j1 2 pj 24 0,5 1 6 16 0,5 1 6 2 2 8 0,5 1 6 5 0,5 1 6 2 2 15 0,5 1 6 25 0,5 1 6 2 2 92,042 40,042 9,375 5,042 40,042 108,375 294,917. Mit Hilfe der Transformationsformel (5.23) erhalten wir für die Varianz der Gewinne in Dollar den Wert VY b 2 VX 1,32 294,917 498,410 $2 , der bis auf eine Rundungsungenauigkeit mit dem in Teil a) errechneten Wert übereinstimmt. 55