7.4 Zufallsvariable, Wahrscheinlichkeitsverteilungen Beispiel 7.4.1: 3 ideale Münzen werden geworfen (dies entspricht 3 Würfen mit einer idealer Münze) Als Gewinn werde die Anzahl von W bei Ergebnis ω ausgezahlt. Dies ist also die Zielgröße. Wir interessieren uns nun für Wahrscheinlichkeiten dafür, das der Gewinn bestimmte vogegebenen Werte annimmt. Dazu sammeln wir aber zunächst Wahrscheinlichkeiten für Wurfergebnisse (genauer: entsprechende Elementarereignisse) überhaupt: Ergebnis ω Gewinn X(ω) P ({w}) ZZZ 0 ZZW 1 ZW Z 1 ZW W 2 W ZZ 1 W ZW 2 WWZ 2 WWW 3 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 Jedem Ergebnis ω wurde also als Gewinn eine bestimmte Zahl zugeordnet. Diese Zuordnung lässt sich als Funktion beschreiben, die wir mit X(ω) bezeichnen. Für das Spiel sind aber nur Wahrscheinlichkeiten für die Gewinngrößen interessant, die wir jetzt in einer verkürzten Tabelle sammeln: Gewinn X Wahrscheinlichkeit 0 1/8 1 3/8 2 3/8 3 1/8 Der Gewinn X ist nun ein Beispiel für eine Zufallsvariable (Abkürzung ZV). Bei der Durchführung der Zufallsexperimentes wird dann eine der Zahlen 0,1,2 oder 3 als Gewinn herauskommen. Erhält man z.B. beim ersten Wurf “2” als Gewinn, dann nennt man “2” eine Realisierung der ZV X. Dazu einige weitere Beispiele von Wurfergebnissen: 2. Wurf 3. Wurf 4. Wurf Gewinn = 2 Gewinn = 2 Gewinn = 0 X = 2 bedeutet: X ≤ 2 bedeutet: 2 ist Realisierung von X beim 2. Wurf 2 ist Realisierung von X beim 3. Wurf 0 ist Realisierung von X beim 4. Wurf zweimal ”W ” = ˆ {ZW W, W ZW, W W Z} höchstens zweimal ”W ”= ˆ {ZZZ, ZZW, ZW Z, W ZZ, ZW W, W ZW, W W Z} Mit X = 2 und X ≤ 2 werden also Teilmengen der Ergebnismenge gekennzeichnet. X = 2 und X ≤ 2 sind somit Beispiele von Ereignissen. Def. 7.4.1: Eine Zufallsvariable (Abk.: ZV) ist eine Größe X (oder Y, Z, Xi usw.), die bei der Durchführung eines Zufallsexperiments (oder bei einem vergleichbaren Vorgang) irgendeinen reellen Wert x annimmt. x heißt dann eine Realisierung von X. Bei einer weiteren Durchführung des Zufallsexperiments erhält man i. a. eine andere Realisierung x′ von X Analogien: X= ˆ Messvorschrift, X= ˆ Merkmal, x= ˆ Messergebnis x= ˆ Merkmalsausprägung Bem.: Häufig wird die ZV auch so definiert: Ω Ergebnismenge X: ω ∈ Ω 7→ X(ω) ∈ IR (”messbare” Abbildung) Bem.: ”X = x”,”X < x” usw. sind für x ∈ IR zufällige Ereignisse. 71 Beispiel 7.4.2: Wurf mit 2 idealen Würfeln Zufallsvariable: X:= Summe der Augenzahlen (etwa als Gewinn ausgezahlt) X 0 1 2 3 4 5 1 2 3 4 Wahrscheinlichkeit 0 0 36 36 36 36 3 P (X = 4) = P ({(1, 3), (2, 2), (3, 1)}) = =: p4 36 P (X = 0) = P (X = 1) = 0 6 5 36 7 6 36 8 5 36 9 4 36 10 3 36 11 2 36 12 1 36 Da X nur ganzzahlige Werte bis 12 annehmen kann, gilt: 3 2 1 1 + + = 36 36 36 6 4 5+6+5 = P (6 ≤ X ≤ 10) = P (X = 6) + P (X = 7) + P (X = 8) = 36 9 1 P (X ≥ 9.5) = P (X ≥ 10) = 6 P (X ≥ 10) = P (X = 10) + P (X = 11) + P (X = 12) = Da man offenbar die Wahrscheinlichkeiten von beliebigen Ereignissen mit Hilfe der Wahrscheinlichkeiten in der obigen Tabelle bestimmen kann, nennt man den Satz von Wahrscheinlichkeiten in der obigen Tabelle eine Wahrscheinlichkeitverteilung. Def. 7.4.2: Kann eine Zufallsvariable X höchstens abzählbar viele Werte annehmen, also nur die Werte (0, )1, 2, . . . , n oder (0, )1, 2, . . . (oder allgemeiner x0 < x1 < . . . < xn oder x0 < x1 < x2 < . . .), so nennt man sie eine diskrete ZV. Def. 7.4.3: X sei eine diskrete ZV. Sind die Wahrscheinlichkeiten pk := P (X = k) oder allgemeiner pk := P (X = xk ) für alle k bekannt, so spricht man von einer Wahrscheinlichkeitsverteilung von X. Andere Ausdrucksweise: X = k bzw. xk mit Wahrscheinlichkeit pk Beispiel 7.4.3: X := Anzahl der in einer Minute an einem Postschalter ankommenden Kunden Dies ist eine Zufallsvariable; mögliche Werte: 0, 1, 2, . . . Die Wahrscheinlichkeiten für diese Werte bei der ZV gilt: λk =: pk , k = 0, 1, 2, . . . , k! wobei λ eine feste reelle Zahl > 0 ist, die experimentell geschätzt wird. Dies ist ein Erfahrungsresultat. Man kann die Darstellung aber auch durch allgemeine Überlegungen gewinnen, was hier aber nicht durchgeführt werden soll. Wir haben hier ein Beispiel für die Poisson–Verteilung, die in Unterabschnitt 7.6.2 behandelt wird. Die obigen Wahrscheinlichkeiten bilden die Wahrscheinlichkeitsverteilung der ZV X. Satz 7.4.1: Für jede Wahrscheinlichkeitsverteilung einer diskreten ZV gilt: P (X = k) = e−λ a) 0 ≤ pk ≤ 1 für alle k b) n P k=0 pk = 1 bzw. ∞ P k=0 pk := limm→∞ m P k=0 pk 72 = 1. Beispiel 7.4.4: Prüfung der Eigenschaften in Satz 7.4.1 bei zwei Beispielen: Für die Werte pk := P (X = k) aus der zweiten Tabelle von Beispiel 7.4.1 erhalten wir 0 ≤ pk ≤ 1 ∧ 3 X pk = k=0 1+3+3+1 =1 8 Für die Werte pk aus Beispiel 7.4.3 erhalten wir ∞ X pk = e−λ k=0 k=0 und 1= ∞ X λk ∞ X j=0 pj = k! = e−λ eλ = 1 ∞ X j=0,j6=k =⇒ (0 <)pk = 1 − pj + pk ∞ X pj < 1 j=0,j6=k | {z >0 } Beispiele 7.4.5 von nicht-diskreten ZV: a) X := Dauer der Reparatur einer defekten Maschine b) X := Abweichung von der Normgröße des Durchmessers einer Kugel (für einen Kugellager) Def. 7.4.4: Es sei X eine beliebige ZV. Dann nennt man die Funktion F (x) := P (X ≤ x) mit x ∈ IR die Verteilungsfunktion von X. Satz 7.4.2: Für die Verteilungsfunktion F (x) einer ZV gilt: a) 0 ≤ F (x) ≤ 1 b) F (x) ↑ (nicht immer streng ↑) auf IR, c) limx→−∞ F (x) = 0 ∧ limx→+∞ F (x) = 1 Erläuterung : zu b) (x ≤ x′ =⇒ F (x) := P (X ≤ x) ≤ F (x′ ) := P (X ≤ x′ )), d.h. F ist monoton wachsend. zu c) x −→ −∞ bzw. +∞ X ≤ x ”−→” ∅ bzw. Ω F (x) := P (X ≤ x) −→ P (∅) = 0 F (x) := P (X ≤ x) −→ P (Ω) = 1 73 Beispiel 7.4.6: i) Eine ZV X sei Poisson-verteilt mit λ = 2 (vergl. Beispiel 7.4.3): pk := P (X = k) = e−2 2k , k! p0 = 0.14, p1 = 0.27, p2 = 0.27, p3 = 0.18, . . . Ausrechnungsbsp. für einen Wert der Verteilungsfunktion F (x): F (3.5) := P (X ≤ 3.5) Xdiskret = P (X = 0 ∨ X = 1 ∨ . . . ∨ X = 3) = 1 pk = 0.86 k=0 - - - 3(≤3.5) P F(x) - 0 - 1 2 3 4 5 x ii) Für ein Beispiel für eine Verteilungsfunktion einer stetigen ZV vergl. Unterabschnitt 7.6.3 Mit Hilfe der Verteilungsfunktion lässt sich leicht die Wahrscheinlichkeit dafür beschreiben, dass X in einem bestimmten halboffenen Intervall liegt: Es sei a < b. Dann gilt: = P (X ≤ b ∧ X > a) = P (X ≤ b ∧ (X ≤ a)) P (a < X ≤ b) a<b, Satz7.2.1ii) = P (X ≤ b) − P (X ≤ a) =F (b) − F (a) Sonderfall: F sei stetig differenzierbar auf IR, d.h. F ′ (x) existiert und ist stetig auf IR. Setzen wir dann F ′ (x) =: f (x), so gilt nach dem Hauptsatz der Differential-und Integralrechnung: Z b Z b ′ f (x)dx F (x)dx = P (a < X ≤ b) = F (b) − F (a) = a a Dies ist ein bestimmtes Integral von a bis b über f (x)(:= der Kurve zu f (x) von a bis b . F ist eine Stammfunktion von f . Speziell folgt aus Satz 7.4.2 c) in diesem Fall: F ′ (x)), F (b) = lima→−∞ (F (b) − F (a)) = lima→−∞ 1 = limb→∞ F (b) = limb→∞ Rb −∞ 74 Rb also der Inhalt der Fläche unter f (x) dx = a f (x) dx = Rb f (x) dx, −∞ R∞ −∞ f (x) dx Def. 7.4.5: ZV, bei denen die Verteilungsfunktion F (x) stetig differenzierbar oder wenigstens durch Rx (7.4.1) F (x) = −∞ f (u) du mit einer geeigneten Funktion f (u) darstellbar ist, heißen stetige ZV. f (x) := F ′ (x) oder im allgemeineren Fall die Funktion f (u) aus (7.4.1) heißt die Verteilungsdichte oder Wahrscheinlichkeitsdichte der ZV. Dass man f (x) Verteilungsdichte nennt, lässt durch einen Vergleich mit der Massendichte erklären: F sei stetig differenzierbar in x: F (x + ∆x) − F (x) P (x < X ≤ x + ∆x) = , ∆x > 0. ∆x ∆x Dies ist die Wahrscheinlichkeit, dass X in dem halboffenen Intervall von x bis (x + ∆x) liegt, dividiert durch die Intervalllänge ∆x und damit analog zum Quotienten aus der Masse in einem kleinen Volumen ∆V dividiert durch die Größe des Volumens selbst: f (x) := F ′ (x) ≈ P (x < X ≤ x + ∆x) Masse im Volumen ∆V = ˆ ≈ Massendichte ∆x ∆V Bem.: Die Eigenschaften ”stetig” und ”diskret” schließen bei ZV einander aus. Darüberhinaus gibt es ZV, die weder diskret noch stetig sind. f (x) ≈ Satz 7.4.3: Für die Verteilungsdichte einer stetigen ZV gilt: a) f (x) ≥ 0 für alle x ∈ IR b) R∞ f (x) dx = 1 −∞ Bem.: f (x) ≤ 1 gilt i.a. nicht, da f (x) nicht als Wahrscheinlichkeit zu interpretieren ist. Satz 7.4.4: Für eine stetige ZV gilt: x R a) P (X = x) = f (u) du = 0, x b) P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b) = Bem.: Rb a f (u) du a) Bei einer stetigen ZV ist also die Wahrscheinlichkeit, dass X einen ganz bestimmten Wert annimmt, = 0. Das ist ein weiterer Grund dafür, dass f (x) nicht als Wahrsch. zu interpretieren ist. b) Bei einer stetigen ZV ist es also gleichgültig, ob die Intervallgrenzen eingeschlossen sind oder nicht. Bei nicht–stetigen ZV gilt das i.a. nicht. Satz 7.4.5: Für eine diskrete ZV X gilt (im Gegensatz zu oben): P (a ≤ X ≤ b) = n(od.∞) P P (a < X ≤ b) = pk , k=0 a ≤ xk ≤ b Für die übrigen Intervalle gilt analoges 75 n(od.∞) P k=0 a < xk ≤ b pk Beispiel 7.4.7 i) 6 f (u) - u b Schraffierte Fläche = Rb −∞ f (u) du = F (b) = P (X ≤ b)(= P (−∞ < X ≤ b)) ii) 6 f (u) - a 1. Fläche = iii) Rb a b a’ f (u) du = P (a ≤ X ≤ b) b’ 2. Fläche = R b′ a′ f (u) du = P (a′ ≤ X ≤ b′ ) 6 f (u) a b - u f (u) ist keine Wahrsch.dichte, da Bedingung a) in Satz 7.4.3 verletzt ist, was in diesem Rb Beispiel zur Folge hat, dass a f (u) du < 0 ist, also keine Wahrscheinlichkeit sein kann. iv) Eine ZV X habe eine Exponentialverteilung, d.h. 0 für x < 0, f (x) := λ e−λ x für x ≥ 0, wobei λ eine feste reelle Zahl > 0 ist, sei die Verteilungsdichte von X. Zunächst lässt sich leicht überprüfen, dass die Bedingungen von Satz 7.4.3 erfüllt sind: a) f (x) ≥ 0 für alle x ∈ IR, 76 u b) R∞ −∞ f (x) dx = Rb 0 f (x) dx = Z 0 f (x) dx + −∞ |{z} :=0 {z } | Rb 0 =0 −λ λ e x dx R∞ 0 f (x) dx = 1, denn: −λb + 1 −→ 0 + 1 für b → ∞ = [−e−λ x ]x=b x=0 = −e Für die Verteilungsfunktion erhält man: Rx f (u) du = 0 −∞ |{z} :=0 Z 0 Rx Rx vergl.o. F (x) = f (u) du + 0 f (u) du = 1 − e−λ x f (u) du = −∞ −∞ |{z} :=0 | {z } für x < 0 für x ≥ 0 =0 Für die Wahrscheinlichkeit, dass X zwischen 1 und 2 liegt, erhält man: Z 2 ix=2 h = e−λ − e−2λ λe−λ x dx = −e−λ x P (1 < X ≤ 2) = x=1 1 = P (1 ≤ X ≤ 2) = P (1 ≤ X < 2) = P (1 < X < 2) Skizzen mit λ = 1.2: 1 F (x) f (x) - 1 x 1 2 P (1 ≤ X ≤ 2) = e−1.2 − e−2.4 = 0.210 v) Poisson-Verteilung mit λ = 2: pk = e−2 · 2k , k! k = 0, 1, 2, . . . P (2 ≤ X < 4) = P (X = 2 ∨ X = 3) = P (X = 2) + P (X = 3) = p2 + p3 = 0.45 P (2 ≤ X ≤ 4) = P (X = 2 ∨ X = 3 ∨ X = 4) = p2 + p3 + p4 = 0.54 P (2 < X < 4) = P (X = 3) = p3 = 0.18 Beispiel 7.4.8 (zur Verteilungsfunktion und Verteilungsdichte einer Funktion einer ZV): Es sei Y := X 2 , wobei X stetige ZV sei mit FX (x), fX (x) als Verteilungsfunktion bzw. Verteilungsdichte. Wir bestimmen zuerst die Verteilungsfunktion von Y : FY (y) := P (Y ≤ y) = P (X 2 ≤ y) = ( P (∅) = 0 P |X| ≤ für y < 0 √ √ √ √ √ Satz 7.4.4 = FX y =P − y≤X≤ y y − FX y für y ≥ 0 77 ) Wir nehmen zunächst ohne Beweis an, dass Y eine stetige ZV ist, also eine besitzt: =0 für y 1 1 √ √ = FX′ ( y) · √ − FX′ (− y) · − √ 2 y y ′ fY (y) = FY (y) √ √ 1 für y = √ (fX ( y) + fX (− y)) 2· y ? für y Verteilungsdichte <0 >0 =0 Es ist unwichtig, ob fY (0) über die Ableitung FY (y) bestimmbar ist oder nicht. Es ist dann nur noch nachweisen, dass (bei beliebiger Setzung von fY (0)) gilt: Z y fY (u) du . FY (y) = −∞ Es gilt nämlich Z Ry für y ≤ 0 −∞R0 du = 0 = FY (y) Ry y fY (u) du = 0 + 0 fY (u) du = lima→0+ a fY (u) du = lima→0+ (FY (y) − FY (a)) −∞ = FY (y) − FY (0) = FY (y) für y > 0 y Dabei ist es für das erste Integral unwichtig, dass der Intergrand an einer einzigen Stelle, nämlich an der Stelle u = 0, von 0 abweichen kann. Damit haben wir auch nachgewiesen, dass Y eine stetige ZV ist. 78