Rechnen mit einfachem Mengenkalkül Bedingte Wahrscheinlichkeiten Allgemeine Frage: Wie groß ist die Wahrscheinlichkeit für ein Ereignis A, falls bereits ein Ereignis B eingetreten ist (und der Betrachter über diese Information verfügt)? Beispiel: Wie groß ist die Wahrscheinlichkeit für eine gerade Zahl beim Würfelwurf, falls bereits eine Zahl kleiner als 4 gewürfelt wurde? Ω A B B 6 2 4 1 2 3 5 „P(A | B)“ = A∩B 1 = 3 Grundlagen - Rechnen mit einfachem Mengenkalkül = A∩ B B = 1 3 A∩ B /Ω B /Ω P(A ∩ B ) P (B ) 366 Rechnen mit einfachem Mengenkalkül Bedingte Wahrscheinlichkeit Seien A und B Ereignisse mit P(B) > 0. Dann ist die bedingte Wahrscheinlichkeit von A unter B definiert als P( A | B ) = P( A ∩ B ) . P(B ) Was ist für P(B ) = 0 ? Analogie zu bedingten relativen Häufigkeiten Befragung unter den Studenten der Veranstaltung Statistik I (B) Nichtraucher Raucher Insg. Männer 74 15 89 Frauen 31 6 37 105 21 126 Insg. f12X |Y = f12 n12 / n 15 / 126 = = = 15 / 21 = 0.714 f •2 n•2 / n 21/ 126 Interpretation? Grundlagen - Rechnen mit einfachem Mengenkalkül 367 Rechnen mit einfachem Mengenkalkül Rechenregeln für bedingte Wahrscheinlichkeiten Rechenregeln für gewöhnliche Wahrscheinlichkeiten können auf bedingte Wahrscheinlichkeiten übertragen werden. Beispielsweise gilt für P(B) > 0: P( A1 ∪ A2 | B ) = P( A1 | B ) + P( A2 | B ) , falls A1 ∩ A2 = ∅ P(A1 | B ) = 1 − P( A1 | B ) . und Es lässt sich theoretisch zeigen, dass durch P( ⋅ | B ) mit P(B ) > 0 ein Wahrscheinlichkeitsmaß definiert wird. Dieses ordnet den Ereignissen einer passend zu wählenden Ereignisalgebra (vgl. Seite 350) Wahrscheinlichkeiten zu. Produktsatz Seien A und B Ereignisse mit P(B) > 0. Dann gilt: P( A ∩ B) = P( A | B) P(B) . Falls P( A) > 0, gilt ebenso P( A ∩ B) = P(B | A) P( A) . Grundlagen - Rechnen mit einfachem Mengenkalkül 368 Rechnen mit einfachem Mengenkalkül Multiplikationssatz Für gegebene Ereignisse A1, A2, ..., Ak mit P( A1 ∩K∩ A k −1 ) > 0 gilt: P( A1 ∩K∩ A k ) = P( A1 ) P( A 2 | A1 ) P( A3 | A1 ∩ A 2 ) ⋅K⋅ P( Ak | A1 ∩K∩ Ak −1 ) . Beweis: folgt sukzessive aus dem Produktsatz Beispiel: Die Entwicklungsabteilung eines Produzenten von Haushaltsgeräten ist in 90% der Fälle für die Markteinführung der von ihr entwickelten Geräte. Ein positives Votum der Entwicklungsabteilung führt mit einer Wahrscheinlichkeit von 0.7 bei der Marketingabteilung ebenfalls zu einem positiven Votum. Sind beide Abteilungen für die Markteinführung des neuen Gerätes, so entscheidet die Geschäftsleitung dennoch mit einer Wahrscheinlichkeit von 0.2 dagegen. Ist die Marketingabteilung gegen die Markteinführung, die Entwicklungsabteilung aber dafür, so stimmt die Geschäftsleitung nur mit einer Wahrscheinlichkeit von 0.4 zu. Grundlagen - Rechnen mit einfachem Mengenkalkül 369 Rechnen mit einfachem Mengenkalkül a) Berechnen Sie die Wahrscheinlichkeit dafür, dass die Markteinführung eines neuen Produktes sowohl von der Geschäftsleitung als auch von der Entwicklungs- und der Marketingabteilung getragen wird. b) Mit welcher Wahrscheinlichkeit entscheiden sich Geschäftsleitung und Entwicklungsabteilung für die Markteinführung eines neuen Produktes? Ereignisse hier: A 1 : Entwicklungsabteilung ist für die Markteinführung A 2 : Marketingabteilung ist für die Markteinführung A 3 : Geschäftsleitung ist für die Markteinführung Für welche Ereignisse sind Wahrscheinlichkeiten gegeben? Für welche Ereignisse sollen Wahrscheinlichkeiten berechnet werden? Gegeben: P ( A1 ) = 0 . 9 , P ( A2 | A1 ) = 0.7 , P(A3 | A1 ∩ A2 ) = 0.2, P(A3 | A1 ∩ A2 ) = 0.4. Gefragt: a) P ( A1 ∩ A2 ∩ A3 ) , b) P ( A1 ∩ A3 ) . Grundlagen - Rechnen mit einfachem Mengenkalkül 370 Rechnen mit einfachem Mengenkalkül 0.9 Entwicklungsabteilung Marketingabteilung Analogie zu relativen Häufigkeiten? 0.7 0.2 Geschäftsleitung A1 ∩ A2 ∩ A3 0.4 A1 ∩ A2 ∩ A3 A2 A1 A2 A1 A3 Grundlagen - Rechnen mit einfachem Mengenkalkül A3 371 Rechnen mit einfachem Mengenkalkül a) P ( A1 ∩ A2 ∩ A3 ) = P ( A1 ) P ( A2 | A1 ) P ( A3 | A1 ∩ A2 ) = P ( A1 ) P ( A2 | A1 ) (1 − P (A3 | A1 ∩ A2 )) = 0.9 ⋅ 0.7 ⋅ (1 − 0.2 ) = 0.504 b) P ( A1 ∩ A3 ) = P ( A1 ∩ A2 ∩ A3 ) + P (A1 ∩ A2 ∩ A3 ) = P ( A1 ∩ A2 ∩ A3 ) + P ( A1 ) P (A2| A1 ) P (A3| A1 ∩ A2 ) = P ( A1 ∩ A2 ∩ A3 ) + P ( A1 ) (1 − P (A2| A1 )) P (A3| A1 ∩ A2 ) = 0.504 + 0.9 ⋅ (1 − 0.7 ) ⋅ 0.4 = 0.612 Wie groß wären die betreffenden Wahrscheinlichkeiten, falls in jeder Abteilung per Münzwurf die Entscheidung für oder gegen das Produkt getroffen würde? Wie groß wäre dann die Wahrscheinlichkeit für A1 ∩ A2 ∩ A3 ? Grundlagen - Rechnen mit einfachem Mengenkalkül 372 Wann sind zwei Ereignisse „unabhängig“? 373 Rechnen mit einfachem Mengenkalkül Unabhängigkeit von Ereignissen Ansatz: P ( A | B ) = P ( A) „Wahrscheinlichkeit für A hängt nicht vom Eintreten des Ereignisses B ab.“ P( A ∩ B ) = P ( A) , P ( B ) > 0 P (B ) vorausgesetzt P( A ∩ B ) = P (B ) , P ( A) vorausgesetzt P ( A) > 0 P ( A ∩ B ) = P ( A ) P (B ) P ( B | A) = P ( B ) Beachte: Wegen P( A) = P( A ∩ B ) + P( A ∩ B ) und P(B ) = 1 − P(B ) gilt mit P( A | B ) = P( A) : P( A | B ) = P ( A ∩ B ) P ( A) − P ( A ∩ B ) P ( A) − P ( A) P ( B ) = = = P ( A) = P ( A | B ) . P(B ) 1 − P(B ) 1 − P(B ) Grundlagen - Rechnen mit einfachem Mengenkalkül 374 Rechnen mit einfachem Mengenkalkül Unabhängigkeit von zwei Ereignissen Zwei Ereignisse A und B heißen stochastisch unabhängig, wenn gilt: P ( A ∩ B ) = P ( A) P ( B ) P( A | B ) = P( A) mit P(B ) > 0 bzw. bzw. P(B | A) = P(B ) mit P( A) > 0. Für P(A) = 0 und/oder P(B) = 0 definieren wir A und B ebenfalls als stochastisch unabhängig. Beispiel: Zweimaliger Münzwurf Ω = { (W , W ), (Z , W ), (W , Z ), (Z , Z ) } Betrachte Ereignissse A und B mit: A = { „beim ersten Wurf Wappen“ } und B = { „beim zweiten Wurf Wappen“ }. Grundlagen - Rechnen mit einfachem Mengenkalkül 375 Rechnen mit einfachem Mengenkalkül Laplace-Experiment Demnach: P ( A) = P (B ) = A Ω B Ω = = P( A ∩ B ) = {(W ,W ), (W , Z )} 4 {(W ,W ), (Z ,W )} 4 A∩ B Ω = 2 = 0.5, 4 = 2 = 0.5, 4 {(W ,W )} 4 P ( A ∩ B ) = P ( A) P ( B ) ! = = 1 = 0.25. 4 A und B sind stochastisch unabhängig Ergebnis hier nicht überraschend! In anderen Fällen mag dies anders aussehen. Grundlagen - Rechnen mit einfachem Mengenkalkül 376 Rechnen mit einfachem Mengenkalkül Analogie zum Zusammenhang zwischen Merkmalen Nichtraucher Raucher Insg. Männer 74 15 89 Frauen 31 6 37 105 21 126 Insg. Wann besteht kein Zusammenhang (empirische Unabhängigkeit)? ! Von stochastischer Unabhängigkeit generell zu unterscheiden! Postulat der empirischen Unabhängigkeit (vgl. S. 214): fij = f• j für i = 1, ..., k und j = 1, ..., l fij = f• j fi• für i = 1, ..., k und j = 1, ..., l f i• Produkt der Randverteilungen ergibt gemeinsame Verteilung Grundlagen - Rechnen mit einfachem Mengenkalkül 377 Sind disjunkte Ereignisse unabhängig? 378 Rechnen mit einfachem Mengenkalkül Übung: Beispiel : Mehr als zwei Ereignisse In einer Urne befinden sich 8 Kugeln, die durchnummeriert sind von 1 bis 8 und sich ansonsten nicht unterscheiden. Eine Kugel wird zufällig gezogen. Betrachten Sie die folgenden Ereignisse: A: Es wird eine Zahl kleiner als 5 gezogen, B: Es wird eine gerade Zahl gezogen, C: Es wird eine 1, 6, 7 oder 8 gezogen. Zeigen Sie, dass die Ereignisse A und B und die Ereignisse B und C jeweils unabhängig sind. Sind auch die Ereignisse A und C unabhängig? Welche allgemeine Schlussfolgerung können Sie ziehen? Grundlagen - Rechnen mit einfachem Mengenkalkül 379 Rechnen mit einfachem Mengenkalkül Weiteres Beispiel : Mehrere Ereignisse Angenommen, es läge in Analogie zum Beispiel auf Seite 371 eine „stochastische Entscheidungsstruktur“ gemäß des folgenden Diagramms vor. 0.5 0.5 0.25 1/16 0.5 0.5 0.75 3/16 0.75 3/16 0.5 0.25 1/16 0.75 3/16 0.5 0.25 0.25 0.75 1/16 1/16 3/16 Man möge nachvollziehen, dass die Entscheidungen der einzelnen Entscheidungsstufen paarweise unabhängig sind und dennoch z.B. nicht gilt: P( A1 | A2 ∩ A3 ) = P( A1 ) bzw. P( A1 ∩ A2 ∩ A3 ) = P( A1 ) P( A2 ) P( A3 ) . Grundlagen - Rechnen mit einfachem Mengenkalkül 380 Rechnen mit einfachem Mengenkalkül Unabhängigkeit von mehreren Ereignissen Die Ereignisse A1, A2, ..., Ak heißen stochastisch unabhängig, wenn gilt: ( ) ( ) ( ) ( ) P A i1 ∩ A i2 ∩ K ∩ A il = P A i1 ⋅ P A i2 ⋅K⋅ P A il Interpretation? für alle möglichen 1 ≤ i1 < i2 < K < il ≤ k und alle l . ! Aus der paarweisen Unabhängigkeit folgt i. A. nicht die Unabhängigkeit der Ereignisse A1, A2, ..., Ak. Ebenso gilt keine „Transitivitätseigenschaft“. Beispiel : Urnenmodell Beim Ziehen mit Zurücklegen sind die Ergebnisse der einzelnen Ziehungen unabhängig. Beim Ziehen ohne Zurücklegen sind die Ergebnisse der einzelnen Ziehungen abhängig. Grundlagen - Rechnen mit einfachem Mengenkalkül 381 Rechnen mit einfachem Mengenkalkül Aufgabe 43 In einer Filiale eines Mannheimer Kreditinstituts besitzen 80% der Kunden ein Girokonto und 50% der Kunden ein Sparkonto. Alle Kunden der Filiale verfügen über mindestens eine der beiden Anlageformen. Dann ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Kunde dieser Bank R F sowohl ein Giro- als auch ein Sparkonto besitzt gleich 0.3, ein Sparkonto besitzt, wenn bereits bekannt ist, dass der Kunde ein Girokonto hat, gleich 1, ein Girokonto besitzt, wenn bereits bekannt ist, dass der Kunde ein Sparkonto hat, gleich 0.4, höchstens eines von beiden Konten besitzt gleich 0.7. Grundlagen - Rechnen mit einfachem Mengenkalkül 382 Rechnen mit einfachem Mengenkalkül Aufgabe 44 Bei der Montage eines Autos wird auf drei Fertigungsstraßen parallel und unabhängig voneinander gearbeitet. Statistische Untersuchungen ergaben für die drei Fertigungsstraßen folgende Ausfallwahrscheinlichkeiten je Schicht: Straße 1: 0.09, Straße 2: 0.16, Straße 3: 0.19. Die Wahrscheinlichkeit, dass während einer Schicht R F alle Fertigungsstraßen ausfallen ist gleich 0.44, keine der drei Fertigungsstraßen ausfällt ist größer als 0.6, auf wenigstens einer der drei Fertigungsstraßen ohne Störung produziert wird ist größer als 0.99. Grundlagen - Rechnen mit einfachem Mengenkalkül 383 Rechnen mit einfachem Mengenkalkül Aufgabe 45 Gegeben seien drei Ereignisse A, B und C mit jeweils positiver Eintrittswahrscheinlichkeit, d.h. P(A) > 0, P(B) > 0 und P(C) > 0. Dann gilt stets: R F P ( A | B ) ≤ P ( A) , P( A) = P( A | C ) , falls P( A) = P( A | B ) und P(B ) = P(B | C ) , P( A ∩ B ) = P( A) P(B ) , falls A ∩ B = ∅ , P( A ∪ B | C ) = P( A | C ) + P(B | C ) , falls A ∩ B = ∅, P( A | C ) = 1, falls C ⊂ A . Grundlagen - Rechnen mit einfachem Mengenkalkül 384 Rechnen mit einfachem Mengenkalkül Satz von der totalen Wahrscheinlichkeit und Satz von Bayes Beispiel: Satz von der totalen Wahrscheinlichkeit A1 A2 A3 A4 („Disjunkte Zerlegung“ von Ω) B Ω 4 Besonderheit hier: UA i = Ω , wobei A i ∩ A j = ∅ für i ≠ j . i =1 B = ( B ∩ A 1 ) ∪ (B ∩ A 2 ) ∪ (B ∩ A 3 ) ∪ ( B ∩ A 4 ) P ( B ) = P ( B ∩ A1 ) + P ( B ∩ A 2 ) + P ( B ∩ A 3 ) + P ( B ∩ A 4 ) Warum geht das? P(B ) = P(B | A1 ) P( A1 ) + P(B | A 2 ) P( A2 ) + P(B | A 3 ) P( A3 ) + P(B | A 4 ) P( A4 ) Grundlagen - Rechnen mit einfachem Mengenkalkül 385 Rechnen mit einfachem Mengenkalkül Satz von der totalen Wahrscheinlichkeit Bilden die Ereignisse A1, A2, ..., Ak eine disjunkte Zerlegung von Ω, so gilt: k P (B ) = ∑ P (B | A i ) P ( A i ) . Bedeutung? i =1 Beispiel: Analogie zu relativen bedingten Häufigkeiten Nichtraucher Raucher Insg. Männer 74 15 89 Frauen 31 6 37 105 21 126 Insg. Wie müssten Fragestellungen im Rahmen von Wahrscheinlichkeiten formuliert werden? „Anteil der Nichtraucher“ = „Anteil der Nichtraucher unter Männern“ × „Anteil der Männer“ + „Anteil der Nichtraucher unter Frauen“ × „Anteil der Frauen“ In Zahlen: f •1 = f11Y | X f1• + f 21Y | X f 2• = f11 f f1• + 21 f 2• = f11 + f 21 = f •1 . f1• f 2• Grundlagen - Rechnen mit einfachem Mengenkalkül 386 Rechnen mit einfachem Mengenkalkül Wegen P (A j | B ) = P (A j | B ) = P (A j ∩ B ) P (B ) gilt nun: P (B | A j ) P (A j ) k ∑ P(B | A )P( A ) i i =1 . i Satz von Bayes Bilden die Ereignisse A1, A2, ..., Ak eine disjunkte Zerlegung von Ω, wobei für mindestens ein i = 1, ..., k, P( Ai ) > 0 und P(B | Ai ) > 0 erfüllt ist. Dann gilt: P (A j | B ) = P (B | A j ) P (A j ) k ∑ P(B | A )P( A ) i =1 i , j = 1, ..., k. Bedeutung? i Grundlagen - Rechnen mit einfachem Mengenkalkül 387 Rechnen mit einfachem Mengenkalkül 1. Beispiel: Medizinische Diagnostik (aus Fahrmeir, S. 212) Zur Erkennung von Krankheiten stehen in der Diagnostik medizinische Tests zur Verfügung, die so angelegt sein sollen, dass sie eine Erkrankung erkennen, wenn sie tatsächlich vorliegt, und nicht reagieren, wenn der entsprechende Patient nicht erkrankt ist. Nehmen wir nun an, es geht um die Erkennung einer sehr seltenen Krankheit. Mit der Bezeichnung A = { Patient ist krank }, B = { Testergebnis ist positiv } lassen sich aus der Erprobungsphase des Tests folgende Wahrscheinlichkeiten als bekannt annehmen: P ( A) = 0.001, P(B | A) = 0.98, P (B | A ) = 0.03. („Sensitivität“) („Spezifität“) Interpretation? Grundlagen - Rechnen mit einfachem Mengenkalkül 388 Rechnen mit einfachem Mengenkalkül Frage: Mit welcher Wahrscheinlichkeit ist ein Patient tatsächlich erkrankt, falls das Testergebnis positiv ausfällt? Formel von Bayes P( A | B ) = P (B | A)P ( A) P (B | A)P ( A) + P (B | A ) P (A ) = 0.98 ⋅ 0.001 = 0.032 0.98 ⋅ 0.001 + 0.03 ⋅ 0.999 Bedeutung? 2. Beispiel: Geldanlage (aus Fahrmeir, S. 214) In diesem Beispiel interessieren die Wahrscheinlichkeiten für bestimmte Tendenzen in der Kursentwicklung, aufgrund dessen man über die Anlage seines Kapitals entscheidet. Es seien drei Ereignisse möglich: A1={Der Zins fällt um 0.5%}, A2={Der Zins bleibt unverändert} und A3={Der Zins steigt um 0.5%}. Grundlagen - Rechnen mit einfachem Mengenkalkül 389 Rechnen mit einfachem Mengenkalkül Nach eigenen subjektiven (!) Einschätzungen nehmen wir folgende Wahrscheinlichkeiten für das Eintreten obiger Ereignisse an: P ( A1 ) = 0.1, P( A 2 ) = 0.6 und P ( A 3 ) = 0.3 . Als Ereignis B ziehen wir die Prognose eines Anlageberaters {Der Zins steigt um 0.5%} hinzu. Aufgrund von Erfahrungswerten (!) sei zudem bekannt: P (B | A1 ) = 0.15, P(B | A 2 ) = 0.30 und P(B | A 3 ) = 0.75 . Interpretation? Da sich ein potentieller Anleger insbesondere für die Wahrscheinlichkeit einer steigenden Zinsentwicklung interessiert, ist die verbesserte Wahrscheinlichkeit für das Eintreten von A3, also für einen Zinsanstieg, nach der Beratung durch einen Anlageberater eine wichtige Information. Mit welcher Wahrscheinlichkeit tritt also nach positiver Einschätzung des Beraters tatsächlich ein Zinsanstieg ein? Grundlagen - Rechnen mit einfachem Mengenkalkül 390 Rechnen mit einfachem Mengenkalkül Formel von Bayes P( A3 | B ) = P(B | A3 ) P( A3 ) 3 ∑ P (B | A ) P ( A ) i =1 i Bedeutung? = 0.75 ⋅ 0.3 = 0.5357 0.15 ⋅ 0.1 + 0.30 ⋅ 0.6 + 0.75 ⋅ 0.3 i Problematik vorhanden? Bemerkung: Im Zusammenhang mit dem Satz von Bayes werden die Wahrscheinlichkeiten P ( A i ) auch als a-priori Wahrscheinlichkeiten und P( A i | B ) als a-posteriori Wahrscheinlichkeiten bezeichnet. Diese a-priori Wahrscheinlichkeiten sind mit den objektiven a-priori Wahrscheinlichkeiten (vgl. S. 333) nicht gleichzusetzen. Diese Wahrscheinlichkeiten basieren auf Vorinformation der Vergangenheit oder auf subjektiven Einschätzungen. Sie werden dazu verwendet, Wahrscheinlichkeiten nach Eintreten eines bestimmten Ereignisses neu („besser“) zu bewerten. Eine konsequente Fortführung dieses Ansatzes findet sich in der sogenannten „Bayes-Statistik“, die heute einen eigenen Zweig der Statistik bildet. Grundlagen - Rechnen mit einfachem Mengenkalkül 391 Rechnen mit einfachem Mengenkalkül Aufgabe 46 Die Bevölkerung eines Landes sezte sich im Wesentlichen aus vier verschiedenen Bevölkerungsgruppen zusammen. Die überwiegende Mehrheit von 70% gehöre Gruppe A an, 12% Gruppe B, 15% Gruppe C und 3% Gruppe D. In einem Referendum soll über den Beitritt des Landes zu einer größeren Staatengemeinschaft („Ja“ oder „Nein“) entschieden werden. Es sei durch Umfragen bekannt, dass 80% von Gruppe A gegen den Beitritt sind. In Gruppe B befürworten dagegen 60% den Beitritt, in Gruppe C 70% und in Gruppe D gar 90%. Die Wahrscheinlichkeit, dass R F ein zufällig ausgewählter Einwohner für den Beitritt stimmt, ist größer als 0.3, ein zufällig ausgewählter Beitrittsbefürworter aus Gruppe A stammt, ist kleiner als 0.5. Grundlagen - Rechnen mit einfachem Mengenkalkül 392 Rechnen mit einfachem Mengenkalkül Aufgabe 47 Um zu prüfen, ob eine Person eine bestimmte Krankheit K hat (K+) oder nicht (K-), wird ein Test T durchgeführt, der positiv (T+) oder negativ (T-) ausfallen kann (T+ deutet auf eine Erkrankung hin), Die Terminologie lautet danach Prävalenz = P(K+), Spezifität = P(T-| K-), Sensitivität = P(T+| K+). In Deutschland ist die Prävalenz von HIV in heterosexuellen Männern, die keiner bekannten Risikogruppe angehören, etwa 0.01%. Die Häufigkeit falsch-positiver HIV-Tests, P(T+| K-) beträgt etwa 0.01%. Die Sensitivität des HIV-Tests beträgt etwa 99.9%. R F Die Wahrscheinlichkeit, HIV-infiziert zu sein, wenn der HIV-Test positiv ausfällt, ist größer als 0.6. Grundlagen - Rechnen mit einfachem Mengenkalkül 393 Eindimensionale Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Mehr über Zufallsvariablen und Verteilungen Eindimensionale Zufallsvariablen 394 Diskrete Zufallsvariablen Zufallsvariable und Wahrscheinlichkeitsverteilung Ziel: Ergebnisse eines Zufallsvorgangs sollen (nur) durch Zahlen ausgedrückt werden 1. Beispiel: Viermaliger Münzwurf Ω = {(W , W , W , W ), (Z , W , W , W ), (W , Z , W , W ), (W , W , Z , W ), (W ,W ,W , Z ), (Z , Z ,W ,W ), (Z ,W , Z ,W ), (Z ,W ,W , Z ), (W , Z , Z ,W ), (W , Z ,W , Z ), (W ,W , Z , Z ), (W , Z , Z , Z ), (Z ,W , Z , Z ), (Z , Z ,W , Z ), (Z , Z , Z ,W ), (Z , Z , Z , Z )} Angenommen, wir interessieren uns nur für die Anzahl von „Wappen“ nach viermaligem Münzwurf. Dann betrachten wir eine Variable X = „Anzahl von Wappen“, die nur die Werte 0, 1, 2, 3 oder 4 annehmen kann. D.h. formal ist X eine Abbildung X : Ω → Ω∗ = { 0, 1, 2, 3, 4 } ϖ a X (ϖ ) = x. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 395 Diskrete Zufallsvariablen Hier gilt z.B. für ϖ 1 = (W , W , W , W ) und ϖ 5 = (W , W , W , Z ) X (ϖ 1 ) = 4 bzw. X (ϖ 5 ) = 3. Mit anderen Worten, betrachten wir nun einen neuen Ereignisraum Ω* mit Ω∗ = { 0, 1, 2, 3, 4 }. Zur Berechnung der Wahrscheinlichkeit von Ereignissen auf dem Ereignisraum Ω* können wir unter Kenntnis der Definition von X auf den ursprünglichen Ereignisraum Ω rückprojizieren. Beispielsweise besteht das Ereignis A* =„Es tritt höchstens einmal Wappen auf“ also A∗ ⊂ Ω∗ mit A∗ = { 0, 1 } aus dem ursprünglichen Ereignis A ⊂ Ω mit A = { (Z , Z , Z , Z ), (W , Z , Z , Z ), (Z , W , Z , Z ), (Z , Z ,W , Z ), (Z , Z , Z , W ) }. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 396 Diskrete Zufallsvariablen Damit ist die Wahrscheinlichkeit für das Ereignis A* gegeben durch ( ) ({ P A∗ = P ( X ≤ 1) = P ϖ | X (ϖ ) ∈ A∗ Ω ω14 ω2 ω13 ω12 ω15 ω3 ω4 12 ,ϖ 13 ,ϖ 14 ,ϖ 15 ,ϖ 16 }) = 5 . 16 X(ω12) A ω1 } ) = P({ϖ ω5 ω6 ω11 ω16 X(ω16) ω10 ω7 ω9 -2 -1 0 1 0 1 2 3 4 5 ω8 A* Da die Werte von X die Ergebnisse eines Zufallsvorgangs sind, bezeichnen wir X auch als „Zufallsvariable“. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 397 Diskrete Zufallsvariablen 2. Beispiel: Zweimaliger Würfelwurf Ω = {ϖ ij | ϖ ij = (i, j ), 1 ≤ i, j ≤ 6 } Betrachte Zufallsvarialbe X = Augensumme. Dann gilt z.B. X(ω11) = 2, X(ω23) = 5 und X(ω55) = 10. Analog zu den Überlegungen im 1. Beispiel gilt z.B. : P(„Augensumme = 5“) = P(X = 5) = P({ω14, ω41, ω23, ω32 }) = 4/36 = 1/9. 3. Beispiel: Mietspiegelerhebung Ω = { mietspiegelrelevante Wohnungen } Betrachte z.B. X = Nettomiete, d.h. X : Ω → Ω∗ = IR + = { x : x ≥ 0 }. ∗ Interessierendes Ereignis z.B. A = { X ≤ 1000 }. Beachte: Hier Kenntnis von Ω und der Definition von X wenig hilfreich zur Berechnung der Wahrscheinlichkeit von A*. Als interessierender Ereignisraum wird deshalb gleich ganz IR betrachtet und die „Wahrscheinlichkeitsverteilung“ von X auf IR . Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 398 Diskrete Zufallsvariablen Zufallsvariable Eine Variable oder ein Merkmal X, dessen Werte oder Ausprägungen die Ergebnisse eines Zufallsvorgangs sind, heißt Zufallsvariable. Die Zahl x ∈ IR , die X bei einer Durchführung des Zufallsvorgangs annimmt, heißt Realisierung oder Wert von X. Bemerkung Wir betrachten im Folgenden also nur noch den Ereignisraum mit reellen Zahlen. Die interessierenden Ereignisse sind dann Teilmengen davon und z.B. von der Art bzw. allgemein { X = a} , { X ≤ a} ,{ X > a} , { a ≤ X ≤ b} { X ∈I } , wobei I ein abgeschlossenes, offenes oder halboffenes Intervall ist. Weitere durch X definierte zulässige Bereiche B ergeben sich daraus durch Komplementbildung und abzählbare Durchschnitts- und Vereinigungsbildung. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 399 Diskrete Zufallsvariablen ! Die grundlegenden Rechengesetze des Mengenkalküls bleiben erhalten! Beispiele: Sei X Zufallsvariable mit P ( X = 1) = 0.5, P( X = 2 ) = 0.3, und P( X = 3) = 0.2. P (1 ≤ X ≤ 2 ) = 0.5 + 0.3 = 0.8 Sei Y Zufallsvariable mit P (Y ∈ (− ∞, 0]) = 0.5, P(Y ∈ (0, 10]) = 0.3, und P(Y ∈ [8, ∞ )) = 0.25. P (Y > 0 ) = 1 − 0.5 = 0.5 P(Y ∈ [8, 10]) = P (Y ∈ (0, 10]) + P (Y ≥ 8) − P (Y > 0 ) = 0.3 + 0.25 − 0.5 = 0.05 Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 400 Diskrete Zufallsvariablen Wahrscheinlichkeitsverteilung Die Menge aller Wahrscheinlichkeiten P( X ∈ I ) oder P( X ∈ B ) für Intervalle I oder zulässige Bereiche B nennt man auch Wahrscheinlichkeitsverteilung (von X). Was folgt ... Unterscheide generell Wahrscheinlichkeitsverteilung von diskreten Zufallsvariablen Wahrscheinlichkeit ... „über addieren“ stetigen Zufallsvariablen „über integrieren“ (Flächen!) zunächst: Rechnen mit diskreten Zufallsvariablen Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 401 Diskrete Zufallsvariablen Verteilungen und Parameter von diskreten Zufallsvariablen Definition und Verteilung Diskrete Zufallsvariable und Wahrscheinlichkeitsfunktion Eine Zufallsvariable X heißt diskret, falls sie nur endlich oder abzählbar unendlich viele Werte a1 , a2 , K , ak , K annehmen kann. Die Wahrscheinlichkeitsverteilung von X ist durch die Wahrscheinlichkeiten P (X = a j ) = p j , j = 1, K, k , Träger gegeben. Die Funktion P (X = a j ) , x = a j ∈ {a1 , a2 ,K , ak ,K} f (x ) = 0, sonst Analogie in der deskriptiven Statistik? heißt dabei Wahrscheinlichkeitsfunktion von X. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 402 Diskrete Zufallsvariablen Verteilungsfunktion einer diskreten Zufallsvariable Gegeben sei eine diskrete Zufallsvariable mit Wahrscheinlichkeitsfunktion f ( x ) . Dann ist durch F (x ) = P( X ≤ x ) = ∑ f (a ) j:a j ≤ x die Verteilungsfunktion von X gegeben. j Analogie in der deskriptiven Statistik? Welche grundlegenden Eigenschaften besitzt die Verteilungsfunktion einer diskreten Zufallsvariable? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 403 Diskrete Zufallsvariablen Übung: Gegeben sei eine diskrete Zufallsvariable mit P ( X = 1) = 0.5, P( X = 2 ) = 0.3, und P( X = 3) = 0.2. Zeichnen Sie die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion von X. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 404 Diskrete Zufallsvariablen => Übungen Eine faire Münze wird viermal geworfen, und man interessiert sich dafür, wie oft im Ergebnis „Zahl“ erscheint. Die Zufallsvariable X gebe die Anzahl von „Zahl“ an. a) Berechnen und zeichnen Sie die Verteilungsfunktion von X. b) Berechnen Sie folgende Wahrscheinlichkeiten: P (0 < X ≤ 2 ), P ( X > 1) und P( X < 3) . Hinweis: Nutzen Sie die Ereignismenge Ω auf Seite 395. Teil a): Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 405 Diskrete Zufallsvariablen Teil b): Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 406