Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 1 Bedingte Wahrscheinlichkeiten Wahrscheinlichkeiten Bedingte A) A) Definition, Multiplikationssatz Multiplikationssatz Definition, B) B) Hilfsmittel für für systematische systematische Lösungen: Lösungen: Hilfsmittel Venn-Diagramm, Kontingenztafel, Kontingenztafel, Entscheidungsbaum Entscheidungsbaum Venn-Diagramm, C) C) Unabhängigkeit Unabhängigkeit D) D) Satz von von der der totalen totalen Wahrscheinlichkeit Wahrscheinlichkeit Satz E) Satz von Bayes Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 2 Aufgabe: Tupamaros 1 / 2 Im „Tupamaros“ bekommt neuerdings jeder Gast eine Chipkarte. Darauf wird jede Bestellung und jede Nutzung eines der Spielautomaten vermerkt. Beim Gehen wird an der Zentralkasse bezahlt. Das neue System erlaubt es erstmals, die Zielgruppen des Restaurants näher unter die Lupe zu nehmen. Der Kassenchef bringt jetzt jedes Mal die neuesten Zahlen, die er aus dem Abrechnungsprogramm gezogen hat, in die Sitzung der Geschäftsleitung ein. Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 3 Aufgabe: Tupamaros 2 / 2 An einem durchschnittlichen Öffnungstag kommen 928 Gäste ins Tupamaros, die Beträge auf der Chipkarte aufweisen (das Lokal ist immer voll). Von diesen Gästen haben 537 gegessen, 698 getrunken, 525 gegessen und getrunken. Von den Gästen, die gegessen und getrunken haben, waren 320 am Spielautomaten, von denen die ausschließlich gegessen haben 3. Die Geschäftsleitung hat heute folgende Fragen: a) Welcher Anteil der Gäste, die essen (bzw. nicht essen), nutzt die Spielautomaten? b) Welcher Anteil der Gäste, die jeweils den Spielautomaten nutzen, isst nichts und trinkt nichts? Helfen Sie dem Kassenchef, die Fragen zu beantworten, die er beantworten kann. c) Der Kassenchef findet noch heraus, dass durchschnittlich 663 Gäste den Spielautomaten nutzen. Wie verändert sich durch diese Information die Antwort auf a) und b)? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 4 Aufgabe: Tupamaros Lösungsansatz An einem durchschnittlichen Öffnungstag kommen 928 Gäste ins Tupamaros, die Beträge auf der Chipkarte aufweisen (das Lokal ist immer voll). Von diesen Gästen haben 537 gegessen, 698 getrunken, 525 gegessen und getrunken. ( ) ( ) P T = 0,752 P E = 537 = 0,579 928 ( ) P E ∩T = 0,566 Von den Gästen, die gegessen und getrunken haben, waren 320 am Spielautomaten, von denen die ausschließlich gegessen haben 3. P (E ∩T ∩ S ) = 0,345 ( ) P E ∩T ∩ S = 0,003 E - "Essen" T - "Trinken" S - "Spielautomat" a) Welcher Anteil der Gäste, die essen (bzw. nicht essen), nutzt die Spielautomaten in der Woche (bzw. am Wochenende)? b) Welcher Anteil der Gäste, die jeweils den Spielautomaten nutzen, isst nichts und trinkt nichts? c) Der Kassenchef findet noch heraus, dass durchschnittlich 663 Gäste den Spielautomaten nutzen. Wie verändert sich durch diese Information die Antwort auf a) und b)? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 7 Bedingte Wahrscheinlichkeiten I Definition: P ( A B ) := P ( A ∩ B) P ( B) heißt die bedingte Wahrscheinlichkeit von A unter der Bedingung B und gibt die Wahrscheinlichkeit wieder, dass A eintritt, wenn B schon eingetroffen ist. Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 8 Beispielaufgabe 1 zu bedingten Wahrscheinlichkeiten Ein Spieler würfelt verdeckt (Würfelbecher) mit einem fairen Würfel. Er schaut sich das Ergebnis an. Um die Spannung zu erhöhen, sagt er zunächst nur: "Es ist eine gerade Zahl“. Wie groß ist danach die Wahrscheinlichkeit, dass er eine 6 gewürfelt hat? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 9 Beispielaufgabe 1 zu bedingten Wahrscheinlichkeiten Derselbe Spieler würfelt nun verdeckt (Würfelbecher) mit einem schiefen Würfel mit der folgenden Belegung: PSchief ({1}) = 1 12 1 PSchief ({i}) = für i = 2, 3, 4, 5 6 1 PSchief ({6}) = 4 Er schaut sich das Ergebnis an und sagt wieder zunächst nur: "Es ist eine gerade Zahl.“ Wie groß ist nun die Wahrscheinlichkeit, dass er eine 6 gewürfelt hat? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 10 Beispielaufgabe 2 zu bedingten Wahrscheinlichkeiten Ein Spieler würfelt mit zwei fairen Würfeln. Er hat mit dem 1. Würfel eine 2 geworfen. Wie groß ist danach die Wahrscheinlichkeit, dass er einen Pasch gewürfelt hat? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 11 Bedingte Wahrscheinlichkeiten II: Der Multiplikationssatz Mit Hilfe der Definitionsformel für die bedingte Wahrscheinlichkeit läßt sich auch umgekehrt die Wahrscheinlichkeit für das gemeinsame Auftreten von Ereignissen berechnen. Es gilt der Multiplikationssatz: P ( A ∩ B ) = P ( A) ⋅ P ( B A ) = P ( B ) ⋅ P ( A B ) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 12 Beispielaufgabe zum Multiplikationssatz Ein Kartenspieler zieht aus einem Skatblatt zwei Karten (ohne die Karten zurückzulegen). Wie groß ist die Wahrscheinlichkeit, dass er zwei Asse zieht? (Überlegen Sie zunächst: was ist ( Ω, A ) ?) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 13 Beispielaufgabe zum Multiplikationssatz Ein Spieler würfelt zweimal mit einem fairen Würfel. Wie groß ist die Wahrscheinlichkeit, insgesamt eine gerade Augensumme zu würfeln und im ersten Wurf eine 6 zu würfeln? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 14 Aufgabe zum Multiplikationssatz: Ziehen mit und ohne Zurücklegen Es wird dreimal hintereinander eine Karte aus einem Skat-Kartenspiel gezogen. Wie groß ist die Wahrscheinlichkeit dafür, dass zuerst ein As, dann ein König und dann eine Dame gezogen wird, wenn die jeweils gezogene Karte nicht zurückgelegt wird („Ziehen ohne Zurücklegen“)? Wie groß ist die Wahrscheinlichkeit dafür, dass zuerst ein As, dann ein König und dann eine Dame gezogen wird, wenn nach jedem Ziehen die gezogene Karte zurückgelegt wird und erneut gemischt wird („Ziehen mit Zurücklegen“)? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 15 Beispiel - Rauchen und Lungenkrebs Die Wahrscheinlichkeit, dass ein erwachsener Hamburger raucht, sei 0,45. Die Wahrscheinlichkeit, dass ein erwachsener Hamburger im Laufe seines Lebens Lungenkrebs entwickelt, sei 0,05. Die Wahrscheinlichkeit, dass ein erwachsener Hamburger raucht und Lungenkrebs entwickelt, sei 0,045. Typische Fragen: Wie groß ist die Wahrscheinlichkeit dafür, dass ein Raucher an Lungenkrebs erkrankt? Wie groß ist die Wahrscheinlichkeit dafür, dass ein Nichtraucher an Lungenkrebs erkrankt? Wie groß ist die Wahrscheinlichkeit dafür, dass ein Mensch, der an Lungenkrebs erkrankt ist, Raucher ist? Wie groß ist der Anteil der Raucher mit Lungenkrebs in der Bevölkerung? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 16 Beispiel - Rauchen und Lungenkrebs 1 / 4 Die Wahrscheinlichkeit, dass ein erwachsener Hamburger raucht, sei 0,45. Die Wahrscheinlichkeit, dass ein erwachsener Hamburger im Laufe seines Lebens Lungenkrebs entwickelt, sei 0,05. Die Wahrscheinlichkeit, dass ein erwachsener Hamburger raucht und Lungenkrebs entwickelt, sei 0,045. Wie sieht eine graphische Darstellung der Elementarereignisse aus? Wie sieht eine tabellarische Darstellung der Elementarereignisse aus? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Beispiel - Rauchen und Krebs 1 / 4 Darstellung der Elementarereignisse mit Venn-Diagramm und Tabelle R R∩L Folie I - 9 - 17 L R∩L Raucher Nichtraucher Lungenkrebs R∩ L R∩ L L kein Lungenkrebs R∩ L R∩ L L Ω R R Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Beispiel - Rauchen und Krebs 1 / 4 Folie I - 9 - 18 Darstellung der Elementarereignisse (fortgesetzt) Venn-Diagramm und Tabelle L (=0,05) R (=0,45) ? 0,045 ? ? Raucher Nichtraucher Lungenkrebs 0,045 ? 0,050 kein Lungenkrebs ? ? ? 0,45 ? 1 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Beispiel - Rauchen und Krebs 1 / 4 Folie I - 9 - 19 Darstellung der Elementarereignisse (fortgesetzt) Venn-Diagramm und Tabelle L (=0,05) R (=0,45) 0,405 0,045 0,005 0,545 Raucher Nichtraucher Lungenkrebs 0,045 0,005 0,050 kein Lungenkrebs 0,405 0,545 0,950 0,45 0,55 1 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 20 Beispiel - Rauchen und Krebs 2 / 4 Prospektive Betrachtung I / IV Raucher Nichtraucher Lungenkrebs 0,045 0,005 0,050 kein Lungenkrebs 0,405 0,545 0,950 L (=0,05) R (=0,45) 0,405 0,45 0,55 1 0,045 0,005 0,545 Wie groß ist die Wahrscheinlichkeit dafür, dass ein Raucher an Lungenkrebs erkrankt? P ( L R) = P ( L ∩ R) P ( R) 0, 045 = = 0,1 0, 45 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 21 Beispiel - Rauchen und Krebs 2 / 4 Prospektive Betrachtung II / IV Raucher Nichtraucher Lungenkrebs 0,045 0,005 0,050 kein Lungenkrebs 0,405 0,545 0,950 L (=0,05) R (=0,45) 0,405 0,45 0,55 1 0,005 0,045 0,545 Wie groß ist die Wahrscheinlichkeit dafür, dass ein Raucher nicht an Lungenkrebs erkrankt? P ( L R) = P ( L ∩ R) P ( R) = 0, 405 = 0, 9 0, 45 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 22 Beispiel - Rauchen und Krebs 2 / 4 Prospektive Betrachtung III / IV Raucher Nichtraucher Lungenkrebs 0,045 0,005 0,050 kein Lungenkrebs 0,405 0,545 0,950 L (=0,05) R (=0,45) 0,405 0,45 0,55 1 0,045 0,005 0,545 Wie groß ist die Wahrscheinlichkeit dafür, dass ein Nichtraucher an Lungenkrebs erkrankt? ( P LR ) = P ( L ∩ R) P ( R) 0, 005 = = 0, 00909 ≈ 0, 01 0, 55 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 23 Beispiel - Rauchen und Krebs 2 / 4 Prospektive Betrachtung IV / IV Lungenkrebs 0,045 0,005 0,050 Raucher Nichtraucher kein Lungenkrebs 0,405 0,545 0,950 L (=0,05) R (=0,45) 0,405 0,45 0,55 1 0,045 0,005 0,545 Wie groß ist die Wahrscheinlichkeit dafür, dass ein Nichtraucher nicht an Lungenkrebs erkrankt? ( P LR ) = P ( L ∩ R) P ( R) 0, 545 = = 0, 9909 ≈ 0, 99 0, 55 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 24 Beispiel - Rauchen und Krebs 3 / 4 Retrospektive Betrachtung I / II Raucher Nichtraucher Lungenkrebs 0,045 0,005 0,050 kein Lungenkrebs 0,405 0,545 0,950 L (=0,05) R (=0,45) 0,405 0,45 0,55 1 0,045 0,005 0,545 Wie groß ist die Wahrscheinlichkeit dafür, dass ein Mensch, der an Lungenkrebs erkrankt ist, Raucher ist? P ( R L) = 0, 045 = 0, 9 0, 05 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 25 Beispiel - Rauchen und Krebs 3 / 4 Retrospektive Betrachtung II / II Raucher Nichtraucher Lungenkrebs 0,045 0,005 0,050 kein Lungenkrebs 0,405 0,545 0,950 L (=0,05) R (=0,45) 0,405 0,45 0,55 1 0,045 0,005 0,545 Wie groß ist die Wahrscheinlichkeit dafür, dass ein Mensch, der nicht an Lungenkrebs erkrankt ist, Raucher ist? P ( R L) = 0, 405 = 0, 426 0, 95 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 26 Beispiel - Rauchen und Krebs 4 / 4 Anwendung des Multiplikationssatzes I / III Gegeben: Anteil der Raucher: P(R) = 45% Wahrscheinlichkeit eines Rauchers, Lungenkrebs zu bekommen: P(L|R) = 10% Wie groß ist der Anteil der Raucher mit Lungenkrebs in der Bevölkerung? P ( L ∩ R ) = P ( R ) ⋅ P ( L | R ) = 0, 45 ⋅ 0,1 = 0, 045 P(L|R) = 0,1 P(R) = 0,45 L R L Ω L R L P ( L ∩ R ) = 0, 45 ⋅ 0,1 = 0, 045 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Beispiel - Rauchen und Krebs 4 / 4 Folie I - 9 - 27 Anwendung des Multiplikationssatzes mit Ereignisbaum und Tabelle II / III Raucher Nichtraucher Lungenkrebs R∩ L R∩ L L P ( R) R Ω P ( R) R kein Lungenkrebs R∩ L R∩ L L P ( L | R) L P ( L ∩ R) P ( L | R) L P ( L | R) P ( L ∩ R) L P ( L ∩ R) P ( L | R) L P ( L ∩ R) Ω R R Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Beispiel - Rauchen und Krebs 4 / 4 Folie I - 9 - 28 Anwendung des Multiplikationssatzes Ereignisbaum und Tabelle III / III Raucher Nichtraucher 0,45 Lungenkrebs 0,045 0,005 0,050 0,45 0,55 1 0,1 L P ( L ∩ R ) = 0,045 0,9 L P ( L ∩ R ) = 0,405 0,009 L P ( L ∩ R ) = 0,005 0,991 L P ( L ∩ R ) = 0,545 R Ω 0,55 kein Lungenkrebs 0,405 0,545 0,950 R Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 29 Aufgabe zu den Darstellungsformen für elementare Wahrscheinlichkeiten Wie lassen sich die Darstellungsformen Venn-Diagramm, Kontingenztafel und Entscheidungsbaum auf drei oder mehr Merkmale verallgemeinern? Wie lassen sich die Darstellungsformen Venn-Diagramm, Kontingenztafel und Entscheidungsbaum auf Merkmale mit mehr als zwei Ausprägungen verallgemeinern? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 30 Bedingte Wahrscheinlichkeiten III Stochastische Unabhängigkeit Definition: Zwei Ereignisse, A und B heißen voneinander (stochastisch) unabhängig, wenn gilt: P ( A B ) = P ( A) oder P ( B A ) = P ( B ) oder P ( A ∩ B ) = P ( A ) ⋅ P ( B ) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 31 Beispielaufgabe 1 zu bedingten Wahrscheinlichkeiten Ein Spieler würfelt verdeckt (Würfelbecher) mit einem fairen Würfel. Er schaut sich das Ergebnis an. Um die Spannung zu erhöhen, sagt er zunächst nur: "Es ist eine gerade Zahl“. Sind die Ereignisse „6 “ und „Gerade Zahl“ stochastisch unabhängig? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 32 Beispielaufgabe 2 zu bedingten Wahrscheinlichkeiten Ein Spieler würfelt mit zwei Würfeln. Er hat mit dem 1. Würfel eine „2“ geworfen. Sind die Ereignisse „Pasch“ und mit „2 im ersten Wurf“ stochastisch unabhängig? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Bedingte Wahrscheinlichkeiten IV Folie I - 9 - 33 Mögliche Wahrscheinlichkeitsbeziehungen zwischen zwei Ereignissen 1 / 2 A=B B A=B P ( A) = P ( B ) „A gleich B“ A⊂ B B B⊂ A A A P ( A) ⊂ P ( B ) „Aus B folgt A“ B P ( A) ⊃ P ( B ) „Aus A folgt B“ Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Bedingte Wahrscheinlichkeiten IV Folie I - 9 - 34 Mögliche Wahrscheinlichkeitsbeziehungen zwischen zwei Ereignissen 2 / 2 P ( A ∩ B ) > P ( A) ⋅ P ( B ) B P ( A ∩ B ) = P ( A) ⋅ P ( B ) B A „A und B fördern einander“ P ( A ∩ B ) < P ( A) ⋅ P ( B ) A B „A und B sind unabhängig“ A „A und B behindern sich“ A∩ B = ∅ B A P ( A ∩ B ) = P (∅ ) = 0 „A und B schließen sich aus (sind disjunkt)“ Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 35 Bedingte Wahrscheinlichkeiten V Definition: Drei Ereignisse, A, B und C heißen (stochastisch) unabhängig, wenn gilt: P ( A ∩ B ∩ C ) = P ( A) ⋅ P ( B ) ⋅ P ( C ) und Je zwei Ereignisse aus A, B und C sind unabhängig Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 36 Bedingte Wahrscheinlichkeiten VI Satz von der totalen Wahrscheinlichkeit 1 / 2 Gegeben seien eine endliche Anzahl von Ereignissen Bi , i = 1,...,k („Bedingungen“), die sich paarweise ausschließen, d.h. für i ≠ j ist Bi ∩ B j = ∅ , und die vereinigt die gesamte Ergebnismenge ergeben, d. h. k ∪B i = Ω. i =1 Dann gilt für ein beliebiges Ereignis A ∈ A k k i =1 i =1 P ( A) = ∑ P ( A ∩ Bi ) = ∑ P ( A | Bi ) ⋅ P ( Bi ) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 37 Bedingte Wahrscheinlichkeiten VI Satz von der totalen Wahrscheinlichkeit 2 / 2 k k i =1 i =1 P ( A) = ∑ P ( A ∩ Bi ) = ∑ P ( A | Bi ) ⋅ P ( Bi ) B1 A Ω B1 B2 B3 B2 B3 A ∩ B1 A ∩ B1 A ∩ B2 A ∩ B2 A ∩ B3 A ∩ B3 Man spricht in diesem Zusammenhang auch von der totalen Wahrscheinlichkeit als der Wahrscheinlichkeit, A auf einem „Pfade“ Bi zu erreichen. Die Formel wird angewendet, wenn man zwar die Wahrscheinlichkeit sämtlicher Bedingungen, die zu A führen können, und die jeweiligen bedingten Wahrscheinlichkeiten von A kennt, P(A) selbst aber nicht. Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 38 Beispielaufgabe zur totalen Wahrscheinlichkeit: Infektiöse Gelbsucht Drei klassische Ursachen für infektiöse Gelbsucht sind - Infektion durch Spritze oder Bluttransfusion - Infektion durch Nahrungsaufnahme - enger persönlicher Kontakt mit einem bereits Erkrankten. In einem Land mögen diese Ursachen in einem Jahr bei 15% / 20% / 2% der Bevölkerung auftreten; nie mehr als eine Ursache auf einmal. Andere Ursachen mögen ausgeschlossen sein. Die Wahrscheinlichkeit, Gelbsucht zu bekommen, sei bei Vorliegen je einer der Ursachen 0,10 / 0,05 / 0,40. Wie groß ist die Wahrscheinlichkeit für einen beliebigen Bürger in einem Jahr Gelbsucht zu bekommen ? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 39 Bedingte Wahrscheinlichkeiten VII Der Satz von Bayes In diesem Zusammenhang tritt häufig die folgende Frage auf: Wenn A eintrifft, wie wahrscheinlich ist es, dass gleichzeitig Bj eintrifft, d.h. A auf dem „Pfade“Bj erreicht wird? Diese Frage wird durch den Satz von Bayes beantwortet: P ( B j ∩ A) P ( A | Bj ) ⋅ P ( Bj ) P ( B j | A) = = k P ( A) ∑ P ( A | Bi ) ⋅ P ( Bi ) i =1 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 40 Beispielaufgabe zum Satz von Bayes: Der AIDS-Test Endlich ist er da: der „99% sichere“ AIDS-Test. Genauer: dieser Test hat eine Sensitivität von 99% (d.h. die Wahrscheinlichkeit eines AIDS-Infizierten, dass der Test positiv ausfällt, ist 99%). Des weiteren hat der Test eine Spezifität von 95% (d.h. die Wahrscheinlichkeit, eines Nicht-AIDS-Infizierten, dass der Test negativ ausfällt, ist 95%). Die "Liga zur Verbesserung der Volksgesundheit" fordert daraufhin "von der Politik", endlich den Zwangstest für alle einzuführen. Berechnen Sie die Wahrscheinlichkeit, dass ein Test-positiver tatsächlich infiziert ist, (die "positive Korrektheit" oder den "positiven prädiktiven Wert" des Tests) wenn die AIDS-Prävalenz (der Anteil der AIDS-Infizierten) 0,05% ist. Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 41 Aufgabe: Ölexploration Eine Ölgesellschaft baut 3 Bohrtürme in der Nordsee auf. Die Wahrscheinlichkeit, innerhalb eines Jahres fündig zu werden, ist bei jedem Bohrturm 1/4. Die Bohrtürme stehen so weit auseinander, dass sie sich gegenseitig nicht beeinflussen. Wie groß ist die Chance der Gesellschaft, im ersten Jahr Öl zu finden? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 42 Lösung zur Aufgabe: Ölexploration 1 / 4 In der Terminologie der Wahrscheinlichkeitsrechnung lautet die Aufgabe: Sei A das Ereignis „fündig bei 1. Bohrung“, B das Ereignis „fündig bei 2. Bohrung“, C das Ereignis „fündig bei 3. Bohrung“. Gesucht: P(A ∪B ∪C) Lösung mit den Rechenregeln der Wahrscheinlichkeitsrechnung: Zunächst für die ersten beiden Bohrungen: P( A ∪ B) = P( A) + P( B) − P( A ∩ B) = (P( A ∩ B) = P( A) ⋅ P( B) = 1 1 1 7 + − = 4 4 16 16 1 1 1 ⋅ = da A und B unabhängig sind) 4 4 16 Dann für alle drei Bohrungen: P( A ∪ B ∪ C ) = P(( A ∪ B) ∪ C ) = P( A ∪ B) + P(C ) − P(( A ∪ B) ∩ C ) 7 1 7 1 37 = + − ⋅ = 16 4 16 4 64 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 43 Lösung zur Aufgabe: Ölexploration 2 / 4 Sei A das Ereignis „fündig bei 1. Bohrung“, B das Ereignis „fündig bei 2. Bohrung“, C das Ereignis „fündig bei 3. Bohrung“. Gesucht: P(A∪ ∪B ∪C) Pfiffiger ist: Unabh. P( A ∪ B ∪ C ) = 1 − P( A ∪ B ∪ C ) = 1 − P( A ∩ B ∩ C ) = 1 − P( A) ⋅ P( B ) ⋅ P(C ) 3 27 37 3 = 1− = 1− = 64 64 4 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 44 Lösung zur Aufgabe: Ölexploration 3 / 4 Sei A das Ereignis „fündig bei 1. Bohrung“, B das Ereignis „fündig bei 2. Bohrung“, C das Ereignis „fündig bei 3. Bohrung“. Gesucht: P(A∪ ∪B ∪C) Systematische Lösung mit dem Venn-Diagramm: A B 9/64 3/64 9/64 oder: 1/64 3/64 27/64 9 9 9 3 3 3 1 37 + + + + + + = 64 64 64 64 64 64 64 64 3/64 1− 9/64 C 27 37 = 64 64 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 45 Lösung zur Aufgabe: Ölexploration 4 / 4 Sei A das Ereignis „fündig bei 1. Bohrung“, B das Ereignis „fündig bei 2. Bohrung“, C das Ereignis „fündig bei 3. Bohrung“. Gesucht: P(A∪ ∪B ∪C) Systematische Lösung mit dem Entscheidungsbaum: P ( A) = 1 4 Aiii 3 4 A Biii Ω P ( A) = ( C ) P B A = P ( B) = 3 4 B ( ) P C B A = P (C ) = 3 3 37 P( A ∪ B ∪ C ) = 1 − P( A ∩ B ∩ C ) = 1 − = 4 64 3 4 C Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 9 Folie I - 9 - 46 Aufgabe: Erträumte Musterlösungen In der Nacht vor der Statistik-I-Klausur erscheint dem sich im Bett wälzenden Erstsemester im Traum ein Geist. “Ich habe Erbarmen mit dir“ , spricht der Geist, “ ich will dir eine Chance geben, dich von allen Klausur-Ängsten befreien. Siehst du die drei Türen dort? Sie führen direkt in den Klausursaal. Hinter einer Tür liegt die Musterlösung. Du darfst dir die Tür aussuchen, durch die du morgen früh gehst. Wähle gut!“ „Kannst du mir nicht noch ein wenig helfen?“, bettelt der Student, „Schließlich ist doch meine Chance sonst nur 33,3%.“ „Bravo!“,antwortet der Geist, „dafür, dass du das gewusst hast, will ich dir zur Belohnung tatsächlich noch eine zweite Chance einräumen. Doch wähle erst!“ Zitternd zeigt der Student auf eine der drei Türen. Der Geist öffnet darauf eine der beiden anderen Türen, hinter der allerdings weit und breit keine Musterlösung zu sehen ist. „Nun wähle ein zweites Mal“, spricht der Geist und löst sich unter wieherndem Gelächter in Rauch auf. Kann der Student durch erneute Wahl seine Chancen verbessern? Welches ist die optimale Strategie, und wie groß ist nach dieser Strategie die Wahrscheinlichkeit, dass er die Musterlösung findet (natürlich nur im Traum)?