Statistik II fu r Studierende der Soziologie und Nebenfachstudierende Thomas Augustin SoSe 2010 Besonderer Dank gilt den Kolleg(innen) Prof. Dr. Thomas Kneib und Dr. Carolin Strobl, die im Rahmen ihrer Vorlesungen im SoSe 08 bzw. SoSe 09 das ursprungliche Material weiterentwickelt haben. Einleitung Statistik II fur Studierende der Soziologie und Nebenfachstudierende Deskriptive vs. induktive Statistik Deskriptive vs. induktive Statistik Deskriptive Statistik (Statistik I): Statistische Beschreibung einer Gesamtheit (Grundgesamtheit oder Stichprobe). Keine Verallgemeinerung von einer Stichprobe auf die zugehorige Grundgesamtheit angestrebt. Induktive Statistik (Statistik II): Induktion: Schluss vom Teil auf das Ganze, von vielen Einzelbeobachtungen auf allgemeine Gesetze Speziell: Schluss von einer Stichprobe auf Eigenschaften der Grundgesamtheit ( In" ferenz\ ) Stichprobe nur Mittel zum Zweck, um Informationen uber die Eigenschaften der Grundgesamtheit zu gewinnen. Einleitung 3 Statistik II fur Studierende der Soziologie und Nebenfachstudierende Deskriptive vs. induktive Statistik Typisches Beispiel: Wahlumfrage Grundgesamtheit: Alle Wahlberechtigten bei der nachsten Bundestagswahl. Stichprobe: 1000 reprasentativ ausgewahlte\ Wahlberechtigte " Gesucht: Information uber alle Wahlberechtigten, also die Grundgesamtheit Einleitung 4 Statistik II fur Studierende der Soziologie und Nebenfachstudierende Fragestellungen der induktiven Statistik Fragestellungen der induktiven Statistik 1. Punktschatzung: Zum Beispiel: Wie gro ist der Anteil der schwarz-gelb-Wahler unter allen Wahlberechtigten? Wie erhalt man aus der Stichprobe gute Schatzwerte fur Charakteristika ( Para" meter\) der Grundgesamtheit? Wann ist ein Schatzverfahren gut/besser als ein anderes? 2. Bereichsschatzung: Typischerweise stimmt der Punktschatzer nicht mit dem wahren Wert uberein. Ungenauere Aussagen, dafur aber zuverlassiger. Realistischer: Gib einen Bereich an, der den wahren Anteil der schwarz-gelb" Wahler mit hoher Wahrscheinlichkeit enthalt\. Einleitung 5 Statistik II fur Studierende der Soziologie und Nebenfachstudierende Fragestellungen der induktiven Statistik 3. Hypothesentests: berprufe aus substanzwissenschaftlicher Theorie abgeleitete Hypothesen uber die U Grundgesamtheit anhand der Daten. Zum Beispiel: Verdienen Manner wirklich mehr als Frauen? Ist der Unterschied signikant\? " 4. Regressionsmodelle incl. Varianzanalyse: Modelle zur Beschreibung des Einusses von Variablen Zum Beispiel: Welche personlichen Merkmale beeinussen die Wahlentscheidung besonders stark? Einleitung 6 Statistik II fur Studierende der Soziologie und Nebenfachstudierende Inferenzfehler Inferenzfehler Zentrales Problem der induktiven Statistik: Jeder Induktionsschluss ist potentiell fehlerbehaftet Beispielsweise ist der wahre Anteil der Wahler einer Partei in der Grundgesamtheit nicht exakt mithilfe der Stichprobe vorhersagbar. Entscheidende Idee: Kontrolle des Fehlers mit Hilfe der Wahrscheinlichkeitsrechnung. Vorgehen: { Stichprobenziehung zufallig { Verwende Methoden der rung/Kontrolle des Fehlers Wahrscheinlichkeitsrechnung zur Quantizie- ! Kap. 1: Wahrscheinlichkeitsrechnung ! Kap. 2: Wie nutzt man Wahrscheinlichkeitsuberlegungen fur die Statistik? Induktive Statistik Einleitung 7 Statistik II fur Studierende der Soziologie und Nebenfachstudierende Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Ziel ist die Vermittlung eines Gefuhls\ fur Wahrscheinlichkeiten. " Gerade fur Sozialwissenschaftler ist probabilistisches Denken (d.h. das Denken in Wahrscheinlichkeiten) unerlasslich! Zunachst grundlegende Rechenregeln fur Wahrscheinlichkeiten, und wichtige Modelle, dann auch spezielle Regeln fur groe Stichproben (Befragungen!) Oft einfacher, da sich gewisse Regelmaigkeiten einstellen: Insbesondere nahert sich die relative Haugkeit eines Ereignisses unter gewissen Voraussetzungen seiner Wahrscheinlichkeit an ! auch wichtig fur Interpretation. Dem so genannter Hauptsatz der Statistik folgend wachst mit dem Stichprobenum" fang in gewisser Weise die Reprasentativitat der Stichprobe\ Bei naiver Herangehensweise (ohne Wahrscheinlichkeitsrechnung) kann man sich leicht tauschen. Z.B. bewerten sowohl medizinische Experten als auch Laien Risiken oft falsch. Einleitung 8 1 Wahrscheinlichkeitsrechnung Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen 1.1 Mengen und elementare Mengenoperationen Denition 1.1. Eine Menge ist eine Zusammenfassung verschiedener Objekte zu einem Ganzen. Die einzelnen Objekte einer Menge werden Elemente genannt. Mengen werden ublicherweise mit Grobuchstaben bezeichnet, z.B. A, B , C , , . . . Mengen werden spater benutzt, um den Ausgang von Zufallsexperimenten zu beschreiben. Bsp. 1.2. A = fHorer einer Vorlesungg. A = f1; 2; 3; 4; 5; 6g (Menge der Ergebnisse eines Wurfelwurfs). Die Reihenfolge der Aufzahlung spielt (im Gegensatz zu Tupeln) keine Rolle: f1; 2; 3; 4; 5; 6g = f1; 3; 5; 2; 4; 6g 1 Wahrscheinlichkeitsrechnung 10 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Jedes Element wird nur einmal genannt. B = fK; Z g (Menge der Ergebnisse eines Munzwurfs, K =Kopf, Z =Zahl). Charakterisierung von Mengen mit einer gewissen Eigenschaft: f1; 2; 3; : : : ; 10g = fx j x ist eine naturliche Zahl 10g Die Menge aller x mit der Eigenschaft x ist eine naturliche Zahl 10\. " Standardmengen: N = f1; 2; 3; : : :g N0 = f0; 1; 2; 3; : : :g Z = f0; 1; 2; : : :g R = ( 1; 1) ; 1 Wahrscheinlichkeitsrechnung : Menge der naturlichen Zahlen, : Menge der naturlichen Zahlen inklusive 0, : Menge der ganzen Zahlen, : Menge der reellen Zahlen, : leere Menge. 11 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Grundlegende Begrie der Mengenlehre: Illustration anhand der Mengen = A = B = C = fCDU/CSU, SPD, FDP, Grune, Linke, Sonstigeg fCDU/CSU, SPD, FDP, Gruneg fCDU/CSU, SPD, FDPg fSPD, FDP, Gruneg Elementeigenschaft: x ist Element der Menge A: x2A x ist nicht Element der Menge A: x 2= A Teilmengen: A ist Teilmenge von B , in Zeichen A B , wenn jedes Element von A auch in B ist. 1 Wahrscheinlichkeitsrechnung 12 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Veranschaulichung von Mengen im Venn-Diagramm: Fur jede Menge A gilt: ;A Die leere Menge ist Teilmenge jeder Menge, denn jedes Element in ; ist in A (Aussagen uber den leeren Quantor sind wahr) AA 1 Wahrscheinlichkeitsrechnung \ enthalt implizit " = \, " deshalb in Literatur manchmal auch d.h. statt 13 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Schnittmenge: Die Schnittmenge A \ B ist die Menge aller Elemente, die sowohl in A als auch in B enthalten sind: A \ B = fxjx 2 A und x 2 B g 1 Wahrscheinlichkeitsrechnung 14 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Weitere Eigenschaften: * Gilt A B , so ist A \ B = A. * Fur jede Menge A gilt: A \ A = A und A \ ; = ;. * Zwei Mengen A und B mit A \ B = ;, d.h. zwei Mengen, die kein gemeinsames Element haben, heien disjunkt. * Die Schnittmenge aus n Mengen A1; : : : ; An enthalt alle Elemente, die in jeder der Mengen A1; : : : ; An enthalten sind und wird bezeichnet mit n \ i=1 Ai := A1 \ A2 \ : : : \ An: Vereinigungsmenge: Die Vereinigungsmenge A [ B ist die Menge aller Elemente, die in A oder B enthalten sind: A [ B = fxjx 2 A oder x 2 B g 1 Wahrscheinlichkeitsrechnung 15 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Bem. 1.3. * Vorsicht: Das oder\ ist nicht exklusiv gemeint, also nicht entweder oder\, " " sondern als in A oder in B oder in beiden\. " * Die Vereinigungsmenge aus n Mengen A1; : : : ; An enthalt alle Elemente, die in mindestens einer der Mengen A1; : : : ; An enthalten sind und wird bezeichnet mit n [ i=1 1 Wahrscheinlichkeitsrechnung Mi := M1 [ M2 [ : : : [ Mn 16 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Dierenzmenge: Die Dierenzmenge A n B ist die Menge aller Elemente, die in A, aber nicht in B enthalten sind: A n B = fxjx 2 A aber x 2= B g Im Beispiel: 1 Wahrscheinlichkeitsrechnung 17 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Komplementarmenge: Die Komplementarmenge A bezuglich einer Grundmenge ist die Menge aller Elemente von , die nicht in A sind: Im Beispiel: 1 Wahrscheinlichkeitsrechnung A = fx 2 jx 2= Ag = fx : x 2= Ag 18 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Bem. 1.4. * Die Komplementarmenge ist nur unter Bezugnahme auf eine Grundmenge denierbar. * Es gilt A = n A. * Es existieren noch weitere Schreibweisen fur die Komplementarmenge, z.B. AC , C A. * Tertium non datur\ (Grundlegendes Prinzip der Mengenlehre (und der Logik): " Fur jedes Element x 2 gilt entweder x 2 A oder x 2 A Potenzmenge: Die Potenzmenge P (A) ist die Menge aller Teilmengen von A: P (A) = fM jM Ag: Im Beispiel: P (B ) = 1 Wahrscheinlichkeitsrechnung 19 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Machtigkeit: Die Machtigkeit jAj einer Menge A ist die Anzahl der Elemente von A Im Beispiel: Fur jede Menge B gilt jP (B )j = 2jBj 1 Wahrscheinlichkeitsrechnung 20 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Rechenregeln fur Mengen 1. Kommutativgesetze (Vertauschung): A \ B = B \ A; A [ B = B [ A: 2. Assoziativgesetze (Zusammenfassen): (A \ B ) \ C = A \ ( B \ C ) : (A [ B ) [ C = A [ ( B [ C ) : 1 Wahrscheinlichkeitsrechnung 21 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen 3. Distributivgesetze (Ausklammern/Ausmultiplizieren): (A [ B ) \ C = (A \ C ) [ (B \ C ): (A \ B ) [ C = (A [ C ) \ (B [ C ): 4. De Morgansche Regeln: (A [ B ) = A \ B (A \ B ) = A [ B 5. Aus A B folgt B A. 6. Fur die Dierenzmenge gilt A n B = A \ B . 7. Fur die Potenzmenge gilt jP (A)j = 2jAj. 1 Wahrscheinlichkeitsrechnung 22 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Das kartesische Produkt Das kartesische Produkt zweier Mengen A = fa1; a2; a3; : : : ; ak g B = fb1; b2; b3; : : : ; bmg ist die Menge A B := n (ai; bj ) i = 1; : : : ; k; j = 1; : : : ; m o Sie besteht also aus allen moglichen Kombinationen, so dass AB = (a1; b1); (a1; b2); (a1; b3); : : : ; (a1; bm); (a2; b1); (a2; b2); (a2; b3); : : : ; (a2; bm); .. (ak; b1); (ak; b2); (ak; b3); : : : ; (ak; bm) 1 Wahrscheinlichkeitsrechnung 23 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Bsp. 1.5. A = B = AB = f1; 2; 3g f1; 2; 3; 4g Achtung: Bei den Elementen von A B handelt es sich um Tupel, das heit die Reihenfolge ist wichtig! (z.B. (1; 2) ist etwas anderes als (2; 1), vgl. Statistik I Kapitel 5) 1 Wahrscheinlichkeitsrechnung 24 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.1 Mengen und elementare Mengenoperationen Verallgemeinerungen: Das kartesische Produkt der Mengen 1; 2; : : : ; n wird mit n i=1 i = 1 2 : : : n bezeichnet und besteht aus allen moglichen n-Tupeln, die sich (unter Beachtung der Reihenfolge) aus Elementen aus 1; 2; : : : ; n bilden lassen. Die Mengen 1; 2; : : : ; n mussen nicht endlich sein; fur endliche Mengen gilt n i=1 = j 1j j 2j : : : j nj Kartesische Produkte werden verwendet, um Ergebnisse komplexer Experimente aus Einzelexperimenten zusammenzusetzen. 1 Wahrscheinlichkeitsrechnung 25 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 1.2.1 Zufallsvorgange Ein Zufallsvorgang fuhrt zu einem von mehreren, sich gegenseitig ausschlieenden Ergebnissen. Es ist vor der Durchfuhrung ungewiss, welches Ergebnis eintreten wird. Was benotigen wir zur Beschreibung eines Zufallsvorganges? Zwei wesentliche Aspekte: a) Welche Ergebnisse eines Zufallsvorgangs sind moglich? (Was kann alles passieren?) b) Mit welcher Wahrscheinlichkeit treten die einzelnen Ergebnisse ein? 1 Wahrscheinlichkeitsrechnung 26 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Zur Beantwortung geht man folgendermaen vor: zu a) Festlegen eines Ergebnisraums (Grundraum, Stichprobenraum) , der alle moglichen Ergebnisse ! enthalt. Beispiele: Teilmengen A von bezeichnet man als Ereignisse, Ereignisse sind also bestimmte Mengen von Ergebnissen. Beispiele: Die einelementigen Teilmengen (also die Ereignisse, die ein Ergebniss ! enthalten) werden als Elementarereignisse bezeichnet. zu b) Eine Wahrscheinlichkeitsbewertung ordnet jedem Ereignis seine Wahrscheinlichkeit zu. Eine Wahrscheinlichkeit ist also eine Abbildung von Ereignissen (Elementen 1 Wahrscheinlichkeitsrechnung 27 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung der Potenzmenge von auf reelle Zahlen: P : P ( ) A ! R 7 P (A) ! Dabei sollen gewisse fundamentale Rechenregeln gelten, z.B. Bsp. 1.6. Es wird sich { fur die Standardtheorie { zeigen: Ein Zufallsvorgang ist ausreichend genau beschrieben, wenn jedem Elementarereignis eine Wahrscheinlichkeit zugeordnet ist, die Wahrscheinlichkeiten komplexerer Ereignisse konnen dann berechnet werden. 1 Wahrscheinlichkeitsrechnung 28 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Beachte: Der Begri der Wahrscheinlichkeit ist an sich sehr komplex und hat eine aufregende Geschichte. Es gab { und gibt immer noch { eine intensive Grundsatzdebatte, was Wahrscheinlichkeiten sind, wie sie zu verstehen und zu formalisieren sind. Es hat sich aber eingeburgert, diese { meines Erachtens sehr spannende und wichtige Grundlagendiskussion { zugunsten einer mathematischen pragmatischen Sicht auszublenden und basierend auf einem intuitiven Verstandnis sowie nahe liegenden (und mathematischen axiomatisierten) Rechenregeln einfach zu rechnen\ und die Ergebnisse " fur eine leistungsfahige statistische Analyse zu nutzen. Diese Vorgehensweise ist auch deshalb pragmatisch erfolgreich, da sich damit eine Reihe von Eigenschaften von Wahrscheinlichkeiten mathematisch folgern lassen, die wiederum zum Verstandnis und zur Interpretierbarkeit des formalen Konstrukts Wahrscheinlichkeit\ beitragen. Wir folgen " dieser Vorgehensweise insofern, als auch hier zunachst etwa mit Wahrscheinlichkeiten gerechnet wird. Einige Anmerkungen zur Geschichte und Interpretation folgen dann am Schluss des Kapitel 1.2 1 Wahrscheinlichkeitsrechnung 29 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 1.2.2 Laplace-Wahrscheinlichkeiten und Urnenmodelle a) Laplace-Wahrscheinlichkeiten (kombinatorische Wahrscheinlichkeiten) Haug: Alle moglichen Elementarereignisse sind gleich wahrscheinlich, d.h. P (fwj g) = 1 j j . In diesem Fall sprechen wir von einem Laplace-Experiment. Abzahlregel: Anzahl der fur A gunstigen Ergebnisse P (A) = Anzahl aller moglichen Ergebnisse Laplace-Wahrscheinlichkeit: In einem Laplace-Experiment gilt fur P (A) mit jAj = M und j j = N : jAj = M : P (A) = j j N 1 Wahrscheinlichkeitsrechnung 30 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Bsp. 1.7. [Dreimaliger Munzwurf] Wir werfen dreimal unabhangig voneinander eine faire Munze und notieren jeweils, ob die Munze Wappen oder Zahl anzeigt. Man beschreibt den Ergebnisraum und berechne die Wahrscheinlichkeit, mindestens einmal Wappen zu erhalten und genau zweimal Wappen zu erhalten. 1 Wahrscheinlichkeitsrechnung 31 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung b) Urnenmodelle Es hat sich eingeburgert, gewisse Grundsituationen, die in der praktischen Stichprobenziehung immer wieder vorkommen, als Urnenmodelle\ zu prototypiesieren und damit " vom konkreten Kontext zu abstrahieren. Man stellt sich eine Urne mit Kugeln vor und zieht daraus dann in einer bestimmten Art und Weise eine bestimmte Anzahl von Kugeln (Stichprobe ). In der Sozialwissenschaft entspricht jede Kugel\ einer interessierenden " Einheit (Person, Haushalt) und die Urne\ einer gedachten Gesamtliste dieser Einheiten. " Eine typische Unterscheidung der verschiedenen Ziehungsvorgange besteht darin, ob eine Einheit mehrfach in eine Stichprobe gelangen kann ( Ziehen mit Zurucklegen\ , " die gezogene Kugel wird also wieder in die Urne zuruckgelegt) oder Ziehen ohne " Zurucklegen\ (die gezogenen Kugeln bleiben also auerhalb der Urne). Dabei ist zu berucksichtigen 1. das Ziehen von n Kugeln ohne Zurucklegen entspricht einem n-fachen einmaligen Zug aus der Urne. 2. Typischerweise sind Stichproben ohne Zurucklegen praktisch einfacher zu realisieren. 1 Wahrscheinlichkeitsrechnung 32 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 3. Fur sehr groe Grundgesamtheiten sind typischerweise bei realistischen Stichprobengroen die Unterschiede zwischen mit und ohne Zurucklegen verschwindend gering. Die Unterscheidung zwischen mit und ohne Zurucklegen wird hier { aus Rucksicht auf die Gepogenheiten der ublichen Literatur { zunachst aufrechterhalten. Bei der konkreten Berechnung wird aber auch die Situation ohne Zurucklegen durch die viel einfacher behandelbare Situation mit Zurucklegen angenahert. Urnenmodell: Ziehen mit Zurucklegen Grundgesamtheit mit N Zahlen G = f1; : : : ; N g. Ziehe Stichprobe vom Umfang n mit Zurucklegen. Zur Beschreibung des Zufallsvorgangs mussen wir die Anzahl der potentiell moglichen Stichprobenergebnisse bestimmen (jede Stichprobe ist gleichwahrscheinlich). = f(!1; : : : ; !n)j!j 2 f1; : : : ; N gg, das selbe Element kann mehrfach vorkommen. j j = |N N {z : : : N} = N n, d.h. N n potentiell mogliche Stichproben vom Umfang n. n-mal 1 Wahrscheinlichkeitsrechnung 33 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Urnenmodell: Ziehen ohne Zurucklegen Grundgesamtheit mit N Einheiten(mit Nummern identiziert) G = f1; : : : ; N g. Ziehe Stichprobe vom Umfang n ohne Zurucklegen. = f(!1; : : : ; !n) : !j 2 f1; : : : ; N g; !j 6= !i fur i 6= j g, jedes Element kann nur einmal vorkommen. Anzahl moglicher Stichproben: j j = N (N 1) : : : N n + 1 = " " " 1. Ziehung 2. Ziehung n-te Ziehung = N (N 1 Wahrscheinlichkeitsrechnung 1) : : : (N n + 1)(N n) : : : 2 1 = N ! (N n)(N n 1) : : : 2 1 (N n)! 34 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Wiederholung: Fakultat Die Fakultat einer naturlichen Zahl k ist deniert als k ! = k (k wobei 1) (k 2) : : : 2 1 1! = 1; 0! = 1: Bsp. 1.8. [Glucksspirale] Gewinnzahl bei Glucksspirale hat 7 Stellen. Ziehungsstrategie des ZDF in der ersten Ziehung (1970): Urne mit jeweils 7 Kugeln der Ziern 0; 1; 2; : : : ; 9: Insgesamt sind also 70 Kugeln in der Urne. Ziehe nacheinander ohne Zurucklegen 7 Kugeln. Frage: Sind alle moglichen Gewinnzahlen gleichwahrscheinlich? 1 Wahrscheinlichkeitsrechnung 35 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Hier Illustration bei einer Gewinnzahl mit 3 Stellen: Bei der originalen Glucksspirale mit 7 Ziern waren mit der Ziehungsstrategie des ZDF manche Gewinnzahlen mehr als 100 mal wahrscheinlicher als andere Zahlen! Spezialfall: Permutationen Ziehe aus der Urne alle Kugeln und notiere diese in der gezogenen Reihenfolge. Gleichbedeutend mit der zufalligen Anordnung der N verschiedenen Zahlen. Bezeichnungsweise: Permutation der N Zahlen. Anzahl der Stichproben bzw. Permutationen: N ! 1 Wahrscheinlichkeitsrechnung 36 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Bsp. 1.9. [Problem des Handlungsreisenden] Handlungsreisender soll 5 Stadte besuchen. Frage: Wie viele Moglichkeiten hat er? Antwort: 5! = 120 Bei 10 Stadten sind es bereits 10! = 3628800 Moglichkeiten. Problem: In welcher Reihenfolge sollen die Stadte besucht werden, um den Fahrtweg zu minimieren? Das Problem ist sehr schwer zu losen wegen der groen Anzahl an Moglichkeiten. 1 Wahrscheinlichkeitsrechnung 37 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Urnenmodell: Ziehen ohne Zurucklegen ohne Berucksichtigung der Reihenfolge Ziehe n Kugeln aus einer Urne mit N nummerierten Kugeln. Die Reihenfolge der Ziehungen spielt keine Rolle, d.h. die Stichprobe 4,1,7\ wird nicht unterschieden " von 7,1,4\. " = ff!1; : : : ; !ng : !j 2 f1; : : : ; N g; !j 6= !i fur j 6= ig Anzahl der Stichproben: j j = (N Nn! )!n! = Nn Wiederholung: Binomialkoezient Der Binomialkoezient N ist deniert als n N N! = : n (N n)! n! Es gilt: N N 0 = 1; 1 = N; N = 1 ; 1 Wahrscheinlichkeitsrechnung N N = 0; falls N < n : n 38 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Bsp. 1.10. [Lottozahlen] Frage: Wie viele verschiedene mogliche Ziehungen gibt es? Antwort: Entspricht der Ziehung ohne Zurucklegen von 6 Zahlen aus 49, d.h. j j = 496 = 43!49! 6! = 13983816: Dann gilt P ("6 Richtige\ ) = 1 = 0:000000072 = 0:000072h 13983816 Frage: Wie gro ist die Wahrscheinlichkeit, 5 Richtige zu bekommen? 1 Wahrscheinlichkeitsrechnung 39 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 1.2.3 Die "induktive Brucke\ I Trivial oder genial, jedenfalls fundamental:\ " Wir werden, mit wachsender Komplexitat und Praxisbezogenheit immer wieder inne halten und uns mit der Grundfrage der induktiven Statistik\ auseinander setzen: " Warum (wie) ist es eigentlich moglich, aus einer Stichprobe etwas Nichttriviales uber die Grundgesamtheit zu lernen? Letztendlich ist dies nur dann der Fall wenn, sich entscheidende Eigenschaften der Grundgesamtheit in jeder konkreten Stichprobe wiedernden. (Wie ist dies aber moglich: Es gibt ja ganz viele verschiedene Moglichkeiten wie die konkrete gezogene Stichprobe aussehen kann. Wurde man die Ziehungsvorgange wiederholen, hatte man (praktisch sicher) eine andere Stichprobe) Man betrachte (und illustriere) dazu folgendes Beispiel: 1 Wahrscheinlichkeitsrechnung 40 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Bsp. 1.11. ["Wahlbeispiel\] Betrachtet werde ein Land, in dem die Wahlberechtigten die Wahl zwischen den Parteien Nr 1, Nr 2, : : :, Nr 5 und Nr 6 (Nichtwahler) haben. Dabei entfallen auf die Parteien 2; 4; 6 jeweils 25% der Stimmen; die restlichen Stimmen verteilen sich gleichmaig auf die Parteien 1; 3; 5. Seien f1; : : : ; f6 die entsprechenden relativen Haugkeiten 1 3 41 1 1 f2 = f4 = f6 = 4 ; f1 = f3 = f5 = 3 = 12 Es wird zufallig (im Sinne einer reinen Zufallsauswahl) eine Person ausgewahlt und ihre Parteipraferenz ermittelt. Geben Sie die sich ergebende Wahrscheinlichkeitsbewertung an. 1 Wahrscheinlichkeitsrechnung 41 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Bem. 1.12. [Fortpanzung relativer Haugkeiten als Wahrscheinlichkeiten in der Stichprobe] Gegeben sei eine Gesamtheit G und ein Merkmal X mit den Auspragungen a1; : : : ; ak und der relativen Haugkeitsverteilung f1; : : : ; fk . Zieht man eine reine Zufallsauswahl\ vom Umfang 1 aus G , hat also jedes Element aus " G die gleiche Wahrscheinlichkeit gezogen zu werden, so gilt mit = f1; : : : ; kg P (fj g) = fj : Die relativen Haugkeiten/Anteile aus der Grundgesamtheit panzen sich also in der entsprechenden Wahrscheinlichkeitsverteilung in der Stichprobe fort. Dies ist ganz entscheidend, denn dadurch kann man also durch Beobachten der Stichprobe etwas uber die Haugkeitsverhaltnisse in der Grundgesamtheit lernen. 1 Wahrscheinlichkeitsrechnung 42 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 1.2.4 Das Axiomensystem von Kolmogoro und wichtige Rechenregeln Warum reichen Laplace-Wahrscheinlichkeiten nicht? Essentielle Voraussetzung: Denition 1.13. [Axiome von Kolmogorov (1933)] Eine Funktion P (P steht fur Probability), die Ereignissen aus reelle Zahlen zuordnet, heit Wahrscheinlichkeit, wenn gilt (K1) P (A) 0 fur alle Ereignisse A : (K2) P ( ) = 1. (K3) Falls A \ B = ;; dann gilt P (A [ B ) = P (A) + P (B ) 1 Wahrscheinlichkeitsrechnung 43 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Bem. 1.14. Die Axiome von Kolmogorov stellen zunachst eine reine Denition dar, die festlegt, was eine Wahrscheinlichkeit sein soll. Es gibt verschiedene Versuche Wahrscheinlichkeiten operational zu denieren (also durch eine Messvorschrift) und verschiedene Interpretationen, die die Axiomatik mit Leben fullen sollen. Aus hier nicht zu erorternden mathematischen Grunden * darf man bei uberabzahlbar unendlichen Ergebnisraumen, z.B. also im Fall = R, nicht alle Teilmengen von als Ereignisse zulassen. Alle Mengen, an die man " normalerweise denkt\ sind aber zugelassen. * muss man bei unendlichen Ergebnisraumen in (K 3) eigentlich unendliche Summen zulassen. * Wir werden uns darum aber nicht kummern. (Nur daran denken, wenn man in etwas formalere Bucher schaut.) 1 Wahrscheinlichkeitsrechnung 44 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Rechenregeln fur Wahrscheinlichkeiten P (A) = Spezialfall: P (;) Fur nicht notwendigerweise disjunkte Mengen A; B gilt Falls A1; A2; : : : ; An paarweise disjunkt sind, also Ai \ Aj = ; fur i 6= j , dann gilt: P (A [ B ) = P (A) + P (B ) P (A \ B ) P n [ i=1 ! Ai = P (A1 [ A2 [ : : : [ An) = P (A1) + P (A2) + : : : + P (An) 1 Wahrscheinlichkeitsrechnung 45 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Beweisidee: Als Spezialfall folgt, dass, sofern endlich ist, die Wahrscheinlichkeitsbewertung durch die Bewertung auf den Elementarereignissen vollstandig bestimmt ist: P (A) = 1 Wahrscheinlichkeitsrechnung X ! 2A p(f!g) 46 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Bsp. 1.15. [Wurfelwurf mit fairem Wurfel] Ergebnisraum: = f1; 2; 3; 4; 5; 6g Alle Elementarereignisse sind gleich wahrscheinlich, d.h. p(f1g) = p(f2g) = : : : p(f6g) wegen p(f1g) + p(f2g) + : : : + p(f6g) ,6a ,a := = = = a; 1 1 1 6 Sei A = fgerade Augenzahlg = f2; 4; 6g: P (A) = P (f2; 4; 6g) = = 1 Wahrscheinlichkeitsrechnung 47 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Alternativ: Berechnung uber Laplace-Wahrscheinlichkeiten P (A) = Die Axiomatik ist insbesondere notig, um mit Situationen mit nicht gleichwahrscheinlichen Elementarereignissen rechnen zu konnen. Bsp. 1.16. ["Wahlbeispiel\] Betrachtet werde ein verfalschter Wurfel (bzw. die Situation des Wahlbeispiels aus Abschnitt 1.2.3 mit 1 P (f1g) = P (f3g) = P (f5g) = 12 1 P (f2g) = P (f4g) = P (f6g) = 4 Gegeben seien ferner die Ereignisse 1 Wahrscheinlichkeitsrechnung 48 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung A die Person wahlt Partei 1 oder 3 B " 4 oder 6 C " 3 oder 4 und berechnen Sie P (A), P (B ), P (B \ C ) und P (A [ C ). Berechne die gesuchten Wahrscheinlichkeiten: Prinzipiell kann man in diesem Beispiel zwar immer noch mit LaplaceWahrscheinlichkeiten rechnen, indem man die Betrachtung auf gleich wahrscheinliche Falle (hier Wahler) zuruckfuhrt. Dies erweist sich aber spater als immer umstandlicher beim Rechnen. Fur das Verstandnis ist diese Vorstellungsweise aber oft hilfreich, zumal man oft die Stichprobe so zieht, dass alle Einheiten gleich wahrscheinlich sind. 1 Wahrscheinlichkeitsrechnung 49 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Vollstandige Zerlegung: Ist A1; A2; : : : ; An eine vollstandige Zerlegung von , d.h. gilt n [ i=1 Ai = und Ai \ Aj = ; fur i 6= j; so gilt fur jedes Ereignis B : P (B ) = 1 Wahrscheinlichkeitsrechnung n X i=1 P (B \ Ai): 50 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Diese Regel ist fur spater sehr wichtig. Als veranschaulichendes Beispiel denke man etwa an die zufallige Auswahl einer Person ! aus der Menge aller wahlberechtigten Bundesburger. Sei B das Ereignis ! ist fur Studiengebuhren A1 " " ! ist SPD-Wahler A2 " " ! ist CDU-Wahler .. An " " ! ist Nichtwahler Sn A1; : : : ; An zerlegt vollstandig (paarweise disjunkt; i=1 Ai = ). B \ Ai ist dann das Ereignis "! ist fur Studiengebuhren und wahlt Partei i\. 1 Wahrscheinlichkeitsrechnung 51 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 1.2.5 Grundlegendes zum Begri "Wahrscheinlichkeit\ Was ist eigentlich Wahrscheinlichkeit? Was bedeutet: Mit Wahrscheinlichkeit 23 wird es morgen regnen?\ " Ausfuhrlichere und weiterfuhrende Literatur: Rohwer, G., Potter, U. (2002): Wahrscheinlichkeit, Begri und Rhetorik in der Sozialforschung. Juventa, Weinhein und Munchen. Schneider, I. (Hg.) (1988): Die Entwicklung der Wahrscheinlichkeit von den Anfangen bis 1933. Einfuhrungen und Texte. Wissenschaftliche Buchgesellschaft, Darmstadt. Weichselberger, K. (2001): Elementare Grundbegrie einer allgemeineren Wahr- scheinlichkeitsrechnung I. Intervallwahrscheinlichkeit als umfassendes Konzept. Physika, Heidelberg S. 30-63. 1 Wahrscheinlichkeitsrechnung 52 Statistik II fur Studierende der Soziologie und Nebenfachstudierende a) 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Wahrscheinlichkeit in der Alltagssprache Stark gebrauchlich in der Umgangssprache als graduelle Abschwachung von Sicherheit ( wahrscheinlich kommt Max\). Weg vom simplen Ja/Nein. " Teilweise sogar quantiziert: Die Niederschlagswahrscheinlichkeit fur morgen betragt 30%\ " Medizinische Beipackzettel: seltene Nebenwirkungen\ " b) Klassische Aspekte und Meilensteine Wahrscheinlichkeit im Glucksspiel, v.a. Wurfelspiel: Profanisierung erst im Mittelalter, dort erst als Zufall gedeutet, vorher oft als Gottesurteil etc. Wahr-schein-lichkeit (Prove-ability ! probability) 1 Wahrscheinlichkeitsrechnung 53 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung b) Zwei Historische Wurzeln Mathematisierung von Glucksspiel als philosophischer/theologischer Begri Wahr-schein-lichkeit (Prove-ability ! probability) c) Laplace'scher Wahrscheinlichkeitsbegri (kombinatorischer Wahrscheinlichkeitsbegri) * Laplace (1749 - 1827) * Aufbauend auf Symmetrieuberlegungen 1 Wahrscheinlichkeitsrechnung 54 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung Erfolgreiche Anwendung v.a. auf Glucksspiele, in der Physik (stochastische Mechanik) und in der Stichprobentheorie bei einer reinen Zufallsauswahl: Intuitiv einleuchtend, aber beschrankte Anwendbarkeit: Von Laplace generell angewendet auf beliebige Unsicherheitssituationen (Sonnenaufgang, Jurisprudenz) Laplace strenger Determinist (Laplace'scher Damon!): Unsicherheit entsteht allein durch unvollstandiges und ungenaues Wissen uber die Anfangsbedingungen!! ! Subjektivismus 1 Wahrscheinlichkeitsrechnung 55 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung d) Aktuelle interpretatorische Hauptrichtungen // typische Wahrscheinlichkeitsbegrie 1. Objektivistisch // frequentistische Richtungen // aleatorische Wahrscheinlichkeiten Anschluss an die gottliche Ordnung Wahrscheinlichkeiten beschreiben tatsachlich vorhandene, zufallige Gesetzmaigkeiten Objektbezogen: Wahrscheinlichkeit ist eine Eigenschaft des untersuchten Objekts (z.B. Wurfel), objektiv ! objektbezogen (wie z.B. spezisches Gewicht, Lange) Haugkeitsinterpretation bzw. sogar -Denition (von Mises, 1883 - 1953): Wahrscheinlichkeit als relative Haugkeiten in unendlich langen\ reproduzierbaren " Experimenten Exkurs: naturliche Haugkeiten (nach Gigerenzer, MPI fur Bildungsforschung) 1 Wahrscheinlichkeitsrechnung 56 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung * T.A.: Superreprasentative Stichprobe vorstellen\, in der sich genau die Haug" keitsverhaltnisse in der Grundgesamtheit wiedernden, z.B. 10 000 Personen * Dann P (A) = 0:1756 vorstellen als: 1756 Personen haben die Eigenschaft A. (Aber man wei naturlich nicht, welche 1756 Personen.) + einfachere Kommunikation von Wahrscheinlichkeiten und Risiken, reduziert Fehler beim Rechnen mit Wahrscheinlichkeiten rzten mathematisch triviale Umformung\, aber erfolgreich: Experimente mit A " zeigen, dass die Darstellungsform Wahrscheinlichkeiten vs. naturliche Haugkeiten) einen starken Einuss auf die Korrektheit von Berechnungen hat. { T.A.: Gefahr der Verschleierung von Unsicherheit: die naturlichen Haugkeiten\ " sind zu erwartende Durchschnittswerte, wenn man sehr viele Stichproben hatte. Individuelle Aussagen sind naturlich zufallig. Einer von zehn leiden an Krankheit A bedeutet naturlich nicht, dass nach 9 nicht an A leidenden Patienten zwingend der nachste krank ist. Auf Beipackzettel wird typischerweise das Risiko von Nebenwirkungen so kommuniziert: 1 Wahrscheinlichkeitsrechnung 57 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung sehr haug: haug: mehr als 1 von 10 Behandelten weniger als 1 von 10, aber mehr als 1 von 100 Behandelten gelegentlich: weniger als 1 von 100, aber mehr als 1 von 1000 Behandelten selten weniger als 1 von 1000, aber mehr als 1 von 10000 Behandelten sehr selten: 1 Fall oder weniger von 10000 Behandelten, einschlielich Einzelfalle Welche Nebenwirkungen konnen bei der Anwendung von *** Auftreten? Gelegentlich wurde uber das Auftreten von Mundschleimhautentzundungen, Kopfschmerzen, Ohrengerauschen berichtet. Selten konnen auftrete: Beschwerden im Magen-Darm-Bereich (z.B. Sodbrennen, belkeit, Erbrechen oder Durchfall). U superreprasentative Stichproben gibt es praktisch nicht. 1 Wahrscheinlichkeitsrechnung 58 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung 2. subjektivistische Richtungen Wahrscheinlichkeit hat ausschlielich mit Unsicherheit, nicht mit Zufalligkeit zu tun (vgl. Laplace) (Man kann auch uber vollig deterministische Aspekte unsicher sein!) Wahrscheinlichkeitsbewertung ist Eigenschaft des untersuchenden Subjekts =) verschiedene Subjekte konnen durchaus zu unterschiedlichen Bewertungen kommen. Anwendung auch auf Aussagen. Bsp: Die Wahrscheinlichkeit, dass die Regierungskoalition die gesamte Legislaturperiode halt, ist. . . behaviouristischer Standpunkt: Wahrscheinlichkeiten auern sich im Verhalten und konnen so gemessen werden z.B. bei Wetten =) Wettdenition / -Interpretation Wahrscheinlichkeit von A = p(A) = 0:3 bedeutet gedanklich: Wichtig: subjektiv sind die Bewertungen, nicht die Rechenregeln. Koharenzkriterien! 1 Wahrscheinlichkeitsrechnung 59 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung e) ("kalter\) mathematisch-formaler Wahrscheinlichkeitsbegri: Axiomatik von Kolmogorov Die Kolmogorsche Axiomatik ist eine reine Denition, die sich zunachst im luftlee" ren\ Raum bewegt. Es wird rein formal festgelegt, was eine Wahrscheinlichkeit sein soll. Es gab/gibt (wie in Kap. 1.1 ausgefuhrt) verschiedene Versuche, Wahrscheinlichkeiten operational zu denieren (also durch eine Messvorschrift) und verschiedene Interpretationen, die die Axiomatik mit Leben fullen (sollen). Die Axiomatik ist vertraglich sowohl mit der Haugkeits- als auch mit der Wettinterpretation. Die Axiome von Kolmogoro geben an, wie man mit Wahrscheinlichkeiten rechnet. Welche Phanomene man durch Wahrscheinlichkeiten beschreiben darf und wie die Ergebnisse zu interpretieren sind, ist eine Frage des Wahrscheinlichkeitsbegris. 1 Wahrscheinlichkeitsrechnung 60 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung In der Tat gibt es auch Kritik an dieser Axiomatik: zu streng und uberprazise\ ! " aktueller Forschungsgegenstand (Imprecise Probabilities, Intervallwahrscheinlichkeit ); hier nicht naher thematisiert: Kolmogoro als absolute Wahrheit\. Kritik: " * Modellierung unsicheren (partiell widerspruchlichen, unvollstandigen) Expertenwissens * Okonomie: Entscheidungen unter komplexer Unsicherheit widersprechen Prognosen aus der ublichen Wahrscheinlichkeitsrechnung logischer Wahrscheinlichkeitsbegri Wahrscheinlichkeit kommt Schlussen zu: Wahrscheinlichkeit als logischer Grad mit dem aus einer Pramisse auf die Konklusion geschlossen werden darf (fruhere Formalisierungsversuche gelten heute als gescheitert; aber Renaissance der Thematik) 1 Wahrscheinlichkeitsrechnung 61 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten (Fahrmeir et al. (2003), Kap 4.4 bis 4.7) 1.3.1 Stochastische Unabhangigkeit Stochastische Unabhangigkeit: Zwei Ereignisse A und B heien (stochastisch) unabhangig wenn gilt P (A \ B ) = P (A) P (B ) andernfalls heien sie stochastisch abhangig. Bem. 1.17. Stochastische Abhangigkeit\ bedeutet nicht kausale Abhangigkeit\ (wie in den " " Uberlegungen zu Korrelation und Kausalitat in Statistik I diskutiert). Die (stochastische) Unabhangigkeit ist eine symmetrische Beziehung in dem Sinne, dass A und B genau dann unabhangig sind, wenn B und A unabhangig sind. 1 Wahrscheinlichkeitsrechnung 62 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten quivalenz folgender Aussagen: Genauer gilt die A A und B A und B A und B A und B sind stochastisch unabhangig. " . " . " . 1 Wahrscheinlichkeitsrechnung 63 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Die Verwandtschaft zur empirischen Unabhangigkeit aus Statistik I. fij = fifj fur alle i; j ergibt sich, wenn man sich durch A und B eine (2 2) Tafel erzeugt denkt, in der anstatt der Haugkeiten die Wahrscheinlichkeiten stehen: A A B B P (A \ B ) P (A \ B ) P (A) P (A \ B ) P (A \ B ) P (A) P (B ) P (B ) Unabhangigkeit: gemeinsame Verteilung = Produkt der Randverteilungen P (A \ B ) = P (A) P (B ) quivalenz) analog fur A; B , (vgl. obige A 1 Wahrscheinlichkeitsrechnung 64 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Bsp. 1.18. [Wahlbeispiel (Fortsetzung)] Sind die Ereignisse A = f1; 3g und C = f3; 4g stochastisch unabhangig? Unabhangigkeit ist eine Eigenschaft, die vom Wahrscheinlichkeitsma abhangt. Betrachtet man wieder = f1; 2; 3; 4; 5; 6g, jetzt aber mit P (f1g) = 91 , P (f2g) = 19 , P (f3g) = 181 , P (f4g) = 185 , P (f5g) = 92 , P (f6g) = 92 , also sind hier A und C stochastisch unabhangig (selbes , andeses Wahrscheinlichkeitsma!). 1 Wahrscheinlichkeitsrechnung 65 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Stochastische Unabhangigkeit mehrerer Ereignisse: Ereignisse A1; A2; : : : ; An heien (vollstandig) stochastisch unabhangig, wenn gilt P (A1 \ A2 \ : : : \ An) = P (A1) P (A2) : : : P (An): Achtung: Aus der paarweisen Unabhangigkeit P (Ai \ Aj ) = P (Ai)P (Aj ) fur alle i; j folgt nicht die vollstandige Unabhangigkeit. 1 Wahrscheinlichkeitsrechnung 66 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten 1.3.2 Bedingte Wahrscheinlichkeiten: A Ereignis, das mit Wahrscheinlichkeit P (A) eintritt. Zusatzinformation: Ereignis B ist eingetreten. Frage: Wie ist nun die Wahrscheinlichkeit fur das Eintreten von A neu zu bewerten? Welche Wahrscheinlichkeit hat A gegeben\ B ? " Notation: P (A j B ). Einmaliges Wurfeln Ereignis A= ^ Augenzahl 6, d.h. A = f6g. Es gilt P (A) = 16 . Zusatzinformation: Augenzahl gerade Wie andert sich die Wahrscheinlichkeit fur A, wenn B = f2; 4; 6g eingetreten ist? 1 Wahrscheinlichkeitsrechnung 67 Statistik II fur Studierende der Soziologie und Nebenfachstudierende Intuitiv: 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten P (A \ B ) 1 3 1 P (AjB ) = = 6=6 = 3 P (B ) Formalisierung: Gegeben seien zwei Ereignisse A und B mit P (B ) > 0. Dann heit: P (A \ B ) P (AjB ) := P (B ) bedingte Wahrscheinlichkeit von A gegeben B oder bedingte Wahrscheinlichkeit von A unter der Bedingung B. Interpretation analog zu bedingten Haugkeiten in Statistik I: P (AjB ) ist die Wahrscheinlichkeit von A wenn man bereits wei, dass B gilt. Bsp. 1.19. 1 Wahrscheinlichkeitsrechnung 68 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Bem. 1.20. Die Beziehung zu Statistik I und den bedingten relativen Haugkeiten ergibt sich, wenn man wieder die durch A und B erzeugte (2 2) Tafel betrachtet. An Stichprobenmodell denken: Grundgesamtheit P (B )^ =f1; P (A \ B )^=f11 1 1 2 1 Wahrscheinlichkeitsrechnung 2 f11 f12 f1 f21 f22 f2 f1 f2 69 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Es ergibt sich auch eine analoge Charakterisierung der stochastischen Unabhangigkeit uber bedingte Wahrscheinlichkeiten: Sind P (A) und P (B ) > 0, so sind aquivalent: i) A und B sind stochastisch unabhangig Dies fuhrt zu folgender inhaltlicher Interpretation: Ist P (AjB ) = P (A), so andert das Wissen um B meine Bewertung von A nicht, also sind A und B unabhangig. Nachweis zu ii) Die ursprungliche Denition der Unabhangigkeit besitzt den Vorteil, dass man nicht P (A) = 0, P (B ) = 0 ausschlieen muss; fur die Interpretation ist aber die Bezugnahme auf bedingte Wahrscheinlichkeiten viel anschaulicher. 1 Wahrscheinlichkeitsrechnung 70 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Interpretation von unter der Bedingung B\: " Anstatt aller Ergebnisse in sind nur noch die Ergebnisse in B moglich. Das Betrach nderung des Grundraumes ten bedingter Wahrscheinlichkeiten entspricht also einer A von zu B . In der Tat ist PB (A) := P (AjB ) = P (A \ B jB ) als Funktion in A bei festem B wieder eine Wahrscheinlichkeitsbewertung, erfullt also wieder die Axiome von Kolmogorov. 1 Wahrscheinlichkeitsrechnung 71 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten 1.3.3 Koppelung von unabhangigen Experimenten, unabhangige Wiederholungen: Mit dem Begri der Unabhangigkeit (und bedingten Wahrscheinlichkeiten) kann man komplexere Situationen aus Einzelbausteinen\ zusammensetzen: " Bisher: Unabhangigkeit als zu uberprufende Eigenschaft P (A1 \ A2) = P (A1) P (A2) 1 Wahrscheinlichkeitsrechnung =) unabhangig: 72 Statistik II fur Studierende der Soziologie und Nebenfachstudierende Beispiel: Werfen eines Wurfels ( 1 f1; : : : ; 8g) unabhangig voneinander. A1 1 : A1 \ A2 : 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten = f1; : : : ; 6g) und eines Oktaeders ( 2 = A1 = f5; 6g ; A2 2 : A2 = f7; 8g eine 5 oder 6 mit dem Wurfel und eine 7 oder 8 mit dem Oktaeder\ " Dann deniert man P (A1 \ A2) [:= P (A1 A2) =] = P1(A1) P2(A2); also erhalt man bei einem fairem Wurfel und einem fairem Oktaeder mit 1 1 P1(fj g) = ; i = 1; : : : ; 6; und P2(fj g) = ; i = 1; : : : ; 8; 6 8 1 1 1 P (A1 \ A2) = 3 4 = 12 : Diese Konstruktion fuhrt man fur alle moglichen A1 1; A2 2 durch. 1 Wahrscheinlichkeitsrechnung 73 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Unabhangige Koppelung mehrerer Experimente: Gegeben sei eine Menge von Zufallsexperimenten, beschrieben durch die Ergebnisraume i; i = 1; : : : ; n und die Wahrscheinlichkeitsbewertungen Pi; i = 1; : : : ; n. Fasst man die Experimente zusammen, so ergibt sich der Ergebnisraum := 1 2 : : : n mit den Elementen ! := (!1; !2; : : : ; !n) : Sind die Experimente unabhangig (Dies ist inhaltlich zu entscheiden!), so setzt man fur beliebige Ai i; i = 1; : : : ; n; P (A1 \ A2 \ : : : \ An) = P1(A1) P2(A2) : : : Pn(An): Dies beschreibt ein Wahrscheinlichkeitsma auf , bei dem { per Konstruktion { beliebige Ereignisse aus den einzelnen i voneinander unabhangig sind. 1 Wahrscheinlichkeitsrechnung 74 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Von besonderer Bedeutung ist der Fall unabhangiger und identischer Wiederholungen, bei dem dasselbe Experiment wiederholt durchgefuhrt wird. Zufallsstichprobe vom Umfang n: Graphische Veranschaulichung "Wahlbeispiel\ Das Experiment Ziehen einer Person und Ermittlung ihrer Parteipraferenz\ wird n-mal " unabhangig (Befragte durfen sich nicht gegenseitig beeinussen!) durchgefuhrt. ~ sowie ein Merkmal X~ mit Allgemeiner: Betrachte eine endliche Grundgesamtheit Auspragungen a1; : : : ; ak und relativen Haugkeiten f1; : : : ; fk . Es werde eine reine Zufallsstichprobe vom Umfang n bezuglich des Merkmals X~ entnommen, d.h. eine (geordnete) Zufallsauswahl (mit Zurucklegen) von n Elementen !1; : : : ; !n mit !i 2 ~ ; i = 1 : : : n; und die diesbezuglichen Auspragungen X~ (!i) von X erhoben. 1 Wahrscheinlichkeitsrechnung 75 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Sei fur j = 1; : : : k; i = 1; : : : ; n mit Aij das Ereignis X~ (!i) = aj\ bezeichnet ( Die " " i-te gezogene Person hat Auspragung aj ), so gilt fur beliebige j1; j2; : : : ; jn P (A1j1 \ A2j2 \ : : : Anj ) = P (A1j1 ) P (A2j2 ) : : : P (Anj ) = fj1 fj2 : : : fj n n n 1 Wahrscheinlichkeitsrechnung 76 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Bsp. 1.21. Unmittelbar nach Schlieung der Wahllokale 2002 habe man eine reine Zufallsauswahl vom Umfang 10 unter den Wahlern vorgenommen. Wie gro ist die Wahrscheinlichkeit, mindestens 9 PDS-Anhanger in der Stichprobe zu haben? Amtliches Endergebnis: SPD: CDU/CSU: Grune: FDP: PDS: Sonstige: 1 Wahrscheinlichkeitsrechnung 38; 5% 38; 5% 8:6% 7; 4% 4; 0% 3; 0% 77 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten 1.3.4 Koppelung abhangiger Experimente: Als nachster Schritt werden komplexere Experimente aus viel einfacheren, voneinander abhangigen Einzelexperimenten gebaut. Gerade bei komplexeren Anwendungen ist es meist bedeutend einfacher, (und auch sicherer, da sich die Chance erhoht, korrektes Expertenwissen zu erhalten) bedingte statt unbedingte Wahrscheinlichkeiten anzugeben. Beispielsweise kann man versuchen, die Wahrscheinlichkeit eines Ereignisses dadurch zu bestimmen, dass man als Zwischenschritt auf alle Eventualitaten bedingt\ und zunachst " die entsprechenden bedingten Wahrscheinlichkeiten bestimmt. (! Baumstruktur) Bsp. 1.22. (nach Fahrmeir et al) Eine Mannschaft gewinnt das Viertelnalspiel. Wie gro ist die Chance, das Halbnale zu gewinnen und ins Finale einzuziehen? Gesucht: P (B ) mit B = Sieg im Halbnale\ " 1 Wahrscheinlichkeitsrechnung 78 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Technisch entscheidend: A1; A2; A3 bilden eine vollstandige Zerlegung. (A1 \ B ), (A2 \ B ) und (A3 \ B ) sind disjunkt und ergeben in der Vereinigung B Damit ergibt sich P (B ) = P (A1 \ B ) [ (A2 \ B ) [ (A3 \ B ) = P (A1 \ B ) + P (A2 \ B ) + P (A3 \ B ) = P (B jA1) P (A1) + P (B jA2) P (A2) + P (B jA3) P (A3) = 0:52 Das Ergebnis lasst sich verallgemeinern auf Beliebige Ereignisse B und vollstandige Zerlegungen (Ai)i=1;:::k . 1 Wahrscheinlichkeitsrechnung 79 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Satz 1.23. [Satz von der totalen Wahrscheinlichkeit] Gegeben sei eine vollstandige Zerlegung A1; A2; : : : ; Ak . Dann gilt fur jedes Ereignis B P (B ) = k X j =1 P (B jAj ) P (Aj ) = k X j =1 P (B \ Aj ): Allgemeiner erlauben bedingte Wahrscheinlichkeiten die Modellierung komplexer Ex" perimente\, welche aus sukzessiven Einzelexperimenten\ bestehen, bei denen die Er" gebnisse jeweils von den vorherigen Experimenten abhangen durfen (insb. dynamische stochastische Modelle). 1 Wahrscheinlichkeitsrechnung 80 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Koppelung abhangiger Experimente: Gegeben seien n Experimente, beschrieben durch die Grundraume i = fai1; : : : ; aik g und die Wahrscheinlichkeitsbewertungen Pi; i = 1; : : : ; n. Bezeichnet man fur beliebiges i = 1; : : : ; n und j = 1; : : : ; ki, mit Aij jeweils das zu aij gehorige Elementarereignis (also das Ereignis aij tritt ein\), so gilt: " i P (A1j1 \ A2j2 \ : : : \ Anj ) = P1(A1j1 ) P2 (A2j2 jA1j1 ) P3 (A3j3 jA1j1 \ A2j2 ) : : : Pn Anj jA1j1 \ A2j2 \ : : : \ An 1j 1 n n n Haug werden die Indizes bei P weggelassen. (i als Zeit vorstellen.) Arbeitet man mit mehreren abhangigen Experimenten, so ist folgende Folgerung aus dem Satz der totalen Wahrscheinlichkeit oft hilfreich: 1 Wahrscheinlichkeitsrechnung 81 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Korollar 1.24. Sei A1; A2; : : : ; Ak eine vollstandige Zerlegung. Dann gilt fur beliebige Ereignisse B und C mit P (C ) > 0 P ( B jC ) = k X j =1 P (B j(Aj \ C )) P (Aj jC ) Beweisidee: P (B jC ) ist fur festes C als Funktion in B eine Wahrscheinlichkeit (vgl. Bemerkung zu bedingten Wahrscheinlichkeiten). Wende den Satz der totalen Wahrscheinlichkeit auf diese Wahrscheinlichkeit an. Anwendungsbeispiele: Komplexere Urnenmodelle ohne Zurucklegen, Wahrscheinlichkeit im n-ten Zug ist davon abhangig, welche Kugeln vorher gezogen wurden. Sicherheitsstudie zu Kernkraftwerken: Wahrscheinlichkeit fur komplexe Pfade praktisch nicht angebbar, aber eben bedingte Einzelwahrscheinlichkeiten. Markovmodelle (dynamische Modelle mit einfacher Bedingung\) " 1 Wahrscheinlichkeitsrechnung 82 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Markovmodelle: Hier interpretiert man den Laundex als Zeit. Gilt in der Koppelung abhangiger Experiment 1 = 2 = : : : = n = fa1; : : : ; ak g und sind alle bedingten Wahrscheinlichkeiten nur vom jeweils unmittelbar vorhergehenden Zeitpunkt abhangig, d.h. gilt (1.1) P (Ai+1;ji+1 jA1j1 \ A2j2 \ : : : \ Aiji ) = P (Ai+1;ji+1 jAiji ); so spricht man von einem Markovmodell mit den Zustanden a1; : : : ; ak . bergangswahrscheinlichkeiten in (1.1) unabhangig von der Sind die sogenannten U Zeit, gilt also P (Ai+1;j jAil) pjl fur alle i; j; l, so heit das Markovmodell homogen. 1 Wahrscheinlichkeitsrechnung 83 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Typische Anwendungen: Glucksspiel: Die Wahrscheinlichkeit P (Ai+1;j ) mit Ai+1;j = Spieler hat zum Zeit" punkt i + 1 Kapitalbestand aj\ hangt nur vom Kapitalbestand zum Zeitpunkt i ab, also nur von Ai1; : : : ; Aik , nicht aber von fruheren Ereignissen. BWL: Konsumentscheidungen / Produktwahl Demographie: Geburts- und Todesprozesse Epidemiologie Bildet das Wetter mit = fSonniger Tag, bewolkter Tag, regnerischer Tag, verschneiter T eine Markovkette? Soziologie: z.B. Modelle sozialer Mobilitat, Mobilitat in Betrieben { Rapoport (1980): Mathematische Methoden in der Sozialwissenschaft, Physika { Bartholomew (1982): Stochastic Models for Social Processes, Wiley 1 Wahrscheinlichkeitsrechnung 84 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Bsp. 1.25. [Soziale Mobilitat (nach Bartholomew (1982), S. 18f.)] Wie entwickelt sich der soziale Status durch die Generationen? Markoveigenschaft bedeutet hier: Homogenitat bedeutet hier: Datengrundlage: mannliche Generationenfolge in Marion County, Indiana (1905 { 1912) 1 Wahrscheinlichkeitsrechnung 85 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Sohne Vater nicht handwerkliche Tatigkeit Dienstleistung handwerkliche Tatigkeit verarb. Gewerbe landwirtschaftliche Tatigkeit Land- u. Forstwirtschaft a1 a2 a3 a1 0:594 0:396 0:009 a2 0:211 0:782 0:007 a3 0:252 0:641 0:108 bergangswahrscheinlichkeiten Die obige Matrix enthalt die (geschatzten) U i-te Zeile, j -te Spalte: P (A2jjA1i) Wahrscheinlichkeit, dass die zweite Generation in Zustand j ist unter der Bedingung, dass die erste Generation im Zustand i ist. 1 Wahrscheinlichkeitsrechnung 86 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Beispiel: Sohn nicht handwerklich\ unter der Bedingung Vater landwirtschaftlich\ " " P (A21jA13) = 0:252 Man sieht: fur feste A1l ist P (A2j jA1l) als Funktion in A2j eine Wahrscheinlichkeitsverteilung, d.h. die jeweiligen Zeileneintrage summieren sich (bis auf Rundungsfehler) zu 1. Inhaltliche Interpretation: Unter der Annahme, dass eine homogene Markov-Kette vorliegt, kann man mit den Daten weitere Entwicklungen prognostizieren. bergangsmatrix allein kann man Fragen der Art beantworten: Wie Mit Hilfe der U gro ist die Wahrscheinlichkeit, dass der Enkel eines in der Landwirtschaft Tatigen eine Tatigkeit im nicht handwerklichen Sektor ausuben wird? Beachte bisher ist nichts uber die (unbedingte) Verteilung auf die einzelnen Sektoren ausgesagt. Kennt man zusatzlich die Startverteilung P (A11); P (A12); P (A13), so kann man die weitere Verteilung auf die Sektoren berechnen. 1 Wahrscheinlichkeitsrechnung 87 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Man kann auch (mit weiterfuhrenden Methoden) eine Gleichgewichtsverteilung bestimmen. Kritische Aspekte: 1 Wahrscheinlichkeitsrechnung 88 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten 1.3.5 Das Theorem von Bayes Bei der Anwendung bedingter Wahrscheinlichkeiten ist es haug von Interesse, Bedin" gung und Ereignis\ zu vertauschen. Also: gegeben P (B jA), gesucht P (AjB ) Bsp. 1.26. [Diagnoseproblem] Bei der Durchfuhrung eines Tests auf eine bestimmte Krankheit ist zu unterscheiden: { Patient ist krank ! Ereignis A { Testergebnis ist positiv, d.h. der Test sagt, die Person sei krank ! Ereignis B In der Praxis sind A und B nie identisch! Ziel bei der Konstruktion eines Tests: moglichst geringe Fehlerwahrscheinlichkeiten 1 Wahrscheinlichkeitsrechnung 89 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten P (B jA) = 0:98 Sensitivitat: Kranker wird als krank eingestuft P (B jA) = 0:97 Spezitat: Gesunder wird als gesund erkannt Hauges Problem in der Praxis: Steigerung der Sensitivitat geht auf Kosten der Spezitat und umgekehrt. Jetzt konkrete Beobachtung bei einem Patienten: Testergebnis 'krank'. Mit welcher Wahrscheinlichkeit ist die Person tatsachlich krank? Allgemeiner nicht nur bei Dichotomie A und A, sondern bei beliebiger vollstandiger Zerlegung A1; : : : ; Ak anwendbar: 1 Wahrscheinlichkeitsrechnung 90 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Theorem 1.27. [Theorem von Bayes] Sei A1; : : : Ak eine vollstandige Zerlegung von (wobei P (Ai) > 0, P (B jAi) > 0, i = 1; : : : k und P (B ) > 0 erfullt seien.) Dann gilt P (B jAj ) P (Aj ) P (Aj jB ) = k X i=1 P (B jAi) P (Ai) : Fortsetzung von Bsp. 1.26 Gegeben seien P (B jA) = 0:98 (Sensitivitat) P (B jA) = 0:97 (Spezitat) P (A) = 0:001 (Pravalenz) 1 Wahrscheinlichkeitsrechnung 91 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Bem. 1.28. [Inhaltliche Bemerkungen zu Bsp. 1.26] Problematik: Flachendeckendes Screening nicht unumstritten, da viele falsch-positive Ergebnisse. Gegenposition: Anwendung nur auf Risikopatienten. Bei Mammographie oder PSA-Test auf Prostatakrebs teilweise sogar noch viel geringere Spezitat. Wert der mathematischen Theorie: Wenn es etwas komplexer wird, verlasst einen sofort der gesunde Menschenverstand\. Untersuchungen (u.a. von Gigerenzer) haben " rzte sich dieser Problematik nicht bewusst sind. gezeigt, dass viele A Bem. 1.29. [Bemerkungen zu Theorem 1.27 (Theorem von Bayes)] bliche Bezeichnungen: U P (Ai): "a priori Wahrscheinlichkeiten\ (Wahrscheinlichkeit vor der Beobachtung des Testergebnisses) P (AijB ): "a posteriori Wahrscheinlichkeiten\ (Wahrscheinlichkeit nach der Beobachtung des Testergebnisses) 1 Wahrscheinlichkeitsrechnung 92 Statistik II fur Studierende der Soziologie und Nebenfachstudierende 1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten Im Prinzip liefert das Theorem von Bayes ein Schema fur das probabilistische Lernen aus Beobachtungen ( Aufdatieren von Wahrscheinlichkeiten\). " priori + Daten ! posteriori Es dient als Grundlage der sog. Bayesianischen Inferenz, einer bestimmten Schule der statistischen Methodologie, die hier nicht behandelt wird. Dabei geht es darum, aus Daten zu lernen, indem man die subjektiven Wahrscheinlichkeiten P (Ai) fur bestimmte Modellparameter mit Hilfe der Daten (B ) aufdatiert, und somit zur besseren Wahrscheinlichkeitsaussagen fur die Modellparameter kommt. Hier Formulierung im medizinischen Kontext. Anwendung auch zur Beurteilung der Ruckfallgefahr, Kreditwurdigkeitsprufung, etc. 1 Wahrscheinlichkeitsrechnung 93