Zufallsvariablen und ihre Verteilungen Begriff der Zufallsvariablen Verteilungen eindimensionaler diskreter Zufallsvariablen Verteilungen eindimensionaler stetiger Zufallsvariablen Verteilungen mehrdimensionaler Zufallsvariablen Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 1 Zufallsvariablen I Bibliografie: ¾ Prof. Dr. Kück Universität Rostock Statistik, Vorlesungsskript, Abschnitt 5.1 ¾ Bleymüller / Gehlert Verlag Vahlen 2003 Statistische Formeln, Tabellen und Programme ¾ Bleymüller / Gehlert / Gülicher Verlag Vahlen 2004 Statistik für Wirtschaftswissenschaftler ¾ Hartung Oldenbourg Verlag 2002 Statistik Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 2 Zufallsvariablen I 1 Begriff der Zufallsvariablen • Einführung • Wahrscheinlichkeitsbegriffe ¾ ¾ ¾ ¾ Klassischer Wahrscheinlichkeitsbegriff Statistischer Wahrscheinlichkeitsbegriff Subjektiver Wahrscheinlichkeitsbegriff Axiomatischer Wahrscheinlichkeitsbegriff • Rechenoperationen mit Wahrscheinlichkeiten • Definition der Zufallsvariablen Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 3 Zufallsvariablen I Einführung Es gibt zwei Prozesse unmittelbarer statistischer Beschreibung eines Erkenntnisobjektes Gesammeltes Datenmaterial entspricht einer definierten Gesamtheit Gesammeltes Datenmaterial entspricht einer Teilmenge der Grundgesamtheit einstufiger Prozess der Beschreibung: zweistufiger Prozess der Beschreibung: 1.Auswertung der Datenmenge, welche eine definierte Gesamtheit operationalisiert, d.h. die Merkmale der Objekte dieser Gesamtheit meßbar und numerisch auswertbar macht Stichprobe n = Gesamtheit N 1.Bildung und Auswertung der Teilmenge (Berechnung der Maßzahlen/ Parameter) 2.stochastischer Schluss von der Teilmenge auf die Grundgesamtheit (Schätzen der Maßzahlen/ Parameter) Stichprobe n =Teilmenge d. Grundgesamtheit N Parameter der Gesamtheit = Parameter der Stichprobe Parameter der Grundgesamtheit = Parameter der Stichprobe + zufällige Abweichung Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 4 Zufallsvariablen I 2 Einführung Grundgesamtheit • endlich, real • unendlich, fiktiv, hypothetisch • Beispiel: Bevölkerungsstand der Bundesrepublik Deutschland am 31.12.2000 Erwerbstätige des Landes MV per 30.06.2002 • Beispiel: Toleranzüberwachung bei gedrehten Werkstücken an einem beliebigen Produktionstag Kontrolle der Bremswirkung an Kraftfahrzeugen • sachlich, zeitlich und räumlich abgegrenzt, in der Realität existent • real nicht vorfindbare Einheiten • Entsprechung: klassisches Realmodell der Kugelurne, Würfel • Entsprechung: klassisches Realmodell der Kugelurne, Würfel Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 5 Zufallsvariablen I Klassischer Wahrscheinlichkeitsbegriff • Definition der Wahrscheinlichkeit nach Laplace: Zahl der günstigen Fälle W(A) = ——————————————— Zahl der gleichmöglichen Fälle • Anwendungsbereich des klassischen Wahrscheinlichkeitsbegriffs: Zufallsexperimente, deren mögliches Ergebnis aus einer endlichen Menge von Elementarereignissen besteht, – die einander ausschließen, – die alle gleichmöglich sind, – von denen genau eines eintritt. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 6 Zufallsvariablen I 3 Klassischer Wahrscheinlichkeitsbegriff Zwei Ereignisse werden immer genau dann als gleichmöglich angesehen, wenn man keinen Grund hat anzunehmen, dass eines der beiden eher eintreten werde als das andere. Man spricht auch von gleichwahrscheinlichen Elementarereignissen. Die Zahl der gleichmöglichen Fälle ist eindeutig bestimmbar, man hat darüber a priori (von vornherein) gesicherte Erkenntnis. Der klassische Wahrscheinlichkeitsbegriff nach Laplace wird deshalb auch mit dem Begriff der a-prioriWahrscheinlichkeit identifiziert. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 7 Zufallsvariablen I Klassischer Wahrscheinlichkeitsbegriff Beispiele: Ereignis A: Würfeln einer „6“ mit einem Wurf Zahl der gleichmöglichen Fälle: 6 Zahl der günstigen Fälle: 1 W (A) = 1/6 (=>Die Wahrscheinlichkeit, mit einem Wurf eine „6“ zu würfeln, muss 1/6 betragen.) analog: Die Wahrscheinlichkeit, bei gleicher Zahl roter und weißer Kugeln aus einer Urne eine rote zu greifen, muss ½ sein. Bei weniger trivialen Aufgaben erfolgt die Berechnung der Wahrscheinlichkeit mit Hilfe der Kombinatorik. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 8 Zufallsvariablen I 4 Exkurs: Kombinatorik Die Kombinatorik beschäftigt sich mit der Berechnung der Anzahl der Anordnungen von n Elementen, die aus N verschiedenen oder gehäuft vorkommenden Elementen unter bestimmten Bedingungen ausgewählt werden. Wir unterscheiden: • Permutationen (mit und ohne Wiederholung) • Variationen n-ter Ordnung (mit und ohne Wiederholung) • Kombinationen n-ter Ordnung (mit und ohne Wiederholung) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 9 Zufallsvariablen I Exkurs: Kombinatorik Eine Permutation ohne Wiederholung... ...bestimmt die Zahl der Anordnungen von insgesamt N Elementen, die alle voneinander verschieden sind. ...liefert N! = N•(N –1)•...•1 verschiedene Anordnungen. Beispiel: Aus den N=3 Buchstaben a, b und c lassen sich 3! = 3•2•1 = 6 verschiedene Wörter (Anordnungen) bilden, wobei jeder Buchstabe in jedem Wort genau einmal vorkommt. { „abc“, „acb“, „bac“, „bca“, „cab“, „cba“ } Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 10 Zufallsvariablen I 5 Exkurs: Kombinatorik Eine Permutation mit Wiederholung... ...bestimmt die Zahl der Anordnungen von insgesamt N Elementen, wobei k verschiedene Elemente mit den Häufigkeiten n1, ..., nk vorhanden sind. (N=n1+n2+...+nk) ...liefert N! / ( n1! • n2! • ... • nk! ) verschiedene Anordnungen. Beispiel: Aus den insgesamt N=5 Buchstaben a, a, a, b, b, wobei k=2 verschiedene Buchstaben mit den Häufigkeiten n1=3 und n2=2 vorkommen, lassen sich 5! / ( 3! • 2! ) = 120/(6•2) = 10 verschiedene fünfbuchstabige Wörter (Anordnungen) bilden. { aaabb, aabab, abaab, baaab, aabba, ababa, baaba, abbaa, babaa, bbaaa } Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 11 Zufallsvariablen I Exkurs: Kombinatorik Eine Variation n-ter Ordnung ohne Wiederholung... ...bestimmt die Zahl der Möglichkeiten, aus insgesamt N verschiedenen Elementen n Elemente auszuwählen, wobei die Reihenfolge der Auswahl berücksichtigt wird und jedes zur Auswahl stehende Element Ni nur einmal benutzt werden darf, so dass n≤ N. ...liefert N! / (N – n)! = N•(N – 1)•...•(N – n + 1) Anordnungs-Möglichkeiten. Beispiel: Bei einem Rennen mit 8 Pferden gibt es 8!/(8-3)! = 8!/5! = 8•7•6 = 336 Möglichkeiten, die ersten drei Plätze zu tippen. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 12 Zufallsvariablen I 6 Exkurs: Kombinatorik Eine Variation n-ter Ordnung mit Wiederholung... ...bestimmt die Zahl der Möglichkeiten, aus insgesamt N verschiedenen Elementen n Elemente auszuwählen, wobei die Reihenfolge der Auswahl berücksichtigt wird und jedes zur Auswahl stehende Element Ni beliebig oft benutzt werden darf. (n>N erlaubt) ...liefert Nn Anordnungs-Möglichkeiten. Beispiel: An einem Zahlenschloss mit je 10 Ziffern auf 3 Ringen ergeben sich 103 = 1000 Varianten. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 13 Zufallsvariablen I Exkurs: Kombinatorik Eine Kombination n-ter Ordnung ohne Wiederholung... ...bestimmt die Zahl der Möglichkeiten, aus insgesamt N verschiedenen Elementen n Elemente auszuwählen, wobei die Auswahl-Reihenfolge unberücksichtigt bleibt und jedes zur Auswahl stehende Element Ni nur einmal benutzt werden darf, so dass n≤ N. ...liefert ⎛N⎞ N! ⎜⎜ ⎟⎟ = ⎝ n ⎠ ( N − n )!•n! Auswahl-Möglichkeiten. Beispiel: Es gibt ⎛ 32 ⎜⎜ ⎝ 2 ⎞ 32 ! ⎟⎟ = 30 !• 2 ! ⎠ = (32•31)/2 = 496 Möglichkeiten für die beiden Karten im Skat. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 14 Zufallsvariablen I 7 Exkurs: Kombinatorik Eine Kombination n-ter Ordnung mit Wiederholung... ...bestimmt die Zahl der Möglichkeiten, aus insgesamt N verschiedenen Elementen n Elemente auszuwählen, wobei die Auswahl-Reihenfolge unberücksichtigt bleibt und jedes zur Auswahl stehende Element Ni beliebig oft benutzt werden darf. (n>N erlaubt) ⎛ N + n − 1⎞ (N + n − 1)! Anordnungs-Möglichkeiten. ⎟⎟ = ⎝ n ⎠ (N − 1)!•n! ...liefert ⎜⎜ Beispiel: Beim 3maligen Werfen (n=3) einer Münze (N=2, W=Wappen, ⎛ 2 + 3 − 1⎞ (2 + 3 − 1)! = 4 verschiedene Kombinationen von ⎟⎟ = ⎝ 3 ⎠ (2 − 1)!•3! Z=Zahl) gibt es⎜⎜ Wappen und Zahl. { WWW, WWZ, WZZ, ZZZ } Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 15 Zufallsvariablen I Zusammenfassung: Kombinatorik Permutation Variation ohne Wiederholung N! N! / (N-n)! mit Wiederholung N! / (n1!•...•nk!) Nn Prof. Kück / S. Winterfeldt Lehrstuhl Statistik Kombination ⎛ N ⎞ ⎜⎜ ⎟⎟ ⎝ n ⎠ ⎛ N + n − 1⎞ ⎜⎜ ⎟⎟ ⎝ n ⎠ 16 Zufallsvariablen I 8 Klassischer Wahrscheinlichkeitsbegriff Beispiel: Wie groß ist die Wahrscheinlichkeit, mit drei Würfeln bei einem Wurf genau 6 Augen zu erzielen? Lösung: Die Zahl aller gleichmöglichen Fälle ist eine Variation mit Wiederholung. Es gibt also 6³ = 216 Fälle. Bei drei Würfeln gibt es drei verschiedene Augenkombinationen, die in der Augensumme 6 ergeben: 1,1,4; 1,2,3; 2,2,2. Es geht jeweils um N=3 Elemente, jedoch mit verschiedenen Häufigkeiten. Zu 1,1,4: k=2 verschiedene Elemente mit den Häufigkeiten n1=2, n2=1 => 3!(2!•1!) = 3 verschiedene Anordnungen (1,1,4; 1,4,1; 4,1,1). Zu 1,2,3: N=3 verschiedene Elemente => 3! = 6 verschiedene Anordnungen (1,2,3; 1,3,2; 2,1,3; 2,3,1; 3,1,2; 3,2,1). Zu 2,2,2: Es gibt nur diese eine Anordnung. Somit erhält man 3+6+1 = 10 günstige Fälle, die gesuchte Wahrscheinlichkeit ist das Verhältnis 10/216 = 0,046. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 17 Zufallsvariablen I Klassischer Wahrscheinlichkeitsbegriff Beispiel: Wie groß ist die Wahrscheinlichkeit, mit zwei Würfeln bei einem Wurf mindestens 9 und höchstens 11 Augen zu erzielen? Lösung: Die Zahl aller gleichmöglichen Fälle ist eine Variation mit Wiederholung, es gibt also 6² = 36 Fälle. Die Summe 9 erzielt man mit den Anordnungen 3,6; 6,3; 4,5; 5,4; die Summe 10 mit 4,6; 6,4; 5,5; die Summe 11 mit 5,6; 6,5. Man erhält damit 4+3+2 = 9 günstige Fälle, die gesuchte Wahrscheinlichkeit ist das Verhältnis 9/36 = 0,25. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 18 Zufallsvariablen I 9 Klassischer Wahrscheinlichkeitsbegriff Beispiel: Eine Gruppe von neun Schülern wird in zwei Sportstunden per Losentscheid in eine vierköpfige rote Mannschaft, eine vierköpfige gelbe Mannschaft und einen Schiedsrichter aufgeteilt. Wie groß ist die Wahrscheinlichkeit, dass in der zweiten Sportstunde a) dieselbe rote Mannschaft b) dieselbe rote und dieselbe gelbe Mannschaft wie in der ersten Sportstunde aufgestellt wird? Lösung: a) Die Zahl der gleichmöglichen Fälle ist eine Kombination ohne ⎛ 9 ⎞ Wiederholung mit ⎜⎜⎝ 4 ⎟⎟⎠ = 126 Möglichkeiten. Da nur ein Fall günstig ist, ergibt sich als Wahrscheinlichkeit: 1/126 = 0,007937. ⎛ 5 ⎞ b) Für jede feststehende rote Mannschaft gibt es ⎜⎜⎝ 4 ⎟⎟⎠ = 5 Möglichkeiten, aus den verbleibenden 5 Schülern eine gelbe Mannschaft zusammenzustellen. Damit erhöht sich die Zahl der gleichmöglichen Fälle auf 126·5 = 630. Die Wahrscheinlichkeit ist: 1/630 = 0,001587. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 19 Zufallsvariablen I Statistischer Wahrscheinlichkeitsbegriff Definition der Wahrscheinlichkeit nach Richard von Mises: W(A) = lim fn(A) = lim (hn(A)/n) n→∞ n→∞ Wobei: • fn(A) := relative Häufigkeit des Ereignisses A bei n Versuchen • hn(A) := absolute Häufigkeit des Ereignisses A bei n Versuchen Die Wahrscheinlichkeit W(A) des Ereignisses A ist als Grenzwert der relativen Häufigkeit des Auftretens von A definiert. Die Bestimmung der Wahrscheinlichkeit erfolgt durch die Beobachtung wiederholter Versuche. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 20 Zufallsvariablen I 10 Statistischer Wahrscheinlichkeitsbegriff Anwendungsbereich des statistischen Wahrscheinlichkeitsbegriffs: Zufallsexperimente, die aus einer langen Folge voneinander unabhängiger Versuche bestehen. • Beispiel: Ereignis A = Würfeln einer sechs mit einem Würfel • klassischer W.-Begriff: W(A) wird im Vorab (a priori) aus der vorhandenen Kenntnis der Gestalt des Würfels bestimmt • statistischer W.-Begriff: W(A) wird aus einer genügend langen Wurfserie und somit im Nachhinein (a posteriori) bestimmt Anmerkung: Da eine Wurfserie mit n=∞ Versuchen in der Praxis nicht möglich ist, kann W(A) nur mit einer Sicherheit <100% bestimmt werden. (Auf den Zusammenhang zwischen Länge der Versuchsreihe [=>Stichprobengröße] und Sicherheit der Aussage [=>Konfidenzintervalle] gehen wir im Abschnitt 7 genauer ein.) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 21 Zufallsvariablen I Subjektiver Wahrscheinlichkeitsbegriff In vielen Fällen, insbesondere bei Entscheidungen im Wirtschaftsleben, lassen sich die Wahrscheinlichkeiten weder unter der Verwendung des klassischen, noch unter Verwendung des statistischen Wahrscheinlichkeitsbegriffs objektiv bestimmen. Entwicklung des Begriffs der subjektiven Wahrscheinlichkeit durch Leonard J. Savage Subjektive Wahrscheinlichkeiten sind „Glaubensannahmen“, die zwar subjektiv, aber möglichst vernünftig getroffen werden. Sie sind mit Wettchancen vergleichbar. Beispiel: Ein Arbeitssuchender stuft die Wahrscheinlichkeit, dass seine Bewerbung bei einer bestimmten Firma zu einer Einstellung führt, subjektiv mit 60% ein. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 22 Zufallsvariablen I 11 Subjektiver Wahrscheinlichkeitsbegriff Anwendungsbereich: Subjektive Wahrscheinlichkeiten gehen häufig in Entscheidungsmodelle bei Unsicherheit ein. Das Ergebnis der Modellrechnung hängt von den eingegebenen Wahrscheinlichkeiten ab. Delphi-Methode: Durch eine (in der Regel mehrfache) Befragung einer Gruppe von Experten wird versucht, die subjektiven Wahrscheinlichkeiten, die in das Modell eingehen, zu objektivieren, um so die Treffsicherheit des Ergebnisses der Modellrechnung zu erhöhen. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 23 Zufallsvariablen I Axiomatischer Wahrscheinlichkeitsbegriff Die auf A.N. Kolmogoroff zurückgehende axiomatische Definition der Wahrscheinlichkeit will nicht das Wesen der Wahrscheinlichkeit erklären, sondern beschreibt die mathematischen Eigenschaften der Wahrscheinlichkeit mit Hilfe von drei Axiomen: 1. Axiom: Die Wahrscheinlichkeit W(A) des Ereignisses A eines Zufallsexperiments ist eine eindeutig bestimmte reelle Zahl, die der Bedingung 0 ≤ W(A) ≤ 1 genügt. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 24 Zufallsvariablen I 12 Axiomatischer Wahrscheinlichkeitsbegriff 2. Axiom: Bezeichnet man das „sichere Ereignis“, das immer eintritt, mit S, dann ist W(S) = 1. 3. Axiom: Schließen sich zwei Ereignisse eines Zufallsexperiments gegenseitig aus, so gilt: W(A∪B) = W(A) + W(B) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 25 Zufallsvariablen I Rechenoperationen mit Wahrscheinlichkeiten Additionssatz Seien A und B Zufallsereignisse, die sich gegenseitig ausschließen, dann ist die Wahrscheinlichkeit, dass entweder A oder B eintritt, gleich der Summe der Wahrscheinlichkeiten beider Ereignisse (=> 3. Axiom von Kolmogoroff): W(A∪B) = W(A) + W(B) Schließen A und B einander nicht aus, dann ist die Summe der Wahrscheinlichkeiten von A und B um die Wahrscheinlichkeit des gemeinsamen Eintretens zu reduzieren: W(A∪B) = W(A) + W(B) - W(A∩B) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 26 Zufallsvariablen I 13 Rechenoperationen mit Wahrscheinlichkeiten Beispiel: In der Demographie spielt die Berechnung von Sterbe- und Überlebenswahrscheinlichkeiten eine wichtige Rolle. Sei Q das Ereignis, dass eine Person im Altersintervall [x, x+n) stirbt, und P das Ereignis, dass eine Person das Altersintervall [x, x+n) überlebt, dann definiert man • W(Q)=nqx als Sterbewahrscheinlichkeit und • W(P)=npx als Überlebenswahrscheinlichkeit in [x, x+n). Da man entweder überlebt oder stirbt, bildet die Vereinigung von Q und P das „sichere Ereignis“: Q∪P=S. Nach dem 2. Axiom von Kolmogoroff gilt: W(Q∪P)=W(S)=1. Da man nicht zugleich überleben und sterben kann, schließen Q und P einander aus (Q∩P=ø und W(Q∩P)=0), und die vereinfachte Form des Additionssatzes findet Verwendung: W(Q)+W(P)=1. Wir gelangen zu: Prof. Kück / S. Winterfeldt Lehrstuhl Statistik nq x + np x = 1 27 Zufallsvariablen I Rechenoperationen mit Wahrscheinlichkeiten Bedingte Wahrscheinlichkeit Oft hängt die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses B vom Eintreten eines anderen Ereignisses A ab. Die Wahrscheinlichkeit für B unter der Voraussetzung, dass ein anderes Ereignis A vorher eingetreten ist bzw. gleichzeitig mit B eintritt, bezeichnet man als bedingte Wahrscheinlichkeit des Ereignisses B unter der Bedingung A => W(B|A). W(B | A) = WW(A(A∩)B) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 28 Zufallsvariablen I 14 Rechenoperationen mit Wahrscheinlichkeiten Multiplikationssatz Durch Umstellen der Definition für die bedingte Wahrscheinlichkeit gelangen wir zur allgemeinen Form des Multiplikationssatzes: W(A∩B) = W(A) • W(B|A) Hat das Eintreten des Ereignisses A keinen Einfluss auf die Wahrscheinlichkeit des Eintretens des Ereignisses B, dann bezeichnen wir die Ereignisse A und B als stochastisch unverbunden. Es gilt: W(B|A) = W(B|Ā) = W(B). In einem solchen Fall vereinfacht sich der Multiplikationssatz zu der Formel: W(A∩B) = W(A) • W(B) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 29 Zufallsvariablen I Rechenoperationen mit Wahrscheinlichkeiten Beispiel: Gemäß der abgekürzten deutschen Sterbetafel 1996/98 sterben Männer mit einer Wahrscheinlichkeit von 0,08469 im Alter 80 und mit einer Wahrscheinlichkeit von 0,09675 im Alter 81. Gesucht ist die Wahrscheinlichkeit 2q80, im Altersintervall [80,82) zu sterben. Lösung: Überlebenswahrscheinlichkeiten: 1p80 = 1–1q80 = 1–0,08469 = 0,91531 1p81 = 1–1q81 = 1–0,09675 = 0,90325 Die Ereignisse „Überleben des Alters 80“ und „Überleben des Alters 81“ sind stochastisch unverbunden, ihr gemeinsames Eintreten führt zum „Überleben des Intervalls [80,82)“, dessen Wahrscheinlichkeit 2p80 ist: (Multiplikationssatz) 2p80 = 1p80 · 1p81 2p80 = 0,91531·0,90325 = 0,82675 2q80 = 1 – 2p80 = 1 – 0,82675 = 0,17325 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 30 Zufallsvariablen I 15 Rechenoperationen mit Wahrscheinlichkeiten Totale Wahrscheinlichkeit Es seien Ai (mit i=1, ..., n) einander ausschließende Ereignisse, deren Vereinigung das sichere Ereignis (S) darstellt. B sei ein Zufallsereignis, dessen bedingte Wahrscheinlichkeiten bezüglich der Ai bekannt sind. Die totale Wahrscheinlichkeit ist dann die Beziehung: n W (B ) = ∑ W (B | A i ) • W ( A i ) i =1 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 31 Zufallsvariablen I Rechenoperationen mit Wahrscheinlichkeiten Formel von Bayes Es gilt: W(Ai|B)=W(Ai∩B)/W(B) (=> bedingte Wk) Ferner gilt: W(Ai∩B)=W(Ai)•W(B|Ai) (=>Multiplikationssatz) W(B)=Σ(W(B|Ai)•W(Ai)) (=> totale Wk) Durch Einsetzen der beiden unteren Gleichungen in die obere Gleichung gelangen wir zur Formel von Bayes: W (A i | B) = W (B | A i ) • W ( A i ) n ∑ ( W (B | A i =1 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik i ) • W ( A i )) 32 Zufallsvariablen I 16 Interpretation von Wahrscheinlichkeiten „Die Regenwahrscheinlichkeit beträgt morgen 30%“ Psychologen untersuchten weltweit (idw-online.de vom 12.09.03), welche Vorstellungen mit dieser Aussage verbunden sind. Vorgegebene Vorstellungen waren: 1. Morgen regnet es auf 30% der Fläche 2. Morgen regnet es 30% der Zeit 3. Es wird an 30% der Tage regnen, welche die gleiche Wetterlage wie der morgige haben. Während die New Yorker mehrheitlich auf die 3. Option tippten, kam gerade diese Interpretation den europäischen Befragten besonders unsinnig vor. Sie favorisierten eher die zweite Möglichkeit, also die Zeit, die es regnen würde. Das wirkliche Ausmaß der Unklarheit kam durch eigene Erläuterungen ans Tageslicht: Einige Teilnehmer in New York und in Berlin interpretierten die Regenwahrscheinlichkeit als eine Art Abstimmungsergebnis unter den Wetterexperten; sie erklärten, dass von zehn Meteorologen drei davon überzeugt seien, dass es morgen regnen wird! Die Mehrdeutigkeit der Aussage blieb unerkannt. Aber der Wahrscheinlichkeitsaussage oben fehlt die Angabe, worauf sie sich bezieht, ob auf die Fläche, die Zeit oder eben die Tage mit identischer Wetterlage. Die Zahl allein kann fehlinterpretiert werden, wenn die Kategorien der Statistik das Messkonzept nicht eindeutig belegen. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 33 Zufallsvariablen I Interpretation von Wahrscheinlichkeiten Um sich ein Bild der Situation des wissenschaftlichen Nachwuchses zu machen, befragt die Frauenbeauftragte der Universität das gesamte weibliche wissenschaftliche Personal. Die 80 Frauen werden danach befragt, ob sie eine Vollzeitbeschäftigung haben und ob sie ihre Promotion abgeschlossen haben. (V/p:20, V/np:15, T/p:10, T/np:35) Die Befragungsergebnisse können in einem Venn-Diagramm dargestellt werden. Beantworten Sie dazu folgende Fragen: Bezeichnen Sie die Ereignisse! Wie groß ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Frau eine Vollzeitbeschäftigung hat? Wie groß ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Frau eine Vollzeitbeschäftigung hat und ihre Promotion abgeschlossen hat? Wie groß ist die Wahrscheinlichkeit, dass eine aus dem vollzeitbeschäftigtem Personal zufällig ausgewählte Frau ihre Promotion abgeschlossen hat? Sind beide Ereignisse unabhängig? Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 34 Zufallsvariablen I 17 Definition der Zufallsvariablen Wir definieren schrittweise: 1) Ein Zufallsvorgang (zufälliger Vorgang) wird dadurch charakterisiert, dass sein Ergebnis (Ausgang) nicht zwingend festliegt und demnach auch nicht mit Sicherheit vorhersehbar ist. 2) Das Ergebnis eines Zufallsvorgangs wird als zufälliges Ereignis bezeichnet. Alle möglichen Ereignisse, die im Ergebnis eines Zufallsvorgangs auftreten können, heißen Elementarereignisse. Sie schließen einander aus; ihre Menge bildet eine Ereignismenge oder einen Ereignisraum. Der Ereignisraum ist endlich, wenn er endlich viele Elementarereignisse umfasst, andernfalls ist er unendlich. Unter dem Begriff „Ereignis“ versteht man im allgemeinen eine beliebige Teilmenge des Ereignisraums, d.h., das Ereignis setzt sich aus einem oder mehreren Elementarereignissen zusammen. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 35 Zufallsvariablen I Definition der Zufallsvariablen Die Beziehungen zwischen zufälligen Ereignissen werden wie folgt zum Ausdruck gebracht: A=B A⊂B A∩B=C A∩B=∅ A∪B=C A= B A und B sind identische Ereignisse. A ist eine Teilmenge von B. C ist das Ereignis, dass A und B zugleich (gemeinsam) eintreten. C heißt Schnittmenge von A und B. A und B sind disjunkte Ereignisse, sie treten nicht gemeinsam ein. Wenn A eintritt, tritt B nicht ein. Die Schnittmenge C ist leer, C=∅. C ist das Ereignis, dass mindestens eines der beiden Ereignisse A und B eintritt. A oder B oder beide treten ein. A ist identisch mit dem Nichteintreten von B. A und B sind komplementäre Ereignisse. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 36 Zufallsvariablen I 18 Definition der Zufallsvariablen 3) Als Zufallsvariable wird eine Veränderliche X bezeichnet, die bestimmte reelle Werte mit bestimmten Wahrscheinlichkeiten W annimmt. Diese Definition der Zufallsvariablen schließt zwei Dinge ein: • das Auftreten von Häufigkeiten statistischer Einheiten mit bestimmten Merkmalsausprägungen, • das Auftreten von bestimmten Merkmalsausprägungen (Werten) an den Einheiten. Zufallsvariablen bilden den Ereignisraum eines Zufallsvorgangs ab. Dieser bestimmt den Definitionsbereich der Zufallsvariablen. Der Wertebereich der Zufallsvariablen ist die Menge der reellen Zahlen, die bei den möglichen Realisationen vorkommen können. Das gilt auch bei qualitativen Merkmalen, wie der Farbe einer gezogenen Kugel. – Die Zufallsvariable ist ein theoretisches Konstrukt, zu dessen realer Bestimmung immer alle möglichen Realisationen mit ihren Wahrscheinlichkeiten des Auftretens und den möglichen Ausprägungen und Wahrscheinlichkeiten gehören. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 37 Zufallsvariablen I Definition der Zufallsvariablen Beispiel: • Zufälliger Vorgang: Das Werfen zweier unterscheidbarer Münzen mit Wappen (W) und Zahl (Z). • Zufallsvariable X: Anzahl der obenliegenden Wappen. • Definitionsbereich der Zufallsvariablen (zufällige Ereignisse): {WW, WZ, ZW, ZZ}. • Wertebereich der Zufallsvariablen: die reellen Zahlen. • mögliche Realisationen der Zufallsvariablen: 0, 1, 2. Anmerkung: Vorsicht ist allerdings geboten, wenn die Rechenregeln einer Kardinalskala auf solche Zahlen angewendet werden. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 38 Zufallsvariablen I 19