Universität Basel Wirtschaftswissenschaftliches Zentrum Grundlagen der Stochastik Dr. Thomas Zehrt Inhalt: 1. Die Ereignismenge 2. Die Wahrscheinlichkeitsverteilung 3. Eigenschaften einer Wahrscheinlichkeitsverteilung 4. Die Laplacesche Gleichverteilung 2 Teil 1 Die Ereignismenge 3 Zufallsexperiment ; Ω die Menge aller möglichen Ausgänge des Experimentes und P : Ω −→ [0, 1] eine Wahrscheinlichkeitsverteilung 4 Zufallsexperiment: ein (theoretisch beliebig oft wiederholbarer) Vorgang, dessen Endzustand oder Ergebnis vom ,,Zufall” abhängt. Die Menge aller überhaupt möglichen Ergebnisse sei soweit bekannt, dass wir jedem Ergebnis ein Element ω einer (mathematischen) Menge Ω, der sogenannten Ergebnismenge, zuordnen können. 5 Beispiele: 1. Werfen einer Münze: Ω = {Kopf , Zahl}. 2. Werfen eines Würfels: Ω = {1, 2, 3, 4, 5, 6}. 3. Überprüfung von n Geräten, ob sie defekt (=0) oder intakt (=1) sind: Ω = {ω = (ω1, . . . , ωn) : ωi ∈ {0, 1} für i = 1, . . . , n} . 4. n-maliges Werfen eines Würfels: Ω = {ω = (ω1, . . . , ωn) : ωi ∈ {1, . . . , 6} für i = 1, . . . , n} . 5. Wert einer Aktie (heute um 19:00 Uhr): Ω = [0, ∞). Zulässig: Ω ,,grösser als nötig” zu wählen!! 6 Teilmengen A ⊂ Ω heissen Ereignisse. Wir wollen sagen, dass das Ereignis A eingetroffen ist, wenn ein Ergebnis ω mit ω ∈ A aufgetreten ist. Beispiele: 1. Das Ereignis ,,gerade Augenzahl” beim Werfen eines Würfels ist A = {2, 4, 6} und A ist eingetroffen, wenn eine 2, 4 oder 6 gewürfelt wurde. 2. Das Ereignis ,,höchstens drei der n geprüften Geräte sind defekt” ist: A = { (ω1, . . . , ωn) : ωi ∈ {0, 1} für i = 1, . . . , n und ω1 + . . . + ωn ≤ 3 } 3. Das Ereignis ,,die Aktie ist wertlos oder kostet zwischen 20.- und 50.- SFr.” ist A = {0} ∪ [20, 50]. 7 Operationen mit Ereignismengen: Darstellung Ereignis Erkärung A∩B A und B Alle Elemente aus Ω, die zu A und B gehören. A∪B A oder B Alle Elemente aus Ω, die zu A oder B gehören. A−B A\B A ohne B Alle Elemente aus Ω, die zu A aber nicht zu B gehören. Ā nicht A Alle Elemente aus Ω, die nicht zu A gehören. Ω ⊂ Ω heisst das sichere Ereignis und ∅ ⊂ Ω (die leere Menge) das unmögliche Ereignis. Ereignisse A und B heissen unvereinbar, wenn A ∩ B = ∅ ist. 8 Die zufälligen Ereignisse A1, A2, . . . , Am heissen vollständiges System oder vollständige Zerlegung von Ω genau dann, wenn • A1 ∪ A2 ∪ . . . ∪ Am = Ω und • Ai ∩ Aj = ∅ für alle i 6= j. Beispiel: Einmaliger Würfelwurf • die Elementarereignisse ω1 = 1, . . . , ω6 = 6 bilden stets eine vollständige Zerlegung, • A1 = {1, 2, 3} und A2 = {4, 5, 6} • A1 = {1} und A2 = {2, 3, 4, 5, 6} 9 Teil 2 Die Wahrscheinlichkeitsverteilung 10 Jeder Teilmenge A ⊂ Ω muss ein charakteristischer Zahlenwert zuordnen werden, der ein Mass dafür darstellt, wie stark wir mit dem Eintreffen dieses Ereignisses zu rechnen haben. Mathematisch: Funktion P : P(Ω) −→ [0, 1] die jedem Ereignis A eine Zahl zwischen 0 und 1 (oder 0% und 100%) zuordnet. Mögliche Interpretation: Auf jedem Ereignis A ∈ Ω der Menge lastet ein Gewicht P(A). 11 Eine solche Funktion P heisst Wahrscheinlichkeitsverteilung und wir erwarten, dass P die folgenden drei grundlegenden Eigenschaften hat: 1. P(Ω) = 1 (P ist normiert); 2. für alle A ⊂ Ω gilt P(A) ≥ 0 und 3. sind A1, A2, . . . paarweise disjunkte Mengen (paarweise unvereinbare Ereignisse), so ist ∞ ∞ X [ P(Ai) (P ist additiv). P Ai = i=1 i=1 Das Paar (Ω, P) ist ein Wahrscheinlichkeitsraum. 12 Relative Häufigkeit /Wahrscheinlichkeit • Der Ausgang eines einzelnen Zufallsexperimentes ist völlig offen. • Führt man ein Experiment sehr oft aus (n-mal), und zählt dabei, wie oft ein bestimmtes Ereignis A eintritt (k-mal), so beobachtet man immer, dass die relative Häufigkeit f(A) von A mit wachsendem n gegen einen festen Wert p ∈ [0, 1] strebt: k f (A) = −→ p ∈ [0, 1]. n Dabei ist der Grenzwert nicht im mathematischen Sinne zu verstehen, sondern rein empirisch zu deuten. 13 Teil 3 Weitere Eigenschaften einer Wahrscheinlichkeitsverteilung 14 Für alle A, B, A1, . . . , An ⊂ Ω gilt: P(Ā) = 1 − P(A) A⊂B ⇒ P(A) ≤ P(B) P(A − B) = P(A) − P(A ∩ B) Pn n P(∪i=1Ai) ≤ i=1 P(Ai) P(A ∪ B) = P(A) + P(B) − P(A ∩ B) P(B) = Pn i=1 P(B ∩ Ai) falls die Mengen Ai eine vollständige Zerlegung von Ω bilden 15 Beweis für P(Ā) = 1 − P(A) Für jede Teilmenge A ⊂ Ω gilt A ∪ Ā = Ω und A ∩ Ā = ∅. Mit den Eigenschaften 1 und 3 aus der Definition folgt P(Ω) = 1 = P(A) + P(Ā) und somit die Behauptung. 2 16 Beweis für A ⊂ B ⇒ P(A) ≤ P(B) Da A ⊂ B gilt, ist B = A ∪ (B − A) und diese Vereinigung ist disjunkt. Damit folgt mit Eigenschaften 3 und 2 aus der Definition: P(B) = P(A ∪ (B − A)) = P(A) + P(B | {z− A)} ≥ P(A). ≥0 2 17 Beweis für P(A − B) = P(A) − P(A ∩ B) Die Menge A kann auf die folgende Weise als disjunkte Vereinigung geschrieben werden: A = (A ∩ B̄) ∪ (A ∩ B) = (A − B) ∪ (A ∩ B). Mit der Eigenschaft 3 aus der Definition folgt somit P(A) = P((A − B) ∪ (A ∩ B)) = P(A − B) + P(A ∩ B) und damit die Behauptung. 2 18 Pn n Beweis für P(∪i=1Ai) ≤ i=1 P(Ai) Diese Regel folgt durch Induktion aus der Eigenschaft 3 aus der Definition. 2 19 Beweis für P(A∪B) = P(A)+P(B)−P(A∩B) Wir nutzen die folgenden Darstellungen der Mengen A, B und A ∪ B als disjunkte Vereinigung: A = (A − B) ∪ (A ∩ B) B = (B − A) ∪ (A ∩ B) A ∪ B = (A − B) ∪ (B − A) ∪ (A ∩ B). Mit Eigenschaft 3 folgt nun einerseits P(A) = P(A − B) + P(A ∩ B) P(B) = P(B − A) + P(A ∩ B) also P(A) + P(B) = P(A − B) + P(B − A) +2 P(A ∩ B); und andererseits P(A ∪ B) = P(A − B) + P(B − A) +P(A ∩ B) und damit folgt die Behauptung. 2 20 Aufgabe 1: Seien A, B, C ⊂ Ω beliebige Ereignisse. Zeigen Sie das die folgende Formel gilt: P (A ∪ B ∪ C) = P (A) + P (B) + P (C) −P (A ∩ B) − P (A ∩ C) − P (B ∩ C) +P (A ∩ B ∩ C) 21 Teil 4 Die Laplacesche Gleichverteilung 22 Zufallsexperimente mit der Eigenschaft, dass alle Ausgänge ,,gleichwahrscheinlich” sind, heissen Laplace-Experimente. Sinnvoll: 1 P(ω) = |Ω| für alle Ergebnisse ω ∈ Ω (d.h. auf jedem Element der Menge Ω lastet das gleiche Gewicht). Für beliebige Ereignisse A ⊂ Ω gilt P(A) = X ω∈A P(ω) = X ω∈A 1 |A| = |Ω| |Ω| Anzahl günstiger Ergebnisse = Anzahl möglicher Ergebnisse 23 Beispiele: 1. Würfeln: Ω = {1, 2, 3, 4, 5, 6}, P(i) = 16 für alle i = 1, . . . , 6 und somit A = {2, 4, 6}, P(A) = 63 = 12 2. Wir werfen zwei gleiche Münzen. Es gibt drei mögliche Ausgänge: ω1 = {Kopf , Zahl} ω2 = {Kopf , Kopf } ω3 = {Zahl, Zahl} also Ω = {ω1, ω2, ω3} und es besteht doch kein Grund, einen dieser Ausgänge zu bevorzugen??! Somit gilt: 1 P(ω1) = P(ω2) = P(ω3) = !? 3 Experiment: (für zu Hause!!) Machen Sie das Experiment 100 mal und bestimmen Sie die relativen Häufigkeiten der drei möglichen Ausgänge. 24 Aufgabe 2: Problem von Chevalier de Méré Man bestimme die Wahrscheinlichkeit dafür, 1. bei 4 Würfen mit einem Laplacewürfel mindestens einmal eine 6 zu erzielen und 2. bei 24 Würfen mit zwei Laplacewürfel mindestens einmal einen Sechserpasch (6, 6) zu erzielen. Chevalier de Méré glaubte beide Wahrscheinlichkeiten als 4/6 = 2/3 und 24/36 = 2/3 bestimmt zu haben. 25 Aufgabe 3: Bestimmen Sie die Wahrscheinlichkeit dafür, bei n Würfen mit einem Laplacewürfel mindestens einmal eine 6 zu erzielen. Für welche n ist die Wahrscheinlichkeit mindestens eine 6 zu erzielen grösser als 0.5? 26 Achtung: Die Intuition täuscht (manchmal)!! Würden Sie das folgende Spiel gegen mich spielen? Wir nehmen ein beliebiges Buch (z.B. die Bibel) und wählen darin zufällig eine Zahl aus (etwa die dritte von unten auf der 70-sten Seite). Ich gewinne 10.− wenn die erste Ziffer dieser Zahl 1, 2 oder 3 ist und Sie gewinnen, wenn diese Ziffer 4, 5, 6, 7, 8 oder 9 ist. Es sollte (Gleichverteilung!?) gelten: P(erste Ziffer ist 1, 2 oder 3) 1 1 1 = + + 9 9 9 < P(erste Ziffer ist 3, 4, . . . , 9) 1 1 1 1 1 1 = + + + + + 9 9 9 9 9 9 27 Sie sollten das Spiel nicht spielen!! Benfordsches Gesetz (Frank Benford, 1883-1948): Ist d die erste Ziffer einer Dezimalzahl, so tritt sie in empirischen Datensätzen (,,natürlich enstandene”) mit der folgenden Wahrscheinlichkeit auf: 1 P(erste Ziffer ist d ) = log10 1 + d 28 Tabelle der Wahrcheinlichkeiten d P( erste Ziffer ist d ) 1 0.301 = 30.1 % 2 0.176 = 17.6 % 3 0.125 = 12.5 % 4 0.097 = 9.7 % 5 0.079 = 7.9 % 6 0.067 = 6.7 % 7 0.058 = 5.8 % 8 0.051 = 5.1 % 9 0.046 = 4.6 % 29 Beweis des Benfordschen Gesetzes Sei X eine Zahl. Dann ist die erste Ziffer dieser Zahl gleich d = 1, 2, . . . oder 9 falls d · 10n ≤ X < (d + 1) · 10n gilt. Daraus folgt durch Anwendung des dekadischen Logaritmus log = log10: log(d · 10n) ≤ log(X) < log((d + 1) · 10n) ⇐⇒ log(d) + n ≤ log(X) < log(d + 1) + n Beachte: Da d = 1, 2, . . . oder 9 ist, gilt: 0 ≤ log(d) < 1 und 0 < log(d + 1) ≤ 1. 30 Die Ungleichung log(d) + n ≤ log(X) < log(d + 1) + n ist nun genau dann erfüllt, wenn die erste Nachkommastelle von log(X) (nennen wir sie Z), zwischen log(d) und log(d + 1) liegt: log(d) ≤ Z < log(d + 1) Annahme: Die Wahrscheinlichkeit, dass Z in ein bestimmtes Intervall [ log(d), log(d+1) ) fällt, ist proportional zur Länge des Intervalls d.h. 0 log(1) 1 log(2) log(5) log(9) P (erste Ziffer von X ist d) = P (log(d) ≤ Z < log(d + 1)) = log(d log(d) + 1) − 1 = log 1 + d 2