-4(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) Kapitel 1: Diskrete Wahrscheinlichkeitsräume Damit man ein mathematisches Modell entwickeln kann, müssen die möglichen Ergebnisse des zufälligen Experiments (zumindest im Prinzip) wohldefiniert und beobachtbar sein. 1.1 Definition: Ω, die Menge aller möglichen Ausgänge eines zufälligen Experiments heißt Ereignis – oder Stichprobenraum. Die Elemente ω ∈ Ω (also die möglichen Ausgänge des Experiments) heißen Elementarereignisse oder Stichproben. 1.2 Beispiele: 1) Einmaliger Münzenwurf: mögliche Ausgänge: Zahl ( = Z ) oder Wappen ( = W ) , d.h. Ω = { Z,W }. Z = „Münze zeigt Zahl“ ist ein Elementarereignis. 2) Zweimaliger Münzenwurf: a) Eine Münze wird zweimal geworfen oder zwei unterscheidbare Münzen werden zugleich geworfen. Ω = { (Z,Z); (Z,W); (W,Z); (W,W) } = { Z,W } × { Z,W }. Hier: (Z,W) ≠ (W,Z). b) Zwei ununterscheidbare Münzen werden zugleich geworfen. Ω = { (Z,Z); {Z,W}; (W,W) }. {Z,W} = {W,Z} = „die Münzen zeigen verschiedene Seiten“ ist in diesem Falle ein Elementarereignis. 3) Eine Münze wird solange geworfen, bis W erscheint. Beobachtet wird die Anzahl der vorausgegangenen Würfe, die das Ergebnis Z zeigen. Ω = { 0, 1, 2, . . . , ∞ } = : NI0 ∪ { ∞ }. -5(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) „3“ = „W erscheint zum ersten Mal beim 4. Wurf“ ist ein Elementarereignis. „∞“ ist das Elementarereignis, daß die Münze nie die W-Seite zeigt. 4) Es wird das Alter beobachtet, in dem verschiedene Menschen sterben. Ω = [0, ∞) = : IR+ . „59,73“ ist das Elementarereignis, daß die beobachtete Person im Alter von genau 59,73 Jahren gestorben ist. 5) Das Wetter während eines Tages wird beobachtet. { sonnig, wolkig, verregnet } kann nicht als Ereignisraum dienen, da a) diese Menge unvollständig ist: z.B. „es schneit“ ist nicht enthalten. b) ihre Elemente nicht wohldefiniert sind: ein Tag kann am Morgen verregnet und am Abend sonnig sein. 1.3 Bemerkung: Die Elementarereignisse ω können Symbole, Zahlen, Vektoren oder noch allgemeinere Begriffe sein, bestimmt durch das Zufallsexperiment, das wir beobachten. Wir werden später sehen, daß die Mächtigkeit von Ω die Komplexität des Modells ganz wesentlich beeinflußt. 1.4 Definition: a) Ω heißt diskret, falls es nur endlich oder abzählbar unendlich viele Elemen- te enthält. b) Ein Experiment heißt diskret (endlich), falls es einen diskreten (endlichen) Stichprobenraum Ω besitzt. 1.5 Bemerkung: 1.2 Beispiele 1), 2): endlich 1), 2), 3): diskret 4): nicht diskret, da [0, ∞) überabzählbar. Bis auf weiteres werden wir uns nur mit diskreten Experimenten beschäftigen. -6(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) 1.6 Definition: Falls Ω diskret, verstehen wir unter einem Ereignis eine beliebige Menge A von möglichen Ausgängen des Experiments, d.h. eine beliebige Teilmenge A von Ω . „Das Ereignis A ist eingetreten“ heißt, daß der beobachtete Ausgang ω des Experiments in A liegt. Für ein diskretes Experiment ist also die Klasse der Ereignisse P(Ω) : = { A | A ⊂ Ω } , die Potenzmenge von Ω . 1.7 Beispiele von Ereignissen: 1.2: 2a) „Die erste Münze zeigt Z“ = { (Z,Z); (Z,W) }. 2b) „Beide Münzen zeigen die gleiche Seite“ = { (Z,Z); (W,W) }. 3) „W erscheint nicht vor dem 7. Wurf“ = { 6, 7, 8, . . . , ∞ }. 1.8 Bemerkungen: 1) Insbesondere sind Ω und ∅ Ereignisse. Ω = „sicheres Ereignis“, das immer eintritt. ∅ = „unmögliches Ereignis“, das nie eintreten kann. (Z.B. eine „7“ zu würfeln.) 2) Falls A und B Ereignisse sind, dann verstehen wir unter A ∪ B = „A oder B treten ein“. A ∩ B = „A und B treten ein“. A \ B = „A, aber nicht B, tritt ein“. A : = Ω \ A = „A tritt nicht ein“. 1.9 Definition: A und B heißen unvereinbar, falls A ∩ B = ∅ . Wir wollen nun jedem Ereignis A eine Maßzahl zuordnen, die anzeigt, welche Chance A hat, nach Durchführung des Experiments einzutreten. Hierzu nehmen wir an, daß unser Experiment unter im wesentlichen konstanten Bedingungen (was nicht immer möglich ist) -7(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) n-mal durchgeführt wird (= : Versuchsreihe der Länge n) und betrachten folgende nahe- liegenden Maßzahlen von A : 1.10 Definition: Für jedes Ereignis A heißt rh(A) : = n(A) n relative Häufigkeit von A , wobei n(A) die Anzahl der Versuche ist, bei denen A eingetreten ist. Leider ist rh(A) für festes A kein konstanter Wert, sondern hängt von n und (was noch viel schlimmer ist) von der jeweiligen individuellen Versuchsreihe ab. (rh(A) kann jeden der Werte 0, 1n , n2 , ... ,1 annehmen.) Hier hilft uns eine empirische Beobachtung weiter. 1.11 Erfahrungstatsache: (Stabilität der relativen Häufigkeiten): Wenn ein stochastisches Experiment n – mal unter im wesentlichen konstanten Bedingungen durchgeführt wird, dann stabilisiert sich die relative Häufigkeit rh(A) eines jeden Ereignisses A um einen spezifischen Wert zwischen 0 und 1 , wenn n groß wird. 1.12 Beispiel : Das Geschlecht von neugeborenen Kindern. A = „männlich“ ; jeweils 20 Versuchsreihen der Länge n : rh(männlich) stabilisiert sich um 0,514 . -8(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) Diese empirische Beobachtung legt nahe, im mathematischen Modell jedem Ereignis A eine Maßzahl P(A) , die Wahrscheinlichkeit von A, für die Chance seines Eintretens zuzuordnen. Wahrscheinlichkeiten können also als Abstraktionen von relativen Häufigkeiten verstanden werden. 1.13 Konvention: Für Elementarereignisse ω schreiben wir kurz P(ω) anstelle von P({ω}). 1.14 Bemerkung: Wie P(A) im Einzelfall numerisch anzusetzen ist, damit das mathema- tische Modell die Realität vernünftig beschreibt, ist kein w-theoretisches, sondern ein statistisches Problem. So bieten sich manchmal gewisse Werte aus Symmetrieüberlegungen an ( P(1) = P(2) = . . . = P(6) = 1 6 ist wohl sinnvoll für einen (unverfälschten) Würfel), in anderen Situationen nimmt man die relativen Häufigkeiten „hinreichend“ langer Versuchsreihen. Aufgabe der W-theorie ist es hingegen, Formeln zu entwickeln, nach denen man aus bekannten Wahrscheinlichkeiten weitere Größen von Interesse berechnen kann. Wie die Geometrie, die Algebra, die Topologie und andere mathematische Disziplinen baut sich auch die W-theorie auf einem axiomatischen Grundsystem auf, das wir Wahrscheinlichkeitsraum (W-raum) nennen. Dieses Begriffssystem wurde 1933 nach Vorarbeiten anderer Mathematiker von A.N. Kolmogorov als erstem konsequent eingeführt. Da unser Modell den Ablauf des stochastischen Experiments möglichst realistisch beschreiben soll, müssen die Wahrscheinlichkeiten P(A) gewissen Rechenregeln genügen, die wir den Eigenschaften der relativen Häufigkeiten entnehmen. Es gilt: a) n(A) ≥ 0 ⇒ rh(A) ≥ 0 . Wir postulieren deshalb: I. P(A) ≥ 0 für alle A ⊂ Ω b) n(Ω) = n ⇒ rh(Ω) = 1. Wir postulieren: II. P(Ω) = 1 -9(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) c) A und B seien unvereinbar ⇒ n(A ∪ B) = n(A) + n(B) ⇒ rh(A ∪ B) = rh(A) + rh(B). Wir sollten postulieren: III´. P(A ∪ B) = P(A) + P(B) für A ∩ B = ∅ (Additivität). Aus technischen Gründen postulieren wir etwas mehr: III. A1, A2, . . . sei eine Folge von paarweise unvereinbaren Ereignissen (d.h. Ai ∩ Aj = ∅ für i ≠ j). Dann gilt: ∞ P(U A j ) = j=1 ∞ ∑ P(A ) (σ -Additivität). j j=1 1.15 Bemerkung: Obige Reihe ist wohldefiniert, da wegen I. alle ihre Glieder nichtnegativ sind. 1.16 Definition: I., II. und III. heißen Kolmogorovsche Axiome. Unter einem diskreten Wahrscheinlichkeitsraum (Ω, P) verstehen wir einen diskreten Ereignisraum Ω ( ≠ ∅ ) und eine Abbildung P: P(Ω) → IR , die den Axiomen I., II. und III. genügt. P heißt dann eine Wahrscheinlichkeit, ein Wahrscheinlichkeitsmaß oder eine Wahrscheinlichkeitsverteilung auf Ω . 1.17 Aus I., II. und III. ergeben sich unmittelbar folgende weitere Eigenschaften von P: IV. P( ∅ ) = 0: 1 = P(Ω) = P(Ω ∪ ∅ ∪ ∅ ∪ ... ) = P(Ω) + P( ∅ ) + P( ∅ ) + . . . ≥ 1 + P( ∅ ) ⇒ 0 ≥ P( ∅ ) ≥ 0 ⇒ Beh. III´. Additivität : A ∩ B =∅ ⇒ P(A ∪ B) = P(A ∪ B ∪ ∅ ∪ ∅ ∪ ... ) = P(A) + P(B) + P( ∅ ) + P( ∅ ) + . . . = P(A) + P(B). V. P( A ) = 1 – P(A), da A ∪ A = Ω und A ∩ A = ∅ . VI. A ⊂ B ⇒ P(A) ≤ P(B) ( ⇒ P(A) ≤ 1 für alle A ⊂ Ω) : B = A ∪ (B \ A) ⇒ P(B) = P(A) + P(B \ A) ≥ P(A) - 10 (Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) VII. Additionssatz : P(A ∪ B) = P(A) + P(B) – P( A ∩ B ) VIII. (Übung !) Stetigkeit : ∞ von unten : A1 ⊂ A2 ⊂ . . . P( U A n ) = lim P(An) ⇒ n →∞ n =1 ∞ von oben : B1 ⊃ B2 ⊃ . . . P( I B n ) = lim P(Bn) . ⇒ n =1 n →∞ (Übung !) 1.18 Bemerkungen: a) Wegen dieses Stetigkeitsverhaltens wird in Axiom III. die σ -Additivität anstelle der Additivität gefordert. (Siehe hierzu auch die Übungen!) b) Die σ -Additivität der Wahrscheinlichkeit P ergibt sich automatisch aus der Additivität von P, wenn man die Überzeugung zu Grunde legt, daß man beobachtbares Naturgeschehen mit Hilfe immer genauerer Beobachtungen beliebig gut approximieren kann. Da Ω = { ω1, ω2, . . . } diskret ist, ist jedes A ⊂ Ω endlich oder abzählbar, d.h. für A ≠ ∅ ist A= U {ω} ω ∈A eine höchstens abzählbare Vereinigung von paarweise unvereinbaren Ereignissen. Nach III. bzw. III´. gilt also: P(A) = ∑ ω P(ω) , ∈A d.h. P ist eindeutig durch seine Werte pj : = P(ωj) ( ≥ 0) , j = 1, 2, . . . bestimmt. Insbesondere gilt: ∑p j j = ∑ ω ∈Ω P(ω) = P(Ω) = 1 . - 11 (Kapitel 1 : Diskrete Wahrscheinlichkeitsräume) r Der | Ω| - dimensionale Vektor p : = (p1, p2, . . . ) erfüllt die Bedingungen : a) pj ≥ 0 , j = 1, 2, . . . und b) ∑p j = 1 j r d.h. p ist ein Wahrscheinlichkeitsvektor (W-vektor). r Umgekehrt sei p ein | Ω| - dimensionaler W-vektor. Wir setzen P(A) : = ∑ pj für ∅ ≠ A ⊂ Ω und P( ∅ ) = 0 . j:ω j ∈A Man sieht leicht ein (Übung!), daß P eine Wahrscheinlichkeit auf Ω ist. Es ist also gezeigt: 1.19 Satz : Die Wahrscheinlichkeiten P auf Ω = { ω1, ω2, . . . } und die | Ω| - dimensior nalen W-vektoren p : = (p1, p2, . . . ) entsprechen sich via pj = P(ωj) in eineindeu- tiger Weise. r Wir werden deshalb einen diskreten W-raum auch oft als (Ω, p ) darstellen. r 1.20 Beispiele : (unverfälschter) Münzenwurf: Ω = {Z,W } , p = ( 12 , 12 ) . r (unverfälschtes) Würfeln : Ω = {1, 2, 3, 4, 5, 6 } , p = ( 16 , 16 , 16 , 16 , 16 , 16 ) . r Geschlecht neugeborener Kinder : Ω = {♂,♀} , p = (0,514; 0,486) .