- 12 (Kapitel 2 : Laplacesche Wahrscheinlichkeitsräume) Kapitel 2: Laplacesche Wahrscheinlichkeitsräume Wie beim unverfälschten Münzenwurf und beim unverfälschten Würfeln spielen Symmetrieüberlegungen, die jedem Elementarereignis die gleiche Wahrscheinlichkeit zuordnen, in vielen Anwendungen eine wichtige Rolle. Man spricht von einem Laplace-Experiment, d.h. es hat endlich viele mögliche Ausgänge, die als gleich wahrscheinlich angesehen werden. Hierher gehören Spiele, die auf Symmetrieeigenschaften eines „Apparates“ beruhen, wie Würfeln, Kartenspiele und Roulette, aber auch Modelle der Physik, in denen die Verteilungen gewisser Teilchen beschrieben werden, Modelle der Genetik, u.s.w. Weiter lassen sich viele Probleme komplexer Natur auf diese einfachen Experimente zurückführen, und eine Anzahl wichtiger Wahrscheinlichkeiten bauen sich auf diesen einfachen Wahrscheinlichkeitsmaßen auf. 2.1 Definition : Ein endlicher W-raum (Ω, P) heißt Laplacescher Wahrscheinlichkeitsraum, P(ω) = 1 falls für alle ω ∈ Ω. Ω P heißt dann Gleichverteilung, Laplacesche Verteilung oder klassische Verteilung in Ω . Es gilt : Die Wahrscheinlichkeit des Ereignisses A ⊂ Ω ist: (* ) P(A) = A Ω = = „Anzahl der für A günstigen Fälle“ / „Anzahl der möglichen Fälle“ . Beweis : Übung ! 2.2 Bemerkungen : 1) In praktischen Aufgaben wird oft stillschweigend die Annahme der Gleichverteilung gemacht. Redewendungen wie „auf gut Glück“ oder „rein zufällig“ werden oft zur Formulierung der Gleichverteilung verwendet. 2) Wie in (*) zu sehen, läuft in einem Laplaceschen W-raum die Berechnung von Wahrscheinlichkeiten auf das Abzählen endlicher Mengen hinaus und führt deshalb zu kombinatorischen Problemen. - 13 (Kapitel 2 : Laplacesche Wahrscheinlichkeitsräume) 3) Im konkreten Anwendungsfall kann bei unzureichender Kenntnis des zugrunde liegenden Zufallsmechanismus die Gleichverteilungsannahme oft sehr problematisch sein. Dies soll im Beispiel 1 von 2.3 demonstriert werden. 2.3 Beispiele : 1. Von einem ausgefüllten Fragebogen zu einer statistischen Erhebung ist nur ein Fragment erhalten . Es läßt jedoch erkennen, daß es sich bei den Befragten um eine Familie mit zwei Kindern handelt, von denen (mindestens) eines ein Junge ist : das Fragment enthält gerade noch den Eintrag in die Namensliste der Kinder. Was ist die Wahrscheinlichkeit dafür, daß auch das andere Kind ein Junge ist ? (Es wird P(♂) = P(♀) = 1 2 angenommen.) Lösungen : a) Das andere Kind kann älterer Bruder, jüngerer Bruder, ältere Schwester oder jüngere Schwester sein, d.h. Ω = {ä.B., j.B., ä.S., j.S.}. Das Laplacemodell ergibt, daß die gesuchte Wahrscheinlichkeit gleich P({ä.B., j.B.}) = 1 2 ist. b) 3 Familientypen kommen in Frage: (♂,♂), (♂,♀) und (♀,♂). Die gesuchte Wahrscheinlichkeit ist also gleich P((♂,♂)) = 1 3 . Welches der beiden Ergebnisse ist korrekt? Die Antwort ist, daß das obige Zufallsexperiment nicht ausreichend beschrieben ist, und je nach weiteren Umständen jedes der beiden Ergebnisse auftreten kann. Sind die Namen der Kinder alphabetisch aufgeführt, so ist wohl die Lösung a) zutreffend. Werden jedoch zunächst die Namen der Söhne und dann die der Töchter in die Liste eingetragen, so ist die Lösung b) realistischer. 2. Urnenmodelle : In einer Urne befinden sich gut durchmischt N gleichartige, aber verschieden gefärbte Kugeln, nämlich R schwarze und (N-R) weiße. Es werden willkürlich n Kugeln herausgezogen, und gesucht ist die Wahrscheinlichkeit dafür, genau k ≤ n schwarze Kugeln zu erhalten (= : Ereignis Ak) . Zur Lösung denken wir uns die Kugeln der Urne mit den natürlichen Zahlen von 1 bis N beschriftet, wobei (z.B.) die schwarzen Kugeln die Zahlen von 1 bis R tragen. - 14 (Kapitel 2 : Laplacesche Wahrscheinlichkeitsräume) Zwei wichtige Fälle sind zu unterscheiden: a) Ziehen ohne Zurücklegen : (hier n ≤ N) ( α ) nacheinander : Die n Kugeln werden der Reihe nach gezogen und außerhalb der Urne gelassen . Ω = { (a1, . . . ,an ) | aj ∈ { 1, . . . , N }, 1 ≤ j ≤ n, und ai ≠ aj für i ≠ j } . | Ω | = (N)n : = N ⋅ (N - 1) ⋅ . . . ⋅ (N - n + 1) . Unter der Annahme, daß ein Laplace-Experiment vorliegt, verfährt man wie folgt: Ak besteht aus allen (a1, . . . ,an ) ∈ Ω, für die genau k Komponenten kleiner oder gleich R sind. ⇒ |Ak| = ( ) (R) n k k (N-R)n-k . n (R) k ( N - R) n -k ⇒ P(Ak) = (N) n k (R) k (N - R) n -k k! (n - k)! = = (N) n n! R N - R k n - k . N n ( β ) gleichzeitig : Die n Kugeln werden durch einen Griff der Urne entnommen. Ω = { T | T ⊂ { 1, . . . , N }, | T | = n }. |Ω|= ( ). N n Ak besteht aus allen T ∈ Ω , die genau k Elemente kleiner oder gleich R enthalten. ⇒ |Ak| = ⇒ ( )( ) . R N -R k n -k R N - R k n - k P(Ak) = N n in Übereinstimmung mit ( α ) . Falls man nur noch an der Anzahl k von schwarzen Kugeln unter den n gezogenen Kugeln interessiert ist, wird durch pk : = P(Ak) , 0 ≤ k ≤ n, ein Wahrscheinlichkeitsmaß auf Ω´ = { 0, 1, . . . , n } definiert. (Die Ak sind paarweise unvereinbar und - 15 (Kapitel 2 : Laplacesche Wahrscheinlichkeitsräume) ∑ pk = n ∑ P(A k ) = P( U A k ) = P(Ω) = 1 . ) n k =0 k =0 k =0 n 2.4 Definition : Es seien N, R und n natürliche Zahlen mit N ≥ R, n . Das Wahrscheinlich- keitsmaß R N - R k n - k N n pk = P(k) = auf { 0, 1, . . . , n } heißt hypergeometrische Verteilung mit den Parametern n, R und N : Hg(n, R, N ) . b) Ziehen mit Zurücklegen : Jede gezogene Kugel wird sofort wieder in die Urne zurückgelegt; nach erneutem Durchmischen des Urneninhalts wird die nächste Kugel auf gut Glück gezogen. Ω = { 1, . . . , N }n = { (a1, . . . ,an ) | aj ∈ { 1, . . . , N }, 1 ≤ j ≤ n } |Ω|= Nn. Ak besteht aus allen (a1, . . . ,an ) ∈ Ω, für die genau k Komponenten kleiner oder gleich R sind. ⇒ |Ak| = ()R n k k (N-R)n-k n R k ( N - R) n -k = P(Ak) = Nn k ()p n k k qn-k , wobei p = R N und q = 1 – p . Wieder wird durch pk : = P(Ak) ein Wahrscheinlichkeitsmaß auf { 0, 1, . . . , n } definiert. 2.5 Definition : Es seien 0 ≤ p ≤ 1, q = 1 – p und n eine natürliche Zahl. Das Wahr- scheinlichkeitsmaß pk = P(k) = ()p n k k qn-k auf heißt Binomialverteilung mit den Parametern n und p : B(n, p) . n Bemerkung : ∑p k =0 n k = ∑ ( )p k =0 n k k q n -k = (p + q)n = 1n =1 . { 0, 1, . . . , n } - 16 (Kapitel 2 : Laplacesche Wahrscheinlichkeitsräume) Bemerkung : Falls N, die Anzahl aller Kugeln, im Verhältnis zu n, der Anzahl der gezo- genen Kugeln, sehr groß ist, dann ist Ziehen „ohne Zurücklegen“ und „mit Zurücklegen“ praktisch dasselbe. Wir zeigen: 2.6 Satz : Falls N, R → ∞ , so daß 0 < p < 1. R N → p , dann Hg(n, R, N)(k) → B(n, p)(k) für alle k ∈ { 0, 1, . . . , n }. N →∞ Wir sagen auch, Hg(n, R, N) konvergiert schwach gegen B(n, p) : d Hg(n, R, N) → B(n, p) . N →∞ Beweis : N-R N → 1 – p = q > 0 ⇒ N - R → ∞ . N →∞ N →∞ R N - R (R) k ( N - R) n -k k n -k R k ( N - R) n -k k n - k = n (R) k ( N - R) n -k = n R N - R k k N N (N) n (N) n N Nn n → N →∞ ()p n k k qn-k . Beispiel : In einer Stadt von zwei Millionen Einwohnern stimmen 40% für eine gewisse Partei. 100 Leute werden zufällig ausgewählt. Die Verteilung der Anzahl der Einwohner unter diesen ausgewählten 100, die für diese Partei stimmen, ist Hg(100, 800.000, 2.000.000) ≈ B(100; 0,4) . 3. n – facher Münzenwurf Ω = {Z,W}n ⇒ (mit unverfälschter Münze) : |Ω| = 2n. Für 0 ≤ k ≤ n – 1 sei Ak = „W erscheint zum ersten Mal beim (k + 1)ten Wurf“. Ak besteht aus allen n-tupeln in deren ersten k Komponenten ein Z und in deren (k + 1)ster Komponente ein W steht. ⇒ | Ak | = 2 n-(k+1) ⇒ P(Ak) = 2 n-(k+1) / 2 n = 2 – (k+1) (unabhängig von n !) - 17 (Kapitel 2 : Laplacesche Wahrscheinlichkeitsräume) 4. Wir betrachten jetzt das Beispiel 3 aus 1.2, in dem eine Münze so lange geworfen wird, bis W erscheint, und wobei die vorausgehenden Ergebnisse Z gezählt werden. Ω = NI0 ∪ { ∞ } . Wenn wir annehmen, daß die Münze unverfälscht ist, erhalten wir aus Beispiel 3: pk = P(k) = 2 – (k+1) , k ∈ NI0 . ∞ p ∞ = P( ∞ ) = P( NI 0 ) = 1 - P( NI0 ) = 1 - ∑2 - (k +1) = 1 - 1 = 0, k =0 was unserer intuitiven Erwartung, daß W irgendwann einmal auftreten muß, entspricht. Wir können uns deshalb auf den kleineren Stichprobenraum Ω´ = NI0 beschränken. 2.7 Definition : Es seien 0 < p ≤ 1 und q = 1 – p. Das Wahrscheinlichkeitsmaß pk = P(k) = p q k auf NI0 = { 0, 1, 2, 3, . . . } heißt geometrische Verteilung mit Parameter p : G(p) .