ETH Zürich FS 2013 D-MATH Hans Rudolf Künsch Koordinator Blanka Horvath Wahrscheinlichkeit & Statistik Musterlösung Serie 2 1. a) Sei e ∈ K mit den Ecken v und w. Es gilt: |{A ⊆ V : v ∈ A, w ∈ / A}| = |{A ⊆ V \ {v, w}}| , und deshalb n−2 2 : v ∈ A, w ∈ / A}| = n P ({v ∈ A, w ∈ Ac}) = |{A ⊆ V|{A ⊆ V }| 2 1 = . 4 Daraus folgt P(e ∈ KA) =P ({v ∈ A, w ∈ Ac} ∪ {v ∈ Ac, w ∈ A}) =P (v ∈ A, w ∈ Ac ) + P (v ∈ Ac , w ∈ A) 1 1 1 = + = . 4 4 2 b) " # X E [|KA |] = E 1{e∈KA } = e∈K = X X E 1{e∈KA } e∈K P (e ∈ KA ) = e∈K 1 |K| 2 c) Angenommen, es gelte |KA | < 12 |K| für alle Mengen A ⊆ V. Dann gilt: E [|KA |] = X P (A) |KA | < A X A d.h. P (A) 1 1 |K| = |K| 2 2 1 |K| 2 was im Widerspruch zu Aufgabe b) ist. Somit muss gelten: Es gibt mindestens eine Menge A ⊆ V mit |KA | ≥ 21 |K|. E [|KA |] < 2. a) X ∼ Bin(n, p): Sei X die Anzahl der gezogenen roten Kugeln in der Stichprobe, Bi das Ereignis “die i-te gezogene Kugel ist rot”. Im Urnenmodell mit Zurücklegen ist es klar, dass die Wahrscheinlichkeit P[Bi ] für alle i ∈ {1, . . . , n} denselben Wert hat. Wir bezeichnen die Wahrscheinlichkeit, dass die i-te gezogene Kugel rot ist, mit p. i) Die folgenden Berechnungen verwenden die Identität k nk = n n−1 . k−1 n n X X n k n−1 k n−k E[X] = k p (1 − p) =n p (1 − p)n−k k k − 1 k=0 k=1 n−1 X n−1 = np = np pj (1 − p)n−1−j j j=0 {z } | =1 (Summe aller W’keiten einer Bin(n − 1, p)-Vert.) ii) Beim Urnenmodell “mit Zurücklegen” ist KN n−1 |Bi | = p, P[Bi] = |Ω| = N n = K N (i = 1, . . . , n), und somit E[X] = n X E[1Bi ] = i=1 n X i=1 P[Bi] = n K = np. N b) X ∼ Hyp(N, K, n): i) Wir verwenden erneut die Identität k Berechnungen. n k = n n−1 k−1 in den folgenden −1−(K−1) =(Nn−1−(k−1) ) E[X] = n X k=0 = n K N k K k N −K n−k N n = n X k K K−1 k k−1 z }| { N −K n−k N −1 N n n−1 k=1 K−1 N −1−(K−1) n−1 X j n−1−j N −1 n−1 j=0 | {z } =1 (Summe aller W’keiten einer Hyp(N − 1, K − 1, n − 1)-Vert.) = n K N ii) Zunächst zeigen wir, dass auch beim Urnenmodell “ohne Zurücklegen” die Wahrscheinlichkeit P[Bi ] für alle i ∈ {1, . . . , n} denselben Wert hat (für alle i ∈ {1, . . . , n}). Bezeichund dieser Wert ist wieder P[Bi ] = K N nen wir nun mit Xi−1 die Anzahl roter Kugeln, die bis zum (i − 1)-ten Zug gezogen wurden. Dann ist Xi−1 ∼ Hyp(N, K, i − 1) und deshalb N −K K i−1 i−1 X X j (i−1)−j K−j K−j P[Bi] = P[Xi−1 = j] = N −(i−1) N −(i−1) N j=0 = K N −(i−1) j=0 | = K N −(i−1) = K . N i−1 j=0 i−1 X − N −K ) (Kj )((i−1)−j − N (i−1) {z } =1 1 N −(i−1) i−1 X j j=0 | N −K ) (Kj )((i−1)−j N (i−1) {z } =(i−1) K (Wie in b/i).) N (i−1)K 1 N −(i−1) N Deshalb ist E[X] = n X i=1 E[1Bi ] = n X i=1 . P[Bi] = n K N Bemerkung: Man kann P[Bi ] = K auch zeigen, indem man günstige und N mögliche Fälle vergleicht: Es gibt genau K Möglichkeiten eine rote Kugel an der i-ten Stelle zu plazieren, und dann noch (N − 1) · · · (N − n + 1) Möglichkeiten (unter Beachtung der Reihenfolge) die restlichen n−1 Kugeln aus den noch N − 1 übrigen zu ziehen, ingesamt gibt es N · · · (N − n + 1) Möglichkeiten (unter Beachtung der Reihenfolge), aus N Kugeln n zu ziehen, d.h. K · (N − 1) · · · (N − n + 1) K i| = = . P[Bi] = |B |Ω| N · · · (N − n + 1) N P 3. Betrachte die Irrfahrt (Sl )0≤l≤n definiert durch Sl := li=1 Xi und ( +1 falls die i-te Stimme für den Sieger, Xi := −1 sonst. Somit stellt Sl die Stimmendifferenz zur Zeit l dar. Wir betrachten das Laplace Modell mit Grundraum Ω = {ω ∈ {−1, +1}n | Sn (ω) = k}, was der Menge aller Pfade von (0, 0) nach (n, k) entspricht. Beachte, dass (n + k)/2 und (n − k)/2 beide ganze Zahlen sind. Wir möchten die Wahrscheinlichkeit von A := ∩nl=1 {ω ∈ Ω | Sl (ω) > 0} berechnen. Für die Bestimmung von |A|, |Ω| und somit von P[A] = |A| , betrachten wir weiter die Zufallsvariable Un , welche die Anzahl Schritte nach |Ω| oben beschreibt, d.h. Un = 2Un − n und somit Pn i=1 1{Xi =+1} . Insbesondere gilt Sn = Un −(n−Un ) = n |{Sn = 2j − n}| = |{Un = j}| = j (j = 0, . . . , n), und |{Sn = l}| = n n+l 2 n+l ∈ {0, . . . , n} . 2 (1) n . Daraus folgt |Ω| = |{Sn = k}| = n+k 2 Zur Berechnung von |A|: Offenbar gilt |A| = r − s, wobei r := Anzahl Pfade von (1, 1) nach (n, k) = Anzahl Pfade von (0, 0) nach (n − 1, k − 1), s := Anzahl Pfade von (1, 1) nach (n, k) welche das Niveau 0 annehmen. Analog zur Berechnung von |Ω|, erhält man aus Formel (1) n−1 r = n+k−2 . 2 Auf der anderen Seite ist s = Anzahl Pfade von (0, 0) nach (n − 1, k − 1) welche das Niveau −1 annehmen, aus dem Reflexionsprinzips, Lemma 2.2 auf Seite 10 im Skript (wir setzen a = 1 und b = k − 1, also ist −2a − b = −2 − (k − 1) = −k − 1), erhalten wir s = Anzahl Pfade von (0, 0) nach (n − 1, −(k + 1)), n−1 und somit, wieder mit Formel (1), s = n−k−2 . 2 Insgesamt ergibt sich also n−1 n−1 (n − 1)! (n − 1)! n−k − n−k r − s = n+k−2 − n−k−2 = n+k −1 ! 2 ! − 1 ! n+k ! 2 2 2 2 2 n (n − 1)! n+k n (n − 1)! n−k 1 n n+k 1 n n−k 2 2 n−k − n+k = = − n n+k n n+k 2 n n+k 2 ! 2 ! n n−k ! 2 ! 2 2 2 2 n k = n+k , n 2 und es folgt k −s = . P[A] = r|Ω| n 4. Die Aufgabe kann mit folgendem Code realisiert werden: longest_run<- function(N) { # computes the length of the longest run # in a random walk of length N # generation of N Bernoulli variables with p=1/2 x<-rbinom(N,1,0.5); # time when 1 changes to 0 and vice versa v<-c(0,(1:(N-1))[x[2:N]!=x[1:(N-1)]],N); k<-length(v); longest_run<-max(v[2:k]-v[1:(k-1)]); return(list(longest_run=longest_run)) }