Lösungsvorschlag 2 - D-MATH

Werbung
ETH Zürich FS 2013
D-MATH
Hans Rudolf Künsch
Koordinator
Blanka Horvath
Wahrscheinlichkeit & Statistik
Musterlösung Serie 2
1. a) Sei e ∈ K mit den Ecken v und w. Es gilt:
|{A ⊆ V : v ∈ A, w ∈
/ A}| = |{A ⊆ V \ {v, w}}| ,
und deshalb
n−2
2
: v ∈ A, w ∈
/ A}|
= n
P ({v ∈ A, w ∈ Ac}) = |{A ⊆ V|{A
⊆ V }|
2
1
= .
4
Daraus folgt
P(e ∈ KA) =P ({v ∈ A, w ∈ Ac} ∪ {v ∈ Ac, w ∈ A})
=P (v ∈ A, w ∈ Ac ) + P (v ∈ Ac , w ∈ A)
1
1 1
= + = .
4 4
2
b)
"
#
X
E [|KA |] = E
1{e∈KA } =
e∈K
=
X
X
E 1{e∈KA }
e∈K
P (e ∈ KA ) =
e∈K
1
|K|
2
c) Angenommen, es gelte |KA | < 12 |K| für alle Mengen A ⊆ V. Dann gilt:
E [|KA |] =
X
P (A) |KA | <
A
X
A
d.h.
P (A)
1
1
|K| = |K|
2
2
1
|K|
2
was im Widerspruch zu Aufgabe b) ist. Somit muss gelten: Es gibt mindestens eine Menge A ⊆ V mit |KA | ≥ 21 |K|.
E [|KA |] <
2. a) X ∼ Bin(n, p):
Sei X die Anzahl der gezogenen roten Kugeln in der Stichprobe, Bi das
Ereignis “die i-te gezogene Kugel ist rot”. Im Urnenmodell mit Zurücklegen
ist es klar, dass die Wahrscheinlichkeit P[Bi ] für alle i ∈ {1, . . . , n} denselben
Wert hat. Wir bezeichnen die Wahrscheinlichkeit, dass die i-te gezogene
Kugel rot ist, mit p.
i) Die folgenden Berechnungen verwenden die Identität k nk = n n−1
.
k−1
n
n X
X
n k
n−1 k
n−k
E[X] =
k
p (1 − p)
=n
p (1 − p)n−k
k
k
−
1
k=0
k=1
n−1
X n−1
= np
= np
pj (1 − p)n−1−j
j
j=0
{z
}
|
=1 (Summe aller W’keiten einer Bin(n − 1, p)-Vert.)
ii) Beim Urnenmodell “mit Zurücklegen” ist
KN n−1
|Bi |
= p,
P[Bi] = |Ω| = N n = K
N
(i = 1, . . . , n),
und somit
E[X] =
n
X
E[1Bi ] =
i=1
n
X
i=1
P[Bi] = n K
= np.
N
b) X ∼ Hyp(N, K, n):
i) Wir verwenden erneut die Identität k
Berechnungen.
n
k
= n
n−1
k−1
in den folgenden
−1−(K−1)
=(Nn−1−(k−1)
)
E[X] =
n
X
k=0
= n
K
N
k
K
k
N −K
n−k
N
n
=
n
X
k
K K−1
k k−1
z }| {
N −K
n−k
N −1
N
n n−1
k=1
K−1 N −1−(K−1)
n−1
X j
n−1−j
N −1
n−1
j=0
|
{z
}
=1 (Summe aller W’keiten einer Hyp(N − 1, K − 1, n − 1)-Vert.)
= n
K
N
ii) Zunächst zeigen wir, dass auch beim Urnenmodell “ohne Zurücklegen”
die Wahrscheinlichkeit P[Bi ] für alle i ∈ {1, . . . , n} denselben Wert hat
(für alle i ∈ {1, . . . , n}). Bezeichund dieser Wert ist wieder P[Bi ] = K
N
nen wir nun mit Xi−1 die Anzahl roter Kugeln, die bis zum (i − 1)-ten
Zug gezogen wurden. Dann ist Xi−1 ∼ Hyp(N, K, i − 1) und deshalb
N −K K
i−1
i−1
X
X
j
(i−1)−j
K−j
K−j
P[Bi] =
P[Xi−1 = j] = N −(i−1)
N −(i−1)
N
j=0
=
K
N −(i−1)
j=0
|
=
K
N −(i−1)
=
K
.
N
i−1
j=0
i−1
X
−
N −K
)
(Kj )((i−1)−j
−
N
(i−1)
{z
}
=1
1
N −(i−1)
i−1
X
j
j=0
|
N −K
)
(Kj )((i−1)−j
N
(i−1)
{z
}
=(i−1) K
(Wie in b/i).)
N
(i−1)K
1
N −(i−1)
N
Deshalb ist
E[X] =
n
X
i=1
E[1Bi ] =
n
X
i=1
.
P[Bi] = n K
N
Bemerkung: Man kann P[Bi ] = K
auch zeigen, indem man günstige und
N
mögliche Fälle vergleicht: Es gibt genau K Möglichkeiten eine rote Kugel
an der i-ten Stelle zu plazieren, und dann noch (N − 1) · · · (N − n + 1)
Möglichkeiten (unter Beachtung der Reihenfolge) die restlichen n−1 Kugeln
aus den noch N − 1 übrigen zu ziehen, ingesamt gibt es N · · · (N − n + 1)
Möglichkeiten (unter Beachtung der Reihenfolge), aus N Kugeln n zu ziehen,
d.h.
K · (N − 1) · · · (N − n + 1)
K
i|
=
= .
P[Bi] = |B
|Ω|
N · · · (N − n + 1)
N
P
3. Betrachte die Irrfahrt (Sl )0≤l≤n definiert durch Sl := li=1 Xi und
(
+1 falls die i-te Stimme für den Sieger,
Xi :=
−1 sonst.
Somit stellt Sl die Stimmendifferenz zur Zeit l dar. Wir betrachten das Laplace
Modell mit Grundraum Ω = {ω ∈ {−1, +1}n | Sn (ω) = k}, was der Menge aller
Pfade von (0, 0) nach (n, k) entspricht. Beachte, dass (n + k)/2 und (n − k)/2
beide ganze Zahlen sind. Wir möchten die Wahrscheinlichkeit von A := ∩nl=1 {ω ∈
Ω | Sl (ω) > 0} berechnen. Für die Bestimmung von |A|, |Ω| und somit von P[A] =
|A|
, betrachten wir weiter die Zufallsvariable Un , welche die Anzahl Schritte nach
|Ω|
oben beschreibt, d.h. Un =
2Un − n und somit
Pn
i=1
1{Xi =+1} . Insbesondere gilt Sn = Un −(n−Un ) =
n
|{Sn = 2j − n}| = |{Un = j}| =
j
(j = 0, . . . , n),
und
|{Sn = l}| =
n
n+l
2
n+l
∈ {0, . . . , n} .
2
(1)
n
.
Daraus folgt |Ω| = |{Sn = k}| = n+k
2
Zur Berechnung von |A|: Offenbar gilt |A| = r − s, wobei
r := Anzahl Pfade von (1, 1) nach (n, k) = Anzahl Pfade von (0, 0) nach (n − 1, k − 1),
s := Anzahl Pfade von (1, 1) nach (n, k) welche das Niveau 0 annehmen.
Analog zur Berechnung von |Ω|, erhält man aus Formel (1)
n−1
r = n+k−2 .
2
Auf der anderen Seite ist
s = Anzahl Pfade von (0, 0) nach (n − 1, k − 1) welche das Niveau −1 annehmen,
aus dem Reflexionsprinzips, Lemma 2.2 auf Seite 10 im Skript (wir setzen a = 1
und b = k − 1, also ist −2a − b = −2 − (k − 1) = −k − 1), erhalten wir
s = Anzahl Pfade von (0, 0) nach (n − 1, −(k + 1)),
n−1
und somit, wieder mit Formel (1), s = n−k−2
.
2
Insgesamt ergibt sich also
n−1
n−1
(n − 1)!
(n − 1)!
n−k − n−k
r − s = n+k−2 − n−k−2 = n+k
−1 ! 2 !
− 1 ! n+k
!
2
2
2
2
2
n (n − 1)! n+k
n (n − 1)! n−k
1 n n+k
1 n n−k
2
2
n−k −
n+k =
=
−
n n+k
n n+k
2
n n+k
2
! 2 ! n n−k
! 2 !
2
2
2
2
n k
= n+k
,
n
2
und es folgt
k
−s
= .
P[A] = r|Ω|
n
4. Die Aufgabe kann mit folgendem Code realisiert werden:
longest_run<- function(N)
{
# computes the length of the longest run
# in a random walk of length N
# generation of N Bernoulli variables with p=1/2
x<-rbinom(N,1,0.5);
# time when 1 changes to 0 and vice versa
v<-c(0,(1:(N-1))[x[2:N]!=x[1:(N-1)]],N);
k<-length(v);
longest_run<-max(v[2:k]-v[1:(k-1)]);
return(list(longest_run=longest_run))
}
Herunterladen