¨Ubung zur Vorlesung Statistik I WS 2014

Werbung
Übung zur Vorlesung Statistik I
WS 2014-2015
Übungsblatt 5
17. November 2014
Aufgabe 13 (4 Punkte):
A
In einer Studie werden n = 15 Patienten behandelt. Die Wahrscheinlichkeit für die Heilung eines Patienten sei p = 0.8. Berechnen Sie mit R
die Wahrscheinlichkeiten für höchstens und für mindestens k = 10 und
k = 12 Heilungen.
B
In einer anderen Studie werden n = 150 Patienten behandelt. Berechnen
Sie die Wahrscheinlichkeit für höchstens und für mindestens k = 100 und
k = 120 Heilungen. Die Wahrscheinlichkeit für eine Heilung sei wieder
p = 0.8.
C
Zwei faire Würfel werden n = 150 mal geworfen. Berechnen Sie die Wahrscheinlichkeit, dass man genau k = 30 mal einen Pasch wirft. Mit welcher
Wahrscheinlichkeit wirft man mindestens k = 30 mal einen Pasch?
D
Berechnen Sie die Wahrscheinlichkeiten, dass sich unter den n Würfen
k = 0, 1, . . . , n mal ein Pasch befindet. Für welches k wird die Wahrscheinlichkeit maximal?
Hinweis: Die Elementarwahrscheinlichkeiten b(k, n, p) der Binomialverteilung werden in R mit der Funktion dbinom berechnet. Die kumulierte
Wahrscheinlichkeitsverteilung ist in der Funktion pbinom implementiert.
Weiter nützliche Funktionen: max und which.
Lösung:
A
>
>
>
>
k <- c(10,12)
n <- 15
# höchstens k Heilungen:
pbinom(k,n,0.8)
[1] 0.1642337 0.6019768
> # mindestens k Heilungen:
> 1 - pbinom(k-1,n,0.8)
[1] 0.9389486 0.6481621
B
>
>
>
>
k <- c(100,120)
n <- 150
# höchstens k Heilungen:
pbinom(k,n,0.8)
[1] 8.845197e-05 5.325434e-01
> # mindestens k Heilungen:
> 1 - pbinom(k-1,n,0.8)
[1] 0.9999577 0.5486532
C
1
.
Die Wahrscheinlichkeit einen bestimmten Pasch zu werfen, beträgt 36
1
Daher ist die Wahrscheinlichkeit irgendeinen Pasch zu werfen p = 6 . Die
Wahrscheinlichkeit für genau k = 30 mal Pasch ist dann:
> dbinom(30,150,1/6)
[1] 0.0458725
Mindestens 30 mal Pasch erhält man mit der Wahrscheinlichkeit
> 1-pbinom(29,150,1/6)
[1] 0.1617218
D
Die Wahrscheinlichkeiten für k = 0, . . . , n mal Pasch erhält man in R am
einfachsten durch
> n <- 150
> WS <- dbinom(0:n,n,1/6)
> WS
[1]
[5]
[9]
[13]
[17]
[21]
1.326823e-12
4.301089e-08
1.785700e-05
9.370491e-04
1.191440e-02
5.052294e-02
3.980470e-11
2.511836e-07
5.634876e-05
1.989427e-03
1.878269e-02
6.255222e-02
5.930900e-10
1.214054e-06
1.589035e-04
3.893593e-03
2.775665e-02
7.335669e-02
5.851822e-09
4.994965e-06
4.044816e-04
7.060383e-03
3.856713e-02
8.164918e-02
[25] 8.641205e-02 8.710335e-02 8.375322e-02 7.692888e-02
[29] 6.758752e-02 5.686674e-02 4.587250e-02 3.551420e-02
[33] 2.641368e-02 1.888979e-02 1.300062e-02 8.617552e-03
[37] 5.505658e-03 3.392676e-03 2.017749e-03 1.158912e-03
[41] 6.431964e-04 3.451298e-04 1.791388e-04 8.998600e-05
[45] 4.376592e-05 2.061861e-05 9.412844e-06 4.165684e-06
[49] 1.787773e-06 7.442972e-07 3.006961e-07 1.179200e-07
[53] 4.490032e-08 1.660465e-08 5.965373e-09 2.082457e-09
[57] 7.065481e-10 2.330369e-10 7.473252e-11 2.330641e-11
[61] 7.069612e-12 2.086115e-12 5.989169e-13 1.673165e-13
[65] 4.548917e-14 1.203713e-14 3.100474e-15 7.774322e-16
[69] 1.897849e-16 4.510830e-17 1.043935e-17 2.352529e-18
[73] 5.162495e-19 1.103218e-19 2.295886e-20 4.652997e-21
[77] 9.183546e-22 1.765149e-22 3.303997e-23 6.022475e-24
[81] 1.068989e-24 1.847636e-25 3.109436e-26 5.094980e-27
[85] 8.127706e-28 1.262185e-28 1.907954e-29 2.807105e-30
[89] 4.019263e-31 5.599873e-32 7.590939e-33 1.001003e-33
[93] 1.283895e-34 1.601417e-35 1.942145e-36 2.289686e-37
[97] 2.623599e-38 2.921120e-39 3.159579e-40 3.319154e-41
[101] 3.385537e-42 3.352017e-43 3.220565e-44 3.001692e-45
[105] 2.713067e-46 2.377164e-47 2.018347e-48 1.659949e-49
[109] 1.321811e-50 1.018643e-51 7.593523e-53 5.472809e-54
[113] 3.811421e-55 2.563433e-56 1.663983e-57 1.041798e-58
[117] 6.286713e-60 3.653816e-61 2.043660e-62 1.099111e-63
[121] 5.678741e-65 2.815905e-66 1.338709e-67 6.094934e-69
[125] 2.654246e-70 1.104166e-71 4.381612e-73 1.656042e-74
[129] 5.951402e-76 2.029935e-77 6.558253e-79 2.002520e-80
[133] 5.764830e-82 1.560405e-83 3.959237e-85 9.384858e-87
[137] 2.070189e-88 4.231044e-90 7.971532e-92 1.376380e-93
[141] 2.162882e-95 3.067918e-97 3.888910e-99 4.351228e-101
[145] 4.230361e-103 3.500988e-105 2.397937e-107 1.305000e-109
[149] 5.290540e-112 1.420279e-114 1.893706e-117
Die maximale Wahrscheinlichkeit beträgt damit
> WSmax <- max(WS)
> WSmax
[1] 0.08710335
Die Position von WSmax im Vektor kann durch
> pos <- which(WS==WSmax)
> pos
[1] 26
ermittelt werden. Da der erste Eintrag im Vektor WS k=0 entspricht, wird
bei
> pos-1
[1] 25
mal Pasch die maximale Wahrscheinlichkeit erreicht.
Aufgabe 14 (4 Punkte):
A
Simulieren Sie ein Münzwurfexperiment mit n = 150 unabhängigen Würfen. Eine Seite der Münze sei mit 1, die andere mit 0 bezeichnet. Die
Wahrscheinlichkeit für 1 sei p = 0.53 (die Münze ist also nicht fair!).
Hinweis: Schreiben Sie das Ergebnis der Simulation in einen numerischen
Vektor der Länge 150. Benutzen Sie die Funktion rbinom. Initialisieren
Sie den Zufallszahlengenerator mit der Funktion set.seed.
B
Bestimmen Sie die absolute Häufigkeit k der Einsen in Ihrer Simulation.
C
Angenommen das gleiche Münzwurfexperiment wird nun mit einer fairen Münze wiederholt. Berechnen Sie die Wahrscheinlichkeit, dass dabei
mindestens max{k, n − k} oder höchstens min{k, n − k} Einsen erzielt
werden. Könnte Ihr Ergebnis der Simulation auch durch Werfen einer
fairen Münze zustande gekommen sein?
D
Wiederholen Sie alle Schritte der vorangegangenen Teilaufgaben mit n =
2000 unabhängigen Wiederholungen. Würde man jetzt noch annehmen,
dass das Ergebnis durch das Werfen einer fairen Münze zustande gekommen sein könnte?
Lösung:
A
>
>
>
>
set.seed(12006)
n <- 150
Z <- rbinom(n, size=1,prob=0.53)
Z
[1]
[33]
[65]
[97]
[129]
0
0
0
1
0
0
1
0
1
1
1
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
1
1
0
1
1
0
1
1
1
0
0
0
1
1
0
0
0
1
1
1
1
1
1
0
1
0
1
1
1
1
1
0
1
1
0
1
0
0
0
0
0
1
1
1
0
1
0
0
0
0
0
1
1
1
1
0
1
0
0
0
0
1
1
1
0
1
1
1
0
1
0
0
0
1
1
1
1
0
0
0
0
0
0
1
1
0
0
1
1
0
0
1
0
1
1
1
1
0
0
1
1
1
1
1
1
1
1
0
1
1
1
1
0
1
0
1
0
1
1
0
0
1
B
> table(Z)
Z
0 1
70 80
oder
> k <- sum(Z)
> k
[1] 80
C
> pbinom(min(c(k,n-k)),size=n,prob=0.5) +
+ 1- pbinom(max(c(k,n-k))-1,size=n,prob=0.5)
[1] 0.4625495
Das Ergebnis der Simulation könnte durchaus auch durch das Werfen
einer fairen Münze zustande gekommen sein.
D
>
>
>
>
n <- 2000
Z2 <- rbinom(n, size=1,prob=0.53)
k <- sum(Z2)
k
[1] 1077
> pbinom(min(c(k,n-k)),size=n,prob=0.5) +
+ 1- pbinom(max(c(k,n-k))-1,size=n,prob=0.5)
[1] 0.0006199947
Es ist sehr unwahrscheinlich, dass ein Münzwurfexperiment mit einer
fairen Münze zu einem solchen Ergebnis führt.
Aufgabe 15 (4 Punkte): Es sei bekannt, dass im menschlichen Genom durchschnittlich eine Ankersequenz pro 1267 bp (Basenpaare) auftritt.
A
Wie viele Anker treten durchschnittlich in 1000 bp auf?
B
Wie lang muss ein DNA Fragment mindestens sein, damit es mit einer
Wahrscheinlichkeit von mehr als 90% mindestens einen Anker enthält?
Hinweis: Gehen Sie davon aus, dass die Anzahl der Anker in einem DNA
Abschnitt der Länge L poissonverteilt ist. Der Parameter λ der Poissonverteilung ist dabei die durchschnittliche Anzahl der Anker in einem
DNA Abschnitt der Länge L.
Lösung:
A
Wenn es durchschnittlich 1 Anker pro 1267 bp gibt, dann beträgt die
durchschnittliche Anzahl der Anker pro 1000 bp
> lambda0 <- 1000/1267
> lambda0
[1] 0.789266
B
Die durchschnittliche Anzahl der Anker in einem DNA Abschnitt der
Länge L ∗ 1000 bp beträgt
λ = L ∗ λ0 = L ∗ 1000/1267.
Wir nehmen an, dass die Anzahl der Anker k in dem DNA Abschnitt
poissonverteilt mit λ = L ∗ 1000/1267 ist. Die Wahrscheinlichkeit für
mindestens einen Anker ist dann
1 − p(Lλ, 0) − p(Lλ, 0) = 1 − e−L∗1000/1267 .
Diese Wahrscheinlichkeit soll ≥ 0.90 sein. Nach Auflösen der Ungleichung
1 − e−L∗1000/1267 ≥ 0.90
erhält man
L ≥ − log(0.1) ∗ 1267/1000.
Das DNA Fragment muss also mindestens
> -log(0.1)*1267/1000
[1] 2.917375
mal 1000 bp lang sein, also mindestens 2918 bp, damit es mit einer Wahrscheinlichkeit von über 90% mindestens einen Anker enthält.
Aufgabe 16 (4 Punkte): Stellen Sie die Binomialverteilung b(n, 2/n, k) der
Poissonverteilung p(k, 2) (k = 0, . . . , 10) in einem Säulendiagramm gegenüber.
Erstellen Sie für n = 10, 100, 1000 jeweils ein Diagramm. Ordnen Sie die Diagramme nebeneinander an. Zeichnen Sie die Säulen für die Wahrscheinlichkeiten der Binomial- und Possonverteilung in verschiedenen Farben. Die Säulen
sollen sich nicht überdecken. Interpretieren Sie die Graphiken.
Hinweis: Nach dem Befehl par(mfrow=c(1,3)) werden die drei nächsten Plots
nebeneinander angeordnet. Fügen Sie dem Plot mit den Wahrscheinlichkeiten
der Binomialverteilung (Befehl plot) durch den Befehl points die Wahrscheinlichkeiten der Poissonverteilung an. Zeichnen Sie die Säulen der Binomialverteilung bei k = 0, . . . , n und die der Poissonverteilung knapp daneben. Verwenden
Sie in beiden Plotbefehlen die Option type=’h’.
Lösung:
>
>
>
>
>
+
>
>
>
>
+
>
>
>
>
+
>
>
PAR <- par(mfrow=c(1,3))
jitter <- 0.2
B <- dbinom(0:10,size=10,prob=2/10)
P <- dpois(0:10,lambda=2)
plot(x=0:10,y=B, col="red", type="h", main=expression(n==10),
xlab="k")
points(x=(0:10)+jitter,y=P, col="blue", type="h")
B <- dbinom(0:10,size=100,prob=2/100)
P <- dpois(0:10,lambda=2)
plot(x=0:10,y=B, col="red", type="h", main=expression(n==100),
xlab="k")
points(x=(0:10)+jitter,y=P, col="blue", type="h")
B <- dbinom(0:10,size=10000,prob=2/10000)
P <- dpois(0:10,lambda=2)
plot(x=0:10,y=B, col="red", type="h", main=expression(n==1000),
xlab="k")
points(x=(0:10)+jitter,y=P, col="blue", type="h")
par(PAR)
n = 100
n = 1000
0
2
4
6
k
8
10
B
0.00
0.00
0.00
0.05
0.05
0.05
0.10
0.10
B
0.10
B
0.15
0.15
0.15
0.20
0.20
0.20
0.25
0.25
0.25
0.30
n = 10
0
2
4
6
k
8
10
0
2
4
6
8
10
k
An den Graphiken kann man recht gut die Gültigkeit des Poissonschen Grenzwertsatzes erkennen.
Schicken Sie Ihre Lösung bis spätestens Sonntag, den 23.11.2014 direkt an
Ihre(n) Tutor(in).
Herunterladen