Übung zur Vorlesung Statistik I WS 2014-2015 Übungsblatt 5 17. November 2014 Aufgabe 13 (4 Punkte): A In einer Studie werden n = 15 Patienten behandelt. Die Wahrscheinlichkeit für die Heilung eines Patienten sei p = 0.8. Berechnen Sie mit R die Wahrscheinlichkeiten für höchstens und für mindestens k = 10 und k = 12 Heilungen. B In einer anderen Studie werden n = 150 Patienten behandelt. Berechnen Sie die Wahrscheinlichkeit für höchstens und für mindestens k = 100 und k = 120 Heilungen. Die Wahrscheinlichkeit für eine Heilung sei wieder p = 0.8. C Zwei faire Würfel werden n = 150 mal geworfen. Berechnen Sie die Wahrscheinlichkeit, dass man genau k = 30 mal einen Pasch wirft. Mit welcher Wahrscheinlichkeit wirft man mindestens k = 30 mal einen Pasch? D Berechnen Sie die Wahrscheinlichkeiten, dass sich unter den n Würfen k = 0, 1, . . . , n mal ein Pasch befindet. Für welches k wird die Wahrscheinlichkeit maximal? Hinweis: Die Elementarwahrscheinlichkeiten b(k, n, p) der Binomialverteilung werden in R mit der Funktion dbinom berechnet. Die kumulierte Wahrscheinlichkeitsverteilung ist in der Funktion pbinom implementiert. Weiter nützliche Funktionen: max und which. Lösung: A > > > > k <- c(10,12) n <- 15 # höchstens k Heilungen: pbinom(k,n,0.8) [1] 0.1642337 0.6019768 > # mindestens k Heilungen: > 1 - pbinom(k-1,n,0.8) [1] 0.9389486 0.6481621 B > > > > k <- c(100,120) n <- 150 # höchstens k Heilungen: pbinom(k,n,0.8) [1] 8.845197e-05 5.325434e-01 > # mindestens k Heilungen: > 1 - pbinom(k-1,n,0.8) [1] 0.9999577 0.5486532 C 1 . Die Wahrscheinlichkeit einen bestimmten Pasch zu werfen, beträgt 36 1 Daher ist die Wahrscheinlichkeit irgendeinen Pasch zu werfen p = 6 . Die Wahrscheinlichkeit für genau k = 30 mal Pasch ist dann: > dbinom(30,150,1/6) [1] 0.0458725 Mindestens 30 mal Pasch erhält man mit der Wahrscheinlichkeit > 1-pbinom(29,150,1/6) [1] 0.1617218 D Die Wahrscheinlichkeiten für k = 0, . . . , n mal Pasch erhält man in R am einfachsten durch > n <- 150 > WS <- dbinom(0:n,n,1/6) > WS [1] [5] [9] [13] [17] [21] 1.326823e-12 4.301089e-08 1.785700e-05 9.370491e-04 1.191440e-02 5.052294e-02 3.980470e-11 2.511836e-07 5.634876e-05 1.989427e-03 1.878269e-02 6.255222e-02 5.930900e-10 1.214054e-06 1.589035e-04 3.893593e-03 2.775665e-02 7.335669e-02 5.851822e-09 4.994965e-06 4.044816e-04 7.060383e-03 3.856713e-02 8.164918e-02 [25] 8.641205e-02 8.710335e-02 8.375322e-02 7.692888e-02 [29] 6.758752e-02 5.686674e-02 4.587250e-02 3.551420e-02 [33] 2.641368e-02 1.888979e-02 1.300062e-02 8.617552e-03 [37] 5.505658e-03 3.392676e-03 2.017749e-03 1.158912e-03 [41] 6.431964e-04 3.451298e-04 1.791388e-04 8.998600e-05 [45] 4.376592e-05 2.061861e-05 9.412844e-06 4.165684e-06 [49] 1.787773e-06 7.442972e-07 3.006961e-07 1.179200e-07 [53] 4.490032e-08 1.660465e-08 5.965373e-09 2.082457e-09 [57] 7.065481e-10 2.330369e-10 7.473252e-11 2.330641e-11 [61] 7.069612e-12 2.086115e-12 5.989169e-13 1.673165e-13 [65] 4.548917e-14 1.203713e-14 3.100474e-15 7.774322e-16 [69] 1.897849e-16 4.510830e-17 1.043935e-17 2.352529e-18 [73] 5.162495e-19 1.103218e-19 2.295886e-20 4.652997e-21 [77] 9.183546e-22 1.765149e-22 3.303997e-23 6.022475e-24 [81] 1.068989e-24 1.847636e-25 3.109436e-26 5.094980e-27 [85] 8.127706e-28 1.262185e-28 1.907954e-29 2.807105e-30 [89] 4.019263e-31 5.599873e-32 7.590939e-33 1.001003e-33 [93] 1.283895e-34 1.601417e-35 1.942145e-36 2.289686e-37 [97] 2.623599e-38 2.921120e-39 3.159579e-40 3.319154e-41 [101] 3.385537e-42 3.352017e-43 3.220565e-44 3.001692e-45 [105] 2.713067e-46 2.377164e-47 2.018347e-48 1.659949e-49 [109] 1.321811e-50 1.018643e-51 7.593523e-53 5.472809e-54 [113] 3.811421e-55 2.563433e-56 1.663983e-57 1.041798e-58 [117] 6.286713e-60 3.653816e-61 2.043660e-62 1.099111e-63 [121] 5.678741e-65 2.815905e-66 1.338709e-67 6.094934e-69 [125] 2.654246e-70 1.104166e-71 4.381612e-73 1.656042e-74 [129] 5.951402e-76 2.029935e-77 6.558253e-79 2.002520e-80 [133] 5.764830e-82 1.560405e-83 3.959237e-85 9.384858e-87 [137] 2.070189e-88 4.231044e-90 7.971532e-92 1.376380e-93 [141] 2.162882e-95 3.067918e-97 3.888910e-99 4.351228e-101 [145] 4.230361e-103 3.500988e-105 2.397937e-107 1.305000e-109 [149] 5.290540e-112 1.420279e-114 1.893706e-117 Die maximale Wahrscheinlichkeit beträgt damit > WSmax <- max(WS) > WSmax [1] 0.08710335 Die Position von WSmax im Vektor kann durch > pos <- which(WS==WSmax) > pos [1] 26 ermittelt werden. Da der erste Eintrag im Vektor WS k=0 entspricht, wird bei > pos-1 [1] 25 mal Pasch die maximale Wahrscheinlichkeit erreicht. Aufgabe 14 (4 Punkte): A Simulieren Sie ein Münzwurfexperiment mit n = 150 unabhängigen Würfen. Eine Seite der Münze sei mit 1, die andere mit 0 bezeichnet. Die Wahrscheinlichkeit für 1 sei p = 0.53 (die Münze ist also nicht fair!). Hinweis: Schreiben Sie das Ergebnis der Simulation in einen numerischen Vektor der Länge 150. Benutzen Sie die Funktion rbinom. Initialisieren Sie den Zufallszahlengenerator mit der Funktion set.seed. B Bestimmen Sie die absolute Häufigkeit k der Einsen in Ihrer Simulation. C Angenommen das gleiche Münzwurfexperiment wird nun mit einer fairen Münze wiederholt. Berechnen Sie die Wahrscheinlichkeit, dass dabei mindestens max{k, n − k} oder höchstens min{k, n − k} Einsen erzielt werden. Könnte Ihr Ergebnis der Simulation auch durch Werfen einer fairen Münze zustande gekommen sein? D Wiederholen Sie alle Schritte der vorangegangenen Teilaufgaben mit n = 2000 unabhängigen Wiederholungen. Würde man jetzt noch annehmen, dass das Ergebnis durch das Werfen einer fairen Münze zustande gekommen sein könnte? Lösung: A > > > > set.seed(12006) n <- 150 Z <- rbinom(n, size=1,prob=0.53) Z [1] [33] [65] [97] [129] 0 0 0 1 0 0 1 0 1 1 1 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 1 1 1 0 1 1 0 1 1 1 0 0 0 1 1 0 0 0 1 1 1 1 1 1 0 1 0 1 1 1 1 1 0 1 1 0 1 0 0 0 0 0 1 1 1 0 1 0 0 0 0 0 1 1 1 1 0 1 0 0 0 0 1 1 1 0 1 1 1 0 1 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 1 0 0 1 0 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 1 0 1 1 0 0 1 B > table(Z) Z 0 1 70 80 oder > k <- sum(Z) > k [1] 80 C > pbinom(min(c(k,n-k)),size=n,prob=0.5) + + 1- pbinom(max(c(k,n-k))-1,size=n,prob=0.5) [1] 0.4625495 Das Ergebnis der Simulation könnte durchaus auch durch das Werfen einer fairen Münze zustande gekommen sein. D > > > > n <- 2000 Z2 <- rbinom(n, size=1,prob=0.53) k <- sum(Z2) k [1] 1077 > pbinom(min(c(k,n-k)),size=n,prob=0.5) + + 1- pbinom(max(c(k,n-k))-1,size=n,prob=0.5) [1] 0.0006199947 Es ist sehr unwahrscheinlich, dass ein Münzwurfexperiment mit einer fairen Münze zu einem solchen Ergebnis führt. Aufgabe 15 (4 Punkte): Es sei bekannt, dass im menschlichen Genom durchschnittlich eine Ankersequenz pro 1267 bp (Basenpaare) auftritt. A Wie viele Anker treten durchschnittlich in 1000 bp auf? B Wie lang muss ein DNA Fragment mindestens sein, damit es mit einer Wahrscheinlichkeit von mehr als 90% mindestens einen Anker enthält? Hinweis: Gehen Sie davon aus, dass die Anzahl der Anker in einem DNA Abschnitt der Länge L poissonverteilt ist. Der Parameter λ der Poissonverteilung ist dabei die durchschnittliche Anzahl der Anker in einem DNA Abschnitt der Länge L. Lösung: A Wenn es durchschnittlich 1 Anker pro 1267 bp gibt, dann beträgt die durchschnittliche Anzahl der Anker pro 1000 bp > lambda0 <- 1000/1267 > lambda0 [1] 0.789266 B Die durchschnittliche Anzahl der Anker in einem DNA Abschnitt der Länge L ∗ 1000 bp beträgt λ = L ∗ λ0 = L ∗ 1000/1267. Wir nehmen an, dass die Anzahl der Anker k in dem DNA Abschnitt poissonverteilt mit λ = L ∗ 1000/1267 ist. Die Wahrscheinlichkeit für mindestens einen Anker ist dann 1 − p(Lλ, 0) − p(Lλ, 0) = 1 − e−L∗1000/1267 . Diese Wahrscheinlichkeit soll ≥ 0.90 sein. Nach Auflösen der Ungleichung 1 − e−L∗1000/1267 ≥ 0.90 erhält man L ≥ − log(0.1) ∗ 1267/1000. Das DNA Fragment muss also mindestens > -log(0.1)*1267/1000 [1] 2.917375 mal 1000 bp lang sein, also mindestens 2918 bp, damit es mit einer Wahrscheinlichkeit von über 90% mindestens einen Anker enthält. Aufgabe 16 (4 Punkte): Stellen Sie die Binomialverteilung b(n, 2/n, k) der Poissonverteilung p(k, 2) (k = 0, . . . , 10) in einem Säulendiagramm gegenüber. Erstellen Sie für n = 10, 100, 1000 jeweils ein Diagramm. Ordnen Sie die Diagramme nebeneinander an. Zeichnen Sie die Säulen für die Wahrscheinlichkeiten der Binomial- und Possonverteilung in verschiedenen Farben. Die Säulen sollen sich nicht überdecken. Interpretieren Sie die Graphiken. Hinweis: Nach dem Befehl par(mfrow=c(1,3)) werden die drei nächsten Plots nebeneinander angeordnet. Fügen Sie dem Plot mit den Wahrscheinlichkeiten der Binomialverteilung (Befehl plot) durch den Befehl points die Wahrscheinlichkeiten der Poissonverteilung an. Zeichnen Sie die Säulen der Binomialverteilung bei k = 0, . . . , n und die der Poissonverteilung knapp daneben. Verwenden Sie in beiden Plotbefehlen die Option type=’h’. Lösung: > > > > > + > > > > + > > > > + > > PAR <- par(mfrow=c(1,3)) jitter <- 0.2 B <- dbinom(0:10,size=10,prob=2/10) P <- dpois(0:10,lambda=2) plot(x=0:10,y=B, col="red", type="h", main=expression(n==10), xlab="k") points(x=(0:10)+jitter,y=P, col="blue", type="h") B <- dbinom(0:10,size=100,prob=2/100) P <- dpois(0:10,lambda=2) plot(x=0:10,y=B, col="red", type="h", main=expression(n==100), xlab="k") points(x=(0:10)+jitter,y=P, col="blue", type="h") B <- dbinom(0:10,size=10000,prob=2/10000) P <- dpois(0:10,lambda=2) plot(x=0:10,y=B, col="red", type="h", main=expression(n==1000), xlab="k") points(x=(0:10)+jitter,y=P, col="blue", type="h") par(PAR) n = 100 n = 1000 0 2 4 6 k 8 10 B 0.00 0.00 0.00 0.05 0.05 0.05 0.10 0.10 B 0.10 B 0.15 0.15 0.15 0.20 0.20 0.20 0.25 0.25 0.25 0.30 n = 10 0 2 4 6 k 8 10 0 2 4 6 8 10 k An den Graphiken kann man recht gut die Gültigkeit des Poissonschen Grenzwertsatzes erkennen. Schicken Sie Ihre Lösung bis spätestens Sonntag, den 23.11.2014 direkt an Ihre(n) Tutor(in).