Übung zur Vorlesung Statistik I für Biowissenschaften WS 2015-2016 Übungsblatt 9 14. Dezember 2015 Aufgabe 27 (2 Punkte): Seien X und Y zwei unabhängige Zufallsvariablen mit Erwartungswert 0 und Varianz 1. Zeigen Sie, dass Z1 = X + Y und Z2 = X − 2Y nicht unabhängig sind. Hinweis: Berechnen Sie zunächst die Varianz von Z1 , Z2 und Z1 + Z2 . Lösung: Es gilt Var(Z1 + Z2 ) = Var(2X − Y ) = 4Var(X) + Var(Y ) = 5 Anderseits gilt Var(Z1 ) = Var(X + Y ) = Var(X) + Var(Y ) = 2 und Var(Z2 ) = Var(X) + 4Var(Y ) = 5. Es gilt also Var(Z1 + Z2 ) 6= Var(Z1 ) + Var(Z2 ). Z1 und Z2 können daher nicht unabhängig sein. Aufgabe 28 (4 Punkte): A Erstellen Sie Stabdiagramme (Argument type=’h’ in plot) der Binomialverteilung für p = 0.3 und n = 10, 100. B Bestimmen Sie die Ablehnungsbereiche A10 und A100 für die zweiseitige Nullhypothese H0 : p = 0.3 (n = 10, 100). Das Signifikanzniveau sei α = 0.1. C Sei p1 = 0.4. Wie groß ist die Wahrscheinlichkeit, dass eine binomialverteilte Zufallsvariable X ∼ B(p1 , n) Werte in den Ablehnungsbereichen A10 bzw. A100 annimmt? D Bestimmen Sie die Ablehnungsbereiche für die einseitige Nullhypothese H0 : p ≤ 0.3 (n = 10, 100). Das Signifikanzniveau sei α = 0.1. Lösung: > > > + + + p <- 0.3 n <- 10 plot(x=0:n,dbinom(0:n,size=n,prob=p), main="Binomialverteilung mit n=10 und p=0.3", type="h", xlab="k", ylab="Wahrscheinlichkeit") 0.00 0.05 0.10 0.15 0.20 0.25 Binomialverteilung mit n=10 und p=0.3 Wahrscheinlichkeit A 0 2 4 6 8 10 k > > > + + + p <- 0.3 n <- 100 plot(x=0:n,dbinom(0:n,size=n,prob=p), main="Binomialverteilung mit n=100 und p=0.3", type="h", xlab="k", ylab="Wahrscheinlichkeit") 0.06 0.04 0.00 0.02 Wahrscheinlichkeit 0.08 Binomialverteilung mit n=100 und p=0.3 0 20 40 60 k B Die untere Ablehnungsgrenze für n = 10 ist > > > > > alpha <- 0.1 n <- 10 p <-0.3 A1 <- qbinom(alpha/2,n,p) - 1 A1 [1] 0 Die obere Grenze > > > > > alpha <- 0.1 n <- 10 p <-0.3 A2 <- qbinom(1-alpha/2,n,p) +1 A2 [1] 6 Probe: 80 100 > pbinom(A1,n,p) # P(X<=A1) [1] 0.02824752 > pbinom(A1+1,n,p) # P(X<=A1+1) [1] 0.1493083 > 1-pbinom(A2-1,n,p) # P(X>=A2) [1] 0.04734899 > 1-pbinom(A2-2,n,p) # P(X>=A2-1) [1] 0.1502683 Der Ablehnungsbereich A10 zerfällt daher in den unteren Bereich A10,u = {0} und den oberen Bereich A10,o = {6, . . . , 10}. Für n = 100 gilt ganz entsprechend: > > > > > alpha <- 0.1 n <- 100 p <-0.3 A1 <- qbinom(alpha/2,n,p) - 1 A1 [1] 22 und > > > > > alpha <- 0.1 n <- 100 p <-0.3 A2 <- qbinom(1-alpha/2,n,p) +1 A2 [1] 39 Probe: > pbinom(A1,n,p) # P(X<=A1) [1] 0.04786574 > pbinom(A1+1,n,p) # P(X<=A1+1) [1] 0.07553077 > 1-pbinom(A2-1,n,p) # P(X>=A2) [1] 0.033979 > 1-pbinom(A2-2,n,p) # P(X>=A2-1) [1] 0.05304559 Der Ablehnungsbereich A100 zerfällt daher in den unteren Bereich A100,u = {0, . . . , 22} und den oberen Bereich A100,o = {39, . . . , 100}. C Für n = 10 gilt > pbinom(0,10,0.4) + 1 - pbinom(5,10,0.4) [1] 0.1722852 Für n = 100 gilt > pbinom(22,100,0.4) + 1 - pbinom(38,100,0.4) [1] 0.6179195 D Hier gibt es nur einen oberen Bereich: > > > > > n <- 10 p <- 0.3 alpha <- 0.1 A <- qbinom(1-alpha,n,p)+1 A # n=10 [1] 6 > n <- 100 > A <- qbinom(1-alpha,n,p)+1 > A # n=100 [1] 37 Aufgabe 29 (4 Punkte): Es soll geprüft werden, ob eine Münze fair ist. Dazu wird sie n = 1000 mal geworfen. Das Ergebnis des Experiments sei k = 450 mal “Kopf“. A Formulieren Sie eine geeignete Nullhypothese H0 . B Berechnen Sie den P-Wert P . C Auf welchen der Signifikanzniveaus α = 0.1, 0.05, 0.01, 0.001 kann H0 abgelehnt werden? D Bestimmen Sie den unteren Ablehnungsbereich für das Signifikanzniveau α = 10%. Lösung: A Faire Münze bedeutet, dass die Wahrscheinlichkeit für Kopf bei jedem Wurf genau p = 0.5 beträgt. Die Nullhypothese ist daher H0 : p = 0.5. B > > > > > n p k P P <<<<- 1000 0.5 450 2*pbinom(k,n,p) [1] 0.001730536 C H0 kann auf α = 0.1, 0.05, 0.01 nicht jedoch auf α = 0.001 abgelehnt werden. D > k <- qbinom(0.05,1000,0.5)-1 > k [1] 473 Probe: > 2* pbinom(k,1000,0.5) [1] 0.09368729 > 2* pbinom(k+1,1000,0.5) [1] 0.1067495 Der untere Ablehnungsbereich ist daher {0, 1, 2, . . . , 473}. Aufgabe 30 (6 Punkte): In einer Medikamentenstudie soll gezeigt werden, dass die Heilrate p eines neuen Heilmittels über 40% liegt. A Formulieren Sie eine geeignete Nullhypothese. B In die Studie werden zunächst nur n1 = 10 Patienten eingeschlossen. Werden von den 10 Patienten nur k1 = 3 oder weniger geheilt, dann wird die Studie abgebrochen und die Nullhypothese wird beibehalten. Berechnen Sie die Wahrscheinlichkeit, die Studie nach dieser Regel abzubrechen, wenn p = 0.6 beträgt. C Werden von den 10 Patienten mehr als k1 = 3 Patienten geheilt, dann wird die Studie mit zusätzlich n2 = 20 Patienten fortgesetzt. Werden schließlich von den insgesamt n = n1 + n2 = 30 Patienten k = 16 oder mehr Patienten geheilt, dann wird die Nullhypothese abgelehnt. Berechnen Sie die Wahrscheinlichkeit, dass die H0 verworfen wird, obwohl p = 0.4 gilt (Fehlerwahrscheinlichkeit 1. Art). Hinweis: Dieses Studiendesign heißt Simon’s Design und wird oft in Studien mit Heilmittel gegen besonders schwere Erkrankungen eingesetzt. Es erlaubt einen vorzeitigen Abbruch (hier schon nach der Behandlung von nur 10 Patienten). Dadurch wird erreicht, dass ein möglicherweise wirkungsloses Medikament an nur wenigen Patienten getestet wird. Lösung: A Hier wird die einseitige Nullhypothese H0 : p ≤ 0.4 getestet. B Die Wahrscheinlichkeit für 3 oder weniger Heilungen bei p = 0.6 beträgt: > pbinom(3,10,0.6) [1] 0.05476188 C Die H0 wird verworfen, wenn von den ersten 10 Patienten k1 = 4, . . . , 10 geheilt werden und dann von den zusätzlich 20 Patienten noch mindestens 16 − k1 : ! 10 20 X X b(k1 , n1 , p) ∗ b(k2 , n2 , p) k1 =4 k2 =16−k1 Setzt man in diesem Ausdruck p = 0.4, n1 = 10 und n2 = 20 ein, erhält man die gesuchte Fehlerwahrscheinlichkeit 1. Art. > sum(dbinom(4:10,10,0.4)*(1-pbinom(16-(4:10)-1,20,0.4))) [1] 0.091687 Schicken Sie Ihre Lösung bis spätestens Sonntag, den 3.01.2016 direkt an Ihre(n) Tutor(in): [email protected] (Ivo Soares Parchao) [email protected] (Ben Hillmer)