BSc Bioinformatik Wintersemester 2015/2016 Nachklausur zur Statistik für Biowissenschaften I Freie Universität Berlin 27. April 2016 Matrikelnummer Nachname Vorname Unterschrift Aufgabe 1 (4 Punkte): Berechnen Sie Mittelwert, Varianz, Median und Standardabweichung folgender Stichproben: S1 = (−1, 1) S2 = (−1, −1, −1, 1, 1, 1) 1 Aufgabe 2 (4 Punkte): Betrachten Sie folgendes Histogramm einer Stichprobe S: 100 80 60 0 20 40 Absolute Häufigkeit 120 140 Histogramm von S 0 1 2 3 4 5 6 7 S Beurteilen Sie folgende Aussagen: A Alle Werte in S sind nicht negativ. wahr 2 B nicht entscheidbar 2 falsch 2 nicht entscheidbar 2 Der Median von S liegt zwischen 0 und 2. wahr 2 E falsch 2 Die Stichprobe wurde vermutlich aus einer normalverteilten Grundgesamtheit gezogen. wahr 2 D nicht entscheidbar 2 Das arithmetische Mittel der Stichprobe ist größer als der Median. wahr 2 C falsch 2 falsch 2 nicht entscheidbar 2 Die Stichprobe enthält mehr als 250 Werte. wahr 2 falsch 2 nicht entscheidbar 2 Aufgabe 3 (2 Punkte): Zu einem Wahrscheinlichkeitsraum Ω gehören 8 Ereignisse. A Wie viele Elemente hat Ω? B Wie viele Ereignisse mit genau zwei Elementen gibt es zu Ω? 2 Aufgabe 4 (4 Punkte): In einer Population gibt es 40% Raucher (R). Der Anteil der Frauen (F) in der Population betrage 50% und die Hälfte der Frauen raucht. Wie groß ist der Frauenanteil unter den Rauchern? Hinweis: Benutzen Sie die Bayes Formel P(B|A) = P(A|B) ∗ P(B) P(A|B) ∗ P(B) = . P(A) P(A|B) ∗ P(B) + P(A|B C ) ∗ P(B C ) 3 Aufgabe 5 (5 Punkte): Sei Y eine Zufallsvariable, deren kumulative Verteilungsfunktion P(Y ≤ x) folgenden Graph hat: 1.0 Kumulative Verteilungsfunktion 0.8 ● 0.6 ● 0.4 ● 0.2 ● 0.0 ● 0 1 2 3 4 x Geben Sie folgende Wahrscheinlichkeiten an: A P(Y = 1) = B P(Y = 2) = C P(Y = 4.5) = D P(Y ≥ 2) = Ist die Verteilung von Y stetig? Antwort: Begründung: 4 5 6 Aufgabe 6 (3 Punkte): Für einen Wahrscheinlichkeitsraum Ω = {0, 1, 3} gelte P(0) = P(1) = 0.25. Berechnen Sie für die Zufallsvariable X(ω) = ω, ω ∈ Ω folgende Erwartungswerte: A E(X) = B E(X 2 ) = C E(X 3 ) = 5 Aufgabe 7 (4 Punkte): Sei X eine binomialverteilte Zufallsvariable, die ein Experiment mit n unabhängigen Versuchswiederholungen mit Trefferwahrscheinlichkeit p beschreibt. A Geben Sie die Standardabweichung (=Quadratwurzel aus der Varianz) σ und den Erwartungswert µ von X an. B Für welches p sind Standardabweichung und Erwartungswert von X gleich? 6 Aufgabe 8 (4 Punkte): Die Sensitivität und Spezifität eines diagnostischen Tests betrage 90%. Die Prävalenz betrage 10%. A Definieren Sie die Begriffe Sensitivität und Spezifität. B Berechnen Sie den negativen prädiktiven Wert. 7 Aufgabe 9 (4 Punkte): Für eine Zufallsvariable X sei bekannt, dass Z= 2X − 3 5 standardnormalverteilt ist. Geben Sie Erwartungswert und Varianz von X an. Aufgabe 10 (4 Punkte): Eine faire Münze werde so lange geworfen, bis das erste Mal “Kopf“ erscheint. Sei k die Anzahl der benötigten Würfe. A Wie groß ist die Wahrscheinlichkeit, dass genau k = 4 Würfe benötigt werden? B Wie groß ist die Wahrscheinlichkeit, dass mindestens drei Würfe benötigt werden? Hinweis: Die Formel für die geometrische Wahrscheinlichkeitsverteilung lautet: p(k, p) = (1 − p)k−1 p 8 Aufgabe 11 (4 Punkte): In einer großen Population ist der heterozygote Genotyp aA mit über 80% vertreten. Kann die Population im Hardy-Weinberg Gleichgewicht sein? Begründen Sie Ihre Antwort. 9 Aufgabe 12 (4 Punkte): Sei S = (1, 5) eine Stichprobe (n = 2) aus einer normalverteilten Population. A Berechnen Sie die Statistik T des Einstichproben t-Tests für die Nullhypothese H0 : µ = 0. B Welcher R Befehl berechnet den zweiseitigen P-Wert? Mehrere oder auch keine der Antworten können richtig sein. (a) 2*pt(T, df=1) (b) 2*pt(T, df=2) (c) 2*pt(-abs(T), df=1) (d) 2*qt(-T, df=1) (e) 2*dt(-T, df=2) Hinweise: Berechnungsformel für den Einstichproben t-Test: µ̂ − µ0 √ n T = p σˆ2 10 Aufgabe 13 (4 Punkte): In einer Medikamentenstudie erhält eine Gruppe von 10 Patienten das Testpräparat, wohingegen einer Kontrollgruppe von 10 Patienten ein Placebo verabreicht wird. Als Ergebnis der Studie erhält man für die Placebo- und Medikamentengruppe folgende Werte: > Placebo <- c(5.8, 5.8, 4.5, 5.2, 5.2, 2.6, 5.1, 4.9, 4.7, 3.5) > Medikament <- c(4.3, 5.6, 4.7, 4.0, 4.8, 4.2, 3.6, 4.2, 2.0, 5.3) Es soll mit Hilfe des zweiseitigen t-Tests festgestellt werden, ob sich die Mittelwerte der Medikamenten- und Placebogruppe signifikant unterscheiden. Liefert eines der folgenden R Programme den korrekten P-Wert? Falls ja, welches? Hinweis: Formel für die Statistik des Zweistichproben t-Tests: r n1 n2 µˆ1 − µˆ2 T = p n1 + n2 σˆ2 A > > > > > > M1 <- sum(Placebo)/10 M2 <- sum(Medikament)/10 V <- (sum((Placebo-M1)^2) + sum((Medikament-M2)^2))/18 T <- (M1-M2)/sqrt(V)*sqrt(5) P <- pt(-abs(T), df=5) P [1] 0.1753075 B > > > > > > M1 <- mean(Placebo) M2 <- sum(Medikament)/10 V <- (9*var(Placebo) + sum((Medikament-M2)^2))/18 T <- (M1-M2)/sqrt(V)*sqrt(5) P <- 2*pt(-abs(T), df=18) P [1] 0.3170609 C > > > > > > M1 <- sum(Placebo)/10 M2 <- sum(Medikament)/10 V <- (sum((Placebo-M1)^2) + sum((Medikament-M2)^2))/19 T <- (M1-M2)/sqrt(V)*sqrt(10) P <- pt(-abs(T), df=18) P [1] 0.07608687 Fortsetzung der Aufgabe nächste Seite! 11 D > > > > M <- Placebo - Medikament T <- mean(M)/sd(M)*sqrt(10) P <- 2*pt(-abs(T), df=9) P [1] 0.3259486 E > P <- t.test(Placebo,Medikament, paired=TRUE)$p.value > P [1] 0.3259486 Antwort: Aufgabe 14 (4 Punkte): Definieren Sie die Begriffe A Fehler 1. Art B Fehler 2. Art C Signifikanzniveau D Power eines statistischen Tests. 12 Aufgabe 15 (4 Punkte): Eine Münze werde fünfmal geworfen. Alle fünf Würfe zeigen Kopf. A Mit welchem Test kann geprüft werden, ob die Münze fair ist? Wie lautet die zweiseitige Nullhypothese? B Geben Sie den P-Wert des Tests der zweiseitigen Nullhypothese an. Kann die Nullhypothese auf dem Niveau α = 0.05 oder α = 0.1 abgelehnt werden? 13 Aufgabe 16 (4 Punkte): Für eine verbundene Stichprobe: 1 2 3 4 5 6 7 vorher nachher D 1 0.0 1.0 4 5.1 -1.1 7 6.2 0.8 2 1.3 0.7 4 5.4 -1.4 6 7.5 -1.5 7 6.6 0.4 soll der Vorzeichenrangtest nach Wilcoxon durchgeführt werden. Berechnen Sie die dazu notwendige Rangsumme R, die zu den positiven Werten der Differenzvariable D=vorher-nachher gehört. 14