BSc Bioinformatik Wintersemester 2015/2016 Nachklausur zur

Werbung
BSc Bioinformatik Wintersemester 2015/2016
Nachklausur zur Statistik für Biowissenschaften I
Freie Universität Berlin
27. April 2016
Matrikelnummer
Nachname
Vorname
Unterschrift
Aufgabe 1 (4 Punkte): Berechnen Sie Mittelwert, Varianz, Median und
Standardabweichung folgender Stichproben:
S1 = (−1, 1)
S2 = (−1, −1, −1, 1, 1, 1)
1
Aufgabe 2 (4 Punkte):
Betrachten Sie folgendes Histogramm einer Stichprobe S:
100
80
60
0
20
40
Absolute Häufigkeit
120
140
Histogramm von S
0
1
2
3
4
5
6
7
S
Beurteilen Sie folgende Aussagen:
A
Alle Werte in S sind nicht negativ.
wahr 2
B
nicht entscheidbar 2
falsch 2
nicht entscheidbar 2
Der Median von S liegt zwischen 0 und 2.
wahr 2
E
falsch 2
Die Stichprobe wurde vermutlich aus einer normalverteilten Grundgesamtheit gezogen.
wahr 2
D
nicht entscheidbar 2
Das arithmetische Mittel der Stichprobe ist größer als der Median.
wahr 2
C
falsch 2
falsch 2
nicht entscheidbar 2
Die Stichprobe enthält mehr als 250 Werte.
wahr 2
falsch 2
nicht entscheidbar 2
Aufgabe 3 (2 Punkte): Zu einem Wahrscheinlichkeitsraum Ω gehören 8
Ereignisse.
A
Wie viele Elemente hat Ω?
B
Wie viele Ereignisse mit genau zwei Elementen gibt es zu Ω?
2
Aufgabe 4 (4 Punkte): In einer Population gibt es 40% Raucher (R). Der
Anteil der Frauen (F) in der Population betrage 50% und die Hälfte der Frauen
raucht. Wie groß ist der Frauenanteil unter den Rauchern?
Hinweis: Benutzen Sie die Bayes Formel
P(B|A) =
P(A|B) ∗ P(B)
P(A|B) ∗ P(B)
=
.
P(A)
P(A|B) ∗ P(B) + P(A|B C ) ∗ P(B C )
3
Aufgabe 5 (5 Punkte): Sei Y eine Zufallsvariable, deren kumulative Verteilungsfunktion P(Y ≤ x) folgenden Graph hat:
1.0
Kumulative Verteilungsfunktion
0.8
●
0.6
●
0.4
●
0.2
●
0.0
●
0
1
2
3
4
x
Geben Sie folgende Wahrscheinlichkeiten an:
A
P(Y = 1) =
B
P(Y = 2) =
C
P(Y = 4.5) =
D
P(Y ≥ 2) =
Ist die Verteilung von Y stetig?
Antwort:
Begründung:
4
5
6
Aufgabe 6 (3 Punkte): Für einen Wahrscheinlichkeitsraum Ω = {0, 1, 3} gelte P(0) = P(1) = 0.25. Berechnen Sie für die Zufallsvariable X(ω) = ω, ω ∈
Ω folgende Erwartungswerte:
A
E(X) =
B
E(X 2 ) =
C
E(X 3 ) =
5
Aufgabe 7 (4 Punkte): Sei X eine binomialverteilte Zufallsvariable, die
ein Experiment mit n unabhängigen Versuchswiederholungen mit Trefferwahrscheinlichkeit p beschreibt.
A
Geben Sie die Standardabweichung (=Quadratwurzel aus der Varianz) σ
und den Erwartungswert µ von X an.
B
Für welches p sind Standardabweichung und Erwartungswert von X
gleich?
6
Aufgabe 8 (4 Punkte): Die Sensitivität und Spezifität eines diagnostischen
Tests betrage 90%. Die Prävalenz betrage 10%.
A
Definieren Sie die Begriffe Sensitivität und Spezifität.
B
Berechnen Sie den negativen prädiktiven Wert.
7
Aufgabe 9 (4 Punkte): Für eine Zufallsvariable X sei bekannt, dass
Z=
2X − 3
5
standardnormalverteilt ist.
Geben Sie Erwartungswert und Varianz von X an.
Aufgabe 10 (4 Punkte): Eine faire Münze werde so lange geworfen, bis das
erste Mal “Kopf“ erscheint. Sei k die Anzahl der benötigten Würfe.
A
Wie groß ist die Wahrscheinlichkeit, dass genau k = 4 Würfe benötigt
werden?
B
Wie groß ist die Wahrscheinlichkeit, dass mindestens drei Würfe benötigt
werden?
Hinweis: Die Formel für die geometrische Wahrscheinlichkeitsverteilung lautet:
p(k, p) = (1 − p)k−1 p
8
Aufgabe 11 (4 Punkte): In einer großen Population ist der heterozygote
Genotyp aA mit über 80% vertreten. Kann die Population im Hardy-Weinberg
Gleichgewicht sein? Begründen Sie Ihre Antwort.
9
Aufgabe 12 (4 Punkte): Sei S = (1, 5) eine Stichprobe (n = 2) aus einer
normalverteilten Population.
A
Berechnen Sie die Statistik T des Einstichproben t-Tests für die Nullhypothese H0 : µ = 0.
B
Welcher R Befehl berechnet den zweiseitigen P-Wert? Mehrere oder auch
keine der Antworten können richtig sein.
(a) 2*pt(T, df=1)
(b) 2*pt(T, df=2)
(c) 2*pt(-abs(T), df=1)
(d) 2*qt(-T, df=1)
(e) 2*dt(-T, df=2)
Hinweise: Berechnungsformel für den Einstichproben t-Test:
µ̂ − µ0 √
n
T = p
σˆ2
10
Aufgabe 13 (4 Punkte): In einer Medikamentenstudie erhält eine Gruppe
von 10 Patienten das Testpräparat, wohingegen einer Kontrollgruppe von 10
Patienten ein Placebo verabreicht wird. Als Ergebnis der Studie erhält man
für die Placebo- und Medikamentengruppe folgende Werte:
> Placebo <- c(5.8, 5.8, 4.5, 5.2, 5.2, 2.6, 5.1, 4.9, 4.7, 3.5)
> Medikament <- c(4.3, 5.6, 4.7, 4.0, 4.8, 4.2, 3.6, 4.2, 2.0, 5.3)
Es soll mit Hilfe des zweiseitigen t-Tests festgestellt werden, ob sich die Mittelwerte der Medikamenten- und Placebogruppe signifikant unterscheiden.
Liefert eines der folgenden R Programme den korrekten P-Wert? Falls ja, welches?
Hinweis: Formel für die Statistik des Zweistichproben t-Tests:
r
n1 n2
µˆ1 − µˆ2
T = p
n1 + n2
σˆ2
A
>
>
>
>
>
>
M1 <- sum(Placebo)/10
M2 <- sum(Medikament)/10
V <- (sum((Placebo-M1)^2) + sum((Medikament-M2)^2))/18
T <- (M1-M2)/sqrt(V)*sqrt(5)
P <- pt(-abs(T), df=5)
P
[1] 0.1753075
B
>
>
>
>
>
>
M1 <- mean(Placebo)
M2 <- sum(Medikament)/10
V <- (9*var(Placebo) + sum((Medikament-M2)^2))/18
T <- (M1-M2)/sqrt(V)*sqrt(5)
P <- 2*pt(-abs(T), df=18)
P
[1] 0.3170609
C
>
>
>
>
>
>
M1 <- sum(Placebo)/10
M2 <- sum(Medikament)/10
V <- (sum((Placebo-M1)^2) + sum((Medikament-M2)^2))/19
T <- (M1-M2)/sqrt(V)*sqrt(10)
P <- pt(-abs(T), df=18)
P
[1] 0.07608687
Fortsetzung der Aufgabe nächste Seite!
11
D
>
>
>
>
M <- Placebo - Medikament
T <- mean(M)/sd(M)*sqrt(10)
P <- 2*pt(-abs(T), df=9)
P
[1] 0.3259486
E
> P <- t.test(Placebo,Medikament, paired=TRUE)$p.value
> P
[1] 0.3259486
Antwort:
Aufgabe 14 (4 Punkte):
Definieren Sie die Begriffe
A
Fehler 1. Art
B
Fehler 2. Art
C
Signifikanzniveau
D
Power eines statistischen Tests.
12
Aufgabe 15 (4 Punkte): Eine Münze werde fünfmal geworfen. Alle fünf
Würfe zeigen Kopf.
A
Mit welchem Test kann geprüft werden, ob die Münze fair ist? Wie lautet
die zweiseitige Nullhypothese?
B
Geben Sie den P-Wert des Tests der zweiseitigen Nullhypothese an. Kann
die Nullhypothese auf dem Niveau α = 0.05 oder α = 0.1 abgelehnt
werden?
13
Aufgabe 16 (4 Punkte): Für eine verbundene Stichprobe:
1
2
3
4
5
6
7
vorher nachher
D
1
0.0 1.0
4
5.1 -1.1
7
6.2 0.8
2
1.3 0.7
4
5.4 -1.4
6
7.5 -1.5
7
6.6 0.4
soll der Vorzeichenrangtest nach Wilcoxon durchgeführt werden. Berechnen
Sie die dazu notwendige Rangsumme R, die zu den positiven Werten der Differenzvariable D=vorher-nachher gehört.
14
Zugehörige Unterlagen
Herunterladen