Klausur zur Stochastik für Bioinformatiker Viel Erfolg!

Werbung
Stochastik für Bioinformatiker
Thomas Kneib, Leonhard Held
Sommersemester 2003
Klausur zur Stochastik für Bioinformatiker
16.07.2003
Wichtig:
- Überprüfen Sie zunächst, ob Ihr Klausurexemplar vollständig ist. Die Klausur sollte aus drei
Blättern (incl. Deckblatt) mit vier Aufgaben bestehen.
- Verwenden Sie für Ihre Lösungen ausschließlich die Ihnen zur Verfügung gestellten Papierbögen.
- Kennzeichnen Sie jedes abgegebene Blatt mit Ihrem Namen und Ihrer Matrikelnummer.
- Als Hilfsmittel zugelassen sind ein Taschenrechner und die ausgeteilte (!) Formelsammlung.
- Maximal können 100 Punkte erreicht werden. Mit 50 Punkten ist die Klausur auf jeden Fall
bestanden.
- Die Bearbeitungszeit beträgt 120 Minuten.
Viel Erfolg!
Aufgabe 1 (18 Punkte)
Betrachten Sie ein genetisches Merkmal mit der folgenden relativen Häufigkeitsverteilung der Genotypen in einer Population:
aa
0.5
ab
0.45
bb
0.05
Der Genotyp bb‘, der durch einen Test erkannt werden soll, sei der Verursacher einer Krankheit. Der
’
Test funktioniert jedoch nur fehlerhaft, wobei bei gegebenen Genotypen die folgenden Wahrscheinlichkeiten für ein positives Testergebnis bekannt seien:
aa
0.05
ab
0.10
bb
0.95
a) Bestimmen Sie die Wahrscheinlichkeit dafür, bei einer zufällig aus der Population ausgewählten
Person ein positives Testergebnis zu erhalten.
b) Bestimmen Sie die Wahrscheinlichkeit, dass eine Person tatsächlich den Genotyp bb‘ hat, wenn
’
ein positives Testergebnis vorliegt.
c) Nehmen Sie nun an, dass eine Person mit Genotyp bb‘ mit Wahrscheinlichkeit 0.3 tatsächlich
’
erkrankt und dass das Testergebnis für eine Person mit Genotyp bb‘ unabhängig davon ist, ob
’
die Person erkrankt ist oder nicht. Wie groß ist nun die Wahrscheinlichkeit, dass eine Person
erkrankt ist, wenn der Test ein positives Ergebnis ergibt?
Aufgabe 2 (27 Punkte)
Betrachten Sie folgendes Zufallsexperiment: Eine faire Münze mit den Seiten 0 und 1 wird zweimal
unabhängig geworfen. Die Zufallsvariable Z1 beschreibe den ersten Münzwurf und Z2 den zweiten
Münzwurf. Nun sei X = min(Z1 , Z2 ) definiert als das Minimum der beiden Münzwürfe und Y =
max(Z1 , Z2 ) als das Maximum der beiden Münzwürfe.
a) Bestimmen Sie die gemeinsame Verteilung von X und Y sowie die jeweiligen Randverteilungen.
b) Bestimmen Sie Erwartungswert und Varianz von X und Y .
c) Bestimmen Sie die Kovarianz und die Korrelation zwischen X und Y .
d) Bestimmen Sie die bedingte Verteilung von Y |X = 0.
Aufgabe 3 (30 Punkte)
Die stetige Zufallsvariable X besitze die folgende Verteilungsfunktion:

0
x≤0

FX (x) =
x

x>0
1+x
a) Berechnen Sie P (X > 1).
b) Bestimmen Sie die Dichte fX (x) von X.
c) Bestimmen Sie (mit Hilfe des Transformationssatzes für Dichten) die Dichte fY (y) der Zufallsvariablen Y = log(X).
d) Zeigen Sie, dass fY (y) = fY (−y) gilt. Was ergibt sich damit für den Erwartungswert von Y
(unter der Voraussetzung, dass er existiert)?
e) Die Verteilungsfunktion von Y lautet
FY (y) =
1
.
1 + exp(−y)
Beschreiben Sie, wie man mit Hilfe des Inversionsverfahrens aus der Verteilung von Y Zufallszahlen ziehen kann und bestimmen Sie die hierfür notwendigen Größen. Wie kann man nun einfach
Zufallszahlen aus der Verteilung von X erzeugen?
Aufgabe 4 (25 Punkte)
Seien X1 , . . . , Xn unabhängig und identisch geometrisch verteilt mit Parameter π, das heißt Xi ∼
G(π), i = 1, . . . , n.
a) Bestimmen Sie den ML-Schätzer π̂M L für π.
b) Nehmen Sie nun eine Betaverteilung als Prioriverteilung für den unbekannten Parameter π an,
das heißt, es gelte Xi |π ∼ G(π), i = 1, . . . , n unabhängig und π ∼ Beta(α, β). Bestimmen Sie die
Dichte der Posterioriverteilung von π|X1 , . . . , Xn . Um welchen Verteilungstyp handelt es sich?
Wie lauten die Parameter der Verteilung?
c) Wie lauten Posteriori-Modus und Posteriori-Erwartungswert von π? (Keine explizite Berechnung
nötig! Angabe der Ergebnisse genügt!)
d) Für welche Werte von α und β stimmt der Posteriori-Modus mit dem ML-Schätzer überein?
Interpretieren Sie das Ergebnis.
Herunterladen