Data-Mining-Methoden WS 2000/2001 Prof. Dr. R. Kruse, Dr. C

Werbung
Data-Mining-Methoden
Prof. Dr. R. Kruse, Dr. C. Borgelt
WS 2000/2001
4. Übungsblatt
Aufgabe 14
Der Bayessche Satz
a) Durchschnittlich 5 von 100 Männern und 25 von 10 000 Frauen sind farbenblind.
Eine farbenblinde Person werde zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, daß diese Person ein Mann ist?
b) In einer gegebenen Population leiden 2% aller Menschen an einer bestimmten
Krankheit. Ein Test habe die Eigenschaft, daß er bei Kranken in 95% und bei
Gesunden in 99% aller Fälle die richtige Diagnose stellt. Wie groß ist die Wahrscheinlichkeit dafür, daß eine Person, bei der auf Grund des Tests die Krankheit
(nicht) diagnostiziert wird, auch tatsächlich (nicht) an dieser Krankheit leidet?
Wie ändert sich das Ergebnis, wenn nur 0.1% aller Menschen der Population an
der Krankheit leiden? Was ist an den Ergebnissen aufällig?
c) In einer Schraubenfabrik stellen drei Maschinen M1 , M2 und M3 von der Gesamtproduktion 20, 30 bzw. 50 % her. Im Mittel sind 2% der von Maschine M1 ,
4% der von Maschine M2 und 7% der von Maschine M3 gefertigten Schrauben
Ausschuß. Aus der Gesamtproduktion werde zufällig eine Schraube entnommen,
von der sich herausstellt, daß sie fehlerhaft ist. Wie groß sind die Wahrscheinlichkeiten p1 , p2 und p3 dafür, daß sie von der Maschine M1 , M2 bzw. M3 hergestellt
wurde?
Aufgabe 15
Erwartungswerte von Zufallsvariablen
Zeigen Sie, daß eine poissonverteilte Zufallsvariable (d.h. eine diskrete Zufallsvariable X
x
mit dem Wertebereich IN0 und der Verteilung ΛX (x; λ) = λx! e−λ ) den Erwartungswert
E(X) = λ und die Varianz D2 (X) = λ besitzt!
Aufgabe 16
Erwartungswerte von Zufallsvariablen
Betrachten Sie folgendes Zufallsexperiment: In einer Urne befinden sich eine weiße und
eine schwarze Kugel. Es wird eine Kugel gezogen. Ist sie weiß, so ist das Experiment
beendet. Ist sie schwarz, wird die Kugel in die Urne zurückgelegt und eine weitere
schwarze Kugel hinzugefügt. Anschließend wird wieder eine Kugel gezogen und stets
genauso verfahren wie vorher. D.h., wird eine weiße Kugel gezogen, so ist das Experiment beendet, wird eine schwarze Kugel gezogen, so wird die gezogene Kugel und
eine weitere schwarze Kugel in die Urne gelegt. Das Vorgehen wird wiederholt, bis eine
weiße Kugel gezogen wird.
Zeigen Sie: Der Erwartungswert für die Zahl der Ziehungen bis zum Ende des Experimentes ist nicht endlich.
Aufgabe 17
Eigenschaften von Erwartungswert und Varianz
a) Zeigen Sie die Linearität des Erwartungswertes, d.h. zeigen Sie daß für eine beliebige Zufallsvariable X mit dem Erwartungswert E(X) gilt:
∀a, b ∈ IR : E(aX + b) = aE(X) + b.
b) Zeigen Sie, daß für eine beliebige Zufallsvariable X mit der Varianz D2 (X) gilt:
∀a, b ∈ IR : D2 (aX + b) = a2 D2 (X).
Zusatzaufgabe
Das St.-Petersburg-Paradoxon
Betrachten Sie folgendes Wettspiel: Eine Münze wird geworfen, bis das erste Mal Kopf
erscheint. Ein Spieler gewinnt 2 DM, wenn Kopf im ersten Wurf erscheint, 4 DM, wenn
Kopf im zweiten Wurf zum ersten Mal erscheint, und allgemein 2k DM, wenn Kopf im kten Wurf zum ersten Mal erscheint. Berechnen Sie den Einsatz, der das Spiel fair macht!
(Ein Wettspiel heißt fair, wenn der Einsatz dem zu erwartenden Gewinn entspricht.)
Warum ist das Ergebnis paradox? Warum wäre es nicht von Belang, wenn jemand
tatsächlich ein solches Spiel anböte? Wie wird man stattdessen den Erwartungswert
berechnen müssen?
Betrachten Sie analog das folgende Martingale-System für das Roulette-Spiel (als Martingale bezeichnet man ein Spiel auf einfache Chancen, also ein Spiel auf rot/schwarz
oder gerade/ungerade): Ein Spieler setzt auf eine einfache Chance. Verliert er, verdoppelt er seinen Einsatz und setzt wieder auf die gleiche einfache Chance. Verliert er
wieder, verdoppelt er erneut seinen Einsatz usw. Warum ist dies ein (theoretisch) sicheres Gewinnsystem? Wie ändert sich der zu erwartende Gewinn, wenn statt auf eine
einfache Chance auf eine Kolonne (die Zahlengruppen 1-12, 13-24 und 25-36 bilden
jeweils eine Kolonne) gesetzt, sonst aber gleich verfahren wird (Verdopplung des Einsatzes bei jedem Verlust)? Woran scheitern diese (theoretisch) sicheren Gewinnsysteme
in der Praxis?
Herunterladen