Data-Mining-Methoden Prof. Dr. R. Kruse, Dr. C. Borgelt WS 2000/2001 4. Übungsblatt Aufgabe 14 Der Bayessche Satz a) Durchschnittlich 5 von 100 Männern und 25 von 10 000 Frauen sind farbenblind. Eine farbenblinde Person werde zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, daß diese Person ein Mann ist? b) In einer gegebenen Population leiden 2% aller Menschen an einer bestimmten Krankheit. Ein Test habe die Eigenschaft, daß er bei Kranken in 95% und bei Gesunden in 99% aller Fälle die richtige Diagnose stellt. Wie groß ist die Wahrscheinlichkeit dafür, daß eine Person, bei der auf Grund des Tests die Krankheit (nicht) diagnostiziert wird, auch tatsächlich (nicht) an dieser Krankheit leidet? Wie ändert sich das Ergebnis, wenn nur 0.1% aller Menschen der Population an der Krankheit leiden? Was ist an den Ergebnissen aufällig? c) In einer Schraubenfabrik stellen drei Maschinen M1 , M2 und M3 von der Gesamtproduktion 20, 30 bzw. 50 % her. Im Mittel sind 2% der von Maschine M1 , 4% der von Maschine M2 und 7% der von Maschine M3 gefertigten Schrauben Ausschuß. Aus der Gesamtproduktion werde zufällig eine Schraube entnommen, von der sich herausstellt, daß sie fehlerhaft ist. Wie groß sind die Wahrscheinlichkeiten p1 , p2 und p3 dafür, daß sie von der Maschine M1 , M2 bzw. M3 hergestellt wurde? Aufgabe 15 Erwartungswerte von Zufallsvariablen Zeigen Sie, daß eine poissonverteilte Zufallsvariable (d.h. eine diskrete Zufallsvariable X x mit dem Wertebereich IN0 und der Verteilung ΛX (x; λ) = λx! e−λ ) den Erwartungswert E(X) = λ und die Varianz D2 (X) = λ besitzt! Aufgabe 16 Erwartungswerte von Zufallsvariablen Betrachten Sie folgendes Zufallsexperiment: In einer Urne befinden sich eine weiße und eine schwarze Kugel. Es wird eine Kugel gezogen. Ist sie weiß, so ist das Experiment beendet. Ist sie schwarz, wird die Kugel in die Urne zurückgelegt und eine weitere schwarze Kugel hinzugefügt. Anschließend wird wieder eine Kugel gezogen und stets genauso verfahren wie vorher. D.h., wird eine weiße Kugel gezogen, so ist das Experiment beendet, wird eine schwarze Kugel gezogen, so wird die gezogene Kugel und eine weitere schwarze Kugel in die Urne gelegt. Das Vorgehen wird wiederholt, bis eine weiße Kugel gezogen wird. Zeigen Sie: Der Erwartungswert für die Zahl der Ziehungen bis zum Ende des Experimentes ist nicht endlich. Aufgabe 17 Eigenschaften von Erwartungswert und Varianz a) Zeigen Sie die Linearität des Erwartungswertes, d.h. zeigen Sie daß für eine beliebige Zufallsvariable X mit dem Erwartungswert E(X) gilt: ∀a, b ∈ IR : E(aX + b) = aE(X) + b. b) Zeigen Sie, daß für eine beliebige Zufallsvariable X mit der Varianz D2 (X) gilt: ∀a, b ∈ IR : D2 (aX + b) = a2 D2 (X). Zusatzaufgabe Das St.-Petersburg-Paradoxon Betrachten Sie folgendes Wettspiel: Eine Münze wird geworfen, bis das erste Mal Kopf erscheint. Ein Spieler gewinnt 2 DM, wenn Kopf im ersten Wurf erscheint, 4 DM, wenn Kopf im zweiten Wurf zum ersten Mal erscheint, und allgemein 2k DM, wenn Kopf im kten Wurf zum ersten Mal erscheint. Berechnen Sie den Einsatz, der das Spiel fair macht! (Ein Wettspiel heißt fair, wenn der Einsatz dem zu erwartenden Gewinn entspricht.) Warum ist das Ergebnis paradox? Warum wäre es nicht von Belang, wenn jemand tatsächlich ein solches Spiel anböte? Wie wird man stattdessen den Erwartungswert berechnen müssen? Betrachten Sie analog das folgende Martingale-System für das Roulette-Spiel (als Martingale bezeichnet man ein Spiel auf einfache Chancen, also ein Spiel auf rot/schwarz oder gerade/ungerade): Ein Spieler setzt auf eine einfache Chance. Verliert er, verdoppelt er seinen Einsatz und setzt wieder auf die gleiche einfache Chance. Verliert er wieder, verdoppelt er erneut seinen Einsatz usw. Warum ist dies ein (theoretisch) sicheres Gewinnsystem? Wie ändert sich der zu erwartende Gewinn, wenn statt auf eine einfache Chance auf eine Kolonne (die Zahlengruppen 1-12, 13-24 und 25-36 bilden jeweils eine Kolonne) gesetzt, sonst aber gleich verfahren wird (Verdopplung des Einsatzes bei jedem Verlust)? Woran scheitern diese (theoretisch) sicheren Gewinnsysteme in der Praxis?