Ellen Baake – Michael Baake Bielefeld, 5. Juli 2013 Fakultät für Mathematik Universität Bielefeld Abgabe bis 12. Juli 2013 um 10:00 Uhr Wahrscheinlichkeitstheorie und Statistik Sommersemester 2013 Übungsblatt 13 Aufgabe 1. Der Cholesterinspiegel einer Person eines Landes A sei normalverteilt mit Erwartungswert 200 mg/100 mL und Standardabweichung 20 mg/100 mL. a) (1,5 P) Geben Sie die Wahrscheinlichkeit an, dass eine zufällig ausgesuchte Person einen Cholesterinspiegel von weniger als 160 mg/100 mL besitzt? b) (2 P) Wie groß ist der Anteil von Personen mit einem Cholesterinspiegel zwischen 170 und 230 mg/100 mL? c) (3,5 P) In einem anderen Land B liegt der durchschnittliche Cholesterinspiegel lediglich bei 190 mg/100 mL, wobei die Standardabweichung erneut 20 mg/100 mL beträgt. Beantworten Sie die Fragen a) und b) für dieses Land. d) (2 P) In jedem der zwei Länder wird zufällig (unabhängig) je eine Person ausgesucht. Wie hoch ist die Wahrscheinlichkeit, dass die Person aus Land A einen höheren Cholesterinspiegel besitzt als die Person aus Land B? Hinweis: Sind X und Y zwei unabhängige Zufallsvariablen mit zugehörigen Verteilungen N (µ, σ 2 ) und N (ν, δ2 ), so besitzt X − Y die Verteilung N (µ − σ, σ 2 + δ2 ). Aufgabe 2. Eine Krankheit X wird durch Parasiten im Blut verursacht. Die Infektion mit dieser Krankheit wird anhand einer Blutprobe nachgewiesen, indem ein Blutstropfen auf einen Objektträger aufgebracht, mit einem Deckglas abgedeckt und unter dem Mikroskop nach Parasiten durchsucht wird. Da die Erreger nicht in allzu großer Zahl im Blut vorhanden sind, findet man bei einem infizierten Menschen nicht in jeder Probe (=Blutstropfen auf Objektträger) Parasiten; tatsächlich beträgt die Wahrscheinlichkeit, dass eine Probe von einer infizierten Person positiv ausfällt (d.h. dass ein oder mehrere Parasiten gefunden werden), nur 0.7. Deshalb wertet man pro Person n Proben aus und diagnostiziert die Person als “infiziert”, wenn mindestens eine dieser Proben positiv ist; ansonsten diagnostiziert man die Person als “nicht infiziert”. a) (1 P.) Mit welcher Wahrscheinlichkeit (in Abhängigkeit von n) wird eine infizierte Person als “nicht infiziert” diagnostiziert? b) (3 P.) Wie groß muss n mindestens sein, damit eine infizierte Person mit einer Wahrscheinlichkeit von mindestens 99% auch als “infiziert” diagnostiziert wird? c) (4 P.) Wissenschaftler A (etwas faul) führt die Untersuchung nur mit n = 2 durch. Er untersucht eine Stichprobe von 1324 Personen und diagnostiziert dabei 74 Personen als “infiziert”. Schätzen Sie (mit Hilfe der Momentenmethode) den Anteil der (tatsächlich) Infizierten in der zugrundeliegenden Population. d) (2 P.) Geben Sie (aufbauend auf den Ergebnissen in c)) ein 95% Konfidenzintervall für den Anteil der (tatsächlich) Infizierten der Population an. Begründen Sie die Auswahl der verwendeten Formel. Aufgabe 3. Sie wollen entscheiden, welche von zwei Fußballmannschaften A und B die stärkere ist. Zu diesem Zweck ist es üblich, A und B 90 Minuten (ggf. plus Verlängerungen und Elfmeterschießen) gegeneinander spielen zu lassen. Wir wollen uns nun mit folgender Frage beschäftigen: Wenn Mannschaft A gewinnt – ist das dann einfach nur Glück, oder ist die Mannschaft wirklich stärker? Wir nehmen an, dass Tore unabhängig voneinander fallen, und messen die Stärke von Mannschaft A anhand des Parameters p, der Wahrscheinlichkeit, dass ein Tor, das fällt, auf das Konto von Mannschaft A geht. Wenn A und B gleich stark sind, ist also p = 1/2 – aber für den Betrachter ist das tatsächliche p unbekannt. a) (1 P.) Nehmen Sie erst einmal an, die Mannschaften seien gleich stark. Welcher Verteilung folgt dann die Zahl der Tore von Mannschaft A, wenn insgesamt n Tore fallen? Mit welcher Wahrscheinlichkeit schießt A genau k Tore? b) (2. P) Sie kennen nun p nicht, haben aber den Anfangsverdacht, dass A stärker sein könnte als B. A spielt nun gegen B und gewinnt tatsächlich 4 : 0. Lässt sich Ihr Verdacht erhärten (α = 0.05)? c) (1 P.) Allgemeiner gefragt: Wie groß muss n mindestens sein, damit aus einem n : 0 Sieg (A:B) geschlossen werden kann, dass A signifikant (α = 0.05) stärker ist als B? d) (2 P.) Wie groß muss m sein, damit aus einem m : 1 Ergebnis (A:B) geschlossen werden kann, dass A signifikant (α = 0.05) stärker ist als B? e) (3 P.) Jemand, der p nicht kennt, nimmt nun das in c) ermittelte n, lässt die beiden Mannschaften gegeneinander spielen, bis n Tore gefallen sind, und schließt im Fall eines n : 0 (und nur in diesem Fall), dass Mannschaft A stärker ist. Wie groß ist der Fehler 2. Art, wenn die wahre Spielstärke von A bei pw = 2/3 liegt? Interpretieren Sie Ihr Ergebnis. Zusatzaufgabe 4. Ein Kindergarten registriert über 20 Jahre hinweg das Auftreten von Zeckenstichen: 1980 1 1981 1 1982 1 1983 3 1984 2 1985 2 1986 0 1987 0 1988 3 1989 1 1990 2 1991 3 1992 1 1993 1 1994 0 1995 0 1996 1 1997 2 1998 1 1999 3 a) (4 P.) Erstellen Sie eine Häufigkeitstabelle und zeichnen Sie das zugehörige Histogramm. Berechnen Sie Stichprobenmittelwert und empirische Varianz. b) (2 P.) Mit welcher Verteilung würden Sie die Anzahl der Zeckenstiche pro Jahr beschreiben? Begründen Sie Ihre Antwort. (Sie brauchen keine(n) Zahlenwert(e) für den(die) Parameter der Verteilung anzugeben.) c) (2 P.) Schätzen Sie nun (mit Hilfe der Momentenmethode) den oder die Parameter der Verteilung aus (b). Ist die Schätzung erwartungstreu? Warum bzw. warum nicht (kurze Rechnung!)? d) (4 P.) Es besteht der Verdacht, dass das Auftreten von Zeckenstichen in den letzten Jahren gegenüber dem in (c) ermittelten Wert (der, weil er aus langjähriger Erfahrung stammt, als Referenzwert angesehen wird) zugenommen 2 hat. Tatsächlich werden im selben Kindergarten (bei unveränderter Gruppengröße) im Jahr 2010 5 Stiche beobachtet. Lässt sich der Verdacht erhärten (α = 0.05)? (Führen Sie einen geeigneten Test durch, beginnend mit der Formulierung des Hypothesenpaars.) 3