Übungsaufgaben 1. Beim österreichischen Lotto sind 6 Zahlen aus der Menge (1; 2; …; 45) anzukreuzen; diese 6 Zahlen ergeben einen Tipp auf dem Lottoschein. a) Wie groß ist die Wahrscheinlichkeit, dass ein Tipp genau 6 richtige Zahlen aufweist? b) Mit welcher Wahrscheinlichkeit kreuzt man in einem Tipp 3 richtige Zahlen an? c) Wie groß sind die entsprechenden Wahrscheinlichkeiten beim deutschen Lotto? Hier sind 6 Zahlen aus (1; 2; …; 49) anzukreuzen. (Bei den Berechnungen sind Zusatzzahlen nicht zu berücksichtigen.) 2. Wie groß ist die Wahrscheinlichkeit, dass die drei Kinder einer Familie Mädchen sind, wenn bekannt ist, dass a) das erste Kind ein Mädchen ist und b) eines der Kinder ein Mädchen ist? Bei der Lösung nehme man Knaben- und Mädchengeburten als gleich wahrscheinlich an, Mehrlingsgeburten sind ausgeschlossen. 3. In einem Unternehmen mit 500 Beschäftigten werden im Zuge einer Grippeimpfung 300 geimpft. In der Folge erkrankten 50 Personen, von denen 15 geimpft waren. Wie groß ist die Wahrscheinlichkeit dafür, dass a) eine Person erkrankt, b) eine geimpfte Person erkrankt, c) eine erkrankte Person zur Gruppe der Geimpften gehört? 4. Ziegenproblem: In einer populären Fernsehshow bekam ein Kandidat die Chance, einen großen Preis (Auto) zu gewinnen. Dazu musste die richtige Wahl zwischen drei Türen getroffen werden; hinter einer steht ein Auto, hinter den beiden anderen je eine Ziege. Der Kandidat wählt z.B. Tür 1, und der Showmaster (der weiß, was sich hinter jeder Tür befindet) öffnet Tür 3 (wo - natürlich eine Ziege zum Vorschein kommt) und fragt den Kandidaten, ob er sich seine Wahl noch einmal überlegen, also wechseln will. Ist es ein Vorteil, die Wahl der Tür zu ändern? 5. Bei einem diagnostischen Verfahren zum Nachweis einer Erkrankung sei die Wahrscheinlichkeit, ein falsch-negatives (falsch-positives) Ergebnis zu erhalten, gleich 0,3% (10%). Die Wahrscheinlichkeit für das Auftreten der Krankheit in einer bestimmten Zielgruppe sei 0,5%. a) Man berechne die Wahrscheinlichkeit, dass bei positivem Ergebnis tatsächlich eine Erkrankung vorliegt. b) Eine Person mit positivem Testergebnis unterzieht sich ein zweites Mal dem Test. Wie groß ist die Wahrscheinlichkeit, dass eine Erkrankung vorliegt, wenn der Test positiv ausfällt? 6. Ein medizinischer Test zum Nachweis einer Erkrankung K liefert mit 95%-iger Wahrscheinlichkeit ein richtig-positives Ergebnis und mit 5%-iger Wahrscheinlichkeit ein falsch-positives Ergebnis. Wie groß ist die Prävalenz von K (d.h. die Wahrscheinlichkeit, mit der K in der betrachteten Region auftritt), wenn die Wahrscheinlichkeit eines positiven Testausgangs 23% beträgt? 7. Eine Münze wird dreimal geworfen, wobei bei jedem Wurf die Münze entweder Kopf oder Zahl (mit gleicher Wahrscheinlichkeit) zeigt. Man bestimme a) die möglichen Werte der Variablen X= „Anzahl der Köpfe in der Versuchsreihe“, b) die Wahrscheinlichkeitsfunktion von X und c) den Wert der Verteilungsfunktion an der Stelle x = 2. 8. Für bestimmte Blumenzwiebeln wird eine Wahrscheinlichkeit von mindestens 80% garantiert, dass eine Zwiebel nach dem Einsetzen austreibt. Jemand kauft 5 Zwiebeln und stellt fest, dass nur 3 1 austreiben. Unter der Voraussetzung, dass die garantierte Mindestwahrscheinlichkeit von 80% zutrifft, gebe man die Wahrscheinlichkeit dafür an, dass höchstens 3 der 5 Zwiebeln austreiben. 9. Bei einem medizinischen Eingriff ist das Risiko einer bestimmten Komplikation gleich 0.5%. Der Eingriff wird bei 100 Personen vorgenommen. Wie groß ist die Wahrscheinlichkeit P, dass mehr als 2 Komplikationen auftreten? a) Man bestimme P mit Hilfe der Poisson-Verteilung. b) Wie stark weicht die approximative Lösung von der exakten ab? 10. Ein Produktionslos enthält 1000 Widerstände. Der Hersteller garantiert, dass höchstens 5% defekt sind. Jedes Los wird vor Lieferung geprüft, indem 10 Widerstände entnommen werden. Sind alle 10 Widerstände in Ordnung, wird das Los zur Auslieferung freigegeben. Wie groß ist bei diesem Prüfverfahren die Wahrscheinlichkeit, dass ein Los zurückgewiesen wird, obwohl es den Bedingungen (höchstens 5% defekt) entspricht? 11. Rückfangmethoden werden angewendet, um die Größe N einer Population zu schätzen. Im einfachsten Fall werden aus der Population a Individuen eingefangen, markiert und wieder freigelassen. Nachdem sich die markierten Individuen mit der übrigen Population vermischt haben, wird eine zweite Stichprobe von n Individuen entnommen und festgestellt, wie groß die Anzahl R der darunter befindlichen markierten Individuen ist. Man bestimme die Wahrscheinlichkeit P(R=2), wenn N=500, a=100 und n=5 ist. 12. Für eine bestimmte Diagnosegruppe ist ein Laborparameter X normalverteilt mit einem Mittelwert von 75 Einheiten und einer Standardabweichung von 10 Einheiten. Laborwerte unter 55 und über 95 gelten als kritisch. a) Wie groß ist die Wahrscheinlichkeit, dass X einen kritischen Wert annimmt? b) Wie groß ist die Wahrscheinlichkeit, dass in einer Stichprobe von 5 Personen, mindestens viermal ein nicht kritischer Wert gemessen wird? 13. Die Serumspiegel von α-Tocopherol (Serum-Vitamin E) von Normalpersonen gelten als annähernd normalverteilt mit einem Erwartungswert von 860 µg/dl und einer Standardabweichung von 340 µg/dl. a) Welcher Anteil von Personen mit einem Serum-α-Tocopherolspiegel zwischen 550 und 1500 µg/dl ist unter diesen Annahmen zu erwarten? b) Mit welcher Wahrscheinlichkeit wird bei Einzelpersonen ein Serum-α-Tocopherolspiegel von 1600 µg/dl und mehr auftreten? c) Wie groß ist die erwartete Anzahl von Personen mit einem Serum-α-Tocopherolspiegel von 860 µg/dl und weniger, wenn 10 Einzelpersonen untersucht werden? d) Wie groß ist die Wahrscheinlichkeit, dass von 10 untersuchten Einzelpersonen genau 3 Personen Serum-α-Tocopherolspiegel von weniger als 860 µg/dl aufweisen? (aus: Ralf-Dieter Hilgers, Peter Bauer, Viktor Scheiber (2007). Einführung in die Medizinische Statistik. 2. Auflage, Springer Verlag.) 14. Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert 10 und der Varianz 0,25. a) Welcher Anteil von Präparaten mit der Substanz W zwischen 9mg und 11mg ist zu erwarten? b) Wie groß ist das 25%- und das 75%-Quantil der Verteilung? 15. Die Masse (in mg) eines Insekts sei normalverteilt mit dem Mittelwert 15 und der Varianz 9. Mit welcher Wahrscheinlichkeit nimmt die Masse einen Wert außerhalb des 1-fachen Interquartilabstandes IQR um den Mittelwert, d.h. außerhalb des Intervalls (µ-IQR, µ+IQR), angenommen? 2 16. Ein Hersteller von Erfrischungsgetränken füllt 1-Liter-Flaschen maschinell ab. Die Abfüllmenge 2 2 sei N(µ, σ )-verteilt. Man berechne µ und σ aus den Werten P(X < 0.97) = 0.04 und P (X > 1.03) = 0.03, die aus Erfahrung bekannt seien. (aus: Mühlbach, G. (2002). Repetitorium der Wahrscheinlichkeitsrechnung und Statistik. 2. Auflage, Binomi Verlag.) 17. Die nachfolgende Tabelle enthält die Gesamtzahl der bis zum Aussterben abgelegten Puparien für 40 (mit jeweils 15 geschlüpften Weibchen gebildete) Kohorten von Tsetsefliegen (Glossina p. palpalis). Man stelle die Verteilung der Merkmalswerte durch eine Häufigkeitstabelle und ein Histogramm dar. Ferner bestimme man das arithmetische Mittel und die Standardabweichung sowie den Median und die Quartile. 55 79 55 61 55 55 40 72 69 54 51 48 53 61 44 62 50 71 72 51 63 86 52 57 73 74 62 66 62 55 63 72 52 53 65 59 53 69 67 54 18. An sieben Patienten wurde der systolische Blutdruck im Sitzen (in mm Hg) vor einer Behandlung (Variable Xv) und nachher (Variable Xn) gemessen; es ergaben sich die in der folgenden Tabelle angeführten Werte. Man bestimme den Mittelwert und die Varianz des durch die Differenz Xn - Xv ausgedrückten Behandlungseffektes. Wie hängen diese Statistiken mit den Mittelwerten bzw. Varianzen von Xv und Xn zusammen? Xv Xn 175 140 155 143 195 157 173 170 154 133 180 150 178 170 19. Von einem metrischen Merkmal X liegt eine (fiktive) Zufallsstichprobe aus 100 Messwerten vor. a) Man lege eine geeignet Klasseneinteilung fest und stelle die Verteilung von X mit einer Häufigkeitstabelle dar, die die Klassengrenzen, die Klassenmitten, die absoluten und relativen Klassenhäufigkeiten sowie die Klassenhäufigkeitsdichten enthält. b) Man veranschauliche die Häufigkeitsverteilung mit einem flächennormierten Histogramm und zeichne in die Grafik zusätzlich die an die Daten angepasste Normalverteilungsdichte ein. 3.995 6.622 9.445 6.795 7.075 6.987 6.253 4.709 2.328 4.959 6.246 8.375 6.160 6.307 5.739 3.618 4.118 6.620 5.255 4.413 5.077 7.636 7.939 5.851 5.639 6.099 5.904 6.043 4.869 2.697 3.128 7.219 6.618 6.038 5.131 6.513 3.217 8.669 6.467 5.052 6.897 3.698 3.868 4.547 3.350 8.394 5.527 2.390 3.652 5.520 5.673 5.424 5.820 8.657 4.616 5.848 4.487 3.974 4.176 5.165 5.913 2.393 5.148 3.026 5.987 7.863 6.320 6.371 3.964 7.747 6.672 5.951 7.912 7.283 5.484 3.163 3.916 4.823 3.328 6.217 3.782 7.161 3.904 3.109 5.698 3.317 5.372 6.893 6.325 3.930 5.956 5.886 7.755 6.191 5.734 6.632 6.819 8.910 6.839 4.633 3 20. Daten aus Beispiel 19. Man stelle die Variation von X mit Hilfe eines Boxplots dar. Welcher Prozentsatz der Messwerte liegt innerhalb des 2-fachen Interquartilabstandes um den Median? Man bestimme den Prozentsatz empirisch (d.h. aus den Messdaten). Welcher Prozentsatz ergibt mit Hilfe der angepassten Normalverteilung? 21. In einem Simulationsexperiment zum Mendelschen Kreuzungsversuch von mischerbigen violettblühenden Erbsen (F1-Generation) wurden 20 Samen entnommen und die Anzahl X der violettblühenden F2-Pflanzen gezählt. a) Man beschreibe die Verteilung von X tabellarisch und grafisch. b) Nach der Mendelschen Spaltungsregel ist X binomialverteilt mit den Parametern n=20 und p=0.75. Man ergänze die Verteilungsgrafik durch die theoretische Verteilung von X. c) Man bestimme aus den Daten den Mittelwert und die Varianz von X und vergleiche diese Kennwerte der Häufigkeitsverteilung mit den entsprechenden Kennwerten der theoretischen Verteilung. 18 19 17 15 12 16 15 15 14 16 14 15 18 14 17 17 15 12 18 18 16 14 16 15 15 14 11 17 14 16 16 15 16 14 17 17 17 15 17 13 17 14 14 16 14 16 14 13 14 13 17 18 15 15 18 15 16 11 13 15 14 13 15 17 17 15 13 11 15 17 15 16 19 13 18 17 13 17 18 16 22. Für den Mittelwert und die Varianz von einer als normalverteilt angenommenen Variablen X wurden mit Hilfe einer Stichprobe vom Umfang n=15 die Werte 40 bzw. 10 bestimmt. Man bestimme ein 95%- Konfidenzintervall für den Mittelwert von X. Um wie viel % größer ist die Intervalllänge eines 99%igen Konfidenzintervalls? 23. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2- Konzentration der Luft in mg/m3) gemeldet: 29, 110, 47, 35, 65, 69, 9, 10. Man bestimme ein 95%-Konfidenzintervall für den Mittelwert und die Standardabweichung von X. 24. Im folgenden wird X als N(m, s2)-verteilt vorausgesetzt. Welcher Stichprobenumfang ist jeweils zu planen? a) Der mittlere Glykoalkaloidgehalt X (in mg/100 mg Frischgewicht) einer Kartoffelsorte soll mit einer Genauigkeit von ± 0.4 bei einer Sicherheit von 99% bestimmt werden. Von einer Voruntersuchung sei bekannt, dass s ≤ 2 ist. b) Das Normgewicht von 10-jährigen Knaben soll auf ± 0.5 kg genau mit einer Sicherheit von 95% bestimmt werden. Für die Standardabweichung möge die Abschätzung s ≤ 2.5 kg zutreffen. 25. In einer Studie wurden 33 Personen mit einem Präparat behandelt. Der Behandlungserfolg wurde auf einer 2-stufigen Skala mit den Skalenwerten "Verbesserung" und "keine Verbesserung" dargestellt. Es ergab sich bei 13 Personen eine Verbesserung. Man bestimme ein 95%iges Konfidenzintervall für die Wahrscheinlichkeit p einer Verbesserung. Welcher Stichprobenumfang müsste geplant werden, um die Wahrscheinlichkeit p mit einer Genauigkeit von +/- 0,1 und einer Sicherheit von 95% schätzen zu können? 26. In einem Supermarkt wurden 100 Milchpackungen überprüft und dabei festgestellt, dass in 15 Fällen die Milch im Begriffe war, sauer zu werden. Man bestimme ein Konfidenzintervall zum Niveau 1-a=95% für den Anteil der sauren Milchpackungen. 4 27. Die Wahrscheinlichkeit für das Auftreten einer Erkrankung soll in einer Risikogruppe mit einer Sicherheit von 95% und einer vorgegebenen Genauigkeit von ± 0.05 bestimmt werden. Wie viele Probanden benötigt man für die Studie? 5