Mittagessen Anzahl E 85 R 135 H 92 S 188 Tabelle 1: Essensverteilung Aufgaben mit Lösungen Mathematik IV für das Lehramt GruMi/Son 5. Juli 2005 Präsenzaufgaben: 1.3. In der Geomatikumkantine werden vier Essen angeboten, nämlich Eintopf (E), Rinderoulade (R), Hähnchenbrust (H) und Sojawürstchen (S). 500 ausgegebene Essen haben sich wie in Tabelle 1 folgt verteilt: Wie lauten die statistischen Begriffe für • Die Zahl 500 Lösung: Umfang der Stichprobe • Das Essen Eintopf“ ” Lösung: Merkmal • Die Zahl 85 Lösung: Absolute Häufigkeit des Merkmals Eintopf“. ” 1.4. Es wird im Skript zwischen qualitativen und quantitativen Merkmalen unterschieden. Es gibt eine noch differenziertere Unterteilung. Diskutieren Sie diese an Hand der Merkmale (a) Augenfarbe (b) Befinden (sehr, gut, es geht, nicht gut, sehr schlecht) (c) Temperatur (d) Gewicht (e) Ifo-Index (Stimmungsbarometer für die Wirtschaftslage) (f) Nationalität (g) Schulabschluss (h) Geburtsjahr (i) Zensur einer Arbeit 1 Abbildung 1: Histogramm Körpergröße Lösung: Bei qualitativen Merkmalen unterscheidet man zwischen ordinalen und nominalen M., je nachdem, ob man sie anordnen kann oder nicht. Die ordinalen Merkmale könnte man auch quantifizieren, die Zahl sagt aber weniger aus als bei metrischen Merkmalen, wo z.B. doppelt so schwer“ ” etwas aussagt, während man bei Stimmungen nicht von doppelt so gut“ sprechen kann. Eine Sonder” rolle spielt die Temperatur, bei der eigentlich kein Nullpunkt ausgezeichnet ist wie beim Gewicht oder der Länge. 1.5. 10000 Personen werden befragt, welche Partei sie wählen würden, wenn morgen Bundestagswahl wäre. 3580 entscheiden sich für die CDU/CSU, 3355 für die SPD, 710 für die Grünen, 580 für die FDP, 470 für die PDS, 380 für andere Parteien, der Rest gibt keine Auskunft. (a) Welches ist der Merkmalraum Ω? Lösung: Ω = {CDU/CSU, SP D, Gruene, F DP, P DS, andere, keineAngabe}. (b) Wieviele Komponenten hat der Stichprobenvektor? Lösung: n = 10000 (c) Welches ist die relative Häufigkeit für das Umfrageergebnis SPD“? ” Lösung: 33,55% 2.1. In Abb. 1 sehen Sie eine Verteilung einer Erhebung der Körpergröße mit einer Klassierung der Daten. (a) Wie groß schätzen Sie den Umfang der Stichprobe? Lösung: n = 155 (b) Welche Länge haben die Intervalle? Lösung: 6.3 (c) Wieviele Elemente hat der Merkmalraum? Lösung: 7 2 (d) Geben Sie die zwei Elemente des Merkmalraums an, zu denen die Längen 160 und 161 gehören. Lösung: [154.3, 160.6), [160.6, 166.9) (e) Wieviele Elemente hätte der Merkmalraum, wenn man als Klassenbreite 1 cm wählen würde? Lösung: Der kleinste Wert ist 148, der größte 192.1. Es gäbe dann ca. 44 Intervalle. 2.3. Berechnen Sie zu obigem x = (3, 2, 2, 2, 3, 1, 1, 4, 5, 5, 1, 1, 5, 3) den (?) Median. Lösung: Es handelt sich um n = 14 Daten, die 7-größte Zahl ist eine 2, die acht-größte eine 3. Damit ist jedes q ∈ [2, 3] ein Median oder aber, um diesen eindeutig zu machen, ist 2.5 der Median. Was ändert sich an dieser Antwort, wenn die letzte 3 zu einer 2 wird? Lösung: Dann ist der Median eindeutig =2. 3.1. Gegeben sei ein Stichprobenvektor x = (9, 10, 10, 8, 15, 11, 15, 15, 9, 10). (a) Zeichnen Sie die empirische Verteilungsfunktion F (b) Geben Sie F (7) und F (16) an. Lösung: F (7) = 0, F (16) = 1. (c) Geben Sie die p-Quantile für p = 0.1, 0.2, ...., 0.9 an — unter Benutzung von Def. 2.9. Welche Quantile sind nicht eindeutig? (d) Wie ändert sich der Mittelwert der Stichprobe, wenn ich seinen letzten Wert (a = 10) von a = 0 bis a = 20 variieren lasse? Lösung: a 7→ m(a) = (9 + 10 + 10 + · · · + 9 + a)/10 = 10.2 + a/10, d.h. der Mittelwert steigt linear von 10.2 auf 12.2 an. (e) Wie ändert sich der Median der Stichprobe, wenn ich seinen letzten Wert (a = 10) von a = 0 bis a = 20 ganzzahlig variieren lasse? Lösung: 10 ist stets ein Median. Für a > 10 ist [10, 11] ein Median-Intervall. 3.2. In einer Klausur gibt es maximal 80 Punkte. Mit 35 Punkten oder weniger gilt die Klausur als nicht bestanden. Mit 75 Punkten oder mehr gibt es ein sehr gut“. Es gebe nur ganzzahlige Bewertungen. ” (a) Sei F die Verteilungsfunktion zu den in der Klausur erzielten Punkten. Wie ergibt sich mit Hilfe von F der Anteil der nicht bestandenen und der Anteil der sehr guten Klausuren? Lösung: F (35) und 1 − F (74). (b) Angenommen, das 10%-Quantil sei 30. Welche der folgenden Aussagen ist richtig (a) Genau 10% haben 30 Punkte oder weniger (b) Mindestens 10% haben 30 Punkte oder weniger (c) Höchstens 10% haben 30 Punkte oder weniger (d) Höchstens 10% haben weniger als 30 Punkte 3 (e) 90 % haben mehr als 30 Punkte (f) Mindestens 90 % haben mehr als 30 Punkte (g) Höchstens 90 % haben mehr als 30 Punkte Lösung: Im Skript steht, dass das 10%-Quantil Q0.1 durch h(X ≤ Q0.1 = 30) ≥ 0.1 und h(X ≤ q) ≤ 0.1 für q < Q0.1 = 30 definiert ist (Def.2.9). Die erste Aussage bedeutet, dass mindestens 10% 30 Punkte oder weni” ger“ haben. Die zweite Aussage, dass höchstens 10% weniger als 30 Punkte haben. Dann haben wir aber auch die gleichwertigen Auusagen (s. Satz 2.10) h(X < Q0.1 ) ≤ 0.1 und h(X > Q0.1 ) ≤ 0.9 Erster besagt, das höchstens 10% weniger als 30 Punkte haben, die zweite, dass höchstens 90% mehr als 30 Punkte haben. Insgesamt sind die Aussagen (b), (d) und (f ) richtig, die anderen i.A. (nicht in allen Fällen!) falsch. 3.3. Die empirische Verteilungsfunktion F einer Stichprobe liefert zu einem x ∈ IR einen Funktionswert F (x), der Folgendes angibt: (a) Die absolute Häufigkeit, mit der x beobachtet wurde (b) Die relative Häufigkeit, mit der x beobachtet wurde (c) Die relative Häufigkeit, mit der Daten kleiner als x beobachtet wurden (d) Die relative Häufigkeit, mit der Daten kleiner oder gleich x beobachtet wurden (e) Die Wahrscheinlichkeit, mit der Daten kleiner oder gleich x beobachtet wurden Lösung: Vorletzte Aussage. 5.1. Sie würfeln mit drei Würfeln. (a) Wie muss der Merkmalraum aussehen, damit alle Elementarereignisse gleichwahrscheinlich sind? Lösung: Ω = {1, 2, ..., 6}3 , die Menge aller geordneten Tripel aus 1,2,...,6. (b) Wie sieht der Merkmalraum aus, wenn es nur auf die Augensumme ankommt? Lösung: Ω̂ = {3, 4, 5, ...., 18} 4 (c) Welche Ereignisse des ersten Merkmalraums entsprechen den Elementarereignissen des zweiten? Stellen Sie dies für einige Spezialfälle fest. Sei z.B. ω̂ = 5 ∈ Ω̂. Hierzu gehört das Ereignis A := {(1, 1, 3), (1, 3, 1), (3, 1, 1), (1, 2, 2), (2, 1, 2), (2, 2, 1)} ⊂ Ω. Letzteres Ereignis von Ω ent” spricht“ dem Elementarereignis ω̂ = 5 von Ω̂. (d) Wie groß ist die Wahrscheinlichkeit für einen Dreierpasch? Lösung: 6/|Ω| = 6/216 = 1/36. (e) Wie groß ist die Wahrscheinlichkeit für die Augensumme 7? Lösung: Man muss sorgfältig zählen, wieviele Tripel aus Ω zur Augensumme 7 führen. Bis auf die Reihenfolge sind es (1, 1, 5), (1, 2, 4), (2, 2, 3), (1, 3, 3). Es gibt 3! = 6 Permutationen von (1, 2, 4), von den anderen nur 3. Also gibt es 15 Tripel und die gesuchte Wahrscheinlichkeit ist 15/216 = 5/72. (f) Wie groß ist die Wahrscheinlichkeit für eine (un)gerade Augensumme? Lösung: Jeweils (nicht überraschend) 1/2. Es gibt viele Begründungen. Z.B., dass die vom Würfel verdeckte Augensumme stets gerade ist, wenn die Augensumme ungerade ist, und umgekehrt. Dasse salso genau so viele Tripel mit gerader wie mit ungerader Augensumme geben muss. Oder: Es kommt nur auf die Eigenschaft gerade (g)“ oder ungerade (u)“ eines Auges an. ” ” Eine gerade Augensumme tritt bie der Kombination (g, g, g) oder bei den Kombinationen (u, u, g), (u, g, u), (g, u, u) ein. Alle sind gleichwahrscheinlich (1/8). 6.1. Das berühmte Geburtstagsproblem kann auch so formuliert werden: Aus einer Urne mit n Kugeln werden k Kugeln mit Zurücklegen gezogen. Wie groß ist die Wahrscheinlichkeit, dass alle k Kugeln verschieden sind? Was ist hier der Merkmalraum? Lösung: : Identifiziert man die n Kugeln mit den Zahlen 1, 2, ..., n, so ist ein Ziehungsergebnis ein k-Tupel dieser n Zahlen, der Merkmalraum ist also das kartesische Produkt {1, 2, ..., n}k . Es gibt nk dieser k-Tupel, von denen haben (n)k = n(n − 1) · · · (n − k + 1) verschiedene Komponenten. Also ist die gesuchte Wahrscheinlichkeit n−k+1 n−1 n−2 · ··· . n n n 6.2. Analysieren Sie das Ziegenproblem“ mit 4 Türen (wobei hinter drei Türen eine Ziege“, hinter ” ” einer der Hauptgewinn steht. Die SpielerIn hat zwei Versuche, nach dem ersten wird eine Ziegentür“ ” geöffnet). Lösung: : In einem von vier Fällen gewinnt der Nichtwechsler, der Wechsler gewinnt nur, wenn er als erstes nicht auf den Mercedes zeigt (75%), dann aber auch nur, wenn er von den verbleibenden 2 Türen die richtige rät. Also ist die Gewinn-Wahrscheinlichkeit 0.75 · 0.5 = 3/8. Bei n Türen: 1 n−1 n−1 · = . n n−2 n(n − 2) 5 6.3 3. Für einen Euro Einsatz gewinnen Sie einen weiteren Euro, wenn Sie mit 4 Spielwürfeln mindestens eine 6 werfen. Lohnt sich das Spiel? Lösung: Ja. Die Wahrscheinlichkeit ist 1 − ( 56 )4 = 0.52. 8.1. Eine Lostrommel enthalte 100 Lose, unter ihnen 5 Gewinnlose. Sie ziehen zwei Lose. Wie groß ist die Wahrscheinlichkeit, dass Sie mindestens einmal gewinnen? Dass Sie zweimal, bzw. dass Sie genau einmal gewinnen? Dass Sie kein Mal gewinnen? Begründen Sie Ihre Antworten einmal rein kombinatorisch, ein anderes Mal mit Hilfe der K-Axiome und ihren Folgerungen, indem Sie A (B) als das Ereignis bezeichnen, dass das erste (zweite) gezogene Los gewinnt. Lösung: Sei A (B) das Ereignis, dass das erste (zweite) gezogene Los gewinnt. Gesucht sind P (A ∪ B), P (A ∩ B), P (A \ B + B \ A). Es gilt P (A) = P (B) = 0.05, P (A ∩ B) = 0.05 · 4/99 = 0.00202. Nach den K-Regeln gilt P (A \ B) = P (A) − P (AB) = 0.04798 = P (B \ A). Wegen P (A ∪ B) = P (A) + P (B) − P (AB) ist 0.09798 die Wahrscheinlichkeit, dass mindestens ein Los gewinnt, P (A ∩ B) = 0.00202 die Wahrscheinlichkeit, dass beide Lose, P (A \ B) + P (B \ A) = 0.0.09596 die Wahrscheinlichkeit, dass genau ein Los gewinnt, und daher1 − 0.00202 − 0.09596 = 0.90202 die Wahrscheinlichkeit, dass kein Los gewinnt. Man hätte auch kombinatorisch vorgehen können: Es gibt 100 · 99 = 9900 verschiedene gleichwahrscheinliche Ziehungsergebnisse. Man kann annehmen, dass die Nummern 1 bis 5 gewinnen. Dann gibt es 95 · 94 = 8930 Ergebnisse ohne jeden Gewinn. Auf diese Weise erhält man p0 := 8930/9900 = 0.90202 als die kein-Gewinn-Wahrscheinlichkeit“. Zu zwei Gewinnen führen 5 · 4 = 20 Ziehungser” gebnisse. daher ist p2 = 20/9900 = 0.00202 die Wahrscheinlichkeit für zwei Gewinne. Damit ist p1 := 1 − p0 − p2 = 0.09596 die Wahrscheinlichkeit auf genau ein Gewinn. Und 1 − p0 = (p1 + p2 =)0.09202 die Wahrscheinlichkeit auf mindestens einen Gewinn. 8.2. (a) Schmidts haben zwei Kinder. Auf die Frage, ob sie eine Tochter haben, antwortet Frau Schmidt mit ja. Wie groß ist die Wahrscheinlichkeit, dass auch das andere Kind eine Tochter ist? Lösung: : Die vier Fälle JJ, JM, MJ, MM sind gleichwahrscheinlich. Nur die letzten drei Möglichkeiten gibt es, von denen nur eine auf ein zweites Mädchen führt. Also Antwort: 1/3 (b) Schmidts haben zwei Kinder. Auf einer Gartenparty kann man ein Mädchen erkennen, das andere Kind wird von einem Strauch verdeckt. Wie gros̈ ist die Wahrscheinlichkeit, dass auch das andere Kind eine Tochter ist? Lösung: : Durch den Strauch werden die Kinder angeordnet“. Die zweite Komponente des ” geordneten Paares sei das Geschlecht des Kindes hinter dem Strauch. Dann gibt es nur zwei gleichwahrscheinliche Möglichkeiten: (M,M) und (M,J). Die Wahrscheinlichkeit ist also 1/2. 9.1. Ein Kasten Bier enthält 24 Flaschen. Eine Flasche sei mit der Wahrscheinlichkeit p := 0.01 beschädigt. Was hat die Frage nach der Wahrscheinlichkeit, dass 3 Flaschen eines Bierkastens beschädigt sind, mit der Binomialverteilung zu tun? 3 21 = 0.00163889. Lösung: b(24, p; 3) = 24 3 p (1 − p) 6 9.2. Es gibt vier (perfekte) Würfel mit den ungewöhnlichen Zahlen (0,0,4,4,4,4) (A), (1,1,1,5,5,5) (B), (2,2,2,2,6,6) (C) und (3,3,3,3,3,3) (D). Schüler und Lehrer nehmen sich je einen Würfel, um danach gegeneinander anzutreten (wer die höhere Zahl würfelt, gewinnt). Welchen Würfel würden Sie wählen? Analysieren Sie das Spiel! Lösung: A schlägt D, D schlägt C, C schlägt B (etwas schwerer einzusehen) und B schlägt A, jeweils mit Wahrscheinlichkeit 2/3. Wer als zweiter wählt, gewinnt! Genauer: • In vier von sechs Fällen wirft A eine 4. In diesen Fällen gewinnt A gegen D. In den anderen beiden Fällen verliert A. • C schlägt B: Das Wurfergebnis ist ein geordnetes Paar aus Ω = {(1, 2), (1, 6), (5, 2), (5, 6)} (erste Komponente: Ergebnis von B, zweite komponente: Ergebnis von C). ω1 := (1, 2) hat die Wahrscheinlichkeit p1 = 1/3, ω1 := (1, 6) die Wahrscheinlichkeit p2 = 1/6, ω3 := (5, 2) die Wahrscheinlichkeit p3 = 1/3 und ω4 := (5, 6) die Wahrscheinlichkeit p4 = 1/6. Das Ereignis C schlägt B“ ist durch {ω1 , ω2 , ω4 } gekennzeichnet. Deren Wahrscheinlichkeit ist ” p1 + p2 + p4 = 2/3. Wenn Sie die Wahrscheinlichkeiten pj , j = 1, 2, 3, 4 nicht einsehen können, stellen Sie sich einen Merkmalraum aus 36 gleichwahrscheinlichen Elementen vor - wie bei 2 normalen Würfeln. Dann entspricht ω1 sechs von diesen Elementarereignissen. 10.1. Im Mittel werden der Polizei pro Jahr sechs Fahrraddiebstähle am Geomatikum gemeldet. (a) Wie groß ist die Wahrscheinlichkeit, dass im Jahr 2005 kein, einer, zwei oder auch weniger als sechs Diebstähle gemeldet werden? Lösung: Sei X= Anzahl der gemeldeten Diebstähle pro Jahr. Nach der Poissonverteilung sind pk := P (X = k) = e−6 6k k! die Elementar-Wahrscheinlichkeiten. Dann gilt (etwas Rechnung!) p0 = e−6 = 0.00248, p1 = 0.0149, p2 = 0.0446, F (5) = p0 + p1 + · · · + p5 = 0.4457. Mit der Wahrscheinlichkeit von 44,57% werden also weniger als 6 Diebstähle gemeldet. (b) Wie groß ist die Wahrscheinlichkeit, dass im Jahr 2005 zwölf oder mehr Diebstähle gemeldet werden? Hinweis: Es genügt hier, eine Formel anzugeben. Lösung: 1 − F (11) = 0.02009, also rund 2%. F ist die Verteilungsfunktion zur Poissonverteilung. 7 (c) Nehmen wir an, dass die Wahrscheinlichkeiten für Diebstähle von Fahrrädern in den nächsten 10 Jahren unverändert bleiben. Wie groß ist die Wahrscheinlichkeit, dass in mindestens zwei der nächsten zehn Jahre zwölf oder mehr Diebstähle gemeldet werden? Benutzen Sie das Ergebnis der letzten Frage. Lösung: Binomialverteilung! 1 − F10,0.02009 (1) = 0.0163, also 1,6%. 10.2. Die Wahrscheinlichkeit eines nächtlichen Einbruchs in ein Reihenhaus betrage (pro Nacht) p = 0.0001, also 0.01%. Wie groß ist die Wahrscheinlichkeit, dass (a) der erste Einbruch am 7.Tag erfolgt? Lösung: (1 − p)6 p = 0.99996 · 0.0001 = 0.00009994 (b) der erste Einbruch nach genau 5 Jahren, also am ersten Tag nach Ablauf von 5 Jahren erfolgt? (1 − p)5·365 p = 0.0000833 (c) das Haus fünf Jahre einbruchsfrei bleibt? Lösung: Ganz einfach (ohne direkte Benutzung der geometrischen Verteilung) (1 − p)5·365 = 0.9999365 = 83.3% (d) in einem Jahr genau zwei Einbrüche erfolgen? Lösung: b(365, p; 2) = 0.00064. 11.1. Sei f (x) := 0 e−x für x < 0 für x ≥ 0 (a) Warum ist f eine W-Dichte? Lösung: Es ist f (x) ≥ 0 für alle x und Z ∞ Z f (x)dx = −∞ ∞ e−x dx. 0 Rb Es ist 0 e−x dx = 1R− e−b , da −e−x Stammfunktion von e−x ist. Nun lasse b = bn → ∞ gehen. ∞ Da e−bn → 0, folgt 0 e−x dx = 1. (b) Sei X eine Zufallsvariable, die die W-Dichte f hat. Berechnen Sie für k ∈ IN pk := P (k ≤ X ≤ k + 1) Lösung: Z pk = k+1 e−x dx = e−k − e−(k+1) = e−k (1 − e−1 ). k 8 (c) Berechnen Sie das 10%-Quantil q. Lösung: Es muss Z z f (x)dx = 0.1 F (z) = ∞ gelten. Es muss z > 0 gelten, da f (x) = 0 für x ≤ 0. Also muss Z z e−x dx = 0.1 0 gelten. Da −e−x eine Stammfunktion von e−x ist, ergibt dies die Gleichung 0.1 = 1 − e−z , also z = − ln(0.9) = 0.1054. 11.2. Ein Stab der Länge 2m werde zufällig geteilt, wobei die Wahrscheinlichkeit, den Trennpunkt x zu treffen, mit wachsender Entfernung vom MIttelpunkt abnehmen soll. Geben Sie eine möglichst einfache W-Dichte an, die diese Eigenschaft widerspiegelt. Lösung: Der Graph von f ist ein auf [0, 2] aufgestztes gleichschenkliges Dreieck mit Fläche 1. Dessen Höhe ist daher . Zeichnen Sie die Verteilungsfunktion! Geben Sie sie analytisch an! Lösung: 0 für x<0 1/2x2 für x ∈ [0, 1] F (x) := 1 − 1/2(2 − x)2 für x ∈ [1, 2] 1 für x>2 12.1. Sie würfeln mit zwei Würfeln. Wie groß ist die Wahrscheinlichkeit, dass Sie die Augensumme 10 würfeln, wenn Sie schon wissen, dass der erste Würfel eine gerade Zahl anzeigt. Lösung: A sei das Ereignis Augensumme 10“, B das Ereignis erste Augenzahl ist gerade“. Da P (AB) = 1/18 ” ” und P (B) = 0.5, gilt P (AB) 1 P (A|B) = = . P (B) 9 12.2. Die gleiche Frage wird gestellt, wenn man weiß, dass mindestens ein Würfel eine gerade Augenzahl zeigt. Raten Sie vor der Rechnung, ob die Wahrscheinlichkeit kleiner oder größer als in der Aufgabe zuvor ausfällt. Lösung: Hier ist B das Ereignis mindestens eine Augenzahl ist gerade“. Es gilt wieder P (AB) = ” 1/18, aber P (B) = 34 , da das Komplementärereignis die Wahrscheinlichkeit 9/36 = 14 hat. Daher gilt 2 P (A|B) = 27 < 19 . 9 Abbildung 2: Aufgabe 2a 12.3. Sie würfeln wieder mit zwei Würfeln. Wie groß ist der Erwartungswert der Augensumme? Sie dürfen benutzen j/36, j = 1, 2, ...., 6 pj = P (X = j + 1) = (12 − j)/36, j = 7, ..., 11 Lösung: EX = 1 252 (2 · 1 + 3 · 2 + 4 · 3 + 5 · 4 + 6 · 5 + 7 · 6 + 8 · 5 + 9 · 4 + 10 · 3 + 11 · 2 + 12 · 1) = =7 36 36 Übungsaufgaben: Aufgabe 2: Mit JUMBO kann man in einem Applet Histogramm mit variabler Klassenbreite einen eigenen Datensatz eingeben. Geben Sie x = (23, 44, 49, 17, 22, 33, 41, 28, 35, 67, 61, 26, 15, 39) ein und klassieren Sie diese mit Klassenbreite 10.4. Drucken Sie das zugehörige Histogramm aus. Berechnen Sie die Mittelwerte vor und nach der Klassierung. Lösung: Siehe Abb. 2. Der Mittelwert vor der Klassierung ist 35, 71, nach der Klassierung sind die Klassenmitten 9.8, 20.2, 30.6, 41, 51.4, 62.8, ihre absoluten Häufigkeiten sind 1, 3, 4, 3, 1, 2. Damit errechnet sich x = (9.8 + 3 · 20.2 + 4 · 30.6 + 3 · 41 + 51.4 + 2 · 62.8)/14 = 35.2 Aufgabe 3: Gegeben sei der Stichprobenvektor x = (1, 2, 3, 4, ..., 10). Nun komme noch ein weiterer Messwert a ∈ IN hinzu, der beliebig groß ausfallen kann. Sei mw(a) der Mittelwert und me(a) der Median der 11 Messwerte1 . Geben Sie eine Formel für mw(a) und me(a) an und zeichnen Sie beide Funktionen. 1 Auch wenn dieser Begriff offiziell noch nicht vorkam: Ordnet man die xk der Größe nach an, so ist der Median der mittlere Wert — hier der sechst-größte. 10 Lösung: mw(a) = 55/11 + a/11, me(a) = 5 für a ≤ 5, me(a) = 6 für a ≥ 6 und me(a) = a sonst. Aufgabe 4: Sei f : IR → IR eine reelle Funktion, mit deren Hilfe aus einem Stichprobenvektor x = (x1 , x2 , ..., xn ) ein anderer Stichprobenvektor y = (y1 , y2 , ..., yn ) mit yk := f (xk ), k = 1, 2, ..., n wird. Seinen x und y die Mittelwerte von x und y. Ferner seien xM und y M deren Mediane. Erörtern Sie die Eigenschaften y = f (x) sowie y M = f (xM ) an Hand von Beispielen. Lösung: Ist f streng monoton, so bleibt die Anordnung der xk erhalten oder wird umgedreht. In jedem Fall gilt y M = f (xM ) für den Median. Für den Mittelwert gilt etwas entsprechendes i.A. nur, wenn f affin-linear, also vom Typ f (x) = ax+b ist. Aufgabe 5: Zeigen Sie, dass für den Mittelwert x einer Stichprobe x = (x1 , x2 , ..., xn ) gilt x ≤ M0 := max k=1,2,...,n xk . Hinweis: Die Aussage ist offensichtlich wahr. Sie soll aber formal korrekt bewiesen werden - siehe auch das Skript für eine ähnliche Aussage. Lösung: Analog wie im Skript zum Minimum: Wenn nämlich x > M0 (indirekter Beweis!), so gilt x > M0 ≥ xk , k = 1, 2, ..., n. Dann gilt aber auch x1 + x2 + · · · + xn < x + x + · · · + x = n · x. Dividiert man diese Ungleichung durch n, so erhält man den Widerspruch x < x. Aufgabe 6: Die Abb. 3 enthält die erhobenen Daten der Körperlänge einer dritten Grundschulklasse. Abb. 4 und Abb. 5 geben die Erhebung grafisch durch Histogramme wieder. Beantworten Sie die folgenden Fragen (verwenden Sie dabei die Vokabeln des Skripts und keine eigenen Wortschöpfungen. Die Bezeichnungen ri , di , αi in Abb. 3 sind anders als im Skript.) (a) Wie viele SchülerInnen wurden gemessen? Wie nennt man diese Zahl? Umfang der Stichprobe n = 61 (b) Wie groß sind die kleinste und die größte SchülerIn? Lösung: 130 cm, 152,2 cm (c) Was bedeutet die Höhe der Rechtecke in Abb. 4? Lösung: Die relative Häufigkeit der Längenklassen der Klassenbreite Eins. (d) Wieviele Stäbe würde ein Stabdiagramm enthalten? Über welcher Länge wäre der höchste Stab zu finden? Lösung: Es gibt drei Längen, die zweimal, und zwei Längen, die dreimal vorkommen. Also gibt es 61-3-4=54 Stäbe. Die beiden höchsten Stäbe gehören zu den Längen 140,3 cm und 142,2 cm 11 Abbildung 3: Längenmessungen von GrundschülerInnen Abbildung 4: Grafische Darstellung A der Längenmessungen 12 Abbildung 5: Grafische Darstellung B der Längenmessungen (e) Erläutern Sie die Abb. 5. Lösung: Es handelt sich um ein Histogramm mit unterschiedlich breiten Klassen. Letztere sind durch die αi gegeben: [130, 134), [134, 135), [135, 138), [138, 140), [140, 141), [141, 146), [146, 152.5) Die Flächen der Rechtecke entsprechen den relativen Häufigkeiten der Klassen. (f) Wie groß ist die Gesamtfläche der Rechtecke in Abb. 4? Lösung: 1 Aufgabe 7: Falls Ω = {0, 1, ..., m} und die relativen Häufigkeiten von j ∈ Ω einer Stichprobe gerade m j hj = p (1 − p)m−j , j = 0, 1, ..., m j mit einem p, das 0 < p < 1 erfüllen, so sprechen wir von einer Binomialverteilung mit Parameter p. (Achtung: Die Nummerierung fängt hier bei j = 0 an!!) (a) Zeigen Sie mit Hilfe des Binomischen Lehrsatzes I.7.6, dass m X hj = 1. j=0 Lösung: Der Binomische Lehrsatz besagt n (a + b) = n X n k=0 k ak bn−k Setze a := p und b := 1 − p sowie n := m und j statt k. 13 (1) Abbildung 6: Binomialverteilung p = 0.2, m = 5 (b) Berechnen Sie für p = 0.2 und m = 5 die 6 verschiedenen hj , j = 0, 1, ..., 5, und zeichnen Sie die Verteilung. Hinweis: Sie können JUMBO benutzen. Lösung: h0 = 0.32768, h1 = 0.4096, h2 = 0.2048, h3 = 0.0512, h4 = 0.0064 und h5 = 0.00032. Zur Grafik s. Abb. 6 (die Beschriftung auf der Achse muss 0.3 statt 0.5 lauten. Hier irrt ein Jumbo-Applet). (c) Mit welcher Formel im Skript können Sie den Mittelwert der Stichprobe berechnen, auch wenn Sie weder Umfang noch die einzelnen Daten der Stichprobe, sondern nur die relativen Häufigkeiten hj kennen? Berechnen Sie den Mittelwert im Spezialfall der letzten Teilaufgabe! Lösung: Die Formel lautet x= m X hj ω j , j=1 hier x= 5 X j · hj = 1. j=0 Dies ist kein Zufall, da der Erwartungswert der Binomialverteilung gerade mp und hier p = 0.2 und m = 5 ist. Aufgabe 8: Betrachte zu einer Stichprobe x = (x1 , x2 , ..., xn ) die Fehlerquadratsummenfunktion q : IR → IR, q(x) = n X (xk − x)2 . k=1 Beweisen Sie den im Skript notierten Satz: Der Mittelwert x ist Tiefpunkt (Minimum) von q, d.h. es gilt q(x) ≤ q(x) für alle x ∈ IR. 14 Anzahl der Tassen Anzahl der Kunden 1 4 2 8 3 15 4 6 5 5 6 2 Tabelle 2: Teeumfrage Hinweis: Bei der Differentiation können Sie Summenzeichen und Differentiation vertauschen. Lösung: n X q 0 (x) = −2 (xk − x), q 00 (x) = 2n k=1 Wegen n X (xk − x) = 0 k=1 folgt q 0 (x) = 0, d.h. an der Stelle x = x liegt ein Extremum vor. Wegen q 00 (x) > 0 für alle x, muss dies ein Tiefpunkt sein. Aufgabe 13: Ein Marktforschungsinstitut befragt 40 Kunden eines Teeladens nach der Anzahl der von ihnen durchschnittlich pro Tag getrunkenen Tassen Tee. Dabei ergaben sich die folgenden Zahlen in Tabelle 2. Sei F die zugehörige Verteilungsfunktion. (a) Zeichnen Sie den Graphen von F (b) Wie hoch ist der Anteil der Kunden, die höchstens 4 Tassen pro Tag trinken? Drücken Sie diese Zahl durch einen Funktionswert von F aus. Lösung: F (4) = 33/40. (c) Wie hoch ist der Anteil der Befragten, die mindestens 3 und höchstens 5 Tassen pro Tag trinken? Drücken Sie diese Zahl durch die Differenz von zwei Funktionswerten F (x) aus. Lösung: F (5) − F (2) = 26/33. (d) Welche Anzahl an Tassen pro Tag wird von 95% der Kunden nicht überschritten? Lösung: 5% von 40 Kunden sind 2 Kunden. Die Antwort ist 5. (e) Bestimmen Sie den Median. Wie verändert sich dieser, wenn einer der Kunden statt 2 Tassen 7 Tassen Tee pro Tag angegeben hätte? Argumentieren Sie mit der Verteilungsfunktion! Lösung: Der Median ist in jedem Fall gleich 3, da F (3) = 27/40 und F (2) = 12/40, bei Veränderung der Angabe wäre F (3) = 26/40 und F (2) = 11/40 Aufgabe 15: Die folgenden Fragen beziehen sich auf das JUMBO-Applet Explorative Datenanalyse2 2 http://medweb.uni-muenster.de/institute/imib/lehre/skripte/biomathe/bio/eda/datalist.html 15 Abbildung 7: Aufgabe 11 Sie können nach Wahl von Histogramme“ durch ein Häkchen bei Statistik“ ein Fenster mit vielen ” ” statistischen Informationen finden. (a) Wie groß ist der Umfang n der Stichprobe? Lösung: n = 42 (b) Ermitteln Sie den Korrelationskoeffizienten zwischen systolischen und diastolischen Blutdruck. Hinweis: Benutzen Sie den Scatterpolot“. ” Lösung: r = 0.96575 (c) Wie lauten die ersten und dritten Quartile sowie der Median der beiden Blutdrücke? Lösung: Diastolisch: 80, 90, 100, Systolisch: 120, 130, 145 (d) Welche Standardabeichung hat der systolische und welche der diastolische Blutdruck? Lösung: Der systolische: 17.47, der diastolische: 13.50 (e) Erklären Sie Abb. 7. Lösung: Es handelt sich um einen Boxplot des systolischen Blutdrucks. Er zeigt die ersten drei Quartile (der zweite ist der Median). Ganz außen sind die Minima und Maxima der Stichprobe. (f) Erläutern Sie die Tabelle in Abb. 8 (Kontingenztafel)? Lösung: Die Blutdrucke wurden jeweils in vier Klassen eingeteilt. Die Tabellenwerte sind einerseits die absoluten Häufigkeiten der Patienten, die zu dem entsprechenden Klassen-Paar gehören. Diese werden relativiert, indem sie zu der Gesamtzahl der zur Zeilenklasse gehörenden Patienten dividiert werden. Aufgabe 16: In Abb. 9 sehen Sie eine Kontingenztafel mit absoluten Häufigkeiten zu den beiden Merkmalen Länge (X) und Gewicht (Y) von 61 SchülerInnen einer dritten Schulklasse mit jeweils vier Klassen. 16 Abbildung 8: Aufgabe 11 Abbildung 9: Kontingenztafel der beiden Merkmale Länge und Gewicht 17 Berechnen Sie die Mittelwerte x und y sowie den Korrelationskoeffizienten rxy . Hineis: Die Rechnungen sind etwas länglich, können aber durch Geschick etwas verkürzt werden. Lösung: (z.T. nach Fischer) x= 20 · 133 + 18 · 138 + 19 · 143 + 4 · 150 = 138.7, 61 y = 33.3 Sxx = (x − x) · (x − x) = 20 · 5.552 + 18 · 0.52 + 19 · 4.52 + 4 · 11.52 = 1520.69, Syy = 1713.49.0, Sxy =??, Sxy = 0.3766 Sxx Syy rxy = p Die Ergebnisse in Fischer sind falsch. Aufgaben 17-19: (siehe Test 1) (a) Sei x = (2, 1, 4, 4, 4, 1, 1, 0, 10) ein Stichprobenvektor. Berechnen Sie dessen Mittelwert, Varianz und Streuung. Lösung: Mittelwert ist x = 27/9 = 3. Die Varianz ist V = √ 9.25, die Streuung ist 9.25 = 3.04. 12 +22 +12 +12 +12 +22 +22 +32 +72 8 = 74 8 = Wer bei der Varianz die Quadrate weglässt, erhält natürlich Null. Aber Varianz=Null bedeutet, dass alle Daten gelich dem Mittelwert sind, dass also keinerlei Streuung“ der Daten um den ” Mittelwert vorliegt! (b) Wie lautet der Tiefpunkt von f (x) := 3(x − 1)2 + 6(x − 3)2 + 2(x − 5)2 ? Von welcher Stichprobe ist er der Mittelwert? Lösung: Die Stichprobe enthält dreimal die 1, sechsmal die 3 und zweimal die 5. Der Mittelwert ist 31/11. Grund: Satz 2.5. (c) In einer Feuerwache zählt man an insgesamt 300 Tagen die Anzahl der täglichen Einsätze, die sich auf maximal 9 beliefen. Das Ergebnis finden Sie in folgender Tabelle: Anzahl Einsätze Anzahl Tage 0 10 1 16 2 38 3 50 4 61 5 62 6 40 7 18 8 4 9 1 • Sei ωj die j-kleinste Merkmalsausprägung. Geben Sie alle ωj und deren relative Häufigkeiten hj , j = 1, 2, ..., m an. Lösung: ω1 = 0, ...., ω10 = 9, h1 = 1/30, ...., h10 = 1/300 18 • Sei F die zugehörige Verteilungsfunktion. Berechnen Sie F (3), F (0) und F (12) =. Lösung: F (0) = 1/30, F (3) = 114/300, F (12) = 1 Achtung: F (3) = Anteil der Daten ≤ ω3 = 4! • Berechnen Sie das 10%-Quantil, das 90%-Quantil. und den Median. Lösung: Wegen F (1) < 0.1, F (2) > 0.1 ist 2 das 10%-Quantil. Analog ist der Median=4 (es ist F (3) < 0.5 und F (4) > 0.5), das 90%-Quantil ist 6, da F (7) > 0.9, aber F (6) < 0.9. (d) Berechnen Sie den Median und das 75%-Quantil von x = (1, 2, 1, 3, 4, 1, a, 3, 3) für ein allgemeines a ∈ IR. Lösung: Der Median ist der fünftgrößte Wert und muss in [2, 3] liegen, da mindestens 4 Werte ≤ 2 und 4 Werte ≥ 3 sind. Wenn a ≤ 2, ist der Median =2, wenn a ≥ 3, ist der Median = 3 und sonst = a. Es handelt sich um 9 Daten. Da 2/9 < 1/4, müssen mindestens drei Daten größer gleich dem 75%-Quantil sein. Das kann aber nur drei sein! (e) Es werde eine Stichprobe zu dem Gewicht von Abiturientinnen erhoben. Angenommen, das 90%Quantil sei 86 kg. Welche der folgenden Aussagen kann man mit Sicherheit hieraus ableiten? • Genau 10% wiegen 86 kg oder mehr. • Mindestens 90% wiegen 86 kg oder weniger. • Höchstens 10% wiegen mehr als 86 kg. • Mindestens 10% wiegen 86 kg oder mehr. • Genau 90% wiegen 86 kg oder weniger. • Höchstens 90% wiegen 86 kg oder weniger. • Höchstens 90% wiegen weniger als 86 kg. Lösung: Nach Satz 2.10 wiegen höchstens 90% weniger und höchstens 10% mehr als 86 kg. Die erste Aussage ist gleichwertig damit, dass mindestens 10% 86 kg oder mehr wiegen, die zweite Aussage ist gleichwertig damit, dass mindestens 90% 86 kg oder weniger wiegen. Also sind insgesamt vier der obigen Aussagen wahr, nämlich die 2., 3., 4. und 7. (f) Nach einer EU-Richtlinie darf in einer Stadt ein Grenzwert eines 24-Stundenmittels in Höhe von 125 Mikrogramm Schwefeldioxid pro Kubikmeter nur an höchstens 3 Tagen im Jahr überschritten werden. Formulieren Sie diese Richtlinie in Form einer Quantilsaussage. Lösung: Dann darf das 362 365 -Quantil der Verteilung von 365 24-Stundenmittel Mikrogramm Schwefeldioxid pro Kubikmeter nicht höher als 125 Mikrogramm ausfallen. 19 (g) In zwei Klassen werden je eine Arbeit geschrieben. In der ersten Klasse gibt es 10 Einsen, 10 Dreien und 10 Fünfen, in der zweiten 15 Dreien und 15 Fünfen. Um wieviel ist die erste Streuung größer als die zweite? Lösung: Klasse 1: Mittelwert=3, Varianz=V1=80/29. Klasse 2: Mittelwert=4, Varianz=V2=30/29. p p Faktor ist V 1/V 2 = 8/3. (h) Sei x = (1, 2, 3) und y = (3, 5, 7). Berechnen Sie den Korrelationskoeffizient rxy . Welche funktionale Beziehung besteht zwischen x und y? Lösung: rxy = 1, f (x) = 2x + 1. (i) Zwei Spieler spielen an 10 aufeinanderfolgenden Tagen gegeneinander. Der Gewinn des einen ist stets der Verlust des anderen. Nach 10 Tagen sei x ∈ IR10 der Gewinn-Verlust-Vektor“ des einen ” und y ∈ IR10 der des anderen Spielers. Warum gilt für den Korrelationskoeffizienten rxy = −1? Lösung: Der funktionale Zusammenhang ist f (x) = −x. Aufgabe 20: Sie würfeln mit drei Würfeln. Angenommen, nach n Zufallsexperimenten (Stichprobe vom Umfang n) sind die relativen Häufigkeiten für alle Augensummen genau gleich ihren Wahrscheinlichkeiten. Was weiß man über n? Wie groß ist der Mittelwert der Stichprobe? Und der Median? Das 90%-Quantil? Lösung: n muss ein Vielfaches von 63 = 216 sein, um P (X = 3) = 1/216 richtig zu treffen. Alle anderen Wahrscheinlichkeiten sind Vielfache dieser Wahrscheinlichkeit. Es gibt die Augensummen von 3 bis 18. Die Wahrscheinlichkeit-Verteilung ist symmetrisch mit der höchsten Wahrscheinlichkeit für 10 und 11. Der Mittelwert ist daher 10.5, der Median ebenfalls. Es gibt nur eine Möglichkeit für die 18, drei für 17, sechs für 16, zehn für 15. Die Wahrscheinlichkeit für Ergebnisse ≥ 15 ist also 20/216 < 0.1. Damit ist F (15) > 0.9. Ferne rist F (14) < 0.9. Daher ist 15 das 90%-Quantil. Aufgabe 21: Man stelle zufällig 3 Flaschen Saft aus drei verschiedenen Sorten (Apfel, Orange, Birne) zu einem Saftkorb“ zusammen. ” (a) Wie groß ist die Wahrscheinlichkeit, dass (mindestens) eine Sorte nicht im Saftkorb vertreten ist? Lösung: Komplementär: es gibt 3!=6 Möglichkeiten, drei verschiedene Sorten zu erwischen - mit Beachtung der Reihenfolge. Und 33 = 27 Möglichkeiten insgesamt. Also gibt es 21 Möglichkeiten, eine Sorte nicht zu erwischen. Daher ist die gesuchte Wahrscheinlichkeit 21/27=7/9. (b) Man könnte so (falsch) rechnen: es gibt mit n = 3 und k = 3 nach der ”vierten Urnenformel“ n+k−1 5 = k 3 = 10 mögliche verschiedene Zusammenstellungen des ”Saftkorbes“. Von denen 20 gibt es nur eine mit genau 3 (verschiedenen) Säften. Also ist die Wahrscheinlichkeit 9/10. Worin liegt der Fehler in der Argumentation? Lösung: Nicht jede Zusammenstellung ist gleich wahrscheinlich. (c) Oder so: Aus 2 Sorten kann man 23 = 8 verschiedene Saftkörbe mit drei Säften zusammenstellen. Da es 32 = 3 Möglichkeiten gibt, 2 Sorten aus drei Sorten auszuwählen, gibt es 3 · 8 = 24 24 Saftkörbe mit nur 2 Sorten. Die gesuchte Wahrscheinlichkeit ist also 27 = 89 . Lösung: Hier wurde der Fehler gemacht, dass die Möglichkeiten mit drei gleichen Säften mehrfach gezählt wurden. Aufgabe 22: Sechs Kugeln fallen zufällig und unabhängig voneinander in eines von 3 verschiedenen Fächern. Mit welcher Wahrscheinlichkeit bleibt mindestens ein Fach leer? Lösung: Eine Urne enthalte drei Fächer“ a1 , a2 , a3 , es wird 6 mal mit Zurücklegen gezogen. Es gibt ” 36 = 3 · 243 Platzierungs-Möglichkeiten (mit Anordnung, damit alle gleichwahrscheinlich). Es gibt jeweils 26 = 64 Möglichkeiten ohne a1 (bzw. a2 , a3 ). Die jeweils eine Möglichkeit, dass nur a1 (bzw. a2 , a3 ) gezogen wird, kommt in dieser Zählweise doppelt vor. Daher gibt es 3 · 26 − 3 = 3(26 − 1) = 3 · 63 gleichwahrscheinliche Ausgänge mit mindestens einem leeren Fach. Die gesuchte Wahrscheinlichkeit ist also 63/243=7/27. Aufgabe 23: Im Folgenden handelt es sich um klassische Fragen im Staatsexamen. Es geht um ein sprachlich ausgedrücktes Verständnis. (a) Sei |A| = n. Denken Sie sich die n Elemente von A durchnummeriert und durch n Plätze veranschaulicht. Begründen Sie unter Verwendung von |{0, 1}n | = 2n die Aussage |P otA| = 2n . Lösung: P otA ist die Menge aller Teilmengen von A. Jeder Teilmenge von A kann man eindeutig ein n-Tupel aus Nullen und Einsen zuordnen, wobei eine Null als k-te Komponente bedeutet, dass das k-te Element von A nicht zu dieser Teilmenge gehört, während eine Eins bedeutet, dass es dazu gehört. Man hat also eine Bijektion zwischen P otA und {0, 1}n . Letztere Menge hat gerade 2n Elemente. (b) Erklären Sie, warum hieraus und aus der kombinatorischen Interpretation von nk sofort n X n k=0 k = 2n folgt. Lösung: P otA ist die disjunkte Vereinigung aller Ak , wobei Ak die Menge aller k-elementigen Teilmengen von A ist, k = 0, 1, ..., n. Daher gilt |P otA| = |A0 | + |A1 | + · · · + |An |. 21 Wegen |Ak | = n k folgt die Behauptung aus der vorhergehenden Teilaufgabe. Bemerkung: Ganz wesentlich ist die Namensgebung für die Menge aller k-elementigen Teilmengen von A — hier Ak . (c) Begründen Sie n X n k=0 k = 2n mit Hilfe des binomischen Lehrsatzes. Lösung: Setze a := 1, b := 1. Dann ist n n 2 = (a + b) = n X n k=0 k k n−k a b = n X n k=0 k . Aufgabe 24: Sei A := {1, 2, ..., n} und Ω1 (n, k) := Ak = {(a1 , a2 , ..., ak ) : aj ∈ A, j = 1, 2, ..., k}, Ω2 (n, k) := {(a1 , a2 , ..., ak ) ∈ Ak : ai 6= aj , i, j = 1, 2, ..., k, i 6= j}, Ω3 (n, k) := {(a1 , ..., ak ) ∈ Ak : a1 < a2 < · · · < ak }. (a) Geben Sie die Mengen Ωj (4, 2) durch Auflistung und ihre Anzahlen |Ωj (4, 2)|, j = 1, 2, 3 an. Lösung: Ω1 (4, 2) = {(1, 1), (1, 2), ....., (4, 4)}, |Ω1 (4, 2)| = 42 = 16. Ω2 (4, 2) = {(1, 2), (1, 3), (1, 4), (2, 1), (2, 3), (2, 4), (3, 1), ....., (3, 4)}, |Ω2 (4, 2)| = 4 · 3 = 12. 4 Ω3 (4, 2) = {(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)}, |Ω1 (4, 2)| = = 6. 2 (b) Sei Ω13 (n, k) := {(1, a2 , ..., ak ) ∈ INk : 2 ≤ a2 < · · · < ak ≤ n} und Ω23 (n, k) := {(a1 , a2 , ..., ak ) ∈ INk : 2 ≤ a1 < a2 < · · · < ak ≤ n} Zeigen Sie: Ω3 (n, k) ist die disjunkte Vereinigung von Ω13 (n, k) und Ω23 (n, k). Lösung: Jedem Element aus Ω3 (n, k) entspricht genau eine k-elementige Teilmenge von A (dan her gilt |Ω3 (n, k)| = k ). Man kann auch sagen, dass es eine Bijektion gibt zwischen der Menge Ak aller k-elementigen Teilmengen von A und der Menge Ω3 (n, k). Ω13 (n, k) enthält in diesem Sinne alle k-elementigen von A mit 1 (daher gilt |Ω13 (n, k)| = n−1 k ). Ω23 (n, k) enthält in diesem Sinne alle k-elementigen von A ohne 1 (daher gilt |Ω23 (n, k)| = n−1 k−1 ). 22 Tabelle 3: Beweis von (2) A B A∪B A∪B 1 1 1 0 1 0 1 0 0 1 1 0 0 0 0 1 A B A∩B 0 0 0 0 1 0 1 0 0 1 1 1 (c) Jetzt folgt |Ω3 (n, k)| = |Ω13 (n, k)| + |Ω23 (n, k)|. Was hat diese Aussage mit dem Pascalschen Dreieck zu tun? n−1 2 Lösung: Es gilt |Ω3 (n, k)| = nk , während |Ω13 (n, k)| = n−1 k−1 . Ferner gilt |Ω3 (n, k)| = k . Diese Formeln folgen aus dem Bezug zwischen den Elementen von Ω3 und den k-elementigen Teilmengen einer n-elementigen Menge (siehe (b)). Aufgabe 25: Betrachte die de Morgansche Regel A ∪ B = A ∩ B, (2) (a) Veranschaulichen Sie diese Aussage mit Hilfe einer Zeichnung mit Mengen A, B ⊂ IR2 . (b) Ein Zufallsexperiment habe den Merkmalraum Ω := {1, 2, ..., 40}. A ⊂ Ω enthalte alle geraden Zahlen und B ⊂ Ω die Menge aller durch 3 teilbaren Zahlen. Interpretieren Sie in diesem Fall (2). Lösung: A ∪ B ist das Ereignis, dass Ergebnis gerade oder durch drei teilbar ist, A ∪ B ist das Ereigniss, dass A ∪ B nicht eintritt. A ist das Ereignis, dass das Ergebnis ungerade ist, und B, dass es nicht durch drei teilbar ist. A ∩ B ist das Ereignis, dass das Ergebnis ungerade und nicht durch drei teilbar ist - die logische Negation von A ∪ B. (c) Beweisen Sie (2) mit einer Wahrheitstabelle analog zu Tab. ??. Lösung: Siehe Tab. 3. (d) Wie lautet die Regel (2) für Aussagen? Hinweis: Verwenden Sie die logischen Operatoren ∧ ( und“) sowie ∨ ( oder“). ” ” Lösung: A ∨ B ⇐⇒ A ∧ B (3) 23 (e) Die Implikation von Aussagen (A ⇒ B) entspricht der Teilmengenrelation A ⊂ B, die Negation von Aussagen entspricht der Komplementbildung von Mengen (s. Kap.I.9.5). Formulieren Sie die logische Äquivalenz (A ⇒ B) ⇐⇒ (B ⇒ A) als Aussage über Mengen. Lösung: (A ⊂ B) ⇐⇒ (B ⊂ A) Aufgabe 26: Ein Kolmogoroff-Axiom lautet bekanntlich P (A ∪ B) = P (A) + P (B), falls A und B disjunkt sind. Diese Aussage kann verallgemeinert werden: Wenn Aj , j = 1, 2, .., n, paarweise disjunkte Teilmengen von Ω sind, so gilt P (A1 ∪ A2 ∪ · · · ∪ An ) = P (A1 ) + P (A2 ) + · · · + P (An ) (4) Beweisen Sie (4) mit vollständiger Induktion, wobei Sie obiges Kolmogoroff-Axiom als Spezialfall n = 2 auffassen sollten. Hinweis: A1 ∪ A2 ∪ · · · ∪ An ∪ An+1 = (A1 ∪ · · · ∪ An ) ∪ An+1 . Ich hoffe, Sie sehen, dass in dem Hinweis ein Induktionsschlüssel“ verborgen ist! ” Lösung: Der Induktionsanfang liegt bei n = 2, da n = 1 keinen Sinn ergibt. Induktionsannahme ist (4) für ein festes n. Zu zeigen ist P (A1 ∪ A2 ∪ · · · ∪ An ∪ An+1 ) = P (A1 ) + P (A2 ) + · · · + P (An ) + P (An+1 ), falls die n + 1 Mengen Aj , j = 1, 2, ..., n + 1 paarweise disjunkt sind. Der Induktionsschlüssel ist A1 ∪ A2 ∪ · · · ∪ An ∪ An+1 = (A1 ∪ · · · ∪ An ) ∪ An+1 . Setze nun A := A1 ∪ · · · ∪ An und B := An+1 . Nun sind A und B disjunkt (da An+1 mit allen Aj , j = 1, 2, .., n disjunkt sind). Aus dem Kolmogoroff-Axiom (n = 2) folgt also P (A ∪ B) = P (A) + P (B), also P ((A1 ∪ A2 ∪ · · · ∪ An ) ∪ An+1 ) = P (A1 ∪ A2 ∪ · · · ∪ An ) + P (An+1 ). Nun kommt die Induktionsannahme ins Spiel: Die rechte Seite ist danach gerade die rechte Seite der Behauptung. Die linke Seite ist wegen des Induktionsschlüssels die linke Seite der Behauptung. Aufgaben 27/28: 24 In einer Urne befinden sich N Kugeln, von denen r rot und s schwarz sind (N = r + s). Nun werde n-mal mit Zurücklegen gezogen (Achtung: Bisher wurden N mit n und n mit k bezeichnet!). Jedes Ziehungsergebnis aus Ω1 := {(a1 , ..., an ) ∈ INn : 1 ≤ aj ≤ N, j = 1, 2, ..., n} sei gleichwahrscheinlich. Nun interessieren wir uns für das Ereignis Ak := {(a1 , ..., an ) ∈ Ω1 : genau k der gezogenen Kugeln Kugeln sind rot}, dass genau k der gezogenen Kugeln rot sind, wobei 0 ≤ k ≤ n. Für das Folgende kann es hilfreich sein, sich die r roten Kugeln mit 1, 2, ..., r (in rot!) und die schwarzen Kugeln mit r + 1, r + 2, ..., N (in schwarz!) beschriftet zu denken. Das Ziehungsergebnis denke man sich dadurch visualisiert, dass man sich die Nummern und die Farbe der gezogenen Kugeln auf n angeordnete Plätze geschrieben denkt (Platzierungsmodell). Achten Sie darauf, dass es eine Vielzahl von Variablen gibt: N (Anzahl der Kugeln), r (Anzahl der roten Kugeln), n (Anzahl der Züge) und k (Anzahl der roten Kugeln nach n Zügen). s = N −r (Anzahl der schwarzen Kugeln) ergibt sich aus den anderen Variablen. Wenn später nach der Wahrscheinlichkeit P (Ak ) gefragt wird, hängt diese möglicherweise von allen diesen Variablen ab! (a) Sei n = 3, N = 3, r = 2, s = 1, k = 2. Notieren Sie alle (wieviele?) Platzierungen zu Ak in Form eines (farbigen!) 3-Tupels aus {1, 2, ..., N }3 . Hinweis: (3, 3, 2) bedeutet, dass in den ersten beiden Zügen jeweils die schwarze Kugel Nr.3 und im letzten Zug die rote Kugel Nr.2 gezogen wurde. Da nur eine rote Kugel gezogen wurde, gilt (3, 3, 2) 6∈ Ak . Lösung: (1, 1, 3), (1, 2, 3), (2, 1, 3), (2, 2, 3), ......, (3, 1, 1), (3, 1, 2), (3, 2, 1), (3, 2, 2) Es gibt insgesamt 12 (rot-schwarz)-Platzierungen. (b) Sei n = 5, N = 6, r = 4, s = 2, k = 2. Sei (R, S, R, S, S) ein Symbol für die Tatsache, dass im ersten Zug eine rote, im zweiten eine schwarze, im dritten wieder eine rote, ....., und im letzten Zug eine schwarze Kugel gezogen wird. Wieviele Ziehungsergebnisse aus Ω1 führen auf diese rot-schwarz-Platzierung“? ” Lösung: Für den ersten Zug gibt es r = 4, für den zweiten Zug s = 2, ....., für den letzten Zug wieder s = 2 Möglichkeiten. Diese müssen multipliziert werden. Es gibt sn−k = s3 = 8 Möglichkeiten für die schwarzen und rk = 42 = 16 für die roten Positionen, also rk · sn−k = 128 Möglichkeiten insgesamt. (c) Jetzt betrachten wir den allgemeinen Fall. Angenommen, Sie kennen die Plätze der k roten (und der n − k schwarzen) Kugeln nach n Zügen, aber nicht ihre Nummern. Wieviele Ziehungsergebnisse können zu dieser rot-schwarz-Platzierung führen? Gesucht ist eine Formel, in die r, s, n, k eingehen. Hinweis: Vielleicht sollten Sie sich überlegen, wie Sie die vorherige Teilaufgabe gelöst haben. Lösung: rk · sn−k (d) Wieviele rot-schwarz-Platzierungen mit k roten und n − k schwarzen Kugeln gibt es? Hinweis: Überlegen Sie genau, was unter einer rot-schwarz-Platzierung“ verstanden wird. In die gesuchte ” Formel gehen nur k und n ein! 25 Lösung: n k (e) Wieviele Elemente hat Ak ? Hinweis: Überprüfen Sie Ihre Formel im Beispiel (a). Lösung: Es gibt nk Möglichkeiten, k rote Kugeln auf n Plätze zu verteilen. Für jede dieser Platzierungen gibt es rk · sn−k Möglichkeiten, also insgesamt n · rk · sn−k k (f) Wieviele Elemente hat Ω1 ? Lösung: N n . (g) Wie groß ist die Wahrscheinlichkeit P (Ak )? Hinweis: Drücken Sie die Wahrscheinlichkeit mit Hilfe von p := Nr aus. Hinweis: N n = N k · N n−k . Lösung: P (Ak ) = |Ak | |Ω1 | . Es ist |Ω1 | = N n . Wegen s := N − r gilt n k P (Ak ) = p (1 − p)n−k . k Aufgabe 29: Unter Verwendung der beiden Formeln P (A ∪ B) = P (A) + P (B) − P (AB), P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − (P (AB) + P (AC) + P (BC)) + P (ABC) (für beliebige endliche Mengen A, B und C) beweise man unter Verweis auf diese beiden Regeln und weitere Gesetze zu den Mengenoperatoren ∪ und ∩ wie Distributiv- und Assozialtivgesetze eine entsprechende (welche?) Regel für P (A ∪ B ∪ C ∪ D). Lösung: Es ist P (A ∪ B ∪ C ∪ D) = P ((A ∪ B ∪ C) ∪ D) wegen des Assoziativgesetzes für ∪. Nach der ersten Formel gilt P ((A ∪ B ∪ C) ∪ D) = P (A ∪ B ∪ C) + P (D) − P ((A ∪ B ∪ C) ∩ D). Auf den ersten Summanden kann man direkt die zweite Formel anwenden, auf den letzten Summanden indirekt wegen (A ∪ B ∪ C) ∩ D = (A ∩ D) ∪ (B ∩ D) ∪ (C ∩ D), so dass P ((A ∪ B ∪ C) ∩ D) = P (AD) + P (BD) + P (CD) −(P (ADBD) + P (ADCD) + P (BDCD)) + P (ADBDCD). Nun gilt offensichtlich ADBD = ABD, BDCD = ACD, BDCD = BCD, ADBDCD = ABCD. Insgesamt erhält man P ((A ∪ B ∪ C) ∪ D) = P (A) + P (B) + P (C) − (P (AB) + P (AC) + P (BC)) + P (ABC) + P (D) +P (ABD) + P (ACD) + P (BCD) − P ABCD). 26 Nach Umstellung sieht man, dass herauskommt P (A ∪ B ∪ C ∪ D) = P (A) + P (B) + P (C) + P (D) − (P (AB) + · · · + P (CD)) +(P (ABC) + · · · + P (BCD)) − P (ABCD). Aufgabe 30: Aufgabe 22 lautete: Sechs Kugeln fallen zufällig und unabhängig voneinander in eines von 3 verschiedenen Fächern. Mit welcher Wahrscheinlichkeit bleibt mindestens ein Fach leer? Sei Aj , j = 1, 2, 3 das Ereignis, dass das j-te Fach leer bleibt. Dann gibt P (A1 ∪ A2 ∪ A3 ) die Antwort auf die Frage in Aufgabe 22. Die Antwort gibt die Formel im Skript n X m k m+1 n (−1) 1− m n m=1 mit k := 6. Statt mit dieser Formel kann man aber auch direkt mit Satz 3.4 arbeiten, der in der Vorlesung bewiesen wurde. Lösen Sie die Aufgabe 22 erneut mit Hilfe von Satz 3.4. Berechnen Sie dabei auch die c(m), m = 1, 2, 3 in Satz 3.5. Lösung: Es ist P (Aj ) = (2/3)6 =: c(1). Ferner ist P (A1 ∩ A2 ) = P (A1 ∩ A3 ) = · · · = (1/3)6 =: c(2) und schließlich P (A1 ∩ A2 ∩ A3 ) = 0 =: c(3). Daher gilt nach Satz 3.4 P ((A1 ∪ A2 ∪ A3 )) = 26 · 3 − 3 7 = . 36 27 Aufgabe 31: Ein Mann, der in New York überfallen wird, behauptet, der Täter sei schwarz. Man stellt durch Versuche fest, dass der Mann sich in Bezug auf die Hautfarbe in 20% aller Fälle irrt. Es gibt 90% Weiße und 10% Schwarze im Bezirk. Wie groß ist die Wahrscheinlichkeit, dass der Täter wirklich schwarz ist? (unter der Voraussetzung, dass der Anteil von Kriminellen bei Schwarzen und Weißen gleich groß ist und dass die Irrtums-Wahrscheinlichkeit unabhängig von der Hautfarbe ist). Lösung: : Von 100 potentiellen Tätern sind 90 weiß und 10 schwarz. Von ersteren werden (irrtümlich) 18, von letzteren (richtig) 8 als schwarz erkannt. Insgesamt 26. Die gesuchte Wahrscheinlichkeit ist 8/26=4/13. Mit späteren Hilfsmitteln kann man die Aufgabe auch so lösen: In einem Zufallsexperiment wird ein Täter und die Zeugenaussage ausgelost. Sei A1 das Ereignis, dass der Täter weiß, und A2 das Ereignis, dass der Täter schwarz ist. Sei B1 das Ereignis, dass das Opfer behauptet, der Täter sei weiß, und B2 entsprechend, dass der Täter schwarz ist. Gesucht ist die bedingte Wahrscheinlichkeit x := P (A2 |B2 ). Wir wissen, dass P (A1 ) = 0.9, P (A2 ) = 0.1 sowie P (Bj |Aj ) = 0.8, j = 1, 2 und P (B1 |A2 ) = 0.2, P (B2 |A1 ) = 0.2. Nun gilt P (A2 B2 ) . x= P (B2 ) 27 Aus 0.8 = P (B2 |A2 ) = P (A2 B2 ) P (A2 ) erhält man P (A2 B2 ) = 0.08 und wir haben x= 0.08 . P (B2 ) Wir benötigen y := P (B2 ). Diese Zahl berechnen wir mit Hilfe von P (B2 |A1 ) und P (A1 |B2 ): Es gilt 0.2 = P (B2 |A1 ) = P (A1 B2 ) P (A1 B2 ) = , P (A1 ) 0.9 woraus P (A1 B2 ) = 0.18 folgt. Ferner ist 1 − x = P (A1 |B2 ) = woraus y = P (B2 ) = P (A1 B2 ) , P (B2 ) 0.18 1−x folgt. Einsetzen in die obere Gleichung für x ergibt x= und hieraus x = (1 − x) · 0.08 0.18 4 13 . Aufgabe 32: (a) Wie groß ist die Wahrscheinlichkeit, mit 2 Würfen eines Würfels mindestens eine 1 zu werfen? Man leite das Ergebnis kombinatorisch und mit Hilfe der Regel P (A ∪ B) = P (A) + P (B) − P (AB) der Wahrscheinlichkeit-Rechnung her. Lösung: Es gibt 62 = 36 Möglichkeiten, von denen 11 günstig sind: Also gilt p = 11/36. Es sei A (B) das Ereignis, mit dem ersten (zweiten) Wurf eine 1 zu werfen. Dann ist P (A) = 1/6 = P (B), P (AB) = 1/36, also P (A ∪ B) = 1/3 − 1/36 = 11/36. (b) Wie groß ist die Wahrscheinlichkeit, mit 3 Würfen eines Würfels mindestens eine 1 zu werfen? Lösung: Analog zu (a): c(1) = P (A) = P (B) = P (C) = 1/6, c(2) = P (AB) = P (AC) = P (BC) = 1/36, c(3) = P (ABC) = 1/216, also P (A ∪ B ∪ C) = 1/2 − 1/12 + 1/216 = 91/216 = 0.421. (c) Wenden Sie Satz 3.5 an, um die Wahrscheinlichkeit pn zu berechnen, mit n Würfen mindestens eine 1 zu würfeln, d.h. berechnen Sie c(m), m = 1, 2, ..., n und geben Sie die Formel für pn an. Lösung: c(m) = 1 6m 28 (d) Überprüfen Sie, ob p2 und p3 mit Ihren Ergebnissen aus den vorherigen Teilen (a) und (b) übereinstimmen und berechnen Sie p4 . Lösung: 2 1 1 1 11 2 1 − = − = . p2 = 2 2 6 3 36 36 1 6 3 1 3 1 3 1 − + p3 = 2 2 6 3 63 1 6 1 1 11 1 − 13 − = . 2 12 36 36 4 1 4 1 4 1 4 1 4 6 4 1 p4 = − + − = − + − . 2 3 4 1 6 2 6 3 6 4 6 6 36 216 1296 = Aufgabe 33: 8 Tischtennisspieler eines Vereins wollen ein internes Ranglistenturnier im Einzel austragen. Je zwei von ihnen bilden ein gut eingespieltes Doppel. In der ersten Runde des Turniers sollen vier EinzelPaarungen ausgelost werden. Dabei stellt sich die Frage nach der Wahrscheinlichkeit, dass mindestens ein Doppel-Paar gegeneinander antreten muss. Lösung: Das beispiel der Tanzpaare im Skript ist hier nicht übertragbar, da es keine Geschlechter gibt. So ist die Anzahl der möglichen /und gleichwahrscheinlichen) Auslosungen nicht 4! = 24 (bei 4 Paaren), sondern (2n − 1)(2n − 3) · · · 3, also (mit n = 4) 7 · 5 · 3 = 105. Auf dieselbe Zahl kommt man mittels 8 6 4 2 2 2 4! . Der Zähler ist die Anzahl der Auslosungen mit Anordnung. Wenn Man als Aj das Ereignis bezeichnet, dass das j-te Doppelpaar gegeneinander antreten muss, so ist schon 1 c(1) = P (Aj ) = 7 ander als beim Tanzparty-Beispiel. Ferner ist c(2) = P (A1 A2 ) = 1 1 = 7·5 35 und c(3) = c(4) = P (A1 A2 A3 ) = 1 . 105 daher ist die gesuchte Wahrscheinlichkeit P (A1 ∪ A2 ∪ A3 ∪ A4 ) = 6 4 1 3 4 − + − = . 7 35 105 105 7 Es ist gar nicht so einfach, dem Merkmalraum Ω anzugben. Er sit die menge aller disjunkten Zerlegungen einer 8-elementigen Menge in vier 2-elementige Teilmengen. Aufgabe 34/35: 29 Beim Doppelkopf (48 Karten, von den sind 26 Trumpfkarten) bekommt jeder Spieler 12 Karten. Wir sind an der Anzahl X der Trumpfkarten in einer Hand nach dem Verteilen interessiert. Der Merkmalraum ist damit Ω = {0, 1, 2, ..., 12}. (a) Gesucht ist eine Formel für pk := P (X = k). Hinweis: Es gibt 48 12 gleichwahrscheinliche ”Kartenverteilungen“ in einer Hand. Überlegen Sie, wieviele Kartenverteilungen es mit k Trümpfen und 12 − k Nicht-Trumpfkarten es gibt. Lösung: pk = 26 k 22 12−k 48 12 · . Jede der 26 k Möglichkeiten, k Trümpfe aus 26 auszuwählen kann mit jeder Möglichkeit, 12 − k Nicht-Trümpfe aus 22 Nicht-Trumpfkarten auszuwählen, per Produktregel kombiniert werden. Ganz falsch ist es, das Binomialmodell mit der Wahrscheinlichkeit p := 26/48 = 13/24, dass man beim ersten Mal eine Trumpfkarte zieht, zu verwenden, weil dort immer wieder zurückgelegt“ ” werden muss, was beim Kartenverteilen gerade nicht passiert. 3 (b) Sie können mit Hilfe von Javaskript zur Berechnung diskreter Verteilungen (Jumbo ) Binomial48 koeffizienten berechnen (z.B. 12 = 69668534468). Berechnen Sie alle pk , k = 0, 1, 2, ..., 12. Lösung: p = (0.000009, 0.000263, 0.003017, 0.018564, 0.068619, 0.161025, 0.246570, 0.248642, 0.164034, 0.069067, 0.017612, 0.002440, 0.000139) (c) Welche Trumpfzahl ist am wahrscheinlichsten (mit Angabe der Wahrscheinlichkeit)? Lösung: k = 7 Trümpfe, p7 = 0.2486 = 24, 86%. (d) Sei F die zugehörige Verteilungsfunktion. Berechnen Sie F (2) und F (10). Lösung: F (2) = P (X ≤ 2) = p0 + p1 + p2 = 0.003289, F (10) = 1 − p11 − p12 = 0.9974 (e) Wie wahrscheinlich ist es, dass Sie arm“ sind (drei Trümpfe oder weniger) ” Lösung: F (3) = F (2) + p3 = 0.0219 = 2, 2%. (f) Berechnen Sie P (5 ≤ X ≤ 8). Lösung: p5 = p6 + p7 + p8 = 0.8203 3 http://medweb.uni-muenster.de/institute/imib/lehre/skripte/biomathe/bio/diskret1.html 30 (g) Berechnen Sie die 25%- und 75%-Quantile. Eine Überschlagsrechnung zeigt F (4) < 0.25, F (5) > 0.25 (gerade so eben). Daher ist k = 5 das 25%-Quantil. Ferner ist F (8) > 0.75 (gerade so eben), aber F (7) < 0.75. Daher ist k = 8 das 75%-Quantil. Aufgabe 36: Wirft man eine Heftzwecke in die Höhe, so lande sie mit der Wahrscheinlichkeit p := 0.45 auf dem Kopf. (a) Wie groß ist die Wahrscheinlichkeit, dass bei 10 Würfen genau 3 Würfe auf dem Kopf landen? Lösung: P (X = 3) = 16, 65% (b) Wie groß ist die Wahrscheinlichkeit, dass bei 10 Würfen mehr als 3 Würfe auf dem Kopf landen? Lösung: P (X > 3) = 1 − P (X ≤ 3) = 73.40% (c) Wie groß ist die Wahrscheinlichkeit, dass bei 10 Würfen weniger als 3 Würfe auf dem Kopf landen? Lösung: P (X < 3) = P (X ≤ 2) = 9.96% (d) Wie groß ist die Wahrscheinlichkeit, dass bei 10 Würfen 5, 6 oder 7 Würfe auf dem Kopf landen? Lösung: P (X ≤ 7) − P (X ≤ 4) = 97.26 − 50.44 = 46.82%. Hinweis: Zur Berechnung können Sie einen Link im Internet (s. Skript) verwenden, z.B. Javaskript zur Berechnung diskreter Verteilungen (Jumbo4 ) Lösung: Wirft man sie n Mal in die Höhe und interessiert man sich für die Anzahl j der Kopftreffer“, so ” ergibt sich die Binomialverteilung n j b(n, p; j) := p (1 − p)n−j . j Aufgabe 37: Wie groß ist die Wahrscheinlichkeit pm , mit 2m Würfen einer Münze (genau) m-mal Wappen und m-mal Zahl zu werfen? (a) Berechnen Sie pm allgemein und speziell für m = 2. Lösung: Binomialverteilung: pm = b(2m, 0.5; m) = 2−2m 2m m . Speziell 3 6 −4 4 p2 = 2 = = = 0.375. 2 16 8 4 http://medweb.uni-muenster.de/institute/imib/lehre/skripte/biomathe/bio/diskret1.html 31 (b) Benutze die Stirling’sche Formel √ n! ≈ nn e−n 2πn für große n, um eine Näherung von pm (speziell für p2 ) und den Grenzwert limm→∞ pm zu bestimmen. Es ist da 2m m = 22m (2m)! ≈√ , m!m! πm √ √ (2m)! ≈ (2m)2m e−2m 4πm = 22m m2m e−2m 2 πm und m!m! ≈ mm mm e−m e−m 2πm = m2m e−2m 2πm und daher pm ≈ √ 1 →0 πm für m → ∞. Speziell: p2 ≈ √1 2π = 0.399 Aufgabe 38: Ein Leuchtmittel werde beim Einschalten mit der Wahrscheinlichkeit von 1% sofort defekt, nach Ablauf von 500 Stunden wird es ausgetauscht, es sei denn, es fällt zwischenzeitlich aus. Dies ist mit der Wahrscheinlichkeit von 40% der Fall, wobei kein Zeitpunkt vor einem anderen ausgezeichnet ist, d.h., der Ausfall in einem Zeitintervall zwischen 0 und 500 hängt nur von der Länge dieses Intervalls ab. Bestimmen Sie die (kontinuierliche!) Verteilungsfunktion F (x) = P (Leuchtdauer ≤ x). Hinweis: F (0) = 0.01, F (x) = 1 für x > 500, F (x) = 0 für x < 0, F (500) = 0.41. Lösung: F hat zwei Sprungstellen bei x = 0 und x = 500. Nun ist P (0 < X ≤ 500) = F (500) − F (0) = 0.4. Also gilt F (500) = 0.41 und F ist zwischen x = 0 und x = 500 eine Gerade mit Steigung s := 0.4/500 = 0.008, es gilt also F (x) = 0.01 + 0.008x Aufgabe 39: Ein Kinderarzt weiss aus Erfahrung, dass 20 % aller Neugeborenen nach unauffälliger Schwangerschaft weniger als 2500 g wiegen. Mehrlingsgeburten sind dabei ausgeschlossen. Aus den entsprechenden Geburtsprotokollen des vergangenen Jahres entnimmt er eine zufällige Stichprobe von n = 10 Protokollen5 . Die Anzahl der Protokolle dieser Stichprobe, in denen ein Geburtsgewicht von weniger als 2500 g dokumentiert ist, kann als eine diskrete binomialverteilte Zufallsvariable X aufgefasst werden. X kann die Werte 0,1,2,3,4,5,6,7,8,9,10 annehmen, d.h., der Merkmalraum ist Ω = {0, 1, 2, ..., 10}. 5 Ein Geburtsprotokoll enthält neben dem Gewicht noch weitere Angaben. 32 (a) Wie groß ist die Wahrscheinlichkeit p, dass genau 4 Neugeborene der Stichprobe weniger als 2500 g wiegen? Lösung: p = b(10, 0.2; 4) = 0.08808 = 8, 8%. (b) Bei wievielen Untergewichtigen der Stichprobe muss der Arzt seinen Erfahrungswert (20%) mit einer Irrtums-Wahrscheinlichkeit von 5% als falsch annehmen, d.h. ab welchem k ∈ IN gilt P (X ≥ k) ≤ 0.05 = 5%? Lösung: Mit k = 5 ist P (X ≥ k) = b(10, 0.2; 5) + · · · + b(10, 0.2; 10) = 1 − F X (4) = 0.0327. Für k = 4 ist P (X ≥ k) > 0.05. (c) Der Arzt nimmt insgesamt 100 solcher Stichproben vom Umfang 10. Wie groß ist die Wahrscheinlichkeit, dass er in mindestens einer Stichprobe auf 5 oder mehr untergewichtige Neugeborne stößt? Lösung: Wieder Binomialverteilung mit p = 0.0327. Gesucht ist 1 − F100,p (0) = 96, 4015% . Aufgabe 40: Nach Satz 3.9 gilt b(n, pn ; k) → π(λ; k), n → ∞, falls n · pn = λ (bei gegebenem λ und k), wenn also pn = λ/n. (a) Dies sollen Sie für λ = 3 und k = 2, 3, 4 verifizieren“, indem Sie jeweils n = 10, 100 und n = 1000 ” setzen. Hinweis: Benutzen Sie zur Berechnung von b(n, pn ; k) und π(λ; k) ein geeignetes JavaSkript in JUMBO. Lösung: • k = 2. Dann ist π(λ, k) = 0.22404181. – n = 10. Dann ist pn = 0.3 und b(n, pn ; k) = 0.23347444 – n = 100. Dann ist pn = 0.03 und b(n, pn ; k) = 0.22515296 – n = 1000. Dann ist pn = 0.003 und b(n, pn ; k) = 0.22415374 • k = 3. Dann ist π(λ, k) = 0.22404181. – n = 10. Dann ist pn = 0.3 und b(n, pn ; k) = 0.26682793 – n = 100. Dann ist pn = 0.03 und b(n, pn ; k) = 0.227474 – n = 1000. Dann ist pn = 0.003 und b(n, pn ; k) = 0.22437857 • k = 4. Dann ist π(λ, k) = 0.16803163. – n = 10. Dann ist pn = 0.3 und b(n, pn ; k) = 0.20012095 – n = 100. Dann ist pn = 0.03 und b(n, pn ; k) = 0.17060560 – n = 1000. Dann ist pn = 0.003 und b(n, pn ; k) = 0.16828393 In allen Fällen kann also deutlich eine Konvergenz beobachtet werden. Für n = 1000 stimmen wenigstens 3 Dezimalstellen. 33 Abbildung 10: Zu Aufgabe 40 (b) (b) Zeichnen Sie die Wahrscheinlichkeit-Verteilung von Π(λ) und B(n, pn ) übereinander für λ = 3 und n = 20, pn = 0.15 (dann ist npn = λ). Lösung: Siehe Abb. 10 Aufgabe 41: Die W-Dichte der Normalverteilung mit den Parametern µ und σ lautet bekanntlich (x−µ)2 1 fµ,σ (x) = √ e− 2σ2 σ 2π (a) Zeichnen Sie die Graphen dieser Dichte einmal für µ = 0, σ = 1 und zum anderen für µ = 2, σ = 0.2 übereinander. Lösung: Beide Glockenkurven unterscheiden sich nur durch Skalierungen. Erste hat ihr Maximum etwa bei 0.4, die zweite bei 2 (Faktor ist 1/σ). (b) Schätzen Sie durch Messungen“ (z.B. durch Abzählen von Quadraten auf entsprechendem Zei” chenpapier) die Fläche zwischen x-Achse und Graphen von x = a := µ − σ bis x = b := µ + 2σ. (c) Welche Zeichnung im Skript bestätigt Ihr Resultat? Lösung: Nach Abb. 3.10 im Skript muss die Fläche gleich (0.9545 − 0.6827)/2 = 0.2718/2 + 0.6827 = 0.1359 + 0.6827 = 0.818 sein. Aufgabe 42: 34 Sei wieder (x−µ)2 1 fµ,σ (x) = √ e− 2σ2 σ 2π und 1 Fµ,σ (t) := √ σ 2π t Z 1 e− 2 x−µ σ 2 dx −∞ die zugehörige Verteilungsfunktion von N(µ, σ 2 ). (a) Angenommen, Sie finden f0,1 (x) und F0,1 (t) tabelliert vor. Geben Sie eine Formel an, mit deren Hilfe Sie zu beliebigen Parametern µ ∈ IR und σ > 0 Funktionswerte fµ,σ (x) und Fµ,σ (t) berechnen können. Begründen brauchen Sie die Formeln nur für die W-Dichte. Lösung: fµ,σ (t) = t − µ 1 f0,1 σ σ (rechnet man leicht nach!) Fµ,σ (t) = F0,1 t − µ σ (b) Das 97,5%-Quantil der Standard-Normalverteilung liegt bei z := 1.96. Wo liegt das 97,5%Quantil τ von Nµ,σ2 für µ = 2 und σ = 0.2? Lösung: Wegen obiger Formel muss τ −µ = z = 1.96 σ also τ = σz + µ = 2.39 gelten. Aufgabe 43: Sei α > 0. Für welches c > 0 ist f (x) := eine W-Dichte? Lösung: Es muss 0 ce−αx Z ∞ für x < 0 für x ≥ 0 ce−αx dx = 1 0 gelten. 35 Eine Stammfunktion ist f (x) := − αc e−αx . Daher gilt Z 0 bn c c ce−αx dx = − e−αbn + . α α Divergiert bn gegen ∞, so ist e−αbn eine Nullfolge. Daher gilt Z ∞ c ce−αx dx = . α 0 Für c = α haben wir eine W-Dichte. Aufgabe 44: Wenn Sie Aufgabe 43 gelöst haben, wissen Sie, dass 0 für x < 0 f (x) := 2e−2x für x ≥ 0 eine W-Dichte ist. (a) Berechnen Sie pk := P (k ≤ X ≤ k + 1) für eine Zufallsvariable, deren W-Dichte gerade f ist. Lösung: Z pk = 2 k+1 e−2x dx = e−2k − e−2(k+1) . k (b) Stellen Sie eine Beziehung zur diskreten geometrischen Verteilung mit Parameter p her, für die bekannlich P (X = k) = (1 − p)k · p gilt. Lösung: Es ist pk = e−2k (1 − e−2 ). Setze p := 1 − e−2 . Aufgabe 45: Betrachten eine Fußballmannschaft, deren Siegeschance je Bundesliga-Spiel bei 75% liegt, falls ihr Kapitän in guter Form ist. Falls ihr Kapitän jedoch nicht in guter Form ist, dann betrage ihre Siegeschance nur 40%. Bei 70% aller Bundesliga-Spiele seiner Mannschaft sei der Kapitän in guter Form. Gesucht ist die Wahrscheinlichkeit, dass 36 (a) die Mannschaft ein Bundesliga-Spiel gewinnt, Lösung: : A: Kapitän ist in guter Form, B: Mannschaft gewinnt Bundesligaspiel. Bekannt ist: P (B|A) = 0.75 und P (B|Ac ) = 0.4 und P (A) = 0.7. Dann ist P (B) = P (BA) + P (BAc ) = P (B|A)P (A) + P (B|Ac )P (Ac ) = 0.75 · 0.7 + 0.4 · 0.3 = 0.645 Oder besser (anders): Von 1.000 Spielen ist der K. 700 Spiele in Form, von diesen werden 75%=525 gewonnen, von den anderen 40%=120. Also gewinnt die Mannschaft 645=64,5% Spiele. (b) der Kapitän bei einem Bundesliga-Spiel in guter Form ist, wenn die Mannschaft das Spiel nicht gewinnt. Lösung: P (A|B c ) = P (AB c ) P (B c |A)P (A) 0.25 · 0.7 = = = 0.493 c P (B ) 0.355 0.355 Von den 700 Spielen, die der K. in Form ist, werden 175 verloren. Insgesamt werden 355 Spiele verloren, von denen der K. 175 Spiele in Form ist. Also ist 175/355=35/71=49,29% die gesuchte Wahrscheinlichkeit. Führen Sie die Berechnungen jeweils auf zwei Arten durch, zum einen mit Hilfe bedingter Wahrscheinlichkeiten, zum anderen durch Bezug auf eine gewisse Anzahl von Spielen. Aufgabe 46: Ein Arzt in einer Rheuma-Ambulanz betreut im Jahr etwa 200 Patienten jüngeren und mittleren Lebensalters mit chronischen Rückenschmerzen, die nicht eindeutig auf einen Bandscheibenvorfall zurückzuführen sind. Aus langjähriger Erfahrung weis̈ der Arzt, dass bei etwa 60% der Patienten mit diesem Krankheitsbild ein Morbus Bechterew (K+) vorliegt. Um die Sicherheit bezüglich der Diagnose zu verbessern, könnte er eine HLA-Typisierung“ durchführen lassen. Er weiß, dass 95% ” aller Patienten mit einem Morbus Bechterew (K+) das HLA-Antigen B 27 (T+) haben, das in der übrigen Bevölkerung (K-) nur mit einem Anteil von 8% vorkommt. Wie ändert sich die Sicherheit, nachdem dem Arzt das Ergebnis der HLA-Typisierung bekannt ist? Anders gefragt: Wie groß ist die Wahrscheinlichkeit, dass ein Patient, der positiv getestet wurde (T+), an der Krankheit K+ leidet? Lösung: P (K+) = 0.6, P (K−) = 0.4, P (T + |K+) = 0.95, P (T + |K−) = 0.08 Die gesuchte Wahrscheinlichkeit P (K + |T +) ist dann nach der Formel von Bayes P (K + |T +) = (0.95 · 0.6)/(0.95 · 0.6 + 0.08 · 0.4) = 0.947. Dies bedeutet, dass in etwa 95% aller Fälle mit einem positiven Testergebnis (HLA 27-Antigen vorhanden) ein Morbus Bechterew vorliegen wird. Alternative: 1000 Patienten, von denen haben 600 K+. Von denen werden 95%, also 570 positiv getestet. Von den Gesunden werden 8%, also 32, positiv getestet. Ingsesamt werden 602 positiv getestet, also ist die gesuchte Wahrscheinlichkeit p := 570/602 = 94, 68%. Aufgabe 47: 37 Es wird Ihnen das folgende Spiel angeboten: Sie werfen dreimal einen (echten) Würfel. Werfen Sie jedes Mal mindestens eine Fünf, so erhalten Sie 20 Euro. Passiert das mindestens zweimal, so erhalten Sie 10 Euro. In allen andern Fällen erhalten Sie nichts. Würden Sie dieses Spiel bei einem Einsatz von 4 Euro einen ganzen Abend lang spielen? Lösung: Die ZV X sei die Auszahlung. Die Wahrscheinlichkeit für den ersten Fall ist p1 = 1/33 = 1/27. Die Wahrscheinlichkeit p2 für den zweiten Fall berechnet man so: Die Wahrscheinlichkeit, in den ersten beiden Würfen mindestens eine Fünf und im letzten Wurf höchstens eine Vier zu werfen, ist 1/3 · 1/3 · 2/3 = 2/27. Daher ist p2 = 6/27 (das dreifache der vorherigen Wahrscheinlichkeit) und EX = 20 · p1 + 10 · p2 = 100/27 < 4. Ds Spiel lohnt sich nicht. Aufgabe 48: Bei einer Multiple Choice Aufgabe erhält man einen Minus-Punkt, wenn man nichts ankreuzt, einen Punkt, wenn man richtig, und 4 Minus-Punkte, wenn man falsch ankreuzt. Wir nehmen an, dass eine StudentIn durch ein 0 < p < 1 folgendermaßen gekennzeichnet ist (q := 1 − p): Mit der Wahrscheinlichkeit p wird das Richtige angekreuzt, mit der Wahrscheinlichkeit q/2 gar nichts und mit der Wahrscheinlichkeit q/2 etwas Falsches. Berechnen Sie Erwartungswert und Streuung bei n Aufgaben! Hinweis: Sie dürfen E(X1 + · · · + Xn ) = EX1 + · · · + EXn und V (X1 + · · · + Xn ) = V (X1 ) + · · · + V (Xn ) verwenden, wobei die Zufallsvariable Xj die Punktzahl bei der j-ten Aufgabe misst. Dies hat zur Folge, dass Sie i.W. nur den Fall n = 1 berechnen müssen. Lösung: n = 1: EX = p − 4(q/2) + q/2 = p + 5/2q = 7/2p − 5/2 Bei n Aufgaben ist EX = n(7/2p − 5/2). Für n = 1 gilt V (X) = p(EX − 1)2 + q/2((EX + 1)2 + q/2(EX + 4)2 ). Nach einiger Rechnung (Termumformung!): V (X) = − 9 49 2 p + 10p + . 4 4 9 2 Bei n Aufgaben gilt V (X) = n · (− 49 4 p + 10p + 4 ), als Streuung erhält man Str(X) = √ r n − 49 2 9 p + 10p + . 4 4 38