Aufgabe 1: Ein Basketballspieler behauptet, bei Freiwürfen eine Trefferwahrscheinlichkeit p von mindestens 75% zu haben. In einer Serie von 15 Würfen trifft er 9-mal. Wir gehen dabei davon aus, dass die einzelnen Würfe unabhängig voneinander sind. (a) Angenommen, es gilt tatsächlich p = 0.75. Geben Sie die Wahrscheinlichkeit, dass der Spieler genau 9 Treffer bei 15 Versuchen erzielt, mit einer Formel an. Der Zahlenwert, muss dabei nicht ausgerechnet werden. Ersetzen Sie aber alle bekannten Werte durch die entsprechenden Zahlen. (2 Punkte) (b) Nun sei der wahre Wert von p unbekannt. • Formulieren Sie die Aussage des Spielers als Nullhypothese. • Geben Sie einen Term an, mit dem der p-Wert eines Hypothesentests zu dieser Nullhypothese berechnet werden kann. Sie brauchen den p-Wert nicht auszurechnen. Ersetzen Sie aber alle bekannten Werte durch die entsprechenden Zahlen. (3 Punkte) (c) Es ergibt sich ein p-Wert von 0.148. • Wie ist dies bei einem Signifikanzniveau von α = 0.05 zu interpretieren? • Welcher Fehler könnte dabei möglicherweise aufgetreten sein? (2 Punkte) (d) Angenommen der Spieler hätte stattdessen bei 150 Würfen 90 Treffer erzielt. Hätte dies zu einem größeren, einem kleineren oder dem gleichen p-Wert geführt? Begründen Sie kurz Ihre Antwort. (2 Punkte) Aufgabe 2: 10 Teilnehmer einer Studie lösen (unabhängig voneinander) eine bestimmte Aufgabe. Die zufällige Größe X beschreibt die Zeit (in Sekunden), die ein Teilnehmer zur Lösung benötigt. Wir nehmen an, dass X normalverteilt ist. (a) Angenommen X hat den Erwartungswert µ = 100 und die Standardabweichung σ = 20. Wie groß ist die Wahrscheinlichkeit, dass ein Teilnehmer mehr als 140 Sekunden zur Lösung der Aufgabe benötigt. Benutzen Sie die Standardnormalverteilung Φ, um das Ergebnis anzugeben. (3 Punkte) (b) Nun sind µ und σ unbekannt. Die Lösungszeiten X1 , X2 , . . . , X10 der Teilnehmer sind: 92 89 93 108 101 86 70 82 77 82 Geben Sie anhand dieser Daten Punktschätzungen für den Erwartungswert µ und die Standardabweichung σ ab. Hinweis: X1 + X2 + . . . + X10 = 880 und X1 − X 2 + X2 − X 2 + . . . + X10 − X 2 = 1132 (3 Punkte) (c) Geben Sie eine (zweiseitige) Intervallschätzung µ ∈ [µU , µO ] für den Erwartungswert µ zum Vertrauensniveau δ = 0.9 ab. Hinweis: Für die t-Verteilungen T9 und T10 gilt T9 (1.38) = 0.9 T9 (1.83) = 0.95 T10 (1.37) = 0.9 Sie benötigen nur eine dieser 4 Gleichungen. (d) T10 (1.81) = 0.95 (4 Punkte) • Erläutern Sie, warum der Wahrheitsgehalt der Aussage µ ∈ [µU , µO ] vom Zufall abhängt. • Was weiß man über die Wahrscheinlichkeit, dass die Aussage wahr ist? (2 Punkte) (e) Angenommen die Teilnehmer der Studie sind in mehrere (mindestens 3) verschiedene Gruppen unterteilt, die unabhängig voneinander die Aufgabe bearbeiten. • Nennen Sie einen Test, mit dem man untersuchen kann, ob zwischen den Gruppen signifikante Unterschiede bezüglich der (im Durchschnitt zu erwartenden) Lösungszeit bestehen. • Welche theoretische Voraussetzung ist für diesen Test zusätzlich zu der Annah me, dass die Lösungszeiten in den verschiedenen Gruppen normalverteilt sind , noch notwendig? (2 Punkte) Aufgabe 3: Bei einer Umfrage werden zwei Gruppen befragt. Es gibt 3 Antwortmöglichkeiten. Es ergeben sich die folgenden absoluten Häufigkeiten für die einzelnen Antworten: Gruppe A Gruppe B Antwort 1 18 12 Antwort 2 12 28 Antwort 3 10 20 Summe 40 60 Summe 30 40 30 100 Mit einem χ2 -Homogenitätstest soll die Nullhypothese H0 : Die Wahrscheinlichkeiten der jeweiligen Antworten sind in Gruppe A genauso groß wie in Gruppe B. untersucht werden. (a) Bestimmen Sie die (unter H0 ) erwarteten absoluten Häufigkeiten für jede Gruppe und jede Antwortmöglichkeit. 1 2 3 Am einfachsten schreiben Sie diese in eine Tabelle: A B (3 Punkte) (b) Berechnen Sie nun die Teststatistik T ? (Antworten Sie mit einem Ausdruck, der nur noch Zahlen enthält. Sie müssen diesen dann aber nicht mehr ausrechnen.) (2 Punkte) (c) Spricht ein hoher oder ein niedriger Wert der Teststatistik gegen H0 ? Begründen Sie kurz Ihre Antwort. (2 Punkte) Lösung zu Aufgabe 1: (a) Binomialverteilung: n = 15, p = 0.75: 15 15 9 15−9 W (genau 9 Treffer) = · (0.75) · (1 − 0.75) = · (0.75)9 · (0.25)6 9 9 (b) H0 : p ≥ 0.75 mit p0 = 0.75 Der p-Wert: linkseitiger Test für die Trefferwahrscheinlichkeit einer Binomialverteilung k P j=0 n j p0 j (1 − p0 )n−j = 9 P j=0 15 j 0.75j (0.25)15−j (c) Da der p-Wert größer ist als α, kann H0 zu diesem Signifikanzniveau nicht abgelehnt werden. Dabei könnte ein β-Fehler aufgetreten sein. (D.h. die Nullhypothese ist falsch, wird aber trotzdem nicht abgelehnt.) (d) Der p-Wert wäre dann (deutlich) kleiner. Begründung: 90 Treffer bei 150 Würfen sprechen sehr viel stärker gegen H0 als 9 Treffer bei 15 Versuchen. Die Trefferquote ist in beiden Fällen gleich, aber unterhalb der 9 90 behaupteten Mindestwahrscheinlichkeit, es gilt: 15 = 150 = 0.6 < 0.75. Falls H0 tatsächlich wahr ist, sind 90 von 150 Treffer sehr viel unwahrscheinlicher als 9 von 15 Treffer. Lösung zu Aufgabe 2: (a) P (X ≥ 140) = 1 − FX (140) = 1 − Φ (b) 140−100 20 = 1 − Φ (2) = Φ(−2) 10 • X = X1 +...+X = 880 10 10 = 88 ist eine Schätzung für µ r q 2 2 2 (X1 −X ) +(X2 −X ) +...+(X10 −X ) 1132 • s= = 9 9 = 11.22 ist eine Schätzung für σ (c) Man erhält das Konfidenzintervall zum Vertrauensniveau δ durch: X − c, X + c mit s c = λ(n−1,δ) · √ n Dabei ist λ(n−1,δ) die Zahl mit Tn−1 λ(n−1,δ) = Also hier: 1+δ 2 1+δ T9 λ(9,0.9) = = 0.95 2 Hinweis ⇒ λ(9,0.9) = 1.83 Damit folgt: 11.22 = 6.49 c = 1.83 · √ 10 ⇒ [µU , µO ] = [88 − 6.49, 88 + 6.49] = [81.51, 94.49] (d) Die Daten X1 , . . . , Xn sind zufällig zustande gekommen. Aus ihnen werden µU und µO berechnet. Daher sind µU und µO zufällig. Der wahre Wert µ ist unbekannt, aber nicht zufällig. Die Wahrscheinlichkeit für eine korrekte Schätzung beträgt immer mindestens δ (hier sogar genau δ), also W (µ ∈ [µU , µO ]) ≥ 0.9 bzw. W (µ ∈ [µU , µO ]) = 0.9 (e) Einfaktorielle Varianzanalyse (F-Test auf Lokationsunterschiede) Dafür müssen die Varianzen für die Lösungszeiten innerhalb der einzelnen Gruppen als gleich vorausgesetzt werden. Lösung zu Aufgabe 3: (a) Es ergibt sich Gruppe A Gruppe B (b) T = (18−12)2 12 + (12−16)2 16 + Antwort 1 40·30 100 = 12 60·30 100 = 18 (10−12)2 12 + (12−18)2 18 Antwort 2 40·40 100 = 16 60·40 100 = 24 + (28−24)2 24 Antwort 3 40·30 100 = 12 60·30 100 = 18 + (20−18)2 18 (c) Falls H0 gilt, erwartet man eher kleine Unterschiede zwischen absoluten Häufigkeiten und erwarteten aboluten Häufigkeiten. Dies führt zu einem kleinen Wert für die Teststatistik. Umgekehrt spricht also ein hoher Wert von T gegen H0 .