Aufgabe 1: (17 Punkte) a) Ränge Ri der yi -Werte: 1 130 30.1 1 i xi yi Ri 2 140 41.9 4 3 150 39.3 3 4 160 32.5 2 5 170 51.7 6 6 180 47.0 5 7 190 58.4 8 8 200 54.4 7 9 230 60.8 9 10 240 63.7 10 11 280 70.2 11 12 290 75.1 12 Der Spearman-Rangkorrelationskoezient ρxy lässt sich mit der folgenden Formel berechnen: n X 6 ρxy = 1 − · (j − Rj )2 . n · (n2 − 1) j=1 Hierbei ist n X (j − Rj )2 = (2 − 4)2 + (4 − 2)2 + (5 − 6)2 + (6 − 5)2 + (7 − 8)2 + (8 − 7)2 j=1 = 12. Also ist der Spearman-Rangkorrelationskoezient 1 ρxy = 1 − · 12 ≈ 0.9580. 286 b) Empirischer Pearson-Korrelationskoezient rxy : rxy = 1 n−1 ³P n j=1 xj · yj − n · x̄ · ȳ sx · sy ´ = 1 11 (130806 − 12 · 196.67 · 52.09) ≈ 0.9395 52.97 · 14.38 c) Die Parameter a∗ und b∗ in der geschätzten Regressionsgeraden y = a∗ + b∗ x berechnen sich wie folgt: sy 14.38 b∗ = rxy · ≈ 0.9395 · ≈ 0.2550 sx 52.97 a∗ = ȳ − b∗ · x̄ ≈ 52.09 − 0.2550 · 196.67 ≈ 1.932. und ein Schätzer für die Varianz σ 2 des Fehlers ist n−1 2 11 2 σ̂ 2 = sy (1 − rxy )≈ · 14.382 · (1 − 0.93952 ) ≈ 26.690. n−2 10 d) Kondenzbereich für b zur Kondenzwahrscheinlichkeit 1−α = 0.95: Zunächst benötigt man das 1 − α/2-Quantil der tn−2 -Verteilung: tn−2,1−α/2 = t10,0.975 ≈ 2.23 (Tabelle A.2). Die untere Grenze des Kondenzbereichs für b ist (S. 188, wobei gemäÿ der Schreibweise im Skript der Schätzer für b jetzt mit b̂ statt mit b∗ bezeichnet wird): √ σ̂ · tn−2,1−α/2 26.690 · 2.23 b̂ − √ ≈ 0.2550 − √ ≈ 0.2550 − 0.0628 ≈ 0.1922. n · sx 12 · 52.97 Die obere Grenze des Kondenzbereichs für b ist: σ̂ · tn−2,1−α/2 ≈ 0.2550 + 0.0628 ≈ 0.3263. b̂ + √ n · sx Der gesuchte Kondenzbereich ist also [0.1922, 0.3263]. Aufgabe 2: (15 Punkte) X1 , . . . , X5 Niederschlagsmengen in den nächsten fünf Jahren, wobei diese Zufallsvariablen X1 , . . . , X5 die Verteilung N (805, 16900) besitzen. a) Wahrscheinlichkeit, dass im nächsten Jahr mehr als 1000 mm Niederschlag fallen: X1 − 805 1000 − 805 ) P (X1 > 1000) = P ( √ > √ 16900 16900 | {z } =:Y ∼N (0,1) = P (Y > 1.5) = 1 − Φ(1.5) ≈ 1 − 0.9332 (Tabelle A.1) = 0.0668 = 6.68% b) Wahrscheinlichkeit, dass in den nächsten fünf Jahren mindestens einmal eine Niederschlagsmenge von mehr als 1000 mm auftritt: P (Mindestens ein Xi > 1000, i = 1, 2, 3, 4, 5 ) = 1 − P (Alle Xi ≤ 1000, i = 1, 2, 3, 4, 5 ) = 1 − P (X1 ≤ 1000, X2 ≤ 1000, . . . , X5 ≤ 1000) = 1 − P (X1 ≤ 1000) · P (X2 ≤ 1000) · · · P (X5 ≤ 1000) (Unabhängigkeit) = 1 − P (X1 ≤ 1000)5 (Identische Verteilung von X1 , . . . , X5 ) ≈ 1 − 0.93325 ≈ 0.2923 = 29.23% c) Wahrscheinlichkeit, dass die Gesamtniederschlagsmenge in den nächsten fünf Jahren höchstens 4700 mm beträgt: Sei Z := X1 + X2 + . . . + X5 . Nach der Faltungsformel für Normalverteilungen hat Z eine N (5 · 805, 5 · 16900)-Verteilung (also N (4025, 84500)). Daher gilt 4700 − 4025 Z − 4025 > √ ) P (Z ≤ 4700) = P ( √ 84500 84500 | {z } =:Y ∼N (0,1) = P (Y < 2.3221) ≈ Φ(2.32) ≈ 0.9898 (Tabelle A.1) = 98.98%. Aufgabe 3: (15 Punkte) a) Gemeinsame Verteilung von X1 und Y : P (X1 P (X1 P (X1 P (X1 = 0, Y = 0, Y = 1, Y = 1, Y = 0) = 1) = 0) = 1) = = = = P (X1 P (X1 P (X1 P (X1 = 0, X2 = 0, X2 = 1, X2 = 1, X2 = 1) = P (X1 = 0) = P (X1 = 0) = P (X1 = 1) = P (X1 = 0) · P (X2 = 0) · P (X2 = 1) · P (X2 = 1) · P (X2 = 1) = 0.5 · 0.5 = 0.25, = 0) = 0.5 · 0.5 = 0.25, = 0) = 0.5 · 0.5 = 0.25, = 1) = 0.5 · 0.5 = 0.25. Randverteilungen von X1 und Y : P (X1 = 0) = P (X1 = 1) = 0.5, P (Y = 0) = P (X1 = 0, Y = 0) + P (X1 = 1, Y = 0) = 0.25 + 0.25 = 0.5, P (Y = 1) = P (X1 = 0, Y = 1) + P (X1 = 1, Y = 1) = 0.25 + 0.25 = 0.5. Eingetragen in die Tabelle: P (X1 = j, Y = k) k=0 k=1 P (X1 = j) j=0 0.25 0.25 0.5 j=1 0.25 0.25 0.5 P (Y = k) 0.5 0.5 1 b) Erwartungswerte: E(X1 ) = 0 · P (X1 = 0) + 1 · P (X1 = 1) = 0.5, E(Y ) = 0 · P (Y = 0) + 1 · P (Y = 1) = 0.5. Korrelationskoezienten ρ(X1 , Y ): E(X1 · Y ) = 0 · 0 · P (X1 = 0, Y = 0) + 1 · 0 . . . + 0 · 1 . . . + 1 · 1 · P (X1 = 1, Y = 1) = 0.25 und damit ρ(X1 , Y ) = E(X1 · Y ) − E(X1 ) · E(Y ) q V (X1 ) · V (Y ) 0.25 − 0.5 · 0.5 =q = 0. V (X1 ) · V (Y ) c) X1 und Y sind stochastisch unabhängig, da für beliebige j ∈ {0, 1} und beliebige k ∈ {0, 1} gilt P (X1 = j, Y = k) = 0.25 = 0.5 · 0.5 = P (X1 = j) · P (Y = k), siehe obige Tabelle. Aufgabe 4: (18 Punkte) a) Es ist die Hypothese H0 : µ = ν zu testen gegen H1 : µ 6= ν. Hier ist der zweiseitige Zwei-Stichproben-t-Test zu verwenden. Für die Prüfgröÿe benötigt man die Mittelwerte und empirischen Varianzen: x̄ = n 1X xi ≈ 1.74545, n i=1 à s2x ! n X 1 = x2 − n · x̄2 ≈ 0.63273, n − 1 i=1 i ȳ = m 1 X yj ≈ 2.12727, m j=1 s2y m 1 X y 2 − m · ȳ 2 ≈ 0.62618. = m − 1 j=1 j Die Teststatistik ist q T =q 1 ((n m+n−2 mn (x̄ m+n q − ȳ) − 1)s2x + (m − 1)s2y ) 11 ≈ q2 (1.74545 − 2.12727) 1 (0.63273 2 + 0.62618) ≈ −1.129. Der kritische Wert ist nach Tabelle A.2 tm+n−2,1−α/2 = t20,0.975 ≈ 2.09. Wegen |T | < tm+n−2,1−α/2 lehnt der Test H0 nicht ab. b) Hier ist der Mann-Whitney-U -Test geeignet. Zunächst ist die Summe der Ränge der xi in der gemeinsamen Stichprobe aller 22 Daten. Es ergibt sich W = 1 + 2 + 5 + 6 + 8.5 + 8.5 + 10 + 14 + 15 + 18 + 20 = 108. Die Teststatistik ist U =W− n(n + 1) = 108 − 66 = 42. 2 Die kritischen Werte sind Um,n,1−α/2 = U11,11,0.975 = 91 (Tabelle A.7), m · n − Um,n,1−α/2 = 121 − 91 = 30. Da weder U ≥ Um,n,1−α/2 noch U ≤ m · n − Um,n,1−α/2 gilt, kann H0 nicht abgelehnt werden. Aufgabe 5: (14 Punkte) a) Die Hypothese ist H0 : p ≤ p0 , die Alternative ist als H1 : p > p 0 mit p0 = 0.7 zu wählen. Wenn der Test die Hypothese ablehnt, hat der Hersteller seine Behauptung statistisch nachgewiesen (zum Signikanzniveau α). b) Die Prüfgröÿe ist Sn = S100 . Die Hypothese H0 , dass weniger als 70 % der Patienten geheilt werden, wird abgelehnt, falls S100 groÿ genug ist, d.h. falls S100 ≥ k̃ . Wegen P0.7 (S100 ≥ 78) = 1 − P0.7 (S100 ≤ 77) = 0.048 = 4.8% ≤ 5% ist k̃ = 78 der kritische Wert für den Test. c) pWert: P0.7 (S100 ≥ 76) = 1 − P0.7 (S100 ≤ 75) = 1 − 0.886 = 0.114 = 11.4%. Aufgabe 6: (11 Punkte) Es gibt s = 5 mögliche Ausgänge bei der Beobachtung einer Familie (0, 1, 2, 3 oder 4 Mädchen). Die Hypothese H0 : p0 = 1 , 16 1 p1 = , 4 3 p2 = , 8 1 p3 = , 4 p4 = 1 16 wird mit dem χ2 -Anpassungstest getestet. Die Prüfgröÿe ist X n2j 1 s−1 1 T = −n= n j=0 qj 500 Der kritische Wert ist à ! 362 1302 1922 1152 272 − 500 = 2.408. + + + + 1/16 1/4 3/8 1/4 1/16 χ2s−1,1−α = χ24,0.95 ≈ 9.49. Wegen T < χ2s−1,1−α lehnt der χ2 -Anpassungstest die Hypothese H0 nicht ab.