Lösungen zum Zusatzübungsblatt Aufgabe 1 Ein Hypothesentest hat ergeben, dass der dazugehörige p-Wert p = 5, 5% ist. Sind die folgenden Aussagen wahr oder falsch? Begründen Sie Ihre Anworten. (i) Auf dem Signifikanzniveau α = 5% wird die Nullhypothese verworfen. (ii) Auf dem Signifikanzniveau α = 10% wird die Alternativhypothese angenommen. (iii) Die Wahrscheinlichkeit dafür, die Nullhypothese zu verwerfen ist 5, 5%. (iv) Wenn die Nullhypothese verworfen wird, ist die Alternativhypothese mit Wahrscheinlichkeit 94, 5% wahr. Lösung: (i) Falsch (ii) Wahr (iii) Falsch (iv) Falsch Aufgabe 2 Ein Autohändler behauptet, dass der Benzinverbrauch eines bestimmten Autos bei einer Geschwindigkeit von 120 km/h bei 9 Litern je 100 km liegt. Bei 36 Testfahrten wurden die folgenden Verbrauchswerte ermittelt: 8.8 9.2 8.9 8.8 9.0 8.9 8.7 8.9 9.3 8.9 9.0 9.0 8.7 9.1 8.8 8.6 9.4 8.5 8.6 8.9 8.9 9.4 8.9 8.8 8.6 8.7 8.7 9.0 8.8 9.0 8.8 8.6 8.8 8.9 9.4 9.2 Prüfen Sie unter der Annahme, dass die Daten Realisierungen von unabhängigen Nµ,σ 2 -verteilten Zufallsgrößen mit unbekanntem µ und unbekanntem σ 2 sind, ob sich die Behauptung des Händlers bei einer Irrtumswahrscheinlichkeit von 5% aufrechterhalten lässt. Lösung: Wie führen einen T-Test mit beidseitiger Alternative durch: Teste zum Niveau α = 5% die Nullhypothese H0 : µ = 9 gegen die Alternative H 1 : µ , 9. Wir berechnen dazu zunächst aus den gegebenen Werten x 1 , . . . ,x 36 : 36 M (x ) = 1X x i ≈ 8.9028 n i=1 36 1 X V (x ) = (x i − M (x )) 2 ≈ 0.055135. n − 1 i=1 ∗ Daraus ergibt sich für die Teststatistik (mit µ 0 = 9 und n = 36) √ n (M (x ) − µ 0 ) T (x ) := T µ 0 (x ) = T9 (x ) = ≈ −2.48429. p V ∗ (x ) 1 Da wir beidseitig testen, ist der Ablehnungsbereich gegeben durch C = − ∞, Q α /2 (t n −1 ) ∪ Q 1−α /2 (t n −1 ), ∞ = − ∞, −Q 0.975 (t 35 ) ∪ Q 0.975 (t 35 ), ∞ = (−∞, −2.0301) ∪ (2.0301, ∞). Hierbei haben wir die Tabelle „Quantile der t-Verteilung“ verwendet. Da T (x ) ∈ C, können wir H 0 zum Niveau von 5% verwerfen. Aufgabe 3 (i) Wie wahrscheinlich ist es, dass eine mit „Kopf“ beginnende faire Münzwurfserie der Länge n auf „Zahl“ endet und dass zugleich die Summe der Anzahl Köpfe am Anfang und der Anzahl Zahlen am Ende ≥ m ist (für ein gegebenes m ∈ {2, . . . ,n})? (ii) Um die Hypothese, dass zwei reelle Stichproben (von ungefähr gleichem Umfang) aus ein- und derselben Verteilung stammen, zu prüfen, hat John Tukey folgenden kompakten Test vorgeschlagen: Falls in der einen Stichprobe k 1 Werte kleiner sind als der kleinste Wert in der anderen Stichprobe und k 2 Werte in der anderen Stichprobe größer sind als der größte Wert in der einen Stichprobe, und falls k 1 + k 2 ≥ 7 gilt, so verwerfe man die Hypothese zum Niveau 5%. Falls k 1 + k 2 ≥ 10, so verwerfe man die Hypothese zum Niveau 1% und falls k 1 +k 2 ≥ 13, so verwerfe man die Hypothese zum Niveau 0, 1%. Verwenden Sie Teil (i) um Tukeys Aussage zu verifizieren. Lösung: (i) Wir wollen zu Beginn eine Serie von mindestens k 1 Köpfen und am Ende dann eine Serie von genau(!) m − k 1 Zahlen. Diese Wahrscheinlichkeiten müssen wir dann über alle möglichen k 1 summieren und erhalten m k 1 −1 m 1 m X 1 1 1 m −k1 X 1 m P ≥m = = · · =m . 2 2 2 2 2 k 1 =1 k 1 =1 Hierbei kommt der Exponent k 1 −1 im ersten Term aus der Bedingung, dass die Münzwurfserie immer mit Kopf anfängt und der Faktor 21 daher, dass wir vor der Zahlenfolge am Ende nochmal einen Kopf bekommen. (ii) Unter der Nullhypothese („Beide Stichproben stammen aus derselben Verteilung“) gilt nach (i): (a) P ≥7 = (b) (c) 7 ≈ 5.4% 27 P ≥10 = 21010 ≈ 0.97% P ≥13 = 21313 ≈ 0.16% Da der Ablehnungsbereich C eines Tests zum Niveau α so gewählt wird, dass P(C |H 0 ) ≤ α, ist es legitim H 0 zum Niveau (a) 5%, (b) 1%, (c) 0.1% zu verwerfen, falls die entsprechenden Werte auftreten. Weitere Erklärungen finden sich unter http://www.jstor.org/stable/1266308?seq=2 2 Aufgabe 4 Es seien X 1 , . . . ,X n unabhängige, auf dem Intervall (0,ϑ ) gleichverteilte Stichproben, wobei uns ϑ unbekannt sei. Es sei ϑ 0 < ϑ 1 . Finden Sie für den Test der Nullhypothese ϑ = ϑ 0 gegen die Alternative ϑ = ϑ 1 einen gleichmäßig besten Test zum Niveau α ∈ (0, 1]. Lösung: Wir definieren T (X ) := max1≤ j ≤n X j . Dann gilt wegen der Unabhängigkeit der X i : n t n Y Pϑ [T (X ) ≤ t] = Pϑ [X 1 ≤ t, . . . ,X n ≤ t] = Pϑ [X j ≤ t] = 1[0,ϑ ] (t ) + 1(ϑ,∞) (t ). ϑ j=1 Es ergibt sich also die Dichte (unter Pϑ ) t n −1 1[0,ϑ ] (t ). ϑn Weiter ist die gemeinsame Dichte von (X 1 , . . . ,X n ) unter Pϑ gegeben durch fT (X ) (t ) = n L x (ϑ ) = f (X 1 , . . .,X n ) (x ) = n n Y Y 1 1 1[0,ϑ ] (x j ) = n 1[0,ϑ ] (T (x )) 1[0,∞) (x j ). ϑ ϑ j=1 j=1 Daraus berechnen wir den Likelihoodquotienten L x (ϑ 1 ) ϑ 0n = 1[0,ϑ0 ] (T (x )) + ∞1(ϑ0 ,ϑ1 ] (T (x )) R(x ) = L x (ϑ 0 ) ϑ 1n ϑn Somit ist c = ϑ0n der kritische Wert. 1 Es gilt {R(x ) = c} = {T (x ) ≤ ϑ 0 } und Pϑ0 [R(X ) > c] = 0, Pϑ0 [T (X ) ≤ ϑ 0 ] = 1. Nun definieren wir den Test 1 φ (x ) = γ (x ) 0 , falls R(x ) > c, , falls R(x ) = c, , falls R(x ) < c. = 1 {T (x ) >ϑ0 } + γ (x ) 1 {T (x ) ≤ϑ0 } , d.h. für T (x ) > ϑ 0 ist φ (x ) = 1 und die Nullhypothese wird abgelehnt. √ Nun ist noch γ so zu bestimmen, dass Eϑ0 [φ (X )] = α ist. Wir setzen dazu k = ϑ 0 n α und 1 , falls T (x ) < k, γ (x ) = 0 , falls T (x ) ≥ k. Dann gilt Eϑ0 [φ (X )] = Eϑ0 [1 {T (X ) >ϑ0 } ] + Eϑ0 [1 {T (X ) <k } ] = Pϑ0 [T (X ) > ϑ 0 ] + Pϑ0 [T (X ) < k] √ = Pϑ0 [T (X ) < ϑ 0 n α] Z ϑ0 √n α t n −1 = n n 1[0,ϑ0 ] (t ) dt ϑ0 0 √ n t=ϑ 0 α n 1 n = n t ϑ0 n t=0 = α. Nach Satz 8.12 ist φ dann also gleichmäßig bester Schätzer zum Niveau α. 3 Aufgabe 5 Es soll zu einem Signifikanzniveau von 10% untersucht werden, ob sich der Mietpreis pro Quadratmeter für Ein- und Zweizimmerwohnungen signifikant unterscheidet. Hierzu wurden die folgenden Stichproben (von Quadratmeterpreisen) erhoben: X Y Einzimmerwohnung Zweizimmerwohnung 7.448 4.718 8.767 12.382 9.770 5.654 7.280 7.269 9.217 9.698 8.645 10.002 8.353 5.193 8.706 7.808 5.188 7.648 12.991 Führen Sie einen Mann-Whitney-Wilcoxon Test durch. Lösung: Korrektur der Aufgabe: Wir rechnen mit α = 5%!!!! (Dafür haben wir die passende Tabelle im SkriptAnhang verfügbar.) Wir wollen die Nullhypothese PX = PY gegen die Alternative, dass PX stochastisch größer ist als PY , testen. Aus der Tabelle ergibt sich das 95%-Quantil von MWU10,9 : c = Q 0.95 (MWU10,9 ) = 65. Als Test legen wir also fest: φ = 1 genau dann, wenn U10,9 > 65. Um die Rangsumme W10,9 zu bestimmen, sortieren wir die Daten der Größe nach und unterstreichen die Zahlen, die vom Typ X stammen. Rang Wert 1 4.718 2 5.188 3 5.193 4 5.654 5 7.269 6 7.280 7 7.448 Rang Wert 11 8.645 12 8.706 13 8.767 14 9.217 15 9.698 16 9.770 17 10.002 8 7.648 9 7.808 18 12.991 10 8.353 19 12.382 Wir erhalten als Rangsumme W10,9 = 2 + 6 + 7 + 10 + 11 + 12 + 13 + 14 + 16 + 18 = 109. Hieraus ergibt sich für die U-Statistik U10,9 = W10,9 − 10 · 11 = 109 − 55 = 54 < 65. 2 Also kann die Nullhypothese nicht zum Niveau 5% verworfen werden. 4