Lösungen zum Zusatzübungsblatt Aufgabe 1 Ein Hypothesentest

Werbung
Lösungen zum Zusatzübungsblatt
Aufgabe 1
Ein Hypothesentest hat ergeben, dass der dazugehörige p-Wert p = 5, 5% ist. Sind die folgenden Aussagen
wahr oder falsch? Begründen Sie Ihre Anworten.
(i) Auf dem Signifikanzniveau α = 5% wird die Nullhypothese verworfen.
(ii) Auf dem Signifikanzniveau α = 10% wird die Alternativhypothese angenommen.
(iii) Die Wahrscheinlichkeit dafür, die Nullhypothese zu verwerfen ist 5, 5%.
(iv) Wenn die Nullhypothese verworfen wird, ist die Alternativhypothese mit Wahrscheinlichkeit 94, 5%
wahr.
Lösung:
(i) Falsch
(ii) Wahr
(iii) Falsch
(iv) Falsch
Aufgabe 2
Ein Autohändler behauptet, dass der Benzinverbrauch eines bestimmten Autos bei einer Geschwindigkeit
von 120 km/h bei 9 Litern je 100 km liegt. Bei 36 Testfahrten wurden die folgenden Verbrauchswerte
ermittelt:
8.8
9.2
8.9
8.8
9.0
8.9
8.7
8.9
9.3
8.9
9.0
9.0
8.7
9.1
8.8
8.6
9.4
8.5
8.6
8.9
8.9
9.4
8.9
8.8
8.6
8.7
8.7
9.0
8.8
9.0
8.8
8.6
8.8
8.9
9.4
9.2
Prüfen Sie unter der Annahme, dass die Daten Realisierungen von unabhängigen Nµ,σ 2 -verteilten Zufallsgrößen mit unbekanntem µ und unbekanntem σ 2 sind, ob sich die Behauptung des Händlers bei einer
Irrtumswahrscheinlichkeit von 5% aufrechterhalten lässt.
Lösung:
Wie führen einen T-Test mit beidseitiger Alternative durch: Teste zum Niveau α = 5% die Nullhypothese
H0 : µ = 9
gegen die Alternative
H 1 : µ , 9.
Wir berechnen dazu zunächst aus den gegebenen Werten x 1 , . . . ,x 36 :
36
M (x ) =
1X
x i ≈ 8.9028
n i=1
36
1 X
V (x ) =
(x i − M (x )) 2 ≈ 0.055135.
n − 1 i=1
∗
Daraus ergibt sich für die Teststatistik (mit µ 0 = 9 und n = 36)
√
n (M (x ) − µ 0 )
T (x ) := T µ 0 (x ) = T9 (x ) =
≈ −2.48429.
p
V ∗ (x )
1
Da wir beidseitig testen, ist der Ablehnungsbereich gegeben durch
C = − ∞, Q α /2 (t n −1 ) ∪ Q 1−α /2 (t n −1 ), ∞
= − ∞, −Q 0.975 (t 35 ) ∪ Q 0.975 (t 35 ), ∞
= (−∞, −2.0301) ∪ (2.0301, ∞).
Hierbei haben wir die Tabelle „Quantile der t-Verteilung“ verwendet.
Da T (x ) ∈ C, können wir H 0 zum Niveau von 5% verwerfen.
Aufgabe 3
(i) Wie wahrscheinlich ist es, dass eine mit „Kopf“ beginnende faire Münzwurfserie der Länge n auf
„Zahl“ endet und dass zugleich die Summe der Anzahl Köpfe am Anfang und der Anzahl Zahlen am
Ende ≥ m ist (für ein gegebenes m ∈ {2, . . . ,n})?
(ii) Um die Hypothese, dass zwei reelle Stichproben (von ungefähr gleichem Umfang) aus ein- und derselben Verteilung stammen, zu prüfen, hat John Tukey folgenden kompakten Test vorgeschlagen:
Falls in der einen Stichprobe k 1 Werte kleiner sind als der kleinste Wert in der anderen Stichprobe
und k 2 Werte in der anderen Stichprobe größer sind als der größte Wert in der einen Stichprobe, und
falls k 1 + k 2 ≥ 7 gilt, so verwerfe man die Hypothese zum Niveau 5%. Falls k 1 + k 2 ≥ 10, so verwerfe
man die Hypothese zum Niveau 1% und falls k 1 +k 2 ≥ 13, so verwerfe man die Hypothese zum Niveau
0, 1%.
Verwenden Sie Teil (i) um Tukeys Aussage zu verifizieren.
Lösung:
(i) Wir wollen zu Beginn eine Serie von mindestens k 1 Köpfen und am Ende dann eine Serie von genau(!)
m − k 1 Zahlen. Diese Wahrscheinlichkeiten müssen wir dann über alle möglichen k 1 summieren und
erhalten
m k 1 −1
m
1 m
X
1
1 1 m −k1 X 1 m
P ≥m =
=
· ·
=m
.
2
2 2
2
2
k 1 =1
k 1 =1
Hierbei kommt der Exponent k 1 −1 im ersten Term aus der Bedingung, dass die Münzwurfserie immer
mit Kopf anfängt und der Faktor 21 daher, dass wir vor der Zahlenfolge am Ende nochmal einen Kopf
bekommen.
(ii) Unter der Nullhypothese („Beide Stichproben stammen aus derselben Verteilung“) gilt nach (i):
(a) P ≥7 =
(b)
(c)
7
≈ 5.4%
27
P ≥10 = 21010 ≈ 0.97%
P ≥13 = 21313 ≈ 0.16%
Da der Ablehnungsbereich C eines Tests zum Niveau α so gewählt wird, dass P(C |H 0 ) ≤ α, ist es
legitim H 0 zum Niveau (a) 5%, (b) 1%, (c) 0.1% zu verwerfen, falls die entsprechenden Werte auftreten.
Weitere Erklärungen finden sich unter http://www.jstor.org/stable/1266308?seq=2
2
Aufgabe 4
Es seien X 1 , . . . ,X n unabhängige, auf dem Intervall (0,ϑ ) gleichverteilte Stichproben, wobei uns ϑ unbekannt sei. Es sei ϑ 0 < ϑ 1 . Finden Sie für den Test der Nullhypothese ϑ = ϑ 0 gegen die Alternative ϑ = ϑ 1
einen gleichmäßig besten Test zum Niveau α ∈ (0, 1].
Lösung:
Wir definieren T (X ) := max1≤ j ≤n X j . Dann gilt wegen der Unabhängigkeit der X i :
n
t n
Y
Pϑ [T (X ) ≤ t] = Pϑ [X 1 ≤ t, . . . ,X n ≤ t] =
Pϑ [X j ≤ t] =
1[0,ϑ ] (t ) + 1(ϑ,∞) (t ).
ϑ
j=1
Es ergibt sich also die Dichte (unter Pϑ )
t n −1
1[0,ϑ ] (t ).
ϑn
Weiter ist die gemeinsame Dichte von (X 1 , . . . ,X n ) unter Pϑ gegeben durch
fT (X ) (t ) = n
L x (ϑ ) = f (X 1 , . . .,X n ) (x ) =
n
n
Y
Y
1
1
1[0,ϑ ] (x j ) = n 1[0,ϑ ] (T (x )) 1[0,∞) (x j ).
ϑ
ϑ
j=1
j=1
Daraus berechnen wir den Likelihoodquotienten
L x (ϑ 1 ) ϑ 0n
=
1[0,ϑ0 ] (T (x )) + ∞1(ϑ0 ,ϑ1 ] (T (x ))
R(x ) =
L x (ϑ 0 ) ϑ 1n
ϑn
Somit ist c = ϑ0n der kritische Wert.
1
Es gilt {R(x ) = c} = {T (x ) ≤ ϑ 0 } und Pϑ0 [R(X ) > c] = 0, Pϑ0 [T (X ) ≤ ϑ 0 ] = 1.
Nun definieren wir den Test


1




φ (x ) = γ (x )



0

, falls R(x ) > c,
, falls R(x ) = c,
, falls R(x ) < c.
= 1 {T (x ) >ϑ0 } + γ (x ) 1 {T (x ) ≤ϑ0 } ,
d.h. für T (x ) > ϑ 0 ist φ (x ) = 1 und die Nullhypothese wird abgelehnt.
√
Nun ist noch γ so zu bestimmen, dass Eϑ0 [φ (X )] = α ist. Wir setzen dazu k = ϑ 0 n α und

 1 , falls T (x ) < k,
γ (x ) = 
 0 , falls T (x ) ≥ k.

Dann gilt
Eϑ0 [φ (X )] = Eϑ0 [1 {T (X ) >ϑ0 } ] + Eϑ0 [1 {T (X ) <k } ]
= Pϑ0 [T (X ) > ϑ 0 ] + Pϑ0 [T (X ) < k]
√
= Pϑ0 [T (X ) < ϑ 0 n α]
Z ϑ0 √n α
t n −1
=
n n 1[0,ϑ0 ] (t ) dt
ϑ0
0
√
n
t=ϑ
0 α
n 1 n
= n t
ϑ0 n
t=0
= α.
Nach Satz 8.12 ist φ dann also gleichmäßig bester Schätzer zum Niveau α.
3
Aufgabe 5
Es soll zu einem Signifikanzniveau von 10% untersucht werden, ob sich der Mietpreis pro Quadratmeter
für Ein- und Zweizimmerwohnungen signifikant unterscheidet. Hierzu wurden die folgenden Stichproben
(von Quadratmeterpreisen) erhoben:
X
Y
Einzimmerwohnung
Zweizimmerwohnung
7.448
4.718
8.767
12.382
9.770
5.654
7.280
7.269
9.217
9.698
8.645
10.002
8.353
5.193
8.706
7.808
5.188
7.648
12.991
Führen Sie einen Mann-Whitney-Wilcoxon Test durch.
Lösung:
Korrektur der Aufgabe: Wir rechnen mit α = 5%!!!! (Dafür haben wir die passende Tabelle im SkriptAnhang verfügbar.)
Wir wollen die Nullhypothese PX = PY gegen die Alternative, dass PX stochastisch größer ist als PY ,
testen. Aus der Tabelle ergibt sich das 95%-Quantil von MWU10,9 : c = Q 0.95 (MWU10,9 ) = 65. Als Test
legen wir also fest: φ = 1 genau dann, wenn U10,9 > 65. Um die Rangsumme W10,9 zu bestimmen, sortieren
wir die Daten der Größe nach und unterstreichen die Zahlen, die vom Typ X stammen.
Rang
Wert
1
4.718
2
5.188
3
5.193
4
5.654
5
7.269
6
7.280
7
7.448
Rang
Wert
11
8.645
12
8.706
13
8.767
14
9.217
15
9.698
16
9.770
17
10.002
8
7.648
9
7.808
18
12.991
10
8.353
19
12.382
Wir erhalten als Rangsumme
W10,9 = 2 + 6 + 7 + 10 + 11 + 12 + 13 + 14 + 16 + 18 = 109.
Hieraus ergibt sich für die U-Statistik
U10,9 = W10,9 −
10 · 11
= 109 − 55 = 54 < 65.
2
Also kann die Nullhypothese nicht zum Niveau 5% verworfen werden.
4
Herunterladen