Übungsblatt 11 zur Vorlesung ”Einführung in die Statistik”

Werbung
Übungsblatt 11 zur Vorlesung ”Einführung in die Statistik”
Seite 1 von 5
Übungsblatt 11 zur Vorlesung ”Einführung in die
Statistik”
Olivier Warin
5. Dezember 2012
Aufgabe 75 [NP-Lemma im diskreten Fall]
Herr Meier besucht einen Banker an der Bahnhofstrasse in Zürich. Herr Meier sagt, dass er eine Software
entwickelt hat, mit der er in 60% der Fälle korrekt voraussagen kann, ob der CHF / $-Kurs morgen höher
oder tiefer liegt als heute (gleichen Kurs schliessen wir aus). Der Banker will Herrn Meier während 10
Handelstagen testen. Für den Banker kann man gerade so gut eine Münze werfen, um zu prognostizieren,
ob der Kurs morgen höher oder tiefer liegt.
a) Sei θ die Wahrscheinlichkeit, dass die Software von Herr Meier richtig liegt. Setze n := 10, α := 0.05,
θ0 := 0.5 und θ1 := 0.6. Seien weiter für i = 1, . . . , n
®
1, falls Herr Meiers Software am Tag i richtig liegt
Xi :=
0, sonst.
Wir nehmen an, dass die Xi ’s unabhängig sind.
Wir wollen nun mit Hilfe des Lemmas von Neyman-Pearson (Satz 6.3) die Hypothesen H0 : θ = θ0
vs. H1 : θ = θ1 auf dem α-Niveau testen. Nach Vorlesung (genauer nach Gleichung (6.2)) müssen
wir dazu K 0 ∈ N und γ ∈ [0, 1) finden, mit
" n
#
" n
#
X
X
0
0
P0
Xi > K + γP0
Xi = K = α.
i=1
i=1
Pn
Unter der H0 -Hypothese hat i=1 Xi eine Bin(n, θ0 )-Verteilung. Es gilt also
" n
#
X
P0
Xi > 7
=
˙ pbinom(7,10,0.5,lower.tail=FALSE) =
˙ 0.05468750 > α
R
i=1
P0
" n
X
i=1
R
#
Xi > 8
=
˙
pbinom(8,10,0.5,lower.tail=FALSE) =
˙ 0.01074219 < α.
R
R
Wir schliessen: K 0 = 8 und
P
α − P0 [ ni=1 Xi > K 0 ]
Pn
=
˙ (0.05 - pbinom(8,10,0.5,FALSE))/dbinom(8,10,0.5)
γ =
R
P0 [ i=1 Xi = K 0 ]
=
˙ 0.8933333.
R
Nach dem Lemma von Neyman-Pearson (Satz 6.3) lautet unser Test also wie folgt ((x1 , . . . , xn ) sei
dabei eine entsprechende Stichprobe)):
P
• Falls ni=1 xi > K 0 = 8, lehne H0 ab.
P
• Falls ni=1 xi = K 0 = 8, lehne H0 mit Wahrscheinlichkeit γ =0.8933333
˙
ab.
Pn
0
• Falls i=1 xi < K = 8, lehne H0 nicht ab.
b) Herr Meier hat noch einen Bruder. Der sagt in genau 20% der Fälle korrekt voraus, ob der Kurs
sinkt oder steigt. Nehmen wir an, dass er das wirklich kann. Der Banker kann dies nun geschickt
einsetzen indem er immer das Gegenteil annimmt, was der Bruder von Herrn Meier sagt. Somit
weiss der Banker in 80% der Fälle ob der Kurs sinkt oder steigt.
Herbstsemester 2012
Olivier Warin
Seite 1 von 5
Übungsblatt 11 zur Vorlesung ”Einführung in die Statistik”
Seite 2 von 5
Aufgabe 76 [NP-Lemma im stetigen Fall]
Ein Hersteller von Glühbirnen behauptet, die von ihnen produzierten Glühbirnen hätten eine durchschnittliche Lebensdauer von 1200 Stunden. Eine Konsumentenschutzorganisation bezweifelt dies. Bevor
sie an die Öffentlichkeit geht, will sie aber mit dem Hersteller zusammen eine zufällige Stichprobe vom
Umfang 3000 ausgiebig testen (brennen lassen bis kaputt). Man einigt sich darauf, davon auszugehen,
dass die Glühbirnen unabhängig voneinander brennen und die Lebensdauer exponentialverteilt modelliert
werden kann.
Seien n := 3000, α := 0.05 und für i = 1, . . . , n sei Xi die Lebensdauer der Glühbirne i (in Stunden).
Nach Obigem, gehen wir davon aus, dass die Xi ’s iid und exponentialverteilt sind. Sei λ > 0, so dass
X1 ∼ Exp(λ).
a) Wir testen nun (auf dem Niveau α) die Hypothesen H0 : E[X1 ] = 1200 bzw. H1 : E[X1 ] = 1000
gegeneinander. Seien λ0 := 1/1200 und λ1 := 1/950.
Da E[X1 ] = 1/λ können wir die Hypothesen H0 und H1 auch wie folgt formulieren:
H0 : λ = λ0 , H1 : λ = λ1 .
Seien f0 , f1 : Rn → R die gemeinsamen Dichten von X1 , . . . , Xn unter H0 bzw. H1 . Es gilt also für
i = 0, 1:
!
n
n
Y
X
q
−λi xk
n
fi (x1 , . . . , xn ) =
λi e
= λi exp −λi
xk
(x1 , . . . , xn > 0).
k=1
k=1
Wir schliessen: Für K > 0 und x1 , . . . , xn > 0 gilt:
n
X
λn
f1 (x1 , . . . , xn )
> K ⇔ 1n exp (λ0 − λ1 )
xk
f0 (x1 , . . . , xn )
λ0
!
>K ⇔
k=1
n
X
xk <
k=1
log(Kλn0 λ−n
1 )
.
λ0 − λ1
log(Kλn λ−n )
0 1
. Nach dem Lemma von Neyman-Pearson (Satz 6.1) müssen wir
Wir setzen also K 0 :=
λ0 −λ1
0
also K > 0 so bestimmen, dass gilt:
#
" n
X
0
Xk < K = α.
P0
k=1
Nach 4.3.3 hat unter der H0 -Hypothese
Pn
k=1
Xk eine Gamma(n, λ0 )-Verteilung. Wir schliessen:
K0 =
˙ qgamma(0.05,3000,1/1200) =
˙ 3492576.
R
R
Unser Test (nach dem Lemma von Neyman-Pearson) lautet also wie folgt ((x1 , . . . , xn ) sei dabei
eine entsprechende Stichprobe):
P
• Falls nk=1 xk < K 0 =3492576
˙
lehne H0 ab.
Pn
0
• Falls k=1 xk > K =3492576
˙
lehne H0 nicht ab.
b) In der darauffolgenden Untersuchung erhielt man eine durchschnittliche Brenndauer von 1167.5
Stunden. Wir bezeichnen die durch diese Untersuchung erhaltene Stichprobe mit (x1 , . . . , xn ). Es
n
P
xk = 1167.5. Wir schliessen:
gilt also n1
k=1
n
X
xk = n · 1167.5 = 3502500 > K 0 =
˙ 3492576.
k=1
Also nehmen wir, nach dem Test aus a), die Hypothese H0 an. Also raten wir als statistischer Consultant der Konsumentenschutzorganisation, dass sie mit ihrer Vermutung nicht an die Öffentlichkeit
gehen soll bzw. sie soll gegen den Hersteller keine Klage erheben.
Aufgabe 77 [Ist die Varianz gleich σ02 oder grösser?]
Seien X1 , . . . , Xn iid Zufallsgrössen mit X1 ∼ N (µ, σ 2 ). Sei weiter σ0 := 1. Wir wollen nun die zwei
Hypothesen
H0 : σ 2 = σ02 , H1 : σ 2 > 1
Herbstsemester 2012
Olivier Warin
Seite 2 von 5
Übungsblatt 11 zur Vorlesung ”Einführung in die Statistik”
gegeneinander testen.
Unter H0 hat der Ausdruck
T :=
Seite 3 von 5
n
1 X
(Xi − X)2
σ02 i=1
eine χ2n−1 -Verteilung. Wir benutzen nun, wie in 6.4.1, dieses T als Teststatistik.
Den Ablehnungsbereich wählen wir dabei wie in der folgenden Skizze (des Graphen der Dichte von
T ) angedeutet (hier mit n = 50):
Damit unser Test das Niveau 10% =: α hat, müssen wir dabei K so wählen, dass die schraffierte Fläche
den Flächeninhalt α hat.
5
10
15
20
> mytest <− function ( x , sigma02 =1, a l p h a =0.1){
+ n <− length ( x ) #Umfang der Stichprobe
+ K <− qchisq(1− alpha , n−1)
+ t <− ( 1 /sigma02 ) ∗ ( n−1)∗var ( x ) #Wert der Teststatistik
+ i f ( t > K) {
+
cat ( ’ Wir nehmen H_1 an , d . h . sigma ^2>1, da t = ’ , t , ’> K = ’ , K, ’ \n ’ )
+ }
+ else {
+
cat ( ’ Wir nehmen H_0 an , d . h . sigma ^2=1, da t = ’ , t , ’<= K = ’ , K, ’ \n ’ )
+
}
+ }
>
> f o r ( i i n c ( 1 : 5 ) ) { #Wiederhole das Folgende fuenfmal.
+ mytest (rnorm ( 5 0 , 2 0 0 9 , sqrt ( 1 . 1 ) ) )
+ }
Wir nehmen H_0 an , d . h . sigma ^2=1, da t = 5 7 . 9 2 0 6 1 <= K = 6 2 . 0 3 7 5 4
Wir nehmen H_1 an , d . h . sigma ^2>1, da t = 7 1 . 0 9 4 6 4 > K = 6 2 . 0 3 7 5 4
Wir nehmen H_0 an , d . h . sigma ^2=1, da t = 5 5 . 7 8 9 9 2 <= K = 6 2 . 0 3 7 5 4
Wir nehmen H_0 an , d . h . sigma ^2=1, da t = 5 6 . 9 8 3 4 2 <= K = 6 2 . 0 3 7 5 4
Wir nehmen H_0 an , d . h . sigma ^2=1, da t = 5 3 . 1 8 2 7 4 <= K = 6 2 . 0 3 7 5 4
>
Aufgabe 78 [Sind die Varianzen von 2 unabhängigen Stichproben gleich?]
2
Seien X1 , . . . , Xm , Y1 , . . . , Yn unabhängige Zufallsgrössen mit Xi ∼ N (µX , σX
) und Yj ∼ N (µY , σY2 ) (für
alle i, j). Wir wollen nun die zwei Hypothesen
2
H 0 : σX
= σY2 , H1 : σX 6= σY
gegeneinander testen.
Unter H0 hat der Ausdruck
T :=
1
m−1
1
n−1
Pm
− X)2
Pn
− Y )2
i=1 (Xi
i=1 (Yi
eine Fm−1,n−1 -Verteilung. Wir benutzen nun, wie in 6.4.2, dieses T als Teststatistik.
Den Ablehnungsbereich wählen wir dabei wie in der folgenden Skizze (des Graphen der Dichte von
T ) angedeutet (hier mit m = 70 und n = 10):
Herbstsemester 2012
Olivier Warin
Seite 3 von 5
Übungsblatt 11 zur Vorlesung ”Einführung in die Statistik”
Seite 4 von 5
Damit unser Test das Niveau 10% =: α hat, müssen wir dabei K1 und K2 so wählen, dass der Flächeninhalt der schraffierten Fläche genau α beträgt.
Wir wählen dazu K1 und K2 so, dass die linke und die rechte schraffierte Fläche jeweils einen Flächeninhalt von α/2 hat.
5
10
15
20
25
30
> mytest <− function ( x , y , a l p h a =0.1) {
+ m <− length ( x ) #Umfang der Stichprobe x
+ n <− length ( y ) #Umfang der Stichprobe y
+ K1 <− qf ( a l p h a / 2 ,m−1,n−1)
+ K2 <− qf (1− a l p h a / 2 ,m−1,n−1)
+ t <− var ( x ) /var ( y ) #Wert der Teststatistik
+ i f ( t < K1 | | t > K2) {
+
cat ( ’ Nehme H_1 an , d . h . Varianzen n i c h t g l e i c h . \n ’ )
+ }
+ else {
+
cat ( ’ Nehme H_0 an , d . h . Varianzen g l e i c h . \n ’ )
+ }
+ cat ( ’ (K1 = ’ ,K1 , ’ , t = ’ , t , ’ , K2 = ’ ,K2 , ’ ) \ n ’ )
+ }
>
> x <− rnorm ( 7 0 , 2 0 0 9 , 1 )
> y1 <− rnorm ( 1 0 , 2 0 1 0 , sqrt ( 1 . 1 ) )
> y2 <− rnorm ( 1 0 0 , 2 0 1 1 , sqrt ( 1 . 1 ) )
> y3 <− rnorm( 1 0 0 0 , 2 0 1 2 , sqrt ( 1 . 1 ) )
>
> mytest ( x , y1 )
Nehme H_0 an , d . h . Varianzen g l e i c h .
(K1 = 0 . 4 9 5 3 8 4 1 , t = 1 . 6 0 2 1 4 7 , K2 = 2 . 7 7 6 9 8 9 )
> mytest ( x , y2 )
Nehme H_0 an , d . h . Varianzen g l e i c h .
(K1 = 0 . 6 8 8 0 0 6 7 , t = 0 . 9 2 3 4 9 8 , K2 = 1 . 4 3 3 3 8 2 )
> mytest ( x , y3 )
Nehme H_0 an , d . h . Varianzen g l e i c h .
(K1 = 0 . 7 3 1 5 6 6 1 , t = 1 . 0 0 8 7 3 4 , K2 = 1 . 3 0 9 9 2 8 )
>
Bemerkung: Es fällt auf, dass wir bei allen drei Stichproben einen Fehler 2. Art gemacht haben. Dies
kommt dadurch zustande, dass der Umfang der Stichproben zu klein ist, um die kleine Differenz 1.1 − 1 =
0.1 der Varianzen zu bemerken.
Aufgabe 79 [Erwartungswert gleich µ0 bei unbekannter Varianz?]
Seien X1 , . . . , Xn iid Zufallsgrössen mit X1 ∼ N (µ, σ 2 ). Sei weiter µ0 := 11. Wir wollen nun die zwei
Hypothesen
H0 : µ = µ0 , H1 : µ 6= µ0
gegeneinander testen.
Unter H0 hat der Ausdruck
T := »
Herbstsemester 2012
1
n(n−1)
X − µ0
Pn
2
i=1 (Xi − X)
Olivier Warin
Seite 4 von 5
Übungsblatt 11 zur Vorlesung ”Einführung in die Statistik”
Seite 5 von 5
eine tn−1 -Verteilung. Wir benutzen nun, wie in 6.4.3, dieses T als Teststatistik.
Den Ablehnungsbereich wählen wir dabei wie in der folgenden Skizze (des Graphen der Dichte von
T ) angedeutet (hier mit n = 30):
Damit unser Test das Niveau 5% =: α hat, müssen wir dabei K so wählen, dass der Flächeninhalt der
schraffierten Fläche genau α beträgt. Wir wählen dazu K so, dass die rechte (und die linke) schraffierte
Fläche den Flächeninhalt α/2 hat.
5
10
15
> mytest <− function ( x , mu0=11 , a l p h a =0.05) {
+ n <− length ( x ) #Umfang der Stichprobe
+ t <− (mean( x)−mu0) /sqrt ( var ( x ) /n ) #Wert der Teststatistik
+ K <− qt(1− a l p h a / 2 , n−1)
+ i f ( abs ( t ) > K) {
+
cat ( "Nehme H_1 an , d . h . Erwartungswert n i c h t g l e i c h mu0 . \ n" )
+ }
+ else {
+
cat ( "Nehme H_0 an , d . h . Erwartungswert g l e i c h mu0 . \ n" )
+ }
+ cat ( " (K = " ,K, " , t =" , t , " ) \ n" )
+ }
>
> x <− rnorm ( 3 0 , 1 2 , sqrt ( 3 0 ) )
> mytest ( x )
Nehme H_0 an , d . h . Erwartungswert g l e i c h mu0 .
(K = 2 . 0 4 5 2 3 0 , t = 0 . 8 4 0 3 7 3 7 )
>
Herbstsemester 2012
Olivier Warin
Seite 5 von 5
Herunterladen