Lösung Blatt 10 - Luchsinger Mathematics AG

Werbung
Dr. Christof Luchsinger
Übungsblatt 10 zur Vorlesung
”Statistische Methoden”
Einfache Regression
Herausgabe des Übungsblattes: Woche 19, Abgabe der Lösungen: Woche 20 (bis Freitag, 1615 Uhr), Besprechung: Woche 21
Must
Aufgabe 49 [Simulation einer Regression]
a) Sei xi := i, 1 ≤ i ≤ 100, eine feste Folge von erklärenden Daten (äquidistant). Es gelte
Yi = β0 + β1 xi + i ,
wobei ∼ N (0, 2) iid. Nehmen Sie β0 = 1 und für β1 nehmen Sie Ihre PN. Generieren Sie jetzt einen Vektor
(yi )100
i=1 .
b) Schätzen Sie jetzt β0 , β1 und die Varianz von mit R, indem Sie eine OLS-Schätzung machen.
c) Vertauschen Sie die Rollen von x und y und machen Sie nochmals eine OLS-Regression. Vergleichen Sie
die Resultate von b) und c).
Standard
Aufgabe 50 [Aufspaltung der Variation in den y] [3 Punkte]
Beweisen Sie mit der Notation aus 7.1.2, dass gilt
n
n
n
X
X
X
(yi − ȳ)2 =
(ŷi − ȳ)2 +
(yi − ŷi )2 .
i=1
i=1
i=1
Aufgabe 51 [Erwartungstreue Schätzer bei OLS] [2+1 Punkte]
Beweisen Sie, dass die Schätzer
β̂1 =
SSxy
SSxx
und
β̂0 = ȳ − β̂1 x̄
erwartungstreu sind. Tipps: Schätzer werden normalerweise auf der Ebene der Stichproben definiert. Um die
Erwartungstreue zu überprüfen, müssen Sie auf die Ebene der Zufallsgrössen wechseln (y durch Y ersetzen)
und mit Formel (7.1) arbeiten.
Aufgabe 52 [yi = β0 + i ] [1+1+1 Punkte]
Das Modell
Yi = β0 + i
ist offenbar ein Spezialfall von (7.1). Berechnen Sie in diesem Modell die OLS-Schätzung von β0 und die
ML-Schätzungen von β0 und σ 2 := V [i ].
Frühjahrsemester 2011
Olivier Warin
Seite 1 von 8
Dr. Christof Luchsinger
Aufgabe 53 [Testen, ob β1 = 0, β1 = P N ] [1+2 Punkte]
Testen Sie in der Situation von Aufgabe 49 (mit den dort erzeugten Daten), ob
a) β1 = 0 und
b) β1 = P N , wobei das P N das richtige (und uns in der Simulation ja bekannte) β1 ist.
Wir geben hier kein Signifikanzniveau vor. Geben Sie den P-Wert an, d.h. sagen Sie, bis zu welchem
Signifikanzniveau die H0 -Hypothese noch aufrecht erhalten wird.
Honours
Aufgabe 54 [Test, ob β0 = 0] [5 Punkte]
In 7.1.3 haben wir einen Test entwickelt, ob β1 = 0 oder nicht. Entwickeln Sie jetzt mit analogen Überlegungen einen Test für die Frage ob β0 = 0 oder nicht.
Frühjahrsemester 2011
Olivier Warin
Seite 2 von 8
Übungsblatt 10 zur Vorlesung “Statistische Methoden”
Seite 3 von 8
Übungsblatt 10 zur Vorlesung “Statistische Methoden”
Olivier Warin
22. Mai 2011
Aufgabe 49 [Simulation einer Regression]
5
10
15
20
25
> #Teilaufgabe a):
> PN <− 2
> N <− 100
> sigma <− sqrt ( 2 )
> b e t a 0 <− 1
> b e t a 1 <− PN
> x <− 1 :N
> y <− b e t a 0 + b e t a 1 ∗x + rnorm(N, 0 , sigma )
>
> #Teilaufgabe b):
> #Zuerst von Hand:
> SSxx <− sum( ( x−mean( x ) ) ^ 2 )
> SSxy <− sum( ( x−mean( x ) ) ∗ ( y−mean( y ) ) )
> b e t a 1 h u t <− SSxy/SSxx
> b e t a 0 h u t <− mean( y ) − b e t a 1 h u t ∗mean( x )
> yhut <− b e t a 0 h u t + b e t a 1 h u t ∗x
> sigma2hut <− 1/ (N−2)∗sum( ( y − yhut ) ^ 2 )
> beta0hut
[ 1 ] 0.998394
> beta1hut
[ 1 ] 2.001701
> sigma2hut
[ 1 ] 2.204446
> sqrt ( sigma2hut ) #(weil R die Standardabweichung angibt)
[ 1 ] 1.484738
> #Nun noch direkt mit R:
> mydata <− data . frame ( x , y )
> r e g r <− lm( y~x , mydata )
> summary( r e g r )
30
Call :
lm( formula = y ~ x , data = mydata )
35
40
45
Residuals :
Min
1Q
−3.44556 −1.00851
Median
0.02655
3Q
0.87074
Max
3.76095
Coefficients :
Estimate Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 0.998394
0.299189
3 . 3 3 7 0 . 0 0 1 2 0 ∗∗
x
2.001701
0 . 0 0 5 1 4 4 3 8 9 . 1 6 8 < 2 e −16 ∗∗∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
R e s i d u a l s t a n d a r d e r r o r : 1 . 4 8 5 on 98 d e g r e e s o f freedom
M u l t i p l e R−s q u a r e d : 0 . 9 9 9 4 ,
Adjusted R−s q u a r e d : 0 . 9 9 9 3
Fr
>hjahrsemester 2011
Olivier Warin
Seite 3 von 8
Übungsblatt 10 zur Vorlesung “Statistische Methoden”
50
55
F− s t a t i s t i c : 1 . 5 1 5 e+05 on 1 and 98 DF, p−v a l u e : < 2 . 2 e −16
> #Das Resultat ist also dasselbe wie von Hand> plot ( x , y )
> abline ( r e g r )
>
> #Teilaufgabe c):
> r e g r c <− lm( x~y , mydata )
> regrc
Call :
lm( formula = x ~ y , data = mydata )
Coefficients :
( Intercept )
−0.4658
60
65
70
Seite 4 von 8
y
0.4993
> b e t a 1 h u t_c <− sum( ( x−mean( x ) ) ∗ ( y−mean( y ) ) ) /sum( ( y−mean( y ) ) ^ 2 )
> b e t a 0 h u t_c <− mean( x ) − b e t a 1 h u t_c∗mean( y )
> b e t a 0 h u t_c
[ 1 ] −0.4657943
> b e t a 1 h u t_c
[ 1 ] 0.4992521
>
> #Zum Vergleich:
> −b e t a 0 h u t / b e t a 1 h u t
[ 1 ] −0.4987728
> 1/ b e t a 1 h u t
[ 1 ] 0.4995752
>
100
0
50
y
150
200
Diese R-Session hat noch den foglenden Plot erzeugt:
0
20
40
60
80
100
x
Frühjahrsemester 2011
Olivier Warin
Seite 4 von 8
Übungsblatt 10 zur Vorlesung “Statistische Methoden”
Seite 5 von 8
Aufgabe 50 [Aufspaltung der Variation in den y]
Behauptung: In den Notationen aus 7.1.2 gilt
n
n
n
X
X
X
(yi − y)2 =
(ŷi − y)2 +
(yi − ŷi )2 .
i=1
i=1
i=1
Beweis: Nach 7.1.2 gilt
n
X
i=1
(yi − β̂0 − β̂1 xi ) = 0 und
n
X
i=1
xi (yi − β̂0 − β̂1 xi ) = 0.
(∗)
Daraus schliessen wir
0 = β̂0
n
n
n
X
X
X
(yi − β̂0 − β̂1 xi ) + β̂1
xi (yi − β̂0 − β̂1 xi ) =
(yi − β̂0 − β̂1 xi )(β̂0 + β̂1 xi )
i=1
i=1
i=1
n
n
X
X
=
(yi − ŷi )ŷi =
(yi ŷi − ŷi2 ).
i=1
i=1
Diese
Pn Gleichung
Pn werden wir gleich noch benutzen. Wenn wir noch beachten, dass aus (∗) sofort folgt
ŷ
=
i
i=1
i=1 yi , können wir nämlich schliessen
n
n
n
n
n
n
n
X
X
X
X
X
X
X
(yi − ŷi )2 =
yi2 +
y 2 − 2y
ŷi + 2
ŷi2 − 2
yi ŷi
(ŷi − y)2 +
i=1
i=1
=
i=1
i=1
i=1
i=1
n
X
n
X
n
X
n
X
yi2 +
i=1
i=1
y 2 − 2y
i=1
yi − 2
i=1
|
i=1
(yi ŷi − ŷi2 )
n
n
X
X
=
(yi + y − 2yyi ) =
(yi − y)2 .
i=1
{z
=0
}
i=1
Dies beweist natürlich die Behauptung.
Aufgabe 51 [Erwartungstreue Schätzer bei OLS]
Behauptung: Die Schätzer (in der Situation und den Notationen aus der Vorlesung)
β̂1 =
SSxy
und β̂0 = y − β̂1 x
SSxx
sind erwartungstreu.
Beweis: Da E[Yi ] = E[β0 + β1 xi + εi ] = β0 + β1 xi und E[Y ] = β0 + β1 x schliessen wir:
Pn
(xi − x)(Yi − Y )
SSxY
i=1
P
E[β̂1 ] = E
= E
n
2
SSxx
i=1 (xi − x)
Pn
n
X
+ β1 xi − (β0 + β1 x))
1
i=1 (xi − x)(β
Pn 0
= Pn
(x
−
x)(E[Y
]
−
E[Y
])
=
i
i
2
2
i=1 (xi − x) i=1
i=1 (xi − x)
Pn
(xi − x)2
β1
= Pn i=1
= β1 .
2
i=1 (xi − x)
Dies bedeutet genau, dass β̂1 ein erwartungstreuer Schätzer von β1 ist.
Es folgt:
E[β̂0 ] = E[Y − β̂1 x] = E[Y ] − E[β̂1 ]x = β0 + β1 x − β1 x = β0 .
Also ist β̂0 ein erwartungstreuer Schätzer von β0 .
Frühjahrsemester 2011
Olivier Warin
Seite 5 von 8
Übungsblatt 10 zur Vorlesung “Statistische Methoden”
Seite 6 von 8
Aufgabe 52 [yi = β0 + εi ]
Wir vereinfachen das Modell von der Gleichung (7.1) auf
Yi = β0 + εi ,
wobei ε1 , · · · , εn iid sind mit ε1 ∼ N (0, σ 2 ).
Nun bestimmen bestimmen wir in diesem Modell ein paar Schätzer:
• Zuerst wollen wir den OLS-Schätzer β̂0OLS von β0 bestimmen. Die Schätzung ŷiOLS von yi ist dann
natürlich einfach durch ŷ OLS = β̂0OLS gegeben. Dazu müssen wir die Funktion
n
X
i=1
(yi − β0 )2 = nβ02 − 2nβ0 y +
n
X
i=1
yi2 = n(β0 − y)2 +
n
X
i=1
yi2 − y 2
bezüglich β0 minimieren. In obiger Form können wir die Stelle, an der das Minimum angenommen
wird, gleich ablesen und erhalten so
β̂0OLS = y.
• Jetzt möchten wir den ML-Schätzer β̂0ML von β0 bestimmen. Dazu müssen wir uns die gemeinsame
Dichtefunktion fβ0 von Y1 , . . . , Yn bestimmen. Da Yi = β0 +εi , hat Yi klar eine N (β0 , σ 2 )-Verteilung.
Es folgt
n
Y
1
1
iid
2
√
fβ0 (y1 , . . . , yn ) =
exp − 2 (x − β0 ) .
2σ
2πσ 2
i=1
Da wir uns bei der ML-Schätzung nur für die Stelle des Maximums (bezüglich β0 ) interessieren,
können wir gerade so gut den Logarithmus davon betrachten:
log fβ0 (y1 , . . . , yn ) = −
n
n
1 X
n
log(2π) − log(σ 2 ) − 2
(yi − β0 )2 .
2
2
2σ i=1
Für die Stelle des Maximums bezüglich β0 sind die Summanden, die nicht von β0 abhängen, natürlich
irrelevant. Ausserdem spielt der Faktor 2σ1 2 (> 0) natürlich auch keine Rolle. Daher reicht es wenn
wir die Maximumsstelle der Funktion
−
n
X
i=1
(yi − β0 )2
bestimmen. Bis auf das Vorzeichein ist das genau die gleiche Funktion, wie diejenige die wir für β̂0OLS
minimiert haben. Wegen dem anderen Vorzeichen wird natürlich aus dem Minimum ein Maximum.
Wir schliesen also
β̂0ML = β̂0OLS = y.
ML
• Zum Schluss bestimmen wir noch den ML-Schätzer σˆ2
von σ 2 . Dazu müssen wir fσ2 (y1 , . . . , yn )
2
bzw. log fσ2 (y1 , . . . , yn ) bezüglich σ (und β0 ) maximieren. Nach obigem gilt:
log fσ2 (y1 , . . . , yn ) = −
n
n
1 X
log(2π) − n log(σ) −
(yi − β0 )2 .
2
2σ i=1
Der Summand, der nicht von σ 2 abhängt spielt hier keine Rolle. Ausserdem haben wir oben gezeigt,
dass das Maximum bezüglich β0 unabhänig von σ 2 an der Stelle β0 = y angenommen wird. Aus
Gründen der Bequemlichkeit multiplizieren wir die Funktion auch noch mit 2. Konkret müssen wir
also noch die Funktion
−n log(σ 2 ) −
Frühjahrsemester 2011
n
1 X
Syy
(yi − y)2 = −n log(σ) − 2
2
σ i=1
σ
Olivier Warin
Seite 6 von 8
Übungsblatt 10 zur Vorlesung “Statistische Methoden”
Seite 7 von 8
bezüglich σ 2 minimieren. Ableiten nach σ 2 liefert:
−
Syy
n
+ 2 2.
σ2
(σ )
Ausserdem lautet die zweite Ableitung nach σ 2 :
Syy
n
− 2 2 3.
2
2
(σ )
(σ )
Die Nullstelle (bezüglich σ 2 ) von der ersten Ableitung lautet
σ2 =
Syy
.
n
Wenn wir dies in der zweiten Ableitung einsetzen erhalten wir:
−
n3
< 0,
Syy
also handelt es sich um ein Maximum. Somit kommen wir zu dem folgenden Ergebnis:
n
ML
1
1X
(yi − y)2 .
σˆ2
= Syy =
n
n i=1
Aufgabe 53 [Testen, ob β1 = 0, β1 = PN]
Dies ist die Fortsetzung der R-Session von Aufgabe 49:
5
10
> #Teilaufabe a)
> t <− b e t a 1 h u t /sqrt ( sigma2hut /SSxx )
> pt ( abs ( t ) ,N−2,lower . t a i l =F) #P−Wert
[ 1 ] 2 . 1 2 4 2 1 6 e −158
>
> #Teilaufgabe b)
> t <− ( b e t a 1 h u t − PN) /sqrt ( sigma2hut /SSxx )
> pt ( abs ( t ) ,N−2,lower . t a i l =F) #P−Wert
[ 1 ] 0.3707982
>
Wir haben dabei die Teststatistik aus der Vorlesung benutzt.
Aufgabe 54 [Test, ob β0 = 0]
Wir wollen nun in Analogie zu 7.1.3 einen Test entwickeln, ob β0 = 0 oder nicht. Dazu betrachen wir die
Definition von β̂0 :
β̂0 = Y − β̂1 x.
σ2
Wir wissen bereits aus 7.1.3, dass β̂1 eine N β1 , SS
-Verteilung hat. Ausserdem hat Y klar eine
xx
2
N (β0 + β1 x, σn )-Verteilung. Wir schliessen (siehe auch Aufgabe 51)
(SSxx + x2 n)σ 2
β̂0 ∼ N β0 ,
.
nSxx
Pn
1
2
2
Wie in 7.1.3, benutzen wir jetzt die Schätzung σ̂ 2 = n−2
i=1 (yi − ŷi ) für σ . Damit erhalten wir die
folgende Teststatistik
T =q
β̂0
(SSxx +x2 n)σ̂ 2
nSxx
,
welche unter H0 (also β0 = 0) eine tn−2 -Verteilung hat. Wir werden die H0 -Hypothese verwerfen, sobald
diese Teststatistik Werte annimmnt, welche weiter als ein bestimmter kritischer Wert von Null entfernt
sind.
Frühjahrsemester 2011
Olivier Warin
Seite 7 von 8
Übungsblatt 10 zur Vorlesung “Statistische Methoden”
Seite 8 von 8
Bemerkung: In obiger Herleitung haben wir zwei Sachen benutzt, die eigentlich nicht offensichtlich sind:
• Bei der Bestimmung von der Verteilung von β̂0 haben wir Unabhängigkeit von Ȳ und β̂1 benutzt.
Denn sie Summe von zwei normalverteilten Zufallsgrössen ist im Allgemeinen nur dann normalverteilt, wenn die beiden Summanden unabhängig sind. Ausserdem haben wir die Unabhängigkeit
(oder mindestens Unkorreliertheit) benutzt, um die Varianz zu berechnen.
• Das zweite ist das Einsetzen von σ̂ 2 statt σ 2 . Denn auch hier ist a priori die Unabhängigkeit nicht
klar und damit auch nicht die tn−2 -Verteilung.
Im freiwilligen Teil von Kapitel 7 werden wir diesen Test nochmals in einer etwas allgemeineren Situation
sehen. Dort werden sich diese zwei Punkte noch klären.
Frühjahrsemester 2011
Olivier Warin
Seite 8 von 8
Herunterladen