Blatt 8 - hsrm-mathematik.de

Hochschule RheinMain
Prof. Dr. D. Lehmann
WS 2016/17
8. Übungsblatt zur Vorlesung Ökonometrie
Aufgabe 1 (t-Verteilung): Die t-Verteilung lässt sich auch folgendermassen motivieren:
(i) Es sei X1 , X2 , ..., Xn eine Folge von unabhängigen, identisch verteilten Zufallsvariablen
mit Erwartungswert µ = E[Xi ] und Varianz σ 2 = V[Xi ] für alle i = 1, 2, ..., n. Nach dem
zentralen Grenzwertsatz der Wahrscheinlichkeitstheorie konvergiert dann die Verteilung
der Zufallsvariable
1 Pn
Pn
1
X
−
E
X
i
i
i=1
n
Yn := n ni=1
o1/2
P
n
V n1 i=1 Xi
Pn
1
i=1 Xi − µ
n
√
=
σ/ n
gegen eine Standard-Normalverteilung.
(ii) Es seien jetzt φ1 , φ2 , ..., φn eine Folge von unabhängigen, identisch normalverteilten
Zufallsvariablen mit Erwartungswert µ = E[φi ] und Varianz σ 2 = V[φi ] für alle i =
1, 2, ..., n. Dann ist die Zufallsvariable
Pn
1
i=1 φi − µ
n
√
Yn :=
σ/ n
für jedes n standard-normalverteilt (also nicht erst im Limes für grosse n).
(iii) Bei unbekannter Varianz σ 2 der Zufallszahlen φ1 , φ2 , ..., φn kann man die Varianz
schätzen mit dem Ausdruck
Pn
P
1
2
σ̂ 2 := n−1
wobei φ̄ := n1 ni=1 φi
(1)
i=1 (φi − φ̄)
Nun gilt folgende Aussage A(n) für n ≥ 2 (σ̂ ist für n = 1 nicht definiert): Die Zufallsvariable
Pn
1
i=1 φi − µ
n
√
Yn :=
(2)
σ̂/ n
ist t-verteilt mit n − 1 Freiheitsgraden oder kurz tn−1 -verteilt. Das heisst,
P Yn ∈ (y, y + dy)
= ptn−1 (y) dy
mit der Dichte (jetzt für tn anstatt tn−1 )
ptn (y) =
Γ[(n+1)/2]
√
Γ[n/2] πn
1+
n+1
y2 − 2
n
Dabei ist die Gamma-Funktion gegeben durch (für t > 0)
R∞
Γ(t) = 0 xt−1 e−x dx .
(3)
In dieser Aufgabe wollen wir die Aussage A(n) für einige Werte von n mit einer R-Simulation
überprüfen. Starten Sie dazu eine R-Session und führen Sie folgende Berechnungen durch:
a) Legen Sie die Variablen n = 3, N = 10000 und µ = 15 und σ = 2 an und erzeugen Sie
dann n × N mit Mittelwert µ und Standardabweichung σ normalverteilte Zufallszahlen.
Speichern Sie diese Zufallszahlen in einer Matrix


φ1
φ2
· · · φn
 φn+1
φn+2
· · · φ2n 


 φ2n+1
φ2n+2
· · · φ3n 
Phi := 
 ∈ RN ×n

..
..
.. 

.
.
. 
φ(N −1)n+1 φ(N −1)n+2 · · · φN n
b) Benutzen Sie den Befehl rowSums(), um den Vektor
 


1
φ̄1
(φ
+
φ
+
·
·
·
+
φ
)
1
2
n
n
1
 φ̄2 


(φ
n+1 + φn+2 + · · · + φ2n )
 


n
1
 φ̄3 


(φ
+
φ
+
·
·
·
+
φ
)
2n+1
2n+2
3n
MeanPhi =   := 
 ∈ RN
n
 .. 


..
 . 


.
1
φ̄N
(φ(N −1)n+1 + φ(N −1)n+2 + · · · + φN n )
n
zu generieren.
c) Zu gegebenem Datenvektor x = (x1 , · · · , xn ) berechnen die R-Funktionen sd(x) und
var(x) exakt die Grössen σ̂ und σ̂ 2 aus Gleichung (1), also (jeweils n − 1 im Nenner,
kein n)
q
Pn
Pn
1
1
2
2
und var(x) = n−1
sd(x) =
i=1 (xi − x̄)
i=1 (xi − x̄)
n−1
wobei x̄ :=
1
n
Pn
i=1
xi . Überprüfen Sie das für den Vektor x = (1, 3).
d) Machen Sie sich mit dem R-Befehl apply() vertraut. Mit diesem Befehl und der sd()Funktion können Sie auf einfache Weise den Vektor


q

1
n−1
Pn
2
i=1 (φ0+i − φ̄1 )



 q

σ̂1
sd(first
row)
P


n
1
 σ̂2 

sd(second row)
(φ − φ̄2 )2 
 
 q n−1 i=1 n+i



P
 σ̂3 


 sd(third row) 
n
1
2
SdPhi =   := 
 = 
 ∈ RN
i=1 (φ2n+i − φ̄3 )
n−1
 .. 




..


 . 


..
.


.
0
q


σ̂N
sd(N th row)
Pn
1
2
(φ
−
φ̄
)
N
(N
−1)n+i
i=1
n−1
erzeugen, wie geht das genau?
e) Berechnen Sie nun den Vektor (erinnern Sie sich daran, dass R immer elementweise
rechnet, Vektor durch Vektor ist gültige Syntax)
Y
=
MeanPhi − µ
√
SdPhi/ n
f ) Erstellen Sie schliesslich ein Histogramm der Zahlen Y = (y1 , y1 , · · · , yN ) und plotten
Sie in dasselbe Diagramm die entsprechende Dichte der t-Verteilung. Histogramm und
Dichte sollten dann also im Wesentlichen übereinstimmen:
g) Produzieren Sie das Bild aus Teil (f) für alle Werte von n ∈ {2, 3, ..., 10}.
Bemerkung: Insbesondere die Verteilungen t1 = t2−1 und t2 = t3−1 können mitunter sehr grosse, sowohl positive als auch negative, Zahlen produzieren mit spürbarer
Wahrscheinlichkeit. Man muss mit den Parametern des hist()-Befehls etwas herumexperimentieren, mal in die Hilfe schauen, damit man auch für n = 2 und n = 3 ein
schönes Histogramm bekommt:
Im Limes n → ∞ konvergiert die t-Verteilung gegen eine Standard-Normalverteilung.