Hochschule RheinMain Prof. Dr. D. Lehmann WS 2016/17 8. Übungsblatt zur Vorlesung Ökonometrie Aufgabe 1 (t-Verteilung): Die t-Verteilung lässt sich auch folgendermassen motivieren: (i) Es sei X1 , X2 , ..., Xn eine Folge von unabhängigen, identisch verteilten Zufallsvariablen mit Erwartungswert µ = E[Xi ] und Varianz σ 2 = V[Xi ] für alle i = 1, 2, ..., n. Nach dem zentralen Grenzwertsatz der Wahrscheinlichkeitstheorie konvergiert dann die Verteilung der Zufallsvariable 1 Pn Pn 1 X − E X i i i=1 n Yn := n ni=1 o1/2 P n V n1 i=1 Xi Pn 1 i=1 Xi − µ n √ = σ/ n gegen eine Standard-Normalverteilung. (ii) Es seien jetzt φ1 , φ2 , ..., φn eine Folge von unabhängigen, identisch normalverteilten Zufallsvariablen mit Erwartungswert µ = E[φi ] und Varianz σ 2 = V[φi ] für alle i = 1, 2, ..., n. Dann ist die Zufallsvariable Pn 1 i=1 φi − µ n √ Yn := σ/ n für jedes n standard-normalverteilt (also nicht erst im Limes für grosse n). (iii) Bei unbekannter Varianz σ 2 der Zufallszahlen φ1 , φ2 , ..., φn kann man die Varianz schätzen mit dem Ausdruck Pn P 1 2 σ̂ 2 := n−1 wobei φ̄ := n1 ni=1 φi (1) i=1 (φi − φ̄) Nun gilt folgende Aussage A(n) für n ≥ 2 (σ̂ ist für n = 1 nicht definiert): Die Zufallsvariable Pn 1 i=1 φi − µ n √ Yn := (2) σ̂/ n ist t-verteilt mit n − 1 Freiheitsgraden oder kurz tn−1 -verteilt. Das heisst, P Yn ∈ (y, y + dy) = ptn−1 (y) dy mit der Dichte (jetzt für tn anstatt tn−1 ) ptn (y) = Γ[(n+1)/2] √ Γ[n/2] πn 1+ n+1 y2 − 2 n Dabei ist die Gamma-Funktion gegeben durch (für t > 0) R∞ Γ(t) = 0 xt−1 e−x dx . (3) In dieser Aufgabe wollen wir die Aussage A(n) für einige Werte von n mit einer R-Simulation überprüfen. Starten Sie dazu eine R-Session und führen Sie folgende Berechnungen durch: a) Legen Sie die Variablen n = 3, N = 10000 und µ = 15 und σ = 2 an und erzeugen Sie dann n × N mit Mittelwert µ und Standardabweichung σ normalverteilte Zufallszahlen. Speichern Sie diese Zufallszahlen in einer Matrix φ1 φ2 · · · φn φn+1 φn+2 · · · φ2n φ2n+1 φ2n+2 · · · φ3n Phi := ∈ RN ×n .. .. .. . . . φ(N −1)n+1 φ(N −1)n+2 · · · φN n b) Benutzen Sie den Befehl rowSums(), um den Vektor 1 φ̄1 (φ + φ + · · · + φ ) 1 2 n n 1 φ̄2 (φ n+1 + φn+2 + · · · + φ2n ) n 1 φ̄3 (φ + φ + · · · + φ ) 2n+1 2n+2 3n MeanPhi = := ∈ RN n .. .. . . 1 φ̄N (φ(N −1)n+1 + φ(N −1)n+2 + · · · + φN n ) n zu generieren. c) Zu gegebenem Datenvektor x = (x1 , · · · , xn ) berechnen die R-Funktionen sd(x) und var(x) exakt die Grössen σ̂ und σ̂ 2 aus Gleichung (1), also (jeweils n − 1 im Nenner, kein n) q Pn Pn 1 1 2 2 und var(x) = n−1 sd(x) = i=1 (xi − x̄) i=1 (xi − x̄) n−1 wobei x̄ := 1 n Pn i=1 xi . Überprüfen Sie das für den Vektor x = (1, 3). d) Machen Sie sich mit dem R-Befehl apply() vertraut. Mit diesem Befehl und der sd()Funktion können Sie auf einfache Weise den Vektor q 1 n−1 Pn 2 i=1 (φ0+i − φ̄1 ) q σ̂1 sd(first row) P n 1 σ̂2 sd(second row) (φ − φ̄2 )2 q n−1 i=1 n+i P σ̂3 sd(third row) n 1 2 SdPhi = := = ∈ RN i=1 (φ2n+i − φ̄3 ) n−1 .. .. . .. . . 0 q σ̂N sd(N th row) Pn 1 2 (φ − φ̄ ) N (N −1)n+i i=1 n−1 erzeugen, wie geht das genau? e) Berechnen Sie nun den Vektor (erinnern Sie sich daran, dass R immer elementweise rechnet, Vektor durch Vektor ist gültige Syntax) Y = MeanPhi − µ √ SdPhi/ n f ) Erstellen Sie schliesslich ein Histogramm der Zahlen Y = (y1 , y1 , · · · , yN ) und plotten Sie in dasselbe Diagramm die entsprechende Dichte der t-Verteilung. Histogramm und Dichte sollten dann also im Wesentlichen übereinstimmen: g) Produzieren Sie das Bild aus Teil (f) für alle Werte von n ∈ {2, 3, ..., 10}. Bemerkung: Insbesondere die Verteilungen t1 = t2−1 und t2 = t3−1 können mitunter sehr grosse, sowohl positive als auch negative, Zahlen produzieren mit spürbarer Wahrscheinlichkeit. Man muss mit den Parametern des hist()-Befehls etwas herumexperimentieren, mal in die Hilfe schauen, damit man auch für n = 2 und n = 3 ein schönes Histogramm bekommt: Im Limes n → ∞ konvergiert die t-Verteilung gegen eine Standard-Normalverteilung.