Tutorium zu Statistik 3 im Nebenfach Nora Fenske Übungsblatt 7 WiSe 2009/10 Aufgabe 29: Richtig oder falsch? (a) Für Matrizen A und B passender Ordnung gilt: Aus A · B = 0 folgt, dass A = 0 oder B = 0 gelten muss. (b) Sei 1n = (1, . . . , 1)0 der n-dimensionale Einsvektor. Dann gilt: 10n In 1n = n. (c) Ein Lineares Gleichungssystem hat entweder genau eine oder unendlich viele Lösungen. (d) Im R3 sind höchstens drei Vektoren linear unabhängig. (e) Sei A eine (5 × 5)-Matrix. Eine Inverse A−1 existiert genau dann, wenn gilt: rg(A) = 5. (f) Sei A eine symmetrische und invertierbare (m × m)-Matrix, dann gilt: Es lassen sich mehrere Matrizen A−1 finden, für die AA−1 = I gilt. Aufgabe 30: In dieser Aufgabe soll für zwei 7-jährige Kinder der Süßigkeitenkonsum in Gramm (Sg) in Abhängigkeit vom wöchentlichen Taschengeld in Euro (TGeuro) sowie vom wöchentlichen Taschengeld in Cent (TGcent) untersucht werden. Das erste Kind bekommt 1e und isst im Durchschnitt 530g Süßigkeiten pro Woche, das zweite Kind bekommt 2e und isst etwa 750g. Es wird das folgende Regressionsmodell betrachtet: Sgi = β0 + β1 TGeuroi + β2 TGcenti + εi mit εi ∼ N(0, σ 2 ) für i ∈ {1, 2} . Stellen Sie für dieses Modell die Designmatrix X auf. Berechnen Sie dann die Matrix X 0 X und ihren Rang. Ist diese Matrix invertierbar? Halten Sie dieses Modell für sinnvoll? Aufgabe 31: Für den Mietspiegel in Entenhausen (siehe auch Aufgabe 7) wurde als eine der Kovariablen die Wohnlage betrachtet. Diese kategoriale Variable, im Folgenden bezeichnet mit lage, wird wie folgt kodiert: 1 = normale Lage, 2 = gute Lage und 3 = beste Lage. Datum: 10.12.2009 Seite 1 Gegeben seien die folgenden sieben Beobachtungen i für die Wohnlage: i 1 2 3 4 5 6 7 lage 1 2 3 1 1 2 2 (a) Bilden Sie aus der Variablen lage mit Hilfe von Dummy-Kodierung die drei möglichen Dummy-Variablen lage1 , lage2 und lage3 . Zeigen Sie dann, dass lage1 , lage2 und lage3 und der Einsvektor 1 linear abhängig sind. Inwiefern könnte sich das in der Regression problematisch auswirken? (b) Berechnen Sie das Produkt X 0 X, wobei X die Designmatrix ist, die den Einsvektor 1 sowie die Beobachtungen zu lage1 , lage2 und lage3 enthält. Bestimmen Sie dann den Rang der Matrix X 0 X. Was kann daraus über die Matrix X 0 X geschlossen werden? (c) Beziehen Sie sich jetzt auf die beste Wohnlage als Referenzkategorie und nehmen Sie die Dummy-Variable lage3 aus der Designmatrix. Zeigen Sie, dass die übrigen Variablen lage1 , lage2 und der Einsvektor 1 linear unabhängig sind. Berechnen Sie außerdem die 0 X Matrix X−3 −3 sowie ihren Rang. (Die Matrix X−3 entspricht dabei der Designmatrix X ohne die Variable lage3 .) Warum eignet sich dieses Vorgehen für die Regression besser als dasjenige in (a)? Aufgabe 32: Betrachtet wird das folgende LGS aus der linearen Einfachregression: ! β̂0 0 XX = X 0y β̂1 wobei 1 x1 X = (1, x) = ... 1 xn X 0X = P n P xi x2i xi P P X 0y = P yi . x i yi Unter welchen Bedingungen lässt sich die Lösung wie folgt darstellen? ! β̂0 = (X 0 X)−1 X 0 y β̂1 Geben Sie ein Beispiel für den Fall der Nichtlösbarkeit an. Datum: 10.12.2009 Seite 2