Kapitel 1 : Matrizenrechnung – Einführung Motivation Beispiel 1.1 Daten zur Unterernährung in Sambia • Zielvariable: Ernährungszustand eines Kindes, gemessen als Z-Score • Kovariablen: – Alter des Kindes in Monaten → ai – BMI der Mutter → BMIi 0 weiblich – Geschlecht des Kindes → gi = 1 männlich • Gemessene Kovariablenwerte bei einer Stichprobe von 4 Kindern: Seite 1 Wie können diese Werte zusammengefasst werden? • Pro Kind: • Pro Merkmal: • Alle Werte: Die geordneten Tupel x1, . . . , x4 heißen Vektoren, das Schema X heißt Matrix. Seite 2 1.1 Vektoren im Rn Definition 1.1 x .1 . Die Menge aller n-Tupel x = . reeller Zahlen x1, . . . , xn xn wird n-dimensionaler Vektorraum über Rn genannt. Die Zahlen x1, . . . , xn heißen auch Skalare. Für Vektoren x ∈ Rn und y ∈ Rn sowie für den Skalar λ ∈ R lassen sich folgende Operationen definieren: (i) Vektoraddition (ii) Skalarmultiplikation Seite 3 Geometrische Veranschaulichung • Vektor im R2 • Vektoraddition im R2 • Skalarmultiplikation im R2 Seite 4 Besondere Vektoren: • Nullvektor: • Einsvektor: Bemerkung Der Einsvektor spielt in der Regressionsanalyse eine wichtige Rolle, er wird als “Kovariable” für den Intercept eingesetzt: Beispiel 1.2 (Fortsetzung von Beispiel 1.1) zi = β0 + β1ai + εi mit εi ∼ N (0, σ 2) für i = 1, . . . , n Seite 5 Satz 1.1 Rechenregeln im Rn Für beliebige Vektoren x, y, z ∈ Rn und Skalare λ, µ ∈ R gelten die folgenden Rechenregeln: 1. x + (y + z) = (x + y) + z 2. x + y = y + x 3. x + 0 = x 4. x + (−x) = 0 5. (λ + µ)x = λx + µx λ(x + y) = λx + λy 6. (λµ)x = λ(µx) 7. 1 · x = x Definition 1.2 Das Skalarprodukt hx, yi der Vektoren x, y ∈ Rn ist definiert als: hx, yi = x1y1 + x2y2 + . . . + xnyn Zwei Vektoren heißen orthogonal, wenn gilt: hx, yi = 0 Seite 6 Geometrische Veranschaulichung Bemerkung Der Raum Rn versehen mit der Vektoraddition, der Skalarmultiplikation und dem Skalarprodukt heißt euklidischer (Vektor-)Raum. Definition 1.3 Gegeben seien x, y ∈ Rn. Der (euklidische) Abstand d(x, y) zwischen den Punkten x und y ist definiert als p d(x, y) = (x1 − y1)2 + (x2 − y2)2 + . . . + (xn − yn)2 p = hx − y, x − yi Die (euklidische) Länge kxk ist definiert als q p 2 2 kxk = x1 + . . . + xn = hx, xi Seite 7 Geometrische Veranschaulichung Seite 8