Vertiefung Lineare Algebra 1 Schriftliche Unterlagen zur Vorlesung im Wintersemester 2016/17 Franz Pauer c 2016 I NSTITUT F ÜR M ATHEMATIK , U NIVERSIT ÄT I NNSBRUCK KAPITEL 1 Mehr über lineare Funktionen In diesem Kapitel sei K ein Körper. §1. Der Graph einer linearen Funktion Satz 1 : Seien V1 , . . . ,V` Vektorräume über K. Dann wird das kartesische Produkt V1 × · · · ×V` = {(x1 , . . . , x` ) | x1 ∈ V1 , . . . , x` ∈ V` } mit der komponentenweisen Addition (x1 , . . . , x` ) + (y1 , . . . , y` ) := (x1 + y1 , . . . , x` + y` ) und der komponentenweisen Skalarmultiplikation c(x1 , . . . , x` ) := (cx1 , . . . , cx` ) mit c ∈ K ein Vektorraum und heißt der Produktraum von V1 , . . . ,V` . Wenn (v11 , . . . , v1n1 ), . . . , (v`1 , . . . , v`n` ) Basen von V1 , . . . ,V` sind, dann ist ((v11 , 0, . . . , 0), . . . , (v1n1 , 0, . . . , 0), . . . . . . , (0, . . . , 0, v`1 ), . . . , (0, . . . , 0, v`n` )) eine Basis von V1 × · · · ×V` , insbesondere gilt dimK (V1 × · · · ×V` ) = dimK (V1 ) + · · · + dimK (V` ) . Beweis: Es ist leicht zu zeigen, dass V1 × · · · ×V` mit der komponentenweisen Addition und Skalarmultiplikation ein Vektorraum ist. Wir beweisen daher nur, dass ((v11 , 0, . . . , 0), . . . , (0, . . . , 0, v`n` )) eine Basis von V1 × · · · ×V` ist. Wir schreiben x1 ∈ V1 , . . . , x` ∈ V` als Linearkombinationen der Basen (v11 , . . . , v1n1 ), . . . , (v`1 , . . . , v`n` ): n` n1 x1 = ∑ d1i v1i , . . . , x` = ∑ d`i v`i . i=1 i=1 Dann ist (x1 , . . . , x` ) = (x1 , 0, . . . , 0) + · · · + (0, . . . , 0, x` ) n` n1 = ∑ d1i (v1i , 0, . . . , 0) + · · · + ∑ d`i (0, . . . , 0, v`i ) , i=1 i=1 1 2 1. MEHR ÜBER LINEARE FUNKTIONEN also ((v11 , 0, . . . , 0), . . . , (0, . . . , 0, v`n` )) ein Erzeugendensystem von V1 × · · · ×V` . Um die lineare Unabhängigkeit zu zeigen, seien c11 , . . . , c`n` ∈ K mit n` n1 ∑ c1i(v1i, 0, . . . , 0) + · · · + ∑ c`i(0, . . . , 0, v`i) = (0, . . . , 0) . i=1 Dann ist i=1 n` n1 ( ∑ c1i v1i , . . . , ∑ c`i v`i ) = (0, . . . , 0) , i=1 also n1 i=1 n` ∑ c1iv1i = 0 , . . . , ∑ c`iv`i = 0 . i=1 i=1 Da (v11 , . . . , v1n` ), . . . , (v`1 , . . . , v`n` ) Basen von V1 , . . . ,V` sind, folgt c11 = · · · = c`n` = 0, was zu zeigen war. Satz 2 : Es seien V und W Vektorräume über K. Eine Funktion f : V → W ist genau dann linear, wenn der Graph von f ein Untervektorraum des Produktraums V ×W ist. Wenn f linear ist und und (v1 , ..., vn ) eine Basis von V ist, dann hat der Graph von f die Basis ((v1 , f (v1 )), ..., (vn , f (vn ))). Insbesondere ist dimK (Graph( f )) = dimK (V ) . Beweis: Nach Definition ist Graph( f ) = {(v, f (v)) | v ∈ V } ⊂ V ×W . Seien u, w ∈ V und c ∈ K. Wenn f linear ist, dann ist 0V ×W = (0V , 0W ) = (0V , f (0V )) ∈ Graph( f ), (u, f (u))+(w, f (w)) = (u+w, f (u)+ f (w)) = (u+w, f (u+w)) ∈ Graph( f ) und c(w, f (w)) = (cw, c f (w)) = (cw, f (cw)) ∈ Graph( f ), also Graph( f ) ein Untervektorraum von V ×W . Wenn umgekehrt Graph( f ) ein Untervektorraum von V ×W ist, dann sind (u, f (u)) + (w, f (w)) = (u + w, f (u) + f (w)) ∈ Graph( f ) und c(w, f (w)) = (cw, c f (w)) ∈ Graph( f ), somit f (u + w) = f (u) + f (w) und f (cw) = c f (w), also f linear. Wenn f linear ist, dann ist auch die Funktion F : V → Graph( f ) , x 7→ (x, f (x)) , linear und hat die Umkehrfunktion Graph( f ) → V , (x, f (x)) 7→ x. Daher ist F ein Isomorphismus und (F(v1 ), ..., F(vn )) eine Basis von Graph( f ). Beispiel 3 : Es sei k eine reelle Zahl und f die lineare Funktion f : R −→ R, z 7−→ kz. Dann ist Graph(f) = {(z, kz)|z ∈ R} = {z(1, k)|z ∈ R} = R(1, k) ⊆ R × R 3 1. MEHR ÜBER LINEARE FUNKTIONEN die Gerade durch (0, 0) und (1, k). Graph( f ) (0, 1) (1, 0) (1, k) Beispiel 4 : Es seien k und d reelle Zahlen und h : R → R , z 7→ kz + d. Dann ist Graph(h) = {(z, kz + d)| z ∈ R } = {z(1, k) + (0, d)| z ∈ R } eine Gerade in R 2 , aber für d 6= 0 kein Untervektorraum. (0, d) (0, 1) (1, 0) (1, k) Graph(h) 4 1. MEHR ÜBER LINEARE FUNKTIONEN Beispiel 5 : Es seien a, b reelle Zahlen und g die lineare Funktion g : R2 −→ R, (x, y) 7−→ ax + by. Dann ist Graph(g) = {(x, y, ax+by) | x, y ∈ R} = {x·(1, 0, a)+y·(0, 1, b) | x, y ∈ R} = = R(1, 0, a) + R(0, 1, b) ⊆ R2 × R die Ebene durch (0, 0, 0), (1, 0, a) und (0, 1, b). (0, 0, 1) (0, 1, 0) (1, 0, 0) (1, 0, a) (0, 1, b) R (0, 1, b) R (1, 0, a) §2. Bild und Kern einer linearen Funktion In diesem Abschnitt seien V und W Vektorräume über K und f : V −→ W eine lineare Funktion. Definition 6 : Die Menge Bild( f ) := { f (v) | v ∈ V } ⊆ W heißt Bild von f und die Menge Kern( f ) := {v ∈ V | f (v) = 0W } ⊆ V heißt Kern von f . 5 1. MEHR ÜBER LINEARE FUNKTIONEN Satz 7 : Bild( f ) ist ein Untervektorraum von W , Kern( f ) ist ein Untervektorraum von V . Die Dimension des Bildes von f heißt Rang von f (Schreibweise rg( f )). Bild( f ) Kern( f ) f 0V 0W W V Beweis: Da f linear ist, ist 0V ∈ Kern( f ). Für u, v ∈ Kern( f ) und c ∈ K folgt aus f (u + v) = f (u) + f (v) = 0W auch u + v ∈ Kern( f ), sowie aus f (cu) = c f (u) = 0W auch cu ∈ Kern( f ). Daher ist Kern( f ) ein Untervektorraum von V . Analog zeigt man, dass Bild( f ) ein Untervektorraum von W ist. Satz 8 : Sei A ∈ K m×n und L(A, 0) := {x ∈ K n×1 | Ax = 0} der Lösungsraum des durch A definierten Systems homogener linearer Gleichungen. Fasst man die Matrix A als lineare Funktion A : K n×1 → K m×1 , x 7→ Ax , auf, dann ist Kern(A) = L(A, 0) und Bild(A) = K hA−1 , . . . , A−n i, der Spaltenraum von A. Beweis: Es ist Kern(A) = {x ∈ K n×1 | Ax = 0} = L(A, 0) und Bild(A) = = { Ax | x ∈ K n×1 } = { ∑ni=1 xi A−i | x1 , . . . xn ∈ K } = K hA−1 , . . . , A−n i. Satz 9 : Seien V,W endlich-dimensionale Vektorräume über K, f : V → W eine K-lineare Funktion und r := rg( f ). Dann gibt es eine Basis (v1 , . . . , vn ) von V so, dass (1) ( f (v1 ), . . . , f (vr )) eine Basis von Bild( f ) und (2) (vr+1 , . . . , vn ) eine Basis von Kern( f ) ist. Insbesondere gilt dimK (V ) = dimK (Bild( f )) + dimK (Kern( f )) . 6 1. MEHR ÜBER LINEARE FUNKTIONEN Ergänzt man die Basis ( f (v1 ), . . . , f (vr )) von Bild( f ) zu einer Basis (w1 , . . . , wm ) von W , dann ist 1 0 ... .. .. . . 0 . . ∈ K m×n Dr := .. . . 1 0 ... (nur an den Stellen (1, 1), . . . , (r, r) stehen Einsen und sonst Nullen) die Matrix von f bezüglich der Basen (v1 , . . . , vn ) und (w1 , . . . , wm ). Beweis: Sei (w1 , . . . , wr ) eine Basis von Bild( f ). Dann kann man Urbilder v1 , . . . , vr ∈ V von w1 , . . . , wr unter f wählen. Sei (u1 , . . . , us ) eine Basis von Kern( f ). Dann ist (v1 , . . . , vr , u1 , . . . , us ) ein Erzeugendensystem von V , weil für y ∈ V aus r r r f (y) = ∑ ai wi = ∑ ai f (vi ) = f ( ∑ ai vi ) i=1 i=1 i=1 r folgt, dass z := y − ∑i=1 ai vi ∈ Kern( f ) ist. Daher ist y Linearkombination von (v1 , . . . , vr , u1 , . . . , us ). = z + ∑ri=1 ai vi eine Wir zeigen noch, dass (v1 , . . . , vr , u1 , . . . , us ) linear unabhängig ist. Seien dazu c1 , . . . , cr , d1 , . . . , ds ∈ K mit r s ∑ civi + ∑ d j u j = 0 . i=1 j=1 f (∑ri=1 ci vi + ∑sj=1 d j u j ) = ∑ri=1 ci f (vi ) = ∑ri=1 ci wi . Dann ist 0 = Da (w1 , . . . , wr ) linear unabhängig ist, sind alle ci gleich 0. Dann ist ∑sj=1 d j u j = 0, und aus der linearen Unabhängigkeit von u1 , . . . , us folgt d1 = · · · = ds = 0. Also ist (v1 , . . . , vr , u1 , . . . , us ) die gesuchte Basis von V . Insbesondere ist r + s = n. Beispiel 10 :V = W 1 −1 1 −1 wobei A := 0 0 = R 3×1 , 1 2 . 3 f : R 3×1 → R 3×1 , 1 1 1 Eine Basis von Bild( f ): w1 := , w2 := 2. 0 3 1 Eine Basis von Kern( f ): v3 := 1. 0 x 7→ Ax, 7 1. MEHR ÜBER LINEARE FUNKTIONEN 1 0 1 Eine Basis des Definitionsbereichs: v := v1 := 0 , v2 := 0 , v3 = 1. 0 1 0 0 Eine Basis des Bildbereichs: w := w1 , w2 , w3 := 0. 1 f (v1 ) = w1 , f (v2 ) = w2 , f (v3 ) = 0, also: 1 0 M( f , v, w) = 0 1 0 0 0 0 . 0 §3. Systeme linearer Gleichungen in koordinatenfreier Form Definition 11 : Ein System linearer Gleichungen in koordinatenfreier Form ist eine Aufgabe: • Gegeben sind eine lineare Funktion f : V → W und ein Vektor y ∈ W . • Gesucht ist eine gute Beschreibung“ der Menge ” L( f , y) := f −1 ({y}) = {x ∈ V | f (x) = y} aller Vektoren x ∈ V , für die f (x) = y ist. Die Menge L( f , y) heißt Lösungsmenge des durch f und y gegebenen Systems linearer Gleichungen. Ihre Elemente heißen Lösungen dieses Systems. Das durch f und y gegebene System linearer Gleichungen heißt homogen, wenn y = 0W ist, ansonsten inhomogen. Die Lösungsmenge eines homogenen Systems linearer Gleichungen ist L( f , 0) = Kern( f ) . Beispiel 12 : Die Aufgabe Finde eine quadratische Funktion g : R → R ” mit g(1) = 3, g(−1) = 2 und g(5) = 1“ ist ein System linearer Gleichungen in koordinatenfreier Form. Gesucht ist g ∈ V := {h : R → R | h Polynomfunktion deren Grad ≤ 2 ist} mit f (g) = (3, 2, 1) ∈ R 3×1 , dabei ist f : V → R 3 die Auswertungsfunkti” on (in 1, −1 und 5)“ mit f (h) = (h(1), h(−1), h(5)). Satz 13 : Sei f : V → W K-linear, y ∈ W und z ∈ L( f , y) (insbesondere ist L( f , y) nicht leer). Dann ist L( f , y) = z + Kern( f ) ein affiner Unterraum von V mit Aufpunkt z und parallelem Untervektorraum Kern( f ). Das durch f und y gegebene System lösen“bedeutet daher: finde ” 8 1. MEHR ÜBER LINEARE FUNKTIONEN (irgend)ein Urbild z von y unter f und (irgend)eine Basis von Kern( f ). Falls V endlichdimensional ist, gilt weiters dimK (L( f , y)) = dimK (V ) − rg( f ) . Beweis: Sei v ∈ Kern( f ). Dann ist f (z + v) = f (z) + f (v) = y + 0 = y, also z + v ∈ L( f , y). Sei x ∈ L( f , y). Dann ist f (x − z) = f (x) − f (z) = y − y = 0, also x − z ∈ Kern( f ) und x = z + (x − z) ∈ {z + v | v ∈ Kern( f )}. Nach Satz 9 ist dimK (Kern( f )) = dimK (V ) − rg( f ) . Beispiel 14 : Fasst man eine Matrix A ∈ K m×n als eine lineare Funktion f : K n×1 → K m×1 , x 7→ Ax , auf, dann ist L( f , y) = L(A, y). Beispiel 15 : Sei C( R , R ) := { f | f : R → R stetig}, C1 ( R , R ) := { f | f : R → R stetig differenzierbar} und D : C1 ( R , R ) → C( R , R ) , f 7→ f 0 , wobei f 0 die Ableitung der Funktion f bezeichnet. Dann sind C( R , R ) und C1 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D ist R -linear. Der Unterraum Kern(D) besteht aus allen konstanten Funktionen. Eine Funktion f ∈ C1 ( R , R ) heißt Stammfunktion von g ∈ C( R , R ), wenn D f = g ist. Wenn f eine Stammfunktion von g ist, dann ist die Menge aller Stammfunktionen von g L(D, g) = f + Kern(D). Beispiel 16 : Sei C( R , R ) := { f | f : R → R stetig}, C2 ( R , R ) := { f | f : R → R 2-mal stetig differenzierbar}, a, b ∈ R und D2 + aD + b : C1 ( R , R ) → C( R , R ) , f 7→ f 00 + a f 0 + b f , wobei f 00 die zweite Ableitung der Funktion f bezeichnet. Dann sind C( R , R ) und C2 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D2 + aD + b ist R -linear. Den Unterraum Kern(D2 + aD + b) nennt man die Lösungsmenge der homogenen linearen Differentialgleichung y00 + ay0 + by = 0. Wenn f ∈ L(D2 + aD + b, g) ist, dann ist L(D2 + aD + b, g) = f + Kern(D2 + aD + b). 9 1. MEHR ÜBER LINEARE FUNKTIONEN Definition 17 : Es sei V ein Vektorraum v = (v1 , . . . , vn ) eine Basis von V und c ∈ K n×1 eine Spalte mit n Zeilen. Wir verwenden im Weiteren die Schreibweise n vc := ∑ ci vi . i=1 Satz 18 : Seien V,W Vektorräume über K der Dimensionen n, m mit Basen v , w , sei f : V → W K-linear mit Matrix A := M( f , v, w) ∈ K m×n und y = wb ∈ W . Dann bildet der Koordinaten-Isomorphismus V → K n×1 , vc 7→ c , L( f , y) auf L(A, b) ab und Kern( f ) auf L(A, 0). Beweis: Es ist vc ∈ L( f , y) genau dann wenn w(Ac) = wb, also c ∈ L(A, b) ist. Nach Satz 18 kann für f : V → W und y ∈ W das System linearer Gleichungen ( f , y) wie folgt gelöst werden: (1) Wähle Basen v , w von V,W . (2) Berechne die Matrix A := M( f , v, w) und die Koordinatenspalte b von y bezüglich w . (3) Berechne die Lösungsmenge L(A, b). Wenn L(A, b) leer ist, dann ist auch L( f , y) leer. Wenn z ∈ L(A, b) und (u1 , . . . , us ) eine Basis von L(A, 0) ist, dann ist vz ∈ L( f , y) und (vu1 , . . . , vus ) eine Basis von Kern( f ). Im Schulunterricht entsprechen Systeme linearer Gleichungen in koordinatenfreier Form gewissen Textaufgaben“. ” Beispiel 19 : ( Interpolation von 3 gegebenen Funktionswerten durch Po” lynomfunktionen, deren Grad höchstens 4 ist“.)Wir bezeichnen mit x die identische Funktion von R nach R und mit 1 die konstante Funktion, die jede reelle Zahl auf 1 abbildet. Man kann zeigen, dass die Potenzfunktionen 1, x, x2 , x3 , x4 linear unabhängig sind. Es sei V der von diesen erzeugte Untervektorraum des Vektorraums aller Polynomfunktionen. Wir suchen alle Polynomfunktionen p ∈ V mit p(−1) = 2, p(1) = 1 und p(2) = 1 . Sei W := R 3 , f : V −→ W , q 7−→ (q(−1), q(1), q(2)) , 10 1. MEHR ÜBER LINEARE FUNKTIONEN und y := (2, 1, 1) ∈ W . Die Funktion f ist linear. Wir wählen die Basis v := (1, x, x2 , x3 , x4 ) von V und die Standardbasis w := (e1 , e2 , e3 ) von W = R 3 . Dann ist 2 1 −1 1 −1 1 A := M( f , v, w) := 1 1 1 1 1 und b := 1 . 1 1 2 4 8 16 Man berechnet mit dem Gauß-Verfahren 4 −2 −4 3 − 1 1 0 2 1 + R 2 + R 5 . L(A, b) = 6 0 −1 0 0 −1 0 Daher ist 1 4 1 L( f , y) = { − x + x2 + 3 2 6 +c(−2 + x + 2x2 − x3 ) + d(−4 + 5x2 − x4 ) | c, d ∈ R } . KAPITEL 2 Interpolation und Regression §1. Interpolationsaufgaben Wir betrachten die folgenden Interpolationsaufgaben: Gegeben sind • • • • ganze Zahlen m ≥ 2 und n ≥ 1, Funktionen f1 , . . . , fn von R nach R, paarweise verschiedene reelle Zahlen x1 , . . . , xm ∈ R und reelle Zahlen y1 , . . . , ym ∈ R. Gesucht sind reelle Zahlen c1 , . . . , cn so, dass die Funktion f := ∑ni=1 ci fi die Bedingungen f (x1 ) = y1 , f (x2 ) = y2 , . . . , f (xm ) = ym erfüllt. y3 y2 y1 x2 x1 y4 x4 x3 Durch die Funktionen f1 , . . . , fn wird der Typ“ der Interpolationsaufga” be vorgegeben. Die reellen Zahlen x1 , . . . , xm heißen Stützstellen, die reellen Zahlen y1 , . . . , ym (Funktions-)Werte der Interpolationsaufgabe. Die gesuchte Funktion f heißt interpolierende Funktion. Wir suchen also eine Funktion f des vorgegebenen Typs so, dass die Funktionswerte von f in den Stützstellen die vorgegebenen Werte der Interpolationsaufgabe sind. Anders formuliert: Wir suchen Zahlen c1 , . . . , cn so, dass f1 (x1 )c1 + f2 (x1 )c2 + . . . + fn (x1 )cn f1 (x2 )c1 + f2 (x2 )c2 + . . . + fn (x2 )cn .. . f1 (xm )c1 + f2 (xm )c2 + . . . + fn (xm )cn 11 = y1 = y2 .. .. . . = ym 12 2. INTERPOLATION UND REGRESSION ist. Das ist ein System von m linearen Gleichungen mit n Unbekannten c1 , . . . , cn . In Matrizenform: f1 (x1 ) . . . fn (x1 ) c1 y1 f1 (x2 ) . . . fn (x2 ) c2 y2 . · . = . . .. .. .. . . .. .. f1 (xm ) . . . fn (xm ) cn ym y1 y2 eine Lösung existiert genau dann, wenn ... ein Element des von ym f1 (x1 ) fn (x1 ) f1 (x2 ) fn (x2 ) . , . . . , . erzeugten Vektorraums ist. .. .. f1 (xm ) fn (xm ) Beispiel 20 : ( Lineare Interpolation“). ” Wenn f1 die konstante Funktion 1 (also die Funktion, die jeder Zahl die Zahl 1 zuordnet) und f2 die Identität (also die Funktion, die jeder Zahl sich selbst zuordnet) ist, dann suchen wir eine Funktion f := c1 f1 + c2 f2 mit ( f (xi ) =) c1 + c2 xi = yi , 1 ≤ i ≤ n . Die Aufgabe, Zahlen c1 und c2 mit den Eigenschaften c1 + c2 x1 = y1 .. .. .. . . . c1 + c2 xm = ym zu finden, ist ein System von m linearen Gleichungen mit zwei Unbekannten. In Matrizenform 1 x1 y1 1 x2 c1 y2 . . · .. .. c2 = ... . 1 xm ym Beispiel 21 : (Interpolation durch Polynomfunktionen). Für 1 ≤ i ≤ n sei fi : R −→ R, z 7−→ zi−1 , die (i − 1)-te Potenzfunktion. Dann ist die gesuchte Funktion f eine Polynomfunktion f : R −→ R, z 7−→ c1 + c2 z + . . . + cn zn−1 . Wir suchen reelle Zahlen c1 , c2 , . . . , cn mit der Eigenschaft, dass c1 + x1 c2 + . . . + x1n−1 cn = y1 .. .. .. . . . n−1 c c1 + xm c2 + . . . + xm = ym n 13 2. INTERPOLATION UND REGRESSION ist, müssen also ein System von m Gleichungen mit n Unbekannten lösen. In Matrizenform: 1 x1 . . . x1n−1 c1 y1 1 x . . . xn−1 c2 y2 2 2 · . = . . .. .. .. .. . . . . .. .. n−1 cn ym 1 xm . . . xm Ist m = n = 3 ( Interpolation durch eine quadratische Funktion für drei ” Stützstellen“), dann hat diese Interpolationsaufgabe für jede Vorgabe von y1 , y2 , y3 genau eine Lösung, weil die Matrix 1 x1 x12 1 x2 x2 2 2 1 x3 x3 invertierbar ist (ihre Determinante ist (x1 − x2 )(x2 − x3 )(x3 − x1 )). §2. Systeme linearer Gleichungen ohne Lösung und Regression Es seien A ∈ Rm×n und b ∈ Rm×1 . Das durch A und b gegebene System linearer Gleichungen hat genau dann eine Lösung, wenn es eine Spalte c ∈ Rn×1 mit A · c = b , also ∑ni=1 ci A−i = b, gibt. Das ist genau dann der Fall, wenn b ein Element des Spaltenraumes von A ist. Wir bezeichnen den Spaltenraum von A mit U, dieser ist ein Untervektorraum von Rm×1 . Wenn b nicht in U liegt, gibt es keine Lösung. Ist man der Meinung, dass es eine Lösung geben sollte, aber vielleicht b nicht exakt bestimmt wurde (z.B. durch Runden oder durch Messfehler), kann man b durch b0 ∈ U so ersetzen, dass der Abstand von b zu b0 möglichst klein ist. Wählen wir den durch das Standardskalarprodukt auf Rm×1 definierten Abstand, bedeutet das, dass m kb − b0 k2 = ∑ (bi − b0i )2 i=1 ( die Summe der Fehlerquadrate“) möglichst klein sein soll. (Für positive ” reelle Zahlen r und s ist r ≤ s genau dann, wenn r2 ≤ s2 ist. Somit ist der Abstand von b zu b0 genau dann minimal, wenn sein Quadrat minimal ist). Für b0 muss daher der Fußpunkt des Lotes von b auf den Untervektorraum U gewählt werden und dann das Gleichungssystem A · z = b0 anstatt von A · z = b gelöst werden. Hat man das Gleichungssystem durch eine Interpolationsaufgabe wie im vorigen Abschnitt erhalten und gibt es keine Lösung (also keine interpolierende Funktion des vorgegebenen Typs), dann nennt man die Vorgangsweise wie oben Regression“. ” 14 2. INTERPOLATION UND REGRESSION U 0 b b0 Mit den Bezeichnungen des vorigen Abschnittes ist Ai j = f j (xi ) und bi = yi , 1 ≤ i ≤ m, 1 ≤ j ≤ n. Für die gesuchte Funktion f = ∑ni=1 ci fi soll f (xi ) = b0i = y0i , 1 ≤ i ≤ m, sein, also der Abstand k( f (x1 ), f (x2 ), . . . , f (xm ))T − (y1 , . . . , ym )T k von der Spalte der berechneten Funktionswerte“ zur Spalte der gemesse” ” nen Funktionswerte“ möglichst klein sein. Falls auf R m×1 das Standardskalarprodukt gewählt wurde, ist m k( f (x1 ), . . . , f (xm ))T − (y1 , . . . , ym )T k2 = ∑ ( f (xi ) − yi )2 i=1 die Summe der Fehlerquadrate“. ” Bei linearer Interpolation“ ist U die von ” 1 x1 . 1 := .. und x := ... 1 xm erzeugte Ebene in Rm×1 . Wir verwenden die Bezeichnungen y1 y := ... und y0 := Fußpunkt des Lotes von y auf U . ym y 1 c1 1 0 x y0 c2 x 15 2. INTERPOLATION UND REGRESSION Wir berechnen nun y0 : • y0 = c2 x + c1 1 ∈ U und • die Gerade durch y und y0 steht normal auf der von x und 1 erzeugten Ebene U. Also ist • hc2 x + c1 1 − y, xi = 0 und • hc2 x + c1 1 − y, 1i = 0. Daraus erhalten wir das folgende System von zwei linearen Gleichungen mit zwei Unbekannten c1 und c2 : • c2 hx, xi + c1 h1, xi = hx, yi • c2 hx, 1i + c1 h1, 1i = h1, yi Als Lösung erhalten wir h1, 1i · hx, yi − h1, xi · h1, yi hx, xi · h1, yi − h1, xi · hx, yi c2 = und c1 = . 2 h1, 1i · hx, xi − h1, xi h1, 1i · hx, xi − h1, xi2 Der Divisor h1, 1i · hx, xi − h1, xi2 ist nach der Cauchy-Schwarzschen Ungleichung nicht 0. Denn: h1, xi2 = h1, 1i · hx, xi nur dann, wenn x ein Vielfaches von 1 ist, d.h.: x1 = x2 = . . . = xm , was wegen der Annahmen m > 1“ ” und xi paarweise verschieden“ nicht möglich ist. Wenn h−, −i das Standard” m m Skalarprodukt ist, dann ist hx, yi = ∑m i=1 xi yi , h1, xi = ∑i=1 xi , h1, yi = ∑i=1 yi , m 2 2 h1, 1i = m, hx, xi = ∑m i=1 xi und hy, yi = ∑i=1 yi , daher c2 = und c1 = m m m ∑m i=1 xi yi − (∑i=1 xi )(∑i=1 yi ) m 2 2 m ∑m i=1 xi − (∑i=1 xi ) m m m 2 (∑m i=1 xi )(∑i=1 yi ) − (∑i=1 xi )(∑i=1 xi yi ) . m 2 2 n ∑m i=1 xi − (∑i=1 xi ) Wir haben damit die Funktion f : R −→ R, z 7−→ c2 z + c1 , so bestimmt, dass der (euklidische) Abstand vom m-Tupel der gegebenen (gemessenen oder gerundeten) ungenauen Funktionswerte (y1 , . . . , ym ) zum m-Tupel der berechneten Funktionswerte ( f (x1 ), . . . , f (xm )) möglichst klein ist, also 2 ∑m i=1 (yi − (c2 xi + c1 )) möglichst klein ist. Der Graph dieser Funktion heißt Regressionsgerade oder Trendlinie der Punkte (x1 , y1 ), (x2 , y2 ), . . . , (xm , ym ). Man rechnet leicht nach, dass 1 m 1 m f ( ∑ xi ) = ∑ yi m i=1 m i=1 ist. Das Paar der arithmetischen Mittel von (x1 , . . . , xm ) und (y1 , . . . , ym ) liegt also immer auf der Regressionsgeraden. KAPITEL 3 Mehr über Geometrie §1. Strahlensatz Satz 22 : ( Strahlensatz“) ” Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann gibt es c, d ∈ K \ {0} so, dass v2 = cv1 und w2 = dw1 ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1 bzw. v2 und w2 . Dann gilt: (1) L1 und L2 sind genau dann parallel, wenn c = d ist. (2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ). Z1 v2 v1 0 w1 L1 w2 Z2 L2 Beweis: (1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw. K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau dann gleich K(cv1 − dw1 ), wenn c = d ist. (2) Wenn L1 und L2 parallel sind, ist c = d und v2 − w2 = cv1 − cw1 = c(v1 − w1 ) . 16 17 3. MEHR ÜBER GEOMETRIE Satz 23 : Es seien V ein Vektorraum über einem Körper K und Z1 = p1 + U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann ist Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0. / Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 . §2. Affine Hülle Es sei K ein Körper und V ein Vektorraum über K. Definition 24 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in V . Eine Linearkombination ∑i∈I ci vi von (vi )i∈I heißt affine Kombination von (vi )i∈I , wenn ∑i∈I ci = 1 ist. Die Menge aller affinen Linearkombinationen von (vi )i∈I heißt affine Hülle von (vi )i∈I . Beispiel 25 : Die affine Hülle von zwei Vektoren v1 und v2 ist ein Punkt, wenn v1 = v2 ist, bzw. die Gerade {c1 v1 + c2 v2 | c1 , c2 ∈ K, c1 + c2 = 1} = {v1 + c(v2 − v1 ) | c ∈ K}, wenn v1 6= v2 ist. Satz 26 : (1) Es seien M ein affiner Unterraum von V und (vi )i∈I eine endliche Familie in M. Dann ist die affine Hülle von (vi )i∈I in M enthalten. (2) Die affine Hülle einer Familie (vi )i∈I in V ist ein affiner Unterraum von V . Der dazu parallele Untervektorraum wird von (vi − v j )i∈I, i6= j erzeugt, wobei j ∈ I beliebig gewählt werden kann. (3) Die affine Hülle von (vi )i∈I ist der (bezüglich Inklusion) kleinste affine Unterraum, der alle vi , i ∈ I, enthält. Beweis: (1) Sei p ∈ M, U der zu M parallele Untervektorraum und (ci )i∈I eine Familie in K mit ∑i∈I ci = 1. Zu vi gibt es ui ∈ U so, dass vi = p + ui , i ∈ I. Dann ist ∑ civi = ∑ ci(p + ui) = (∑ ci)p + ∑ ciui = p + ∑ ciui ∈ M . i∈I i∈I i∈I i∈I (2) Sei j ∈ I und M := v j + K hvi − v j ; i ∈ I, i 6= ji. i∈I 18 3. MEHR ÜBER GEOMETRIE Dann ist (vi )i∈I eine Familie in M und nach (1) ist ihre affine Hülle in M enthalten. Sei umgekehrt (di )i∈I eine Familie in K. Dann ist v j + ∑ di (vi − v j ) = ∑ di vi + 1 − ∑ di v j i∈I i6= j i∈I i6= j i∈I i6= j eine affine Linearkombination von (vi )i∈I . Daher ist jedes Element von M in der affinen Hülle von (vi )i∈I enthalten. (3) Folgt aus (1) und (2). Definition 27 : Affine Unterräume von V heißen kollinear bzw. koplanar, wenn sie alle in einer Geraden bzw. Ebene in V enthalten sind. Satz 28 : (1) Drei Punkte v1 , v2 , v3 ∈ V sind genau dann kollinear, wenn die Vektoren v2 − v1 und v3 − v1 linear abhängig sind. (2) Vier Punkte v1 , v2 , v3 , v4 ∈ V sind genau dann koplanar, wenn die Vektoren v2 − v1 , v3 − v1 und v4 − v1 linear abhängig sind. (3) Zwei Geraden p1 + Kv1 und p2 + Kv2 sind genau dann koplanar, wenn die Vektoren p1 − p2 , v1 und v2 linear abhängig sind. Beweis: Die ersten zwei Aussagen folgen aus Satz 26, (2). Der zur affinen Hülle von (p1 , p2 , p1 + v1 , p2 + v2 ) parallele Untervektorraum wird von p1 − p2 , v1 und v2 erzeugt. 1 2 −1 Beispiel 29 : Sind die Vektoren v1 := 0 , v2 := 2 , v3 := 1 1 3 0 1 und v4 := 2 ∈ R 3×1 koplanar? 3 1 −2 0 Es ist v2 − v1 = 2 , v3 − v1 = 1 , v4 − v1 = 2 . 2 −1 2 1 −2 0 Wegen det 2 1 2 = 4 6= 0 sind v2 − v1 , v3 − v1 , v4 − v1 linear un2 −1 2 abhängig, nach Satz 28 also v1 , v2 , v3 , v4 nicht koplanar. 19 3. MEHR ÜBER GEOMETRIE Satz 30 : Zwei verschiedene koplanare Geraden schneiden einander in genau einem Punkt oder sie sind parallel. Beweis: Seien M1 und M2 verschiedene koplanare Geraden und E die Ebene, die beide enthält. Wenn M1 und M2 nicht parallel sind, dann ist U1 ∩U2 = {0} und U1 + U2 = U1 ⊕ U2 ist der zu E parallele Untervektorraum. Wegen p1 , p2 ∈ E ist p1 − p2 ∈ U1 ⊕ U2 , daher gibt es eindeutig bestimmte Vektoren u1 ∈ U1 , u2 ∈ U2 so, dass p1 − p2 = u1 + u2 ist. Somit ist M1 ∩ M2 = {p1 − u1 } = {p2 + u2 }. §3. Polytope und Schwerpunkte Es seien K = Q oder R und V ein Vektorraum über K. Definition 31 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in V. Eine Linearkombination ∑ ci vi von (vi )i∈I heißt konvexe Linearkombinatii∈I on von (vi )i∈I , wenn ∑ ci = 1 und ci ≥ 0 für alle i ∈ I ist. i∈I Die Menge der konvexen Linearkombinationen von (vi )i∈I heißt konvexe Hülle von (vi )i∈I . Die konvexe Hülle zweier Vektoren v1 , v2 heißt Strecke zwischen v1 und v2 . v2 v1 Die konvexe Hülle dreier nicht kollinearer Punkte v1 , v2 , v3 heißt Dreieck mit Eckpunkten v1 , v2 , v3 . v3 v2 v1 20 3. MEHR ÜBER GEOMETRIE Eine Teilmenge von V heißt Polytop, wenn sie die konvexe Hülle einer endlichen Familie in V ist. Es sei I := {1, . . . , n} , c1 , . . . , cn ∈ R ≥0 und ∑ ci = 1. Für cn 6= 1 ist i∈I ! ci ∑ civi = (1 − cn) ∑ 1 − cn vi + cnvn = (1 − cn)w + cnvn , i=1 i=1 n n−1 ci wobei w := ∑n−1 i=1 1−cn vi in der konvexen Hülle H von (v1 , . . . , vn−1 ) liegt. Daraus folgt: Für n ≥ 3 ist die konvexe Hülle von (v1 , . . . , vn ) die Vereinigung aller Strecken zwischen vn und den Elementen von H. v3 u = c1 v1 + c2 v2 + c3 v3 = (c1 + c2 )w + c3 v3 u v1 c1 c2 c1 +c2 v1 + c1 +c2 v2 =: w v2 Beispiel 32 : Eine Teilmenge von R ist genau dann ein Polytop, wenn sie ein abgeschlossenes Intervall ist. Satz 33 : Es seien P die konvexe Hülle einer Familie w j j∈J in V und (vi )i∈I eine Familie in P. Dann ist die konvexe Hülle von (vi )i∈I in P enthalten. Beweis: Für allei ∈ I ist der Vektor vi eine konvexe Linearkombination ∑ c ji w j von w j j∈J . j∈J 21 3. MEHR ÜBER GEOMETRIE Sei ∑ di vi eine konvexe Linearkombination von (vi )i∈I . Dann ist i∈I ! ∑ divi = ∑ ∑ dic jiw j = ∑ ∑ dic ji i∈I i∈I j∈J j∈J mit ∑ di c ji ≥ 0, für alle j ∈ J, und i∈I ! ∑ ∑ dic ji j∈J i∈I = ∑ di i∈I wj i∈I ! = ∑ di = 1 . ∑ c ji j∈J i∈I Daher ist ∑ di vi ∈ P . i∈I Definition 34 : Es sei (vi )i∈I eine endliche Familie in V . Der Schwerpunkt von (vi )i∈I ist 1 vi . # (I) ∑ i∈I Der Schwerpunkt von (v1 , v2 ) heißt Mittelpunkt der Strecke zwischen v1 und v2 . Satz 35 : Es seien u, v, w drei nicht kollineare Punkte in V . Die Gerade durch u bzw. v bzw. w und den Mittelpunkt der Strecke zwischen den anderen zwei Punkten heißt Schwerlinie des Dreiecks mit Eckpunkten u, v, w durch u bzw. v bzw. w. Die drei Schwerlinien sind paarweise verschieden und schneiden einander im Schwerpunkt 13 (u + v + w) von (u, v, w) . w 1 2 (u + w) 1 2 (v + w) u 1 2 (u + v) v Beweis: Da u, v, w nicht kollinear sind, sind nach Satz 28 die Vektoren v − u und w − u linear unabhängig. Also sind auch 1 1 1 v − u und (v − u) + (w − u) = (v + w) − u 2 2 2 22 3. MEHR ÜBER GEOMETRIE linear unabhängig, nach Satz 28 sind daher u, v, 12 (v + w) nicht kollinear. Somit liegt v nicht auf der Schwerlinie durch u . Daher sind die Schwerlinien durch u und durch v verschieden und die drei Schwerlinien haben höchstens einen Schnittpunkt. Wegen 1 2 1 1 2 1 1 (u + v + w) = u + (v + w) = v + (u + w) = 3 3 3 2 3 3 2 1 2 1 = w+ (u + v) 3 3 2 liegt der Schwerpunkt auf allen Schwerlinien. §4. Affine Räume Definition 36 : Es seien (G, ?) eine Gruppe mit neutralem Element e und M eine Menge. Eine Funktion G × M −→ M , (s, m) 7−→ s · m , ist eine Operation der Gruppe G auf der Menge M, wenn gilt: für alle m ∈ M ist e · m = m und für alle s,t ∈ G und alle m ∈ M ist (s ? t) · m = s · (t · m). Beispiel 37 : Die Funktion Sn × {1, 2, . . . , n} → {1, 2, . . . , n} , (σ , i) 7→ σ (i) , ist eine Operation der Permutationsgruppe Sn auf der Menge {1, 2, . . . , n}. Definition 38 : Sei V ein Vektorraum über einem Körper K, A eine Menge und V × A → A , (v, a) 7→ v · a , eine Operation der Gruppe (V, +) auf A. (Also: Für alle a ∈ A, v, w ∈ V ist 0 · a = a und (v + w) · a = v · (w · a). A zusammen mit dieser Operation ist ein affiner Raum über V , wenn es für alle Elemente a, b ∈ A genau einen Vektor v ∈ V gibt mit v · a = b. Die Elemente von A heißen dann Punkte, die Elemente von V Vektoren des affinen Raums. Satz 39 : Sei A ein affiner Raum über V und a ∈ A. Die Funktion V −→ A , v 7−→ v · a , ist bijektiv. (Nach Wahl eines Nullpunktes“ kann ein affiner Raum als Vek” torraum betrachtet werden). Beweis: Folgt aus der Definition. 23 3. MEHR ÜBER GEOMETRIE Beispiel 40 : Sei V ein Vektorraum, p ∈ V und U ein Untervektorraum von V . Dann ist der affine Unterraum p +U mit U × (p +U) −→ p +U (v, p + u) 7−→ p + (u + v) , ein affiner Raum über U. Insbesondere ist jeder Vektorraum ein affiner Raum (über sich selbst). Beispiel 41 : Sie E die Zeichenebene oder der Anschauungsraum und T (E) der Vektorraum der Translationen von E. Dann ist E mit T (E) × E −→ E , (t, x) 7−→ t(x) , ein affiner Raum über T (E). Möchte man in der Zeichenebene keinen Nullpunkt“ wählen, kann man ” sie als affinen Raum betrachten. Dann muss man zwischen Punkten (∈ E) und Vektoren (∈ T (E)) unterscheiden. Punkte können dann nicht addiert werden, aber Vektoren können addiert werden und auf Punkten wirken“. ” Sind P und Q Punkte von E und P 6= Q, dann gibt es genau eine Trans~ bezeichnet. lation in T (E), die P auf Q abbildet. Sie wird häufig mit PQ Q ~ Graph(PQ) P Die Menge ~ |t ∈ R } ⊆ T (E) {t PQ ~ in T (E). Die Gerade durch P und ist die Gerade durch 0T (E) = idE und PQ ” Q in E“ ist dann als ~ {(t PQ)(P) |t ∈ R } ⊆ E ~ ~ definiert. Wegen (PQ)(P) = Q und (0 · PQ)(P) = idE (P) = P sind P und ~ Q Punkte dieser Geraden. Die Translation PQ wird als Richtungsvektor“ ” dieser Geraden bezeichnet. ~ Gerade durch 0T (E) und PQ im Vektorraum T (E) ~ 2PQ ~ (−PQ)(P) P Q ~ PQ 0T (E) = idE ~ −PQ Gerade durch P und Q in E ~ ~ (2PQ)(P) = PQ(Q)