Vertiefung Lineare Algebra 1 Schriftliche Unterlagen zur Vorlesung im Wintersemester 2013/14 Franz Pauer c 2013 I NSTITUT F ÜR M ATHEMATIK , U NIVERSIT ÄT I NNSBRUCK ⃝ KAPITEL 1 Vertiefung zu Kap. 2, §3 In diesem Kapitel sei K ein Körper. §1. Erzeugendensysteme, lineare Unabhängigkeit und Basen In der Vorlesung Lineare Algebra 1“ wurde der Begriff Linearkom” bination eines n-Tupels von Vektoren eingeführt. Wir erweitern diesen Begriff nun auf beliebige (auch unendliche) Familien (vi )i∈I von Vektoren. Die Definition im Skriptum Lineare Algebra 1 entspricht dann dem Spezialfall I := {1, . . . , n}. Definition 1 : Sei V ein Vektorraum über K und I eine (beliebige) Menge. Eine Familie (ci )i∈I von Elementen in K heißt Koeffizientenfamilie, wenn ci ̸= 0 für nur endlich viele i ∈ I ist. Sei (vi )i∈I eine Familie von Vektoren in V . Ein Vektor w ∈ V heißt eine Linearkombination von (vi )i∈I , wenn es eine Koeffizientenfamilie (ci )i∈I gibt, sodass w= ∑ ci vi i∈I,ci ̸=0 ist. Wir schreiben im weiteren einfach ∑ ci vi anstatt ∑ ci vi . i∈I,ci ̸=0 i∈I Die Menge aller Linearkombinationen von (vi )i∈I ist ein Untervektorraum von V und enthält alle Vektoren vi , i ∈ I. Er heißt der von vi , i ∈ I, erzeugte Untervektorraum von V und wird mit K ⟨vi | i ∈ I⟩ oder ∑ Kvi i∈I bezeichnet. Definition 2 : Sei V ̸= {0} ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren in V heißt genau dann ein Erzeugendensystem von V bzw. linear unabhängig in V bzw. eine Basis von V , wenn jeder Vektor in V auf mindestens eine bzw. höchstens eine bzw. genau eine Weise als Linearkombination von (vi )i∈I geschrieben werden kann. Wir schreiben linear abhängig anstatt nicht linear unabhängig. Die leere Menge ist eine Basis von {0}. 1 1. VERTIEFUNG ZU KAP. 2, §3 2 Satz 3 : Sei V ̸= {0} ein Vektorraum über K und (vi )i∈I eine Familie von Vektoren in V . (1) Eine Basis von V ist ein linear unabhängiges Erzeugendensystem. (2) Die Familie (vi )i∈I von Vektoren ist genau dann ein Erzeugendensystem von V , wenn K ⟨vi | i ∈ I⟩ = V ist. (3) Die Familie (vi )i∈I von Vektoren ist genau dann linear unabhängig, wenn für jede Koeffizientenfamilie (ci )i∈I aus ∑ civi = 0 i∈I folgt, dass ci = 0 für alle i ∈ I ist. Beweis: (1) und (2) folgen aus der Definition der Begriffe Erzeugendensystem, linear unabhängig und Basis. (3) Wenn sich jeder Vektor aus V auf höchstens eine Weise als Linearkombination von (vi )i∈I schreiben lässt, dann folgt aus ∑ civi = 0V = ∑ 0K vi i∈I i∈I auf Grund der Eindeutigkeit ci = 0K für 1 ≤ i ≤ n. Sei umgekehrt (vi )i∈I linear unabhängig in V und w ∈ V so, dass es eine Koeffizientenfamilie (ci )i∈I mit w = ∑ ci vi i∈I gibt. Falls (di )i∈I eine weitere Koeffizientenfamilie mit w = ∑ di vi i∈I ist, erhält man 0V = w − w = ∑ ci vi − ∑ di vi = ∑(ci − di )vi . i∈I i∈I i∈I Nach Annahme folgt ci − di = 0K für alle i ∈ I, also ci = di für alle i ∈ I. Beispiel 4 : Die Familie (Ekℓ )1≤k≤m = (Ekℓ )(k,ℓ)∈{1,...,m}×{1,...,n} 1≤ℓ≤n 1. VERTIEFUNG ZU KAP. 2, §3 3 der Standard-Matrizen ist eine Basis von K m×n und heißt die Standardbasis von K m×n . Für A ∈ K m×n ist A = ∑ Akℓ Ekℓ , 1≤k≤m 1≤ℓ≤n also ist A die Koordinatenfamilie von A bezüglich der Standardbasis (Ekℓ )1≤k≤m (und Akℓ die Koordinate von A bei Ekℓ ). 1≤ℓ≤n Beispiel 5 : Es seien I eine endliche Menge und V die Menge aller Funktionen von I in einen Körper K. Für i ∈ I sei δi die durch δi ( j) := δi j , j ∈ I, definierte Funktion von I nach K. Dann ist die Familie (δi )i∈I eine K-Basis von V . Für f ∈ V ist f = ∑ f (i)δi . i∈I Beispiel 6 : Es sei K ein Körper und F := {(ai )i∈N | ai ∈ K, i ∈ N} die Menge aller Folgen in K. Mit den durch (ai )i∈N + (bi )i∈N := (ai + bi )i∈N und c · (ai )i∈N := (cai )i∈N definierten Rechenoperationen wird F zu einem Vektorraum. Mit ei (i ∈ N) bezeichnen wir die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der i-ten Stelle steht. Die Familie (ei )i∈N ist linear unabhängig, aber kein Erzeugendensystem von F. Zum Beispiel kann die Folge (1, 1, 1, . . . , 1, . . .) nicht als Linearkombination der Familie (ei )i∈N geschrieben werden. Der von der Familie (ei )i∈N erzeugte Untervektorraum ist die Menge aller Folgen, von denen nur endlich viele Folgenglieder nicht 0 sind. Er heißt Vektorraum der endlichen Folgen in K. Die Familie (ei )i∈N ist eine Basis dieses Vektorraums, daher ist er unendlich-dimensional. §2. Rechnen mit Koordinaten In diesem Abschnitt seien V und W endlich-dimensionale Vektorräume über K, n ∈ N die Dimension von V und v := (v1 , . . . , vn ) eine Basis von V . Definition 7 : Seien p und q positive ganze Zahlen und u := (u1 , . . . , u p ) ∈ V p 1. VERTIEFUNG ZU KAP. 2, §3 4 ein p-Tupel von Vektoren in V . Für T ∈ K p×q sei ( ) p p ( ) uT := (uT )1 , . . . , (uT )q := ∑ Ti1 ui , . . . , ∑ Tiq ui ∈ V q . i=1 i=1 Die Bezeichnung uT ist eine Merkhilfe, weil man analog zur Matrizenrechnung über K den Vektor (uT ) j ∈ V nach der Regel Zeile u mal Spalte T− j“ ” berechnet. Satz 8 : Seien p, q, r positive ganze Zahlen und u := (u1 , . . . , u p ) ∈ V p . Dann gilt: (1) uI p = u (2) Für T ∈ K p×q und U ∈ K q×r ist u(TU) = (uT )U . (3) Für T ∈ GL p (K) und u′ := uT gilt u = u′ T −1 . Beweis: (1) gilt nach Definition, (2) rechnet man nach und (3) folgt aus u = uI p = u(T T −1 ) = (uT )T −1 = u′ T −1 . Definition 9 : Seien w ∈ V und c1 , . . . , cn ∈ K die Koordinaten von w bezüglich v, also n w = ∑ ci vi = vc ∈ V , i=1 Dann heißt die Spalte c1 ... ∈ K n×1 cn die Koordinatenspalte von w bezüglich v. Satz 10 : Sei u := (u1 , . . . , uq ) ∈ V q . Dann gilt: (1) Es gibt genau eine Matrix T ∈ K n×q mit u = vT . Diese Matrix T heißt die Transformationsmatrix von v zu u, und die Spalten von T sind die Koordinatenspalten von u1 , . . . , uq bezüglich v. (2) Die Familie u ist genau dann eine Basis von V , wenn T invertierbar ist. Beweis: 5 1. VERTIEFUNG ZU KAP. 2, §3 (1) Sei T ∈ K n×k jene Matrix, die sich durch Nebeneinanderschreiben der Koordinatenspalten von u1 , . . . , uk bezüglich v ergibt. Dann ist u j = vT− j für 1 ≤ j ≤ k, also u = vT . Wenn umgekehrt u = vS mit S ∈ K n×k ist, d.h. u j = vS− j für 1 ≤ j ≤ k, dann ist S− j die Koordinatenspalte von u j bezüglich v für 1 ≤ j ≤ k. (2) Wenn T ∈ GLn (K) ist, dann ist v = uT −1 nach Satz 8, also sind die Vektoren v1 , . . . , vn Linearkombinationen von u1 , . . . , un , somit ist K ⟨u1 , . . . , un ⟩ = V und, weil V n-dimensional ist, (u1 , . . . , un ) eine Basis von V . Wenn umgekehrt u eine Basis von V ist, dann gibt es eine Matrix U ∈ K n×n mit v = uU. Weil u eine Basis ist, folgt aus uIn = vT = u(UT ), dass UT = In ist und analog TU = In , also ist T ∈ GLn (K). Satz 11 : Sei u eine Basis von V und T ∈ GLn (K) die Transformationsmatrix von v zu u. Ist c die Koordinatenspalte von w ∈ V bezüglich v, dann ist T −1 c die Koordinatenspalte von w bezüglich u , d.h. bei Basiswechsel mit der Matrix T transformieren sich die Koordinaten“ mit der Matrix T −1 . ” Beweis: Es ist w = vc = (uT −1 )c = u(T −1 c). Beispiel 12 : Wir betrachten die Ebene E nach Wahl eines Nullpunktes als Vektorraum. Wir wählen Punkte P1 , P2 so, dass P := (P1 , P2 ) eine Basis von E ist. Es sei 3 1 1 Q := (Q1 , Q2 ) := ( P1 + 2P2 , P1 + P2 ) . 2 2 2 Dann ist Q = PT , wobei 3 1 T := 2 2 2 1 2 ist. Man prüft leicht nach, dass T invertierbar ist und dass ( ) −2 2 −1 T = 8 −6 ist. Daher ist P = QT −1 = (−2Q1 + 8Q2 , 2Q1 − 6Q2 ). ( ) 1 Der Punkt P1 + 2P2 hat bezüglich P die Koordinatenspalte und 2 ( ) ( ) 1 2 bezüglich Q die Koordinatenspalte T −1 = . 2 −4 Somit ist P1 + 2P2 = 2Q1 − 4Q2 . KAPITEL 2 Vertiefung zu Kap. 3, §2 §1. Strahlensatz Satz 13 : ( Strahlensatz“) ” Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann gibt es c, d ∈ K \ {0} so, dass v2 = cv1 und w2 = dw1 ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1 bzw. v2 und w2 . Dann gilt: (1) L1 und L2 sind genau dann parallel, wenn c = d ist. (2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ). Z1 v2 v1 0 w1 L1 w2 L2 Z2 A BBILDUNG 1. Strahlensatz Beweis: (1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw. K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau dann gleich K(cv1 − dw1 ), wenn c = d ist. 6 2. VERTIEFUNG ZU KAP. 3, §2 7 (2) Wenn L1 und L2 parallel sind, ist c = d und v2 − w2 = cv1 − cw1 = c(v1 − w1 ) . Satz 14 : Es seien V ein Vektorraum über einem Körper K und Z1 = p1 + U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann ist Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0. / Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 . §2. Affine Hülle Es sei K ein Körper und V ein Vektorraum über K. Definition 15 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in V . Eine Linearkombination ∑i∈I ci vi von (vi )i∈I heißt affine Kombination von (vi )i∈I , wenn ∑i∈I ci = 1 ist. Die Menge aller affinen Linearkombinationen von (vi )i∈I heißt affine Hülle von (vi )i∈I . Beispiel 16 : Die affine Hülle von zwei Vektoren v1 und v2 ist ein Punkt, wenn v1 = v2 ist, bzw. die Gerade {c1 v1 + c2 v2 | c1 , c2 ∈ K, c1 + c2 = 1} = {v1 + c(v2 − v1 ) | c ∈ K}, wenn v1 ̸= v2 ist. Satz 17 : (1) Es seien M ein affiner Unterraum von V und (vi )i∈I eine endliche Familie in M. Dann ist die affine Hülle von (vi )i∈I in M enthalten. (2) Die affine Hülle einer Familie (vi )i∈I in V ist ein affiner Unterraum von V . Der dazu parallele Untervektorraum wird von (vi − v j )i∈I, i̸= j erzeugt, wobei j ∈ I beliebig gewählt werden kann. (3) Die affine Hülle von (vi )i∈I ist der (bezüglich Inklusion) kleinste affine Unterraum, der alle vi , i ∈ I, enthält. Beweis: 2. VERTIEFUNG ZU KAP. 3, §2 8 (1) Sei p ∈ M, U der zu M parallele Untervektorraum und (ci )i∈I eine Familie in K mit ∑i∈I ci = 1. Dann ist ( ) ( ) ∑ civi = ∑ ci i∈I p− i∈I ∑ ci i∈I p + ∑ ci vi = i∈I = p + ∑ ci (vi − p) ∈ p +U = M. i∈I (2) Sei j ∈ I und M := v j + K ⟨vi − v j ; i ∈ I, i ̸= j⟩. Dann ist (vi )i∈I eine Familie in M und nach (1) ist ihre affine Hülle in M enthalten. Sei umgekehrt (di )i∈I eine Familie in K. Dann ist v j + ∑ di (vi − v j ) = ∑ di vi + 1 − ∑ di v j i∈I i̸= j i∈I i̸= j i∈I i̸= j eine affine Linearkombination von (vi )i∈I . Daher ist jedes Element von M in der affinen Hülle von (vi )i∈I enthalten. (3) Folgt aus (1) und (2). Definition 18 : Affine Unterräume von V heißen kollinear bzw. koplanar, wenn sie alle in einer Geraden bzw. Ebene in V enthalten sind. Satz 19 : (1) Drei Punkte v1 , v2 , v3 ∈ V sind genau dann kollinear, wenn die Vektoren v2 − v1 und v3 − v1 linear abhängig sind. (2) Vier Punkte v1 , v2 , v3 , v4 ∈ V sind genau dann koplanar, wenn die Vektoren v2 − v1 , v3 − v1 und v4 − v1 linear abhängig sind. (3) Zwei Geraden p1 + Kv1 und p2 + Kv2 sind genau dann koplanar, wenn die Vektoren p1 − p2 , v1 und v2 linear abhängig sind. Beweis: Die ersten zwei Aussagen folgen aus Satz 17, (2). Der zur affinen Hülle von (p1 , p2 , p1 + v1 , p2 + v2 ) parallele Untervektorraum wird von p1 − p2 , v1 und v2 erzeugt. Satz 20 : Zwei verschiedene koplanare Geraden schneiden einander in genau einem Punkt oder sie sind parallel. 2. VERTIEFUNG ZU KAP. 3, §2 9 Beweis: Seien M1 und M2 verschiedene koplanare Geraden und E die Ebene, die beide enthält. Wenn M1 und M2 nicht parallel sind, dann ist U1 ∩U2 = {0} und U1 + U2 = U1 ⊕ U2 ist der zu E parallele Untervektorraum. Wegen p1 , p2 ∈ E ist p1 − p2 ∈ U1 ⊕ U2 , daher gibt es eindeutig bestimmte Vektoren u1 ∈ U1 , u2 ∈ U2 so, dass p1 − p2 = u1 + u2 ist. Somit ist M1 ∩ M2 = {p1 − u1 } = {p2 + u2 }. §3. Polytope und Schwerpunkte Es seien K = Q oder R und V ein Vektorraum über K. Definition 21 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in V. Eine Linearkombination ∑ ci vi von (vi )i∈I heißt konvexe Linearkombinatii∈I on von (vi )i∈I , wenn ∑ ci = 1 und ci ≥ 0 für alle i ∈ I ist. i∈I Die Menge der konvexen Linearkombinationen von (vi )i∈I heißt konvexe Hülle von (vi )i∈I . Die konvexe Hülle zweier Vektoren v1 , v2 heißt Strecke zwischen v1 und v2 . Die konvexe Hülle dreier nicht kollinearer Punkte v1 , v2 , v3 heißt Dreieck mit Eckpunkten v1 , v2 , v3 . Eine Teilmenge von V heißt Polytop, wenn sie die konvexe Hülle einer endlichen Familie in V ist. Es sei I := {1, . . . , n} und c1 , . . . , cn ∈ R ≥0 . Für cn ̸= 1 ist ) ci ∑ civi = (1 − cn) ∑ 1 − cn vi + cnvn = (1 − cn)w + cnvn , i=1 i=1 n ( n−1 ci wobei w := ∑n−1 i=1 1−cn vi in der konvexen Hülle H von (v1 , . . . , vn−1 ) liegt. Daraus folgt: Für n ≥ 3 ist die konvexe Hülle von (v1 , . . . , vn ) die Vereinigung aller Strecken zwischen vn und den Elementen von H. Beispiel 22 : Eine Teilmenge von R ist genau dann ein Polytop, wenn sie ein abgeschlossenes Intervall ist. ( ) Satz 23 : Es seien P die konvexe Hülle einer Familie w j j∈J in V und (vi )i∈I eine Familie in P. Dann ist die konvexe Hülle von (vi )i∈I in P enthalten. 2. VERTIEFUNG ZU KAP. 3, §2 10 Beweis: Für (alle)i ∈ I ist der Vektor vi eine konvexe Linearkombination ∑ c ji w j von w j j∈J . j∈J Sei ∑ di vi eine konvexe Linearkombination von (vi )i∈I . Dann ist i∈I ( ) ∑ divi = ∑ ∑ dic jiw j = ∑ ∑ dic ji i∈I i∈I j∈J j∈J wj i∈I mit ∑ di c ji ≥ 0, für alle j ∈ J, und i∈I ) ( ∑ ∑ dic ji j∈J i∈I ( = ∑ di i∈I ) ∑ c ji j∈J = ∑ di = 1 . i∈I Daher ist ∑ di vi ∈ P . i∈I Definition 24 : Es sei (vi )i∈I eine endliche Familie in V . Der Schwerpunkt von (vi )i∈I ist 1 vi . # (I) ∑ i∈I Der Schwerpunkt von (v1 , v2 ) heißt Mittelpunkt der Strecke zwischen v1 und v2 . Satz 25 : Es seien u, v, w drei nicht kollineare Punkte in V . Die Gerade durch u bzw. v bzw. w und den Mittelpunkt der Strecke zwischen den anderen zwei Punkten heißt Schwerlinie des Dreiecks mit Eckpunkten u, v, w durch u bzw. v bzw. w. Die drei Schwerlinien sind paarweise verschieden und schneiden einander im Schwerpunkt 31 (u + v + w) von (u, v, w) . Beweis: Da u, v, w nicht kollinear sind, sind nach Satz 19 die Vektoren v − u und w − u linear unabhängig. Also sind auch v − u und 1 1 1 (v − u) + (w − u) = (v + w) − u 2 2 2 linear unabhängig, nach Satz 19 sind daher u, v, 12 (v + w) nicht kollinear. Somit liegt v nicht auf der Schwerlinie durch u . Daher sind die Schwerlinien durch u und durch v verschieden und die drei Schwerlinien haben 11 2. VERTIEFUNG ZU KAP. 3, §2 höchstens einen Schnittpunkt. Wegen ( ) ( ) 1 1 2 1 1 2 1 (u + v + w) = u + (v + w) = v + (u + w) = 3 3 3 2 3 3 2 ( ) 1 2 1 = w+ (u + v) 3 3 2 liegt der Schwerpunkt auf allen Schwerlinien. §4. Affine Räume Definition 26 : Es seien (G, ⋆) eine Gruppe mit neutralem Element e und M eine Menge. Eine Funktion G × M −→ M , (s, m) 7−→ s · m , ist eine Operation der Gruppe G auf der Menge M, wenn gilt: für alle m ∈ M ist e · m = m und für alle s,t ∈ G und alle m ∈ M ist (s ⋆ t) · m = s · (t · m). Beispiel 27 : Die Funktion Sn × {1, 2, . . . , n} → {1, 2, . . . , n} , (σ , i) 7→ σ (i) , ist eine Operation der Permutationsgruppe Sn auf der Menge {1, 2, . . . , n}. Definition 28 : Sei V ein Vektorraum über einem Körper K, A eine Menge und V × A → A , (v, a) 7→ v · a , eine Operation der Gruppe (V, +) auf A. (Also: Für alle a ∈ A, v, w ∈ V ist 0 · a = a und (v + w) · a = v · (w · a). A zusammen mit dieser Operation ist ein affiner Raum über V , wenn es für alle Elemente a, b ∈ A genau einen Vektor v ∈ V gibt mit v · a = b. Die Elemente von A heißen dann Punkte, die Elemente von V Vektoren des affinen Raums. Satz 29 : Sei A ein affiner Raum über V und a ∈ A. Die Funktion V −→ A , v 7−→ v · a , ist bijektiv. (Nach Wahl eines Nullpunktes“ kann ein affiner Raum als Vek” torraum betrachtet werden). Beweis: Folgt aus der Definition. 12 2. VERTIEFUNG ZU KAP. 3, §2 Beispiel 30 : Sei V ein Vektorraum, p ∈ V und U ein Untervektorraum von V . Dann ist der affine Unterraum p +U mit U × (p +U) −→ p +U (v, p + u) 7−→ p + (u + v) , ein affiner Raum über U. Insbesondere ist jeder Vektorraum ein affiner Raum (über sich selbst). Beispiel 31 : Sie E die Zeichenebene oder der Anschauungsraum und T (E) der Vektorraum der Translationen von E. Dann ist E mit T (E) × E −→ E , (t, x) 7−→ t(x) , ein affiner Raum über T (E). Möchte man in der Zeichenebene keinen Nullpunkt“ wählen, kann man ” sie als affinen Raum betrachten. Dann muss man zwischen Punkten (∈ E) und Vektoren (∈ T (E)) unterscheiden. Punkte können dann nicht addiert werden, aber Vektoren können addiert werden und auf Punkten wirken“. ” Sind P und Q Punkte von E und P ̸= Q, dann gibt es genau eine Trans⃗ bezeichnet. Die lation in T (E), die P auf Q abbildet. Sie wird häufig mit PQ Menge ⃗ |t ∈ R } ⊆ T (E) {t PQ ⃗ in T (E). Die Gerade durch P und ist die Gerade durch 0T (E) = idE und PQ ” Q in E“ ist dann als ⃗ {(t PQ)(P) |t ∈ R } ⊆ E ⃗ ⃗ definiert. Wegen (PQ)(P) = Q und (0 · PQ)(P) = idE (P) = P sind P und ⃗ wird als Richtungsvektor“ Q Punkte dieser Geraden. Die Translation PQ ” dieser Geraden bezeichnet. KAPITEL 3 Vertiefung zu Kap. 3, §3-5 §1. Mehr über Skalarprodukte In diesem Abschnitt sei V ein reeller Vektorraum und ⟨−, −⟩ ein Skalarprodukt auf V . Definition 32 : Ein reeller Vektorraum mit einem Skalarprodukt heißt reeller Prähilbertraum. Ein endlich-dimensionaler reeller Prähilbertraum heißt euklidischer Raum. Beispiel 33 : (Für Studierende mit Kenntnissen aus Analysis). Es seien a, b reelle Zahlen mit a < b und V der Vektorraum aller stetigen Funktionen vom Intervall [a, b] nach R . Die Funktion ⟨−, −⟩ : V ×V −→ R , ( f , g) 7−→ ∫ b a f (x) · g(x)dx , ist ein Skalarprodukt auf V . Die Norm von f ∈ V ist √ ∥f∥ = ∫ b f (x)2 dx . a Satz 34 : (Parallelogrammgleichung) Für alle Vektoren v und w in einem reellen Prähilbertraum ist ∥v + w∥2 + ∥v − w∥2 = 2∥v∥2 + 2∥w∥2 . Beweis: Nachrechnen. Definition 35 : Eine Norm auf V ist eine Funktion N : V −→ R ≥0 := {t ∈ R |t ≥ 0} , v 7−→ N(v) , mit den Eigenschaften: (1) Es ist N(v) = 0 genau dann, wenn v = 0 ist. (2) Für alle c ∈ R , v ∈ V ist N(cv) = |c|N(v) . (3) Für alle v, w ∈ V ist N(v + w) ≤ N(v) + N(w) . V zusammen mit einer Norm heißt normierter Raum . 13 3. VERTIEFUNG ZU KAP. 3, §3-5 14 Beispiel 36 : Ist ⟨−, −⟩ ein Skalarprodukt auf V , dann ist √ ∥ · ∥ : V −→ R , v 7−→ ∥v∥ := ⟨v, v⟩, eine Norm. Beispiel 37 : Die Funktion n N : R −→ R ≥0 , (c1 , c2 , . . . , cn ) 7−→ ∑ |ci | , n i=1 Rn . ist eine Norm (die Summennorm“) auf ” Die Parallelogrammgleichung gilt für diese Norm nicht, zum Beispiel ist für n = 2, v := (2, 1) und w := (1, 2): N(v + w)2 + N(v − w)2 = 36 + 4 = 40, aber 2 · N(v)2 + 2 · N(w)2 = 18 + 18 = 36. Satz 38 : N sei eine Norm auf V . Dann sind die folgenden Aussagen äquivalent: (1) Die Parallelogrammgleichung gilt für N, dh.: Für alle v, w ∈ V ist N(v + w)2 + N(v − w)2 = 2 · N(v)2 + 2 · N(w)2 . (2) Es gibt ein Skalarprodukt √ ⟨−, −⟩, das die Norm N induziert, dh.: für alle v ∈ V ist N(v) = ⟨v, v⟩. In diesem Fall ist dieses Skalarprodukt von v, w ∈ V durch 1 ⟨v, w⟩ := (N(v + w)2 − N(v − w)2 ) 4 definiert. Beweis: Wenn (2) gilt, dann folgt (1) aus Satz 34. Wenn (1) gilt, dann kann damit nachgeprüft werden, dass die oben definierte Funktion ⟨−, −⟩ die Eigenschaften eines Skalarproduktes hat. Definition 39 : Eine Familie (vi )i∈I in V heißt orthonormal bezüglich ⟨−, −⟩, wenn für alle i, j ∈ I gilt: ⟨vi , v j ⟩ = δi j . Eine Familie (vi )i∈I in V heißt Orthonormalbasis (kurz: ON-Basis) von V bezüglich ⟨−, −⟩, wenn sie eine Basis von V und orthonormal bezüglich ⟨−, −⟩ ist. Beispiel 40 : Es sei V der Vektorraum der endlichen Folgen in R. Für i ∈ N bezeichnen wir mit ei die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der 15 3. VERTIEFUNG ZU KAP. 3, §3-5 i-ten Stelle steht. Die Familie (ei )i∈N ist eine Basis von V . Durch ⟨a, b⟩ := ∑ aibi , für alle Folgen a, b in N i∈N wird ein Skalarprodukt auf V definiert. Die Familie (ei )i∈N ist eine ONBasis bezüglich dieses Skalarproduktes. Satz 41 : Eine orthonormale Familie ist linear unabhängig. Insbesondere: Wenn V endlich-dimensional ist, dann ist jede orthonormale Familie mit dimK (V ) Elementen eine ON-Basis von V . Beweis: Sei (vi )i∈I eine orthonormale Familie und (ci )i∈I eine Koeffizienten-Familie in K. Wenn ∑i∈I ci vi = 0 ist, dann ist für alle j ∈ I auch 0 = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = c j . i∈I i∈I Satz 42 : Sei w ∈ V und (vi )i∈I eine ON-Basis von V . Dann ist w = ∑⟨vi , w⟩vi . i∈I ( Die Koordinate von w bei vi ist das Skalarprodukt von vi mit w“.) ” Beweis: Sei w = ∑i∈I ci vi . Dann ist ⟨v j , w⟩ = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = ∑ ci δ ji = c j . i∈I i∈I i∈I §2. Interpolationsaufgaben Wir betrachten die folgenden Interpolationsaufgaben: Gegeben sind • Funktionen f1 , . . . , fk von R nach R, • paarweise verschiedene reelle Zahlen x1 , . . . , xn ∈ R und • reelle Zahlen y1 , . . . , yn ∈ R. Gesucht sind reelle Zahlen c1 , . . . , ck so, dass die Funktion f := ∑ki=1 ci fi die Bedingungen f (x1 ) = y1 , f (x2 ) = y2 , . . . , f (xn ) = yn erfüllt. r y1 x1 r r y2 x2 r y3 x3 y4 x4 16 3. VERTIEFUNG ZU KAP. 3, §3-5 Durch die Funktionen f1 , . . . , fk wird der Typ“ der Interpolationsaufgabe ” vorgegeben. Die reellen Zahlen x1 , . . . , xn heißen Stützstellen, die reellen Zahlen y1 , . . . , yn (Funktions-)Werte der Interpolationsaufgabe. Die gesuchte Funktion f heißt interpolierende Funktion. Wir suchen also eine Funktion f des vorgegebenen Typs so, dass die Funktionswerte von f in den Stützstellen die vorgegebenen Werte der Interpolationsaufgabe sind. Anders formuliert: Wir suchen Zahlen c1 , . . . , ck so, dass f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1 f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2 .. .. .. . . . f1 (xn )c1 + f2 (xn )c2 + . . . + fk (xn )ck = yn ist. Das ist ein System von n linearen Gleichungen mit k Unbekannten c1 , . . . , ck . In Matrizenform: f1 (x1 ) . . . fk (x1 ) c1 y1 f1 (x2 ) . . . fk (x2 ) c2 y2 . · . = . . .. .. .. . . .. .. f1 (xn ) . . . fk (xn ) ck yn Beispiel 43 : ( Lineare Interpolation“). ” Wenn f1 die konstante Funktion 1 (also die Funktion, die jeder Zahl die Zahl 1 zuordnet) und f2 die Identität (also die Funktion, die jeder Zahl sich selbst zuordnet) ist, dann suchen wir eine Funktion f := c1 f1 + c2 f2 mit ( f (xi ) =) c1 + c2 xi = yi , 1 ≤ i ≤ n . Die Aufgabe, Zahlen c1 und c2 mit den Eigenschaften c1 + c2 x1 = y1 .. .. .. . . . c1 + c2 xn = yn zu finden, ist ein System von n linearen Gleichungen mit zwei Unbekannten. In Matrizenform y1 1 x1 ( ) y2 1 x2 c1 . . · .. .. c2 = ... . yn 1 xn Beispiel 44 : (Interpolation durch Polynomfunktionen). Für 1 ≤ i ≤ k sei fi : R −→ R, z 7−→ zi−1 , die i − 1-te Potenzfunktion. Dann ist die gesuchte Funktion f eine Polynomfunktion vom Grad k − 1, also f : R −→ R, z 7−→ c1 + c2 z + . . . + ck zk−1 . 3. VERTIEFUNG ZU KAP. 3, §3-5 17 Wir suchen reelle Zahlen c1 , c2 , . . . , ck mit der Eigenschaft, dass c1 + x1 c2 + . . . + x1k−1 ck = y1 .. .. .. . . . k−1 c1 + xn c2 + . . . + xn ck = yn ist, müssen also ein System von n Gleichungen mit k Unbekannten lösen. In Matrizenform: 1 x1 . . . x1k−1 y1 c1 1 x . . . xk−1 c2 y2 2 2 . · .. = .. .. .. . .. .. . . . . . yn ck 1 xn . . . xnk−1 §3. Systeme linearer Gleichungen (mit und ohne Lösung) Das System f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1 f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2 .. .. .. . . . f1 (xn )c1 + f2 (xn )c2 + . . . + fk (xn )ck = yn von k linearen Gleichungen mit den Unbekannten c1 , . . . , ck kann auch in der Form fk (x1 ) y1 f1 (x1 ) . . c1 .. + . . . + ck .. = ... , fk (xn ) yn f1 (xn ) oder, mit den Abkürzungen y1 y := ... und yn fi (x1 ) fi (x) := ... , 1 ≤ i ≤ k, fi (xn ) kurz als k ∑ cifi(x) = y i=1 angeschrieben werden. Wir können also das System linearer Gleichungen als die folgende Aufgabe interpretieren: Schreibe die Spalte y als Linearkombination ∑ki=1 ci fi (x) der Spalten fi (x) , 1 ≤ i ≤ k. Das ist aber nur dann möglich, wenn y in dem von den Spalten fi (x) , 1 ≤ i ≤ k , erzeugten Untervektorraum U von Rn×1 enthalten ist. Wenn das nicht der Fall ist, ist dieses System linearer Gleichungen nicht lösbar. 18 3. VERTIEFUNG ZU KAP. 3, §3-5 Im Fall von Beispiel Lineare Interpolation“ ist U die von ” 1 x1 . 1 := .. und x := ... 1 xn erzeugte Ebene in Rn×1 . Im Fall von Beispiel Interpolation durch Polynomfunktionen vom Grad ” ≤ k“ ist U der von 1 x1 . .. , ... , . . . 1 xn x1k−1 , ... xnk−1 erzeugte Untervektorraum von Rn×1 . Wenn die Interpolationsaufgabe einerseits eine Situation beschreibt, von der man weiß, dass es eine Lösung gibt, andererseits die Aufgabe aber nicht lösbar ist, weil y mit Mess- oder Rundungsfehlern behaftet ist, liegt es nahe, dass y eigentlich“ ein Element von U sein sollte. Wir erzwingen die ” Lösbarkeit der Aufgabe, indem wir y durch eine Spalte y′ in U ersetzen! Wie sollen wir diese Spalte y′ aber wählen? Am einfachsten ist es, y′ in U so zu wählen, dass der Abstand zwischen y′ und y möglichst klein ist. Wir suchen also ein Element des Vektorraums U so, dass der Abstand ∥y′ − y∥ zwischen y und y′ so klein wie möglich ist. Wir müssen nun festlegen, welchen Abstand wir meinen: Wenn wir den (durch das Standardskalarprodukt auf dem Rn induzierten) euklidischen Abstand im Rn wählen, dann ist √ ∥y′ − y∥ := n ∑ (y′i − yi)2 . i=1 Für positive reelle Zahlen a und b ist a ≤ b genau dann, wenn a2 ≤ b2 ist. Daher ist der ∥y′ − y∥ genau dann minimal, wenn die Summe ∑ni=1 (y′i − yi )2 der Fehlerquadrate“ minimal ist. ” Die Spalte y′ ist der Fußpunkt des Lotes von y auf U. §4. Lineare Regression Genau dann ist der Abstand zwischen y′ und y kleiner oder gleich dem Abstand zwischen y und jedem anderen Element z von U, wenn die Gerade durch y′ und y normal zum Untervektorraum U steht. Das folgt leicht aus dem Satz von Pythagoras: 3. VERTIEFUNG ZU KAP. 3, §3-5 19 U hy Sphhhhhh h S z S Sp y′ Das Dreieck mit den Eckpunkten y′ , y und z hat bei y′ einen rechten Winkel. Der Abstand zwischen y und z ist die Länge der Hypotenuse, also größer oder gleich der Länge einer Kathete, also dem Abstand zwischen y und y′ . Die Gerade durch y′ und y steht genau dann normal zu U, wenn alle Skalarprodukte von y′ − y mit den erzeugenden Spalten von U gleich 0 sind. Für y′ = ∑ki=1 ci fi (x) ∈ U muss also gelten: ⟨y′ − y, fj (x)⟩ = 0, 1 ≤ j ≤ k . Anders geschrieben: k ∑ ci⟨fi(x), fj(x)⟩ = ⟨y, fj(x)⟩, 1 ≤ j ≤ k . i=1 Wenn wir dieses System von k linearen Gleichungen mit k Unbekannten c1 , . . . , ck lösen, dann erhalten wir die annähernd“ interpolierende Funktion ” f = ∑ki=1 ci fi . Bei linearer Interpolation ist • y′ = c2 x + c1 1 ∈ U und • die Gerade durch y und y′ steht normal auf der von x und 1 erzeugten Ebene U. Also ist • ⟨c2 x + c1 1 − y, x⟩ = 0 und • ⟨c2 x + c1 1 − y, 1⟩ = 0. Daraus erhalten wir das folgende System von zwei linearen Gleichungen mit zwei Unbekannten c1 und c2 : • c2 ⟨x, x⟩ + c1 ⟨1, x⟩ = ⟨x, y⟩ • c2 ⟨x, 1⟩ + c1 ⟨1, 1⟩ = ⟨1, y⟩ Als Lösung erhalten wir c2 = ⟨1, 1⟩.⟨x, y⟩ − ⟨1, x⟩.⟨1, y⟩ ⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2 und c1 = ⟨x, x⟩.⟨1, y⟩ − ⟨1, x⟩.⟨x, y⟩ . ⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2 3. VERTIEFUNG ZU KAP. 3, §3-5 20 Wenn ⟨−, −⟩ das Standard-Skalarprodukt ist, dann ist ⟨x, y⟩ = ∑ni=1 xi yi , ⟨1, x⟩ = ∑ni=1 xi , ⟨1, y⟩ = ∑ni=1 yi , ⟨1, 1⟩ = n, ⟨x, x⟩ = ∑ni=1 xi2 und ⟨y, y⟩ = ∑ni=1 y2i , daher c2 = und c1 = n ∑ni=1 xi yi − (∑ni=1 xi )(∑ni=1 yi ) n ∑ni=1 xi2 − (∑ni=1 xi )2 (∑ni=1 xi2 )(∑ni=1 yi ) − (∑ni=1 xi )(∑ni=1 xi yi ) . n ∑ni=1 xi2 − (∑ni=1 xi )2 Wir haben damit die Funktion f : R −→ R, z 7−→ c2 z + c1 , so bestimmt, dass der (euklidische) Abstand vom n-Tupel der gegebenen (gemessenen oder gerundeten) ungenauen Funktionswerte (y1 , . . . , yn ) zum n-Tupel der berechneten Funktionswerte ( f (x1 ), . . . , f (xn )) möglichst klein ist, also ∑ni=1 (yi − (c2 xi + c1 ))2 möglichst klein ist. Der Graph dieser Funktion heißt Regressionsgerade oder Trendlinie der Punkte (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ). Man rechnet leicht nach, dass 1 n 1 n f ( ∑ xi ) = ∑ yi n i=1 n i=1 ist. Das Paar der arithmetischen Mittel von (x1 , . . . , xn ) und (y1 , . . . , yn ) liegt also immer auf der Regressionsgeraden. KAPITEL 4 Mehr über lineare Funktionen In diesem Kapitel sei K ein Körper. §1. Der Graph einer linearen Funktion Satz 45 : Seien V1 , . . . ,Vℓ Vektorräume über K. Dann wird das kartesische Produkt V1 × · · · ×Vℓ = {(x1 , . . . , xℓ ) | x1 ∈ V1 , . . . , xℓ ∈ Vℓ } mit der komponentenweisen Addition (x1 , . . . , xℓ ) + (y1 , . . . , yℓ ) := (x1 + y1 , . . . , xℓ + yℓ ) und der komponentenweisen Skalarmultiplikation c(x1 , . . . , xℓ ) := (cx1 , . . . , cxℓ ) mit c ∈ K ein Vektorraum und heißt der Produktraum von V1 , . . . ,Vℓ . Wenn (v11 , . . . , v1n1 ), . . . , (vℓ1 , . . . , vℓnℓ ) Basen von V1 , . . . ,Vℓ sind, dann ist ((v11 , 0, . . . , 0), . . . , (v1n1 , 0, . . . , 0), . . . . . . , ((0, . . . , 0, vℓ1 ), . . . , (0, . . . , 0, vℓnℓ )) eine Basis von V1 × · · · ×Vℓ , insbesondere gilt dimK (V1 × · · · ×Vℓ ) = dimK (V1 ) + · · · + dimK (Vℓ ) . Beweis: Es ist leicht zu zeigen, dass V1 × · · · ×Vℓ mit der komponentenweisen Addition und Skalarmultiplikation ein Vektorraum. Wir beweisen daher nur, dass ((v11 , 0, . . . , 0), . . . , (0, . . . , 0, vℓnℓ )) eine Basis von V1 × · · · ×Vℓ ist. Wir schreiben x1 ∈ V1 , . . . , xℓ ∈ Vℓ als Linearkombinationen der Basen (v11 , . . . , v1n1 ), . . . , (vℓ1 , . . . , vℓnℓ ): n1 nℓ i=1 i=1 x1 = ∑ d1i v1i , . . . , xℓ = ∑ dℓi vℓi . Dann ist (x1 , . . . , xℓ ) = (x1 , 0, . . . , 0) + · · · + (0, . . . , 0, xℓ ) n1 nℓ i=1 i=1 = ∑ d1i (v1i , 0, . . . , 0) + · · · + ∑ dℓi (0, . . . , 0, vℓi ) 21 22 4. MEHR ÜBER LINEARE FUNKTIONEN und ((v11 , 0, . . . , 0), . . . , (0, . . . , 0, vℓnℓ )) ein Erzeugendensystem von V1 × · · · ×Vℓ . Um die lineare Unabhängigkeit zu zeigen, seien c11 , . . . , cℓnℓ ∈ K mit n1 nℓ i=1 i=1 ∑ c1i(v1i, 0, . . . , 0) + · · · + ∑ cℓi(0, . . . , 0, vℓi) = (0, . . . , 0) . Dann ist n1 nℓ i=1 i=1 ( ∑ c1i v1i , . . . , ∑ cℓi vℓi ) = (0, . . . , 0) , also n1 ∑ c1iv1i = 0 , . . . , i=1 nℓ ∑ cℓivℓi = 0 . i=1 Da (v11 , . . . , v1nℓ ), . . . , (vℓ1 , . . . , vℓnℓ ) Basen von V1 , . . . ,Vℓ sind, folgt c11 = · · · = cℓnℓ = 0, was zu zeigen war. Definition 46 : Seien V und W Vektorräume über K. Eine Funktion f : V → W heißt K-linear, wenn die folgenden zwei Bedingungen erfüllt sind: (1) Für alle v, w ∈ V ist f (v + w) = f (v) + f (w) . ( Das Bild der Summe ist die Summe der Bilder.“) ” (2) Für alle c ∈ K und für alle v ∈ V ist f (cv) = c f (v) . ( Das Bild des c-fachen ist das c-fache des Bildes.“) ” Beispiel 47 : Ein Kaufhaus bietet n Waren an. Kauft jemand ai Einheiten der i-ten Ware, 1 ≤ i ≤ n, so muss er p(a1 , . . . , an ) Euro zahlen. Die Funktion p : Q n −→ Q , (a1 , . . . , an ) 7−→ p(a1 , . . . , an ) ist genau dann linear, wenn es keinen Mengenrabatt, keine Sonderaktionen ( nimm drei, zahl’ zwei“) oder ähnliches gibt, also: ” (1) Nimmt man bei einem Einkauf ai und bei einem anderen Einkauf bi Einheiten der i-ten Ware, 1 ≤ i ≤ n, dann bezahlt man in Summe dasselbe, wie wenn man alles bei einem Einkauf genommen hätte (p(a1 , . . . , an ) + p(b1 , . . . , bn ) = p(a1 + b1 , . . . , an + bn )). (2) Kauft man von jeder Ware das c-fache, dann muss man c-mal soviel zahlen (p(ca1 , . . . , can ) = c · p(a1 , . . . , an )). Beispiel 48 : V sei ein Untervektorraum des K-Vektorraums F(K, K) aller Funktionen von K nach K und t0 , . . . ,tn seien paarweise verschiedene Elemente von K. Dann ist die Auswertungsfunktion“ ” a : V −→ K n+1 , f 7−→ ( f (t0 ), f (t1 ), . . . , f (tn )), linear. 23 4. MEHR ÜBER LINEARE FUNKTIONEN Beispiel 49 : Für jede Matrix A ∈ K m×n ist die Funktion K n×1 → K m×1 , x 7→ Ax , K-linear. Später werden wir sehen, dass jede lineare Funktion vom Vektorraum aller m-Spalten in den Vektorraum aller n-Spalten durch Multiplikation mit einer Matrix gegeben ist. Satz 50 : Es seien V und W Vektorräume über K und (vi )i∈I eine (beliebige) Basis von V . Eine Funktion f : V → W ist genau dann linear, wenn der Graph von f ein Untervektorraum des Produktraums V ×W ist. In diesem Fall hat der Graph von f die Basis ((vi , f (vi )))i∈I . Insbesondere gilt dimK (Graph( f )) = dimK (V ) . Beweis: Nach Definition ist Graph( f ) = {(v, f (v)) | v ∈ V } ⊂ V ×W . Seien u, w ∈ V und c ∈ K. Wenn f linear ist, dann ist 0V ×W = (0V , 0W ) = (0V , f (0V )) ∈ Graph( f ), (u, f (u))+(w, f (w)) = (u+w, f (u)+ f (w)) = (u+w, f (u+w)) ∈ Graph( f ) und c(w, f (w)) = (cw, c f (w)) = (cw, f (cw)) ∈ Graph( f ), also Graph( f ) ein Untervektorraum von V ×W . Wenn umgekehrt Graph( f ) ein Untervektorraum von V ×W ist, dann sind (u, f (u)) + (w, f (w)) = (u + w, f (u) + f (w)) ∈ Graph( f ) und c(w, f (w)) = (cw, c f (w)) ∈ Graph( f ), somit f (u + w) = f (u) + f (w) und f (cw) = c f (w), also f linear. Wenn f linear ist, dann ist auch die Funktion F : V → Graph( f ) , x 7→ (x, f (x)) , linear und hat die Umkehrfunktion Graph( f ) → V , (x, f (x)) 7→ x. Daher ist F ein Isomorphismus und (F(vi ))i∈I eine Basis von Graph( f ). Beispiel 51 : Es sei k eine reelle Zahl und f die lineare Funktion f : R −→ R, z 7−→ kz. Dann ist Graph(f) = {(z, kz)|z ∈ R} = {z(1, k)|z ∈ R} = R(1, k) ⊆ R × R die Gerade durch (0, 0) und (1, k). Beispiel 52 : Es seien a, b reelle Zahlen und g die lineare Funktion g : R2 −→ R, (x, y) 7−→ ax + by. Dann ist Graph(g) = {(x, y, ax+by) | x, y ∈ R} = {x·(1, 0, a)+y·(0, 1, b) | x, y ∈ R} = = R(1, 0, a) + R(0, 1, b) ⊆ R2 × R 24 4. MEHR ÜBER LINEARE FUNKTIONEN die Ebene durch (0, 0, 0), (1, 0, a) und (0, 1, b). §2. Bild und Kern einer linearen Funktion In diesem Abschnitt seien V und W Vektorräume über K und f : V −→ W eine lineare Funktion. Definition 53 : Die Menge Bild( f ) := { f (v) | v ∈ V } ⊆ W heißt Bild von f und die Menge Kern( f ) := {v ∈ V | f (v) = 0W } ⊆ V heißt Kern von f . Satz 54 : Bild( f ) ist ein Untervektorraum von W , Kern( f ) ist ein Untervektorraum von V . Die Dimension des Bildes von f heißt Rang von f (Schreibweise rg( f )). Beweis: Da f linear ist, ist 0V ∈ Kern( f ). Für u, v ∈ Kern( f ) und c ∈ K folgt aus f (u + v) = f (u) + f (v) = 0W auch u + v ∈ Kern( f ), sowie aus f (cu) = c f (u) = 0W auch cu ∈ Kern( f ). Daher ist Kern( f ) ein Untervektorraum von V . Analog zeigt man, dass Bild( f ) ein Untervektorraum von W ist. Satz 55 : Sei A ∈ K m×n und L(A, 0) := {x ∈ K n×1 | Ax = 0} der Lösungsraum des durch A definierten Systems homogener linearer Gleichungen. Fasst man die Matrix A als lineare Funktion A : K n×1 → K m×1 , x 7→ Ax , auf, dann ist Kern(A) = L(A, 0) und Bild(A) = K ⟨A−1 , . . . , A−n ⟩. Beweis: Es ist Kern(A) = {x ∈ K n×1 | Ax = 0} = L(A, 0) und Bild(A) = = { Ax | x ∈ K n×1 } = { ∑ni=1 xi A−i | x1 , . . . xn ∈ K } = K ⟨A−1 , . . . , A−n ⟩. Satz 56 : Seien V,W endlich-dimensionale Vektorräume über K, f : V → W eine K-lineare Funktion und r := rg( f ). Dann gibt es eine Basis (v1 , . . . , vn ) von V so, dass (1) ( f (v1 ), . . . , f (vr )) eine Basis von Bild( f ) und (2) (vr+1 , . . . , vn ) eine Basis von Kern( f ) ist. Insbesondere gilt dimK (V ) = dimK (Bild( f )) + dimK (Kern( f )) . 25 4. MEHR ÜBER LINEARE FUNKTIONEN Ergänzt man die Basis ( f (v1 ), . . . , f (vr )) von Bild( f ) zu einer Basis (w1 , . . . , wm ) von W , dann ist 1 0 ... .. .. . . 0 . . ∈ K m×n . . Dr := . . 1 0 .. . (nur an den Stellen (1, 1), . . . , (r, r) stehen Einsen und sonst Nullen) die Matrix von f bezüglich der Basen (v1 , . . . , vn ) und (w1 , . . . , wm ). Beweis: Sei (w1 , . . . , wr ) eine Basis von Bild( f ). Dann kann man Urbilder v1 , . . . , vr ∈ V von w1 , . . . , wr unter f wählen. Sei (u1 , . . . , us ) eine Basis von Kern( f ). Dann ist (v1 , . . . , vr , u1 , . . . , us ) ein Erzeugendensystem von V , weil für y ∈ V aus r r r i=1 i=1 i=1 f (y) = ∑ ai wi = ∑ ai f (vi ) = f ( ∑ ai vi ) folgt, dass z := y − ∑ri=1 ai vi ∈ Kern( f ) ist. Daher ist y = z + ∑ri=1 ai vi eine Linearkombination von (v1 , . . . , vr , u1 , . . . , us ). Wir zeigen noch, dass (v1 , . . . , vr , u1 , . . . , us ) linear unabhängig ist. Seien dazu c1 , . . . , cr , d1 , . . . , ds ∈ K mit r s i=1 j=1 ∑ ci vi + ∑ d j u j = 0 . Dann ist 0 = f (∑ri=1 ci vi + ∑sj=1 d j u j ) = ∑ri=1 ci f (vi ) = ∑ri=1 ci wi . Da (w1 , . . . , wr ) linear unabhängig ist, sind alle ci gleich 0. Dann ist ∑sj=1 d j u j = 0, und aus der linearen Unabhängigkeit von u1 , . . . , us folgt d1 = · · · = ds = 0. Also ist (v1 , . . . , vr , u1 , . . . , us ) die gesuchte Basis von V . Insbesondere ist r + s = n. §3. Systeme linearer Gleichungen in koordinatenfreier Form Definition 57 : Ein System linearer Gleichungen in koordinatenfreier Form ist eine Aufgabe: • Gegeben sind eine lineare Funktion f : V → W und ein Vektor y ∈ W . • Gesucht ist eine gute Beschreibung“ der Menge ” L( f , y) := f −1 ({y}) = {x ∈ V | f (x) = y} aller Vektoren x ∈ V , für die f (x) = y ist. 26 4. MEHR ÜBER LINEARE FUNKTIONEN Die Menge L( f , y) heißt Lösungsmenge des durch f und y gegebenen Systems linearer Gleichungen. Ihre Elemente heißen Lösungen dieses Systems. Das durch f und y gegebene System linearer Gleichungen heißt homogen, wenn y = 0W ist, ansonsten inhomogen. Die Lösungsmenge eines homogenen Systems linearer Gleichungen ist L( f , 0) = Kern( f ) . Satz 58 : Sei f : V → W K-linear, y ∈ W und z ∈ L( f , y) (also ist L( f , y) insbesondere nicht leer). Dann ist L( f , y) = z + Kern( f ) ein affiner Unterraum von V mit Aufpunkt z und parallelem Untervektorraum Kern( f ). Das durch f und y gegebene System lösen“bedeutet daher: finde ” (irgend)ein Urbild z von y unter f und (irgend)eine Basis von Kern( f ). Falls V endlichdimensional ist, gilt weiters dimK (L( f , y)) = dimK (V ) − rg( f ) . Beweis: Sei v ∈ Kern( f ). Dann ist f (z + v) = f (z) + f (v) = y + 0 = y, also z + v ∈ L( f , y). Sei x ∈ L( f , y). Dann ist f (x − z) = f (x) − f (z) = y − y = 0, also x − z ∈ Kern( f ) und x = z + (x − z) ∈ {z + v | v ∈ Kern( f )}. Nach Satz 56 ist dimK (Kern( f )) = dimK (V ) − rg( f ) . Beispiel 59 : Fasst man eine Matrix A ∈ K m×n als eine lineare Funktion f : K n×1 → K m×1 , x 7→ Ax , auf, dann ist L( f , y) = L(A, y). Beispiel 60 : Sei C( R , R ) := { f | f : R → R stetig}, C1 ( R , R ) := { f | f : R → R stetig differenzierbar} und D : C1 ( R , R ) → C( R , R ) , f 7→ f ′ , wobei f ′ die Ableitung der Funktion f bezeichnet. Dann sind C( R , R ) und C1 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D ist R -linear. Der Unterraum Kern(D) besteht aus allen konstanten Funktionen. Eine Funktion f ∈ C1 ( R , R ) heißt Stammfunktion von g ∈ C( R , R ), wenn D f = g ist. Die Menge aller Stammfunktionen von g ist L(D, g) = f + Kern(D). 27 4. MEHR ÜBER LINEARE FUNKTIONEN Satz 61 : Seien V,W Vektorräume über K der Dimensionen n, m mit Basen v , w , sei f : V → W K-linear mit Matrix A := M( f , v, w) ∈ K m×n und y = wb ∈ W . Dann bildet der Koordinaten-Isomorphismus V → K n×1 , vc 7→ c , L( f , y) auf L(A, b) ab und Kern( f ) auf L(A, 0). Beweis: Es ist vc ∈ L( f , y) genau dann wenn w(Ac) = wb, also c ∈ L(A, b) ist. Nach Satz 61 kann für f : V → W und y ∈ W das System linearer Gleichungen ( f , y) wie folgt gelöst werden: (1) Wähle Basen v , w von V,W . (2) Berechne die Matrix A := M( f , v, w) und die Koordinatenspalte b von y bezüglich w . (3) Berechne die Lösungsmenge L(A, b). Wenn L(A, b) leer ist, dann ist auch L( f , y) leer. Wenn z ∈ L(A, b) und (u1 , . . . , us ) eine Basis von L(A, 0) ist, dann ist vz ∈ L( f , y) und (vu1 , . . . , vus ) eine Basis von Kern( f ). Im Schulunterricht entsprechen Systeme linearer Gleichungen in koordinatenfreier Form gewissen Textaufgaben“, und die Umwandlung in die ” Form Ax = b nennt man den Ansatz finden“. ” Beispiel 62 : Wir suchen alle Polynomfunktionen p ∈ R [x] mit p(−1) = 2, p(1) = 1, p(2) = 1 und gr(p) < 5 . Sei V := {q ∈ R [x] | gr(q) < 5}, W := R 3 , f : V −→ W , q 7−→ (q(−1), q(1), q(2)) , und y := (2, 1, 1) ∈ W . Die Funktion f ist linear. Wir wählen die Basis v := (1, x, x2 , x3 , x4 ) von V und die Standardbasis w := (e1 , e2 , e3 ) von W = R 3 . Dann ist 1 −1 1 −1 1 2 A := M( f , v, w) := 1 1 1 1 1 und b := 1 . 1 2 4 8 16 1 Man berechnet mit dem Gauß-Verfahren 4 −4 −2 3 0 1 − 1 2 1 + R 2 + R 5 . L(A, b) = 6 0 −1 0 −1 0 0 28 Daher ist 4. MEHR ÜBER LINEARE FUNKTIONEN 4 1 1 L( f , y) = { − x + x2 + 3 2 6 2 3 +c(−2 + x + 2x − x ) + d(−4 + 5x2 − x4 ) | c, d ∈ R } . Satz 63 : Sei V ein endlich-dimensionaler Vektorraum über K und Z ein affiner Unterraum von V . Dann ist Z die Lösungsmenge eines Systems linearer Gleichungen, d.h. es gibt eine lineare Funktion f : V → W und einen Vektor y ∈ W mit Z = L( f , y) . (Dann ist Z durch f und y in impliziter Form“ gegeben). ” Wenn der affine Unterraum Z durch einen Aufpunkt p und eine Basis (u1 , . . . , uk ) des parallelen Untervektorraums gegeben ist, dann kann ein solches System linearer Gleichungen auf die folgende Weise berechnet werden: Ergänze (u1 , . . . , uk ) zu einer Basis (u1 , . . . , uk , uk+1 , . . . , un ) von V . Setze f : V −→ K n−k , n ∑ ciui 7−→ (ck+1, ck+2, . . . , cn) i=1 und y := f (p). Beweis: Seien f und y wie im Satz definiert. Dann ist Kern( f ) = =K < u1 , . . . , uk > und p ∈ L( f , y). Nach Satz 58 ist Z = L( f , y).