Vertiefung Lineare Algebra 1 Schriftliche Unterlagen zur Vorlesung im Wintersemester 2011/12 Franz Pauer c 2011 I NSTITUT F ÜR M ATHEMATIK , U NIVERSIT ÄT I NNSBRUCK ⃝ KAPITEL 1 Vertiefung zu Kap. 2, §3 In diesem Kapitel sei K ein Körper. §1. Erzeugendensysteme, lineare Unabhängigkeit und Basen In der Vorlesung Lineare Algebra 1“ wurde der Begriff Linearkom” bination eines n-Tupels von Vektoren eingeführt. Wir erweitern diesen Begriff nun auf beliebige (auch unendliche) Familien (vi )i∈I von Vektoren. Die Definition im Skriptum Lineare Algebra 1 entspricht dann dem Spezialfall I := {1, . . . , n}. Definition 1 : Sei V ein Vektorraum über K und I eine (beliebige) Menge. Eine Familie (ci )i∈I von Elementen in K heißt Koeffizientenfamilie, wenn ci ̸= 0 für nur endlich viele i ∈ I ist. Sei (vi )i∈I eine Familie von Vektoren in V . Ein Vektor w ∈ V heißt eine Linearkombination von (vi )i∈I , wenn es eine Koeffizientenfamilie (ci )i∈I gibt, sodass w= ∑ ci vi i∈I,ci ̸=0 ist. Wir schreiben im weiteren einfach ∑ ci vi anstatt ∑ ci vi . i∈I,ci ̸=0 i∈I Die Menge aller Linearkombinationen von (vi )i∈I ist ein Untervektorraum von V und enthält alle Vektoren vi , i ∈ I. Er heißt der von vi , i ∈ I, erzeugte Untervektorraum von V und wird mit K ⟨vi | i ∈ I⟩ oder ∑ Kvi i∈I bezeichnet. Definition 2 : Sei V ̸= {0} ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren in V heißt genau dann ein Erzeugendensystem von V bzw. linear unabhängig in V bzw. eine Basis von V , wenn jeder Vektor in V auf mindestens eine bzw. höchstens eine bzw. genau eine Weise als Linearkombination von (vi )i∈I geschrieben werden kann. Wir schreiben linear abhängig anstatt nicht linear unabhängig. Die leere Menge ist eine Basis von {0}. 1 1. VERTIEFUNG ZU KAP. 2, §3 2 Satz 3 : Sei V ̸= {0} ein Vektorraum über K und (vi )i∈I eine Familie von Vektoren in V . (1) Eine Basis von V ist ein linear unabhängiges Erzeugendensystem. (2) Die Familie (vi )i∈I von Vektoren ist genau dann ein Erzeugendensystem von V , wenn K ⟨vi | i ∈ I⟩ = V ist. (3) Die Familie (vi )i∈I von Vektoren ist genau dann linear unabhängig, wenn für jede Koeffizientenfamilie (ci )i∈I aus ∑ civi = 0 i∈I folgt, dass ci = 0 für alle i ∈ I ist. Beweis: (1) und (2) folgen aus der Definition der Begriffe Erzeugendensystem, linear unabhängig und Basis. (3) Wenn sich jeder Vektor aus V auf höchstens eine Weise als Linearkombination von (vi )i∈I schreiben lässt, dann folgt aus ∑ civi = 0V = ∑ 0K vi i∈I i∈I auf Grund der Eindeutigkeit ci = 0K für 1 ≤ i ≤ n. Sei umgekehrt (vi )i∈I linear unabhängig in V und w ∈ V so, dass es eine Koeffizientenfamilie (ci )i∈I mit w = ∑ ci vi i∈I gibt. Falls (di )i∈I eine weitere Koeffizientenfamilie mit w = ∑ di vi i∈I ist, erhält man 0V = w − w = ∑ ci vi − ∑ di vi = ∑(ci − di )vi . i∈I i∈I i∈I Nach Annahme folgt ci − di = 0K für alle i ∈ I, also ci = di für alle i ∈ I. Beispiel 4 : Die Familie (Ekℓ )1≤k≤m = (Ekℓ )(k,ℓ)∈{1,...,m}×{1,...,n} 1≤ℓ≤n 1. VERTIEFUNG ZU KAP. 2, §3 3 der Standard-Matrizen ist eine Basis von K m×n und heißt die Standardbasis von K m×n . Für A ∈ K m×n ist A = ∑ Akℓ Ekℓ , 1≤k≤m 1≤ℓ≤n also ist A die Koordinatenfamilie von A bezüglich der Standardbasis (Ekℓ )1≤k≤m (und Akℓ die Koordinate von A bei Ekℓ ). 1≤ℓ≤n Beispiel 5 : Es seien I eine endliche Menge und V die Menge aller Funktionen von I in einen Körper K. Für i ∈ I sei δi die durch δi ( j) := δi j , j ∈ I, definierte Funktion von I nach K. Dann ist die Familie (δi )i∈I eine K-Basis von V . Für f ∈ V ist f = ∑ f (i)δi . i∈I Beispiel 6 : Es sei K ein Körper und F := {(ai )i∈N | ai ∈ K, i ∈ N} die Menge aller Folgen in K. Mit den durch (ai )i∈N + (bi )i∈N := (ai + bi )i∈N und c · (ai )i∈N := (cai )i∈N definierten Rechenoperationen wird F zu einem Vektorraum. Mit ei (i ∈ N) bezeichnen wir die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der i-ten Stelle steht. Die Familie (ei )i∈N ist linear unabhängig, aber kein Erzeugendensystem von F. Zum Beispiel kann die Folge (1, 1, 1, . . . , 1, . . .) nicht als Linearkombination der Familie (ei )i∈N geschrieben werden. Der von der Familie (ei )i∈N erzeugte Untervektorraum ist die Menge aller Folgen, von denen nur endlich viele Folgenglieder nicht 0 sind. Er heißt Vektorraum der endlichen Folgen in K. Die Familie (ei )i∈N ist eine Basis dieses Vektorraums, daher ist er unendlich-dimensional. §2. Rechnen mit Koordinaten In diesem Abschnitt seien V und W endlich-dimensionale Vektorräume über K, n ∈ N die Dimension von V und v := (v1 , . . . , vn ) eine Basis von V . Definition 7 : Seien p und q positive ganze Zahlen und u := (u1 , . . . , u p ) ∈ V p 1. VERTIEFUNG ZU KAP. 2, §3 4 ein p-Tupel von Vektoren in V . Für T ∈ K p×q sei ( ) p p ( ) uT := (uT )1 , . . . , (uT )q := ∑ Ti1 ui , . . . , ∑ Tiq ui ∈ V q . i=1 i=1 Die Bezeichnung uT ist eine Merkhilfe, weil man analog zur Matrizenrechnung über K den Vektor (uT ) j ∈ V nach der Regel Zeile u mal Spalte T− j“ ” berechnet. Satz 8 : Seien p, q, r positive ganze Zahlen und u := (u1 , . . . , u p ) ∈ V p . Dann gilt: (1) uI p = u (2) Für T ∈ K p×q und U ∈ K q×r ist u(TU) = (uT )U . (3) Für T ∈ GL p (K) und u′ := uT gilt u = u′ T −1 . Beweis: (1) gilt nach Definition, (2) rechnet man nach und (3) folgt aus u = uI p = u(T T −1 ) = (uT )T −1 = u′ T −1 . Definition 9 : Seien w ∈ V und c1 , . . . , cn ∈ K die Koordinaten von w bezüglich v, also n w = ∑ ci vi = vc ∈ V , i=1 Dann heißt die Spalte c1 ... ∈ K n×1 cn die Koordinatenspalte von w bezüglich v. Satz 10 : Sei u := (u1 , . . . , uq ) ∈ V q . Dann gilt: (1) Es gibt genau eine Matrix T ∈ K n×q mit u = vT . Diese Matrix T heißt die Transformationsmatrix von v zu u, und die Spalten von T sind die Koordinatenspalten von u1 , . . . , uq bezüglich v. (2) Die Familie u ist genau dann eine Basis von V , wenn T invertierbar ist. Beweis: 5 1. VERTIEFUNG ZU KAP. 2, §3 (1) Sei T ∈ K n×k jene Matrix, die sich durch Nebeneinanderschreiben der Koordinatenspalten von u1 , . . . , uk bezüglich v ergibt. Dann ist u j = vT− j für 1 ≤ j ≤ k, also u = vT . Wenn umgekehrt u = vS mit S ∈ K n×k ist, d.h. u j = vS− j für 1 ≤ j ≤ k, dann ist S− j die Koordinatenspalte von u j bezüglich v für 1 ≤ j ≤ k. (2) Wenn T ∈ GLn (K) ist, dann ist v = uT −1 nach Satz 8, also sind die Vektoren v1 , . . . , vn Linearkombinationen von u1 , . . . , un , somit ist K ⟨u1 , . . . , un ⟩ = V und, weil V n-dimensional ist, (u1 , . . . , un ) eine Basis von V . Wenn umgekehrt u eine Basis von V ist, dann gibt es eine Matrix U ∈ K n×n mit v = uU. Weil u eine Basis ist, folgt aus uIn = vT = u(UT ), dass UT = In ist und analog TU = In , also ist T ∈ GLn (K). Satz 11 : Sei u eine Basis von V und T ∈ GLn (K) die Transformationsmatrix von v zu u. Ist c die Koordinatenspalte von w ∈ V bezüglich v, dann ist T −1 c die Koordinatenspalte von w bezüglich u , d.h. bei Basiswechsel mit der Matrix T transformieren sich die Koordinaten“ mit der Matrix T −1 . ” Beweis: Es ist w = vc = (uT −1 )c = u(T −1 c). Beispiel 12 : Wir betrachten die Ebene E nach Wahl eines Nullpunktes als Vektorraum. Wir wählen Punkte P1 , P2 so, dass P := (P1 , P2 ) eine Basis von E ist. Es sei 3 1 1 Q := (Q1 , Q2 ) := ( P1 + 2P2 , P1 + P2 ) . 2 2 2 Dann ist Q = PT , wobei 3 1 T := 2 2 2 1 2 ist. Man prüft leicht nach, dass T invertierbar ist und dass ( ) −2 2 −1 T = 8 −6 ist. Daher ist P = QT −1 = (−2Q1 + 8Q2 , 2Q1 − 6Q2 ). ( ) 1 Der Punkt P1 + 2P2 hat bezüglich P die Koordinatenspalte und 2 ( ) ( ) 1 2 bezüglich Q die Koordinatenspalte T −1 = . 2 −4 Somit ist P1 + 2P2 = 2Q1 − 4Q2 . KAPITEL 2 Vertiefung zu Kap. 3, §2 §1. Strahlensatz Satz 13 : ( Strahlensatz“) ” Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann gibt es c, d ∈ K \ {0} so, dass v2 = cv1 und w2 = dw1 ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1 bzw. v2 und w2 . Dann gilt: (1) L1 und L2 sind genau dann parallel, wenn c = d ist. (2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ). Z1 v2 v1 0 w1 L1 w2 L2 Z2 A BBILDUNG 1. Strahlensatz Beweis: (1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw. K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau dann gleich K(cv1 − dw1 ), wenn c = d ist. 6 2. VERTIEFUNG ZU KAP. 3, §2 7 (2) Wenn L1 und L2 parallel sind, ist c = d und v2 − w2 = cv1 − cw1 = c(v1 − w1 ) . Satz 14 : Es seien V ein Vektorraum über einem Körper K und Z1 = p1 + U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann ist Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0. / Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 . §2. Affine Hülle Es sei K ein Körper und V ein Vektorraum über K. Definition 15 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in V . Eine Linearkombination ∑i∈I ci vi von (vi )i∈I heißt affine Kombination von (vi )i∈I , wenn ∑i∈I ci = 1 ist. Die Menge aller affinen Linearkombinationen von (vi )i∈I heißt affine Hülle von (vi )i∈I . Beispiel 16 : Die affine Hülle von zwei Vektoren v1 und v2 ist ein Punkt, wenn v1 = v2 ist, bzw. die Gerade {c1 v1 + c2 v2 | c1 , c2 ∈ K, c1 + c2 = 1} = {v1 + c(v2 − v1 ) | c ∈ K}, wenn v1 ̸= v2 ist. Satz 17 : (1) Es seien M ein affiner Unterraum von V und (vi )i∈I eine endliche Familie in M. Dann ist die affine Hülle von (vi )i∈I in M enthalten. (2) Die affine Hülle einer Familie (vi )i∈I in V ist ein affiner Unterraum von V . Der dazu parallele Untervektorraum wird von (vi − v j )i∈I, i̸= j erzeugt, wobei j ∈ I beliebig gewählt werden kann. (3) Die affine Hülle von (vi )i∈I ist der (bezüglich Inklusion) kleinste affine Unterraum, der alle vi , i ∈ I, enthält. Beweis: 2. VERTIEFUNG ZU KAP. 3, §2 8 (1) Sei p ∈ M, U der zu M parallele Untervektorraum und (ci )i∈I eine Familie in K mit ∑i∈I ci = 1. Dann ist ( ) ( ) ∑ civi = ∑ ci i∈I p− i∈I ∑ ci i∈I p + ∑ ci vi = i∈I = p + ∑ ci (vi − p) ∈ p +U = M. i∈I (2) Sei j ∈ I und M := v j + K ⟨vi − v j ; i ∈ I, i ̸= j⟩. Dann ist (vi )i∈I eine Familie in M und nach (1) ist ihre affine Hülle in M enthalten. Sei umgekehrt (di )i∈I eine Familie in K. Dann ist v j + ∑ di (vi − v j ) = ∑ di vi + 1 − ∑ di v j i∈I i̸= j i∈I i̸= j i∈I i̸= j eine affine Linearkombination von (vi )i∈I . Daher ist jedes Element von M in der affinen Hülle von (vi )i∈I enthalten. (3) Folgt aus (1) und (2). Definition 18 : Affine Unterräume von V heißen kollinear bzw. koplanar, wenn sie alle in einer Geraden bzw. Ebene in V enthalten sind. Satz 19 : (1) Drei Punkte v1 , v2 , v3 ∈ V sind genau dann kollinear, wenn die Vektoren v2 − v1 und v3 − v1 linear abhängig sind. (2) Vier Punkte v1 , v2 , v3 , v4 ∈ V sind genau dann koplanar, wenn die Vektoren v2 − v1 , v3 − v1 und v4 − v1 linear abhängig sind. (3) Zwei Geraden p1 + Kv1 und p2 + Kv2 sind genau dann koplanar, wenn die Vektoren p1 − p2 , v1 und v2 linear abhängig sind. Beweis: Die ersten zwei Aussagen folgen aus Satz 17, (2). Der zur affinen Hülle von (p1 , p2 , p1 + v1 , p2 + v2 ) parallele Untervektorraum wird von p1 − p2 , v1 und v2 erzeugt. Satz 20 : Zwei verschiedene koplanare Geraden schneiden einander in genau einem Punkt oder sie sind parallel. 2. VERTIEFUNG ZU KAP. 3, §2 9 Beweis: Seien M1 und M2 verschiedene koplanare Geraden und E die Ebene, die beide enthält. Wenn M1 und M2 nicht parallel sind, dann ist U1 ∩U2 = {0} und U1 + U2 = U1 ⊕ U2 ist der zu E parallele Untervektorraum. Wegen p1 , p2 ∈ E ist p1 − p2 ∈ U1 ⊕ U2 , daher gibt es eindeutig bestimmte Vektoren u1 ∈ U1 , u2 ∈ U2 so, dass p1 − p2 = u1 + u2 ist. Somit ist M1 ∩ M2 = {p1 − u1 } = {p2 + u2 }. §3. Polytope und Schwerpunkte Es seien K = Q oder R und V ein Vektorraum über K. Definition 21 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in V. Eine Linearkombination ∑ ci vi von (vi )i∈I heißt konvexe Linearkombinatii∈I on von (vi )i∈I , wenn ∑ ci = 1 und ci ≥ 0 für alle i ∈ I ist. i∈I Die Menge der konvexen Linearkombinationen von (vi )i∈I heißt konvexe Hülle von (vi )i∈I . Die konvexe Hülle zweier Vektoren v1 , v2 heißt Strecke zwischen v1 und v2 . Die konvexe Hülle dreier nicht kollinearer Punkte v1 , v2 , v3 heißt Dreieck mit Eckpunkten v1 , v2 , v3 . Eine Teilmenge von V heißt Polytop, wenn sie die konvexe Hülle einer endlichen Familie in V ist. Es sei I := {1, . . . , n} und c1 , . . . , cn ∈ R ≥0 . Für cn ̸= 1 ist ) ci ∑ civi = (1 − cn) ∑ 1 − cn vi + cnvn = (1 − cn)w + cnvn , i=1 i=1 n ( n−1 ci wobei w := ∑n−1 i=1 1−cn vi in der konvexen Hülle H von (v1 , . . . , vn−1 ) liegt. Daraus folgt: Für n ≥ 3 ist die konvexe Hülle von (v1 , . . . , vn ) die Vereinigung aller Strecken zwischen vn und den Elementen von H. Beispiel 22 : Eine Teilmenge von R ist genau dann ein Polytop, wenn sie ein abgeschlossenes Intervall ist. ( ) Satz 23 : Es seien P die konvexe Hülle einer Familie w j j∈J in V und (vi )i∈I eine Familie in P. Dann ist die konvexe Hülle von (vi )i∈I in P enthalten. 2. VERTIEFUNG ZU KAP. 3, §2 10 Beweis: Für (alle)i ∈ I ist der Vektor vi eine konvexe Linearkombination ∑ c ji w j von w j j∈J . j∈J Sei ∑ di vi eine konvexe Linearkombination von (vi )i∈I . Dann ist i∈I ( ) ∑ divi = ∑ ∑ dic jiw j = ∑ ∑ dic ji i∈I i∈I j∈J j∈J wj i∈I mit ∑ di c ji ≥ 0, für alle j ∈ J, und i∈I ) ( ∑ ∑ dic ji j∈J i∈I ( = ∑ di i∈I ) ∑ c ji j∈J = ∑ di = 1 . i∈I Daher ist ∑ di vi ∈ P . i∈I Definition 24 : Es sei (vi )i∈I eine endliche Familie in V . Der Schwerpunkt von (vi )i∈I ist 1 vi . # (I) ∑ i∈I Der Schwerpunkt von (v1 , v2 ) heißt Mittelpunkt der Strecke zwischen v1 und v2 . Satz 25 : Es seien u, v, w drei nicht kollineare Punkte in V . Die Gerade durch u bzw. v bzw. w und den Mittelpunkt der Strecke zwischen den anderen zwei Punkten heißt Schwerlinie des Dreiecks mit Eckpunkten u, v, w durch u bzw. v bzw. w. Die drei Schwerlinien sind paarweise verschieden und schneiden einander im Schwerpunkt 31 (u + v + w) von (u, v, w) . Beweis: Da u, v, w nicht kollinear sind, sind nach Satz 19 die Vektoren v − u und w − u linear unabhängig. Also sind auch v − u und 1 1 1 (v − u) + (w − u) = (v + w) − u 2 2 2 linear unabhängig, nach Satz 19 sind daher u, v, 12 (v + w) nicht kollinear. Somit liegt v nicht auf der Schwerlinie durch u . Daher sind die Schwerlinien durch u und durch v verschieden und die drei Schwerlinien haben 11 2. VERTIEFUNG ZU KAP. 3, §2 höchstens einen Schnittpunkt. Wegen ( ) ( ) 1 1 2 1 1 2 1 (u + v + w) = u + (v + w) = v + (u + w) = 3 3 3 2 3 3 2 ( ) 1 2 1 = w+ (u + v) 3 3 2 liegt der Schwerpunkt auf allen Schwerlinien. §4. Affine Räume Definition 26 : Es seien (G, ⋆) eine Gruppe mit neutralem Element e und M eine Menge. Eine Funktion G × M −→ M , (s, m) 7−→ s · m , ist eine Operation der Gruppe G auf der Menge M, wenn gilt: für alle m ∈ M ist e · m = m und für alle s,t ∈ G und alle m ∈ M ist (s ⋆ t) · m = s · (t · m). Beispiel 27 : Die Funktion Sn × {1, 2, . . . , n} → {1, 2, . . . , n} , (σ , i) 7→ σ (i) , ist eine Operation der Permutationsgruppe Sn auf der Menge {1, 2, . . . , n}. Definition 28 : Sei V ein Vektorraum über einem Körper K, A eine Menge und V × A → A , (v, a) 7→ v · a , eine Operation der Gruppe (V, +) auf A. (Also: Für alle a ∈ A, v, w ∈ V ist 0 · a = a und (v + w) · a = v · (w · a). A zusammen mit dieser Operation ist ein affiner Raum über V , wenn es für alle Elemente a, b ∈ A genau einen Vektor v ∈ V gibt mit v · a = b. Die Elemente von A heißen dann Punkte, die Elemente von V Vektoren des affinen Raums. Satz 29 : Sei A ein affiner Raum über V und a ∈ A. Die Funktion V −→ A , v 7−→ v · a , ist bijektiv. (Nach Wahl eines Nullpunktes“ kann ein affiner Raum als Vek” torraum betrachtet werden). Beweis: Folgt aus der Definition. 12 2. VERTIEFUNG ZU KAP. 3, §2 Beispiel 30 : Sei V ein Vektorraum, p ∈ V und U ein Untervektorraum von V . Dann ist der affine Unterraum p +U mit U × (p +U) −→ p +U (v, p + u) 7−→ p + (u + v) , ein affiner Raum über U. Insbesondere ist jeder Vektorraum ein affiner Raum (über sich selbst). Beispiel 31 : Sie E die Zeichenebene oder der Anschauungsraum und T (E) der Vektorraum der Translationen von E. Dann ist E mit T (E) × E −→ E , (t, x) 7−→ t(x) , ein affiner Raum über T (E). Möchte man in der Zeichenebene keinen Nullpunkt“ wählen, kann man ” sie als affinen Raum betrachten. Dann muss man zwischen Punkten (∈ E) und Vektoren (∈ T (E)) unterscheiden. Punkte können dann nicht addiert werden, aber Vektoren können addiert werden und auf Punkten wirken“. ” Sind P und Q Punkte von E und P ̸= Q, dann gibt es genau eine Trans⃗ bezeichnet. Die lation in T (E), die P auf Q abbildet. Sie wird häufig mit PQ Menge ⃗ |t ∈ R } ⊆ T (E) {t PQ ⃗ in T (E). Die Gerade durch P und ist die Gerade durch 0T (E) = idE und PQ ” Q in E“ ist dann als ⃗ {(t PQ)(P) |t ∈ R } ⊆ E ⃗ ⃗ definiert. Wegen (PQ)(P) = Q und (0 · PQ)(P) = idE (P) = P sind P und ⃗ wird als Richtungsvektor“ Q Punkte dieser Geraden. Die Translation PQ ” dieser Geraden bezeichnet. KAPITEL 3 Vertiefung zu Kap. 3, §3-5 §1. Mehr über Skalarprodukte In diesem Abschnitt sei V ein reeller Vektorraum und ⟨−, −⟩ ein Skalarprodukt auf V . Definition 32 : Ein reeller Vektorraum mit einem Skalarprodukt heißt reeller Prähilbertraum. Ein endlich-dimensionaler reeller Prähilbertraum heißt euklidischer Raum. Beispiel 33 : (Für Studierende mit Kenntnissen aus Analysis). Es seien a, b reelle Zahlen mit a < b und V der Vektorraum aller stetigen Funktionen vom Intervall [a, b] nach R . Die Funktion ⟨−, −⟩ : V ×V −→ R , ( f , g) 7−→ ∫ b a f (x) · g(x)dx , ist ein Skalarprodukt auf V . Die Norm von f ∈ V ist √ ∥f∥ = ∫ b f (x)2 dx . a Satz 34 : (Parallelogrammgleichung) Für alle Vektoren v und w in einem reellen Prähilbertraum ist ∥v + w∥2 + ∥v − w∥2 = 2∥v∥2 + 2∥w∥2 . Beweis: Nachrechnen. Definition 35 : Eine Norm auf V ist eine Funktion N : V −→ R ≥0 := {t ∈ R |t ≥ 0} , v 7−→ N(v) , mit den Eigenschaften: (1) Es ist N(v) = 0 genau dann, wenn v = 0 ist. (2) Für alle c ∈ R , v ∈ V ist N(cv) = |c|N(v) . (3) Für alle v, w ∈ V ist N(v + w) ≤ N(v) + N(w) . V zusammen mit einer Norm heißt normierter Raum . 13 3. VERTIEFUNG ZU KAP. 3, §3-5 14 Beispiel 36 : Ist ⟨−, −⟩ ein Skalarprodukt auf V , dann ist √ ∥ · ∥ : V −→ R , v 7−→ ∥v∥ := ⟨v, v⟩, eine Norm. Beispiel 37 : Die Funktion n N : R −→ R ≥0 , (c1 , c2 , . . . , cn ) 7−→ ∑ |ci | , n i=1 Rn . ist eine Norm (die Summennorm“) auf ” Die Parallelogrammgleichung gilt für diese Norm nicht, zum Beispiel ist für n = 2, v := (2, 1) und w := (1, 2): N(v + w)2 + N(v − w)2 = 36 + 4 = 40, aber 2 · N(v)2 + 2 · N(w)2 = 18 + 18 = 36. Satz 38 : N sei eine Norm auf V . Dann sind die folgenden Aussagen äquivalent: (1) Die Parallelogrammgleichung gilt für N, dh.: Für alle v, w ∈ V ist N(v + w)2 + N(v − w)2 = 2 · N(v)2 + 2 · N(w)2 . (2) Es gibt ein Skalarprodukt √ ⟨−, −⟩, das die Norm N induziert, dh.: für alle v ∈ V ist N(v) = ⟨v, v⟩. In diesem Fall ist dieses Skalarprodukt von v, w ∈ V durch 1 ⟨v, w⟩ := (N(v + w)2 − N(v − w)2 ) 4 definiert. Beweis: Wenn (2) gilt, dann folgt (1) aus Satz 34. Wenn (1) gilt, dann kann damit nachgeprüft werden, dass die oben definierte Funktion ⟨−, −⟩ die Eigenschaften eines Skalarproduktes hat. Definition 39 : Eine Familie (vi )i∈I in V heißt orthonormal bezüglich ⟨−, −⟩, wenn für alle i, j ∈ I gilt: ⟨vi , v j ⟩ = δi j . Eine Familie (vi )i∈I in V heißt Orthonormalbasis (kurz: ON-Basis) von V bezüglich ⟨−, −⟩, wenn sie eine Basis von V und orthonormal bezüglich ⟨−, −⟩ ist. Beispiel 40 : Es sei V der Vektorraum der endlichen Folgen in R. Für i ∈ N bezeichnen wir mit ei die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der 15 3. VERTIEFUNG ZU KAP. 3, §3-5 i-ten Stelle steht. Die Familie (ei )i∈N ist eine Basis von V . Durch ⟨a, b⟩ := ∑ aibi , für alle Folgen a, b in N i∈N wird ein Skalarprodukt auf V definiert. Die Familie (ei )i∈N ist eine ONBasis bezüglich dieses Skalarproduktes. Satz 41 : Eine orthonormale Familie ist linear unabhängig. Insbesondere: Wenn V endlich-dimensional ist, dann ist jede orthonormale Familie mit dimK (V ) Elementen eine ON-Basis von V . Beweis: Sei (vi )i∈I eine orthonormale Familie und (ci )i∈I eine Koeffizienten-Familie in K. Wenn ∑i∈I ci vi = 0 ist, dann ist für alle j ∈ I auch 0 = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = c j . i∈I i∈I Satz 42 : Sei w ∈ V und (vi )i∈I eine ON-Basis von V . Dann ist w = ∑⟨vi , w⟩vi . i∈I ( Die Koordinate von w bei vi ist das Skalarprodukt von vi mit w“.) ” Beweis: Sei w = ∑i∈I ci vi . Dann ist ⟨v j , w⟩ = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = ∑ ci δ ji = c j . i∈I i∈I i∈I §2. Interpolationsaufgaben Wir betrachten die folgenden Interpolationsaufgaben: Gegeben sind • Funktionen f1 , . . . , fk von R nach R, • paarweise verschiedene reelle Zahlen x1 , . . . , xn ∈ R und • reelle Zahlen y1 , . . . , yn ∈ R. Gesucht sind reelle Zahlen c1 , . . . , ck so, dass die Funktion f := ∑ki=1 ci fi die Bedingungen f (x1 ) = y1 , f (x2 ) = y2 , . . . , f (xn ) = yn erfüllt. r y1 x1 r r y2 x2 r y3 x3 y4 x4 16 3. VERTIEFUNG ZU KAP. 3, §3-5 Durch die Funktionen f1 , . . . , fk wird der Typ“ der Interpolationsaufgabe ” vorgegeben. Die reellen Zahlen x1 , . . . , xn heißen Stützstellen, die reellen Zahlen y1 , . . . , yn (Funktions-)Werte der Interpolationsaufgabe. Die gesuchte Funktion f heißt interpolierende Funktion. Wir suchen also eine Funktion f des vorgegebenen Typs so, dass die Funktionswerte von f in den Stützstellen die vorgegebenen Werte der Interpolationsaufgabe sind. Anders formuliert: Wir suchen Zahlen c1 , . . . , ck so, dass f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1 f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2 .. .. .. . . . f1 (xn )c1 + f2 (xn )c2 + . . . + fk (xn )ck = yn ist. Das ist ein System von n linearen Gleichungen mit k Unbekannten c1 , . . . , ck . In Matrizenform: f1 (x1 ) . . . fk (x1 ) c1 y1 f1 (x2 ) . . . fk (x2 ) c2 y2 . · . = . . .. .. .. . . .. .. f1 (xn ) . . . fk (xn ) ck yn Beispiel 43 : ( Lineare Interpolation“). ” Wenn f1 die konstante Funktion 1 (also die Funktion, die jeder Zahl die Zahl 1 zuordnet) und f2 die Identität (also die Funktion, die jeder Zahl sich selbst zuordnet) ist, dann suchen wir eine Funktion f := c1 f1 + c2 f2 mit ( f (xi ) =) c1 + c2 xi = yi , 1 ≤ i ≤ n . Die Aufgabe, Zahlen c1 und c2 mit den Eigenschaften c1 + c2 x1 = y1 .. .. .. . . . c1 + c2 xn = yn zu finden, ist ein System von n linearen Gleichungen mit zwei Unbekannten. In Matrizenform y1 1 x1 ( ) y2 1 x2 c1 . . · .. .. c2 = ... . yn 1 xn Beispiel 44 : (Interpolation durch Polynomfunktionen). Für 1 ≤ i ≤ k sei fi : R −→ R, z 7−→ zi , die i-te Potenzfunktion. Dann ist die gesuchte Funktion f eine Polynomfunktion vom Grad k − 1, also f : R −→ R, z 7−→ c1 + c2 z + . . . + ck zk−1 . 3. VERTIEFUNG ZU KAP. 3, §3-5 17 Wir suchen reelle Zahlen c1 , c2 , . . . , ck mit der Eigenschaft, dass c1 + x1 c2 + . . . + x1k−1 ck = y1 .. .. .. . . . k−1 c1 + xn c2 + . . . + xn ck = yn ist, müssen also ein System von n Gleichungen mit k Unbekannten lösen. In Matrizenform: 1 x1 . . . x1k−1 y1 c1 1 x . . . xk−1 c2 y2 2 2 . · .. = .. .. .. . .. .. . . . . . yn ck 1 xn . . . xnk−1 §3. Systeme linearer Gleichungen (mit und ohne Lösung) Das System f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1 f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2 .. .. .. . . . f1 (xk )c1 + f2 (xk )c2 + . . . + fk (xn )ck = yn von k linearen Gleichungen mit den Unbekannten c1 , . . . , cn kann auch in der Form fk (x1 ) y1 f1 (x1 ) . . c1 .. + . . . + ck .. = ... , fk (xn ) yn f1 (xn ) oder, mit den Abkürzungen y1 y := ... und yn fi (x1 ) fi (x) := ... , 1 ≤ i ≤ k, fi (xn ) kurz als k ∑ cifi(x) = y i=1 angeschrieben werden. Wir können also das System linearer Gleichungen als die folgende Aufgabe interpretieren: Schreibe die Spalte y als Linearkombination ∑ki=1 ci fi (x) der Spalten fi (x) , 1 ≤ i ≤ k. Das ist aber nur dann möglich, wenn y in dem von den Spalten fi (x) , 1 ≤ i ≤ k , erzeugten Untervektorraum U von Rn×1 enthalten ist. Wenn das nicht der Fall ist, ist dieses System linearer Gleichungen nicht lösbar. 18 3. VERTIEFUNG ZU KAP. 3, §3-5 Im Fall von Beispiel Lineare Interpolation“ ist U die von ” 1 x1 . 1 := .. und x := ... 1 xn erzeugte Ebene in Rn×1 . Im Fall von Beispiel Interpolation durch Polynomfunktionen vom Grad ” ≤ k“ ist U der von 1 x1 . .. , ... , . . . 1 xn x1k−1 , ... xnk−1 erzeugte Untervektorraum von Rn×1 . Wenn die Interpolationsaufgabe einerseits eine Situation beschreibt, von der man weiß, dass es eine Lösung gibt, andererseits die Aufgabe aber nicht lösbar ist, weil y mit Mess- oder Rundungsfehlern behaftet ist, liegt es nahe, dass y eigentlich“ ein Element von U sein sollte. Wir erzwingen die ” Lösbarkeit der Aufgabe, indem wir y durch eine Spalte y′ in U ersetzen! Wie sollen wir diese Spalte y′ aber wählen? Am einfachsten ist es, y′ in U so zu wählen, dass der Abstand zwischen y′ und y möglichst klein ist. Wir suchen also ein Element des Vektorraums U so, dass der Abstand ∥y′ − y∥ zwischen y und y′ so klein wie möglich ist. Wir müssen nun festlegen, welchen Abstand wir meinen: Wenn wir den (durch das Standardskalarprodukt auf dem Rn induzierten) euklidischen Abstand im Rn wählen, dann ist √ ∥y′ − y∥ := n ∑ (y′i − yi)2 . i=1 Für positive reelle Zahlen a und b ist a ≤ b genau dann, wenn a2 ≤ b2 ist. Daher ist der ∥y′ − y∥ genau dann minimal, wenn die Summe ∑ni=1 (y′i − yi )2 der Fehlerquadrate“ minimal ist. ” Die Spalte y′ ist der Fußpunkt des Lotes von y auf U. §4. Lineare Regression Genau dann ist der Abstand zwischen y′ und y kleiner oder gleich dem Abstand zwischen y und jedem anderen Element z von U, wenn die Gerade durch y′ und y normal zum Untervektorraum U steht. Das folgt leicht aus dem Satz von Pythagoras: 3. VERTIEFUNG ZU KAP. 3, §3-5 19 U hy Sphhhhhh h S z S Sp y′ Das Dreieck mit den Eckpunkten y′ , y und z hat bei y′ einen rechten Winkel. Der Abstand zwischen y und z ist die Länge der Hypotenuse, also größer oder gleich der Länge einer Kathete, also dem Abstand zwischen y und y′ . Die Gerade durch y′ und y steht genau dann normal zu U, wenn alle Skalarprodukte von y′ − y mit den erzeugenden Spalten von U gleich 0 sind. Für y′ = ∑ki=1 ci fi (x) ∈ U muss also gelten: ⟨y′ − y, fj (x)⟩ = 0, 1 ≤ j ≤ k . Anders geschrieben: k ∑ ci⟨fi(x), fj(x)⟩ = ⟨y, fj(x)⟩, 1 ≤ j ≤ k . i=1 Wenn wir dieses System von k linearen Gleichungen mit k Unbekannten c1 , . . . , ck lösen, dann erhalten wir die annähernd“ interpolierende Funktion ” f = ∑ki=1 ci fi . Bei linearer Interpolation ist • y′ = c2 x + c1 1 ∈ U und • die Gerade durch y und y′ steht normal auf der von x und 1 erzeugten Ebene U. Also ist • ⟨c2 x + c1 1 − y, x⟩ = 0 und • ⟨c2 x + c1 1 − y, 1⟩ = 0. Daraus erhalten wir das folgende System von zwei linearen Gleichungen mit zwei Unbekannten c1 und c2 : • c2 ⟨x, x⟩ + c1 ⟨1, x⟩ = ⟨x, y⟩ • c2 ⟨x, 1⟩ + c1 ⟨1, 1⟩ = ⟨1, y⟩ Als Lösung erhalten wir c2 = ⟨1, 1⟩.⟨x, y⟩ − ⟨1, x⟩.⟨1, y⟩ ⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2 und c1 = ⟨x, x⟩.⟨1, y⟩ − ⟨1, x⟩.⟨x, y⟩ . ⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2 3. VERTIEFUNG ZU KAP. 3, §3-5 20 Wenn ⟨−, −⟩ das Standard-Skalarprodukt ist, dann ist ⟨x, y⟩ = ∑ni=1 xi yi , ⟨1, x⟩ = ∑ni=1 xi , ⟨1, y⟩ = ∑ni=1 yi , ⟨1, 1⟩ = n, ⟨x, x⟩ = ∑ni=1 xi2 und ⟨y, y⟩ = ∑ni=1 y2i , daher c2 = und c1 = n ∑ni=1 xi yi − (∑ni=1 xi )(∑ni=1 yi ) n ∑ni=1 xi2 − (∑ni=1 xi )2 (∑ni=1 xi2 )(∑ni=1 yi ) − (∑ni=1 xi )(∑ni=1 xi yi ) . n ∑ni=1 xi2 − (∑ni=1 xi )2 Wir haben damit die Funktion f : R −→ R, z 7−→ c2 z + c1 , so bestimmt, dass der (euklidische) Abstand vom n-Tupel der gegebenen (gemessenen oder gerundeten) ungenauen Funktionswerte (y1 , . . . , yn ) zum n-Tupel der berechneten Funktionswerte ( f (x1 ), . . . , f (xn )) möglichst klein ist, also ∑ni=1 (yi − (c2 xi + c1 ))2 möglichst klein ist. Der Graph dieser Funktion heißt Regressionsgerade oder Trendlinie der Punkte (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ). Man rechnet leicht nach, dass 1 n 1 n f ( ∑ xi ) = ∑ yi n i=1 n i=1 ist. Das Paar der arithmetischen Mittel von (x1 , . . . , xn ) und (y1 , . . . , yn ) liegt also immer auf der Regressionsgeraden.