Vektorräume und Lineare Abbildungen Patricia Doll, Selmar Binder, Lukas Bischoff, Claude Denier ETHZ D-MATL SS–07 11.04.2007 1 Vektorräume 1.1 Definition des Vektorraumes (VR) 1.1.1 Grundoperationen Um den Vektorraum zu verstehen müssen wir erst die Grundoperationen die angewendet werden beschreiben (hier am Beispiel der „geometrischen“ Vektoren, für andere mögliche Elemente eines Vektorraumes müssen sie sinnvoll definiert werden): 1. Addition zweier Vektoren Vektoren werden gemäss dem ”altbekannten” Parallelogramm addiert. Abbildung 1: Vektoraddition 1 2. Multiplikation mit einem Skalar: Bei der Multiplikation eines Vektors mit einem Skalar a (d.h. einer eindimensionalen Zahl) bleibt die Richtung des Vektors erhalten. Nur die Länge wird gestreckt wobei a der Streckungsfaktor ist. Dabei gelten immer folgende Rechenregeln: (~a, ~b, ~c sind Vektoren, α, β Skalare Zahlen) i) ~a + ~b = ~b + ~a ii) ~a + (~b + ~c) = (~a + ~b) + ~c iii) ~a + ~0 = ~0 ~ = ~0 iv) ~a + (−a) v) α(β~a) = (αβ)~a vi) (α + β)~a = α~a + β~a vii) 1 · ~a = ~a α(~a + ~b) = α~a + β~b 1.1.2 Definition Vektorraum Ein Vektorraum ist eine Menge von Elementen (Vektoren), die bezüglich der definierten Grundoperationen abgeschlossen ist. Das heisst, Elemente eines Vektorraumes untereinander oder mit einem Skalar verknüpft ergeben wieder ein Element desselben VR. Somit sind Vektorräume bezüglich der Grundoperationen Abelsche Gruppen. Bemerkung: Elemente eines Vektorraums können nicht nur „geometrische“ Vektoren sein. Es kann sich beispielsweise auch um Matrizen oder Funktionen handeln. Es müssen nur die Grundoperationen neu definiert werden. Für Funktionen zum Beispiel ist es nahe liegend unter der Multiplikation mit einem Skalar die Streckung der Funktionswerte zu verstehen. Auch die Addition zweier Funktionen wird wohl jeder intuitiv richtig definieren. Prüfen wir nach, kommen wir schnell zum Schluss, dass die Bedingungen für einen Vektorraum der aus Funktionen besteht, erfüllbar sind. 1.2 Eigenschaften von Vektorräumen 1.2.1 Der Untervektorraum (UVR) Nehmen wir uns einen ”grossen” Vektorraum, mit vielen Elementen, wie R2 . Die in ihm enthaltenen Vektoren sind von der Form (x, y). Nehmen wir daraus nur die Teilmenge U der Vektoren deren y-Wert gleich 0 ist. Sie sind von der Form (x, 0). Ohne nachzuprüfen ist uns klar dass die erlaubten Grundoperationen für R2 auch für U gelten. Kurz darüber nachgedacht, ist es auch offensichtlich das jede Anwendung der Grundoperationen auf einen Vektor der Form (x, 0), nur einen Vektor derselben Form erzeugen kann. 2 Offensichtlich erfüllt die Menge U alle Kriterien für einen Vektorraum. Gleichzeitig ist U komplett enthalten in R2 . U ist damit ein Untervektorraum des Vektorraumes R2 . 1.2.2 Linearkombination Ein Vektor ~b ist dann linear abhängig von einer Menge Vektoren A = (a~1 , a~2 , . . . , a~n ) wenn folgende Gleichung erfüllbar ist ohne dass alle ci gleich 0 sind: a~1 c1 + a~2 c2 + . . . + a~n cn = ~b (1) ~b ist linear abhängig von der Menge A. er lässt sich komplett durch Elemente von A ausdrücken und ist auch definitiv in einem Vektorraum mit der Menge A. 1.2.3 Erzeugungssystem Sind alle Vektoren ~b eines Vektorraumes V linear abhängig von einer Teilmenge A des Vektorraumes V, so ist A ein Erzeugungssystem des Vektorraumes V. (Die triviale Lösung A = V ist offensichtlich und sinnlos. Ein Erzeugungssystem macht erst dann Sinn wenn es weniger Elemente hat als der Vektorraum den es erzeugt.) 1.2.4 Basis Eine Basis eines Vektorraumes V, ist ein Erzeugungssystem für V dessen Elemente alle linear unabhängig voneinander sind. Es hat die minimal nötige Anzahl von Elementen. Daraus folgt auch, dass ein Erzeugungssystem das keine Basis ist, ”überflüssige” Elemente enthält. Bemerkung: Ein Erzeugungssystem kann von linear abhängigen Vektoren befreit werden, wenn alle Elemente a~i (nach Gleichung 1) durch Linearkombination den Nullvektor erzeugen können. Durch subtrahieren von a~n und dividieren durch cn , zeigt die Gleichung nun, dass a~n eine Linearkombination der Vektoren a~1 bis an−1 ~ ist. a~n kann eindeutig erzeugt werden und kann somit aus dem Erzeugungssystem gestrichen werden. Kann die Gleichung nicht mehr erfüllt werden ohne, dass alle ci = 0 sind, so ist aus dem Erzeugungssystem eine Basis geworden (durch Elimination der linear abhängigen Elemente). Grösse einer Basis (für Vn ): i) Mehr als n Vektoren sind linear abhängig. ii) Weniger als n Vektoren sind nie ein Erzeugungssystem. 3 iii) n Vektoren sind dann ein Erzeugungssystem, wenn sie linear unabhängig sind und somit eine Basis bilden. → Glaubt man obigen drei Annahmen haben alle Basen für Vn n Elemente. Auf einen Beweis der obigen Annahmen wird verzichtet. Es sollte aber möglich sein durch Vertiefung der Bedeutung jeder einzelnen Aussage intuitiv deren Richtigkeit zu glauben. 1.3 Normierte Vektorräume Die Norm eines Vektors wird auch als Länge oder Betrag bezeichnet. Bei der Vorstellung eines Vektors als Pfeil, d.h. als gerichtete Strecke, stellt diese die Länge dar. Beim Lösen von der Idee des Vektors als Pfeil muss eine andere Art gefunden werden, wie der Längenbegriff zu definieren ist. Deshalb werden die Eigenschaften in den Vordergrund gesetzt. Die Norm eines Vektors a wird |a| geschrieben. Def. 1 Wenn V ein Vektorraum ist und eine Vorschrift einem Vektor a ∈ V eine reelle Zahl |a| zuordnet, heisst diese Norm, wenn die folgenden Regeln erfüllt sind. 1. i) Für jeden Vektor a ∈ Vgilt|a| ≥ 0, ii) aus |a| = 0 folgt a = 0. 2. Für jeden Vektor a ∈ V und√ für jede Zahl α gilt: |αa| = |α| · |a| Für komplexe Zahlen: |α| = u2 + v 2 , falls α = u + iv ist. 3. Für alle Vektoren a, b ∈ V gilt: |a + b| ≤ |a| + |b| (Dreiecksgleichung). Die folgenden Normen sind bei Vektorräumen anzuwenden, welche aus Vektoren bestehen. q Lp -Normen: |x|p := | p |x1 |p + |x2 |p + |x3 |p | (=Klasse von Normen) q Euklidische Norm: |x|2 := | x12 + x22 + x32 | (gehört zu den Lp -Normen) Maximumnorm: |x|∞ := max(|x1 |, |x2 |, |x3 |) 4 Abbildung 2: ”Einheitskreisscheibe mit verschiedenen Lp -Normen” Vektorräume aus Funktionen bestehend benötigen eine andere Norm. Diese Norm |f | ist z.B. der maximale mögliche Wert einer Funktion f (x) ∈ I = [a, b], anstelle von f (x) wird jedoch |f (x)| eingesetzt, da auch die negativen Ausschläge berücksichtigt werden (2). In diese Norm kann auch noch die zweite Ableitung hinein genommen werden (3). Diese Norm kann damit mehr über die Funktion aussagen. |f |0 := max |f (x)| (2) |f |1 := max |f (x)| + max |f 0 (x)| (3) x∈I x∈I x∈I 1.4 Skalarprodukt So wie der Längenbegriff über die Norm definiert werden kann, wird der Begriff des Winkels über das Skalarprodukt definiert. cos ϕ = <a,b> , kak·kbk falls a 6= 0, b 6= 0 Wenn (a, b) = 0 stehen a und b senkrecht aufeinander, sind sie orthogonal. Def. 2 Sei V ein reeller Vektorraum. Eine Vorschrift, welche jedem Paar x, y von Vektoren eine reelle Zahl (x, y) zuordnet, heisst Skalarprodukt im Vektorraum V, wenn die folgenden Regeln erfüllt sind: 1. Das Skalarprodukt ist linear im zweiten Faktor, d.h. es gilt: i) (x, y (1) + y (2) ) = (x, y (1) ) + (x, y (2) ) ∀x, y (1) , y (2) ∈ V ii) (x, αy) = α(x, y) ∀x, y ∈ V, α ∈ R 5 2. Das Skalarprodukt ist symmetrisch, d.h. es gilt: (x, y) = (y, x) ∀x, y ∈ V 3. Das Skalarprodukt ist positiv definit, d.h. es gilt: i) (x, x) ≥ 0 ∀x, y ∈ V; ii) aus (x, x) = 0 folgt x = 0 Folgend sind Beispiele von Skalarprodukten eines Vektorraums mit Vektoren und anschliessend Funktionen. Standardskalarprodukt in Rn : Skalarprodukt in C[a, b] : (x, y) := xT y (f, g) := Rb a f, g Fkt ∈ C[a, b] f (t)g(t)dt Def. 3 Zwei Vektoren x, y ∈ V heissen orthogonal, wenn (x, y) = 0. Da cos ϕ = 0 falls x 6= 0, y 6= 0, wobei ϕ = 90◦ Satz 1 Sei V ein reeller Vektorraum mit Skalarprodukt. i) Die orthogonale Projektion eines Vektors x auf den Vektor y 6= 0 ist gegeben y durch den Vektor (x,y) (y,y) ii) Für alle x, y ∈ V gilt:(x, y)2 ≤ (x, x)(y, y) (Schwarzsche Ungleichung) iii) Die Vorschrift, die jedem x ∈ V die Zahl |x| := in V. q (x, x) zuordnet, ist eine Norm iv) Stehen zwei Vektoren x, y ∈ V senkrecht aufeinander, d.h. ist (x, y) = 0, so gilt |x + y|2 = |x − y|2 = |x|2 + |y|2 (Satz von Pythagoras). Dabei bezeichnet kxk, x ∈ V die in iii) eingeführte Norm. 6 2 Lineare Abbildungen Def. 4 Eine Abbildung F : x ∈ V 7→ y = F (x) ∈ W ist eine lineare Abbildung von V 7→ W, falls: i) F (x, y) = F (x) + F (y) ii) F (αy) = αF (x) ∀x, y ∈ V ∀α, x ∈ V 2.1 Lineare Abbildungen und Matrizen Es gilt V = Rn , W = Rm und die lineare Abbildung F : x ∈ V 7→ y ∈ W ist gegeben durch eine m × n-Matrix A, d.h. y = Ax. Sowie Vn bzw Vm für den Vektorraum der n x × 1-Matrizen. Def. 5 Sei F : x ∈ Vn 7→ y ∈ Vm eine lineare Abbildung. i) Die Menge aller Vektoren, welche auf null abgebildet werden, heisst Kern der Matrix A. Kern A := {x ∈ Vn |Ax = 0} ii) Die Menge aller Bildvektoren y ∈ Vm heisst Bild der Matrix A. Bild A := {y ∈ Vm |Es gibt ein x ∈ Vn , so dass y = Ax} Eigenschaften von Kern A und Bild A (im Zusammenhang mit Ax = b und Ax = 0) i) b ∈ Bild A 7→ es gibt ein x womit b = Ax lösbar, d.h., dass b ∈ Bild A mindestens eine Lösung besitzt. ii) x ∈ Kern A falls x das homogene Gleichungssystem löst. iii) Kern A ist ein Unterraum von Vn . Bild A ist ein Unterraum von Vm . iv) Es gilt: dim(KernA) + dim(BildA) = n = dimVn da (n − r) + r = n = Vn v) Es gilt: dim(BildA) = (dim(BildAT ) 2.1.1 Zusammensetzen von Abbildungen H(x) = G(F (x)) 7→ G ◦ F und liest sich als: ”G verknüpft mit F” Es gilt: Das Zusammensetzen von linearen Abbildungen ist wiederum linear. 7 2.2 Abbildungen und Skalarprodukt Wird der n-dimensionale Vektorraum V zu Rn , dann wird das Skalarprodukt zum Standardskalarprodukt. Eine lineare Abbildung F ist gegeben durch F : x ∈ Rn 7→ y = Ax ∈ Rm . Das Standardskalarprodukt ist enthalten in Rn und Rm Es gilt: i) Die Unterräume Bild A und Kern AT von Rm spannen Rm auf: Bild A+Kern AT = Rm ii) die Unterräume Bild A und Kern AT von Rm stehen senkrecht aufeinander: Aus y ∈ Bild A und v ∈ Kern AT folgt (y, v) = 0 iii) dim(BildA) + dim(KernAT ) = dimRm = m → Das Gleichungssystem Ax = b ist genau dann lösbar, wenn b senkrecht auf allen Lösungen des so genannten adjungierten Gleichungssystem AT y = 0 steht. Denn aus ii) wissen wir, dass Bild A genau aus denjenigen Vektoren besteht, die senkrecht auf dem Kern von AT stehen. Beispiel:Fibonacci-Folge F0 , F1 , F2 , . . . 7→ 0, 1, 1, 2, 3, 5, 8, . . . Die Fibonacci-Folge ist wie folgt definiert: F0 = 0, F1 = 1 ! Fn+1 = Fn + Fn−1 n = 1, 2, 3, . . . F n xn sei , gesucht ist die lineare Abbildungsmatrix A, die xn nach xn+1 überFn+1 führt (Also xn · A = xn+1 ) Lösung: ! 0 1 A= 1 1 3 7→ x = 2 3 · A = 3 5 8 2.3 Lineare Selbstabbildungen von Vektorräumen Untersucht werden lineare Abbildungen eines endlichdimensionalen Vektorraumes Vn = Rn . Die linearen Abbildungen sind also quadratische Matrizen. Def. 6 i) Eine Abbildung F : x ∈ Vn 7→ x0 ∈ Vn heisst umkehrbar oder invertierbar, falls es zu jedem x0 ∈ Vn ein eindeutig bestimmtes x0 ∈ Vn gibt mit x0 = F (x). ii) Ist F invertierbar, so heisst die Abbildung, die jedem x0 = F (x) das eindeutig bestimmte Urbild x zuordnet, die Umkehrabbildung von F. Diese wird mit F −1 bezeichnet. Eigenschaften umkehrbarer linearen Abbildungen: i) Eine lineare Abbildung F : x ∈ Vn 7→ x0 = Ax ∈ Vn ist genau dann umkehrbar, wenn A regulär ist. ii) Ist F : x 7→ x0 = Ax umkehrbar, so ist F −1 linear und F −1 wird durch die Matrix A−1 beschrieben. F −1 : x0 7→ x = A−1 x0 . iii) Ist F umkehrbar, so gilt F −1 ◦ F = F ◦ F −1 = I. Dabei ist I die Identität, d.h. I : x ∈ Vn 7→ x ∈ Vn . 2.3.1 Koordinatentransformation Koordinatentransformation = Im Vektorraum wird eine neue Basis gewählt. Def. 7 Eine Koordinatentransformation ist eine umkehrbare lineare Abbildung T : y ∈ Wn 7→ x = T y ∈ Vn . Ein Punkt x = (x1 , x2 , . . . , xn )T ∈ Vn hat mit der Standardbasis des Vektorraums als Komponenten genau die Koordinaten von x. Nimmt man nun eine neue Basis t(1) , . . . , t(n) ∈ Vn , kann Punkt x als Linearkombination dieser neuen Vektoren dargestellt werden: x = y1 t(1) + y2 t(2) + y3 t(3) + . . . + yn t(n) yi sind die neuen Koordinaten des Punktes x bezüglich der neuen Basis. Satz 2 Seien eine lineare Abbildung F : x ∈ Vn 7→ x0 = Ax ∈ Vn und eine Koordinatentransformation T : y ∈ Wn 7→ x = T y ∈ Vn gegeben. Dann lässt sich die lineare Abbildung in den neuen Koordinaten darstellen als: G = T −1 ◦ F ◦ T : y ∈ Wn 7→ y 0 = T −1 AT y ∈ Wn 9 2.3.2 Norm einer Matrix Die ”Grösse” oder Norm einer Matrix soll angeben, um welchen Faktor sich die Norm eines Vektors x maximal verändert, wenn man auf ihn die Abbildung F : x 7→ x0 = Ax anwendet. Def. 8 Sei A eine n × n-Matrix, und sei in Vn eine Norm kxk∗ , x ∈ Vn gegeben. Dann heisst die Zahl ) ( kAxk∗ kAk∗ := sup kxk∗ x∈Vn ,x6=0 Norm von A. Durch Umformen: (∀x ∈ Vn , x 6= 0, der Vektor 1 x kxk∗ hat die Norm 1): kAk∗ := sup {kAxk∗ } kxk∗ =1 Eigenschaften: i) kAk∗ ≥ 0, aus kAk∗ = 0 folgt A = 0 ii) kαAk = |α|kAk∗ . iii) kA + Bk∗ ≤ kak∗ + kBk∗ iv) kAxk∗ ≤ kAk∗ kxk∗ v) kABk∗ ≤ kAk∗ kBk∗ 2.3.3 Orthogonale Abbildungen Ausgehend von folgenden Annahmen: Orthonormale Basis ∈ V, die Vektoren x ∈ V werden mit ihren Koordinatenvektoren identifiziert. V = Rn ; F : x 7→ x0 = Ax. Skalarprodukt: (x, y) = xT y. Norm euklidisch kxk := kxk2 , x ∈ Rn Def. 9 i) Die Abbildung F : x ∈ Rn 7→ x0 = Ax ∈ Rn heisst orthogonal, falls (x0 , y 0 ) = (Ax, Ay) = (x, y) ∀x, y ∈ Rn gilt. ii) Die Abbildung F : x ∈ Rn 7→ x0 = Ax ∈ Rn heisst längentreu, falls kx0 k = kAxk = kxk ∀x ∈ Rn gilt. 10 Eigenschaften: (F : x ∈ Rn 7→ x0 = Ax ∈ Rn , (x0 , y 0 ) = (Ax, Ay) = (x, y)) i) F ist orthogonal. ii) F ist längentreu. iii) Die Spalten von A bilden eine orthonormale Basis in Rn . iv) Die Matrix A ist orthogonal, d.h. es gilt AAT = I, bzw. AT = A−1 . 11