Vektorräume und Lineare Abbildungen

Werbung
Vektorräume und Lineare
Abbildungen
Patricia Doll, Selmar Binder, Lukas Bischoff, Claude Denier
ETHZ D-MATL SS–07
11.04.2007
1 Vektorräume
1.1 Definition des Vektorraumes (VR)
1.1.1 Grundoperationen
Um den Vektorraum zu verstehen müssen wir erst die Grundoperationen die angewendet werden beschreiben (hier am Beispiel der „geometrischen“ Vektoren, für andere
mögliche Elemente eines Vektorraumes müssen sie sinnvoll definiert werden):
1. Addition zweier Vektoren
Vektoren werden gemäss dem ”altbekannten” Parallelogramm addiert.
Abbildung 1: Vektoraddition
1
2. Multiplikation mit einem Skalar:
Bei der Multiplikation eines Vektors mit einem Skalar a (d.h. einer eindimensionalen Zahl) bleibt die Richtung des Vektors erhalten. Nur die Länge wird gestreckt
wobei a der Streckungsfaktor ist.
Dabei gelten immer folgende Rechenregeln:
(~a, ~b, ~c sind Vektoren, α, β Skalare Zahlen)
i) ~a + ~b = ~b + ~a
ii) ~a + (~b + ~c) = (~a + ~b) + ~c
iii) ~a + ~0 = ~0
~ = ~0
iv) ~a + (−a)
v) α(β~a) = (αβ)~a
vi) (α + β)~a = α~a + β~a
vii) 1 · ~a = ~a
α(~a + ~b) = α~a + β~b
1.1.2 Definition Vektorraum
Ein Vektorraum ist eine Menge von Elementen (Vektoren), die bezüglich der definierten
Grundoperationen abgeschlossen ist. Das heisst, Elemente eines Vektorraumes untereinander oder mit einem Skalar verknüpft ergeben wieder ein Element desselben VR.
Somit sind Vektorräume bezüglich der Grundoperationen Abelsche Gruppen.
Bemerkung: Elemente eines Vektorraums können nicht nur „geometrische“ Vektoren
sein. Es kann sich beispielsweise auch um Matrizen oder Funktionen handeln. Es müssen nur die Grundoperationen neu definiert werden. Für Funktionen zum Beispiel ist es
nahe liegend unter der Multiplikation mit einem Skalar die Streckung der Funktionswerte zu verstehen. Auch die Addition zweier Funktionen wird wohl jeder intuitiv richtig
definieren. Prüfen wir nach, kommen wir schnell zum Schluss, dass die Bedingungen
für einen Vektorraum der aus Funktionen besteht, erfüllbar sind.
1.2 Eigenschaften von Vektorräumen
1.2.1 Der Untervektorraum (UVR)
Nehmen wir uns einen ”grossen” Vektorraum, mit vielen Elementen, wie R2 . Die in ihm
enthaltenen Vektoren sind von der Form (x, y). Nehmen wir daraus nur die Teilmenge U
der Vektoren deren y-Wert gleich 0 ist. Sie sind von der Form (x, 0). Ohne nachzuprüfen
ist uns klar dass die erlaubten Grundoperationen für R2 auch für U gelten. Kurz darüber
nachgedacht, ist es auch offensichtlich das jede Anwendung der Grundoperationen
auf einen Vektor der Form (x, 0), nur einen Vektor derselben Form erzeugen kann.
2
Offensichtlich erfüllt die Menge U alle Kriterien für einen Vektorraum. Gleichzeitig ist
U komplett enthalten in R2 . U ist damit ein Untervektorraum des Vektorraumes R2 .
1.2.2 Linearkombination
Ein Vektor ~b ist dann linear abhängig von einer Menge Vektoren A = (a~1 , a~2 , . . . , a~n )
wenn folgende Gleichung erfüllbar ist ohne dass alle ci gleich 0 sind:
a~1 c1 + a~2 c2 + . . . + a~n cn = ~b
(1)
~b ist linear abhängig von der Menge A. er lässt sich komplett durch Elemente von A
ausdrücken und ist auch definitiv in einem Vektorraum mit der Menge A.
1.2.3 Erzeugungssystem
Sind alle Vektoren ~b eines Vektorraumes V linear abhängig von einer Teilmenge A des
Vektorraumes V, so ist A ein Erzeugungssystem des Vektorraumes V.
(Die triviale Lösung A = V ist offensichtlich und sinnlos. Ein Erzeugungssystem macht
erst dann Sinn wenn es weniger Elemente hat als der Vektorraum den es erzeugt.)
1.2.4 Basis
Eine Basis eines Vektorraumes V, ist ein Erzeugungssystem für V dessen Elemente
alle linear unabhängig voneinander sind. Es hat die minimal nötige Anzahl von Elementen. Daraus folgt auch, dass ein Erzeugungssystem das keine Basis ist, ”überflüssige”
Elemente enthält.
Bemerkung: Ein Erzeugungssystem kann von linear abhängigen Vektoren befreit werden, wenn alle Elemente a~i (nach Gleichung 1) durch Linearkombination den Nullvektor
erzeugen können. Durch subtrahieren von a~n und dividieren durch cn , zeigt die Gleichung nun, dass a~n eine Linearkombination der Vektoren a~1 bis an−1
~ ist. a~n kann
eindeutig erzeugt werden und kann somit aus dem Erzeugungssystem gestrichen werden. Kann die Gleichung nicht mehr erfüllt werden ohne, dass alle ci = 0 sind, so ist aus
dem Erzeugungssystem eine Basis geworden (durch Elimination der linear abhängigen
Elemente).
Grösse einer Basis (für Vn ):
i) Mehr als n Vektoren sind linear abhängig.
ii) Weniger als n Vektoren sind nie ein Erzeugungssystem.
3
iii) n Vektoren sind dann ein Erzeugungssystem, wenn sie linear unabhängig sind
und somit eine Basis bilden.
→ Glaubt man obigen drei Annahmen haben alle Basen für Vn n Elemente.
Auf einen Beweis der obigen Annahmen wird verzichtet. Es sollte aber möglich sein
durch Vertiefung der Bedeutung jeder einzelnen Aussage intuitiv deren Richtigkeit zu
glauben.
1.3 Normierte Vektorräume
Die Norm eines Vektors wird auch als Länge oder Betrag bezeichnet. Bei der Vorstellung
eines Vektors als Pfeil, d.h. als gerichtete Strecke, stellt diese die Länge dar. Beim Lösen
von der Idee des Vektors als Pfeil muss eine andere Art gefunden werden, wie der
Längenbegriff zu definieren ist. Deshalb werden die Eigenschaften in den Vordergrund
gesetzt. Die Norm eines Vektors a wird |a| geschrieben.
Def. 1 Wenn V ein Vektorraum ist und eine Vorschrift einem Vektor a ∈ V eine reelle
Zahl |a| zuordnet, heisst diese Norm, wenn die folgenden Regeln erfüllt sind.
1.
i) Für jeden Vektor a ∈ Vgilt|a| ≥ 0,
ii) aus |a| = 0 folgt a = 0.
2. Für jeden Vektor a ∈ V und√
für jede Zahl α gilt: |αa| = |α| · |a|
Für komplexe Zahlen: |α| = u2 + v 2 , falls α = u + iv ist.
3. Für alle Vektoren a, b ∈ V gilt: |a + b| ≤ |a| + |b| (Dreiecksgleichung).
Die folgenden Normen sind bei Vektorräumen anzuwenden, welche aus Vektoren bestehen.
q
Lp -Normen: |x|p := | p |x1 |p + |x2 |p + |x3 |p | (=Klasse von Normen)
q
Euklidische Norm: |x|2 := | x12 + x22 + x32 | (gehört zu den Lp -Normen)
Maximumnorm: |x|∞ := max(|x1 |, |x2 |, |x3 |)
4
Abbildung 2: ”Einheitskreisscheibe mit verschiedenen Lp -Normen”
Vektorräume aus Funktionen bestehend benötigen eine andere Norm. Diese Norm |f |
ist z.B. der maximale mögliche Wert einer Funktion f (x) ∈ I = [a, b], anstelle von
f (x) wird jedoch |f (x)| eingesetzt, da auch die negativen Ausschläge berücksichtigt
werden (2). In diese Norm kann auch noch die zweite Ableitung hinein genommen
werden (3). Diese Norm kann damit mehr über die Funktion aussagen.
|f |0 := max |f (x)|
(2)
|f |1 := max |f (x)| + max |f 0 (x)|
(3)
x∈I
x∈I
x∈I
1.4 Skalarprodukt
So wie der Längenbegriff über die Norm definiert werden kann, wird der Begriff des
Winkels über das Skalarprodukt definiert.
cos ϕ =
<a,b>
,
kak·kbk
falls a 6= 0, b 6= 0
Wenn (a, b) = 0 stehen a und b senkrecht aufeinander, sind sie orthogonal.
Def. 2 Sei V ein reeller Vektorraum. Eine Vorschrift, welche jedem Paar x, y von
Vektoren eine reelle Zahl (x, y) zuordnet, heisst Skalarprodukt im Vektorraum V, wenn
die folgenden Regeln erfüllt sind:
1. Das Skalarprodukt ist linear im zweiten Faktor, d.h. es gilt:
i) (x, y (1) + y (2) ) = (x, y (1) ) + (x, y (2) )
∀x, y (1) , y (2) ∈ V
ii) (x, αy) = α(x, y)
∀x, y ∈ V, α ∈ R
5
2. Das Skalarprodukt ist symmetrisch, d.h. es gilt:
(x, y) = (y, x)
∀x, y ∈ V
3. Das Skalarprodukt ist positiv definit, d.h. es gilt:
i) (x, x) ≥ 0
∀x, y ∈ V;
ii) aus (x, x) = 0 folgt x = 0
Folgend sind Beispiele von Skalarprodukten eines Vektorraums mit Vektoren und anschliessend Funktionen.
Standardskalarprodukt in Rn :
Skalarprodukt in C[a, b] :
(x, y) := xT y
(f, g) :=
Rb
a
f, g Fkt ∈ C[a, b]
f (t)g(t)dt
Def. 3 Zwei Vektoren x, y ∈ V heissen orthogonal, wenn (x, y) = 0. Da cos ϕ = 0
falls x 6= 0, y 6= 0, wobei ϕ = 90◦
Satz 1 Sei V ein reeller Vektorraum mit Skalarprodukt.
i) Die orthogonale Projektion eines Vektors x auf den Vektor y 6= 0 ist gegeben
y
durch den Vektor (x,y)
(y,y)
ii) Für alle x, y ∈ V gilt:(x, y)2 ≤ (x, x)(y, y) (Schwarzsche Ungleichung)
iii) Die Vorschrift, die jedem x ∈ V die Zahl |x| :=
in V.
q
(x, x) zuordnet, ist eine Norm
iv) Stehen zwei Vektoren x, y ∈ V senkrecht aufeinander, d.h. ist (x, y) = 0, so gilt
|x + y|2 = |x − y|2 = |x|2 + |y|2 (Satz von Pythagoras).
Dabei bezeichnet kxk, x ∈ V die in iii) eingeführte Norm.
6
2 Lineare Abbildungen
Def. 4 Eine Abbildung F : x ∈ V 7→ y = F (x) ∈ W ist eine lineare Abbildung von
V 7→ W, falls:
i) F (x, y) = F (x) + F (y)
ii) F (αy) = αF (x)
∀x, y ∈ V
∀α, x ∈ V
2.1 Lineare Abbildungen und Matrizen
Es gilt V = Rn , W = Rm und die lineare Abbildung F : x ∈ V 7→ y ∈ W ist gegeben
durch eine m × n-Matrix A, d.h. y = Ax. Sowie Vn bzw Vm für den Vektorraum der
n x × 1-Matrizen.
Def. 5 Sei F : x ∈ Vn 7→ y ∈ Vm eine lineare Abbildung.
i) Die Menge aller Vektoren, welche auf null abgebildet werden, heisst Kern der
Matrix A.
Kern A := {x ∈ Vn |Ax = 0}
ii) Die Menge aller Bildvektoren y ∈ Vm heisst Bild der Matrix A.
Bild A := {y ∈ Vm |Es gibt ein x ∈ Vn , so dass y = Ax}
Eigenschaften von Kern A und Bild A (im Zusammenhang mit Ax = b und Ax = 0)
i) b ∈ Bild A 7→ es gibt ein x womit b = Ax lösbar, d.h., dass b ∈ Bild A mindestens
eine Lösung besitzt.
ii) x ∈ Kern A falls x das homogene Gleichungssystem löst.
iii) Kern A ist ein Unterraum von Vn .
Bild A ist ein Unterraum von Vm .
iv) Es gilt: dim(KernA) + dim(BildA) = n = dimVn da (n − r) + r = n = Vn
v) Es gilt: dim(BildA) = (dim(BildAT )
2.1.1 Zusammensetzen von Abbildungen
H(x) = G(F (x)) 7→ G ◦ F und liest sich als: ”G verknüpft mit F”
Es gilt: Das Zusammensetzen von linearen Abbildungen ist wiederum linear.
7
2.2 Abbildungen und Skalarprodukt
Wird der n-dimensionale Vektorraum V zu Rn , dann wird das Skalarprodukt zum
Standardskalarprodukt.
Eine lineare Abbildung F ist gegeben durch F : x ∈ Rn 7→ y = Ax ∈ Rm . Das
Standardskalarprodukt ist enthalten in Rn und Rm
Es gilt:
i) Die Unterräume Bild A und Kern AT von Rm spannen Rm auf:
Bild A+Kern AT = Rm
ii) die Unterräume Bild A und Kern AT von Rm stehen senkrecht aufeinander:
Aus y ∈ Bild A und v ∈ Kern AT folgt (y, v) = 0
iii) dim(BildA) + dim(KernAT ) = dimRm = m
→ Das Gleichungssystem Ax = b ist genau dann lösbar, wenn b senkrecht auf allen
Lösungen des so genannten adjungierten Gleichungssystem AT y = 0 steht. Denn aus
ii) wissen wir, dass Bild A genau aus denjenigen Vektoren besteht, die senkrecht auf
dem Kern von AT stehen.
Beispiel:Fibonacci-Folge
F0 , F1 , F2 , . . . 7→ 0, 1, 1, 2, 3, 5, 8, . . .
Die Fibonacci-Folge ist wie folgt definiert:
F0 = 0, F1 = 1 ! Fn+1 = Fn + Fn−1
n = 1, 2, 3, . . .
F
n
xn sei
, gesucht ist die lineare Abbildungsmatrix A, die xn nach xn+1 überFn+1
führt (Also xn · A = xn+1 )
Lösung:
!
0 1
A=
1 1
3
7→ x = 2 3 · A = 3 5
8
2.3 Lineare Selbstabbildungen von Vektorräumen
Untersucht werden lineare Abbildungen eines endlichdimensionalen Vektorraumes
Vn = Rn . Die linearen Abbildungen sind also quadratische Matrizen.
Def. 6
i) Eine Abbildung F : x ∈ Vn 7→ x0 ∈ Vn heisst umkehrbar oder invertierbar, falls es zu jedem x0 ∈ Vn ein eindeutig bestimmtes x0 ∈ Vn gibt mit
x0 = F (x).
ii) Ist F invertierbar, so heisst die Abbildung, die jedem x0 = F (x) das eindeutig
bestimmte Urbild x zuordnet, die Umkehrabbildung von F. Diese wird mit F −1
bezeichnet.
Eigenschaften umkehrbarer linearen Abbildungen:
i) Eine lineare Abbildung F : x ∈ Vn 7→ x0 = Ax ∈ Vn ist genau dann umkehrbar,
wenn A regulär ist.
ii) Ist F : x 7→ x0 = Ax umkehrbar, so ist F −1 linear und F −1 wird durch die
Matrix A−1 beschrieben. F −1 : x0 7→ x = A−1 x0 .
iii) Ist F umkehrbar, so gilt F −1 ◦ F = F ◦ F −1 = I. Dabei ist I die Identität, d.h.
I : x ∈ Vn 7→ x ∈ Vn .
2.3.1 Koordinatentransformation
Koordinatentransformation = Im Vektorraum wird eine neue Basis gewählt.
Def. 7 Eine Koordinatentransformation ist eine umkehrbare lineare Abbildung T : y ∈
Wn 7→ x = T y ∈ Vn .
Ein Punkt x = (x1 , x2 , . . . , xn )T ∈ Vn hat mit der Standardbasis des Vektorraums als
Komponenten genau die Koordinaten von x.
Nimmt man nun eine neue Basis t(1) , . . . , t(n) ∈ Vn , kann Punkt x als Linearkombination dieser neuen Vektoren dargestellt werden:
x = y1 t(1) + y2 t(2) + y3 t(3) + . . . + yn t(n)
yi sind die neuen Koordinaten des Punktes x bezüglich der neuen Basis.
Satz 2 Seien eine lineare Abbildung F : x ∈ Vn 7→ x0 = Ax ∈ Vn und eine
Koordinatentransformation T : y ∈ Wn 7→ x = T y ∈ Vn gegeben.
Dann lässt sich die lineare Abbildung in den neuen Koordinaten darstellen als:
G = T −1 ◦ F ◦ T : y ∈ Wn 7→ y 0 = T −1 AT y ∈ Wn
9
2.3.2 Norm einer Matrix
Die ”Grösse” oder Norm einer Matrix soll angeben, um welchen Faktor sich die Norm
eines Vektors x maximal verändert, wenn man auf ihn die Abbildung F : x 7→ x0 = Ax
anwendet.
Def. 8 Sei A eine n × n-Matrix, und sei in Vn eine Norm kxk∗ , x ∈ Vn gegeben.
Dann heisst die Zahl
)
(
kAxk∗
kAk∗ := sup
kxk∗
x∈Vn ,x6=0
Norm von A.
Durch Umformen: (∀x ∈ Vn , x 6= 0, der Vektor
1
x
kxk∗
hat die Norm 1):
kAk∗ := sup {kAxk∗ }
kxk∗ =1
Eigenschaften:
i) kAk∗ ≥ 0, aus kAk∗ = 0 folgt A = 0
ii) kαAk = |α|kAk∗ .
iii) kA + Bk∗ ≤ kak∗ + kBk∗
iv) kAxk∗ ≤ kAk∗ kxk∗
v) kABk∗ ≤ kAk∗ kBk∗
2.3.3 Orthogonale Abbildungen
Ausgehend von folgenden Annahmen:
Orthonormale Basis ∈ V, die Vektoren x ∈ V werden mit ihren Koordinatenvektoren
identifiziert.
V = Rn ; F : x 7→ x0 = Ax.
Skalarprodukt: (x, y) = xT y.
Norm euklidisch kxk := kxk2 , x ∈ Rn
Def. 9
i) Die Abbildung F : x ∈ Rn 7→ x0 = Ax ∈ Rn heisst orthogonal, falls
(x0 , y 0 ) = (Ax, Ay) = (x, y)
∀x, y ∈ Rn gilt.
ii) Die Abbildung F : x ∈ Rn 7→ x0 = Ax ∈ Rn heisst längentreu, falls
kx0 k = kAxk = kxk
∀x ∈ Rn gilt.
10
Eigenschaften: (F : x ∈ Rn 7→ x0 = Ax ∈ Rn , (x0 , y 0 ) = (Ax, Ay) = (x, y))
i) F ist orthogonal.
ii) F ist längentreu.
iii) Die Spalten von A bilden eine orthonormale Basis in Rn .
iv) Die Matrix A ist orthogonal, d.h. es gilt AAT = I, bzw. AT = A−1 .
11
Herunterladen