1 Der Begriff des Vektorraumes, Definition und Beispiele

Werbung
1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE
1
1
Der Begriff des Vektorraumes, Definition und Beispiele
Von zentraler Bedeutung in der linearen Algebra ist der Begriff des Vektorraumes. Dieser Begriff ist zumindest
zum Teil aus der Vektorgeometrie, wie man sie aus der analytischen Geometrie kennt, entstanden. Dort wird
ein Vektor durch seine Richtung und seine Länge charakterisiert. Repräsentiert wird er durch einen Pfeil.
Primär werden in der Vektorrechnung zwei Operationen mit Vektoren eingeführt:
b
a
a+b
µa
a
Abbildung 1: Vektoren
die Addition (mit Hilfe des Parallelogramms, vgl. Abbildung 1) und die Multiplikation eines Vektors mit einer
Zahl (die „Streckung“ eines Vektors, vgl. Abbildung 1)
Dabei gelten folgende
1.1
Regeln
• a+b=b+a
• (a + b) + c = a + (b + c)
• für den Nullvektor 0 gilt: a + 0 = a
• für den zu a entgegengesetzten Vektor −a gilt: a + (−a) = 0
• α(βa) = (αβ)a
• (α + β)a = αa + βa
• α(a + b) = αa + αb
• 1a = a
Dabei sind a, b und c beliebige Vektoren und α, β bezeichnen beliebige reelle Zahlen.
Bemerkung 1.
Die Vektoren (der Geometrie) sind nicht die einzigen Objekte, die sich addieren und mit einer Zahl multiplizieren lassen, so dass die obigen Rechenregeln 1.1 gelten. Die Vektoren der Ebene (oder des Raumes)
sind ein Beispiel, sozusagen ein Prototyp, für eine Struktur, die häufiger vorkommt, als man zunächst vermutet.
Es folgt eine Illustration an verschiedenen Beispielen:
Beispiel 1. Der Vektorraum R2
Ein Vektor ist ein Paar reeller Zahlen, die als 2 × 1−Matrizen geschrieben werden:
µ
¶
x1
x=
x1 , x2 ∈ R
x2
zhaw
ungr/vektor_raum.tex
1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE
2
Die Menge aller solcher Vektoren wird mit R2 bezeichnet:
½
µ
¶¯
¾
x1 ¯¯
R2 = x =
x
,
x
∈
R
x2 ¯ 1 2
Da Vektoren 2 × 1−Matrizen sind, kann man sie addieren und mit reellen Zahlen α multiplizieren.
Es gilt:
µ
¶ µ
¶
µ
¶
x1
y1
x1 + y1
x+y =
+
=
x2
y2
x2 + y2
µ
¶
µ
¶
x1
αx1
αx = α
=
x2
αx2
µ ¶
0
Es ist leicht nachzurechnen, dass die Regeln 1.1 erfüllt sind, wobei der Nullvektor durch 0 =
und der
0
µ
¶
−x1
Vektor −x durch −x =
gegeben sind.
−x2
Falls in der Ebene ein Ursprung und ein kartesisches Koordinatensystem festgelegt werden, so kann jeder Punkt
dieser Ebene mit einem Vektor aus R2 identifiziert werden. R2 ist also die Menge der Koordinatenvektoren
der Ebene, vgl. Abschnitt 2.2 und Definition 9.
Beispiel 2. Der Vektorraum R3
Ein Vektor ist ein Tripel reeller Zahlen, die als 3 × 1−Matrizen geschrieben werden:


x1
x =  x2 
x1 , x2 , x3 ∈ R
x3
Die Menge aller solcher Vektoren wird mit R3 bezeichnet:



¯
x1 ¯¯


R3 = x =  x2 ¯¯ x1 , x2 , x3 ∈ R


x3 ¯
Da Vektoren 3 × 1−Matrizen sind, kann man sie addieren und mit reellen Zahlen α multiplizieren.
Es gilt:

 



x1
y1
x1 + y1
x + y =  x2  +  y2  =  x2 + y2 
x3
y3
x3 + y3




x1
αx1
αx = α  x2  =  αx2 
x3
αx3


0
Es ist leicht nachzurechnen, dass die Regeln 1.1 erfüllt sind, wobei der Nullvektor durch 0 =  0  und der
0


−x1
Vektor −x durch −x =  −x2  gegeben sind.
−x3
Falls im Raum ein Ursprung und ein kartesisches Koordinatensystem festgelegt werden, so kann jeder Punkt
dieses Raumes mit einem Vektor aus R3 identifiziert werden. R3 ist also die Menge der Koordinatenvektoren
des Raumes, vgl. Abschnitt 2.2 und Definition 9.
zhaw
ungr/vektor_raum.tex
1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE
3
Beispiel 3. Der Vektorraum Rn
Ein Vektor ist ein n−Tupel reeller Zahlen, die als n × 1−Matrizen geschrieben werden:


x1
 x2 


x= . 
x1 , x2 , . . . , xn ∈ R
 .. 
xn
Die Menge aller solcher Vektoren wird mit Rn bezeichnet:


¯

x1 ¯¯








 x2 ¯
¯

n
R = x =  . ¯ x1 , x2 , . . . , xn ∈ R


 .. ¯


¯




¯
xn
Da Vektoren n × 1−Matrizen sind, kann man sie addieren und
Es gilt:

 

x1
y1
 x2   y2 

 

x+y = . + .  =
 ..   .. 
xn



αx = α 

yn
x1
x2
..
.
mit reellen Zahlen α multiplizieren.













= 

xn
x1 + y1
x2 + y2
..
.





xn + yn

αx1
αx2 

.. 
. 
αxn



Es ist leicht nachzurechnen, dass die Regeln 1.1 erfüllt sind, wobei der Nullvektor 0 durch 




und der Vektor −x durch 

−x1
−x2
..
.
0
0
..
.





0



 gegeben sind.

−xn
n
Der R ist eine formale Erweiterung der geometrisch anschaulichen Fälle R2 und R3 . Mit einem Vektor x ∈ Rn
lässt sich keine konkrete geometrische Vorstellung mehr verbinden.
Beispiel 4. Der Vektorraum C[a, b]
Mit diesem Beispiel entfernen wir uns noch mehr von der ursprünglichen Vorstellung eines Vektors. Als
Objekte werden nun Funktionen, die auf einem fest gewählten Intervall I = [a, b] definiert und stetig sind,
vgl. Abbildung 2
Die Menge dieser Funktionen nennt man C[a, b], wobei C für continuous, d.h. stetig steht. Sind f und g zwei
Elemente aus C[a, b], so wird eine Funktion f + g auf [a, b] durch
(f + g)(x) := f (x) + g(x)
x ∈ [a, b]
definiert. Der Wert der Funktion f + g an der Stelle x ist gleich der Summe der Werte von f und g an dieser
Stelle (Überlagerung bzw. Superposition zweier Funktionen). Aus der Analysis ist bekannt, dass die Summe
zweier stetiger Funktionen wieder eine stetige Funktion ist, d.h. es gilt f + g ∈ C[a, b].
Analog kann die Multiplikation einer Funktion f ∈ C[a, b] mit einer reellen Zahl c definiert werden:
(cf )(x) := cf (x)
x ∈ [a, b]
Auch cf ist eine stetige Funktion, d.h. cf ∈ C[a, b].
zhaw
ungr/vektor_raum.tex
1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE
4
2.5
2
1.5
1
0.5
0
a
b
−0.5
−1
−1
−0.5
0
0.5
1
1.5
2
2.5
3
Abbildung 2: stetige Funktionen
Es ist nicht schwierig nachzuprüfen, dass die Regeln 1.1 wiederum gelten. Dabei ist 0 die Nullfunktion, d.h.
diejenige Funktion aus C[a, b], die jedem x den Wert 0 zuordnet; −f ist durch
(−f )(x) := −f (x)
x ∈ [a, b]
definiert. Damit ist klar, dass die stetigen Funktionen ebenso „Vektor-Eigenschaften“ haben, wie die „Pfeile“
der ebenen bzw. räumlichen Geometrie.
1.2
Abstrakter Begriff
Ein
Definition 1. Reeller Vektorraum V
V ist eine Menge von Objekten (Vektoren) mit den folgenden Eigenschaften:
Es ist eine Addition definiert, d.h. zwei Vektoren a und b aus V ist ein dritter Vektor aus V zugeordnet, der
mit a + b bezeichnet wird.
Es ist eine Multiplikation mit reellen Zahlen definiert, d.h. einer reellen Zahl α und einem Vektor a aus V ist
ein Vektor aus V zugeordnet, der mit αa bezeichnet wird.
Es gelten die folgenden Regeln:
(A1) a + b = b + a
(A2) (a + b) + c = a + (b + c)
(A3) Es gibt einen Nullvektor, der mit 0 bezeichnet wird und für den gilt: a + 0 = a
(A4) zu jedem Vektor a gibt es einen entgegengesetzten Vektor, der mit −a bezeichnet wird und für den
gilt: a + (−a) = 0
(M1) α(βa) = (αβ)a
(M2) (α + β)a = αa + βa sowie α(a + b) = αa + βa
(M3) 1a = a
Dabei sind a, b und c beliebige Vektoren aus V und α, β beliebige reelle Zahlen.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
2
5
Die Struktur von Vektorräumen
Nun werden gewisse Teilmengen von Vektorräumen untersucht, sogenannte Unterräume. Als Beispiel wird der
R4 und als Teilmenge U die Vektoren x von folgender Gestalt


x3 − x4
 x3 + x4 

x=


x3
x4
Dabei sind x3 und x4 beliebige Zahlen. Seien nun a und b zwei dieser Vektoren, also




a3 − a4
b3 − b4
 a3 + a4 
 b3 + b4 


a=
b=




a3
b3
a4
b4
Wir bilden a + b und αa, wobei α ∈ R. Offenbar sind beide Vektoren wieder von derselben Gestalt wie a und
b, nämlich:




(a3 + b3 ) − (a4 + b4 )
αa3 − αa4
 (a3 + b3 ) + (a4 + b4 ) 
 αa3 + αa4 


a+b=
αa = 




a3 + b3
αa3
a4 + b4
αa4
Bemerkung 2. U ist selbst wieder ein Vektorraum, ein Unterraum des R4 .
Wir wissen schon, dass die Summe zweier Vektoren aus U wieder in U liegt und dass jedes Vielfache eines
Vektors aus U wieder ein Element von U ist.
Es bliebe noch zu zeigen, dass die Regeln (A1) - (A4) bzw. (M1) - (M3) gelten. Das wird später in einem
allgemeinen Fall nachgeprüft, vgl. Satz 1.
Beispiel 5. Gegenbeispiel
Illustration, dass keineswegs jede Teilmenge eines Vektorraums wieder ein Vektorraum ist.
Wir betrachten als Vektorraum den R2 und als Teilmenge M alle Vektoren der Gestalt
µ 2 ¶
x2
x=
x2
Dabei ist x2 eine beliebige reelle Zahl. Seien a und b zwei dieser Vektoren, also
µ 2 ¶
µ 2 ¶
a2
b2
a=
b=
a2
b2
Wann sind a + b oder αa, α ∈ R, wieder Elemente der Teilmenge M , d.h. wann gilt
µ 2 ¶
c2
a+b=c=
c2
für ein geeignet gewähltes c2 ?
Offenbar muss
a22 + b22
=
c22
a2 + b2
=
c2
gelten. Quadriert man die zweite Gleichung und subtrahiert man davon die erste, so erhält man 2a2 b2 = 0.
Es muss also a2 = 0 oder b2 = 0 gelten. Der Vektor a + b liegt daner nur dann in der Teilmenge M , falls
entweder a oder b der Nullvektor ist. Ähnlich wird gezeigt, dass für a =
6 0 der Vektor αa nur dann in der
Teilmenge M liegt, wenn α = 1 oder α = 0 ist.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
6
Diese beiden Beispiele zeigen: entscheidend dafür, dass eine Teilmenge eines Vektorraumes einen Vektorraum
darstellt, ist, dass sie “abgeschlossen”, ist gegenüber der Addition und der Multiplikation mit einer Zahl.
Dies führt zur
Definition 2. Unterraum U eines Vektorraumes
Eine nicht-leere Teilmenge U eines Vektorraumes V heisst Unterraum von V , falls folgende beiden Bedingungen erfüllt sind:
i) mit a, b ∈ U ist auch a + b ∈ U .
ii) mit a ∈ U , α ∈ R, ist auch αa ∈ U .
Satz 1. Jeder Unterraum U eines Vektorraumes V ist selbst ein Vektorraum.
Begründung:
• die Regeln (A1), (A2), (M1) - (M3) gelten im ganzen Vektorraum V , insbesondere
in der Teilmenge U
• zur Regel (A3): der Nullvektor von V liegt auch in U . Ist nämlich a irgendein Vektor aus U , dann ist
nach ii) 0a ebenfalls in U . 0a ist aber der Nullvektor, damit gilt (A3) auch in U .
• zur Regel (A4): mit dem Vektor a ist auch der Vektor −a in U , dies folgt aus −a = (−1)a und wiederum
mit ii).
Bemerkung 3.
Es gibt immer die folgenden trivialen Unterräume des Vektorraumes V : erstens V selbst und zweitens {0},
d.h. die Menge, die nur aus dem Nullvektor besteht.
Anhand verschiedener Beispiele soll nun der Unterraum etwas genauer untersucht werden:
Beispiel 6. Ax = 0
Sei V = Rn und A eine gegebene (reelle) m × n−Matrix. Als Teilmenge U des Vektorraumes V werden die
Lösungen des linearen homogenen Gleichungssystems
Ax = 0
betrachtet. D.h. es ist U = { x ∈ Rn | Ax = 0}.
Zu zeigen ist: U ist ein Unterraum von V .
Seien a, b ∈ U , d.h. es gilt Aa = 0 und Ab = 0, dann folgt
A(a + b) = Aa + Ab = 0 + 0 = 0
A(αa) = αAa = α0 = 0
Somit gilt: a + b ∈ U und αa ∈ U
Bemerkung 4.
Für c 6= 0 bilden die Lösungen x des linearen inhomogenen Systems Ax = c keinen Unterraum!
Beispiel 7. C 1 [a, b] ⊂ C[a, b]
Als Vektorraum wird nun der C[a, b], d.h. die Menge der stetigen Funktionen auf einem fest vorgegebenen
Intervall I = [a, b], betrachtet. Betrachten wir zudem die Menge C 1 [a, b] der auf I differenzierbaren Funktionen, die eine stetige Ableitung haben. Da jede Funktion in C 1 [a, b] differenzierbar ist, ist sie auch stetig und
gehört damit zu C[a, b].
Umgekehrt ist nicht jede stetige Funktion auch differenzierbar, cf. Abbildung 3.
Es gilt also: C 1 [a, b] ist eine Teilmenge von C[a, b]. Man nennt die Funktionen aus C 1 [a, b] (einmal) stetig
differenzierbar.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
7
y
y = f(x)
x
a
b
Abbildung 3: Kurve y = f (x) einer nicht differenzierbaren Funktionen aus C[a, b]
In der Analysis wird gezeigt: sind f und g stetig differenzierbar, so auch f + g {Summenregel der Ableitung:
(f + g)0 = f 0 + g 0 } und αf , α ∈ R, {Produkteregel der Ableitung für eine Konstante: (αf )0 = αf 0 }
Die Teilmenge C 1 [a, b] ist somit ein Unterraum des Vektorraumes C[a, b].
Wir können einen Schritt weitergehen und die Menge C 2 [a, b] der zweimal stetig differenzierbaren Funktionen
betrachten. Das sind diejenigen Funktionen f , die eine erste und eine zweite Ableitung haben, wobei die
zweite Ableitung f 00 stetig ist. Aus der Analysis folgt erneut, dass C 2 [a, b] ein Unterraum von C 1 [a, b] ist und
damit auch von C[a, b]. So fortfahrend kann man eine unendliche Folge von ineinander liegenden Unterräumen
definieren:
C[a, b] = C 0 [a, b] ⊃ C 1 [a, b] ⊃ C 2 [a, b] ⊃ C 3 [a, b] ⊃ C 4 [a, b] ⊃ . . .
Seien nun U1 und U2 zwei Unterräume des Vektorraumes V . Sowohl der Durchschnitt U1 ∩ U2 als auch die
Summe U1 + U2 von U1 und U2 sind Unterräume von V (nicht aber die Vereinigung U1 ∪ U2 ). Dabei besteht
U1 + U2 aus denjenigen Vektoren in V , die gleich der Summe eines Vektors aus U1 und eines Vektors aus U2
sind, d.h. U1 + U2 besteht aus allen Vektoren der Form a + b mit a ∈ U1 und b ∈ U2 .
Einzusehen, dass U1 ∩ U2 und U1 + U2 Unterräume von V sind, ist eine einfache Übungsaufgabe.
Als Anwendung dazu, betrachten wir erneut das Beispiel 6. Dieses Beispiel kann in der Form
n
X
aik xk = 0
i = 1, 2, . . . , m
k=1
geschrieben werden. Aufgrund von Beispiel 6 wissen wir, dass die Lösungsmenge U einen Unterraum von Rn
bildet. Dieser Unterraum kann als Durchschnitt von m Unterräumen U1 , U2 , . . ., Um interpretiert werden:
U = U1 ∩ U2 ∩ . . . ∩ Um
Dabei wird der Unterraum U1 durch die erste, U2 durch die zweite, . . ., Um durch die m−te Gleichung
bestimmt:
¯
(
)
n
¯X
n¯
Ui = x ∈ R ¯
aik xk = 0
¯
k=1
Das ist lediglich die Verallgemeinerung einer „alt“bekannten Tatsache aus der Vektorgeometrie, nämlich:
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
8
betrachten wir ein lineares Gleichungssystem
a11 x1 + a12 x2 + a13 x3
a21 x1 + a22 x2 + a23 x3
a31 x1 + a32 x2 + a33 x3
= 0
= 0
= 0
so definiert jede dieser drei Gleichungen eine Ebene im dreidimensionalen Raum R3 . Der Durchschnitt dieser
drei Ebenen bildet die Lösungsmenge des Gleichungssystems, cf. Gauss-Algorithmus.
Der Begriff der Summe zweier Vektorräume kann ebenfalls mit Hilfe der Vektorgeometrie illustriert werden:
a) Seien a und b zwei nicht-parallele Vektoren und U1 bzw. U2 die von ihnen bestimmten Ursprungsgeraden
(durch den Nullpunkt):
U1 = { λa| λ ∈ R}
U2 = { µb| µ ∈ R}
Dann ist
U = U1 + U2 = { λa + µb | λ, µ ∈ R}
die Ebene (auch durch den Nullpunkt), die von den beiden Vektoren a und b aufgespannt wird.
b) Sei neu jetzt U1 eine Ebene und U2 eine Gerade (beide durch den Nullpunkt) mit der Eigenschaft, dass
U2 nicht in U1 liegt, dann spannen U1 + U2 den ganzen Raum R3 auf.
2.1
Linearkombination, Erzeugendensystem, Basis
Gegeben sind k Vektoren a(1) , a(2) , . . ., a(k) eines Vektorraumes V . Seien zudem x1 , x2 , . . ., xk beliebig
gewählte reelle Zahlen. Dann heisst
Definition 3. Linearkombination
der Vektor
x1 a(1) + x2 a(2) + . . . + xk a(k) =
k
X
xi a(i)
i=1
eine Linearkombination der Vektoren a
(1)
(2)
,a
, . . ., a
(k)
.
Gilt für einen Vektor b die Darstellung
b=
k
X
xi a(i)
i=1
mit geeignet gewählten Koeffizienten x1 , x2 , . . ., xk , so sagt man, b lasse sich als Linearkombination von
a(1) , a(2) , . . ., a(k) darstellen.
Betrachten wir die Menge U aller Vektoren in V , die sich als Linearkombination der fest vorgegebenen k
Vektoren a(1) , a(2) , . . ., a(k) darstellen lassen:
¯
n
o
¯
U = x1 a(1) + x2 a(2) + . . . + xk a(k) ¯ x1 , x2 , . . . , xk ∈ R
Es ist leicht zu zeigen, dass U ein Unterraum ist, da nämlich mit
k
X
xi a(i)
k
X
und
i=1
in U auch
k
X
xi a
i=1
(i)
+
k
X
i=1
α·
k
X
i=1
zhaw
(i)
yi a
i=1
und ebenfalls
yi a(i)
xi a(i) =
=
k
X
(xi + yi ) a(i)
i=1
k
X
(αxi ) a(i)
i=1
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
9
in U sind.
U heisst der von a(1) , a(2) , . . ., a(k) aufgespannte oder erzeugte Unterraum. Diese Tatsache wird durch
folgende Schreibweise deutlicher zum Ausdruck gebracht:
n
o
U = span a(1) , a(2) , . . . , a(k)
Definition 4. Erzeugendensystem
Kann jeder Vektor b eines Vektorraumes V als Linearkombination der Vektoren a(1) , a(2) , . . ., a(k) von V
dargestellt werden, so nennt man diese Vektoren a(1) , a(2) , . . ., a(k) ein Erzeugendensystem des Vektorraumes
V.
Bemerkung 5.
Die Vektoren eines Erzeugendensystems eines Vektorraumes V nennt man auch erzeugend. Beachten Sie,
dass hier nur endliche Erzeugendensysteme betrachtet werden.
¯
©
ª
Beispiel 8. U = x ∈ R4 ¯ Ax = 0
¯
©
ª
Es sei V = R4 und U = x ∈ R4 ¯ Ax = 0 , wobei


1
2 3
5
 3
7 2 −4 

A=
 −1 −3 4 14 
9 20 13
7
Wird nun der Algorithmus von Gauss zur Bestimmung der Lösungsmenge von Ax = 0 angewendet, so finden
wir
x1
x2
= −17x3 − 43x4
= 7x3 + 19x4
wobei x3 und x4 frei wählbare Parameter sind.
Der Unterraum U besteht somit aus den Vektoren





 
 

−43
−17
−43x4
−17x3
−17x3 − 43x4





 7x3 + 19x4  
7 
7x3 
 + x4  19 
 +  19x4  = x3 
=



 

0 
1 
0 
x3  
x3
0
1
x4
x4
0
Daraus folgt: der Unterraum U der Lösungen des linearen Gleichungssystems Ax = 0 wird durch die beiden
Vektoren




−17
−43



7 
 und a(2) :=  19 
a(1) := 



1
0 
0
1
aufgespannt. Anders formuliert:
o
n
U = span a(1) , a(2)
Beispiel 9. Polynome
Hier wird der Vektorraum der stetigen Funktionen C[a, b] betrachtet. Eine Funktion aus C[a, b] der Form
2
n
pn (x) = a0 + a1 x + a2 x + . . . + an x =
n
X
ak xk
k=1
mit gegebenen reellen Zahlen a0 , a1 , . . ., an heisst Polynom. Die Zahlen a0 , a1 , . . ., an heissen Koeffizienten
des Polynoms und n = Grad des Polynoms pn , falls an 6= 0. Betrachten wir die Menge P aller Polynome.
Da das α−fache eines Polynoms ebenso wie die Summe zweier Polynome pn (x) und qm (x) wieder Polynome
sind, ist P ein Unterraum von C[a, b].
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
10
Betrachten wir nun den Vektorraum P und untersuchen die Teilmenge U ⊂ P aller Polynome von höchstens
4−tem Grad:
¯
©
ª
U = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 ¯ a0 , a1 , a2 , a3 , a4 ∈ R
U ist ein Unterraum von P. Zudem gilt, dass U von den Monomen 1, x, x2 , x3 und x4 aufgespannt wird,
d.h. es gilt:
©
ª
U = span 1, x, x2 , x3 , x4
Dies ist die naheliegendste, aber nicht die einzige, und für gewisse Zwecke auch nicht beste Art, U aufzuspannen.
Beispielsweise gilt auch
U = span {P0 (x), P1 (x), P2 (x), P3 (x), P4 (x)}
wobei die Pk (x) die sogenannten Legendre - Polynome sind. Die Pk (x) sind wie folgt definiert:
P0 (x) = 1
Pk (x) =
1
dk 2
(x − 1)k
2k k! dxk
für k > 0
Damit bekommen wir durch Ausführen der Differentiation:
P0 (x)
P1 (x)
P2 (x)
P3 (x)
P4 (x)
= 1
= x
3 2 1
=
x −
2
2
5 3 3
=
x − x
2
2
35 4 15 2 3
=
x −
x +
8
4
8
Um einzusehen, dass die ersten fünf Legendre - Polynome den Unterraum U erzeugen, muss man sich nur
klar machen, dass die Monome 1, x, x2 , x3 und x4 als LK durch die Pk (x) ausgedrückt werden können.
Es gilt:
1 = P0 (x)
x = P1 (x)
2
1
x2 =
P2 (x) + P0 (x)
3
3
2
3
x3 =
P3 (x) + P1 (x)
5
5
8
4
35
x4 =
P4 (x) + P2 (x) +
P0 (x)
35
7
7
Definition 5. endlich-dimensional
Ein Vektorraum heisst endlich-dimensional, falls er ein Erzeugendensystem hat, d.h. falls es endlich viele
Vektoren a(1) , a(2) , . . ., a(k) gibt, so dass
o
n
V = span a(1) , a(2) , . . . , a(k)
gilt. Andernfalls heisst der Vektorraum unendlich-dimensional.
Der Vektorraum Rn ist endlichdimensional. Betrachten wir z.B. den R4 : die folgenden Vektoren bilden offenbar
ein Erzeugendensystem:
 




 
1
0
0
0
 0 
 1 
 0 
 0 
(1)
(2)
(3)
(4)





 
e =
 0  e = 0  e = 1  e = 0 
0
0
0
1
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
11
Dagegen sind der Vektorraum C[a, b] und alle Unterräume C 1 [a, b], C 2 [a, b], . . . unendlichdimensional.
Betrachten wir im folgenden endlichdimensionale Vektorräume: ein solcher Vektorraum kann dabei auch ein
endlichdimensionaler Unterraum eines unendlichdimensionalen Vektorraumes sein. In Beispiel 9 haben wir
gesehen, dass ein endlichdimensionaler Vektorraum verschiedene Erzeugendensysteme haben kann. Es stellt
sich somit die Frage, ob ein Erzeugendensystem vorteilhafter ist als ein anderes.
Gewünscht ist ein Erzeugendensystem, das aus möglichst wenig Vektoren besteht.
©
ª
Sei V ein Vektorraum und U ein Unterraum mit U = span a(1) , a(2) , . . . , a(k) . Das Erzeugendensystem
a(1) , a(2) , . . . , a(k) ist sicher dann nicht optimal, falls sich einer der Vektoren, z.B. a(k) , als Linearkombination
der übrigen darstellen lässt, d.h. falls
a(k) = α1 a(1) + α2 a(2) + . . . + αk−1 a(k−1)
(1)
gilt für gewisse Zahlen α1 , α2 , . . ., αk−1 . Dann ist a(k) in der Liste der erzeugenden Vektoren überflüssig und
kann weggelassen werden, weil a(k) immer durch (1) ersetzt werden kann. Mit andern Worten:
n
o
U = span a(1) , a(2) , . . . , a(k−1)
Allgemein formuliert: das Erzeugendensystem a(1) , a(2) , . . . , a(k) kann reduziert werden, falls es reelle Zahlen
x1 , x2 , . . ., xk , nicht alle gleichzeitig Null, gibt, sodass
x1 a(1) + x2 a(2) + . . . + xk a(k) =
(2)
k
X
xj a(j) = 0
j=1
Ist z.B. xj 6= 0, so kann (2) nach a(j) aufgelöst werden und der Vektor a(j) kann aus der Liste der erzeugenden
Vektoren gestrichen werden. Ist umgekehrt (2) nur für x1 = x2 = . . . = xk = 0 erfüllt, so kann man offenbar
auf keinen der Vektoren a(1) , a(2) , . . . , a(k) verzichten, um U aufzuspannen.
Mit diesem Unterschied haben wir
Definition 6.
a) die Vektoren a(1) , a(2) , . . . , a(k) aus dem Vektorraum V heissen linear unabhängig, falls aus
x1 a(1) + x2 a(2) + . . . + xk a(k) = 0
folgt, dass x1 = x2 = . . . = xk = 0.
b) die Vektoren a(1) , a(2) , . . . , a(k) aus dem Vektorraum V heissen linear abhängig, falls es Zahlen x1 , x2 ,
. . ., xk gibt, die nicht alle gleichzeitig Null sind und für die gilt:
x1 a(1) + x2 a(2) + . . . + xk a(k) = 0
Beispiel 10. lineare Abhängigkeit
Wir betrachten im Vektorraum R4 die Vektoren



1
−3



−2
5

a(1) = 
a(2) = 
 −1 
 2
4
−2
Sie sind linear abhängig, denn es gilt





a(3)

−4
 5 

=
 1 
14
5a(1) + 3a(2) − a(3) = 0
Diese Erkenntnis kann am einfachsten mit dem Gauss-Algorithmus gewonnen werden, vgl. Abschnitt 2.3
Von besonderem Interesse sind Erzeugendensysteme, die aus linear unabhängigen Vektoren bestehen.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
12
Definition 7. Basis
Sei a(1) , a(2) , . . . , a(n) ein Erzeugendensystem für einen Vektorraum V . Falls die Vektoren a(1) , a(2) , . . . , a(n)
linear unabhängig sind, nennt man das Erzeugendensystem eine Basis von V .
Beispiel 11.
Sowohl die Monome 1, x, x2 , x3 und x4 , als auch die Legendre-Ploynome P0 , P1 , P2 , P3 und P4 bilden eine
Basis im Unterraum U der Polynome von höchstens 4−tem Grad.
Das Beispiel 11 zeigt, dass es in endlich–dimensionalen Vektorräumen verschiedene Basen gibt.
Es stellt sich die Frage, ob es Basen mit unterschiedlich vielen Vektoren gibt.
Die Antwort dazu, liefert der
Satz 2. Verschiedene Basen für einen Vektorraum bestehen aus gleich vielen Basisvektoren.
Der Satz 2 besagt also, dass die Anzahl der Vektoren, aus der eine Basis besteht, nicht eine Eigenschaft dieser
Basis ist, sondern eine Eigenschaft des Vektorraumes.
Definition 8. Dimension
Hat der Vektorraum V 6= {0} eine Basis b(1) , b(2) , . . . , b(n) , so heisst n die Dimension von V .
Bezeichnung: n = dimV .
Bemerkung 6.
• Der Nullvektor eines Vektorraumes ist immer linear abhängig, da die Gleichung x1 0 = 0 eine nichttriviale Lösung hat, z.B. x1 = 1.
Der triviale Vektorraum {0} hat somit keine Basis,
man setzt daher: dim{0} = 0
• Ist V ein ∞−dimensionaler Vektorraum, so wird dimV = ∞ gesetzt.
Der Rn ist n−dimensional. Betrachten wir noch einmal als Beispiel

 


1
0
0
 0 
 1 
 0
(1)
(2)
(3)




e =
 0  e = 0  e = 1
0
0
0
den R4 und die Vektoren

 
0

 0 
(4)
 e = 

 0 
1
Wir haben schon oben bemerkt, dass die Vektoren e(1) , e(2) , e(3) , e(4) ein Erzeugendensystem für den R4
bilden.
Da das Gleichungssystem
³
´
Ax = 0 mit A = e(1) e(2) e(3) e(4) = I4
nur die triviale Lösung hat, sind die Vektoren e(1) , e(2) , e(3) , e(4) linear unabhängig und bilden somit eine Basis
des R4 .
Im folgenden Satz werden einige Zusammenhänge der Begriffe linear unabhängig bzw. abhängig, erzeugend,
Basis und Dimension zusammengestellt:
Satz 3. Es sei V ein Vektorraum der Dimension n.
Dann gilt:
i) mehr als n Vektoren in V sind linear abhängig.
ii) weniger als n Vektoren in V sind nicht erzeugend.
iii) n Vektoren in V sind linear unabhängig genau dann, wenn sie erzeugend sind und genau dann
bilden sie eine Basis.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
2.2
13
Koordinaten in endlich-dimensionalen Vektorräumen
Es gibt im wesentlichen nur einen reellen n−dimensionalen Vektorraum, nämlich den Rn . Jeder reelle n−dimensionale
Vektorraum V ist eine exakte Kopie des Rn .
Es sei V ein reeller endlich-dimensionaler Vektorraum und sei a(1) , a(2) , . . . , a(n) eine Basis von V , sei zudem
x ein Vektor in V .
Weil eine Basis ein Erzeugendensystem ist, gibt es Zahlen x1 , x2 , . . ., xn so, dass
(3)
n
X
x=
xk a(k)
k=1
gilt.
Die Zahlen x1 , x2 , . . ., xn sind eindeutig bestimmt, denn wäre
n
X
x=
x0k a(k)
k=1
eine zweite Darstellung von x als Linearkombination der Vektoren a(1) , a(2) , . . . , a(n) , so würde sofort folgen:
0=x−x=
n
X
xk a(k) −
k=1
(1)
(2)
n
X
x0k a(k) =
k=1
n
X
(xk − x0k ) a(k)
k=1
(n)
Da die Vektoren a , a , . . . , a
linear unabhängig sind, ergibt sich xk − x0k = 0 und damit xk = x0k für
k = 1, 2, . . . , n, was die Eindeutigkeit beweist.
Definition 9. Koordinaten
Die Zahlen x1 , x2 , . . ., xn in (3) heissen Koordinaten des Vektors x bzgl. der Basis a(1) , a(2) , . . . , a(n) .
Wir fassen die Koordinaten von x als Elemente eines

x1
 x2

 ..
 .
Vektors aus Rn auf:



 ∈ Rn

xn
Dieser Vektor heisst Koordinatenvektor von x. Es ist üblich, auch diesen Vektor mit x zu bezeichnen, was
eigentlich nicht ganz korrekt ist, da die Koordinaten nicht nur vom Vektor x, sondern auch von der gewählten
Basis abhängen.
Diese Notation führt u.U. zu Schwierigkeiten, falls gleichzeitig verschiedene Basen verwendet werden.
Die Vektorraum-Operationen in Koordinaten lassen sich wie folgt ausdrücken:
mit
n
n
X
X
x=
xk a(k) und y =
yk a(k)
k=1
erhalten wir
x+y =
n
X
k=1
(xk + yk ) a(k)
k=1
bzw. α x =
n
X
(α xk ) a(k)
k=1
also
• dem Addieren zweier Vektoren in V entspricht die Addition der zugehörigen Koordinatenvektoren im
Rn .
• der Multiplikation eines Vektors in V mit einem Skalar α entspricht die Multiplikation des Koordinatenvektors im Rn mit α.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
2.3
14
wichtige Zusammenhänge
• k Vektoren a(1) , a(2)
. . . , a(k) im Rn¢sind nach Definition erzeugend, falls das lineare Gleichungssystem
¡ , (1)
Ax = b mit A := a a(2) . . . a(k) für jedes b ∈ Rn eine Lösung x ∈ Rk besitzt. Die Matrix A ist
hier eine n × k−Matrix. Aus
{ Ein lineares Gleichungssystem Ax = b, wobei A = m × n−Matrix, ist genau dann für beliebige rechte
Seiten b ∈ Rm lösbar, falls r = m ist, vgl. Lösbarkeit von Ax = b }
folgt, dass die Vektoren a(1) , a(2) , . . . , a(k) genau dann erzeugend sind, falls für den Rang r von Ax = b
die Gleichheit r = n gilt.
• k Vektoren a(1) , a(2) , . . . , a(k) im¡ Rn sind nach Definition
linear unabhängig, falls das homogene Glei¢
chungssystem Ax = 0 mit A := a(1) a(2) . . . a(k) nur die triviale Lösung x = 0 ∈ Rk hat. Nach dem
entsprechenden Satz
{ Die Lösung von Ax = b mit A = m × n−Matrix – falls sie existiert – ist genau dann eindeutig, wenn
r = n ist, vgl. Lösbarkeit von Ax = b }
gilt, dass die Vektoren a(1) , a(2) , . . . , a(k) genau dann linear unabhängig sind, falls der Rang r von
Ax = 0 gleich k ist.
• Mit dem Gauss-Algorithmus lässt sich auch folgende Aufgabe lösen:
Gegeben seien a(1) , a(2) , . . . , a(k) ∈ Rn .
Gesucht ist die maximale Anzahl linear unabhängiger Vektoren der gegebenen Vektoren, vgl. Beispiel 10.
Es gilt: ¡
¢
Sei A := a(1) a(2) . . . a(k) . Mit dem Gauss-Algorithmus erhält man daraus im Endschema die Matrix
¡ (1) (2)
¢
R = r r . . . r(k) mit RangR = RangA = r ≤ k. Seien r(k1 ) , r(k2 ) , . . ., r(kr ) die Pivotspalten
von R. Dann sind die Vektoren a(k1 ) , a(k2 ) , . . ., a(kr ) linear unabhängig. Die maximale Anzahl linear
unabhängiger Vektoren von A ist gleich r.
Begründung:
¡
¢
¡
¢
Sei R̃ = r(k1 ) r(k2 ) . . . r(kr ) und à = a(k1 ) a(k2 ) . . . a(kr ) . Der Algorithmus von Gauss auf Ã
angewendet liefert im Endschema die Matrix R̃ und die beiden homogenen Gleichungssysteme Ãx = 0
und R̃x = 0 haben die selbe Lösungsmenge.
Da die n × r−Matrix R̃ den Rang r hat (r Pivots im Endschema) hat R̃x = 0 nur die triviale Lösung.
Also hat auch Ãx = 0 nur die triviale Lösung, d.h. à hat den Rang r, bzw. die Spalten von à sind
linear unabhängig.
Werden andererseits aus der Matrix A r + 1 Spalten ausgelesen, so gehört mindestens eine Spalte zu
einer Nicht-Pivotspalte im Endschema. Die entsprechenden Spaltenvektoren von R bzw. A sind linear
abhängig, da das entsprechende homogene lineare Gleichungssytem nicht-triviale Lösungen hat.
Aus den gemachten Betrachtungen können wir schliessen:
Satz 4. Der Rang einer Matrix A ist gleich der maximalen Anzahl linear unabhängiger Spaltenvektoren
von A.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
15
Aufgabe 1.
Bestimmen Sie in den folgenden Fällen mit dem Gauss-Algorithmus, ob die Vektoren linear abhängig oder
linear unabhängig und ob sie erzeugend sind.
 
1
 2 
 

a) 
 3 
 4 
5
 
0
 0 
 

b) 
 0 
 0 
0
 


1
0
 2 
 0 



c) 
 3 ,  0 
4
0

 

 
1
5
2
 2 
 6 
 4 





d)   , 
,  
3
7 
6 
4
8
8


 


1
3
1
e)  −1  ,  1  ,  1 
0
2
1
 


  
1
1
1
0
f)  0  ,  1  ,  1   1 
0
0
1
0
Aufgabe 2.
Wählen Sie, falls möglich, mit dem Gauss-Algorithmus unter den sechs






 

1
−1
2
1
 2  ,  1  ,  −5  ,  1  , 
1
−1
2
1
Vektoren



1
−1
1  ,  −1 
4
−2
eine Basis für den R3 , (mit Begründung).
Aufgabe 3.
a) Untersuchen Sie mit dem Gauss-Algorithmus, ob die Vektoren






2
1
0
a(1) =  0  , a(2) =  2  , a(3) =  4  ,
2
1
3
im R3 eine Basis bilden (mit Begründung).
b) Konstruieren Sie aus a(1) , a(2) und a(3) eine orthonormale Basis mit Hilfe des Schmidt’schen Orthogonalisierungsverfahren.
zhaw
ungr/vektor_raum.tex
2 DIE STRUKTUR VON VEKTORRÄUMEN
16
Aufgabe 4.


−5
Für welche Werte des Parameters s lässt sich der Vektor a =  −4  als
4
Linearkombination der Vektoren
 




1
0
−1
a(1) =  2  , a(2) =  s  , a(3) =  0  ,
3
−1
7
darstellen? Bestimmen Sie für diese Fälle die Koeffizienten der Linearkombintion.
Lösung 1.
a) linear unabhängig, nicht erzeugend
b) linear abhängig, nicht erzeugend
c) linear abhängig, nicht erzeugend
d) linear abhängig, nicht erzeugend
e) linear abhängig, nicht erzeugend
f) linear abhängig, erzeugend
Lösung 2.
Endschema:
1
°
0
0
-1
3
°
0
2
-9
0
1
-1
0
1
-1
3
°
-1
1
1
die Pivotspalten bilden eine Basis, also auch die entsprechenden Spaltenvektoren






1
−1
1
 2 ,  1 ,  1 
4
−1
1
im Ausgangs-Schema.
Lösung 3.
a) Die drei Vektoren bilden eine Basis, denn det a(1) a(2) a(3) = 12 6= 0
b)


√1
2


0 ,
√1
2

0
 1 ,
0


− √12

0 
1
√
2
Lösung 4.

1
det  2
3
0
s
−1

−1
0  = det(A) = 10s + 2
7
Für s 6= − 15 lässt sich jeder Vektor im R3 als Linearkombination von a(1) , a(2) und a(3) darstellen.
Insbesondere gilt:
a=
22
19s + 6 (3)
31s + 4 (1)
a +
a(2) +
a
10s + 2
10s + 2
10s + 2
Für s = − 15 lässt sich a nicht als Linearkombination von a(1) , a(2) und a(3) darstellen, da das Gleichungssystem
Ax = a keine Lösung hat.
zhaw
ungr/vektor_raum.tex
3 NORMIERTE VEKTORRÄUME
3
17
Normierte Vektorräume
Hier brauchen Sie die Unterlagen, die Sie im Zusammenhang mit der Kondition eines Problems erhalten haben.
3.1
Norm eines Vektors
Die p− Norm eines Vektors x ∈ Rn ist wie folgt definiert:
v
u n
uX
p
|xk |p
(4)
kxkp = t
k=1
für p = 1, 2, . . .
Für p = ∞ gilt:
(5)
kxk∞ = max |xk |
1≤k≤n
kxk∞ ist die sogenannte ∞− Norm von x ∈ Rn (vgl MATLAB, help norm).
3.2
Norm einer Matrix
Was soll die “Länge” bzw. “Grösse” einer Matrix sein? Die “Grösse” oder Norm einer Matrix soll angeben, um
welchen Faktor sich die Norm eines Vektors x maximal verändert.
Definition 10. Sei A eine n × n−Matrix und sei für x ∈ Vn eine Norm kxk gegeben. Dann heisst die
Zahl
kAxk
kAk = max
n
x∈V ,x6=0 kxk
Norm von A, (genauer: die von der Vektornorm kxk induzierte Matrixnorm).
Diese Definition ist für sämtliche Vektornormen (4) und (5) gültig.
Vergleichen Sie dazu auch die entsprechenden Befehle in MATLAB, bzw. die entsprechenden Erklärungen im
help von MATLATB.
Bemerkung 7.
kAxk
kxk
auch anders geschrieben werden:
°
° ° µ
¶°
° 1
° °
°
kAxk
1
1
°
°
°
=
· kAxk = °
(Ax)° = °A
·x °
°
kxk
kxk
kxk
kxk
In der Definition von kAk kann der Quotient
Für alle x ∈ Vn , x 6= 0 hat der Vektor
1
kxk
· x die Norm 1.
Es gilt also
kAk = max kAxk
kxk=1
Diese Charakterisierung der Norm einer Matrix ist oft einfacher zu handhaben.
Die Matrixnorm hat folgende Eigenschaften:
Satz 5.
a) kAk ≥ 0, aus kAk = 0 folgt A = 0
b) kαAk = |α| kAk
c) kA + Bk ≤ kAk + kBk
d) kAxk ≤ kAk kxk
e) kA · Bk ≤ kAk · kBk
zhaw
ungr/vektor_raum.tex
4 VEKTORRÄUME MIT EINEM SKALARPRODUKT
4
18
Vektorräume mit einem Skalarprodukt
Als nächstes setzen wir uns mit dem Winkelbegriff auseinander. Der Begriff des Winkels kann über das
Skalarprodukt definiert werden. Dabei werden ganz allgemeine Skalarprodukte in Vektorräumen eingeführt.
Wir gehen dabei ähnlich vor wie bei der Norm.
Ähnlich, wie bei der Norm, wird hier nicht gefragt, wie das Skalarprodukt definiert ist, sondern, welche
Eigenschaften ein Skalarprodukt haben muss.
So werden wir schliesslich sagen könen, wann zwei Funktionen „senkrecht aufeinander stehen“.
4.1
Winkel und Skalarprodukt




a1
b1
Das Skalarprodukt zweier Vektoren a =  a2  und b =  b2  aus R3 ist mit
a3
b3
(a, b) := a1 b1 + a2 b2 + a3 b3 = aT b
(6)
definiert. Die Euklid’sche Länge (= 2-Norm) eines Vektors kann mit Hilfe des Skalarprodukts definiert werden:
q
p
(7)
kak = (a, a) = a21 + a22 + a23
.......
................
.......... ........
..........
..
..........
.
.
.
.
.
.
.
.
.
.
.
.
...
..
..........
..
..........
.
.
.
.
.
.
.
.
.
.
.
...
...
..........
............................................................................................................................................................
....... .... ...................
...........
.......
....
....... ........................
..........
.
.
.
.
.
.
.
.
.
.
.
...
.
..
..
..
....... ..........
....... ..
....
...
..........................
....... ....
.
.
.
.
.
.
.
.
.
.
.
.
...
.
.
..
................
..
.....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.
.
.
...
...
..
...
........................................................................................................................................................
.
.
.......
.
.
.
.
...
...
.
.
.......
..
..
..
.......
.
.
...
...
.
.
.
.
.......
.
..
.
.
.
.
...
.
.......
..
..
..
.
.......
.
...
....
.
.
....... ...
..
...
...
....
.
........
.
........
.
.
...
...
.
.
.
.... ..............
...
...
.... ....
.......
.
.
.
...
...
...
.
.......
.. ....
.......
...
...
...
.
. ..
.......
.
...
...
...
.
.
.......
....... ... ...
...
...
...
.............
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
...
........................................................................................................................................
...
.
.
.
.
.
.
.
.
.
...
.
.
.....
.....
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.
.
.
.......
.......
...
....
.......
.......
.......
.......
...
...
.......
.......
...
...
.......
.......
... ..............
.... ..............
.....................................................................................................................................
~c
~a
z
~b
6
O
©•
©
¼
x
y
Abbildung 4: Interpretation der Vektoren als Pfeile: ~c = ~b − ~a
Es seien nun a und b zwei Vektoren zwei Vektoren aus dem R3 , und es sei c = b − a. Für die Länge von c gilt:
2
kck = (c, c) = (b − a, b − a) = (b, b) − 2(a, b) + (a, a)
bzw.
2
2
2
kck = kak + kbk − 2(a, b)
Andererseits gilt nach dem Kosinussatz für ebene Dreiecke
2
2
2
kck = kak + kbk − 2 kak · kbk · cos ϕ
ϕ = ^(a, b)
Ein Vergleich der letzten beiden Formeln zeigt, dass 2(a, b) = 2 kak · kbk · cos ϕ gilt. Somit erhält man für
den Kosinus des Winkels ϕ
(8)
cos ϕ =
(a, b)
kak · kbk
falls a 6= 0, b 6= 0
Speziell gilt: a und b stehen senkrecht (orthogonal) aufeinander, falls (a, b) = 0 ist. Es ist also allgemein
möglich, ausgehend vom Skalarprodukt, den Winkel zwischen zwei Vektoren zu definieren. Zuerst wird mit
(7) die Länge von Vektoren definiert und anschliessend kann mit Hilfe von (8) der Winkel ϕ definiert werden.
Auf diese Weise kann man in einem beliebigen Vektorraum vorgehen, sobald ein Skalarprodukt zur Verfügung
steht.
zhaw
ungr/vektor_raum.tex
4 VEKTORRÄUME MIT EINEM SKALARPRODUKT
4.2
19
Das Skalarprodukt
Wie bei der Norm, wird die Frage gestellt, welche Eigenschaften ein Skalarprodukt haben muss. Offenbar wird
jedem Paar x und y von Vektoren eine reelle Zahl (x, y) zugeordnet. Diese Zahl heisst Skalarprodukt von x
und y.
Definition 11 (Skalarprodukt).
Sei V ein reeller Vektorraum. Eine Vorschrift, die jedem Paar x und y von Vektoren aus V eine reellle
Zahl (x, y) zuordnet, heisst Skalarprodukt im Vektorraum V , falls gilt:
(S1) Das Skalarprodukt ist linear im zweiten Faktor, d.h.es gilt
a) (x, y (1) + y (2) ) = (x, y (1) ) + (x, y (2) ) für alle x, y (1) und y (2) ∈ V
b) (x, αy) = α(x, y) für alle x, y ∈ V und α ∈ R.
(S2) das Skalarprodukt ist symmetrisch, dh. es gilt:
(x, y) = (y, x) für alle x und y ∈ V .
(S3) Das Skalarprodukt ist positiv definit, d.h. es gilt:
a) (x, x) ≥ 0 für alle x ∈ V
b) aus (x, x) = 0 folgt, dass x = 0
Aus (S1) und (S2) folgt, dass das Skalarprodukt in einem reellen Vektorraum auch bezüglich des ersten
Faktors linear ist.
Beispiel 12 (Skalarprodukt im Rn ).
Rn kann als Menge der n × 1− Matrizen interpretiert werden. Für zwei Vektoren x und y ∈ Rn ist somit
das Produkt xT · y als Marixprodukt definiert.
Behauptung: (x, y) := xT · y ist ein Skalarprodukt im Rn .
“Beweis”: Das Produkt der 1 × n− Matrix xT mit der n × 1− Matrix y ist definiert und als 1 × 1− Matrix
eine reelle Zahl.
(S1) folgt sofort aus den entsprechenden Eigenschaften des Matrixprodukts
(S2) jede 1 × 1− Matrix ist symmetrisch, es gilt:
(x, y) = xT · y = (xT · y)T = y T · x = (y, x)
(S3)
a) (x, x) = xT · x =
n
P
i=1
x2i ≥ 0 für alle x ∈ Rn
b) aus (x, x) = xT · x =
n
P
i=1
x2i = 0 folgt, dass xi = 0 für i = 1, 2, . . . , n, also x = 0.
Man nennt xT · y das Standardskalarprodukt im Rn .
Aufgabe 5.
Es gibt noch andere Skalarprodukte im Rn : falls D eine Diagonalmatrix mit positiven Diagonalelementen ist,
so ist (x, y) := xT Dy auch ein Skalarprodukt.
Beweisen Sie diese Behauptung!
zhaw
ungr/vektor_raum.tex
4 VEKTORRÄUME MIT EINEM SKALARPRODUKT
20
Skalarprodukt im Vektorraum der stetigen Funktionen
Beispiel 13. Seien f und g zwei Funktionen aus C[a, b]. Dann ist mit
Zb
(9)
(f, g) :=
f (t)g(t) dt
a
ein Skalarprodukt definiert.
Begründung:
Das Integral einer stetigen Funktion über einem endlichen Intervall existiert. (f, g) ist also eine reelle Zahl.
(S1) folgt aus der Linearität des Integrals:
a)
Zb
(f, g1 + g2 ) =
f (t) [g1 (t) + g2 (t)] dt
a
Zb
=
[f (t)g1 (t) + f (t)g2 (t)] dt
a
Zb
=
Zb
f (t)g1 (t) dt +
a
=
b) (f, αg) =
Rb
f (t)αg(t) dt = α
a
(S2) (f, g) =
Rb
f (t)g(t) dt =
a
(S3)
a) (f, f ) =
Rb
f (t)g2 (t) dt
a
(f, g1 ) + (f, g2 )
f (t)g(t) dt = α(f, g)
a
Rb
g(t)f (t) dt = (g, f )
a
Rb
[f (t)]2 dt ≥ 0, da [f (t)]2 ≥ 0
a
b) falls (f, f ) = 0, d.h. falls
f = 0.
Rb
[f (t)]2 dt = 0, dann gilt: f (t) = 0 für alle t ∈ [a, b] und damit ist
a
Bemerkung 8 (genauere Begründung für (S3) b)).
Indirekt: wir nehmen an, dass f (t0 ) 6= 0 gilt, für ein t0 ∈ [a, b]. Da f eine stetige Funktion ist, gilt
f (t) 6= 0 in einem ganzen Intervall [a0 , b0 ] ⊂ [a, b] um t0 . Für t ∈ [a0 , b0 ] gilt: [f (t)]2 > 0 und damit
Zb
Zb
[f (t)]2 dt ≥
(f, f ) =
a
0
[f (t)]2 dt > 0
a0
was ein Widerspruch zur Annahme (f, f ) = 0 ist.
Damit haben wir gezeigt: aus (f, f ) = 0 folgt, dass f = 0 ist.
Definition 12 (Orthogonalität).
Zwei Vektoren x und y aus V heissen orthogonal, falls (x, y) = 0. Man sagt auch: x und y stehen
senkrecht aufeinander.
zhaw
ungr/vektor_raum.tex
4 VEKTORRÄUME MIT EINEM SKALARPRODUKT
21
..
...............
.... ...
.. .....
...
...
...
...
...
...
.........
.
...
.
..
............
...
.
.
..........
..
...
.
..........
.
...
..........
..
.
.
.
.
.
.
.
.
.
.
.
....
...
..
..........
...
...
..........
...
...
..........
...
..........
...
..........
.
...
.
.
.
.
.
.
.
.
.
.
.
.
...
....
..
..........
...
...
..........
...
...
..........
...
. ..........
...........
.
.
.
.
...
.
.
.
.
.
.
.
.
.
.
.
....
..
..........
...
..........
...
..........
...
..........
..........
.
...
.
.
.
.
.
.
.
.
.
.
.......
...
..........
...
..........
...
..........
... ..........
..........
x..........
z
y
λy
Abbildung 5: Orthogonale Projektion von x auf y
Diese Definition ist in einem beliebigen reellen Vektorraum gültig. In diesem Fall ist dann cos ϕ = 0, falls
x 6= 0 und y 6= 0, cf. (8). Der Winkel zwischen den beiden Vektoren x und y ist dann ϕ = π2 .
Nun sind wir in der Lage, eine Vektor x auf einen anderen Vektor y (senkrecht) zu projizieren. Es seien zwei
Vektoren x und y 6= 0 gegeben. Es wird x auf y projiziert. Es wird ein Vielfaches λy des Vektors y von x so
subtrahiert, dass z = x − λy auf y senkrecht steht, cf. Abbildung 5.
Gesucht wird also eine Zahl λ so, dass (z, y) = (x − λy, y) = (x, y) − (λy, y) = 0 gilt. Damit erhalten wir
y)
sofort, dass λ = (x,
(y, y) ist. Die orthogonale Projektion von x auf den Vektor y 6= 0 ist somit durch den Vektor
(x, y)
(y, y)
· y gegeben.
Diese Projektion erlaubt uns, noch weitere Eigenschaften herzuleiten.
Satz 6.
Sei V ein reeller Vektorraum mit Skalarprodukt.
i) Die orthogonale Projektion eines Vektors x auf den Vektor y 6= 0 ist gegeben durch den Vektor
(x, y)
(y, y) · y
ii) Für alle x und y aus V gilt:
(x, y)2 ≤ (x, x) · (y, y)
Schwarz’sche Ungleichung
iii) Die Vorschrift, die jedem x ∈ V die Zahl kxk :=
p
(x, x) zuordent, ist eine Norm in V .
iv) Stehen zwei Vektoren x, y ∈ V senkrecht aufeinander, d.h. (x, y) = 0, so gilt
2
2
2
2
kx + yk = kx − yk = kxk + kyk
Satz von Pythagoras
dabei bezeichnet kxk, x ∈ V die in iii) eingeführte Norm.
Bemerkung 9.
1) kxk =
p
(x, x) heisst die vom Skalarprodukt (. , .) induzierte Norm.
Folgende Vereinbarung ist üblich: falls in V ein Skalarprodukt definiert ist, so bezeichnet k.k die
von diesem Skalarprodukt induzierte Norm.
2) Nicht jede Norm ist von einem Skalarprodukt induziert, z.B. gibt es kein Skalarprodukt in Rn , das
die Maximumnorm induziert.
zhaw
ungr/vektor_raum.tex
LITERATUR
22
Literatur
[1] K. Nipp, D. Stoffer: Lineare Algebra,
Eine Einführung für Ingenieure unter besonderer Berücksichtigung numerischer Aspekte,
vdf, 4. Auflage 1998. (oder neuer)
[2] G. Strang: Lineare Algebra, Springer–Verlag 2003,
Übersetzung aus dem Englischen.
Titel der Originalausgabe: Introduction to Linear Algebra, erschienen bei Wellesley–Cambridge Press,
1998.
zhaw
ungr/vektor_raum.tex
Herunterladen