1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE 1 1 Der Begriff des Vektorraumes, Definition und Beispiele Von zentraler Bedeutung in der linearen Algebra ist der Begriff des Vektorraumes. Dieser Begriff ist zumindest zum Teil aus der Vektorgeometrie, wie man sie aus der analytischen Geometrie kennt, entstanden. Dort wird ein Vektor durch seine Richtung und seine Länge charakterisiert. Repräsentiert wird er durch einen Pfeil. Primär werden in der Vektorrechnung zwei Operationen mit Vektoren eingeführt: b a a+b µa a Abbildung 1: Vektoren die Addition (mit Hilfe des Parallelogramms, vgl. Abbildung 1) und die Multiplikation eines Vektors mit einer Zahl (die „Streckung“ eines Vektors, vgl. Abbildung 1) Dabei gelten folgende 1.1 Regeln • a+b=b+a • (a + b) + c = a + (b + c) • für den Nullvektor 0 gilt: a + 0 = a • für den zu a entgegengesetzten Vektor −a gilt: a + (−a) = 0 • α(βa) = (αβ)a • (α + β)a = αa + βa • α(a + b) = αa + αb • 1a = a Dabei sind a, b und c beliebige Vektoren und α, β bezeichnen beliebige reelle Zahlen. Bemerkung 1. Die Vektoren (der Geometrie) sind nicht die einzigen Objekte, die sich addieren und mit einer Zahl multiplizieren lassen, so dass die obigen Rechenregeln 1.1 gelten. Die Vektoren der Ebene (oder des Raumes) sind ein Beispiel, sozusagen ein Prototyp, für eine Struktur, die häufiger vorkommt, als man zunächst vermutet. Es folgt eine Illustration an verschiedenen Beispielen: Beispiel 1. Der Vektorraum R2 Ein Vektor ist ein Paar reeller Zahlen, die als 2 × 1−Matrizen geschrieben werden: µ ¶ x1 x= x1 , x2 ∈ R x2 zhaw ungr/vektor_raum.tex 1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE 2 Die Menge aller solcher Vektoren wird mit R2 bezeichnet: ½ µ ¶¯ ¾ x1 ¯¯ R2 = x = x , x ∈ R x2 ¯ 1 2 Da Vektoren 2 × 1−Matrizen sind, kann man sie addieren und mit reellen Zahlen α multiplizieren. Es gilt: µ ¶ µ ¶ µ ¶ x1 y1 x1 + y1 x+y = + = x2 y2 x2 + y2 µ ¶ µ ¶ x1 αx1 αx = α = x2 αx2 µ ¶ 0 Es ist leicht nachzurechnen, dass die Regeln 1.1 erfüllt sind, wobei der Nullvektor durch 0 = und der 0 µ ¶ −x1 Vektor −x durch −x = gegeben sind. −x2 Falls in der Ebene ein Ursprung und ein kartesisches Koordinatensystem festgelegt werden, so kann jeder Punkt dieser Ebene mit einem Vektor aus R2 identifiziert werden. R2 ist also die Menge der Koordinatenvektoren der Ebene, vgl. Abschnitt 2.2 und Definition 9. Beispiel 2. Der Vektorraum R3 Ein Vektor ist ein Tripel reeller Zahlen, die als 3 × 1−Matrizen geschrieben werden: x1 x = x2 x1 , x2 , x3 ∈ R x3 Die Menge aller solcher Vektoren wird mit R3 bezeichnet: ¯ x1 ¯¯ R3 = x = x2 ¯¯ x1 , x2 , x3 ∈ R x3 ¯ Da Vektoren 3 × 1−Matrizen sind, kann man sie addieren und mit reellen Zahlen α multiplizieren. Es gilt: x1 y1 x1 + y1 x + y = x2 + y2 = x2 + y2 x3 y3 x3 + y3 x1 αx1 αx = α x2 = αx2 x3 αx3 0 Es ist leicht nachzurechnen, dass die Regeln 1.1 erfüllt sind, wobei der Nullvektor durch 0 = 0 und der 0 −x1 Vektor −x durch −x = −x2 gegeben sind. −x3 Falls im Raum ein Ursprung und ein kartesisches Koordinatensystem festgelegt werden, so kann jeder Punkt dieses Raumes mit einem Vektor aus R3 identifiziert werden. R3 ist also die Menge der Koordinatenvektoren des Raumes, vgl. Abschnitt 2.2 und Definition 9. zhaw ungr/vektor_raum.tex 1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE 3 Beispiel 3. Der Vektorraum Rn Ein Vektor ist ein n−Tupel reeller Zahlen, die als n × 1−Matrizen geschrieben werden: x1 x2 x= . x1 , x2 , . . . , xn ∈ R .. xn Die Menge aller solcher Vektoren wird mit Rn bezeichnet: ¯ x1 ¯¯ x2 ¯ ¯ n R = x = . ¯ x1 , x2 , . . . , xn ∈ R .. ¯ ¯ ¯ xn Da Vektoren n × 1−Matrizen sind, kann man sie addieren und Es gilt: x1 y1 x2 y2 x+y = . + . = .. .. xn αx = α yn x1 x2 .. . mit reellen Zahlen α multiplizieren. = xn x1 + y1 x2 + y2 .. . xn + yn αx1 αx2 .. . αxn Es ist leicht nachzurechnen, dass die Regeln 1.1 erfüllt sind, wobei der Nullvektor 0 durch und der Vektor −x durch −x1 −x2 .. . 0 0 .. . 0 gegeben sind. −xn n Der R ist eine formale Erweiterung der geometrisch anschaulichen Fälle R2 und R3 . Mit einem Vektor x ∈ Rn lässt sich keine konkrete geometrische Vorstellung mehr verbinden. Beispiel 4. Der Vektorraum C[a, b] Mit diesem Beispiel entfernen wir uns noch mehr von der ursprünglichen Vorstellung eines Vektors. Als Objekte werden nun Funktionen, die auf einem fest gewählten Intervall I = [a, b] definiert und stetig sind, vgl. Abbildung 2 Die Menge dieser Funktionen nennt man C[a, b], wobei C für continuous, d.h. stetig steht. Sind f und g zwei Elemente aus C[a, b], so wird eine Funktion f + g auf [a, b] durch (f + g)(x) := f (x) + g(x) x ∈ [a, b] definiert. Der Wert der Funktion f + g an der Stelle x ist gleich der Summe der Werte von f und g an dieser Stelle (Überlagerung bzw. Superposition zweier Funktionen). Aus der Analysis ist bekannt, dass die Summe zweier stetiger Funktionen wieder eine stetige Funktion ist, d.h. es gilt f + g ∈ C[a, b]. Analog kann die Multiplikation einer Funktion f ∈ C[a, b] mit einer reellen Zahl c definiert werden: (cf )(x) := cf (x) x ∈ [a, b] Auch cf ist eine stetige Funktion, d.h. cf ∈ C[a, b]. zhaw ungr/vektor_raum.tex 1 DER BEGRIFF DES VEKTORRAUMES, DEFINITION UND BEISPIELE 4 2.5 2 1.5 1 0.5 0 a b −0.5 −1 −1 −0.5 0 0.5 1 1.5 2 2.5 3 Abbildung 2: stetige Funktionen Es ist nicht schwierig nachzuprüfen, dass die Regeln 1.1 wiederum gelten. Dabei ist 0 die Nullfunktion, d.h. diejenige Funktion aus C[a, b], die jedem x den Wert 0 zuordnet; −f ist durch (−f )(x) := −f (x) x ∈ [a, b] definiert. Damit ist klar, dass die stetigen Funktionen ebenso „Vektor-Eigenschaften“ haben, wie die „Pfeile“ der ebenen bzw. räumlichen Geometrie. 1.2 Abstrakter Begriff Ein Definition 1. Reeller Vektorraum V V ist eine Menge von Objekten (Vektoren) mit den folgenden Eigenschaften: Es ist eine Addition definiert, d.h. zwei Vektoren a und b aus V ist ein dritter Vektor aus V zugeordnet, der mit a + b bezeichnet wird. Es ist eine Multiplikation mit reellen Zahlen definiert, d.h. einer reellen Zahl α und einem Vektor a aus V ist ein Vektor aus V zugeordnet, der mit αa bezeichnet wird. Es gelten die folgenden Regeln: (A1) a + b = b + a (A2) (a + b) + c = a + (b + c) (A3) Es gibt einen Nullvektor, der mit 0 bezeichnet wird und für den gilt: a + 0 = a (A4) zu jedem Vektor a gibt es einen entgegengesetzten Vektor, der mit −a bezeichnet wird und für den gilt: a + (−a) = 0 (M1) α(βa) = (αβ)a (M2) (α + β)a = αa + βa sowie α(a + b) = αa + βa (M3) 1a = a Dabei sind a, b und c beliebige Vektoren aus V und α, β beliebige reelle Zahlen. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 2 5 Die Struktur von Vektorräumen Nun werden gewisse Teilmengen von Vektorräumen untersucht, sogenannte Unterräume. Als Beispiel wird der R4 und als Teilmenge U die Vektoren x von folgender Gestalt x3 − x4 x3 + x4 x= x3 x4 Dabei sind x3 und x4 beliebige Zahlen. Seien nun a und b zwei dieser Vektoren, also a3 − a4 b3 − b4 a3 + a4 b3 + b4 a= b= a3 b3 a4 b4 Wir bilden a + b und αa, wobei α ∈ R. Offenbar sind beide Vektoren wieder von derselben Gestalt wie a und b, nämlich: (a3 + b3 ) − (a4 + b4 ) αa3 − αa4 (a3 + b3 ) + (a4 + b4 ) αa3 + αa4 a+b= αa = a3 + b3 αa3 a4 + b4 αa4 Bemerkung 2. U ist selbst wieder ein Vektorraum, ein Unterraum des R4 . Wir wissen schon, dass die Summe zweier Vektoren aus U wieder in U liegt und dass jedes Vielfache eines Vektors aus U wieder ein Element von U ist. Es bliebe noch zu zeigen, dass die Regeln (A1) - (A4) bzw. (M1) - (M3) gelten. Das wird später in einem allgemeinen Fall nachgeprüft, vgl. Satz 1. Beispiel 5. Gegenbeispiel Illustration, dass keineswegs jede Teilmenge eines Vektorraums wieder ein Vektorraum ist. Wir betrachten als Vektorraum den R2 und als Teilmenge M alle Vektoren der Gestalt µ 2 ¶ x2 x= x2 Dabei ist x2 eine beliebige reelle Zahl. Seien a und b zwei dieser Vektoren, also µ 2 ¶ µ 2 ¶ a2 b2 a= b= a2 b2 Wann sind a + b oder αa, α ∈ R, wieder Elemente der Teilmenge M , d.h. wann gilt µ 2 ¶ c2 a+b=c= c2 für ein geeignet gewähltes c2 ? Offenbar muss a22 + b22 = c22 a2 + b2 = c2 gelten. Quadriert man die zweite Gleichung und subtrahiert man davon die erste, so erhält man 2a2 b2 = 0. Es muss also a2 = 0 oder b2 = 0 gelten. Der Vektor a + b liegt daner nur dann in der Teilmenge M , falls entweder a oder b der Nullvektor ist. Ähnlich wird gezeigt, dass für a = 6 0 der Vektor αa nur dann in der Teilmenge M liegt, wenn α = 1 oder α = 0 ist. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 6 Diese beiden Beispiele zeigen: entscheidend dafür, dass eine Teilmenge eines Vektorraumes einen Vektorraum darstellt, ist, dass sie “abgeschlossen”, ist gegenüber der Addition und der Multiplikation mit einer Zahl. Dies führt zur Definition 2. Unterraum U eines Vektorraumes Eine nicht-leere Teilmenge U eines Vektorraumes V heisst Unterraum von V , falls folgende beiden Bedingungen erfüllt sind: i) mit a, b ∈ U ist auch a + b ∈ U . ii) mit a ∈ U , α ∈ R, ist auch αa ∈ U . Satz 1. Jeder Unterraum U eines Vektorraumes V ist selbst ein Vektorraum. Begründung: • die Regeln (A1), (A2), (M1) - (M3) gelten im ganzen Vektorraum V , insbesondere in der Teilmenge U • zur Regel (A3): der Nullvektor von V liegt auch in U . Ist nämlich a irgendein Vektor aus U , dann ist nach ii) 0a ebenfalls in U . 0a ist aber der Nullvektor, damit gilt (A3) auch in U . • zur Regel (A4): mit dem Vektor a ist auch der Vektor −a in U , dies folgt aus −a = (−1)a und wiederum mit ii). Bemerkung 3. Es gibt immer die folgenden trivialen Unterräume des Vektorraumes V : erstens V selbst und zweitens {0}, d.h. die Menge, die nur aus dem Nullvektor besteht. Anhand verschiedener Beispiele soll nun der Unterraum etwas genauer untersucht werden: Beispiel 6. Ax = 0 Sei V = Rn und A eine gegebene (reelle) m × n−Matrix. Als Teilmenge U des Vektorraumes V werden die Lösungen des linearen homogenen Gleichungssystems Ax = 0 betrachtet. D.h. es ist U = { x ∈ Rn | Ax = 0}. Zu zeigen ist: U ist ein Unterraum von V . Seien a, b ∈ U , d.h. es gilt Aa = 0 und Ab = 0, dann folgt A(a + b) = Aa + Ab = 0 + 0 = 0 A(αa) = αAa = α0 = 0 Somit gilt: a + b ∈ U und αa ∈ U Bemerkung 4. Für c 6= 0 bilden die Lösungen x des linearen inhomogenen Systems Ax = c keinen Unterraum! Beispiel 7. C 1 [a, b] ⊂ C[a, b] Als Vektorraum wird nun der C[a, b], d.h. die Menge der stetigen Funktionen auf einem fest vorgegebenen Intervall I = [a, b], betrachtet. Betrachten wir zudem die Menge C 1 [a, b] der auf I differenzierbaren Funktionen, die eine stetige Ableitung haben. Da jede Funktion in C 1 [a, b] differenzierbar ist, ist sie auch stetig und gehört damit zu C[a, b]. Umgekehrt ist nicht jede stetige Funktion auch differenzierbar, cf. Abbildung 3. Es gilt also: C 1 [a, b] ist eine Teilmenge von C[a, b]. Man nennt die Funktionen aus C 1 [a, b] (einmal) stetig differenzierbar. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 7 y y = f(x) x a b Abbildung 3: Kurve y = f (x) einer nicht differenzierbaren Funktionen aus C[a, b] In der Analysis wird gezeigt: sind f und g stetig differenzierbar, so auch f + g {Summenregel der Ableitung: (f + g)0 = f 0 + g 0 } und αf , α ∈ R, {Produkteregel der Ableitung für eine Konstante: (αf )0 = αf 0 } Die Teilmenge C 1 [a, b] ist somit ein Unterraum des Vektorraumes C[a, b]. Wir können einen Schritt weitergehen und die Menge C 2 [a, b] der zweimal stetig differenzierbaren Funktionen betrachten. Das sind diejenigen Funktionen f , die eine erste und eine zweite Ableitung haben, wobei die zweite Ableitung f 00 stetig ist. Aus der Analysis folgt erneut, dass C 2 [a, b] ein Unterraum von C 1 [a, b] ist und damit auch von C[a, b]. So fortfahrend kann man eine unendliche Folge von ineinander liegenden Unterräumen definieren: C[a, b] = C 0 [a, b] ⊃ C 1 [a, b] ⊃ C 2 [a, b] ⊃ C 3 [a, b] ⊃ C 4 [a, b] ⊃ . . . Seien nun U1 und U2 zwei Unterräume des Vektorraumes V . Sowohl der Durchschnitt U1 ∩ U2 als auch die Summe U1 + U2 von U1 und U2 sind Unterräume von V (nicht aber die Vereinigung U1 ∪ U2 ). Dabei besteht U1 + U2 aus denjenigen Vektoren in V , die gleich der Summe eines Vektors aus U1 und eines Vektors aus U2 sind, d.h. U1 + U2 besteht aus allen Vektoren der Form a + b mit a ∈ U1 und b ∈ U2 . Einzusehen, dass U1 ∩ U2 und U1 + U2 Unterräume von V sind, ist eine einfache Übungsaufgabe. Als Anwendung dazu, betrachten wir erneut das Beispiel 6. Dieses Beispiel kann in der Form n X aik xk = 0 i = 1, 2, . . . , m k=1 geschrieben werden. Aufgrund von Beispiel 6 wissen wir, dass die Lösungsmenge U einen Unterraum von Rn bildet. Dieser Unterraum kann als Durchschnitt von m Unterräumen U1 , U2 , . . ., Um interpretiert werden: U = U1 ∩ U2 ∩ . . . ∩ Um Dabei wird der Unterraum U1 durch die erste, U2 durch die zweite, . . ., Um durch die m−te Gleichung bestimmt: ¯ ( ) n ¯X n¯ Ui = x ∈ R ¯ aik xk = 0 ¯ k=1 Das ist lediglich die Verallgemeinerung einer „alt“bekannten Tatsache aus der Vektorgeometrie, nämlich: zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 8 betrachten wir ein lineares Gleichungssystem a11 x1 + a12 x2 + a13 x3 a21 x1 + a22 x2 + a23 x3 a31 x1 + a32 x2 + a33 x3 = 0 = 0 = 0 so definiert jede dieser drei Gleichungen eine Ebene im dreidimensionalen Raum R3 . Der Durchschnitt dieser drei Ebenen bildet die Lösungsmenge des Gleichungssystems, cf. Gauss-Algorithmus. Der Begriff der Summe zweier Vektorräume kann ebenfalls mit Hilfe der Vektorgeometrie illustriert werden: a) Seien a und b zwei nicht-parallele Vektoren und U1 bzw. U2 die von ihnen bestimmten Ursprungsgeraden (durch den Nullpunkt): U1 = { λa| λ ∈ R} U2 = { µb| µ ∈ R} Dann ist U = U1 + U2 = { λa + µb | λ, µ ∈ R} die Ebene (auch durch den Nullpunkt), die von den beiden Vektoren a und b aufgespannt wird. b) Sei neu jetzt U1 eine Ebene und U2 eine Gerade (beide durch den Nullpunkt) mit der Eigenschaft, dass U2 nicht in U1 liegt, dann spannen U1 + U2 den ganzen Raum R3 auf. 2.1 Linearkombination, Erzeugendensystem, Basis Gegeben sind k Vektoren a(1) , a(2) , . . ., a(k) eines Vektorraumes V . Seien zudem x1 , x2 , . . ., xk beliebig gewählte reelle Zahlen. Dann heisst Definition 3. Linearkombination der Vektor x1 a(1) + x2 a(2) + . . . + xk a(k) = k X xi a(i) i=1 eine Linearkombination der Vektoren a (1) (2) ,a , . . ., a (k) . Gilt für einen Vektor b die Darstellung b= k X xi a(i) i=1 mit geeignet gewählten Koeffizienten x1 , x2 , . . ., xk , so sagt man, b lasse sich als Linearkombination von a(1) , a(2) , . . ., a(k) darstellen. Betrachten wir die Menge U aller Vektoren in V , die sich als Linearkombination der fest vorgegebenen k Vektoren a(1) , a(2) , . . ., a(k) darstellen lassen: ¯ n o ¯ U = x1 a(1) + x2 a(2) + . . . + xk a(k) ¯ x1 , x2 , . . . , xk ∈ R Es ist leicht zu zeigen, dass U ein Unterraum ist, da nämlich mit k X xi a(i) k X und i=1 in U auch k X xi a i=1 (i) + k X i=1 α· k X i=1 zhaw (i) yi a i=1 und ebenfalls yi a(i) xi a(i) = = k X (xi + yi ) a(i) i=1 k X (αxi ) a(i) i=1 ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 9 in U sind. U heisst der von a(1) , a(2) , . . ., a(k) aufgespannte oder erzeugte Unterraum. Diese Tatsache wird durch folgende Schreibweise deutlicher zum Ausdruck gebracht: n o U = span a(1) , a(2) , . . . , a(k) Definition 4. Erzeugendensystem Kann jeder Vektor b eines Vektorraumes V als Linearkombination der Vektoren a(1) , a(2) , . . ., a(k) von V dargestellt werden, so nennt man diese Vektoren a(1) , a(2) , . . ., a(k) ein Erzeugendensystem des Vektorraumes V. Bemerkung 5. Die Vektoren eines Erzeugendensystems eines Vektorraumes V nennt man auch erzeugend. Beachten Sie, dass hier nur endliche Erzeugendensysteme betrachtet werden. ¯ © ª Beispiel 8. U = x ∈ R4 ¯ Ax = 0 ¯ © ª Es sei V = R4 und U = x ∈ R4 ¯ Ax = 0 , wobei 1 2 3 5 3 7 2 −4 A= −1 −3 4 14 9 20 13 7 Wird nun der Algorithmus von Gauss zur Bestimmung der Lösungsmenge von Ax = 0 angewendet, so finden wir x1 x2 = −17x3 − 43x4 = 7x3 + 19x4 wobei x3 und x4 frei wählbare Parameter sind. Der Unterraum U besteht somit aus den Vektoren −43 −17 −43x4 −17x3 −17x3 − 43x4 7x3 + 19x4 7 7x3 + x4 19 + 19x4 = x3 = 0 1 0 x3 x3 0 1 x4 x4 0 Daraus folgt: der Unterraum U der Lösungen des linearen Gleichungssystems Ax = 0 wird durch die beiden Vektoren −17 −43 7 und a(2) := 19 a(1) := 1 0 0 1 aufgespannt. Anders formuliert: o n U = span a(1) , a(2) Beispiel 9. Polynome Hier wird der Vektorraum der stetigen Funktionen C[a, b] betrachtet. Eine Funktion aus C[a, b] der Form 2 n pn (x) = a0 + a1 x + a2 x + . . . + an x = n X ak xk k=1 mit gegebenen reellen Zahlen a0 , a1 , . . ., an heisst Polynom. Die Zahlen a0 , a1 , . . ., an heissen Koeffizienten des Polynoms und n = Grad des Polynoms pn , falls an 6= 0. Betrachten wir die Menge P aller Polynome. Da das α−fache eines Polynoms ebenso wie die Summe zweier Polynome pn (x) und qm (x) wieder Polynome sind, ist P ein Unterraum von C[a, b]. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 10 Betrachten wir nun den Vektorraum P und untersuchen die Teilmenge U ⊂ P aller Polynome von höchstens 4−tem Grad: ¯ © ª U = a0 + a1 x + a2 x2 + a3 x3 + a4 x4 ¯ a0 , a1 , a2 , a3 , a4 ∈ R U ist ein Unterraum von P. Zudem gilt, dass U von den Monomen 1, x, x2 , x3 und x4 aufgespannt wird, d.h. es gilt: © ª U = span 1, x, x2 , x3 , x4 Dies ist die naheliegendste, aber nicht die einzige, und für gewisse Zwecke auch nicht beste Art, U aufzuspannen. Beispielsweise gilt auch U = span {P0 (x), P1 (x), P2 (x), P3 (x), P4 (x)} wobei die Pk (x) die sogenannten Legendre - Polynome sind. Die Pk (x) sind wie folgt definiert: P0 (x) = 1 Pk (x) = 1 dk 2 (x − 1)k 2k k! dxk für k > 0 Damit bekommen wir durch Ausführen der Differentiation: P0 (x) P1 (x) P2 (x) P3 (x) P4 (x) = 1 = x 3 2 1 = x − 2 2 5 3 3 = x − x 2 2 35 4 15 2 3 = x − x + 8 4 8 Um einzusehen, dass die ersten fünf Legendre - Polynome den Unterraum U erzeugen, muss man sich nur klar machen, dass die Monome 1, x, x2 , x3 und x4 als LK durch die Pk (x) ausgedrückt werden können. Es gilt: 1 = P0 (x) x = P1 (x) 2 1 x2 = P2 (x) + P0 (x) 3 3 2 3 x3 = P3 (x) + P1 (x) 5 5 8 4 35 x4 = P4 (x) + P2 (x) + P0 (x) 35 7 7 Definition 5. endlich-dimensional Ein Vektorraum heisst endlich-dimensional, falls er ein Erzeugendensystem hat, d.h. falls es endlich viele Vektoren a(1) , a(2) , . . ., a(k) gibt, so dass o n V = span a(1) , a(2) , . . . , a(k) gilt. Andernfalls heisst der Vektorraum unendlich-dimensional. Der Vektorraum Rn ist endlichdimensional. Betrachten wir z.B. den R4 : die folgenden Vektoren bilden offenbar ein Erzeugendensystem: 1 0 0 0 0 1 0 0 (1) (2) (3) (4) e = 0 e = 0 e = 1 e = 0 0 0 0 1 zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 11 Dagegen sind der Vektorraum C[a, b] und alle Unterräume C 1 [a, b], C 2 [a, b], . . . unendlichdimensional. Betrachten wir im folgenden endlichdimensionale Vektorräume: ein solcher Vektorraum kann dabei auch ein endlichdimensionaler Unterraum eines unendlichdimensionalen Vektorraumes sein. In Beispiel 9 haben wir gesehen, dass ein endlichdimensionaler Vektorraum verschiedene Erzeugendensysteme haben kann. Es stellt sich somit die Frage, ob ein Erzeugendensystem vorteilhafter ist als ein anderes. Gewünscht ist ein Erzeugendensystem, das aus möglichst wenig Vektoren besteht. © ª Sei V ein Vektorraum und U ein Unterraum mit U = span a(1) , a(2) , . . . , a(k) . Das Erzeugendensystem a(1) , a(2) , . . . , a(k) ist sicher dann nicht optimal, falls sich einer der Vektoren, z.B. a(k) , als Linearkombination der übrigen darstellen lässt, d.h. falls a(k) = α1 a(1) + α2 a(2) + . . . + αk−1 a(k−1) (1) gilt für gewisse Zahlen α1 , α2 , . . ., αk−1 . Dann ist a(k) in der Liste der erzeugenden Vektoren überflüssig und kann weggelassen werden, weil a(k) immer durch (1) ersetzt werden kann. Mit andern Worten: n o U = span a(1) , a(2) , . . . , a(k−1) Allgemein formuliert: das Erzeugendensystem a(1) , a(2) , . . . , a(k) kann reduziert werden, falls es reelle Zahlen x1 , x2 , . . ., xk , nicht alle gleichzeitig Null, gibt, sodass x1 a(1) + x2 a(2) + . . . + xk a(k) = (2) k X xj a(j) = 0 j=1 Ist z.B. xj 6= 0, so kann (2) nach a(j) aufgelöst werden und der Vektor a(j) kann aus der Liste der erzeugenden Vektoren gestrichen werden. Ist umgekehrt (2) nur für x1 = x2 = . . . = xk = 0 erfüllt, so kann man offenbar auf keinen der Vektoren a(1) , a(2) , . . . , a(k) verzichten, um U aufzuspannen. Mit diesem Unterschied haben wir Definition 6. a) die Vektoren a(1) , a(2) , . . . , a(k) aus dem Vektorraum V heissen linear unabhängig, falls aus x1 a(1) + x2 a(2) + . . . + xk a(k) = 0 folgt, dass x1 = x2 = . . . = xk = 0. b) die Vektoren a(1) , a(2) , . . . , a(k) aus dem Vektorraum V heissen linear abhängig, falls es Zahlen x1 , x2 , . . ., xk gibt, die nicht alle gleichzeitig Null sind und für die gilt: x1 a(1) + x2 a(2) + . . . + xk a(k) = 0 Beispiel 10. lineare Abhängigkeit Wir betrachten im Vektorraum R4 die Vektoren 1 −3 −2 5 a(1) = a(2) = −1 2 4 −2 Sie sind linear abhängig, denn es gilt a(3) −4 5 = 1 14 5a(1) + 3a(2) − a(3) = 0 Diese Erkenntnis kann am einfachsten mit dem Gauss-Algorithmus gewonnen werden, vgl. Abschnitt 2.3 Von besonderem Interesse sind Erzeugendensysteme, die aus linear unabhängigen Vektoren bestehen. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 12 Definition 7. Basis Sei a(1) , a(2) , . . . , a(n) ein Erzeugendensystem für einen Vektorraum V . Falls die Vektoren a(1) , a(2) , . . . , a(n) linear unabhängig sind, nennt man das Erzeugendensystem eine Basis von V . Beispiel 11. Sowohl die Monome 1, x, x2 , x3 und x4 , als auch die Legendre-Ploynome P0 , P1 , P2 , P3 und P4 bilden eine Basis im Unterraum U der Polynome von höchstens 4−tem Grad. Das Beispiel 11 zeigt, dass es in endlich–dimensionalen Vektorräumen verschiedene Basen gibt. Es stellt sich die Frage, ob es Basen mit unterschiedlich vielen Vektoren gibt. Die Antwort dazu, liefert der Satz 2. Verschiedene Basen für einen Vektorraum bestehen aus gleich vielen Basisvektoren. Der Satz 2 besagt also, dass die Anzahl der Vektoren, aus der eine Basis besteht, nicht eine Eigenschaft dieser Basis ist, sondern eine Eigenschaft des Vektorraumes. Definition 8. Dimension Hat der Vektorraum V 6= {0} eine Basis b(1) , b(2) , . . . , b(n) , so heisst n die Dimension von V . Bezeichnung: n = dimV . Bemerkung 6. • Der Nullvektor eines Vektorraumes ist immer linear abhängig, da die Gleichung x1 0 = 0 eine nichttriviale Lösung hat, z.B. x1 = 1. Der triviale Vektorraum {0} hat somit keine Basis, man setzt daher: dim{0} = 0 • Ist V ein ∞−dimensionaler Vektorraum, so wird dimV = ∞ gesetzt. Der Rn ist n−dimensional. Betrachten wir noch einmal als Beispiel 1 0 0 0 1 0 (1) (2) (3) e = 0 e = 0 e = 1 0 0 0 den R4 und die Vektoren 0 0 (4) e = 0 1 Wir haben schon oben bemerkt, dass die Vektoren e(1) , e(2) , e(3) , e(4) ein Erzeugendensystem für den R4 bilden. Da das Gleichungssystem ³ ´ Ax = 0 mit A = e(1) e(2) e(3) e(4) = I4 nur die triviale Lösung hat, sind die Vektoren e(1) , e(2) , e(3) , e(4) linear unabhängig und bilden somit eine Basis des R4 . Im folgenden Satz werden einige Zusammenhänge der Begriffe linear unabhängig bzw. abhängig, erzeugend, Basis und Dimension zusammengestellt: Satz 3. Es sei V ein Vektorraum der Dimension n. Dann gilt: i) mehr als n Vektoren in V sind linear abhängig. ii) weniger als n Vektoren in V sind nicht erzeugend. iii) n Vektoren in V sind linear unabhängig genau dann, wenn sie erzeugend sind und genau dann bilden sie eine Basis. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 2.2 13 Koordinaten in endlich-dimensionalen Vektorräumen Es gibt im wesentlichen nur einen reellen n−dimensionalen Vektorraum, nämlich den Rn . Jeder reelle n−dimensionale Vektorraum V ist eine exakte Kopie des Rn . Es sei V ein reeller endlich-dimensionaler Vektorraum und sei a(1) , a(2) , . . . , a(n) eine Basis von V , sei zudem x ein Vektor in V . Weil eine Basis ein Erzeugendensystem ist, gibt es Zahlen x1 , x2 , . . ., xn so, dass (3) n X x= xk a(k) k=1 gilt. Die Zahlen x1 , x2 , . . ., xn sind eindeutig bestimmt, denn wäre n X x= x0k a(k) k=1 eine zweite Darstellung von x als Linearkombination der Vektoren a(1) , a(2) , . . . , a(n) , so würde sofort folgen: 0=x−x= n X xk a(k) − k=1 (1) (2) n X x0k a(k) = k=1 n X (xk − x0k ) a(k) k=1 (n) Da die Vektoren a , a , . . . , a linear unabhängig sind, ergibt sich xk − x0k = 0 und damit xk = x0k für k = 1, 2, . . . , n, was die Eindeutigkeit beweist. Definition 9. Koordinaten Die Zahlen x1 , x2 , . . ., xn in (3) heissen Koordinaten des Vektors x bzgl. der Basis a(1) , a(2) , . . . , a(n) . Wir fassen die Koordinaten von x als Elemente eines x1 x2 .. . Vektors aus Rn auf: ∈ Rn xn Dieser Vektor heisst Koordinatenvektor von x. Es ist üblich, auch diesen Vektor mit x zu bezeichnen, was eigentlich nicht ganz korrekt ist, da die Koordinaten nicht nur vom Vektor x, sondern auch von der gewählten Basis abhängen. Diese Notation führt u.U. zu Schwierigkeiten, falls gleichzeitig verschiedene Basen verwendet werden. Die Vektorraum-Operationen in Koordinaten lassen sich wie folgt ausdrücken: mit n n X X x= xk a(k) und y = yk a(k) k=1 erhalten wir x+y = n X k=1 (xk + yk ) a(k) k=1 bzw. α x = n X (α xk ) a(k) k=1 also • dem Addieren zweier Vektoren in V entspricht die Addition der zugehörigen Koordinatenvektoren im Rn . • der Multiplikation eines Vektors in V mit einem Skalar α entspricht die Multiplikation des Koordinatenvektors im Rn mit α. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 2.3 14 wichtige Zusammenhänge • k Vektoren a(1) , a(2) . . . , a(k) im Rn¢sind nach Definition erzeugend, falls das lineare Gleichungssystem ¡ , (1) Ax = b mit A := a a(2) . . . a(k) für jedes b ∈ Rn eine Lösung x ∈ Rk besitzt. Die Matrix A ist hier eine n × k−Matrix. Aus { Ein lineares Gleichungssystem Ax = b, wobei A = m × n−Matrix, ist genau dann für beliebige rechte Seiten b ∈ Rm lösbar, falls r = m ist, vgl. Lösbarkeit von Ax = b } folgt, dass die Vektoren a(1) , a(2) , . . . , a(k) genau dann erzeugend sind, falls für den Rang r von Ax = b die Gleichheit r = n gilt. • k Vektoren a(1) , a(2) , . . . , a(k) im¡ Rn sind nach Definition linear unabhängig, falls das homogene Glei¢ chungssystem Ax = 0 mit A := a(1) a(2) . . . a(k) nur die triviale Lösung x = 0 ∈ Rk hat. Nach dem entsprechenden Satz { Die Lösung von Ax = b mit A = m × n−Matrix – falls sie existiert – ist genau dann eindeutig, wenn r = n ist, vgl. Lösbarkeit von Ax = b } gilt, dass die Vektoren a(1) , a(2) , . . . , a(k) genau dann linear unabhängig sind, falls der Rang r von Ax = 0 gleich k ist. • Mit dem Gauss-Algorithmus lässt sich auch folgende Aufgabe lösen: Gegeben seien a(1) , a(2) , . . . , a(k) ∈ Rn . Gesucht ist die maximale Anzahl linear unabhängiger Vektoren der gegebenen Vektoren, vgl. Beispiel 10. Es gilt: ¡ ¢ Sei A := a(1) a(2) . . . a(k) . Mit dem Gauss-Algorithmus erhält man daraus im Endschema die Matrix ¡ (1) (2) ¢ R = r r . . . r(k) mit RangR = RangA = r ≤ k. Seien r(k1 ) , r(k2 ) , . . ., r(kr ) die Pivotspalten von R. Dann sind die Vektoren a(k1 ) , a(k2 ) , . . ., a(kr ) linear unabhängig. Die maximale Anzahl linear unabhängiger Vektoren von A ist gleich r. Begründung: ¡ ¢ ¡ ¢ Sei R̃ = r(k1 ) r(k2 ) . . . r(kr ) und à = a(k1 ) a(k2 ) . . . a(kr ) . Der Algorithmus von Gauss auf à angewendet liefert im Endschema die Matrix R̃ und die beiden homogenen Gleichungssysteme Ãx = 0 und R̃x = 0 haben die selbe Lösungsmenge. Da die n × r−Matrix R̃ den Rang r hat (r Pivots im Endschema) hat R̃x = 0 nur die triviale Lösung. Also hat auch Ãx = 0 nur die triviale Lösung, d.h. à hat den Rang r, bzw. die Spalten von à sind linear unabhängig. Werden andererseits aus der Matrix A r + 1 Spalten ausgelesen, so gehört mindestens eine Spalte zu einer Nicht-Pivotspalte im Endschema. Die entsprechenden Spaltenvektoren von R bzw. A sind linear abhängig, da das entsprechende homogene lineare Gleichungssytem nicht-triviale Lösungen hat. Aus den gemachten Betrachtungen können wir schliessen: Satz 4. Der Rang einer Matrix A ist gleich der maximalen Anzahl linear unabhängiger Spaltenvektoren von A. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 15 Aufgabe 1. Bestimmen Sie in den folgenden Fällen mit dem Gauss-Algorithmus, ob die Vektoren linear abhängig oder linear unabhängig und ob sie erzeugend sind. 1 2 a) 3 4 5 0 0 b) 0 0 0 1 0 2 0 c) 3 , 0 4 0 1 5 2 2 6 4 d) , , 3 7 6 4 8 8 1 3 1 e) −1 , 1 , 1 0 2 1 1 1 1 0 f) 0 , 1 , 1 1 0 0 1 0 Aufgabe 2. Wählen Sie, falls möglich, mit dem Gauss-Algorithmus unter den sechs 1 −1 2 1 2 , 1 , −5 , 1 , 1 −1 2 1 Vektoren 1 −1 1 , −1 4 −2 eine Basis für den R3 , (mit Begründung). Aufgabe 3. a) Untersuchen Sie mit dem Gauss-Algorithmus, ob die Vektoren 2 1 0 a(1) = 0 , a(2) = 2 , a(3) = 4 , 2 1 3 im R3 eine Basis bilden (mit Begründung). b) Konstruieren Sie aus a(1) , a(2) und a(3) eine orthonormale Basis mit Hilfe des Schmidt’schen Orthogonalisierungsverfahren. zhaw ungr/vektor_raum.tex 2 DIE STRUKTUR VON VEKTORRÄUMEN 16 Aufgabe 4. −5 Für welche Werte des Parameters s lässt sich der Vektor a = −4 als 4 Linearkombination der Vektoren 1 0 −1 a(1) = 2 , a(2) = s , a(3) = 0 , 3 −1 7 darstellen? Bestimmen Sie für diese Fälle die Koeffizienten der Linearkombintion. Lösung 1. a) linear unabhängig, nicht erzeugend b) linear abhängig, nicht erzeugend c) linear abhängig, nicht erzeugend d) linear abhängig, nicht erzeugend e) linear abhängig, nicht erzeugend f) linear abhängig, erzeugend Lösung 2. Endschema: 1 ° 0 0 -1 3 ° 0 2 -9 0 1 -1 0 1 -1 3 ° -1 1 1 die Pivotspalten bilden eine Basis, also auch die entsprechenden Spaltenvektoren 1 −1 1 2 , 1 , 1 4 −1 1 im Ausgangs-Schema. Lösung 3. a) Die drei Vektoren bilden eine Basis, denn det a(1) a(2) a(3) = 12 6= 0 b) √1 2 0 , √1 2 0 1 , 0 − √12 0 1 √ 2 Lösung 4. 1 det 2 3 0 s −1 −1 0 = det(A) = 10s + 2 7 Für s 6= − 15 lässt sich jeder Vektor im R3 als Linearkombination von a(1) , a(2) und a(3) darstellen. Insbesondere gilt: a= 22 19s + 6 (3) 31s + 4 (1) a + a(2) + a 10s + 2 10s + 2 10s + 2 Für s = − 15 lässt sich a nicht als Linearkombination von a(1) , a(2) und a(3) darstellen, da das Gleichungssystem Ax = a keine Lösung hat. zhaw ungr/vektor_raum.tex 3 NORMIERTE VEKTORRÄUME 3 17 Normierte Vektorräume Hier brauchen Sie die Unterlagen, die Sie im Zusammenhang mit der Kondition eines Problems erhalten haben. 3.1 Norm eines Vektors Die p− Norm eines Vektors x ∈ Rn ist wie folgt definiert: v u n uX p |xk |p (4) kxkp = t k=1 für p = 1, 2, . . . Für p = ∞ gilt: (5) kxk∞ = max |xk | 1≤k≤n kxk∞ ist die sogenannte ∞− Norm von x ∈ Rn (vgl MATLAB, help norm). 3.2 Norm einer Matrix Was soll die “Länge” bzw. “Grösse” einer Matrix sein? Die “Grösse” oder Norm einer Matrix soll angeben, um welchen Faktor sich die Norm eines Vektors x maximal verändert. Definition 10. Sei A eine n × n−Matrix und sei für x ∈ Vn eine Norm kxk gegeben. Dann heisst die Zahl kAxk kAk = max n x∈V ,x6=0 kxk Norm von A, (genauer: die von der Vektornorm kxk induzierte Matrixnorm). Diese Definition ist für sämtliche Vektornormen (4) und (5) gültig. Vergleichen Sie dazu auch die entsprechenden Befehle in MATLAB, bzw. die entsprechenden Erklärungen im help von MATLATB. Bemerkung 7. kAxk kxk auch anders geschrieben werden: ° ° ° µ ¶° ° 1 ° ° ° kAxk 1 1 ° ° ° = · kAxk = ° (Ax)° = °A ·x ° ° kxk kxk kxk kxk In der Definition von kAk kann der Quotient Für alle x ∈ Vn , x 6= 0 hat der Vektor 1 kxk · x die Norm 1. Es gilt also kAk = max kAxk kxk=1 Diese Charakterisierung der Norm einer Matrix ist oft einfacher zu handhaben. Die Matrixnorm hat folgende Eigenschaften: Satz 5. a) kAk ≥ 0, aus kAk = 0 folgt A = 0 b) kαAk = |α| kAk c) kA + Bk ≤ kAk + kBk d) kAxk ≤ kAk kxk e) kA · Bk ≤ kAk · kBk zhaw ungr/vektor_raum.tex 4 VEKTORRÄUME MIT EINEM SKALARPRODUKT 4 18 Vektorräume mit einem Skalarprodukt Als nächstes setzen wir uns mit dem Winkelbegriff auseinander. Der Begriff des Winkels kann über das Skalarprodukt definiert werden. Dabei werden ganz allgemeine Skalarprodukte in Vektorräumen eingeführt. Wir gehen dabei ähnlich vor wie bei der Norm. Ähnlich, wie bei der Norm, wird hier nicht gefragt, wie das Skalarprodukt definiert ist, sondern, welche Eigenschaften ein Skalarprodukt haben muss. So werden wir schliesslich sagen könen, wann zwei Funktionen „senkrecht aufeinander stehen“. 4.1 Winkel und Skalarprodukt a1 b1 Das Skalarprodukt zweier Vektoren a = a2 und b = b2 aus R3 ist mit a3 b3 (a, b) := a1 b1 + a2 b2 + a3 b3 = aT b (6) definiert. Die Euklid’sche Länge (= 2-Norm) eines Vektors kann mit Hilfe des Skalarprodukts definiert werden: q p (7) kak = (a, a) = a21 + a22 + a23 ....... ................ .......... ........ .......... .. .......... . . . . . . . . . . . . ... .. .......... .. .......... . . . . . . . . . . . ... ... .......... ............................................................................................................................................................ ....... .... ................... ........... ....... .... ....... ........................ .......... . . . . . . . . . . . ... . .. .. .. ....... .......... ....... .. .... ... .......................... ....... .... . . . . . . . . . . . . ... . . .. ................ .. ..... . . . . . . . . . . . . . . . ... . . . ... ... .. ... ........................................................................................................................................................ . . ....... . . . . ... ... . . ....... .. .. .. ....... . . ... ... . . . . ....... . .. . . . . ... . ....... .. .. .. . ....... . ... .... . . ....... ... .. ... ... .... . ........ . ........ . . ... ... . . . .... .............. ... ... .... .... ....... . . . ... ... ... . ....... .. .... ....... ... ... ... . . .. ....... . ... ... ... . . ....... ....... ... ... ... ... ... ............. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. ... ........................................................................................................................................ ... . . . . . . . . . ... . . ..... ..... . . . . . . . . . . . . . ... . . . ....... ....... ... .... ....... ....... ....... ....... ... ... ....... ....... ... ... ....... ....... ... .............. .... .............. ..................................................................................................................................... ~c ~a z ~b 6 O ©• © ¼ x y Abbildung 4: Interpretation der Vektoren als Pfeile: ~c = ~b − ~a Es seien nun a und b zwei Vektoren zwei Vektoren aus dem R3 , und es sei c = b − a. Für die Länge von c gilt: 2 kck = (c, c) = (b − a, b − a) = (b, b) − 2(a, b) + (a, a) bzw. 2 2 2 kck = kak + kbk − 2(a, b) Andererseits gilt nach dem Kosinussatz für ebene Dreiecke 2 2 2 kck = kak + kbk − 2 kak · kbk · cos ϕ ϕ = ^(a, b) Ein Vergleich der letzten beiden Formeln zeigt, dass 2(a, b) = 2 kak · kbk · cos ϕ gilt. Somit erhält man für den Kosinus des Winkels ϕ (8) cos ϕ = (a, b) kak · kbk falls a 6= 0, b 6= 0 Speziell gilt: a und b stehen senkrecht (orthogonal) aufeinander, falls (a, b) = 0 ist. Es ist also allgemein möglich, ausgehend vom Skalarprodukt, den Winkel zwischen zwei Vektoren zu definieren. Zuerst wird mit (7) die Länge von Vektoren definiert und anschliessend kann mit Hilfe von (8) der Winkel ϕ definiert werden. Auf diese Weise kann man in einem beliebigen Vektorraum vorgehen, sobald ein Skalarprodukt zur Verfügung steht. zhaw ungr/vektor_raum.tex 4 VEKTORRÄUME MIT EINEM SKALARPRODUKT 4.2 19 Das Skalarprodukt Wie bei der Norm, wird die Frage gestellt, welche Eigenschaften ein Skalarprodukt haben muss. Offenbar wird jedem Paar x und y von Vektoren eine reelle Zahl (x, y) zugeordnet. Diese Zahl heisst Skalarprodukt von x und y. Definition 11 (Skalarprodukt). Sei V ein reeller Vektorraum. Eine Vorschrift, die jedem Paar x und y von Vektoren aus V eine reellle Zahl (x, y) zuordnet, heisst Skalarprodukt im Vektorraum V , falls gilt: (S1) Das Skalarprodukt ist linear im zweiten Faktor, d.h.es gilt a) (x, y (1) + y (2) ) = (x, y (1) ) + (x, y (2) ) für alle x, y (1) und y (2) ∈ V b) (x, αy) = α(x, y) für alle x, y ∈ V und α ∈ R. (S2) das Skalarprodukt ist symmetrisch, dh. es gilt: (x, y) = (y, x) für alle x und y ∈ V . (S3) Das Skalarprodukt ist positiv definit, d.h. es gilt: a) (x, x) ≥ 0 für alle x ∈ V b) aus (x, x) = 0 folgt, dass x = 0 Aus (S1) und (S2) folgt, dass das Skalarprodukt in einem reellen Vektorraum auch bezüglich des ersten Faktors linear ist. Beispiel 12 (Skalarprodukt im Rn ). Rn kann als Menge der n × 1− Matrizen interpretiert werden. Für zwei Vektoren x und y ∈ Rn ist somit das Produkt xT · y als Marixprodukt definiert. Behauptung: (x, y) := xT · y ist ein Skalarprodukt im Rn . “Beweis”: Das Produkt der 1 × n− Matrix xT mit der n × 1− Matrix y ist definiert und als 1 × 1− Matrix eine reelle Zahl. (S1) folgt sofort aus den entsprechenden Eigenschaften des Matrixprodukts (S2) jede 1 × 1− Matrix ist symmetrisch, es gilt: (x, y) = xT · y = (xT · y)T = y T · x = (y, x) (S3) a) (x, x) = xT · x = n P i=1 x2i ≥ 0 für alle x ∈ Rn b) aus (x, x) = xT · x = n P i=1 x2i = 0 folgt, dass xi = 0 für i = 1, 2, . . . , n, also x = 0. Man nennt xT · y das Standardskalarprodukt im Rn . Aufgabe 5. Es gibt noch andere Skalarprodukte im Rn : falls D eine Diagonalmatrix mit positiven Diagonalelementen ist, so ist (x, y) := xT Dy auch ein Skalarprodukt. Beweisen Sie diese Behauptung! zhaw ungr/vektor_raum.tex 4 VEKTORRÄUME MIT EINEM SKALARPRODUKT 20 Skalarprodukt im Vektorraum der stetigen Funktionen Beispiel 13. Seien f und g zwei Funktionen aus C[a, b]. Dann ist mit Zb (9) (f, g) := f (t)g(t) dt a ein Skalarprodukt definiert. Begründung: Das Integral einer stetigen Funktion über einem endlichen Intervall existiert. (f, g) ist also eine reelle Zahl. (S1) folgt aus der Linearität des Integrals: a) Zb (f, g1 + g2 ) = f (t) [g1 (t) + g2 (t)] dt a Zb = [f (t)g1 (t) + f (t)g2 (t)] dt a Zb = Zb f (t)g1 (t) dt + a = b) (f, αg) = Rb f (t)αg(t) dt = α a (S2) (f, g) = Rb f (t)g(t) dt = a (S3) a) (f, f ) = Rb f (t)g2 (t) dt a (f, g1 ) + (f, g2 ) f (t)g(t) dt = α(f, g) a Rb g(t)f (t) dt = (g, f ) a Rb [f (t)]2 dt ≥ 0, da [f (t)]2 ≥ 0 a b) falls (f, f ) = 0, d.h. falls f = 0. Rb [f (t)]2 dt = 0, dann gilt: f (t) = 0 für alle t ∈ [a, b] und damit ist a Bemerkung 8 (genauere Begründung für (S3) b)). Indirekt: wir nehmen an, dass f (t0 ) 6= 0 gilt, für ein t0 ∈ [a, b]. Da f eine stetige Funktion ist, gilt f (t) 6= 0 in einem ganzen Intervall [a0 , b0 ] ⊂ [a, b] um t0 . Für t ∈ [a0 , b0 ] gilt: [f (t)]2 > 0 und damit Zb Zb [f (t)]2 dt ≥ (f, f ) = a 0 [f (t)]2 dt > 0 a0 was ein Widerspruch zur Annahme (f, f ) = 0 ist. Damit haben wir gezeigt: aus (f, f ) = 0 folgt, dass f = 0 ist. Definition 12 (Orthogonalität). Zwei Vektoren x und y aus V heissen orthogonal, falls (x, y) = 0. Man sagt auch: x und y stehen senkrecht aufeinander. zhaw ungr/vektor_raum.tex 4 VEKTORRÄUME MIT EINEM SKALARPRODUKT 21 .. ............... .... ... .. ..... ... ... ... ... ... ... ......... . ... . .. ............ ... . . .......... .. ... . .......... . ... .......... .. . . . . . . . . . . . .... ... .. .......... ... ... .......... ... ... .......... ... .......... ... .......... . ... . . . . . . . . . . . . ... .... .. .......... ... ... .......... ... ... .......... ... . .......... ........... . . . . ... . . . . . . . . . . . .... .. .......... ... .......... ... .......... ... .......... .......... . ... . . . . . . . . . . ....... ... .......... ... .......... ... .......... ... .......... .......... x.......... z y λy Abbildung 5: Orthogonale Projektion von x auf y Diese Definition ist in einem beliebigen reellen Vektorraum gültig. In diesem Fall ist dann cos ϕ = 0, falls x 6= 0 und y 6= 0, cf. (8). Der Winkel zwischen den beiden Vektoren x und y ist dann ϕ = π2 . Nun sind wir in der Lage, eine Vektor x auf einen anderen Vektor y (senkrecht) zu projizieren. Es seien zwei Vektoren x und y 6= 0 gegeben. Es wird x auf y projiziert. Es wird ein Vielfaches λy des Vektors y von x so subtrahiert, dass z = x − λy auf y senkrecht steht, cf. Abbildung 5. Gesucht wird also eine Zahl λ so, dass (z, y) = (x − λy, y) = (x, y) − (λy, y) = 0 gilt. Damit erhalten wir y) sofort, dass λ = (x, (y, y) ist. Die orthogonale Projektion von x auf den Vektor y 6= 0 ist somit durch den Vektor (x, y) (y, y) · y gegeben. Diese Projektion erlaubt uns, noch weitere Eigenschaften herzuleiten. Satz 6. Sei V ein reeller Vektorraum mit Skalarprodukt. i) Die orthogonale Projektion eines Vektors x auf den Vektor y 6= 0 ist gegeben durch den Vektor (x, y) (y, y) · y ii) Für alle x und y aus V gilt: (x, y)2 ≤ (x, x) · (y, y) Schwarz’sche Ungleichung iii) Die Vorschrift, die jedem x ∈ V die Zahl kxk := p (x, x) zuordent, ist eine Norm in V . iv) Stehen zwei Vektoren x, y ∈ V senkrecht aufeinander, d.h. (x, y) = 0, so gilt 2 2 2 2 kx + yk = kx − yk = kxk + kyk Satz von Pythagoras dabei bezeichnet kxk, x ∈ V die in iii) eingeführte Norm. Bemerkung 9. 1) kxk = p (x, x) heisst die vom Skalarprodukt (. , .) induzierte Norm. Folgende Vereinbarung ist üblich: falls in V ein Skalarprodukt definiert ist, so bezeichnet k.k die von diesem Skalarprodukt induzierte Norm. 2) Nicht jede Norm ist von einem Skalarprodukt induziert, z.B. gibt es kein Skalarprodukt in Rn , das die Maximumnorm induziert. zhaw ungr/vektor_raum.tex LITERATUR 22 Literatur [1] K. Nipp, D. Stoffer: Lineare Algebra, Eine Einführung für Ingenieure unter besonderer Berücksichtigung numerischer Aspekte, vdf, 4. Auflage 1998. (oder neuer) [2] G. Strang: Lineare Algebra, Springer–Verlag 2003, Übersetzung aus dem Englischen. Titel der Originalausgabe: Introduction to Linear Algebra, erschienen bei Wellesley–Cambridge Press, 1998. zhaw ungr/vektor_raum.tex