3 Lineare Algebra (Teil 1): Lineare Unabhängigkeit 3.1 Der Vektorraum Rn Die Menge Rn aller n-dimensionalen Spalten a reeller Zahlen a1 , ..., an ∈ R bildet bezüglich der Addition a1 b1 a1 + b1 .. (153) a + b ≡ ... + ... := . an bn an + bn (mit a, b ∈ Rn ) eine abelsche Gruppe (siehe Anhang A), mit der Nullspalte 1 0 = (0, ..., 0)T als neutralem Element und −a = (−a1 , ..., −an )T als Inversem zu a, a + b = b + a, a + 0 = 0 + a = a, a + (b + c) = (a + b) + c , a + (−a) = (−a) + a = 0 . (154) Die Multiplikation einer Spalte a ∈ Rn mit einer reellen Zahl λ ∈ R wird erklärt durch a1 λa1 λ · a ≡ λ · ... := ... ∈ Rn . (155) an λan (Der Multiplikationspunkt “·” wird meistens fortgelassen.) Zusammen mit dieser äußeren Multiplikation R × Rn → Rn bildet die Gruppe (Rn , +) einen Vektorraum (siehe Anhang A) über dem Körper R der reellen Zahlen, denn für λ, µ ∈ R und a, b ∈ Rn gilt etwa λ(a + b) = λa + λb , (λ + µ)a = λa + µa , etc. (156) Der Kürze halber sprechen wir vom Vektorraum Rn . Bem.: In völlig analoger Weise bildet die Menge Cn aller n-dimensionalen Spalten komplexer Zahlen einen Vektorraum über dem Körper C. 1 Um Platz zu sparen, schreiben wir Spalten auch als Zeilen mit dem Transpositionszeichen T . 27 3.2 Lineare Unabhängigkeit Def.: Eine endliche Teilmenge {b1 , ..., bm } ⊂ Rn heißt linear abhängig, wenn sich durch eine Linearkombination x1 b1 + ... + xm bm ihrer Elemente auf nicht-triviale Weise (also so, daß die Koeffizienten x1 , ..., xm ∈ R nicht alle gleich null sind) die Null darstellen läßt, x1 b1 + ... + xm bm ≡ m X m X xk bk = 0 k=0 k=0 |xk | > 0 . (157) Ist dies nicht möglich, so heißt {b1 , ..., bm } linear unabhängig. Bsp. 1: Ein linear abhängiger Satz von Elementen des R3 ist 1 2 −2 b = 2 , b2 = −4 , b3 = 2 , 1 3 −6 3 (158) denn er ermöglicht eine nicht-triviale Darstellung der Null, 2b1 + 3b2 + 4b3 = 0. Linear unabhängig dagegen ist der Satz 1 1 1 1 , , b2 = b = 1 1 0 (159) 1 b3 = 0 , 0 (160) denn die Forderung x1 b1 + x2 b2 + x3 b3 = 0 führt auf das Gleichungssystem x1 + x2 + x3 = 0, x1 + x2 = 0, x1 = 0, (161) (162) und dies ist nur lösbar durch x1 = x2 = x3 = 0. Satz 1: Der Satz {b1 , ..., bm } ⊂ Rn ist gewiß linear abhängig, wenn m > n ist. Bsp. 2: {(1, 2)T , (2, 3)T , (3, 4)T } ⊂ R2 ist linear abhängig. Tatsächlich gilt 3 2 1 = 0. + −2 4 3 2 28 (163) 3.3 Dimension Def.: Unter der linearen Hülle des Satzes {b1 , ..., bm } ⊂ Rn versteht man die Menge aller Linearkombinationen seiner Elemente, also die unendliche Teilmenge b1 , ..., bm m o n X xk bk x1 , ..., xm ∈ R ⊆ Rn . := a = (164) k=1 Satz 2: Die lineare Hülle jedes Satzes {b1 , ..., bm } ⊂ Rn ist ein Untervektorraum von Rn . Bsp. 3: Die lineare Hülle U = b1 , b2 ⊂ R3 des Satzes 0 1 {b1 , b2 } = 0 , 1 0 0 ist im Wesentlichen der Vektorraum R2 , denn es gilt x1 x2 b1 , b2 = a = x1 b1 + x2 b2 ≡ x1 , x2 ∈ R . 0 (165) (166) n n Def.: Sei V ⊆ Rn ein Untervektorraum von R . Der Satz {b1 , ..., bm } ⊂ R heißt ein Erzeugendensystem von V , wenn V = b1 , ..., bm . Bsp. 4: In Bsp. 3 ist {b1 , b2 } ein Erzeugendensystem von U. Ein anderes Erzeugendensystem desselben Vektorraums U ist etwa {a1 , a2 , a3 , a4 } mit den Vektoren 2 3 4 1 (167) a1 = 2 , a2 = 3 , a3 = 4 , a4 = 5 . 0 0 0 0 Weitere Erzeugendensysteme von U sind {a1 , a2 }, {a1 , a3 }, ..., {a3 , a4 }. Wir betrachten das letzte Beispiel näher. Tatsächlich läßt sich jedes a = x1 b1 + x2 b2 ∈ U darstellen als 3y1 + 4y2 x1 a ≡ x2 = y1 a3 + y2 a4 ≡ 4y1 + 5y2 , (168) 0 0 denn zu beliebig vorgegebenen Werten x1 und x2 ist das Gleichungssystem {x1 = 3y1 + 4y2, x2 = 4y1 + 5y2} lösbar, mit den Lösungen y1 = 5x1 − 4x2 und y2 = 4x1 − 3x2 . 29 (169) Def.: Das Erzeugendensystem {b1 , ..., bm } ⊂ Rn von V heißt eine Basis von V , wenn es linear unabhängig ist. Dann heißen die Vektoren b1 , ..., bm Basisvektoren. Offenbar ist 0 0 1 0 1 0 (170) .. , .. , ..., .. , . . . 0 1 0 eine Basis des Rn , die sog. Standardbasis. Satz 3/Def.: Jede Basis eines bestimmten Vektorraums V ⊆ Rn enthält dieselbe Zahl m von Basisvektoren. Diese Zahl heißt die Dimension von V , m = dim V. (171) Jeder linear unabhängige Satz aus m (= dim V ) Vektoren ∈ V ist eine Basis von V . Ist {b1 , ..., bm } eine Basis von V , so sind die Koeffizienten xk in der Darstellung a= m X xk bk (172) k=1 eines gegebenen Vektors a ∈ V eindeutig bestimmt. Bsp. 5: Rn selbst hat die Dimension n. In Bsp. 4 ist jedes der Erzeugendensysteme {a1 , a2 }, {a1 , a3 }, ..., {a3 , a4 } zugleich eine Basis von U, da in diesem Fall {ai , aj } für i 6= j jeweils linear unabhängig ist. Es gilt also dim U = 2 und das Erzeugendensystem {a1 , a2 , a3 , a4 } ist keine Basis von U. 30 3.4 3.4.1 Lineare Gleichungssysteme Definition Ein System aus n linearen Gleichungen für m Unbekannte x1 , ..., xm hat die Form a11 x1 + a12 x2 + ... + a1m xm = b1 , a21 x1 + a22 x2 + ... + a2m xm = b2 , .. .. .. .. . . . . an1 x1 + an2 x2 + ... + anm xm = bn . (173) Fassen wir die Koeffizienten aik ∈ R der Variable xk (mit i = 1, ..., n) zur Spalte ak ∈ Rn und die Koeffizienten bi zur Spalte b ∈ Rn zusammen, so wird daraus m X xk ak ≡ x1 a1 + ... + xm am = b. (174) k=1 Das lineare Gleichungssystem heißt homogen, falls b = 0, andernfalls heißt es inhomogen. Unter der Lösungsmenge des Gleichungssystems versteht man die Menge n o L = (x1 , ..., xm ) ∈ Rm x1 a1 + ... + xm am = b ⊆ Rm . (175) Das System (174) ist offenbar genau dann lösbar (d.h.: L 6= ∅), wenn gilt b ∈ a1 , ..., am . (176) Def.: Zwei lineare Gleichungssysteme heißen äquivalent, wenn ihre Lösungsmengen gleich sind. 3.4.2 Gaußscher Algorithmus Zur Bestimmung der vollständigen Lösungsmenge eines linearen Gleichungssystems bemerken wir: Satz 4: Die Lösungsmenge eines linearen Gleichungssystems ändert sich nicht durch: (a) Vertauschen zweier Gleichungen; (b) Multiplikation einer Gleichung mit einer reellen Zahl c 6= 0; (c) Addition des c-fachen einer Gleichung zu einer anderen. Durch diese Operationen kann man jedes lineare Gleichungssystem auf eine Form bringen, aus der sich die Lösungsmenge direkt ablesen läßt. In dieser sog. Zeilenstufenform (ZSF) gibt es in jeder Einzelgleichung (“Zeile”) mindestens eine Variable xk , die in allen nachfolgenden Gleichungen nicht mehr vorkommt. Dies sei an einem Beispiel erläutert. 31 Bsp. 6: Wir betrachten das Gleichungssystem x1 + 2x2 + 3x3 + 4x4 = 5, 2x1 + 3x2 + 4x3 + 5x4 = 12, 3x1 + 4x2 + 5x3 + 9x4 = 17. (1) (2) (3) (177) Durch die Ersetzungen (2) → (2′ ) = 2 · (1) − (2) und (3) → (3′ ) = 3 · (1) − (3) wird daraus x1 + 2x2 + 3x3 + 4x4 = 5, x2 + 2x3 + 3x4 = −2, 2x2 + 4x3 + 3x4 = −2. (1′ ) (2′ ) (3′ ) (178) Schließlich ersetzen wir (3′ ) → (3′′ ) = (3′ ) − 2 · (2′ ), um ZSF zu erzielen, x1 + 2x2 + 3x3 + 4x4 = 5, x2 + 2x3 + 3x4 = −2, − 3x4 = 2. (1′′ ) (2′′ ) (3′′ ) (179) Aus Gl. (3′′ ) folgt x4 = − 23 , womit Gl. (2′′ ) lautet x2 + 2x3 = 0. (180) Es ist also etwa x3 frei wählbar und x2 = −2x3 wird festgelegt. Mit Gl. (1′′ ) ist dann auch x1 = x3 + 38 festgelegt, und wir erhalten die einparametrige Lösungsmenge 3 n o 2 L= x3 + 38 , −2x , x , − x ∈ R ⊂ R4 . (181) 3 3 3 3 3 Die allgemeine Lösung des Gleichungssystems ist also 1 38 −2 1 0 + x3 x= 1 3 0 0 −2 . (182) Bem.: Offenbar ist die Zahl d der unabhängigen Parameter in der Lösungsmenge eines linearen Gleichungssystems (hier: d = 1, ein einziger Parameter x3 ) gegeben durch d = m − r, (183) wobei m die Anzahl der Unbekannten und r die Anzahl der in der ZSF verbleibenden Gleichungen ist. Jede dieser Gleichungen stellt nämlich eine unabhängige Bedingung an die Lösungsmenge dar, welche die Anzahl von deren Freiheitsgraden je um eins reduziert. 32 3.4.3 Allgemeines Lösungsverhalten Die Lösungsmenge eines linearen Gleichungssystems (n Gleichungen für m Unbekannte), m X xk ak ≡ x1 a1 + ... + xm am = b ∈ Rn , (184) k=1 wird bestimmt durch die Dimension r der linearen Hülle des Satzes {a1 , ..., am } r = dim a1 , ..., am ≤ min{m, n}. (185) Wir bezeichnen r als Rang des Gleichungssystems (genauer: der “Koeffizientenmatrix”). r ist gerade die Anzahl der Gleichungen in der ZSF des Systems (sofern diese keinen Widerspruch enthält und das System daher nicht lösbar ist). In homogenen Fall b = 0 ist das System immer lösbar und es gilt der Satz 5: Die Lösungsmenge eines homogenen linearen Gleichungssystems, n o L0 = (x1 , ..., xm ) ∈ Rm x1 a1 + ... + xm am = 0 ⊆ Rm , (186) bildet einen d-dimensionalen Untervektorraum des Rm , wobei d = m − r. Es gibt also einen linear unbhängigen Satz {b1 , ..., bd } ⊂ Rm , sodaß gilt n o L0 = x = c1 b1 + ... + cd bd c1 , ..., cd ∈ R . (187) (188) Im Fall r = m, also d = 0, ist der Satz {a1 , ..., am } linear unabhängig. Dann gibt es nur die triviale Lösung x = 0, und der Lösungsraum ist 0-dimensional, L0 = {0}. Für inhomogene Systeme mit b 6= 0 gilt der Satz 6: Die Lösungsmenge L eines lösbaren inhomogenen linearen Gleichungssystems ergibt sich durch Addition einer beliebigen Einzellösung xspez zur allgemeinen Lösung des entsprechenden homogenen Systems, n o L = x = xspez + c1 b1 + ... + cd bd c1 , ..., cd ∈ R . (189) Diese Menge bildet im Gegensatz zu L0 keinen Vektorraum, denn im Fall b 6= 0 gilt immer / L. Das System ist genau dann unlösbar, L = ∅, wenn b ∈ / [ a1 , ..., am ]. (In diesem 0∈ Fall führt die Erstellung der ZSF auf einen Widerspruch.) 33 3.5 Matrizen 3.5.1 Definition Def.: Eine (n × m)-Matrix A ist ein Spalten, a11 a21 A = .. . an1 rechteckiges Zahlenschema mit n Zeilen und m a12 . . . a22 . . . .. . a1m a2m .. . an2 . . . anm . (190) Die Zahlen aij ∈ K (hier steht K wahlweise entweder für den Körper R der reellen oder C der komplexen Zahlen) heißen die Elemente von A. Dabei steht aij in der i-ten Zeile und der j-ten Spalte von A. Man schreibt auch kurz A = (aij ). Die Menge aller (n × m)-Matrizen von Zahlen ∈ K wird mit M(n × m, K) bezeichnet. Bem.: Bezüglich der elementweisen Addition A + B ≡ (aij ) + (bij ) := (aij + bij ) (191) und der äußeren (”skalaren”) Multiplikation λ · A ≡ λ · (aij ) := (λaij ) (192) bildet M(n × m, K) einen Vektorraum über dem Körper K. 3.5.2 Rang Def.: Die m Spalten einer (n × m)-Matrix A, aufgefaßt als Elemente des Rn , spannen als ihre lineare Hülle einen Untervektorraum des Rn auf, den Spaltenraum von A. Auf analoge Weise wird der Zeilenraum von A als Unterraum des Rm definiert. Die Dimensionen dieser Räume heißen Zeilen- bzw. Spaltenrang von A. Bem.: Zeilen- und Spaltenrang einer Matrix ändern sich nicht durch: (a) Vertauschen zweier Zeilen; (b) Multiplikation einer Zeile mit einer reellen Zahl c 6= 0; (c) Addition des c-fachen einer Zeile zu einer anderen. Jede Matrix A kann durch solche Operationen auf Zeilenstufenform gebracht werden. Es ist leicht einzusehen, daß bei der resultierenden Matrix A′ Zeilen- und Spaltenrang übereinstimmen. Es gilt also der Satz 7: Zeilen- und Spaltenrang einer (n × m)-Matrix A sind identisch. Ihr gemeinsamer Wert heißt der Rang von A. 34 3.5.3 Matrizenmultiplikation Def.: Unter dem Produkt A ◦ B der (n × ℓ)-Matrix A = (aij ) mit der (ℓ × m)-Matrix B = (bjk ) versteht man die (n × m)-Matrix C = (cik ) mit den Elementen cik := ℓ X aij bjk . (193) j=1 Bsp. 7: 1 2 3 4 5 6 7 8 58 64 7 + 18 + 33 8 + 20 + 36 . (194) = ◦ 9 10 = 139 154 28 + 45 + 66 32 + 50 + 72 11 12 Bem.: Das Produkt A ◦ B ist nur erklärt, wenn A ebensoviele Spalten wie B Zeilen hat! Insbesondere ist das Matrizenprodukt, selbst unter quadratischen (n × n)-Matrizen (mit gleicher und einheitlicher Zeilen- und Spaltenzahl n) nicht kommutativ. Bsp. 8: 0 1 0 1 1 0 0 0 1 0 , = ◦ 6= = ◦ 0 0 0 0 0 0 0 0 0 0 (195) 23 34 1 2 5 6 19 22 5 6 . = ◦ 6= = ◦ 31 46 3 4 7 8 43 50 7 8 (196) 0 1 0 0 1 2 3 4 Bem.: Die Spaltenvektoren x ∈ Rn lassen sich natürlich als (n × 1)-Matrizen auffassen. Das lineares Gleichungssystem (174) läßt daher schreiben als A ◦ x = b. Satz: Für A ∈ M(n × k, K) und B, C ∈ M(k × m, K) gilt das Distributivgesetz A ◦ λB + µC = λ A ◦ B + µ A ◦ C (λ, µ ∈ R). (197) (198) Für A ∈ M(n × k, K), B ∈ M(k × ℓ, K) und C ∈ M(ℓ × m, K) gilt das Assoziativgesetz A ◦ B ◦ C = A ◦ B ◦ C ≡ A ◦ B ◦ C. (199) 35 3.5.4 Lineare Abbildungen Eine (n × m)-Matrix A impliziert eine lineare Abbildung f : Rn → Rm , x 7→ f (x) := A ◦ x. (200) Diese ist tatsächlich linear, denn nach Gl. (198) gilt für beliebige λ, µ ∈ R und x1 , x2 ∈ Rn f (λx1 + µx2 ) = A ◦ λx1 + µx2 = λ A ◦ x1 + µ A ◦ x2 = λf (x1 ) + µf (x2 ). (201) Def.: Bild bzw. Kern einer linearen Abbildung f : Rn → Rm werden definiert als n o Bildf := y ∈ Rm ∃ x ∈ Rn : y = f (x) ⊆ Rm , o n n (202) Kernf := x ∈ R f (x) = 0 ⊆ Rn . Bem.: Bildf ist die Menge aller y ∈ Rm , für die das inhomogene Gleichungssystem A◦x=y (203) lösbar ist. Kernf ist die Lösungsmenge L0 des homogenen Systems A ◦ x = 0. Satz 8: Bildf und Kernf sind Untervektorräume von Rm bzw. Rn . Ihre Dimensionen, r = dim Bildf, s = dim Kernf, (204) auch Rang bzw. Defekt von f genannt, addieren sich zur Ausgangsdimension n, r + s = n. (205) r ist der (Spalten-) Rang der Matrix A. Bsp. 9: Für die lineare Abbildung f : R5 → R4 , mit x1 1 2 1 1 3 2 3 3 1 6 x2 ◦ x3 ≡ a1 , a2 , a3 , a4 , a5 ◦ x, f (x) = A ◦ x ≡ 0 1 −1 1 0 x4 1 1 2 0 3 x5 berechnen wir zunächst r. Es gilt n o Bildf = x1 a1 + x2 a2 + x3 a3 + x4 a4 + x5 a5 x1 , x2 , x3 , x4 , x5 ∈ R . 36 (206) (207) Wegen a2 = a1 + a4 , a3 = 2a1 − a4 und a5 = 3a1 folgt also n o Bildf = y1 a1 + y4 a4 y1 , y4 ∈ R (208) und, weil {a1 , a4 } offensichtlich linear unabhängig ist, schließlich r ≡ dim Bildf = 2. (209) Berechnung von s: Die Matrix A hat die ZSF 1 0 A′ = 0 0 2 1 1 3 1 −1 1 0 . 0 0 0 0 0 0 0 0 (210) Für die Lösungsmenge L0 des homogenen Gleichungssystems A ◦ x = 0 gilt also s ≡ dim Kernf ≡ dim L0 = 5 − 2 = 3. (211) Tatsächlich finden wir r + s = dim R5 = 5. Anmerkung: Das Ergebnis r = 2 hätten wir natürlich direkt aus der ZSF A′ ablesen können, da Zeilen- und Spaltenrang von A bzw. A′ gleich sind. 37