Kapitel 2 Lineare Gleichungssysteme Wir wollen uns in diesem Abschnitt sehr ausführlich mit linearen Gleichungssystemen beschäftigen. Üblicherweise macht man das erst, nachdem man die Theorie der Vektorräume und der linearen Abbildungen auf Vektorräumen behandelt hat. Vieles mag Ihnen von der Schule her vertraut sein. Aber eine wichtige Erweiterung gegenüber dem Schulstoff werden wir jetzt gleich im nächsten Abschnitt einführen. Wir wollen Gleichungssysteme nämlich nicht nur über den Ihnen bekannten Zahlbereichen R und Q betrachten, sondern über beliebigen sogenannten Körpern. 2.1 Körper Körper sind algebraische Objekte, in denen ähnliche Rechenregeln gelten wie in R oder Q (Multiplikation, Addition, Assoziativgesetz, Distributivgesetz). Es gibt aber noch mehr algebraische Strukturen als nur R und Q, in denen solche Regeln gelten. Dazu wollen wir zunächst die entscheidenden Rechenregeln formalisieren und dann weitere Körper kennenlernen. Ein Hauptziel der linearen Algebra ist es, lineare Gleichungssysteme über solchen Körpern zu lösen. Definition 2.1.1 Sei K eine nicht leere Menge, auf der zwei binäre Verknüpfungen + und · definiert sind, die folgende Eigenschaften haben: 26 [A1] x+y =y+x ∀x, y ∈ K. [A2] x + (y + z) = (x + y) + z [A3] Es gibt ein Element 0 ∈ K mit der Eigenschaft x + 0 = x K. [A4] Zu jedem x ∈ K gibt es ein Element y ∈ K mit x + y = 0. Bezeichnung für dieses Element y = −x. ∀x, y, z ∈ K. ∀x ∈ Die Regel [A1] ist die Kommutativität der Addition, [A2] die Assoziativität, [A3] sagt etwas über die Existenz eines neutralen Elementes und [A4] sagt etwas über die Existenz eines inversen Elementes. Nun zur Multiplikation. Dazu setzen wir K∗ := K \ {0}. [M1] x·y =y·x ∀x, y ∈ K. [M2] (x · y) · z = x · (y · z) [M3] Es gibt ein Element 1 ∈ K∗ mit x · 1 = x [M4] Zu jedem x ∈ K∗ gibt es ein Element y ∈ K∗ mit x · y = 1. Bezeichnung für dieses Element y = x−1 . ∀x, y, z ∈ K ∀x ∈ K. Bislang stehen Addition und Multiplikation einfach nur nebeneinander. Interessant wird es durch das Distributivgesetz: [D] x · (y + z) = (x · y) + (x · z) ∀x, y, z ∈ K. Um deutlich zu machen, dass nicht die Menge K, sondern die Menge zusammen mit den Verknüpfungen den Körper bilden, schreiben wir den Körper manchmal auch als “Tupel” (K, +, ·, 0, 1). Beispiel 2.1.2 Wie schon erwähnt sind R und Q Beispiele von Körpern. Die ganzen Zahlen Z sind kein Körper, weil [M4] nicht erfüllt ist. Die natürlichen Zahlen (einschließlich der 0) sind kein Körper, weil [M4] und [A4] nicht erfüllt 27 sind. Lemma 2.1.3 Das bzgl. “+” sowie bzgl. “·” inverse Element in einem Körper K ist eindeutig. Ferner gibt es außer den Elementen 0 und 1 keine weiteren Elemente g und h mit x + g = x für alle x und x · h = x für alle x. Lemma 2.1.4 Sei K ein Körper. Dann gilt: (1.) x · 0 = 0 · x ∀x ∈ K. (2.) −x = (−1) · x (3.) x · y 6= 0 Beweis (1.) ∀x ∈ K. ∀x, y ∈ K∗ . Es gilt x · 0 + x = x · 0 + x · 1 = x · (0 + 1) = x · 1 = x, also x · 0 = 0 (Addiere auf beiden Seiten (−x)). (2.) 0 = 0 · x = (1 + (−1)) · x = 1 · x + (−1) · x = x + (−1) · x, also muss (−1) · x das eindeutig bestimmte additiv inverse Element von x sein. (3.) Angenommen x · y = 0, aber x, y 6= 0. Dann x · x−1 · y · y −1 = 1, aber auch = 0 wegen xy = 0 und (1.). Das liefert den Widerspruch 0 = 1. Teil (3.) von Lemma 2.1.4 zeigt, dass die Multiplikation auf K∗ abgeschlossen ist, d.h. das Produkt von zwei Elementen in K∗ liegt wieder in K∗ - Die Eigenschaften der Multiplikation auf K∗ sind identisch mit denen der Addition auf K (neutrales Element, Assoziativität, Kommutativität, inverses Element). Solche algebraischen Strukturen treten sehr häufig auf, und man nennt sie Gruppen (wobei das Kommutativgesetz nicht unbedingt gelten muss). Dazu später mehr. 2.2 Neue Körper: C und Fp Definition 2.2.1 Wir definieren C als die Menge {(x, y) : x, y ∈ R} zusammen mit den zwei Verknüpfungen + und · wie folgt: (x, y) + (x′ , y ′ ) = (x + x′ , y + y ′) (x, y) · (x′ , y ′ ) = (xx′ − yy ′, xy ′ + x′ y). 28 Diese Definition ist sehr sinnvoll, wie der folgende Satz zeigt: Satz 2.2.2 C ist ein Körper mit dem additiv neutralen Element (0, 0), dem multiplikativ neutralen Element (1, 0) sowie den inversen Elementen −(x, y) := (−x, −y) x −y −1 (x, y) := , . x2 + y 2 x2 + y 2 Beweis Man rechnet die Regeln [A1] bis [A4], [D] sowie [M1] bis [M4] nach. Bemerkung 2.2.3 Die Menge {(x, 0) : x ∈ R} ⊆ C ist selber ein Körper, den wir mit R “identifizieren” können, d.h. wir identifizieren das Element (x, 0) in C mit x ∈ R. Auf diese Weise können wir R als “Teilkörper” von C auffassen (präzise Definition folgt). Das Element (0, 1) bekommt einen besonderen Namen i und heißt “imaginäre Einheit”. Es gilt i2 = (−1, 0), was wir ja auch als die reelle Zahl −1 auffassen wollen. Man schreibt statt (x, y) oft auch x + iy, x, y ∈ R. Dann wird klar, warum die Multiplikation gerade so gewählt ist, wie sie gewählt ist: (x + iy)(x′ + iy ′) = xx′ + i2 yy ′ + ixy ′ + ix′ y = xx′ − yy ′ + i(xy ′ + x′ y). Definition 2.2.4 Sei (K, +, ·, 0, 1) ein Körper. Ist F ⊆ K, und gilt 0, 1 ∈ F, so heißt F ein Teilkörper von K, falls x + y ∈ F, xy ∈ F, −x ∈ F sowie x−1 ∈ F für alle x, y ∈ F gilt. Um zu zeigen, dass F ein Teilkörper ist, müssen Sie nicht mehr alle Rechenregeln überprüfen, sondern nur die Abgeschlossenheit von + und · in F. Machen Sie sich das an dem Beispiel klar, dass die Menge {(x, 0) : x ∈ R} ein Teilkörper von C ist. Auf eine formale Definition, was es heißt, diesen Teilkörper mit R zu identifizieren, möchte ich hier an dieser Stelle (noch) verzichten. Der Körper R hat auch einen Teilkörper, nämlich Q. Man kann sich leicht überlegen, dass jeder Teilkörper von R diesen Teilkörper Q enthält. Neben Q, R und C spielen Körper mit nur endlich vielen Elementen in den Anwendungen eine zunehmende Bedeutung. 29 Beispiel 2.2.5 Die Menge {0, 1} mit den Verknüpfungen 0 + 1 = 1 + 0 = 1, 1 + 1 = 0 + 0 = 1 sowie der Multiplikation 1 · 1 = 1 ist ein Körper (mit nur zwei Elementen). Unser Ziel wird sein, Körper zu konstruieren, die p Elemente haben, wobei p eine Primzahl ist. Definition 2.2.6 Sei n ∈ N, und sei ≡n die in 1.4.7 definierte Äquivalenzrelation. Dann definieren wir Zn := {[0]≡n , . . . , [n − 1]≡n } als die Menge der Äquivalenzklassen von ≡n . Bezeichnung: [i]≡n =: i. Es sollte klar sein, dass |Zn | = n, und dass es keine weiteren Äquivalenzklassen gibt.Wir definieren nun auf Zn eine Addition und eine Multiplikation: [An] i + j := i + j [Mn] i · j := i · j Beispiel 2.2.7 Sei n = 4. Dann ist 5 + 7 = 12 = 0. Nun gilt 5 = 1 und 7 = 3. Wenn wir diese anderen Repräsentanten wählen, um die Addition auszuführen, erhalten wir 1 + 3 = 4 = 0, also dasselbe Ergebnis. Satz 2.2.8 [An] und [Mn] sind wohldefiniert, d.h. für i = i′ und j = j ′ gilt i + j = i′ + j ′ i · j = i′ · j ′ Bemerkung 2.2.9 Dieses Problem der “Wohldefiniertheit” tritt immer dann auf, wenn man zur Erklärung einer mathematischen Funktion “Repräsentanten” benutzt. Man muss dann zeigen, dass das Ergebnis der Funktionsauswertung unabhängig von der Auswahl des Repräsentanten ist Die Funktion, die wir hier vorliegen haben, ist die binäre Verknüpfung + (bzw. ·), die man auch als Abbildung + : Zn × Zn → Zn auffassen kann. 30 Beweis (Beweis von Satz 2.2.8) [An] Nach Voraussetzung gilt n | (i − i′ ) und n | (j − j ′ ), also na = i − i′ und nb = j − j ′ für geeignete a, b ∈ Z. Nun ist na + nb = i − i′ + j − j ′ = (i + j) − (i′ + j ′ ), also n | ((i + j) − (i′ + j ′ )), d.h. i + j = i′ + j ′ . [Mn] Beachte n | (i − i′ ) ⇒ n | (ij − i′ j) n | (j − j ′ ) ⇒ n | (i′ j − i′ j ′ ) Aus diesen beiden Gleichungen folgt durch Addition n | (ij − i′ j ′ ), also ij = i′ j ′ . Satz 2.2.10 (Zn , +, ·, 0, 1) erfüllt die Regeln [A1],[A2], [A3],[A4], [M1], [M2], [M3] sowie [D]. Beweis Alle Rechenregeln folgen direkt aus der Definition. Beachten Sie, dass es in Zn nicht alle Elemente multiplikativ invertierbar sind. Ferner ist die Menge Zn \ {0} bzgl. der Multiplikation im allgemeinen nicht abgeschlossen. Wenn n = a · b gilt, a, b 6= n, a, b ∈ N, dann ist a · b = n = 0. Also kann Zn kein Körper sein, wenn n eine zusammengesetzte Zahl ist. Die algebraische Struktur, die wir hier vorliegen haben, nennt man einen kommutativen Ring mit 1. Also: Wenn [M4] nicht gilt, spricht man von einem kommutativen Ring mit 1. Man kann auch “kommutativ” und “mit 1” weglassen, muss dann aber aufpassen: Im nicht kommutativen Fall müssen wir fordern, dass 1 von beiden Seiten ein neutrales Element ist. Wir fassen dies zusammen: Definition 2.2.11 Sei R eine nicht leere Menge mit zwei Verknüpfungen + und ·. Dann heißt R ein Ring, wenn gilt: [A1] x+y =y+x ∀x, y ∈ R. [A2] x + (y + z) = (x + y) + z ∀x, y, z ∈ R. 31 [A3] Es gibt ein Element 0 ∈ R mit der Eigenschaft x + 0 = x R. [A4] Zu jedem x ∈ R gibt es ein Element y ∈ R mit x + y = 0. Bezeichnung für dieses Element y = −x. [Ass] (x · y) · z = x · (y · z) ∀x ∈ ∀x, y, z ∈ K [D1] x · (y + z) = (x · y) + (x · z) ∀x, y, z ∈ R. [D2] (y + z) · x = (y · x) + (z · x) ∀x, y, z ∈ R. Wenn zusätzlich gilt [NE] Es gibt ein Element 1 ∈ R \ {0} mit x · 1 = x = 1 · x ∀x ∈ K. so sagt man, R sei ein Ring mit neutralem Element 1. Gilt [K] x · y = y · x ∀x, y ∈ R, so heißt der Ring kommutativ. Bemerkung 2.2.12 Genauso wie in Lemma 2.1.3 kann man zeigen, dass die 0 und die 1 in einem Ring eindeutig bestimmt sind. Ferner sind die additiv inversen Elemente eindeutig. Etwas schwieriger ist die Eindeutigkeit eines inversen Elementes bzgl der Multiplikation, insbesondere, weil die Multiplikation nicht eindeutig ist: Lemma 2.2.13 Wenn es in einem Ring mit 1 zu einem Element x ein y gibt mit x · y = 1, so gilt auch y · x = 1 und y ist durch x · y = 1 eindeutig bestimmt. Das Standardbeispiel eines kommutativen Rings mit 1 ist der Ring der ganzen Zahlen. Die Menge aller geraden Zahlen ist ein kommutativer Ring ohne 1. Wir werden bald nicht kommutative Ringe kennenlernen. Aber jetzt endlich zur Konstruktion endlicher Körper: 32 Satz 2.2.14 Ist p eine Primzahl, so ist (Zp , +, ·, 0, 1) ein Körper. Bezeichnung: Fp . Beweis Wir müssen nur [M4] zeigen. Sei also x 6= 0. Dann betrachten wir die p − 1 Elemente x · 1, . . . , x · p − 1. Weil p prim ist, taucht in dieser Liste das Element 0 nicht auf: Sonst p | x · y für ein y ∈ {1, . . . , p − 1}, aber p teilt weder x (sonst x = 0) noch y (wg. 1 ≤ y ≤ p − 1), das ist ein Widerspruch dazu, dass p prim ist. Wenn x kein Inverses hat, so muss in der Liste dieser Elemente also mindestens ein Element mehrfach auftreten, also x · i = x · i′ mit (obdA) i > i′ . Das liefert x · i − i′ = 0 mit 1 ≤ i − i′ ≤ p − 1. Also würde doch 0 in der Liste auftreten, ein Widerspruch. Also sind alle Elemente verschieden, und damit kommt auch 1 vor und es gibt zu x ein Inverses. Bemerkung 2.2.15 In Fp gilt |1 + 1 +{z. . . + 1} = 0. p mal Das ist ein ganz anderes Verhalten, als wir das für Q, R (und C) kennen. Bemerkung 2.2.16 Wir können das multiplikativ inverse Element von x modulo p mit Hilfe des Euklidischen Algorithmus bestimmen. Dazu suchen wir die Vielfachsummendarstellung des ggT von x und p. Wennn p eine Primzahl ist, so ist ggT(p, x) = 1 ür 1 ≤ x ≤ p − 1. Wir berechnen die Vielfachsummendarstellung des ggT, finden also eine Darstellung 1 = ap + bx. Dann ist b offenbar das Inverse von x. 2.3 Lineare Gleichungssysteme: Definitionen Sei K ein Körper. Wir untersuchen Gleichungssysteme der Form α1,1 x1 + α1,2 x2 + . . . + α1,n xn = β1 α2,1 x1 + α2,2 x2 + . . . + α2,n xn = β2 ...... ...... ... αm,1 x1 + αm,2 x2 + . . . + αm,n xn = βm 33 (2.1) wobei αi,j , βi ∈ K, i = 1, . . . , m, j = 1, . . . , n. Wir haben hier m Gleichungen und n Unbekannte. Wir suchen Lösungen mit xi ∈ K. Ein n-Tupel (x1 , . . . , xn ), das dieses Gleichungssystem löst, heißt Lösung des Systems. In der Regel gibt es viele Lösungen eines Systems. Die Menge aller Lösungen nennen wir die Lösungsmenge. Das Gleichungssystem heißt homogen, wenn β1 = β2 = . . . = βm = 0 gilt, andernfalls inhomogen. Beispiel 2.3.1 (1.) Jedes homogene Gleichungssystem hat mindestens eine Lösung, nämlich x1 = x2 = . . . = xn = 0 (triviale Lösung). (2.) Es gibt homogene Gleichungssysteme, die mehr als nur die triviale Lösung haben. Das gilt insbesondere, wenn m < n ist (unterbestimmtes System, Beweis später!). (3.) Es gibt inhomogene Systeme, die unlösbar sind, solche mit genau einer Lösung, und solche mit mehreren Lösungen. Selbst im Fall m < n kann es passieren, dass es keine Lösungen gibt. Unser Ziel ist es, das Gleichungssystem in ein “äquivalentes” System umzuformen, das dieselben Lösungen besitzt, aber einfacher zu lösen ist. Seien γ1 , . . . , γm ∈ K. Dann erfüllt jede Lösung von (2.1) auch die Gleichung (γ1 α1,1 + γ2 α2,1 + . . . + γm αm,1 )x1 + + (γ1 α1,2 + γ2 α2,2 + . . . + γm αm,2 )x2 + . . . + . . . + (γ1 α1,n + γ2 α2,n + . . . + γm αm,n )xn = = γ1 β1 + γ2 β2 + . . . + γm βm . Wir nennen eine solche Gleichung eine Linearkombination der Gleichungen in (2.1). Wenn wir aus einem Gleichungssystem (GLS1) ein neues Gleichungssystem (GLS2) bilden, in dem jede Gleichung eine Linearkombination der Gleichungen aus (GLS1) ist, dann gilt: (x1 , . . . , xn ) löst (GLS1) ⇒ (x1 , . . . , xn ) löst (GLS2) Definition 2.3.2 Zwei Gleichungssysteme (GLS1) und (GLS2) heißen äquivalent wenn jede Gleichung von (GLS1) eine Linearkombination der Gleichungen aus (GLS2) ist und umgekehrt. 34 Satz 2.3.3 Äquivalente Gleichungssysteme haben dieselben Lösungsmengen. Noch eine Definition: Definition 2.3.4 (Matrix) Sei R ein Ring. Eine Abbildung A : {1, . . . , m} × {1, . . . , n} → R heißt eine m × n-Matrix. Wenn A(i, j) = αi,j , dann schreiben wir eine Matrix meistens wie folgt: α1,1 · · · α1,n ··· A = ··· αm,1 · · · αm,n Die Menge aller m × n-Matrizen wird mit R(m,n) bezeichnet. Eine Matrix besteht aus m Zeilen und n Spalten. β1 β2 b = .. . betam ist eine m × 1-Matrix. Das Gleichungssystem (2.1) kürzen wir mit Ax = b ab. In den meisten Fällen betrachten wir Matrizen über Körpern, d.h. R ist ein Körper. Die Menge der Matrizen ist dann entsprechend K(m,n) . Besondere Matrizen sind die Einheitsmatrizen 1 0 0 ··· 0 1 0 · · · In = .. . 0 0 .. . 0 0 0 ··· 1 in K(n,n) . Der Index wird weggelassen, wenn n aus dem Zusammenhang hervorgeht. Die Nullmatrix 0m,n ist die m × n-Matrix, deren sämtlichen Einträge 0 sind. Auch hier lassen wir den Index weg, wenn die Größe aus dem Zusammenhang ersichtlich ist. Gilt m = n, so schreiben wir einfach 0n . 35 2.4 Elementare Zeilenumformungen Gegeben sei eine m × n-Matrix A mit Einträgen aus K. Wir erlauben nun für die Zeilen von A folgende Zeilenumformungen: [E1] Multiplikation der r-ten Zeile mit γ ∈ K, γ 6= 0. [E2] Addition des γ-fachen der s-ten Zeile zur r-ten Zeile (γ ∈ K, s 6= r). [E3] Vertauschen von Zeile r und s. Diese Umformungen sind Abbildungen K(m,n) → K(m,n) , die wir auch wie folgt beschreiben können: zu [E1] K(m,n) → K(m,n) ′ ) A = (αi,j ) 7→ A′ = (αi,j Er (γ) : wobei ( αi,j = γ · αr,j ′ αi,j wenn i 6= r sonst zu [E2] K(m,n) → K(m,n) ′ A = (αi,j ) 7→ A′ = (αi,j ) Es,r (γ) : wobei ′ αi,j = ( αi,j αr,j + γ · αs,j wenn i 6= r sonst zu [E3] Es,r : wobei ′ αi,j K(m,n) → K(m,n) ′ A = (αi,j ) 7→ A′ = (αi,j ) αi,j = αs,j αr,j wenn i 6= s, r wenn i = r wenn i = s Satz 2.4.1 (1.) Er (γ −1 ) = Er (γ)−1 . 36 (2.) Es,r (−γ) = Es,r (γ)−1 . (3.) Es,r = E−1 s,r , d.h. insbesondere, dass die oben definierten Abbildungen bijektiv sind. Definition 2.4.2 Zwei Matrizen A und B heißen zeilenäquivalent wenn B durch endlich viele elementare Zeilenumformungen aus A hervorgeht. Satz 2.4.3 Zeilenäquivalenz ist eine Äquivalenzrelation. Beweis Nicht ganz offensichtlich ist die Symmetrie. Die folgt aber aus Satz 2.4.1, weil elementare Zeilenumformungen durch ebensolche wieder rückgängig gemacht werden können. Satz 2.4.4 Sind A und B zeilenäquivalent, so sind die beiden homogenen Gleichungssysteme Ax = 0 und Bx = 0 äquivalent. Wir werden später sehen, dass auch die Umkehrung gilt. Nun ist die Strategie zum Lösen linearer Gleichungssysteme klar: Man versucht, die Matrix A durch elementare Zeilenumformungen in eine “möglichst” einfache Form zu bringen, die dann leicht lösbar ist. 37