Kapitel 2 Lineare Gleichungssysteme

Kapitel 2
Lineare Gleichungssysteme
Wir wollen uns in diesem Abschnitt sehr ausführlich mit linearen Gleichungssystemen beschäftigen. Üblicherweise macht man das erst, nachdem man die
Theorie der Vektorräume und der linearen Abbildungen auf Vektorräumen
behandelt hat.
Vieles mag Ihnen von der Schule her vertraut sein. Aber eine wichtige Erweiterung gegenüber dem Schulstoff werden wir jetzt gleich im nächsten Abschnitt einführen. Wir wollen Gleichungssysteme nämlich nicht nur über den
Ihnen bekannten Zahlbereichen R und Q betrachten, sondern über beliebigen
sogenannten Körpern.
2.1
Körper
Körper sind algebraische Objekte, in denen ähnliche Rechenregeln gelten wie
in R oder Q (Multiplikation, Addition, Assoziativgesetz, Distributivgesetz).
Es gibt aber noch mehr algebraische Strukturen als nur R und Q, in denen
solche Regeln gelten. Dazu wollen wir zunächst die entscheidenden Rechenregeln formalisieren und dann weitere Körper kennenlernen. Ein Hauptziel
der linearen Algebra ist es, lineare Gleichungssysteme über solchen Körpern
zu lösen.
Definition 2.1.1 Sei K eine nicht leere Menge, auf der zwei binäre Verknüpfungen + und · definiert sind, die folgende Eigenschaften haben:
26
[A1]
x+y =y+x
∀x, y ∈ K.
[A2]
x + (y + z) = (x + y) + z
[A3]
Es gibt ein Element 0 ∈ K mit der Eigenschaft x + 0 = x
K.
[A4]
Zu jedem x ∈ K gibt es ein Element y ∈ K mit x + y = 0.
Bezeichnung für dieses Element y = −x.
∀x, y, z ∈ K.
∀x ∈
Die Regel [A1] ist die Kommutativität der Addition, [A2] die Assoziativität,
[A3] sagt etwas über die Existenz eines neutralen Elementes und [A4] sagt
etwas über die Existenz eines inversen Elementes.
Nun zur Multiplikation. Dazu setzen wir K∗ := K \ {0}.
[M1]
x·y =y·x
∀x, y ∈ K.
[M2]
(x · y) · z = x · (y · z)
[M3]
Es gibt ein Element 1 ∈ K∗ mit x · 1 = x
[M4]
Zu jedem x ∈ K∗ gibt es ein Element y ∈ K∗ mit x · y = 1.
Bezeichnung für dieses Element y = x−1 .
∀x, y, z ∈ K
∀x ∈ K.
Bislang stehen Addition und Multiplikation einfach nur nebeneinander. Interessant wird es durch das Distributivgesetz:
[D]
x · (y + z) = (x · y) + (x · z)
∀x, y, z ∈ K.
Um deutlich zu machen, dass nicht die Menge K, sondern die Menge zusammen mit den Verknüpfungen den Körper bilden, schreiben wir den Körper
manchmal auch als “Tupel” (K, +, ·, 0, 1).
Beispiel 2.1.2 Wie schon erwähnt sind R und Q Beispiele von Körpern. Die
ganzen Zahlen Z sind kein Körper, weil [M4] nicht erfüllt ist. Die natürlichen
Zahlen (einschließlich der 0) sind kein Körper, weil [M4] und [A4] nicht erfüllt
27
sind.
Lemma 2.1.3 Das bzgl. “+” sowie bzgl. “·” inverse Element in einem Körper
K ist eindeutig. Ferner gibt es außer den Elementen 0 und 1 keine weiteren
Elemente g und h mit x + g = x für alle x und x · h = x für alle x.
Lemma 2.1.4 Sei K ein Körper. Dann gilt:
(1.) x · 0 = 0 · x
∀x ∈ K.
(2.) −x = (−1) · x
(3.) x · y 6= 0
Beweis (1.)
∀x ∈ K.
∀x, y ∈ K∗ .
Es gilt
x · 0 + x = x · 0 + x · 1 = x · (0 + 1) = x · 1 = x,
also x · 0 = 0 (Addiere auf beiden Seiten (−x)).
(2.) 0 = 0 · x = (1 + (−1)) · x = 1 · x + (−1) · x = x + (−1) · x, also muss
(−1) · x das eindeutig bestimmte additiv inverse Element von x sein.
(3.) Angenommen x · y = 0, aber x, y 6= 0. Dann x · x−1 · y · y −1 = 1, aber
auch = 0 wegen xy = 0 und (1.). Das liefert den Widerspruch 0 = 1.
Teil (3.) von Lemma 2.1.4 zeigt, dass die Multiplikation auf K∗ abgeschlossen ist, d.h. das Produkt von zwei Elementen in K∗ liegt wieder in K∗ - Die
Eigenschaften der Multiplikation auf K∗ sind identisch mit denen der Addition auf K (neutrales Element, Assoziativität, Kommutativität, inverses
Element). Solche algebraischen Strukturen treten sehr häufig auf, und man
nennt sie Gruppen (wobei das Kommutativgesetz nicht unbedingt gelten
muss). Dazu später mehr.
2.2
Neue Körper: C und Fp
Definition 2.2.1 Wir definieren C als die Menge {(x, y) : x, y ∈ R} zusammen mit den zwei Verknüpfungen + und · wie folgt:
(x, y) + (x′ , y ′ ) = (x + x′ , y + y ′)
(x, y) · (x′ , y ′ ) = (xx′ − yy ′, xy ′ + x′ y).
28
Diese Definition ist sehr sinnvoll, wie der folgende Satz zeigt:
Satz 2.2.2 C ist ein Körper mit dem additiv neutralen Element (0, 0), dem
multiplikativ neutralen Element (1, 0) sowie den inversen Elementen
−(x, y) := (−x, −y)
x
−y
−1
(x, y)
:=
,
.
x2 + y 2 x2 + y 2
Beweis Man rechnet die Regeln [A1] bis [A4], [D] sowie [M1] bis [M4]
nach.
Bemerkung 2.2.3 Die Menge {(x, 0) : x ∈ R} ⊆ C ist selber ein Körper,
den wir mit R “identifizieren” können, d.h. wir identifizieren das Element
(x, 0) in C mit x ∈ R. Auf diese Weise können wir R als “Teilkörper” von
C auffassen (präzise Definition folgt). Das Element (0, 1) bekommt einen
besonderen Namen i und heißt “imaginäre Einheit”. Es gilt i2 = (−1, 0),
was wir ja auch als die reelle Zahl −1 auffassen wollen. Man schreibt statt
(x, y) oft auch x + iy, x, y ∈ R. Dann wird klar, warum die Multiplikation
gerade so gewählt ist, wie sie gewählt ist:
(x + iy)(x′ + iy ′) = xx′ + i2 yy ′ + ixy ′ + ix′ y
= xx′ − yy ′ + i(xy ′ + x′ y).
Definition 2.2.4 Sei (K, +, ·, 0, 1) ein Körper. Ist F ⊆ K, und gilt 0, 1 ∈ F,
so heißt F ein Teilkörper von K, falls x + y ∈ F, xy ∈ F, −x ∈ F sowie
x−1 ∈ F für alle x, y ∈ F gilt.
Um zu zeigen, dass F ein Teilkörper ist, müssen Sie nicht mehr alle Rechenregeln überprüfen, sondern nur die Abgeschlossenheit von + und · in F.
Machen Sie sich das an dem Beispiel klar, dass die Menge {(x, 0) : x ∈ R}
ein Teilkörper von C ist. Auf eine formale Definition, was es heißt, diesen
Teilkörper mit R zu identifizieren, möchte ich hier an dieser Stelle (noch)
verzichten.
Der Körper R hat auch einen Teilkörper, nämlich Q. Man kann sich leicht
überlegen, dass jeder Teilkörper von R diesen Teilkörper Q enthält.
Neben Q, R und C spielen Körper mit nur endlich vielen Elementen in den
Anwendungen eine zunehmende Bedeutung.
29
Beispiel 2.2.5 Die Menge {0, 1} mit den Verknüpfungen 0 + 1 = 1 + 0 = 1,
1 + 1 = 0 + 0 = 1 sowie der Multiplikation 1 · 1 = 1 ist ein Körper (mit nur
zwei Elementen).
Unser Ziel wird sein, Körper zu konstruieren, die p Elemente haben, wobei p
eine Primzahl ist.
Definition 2.2.6 Sei n ∈ N, und sei ≡n die in 1.4.7 definierte Äquivalenzrelation. Dann definieren wir
Zn := {[0]≡n , . . . , [n − 1]≡n }
als die Menge der Äquivalenzklassen von ≡n . Bezeichnung: [i]≡n =: i.
Es sollte klar sein, dass |Zn | = n, und dass es keine weiteren Äquivalenzklassen gibt.Wir definieren nun auf Zn eine Addition und eine Multiplikation:
[An]
i + j := i + j
[Mn]
i · j := i · j
Beispiel 2.2.7 Sei n = 4. Dann ist 5 + 7 = 12 = 0. Nun gilt 5 = 1 und
7 = 3. Wenn wir diese anderen Repräsentanten wählen, um die Addition
auszuführen, erhalten wir 1 + 3 = 4 = 0, also dasselbe Ergebnis.
Satz 2.2.8 [An] und [Mn] sind wohldefiniert, d.h. für i = i′ und j = j ′ gilt
i + j = i′ + j ′
i · j = i′ · j ′
Bemerkung 2.2.9 Dieses Problem der “Wohldefiniertheit” tritt immer dann
auf, wenn man zur Erklärung einer mathematischen Funktion “Repräsentanten” benutzt. Man muss dann zeigen, dass das Ergebnis der Funktionsauswertung unabhängig von der Auswahl des Repräsentanten ist Die Funktion,
die wir hier vorliegen haben, ist die binäre Verknüpfung + (bzw. ·), die man
auch als Abbildung + : Zn × Zn → Zn auffassen kann.
30
Beweis (Beweis von Satz 2.2.8) [An] Nach Voraussetzung gilt n |
(i − i′ ) und n | (j − j ′ ), also na = i − i′ und nb = j − j ′ für geeignete
a, b ∈ Z. Nun ist
na + nb = i − i′ + j − j ′ = (i + j) − (i′ + j ′ ),
also n | ((i + j) − (i′ + j ′ )), d.h. i + j = i′ + j ′ .
[Mn]
Beachte
n | (i − i′ ) ⇒ n | (ij − i′ j)
n | (j − j ′ ) ⇒ n | (i′ j − i′ j ′ )
Aus diesen beiden Gleichungen folgt durch Addition n | (ij − i′ j ′ ), also
ij = i′ j ′ .
Satz 2.2.10 (Zn , +, ·, 0, 1) erfüllt die Regeln [A1],[A2], [A3],[A4], [M1],
[M2], [M3] sowie [D].
Beweis Alle Rechenregeln folgen direkt aus der Definition.
Beachten Sie, dass es in Zn nicht alle Elemente multiplikativ invertierbar sind.
Ferner ist die Menge Zn \ {0} bzgl. der Multiplikation im allgemeinen nicht
abgeschlossen. Wenn n = a · b gilt, a, b 6= n, a, b ∈ N, dann ist a · b = n = 0.
Also kann Zn kein Körper sein, wenn n eine zusammengesetzte Zahl ist.
Die algebraische Struktur, die wir hier vorliegen haben, nennt man einen
kommutativen Ring mit 1. Also: Wenn [M4] nicht gilt, spricht man von
einem kommutativen Ring mit 1. Man kann auch “kommutativ” und “mit
1” weglassen, muss dann aber aufpassen: Im nicht kommutativen Fall müssen
wir fordern, dass 1 von beiden Seiten ein neutrales Element ist. Wir fassen
dies zusammen:
Definition 2.2.11 Sei R eine nicht leere Menge mit zwei Verknüpfungen
+ und ·. Dann heißt R ein Ring, wenn gilt:
[A1]
x+y =y+x
∀x, y ∈ R.
[A2]
x + (y + z) = (x + y) + z
∀x, y, z ∈ R.
31
[A3]
Es gibt ein Element 0 ∈ R mit der Eigenschaft x + 0 = x
R.
[A4]
Zu jedem x ∈ R gibt es ein Element y ∈ R mit x + y = 0. Bezeichnung für dieses Element y = −x.
[Ass]
(x · y) · z = x · (y · z)
∀x ∈
∀x, y, z ∈ K
[D1]
x · (y + z) = (x · y) + (x · z)
∀x, y, z ∈ R.
[D2]
(y + z) · x = (y · x) + (z · x)
∀x, y, z ∈ R.
Wenn zusätzlich gilt
[NE]
Es gibt ein Element 1 ∈ R \ {0} mit x · 1 = x = 1 · x ∀x ∈ K.
so sagt man, R sei ein Ring mit neutralem Element 1. Gilt
[K]
x · y = y · x ∀x, y ∈ R,
so heißt der Ring kommutativ.
Bemerkung 2.2.12 Genauso wie in Lemma 2.1.3 kann man zeigen, dass die
0 und die 1 in einem Ring eindeutig bestimmt sind. Ferner sind die additiv
inversen Elemente eindeutig. Etwas schwieriger ist die Eindeutigkeit eines
inversen Elementes bzgl der Multiplikation, insbesondere, weil die Multiplikation nicht eindeutig ist:
Lemma 2.2.13 Wenn es in einem Ring mit 1 zu einem Element x ein y
gibt mit x · y = 1, so gilt auch y · x = 1 und y ist durch x · y = 1 eindeutig
bestimmt.
Das Standardbeispiel eines kommutativen Rings mit 1 ist der Ring der ganzen
Zahlen. Die Menge aller geraden Zahlen ist ein kommutativer Ring ohne 1.
Wir werden bald nicht kommutative Ringe kennenlernen. Aber jetzt endlich
zur Konstruktion endlicher Körper:
32
Satz 2.2.14 Ist p eine Primzahl, so ist (Zp , +, ·, 0, 1) ein Körper. Bezeichnung: Fp .
Beweis Wir müssen nur [M4] zeigen. Sei also x 6= 0. Dann betrachten wir
die p − 1 Elemente x · 1, . . . , x · p − 1. Weil p prim ist, taucht in dieser Liste
das Element 0 nicht auf: Sonst p | x · y für ein y ∈ {1, . . . , p − 1}, aber p teilt
weder x (sonst x = 0) noch y (wg. 1 ≤ y ≤ p − 1), das ist ein Widerspruch
dazu, dass p prim ist.
Wenn x kein Inverses hat, so muss in der Liste dieser Elemente also mindestens ein Element mehrfach auftreten, also
x · i = x · i′
mit (obdA) i > i′ . Das liefert x · i − i′ = 0 mit 1 ≤ i − i′ ≤ p − 1. Also
würde doch 0 in der Liste auftreten, ein Widerspruch. Also sind alle Elemente
verschieden, und damit kommt auch 1 vor und es gibt zu x ein Inverses. Bemerkung 2.2.15 In Fp gilt
|1 + 1 +{z. . . + 1} = 0.
p mal
Das ist ein ganz anderes Verhalten, als wir das für Q, R (und C) kennen.
Bemerkung 2.2.16 Wir können das multiplikativ inverse Element von x
modulo p mit Hilfe des Euklidischen Algorithmus bestimmen. Dazu suchen
wir die Vielfachsummendarstellung des ggT von x und p. Wennn p eine Primzahl ist, so ist ggT(p, x) = 1 ür 1 ≤ x ≤ p − 1. Wir berechnen die Vielfachsummendarstellung des ggT, finden also eine Darstellung 1 = ap + bx. Dann
ist b offenbar das Inverse von x.
2.3
Lineare Gleichungssysteme: Definitionen
Sei K ein Körper. Wir untersuchen Gleichungssysteme der Form
α1,1 x1 + α1,2 x2 + . . . + α1,n xn = β1
α2,1 x1 + α2,2 x2 + . . . + α2,n xn = β2
......
......
...
αm,1 x1 + αm,2 x2 + . . . + αm,n xn = βm
33
(2.1)
wobei αi,j , βi ∈ K, i = 1, . . . , m, j = 1, . . . , n. Wir haben hier m Gleichungen und n Unbekannte. Wir suchen Lösungen mit xi ∈ K. Ein n-Tupel
(x1 , . . . , xn ), das dieses Gleichungssystem löst, heißt Lösung des Systems.
In der Regel gibt es viele Lösungen eines Systems. Die Menge aller Lösungen
nennen wir die Lösungsmenge.
Das Gleichungssystem heißt homogen, wenn β1 = β2 = . . . = βm = 0 gilt,
andernfalls inhomogen.
Beispiel 2.3.1 (1.) Jedes homogene Gleichungssystem hat mindestens eine
Lösung, nämlich x1 = x2 = . . . = xn = 0 (triviale Lösung).
(2.) Es gibt homogene Gleichungssysteme, die mehr als nur die triviale
Lösung haben. Das gilt insbesondere, wenn m < n ist (unterbestimmtes
System, Beweis später!).
(3.) Es gibt inhomogene Systeme, die unlösbar sind, solche mit genau einer
Lösung, und solche mit mehreren Lösungen. Selbst im Fall m < n kann es
passieren, dass es keine Lösungen gibt.
Unser Ziel ist es, das Gleichungssystem in ein “äquivalentes” System umzuformen, das dieselben Lösungen besitzt, aber einfacher zu lösen ist.
Seien γ1 , . . . , γm ∈ K. Dann erfüllt jede Lösung von (2.1) auch die Gleichung
(γ1 α1,1 + γ2 α2,1 + . . . + γm αm,1 )x1 +
+ (γ1 α1,2 + γ2 α2,2 + . . . + γm αm,2 )x2 +
. . . + . . . + (γ1 α1,n + γ2 α2,n + . . . + γm αm,n )xn =
= γ1 β1 + γ2 β2 + . . . + γm βm .
Wir nennen eine solche Gleichung eine Linearkombination der Gleichungen in
(2.1). Wenn wir aus einem Gleichungssystem (GLS1) ein neues Gleichungssystem (GLS2) bilden, in dem jede Gleichung eine Linearkombination der
Gleichungen aus (GLS1) ist, dann gilt:
(x1 , . . . , xn ) löst (GLS1)
⇒
(x1 , . . . , xn ) löst (GLS2)
Definition 2.3.2 Zwei Gleichungssysteme (GLS1) und (GLS2) heißen
äquivalent wenn jede Gleichung von (GLS1) eine Linearkombination der
Gleichungen aus (GLS2) ist und umgekehrt.
34
Satz 2.3.3 Äquivalente Gleichungssysteme haben dieselben Lösungsmengen.
Noch eine Definition:
Definition 2.3.4 (Matrix) Sei R ein Ring. Eine Abbildung A :
{1, . . . , m} × {1, . . . , n} → R heißt eine m × n-Matrix. Wenn A(i, j) = αi,j ,
dann schreiben wir eine Matrix meistens wie folgt:


α1,1 · · · α1,n
··· 
A =  ···
αm,1 · · · αm,n
Die Menge aller m × n-Matrizen wird mit R(m,n) bezeichnet. Eine Matrix
besteht aus m Zeilen und n Spalten.


β1
 β2 


b =  .. 
 . 
betam
ist eine m × 1-Matrix. Das Gleichungssystem (2.1) kürzen wir mit Ax = b
ab.
In den meisten Fällen betrachten wir Matrizen über Körpern, d.h. R ist ein
Körper. Die Menge der Matrizen ist dann entsprechend K(m,n) .
Besondere Matrizen sind die Einheitsmatrizen

1 0 0 ···
0 1 0 · · ·

In =  ..
.

0
0

.. 
.
0 0 0 ··· 1
in K(n,n) . Der Index wird weggelassen, wenn n aus dem Zusammenhang hervorgeht.
Die Nullmatrix 0m,n ist die m × n-Matrix, deren sämtlichen Einträge 0 sind.
Auch hier lassen wir den Index weg, wenn die Größe aus dem Zusammenhang
ersichtlich ist. Gilt m = n, so schreiben wir einfach 0n .
35
2.4
Elementare Zeilenumformungen
Gegeben sei eine m × n-Matrix A mit Einträgen aus K. Wir erlauben nun
für die Zeilen von A folgende Zeilenumformungen:
[E1]
Multiplikation der r-ten Zeile mit γ ∈ K, γ 6= 0.
[E2]
Addition des γ-fachen der s-ten Zeile zur r-ten Zeile (γ ∈ K, s 6= r).
[E3]
Vertauschen von Zeile r und s.
Diese Umformungen sind Abbildungen K(m,n) → K(m,n) , die wir auch wie
folgt beschreiben können:
zu [E1]
K(m,n)
→ K(m,n)
′
)
A = (αi,j ) 7→ A′ = (αi,j
Er (γ) :
wobei
(
αi,j
=
γ · αr,j
′
αi,j
wenn i 6= r
sonst
zu [E2]
K(m,n)
→ K(m,n)
′
A = (αi,j ) 7→ A′ = (αi,j
)
Es,r (γ) :
wobei
′
αi,j
=
(
αi,j
αr,j + γ · αs,j
wenn i 6= r
sonst
zu [E3]
Es,r :
wobei
′
αi,j
K(m,n)
→ K(m,n)
′
A = (αi,j ) 7→ A′ = (αi,j
)


αi,j
= αs,j


αr,j
wenn i 6= s, r
wenn i = r
wenn i = s
Satz 2.4.1 (1.) Er (γ −1 ) = Er (γ)−1 .
36
(2.) Es,r (−γ) = Es,r (γ)−1 .
(3.) Es,r = E−1
s,r ,
d.h. insbesondere, dass die oben definierten Abbildungen bijektiv sind.
Definition 2.4.2 Zwei Matrizen A und B heißen zeilenäquivalent wenn
B durch endlich viele elementare Zeilenumformungen aus A hervorgeht.
Satz 2.4.3 Zeilenäquivalenz ist eine Äquivalenzrelation.
Beweis Nicht ganz offensichtlich ist die Symmetrie. Die folgt aber aus Satz
2.4.1, weil elementare Zeilenumformungen durch ebensolche wieder rückgängig
gemacht werden können.
Satz 2.4.4 Sind A und B zeilenäquivalent, so sind die beiden homogenen
Gleichungssysteme Ax = 0 und Bx = 0 äquivalent.
Wir werden später sehen, dass auch die Umkehrung gilt.
Nun ist die Strategie zum Lösen linearer Gleichungssysteme klar: Man versucht, die Matrix A durch elementare Zeilenumformungen in eine “möglichst”
einfache Form zu bringen, die dann leicht lösbar ist.
37