Kapitel 2 Lineare Gleichungssysteme

Werbung
Kapitel 2
Lineare Gleichungssysteme
Wir wollen uns in diesem Abschnitt sehr ausführlich mit linearen Gleichungssystemen beschäftigen. Üblicherweise macht man das erst, nachdem man die
Theorie der Vektorräume und der linearen Abbildungen auf Vektorräumen
behandelt hat.
Vieles mag Ihnen von der Schule her vertraut sein. Aber eine wichtige Erweiterung gegenüber dem Schulstoff werden wir jetzt gleich im nächsten Abschnitt einführen. Wir wollen Gleichungssysteme nämlich nicht nur über den
Ihnen bekannten Zahlbereichen R und Q betrachten, sondern über beliebigen
sogenannten Körpern.
2.1
Körper
Körper sind algebraische Objekte, in denen ähnliche Rechenregeln gelten wie
in R oder Q (Multiplikation, Addition, Assoziativgesetz, Distributivgesetz).
Es gibt aber noch mehr algebraische Strukturen als nur R und Q, in denen
solche Regeln gelten. Dazu wollen wir zunächst die entscheidenden Rechenregeln formalisieren und dann weitere Körper kennenlernen. Ein Hauptziel
der linearen Algebra ist es, lineare Gleichungssysteme über solchen Körpern
zu lösen.
Definition 2.1.1 Sei K eine nicht leere Menge, auf der zwei binäre Verknüpfungen + und · definiert sind, die folgende Eigenschaften haben:
26
[A1]
x+y =y+x
∀x, y ∈ K.
[A2]
x + (y + z) = (x + y) + z
[A3]
Es gibt ein Element 0 ∈ K mit der Eigenschaft x + 0 = x
K.
[A4]
Zu jedem x ∈ K gibt es ein Element y ∈ K mit x + y = 0.
Bezeichnung für dieses Element y = −x.
∀x, y, z ∈ K.
∀x ∈
Die Regel [A1] ist die Kommutativität der Addition, [A2] die Assoziativität,
[A3] sagt etwas über die Existenz eines neutralen Elementes und [A4] sagt
etwas über die Existenz eines inversen Elementes.
Nun zur Multiplikation. Dazu setzen wir K∗ := K \ {0}.
[M1]
x·y =y·x
∀x, y ∈ K.
[M2]
(x · y) · z = x · (y · z)
[M3]
Es gibt ein Element 1 ∈ K∗ mit x · 1 = x
[M4]
Zu jedem x ∈ K∗ gibt es ein Element y ∈ K∗ mit x · y = 1.
Bezeichnung für dieses Element y = x−1 .
∀x, y, z ∈ K
∀x ∈ K.
Bislang stehen Addition und Multiplikation einfach nur nebeneinander. Interessant wird es durch das Distributivgesetz:
[D]
x · (y + z) = (x · y) + (x · z)
∀x, y, z ∈ K.
Um deutlich zu machen, dass nicht die Menge K, sondern die Menge zusammen mit den Verknüpfungen den Körper bilden, schreiben wir den Körper
manchmal auch als “Tupel” (K, +, ·, 0, 1).
Beispiel 2.1.2 Wie schon erwähnt sind R und Q Beispiele von Körpern. Die
ganzen Zahlen Z sind kein Körper, weil [M4] nicht erfüllt ist. Die natürlichen
Zahlen (einschließlich der 0) sind kein Körper, weil [M4] und [A4] nicht erfüllt
27
sind.
Lemma 2.1.3 Das bzgl. “+” sowie bzgl. “·” inverse Element in einem Körper
K ist eindeutig. Ferner gibt es außer den Elementen 0 und 1 keine weiteren
Elemente g und h mit x + g = x für alle x und x · h = x für alle x.
Lemma 2.1.4 Sei K ein Körper. Dann gilt:
(1.) x · 0 = 0 · x
∀x ∈ K.
(2.) −x = (−1) · x
(3.) x · y 6= 0
Beweis (1.)
∀x ∈ K.
∀x, y ∈ K∗ .
Es gilt
x · 0 + x = x · 0 + x · 1 = x · (0 + 1) = x · 1 = x,
also x · 0 = 0 (Addiere auf beiden Seiten (−x)).
(2.) 0 = 0 · x = (1 + (−1)) · x = 1 · x + (−1) · x = x + (−1) · x, also muss
(−1) · x das eindeutig bestimmte additiv inverse Element von x sein.
(3.) Angenommen x · y = 0, aber x, y 6= 0. Dann x · x−1 · y · y −1 = 1, aber
auch = 0 wegen xy = 0 und (1.). Das liefert den Widerspruch 0 = 1.
Teil (3.) von Lemma 2.1.4 zeigt, dass die Multiplikation auf K∗ abgeschlossen ist, d.h. das Produkt von zwei Elementen in K∗ liegt wieder in K∗ - Die
Eigenschaften der Multiplikation auf K∗ sind identisch mit denen der Addition auf K (neutrales Element, Assoziativität, Kommutativität, inverses
Element). Solche algebraischen Strukturen treten sehr häufig auf, und man
nennt sie Gruppen (wobei das Kommutativgesetz nicht unbedingt gelten
muss). Dazu später mehr.
2.2
Neue Körper: C und Fp
Definition 2.2.1 Wir definieren C als die Menge {(x, y) : x, y ∈ R} zusammen mit den zwei Verknüpfungen + und · wie folgt:
(x, y) + (x′ , y ′ ) = (x + x′ , y + y ′)
(x, y) · (x′ , y ′ ) = (xx′ − yy ′, xy ′ + x′ y).
28
Diese Definition ist sehr sinnvoll, wie der folgende Satz zeigt:
Satz 2.2.2 C ist ein Körper mit dem additiv neutralen Element (0, 0), dem
multiplikativ neutralen Element (1, 0) sowie den inversen Elementen
−(x, y) := (−x, −y)
x
−y
−1
(x, y)
:=
,
.
x2 + y 2 x2 + y 2
Beweis Man rechnet die Regeln [A1] bis [A4], [D] sowie [M1] bis [M4]
nach.
Bemerkung 2.2.3 Die Menge {(x, 0) : x ∈ R} ⊆ C ist selber ein Körper,
den wir mit R “identifizieren” können, d.h. wir identifizieren das Element
(x, 0) in C mit x ∈ R. Auf diese Weise können wir R als “Teilkörper” von
C auffassen (präzise Definition folgt). Das Element (0, 1) bekommt einen
besonderen Namen i und heißt “imaginäre Einheit”. Es gilt i2 = (−1, 0),
was wir ja auch als die reelle Zahl −1 auffassen wollen. Man schreibt statt
(x, y) oft auch x + iy, x, y ∈ R. Dann wird klar, warum die Multiplikation
gerade so gewählt ist, wie sie gewählt ist:
(x + iy)(x′ + iy ′) = xx′ + i2 yy ′ + ixy ′ + ix′ y
= xx′ − yy ′ + i(xy ′ + x′ y).
Definition 2.2.4 Sei (K, +, ·, 0, 1) ein Körper. Ist F ⊆ K, und gilt 0, 1 ∈ F,
so heißt F ein Teilkörper von K, falls x + y ∈ F, xy ∈ F, −x ∈ F sowie
x−1 ∈ F für alle x, y ∈ F gilt.
Um zu zeigen, dass F ein Teilkörper ist, müssen Sie nicht mehr alle Rechenregeln überprüfen, sondern nur die Abgeschlossenheit von + und · in F.
Machen Sie sich das an dem Beispiel klar, dass die Menge {(x, 0) : x ∈ R}
ein Teilkörper von C ist. Auf eine formale Definition, was es heißt, diesen
Teilkörper mit R zu identifizieren, möchte ich hier an dieser Stelle (noch)
verzichten.
Der Körper R hat auch einen Teilkörper, nämlich Q. Man kann sich leicht
überlegen, dass jeder Teilkörper von R diesen Teilkörper Q enthält.
Neben Q, R und C spielen Körper mit nur endlich vielen Elementen in den
Anwendungen eine zunehmende Bedeutung.
29
Beispiel 2.2.5 Die Menge {0, 1} mit den Verknüpfungen 0 + 1 = 1 + 0 = 1,
1 + 1 = 0 + 0 = 1 sowie der Multiplikation 1 · 1 = 1 ist ein Körper (mit nur
zwei Elementen).
Unser Ziel wird sein, Körper zu konstruieren, die p Elemente haben, wobei p
eine Primzahl ist.
Definition 2.2.6 Sei n ∈ N, und sei ≡n die in 1.4.7 definierte Äquivalenzrelation. Dann definieren wir
Zn := {[0]≡n , . . . , [n − 1]≡n }
als die Menge der Äquivalenzklassen von ≡n . Bezeichnung: [i]≡n =: i.
Es sollte klar sein, dass |Zn | = n, und dass es keine weiteren Äquivalenzklassen gibt.Wir definieren nun auf Zn eine Addition und eine Multiplikation:
[An]
i + j := i + j
[Mn]
i · j := i · j
Beispiel 2.2.7 Sei n = 4. Dann ist 5 + 7 = 12 = 0. Nun gilt 5 = 1 und
7 = 3. Wenn wir diese anderen Repräsentanten wählen, um die Addition
auszuführen, erhalten wir 1 + 3 = 4 = 0, also dasselbe Ergebnis.
Satz 2.2.8 [An] und [Mn] sind wohldefiniert, d.h. für i = i′ und j = j ′ gilt
i + j = i′ + j ′
i · j = i′ · j ′
Bemerkung 2.2.9 Dieses Problem der “Wohldefiniertheit” tritt immer dann
auf, wenn man zur Erklärung einer mathematischen Funktion “Repräsentanten” benutzt. Man muss dann zeigen, dass das Ergebnis der Funktionsauswertung unabhängig von der Auswahl des Repräsentanten ist Die Funktion,
die wir hier vorliegen haben, ist die binäre Verknüpfung + (bzw. ·), die man
auch als Abbildung + : Zn × Zn → Zn auffassen kann.
30
Beweis (Beweis von Satz 2.2.8) [An] Nach Voraussetzung gilt n |
(i − i′ ) und n | (j − j ′ ), also na = i − i′ und nb = j − j ′ für geeignete
a, b ∈ Z. Nun ist
na + nb = i − i′ + j − j ′ = (i + j) − (i′ + j ′ ),
also n | ((i + j) − (i′ + j ′ )), d.h. i + j = i′ + j ′ .
[Mn]
Beachte
n | (i − i′ ) ⇒ n | (ij − i′ j)
n | (j − j ′ ) ⇒ n | (i′ j − i′ j ′ )
Aus diesen beiden Gleichungen folgt durch Addition n | (ij − i′ j ′ ), also
ij = i′ j ′ .
Satz 2.2.10 (Zn , +, ·, 0, 1) erfüllt die Regeln [A1],[A2], [A3],[A4], [M1],
[M2], [M3] sowie [D].
Beweis Alle Rechenregeln folgen direkt aus der Definition.
Beachten Sie, dass es in Zn nicht alle Elemente multiplikativ invertierbar sind.
Ferner ist die Menge Zn \ {0} bzgl. der Multiplikation im allgemeinen nicht
abgeschlossen. Wenn n = a · b gilt, a, b 6= n, a, b ∈ N, dann ist a · b = n = 0.
Also kann Zn kein Körper sein, wenn n eine zusammengesetzte Zahl ist.
Die algebraische Struktur, die wir hier vorliegen haben, nennt man einen
kommutativen Ring mit 1. Also: Wenn [M4] nicht gilt, spricht man von
einem kommutativen Ring mit 1. Man kann auch “kommutativ” und “mit
1” weglassen, muss dann aber aufpassen: Im nicht kommutativen Fall müssen
wir fordern, dass 1 von beiden Seiten ein neutrales Element ist. Wir fassen
dies zusammen:
Definition 2.2.11 Sei R eine nicht leere Menge mit zwei Verknüpfungen
+ und ·. Dann heißt R ein Ring, wenn gilt:
[A1]
x+y =y+x
∀x, y ∈ R.
[A2]
x + (y + z) = (x + y) + z
∀x, y, z ∈ R.
31
[A3]
Es gibt ein Element 0 ∈ R mit der Eigenschaft x + 0 = x
R.
[A4]
Zu jedem x ∈ R gibt es ein Element y ∈ R mit x + y = 0. Bezeichnung für dieses Element y = −x.
[Ass]
(x · y) · z = x · (y · z)
∀x ∈
∀x, y, z ∈ K
[D1]
x · (y + z) = (x · y) + (x · z)
∀x, y, z ∈ R.
[D2]
(y + z) · x = (y · x) + (z · x)
∀x, y, z ∈ R.
Wenn zusätzlich gilt
[NE]
Es gibt ein Element 1 ∈ R \ {0} mit x · 1 = x = 1 · x ∀x ∈ K.
so sagt man, R sei ein Ring mit neutralem Element 1. Gilt
[K]
x · y = y · x ∀x, y ∈ R,
so heißt der Ring kommutativ.
Bemerkung 2.2.12 Genauso wie in Lemma 2.1.3 kann man zeigen, dass die
0 und die 1 in einem Ring eindeutig bestimmt sind. Ferner sind die additiv
inversen Elemente eindeutig. Etwas schwieriger ist die Eindeutigkeit eines
inversen Elementes bzgl der Multiplikation, insbesondere, weil die Multiplikation nicht eindeutig ist:
Lemma 2.2.13 Wenn es in einem Ring mit 1 zu einem Element x ein y
gibt mit x · y = 1, so gilt auch y · x = 1 und y ist durch x · y = 1 eindeutig
bestimmt.
Das Standardbeispiel eines kommutativen Rings mit 1 ist der Ring der ganzen
Zahlen. Die Menge aller geraden Zahlen ist ein kommutativer Ring ohne 1.
Wir werden bald nicht kommutative Ringe kennenlernen. Aber jetzt endlich
zur Konstruktion endlicher Körper:
32
Satz 2.2.14 Ist p eine Primzahl, so ist (Zp , +, ·, 0, 1) ein Körper. Bezeichnung: Fp .
Beweis Wir müssen nur [M4] zeigen. Sei also x 6= 0. Dann betrachten wir
die p − 1 Elemente x · 1, . . . , x · p − 1. Weil p prim ist, taucht in dieser Liste
das Element 0 nicht auf: Sonst p | x · y für ein y ∈ {1, . . . , p − 1}, aber p teilt
weder x (sonst x = 0) noch y (wg. 1 ≤ y ≤ p − 1), das ist ein Widerspruch
dazu, dass p prim ist.
Wenn x kein Inverses hat, so muss in der Liste dieser Elemente also mindestens ein Element mehrfach auftreten, also
x · i = x · i′
mit (obdA) i > i′ . Das liefert x · i − i′ = 0 mit 1 ≤ i − i′ ≤ p − 1. Also
würde doch 0 in der Liste auftreten, ein Widerspruch. Also sind alle Elemente
verschieden, und damit kommt auch 1 vor und es gibt zu x ein Inverses. Bemerkung 2.2.15 In Fp gilt
|1 + 1 +{z. . . + 1} = 0.
p mal
Das ist ein ganz anderes Verhalten, als wir das für Q, R (und C) kennen.
Bemerkung 2.2.16 Wir können das multiplikativ inverse Element von x
modulo p mit Hilfe des Euklidischen Algorithmus bestimmen. Dazu suchen
wir die Vielfachsummendarstellung des ggT von x und p. Wennn p eine Primzahl ist, so ist ggT(p, x) = 1 ür 1 ≤ x ≤ p − 1. Wir berechnen die Vielfachsummendarstellung des ggT, finden also eine Darstellung 1 = ap + bx. Dann
ist b offenbar das Inverse von x.
2.3
Lineare Gleichungssysteme: Definitionen
Sei K ein Körper. Wir untersuchen Gleichungssysteme der Form
α1,1 x1 + α1,2 x2 + . . . + α1,n xn = β1
α2,1 x1 + α2,2 x2 + . . . + α2,n xn = β2
......
......
...
αm,1 x1 + αm,2 x2 + . . . + αm,n xn = βm
33
(2.1)
wobei αi,j , βi ∈ K, i = 1, . . . , m, j = 1, . . . , n. Wir haben hier m Gleichungen und n Unbekannte. Wir suchen Lösungen mit xi ∈ K. Ein n-Tupel
(x1 , . . . , xn ), das dieses Gleichungssystem löst, heißt Lösung des Systems.
In der Regel gibt es viele Lösungen eines Systems. Die Menge aller Lösungen
nennen wir die Lösungsmenge.
Das Gleichungssystem heißt homogen, wenn β1 = β2 = . . . = βm = 0 gilt,
andernfalls inhomogen.
Beispiel 2.3.1 (1.) Jedes homogene Gleichungssystem hat mindestens eine
Lösung, nämlich x1 = x2 = . . . = xn = 0 (triviale Lösung).
(2.) Es gibt homogene Gleichungssysteme, die mehr als nur die triviale
Lösung haben. Das gilt insbesondere, wenn m < n ist (unterbestimmtes
System, Beweis später!).
(3.) Es gibt inhomogene Systeme, die unlösbar sind, solche mit genau einer
Lösung, und solche mit mehreren Lösungen. Selbst im Fall m < n kann es
passieren, dass es keine Lösungen gibt.
Unser Ziel ist es, das Gleichungssystem in ein “äquivalentes” System umzuformen, das dieselben Lösungen besitzt, aber einfacher zu lösen ist.
Seien γ1 , . . . , γm ∈ K. Dann erfüllt jede Lösung von (2.1) auch die Gleichung
(γ1 α1,1 + γ2 α2,1 + . . . + γm αm,1 )x1 +
+ (γ1 α1,2 + γ2 α2,2 + . . . + γm αm,2 )x2 +
. . . + . . . + (γ1 α1,n + γ2 α2,n + . . . + γm αm,n )xn =
= γ1 β1 + γ2 β2 + . . . + γm βm .
Wir nennen eine solche Gleichung eine Linearkombination der Gleichungen in
(2.1). Wenn wir aus einem Gleichungssystem (GLS1) ein neues Gleichungssystem (GLS2) bilden, in dem jede Gleichung eine Linearkombination der
Gleichungen aus (GLS1) ist, dann gilt:
(x1 , . . . , xn ) löst (GLS1)
⇒
(x1 , . . . , xn ) löst (GLS2)
Definition 2.3.2 Zwei Gleichungssysteme (GLS1) und (GLS2) heißen
äquivalent wenn jede Gleichung von (GLS1) eine Linearkombination der
Gleichungen aus (GLS2) ist und umgekehrt.
34
Satz 2.3.3 Äquivalente Gleichungssysteme haben dieselben Lösungsmengen.
Noch eine Definition:
Definition 2.3.4 (Matrix) Sei R ein Ring. Eine Abbildung A :
{1, . . . , m} × {1, . . . , n} → R heißt eine m × n-Matrix. Wenn A(i, j) = αi,j ,
dann schreiben wir eine Matrix meistens wie folgt:


α1,1 · · · α1,n
··· 
A =  ···
αm,1 · · · αm,n
Die Menge aller m × n-Matrizen wird mit R(m,n) bezeichnet. Eine Matrix
besteht aus m Zeilen und n Spalten.


β1
 β2 


b =  .. 
 . 
betam
ist eine m × 1-Matrix. Das Gleichungssystem (2.1) kürzen wir mit Ax = b
ab.
In den meisten Fällen betrachten wir Matrizen über Körpern, d.h. R ist ein
Körper. Die Menge der Matrizen ist dann entsprechend K(m,n) .
Besondere Matrizen sind die Einheitsmatrizen

1 0 0 ···
0 1 0 · · ·

In =  ..
.

0
0

.. 
.
0 0 0 ··· 1
in K(n,n) . Der Index wird weggelassen, wenn n aus dem Zusammenhang hervorgeht.
Die Nullmatrix 0m,n ist die m × n-Matrix, deren sämtlichen Einträge 0 sind.
Auch hier lassen wir den Index weg, wenn die Größe aus dem Zusammenhang
ersichtlich ist. Gilt m = n, so schreiben wir einfach 0n .
35
2.4
Elementare Zeilenumformungen
Gegeben sei eine m × n-Matrix A mit Einträgen aus K. Wir erlauben nun
für die Zeilen von A folgende Zeilenumformungen:
[E1]
Multiplikation der r-ten Zeile mit γ ∈ K, γ 6= 0.
[E2]
Addition des γ-fachen der s-ten Zeile zur r-ten Zeile (γ ∈ K, s 6= r).
[E3]
Vertauschen von Zeile r und s.
Diese Umformungen sind Abbildungen K(m,n) → K(m,n) , die wir auch wie
folgt beschreiben können:
zu [E1]
K(m,n)
→ K(m,n)
′
)
A = (αi,j ) 7→ A′ = (αi,j
Er (γ) :
wobei
(
αi,j
=
γ · αr,j
′
αi,j
wenn i 6= r
sonst
zu [E2]
K(m,n)
→ K(m,n)
′
A = (αi,j ) 7→ A′ = (αi,j
)
Es,r (γ) :
wobei
′
αi,j
=
(
αi,j
αr,j + γ · αs,j
wenn i 6= r
sonst
zu [E3]
Es,r :
wobei
′
αi,j
K(m,n)
→ K(m,n)
′
A = (αi,j ) 7→ A′ = (αi,j
)


αi,j
= αs,j


αr,j
wenn i 6= s, r
wenn i = r
wenn i = s
Satz 2.4.1 (1.) Er (γ −1 ) = Er (γ)−1 .
36
(2.) Es,r (−γ) = Es,r (γ)−1 .
(3.) Es,r = E−1
s,r ,
d.h. insbesondere, dass die oben definierten Abbildungen bijektiv sind.
Definition 2.4.2 Zwei Matrizen A und B heißen zeilenäquivalent wenn
B durch endlich viele elementare Zeilenumformungen aus A hervorgeht.
Satz 2.4.3 Zeilenäquivalenz ist eine Äquivalenzrelation.
Beweis Nicht ganz offensichtlich ist die Symmetrie. Die folgt aber aus Satz
2.4.1, weil elementare Zeilenumformungen durch ebensolche wieder rückgängig
gemacht werden können.
Satz 2.4.4 Sind A und B zeilenäquivalent, so sind die beiden homogenen
Gleichungssysteme Ax = 0 und Bx = 0 äquivalent.
Wir werden später sehen, dass auch die Umkehrung gilt.
Nun ist die Strategie zum Lösen linearer Gleichungssysteme klar: Man versucht, die Matrix A durch elementare Zeilenumformungen in eine “möglichst”
einfache Form zu bringen, die dann leicht lösbar ist.
37
Herunterladen