Lineare Algebra - Goethe

Lineare Algebra
KAPITEL 0
Einführung
Dieses Skript zur Vorlesung “Lineare Algebra” an der Goethe Universität Frankfurt
im Sommersemester 2011 befindet sich noch in der Entstehung und wird fortlaufend
aktualisiert.
Ich gehe davon aus, dass es noch einige Zeit dauern wird, bis die gröbsten Fehler
korrigiert sind. Korrekturvorschläge nehme ich gerne entgegen. Bitte teilen Sie mir
solche per Email oder persönlich nach der Vorlesung mit.
Folgende zwei Bücher dienten als Grundstruktur dieser Vorlesung. Ich kann den
Titel von Artin auch als weiterführende Lektüre empfehlen.
1 Michael Artin, Algebra, Birkhäuser Verlag, 1999.
2 Gerd Fischer, Lineare Algebra, Vieweg Verlag.
3
KAPITEL 1
Algebraische Grundlagen: Mengen, Gruppen,
Ringe, Körper
Bevor wir mit dem Studium linearer Abbildungen im Sinne der linearen Algebra
loslegen, müssen wir die nötigen Grundlagen erarbeiten. Dabei werden wir uns von
den Rechenoperationen wie Addition, Multiplikation im vertrauten Rahmen der
rationalen oder reellen Zahlen lösen müssen.
Ziel dieses Kapitels ist es algebraische Strukturen einzuführen, die Rechenoperationen wie Addition oder Multiplikation verallgemeinern. Die lineare Algebra wird
sich in diesem Kontext abspielen.
1. Mengen und Abbildungen
Entgegen vieler Versprechungen bezüglich der Rigorosität im Einführungskapitel,
werden wir den Begriff der Menge nicht definieren.
Für uns ist eine Menge eine “Ansammlung” von Objekten.
Dies ist keine mathematisch korrekte Definition. Wir müssen uns mit einer naiven
Vorstellung des Mengenbegriffs begnügen. Eine präzise Behandlung würde uns zu
weit vom eigentlichen Thema wegführen.
Einige der folgenden Mengen werden wir im Laufe der Vorlesung immer wieder
antreffen.
Beispiel.
(i) Die Menge der natürlichen Zahlen ist N = {1, 2, 3, . . . }, die der
ganzen Zahlen Z = {0, ±1, ±2, . . . }.
(ii) Die Menge der Primzahlen ist {2, 3, 5, . . . }.
(iii) Die leere Menge ∅ = {} enthält keine Elementen.
(iv) Die rationalen Zahlen sind Brüche von ganzen Zahlen. Ihre Gesamtheit
wird mit Q = {a/b; a, b ∈ Z und b 6= 0} bezeichnet.
(v) In der Analysisvorlesung spielt die Menge R der reellen Zahlen eine wichtige Rolle.
(vi) Es gibt auch exotischere Mengen, z.B. die Menge {{}} deren einziges Element die leere Menge ist. Eine alternative Schreibweise ist {∅}. Es ist
wichtig, die zwei Mengen {{}} =
6 {} nicht zu verwechseln.
Hat man zwei Mengen gegeben, so gibt es viele Möglichkeiten weitere daraus zu
gewinnen.
Definition. Seien M und N Mengen. Ihre Vereinigung ist M ∪ N = {m; m ∈
M oder m ∈ N } und ihr Schnitt ist M ∩ N = {m; m ∈ M und m ∈ N }. Wir
setzen auch M r N = {m ∈ M ; m 6∈ N }.
Beispiel.
(i) Es gilt {1, 2, 3} ∪ {a, b, c} = {b, a, 3, c, 2, 1}. (Bei Mengen spielt
die Reihenfolge der Elemente keine Rolle.)
5
6
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
(ii) Die positiven und negativen reellen Zahlen sind disjunkt, d.h. sie haben
kein gemeinsames Element. In Notationsschreibweise {x ∈ R; x > 0} ∩
{x ∈ R; x < 0} = ∅.
(iii) Es gilt {p ∈ N; p eine Primzahl} ∩ {n ∈ N; n is gerade} = {2}.
(iv) Ganz allgemein haben wir M ∪ ∅ = M und M ∩ ∅ = ∅ für jede Menge M .
Eine weitere wichtige Konstruktion ist die des Produkts zweier Mengen.
Definition. Seien M und N Mengen. Das kartesische Produkt M × N besteht aus
allen Paaren bestehend aus einem Element aus M und aus N . D.h., es gilt
M × N = {(m, n); m ∈ M und n ∈ N }.
Eine für die lineare Algebra wichtige Situation erhält man, wenn das Produkt aus
Kopien der reellen Zahlen nimmt.
Beispiel.
(i) Es gilt R × R = {(x, y); x, y ∈ R}. Also besteht jedes Element
von R × R aus zwei “Koordinaten”. Dies legt nahe, dass R × R als Ebene
betrachtet werden soll.
(ii) Jedes Element aus R × R × R hat drei “Koordinaten”. Und deshalb soll
man sich R × R × R als den dreidimensionalen Raum vorstellen.
(iii) Natürlich kann man jetzt beliebig lange weitergehen und R × R × R × R
usw. definieren. Unser Vorstellungsvermögen lässt uns nun im Stich, da
es uns schwer fällt, uns den vierdimensionalen Raum vorzustellen. Um die
Notation zu erleichtern schreiben wir
Rn
für
R × R × ··· × R
{z
}
|
n Faktoren
für n ∈ N. Ganz allgemein ist M n das n-fache kartesische Produkt
M × M × ··· × M .
{z
}
|
n Faktoren
Wir werden später den Begriff eines Vektorraums einführen. Der n-dimensionale
reelle Raum Rn ist ein klassisches Beispiel eines Vektorraums.
Die Mengen die wir oben gesehen haben, fallen in zwei Kategorien. Es gibt endliche
und unendliche Mengen. D.h. Mengen, die endlich viele oder unendlich viele Elemente enthalten. Wiederum werden wir den Begriff “endliche Menge” nicht präzise
definieren.
Definition. Ist M eine endliche Menge, so bezeichnet #M oder |M | die Anzahl
Elemente in M . Diese Anzahl heißt auch Kardinalität von M .
Mengen werden interessanter wenn man sie in Beziehung zu anderen Mengen bringen kann.
Definition. Seien M und N Mengen. Eine Abbildung f : M → N ordnet jedem
Element m ∈ M genau ein Element f (m) ∈ N zu. Die Menge M nennt man gerne
den Definitionsbereich von f und N heißt Wertebereich.
Dabei muss nicht jedes Element von N als Wert angenommen werden. Es ist nur
wichtig, dass jedes Element aus M ein Bildpunkt in N besitzt. Auch erlaubt ist
es, dass f mehrere (oder sogar alle) Elemente von M auf dasselbe Element in N
abbildet.
1. MENGEN UND ABBILDUNGEN
7
Beispiel.
(i) Sei V die Menge aller Vorlesungen an der Goethe Universität.
Dann gibt es eine Abbildung f : V → N die jeder Vorlesung die vorgesehene Anzahl Kreditpunkte zuordnet. Z.B. gilt f (lineare Algebra) = 9.
(ii) Die Abbildung f (x) = 1/x kann nicht Definitionsbereich R haben, denn
Division durch Null ist nicht erlaubt. Der größtmögliche Definitionsbereich
ist R r {0}.
Definition. Sei f : M → N eine Abbildung zwischen Mengen M und N . Dann
heißt f surjektiv falls jedes Element von N Bildpunkt ist, d.h. für jedes n ∈ N gibt
es (mindestens) ein m ∈ M mit f (m) = n. Die Abbildung f heißt injektiv falls
f (m) = f (m0 ) → m = m0 .
Eine surjektive und injektive Abbildung heißt bijektiv.
Bemerkung. Eine bijektive Abbildung f : M → N lässt sich invertieren. Für
jedes
genau ein m ∈ M
n∈N
gibt es
| {z }
| {z }
da f surjektiv
da f injektiv
mit f (m) = n. Die Zuordnung n 7→ m definiert die sogenannte Umkehr- oder
Inverseabbildung f −1 : N → M .
Je zwei Abbildungen f : M → N und g : N → P lassen sich verknüpfen zu einer
Abbildung g ◦ f : N → P :
f
G
M → N → P.
Konkret setzt man (g ◦ f )(m) = g(f (m)) für jedes m ∈ M . Dabei muss der Wertebereich von f gleich dem Definitionsbereich von g sein. Ansonsten können man g
nicht bei f (m) auswerten.
Achtung. Verknüpfungen “liest” man von rechts nach links. In der Notation oben,
also bei g ◦ f wird zuerst f und dann g angewendet.
Beispiel. Ist f : M → N bijektiv und f −1 : N → M die Umkehrabbildung, so ist
(f −1 ◦ f )(m) = m für m ∈ M und (f ◦ f −1 )(n) = n für n ∈ N .
Definition. Die “triviale” Selbstabbildungen f : M → M , die durch f (m) = m
definiert ist, heißt Identitätsabbildung. Sie wird mit 1M , idM , id oder sogar nur 1
bezeichnet.
Zwischen zwei Mengen M und N kann es “sehr viele” Abbildungen geben. Ihr
Gesamtheit ist selber eine Menge
Abb(M, N ) = {f ; f : M → N ist eine Abbildung}.
Beispiel.
(i) Die Menge Abb(R, R) wird man als Mathematiker wahrscheinlich nie direkt benutzen. Diese Menge ist zu unüberschaubar. Es fehlt hier
zusätzliche Struktur die wirklich interessante Abbildungen heraus filtert.
Stattdessen gibt es zu viele “wilde” Abbildungen R → R.
(ii) Es gibt keine Abbildung mit Definitionsbereich N und Wertebereich {}.
Um dies einzusehen, überlege man sich welchen Bildpunkt das Element
1 ∈ N haben würde, falls eine derartige Abbildung existieren würde.
(iii) Überlegen sie sich, ob eine Abbildung ∅ → ∅ existiert oder nicht!
8
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
(iv) Sind M und N zwei endliche Mengen und f : M → N eine bijektive
Abbildung, so gilt #M = #N .
Sind M und N unendliche Mengen, so können kuriose Dinge passieren.
Die Abbildung
f : N = {1, 2, 3, . . . } → {2, 4, 6, . . . }
gegeben durch
f (n) = 2n
ist bijektiv obwohl N auf den ersten Blick gesehen doppelt so viele Elemente enthält wie wie {2, 4, 6, . . .}. Noch kurioser ist die Tatsache, dass
es sogar ein bijektive Abbildung N → N2 gibt. Rein als Menge lässt sich
N nicht von N2 unterscheiden!
Mengen bilden die Grundlage der ganzen Mathematik. Im Prinzip ist jedes Objekt,
welches wir untersuchen werden, eine Menge. Diese wird jedoch meistens zusätzliche
Struktur verschlüsseln.
Die erste “Struktur”, die wir behandeln werden, ist die Gruppenstruktur.
2. Gruppen
Bislang haben wir Z = {0, ±1, ±2, . . . } als reine Menge behandelt. Dabei haben
wir einen wichtigen Aspekt vergessen:
(1.1)
Zwei ganze Zahlen a, b ∈ Z lassen sich zu einer ganzen Zahl a + b summieren.
Diese einfache Tatsache wird vom Mengenbegriff nicht berücksichtigt.
Schauen wir (1.1) nüchtern aus der Perspektive der Mengenlehre an, so fällt auf,
dass die Addition eigentlich eine Abbildung ist:
m : Z × Z → Z definiert durch
m(a, b) = a + b.
Man nennt m auch die Verknüpfungsabbildung.
Diese ist keineswegs beliebig, sie besitzt viele Eigenschaften, die man formal beschreiben kann und im Gruppenbegriff elegant verpackt wird. Schauen wir nun
einige der Eigenschaften an.
Seien a und b in Z.
(N) Es gilt m(a, 0) = a + 0 = a und m(0, b) = 0 + b = b (Neutrales Element).
(K) Es gilt m(a, b) = a + b = b + a = m(b, a) (Kommutativität).
(I) Es gilt m(−a, a) = (−a) + a = 0 (Inverses).
Diese dritte Eigenschaft legt nahe, eine weitere Abbildung einzuführen. Wir setzen
i : Z → Z wobei i(a) = −a.
Mit dieser Notation sagt uns (iii) nichts anderes als
m(i(a), a) = 0.
Es gibt eine vierte Eigenschaft, die man vielleicht leicht übersieht.
(A) Für a, b, c ∈ Z gilt m(m(a, b), c) = (a + b) + c = a + (b + c) = m(a, m(b, c))
(Assoziativität).
Würde man nur mit den ganzen Zahlen arbeiten, so würde es sich nicht lohnen,
die Abbildungen m und i einzuführen. Wir können die Addition bzw. Inversion mit
denen aus der Schule bekannten Symbole + und − ebenso gut beschreiben. Die
vier Eigenschaften oben bilden jedoch die Schablone für den Begriff der abelschen
Gruppe.
2. GRUPPEN
9
Definition. Eine Gruppe besteht aus einem Tupel (G, m, e, i). Hier ist G eine
Menge, m : G×G → G eine Abbildung, e ∈ G ist ein Element und i : G → G ist eine
Abbildung. Diese erfüllen folgende Eigenschaften (auch Gruppenaxiome genannt).
(A) Für alle a, b, c ∈ G gilt m(m(a, b), c) = m(a, m(b, c)).
(N) Für alle a ∈ G gilt m(e, a) = a.
(I) Für alle a ∈ G gilt m(i(a), a) = e.
Die Abbildung m heißt Verknüpfungsabbildung der Gruppe, e heißt neutrales Element der Gruppe und i heißt Inversionsabbildung der Gruppe.
Gilt zusätzlich
(K) Für alle a, b ∈ G gilt m(a, b) = m(b, a).
so nennt man G kommutativ oder abelsch.
Bemerkung.
(i) Die Kommutativität wird nicht ausdrücklich als Gruppenaxiom verlangt. Diese schließt zu viele interessante Beispiele aus.
(ii) In unserem Beispiel der ganzen Zahlen war das neutrale Element e = 0 ∈
Z.
(iii) Die Symbole m und i in der Definition sind schwerfällig. Oft nutzt man
a ·G b
oder a +G b oder ab
oder a + b
für die Verknüpfungsabbildung. Die Symbole +G und + sind für abelsche
Gruppen reserviert; die Schreibweise a ·G b oder ab kommt jedoch auch bei
nicht abelschen Gruppen vor. Ist die Notation “multiplikativ” (d.h. wird
ab für die Verknüpfung verwendet), so schreiben wir a−1 anstelle von i(a)
und 1 anstatt e. Ist die Notation “additiv”, so schreiben wir −a für i(a)
und 0 für e.
(iv) In der Praxis erwähnt man oft nur die Menge G des Tupels (G, m, e, i).
D.h. es wird meistens von einer Gruppe G die Rede sein, wobei implizit
klar ist, wie die Verknüpfung, das neutrale Element und die Inversionsabbildung zu verstehen sind.
Wir haben schon ein Beispiel einer Gruppe gesehen. Es gibt aber weitere Gruppen,
die wir zumindest implizit kennen.
Beispiel.
(i) Die Gruppe der rationalen Zahlen mit der Addition.
(ii) Die Gruppe der rationalen Zahlen ungleich Null mit Multiplikation (Q r
{0}, m, 1, i). Hier gilt m(a, b) = ab für zwei rationale Zahlen a, b ∈ Qr{0}.
Die Inverseabbildung ist i(a) = 1/a für a ∈ Qr{0}. Natürlich darf die Null
nicht in der Gruppe enthalten sein. Denn wäre a ein Inverses bezüglich
der Multiplikation von 0, so hätten wir 1 = a0 = 0 was natürlich absurd
ist. Man darf nicht durch Null dividieren!
(iii) Sei M eine beliebige Menge. Wir können aus M wie folgt eine Gruppe
gewinnen. Die Elemente dieser Gruppe sind bijektive Selbstabbildungen
von M . D.h.
SM = {f : M → M ; f ist bijektiv}.
Die Verknüpfung unserer Gruppe wird die Verknüpfung von Abbildungen
sein:
m(f, g) = f ◦ g
für f, g ∈ SM .
10
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
Das neutrale Element ist die Identitätsabbildung 1M : M → M und die
Inversionsabbildung ist
i(f ) = f −1
wobei f −1 die Inverseabbildung von f ist. Diese existiert, da f bijektiv
ist. Behauptung: Das Tupel (SM , m, 1M , i) ist eine Gruppe.
Beweis: Wir müssen die Axiome (A), (N) und (I) nachweisen. Falls f
und g bijektive Selbstabbildungen von M sind, so ist auch f ◦ g eine
Selbstabbildung von M . Diese Verknüpfung ist auch bijektiv. Somit ist
f ◦ g ∈ SM und m : SM × SM → SM ist eine wohldefinierte Abbildung.
Falls f, g, h ∈ SM und m ∈ M so gilt
((f ◦ g) ◦ h)(m) = (f ◦ g)(h(m)) = f (g(h(m))) = f ((g ◦ h)(m)) = (f ◦ (g ◦ h))(m).
Da dies für jedes m ∈ M gilt, haben wir (f ◦ g) ◦ h = f ◦ (g ◦ h). Somit ist
das Axiom (A) gezeigt.
Es gilt 1M ◦ f = f da 1M die Identitätsabbildung ist. Daraus folgt Axiom
(N).
Schließlich haben wir f −1 ◦ f = 1M da f −1 die Umkehrabbildung von f
ist. Wir folgern das Axiom (I) und somit ist (SM , m, 1M , i) eine Gruppe.
Die Gruppe SM heißt die symmetrische Gruppe. Sie ist nur dann abelsch,
wenn #M ≤ 2.
(iv) Die triviale Gruppe ist die simpelste Gruppe, die man sich vorstellen kann.
Sie besteht aus nur einem Element G = {e}. Dadurch sind Verknüpfungsund die Inversionsabbildungen durch m(e, e) = e bzw. i(e) = e festgelegt.
Natürlich muss auch e das neutrale Element sein. Man überprüft alle
Axiome leicht nach. Die triviale Gruppe ist sogar eine abelsche Gruppe.
(v) Es gibt auch eine Gruppe mit zwei Elementen. Wir setzen G = {e, x}
wobei x 6= e. Die Verknüpfungsabbildung wird in folgender Tabelle beschrieben
e x
e
e x
x
x e
Die Inversionsabbildung ist durch i(e) = e und i(x) = x festgelegt und
das neutrale Element ist e. Um zu zeigen, dass (G, m, e, i) eine Gruppe ist
muss man alle Axiome nachrechnen. Dies wird eine Übungsaufgabe sein.
Eine Gruppe (G, m, e, i) mit G = {g1 , . . . , gn } endlich lässt sich mittels der Verknüpfungstabelle untersuchen:
g1
..
.
g1
m(g1 , g1 )
..
.
···
···
gn
m(g1 , gn )
..
.
gn
m(gn , g1 ) · · ·
m(gn , gn )
Diese Tabelle unterliegt Symmetriebedingungen, die sich aus den Axiomen ergeben.
Ist z.B. g1 = e das neutrale Element der Gruppe, so ist die erste Spalte gleich
g1 , . . . , gn . Eine abelsche Gruppe ergibt eine Verknüpfungstabelle, die symmetrisch
bezüglich der Diagonale von oben links nach unten rechts ist.
Kommen wir nun zum ersten Lemma.
Lemma 1.1. Sei (G, m, e, i) eine Gruppe.
2. GRUPPEN
11
(i) Für alle a ∈ G gilt m(a, i(a)) = e, i(i(a)) = a und m(a, e) = e.
(ii) Sei e0 ∈ G mit m(e0 , a) = a für alle a ∈ G. Dann ist e0 = e. (Das neutrale
Element ist eindeutig.)
(iii) Seien a, a0 ∈ G mit m(a0 , a) = e. Dann ist a0 = i(a). (Die Inversionsabbildung ist eindeutig.)
(iv) Seien a, b, c ∈ G mit m(a, b) = m(a, c), dann gilt b = c. Haben wir
m(b, a) = m(c, a), so gilt ebenfalls b = c. (Man darf kürzen.)
Beweis. Der Beweis von (i) ist eine trickreiche Rechnung. Wir nutzen die
Abkürzung ab für m(a, b) und a−1 = i(a). Zur Vereinfachung der Notation in diesem
Beweis, setzen wir ã = i(i(a)) = (a−1 )−1 . Gemäß Definition gilt ãa−1 = e. Wir
haben
(N )
(A)
s.o.
(I)
(N )
(I)
aa−1 = e(aa−1 ) = (ãa−1 )(aa−1 ) = ã((a−1 a)a−1 ) = ã(ea−1 ) = ãa−1 = e.
Es folgt also die erste Behauptung in (i).
Die zweite Behauptung ist eine Übungsaufgabe.
Die dritte Behauptung ergibt sich aus
(I)
(A)
s.o.
(N )
ae = a(a−1 a) = (aa−1 )a = ea = a.
Nun beweisen wir Teil (ii). Sei also e0 ein alternatives neutrales Element: d.h. e0 a = a
für alle a ∈ G. Wir setzen a = e und erhalten e0 e = e. Aus der dritten Behauptung
von (i) folgt aber e0 e = e0 und somit e0 = e.
Nun kommt der letzte Teil. Seien a, a0 ∈ G mit a0 a = e. Wir erhalten
(N )
(A)
(i)
(N )
a−1 = ea−1 = (a0 a)a−1 = a0 (aa−1 ) = a0 e = a0
und somit ist Teil (iii) erledigt.
Die erste Situation in Teil (iv) impliziert ab = ac. Wir erhalten also a−1 (ab) =
a−1 (ac). Nutzt man nun auf beiden Seiten (A), so erhält man (a−1 a)b = (a−1 a)c.
Das Gruppenaxiom (I) impliziert a−1 a = e und (N) ergibt eb = b und ec = c. Wir
erhalten b = c.
Die zweite Situation in (iv) ist ba = ca. Nun haben wir (ba)a−1 = (ca)a−1 . Wir argumentieren wie in der ersten Situation, nutzen aber Teil (i) diese Lemmas anstelle
von (I) um b = c zu folgern.
Der Beweis des Lemmas wäre für abelsche Gruppen viel einfacher gewesen.
Bemerkung. Aus (ii) und (iii) des vorherigen Lemmas folgt, dass die Verknüpfungsabbildung
m : G × G → G einer Gruppe das neutrale Element und die Inverseabbildung
festlegt. Insbesondere wird eine endliche Gruppe durch ihre Verknüpfungstabelle
eindeutig festgelegt.
Für eine feste Tabellengrösse n gibt es nur endlich viele Möglichkeiten, die Tabelle
mit Elementen aus G zu füllen. Natürlich ist nicht jede beliebige Tabelle bestehend
aus Elementen von G die Verknüpfungstabelle einer Gruppe. Auf jeden Fall gibt
es zu festem n nur endlich viele “verschiedene” Gruppen der Kardinalität n. Für
größere n kann die genaue Anzahl durchaus schwierig zu bestimmen sein.
12
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
n
1
2
3
4
5
6
7
8
..
.
16
..
.
256
..
.
2011
..
.
Anzahl “verschiedener” Gruppen mit Kardinalität n
1 (die triviale Gruppe)
1 (Gruppe aus Bsp. (v))
1
2
1
2
1
5
..
.
14
..
.
56092
..
.
1
..
.
Dieses unregelmäßige Verhalten steht im Kontrast zur Einfachheit des Gruppenbegriffs.
ähnlich wie bei Mengen, können Gruppen mittels Abbildungen verglichen werden.
Definition. Seien (G, . . .) und (H, . . .) Gruppen mit Verknüpfungen ·G und ·H .
Eine Abbildung f : G → H heißt Gruppenhomomorphismus (oder kurz Homomorphismus) falls
f (g1 ·G g2 ) = f (g1 ) ·H f (g2 )
für alle g1 , g2 ∈ G. Ist f bijektiv, so nennt man g einen Gruppenisomorphismus
(oder kurz Isomorphismus).
Beispiel.
(i) Seien G und H die Gruppe der ganzen Zahlen mit der Addition.
Falls n ∈ Z so erfüllt die Abbildung f : Z → Z gegeben durch f (a) = na
die Gleichung
f (a + b) = n(a + b) = na + nb = f (a) + f (b)
für alle a, b ∈ Z. Also ist f ein Gruppenhomomorphismus.
(ii) Sei nun G wie in Beispiel (i) und H die Gruppe Q r {0} mit der Multiplikation. Wir definieren f (a) = 2a für a ∈ Z. Dann ist f ein Gruppenhomomorphismus weil f (a + b) = 2a+b = 2a 2b = f (a)f (b) für alle
a, b ∈ Q r {0}.
Wir bestimmen erste Eigenschaften eines Gruppenhomomorphismus.
Lemma 1.2. Seien G und H Gruppen mit Verknüpfungen ·G und ·H und neutrale
Elemente eG und eH . Sei f : G → H ein Gruppenhomomorphismus.
(i) Es gilt f (eG ) = eH und f (a−1 ) = f (a)−1 für alle a ∈ G.
(ii) Seien
a1 , a2 ∈ {a ∈ G; f (a) = eH } = f −1 (eH ),
dann ist a1 ·G a2 ∈ f −1 (eH )
2. GRUPPEN
13
Beweis. Wegen Axiom (N) gilt eG ·G eG = eG . Also
eH ·H f (eG ) = f (eG ) = f (eG ·G eG ) = f (eG ) ·H f (eG ).
Wir berufen uns auf Teil (iv) des vorherigen Lemmas um f (eG ) zu kürzen. Daraus
ergibt sich eH = f (eG ) und die erste Hälfte von Teil (i) folgt.
Die zweite Hälfte ergibt sich aus
f (a−1 ) ·H f (a) = f (a−1 ·G a) = f (eG ) = eH .
und Teil (iii) von Lemma 1.1.
Teil (ii) ist wiederum ein Spiel mit den Axiomen. Denn a1 und a2 erfüllen f (a1 ) =
eH und f (a2 ) = eH . Deren Produkt liefert
eH = eH ·H eH = f (a1 ) ·H f (a2 ) = f (a1 ·G a2 ).
Definition. Die Menge f −1 (eH ) aus dem letzten Lemma heißt Kern von f . Schreibweise: ker f .
Der Kern eines Gruppenhomomorphismus enthält das neutrale Element der Gruppe
und ist abgeschlossen unter der Verknüpfung- und der Inversionsabbildung. Die
Elemente des Kerns bilden also wieder eine Gruppe wobei die Verknüpfung und
Inversion von der umliegenden Gruppe G geerbt wird.
Beispiel. Seien G, H und f wie in Teil (i) des letzten Beispiels. Also gilt f (a) = na
für alle a ∈ Z. Falls n = 0 so ist f konstant 0. In anderen Worten, ker f = Z. Falls
n 6= 0 so haben wir
a ∈ ker f ⇔ na = 0 ⇔ a = 0.
Also gilt ker f = {0}.
Definition. Sei (G, . . .) eine Gruppe mit neutralem Element e in multiplikativer
Schreibweise. Eine Untergruppe ist eine Teilmenge H ⊂ G die folgende Eigenschaften erfüllt.
(i) Es gilt e ∈ H.
(ii) Für alle a, b ∈ H gilt ab ∈ H.
(iii) Für alle a ∈ H gilt a−1 ∈ H.
Beispiel.
(i) Sicher ist 0 ∈ Z durch zwei teilbar. Weiterhin ist die Summe
zweier geraden Zahlen wieder gerade und falls a durch zwei teilbar ist,
so ist auch −a durch zwei teilbar. Also bildet die Menge der durch zwei
teilbaren Zahlen {a ∈ Z; a gerade} eine Untergruppe von Z.
(ii) Ein beliebige Gruppe (G, m, e, i) besitzt immer {e} als Untergruppe. Zu
dem ist G selbst eine Untergruppe. Beide Behauptungen folgen direkt aus
den Definitionen. Diese Untergruppen nennt man die trivialen Untergruppen.
Bemerkung.
(i) Eine Untergruppe H einer Gruppe G definiert, zusammen
mit der geerbten Verknüpfung, dem neutralen Element und der Inversion,
selbst eine Gruppe. Der Beweis dafür folgt leicht: die Verknüpfung zweier
Elemente aus H liegt in H wegen Eigenschaft (ii). Die Verknüpfungsabbildung
erfüllt (A), weil G eine Gruppe ist. Weiterhin ist auch (N) erfüllt, weil es
auf G gilt. Schließlich gilt auch (I), denn i(h) ∈ H für jedes h ∈ H.
14
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
(iii) Der Kern jedes Gruppenhomomorphismus ist eine Untergruppe. Dies folgt
aus Lemma 1.2.
Wir haben schon ein genügend großes Vokabular zur Behandlung von Gruppen in
der linearen Algebra.
Es folgt nun ein kleiner Abschnitt, der verdeutlichen soll, dass der Gruppenbegriff zwar elementar, aber sehr facettenreich ist. Heute ist das Studium endlicher
Gruppen ein aktuelles Forschungsgebiet.
Wir erwähnen das grundlegende Resultat von Feit-Thompson über endliche Gruppen ungerader Kardinalität, oder Ordnung, wie man bei Gruppen zu sagen pflegt.
Satz (Feit-Thompson 1963). Sei G eine endliche Gruppe ungerader Ordnung. Dann
ist G “auflösbar”.
Der Begriff der Auflösbarkeit von Gruppen wird vielleicht in einer späteren Vorlesung aufgegriffen. Grob gesagt bedeutet “auflösbar”, dass es genügend viele Untergruppen von besonders simpler Struktur gibt. Diese können Aufschluss über die
Struktur der ganzen Gruppe liefern.
Wir werden den Satz nicht beweisen; der Beweis ist 250 Seiten lang.
Wir haben oben gesehen, dass jeder Kern eines Gruppenhomomorphismus eine
Untergruppe liefert. Nun kann man sich fragen, ob umgekehrt jede Untergruppe
einer Gruppe als Kern eines Gruppenhomomorphismus auftaucht. Man kann sich
davon überzeugen, dass die trivialen Untergruppen, d.h. die ganze Gruppe und
{e}, als Kern auftauchen. Im Allgemeinen muss eine Untergruppe einer Gruppe
jedoch kein Kern eines Gruppenhomomorphismus sein. Es gibt sogar nicht-triviale
Gruppen, bei denen jede nicht-triviale Untergruppe kein Kern ist. Solche Gruppen
nennt man einfach. Sie bilden wichtige Bausteine in der Gruppentheorie.
Die Klassifikation aller endlichen einfachen Gruppen war für lange Zeit ein wichtiges
Problem.
Satz (Klassifikationssatz für endliche einfache Gruppen ca. 2006). Sei G eine endliche einfache Gruppe. Dann ist G in einer von 18 Familien enthalten oder G ist
eine der 26 sporadischen endlichen einfachen Gruppen.
Beweis. 10.000 Seiten.
Die größte sporadische Gruppe heißt Monstergruppe und wird üblicherweise mit
M bezeichnet. Ihre Existenz wurde in 1983 von Griess bewiesen, nachdem sie von
Bernd Fischer (Ph.D. Uni Frankfurt) in der Dekade zuvor vermutet wurde. Ihre
Ordnung ist
#M = 246 · 320 · 59 · 76 · 112 · 133 · 17 · 19 · 23 · 29 · 31 · 41 · 47 · 59 · 71.
3. Ringe und Körper
Im letzten Abschnitt haben wir die Menge Z mit zusätzlicher Struktur einer Gruppe
versehen.
Wir haben dabei schon wieder etwas vernachlässigt. Wir können zwei Elemente
in Z auch miteinander multiplizieren und erhalten ein neues Element in Z. Diese
Verknüpfung definiert jedoch keine Gruppe, denn das multiplikative Inverse zu 2
ist 1/2 und liegt außerhalb von Z. Der Ringbegriff berücksichtigt dieses Phänomen
3. RINGE UND KÖRPER
15
und auch die Tatsache, dass die Addition und Multiplikation in Z durch das Distributivgesetz verbunden sind:
(1.2)
a · (b + c) = a · b + a · c für a, b, c ∈ Z.
In der Definition eines Rings tauchen nun zwei Operationen auf. Die eine entspricht
der Addition in Z und die andere der Multiplikation.
Nun kommen wir zur formalen Definition eines Rings.
Definition. Ein Ring ist ein Tupel (R, s, 0, i, m, 1) bestehend aus einer Menge R,
einer Abbildung s : R × R → R genannt Addition, einem Element 0 ∈ R genannt
Null, einer Abbildung i : R → R, einer Abbildung m : R × R → R genannt Multiplikation und einem Element 1 ∈ R genannt Eins mit folgenden Eigenschaften.
(i) Das Quadrupel (R, s, 0, i) ist eine abelsche Gruppe.
(ii) (Assoziativität der Multiplikation.) Es gilt
m(m(a, b), c) = m(a, m(b, c))
a, b, c ∈ R.
für alle
(iii) (Neutrales Element der Multiplikation.) Es gilt
m(1, a) = m(a, 1) = a
für alle
a ∈ R.
(iv) (Distributivgesetz) Es gilt
m(a, s(b, c)) = s(m(a, b), m(a, c))
und
m(s(b, c), a) = s(m(b, a), m(b, c))
für alle a, b, c ∈ R.
Man nennt den Ring kommutativ, falls die nachfolgende Eigenschaft gilt.
(v) (Kommutativgesetz) Es gilt
m(a, b) = m(b, a)
für alle
a, b ∈ R.
Spätestens jetzt wird die Notation wegen den zwei Operationen s (die Summation) und m (die Multiplikation) schwerfällig. Deshalb werden wir ab jetzt fast
ausschließlich mit der für uns natürlichen Notation schreiben. Konkret schreiben
wir
a · b oder ab anstatt m(a, b)
und
a + b anstatt s(a, b)
für a und b Elemente eines Rings. Es ist auch sehr praktisch
−a anstatt i(a)
für das additive Inverse von a zu schreiben. Weiterhin setzen wir
a + (−b) = a − b.
Dabei gilt wie üblich die Konvention “Punkt vor Strich”.
In dieser praktischen Notation ist das Distributivgesetz nichts anderes als
a · (b + c) = a · b + a · c und
(b + c) · a = b · a + c · a.
Aus diesem Grund wird vorsorglich das neutrale Element bezüglich + mit der 0
und das neutrale Element bezüglich · mit der 1 bezeichnet.
Dennoch sollte man sich im Klaren sein, dass + oder · je nach Situation, nichts mit
der aus der Schule bekannten Operationen gemeinsam haben.
Um die Notation weiter zu vereinfachen, werden wir oft, wie bei den Gruppen, einen
Ring mit der Menge R identifizieren. D.h. steht irgendwo “Sei R ein Ring . . . ”, so
16
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
meinem wir damit immer ein Tupel wie in der Definition und sparen uns die fünf
fehlende Symbole s, 0, i, m, 1.
Achtung. Die Definition eines Rings ist nicht ganz ohne Kontroversen. So ist in
manchen Quellen die Kommutativität der Multiplikation Bestandteil der Definition
eines Rings. Andere Quellen verlangen nicht unbedingt die Existenz eines neutralen
Elements bezüglich der Multiplikation.
Auch wir werden uns hauptsächlich mit kommutativen Ringen beschäftigen. Ringe,
die mittels Matrizenmultiplikation definiert werden, werden jedoch im Allgemeinen
nicht kommutativ sein.
Beispiel.
(i) Wir kennen implizit schon viele kommutative Ringe, wie Z, Q
und R mit den klassischen Operationen.
(ii) Wie immer gibt es ein pathologisches Beispiel: der Nullring. Die zugrunde
liegende Menge ist R = {0}. Es gibt nur eine Wahl für eine Abbildung R×
R → R und für eine Abbildung R → R. Und man überprüft leicht nach,
dass diese sowohl die Eigenschaften der Addition und der Multiplikation
erfüllen. Folglich ist der Nullring ein Ring und sogar ein kommutativer
Ring. Beachte, dass 1 = 0 im Nullring gilt! Der Nullring ist der einzige
Ring, in welchem 1 = 0 gilt. Diese Aussage werden wir in Kürze beweisen.
(iii) Sei R ein Ring und sei X zunächst ein Symbol. Wir können den Ring
R[X] der Polynome über R wie folgt definieren. Die Elemente von R[X]
sind Polynome in einer Variable X und Koeffizienten in R. In anderen
Worten, die Elemente von R[X] sind von der Form
an X n + an−1 X n−1 + · · · + a1 X + a0 =
n
X
ak X k
k=0
wobei n ∈ N ∪ {0} und
n ∈ R. Die Addition auf R[X] ist wie
Pn a0 , . . . , aP
m
folgt definiert. Seien k=0 ak X k , k=0 bk X k ∈ R[X]. Man setzt
!
! max{m,n}
n
m
X
X
X
ak X k +
bk X k =
(ak + bk )X k
k=0
k=0
k=0
wobei ak = 0 für k > n und bk = 0 für k > m gesetzt wird. Nun müssen
wir auch eine Multiplikationsabbildung definieren. Dies geschieht wie folgt.
Wir setzen
!
! n+m k
!
n
m
X
X
X X
k
k
ak X
·
bk X
=
al bk−l X k
k=0
k=0
k=0
l=0
Das neutrale Element der Addition von R[X] definieren wir als 0 ∈ R und
das der Multiplikation als 1 ∈ R.
Es wird eine Übungsaufgabe sein nachzuprüfen, dass R[X] zusammen
mit diesen Operationen einen Ring definiert. Falls R kommutativ ist, so
wird R[X] kommutativ sein.
Falls A = an X n + · · · + a1 X + a0 ∈ R[X] mit an 6= 0 so definieren wir
den Grad des Polynoms A als
deg P = n ≥ 0.
Beachten Sie, dass wir den Grad des Polynoms 0 ∈ R[X] nicht definiert
haben.
3. RINGE UND KÖRPER
17
Wir halten nun einige formale Konsequenzen der Ringaxiome fest. Dabei wird man
einige bekannte Rechenregeln wiedererkennen.
Lemma 1.3. Sei R ein Ring und a ∈ R.
(i) Es gilt 0 · a = a · 0 = 0.
(ii) Gemäß Definition ist das additive Inverse von a gleich −a. Es gilt −a =
(−1) · a = a · (−1) und (−1) · (−1) = 1.
Beweis. Distributivität ergibt 0 · a = (0 + 0) · a = 0 · a + 0 · a. Addiert man
nun −0 · a zu dieser Gleichung, so erhält man 0 = 0 · a. Der Beweis für a · 0 = 0 ist
völlig analog. Daraus ergibt sich Teil (i).
Gemäß Definition und Teil (i) haben wir ((−1) + 1) · a = 0 · a = 0. Wenden wir
Distributivität an, so folgt 0 = (−1)·a+1·a = (−1)·a+a. Wegen Lemma 1.1(iii) ist
das additive Inverse in einer Gruppe eindeutig bestimmt. Daraus folgt −a = (−1)·a
und −a = a · (−1) lässt sich analog zeigen.
Wir müssen noch (−1) · (−1) = 1 zeigen. Aus Teil (i) und Distributivität folgt
0 = 0 · 0 = ((−1) + 1) · ((−1) + 1) = (−1) · (−1) + (−1) · 1 + 1 · (−1) + 1 · 1.
Da 1 das neutrale Element bezüglich Multiplikation ist, haben wir 0 = (−1)·(−1)+
(−1) + (−1) + 1 = (−1) · (−1) + (−1). Also muss (−1) · (−1) = 1 gelten.
Bemerkung. Jeder Ring R ist mit einer Multiplikationsabbildung ausgestattet.
Diese definiert jedoch fast nie eine Gruppenstruktur auf R. Nehmen wir mal an,
dass sie es doch tut. Dann besitzt 0 ein multiplikatives inverses x, so muss 0 · x = 1
gelten. Teil (i) des letzten Lemmas impliziert dann 0 = 1. Jedes a ∈ R ist von der
Form a = 1 · a = 0 · a = 0. Also ist R der Nullring.
Wir halten fest: ist R nicht der Nullring so definiert die Multiplikation keine Gruppenstruktur mit neutralem Element 1.
Wenn wir das Nullelement 0 vernachlässigen, dann gibt es viele Ringe bei denen
die Multiplikation eine Gruppe definiert. Diese nennt man Körper und sie haben in
der linearen Algebra eine besondere Bedeutung.
Definition. Ein kommutativer Ring (K, s, 0, i, m, 1) nennt man einen Körper, falls
folgende Eigenschaft erfüllt ist.
(vi) Wir haben 0 6= 1 und für jedes a ∈ K r {0} gibt es ein a0 ∈ K mit a0 a = 1.
Lemma 1.4. Sei K ein Körper.
(i) Sind a, b ∈ K mit
ab = 0
so gilt
a=0
oder
b = 0.
(ii) Die Menge K r {0} zusammen mit der Multiplikation, dem Element 1 ∈
K r{0}, und der Abbildung i(a) = a0 implizit in (vi) oben ist eine abelsche
Gruppe.
Beweis. Seien a, b ∈ K mit ab = 0. Wir möchten a = 0 oder b = 0 beweisen.
Wir können also a 6= 0 annehmen, ansonsten ist die Aussage schon bewiesen. Axiom
(iv) in der Definition eines Körper impliziert, dass es ein a0 ∈ K gibt mit a0 a = 1.
Aus Lemma 1.3(i) erhalten wir
0 = a0 0 = a0 (ab) = (a0 a)b = 1b = b.
Hieraus folgt Teil (i).
18
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
Teil (i) lässt sich wie folgt umformulieren: falls a, b ∈ K mit a 6= 0 und b 6= 0, so gilt
ab 6= 0. Also nimmt die Multiplikationsabbildung m(a, b) = ab Werte in K r {0}
an, falls a, b ∈ K r {0}. Sie definiert also eine Abbildung
(K r {0}) × (K r {0}) → K r {0}.
Gemäß Definition von K gilt 0 6= 1, also liegt 1 ∈ K r {0}.
Für a ∈ K r {0} gibt es ein a0 ∈ K mit a0 a = 1. Wir definieren eine Abbildung
i : K r {0} → K durch i(a) = a0 . Wir halten aber fest, dass i(a) 6= 0 gelten muss,
den andererseits wäre 1 = i(a)a = 0a = 0 wegen Lemma 1.3(i). Also ist i eine
Abbildung K r {0} → K r {0}.
Um Teil (ii) zu beweisen, müssen wir zeigen, dass es bei K r {0} mit den soeben
beschrieben Abbildungen eine Gruppe mit neutralem Element handelt.
Die Assoziativität der Multiplikation (A) folgt aus (ii) in der Definition eines Rings,
Axiom (N) im Gruppenbegriff folgt aus (iii) in derselben Definition, schließlich folgt
(I) aus (iv) in der Definition eines Körpers.
Bemerkung.
(i) Wir halten nochmals das Kontrapositiv von Teil (i) im obigen Lemma fest. Sind a, b Elements eines Körper mit a 6= 0 und b 6= 0, so
ist ab 6= 0.
(ii) Aus unserer Definition folgt, dass 1 ∈ K r {0}. Insbesondere besitzt ein
Körper mindestens zwei Elemente.
(iii) Da K r {0} (mit der Multiplikation) eine Gruppe bildet, können wir
kürzen, siehe dazu Lemma 1.1(iv). Konkret, falls a, b, c ∈ K mit a 6= 0
und
ab = ac so gilt b = c.
(iv) Gemäß Definition ist jeder Körper ein Ring. Die Umkehrung gilt nicht,
d.h. wir werden unten in einem Beispiel sehen, dass es gibt Ringe gibt, die
keine Körper sind.
Beispiel.
(i) Der Ring der rationalen Zahlen Q ist ein Körper. Das gleiche
gilt für den Ring der reellen Zahlen R.
(ii) Die komplexen Zahlen C (siehe Vorlesung Analysis) bilden einen Körper.
(iii) Der Ring der ganzen Zahlen Z ist kein Körper, da 1/2 ∈ Q r Z.
(iv) Bis jetzt kennen wir nur Körper mit unendlich vielen Elementen. Ein
Körper muss per Definition mindestens zwei Elemente enthalten. Das lässt
eine große Lücke zu. Wir zeigen nun, dass es einen Körper F2 mit genau
zwei Elementen gibt. Wir machen den Ansatz F2 = {0, 1} mit 0 6= 1 zwei
Symbole. Bezüglich der Addition muss F2 eine abelsche Gruppe sein. Die
folgende Additionstabelle (die wir schon einmal gesehen haben) definiert
diese Gruppenstruktur:
+
0
1
0
0
1
1
1
0
Somit ist Axiom (i) in der Definition eines Rings erfüllt. Für die Multiplikationstabelle gibt es wegen Lemma 1.3 nur eine Möglichkeit:
·
0
1
0
0
0
1
0
1
3. RINGE UND KÖRPER
19
Also definiert die Multiplikation auf F2 r {0} = {1} eine Gruppenstruktur: die der trivialen Gruppe. Daraus folgt Axiom (vi) in der Definition
des Körpers. Die Axiome (ii), (iii) und (v) in der Definition des Ringbegriffs folgen sofort. Nach einer kurzen Rechnung folgt, dass Addition und
Multiplikation das Distributivgesetz befolgen (also Axiom (iv)).
Also sind alle Axiome erfüllt. Daher ist F2 ein Körper, der kleinste Körper,
den es gibt. In F2 gilt die bemerkenswerte Gleichung
1 + 1 = 0.
Es können also keine Vorzeichenfehler passieren!
Sei K ein Körper. Da K auch ein Ring ist, erhalten wir aus der Konstruktion aus
dem vorigen Abschnitt den Ring K[X] der Polynome mit Koeffizienten in K. Zur
Erinnerung, Elemente aus K[X] sind von der Form
an X n + an−1 X n−1 + · · · + a1 X + a0
mit
an , . . . , a0 ∈ K
für ein n ∈ N ∪ {0}. Wir werden weiter unten sehen, dass K[X] nie ein Körper ist.
Lemma 1.5. Sei K ein Körper.
(i) Seien A, B ∈ K[X] r {0}. Dann gilt AB 6= 0 und
deg AB = deg A + deg B.
(ii) Der Ring K[X] ist kein Körper.
Beweis. Um Teil (i) zu beweisen, schreiben wir A = an X n + · · · + a0 mit
an 6= 0 und B = bm X m + · · · + b0 mit bm 6= 0. Die Definition des Grads impliziert
deg A = n und deg B = m.
Wir berechnen das Produkt
AB = (an X n + · · · + a0 )(bm X m + · · · + b0 )
(1.3)
= an bm X n+m + (an bm−1 + an−1 bm )X n+m−1 + · · · + (a1 b0 + a0 b1 )X + a0 b0 .
Nun sind an 6= 0 und bm 6= 0. Somit ist das Produkt an bm 6= 0 weil K ein Körper ist.
Da der Term an bm X n+m nicht durch die weiteren Summanden in AB weggekürzt
werden kann, haben wir AB 6= 0. Insbesondere ist der Grad deg AB wohldefiniert.
Schließlich sehen wir aus (1.3), dass deg AB = n + m = deg A + deg B gilt. Somit
ist Teil (i) bewiesen.
Nun kommen wir zu (ii). Wäre K[X] ein Körper, so gäbe es A ∈ K[X] mit XA = 1.
Dies wird zu einem Widerspruch führen. Es gilt deg 1 = 0 und deg X = 1. Wenden
wir Teil (i) an, so erhalten wir 1 + deg A = 0 und somit deg A = −1. Dies ist ein
Widerspruch, da der Grad eines Polynoms nie negative sein kann.
Definition. Eine natürliche Zahl p nennt man Primzahl, falls p ≥ 2 und falls p in
N nur die Teiler 1 und p besitzt.
Bemerkung.
(i) In einem Körper K kann man wie “gewohnt” rechnen. Sind
a, b ∈ K mit b 6= 0 so schreiben wir b−1 für das multiplikative Inverse von
b und wir kürzen
a
ab.
b−1 a = ab−1 durch
b
20
1. ALGEBRAISCHE GRUNDLAGEN: MENGEN, GRUPPEN, RINGE, KÖRPER
(ii) Es gibt weitere endliche Körper. Für jede Primzahl p ∈ {2, 3, 5, 7, . . .}
und jede natürliche Zahl n ∈ N gibt es einen Körper Fpn der Kardinalität
pn . Das sind schon sämtliche endliche Körper. Die Existenz der Fp werden wir im Laufe des Semesters beweisen. Die restlichen Aussagen dieser
Bemerkung werden vielleicht in höheren Vorlesungen behandelt.
Wir haben gesehen, dass in F2 die Gleichung 1 + 1 = 0 gilt. Das Element 2 kommt
nicht in der Definition des Körpers vor. Jedoch können wir
2=1+1
in einem beliebigen Körper K definieren und somit hat 2 eine Bedeutung als Element von K. Dasselbe kann man für jede natürliche Zahl n ∈ N ∪ {0} machen
(1.4)
n := 1 + · · · + 1 ∈ K.
| {z }
n Summanden
Hier ist 0 = 0 in K. Für negative n ∈ Z definieren wir
n := −
(1 + · · · + 1)
|
{z
}
∈K
−n > 0 Summanden
In dieser Notation gilt
2 = 0 im Körper F2 .
Später werden wir einfach n für n schreiben. Hier spielt uns die Notation einen
Streich: das “n” ist je nach Situation ein Element in K und darf dann nicht mit
der natürlichen Zahl, die wir auch mit n bezeichnen, verwechselt werden!
Dieses Phänomen führt zu einer wichtigen Invariante eines Körpers, die Charakteristik.
Lemma 1.6. Sei K ein Körper. Angenommen es gibt eine natürliche Zahl n ∈ N
mit n = 0 als Element von K. Dann gibt es eine kleinste natürliche Zahl mit dieser
Eigenschaft und diese ist eine Primzahl.
Beweis. Falls es n ∈ N mit n = 0 in K gibt, so gibt es sicherlich ein kleinstes
n mit dieser Eigenschaft. Es reicht also zu zeigen, dass dieses n eine Primzahl ist.
Sicher gilt n 6= 1 da 1 = 1 6= 0 in einem Körper. Also haben wir n ≥ 2. Falls n = tt0
mit t, t0 ∈ N so zeigt man rasch, dass n = t · t0 = 0. Aus Lemma 1.4(i) folgt nun
t = 0 oder t0 = 0. Aus der Symmetrie der Situation können wir annehmen, dass
t = 0 gilt. Aus der Minimalität von n folgt t ≥ n. Aber t ist ein Teiler von n, also
t ≤ n. Somit gilt t = n und t0 = 1. Hieraus folgt, dass n nur zwei Teiler hat. Also
ist n eine Primzahl.
Definition. Sei K ein Körper. Falls es n ∈ N gibt mit n = 0 in K. Dann nennt
man die Primzahl, welche wir aus dem letzten Lemma erhalten, die Charakteristik
von K. Falls n 6= 0 für alle n ∈ N gilt, so wird die Charakteristik von K als 0
definiert.
Beispiel.
(i) Die Charakteristik von Q ist 0. Dasselbe gilt für die Körper R
und C.
(ii) Die Charakteristik von F2 ist 2.
KAPITEL 2
Matrizenkalkül
Bislang haben wir algebraische Strukturen wie Gruppen, Ringe und Körper eingeführt. In diesem Kapitel werden wir hauptsächlich in einem Körper K arbeiten.
Dabei soll es uns um das Lösen von Gleichungen mit Koeffizienten in K gehen. Die
einfachste Klasse von Gleichungen sind die linearen Gleichungen und diese werden
uns beschäftigen.
Beispiel. Ein Beispiel eines linearen Gleichungssystems mit Koeffizienten im Körper
Q und zwei Unbekannten ist
(2.1)
3x + 5y = 0.
Hier sind x und y die unbekannten Variablen. Dieses Gleichungssystem besitzt
unendliche viele Lösungen: für jedes λ ∈ Q wird durch x = −5λ und y = 3λ eine
Lösung gegeben.
Man mächte jedoch auch mehrere Gleichungen gleichzeitig behandeln:
(2.2)
x + 2y = 0
(2.3)
−3x + y = 0.
Dieses Gleichungssystem hat genau eine Lösung x = y = 0.
Matrizen sind wichtige Werkzeuge solche Gleichung systematisch zu studieren. Sie
besitzen aber auch ein Eigenleben und werden in späteren Kapitel eine neuen Rolle
annehmen: lineare Abbildungen werden sich mittels Matrizen beschreiben lassen.
Ziel des Kapitels ist es, Matrizen zu definieren, die Addition und Multiplikation
von Matrizen einzuführen, Zeilenstufenform einer Matrix zu definieren und die Determinante und Spur einer Matrix zu definieren.
1. Matrizen: Summe, Skalarprodukt und Produkt
Definition. Sei K ein beliebiger Körper und m, n ∈ N. Eine m × n Matrix mit
Koeffizienten in K ist ein Element


a1,1 a1,2 · · · a1,n
 a2,1 a2,2 · · · a2,n 


A= .
..
.. 
.
.
.
 .
.
.
. 
am,1
am,2
mn
···
am,n
des mn-fachen Kartesischen Produkts K . Das heißt, die ai,j sind Elemente von
K. Die Menge der m × n Matrizen mit Koeffizienten in K wird mit Matm,n (K)
bezeichnet.
Ist m = n so nennt man m × m Matrizen quadratisch und benutzt die abkürzende
Schreibweise Matm (K) = Matm,m (K).
21
22
2. MATRIZENKALKÜL
Bemerkung. Üblicherweise besteht eine m × n Matrix aus m Zeilen und n Spalten (beachten Sie die Reihenfolge). Ist A ∈ Matm,n (K) wie in der Definition, so
bezeichnet ai,j den Koeffizienten in der i-ten Zeile und j-ten Spalte von A.
Beispiel.
(i) Die Matrix
3
5
∈ Mat1,2 (Q)
besitzt als Koeffizienten genau die rationalen Zahlen die im Beispiel (2.1)
auftauchen.
(ii) Die Matrix
1 2
∈ Mat2,2 (Q)
−3 1
besitzt als Koeffizienten genau die rationalen Zahlen, die im Beispiel (2.2)
auftauchen. Diese Matrix ist, im Gegensatz zur Matrix im ersten Beispiel,
quadratisch.
Es gibt zwei Matrizen, die durchwegs eine besondere Rolle spielen.
Definition. Sei K ein Körper und m, n ∈ N.
(i) Die Nullmatrix ist durch

0
 ..
0m,n =  .
0
···
..
.
···

0
..  ∈ Mat (K)
m,n
. 
0
gegeben, d.h. alle Koeffizienten sind 0. Oft werden wir die Indizes in 0m,n
weglassen und das Symbol 0 für die Nullmatrix verwenden.
(ii) Sei m = n, also sind die Elemente von Matm (K) quadratische Matrizen.
Die Einheits- oder Einsmatrix ist durch


1 0 ···
0
 0 1 ···
0 


 ..
..  ∈ Mat (K)
.
..
Em =  .
m
. 


 0
··· 1 0 
0
··· 0 1
gegeben, d.h. alle Koeffizienten auf der Diagonale sind 1 und die restlichen
sind 0. Auch hier werden wir oft E anstatt Em schreiben.
Beachten Sie, dass die Einheitsmatrix nicht ausschließlich aus der 1 ∈ K besteht!
Die Erklärung dafür werden wir sehen, sobald wir das Produkt zweier Matrizen
kennen.
Zwei Matrizen mit Koeffizienten im selben Körper und welche die gleiche Anzahl
Zeilen und Spalten besitzen lassen sich summieren.
Definition. Sei K ein

a1,1 a1,2
 a2,1 a2,2

A= .
..
 ..
.
am,1 am,2
Körper und m, n ∈ N. Sind


· · · a1,n
b1,1
 b2,1
· · · a2,n 


..  und B =  ..
..

 .
.
.
· · · am,n
bm,1
b1,2
b2,2
..
.
···
···
..
.
b1,n
b2,n
..
.
bm,2
···
bm,n





1. MATRIZEN: SUMME, SKALARPRODUKT UND PRODUKT
in Matm,n (K) so ist ihre Summe komponentenweise durch

a1,1 + b1,1
a1,2 + b1,2 · · · a1,n + b1,n
 a2,1 + b2,1
a2,2 + b2,2 · · · a2,n + b2,n

A+B =
..
..
..
..

.
.
.
.
am,1 + bm,1
am,2 + bm,2
···
23



 ∈ Matm,n (K)

am,n + bm,n
gegeben.
Beispiel.
(2.4)
(i) Seien
1 2
A=
∈ Mat2 (Q)
3 4
und B =
−4
−9
2
15
∈ Mat2 (Q)
so gilt
A+B =
−3
−6
4
19
∈ Mat2 (Q).
(ii) Zwei nicht quadratische Matrizen mit Koeffizienten in F2 lassen sich auch
summieren. Falls
1
1
und B =
A=
0
1
mit A, B ∈ Mat2,1 (F2 ) so ist
1+1
0
=
.
A+B =
0+1
1
Wir werden nun die Skalarmultiplikation eines Elements aus K mit einer Matrix
mit Koeffizienten aus K definieren.
Definition. Sei K ein Körper und m, n ∈ N. Ist λ ∈ K und


a1,1 a1,2 · · · a1,n
 a2,1 a2,2 · · · a2,n 


A= .
..
.. 
..
 ..
.
.
. 
am,1 am,2 · · · am,n
so ist das Skalarprodukt durch



λA = 


λa1,1
λa2,1
..
.
λa1,2
λa2,2
..
.
···
···
..
.
λa1,n
λa2,n
..
.
λam,1
λam,2
···
λam,n




gegeben. In anderen Worten, wir multiplizieren jeden Eintrag von A mit dem “Skalar” λ.
Beispiel.
(i) Seien A und B wie in (2.4). Es gilt
2 4
4
2A =
und (−1)A =
6 8
9
−2
−15
.
(ii) Sei K ein beliebiger Körper, m, n ∈ N und A ∈ Matm,n (K). Aus den
Resultaten über Körper des letzten Kapitels folgern wir
0A = 0m,n
24
2. MATRIZENKALKÜL
und
(2.5)
(−1)A + A = 0m,n .
Das letzte Beispiel legt nahe, dass Matrizen bezüglich der Addition eine Gruppe
bilden.
Lemma 2.1. Sei K ein Körper und m, n ∈ N. Die Menge der Matrizen Matm,n (K)
zusammen mit der Matrizenaddition, dem Element 0m,n , und der durch (2.5) definierten Abbildung ist eine abelsche Gruppe.
Beweis. Die Summe zweier Matrizen in Matm,n (K) liegt wieder in Matm,n (K).
Dass die Summe assoziativ ist und dass 0m,n ein neutrales Element ist, folgt aus der
Definition des Körpers. Jedes Element in Matm,n (K) besitzt zu dem ein additives
Inverses (2.5).
Nun stellt sich die Frage ob man auch Matrizen miteinander multiplizieren kann.
Vielleicht lässt sich sogar eine Ringstruktur auf der Menge der Matrizen definieren. Die naheliegenste Methode zwei Matrizen miteinander zu multiplizieren ist die
folgende. Seien




a1,1 · · · a1,n
b1,1 · · · b1,n

..  und B =  ..
.. 
A =  ...
 .
. 
. 
am,1
···
am,n
bm,1
···
bm,n
beide in Matm,n (K). Wir definieren eine neue Matrix A♠B durch


a1,1 b1,1 · · · a1,n b1,n


..
..
A♠B = 
 ∈ Matm,n (K).
.
.
am,1 bm,1 · · · am,n bm,n
Das heißt, wir multiplizieren die Einträge Komponentenweise. Nun lässt es sich
leicht zeigen, dass Matm,n (K) mit der Matrizenaddition und mit der Verknüpfung
♠ einen kommutativen Ring bildet.
Achtung. Obwohl ♠ zunächst wie ein plausibler Kandidat für die Matrizenmultiplikation ist, ist es nicht die Definition, die wir brauchen werden. Wir werden später
im Kapitel über lineare Abbildungen sehen, dass diese Definition, obwohl sie uns
jetzt einfach erscheint, nicht die natürliche ist.
Hier ist eine vorläufige Erklärung wieso die Verknüpfung ♠ nicht geeignet ist. Matrizen sollen und werden lineare Abbildung repräsentieren. Beispiele solcher Abbildungen haben wir in der Einführungsvorlesung gesehen. Es kamen unter anderem Drehungen und Spiegelungen vor. Die geometrisch natürlichste Definition der
Multiplikation zweier Matrizen erhält man, in dem man die entsprechenden linearen Abbildung verknüpft. Nun haben wir in der ersten Vorlesung gesehen, dass
wenn man eine Spiegelung mit einer Drehung verknüpft, nicht dieselbe Abbildung
entsteht, wie wenn man die Abbildungen in umgekehrter Reihenfolge verknüpft.
Andererseits ist ♠ kommutativ und entsprich daher keineswegs der geometrischen
Situation.
Nun kommen wir zur “korrekten” Definition der Matrizenmultiplikation.
1. MATRIZEN: SUMME, SKALARPRODUKT UND PRODUKT
25
Definition. Sei K ein Körper und m, n, p ∈ N. Das Produkt der zwei Matrizen




b1,1 · · · b1,p
a1,1 · · · a1,n

..  ∈ Mat (K).
..  ∈ Mat (K) und B =  ..
A =  ...
 .
n,p
m,n
. 
. 
bn,1 · · · bn,p
am,1 · · · am,n
ist

a1,1 b1,1 + a1,2 b2,1 + · · · + a1,n bn,1

..
AB = 
.
am,1 b1,1 + am,2 b2,1 + · · · + am,n bn,1
···
a1,1 b1,p + a1,2 b2,p + · · · + a1,n bn,p
..
.
···
am,1 b1,p + am,2 b2,p + · · · + am,n bn,p
Völlig äquivalent schreiben wir C = AB mit C = (ci,k )1≤i≤m,1≤k≤p und
ci,k =
n
X
ai,j bj,k .
j=1
Diese etwas eigentümlich Definition werden wir weiter unten an Beispielen üben.
Bemerkung.
(i) In der Definition oben ist zu beachten, dass die Anzahl
Spalten n des ersten Faktors A gleich den Anzahl Zeilen des zweiten Faktors ist.
Das Produkt aus B und A ist nur dann wohldefiniert, wenn m = p.
(ii) Gilt m = n = p, sind also A und B quadratische Matrizen der gleichen
Größe, so läßt sich sowohl AB wie auch BA bilden.
Beispiel.
(i) Seien
1 2
A=
∈ Mat2 (Q)
3 4
und B =
8
6
7
5
∈ Mat2 (Q)
so gilt
1·8+2·6
3·8+4·6
1·7+2·5
3·7+4·5
Berechnen wir jedoch
8·1+7·3
BA =
6·1+5·3
8·2+7·4
6·2+5·4
AB =
=
=
20
48
17
41
29
21
30
32
.
,
so fällt
AB 6= BA
sofort ins Auge. Die Matrizenmultiplikation ist also im Allgemeinen nicht
kommutativ.
(ii) Sei A wie im Beispiel (i) und
−1
B=
∈ Mat2,1 (Q)
7
dann ist
AB =
1 · (−1) + 2 · 7
3 · (−1) + 4 · 7
=
13
25
.
Beachten Sie, dass das Produkt von B mit A nicht definiert ist! Die Anzahl
Spalten von B ist ungleich der Anzahl Zeilen von A.


 ∈ Matm,p (K).
26
2. MATRIZENKALKÜL
(iii) Sei B wie in (ii) und
5
C=
3
.
Die Matrix B hat eine Spalte und C hat eine Zeile. Also ist BC definiert
und gemäß Definition eine 2 × 2 Matrix. Es gilt
−5 −3
BC =
.
35 21
Da B aber zwei Zeilen hat, ist eine CB wohldefiniert 1 × 1 Matrix. Wir
haben
CB = ((−1) · 5 + 3 · 7) ∈ Mat1 (Q).
Eine 1×1 Matrix ist nichts anderes wie ein Element des Grundkörpers.
(iv) Natürlich können wir auch Matrizen mit Koeffizienten in F2 multiplizieren. Seien
1 1
1 1
und B =
A=
1 0
1 0
so gilt
AB =
1·1+1·1
1·1+0·1
(v) Sei K ein beliebiger Körper und
a
A=
c
1·1+1·0
1·1+0·0
b
d
=
0
1
1
1
.
∈ Mat2 (K).
Weiter oben haben wir die Einsmatrix in Matn (K) definiert. Für n = 2 erhalten
wird
1 0
E2 = E =
.
0 1
Da A und E quadratische Matrizen mit der selben Anzahl Zeilen sind, sind sowohl
AE wie auch EA definiert. Wir rechnen leicht nach, dass
a·1+b·0 a·0+b·1
a b
AE =
=
= A.
c·1+d·0 c·0+d·1
c d
Wie sieht es mit dem Produkt EA aus?
1·a+0·c 1·b+0·d
a
EA =
=
0·a+1·c 0·b+1·d
c
b
d
= A.
Dieses Beispiel zeigt, dass En ein neutrales Element bezüglich der Multiplikation
ist für n = 2. Dies wird auch für jedes n ≥ 1 richtig sein.
(vi) Ist A wie im Beispiel (v) so überrascht es nicht, dass
A02,2 = 02,2
und
02,2 A = 02,2
gilt. Hier ist 02,2 die 2 × 2 Nullmatrix.
Definition. Sei K ein Körper und m ∈ N. Eine Matrix in Mat1,m (K) nennt
man auch Zeilenvektor (der Länge m). Entsprechend nennt man eine Matrix in
Matm,1 (K) gerne Spaltenvektor (der Länge m).
Bemerkung. Sei K ein Körper und m, n ∈ N. Ist A = (ai,j )1≤i≤m,1≤j≤n ∈
Matm,n (K) so ist Av wohldefiniert für jeden Spaltenvektor v der Länge n. Das
Produkt ist eine Matrix Matm,1 (K), d.h. ein Spaltenvektor der Länge m.
1. MATRIZEN: SUMME, SKALARPRODUKT UND PRODUKT
27
Beispiel. Sei
A=
1
3
2
2
3
1


1
und v =  0 
−1
so gilt
Av =
−2
2
.
Wir halten im nächsten Lemma einige elementare Rechenregeln fest.
Lemma 2.2. Sei K ein Körper und m, n, p, q ∈ N.
(i) Sei A ∈ Matm,n (K), B ∈ Matn,p (K) und C ∈ Matp,q (K). Dann gilt das
Assoziativgesetz
(AB)C = A(BC).
(Man soll sich davon überzeugen, dass alle vier Produkte wohldefiniert
sind.)
(ii) Sind A, B ∈ Matm,n (K) und C ∈ Matn,p (K), so haben wir Distributivität
(A + B)C = AB + AC.
Liegt C ∈ Matp,m (K), so gilt analog
C(A + B) = CA + CB.
(iii) Ist A ∈ Matm,n (K) so gilt
Em A = A = AEn .
D.h. Em ist ein neutrales Element falls m = n.
(iv) Für jedes A ∈ Matm,n (K) gilt
A0n,p = 0m,p
und
0p,m A = 0p,n .
Beweis. Die vier Aussagen lassen sich formal mit der Definition der Matrizenaddition bzw. -multiplikation beweisen. Die Argumentation ist jedoch nicht besonders interessant. Wir begnügen uns damit, AEn = A aus Teil (iii) zu zeigen.
Dazu nehmen wir wie üblich an, dass A = (ai,j )1≤i≤m,1≤j≤n gilt mit ai,j ∈ K. Der
Eintrag von En in der j-ten Zeile und k-ten Spalte soll mit ej,k bezeichnet werden.
Es gilt
1 : falls j = k,
ej,k =
0 : sonst.
Wir schreiben AEn = A0 mit A0 = (ai,k )1≤i≤m,1≤k≤n . Aus der Definition erhalten
wir
n
X
a0i,k =
ai,j ej,k .
j=1
In dieser Summe überlebt nur der Faktor mit j = k, ansonsten ist ej,k = 0. Es gilt
daher
a0i,k = ai,k
für alle möglichen j und k.
Bemerkung. Die Assoziativität der Matrizenmultiplikation und die Einsmatrix
lassen erhoffen, dass irgendwo eine Gruppe versteckt ist. Dies ist tatsächlich der
Fall. Diese korrekt zu definieren, wird jedoch Zeit beanspruchen.
28
2. MATRIZENKALKÜL
Definition. Sei K ein Körper und m ∈ N. Gegeben seien quadratische Matrizen
A, B ∈ Matm (K). Man sagt, dass B ein Rechtsinverses zu A ist, falls AB = Em .
Analog bezeichnet man B als Linksinverses zu A, falls BA = Em . Schliesslich nennt
man B Inverses von A falls AB = BA = Em .
Es gibt keinen Grund anzunehmen, dass es zu einer Matrix A ein Links- oder
Rechtsinverses gibt!
Definition. Sei A wie in der vorigen Definition. Dann nennt man A invertierbar,
falls A ein Inverses besitzt.
Beispiel. In diesem Beispiel wollen wir erörtern, ob es ein Inverses bezüglich der
Matrizenmultiplikation gibt. Wir wollen uns dabei auf quadratische Matrizen in
Matn (K) beschränken, hier ist K wie immer ein Körper.
(i) Natürlich gilt En En = En2 = En , dass heißt, En ihr eigenes Inverses.
(ii) Sei 0n die Nullmatrix. Für jede Matrix A ∈ Matn (K) gilt 0n A = A0n =
0n . Somit hat 0n weder ein Links- noch ein Rechtsinverses.
(iii) Es gibt aber auch Matrizen ungleich der Nullmatrix die weder ein Linksnoch ein Rechtsinverses besitzt. Dies läßt sich mit der Matrix
1 1
A=
∈ Mat2 (Q)
1 1
beweisen. Nehmen wir an, dass es B ∈ Mat2 (Q) mit AB = E2 gibt. Wir
definieren die Hilfsmatrix
1 −1
C=
∈ Mat2 (Q).
−1 1
Dann gilt (CA)B = C(AB) = CE2 = C wegen Assoziativität, und weil
E2 die Einsmatrix ist, siehe Lemma 2.2. Berechnen wir nun
0 0
CA =
= 02 ,
0 0
so erhalten wir 02 = 02 B = C. Dies ist ein Widerspruch. Also kann
A kein Rechtsinverses besitzen. Unter Verwendung von CA = 02 zeigt
eine ähnliche Rechnung, dass A kein Linksinverses besitzt. Dies wird eine
Übungsaufgabe sein.
(iii) Die Matrix
1 1
∈ Mat2 (Q)
0 1
ist invertierbar. Ein Inverses ist durch
1 −1
∈ Mat2 (Q).
0 1
gegeben wie man leicht nachrechnet.
Lemma 2.3. Sei K ein Körper und m ∈ N.
(i) Sind A, B ∈ Matm (K) beide invertierbar, so ist auch AB invertierbar.
(ii) Ist A ∈ Matm (K) invertierbar, so ist auch jedes Inverse A0 von A invertierbar.
(iii) Die Menge der invertierbaren Matrizen zusammen mit der Matrizenmultiplikation ist eine Gruppe mit neutralem Element Em .
1. MATRIZEN: SUMME, SKALARPRODUKT UND PRODUKT
29
Beweis. Seien A0 und B 0 Inverse zu A und B 0 . Das heißt, A0 A = AA0 = En
und B 0 B = BB 0 = En . Wir behaupten, dass B 0 A0 ein Inverses zu AB ist. Dazu
berechnen wir
(AB)(B 0 A0 ) = A(BB 0 )A0 = AA0 = En
und
(B 0 A0 )(AB) = B 0 (A0 A)B = B 0 B = En ,
was für Teil (i) zu zeigen war.
Teil (ii) folgt sofort aus der Definition des Inversen.
Um Teil (iii) zu zeigen, muss man die Gruppenaxiome nachprüfen. Dass das Produkt
oder ein Inverses einer invertierbaren Matrix wieder invertierbar ist, folgt aus Teilen
(i) und (ii). Assoziativität und Existenz des neutralen Elements folgt aus Lemma
(2.2). Existenz des Inversen folgt aus der Definition.
Bemerkung. Aus dem Kapitel über Gruppentheorie folgt nun, dass das Inverse
einer invertierbaren Matrix eindeutig bestimmt ist.
Definition. Die Gruppe aus der vorherigen Definition wird mit GLn (K) bezeichnet. Die Inverse von A ∈ GLn (K) bezeichnen wir mit A−1 .
Wir werden üblicherweise GLn (K) als Teilmenge von Matn (K) betrachten.
Das letzte Lemma ist unbefriedigend, da es kein Rezept angibt, zu entscheiden wann
eine Matrix invertierbar ist. Wir wissen also abstrakt, dass die Gruppe GLn (K)
existiert. Wir können jedoch noch nicht sagen, welche Matrizen ihr angehören.
Für 2 × 2 Matrix lässt sich GL2 (K) jedoch leicht bestimmen. Später werden wir
mit Hilfe der Determinante eine ähnliche Aussage für alle n erhalten.
Lemma 2.4. Sei K ein Körper und
a b
A=
∈ Mat2 (K).
c d
Dann gilt
A ∈ GL2 (K) ⇐⇒ ad − bc 6= 0.
Beweis. Da wir die Äquivalenz zweier Aussagen beweisen wollen, müssen wir
beide Implikationen “⇐” und “⇒” beweisen.
Wir beginnen mit “⇐”. Dazu setzen wir δ = ad − bc. Dies ist ein Element von
K r {0} nach Voraussetzung. Deshalb ist δ −1 ein wohldefiniertes Element von K.
Wir setzen
−1
δ d −δ −1 b
d −b
−1
B=
=
δ
−δ −1 c δ −1 a
−c a
und werden nun nachweisen, dass B das Inverse von A ist. Dazu rechnen wir
ad − bc −ab + ba
1 0
AB = δ −1
=
= E2 .
cd − dc ad − bc
0 1
Also ist B zumindest ein Rechtsinverses von A. Völlig analog zeigt man, dass BA =
E2 . Und daraus folgt, dass A invertierbar ist.
Nun zeigen wir die andere Implikation “⇒”. Nach Voraussetzung gibt es ein B ∈
Mat2 (K) mit AB = E2 . Wir definieren die Hilfsmatrix
d −b
C=
.
−c a
30
2. MATRIZENKALKÜL
Diese erfüllt
(2.6)
CA =
ad − bc
−ca + ca
db − db
ad − bc
=
δ
0
0
δ
mit δ = ad − bc.
Wir möchten beweisen, dass δ 6= 0. Um dies zu tun nehmen wir das Gegenteil an,
und folgern einen Widerspruch. Falls δ = 0 so gilt wegen (2.6) CA = 02 = 0. Also
haben wir
0 = 0B = (CA)B = C(AB) = CE2 = C.
Aus der Definition von C folgt nun A = 0. Aber die Nullmatrix kann unmöglich
invertierbar sein. Dies haben wir schon weiter oben gesehen und daraus folgt der
gewünschte Widerspruch. Daher ist δ 6= 0 und das Lemma ist bewiesen.
2. Lineare Gleichungssysteme und Zeilenstufenform
Ziel dieses Abschnitts ist es, lineare Gleichungssysteme systematisch mittels Matrizen zu studieren.
Definition. Sei K ein Körper und m, n ∈ N. Gegeben seien Elemente ai,j ∈ K
sowie xi , bj ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Gilt

a1,1 x1 + a1,2 x2 + · · · + a1,n xn = b1



 a2,1 x1 + a2,2 x2 + · · · + a2,n xn = b2
(2.7)
..

.



am,1 x1 + am,2 x2 + · · · + am,n xn = bm
so sagt man, dass (x1 , . . . , xn ) ∈ K n eine Lösung des inhomogenen Gleichungssystems (2.7) ist. Sind b1 = b2 = · · · = bm = 0 so nennt man (x1 , . . . , xn ) ∈ K n eine
Lösung des homogenen Gleichungssystems (2.7).
Lineare Gleichungssystem sind die einfachsten Gleichungen, die man nur unter Verwendendung der Körperaxiome aufschreiben kann. Lässt man höhere Potenzen xkj
oder gar gemischte Terme xk11 · · · xknn zu, so redet man von polynomialen Gleichungen. Diese lassen sich nur mit viel größeren Mühe behandeln; die dazugehörige
Vorlesung heißt Algebraische Geometrie.
Matrizen lassen sich verwenden, um das System (2.7) viel effizienter zu beschreiben.
Sei dazu A ∈ Matm,n (K) die Matrix A = (ai,j )1≤i≤m,1≤j≤n und


b1


b =  ...  ∈ Matm,1 (K)
bm
ein Spaltenvektor. Sei x = (x1 , . . . , xn ) ∈ Mat1,n (K) ein Zeilenvektor. Dann gilt
Ax = b
⇐⇒
(x1 , . . . , xn ) is eine Lösung von (2.7).
Der Grund für diese Äquivalenz liegt in der Beobachtung, dass das Produkt der
zwei Matrizen A und b genau durch die linke Seite von (2.7) gegeben ist.
Natürlich ist die Notation Ax = b viel kompakter wie (2.7). Matrizen dienen jedoch
nicht nur der Kosmetik. Sie werden uns später helfen lineare Gleichungssysteme zu
lösen.
2. LINEARE GLEICHUNGSSYSTEME UND ZEILENSTUFENFORM
31
Definition. In Zukunft werden wir das inhomogene System (2.7) durch
[A|b]
abkürzen. Das homogene System (b = 0) lässt sich durch A alleine ausdrücken.
Bevor wir zur allgemeinen Theorie kommen, werden wir ein relativ einfaches Gleichungssytem von Hand lösen. Die Schritte, die wir dabei durchlaufen, werden wir
später verallgemeinern.
Beispiel. Wir betrachten das homogene Gleichungssystem, welches durch die Matrix
0 2 −2
A=
∈ Mat2,3 (Q)
2 4 6
gegeben ist. Wir wollen alle Lösungen des Systems bestimmen.
Zuerst nehmen wir an, dass der Spaltenvektor


x1
x =  x2 
x3
eine Lösung mit rationalen Koeffizienten ist. D.h. Ax = 0.
Natürlich ist x auch eine Lösung des homogenen Gleichungssystems, welches wir
durch das Vertauschen der zwei Zeilen von A erhalten:
2 4 6
0
A =
0 2 −2
Es gilt 2x1 + 4x2 + 6x3 = 0 und somit auch x1 + 2x2 + 3x3 = 0 nach Division durch
2. Dies entspricht Multiplikation der ersten Zeile von A0 mit 1/2. Also gilt A00 x = 0
mit
1 2 3
A00 =
0 2 −2
Es gilt
x1 + 2x2 + 3x3 = 0 und 2x2 − 2x3 = 0.
Falls wir die zweite Gleichung von der ersten subtrahieren, so erhalten wir
x1 + 5x3 = 0.
000
Wir haben A x = 0 mit
1
0
Als letztes multiplizieren wir, ähnlich wie
und erhalten
1
A0000 =
0
0000
wobei immer noch A x = 0 gelten muss.
A000 =
x1 = −5x3
0 5
2 −2
vorhin, die zweite Zeile von A000 mit 1/2
0 5
1 −1
Setzen wir x hier ein, so ergibt sich
und x2 = x3 .
Wir haben bewiesen, dass jede Lösung x ∈ Q3 von Ax = 0 von der Form


−5
(2.8)
x =  1  t ist für ein t ∈ Q.
1
Hier haben wir x3 durch t ersetzt.
32
2. MATRIZENKALKÜL
Wir sagen, dass A0000 in Zeilenstufenform ist. Diesen Begriff werden wir später für
allgemeine Matrizen definieren.
Umgekehrt sieht man sofort, dass jeder Spaltenvektor der Form (2.8) eine Lösung
von Ax = 0 ist.
Somit ist die Lösungsmenge bestimmt.
Insgesamt mussten wir drei verschiedene Zeilenumformungen durchführen, bis unsere Matrix A in Zeilenstufenform war. Wir fassen diese zusammen.
A
Z1 und Z2 vertauschen
A0
Z1 mal 1/2
A00
Z1 durch Z1-Z2 ersetzen
A000
Z2 mal 1/2
A0000 .
Wie schon angedeutet, kann man diese drei Zeilenumformungen in einem allgemeineren Kontext durchführen.
Definition. Sei K ein Körper und m, n ∈ N. Sei A ∈ Matm,n (K) eine Matrix mit
Zeilen a1 , . . . , am (wir betrachten die ai als Zeilenvektoren).
Wir sagen, dass eine Matrix A0 ∈ Matm,n (K) durch Zeilenumformungen aus A
entstehe falls:
(I) die i-te Zeile ai von A durch ai + λaj ersetzt wurde, wobei λ ∈ K und
1 ≤ i 6= j ≤ n, oder
(II) die i-te und j-te Zeilen von A vertauscht wurden wobei 1 ≤ i 6= j ≤ n,
oder
(III) die i-te Zeile ai durch λai ersetzt wurde, wobei λ ∈ K r{0} und 1 ≤ i ≤ n.
Diese Umformungen werden wir als Zeilenumformung vom Typ I, II oder III bezeichnen.
Ein wichtiges Fakt im Zusammenhang mit Zeilenumformungen ist, dass sie durch
Matrizenmultiplikation der sogenannten Elementarmatrizen entstehen.
Definition. Sei K ein Körper, m ∈ N und 1 ≤ i, j ≤ m. Wir definieren


0 ··· 0

.. 
ei,j =  ...
1
. 
0
···
0
wobei sich die 1 in der i-ten Zeile und j-ten Spalte befindet, alle weiteren Einträge
sind 0. Wir definieren drei Typen von Elementarmatrizen der Größe m.
(I) Für 1 ≤ i 6= j ≤ m und λ ∈ K definieren wir


1


..


.


I

 = Em + λei,j .
1 λ
E (i, j, λ) = 



..


.
1
In Worten: die Diagonaleinträge von E(i, j, λ) sind 1, außerhalb der Diagonale sind die Einträge 0, außer in der i-ten Zeile und j-ten Spalte wo
λ steht.
2. LINEARE GLEICHUNGSSYSTEME UND ZEILENSTUFENFORM
33
(II) Für 1 ≤ i 6= j ≤ m definieren wir







II
E (i, j) = 






1
..






 = Em − ei,i − ej,j + ei,j + ej,i .





.
0
1
..
.
1
0
..
.
1
(iii) Für 1 ≤ i ≤ m und λ ∈ K r {0} definieren


1


..


.


 = Em − ei,i + λei,i .
λ
E III (i, λ) = 




..


.
1
Nun werden wir beweisen, dass die drei Zeilenumformungen durch Linksmultiplikation der Elementarmatrizen induziert werden.
Lemma 2.5. Sei K ein Körper, m, n ∈ N und A ∈ Matm,n (K).
(i) Seien 1 ≤ i 6= j ≤ n und λ ∈ K. Dann entsteht E I (i, j, λ)A durch A
mittels einer Zeilenumformung des Types I.
(ii) Seien 1 ≤ i 6= j ≤ n. Dann entsteht E II (i, j)A durch A mittels einer
Zeilenumformung des Typs II.
(iii) Seien 1 ≤ i ≤ n und λ ∈ K r {0}. Dann entsteht E III (i, λ)A durch A
mittels einer Zeilenumformung des Typs III.
Beweis. Wir schreiben

a1,1
 ..
A= .
am,1
···
···

a1,n
..  ∈ Mat (K).
m,n
. 
am,n
Seien 1 ≤ i 6= j ≤ n und λ ∈ K. Wir nehmen ohne Beschränkung der Allgemeinheit
an, dass i < j.
Es gilt


 
1
a1,1
···
a1,n
a1,1
···
a1,n





.
.
.
..
.
..
..  
..

  ..
.


 

  ai,1
 =  ai,1 + λaj,1
1
λ
·
·
·
a
·
·
·
a
+
λaj,n
i,n
i,n


 

 .
..  
..
..
.
.
.

 .
.
.  
.
.
1
am,1
···
am,n
am,1
···
am,n
hieraus folgt (i).




.



34
2. MATRIZENKALKÜL
Wir berechnen

1

..

.


0


..

.


1



···

a1,1
  ..
 .

  ai,1

  ..
 .

  aj,1

 .
  ..
am,1
1
1
0
..
.
ai,i
···
ai,j
···
···
aj,i
···
aj,j
···
···
···

a1,1
 ..
 .

 aj,1

 ..
 .

 ai,1

 .
 ..
···
···
aj,i
···
aj,j
···
···
ai,i
···
ai,j
···
am,1
···
Somit ist (ii) bewiesen.
Schlussendlich, sei λ ∈ K r {0}. Dann gilt


1
a1,1
···
a1,n



.
..
.
..
  ..

.


  ai,1

λ
·
·
·
a
i,n


 .

..
..
  ..

.
.
1
am,1
···
am,n

a1,n
.. 
. 

ai,n 

..  =
. 

aj,n 

.. 
. 
am,n

a1,n
.. 
. 

aj,n 

..  .
. 

ai,n 

.. 
. 
am,n



a1,n
.. 
. 

λai,n 
.
.. 
. 
am,n
···
a1,1
  ..
  .
 
 =  λai,1
 
  .
  ..
am,1
···
···
Also ist (iii) wahr.
Beispiel. Sei
A=
3
−1
7
2
3
−1
7
2
3
−1
7
2
3
−1
7
2
∈ Mat2 (Q).
Für λ ∈ Q gilt
E I (2, 1, λ)A =
1
λ
und
II
0
1
E (2, 1)A =
und
E III (2, λ)A =
0
1
1
0
1
0
0
λ
=
3
−1 + 3λ
−1
3
2
7
3
−λ
7
2λ
=
=
7
2 + 7λ
falls λ 6= 0.
Was passiert, wenn man hintereinander zweimal die Zeilen i und j vertausch? Man
erhält natürlich die ursprüngliche Matrix.
Im nächsten Lemma verallgemeinern wir diese Beobachtung.
Lemma 2.6. Sei K ein Körper, wir betrachten Elementarmatrizen der Größe m ∈
N.
2. LINEARE GLEICHUNGSSYSTEME UND ZEILENSTUFENFORM
35
(i) Für 1 ≤ i 6= j ≤ m und λ ∈ K gilt
E I (i, j, −λ)E I (i, j, λ) = Em .
(ii) Für 1 ≤ i 6= j ≤ m gilt
E II (i, j)E II (i, j) = Em .
(iii) Für 1 ≤ i ≤ m und λ ∈ K r {0} gilt
E III (i, λ−1 )E III (i, λ) = Em .
Insbesondere sind alle Elementarmatrizen invertierbar, d.h. sie liegen in GLm (K).
Beweis. Addiert man −λ mal die j-te Zeile zur i-ten Zeile von E I (i, j, λ) so
erhält man Em . Also folgt (i)
Vertauscht man zweimal hintereinander die selben zwei Zeilen so erhält man die
ursprüngliche Matrix. Hieraus folgert man (ii)
Multipliziert man die i-te Zeile einer Matrix zuerst mit λ und anschließend mit λ−1 ,
so erhält man wiederum die ursprüngliche Matrix. Daraus folgt (iii)
Die Invertierbarkeit der Elementarmatrizen folgt nun sofort aus (i), (ii) und (iii). Nun folgt leicht, dass Zeilenumformungen die Lösungsmenge eines linearen Gleichungssystems nicht verändern.
Lemma 2.7. Sei K ein Körper, m, n ∈ N, A ∈ Matm,n (K) und b ∈ Matm,1 (K) =
K m ein Zeilenvektor. Entstehen A0 bzw. b0 beide durch endlich viele, gleichen Zeilenumformungen aus A bzw. b so gilt
Ax = b ⇐⇒ A0 x = b0
für alle
x ∈ Matn,1 (K).
Beweis. Nach Voraussetzung und Lemma 2.5 gilt A0 = LA und b0 = Lb wobei
L ein endliches Produkt aus Elementarmatrizen E I (· · · ), E II (· · · ) und E III (· · · )
ist.
Wir wissen aus Lemma 2.6, dass Elementarmatrizen invertierbar sind. D.h. die
Menge aller invertierbarer Matrizen liegt in der Gruppe GLm (K). Also liegt auch
L in GLm (K). Insbesondere ist L invertierbar, d.h. L−1 existiert.
Wir erhalten
Ax = b =⇒ LAx = Lb =⇒ A0 x = b0
und andererseits
−1 0
−1 0
A0 x = b0 =⇒ L
| {zA} x = L b =⇒ Ax = b.
=L−1 (LA)
Wir haben weiter oben in einem Beispiel die Matrix
0 2 −2
2 4 6
durch geeignet Zeilenumformungen in besonders einfacher Form gebracht. Wir wollen dies nun für alle Matrizen machen.
36
2. MATRIZENKALKÜL
Definition. Sei K ein Körper und
Gestalt

0 ··· 0 1 ? ··· ? 0 ?
 0 ··· 0 0 0 ··· 0 1 ?

 0 ··· 0 0 0 ··· 0 0 0

 0 ··· 0 0 0 ··· 0 0 0

..
.. .. ..
.. .. ..
.
. . .
. . .
m, n ∈ N. Wir sagen, dass eine Matrix der
···
···
···
···
?
?
0
0
..
.
0 ?
0 ?
1 ?
0 0
.. ..
. .
···
···
···
···
?
?
?
0
0
0
0
1
···
···
···
···
..
.




 ∈ Matm,n (K)


in Zeilenstufenform ist.
In Worten: Eine Matrix A ∈ Matm,n (K) ist in Zeilenstufenform genau dann, wenn
folgende drei Bedingungen erfüllt sind.
(i) Der erste Eintrag ungleich Null jeder Zeile von A ist 1. Diesen Eintrag
nennt man Pivot. (N.B.: nicht jede Zeile muss ein Pivotelement besitzen,
d.h. es darf Nullzeilen geben.)
(ii) Der Pivoteintrag der i-ten Zeile von A steht rechts des Pivoteintrags der
i − 1-ten Zeile.
(iii) Die Einträge oberhalb eines Pivoteintrags sind 0.
Beispiel. Die Matrizen
1
0
0
1
5
−1

1
, 0
0
0
1
0
 
0
0
0 , 0
1
0
0
0
0

0
1
0 ,
0
0
1
0
0
1
sind in Zeilenstufenform.
Die Matrix

0
 0
0
0
1
0

0
0 
0
ist nicht in Zeilenstufenform. Vertauscht man jedoch die ersten zwei Zeilen so erhält
man


0 1 0
 0 0 0 
0 0 0
und diese Matrix ist in Zeilenstufenform.
Wir zeigen zunächst, dass sich jede Matrix durch Zeilenumformungen in Zeilenstufenform bringen lässt.
Später werden wir sehen, wir man durch hinstarren lineare Gleichungssyteme lösen
kann, wenn die dazugehörige Matrix in Zeilenstufenform ist.
Lemma 2.8. Sei K ein Körper, m, n ∈ N und A ∈ Matm,n (K). Dann lässt sich jede Matrix in Matm,n (K) nach endlich vielen Zeilenumformung in Zeilenstufenform
bringen.
Beweis. Die erste Spalte von A könnte Null sein. Aber nachdem wir, falls
nötig, eine Zeilenvertauschung (Typ II) gemacht haben, enthält die erste Spalte
die ungleich Null ist ein Element ungleich Null in der ersten Zeile. Das heißt, wir
2. LINEARE GLEICHUNGSSYSTEME UND ZEILENSTUFENFORM
37
erhalten

A
Typ II
(falls nötig)


A0 = 

0
0
..
.
···
···
0
···

a ···
? ··· 


..

.
? ···
0
0
..
.
0
mit
a 6= 0.
Da a 6= 0 erlauben wir uns eine Zeilenumformung des Typs III und multiplizieren
die erste Zeile mit a−1 . Wir erhalten

A0
Typ III


A00 = 

0
0
..
.
···
···
0
···
0
0
..
.
1
a2
..
.
0
am

···
··· 



···
mit
a2 , . . . , am ∈ K.
Nun wenden wir Zeilenumformungen des Typs I an und subtrahieren a2 mal Zeile
eins von Zeile zwei. Dann subtrahieren wir a3 mal Zeile eins von Zeile drei, usw.
usw. Dies hat zur Folge, dass unter der führenden 1 der erste Zeile nur die 0 steht.
Also

Typ I
A00 |
·{z
··


000
}A = 

Typ I
m−1 mal
0
0
..
.
···
···
0
0
..
.
1
0
..
.
0
···
0
0

···
··· 
0

=

0

···
1
0
B
C
wobei B ein Zeilenvektor und C eine Matrix mit m − 1 Zeilen.
Nun wenden wir das oben angegebene Vorgehen induktiv auf C an. Die dabei
auftretenden Zeilenumformungen beeinflussen die erste Zeile von A000 nicht. Nach
einer Induktion auf m erhalten wir

0 ··· 0 1 ? ··· ? ? ? ··· ? ? ? ··· ? ?
 0 ··· 0 0 0 ··· 0 1 ? ··· ? ? ? ··· ? ?

induktiv 0000

A000
A =  0 ··· 0 0 0 ··· 0 0 0 ··· 0 1 ? ··· ? ?
 0 ··· 0 0 0 ··· 0 0 0 ··· 0 0 0 ··· 0 1

..
.. .. ..
.. .. ..
.. .. ..
.
. . .
. . .
. . .
Die Matrix A0000 is noch nicht ganz in Zeilenstufenform: die markierten Einträge
oberhalb der Pivots sind vielleicht noch nicht 0. Dieses Problem lässt sich jedoch
leicht lösen. Mit Hilfe von Zeilenumformungen des Typs I lassen sich auch auf diese
Werte eliminieren:
A0000
Typ I
···
Typ I
A00000
ist in Zeilenstufenform.
Proposition 2.9. Sei K ein Körper, m, n ∈ N und A ∈ Matm,n (K) eine Matrix
in Zeilenstufenform. Sei r die größte ganze Zahl in {1, . . . , m} mit der Eigenschaft,
dass die r-te Zeile von A keine Nullzeile ist. Sei


b1


b =  ... 
bm
ein Spaltenvektor.
···
···
···
···
..
.




.


38
2. MATRIZENKALKÜL
Das lineare Gleichungssystem

(2.9)
Ax = b

x1


x =  ...  ∈ Matm,1 (K)
xn
mit
hat genau dann eine Lösung x, wenn br+1 = br+2 = · · · = bm = 0.
Nehmen wir an, dass eine Lösung existiert und seien j1 < j2 < · · · < jk die
Spalten von A, welche kein Pivotelement enthalten. Dann gibt es zu jeder Wahl von
xj1 , . . . , xjk ∈ K genau eine Lösung x wie in (2.9).
Beweis. Eine Lösung des Gleichungssystem erfüllt
···
xt1 + a1,t1 +1 xt1 +1
x t2 +
a2,t2 +1 xt2 +1 +
= b1 ,
= b2 ,
···
..
.
xtr + ar,tr +1 xtr +1
wobei t1 , t2 , . . . die Spalten von A bezeichnen, die ein Pivotelement enthalten.
Somit ist br+1 = · · · = bm = 0 ein notwendiges Kriterium für die Existenz einer
Lösung.
Umkehrt ist dies auch ein hinreichendes Kriterium. Nehmen wir also br+1 = · · · =
bm = 0 an. Sind xtr +1 , . . . , xm ∈ K beliebig, so lässt sich ein eindeutiges xtr ∈ K
finden, so dass die letzte nichttriviale Gleichung oben erfüllt ist. Man finden also
ein xtr−1 ∈ K welches die zweitletzte nichttriviale Gleichung löst, dabei kann man
xtr−1 +1 , . . . , xtr −1 frei wählen. Dieses “rückwärts-aufwärts” Lösen setzt man fort,
bis man ganz oben links angelangt ist.
Beispiel. Die Matrix
A=
1
0
2
0
0
1
5
−2
!
∈ Mat2,4 (Q)
ist in Zeilenstufenform; die Pivoteinträge sind umrandet.
Wir wollen das inhomogene System


x1
 x2 
7

Ax =
in x = 
 x3 
−3
x4
lösen. Gemäß Lemma existiert eine Lösung
Die Lösungsmenge ist also

−2x2 − 5x4 + 7



x2


2x
−3

4


x4
und wir können x2 und x4 frei wählen.






 ; x2 , x4 ∈ Q .




···
0
= br ,
= br+1 ,
..
.
0
= bm
2. LINEARE GLEICHUNGSSYSTEME UND ZEILENSTUFENFORM
39
Zur Erinnerung, gegeben eine Matrix A ∈ Matm,n (K) mit K ein Körper, so definiert
Ax = 0
mit x ∈ Matn,1 (K)
ein lineares Gleichungsssytem bestehend aus m homogenen linearen Gleichungen in
n Unbekannten. Der Nullvektor x ist natürlich immer eine Lösung. Diese Lösung
heißt die triviale Lösung.
Folgendes Korollar impliziert, dass ein überbestimmtes homogenes lineares Gleichungssystem (diejenige mit m > n) eine nicht triviale Lösung besitzt.
Korollar 2.10. Sei K ein Körper m, n ∈ N mit n > m und A ∈ Matm,n (K).
Dann existiert ein Spaltenvektor x ∈ K n r {0} mit Ax = 0.
Beweis. Wegen Lemmas 2.7 und 2.8 dürfen wir annehmen, dass A in Zeilenstufenform ist.
Jetzt werden wir Proposition 2.9 anwenden. Sei k die Anzahl Spalten von A welche
kein Pivoteintrag enthalten. Wäre nun k = 0, so enthielte jede Spalte von A einen
Pivoteintrag und es gäbe deren insgesamt mindestens n Stück. Da es mindestens
soviele Zeilen wie Pivoteinträge geben muss, folgt m ≥ n.
Dies ist ein Widerspruch. Es muss also k ≥ 1 gelten. Nun sind k Einträge von x
“frei wählbar”. Inbesondere gibt es eine Lösung von Ax = 0 mit x 6= 0.
Nun können wir eine für die Theorie wichtige Aussage beweisen. Eine quadratische
Matrix besitzt ein Rechtsinverses genau dann, wenn sie ein Linksinverses besitzt.
Proposition 2.11. Sei K ein Körper und m ∈ N. Seien A, B ∈ Matm (K) quadratische Matrizen mit AB = Em . Dann gilt BA = Em . Insbesondere sind A und
B invertierbar.
Beweis. Wegen Lemmas 2.5 und 2.8 gibt es ein Produkt L ∈ Matm (K) aus
endlich vielen Elementarmatrizen mit LA in Zeilenstufenform.
Die Matrix L ist invertierbar, weil sie ein endliches Produkt aus Elementarmatrizen
ist, siehe Lemma 2.6.
Das Pivotelement der i-ten Zeile von LA rechts des Pivotelements der i−1-ten Zeile
von LA steht und weil LA quadratisch ist, muss einer der zwei folgenden Aussagen
wahr sein.
(i) Das Produkt LA ist die Einsmatrix Em .
(ii) Die letzte Zeile von LA ist 0.
Wir wollen den zweiten Fall ausschliessen. Trifft er doch zu, so ist auch die letzte
Zeile von
(2.10)
(LA)B = L(AB) = L
Null. Also müsste auch die letzte Zeile von LL−1 = Em gleich 0 sein. Dies ist ein
Widerspruch.
Folglich sind wir im Fall (i) und es gilt LA = Em . Wir multiplizieren von links
mit L−1 und erhalten L−1 = L−1 (LA) = (L−1 L)A = A. Also ist zumindest A
invertierbar, da L und L−1 invertierbar sind. Aus AB = Em folgt nun L = L(AB) =
(LA)B = B und somit ist auch B invertierbar.
Also liegen A und B in der Gruppe GLm (K). Das Inverse in einer Gruppe ist
eindeutig bestimmt und ein Linksinverses ist auch ein Rechtsinverses. Für diese
Aussagen verweisen wir auf Teile (i) und (ii) von Lemma 1.1. Wir erhalten BA =
Em .
40
2. MATRIZENKALKÜL
Bemerkung. Die eben bewiesene Proposition und deren Beweis impliziert folgende
Aussage.
Sei A ∈ Matm (K) eine Matrix und L ein endliches Produkt aus Elementarmatrizen mit der Eigenschaft, dass LA in Zeilenstufenform ist. Dann ist genau dann A
invertierbar, wenn LA die Einsmatrix ist.
Wir halten zwei nützliche Konsequenzen fest. Bringen wir eine eine quadratische
Matrix in Zeilenstufenform, so können wir entscheiden ob die ursprüngliche Matrix
invertierbar ist oder nicht. Ist sie invertierbar, so ist die Matrix L (Notation wie
oben) die Inverse von A.
Diese Bemerkung erläutern an einem Beispiel.
Beispiel. Sei

1
A= 2
4
1
3
9

1
4  ∈ Mat3 (Q).
16
Wir wollen die Erkenntnis aus der letzten Bemerkung benutzen, um zu entscheiden
ob A invertierbar ist.
Also bringen wir A durch Zeilenumformungen in Zeilenstufenform. Wir werden jede
Zeilenumformung parallel an der Einsmatrix E3 durchführen. Dies wird schlussendlich die Matrix L aus der Bemerkung liefern.
Schritt 1. Wir subtrahieren 2 mal Zeile 1 von Zeile 2 und 4 mal Zeile 1 von Zeile
4. Wir erhalten


1 1 1
Typ I Typ I 0
A
A = E I (3, 1, −4)E I (2, 1, −2)A =  0 1 2 
0 5 12
und parallel

E3
Typ I
1
Typ I
E 0 = E I (3, 1, −4)E I (2, 1, −2)E3 =  −2
−4

0 0
1 0 .
0 1
Schritt 2. Der Eintrag in Zeile 2, Spalte 2 von A0 ist schon 1. Somit bleiben uns
Zeilenumformungen des Typs II und III ersparrt. Wir subtrahieren Zeile 2 von Zeile
1 und dann 5 mal Zeile 2 von Zeile 3. Dies ergibt


1 0 −1
Typ
I
Typ
I
A0
A00 = E I (3, 2, −5)E I (1, 2, −1)A0 =  0 1 2  .
0 0 2
Wir führen wieder die selben Umformungen parallel an E 0 aus und erhalten


3 −1 0
Typ
I
Typ
I
E0
E 00 = E I (3, 2, −5)E I (1, 2, −1)E 0 =  −2 1 0  .
6 −5 1
Schritt 3. Der Eintrag in Zeile 3 und Spalte 3 von A00 ist 2. Wir multiplizieren
also Zeile 3 mit 1/2 in A00 und E 00 und erhalten dabei


1 0 −1
Typ III 000
A00
A = E III (3, 1/2)A00 =  0 1 2 
0 0 1
2. LINEARE GLEICHUNGSSYSTEME UND ZEILENSTUFENFORM
und
41


3
−1
0
Typ III
1
0 .
E 000 = E III (3, 1/2)E 00 =  −2
E 00
3 −5/2 1/2
Schritt 4. Die Matrix A000 ist fast in Zeilenstufenform. Wir müssen noch 2 mal eine
Zeilenumformung des Types I durchführen. Explizit müssen wir Zeile 3 zu Zeile 1
addieren und dann 2 mal Zeile 3 von Zeile 2 subtrahieren. Also


1 0 0
Typ ITyp I 0000
A = E I (2, 3, −2)E I (1, 3, 1)A000 =  0 1 0 
A000
0 0 1
und schon ist A0000 in Zeilenstufenform. Folglich ist A invertierbar. Dieselbe Umformungen führen wir an E 000 aus und kriegen


6 −7/2 1/2
Typ ITyp I
6
−1  .
E 000
E 0000 = E I (2, 3, −2)E I (1, 3, 1)E 000 =  −8
3 −5/2 1/2
Weshalb haben wir die Einsmatrix mittransformiert? Wenn man den ganzen Prozess
betrachtet so haben wir
E3 = A0000 = E I (2, 3, −2) · · · E I (2, 1, −2) A
|
{z
}
L
die gleichen Umformungen haben wir an E3 unternommen, also
E 0000 = E I (2, 3, −2) · · · E I (2, 1, −2)E3 .
Somit ist E 0000 = L die Inverse von A.
Eine kurze Kontrollrechnung zeigt auch


1
6 −7/2 1/2
 −8
6
−1   2
4
3 −5/2 1/2
1
3
9
 
1
1
4 = 0
0
16
0
1
0

0
0 .
1
Lemma 2.12. Sei K ein Körper, m ∈ N und A ∈ Matm (K). Folgende Aussagen
sind äquivalent.
(i) Die Matrix A ist invertierbar.
(ii) Das homogene Gleichungssystem Ax = 0 hat nur die Lösung x = 0 ∈ K m .
Beweis. Wir zeigen zuerst die einfachere Richtung (i)⇒(ii).
Sei also x ∈ K n eine Lösung Ax = 0. Wir multiplizieren diese Gleichung von links
mit A−1 und erhalten A−1 Ax = A−1 0 = 0. Es folgt x = 0.
Nun zu (ii)⇒(i). Wegen Lemmas 2.5 und 2.8 gibt es ein endliches Produkt L ∈
Matm (K) aus Elementarmatrizen mit LA in Zeilenstufenform.
Ähnlich wie im Beweis zu Proposition 2.11 muss LA entweder die Einsmatrix sein
oder eine Nullzeile besitzen.
Im ersten Fall gilt LA = Em und wegen Proposition 2.11 auch AL = Em . Somit
ist A invertierbar.
Der zweite Fall führt wie folgt zum Widerspruch. Unsere neue Matrix hat die Gestalt
0 A
LA =
0
mit A0 ∈ Matm−1,m (K). Wegen Korollar 2.10 gibt es ein x ∈ K m r{0} mit A0 x = 0.
Die letzte Zeile von LA bereitet keine Probleme: es gilt auch LAx = 0. Nun ist L
42
2. MATRIZENKALKÜL
invertierbar, somit haben wir 0 = L−1 LAx = Ax. Dies ist ein Widerspruch zu Teil
(ii).
KAPITEL 3
Die Determinante einer Matrix
Sei K ein Körper. Eine 1 × 1 Matrix (a1,1 ) besteht aus nur einem Eintrag a1,1 ∈ K.
Diese Matrix ist genau dann invertierbar, wenn a1,1 6= 0.
Für eine 2 × 2 Matrix
a b
A=
∈ Mat2 (K)
c d
ist die Situation schon etwas komplizierter, wie wir in Lemma 2.4 gesehen haben.
In der Tat ist A invertierbar, genau dann wenn
ad − bc 6= 0.
(3.1)
Im Prinzip können wir für eine beliebige m × m Matrix A ∈ Matm (K) entscheiden
ob sie invertierbar ist oder nicht. Dafür müssen wir A jedoch in Zeilenstufenform
bringen und das ist nicht immer sehr praktikabel.
In diesem Kapitel werden wir jeder quadratischen Matrix A ein Element aus K
zuordnen. Dieses Element heißt Determinante von A und ist ungleich 0 genau dann,
wenn A invertierbar ist.
Wir definieren zuerst ad hoc die Determinante einer 1 × 1 und einer 2 × 2 Matrizen:
det(a1,1 ) = a1,1 .
und
a b
det
= ad − bc.
c d
Im Laufe des Kapitels werden wir die allgemeine Definition der Determinante einer quadratischen Matrizen liefern. Diese Definition stimmt mit den zwei ad hoc
Definitionen oben überein.
Wir erläutern eine zentrale Eigenschaft für Determinanten von 2×2 Matrizen: sie ist
multiplikativ. Später werden wir sehen, dass die Multiplikativität sich auf Matrizen
beliebiger Größe überträgt.
Lemma 3.0. Sei K ein Körper und A, B ∈ Mat2 (K). Es gilt
det(AB) = det(A) det(B).
Beweis. Übungsaufgabe.
1. Permutationen
Es gibt mehrere (äquivalente) Definitionen für die Determinante einer m×m Matrix.
Wir werden die Determinante über die sogenannte Leibnizformel einführen. Ein
alternativer Zugang ist über die Laplaceentwicklung. Wir werden im Laufe des
Kapitels beweisen, dass beide Definitionen den gleichen Wert liefern.
Um die Determinante mittels der Leibnizformel einzuführen brauchen wir den Begriff der Permutation und der symmetrischen Gruppe.
43
44
3. DIE DETERMINANTE EINER MATRIX
Wir haben im Kapitel über Gruppentheorie die symmetrische Gruppe auf einer
beliebigen Menge als Beispiel kennengelernt. Im Zusammenhang mit der Determinante reicht es aus, die symmetrische Gruppe auf endlichen Mengen zu betrachten.
Definition. Sei n ∈ N = {1, 2, . . . }. Die symmetrische Gruppe Sn (auf {1, 2, . . . , n})
besteht aus allen bijektiven Abbildungen σ : {1, 2, . . . , n} → {1, 2, . . . , n}, die sogenannten Permutationen. Die Verknüpfung ist durch die Verknüfung von Abbildungen gegeben. Das Einselement der Gruppe ist die Identitätsabbildung id(i) = i für
i ∈ {1, . . . , n}. Die Inversionsabbildung ordnet jeder Permutation σ ihre Umkehrabbildung σ −1 zu.
Sind σ1 , σ2 ∈ Sn zwei Permutationen so bezeichnet σ2 ◦ σ1 ∈ Sn ihre Verknüpfung
Eine Permutation σ : {1, 2, . . . , n} → {1, 2, . . . , n} können wir tabellarisch wie folgt
darstellen
1
σ(1)
σ
2
σ(2)
3
σ(3)
···
···
n
σ(n)
Dabei kommt in der zweiten Zeile jedes Element von {1, 2, . . . , n} genau einmal
vor. Die Zahlen in der zweiten Zeile sind womöglich nicht mehr in aufsteigender
Reihenfolge. Daher der Begriff Permutation.
Beispiel. Die Gruppe S2 enthält nur id und σ mit
id
1
1
2
2
und
σ
1
2
2
1
Hier ist id die Identitätsabbildung. Was ist σ ◦ σ = σ 2 ? Rechnen wir nach! Es gilt
σ 2 (1) = σ(σ(1)) = σ(2) = 1
und
σ 2 (2) = σ(σ(2)) = σ(1) = 2
und somit σ 2 = id.
Die Kardinalität der symmetrische Gruppe Sn nimmt mit wachsendem n stark zu.
Lemma 3.1. Sei n ∈ N. Dann gilt
#Sn = n! = n(n − 1) · · · 2 · 1.
Beweis. Die Kardinalität #Sn ist die Anzahl bijektiver Abbildungen {1, . . . , n} →
{1, . . . , n}. Wieviele Möglichkeiten gibt es hierfür?
Für σ(1) gibt es zunächst die n Möglichkeiten {1, . . . , n}. Ist σ(1) einmal “gewählt”
so darf σ(2) jeden Wert in {1, . . . , n} außer der σ(1) annehmen; wir wollen, dass σ
injektiv ist. Also bleiben n−1 Möglichkeiten für σ(2). Analog gibt es für σ(3) genau
n − 3 mögliche Werte, nämlich {1, . . . , n} r {σ(1), σ(2)}. Dies führen wir weiter und
finden insgesamt
n(n − 1) · · · 2 · 1 = n!
Möglichkeiten für die Werte von σ. Hieraus ergibt sich die Behauptung.
Also hat #S10 mit 3628800 mehr als drei Millionen Elemente! Die Gruppen Sn
werden also schnell unübersichtlich groß. Wir können aber trotzdem mit diesen
Gruppen klarkommen, den sie sind aus einfachen Bausteinen aufgebaut: den Transpositionen.
1. PERMUTATIONEN
45
Definition. Sei n ∈ N. Eine Transposition ist eine Permutation τ ∈ Sn die genau
zwei Elemente aus {1, . . . , n} vertauscht. Präziser ausdrückt gibt es i, j ∈ {1, . . . , n}
mit i 6= j und
τ (i) = j,
τ (j) = i
Bemerkung.
tauscht.
sowie
τ (k) = k
für
k ∈ {1, . . . , n} r {i, j}.
(i) Ist τ eine Transposition, so werden nur zwei Zahlen ver1
1
τ
···
···
···
···
i
j
j
i
···
···
n
n
(ii) Für jede Transposition τ gilt τ 2 = id, denn wenn man die selben Zahlen
zweimal hintereinander vertauscht, passiert insgesamt nichts.
Beispiel.
(i) Das Elemente von S2 welches nicht das Einselement ist, ist eine
Transposition.
(ii) Die Permutation σ ∈ S3 die durch
1
2
σ
2
3
3
1
gegeben ist, ist keine Transposition.
Folgende zwei Permutationen sind jedoch Tranpositionen
τ1
1
1
2
3
3
2
und
τ2
1
2
2
1
3
3
Deren Produkt ist genau σ:
τ2 ◦ τ1 = σ.
Obwohl nicht jede Permutation in Sn eine Transposition ist, kann man jede Permutation als Produkt von endlich vielen Transpositionen schreiben. Dies ist der Inhalt
des nächsten Lemmas.
Lemma 3.2. Sei n ∈ N und σ ∈ Sn . Dann gibt es Transpositionen τ1 , . . . , τN ∈ Sn
mit
σ = τN ◦ · · · ◦ τ1 .
Beweis. Wir beweisen das Lemma über Induktion. Die Induktion ist über den
Defekt einer Permutation. Diese definieren wir wie folgt.
Sei σ ∈ Sn . Falls σ = id, so defineren wir D(σ) = 0. Falls σ 6= id dann gibt es ein
Index i ∈ {1, . . . , n} mit
(3.2)
σ(1) = 1,
σ(2) = 2,
...
σ(i − 1) = i − 1
aber σ(i) 6= i.
Der Defekt von σ ist nun
D(σ) = n − i ≥ 1.
Sei nun σ ∈ Sn beliebig. Falls D(σ) = 0 so ist σ = id. In diesem Fall ist nichts zu
zeigen, da σ das leere Produkt aus Transpositionen ist.
Wir nehmen nun an, dass D(σ) ≥ 1 und dass jede Permutation in Sn mit Defekt
höchstens D(σ) − 1 ein Produkt aus Transpositionen ist. Sei i = n − D(σ). Nach
Definition gilt σ(i) = j 6= i. Da σ injektiv ist, folgt σ(j) 6= j. Also muss j > i gelten.
Sei nun τ ∈ Sn die Transposition, welche i und j vertauscht.
Wir behaupten
(3.3)
D(τ ◦ σ) < D(σ).
46
3. DIE DETERMINANTE EINER MATRIX
Falls k ∈ {1, . . . , i − 1} so gilt σ(k) = k wegen (3.2) und τ (k) = k weil i, j > k.
Weiterhin haben wir τ (σ(i)) = τ (j) = i nach der Wahl von τ . Also ist τ ◦σ entweder
die Identität oder der kleinste Index i0 mit τ ◦ σ(i0 ) 6= i0 erfüllt i0 > i. In beiden
Fällen folgt (3.3).
Nach Induktionsvoraussetzung ist τ ◦ σ = τN −1 ◦ · · · τ1 mit τ1 , . . . , τN −1 Transpositionen. Wir multiplizieren diese Gleichung von links mit τ und nutzen τ 2 = id um
σ = τ ◦ τN −1 ◦ · · · τ1 zu erhalten.
Bemerkung. Die Faktorisierung einer Permutation als Produkt von Transpositionen ist nicht eindeutig im Allgemeinen: die Identität id lässt sich immer als τ 2 mit
τ einer Permutation beschreiben.
Seien
0
σ = τ1 ◦ · · · ◦ τN = τ10 ◦ · · · ◦ τN
0
zwei verschiedene Faktorisierungen einer Permutation s ∈ SN in Transpositionen.
Wir werden weiter unten beweisen, dass die Differenz der Anzahl Faktoren N − N 0
immer eine gerade Zahl ist. Dafür brauchen wir den Begriff des Vorzeichen einer
Permutation.
Definition. Sei n ∈ N und σ ∈ Sn . Man nennt ein Paar (i, j) mit i, j ∈ {1, . . . , n}
einen Fehlstand der Permutation σ falls
i<j
aber
σ(i) > σ(j).
Sei m die Anzahl der Fehlstände von σ, dann definieren wir
sign(σ) = (−1)m ∈ {−1, +1}.
Beispiel.
(i) Die Identitätsabbildung id ∈ Sn besitzt keine Fehlstände. Deshalb gilt
sign(id) = (−1)0 = 1.
(ii) Sei n ∈ N mit n ≥ 2 und τ die Transposition die 1 und 2 vertauscht. Das
heißt,
1 2 3 ··· n
τ
2 1 3 ··· n
Dann ist (1, 2) der einzige Fehlstand von τ . Es gilt also
sign(τ ) = (−1)1 = −1.
(iii) Sei σ ∈ S3 durch
σ
1
2
2
3
3
1
gegeben. Die Menge der Fehlstände von σ ist
{(1, 3), (2, 3)}.
Also gilt
sign(σ) = (−1)2 = 1.
Dass die Transposition in Beispiel (ii) oben Vorzeichen −1 besitzt, ist kein Zufall.
Lemma 3.3. Sei n ∈ N und τ ∈ Sn eine Transposition. Dann gilt sign(τ ) = −1.
1. PERMUTATIONEN
47
Beweis. Da τ eine Transposition ist, vertauscht sie zwei Indizes i, j ∈ {1, . . . , n}
mit i < j. Somit ist
(3.4)
(i, j)
ein Fehlstand von τ ist.
Es kann jedoch weitere Fehlstände geben. Sei i < k < j, dann gilt σ(i) = j > k =
σ(k). Wir erhalten j − i − 1 zusätzliche Fehlstände
(i, i + 1), (i, i + 2), . . . , (i, j − 1).
(3.5)
Andererseits ist auch (k, j) ein Fehlstand da σ(k) = k > i = σ(j). Diese Überlegung
ergibt wiederum j − i − 1 Fehlstände
(i + 1, j), (i + 2, j), . . . , (j − 1, j).
(3.6)
Wir haben also in (3.4), (3.5) und (3.6) insgesamt
1 + (j − i − 1) + (j − i − 1) = 1 + 2(j − i − 1)
Fehlstände gefunden.
Schliesslich deckt unsere Liste jeden Fehlstand von τ ab, denn ist (i0 , j 0 ) ein Fehlstand so muss i0 = i oder j 0 = j sein.
Somit gilt
σ(τ ) = (−1)1+2(j−i−1) = −1.
Teil (ii) des folgendes Lemma zeigt, dass die Abbildung
sign : Sn → {−1, +1}
ein Gruppenhomomorphismus ist; wir betrachten {−1, +1} als Untergruppe der
multiplikativen Gruppe Q r {0}. Die erste Aussage ist eine Hilfsresultat, welches
im Beweis von (ii) benötigt wird.
Lemma 3.4. Sei n ∈ N.
(i) Für jedes σ ∈ Sn gilt
sign(σ) =
Y σ(j) − σ(i)
i<j
j−i
;
die Indizes i und j laufen über {1, . . . , n} mit der Zusatzbedingung i < j.
(ii) Für σ1 , σ2 ∈ Sn gilt
sign(σ1 ◦ σ2 ) = sign(σ1 )sign(σ2 ).
Insbesondere ist sign : Sn → {−1, +1} ein Gruppenhomomorphismus.
Beweis. Wir beginnen mit Teil (i). Sei also σ ∈ Sn und m ≥ 0 die Anzahl
Fehlstände von σ. Wir spalten das Produkt aus der Behauptung im Zähler in zwei
Faktoren auf:
Y
Y
Y
(σ(j) − σ(i)) =
(σ(j) − σ(i))
(σ(j) − σ(i)).
i<j
i<j
σ(i)<σ(j)
i<j
σ(i)>σ(j)
Überlegen Sie sich, weshalb kein Faktor σ(i) = σ(j) auftaucht! Jeder Faktor im
Produkt ganz rechts ist negativ und entspricht einem Fehlstand von σ. Aus dieser
48
3. DIE DETERMINANTE EINER MATRIX
Überlegung erhalten wir
Y
(σ(j) − σ(i)) = (−1)m
i<j
Y
= (−1)m
Y
|σ(j) − σ(i)|
i<j
σ(i)>σ(j)
i<j
σ(i)<σ(j)
(3.7)
Y
(σ(j) − σ(i))
|σ(j) − σ(i)|.
i<j
Da σ bijektiv ist, durchläuft σ(j) jede Zahl in {1, .Q
. . , n} wenn j diese Menge
durchläuft. Das letzte Produkt (3.7) ist also gleich i<j (j − i). Somit erhalten
wir
Y σ(j) − σ(i)
= (−1)m .
j
−
i
i<j
Die rechte Seite ist aber sign(σ) per Definition. Es folgt Teil (i).
Nun beweisen wir (ii) und dafür dürfen wir die Formel für sign(σ) aus (i) benützen.
Wir haben also
Y σ1 (σ2 (j)) − σ1 (σ2 (i)) Y σ1 (σ2 (j)) − σ1 (σ2 (i)) σ2 (j) − σ2 (i)
sign(σ1 ◦ σ2 ) =
=
j−i
σ2 (j) − σ2 (i)
j−i
i<j
i<j


Y σ1 (σ2 (j)) − σ1 (σ2 (i))
 sign(σ2 )
(3.8)
=
σ
(j)
−
σ
(i)
2
2
i<j
{z
}
|
(∗)
Wir müssen noch zeigen, dass das Produkt (∗) gleich sign(σ1 ) ist. Dazu spalten wir
das Produkt auf in zwei Faktoren:
(3.9)
Y σ1 (σ2 (j)) − σ1 (σ2 (i))
Y
Y
σ1 (σ2 (j)) − σ1 (σ2 (i))
σ1 (σ2 (j)) − σ1 (σ2 (i))
=
σ
(j)
−
σ
(i)
σ
(j)
−
σ
(i)
σ2 (j) − σ2 (i)
2
2
2
2
i<j
i<j
i<j
σ2 (i)<σ2 (j)
σ2 (i)>σ2 (j)
|
{z
(∗∗)
Wir vertauschen die Rollen von i und j im Produkt (∗∗) und finden
Y
Y
σ1 (σ2 (j)) − σ1 (σ2 (i))
σ1 (σ2 (i)) − σ1 (σ2 (j))
=
(∗∗) =
σ
(i)
−
σ
(j)
σ2 (j) − σ2 (i)
2
2
i>j
i<j
σ2 (i)>σ2 (j)
σ2 (i)<σ2 (j)
Setzen wir diesen Ausdruck in (3.9) ein, so sehen wir
Y σ1 (σ2 (j)) − σ1 (σ2 (i))
Y
σ1 (σ2 (j)) − σ1 (σ2 (i))
=
.
σ2 (j) − σ2 (i)
σ2 (j) − σ2 (i)
i<j
σ2 (i)<σ2 (j)
Q
1 (i)
Dieser letzte Ausdruck ist dasselbe wie i<j σ1 (j)−σ
, denn σ2 ist eine Bijektion.
j−i
Also ist (∗) gleich sign(σ1 ). Wir kombieren diese Erkenntnis mit (3.8) und erhalten
sign(σ1 ◦ σ2 ) = sign(σ1 )sign(σ2 ), was zu zeigen war.
Da sign : Sn → {−1, +1} ein Gruppenhomomorphism ist, ist sein Kern eine Untergruppe.
Definition. Sei n ∈ N. Die alternierende Gruppe An (auf {1, 2, . . . , n}) ist die
Untergruppe
{σ ∈ Sn ; sign(σ) = +1}.
}
2. DIE DEFINITION DER DETERMINANTE
49
Bemerkung. Ist n ∈ N mit n ≥ 2 dann existiert eine Transposition τ ∈ Sn . Diese
erfüllt sign(τ ) = −1 wegen Lemma 3.3. Damit gilt τ ∈ Sn r An also inbesondere
An ( Sn .
Überlegen Sie sich in Ruhe, weshalb nicht jedes Element in Sn r An eine Tranposition sein muss falls n ≥ 4.
Lemma 3.5. Sei n ∈ N mit n ≥ 2 und σ ∈ Sn mit sign(σ) = −1. Dann gilt
An ∪ An σ = Sn
und
An ∩ An σ = ∅
hier ist An σ = {η ◦ σ; sign(η) = +1}. Schliesslich sind An und σAn gleich groß:
#An = #σAn = n!/2.
Beweis. Sicher haben wir An ∪ An σ ⊂ Sn . Ist andererseits η ∈ Sn r An so
gilt natürlich sign(η) = −1. Wegen Lemma 3.4(ii) haben wir sign(σ)sign(σ −1 ) =
sign(σ ◦ σ −1 ) = +1, also sign(σ −1 ) = −1. Aus dem selben Lemma folgt übrigens
auch sign(η ◦ σ −1 ) = sign(η)sign(σ −1 ) = (−1)2 = +1 und somit η ◦ σ −1 ∈ An .
Hieraus folgt η ∈ An σ und daher gilt auch An ∪ An σ = Sn .
Der Schnitt An ∩ An σ ist leer, denn die Elemente von An und σAn haben in Anbetracht von Lemma 3.4(ii) verschiedene Vorzeichen.
Um die Kardinalitätsfrage zu behandlen, reicht es #An = #σAn zu zeigen, denn es
gilt #Sn = n! wegen Lemma 3.1. Aber η 7→ σ ◦ η definiert eine Bijektion An → σAn
also müssen Bild- und Urbildbereich gleiche Kardinalität besitzen.
Wir werden später auf die Resultate über Permutationen in diesem Abschnitt verweisen. Schon bei der Definition der Determinante im nächsten Abschnitt werden
diese ein wichtige Rolle spielen.
2. Die Definition der Determinante
Nach der Vorarbeit des letzten Abschnitts können wir sofort die Determinante
definieren, um dann einige wichtige Eigenschaften zu beweisen.
Definition. Sei K ein Körper, m ∈ N und


a1,1 · · · a1,m

..  ∈ Mat (K).
A =  ...
m
. 
am,1 · · · am,m
Die Determinante von A ist
det(A) =
X
sign(σ)a1,σ(1) a2,σ(2) · · · am,σ(m) .
σ∈Sm
Bemerkung. Nur quadratische Matrizen besitzen eine Determinante (den nur diese können invertierbar sein).
Beispiel.
(i) Für n = 2 gilt S2 = {id, τ } mit τ die Transposition gegeben
durch τ (1) = 2 und τ (2) = 1. Falls
a1,1 a1,2
A=
∈ Mat2 (K)
a2,1 a2,2
50
3. DIE DETERMINANTE EINER MATRIX
gilt
det(A) =
X
sign(σ)a1,σ(1) a2,σ(2)
σ
= sign(id)a1,1 a2,2 + sign(τ )a1,τ (1) a2,τ (2)
= a1,1 a2,2 − a1,2 a2,1 .
Somit stimmt det A mit dem Ausdruck in Lemma 2.4 und der Definition
am Anfang dieses Kapitels überein.
(ii) Sei


a1,1 a1,2 a1,3
A =  a2,1 a2,2 a2,3 
a3,1 a3,2 a3,3
eine 3×3 Matrix mit Koeffizienten in einem Körper K. Ihre Determinante
lässt sich mit der Regel von Sarrus berechnen:
det(A) = a1,1 a2,2 a3,3 +a1,2 a2,3 a3,1 +a1,3 a2,1 a3,2 −a1,3 a2,2 a3,1 −a1,2 a2,1 a3,3 −a1,1 a2,3 a3,2 .
Insgesagt treten 6 = 3! = #S3 Terme auf.
(iii) Die Determinante zweier wichtigen Matrizen werden wir nun berechnen.
Die Nullmatrix in Matm (K) hat Determinante 0, denn jede Summand in
der Definition ist 0.
Die Einsmatrix erfüllt det Em = 1 und dies sieht man wie folgt. Sei Em =
(ai,j )1≤i,j≤m . Gemäß Definition ist
X
det Em =
sign(σ)a1,σ(1) · · · am,σ(m) .
σ∈Sm
Für σ = id ist a1,σ(1) · · · am,σ(m) = a1,1 · · · am,m = 1. Sei nun σ ∈ Sm mit
σ 6= id, dann gilt a1,σ(1) · · · am,σ(m) = 0 da es ein j mit σ(j) 6= j gibt; für
dieses haben wir aj,σ(j) = 0.
Die Argumentation des letzten Beispiels impliziert


λ1
0


λ2




.
..
det A = λ1 · · · λm für A = 
.




λm−1
0
λm
Matrizen wie A, deren Einträge außerhalb der Diagonale Null sind, heißen
Diagonalmatrizen.
Folgendes Lemma verallgemeinert die Aussage, dass die Nullmatrix Determinante
Null besitzt.
Lemma 3.6. Sei K ein Körper, m ∈ N und A ∈ Matm (K) mit einer Nullzeile.
Dann gilt det(A) = 0.
Beweis. Übungsaufgabe in Serie 7.
Die zwei wichtigsten Eigenschaften halten wir in folgendem Satz fest. Er verallgemeinert erstens die Tatsache, dass die Determinante einer 2 × 2 Matrix über ihre
Invertierbarkeit entscheidet, siehe Lemma 2.4 und zweitens die Multiplikativität
der Determinante für 2 × 2 Matrizen, siehe Übungsserie 6.
2. DIE DEFINITION DER DETERMINANTE
51
Satz 1. Sei K ein Körper und m ∈ N.
(i) Eine Matrix A ∈ Matm (K) ist invertierbar genau dann, wenn det(A) 6= 0.
In anderen Worten
GLm (K) = {A ∈ Matm (K); det(A) 6= 0}.
(ii) Für A, B ∈ Matm (K) gilt
det(AB) = det(A) det(B).
Beweis. Später.
Bevor wir den Satz beweisen, werden wir zunächst einige einfachere Rechenregeln
der Determinante kennenlernen.
Lemma 3.7. Sei K ein Körper, m ∈ N und a1 , . . . , am ∈ K m Zeilenvektoren der
Länge m.
(i) Die Determinante ist linear in den Zeilen, d.h. für jedes i ∈ {1, . . . , m}
und jeden Zeilenvektor a0i ∈ K m und jedes Paar λ, µ ∈ K gilt






a1
a1
a1


 .. 
 .. 
..


 . 
 . 
.




 0 
0 


 a .
λa
+
µa
a
(3.10)
det 
=
λ
det
+
µ
det
i
i 

 i 
 i 


 . 
 . 
..
.




 .. 
.
.
am
am
am
(ii) Die Determinante ist alternierend, d.h. falls es zwei verschiedene Indizes
i, j ∈ {1, . . . , m} mit ai = aj gibt, dann gilt


a1


det  ...  = 0.
am
Beweis. Wir schreiben ai = (ai,1 , . . . , ai,m ) für jedes i ∈ {1, . . . , m}.
Der Beweis von Teil (i) ist eine formale Konsequenz der Definition der Determinante. Sei dazu a0i = (a0i,1 , . . . , a0i,m ). Per Definition ist die Determinante auf der
rechten Seite von (3.10) gleich
X
sign(σ)a1,σ(1) · · · ai−1,σ(i−1) (λai,σ(i) + µa0i,σ(i) )ai+1,σ(i+1) · · · am,σ(m)
σ∈Sm
=λ
X
sign(σ)a1,σ(1) · · · ai,σ(i) · · · am,σ(m) + µ
σ∈Sm

a1
 ..
 .

= λ det 
 ai
 .
 ..
am
X
sign(σ)a1,σ(1) · · · a0i,σ(i) · · · am,σ(m)
σ∈Sm


a1

 ..

 .


 + µ det  a0

 i

 .

 ..
am








was zu zeigen war.
Für den Beweis von Teil (ii) benötigen wir nun die die Theorie der Permutationen
wie wir sie im letzten Abschnitt behandelt haben.
52
3. DIE DETERMINANTE EINER MATRIX
Zunächst müssen wir uns im Klaren sein, dass m ≥ 2. Denn gilt m = 1 so können
wir natürlich nicht zwei Zeilen gleich sein!
Sei

 

a1
a1,1 · · · a1,m

 
.. 
A =  ...  =  ...
. 
am
am,1 · · · am,m
ein Zeilenvektor der Länge m ist. Nach Voraussetzung sind die i-te un j-te Zeile
von A gleich. Wir müssen det(A) = 0 zeigen. Zur Vereinfachung der Präsentation
nehmen wir i < j an.
Wir fixieren die Transposition τ ∈ Sm , welche i und j vertauscht.
Wir erinnern uns nun an Lemma 3.5 welches besagte, dass die symmetrische Gruppe
wie folgt zerlegt werden kann:
Sm = Am ∪ Am τ
und Am ∩ Am τ = ∅.
Die Determinante von A lässt sich also in zwei Teilsumme zerlegen:
X
X
sign(σ ◦ τ )a1,σ(τ (1)) · · · am,σ(τ (m))
det(A) =
sign(σ) a1,σ(1) · · · am,σ(m) +
| {z }
σ∈Am
σ∈Am
+1
Wegen Multiplikativität des Vorzeichens gilt sign(σ ◦ τ ) = sign(σ)sign(τ ). Eine Permutation hat Vorzeichen −1, also folgt
X
X
(3.11)
det(A) =
a1,σ(1) · · · am,σ(m) −
a1,σ(τ (1)) · · · am,σ(τ (m)) .
σ∈Am
σ∈Am
Die Strategie ist nun die Folgende. Wir werden zeigen, dass sich jeder Term der
ersten Summe mit einem Term der zweiten Summe aufhebt. Die Details sind wie
folgt.
Sei σ ∈ Am beliebig. Es gilt
a1,σ(τ (1)) · · ·ai,σ(τ (i)) · · ·aj,σ(τ (j)) · · ·am,σ(τ (m))
=a1,σ(1)
· · ·ai,σ(j)
· · ·aj,σ(i)
· · ·am,σ(m)
da τ (j) = i, τ (i) = j und weil alle anderen Werte von τ unberührt bleiben. Weiterhin sind die i-te und j-te Zeilen gleich, also.
a1,σ(τ (1)) · · ·ai,σ(τ (i)) · · ·aj,σ(τ (j)) · · ·am,σ(τ (m))
=a1,σ(1)
· · ·aj,σ(j)
· · ·ai,σ(i)
=a1,σ(1)
· · ·am,σ(m) .
· · ·am,σ(m)
Nun sieht man, dass sich die Terme in (3.11) gegenseitig aufheben. Es folgt det(A) =
0.
Wir wollen nun untersuchen wie sich die Determinante einer Matrix unter Zeilenumformungen verändert. Zur Erinnerung: es gab drei verschiedene Zeilenumformungen
und diese können durch linksmultiplikation mit Elementarmatrizen realisiert werden. Dies haben wir in Lemma 2.5 gesehen.
Lemma 3.8. Sei K ein Körper, m ∈ N, und A ∈ Matm (K).
(i) (Zeilenaddition) Seien i, j ∈ {1, . . . , m} mit i 6= j und λ ∈ K. Wir setzen
A0 = E I (i, j, λ)A. Dann gilt
det(A0 ) = det(A)
und insbesondere det(E I (i, j, λ)) = 1.
2. DIE DEFINITION DER DETERMINANTE
53
(ii) (Zeilenvertauschen) Seien i, j ∈ {1, . . . , m} mit i 6= j und A0 = E II (i, j)A.
Dann gilt
det(A0 ) = − det(A)
und insbesondere det E II (i, j) = −1.
(iii) (Skalarmultiplikation einer Zeile) Sei i ∈ {1, . . . , m} und λ ∈ K. Wir
setzen A0 = E III (i, λ)A. Dann gilt
det(A0 ) = λ det(A)
und insbesondere det E III (i, λ) = λ.
Beweis. Seien a1 , . . . , am die Zeilen von A.
Eine Zeilenumformung des Typs (I) wie in (i) ersetzt ai durch ai + λaj . Wir zeigen
den Fall i < j, gilt j > i so ist das Argument ähnlich. Wegen Lemma 3.7(i) gilt die
zweite Gleichung in







0
det(A ) = det 







a1

 .. 


 . 






 ai 
ai + λaj 





 .. 

..
+λ
det
=
det




.

 . 





aj

 aj 





..
..




.
.
am
am
{z
}
|
a1
..
.



a1
.. 
. 

aj 

..  .
. 

aj 

.. 
. 
am
det(A)
Ganz rechts steht nun eine Matrix mit zwei gleichen Zeilen. Wegen Lemma 3.7(ii)
muss die entsprechende Determinante gleich 0 sein. Es folgt also det(A0 ) = det(A).
Wenden man nun die eben bewiesen Gleichung auf die Einsmatrix A = Em an, so
folgt det(E I (i, j, λ)) = det(Em ) = 1.
Um (ii) zu zeigen, benötigen wir einen Trick. Wir nehmen wieder i < j an und
definieren die Hilfsmatrix


a1


..


.


 ai + aj 




..
B=
.
.


 ai + aj 




..


.
am
Sie stimmt in allen Zeilen, außer der i-ten und j-ten, mit A überein. Da aber B
zwei gleiche Zeilen besitzt, gilt det(B) = 0.
54
3. DIE DETERMINANTE EINER MATRIX
Nun formen wir det B mit Hilfe von Lemma 3.7(i) zweimal um. Linearität in der
i-ten Zeile ergibt




a1
a1




..
..




.
.








aj
ai








.
.
..
..
0 = det(B) = det 
.
 + det 




 ai + aj 
 ai + aj 








..
..




.
.
am
am
Nun nutzen wir Linearität in der j-ten



a1
a1
 .. 
 ..
 . 
 .



 ai 
 ai



 .. 

0 = det  .  + det  ...



 ai 
 aj



 . 
 .
 .. 
 ..
|
am
{z
}
=0
|
Zeile aus, um


a1
 ..

 .



 aj



 .

 + det  ..


 ai



 .

 ..

am
{z
}
=det(A)
|
am
{z
=det(A0 )



a1
 .. 

 . 




 aj 




 . 

 + det  .. 



 aj 




 . 

 .. 

am
} |
{z
}
=0
zu erhalten. Dass die äußeren beiden Matrizen Determinante Null haben, folgt da
sie beide zwei identische Zeilen besitzen. Wir erhalten
det(A) + det(A0 ) = 0
und daher
det(A0 ) = − det(A).
Die eben bewiesen Gleichung auf die Einsmatrix A = Em angewandt, impliziert
det(E II (i, j)) = − det(Em ) = −1.
Die Behauptung (iii) ist die einfachste. Den Lemma 3.7(i) mit µ = 0 und a0i = 0
ergibt sich




a1
a1
 .. 
 .. 
 . 
 . 





 aj  = λ det(A).
λa
det(A0 ) = det 
=
λ
det
j 



 . 
 . 
 .. 
 .. 
am
am
Die eben bewiesen Gleichung auf die Einsmatrix A = Em angewandt, impliziert
det(E III (i, λ)) = λ det(Em ) = λ.
Wir nähern uns jetzt dem Beweis von Satz 1. Bevor wir die Multiplikativität der
Determinante im Allgemeinen beweisen können, betrachten wir den Spezialfall eines
Produkts aus Elementarmatrizen.
Bemerkung. Seien K, m, A wie im Lemma oben und sei E ? eine Elementarmatrix
von Typ I, II oder III. Geht man die drei Fälle durch, so haben wir
det(E ? A) = det(E ? ) det(A)
bewiesen.
2. DIE DEFINITION DER DETERMINANTE
55
Wir verallgemeinern diese Bemerkung mit einem Induktionsargument.
Lemma 3.9. Sei K ein Körper, m ∈ N und A ∈ Matm (K). Sei L ein endliches
Produkt aus Elementarmatrizen aus Matm (K).
(i) Es gilt
det(LA) = det(L) det(A).
(ii) Wir haben det(L) 6= 0.
Beweis. Wir können L als Produkt E (1) · · · E (N −1) E (N ) schreiben wobei jedes
E eine Elementarmatrix ist.
Der Beweis ist über Induktion auf N . Für N = 0 ist nichts zu zeigen. Das leere
Produkt ist per Definition die Einsmatrix L = Em .
Sei nun N ≥ 1. Dann ist nach Induktionsvoraussetzung
(i)
det(LA) = det(E (1) · · · E (N −1) ) det(E (N ) A).
Die Bemerkung oberhalb des Lemmas impliziert det(E (N ) A) = det(E (N ) ) det(A).
Also
(3.12)
det(LA) = det(E (1) · · · E (N −1) ) det(E (N ) ) det(A).
Wir wenden die Induktionsvoraussetzung ein zweites mal an, um
(3.13)
det(E (1) · · · E (N −1) ) det(E (N ) ) = det(E (1) · · · E (N ) ) = det(L)
zu erhalten. Nach Voraussetzung ist det(E (1) · · · E (N −1) ) 6= 0 und Lemma 3.8 impliziert det(E (N ) ) 6= 0. Also folgt det L 6= 0 und somit Teil (ii).
Die Gleichung (3.13) zusammen mit (3.12) impliziert Teil (i).
Beweis von Satz 1. Sei A ∈ Matm (K). Wir zeigen zuerst, dass
(3.14)
A ist invertierbar
⇐⇒
det(A) 6= 0
gilt. Wie immer müssen wir beide Implikationsrichtungen beweisen.
Aus den Resultaten von Kapitel 2, genauer aus Lemma 2.8, wissen wir, dass sich A
durch endlich viele Zeilenumformungen in Zeilenstufenform A0 bringen lässt. Zeilenumformungen entstehen durch linksmultiplikation mit Elementarmatrizen wegen
Lemma 2.5. Folglich gilt A0 = LA wobei L ein endliches Produkt aus Elementarmatrizen in Matm (K) ist.
Lemma 3.9 ergibt
(3.15)
det(A0 ) = det(L) det(A)
und
det(L) 6= 0.
Eine quadratische Matrix in Zeilenstufenform ist entweder die Einsmatrix oder
besitzt eine Nullzeile.
Nehmen wir zuerst an, dass A invertierbar ist. Dann ist A0 A−1 = L invertierbar.
Hätte nun A0 eine Nullzeile, dann würde auch L eine Nullzeile besitzen. Es gäbe
also wegen Korollar 2.10 eine nichttriviale Lösung x ∈ K m r {0} von Lx = 0, weil
man die Nullzeile von L nicht berücksichtigen muss. Dies ist ein Widerspruch da
x = L−1 Lx = 0. Also besitzt A0 keine Nullzeile und es muss A0 = Em gelten.
Aus (3.15) folgt nun 1 = det(L) det(A) und daher insbesondere det(A) 6= 0. Somit
haben wir die Implikation “=⇒” in (3.14) gezeigt.
Wir nun umgekehrt an, dass det(A) 6= 0. Aber wir wissen auch det(L) 6= 0. Also
folgt det(A0 ) 6= 0. Somit kann A0 wegen Lemma 3.6 keine Nullzeile besitzen. Also
ist A0 die Einsmatrix. Wir erhalten LA = Em . Aus Proposition 2.11 folgt die
Invertierbarkeit von A und somit die Richtung “⇐=” in (3.14).
56
3. DIE DETERMINANTE EINER MATRIX
Der Beweis vom ersten Teil des Satzes ist geliefert. Seien also A, B ∈ Matm (K).
Wir müssen zeigen, dass det(AB) und det(A) det(B) gleich sind.
Wie oben bringen wir A in Zeilenstufenform A0 = LA wobei L ein endliches Produkt aus Elementarmatrizen ist. Um den Beweis abzuschließen, müssen wir eine
Fallunterscheidung machen.
Fall 1: Die Matrix A ist nicht invertierbar. Dann kann A0 nicht die Einsmatrix sein wegen Proposition 2.11. Also muss A0 eine Nullzeile besitzen. Daher
besitzt auch A0 B eine Nullzeile. Wegen Lemma 3.6 gilt det(LAB) = det(A0 B) = 0.
Schließlich impliziert Lemma 3.9(i) det(LAB) = det(L) det(AB). Zusammengefasst
ergibt sich det(L) det(AB) = 0 und sogar det(AB) = 0 wegen Teil (ii) von Lemma
3.9. Der erste Teil des Satzes liefert auch det A = 0. Somit haben wir
det(AB) = 0 = det(A) det(B),
was zu zeigen war.
Fall 2: Die Matrix A ist invertierbar. Wie wir bereits im Beweis des ersten
Teils gesehen haben, muss A0 = Em sein. Wir haben also LAB = B. Wir wissen,
dass
1 = det(Em ) = det(LA) = det(L) det(A)
und
det(B) = det(LAB) = det(L) det(AB)
gelten muss, siehe Lemma 3.9. Multiplizieren wir die zweite Gleichung mit det(A)
so erhalten wir
det(A) det(B) = det(AB).

Zugehörige Unterlagen

Lineare Algebra I

4 Sei die Abbildung 1) Bestimmen Sie, bei welchen Punkten lokal

LINEARE ALGEBRA II ¨UBUNGSBLATT NR. 4 Aufgaben für die

Document

(0 Punkte) (a)

Lineare Algebra - Goethe

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können