Algorithmische Mathematik 1

Algorithmische Mathematik 1
Ein Skriptum zur Vorlesung im WS
2004/05
Franz Pauer
4.Auflage
c 2005 F RANZ PAUER
I NNSBRUCK , Ö STERREICH
Vorwort
Das vorliegende Skriptum soll den Hörerinnen und Hörern der Vorlesung Algorithmische Mathematik 1“ im Wintersemester 2004/05 das Mit”
schreiben und Mitdenken in der Vorlesung erleichtern. Das Skriptum enthält
alle Algorithmen, Definitionen und Sätze der Vorlesung, aber fast keine Beispiele dazu. In der Vorlesung werden die Algorithmen, Definitionen und
Sätze motiviert, der Zusammenhang mit früheren Ergebnissen erläutert und
Beispiele dazu besprochen.
Die Hauptziele dieser Vorlesung sind:
• Zahlenbereiche, in denen exakt (also ohne zu runden) gerechnet werden kann, aufzubauen (Kapitel 1 und 5).
Dazu werden Möglichkeiten zur Darstellung von ganzen, rationalen
und algebraischen Zahlen sowie Verfahren zum Rechnen mit diesen
Zahlen vorgestellt. Grundlegend dafür sind die Division mit Rest,
der Euklidische Algorithmus und der erweiterte Euklidische Algorithmus.
• Systeme linearer Gleichungen zu lösen (Kapitel 2).
Die Fragen, wann es eine Lösung gibt, ob sie eindeutig ist und wie
Lösungen berechnet werden können, werden vollständig beantwortet. Weiters wird gezeigt, wie die Menge aller Lösungen durch endlich viele Daten beschrieben werden kann. Dazu muss die Matrizenrechnung eingeführt und auf die Theorie der Vektorräume eingegangen werden. Das zentrale Rechenverfahren zur Lösung von Systemen
linearer Gleichungen ist der Gauss-Algorithmus.
• Eigenwertprobleme zu lösen(Kapitel 6).
Dazu benötigte Hilfsmittel sind Determinanten und polynomiale Abbildungen.
Für diese drei Themen ist das Rechnen mit Abbildungen (Kapitel 3) und
mit Polynomen (Kapitel 4) von großer Bedeutung.
Im Kapitel 0 werden einige Grundbegriffe der Mathematik eingeführt.
Dieses Skriptum hat viel mit den Skripten Lineare Algebra (Dür, A.
und Pauer, F., Institut für Mathematik, Universität Innsbruck, 2004, 4. Auflage) und Algebra (Pauer, F., Institut für Mathematik, Universität Innsbruck,
2000, 2. Auflage) gemeinsam.
Von den ersten drei Auflagen (September 2001, 2002 und 2003) unterscheidet sich diese vierte Auflage nur durch einige Korrekturen und kleinere
Veränderungen.
ii
iii
Franz Pauer
VORWORT
Innsbruck, September 2004
Inhaltsverzeichnis
Vorwort
ii
Kapitel 0. Mengen und Abbildungen
1. Mengen
2. Durchschnitt, Vereinigung und Komplement
3. Abbildungen
4. Familien, Tupel, Folgen und kartesisches Produkt
5. Zusammengesetzte Aussagen
6. Der Induktionsbeweis
1
1
2
3
5
8
8
Kapitel 1. Rechnen mit ganzen und rationalen Zahlen
1. Rechenregeln für ganze Zahlen
2. Division mit Rest
3. Zifferndarstellung von Zahlen
4. Rationale Zahlen
5. Zifferndarstellung von rationalen Zahlen
6. Der Euklidische Algorithmus
7. Primzahlen
8. Gruppen
9. Ringe und Körper
10. Restklassen
10
10
11
12
15
18
19
22
24
27
30
Kapitel 2. Systeme linearer Gleichungen
1. Matrizen
2. Elementare Umformungen
3. Systeme linearer Gleichungen
4. Vektorräume
5. Erzeugendensysteme, lineare Unabhängigkeit und Basen
6. Der Gauss-Algorithmus
34
34
39
41
43
45
49
Kapitel 3. Rechnen mit Abbildungen
1. Permutationen
2. Polynomiale Abbildungen
3. Lineare Abbildungen
4. Die Matrix einer linearen Abbildung
5. Basiswechsel
56
56
60
63
65
69
Kapitel 4. Polynome
1. Der Polynomring
73
73
iv
v
INHALTSVERZEICHNIS
2.
3.
4.
5.
6.
7.
Nullstellen von Polynomen
Interpolation
Der Euklidische Algorithmus für Polynome
Irreduzible Polynome
Die Anzahl der Nullstellen eines Polynoms
Polynome in mehreren Variablen
75
77
78
80
82
84
Kapitel 5. Erweiterungen des Zahlenbereichs
1. Algebraische Elemente und Minimalpolynome
2. Existenz von Nullstellen
3. Endliche Körper
87
87
89
92
Kapitel 6. Eigenwertprobleme
1. Eigenwerte und Eigenvektoren
2. Determinanten
3. Berechnung von Eigenwerten
93
93
94
99
KAPITEL 0
Mengen und Abbildungen
1. Mengen
Definitionen setzen Vorwissen voraus. Zum Beispiel setzt die Definition
Ein Quadrat ist ein gleichseitiges Rechteck“
”
voraus, dass bekannt ist, was gleichseitig“ und Rechteck“ bedeuten. Die
”
”
Definition
Eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird“
”
setzt voraus, dass bekannt ist, was ganze Zahl“ und teilen“ bedeuten. Für
”
”
Definitionen wird häufig die folgende Kurzschreibweise verwendet:
zu definierender Begriff := definierende (schon bekannte) Begriffe .
Zum Beispiel:
Quadrat := gleichseitiges Rechteck
(in Worten: ein Quadrat ist ein gleichseitiges Rechteck)
und
gerade Zahl := ganze Zahl, die von 2 geteilt wird
(in Worten: eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird).
Der Begriff Menge“ ist jedoch ein Grundbaustein der Mathematik, der
”
nicht definiert, sondern nur umschrieben wird: Eine Menge ist eine Zusammenfassung unterscheidbarer Objekte. Diese heißen Elemente der Menge.
Eine Menge kann auf zwei Arten angegeben werden:
(1) durch Anschreiben der Elemente zwischen geschweiften Klammern,
zum Beispiel {7, 3, 5, 8, 1} , {Meier, Müller} ;
oder
(2) durch ihre Eigenschaften, zum Beispiel
{n | n ganze Zahl, n ist größer als 0 und kleiner als 7}
(Sprechweise: die Menge aller n, für die gilt: n ist eine ganze Zahl,
”
die größer als 0 und kleiner als 7 ist“ oder die Menge aller ganzen
”
Zahlen, die größer als 0 und kleiner als 7 sind“).
Bezeichnungen:
0/ := {}
leere Menge
(Menge ohne Elemente)
N := {0, 1, 2, 3, . . .}
Menge der natürlichen Zahlen
Z := {0, 1, −1, 2, −2, . . .}
Menge der ganzen Zahlen
Ist M eine Menge, so wird
1
2
0. MENGEN UND ABBILDUNGEN
e∈M
für e ist ein Element von M“ geschrieben, und analog
”
e∈
/M
für e ist kein Element von M“.
”
Auf logische Probleme, die bei der Einführung des Begriffes Menge“
”
auftreten, gehen wir hier nicht ein. Das Russell’sche Paradoxon“ zeigt,
”
dass man nicht zu sorglos sein darf:
Gilt für M := {A | A Menge, A ∈
/ A} die Beziehung M ∈ M ?
Beispiel 1 : 1 ∈ N , −1 6∈ N , 1 6∈ 0.
/
Definition 1 : M und N seien Mengen. M heißt Teilmenge von N, in Zeichen
M ⊂ N oder M ⊆ N ,
wenn jedes Element von M auch Element von N ist.
M 6⊂ N
bedeutet, dass M nicht Teilmenge von N ist. Die Mengen M und N sind
gleich, in Zeichen
M=N,
wenn M ⊂ N und N ⊂ M ist. Falls M und N nicht gleich sind, schreibt man
M 6= N .
Schließlich bedeutet
M$N,
dass M ⊂ N und M 6= N ist, und man nennt M eine echte Teilmenge von
N.
Beispiel 2 : Für alle Mengen N ist N ⊆ N und 0/ ⊆ N. Es ist {a, b, c} =
{b, a, c} = {c, a, b}, beim Anschreiben der Elemente einer Menge kann die
Reihenfolge also beliebig gewählt werden.
2. Durchschnitt, Vereinigung und Komplement
Definition 2 : M und N seien Mengen. Der Durchschnitt von M und N ist
die Menge
M ∩ N := {a | a ∈ M und a ∈ N} .
Die Mengen M und N sind disjunkt, wenn ihr Durchschnitt leer ist.
Die Vereinigung von M und N ist die Menge
M ∪ N := {a | a ∈ M oder a ∈ N} ,
3
0. MENGEN UND ABBILDUNGEN
wobei mit oder“ das einschließende Oder ( und-oder“) und nicht das aus”
”
schließende Oder ( entweder-oder“) gemeint ist. Das Komplement von N in
”
M bzw. die Mengendifferenz von M und N ist
M \ N := {a | a ∈ M und a 6∈ N} .
Beispiel 3 :
{1, 2, 3} ∩ {4, 3, 5} = {3} ,
{1, 2, 3} ∪ {4, 3, 5} = {1, 2, 3, 4, 5} ,
{1, 2, 3} \ {4, 3, 5} = {1, 2} .
Definition 3 : Sind M, N und P Mengen, so bedeutet
M ∩ (N ∪ P) ,
dass zuerst die Vereinigung von N und P gebildet wird und danach der
Durchschnitt von M mit N ∪ P. Analog wird für andere Verknüpfungen die
Reihenfolge durch Klammerung festgelegt.
3. Abbildungen
M und N seien Mengen. Eine Abbildung oder Funktion von M nach N ist
eine Vorschrift, die jedem Element von M genau ein Element von N zuordnet. M heißt dann der Definitionsbereich der Abbildung, N der Bildbereich.
Die Schreibweisen
f : M → N , m 7→ f (m) ,
oder
f : M −→
N
m 7→ f (m)
bedeuten, dass f eine Abbildung von M nach N ist, die dem Element m ∈
M das Element f (m) ∈ N zuordnet. Das Element f (m) heißt Bild von m
(bezüglich f ). Ein Element m ∈ M mit f (m) = n ∈ N heißt ein Urbild von
n (bezüglich f ).
Beispiel 4 : Die Abbildung
f : N → Z , z 7→ 2z − 3 ,
ordnet jeder natürlichen Zahl z die ganze Zahl 2z − 3 zu. Das Bild von 0
bzw. 1 bzw. 2 bezüglich f ist −3 bzw. −1 bzw. 1.
Definition 4 : Seien f : M → N und g : P → Q Abbildungen. Dann sind f
und g gleich, in Zeichen
f = g,
wenn gilt: M = P, N = Q und für alle m ∈ M ist f (m) = g(m).
4
0. MENGEN UND ABBILDUNGEN
Definition 5 : Sei M eine beliebige Menge. Dann heißt die Abbildung
IdM : M → M , m 7→ m ,
die identische Abbildung oder Identität auf M.
Definition 6 : Seien f : M → N eine Abbildung, A ⊂ M und B ⊂ N. Dann
heißt
f (A) := { f (a) | a ∈ A} ⊂ N
das Bild von A (bezüglich f ),
Bild( f ) := f (M)
heißt das Bild von f , und
f −1 (B) := {m ∈ M | f (m) ∈ B}
heißt das Urbild von B (bezüglich f ). Die Abbildung
f |A : A → N, a 7→ f (a),
heißt die Einschränkung von f auf A. Man sagt f bildet A auf B ab“, wenn
”
f (A) = B ist.
Definition 7 : Seien f : M → N und g : P → Q Abbildungen mit
Dann heißt die Abbildung
Bild( f ) ⊂ P .
g ◦ f : M → Q, m 7→ g( f (m)),
die Hintereinanderausführung oder Zusammensetzung von f und g (sprich
g nach f“). Oft wird statt g ◦ f nur g f geschrieben.
”
Beispiel 5 : Die Hintereinanderausführung von
und
ist
f : N → Z , z 7→ 2z + 1 ,
g : Z → Z , z 7→ 3z − 7 ,
g f : N → Z , z 7→ 6z − 4 .
Satz 1 : Seien f : M → N, g : P → Q und h : R → S Abbildungen mit
Bild( f ) ⊂ P und Bild(g) ⊂ R. Dann gilt
h ◦ (g ◦ f ) = (h ◦ g) ◦ f =: h ◦ g ◦ f ,
d.h. bei mehrfacher Hintereinanderausführung von Abbildungen kommt es
nicht auf die Reihenfolge an (die Hintereinanderausführung von Abbildungen ist assoziativ, auf das Setzen von Klammern kann verzichtet werden).
5
0. MENGEN UND ABBILDUNGEN
Beweis: Sowohl h ◦ (g ◦ f ) als auch (h ◦ g) ◦ f sind Abbildungen von M
nach S. Für jedes m ∈ M ist
(h ◦ (g ◦ f ))(m) = h((g ◦ f )(m)) = h(g( f (m))) = (h ◦ g)( f (m))
= ((h ◦ g) ◦ f )(m).
Definition 8 : Eine Abbildung f : M → N heißt injektiv bzw. surjektiv,
wenn jedes Element von N höchstens bzw. mindestens ein Urbild hat. Eine
Abbildung f : M → N heißt bijektiv, wenn jedes Element von N genau ein
Urbild hat.
Wenn f : M → N bijektiv ist, dann heißt die (ebenfalls bijektive) Abbildung
f −1 : N → M, n 7→ Urbild von n bezüglich f ,
die zu f inverse Abbildung oder die Umkehrabbildung von f .
Eine Abbildung ist also genau dann bijektiv, wenn sie sowohl injektiv
als auch surjektiv ist. Eine Abbildung ist genau dann surjektiv, wenn ihr Bild
und ihr Bildbereich gleich sind. Eine Abbildung ist genau dann injektiv,
wenn die Bilder von je zwei verschiedenen Elementen wieder verschieden
sind.
Definition 9 : Eine Menge M heißt endlich, wenn sie leer ist oder es ein
n ∈ N und eine bijektive Abbildung f : {1, . . ., n} → M gibt. Man nennt
dann
#(M) := n
die Anzahl der Elemente von M. Die leere Menge hat 0 Elemente.
M heißt unendlich, wenn M nicht endlich ist.
4. Familien, Tupel, Folgen und kartesisches Produkt
Eine Abbildung f : I → M wird manchmal in der Form
( f (i))i∈I
oder
( fi )i∈I
geschrieben und als Familie von Elementen in M, indiziert durch I, bezeichnet. I heißt dann die Indexmenge der Familie ( f i )i∈I . Die Familie ( fi )i∈I
heißt endlich, wenn I endlich ist.
Wichtige Spezialfälle sind:
(1) Eine Abbildung x : {1, 2, . . ., n} → M , i 7→ x(i) , wird in der Form
(x1 , . . ., xn ) = (xi )1≤i≤n = (xi )i∈{1,...,n}
geschrieben und heißt ein n-Tupel von Elementen in M. Das Element
xi heißt dann i-te Komponente von (x1 , . . . , xn ). In den Spezialfällen
6
0. MENGEN UND ABBILDUNGEN
n = 2, 3 nennt man (x1 , . . ., xn ) ein Paar bzw. Tripel. Die Menge aller
n-Tupel von Elementen in M wird mit
Mn
bezeichnet (sprich M hoch n“). Für x, y ∈ M n gilt
”
x=y
genau dann, wenn xi = yi für i = 1, . . ., n ist.
Ein Paar (a, b) enthält mehr Information“ als die Menge
”
{a, b}. Es ist {a, b} = {b, a}, aber (a, b) = (b, a) nur dann, wenn
a = b ist.
(2) Seien m ∈ N und I := {i ∈ N | i ≥ m}. Eine Abbildung
x : I → M , i 7→ x(i) , wird in der Form
(xi )i≥m
geschrieben und heißt eine Folge in M.
Man beachte, dass (xi )i≥m 6= {xi | i ≥ m} ist.
Definition 10 : M und N seien Mengen. Dann heißt
M × N := {(x, y) | x ∈ M und y ∈ N} ⊆ (M ∪ N)2
das kartesische Produkt von M und N. Die Abbildungen
pr1 : M × N → M , (x, y) 7→ x ,
und
pr2 : M × N → N , (x, y) 7→ y ,
heißen Projektionen auf den ersten bzw. zweiten Faktor.
Definition 11 : Sei f : M → N eine Abbildung. Dann heißt die Menge
Graph( f ) := {(m, f (m)) | m ∈ M} ⊆ M × N
der Graph von f .
Satz 2 : Zwei Abbildungen von M nach N sind genau dann gleich, wenn
ihre Graphen gleich sind.
Beweis: Es ist zu zeigen:
1. Wenn zwei Abbildungen von M nach N gleich sind, dann sind auch
ihre Graphen gleich.
2. Wenn die Graphen zweier Abbildungen von M nach N gleich sind,
dann sind diese zwei Abbildungen gleich.
Seien f und g Abbildungen von M nach N.
Zu 1): Wenn f = g ist, dann ist f (m) = g(m) für alle m ∈ M. Daher ist
Graph( f ) = {(m, f (m)) | m ∈ M} =
= {(m, g(m)) | m ∈ M} = Graph(g) .
7
0. MENGEN UND ABBILDUNGEN
Zu 2): Wenn Graph( f ) = Graph(g) ist, dann ist für alle m ∈ M das Paar
(m, f (m)) ein Element von Graph(g). In Graph(g) gibt es genau ein Element, dessen erste Komponente m ist, nämlich (m, g(m)). Also ist f (m) =
g(m) für alle m ∈ M, somit ist f = g.
Definition 12 : Sei (Mi )i∈I eine Familie von Mengen. Dann heißt
∏ Mi := {(xi)i∈I | für alle i ∈ I ist xi ∈ Mi}
i∈I
das kartesische Produkt der Mengen Mi , i ∈ I. Für j ∈ I heißt
pr j : ∏ Mi → M j , (xi )i∈I 7→ x j ,
i∈I
die Projektion auf den j-ten Faktor.
Im Spezialfall I = {1, . . . , n} wird für ∏i∈I Mi auch
n
∏ Mi
i=1
geschrieben.
oder
M1 × . . . × Mn
8
0. MENGEN UND ABBILDUNGEN
5. Zusammengesetzte Aussagen
Wir betrachten Aussagen A, B,C, . . . , die nach Vereinbarung entweder
wahr oder falsch sind. Mit Hilfe der Worte
und“
(Zeichen: ∧) ,
”
oder“
(Zeichen: ∨) ,
”
nicht“
(Zeichen: ¬) ,
”
wenn, dann“
(Zeichen: ⇒) ,
”
genau dann, wenn“ (Zeichen: ⇔)
”
bilden wir zusammengesetzte Aussagen, deren Wahrheitswert“ wir durch
”
die folgende Tabelle definieren. Dabei steht w für wahr“ und
”
f für falsch“.
”
A B A ∧ B A ∨ B ¬A A ⇒ B A ⇔ B
w w
w
w
f
w
w
w f
f
w
f
f
f
f w
f
w
w
w
f
f f
f
f
w
w
w
Für A ⇒ B verwendet man statt wenn A, dann B“ auch die Sprechwei”
sen aus A folgt B“ oder A impliziert B“.
”
”
Man beachte:
A ist genau dann wahr, wenn ¬A falsch ist. Das wird für indirekte Beweise
verwendet: anstatt zu zeigen, dass eine Aussage A wahr ist, wird gezeigt,
dass ihr Gegenteil“ ¬A falsch ist.
”
In der Mathematik bedeutet das Wort oder“ immer das nicht ausschließen”
de und-oder“ und nicht das ausschließende entweder-oder“.
”
”
Ist A falsch, dann ist die Aussage A ⇒ B immer wahr ( ex falso quodlibet“).
”
6. Der Induktionsbeweis
Sei m eine natürliche Zahl (meistens 0 oder 1) und sei
(Am , Am+1 , Am+2 , . . .) eine Folge von Aussagen.
Satz 3 : Wenn
(1) Am wahr ist und
(2) für alle n > m aus An−1 auch An folgt,
dann sind alle Aussagen An , n ≥ m , wahr.
Damit erhält man eine Methode, die Gültigkeit der Aussagen An , n ≥ m,
zu zeigen ( Beweis durch vollständige Induktion“): Es genügt zu zeigen,
”
dass (1) ( Induktionsanfang“) und (2) ( Induktionsschluss“) richtig sind.
”
”
Um zu zeigen, dass (2) richtig ist, nimmt man an, dass An−1 wahr ist ( In”
duktionsannahme“) und versucht damit zu zeigen, dass auch A n wahr ist.
Man könnte im Satz die Annahme (2) auch durch
(2’) für alle n > m aus Am , Am+1 , . . . , An−1 auch An folgt,
9
0. MENGEN UND ABBILDUNGEN
ersetzen.
Beweis: Wir benutzen die folgende Eigenschaft der natürlichen Zahlen: jede Teilmenge von N hat ein kleinstes Element. Wir führen den Beweis indirekt und nehmen an, dass nicht alle Aussagen An , n ≥ m , wahr sind. Dann
ist die Menge
M := {n ∈ N | n ≥ m und An ist falsch}
nicht leer. Daher gibt es eine kleinste Zahl k so, dass k ≥ m und Ak falsch
ist. Wegen (1) gilt k ≥ m + 1 , also k − 1 ≥ m. Weiters muss Ak−1 wahr sein,
weil k die kleinste Zahl in M ist. Aus (2) folgt nun, dass auch Ak wahr ist,
was einen Widerspruch bedeutet. Somit muss unsere Annahme am Anfang
des Beweises falsch sein, d.h. alle Aussagen An , n ≥ m , sind wahr.
Satz 4 : Sei n eine natürliche Zahl. Die Summe der Quadrate aller natürlichen Zahlen von 1 bis n ist S(n) := 61 (2n3 + 3n2 + n).
Beweis: Induktionsanfang: S(1) = 61 (2 + 3 + 1) = 1 = 12 , also ist die Aussage für n = 1 wahr.
Induktionsschluss: Wir nehmen an, dass die Summe der Quadrate aller natürlichen Zahlen von 1 bis n − 1 gleich S(n − 1) ist. Die Summe der Quadrate
aller natürlichen Zahlen von 1 bis n ist dann
Wegen
S(n − 1) + n2 .
1
S(n − 1) + n2 = (2(n − 1)3 + 3(n − 1)2 + n − 1) + n2 = S(n)
6
ist die Behauptung richtig.
KAPITEL 1
Rechnen mit ganzen und rationalen Zahlen
1. Rechenregeln für ganze Zahlen
Wir setzen die Menge Z := {. . ., −2, −1, 0, 1, 2, . . .} der ganzen Zahlen
mit der Addition Z × Z −→ Z , (a, b) 7−→ a + b, und der Multiplikation Z × Z −→ Z , (a, b) 7−→ a · b, als bekannt voraus. Dabei gelten die
folgenden Rechenregeln: Sind a, b, c ganze Zahlen, dann ist
• (a + b) + c = a + (b + c) =: a + b + c ( Die Addition von ganzen Zah”
len ist assoziativ“, das heißt: auf Klammern kann verzichtet werden).
• 0+a = a+0 = a
• a + (−a) = (−a) + a = 0 (dabei ist −a := (−1) · a)
• a + b = b + a ( Die Addition ist kommutativ“).
”
• (a · b) · c = a · (b · c) =: a · b · c ( Die Multiplikation ist assoziativ“).
”
• 1·a = a·1 = a
• a · b = b · a ( Die Multiplikation ist kommutativ“).
”
• (a + b) · c = (a · c) + (b · c) =: a · c + b · c ( Distributivgesetz“)
”
Sind m, n ∈ Z , m ≤ n und am , am+1 , . . . , an ∈ Z , dann schreiben wir
n
∑ ai
i=m
für am + am+1 + . . . + an und
n
∏ ai
i=m
für am · am+1 · . . . · an . (Sprechweise: Die Summe bzw. das Produkt aller ai
”
mit i von m bis n“).
Man prüft leicht nach:
Seien p, q ∈ Z , p ≤ q und b p , . . . , bq ∈ Z . Dann gilt
!
!
!
!
n
∑ ai ·
i=m
q
∑ bj
j=p
n
=
∑
i=m
q
∑ ai b j
j=p
=
q
n
j=p
i=m
∑ ∑ ai b j
.
Für a, b, c ∈ Z mit c 6= 0 folgt aus a · c = b · c, dass a = b ist. ( In Z kann
”
gekürzt werden“). Insbesondere folgt aus a · b = 0, dass a = 0 oder b = 0
ist.
Die Subtraktion ist durch Z × Z −→ Z , (a, b) 7−→ a − b := a + (−b),
gegeben.
Es sei ≤ die durch
a ≤ b :⇔ b − a ∈ N
10
11
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
definierte natürliche Ordnung der ganzen Zahlen, wir schreiben a < b für:
a ≤ b und a 6= b.
Für a, b, c ∈ Z gilt:
a≤a ,
aus a ≤ b und b ≤ a folgt a = b ,
aus a ≤ b und b ≤ c folgt a ≤ c ,
a ≤ b oder b ≤ a ,
a ≤ b genau dann, wenn a + c ≤ b + c ist
und
wenn c > 0 ist, dann ist a ≤ b genau dann, wenn a · c ≤ b · c ist.
Die ersten vier Eigenschaften bedeuten, dass ≤ eine totale Ordnung auf Z
ist, die letzten zwei, dass diese mit Addition und Multiplikation vertr äglich
ist.
Das Vorzeichen vz(a) einer ganzen Zahl a ist 1, wenn a ∈ N , und −1, wenn
a 6∈ N . Der Betrag |a| einer ganzen Zahl a ist vz(a) · a. Für Zahlen a, b ∈ Z
ist |a · b| = |a| · |b| und |a + b| ≤ |a| + |b|.
Eine ganze Zahl ist positiv bzw. negativ, wenn sie größer bzw. kleiner als 0
ist.
2. Division mit Rest
Wenn Sie einen Sack mit a Euromünzen haben, die Sie an b Personen
verteilen sollen (jede soll gleich viel bekommen), dann werden Sie wahrscheinlich zuerst jeder Person einen Euro geben und diesen Vorgang solange wiederholen, bis im Sack weniger als b Euromünzen sind. Sie haben
dann a mit Rest durch b dividiert.
Der folgende Satz ist grundlegend für alle Rechenverfahren für ganze Zahlen. Seine Bedeutung liegt darin, dass die drei Strukturen“ +, · und ≤
”
zueinander in Beziehung gesetzt werden.
Satz 5 : (Division mit Rest von ganzen Zahlen)
Zu je zwei ganzen Zahlen a und b mit b 6= 0 gibt es eindeutig bestimmte
ganze Zahlen m und r mit den Eigenschaften
a = m·b+r
und 0 ≤ r < |b| .
Die Zahlen m bzw. r heißen ganzzahliger Quotient von a und b bzw. Rest
von a nach Division durch b. Die Zahlen m und r können mit dem folgenden
Verfahren (Divisionsalgorithmus) berechnet werden:
• Falls a und b natürliche Zahlen sind:
Setze m := 0 und r := a.
Solange r ≥ b ist, ersetze r durch r − b und m durch m + 1.
• Falls a < 0 oder b < 0 ist:
Berechne wie oben n und s so, dass |a| = n · |b| + s und
0 ≤ s < |b| ist.
Wenn a ≥ 0 ist, dann setze m := −n und r := s.
12
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Wenn a < 0 und s > 0 ist, dann setze m := −vz(b) · (n + 1) und r :=
|b| − s.
Wenn a < 0 und s = 0 ist, dann setze m := −vz(b) · n und r := 0.
Beweis: Wenn a und b natürliche Zahlen sind, dann erhalten wir bei jedem
Ersetzen von r durch r − b eine um mindestens 1 kleinere Zahl. Also tritt
nach höchstens a Schritten der Fall r < b ein. Somit liefert das obige Verfahren nach endlich vielen Schritten ein Ergebnis m, r. Mit Induktion über
|a| ist leicht nachzuprüfen, dass diese Zahlen die angegebenen Bedingungen erfüllen.
Es seien m1 , m2 , r1 , r2 ganze Zahlen mit a = m1 · b + r1 = m2 · b + r2 , 0 ≤
r1 , r2 < |b| und o.E.d.A. ( ohne Einschränkung der Allgemeinheit“) r1 ≤ r2 .
”
Dann ist
|b| > r2 − r1 = |m1 − m2 | · |b| .
Daraus folgt m1 = m2 und r1 = r2 , also sind der ganzzahlige Quotient von
a und b und der Rest von a nach Division durch b eindeutig bestimmt.
3. Zifferndarstellung von Zahlen
Nehmen wir an, Sie kommen mit einem Sack voller Euromünzen in eine
Bank und wollen dieses Geld auf ihr Sparbuch einzahlen. Die Anzahl der
Euromünzen im Sack ist eine eindeutig bestimmte natürliche Zahl a. Bevor
diese Zahl in Ihr Sparbuch eingetragen werden kann, muss der Bankbeamte
ihre Zifferndarstellung (zur Basis 10) berechnen. Eine Zahl ist also nicht
immer schon in Zifferndarstellung gegeben, sondern diese ist eine Zusatz”
information“ über die Zahl. Wie wird die Zifferndarstellung zur Basis 10
von a ermittelt? Man bildet aus den Euromünzen solange Zehnerstapel“,
”
bis nur noch weniger als zehn Münzen übrigbleiben, das heißt: a wird mit
Rest durch 10 dividiert. Die Anzahl der übriggebliebenen Euromünzen ist
dann die Einerziffer“ von a. Macht man dasselbe nun mit den Zehner”
stapeln statt mit den Münzen, dann erhält man die Zehnerziffer“ von a,
”
usw.
Satz 6 : (Darstellung von Zahlen durch Ziffern)
Es seien a und b natürliche Zahlen mit a 6= 0 und b ≥ 2. Dann gibt es
eindeutig bestimmte natürliche Zahlen n, z0 , z1 , . . ., zn so, dass
zn 6= 0, 0 ≤ z0 , z1 , . . ., zn < b
und
a = zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 =
n
∑ zi b i
i=0
ist.
Wenn b fest gewählt ist, dann ist a durch die Zahlen n, z0 , z1 , . . . , zn eindeutig
13
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
bestimmt. Man wählt Zeichen für die Zahlen von 0 bis b − 1 und schreibt
dann
n
zn zn−1 . . . z0
statt
∑ zi b i
.
i=0
Die Zahlen z0 , z1 , . . ., zn heißen Ziffern von a zur Basis b (für b=2 bzw. 10:
Binärziffern“ bzw. Dezimalziffern“).
”
”
Die Ziffern zi von a 6= 0 zur Basis b können mit dem folgenden Verfahren
berechnet werden:
• Setze i := 0.
• Solange a nicht 0 ist: Die i-te Ziffer zi ist der Rest von a nach Division
durch b. Ersetze a durch den ganzzahligen Quotienten von a und b.
Ersetze i durch i + 1.
Beweis: Induktion über a:
Wenn a = 1 ist, ist n = 0 und z0 = 1.
Für a > 1 seien m bzw. r der ganzzahlige Quotient von a und b bzw. der Rest
von a nach Division durch b. Wegen b > 1 ist m < a, also gibt es nach Induktionsannahme eindeutig bestimmte Zahlen k, y0 , y1 , . . ., yk so, dass yk 6= 0,
0 ≤ y0 , y1 , . . ., yk < b und
m = yk bk + yk−1 bk−1 + . . . + y1 b1 + y0
ist. Dann ist
a = m · b + r = yk bk+1 + yk−1 bk + . . . + y1 b2 + y0 b + r ,
und yk , . . ., y0 , r sind die Ziffern von a. Aus der Eindeutigkeit von m und
r folgt aus der Induktionsannahme die Eindeutigkeit der Ziffern von a zur
Basis b.
Wird für die Zifferndarstellung einer Zahl die Basis b gewählt, dann
können alle Zahlen durch Aneinanderreihen von b verschiedenen Symbolen
angeschrieben werden. Eine kleine Basis (zum Beispiel 2) hat den Vorteil,
dass man nur wenige Symbole braucht und dass das kleine Einmaleins“
”
sehr einfach ist. Allerdings braucht man dann für größere Zahlen sehr viele
Ziffern.
Definition 13 : Es seien v = (v1 , . . ., vn ) und w = (w1 , . . . , wn ) zwei verschiedene n-Tupel von ganzen Zahlen und j die kleinste Zahl in {1, . . ., n}
mit der Eigenschaft, dass v j 6= w j ist.
Dann ist v lexikographisch kleiner als w (Schreibweise: v <lex w), wenn
v j < w j ist.
14
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beispiel 6 : (1, 2, 3, 4) <lex (1, 2, 4, 3) <lex (2, −7, −3, −5)
Satz 7 : (Vergleich von zwei Zahlen, die durch Ziffern dargestellt sind) Es
seien b, x, y positive natürliche Zahlen, b ≥ 2 und
xk , xk−1 , . . ., x0
y` , y`−1 , . . ., y0
bzw.
die Ziffern von x bzw. y bezüglich b.
Dann ist x genau dann kleiner als y, wenn
k < ` oder
(k = ` und (xk , xk−1 , . . . , x0 ) <lex (y` , y`−1 , . . . , y0 )) ist.
Beweis: Wenn k < ` ist, dann ist
k
x = ∑ xi b ≤
i
i=0
k
∑ (b − 1)b
i
k+1
=
i=0
k
∑ b − ∑ bi = bk+1 − 1 < bk+1 ≤ y .
i
i=1
i=0
Es seien k = ` und j die größte Zahl mit der Eigenschaft, dass x j 6= y j ist.
Wenn x j < y j ist, dann ist
j
∑ xi b
j
i
i=0
≤ x j b + (b − 1) < (x j + 1)b ≤ y j b ≤ ∑ yi bi
j
j
j
i=0
und
k
x=
j
∑
i= j+1
j
xi b i + ∑ xi b i <
i=0
k
∑
i= j+1
j
xi b i + ∑ yi b i = y .
i=0
Satz 8 : (Addition von zwei Zahlen, die durch Ziffern dargestellt sind) Es
seien b, x, y, k, ` natürliche Zahlen, b ≥ 2 und
xk , xk−1 , . . ., x0
bzw.
y` , y`−1 , . . ., y0
die Ziffern von x bzw. y bezüglich b. Für je zwei Zahlen in {0, . . ., b − 1} sei
die Zifferndarstellung ihrer Summe bekannt. (Wenn diese Summe gr ößer als
b − 1 ist, dann hat sie zwei Ziffern, die erste ist 1 und die zweite ist kleiner
als b − 1 ). O.E.d.A. sei ` ≤ k.
Dann können die Ziffern von x + y mit dem folgenden Verfahren berechnet
werden:
• Ermittle die Ziffern (x0 + y0 )1 und (x0 + y0 )0 von x0 + y0 . Setze (x +
y)0 := (x0 + y0 )0 , u0 := (x0 + y0 )1 und i := 0.
• Solange i < ` ist, setze i := i + 1 und ermittle die Ziffern
(xi + yi + ui−1 )1 und (xi + yi + ui−1 )0 von xi + yi + ui−1 .
Setze (x + y)i := (xi + yi + ui−1 )0 und ui := (xi + yi + ui−1 )1 ( i-ter
”
Übertrag“).
• Solange i < k ist, setze i := i + 1 und ermittle die Ziffern
(xi + ui−1 )1 und (xi + ui−1 )0 von xi + ui−1 .
Setze (x + y)i := (xi + ui−1 )0 und ui := (xi + ui−1 )1 .
• Wenn u` 6= 0 ist, setze (x + y)`+1 := u` .
15
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beweis: Übung.
Verfahren für die Subtraktion und Multiplikation können in ähnlicher
Weise angegeben werden. Hier wird nur noch das Verfahren für die Division
mit Rest in einem Satz formuliert. In Satz 5 wurde bereits ein Divisionsalgorithmus angegeben. Wenn eine Zifferndarstellung der gegebenen Zahlen
bekannt ist, kann dieses Verfahren mit Hilfe dieser zusätzlichen Information
verbessert werden.
Satz 9 : (Division mit Rest von Zahlen, die durch Ziffern dargestellt sind)
Es seien b, x, y, k, ` natürliche Zahlen, b ≥ 2, y > 0 und
xk , xk−1 , . . ., x0
bzw.
y` , y`−1 , . . ., y0
die Ziffern von x bzw. y bezüglich b. O.E.d.A. sei x ≥ y.
Die Ziffern des ganzzahligen Quotienten m von x und y können mit dem
folgenden Verfahren berechnet werden:
• Setze j := k − `, wenn ∑`i=0 xi+k−` bi ≥ y ist, und j := k − ` − 1, sonst.
• Solange j ≥ 0 ist, berechne (wie in Satz 5) den ganzzahligen Quotienten m j von ∑i≥0 xi+ j bi und y. Dieser ist die j-te Ziffer von m.
Ersetze x durch x − m j · y · b j und j durch j − 1.
Beweis: Übung.
Wenn zur Darstellung einer Zahl am Computer 32 bits (also 32 Binärziffern) zur Verfügung stehen, dann können in der Zweierkomplementdarstellung die Zahlen in
{−231 = −2147483648, . . ., −1, 0, 1, . . ., 231 − 1 = 2147483647}
(also insgesamt 232 Zahlen) dargestellt werden.
Ist a eine natürliche Zahl in diesem Zahlenbereich, dann wird a durch
0 a30 a29 . . . a1 a0
dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a zur Basis 2 sind.
Ist a eine negative Zahl in diesem Zahlenbereich, dann wird a durch
1 a30 a29 . . . a1 a0
dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a + 231 zur Basis 2 sind.
4. Rationale Zahlen
Es seien a und b ganze Zahlen, wobei b 6= 0 ist. Die Aufgabe Finde
”
eine Zahl z so, dass b · z = a ist“ bezeichnen wir als Gleichung“ b · x = a.
”
Eine Zahl z mit b · z = a heißt Lösung von b · x = a. Wenn |b| 6= 1 ist, dann
16
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
hat die Aufgabe b · x = 1 in Z keine Lösung. Um Lösungen zu erhalten,
müssen wir den Zahlenbereich erweitern“.
”
Die Aufgabe b · x = a wird durch das Paar (a, b) ∈ Z 2 eindeutig beschrieben, also liegt es nahe, die neuen Zahlen“ durch Paare von ganzen
”
Zahlen zu beschreiben. Allerdings sollten für t ∈ Z , t 6= 0, die Gleichungen
b · x = a und t · b · x = t · a dieselbe Lösung haben, daher sollen die Zahlenpaare (a, b) und (t · a,t · b) dieselbe neue Zahl“ beschreiben.
”
Definition 14 : Es seien a und b ganze Zahlen, wobei b 6= 0. Dann ist die
Menge
a
:= {(c, d) | c, d ∈ Z , ad = bc, d 6= 0}
b
die durch den Zähler“ a und den Nenner“ b gegebene rationale Zahl oder
”
”
Bruchzahl. (Beachte: Eine Bruchzahl ist durch Vorgabe von Zähler und
Nenner eindeutig bestimmt, aber umgekehrt sind Zähler und Nenner durch
die Bruchzahl nicht eindeutig bestimmt). Wir schreiben Q für die Menge
der rationalen Zahlen.
Für die Bruchzahl a1 schreiben wir oft nur a und fassen so Z als Teilmenge
von Q auf. ( Jede ganze Zahl ist eine rationale Zahl“).
”
Satz 10 : Es seien a0 , b0 ganze Zahlen und b0 6= 0. Dann sind die Bruchzah0
len ba und ab0 genau dann gleich, wenn a · b0 = a0 · b ist.
0
Beweis: Wenn ab = ba0 ist, dann ist insbesondere (a0 , b0 ) ∈ ab , also a · b0 =
a0 · b.
Sei umgekehrt a · b0 = a0 · b und (c, d) ∈ ab , also b · c = a · d. Dann ist zu
0
zeigen, dass (c, d) ∈ ba0 , also b0 · c = a0 · d ist.
Es ist
a · (b0 · c) = (a · b0) · c = (a0 · b) · c = a0 · (b · c) = a0 · (a · d) = a · (a0 · d) ,
also auch b0 · c = a0 · d.
Satz 11 : Für den Nenner einer Bruchzahl kann immer eine positive Zahl
gewählt werden. Dann wird die totale Ordnung ≤ auf Z durch
a c
≤ :⇔ a · d ≤ b · c
b d
zu einer totalen Ordnung auf Q erweitert.
Beweis: Zuerst ist zu zeigen, dass die Definition von ≤ nicht von der Wahl
von Zähler und positivem Nenner abhängt. Seien a, a0 , c, c0 ∈ Z und b, b0 , d, d 0
positive ganze Zahlen so, dass a · b0 = a0 · b, c · d 0 = c0 · d und a · d ≤ b · c ist.
17
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Dann ist
a0 · d 0 · b · d = a · d 0 · b 0 · d ≤ b · d 0 · b 0 · c = b 0 · c0 · b · d
und a0 · d 0 ≤ b0 · c0 .
Seien a, c, e ∈ Z , b, d, f positive ganze Zahlen so, dass ba ≤ dc und dc ≤ ef ist.
Es ist noch zu zeigen, dass dann auch ab ≤ ef ist. Aus a·d · f ≤ b·c· f ≤ b·d ·e
folgt a · f ≤ b · e und daher die Behauptung.
Wir werden nun die Rechenoperationen von Z auf Q fortsetzen.
Satz 12 : Die Abbildungen
+ : Q × Q −→ Q ,
a c
ad + bc
a c
,
( , ) 7−→ + :=
b d
b d
bd
und
a c
a c
ac
( , ) 7−→ · :=
,
b d
b d
bd
sind wohldefiniert. Diese Rechenoperationen in Q erfüllen die gleichen Rechenregeln wie Addition und Multiplikation in Z . Darüberhinaus hat jedes
Element ba ∈ Q \ {0} ein inverses Element ( ba )−1 mit der Eigenschaft
· : Q × Q −→ Q ,
a
a
( )−1 · = 1 ,
b
b
und zwar ist
a
b
( )−1 = .
b
a
Die Einschränkungen von + und · auf Z × Z stimmen mit der Addition und
der Multiplikation auf Z überein.
Beweis: Wir müssen zuerst zeigen, dass die Abbildungen + und · wohlde0
0
finiert sind, das heißt: wenn ba = ba0 und dc = dc 0 ist, dann muss auch
ad + bc a0 d 0 + b0 c0
=
bd
b0 d 0
und
a 0 c0
ac
= 0 0
bd b d
sein.
Aus a0 b = ab0 und c0 d = cd 0 folgt
(ad + bc)b0 d 0 = a0 bdd 0 + bb0 c0 d = bd(a0 d 0 + b0 c0 )
und
(ac)b0 d 0 = bd(a0 c0 ) .
Die Rechenregeln können leicht nachgeprüft werden.
18
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
5. Zifferndarstellung von rationalen Zahlen
Satz 13 : (Zifferndarstellung von rationalen Zahlen)
Es seien b, c, d, p positive ganze Zahlen mit b ≥ 2. Dann gibt es eindeutig
bestimmte natürliche Zahlen n, zn , . . . , z0 , z−1 , . . ., z−p so, dass
und
zn 6= 0 oder n = 0,
0 ≤ zn , . . . , z0 , z−1 , . . . , z−p < b
c
− (zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 + z−1 b−1 + . . . + z−p b−p ) < b−p
d
ist. Ist b fest gewählt, schreibt man
0≤
n
zn zn−1 . . . z0 .z−1 z−2 . . . z−p
statt
∑
zi b i .
i=−p
Die Zahlen zn , . . . , z0 , z−1 , . . ., z−p heißen Ziffern von a zur Basis b. Die
Ziffern zi von dc zur Basis b können wie folgt berechnet werden:
• Berechne (mit Satz 6) die Ziffern y0 , . . . , yk zur Basis b des ganzzahligen Quotienten m von c · b p und d .
• Setze zi := yi+p , −p ≤ i ≤ k − p =: n .
Beweis: Sei r der Rest von c · b p nach Division durch d. Wegen c · b p =
m · d + r ist dann
c · bp
m·d
r
=
+
,
d · bp d · bp d · bp
also
c
m r
r
= p + .b−p und
<1.
d b
d
d
Rationale Zahlen können also beliebig genau“ durch Zahlen der Form
”
zn zn−1 . . . z0 .z−1 z−2 . . .z−p angenähert werden, aber es gibt rationale Zahlen,
die für alle p von zn zn−1 . . . z0 .z−1 z−2 . . . z−p verschieden sind.
Eine rationale Zahl
z0 .z−1 z−2 . . . z−p Ee := z0 .z−1 z−2 . . . z−p · be
mit b ≥ 2 und z0 6= 0 ist in Exponentialform zur Basis b dargestellt. Die
Zahlen e und z0 .z−1 z−2 . . . z−p heißen Exponent und Mantisse.
Am Computer kann eine Zahl dann durch die Ziffern des Exponenten
und der Mantisse zur Basis 2 dargestellt werden. Die Anzahl dieser Ziffern
ist durch eine vorgegebene Zahl beschränkt. Die so am Computer verfügbaren Zahlen heißen Maschinenzahlen. Es gibt nur endlich viele Maschinenzahlen, alle Maschinenzahlen sind rationale Zahlen.
Beim Rechnen mit so dargestellten Zahlen gibt es im allgemeinen keine exakten Ergebnisse, sondern Rundungsfehler. Bei Rechenverfahren muss
daher darauf geachtet werden, dass sich die Fehler nicht akkumulieren. Fehlerabschätzungen sind erforderlich.
19
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beispiel 7 : Die Zahl 0.1 (Dezimaldarstellung) auf der Tastatur wird vom
Computer in Binärdarstellung 0.0001100110011001100 . . . umgewandelt und
zum Beispiel als
1.100110011001100110011001100110011001100 E − 4
gespeichert. Also ergibt schon die Eingabe von 0.1 einen Rundungsfehler!
Will man mit rationalen Zahlen am Computer exakt rechnen, kann man ab
als Zahlenpaar (a, b) eingeben. Dann müssen für Zahlenpaare die Rechenoperationen
(a, b) + (c, d) := (ad + bc, bd) und
definiert werden.
(a, b) · (c, d) := (ac, bd)
6. Der Euklidische Algorithmus
Es seien a, b, c ganze Zahlen und b 6= 0, c 6= 0. Dann ist
a a·c
=
∈Q.
b b·c
Der Übergang von der Darstellung dieser rationalen Zahl durch das Zahlenpaar (a · c, b · c) zu der durch (a, b) heißt durch c kürzen. Rechnet man
mit rationalen Zahlen, dann ist es sehr empfehlenswert, alle auftretenden
Brüche sofort durch möglichst große Zahlen zu kürzen. Dadurch werden
die weiteren Rechnungen oft wesentlich vereinfacht. In diesem Abschnitt
wird ein Verfahren zum optimalen Kürzen“ angegeben. Darüberhinaus
”
lernen wir ein Verfahren zur Berechnung einer Lösung einer ganzzahligen
”
linearen Gleichung“ kennen.
Definition 15 : Es seien a,b ganze Zahlen mit b 6= 0. Dann ist a Teiler von
b (oder: a teilt b), wenn es eine Zahl c ∈ Z gibt mit b = ac. Die Zahl b heißt
Vielfaches von a, wenn a ein Teiler von b ist.
Definition 16 : Der größte gemeinsame Teiler von zwei von Null verschiedenen ganzen Zahlen ist die größte ganze Zahl, die beide teilt. Das kleinste
gemeinsame Vielfache von zwei von Null verschiedenen ganzen Zahlen ist
die kleinste positive ganze Zahl, die Vielfaches von beiden ist.
Wir schreiben ggT (a, b) bzw. kgV (a, b) für den größten gemeinsamen Teiler bzw. das kleinste gemeinsame Vielfache zweier Zahlen a und b.
Hilfssatz 1 : Es seien a, b, c ∈ Z , a 6= 0, b 6= 0 und a 6= c · b. Dann ist
und
ggT (a, b) = ggT (|a|, |b|)
ggT (a, b) = ggT (a − c · b, b) .
20
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beweis: Übung.
Satz 14 : (Euklidischer Algorithmus für ganze Zahlen)
Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Mit dem folgenden Verfahren kann der
größte gemeinsame Teiler von a und b berechnet werden:
• Ersetze a und b durch |a| und |b|.
• Solange die zwei Zahlen verschieden sind, ersetze die größere durch
die Differenz der größeren und der kleineren.
• Wenn die zwei Zahlen gleich sind, dann ist ggT (a, b) gleich dieser
Zahl.
Ersetzt man mehrfaches Abziehen derselben Zahl durch eine Division mit
Rest, dann hat dieses Verfahren die folgende Form:
• Ersetze a und b durch |a| und |b|.
• Solange keine der zwei Zahlen ein Teiler der anderen ist, ersetze die
größere der zwei Zahlen durch ihren Rest nach Division durch die
kleinere.
• Wenn eine der zwei Zahlen ein Teiler der anderen ist, dann ist sie der
ggT (a, b).
Beweis: Es ist ggT (a, b) = ggT (|a|, |b|). Also können wir annehmen, dass
a und b positive ganze Zahlen sind. Wenn sie verschieden sind, wird die
größere der zwei Zahlen (wir bezeichnen sie mit max(a, b)) im nächsten
Schritt durch eine kleinere positive ganze Zahl ersetzt. Also sind die zwei
Zahlen nach höchstens max(a, b) − 1 Schritten gleich. In jedem Schritt wird
ein Zahlenpaar durch ein anderes ersetzt, nach Lemma 1 aber so, dass die
größten gemeinsamen Teiler der zwei Zahlenpaare gleich sind. Sobald man
den größten gemeinsamen Teiler eines Zahlenpaares kennt (das ist spätestens dann der Fall, wenn die zwei Zahlen gleich sind), hat man ggT (a, b)
ermittelt.
Im Euklidischen Algorithmus wird die folgende Strategie zur Lösung
von Problemen verwendet: Wenn man eine Aufgabe nicht sofort lösen
kann, ersetzt man diese Aufgabe durch eine einfachere, die aber dieselbe
Lösungsmenge hat. Das wiederholt man solange, bis man bei einer Aufgabe landet, deren Lösungen man kennt. Diese Lösungen sind dann auch die
Lösungen der ursprünglichen Aufgabe.
Satz 15 : (Erweiterter Euklidischer Algorithmus)
Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Es gibt ganze Zahlen u, v so, dass u · a +
v · b = ggT (a, b) ist. Diese können mit dem folgenden Verfahren berechnet
werden:
21
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
• Setze A := (A1 , A2 , A3 ) := (|a|, 1, 0) ∈ Z 3 und
B := (B1 , B2 , B3 ) := (|b|, 0, 1) ∈ Z 3 .
• Solange B1 die Zahl A1 nicht teilt, berechne den ganzzahligen Quotienten m von A1 und B1 und setze C := B, B :=
A − m ·C := (A1 − m ·C1 , A2 − m ·C2 , A3 − m ·C3 ) und A := C.
• Wenn B1 die Zahl A1 teilt, dann ist u := vz(a) · B2 und v := vz(b) · B3
.
Beweis: Wenn zwei Zahlentripel S und T die Eigenschaft
S1 = |a| · S2 + |b| · S3
bzw. T1 = |a| · T2 + |b| · T3
haben, dann auch alle Tripel S − m · T mit m ∈ Z . Die ersten zwei Tripel
im Algorithmus haben diese Eigenschaft, daher auch alle anderen auftretenden Tripel. Für die ersten Komponenten der Tripel wird der euklidische
Algorithmus durchgeführt, für das letzte Tripel B gilt daher ggT (a, b) =
|a| · B2 + |b| · B3 = vz(a) · a · B2 + b · vz(b) · B3 .
Satz 16 : (Berechnung von kgV (a, b))
Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Dann ist
kgV (a, b) =
|b|
|a|
· |b| =
· |a| .
ggT (a, b)
ggT (a, b)
|a|
|b|
Beweis: Es ist klar, dass ggT (a,b) · |b| = ggT (a,b) · |a| ein Vielfaches von a
und von b ist. Sei z eine positive ganze Zahl, die Vielfaches von a und von
b ist. Dann gibt es ganze Zahlen c, d mit z = c · a und z = d · b. Nach Satz
15 gibt es Zahlen u, v so, dass u · a + v · b = ggT (a, b) ist. Dann ist
z=
=
u·a+v·b
u·a
v·b
·z =
·z+
·z =
ggT (a, b)
ggT (a, b)
ggT (a, b)
u·a·d·b v·b·c·a
a·b
+
=
· (u · d + v · c) =
ggT (a, b) ggT (a, b) ggT (a, b)
=
ein Vielfaches von
|a| · |b|
· vz(a · b) · (u · d + v · c)
ggT (a, b)
|a|
ggT (a,b)
· |b|.
Satz 17 : ( Lösen einer ganzzahligen linearen Gleichung“). Es seien a1 , . . . , an ∈
”
Z \ {0} und b ∈ Z . Die größte ganze Zahl, die a1 , . . ., an teilt, heißt größter
gemeinsamer Teiler von a1 , . . . , an und wird mit ggT (a1 , . . . , an ) bezeichnet.
Es ist
ggT (a1 , . . . , an ) = ggT (a1 , ggT (a2 , ggT (a3 , ggT (. . . , an ) . . .)) ,
22
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
also kann der größte gemeinsame Teiler von mehreren Zahlen durch sukzessives Berechnen des größten gemeinsamen Teilers von je zwei Zahlen
berechnet werden.
Es gibt genau dann ein n-Tupel (x1 , . . . , xn ) ∈ Z n mit
a1 · x1 + . . . + a n · xn = b ,
wenn b ein Vielfaches von g := ggT (a1 , . . ., an ) ist. In diesem Fall kann ein
solches n-Tupel wie folgt berechnet werden:
• Berechne mit Satz 15 Zahlen u1 , . . . , un so, dass
a1 · u1 + . . . + an · un = g ist.
• Setze xi := ui · bg , 1 ≤ i ≤ n.
Beweis: Für jedes n-Tupel (x1 , . . ., xn ) ∈ Z n wird a1 · x1 + . . . + an · xn von
g geteilt. Also ist die Bedingung, dass b ein Vielfaches von g ist, notwendig
für die Existenz einer Lösung. Wenn diese Bedingung erfüllt ist, ist leicht
nachzuprüfen, dass (u1 · bg , . . . , un · bg ) eine Lösung ist.
7. Primzahlen
Definition 17 : Eine ganze Zahl p ∈ Z heißt Primzahl, wenn
p 6= 0, p 6= 1, p 6= −1 und {1, −1, p, −p} die Menge der Teiler von p ist.
Hilfssatz 2 : Es seien p eine Primzahl und a, b ∈ Z .
Wenn p die Zahl a · b teilt, dann teilt p auch a oder b.
Beweis: Sei c eine ganze Zahl so, dass c · p = a · b ist. Wenn p die Zahl a
nicht teilt, dann ist ggT (a, p) = 1. Daher gibt es ganze Zahlen u und v so,
dass 1 = u · a + v · p ist. Dann ist
b = b · u · a + b · v · p = u · c · p + b · v · p = (u · c + b · v) · p ,
somit ist p ein Teiler von b.
Satz 18 : (Zerlegung in Primfaktoren)
Jede ganze Zahl, die größer als 1 ist, kann als Produkt von positiven Primzahlen geschrieben werden. Diese Primzahlen heißen Primfaktoren der Zahl
und sind bis auf die Reihenfolge eindeutig bestimmt.
Beweis: Es sei a eine ganze Zahl, die größer als 1 ist. Wir beweisen die
erste Aussage durch Induktion über a.
Wenn a = 2 ist, dann ist a eine Primzahl.
Wenn a > 2 ist, dann ist a entweder eine Primzahl oder es gibt ganze Zahlen
23
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
b, c mit 1 < b, c < a so, dass a = b · c ist. Nach Induktionsannahme sind b
und c Produkte von positiven Primzahlen, also auch a.
Wir beweisen noch die Eindeutigkeit der Primfaktorzerlegung. Es seien
a = p1 · p2 · . . . · pk und a = q1 · q2 · . . . · q` zwei Zerlegungen von a in Primfaktoren. Wir beweisen durch Induktion über die größere der zwei Zahlen
k, `, dass die Primfaktoren der zwei Zerlegungen bis auf die Reihenfolge
gleich sind. Weil p1 das Produkt q1 · q2 · . . . · q` teilt, gibt es nach Lemma 2
eine Zahl j ∈ {1, . . ., `} so, dass p1 = q j ist. Daher ist
p2 · . . . · pk =
∏
qi ,
1≤i≤`,i6= j
und die Behauptung folgt aus der Induktionsannahme.
Die Berechnung der Primfaktoren einer Zahl ist sehr aufwendig. Rechenverfahren, in denen Zahlen in Primfaktoren zerlegt werden müssen,
sollten nach Möglichkeit vermieden werden.
Satz 19 : Es gibt unendlich viele positive Primzahlen.
Beweis: Wenn es nur endlich viele positive Primzahlen gäbe, dann wäre
ihr Produkt q eine ganze Zahl und q + 1 wäre größer als jede Primzahl.
Insbesondere wäre q + 1 keine Primzahl. Nach Satz 18 gibt es eine Primzahl
p, die q+1 teilt. Da p auch q teilt, würde p dann auch 1 teilen, Widerspruch.
Satz 20 : (Berechnung von ggT und kgV zweier Zahlen, deren Primfaktoren bekannt sind).
Es seien p1 , . . . , pn paarweise verschiedene positive Primzahlen und e1 , . . . , en , f1 , . . ., fn
natürliche Zahlen. Mit min(ei , fi ) bzw. max(ei , fi ) bezeichnen wir die kleinere bzw. größere der zwei Zahlen ei und fi . Dann ist
n
n
i=1
i=1
n
n
i=1
i=1
n
ggT (∏ pei i , ∏ pi i ) = ∏ pi
und
f
min(ei , fi )
i=1
n
kgV (∏ pei i , ∏ pi i ) = ∏ pi
min(e , f )
f
max(ei , fi )
.
i=1
i i
. Es ist klar, dass g die Zahlen a :=
Beweis: Es sei g := ∏ni=1 pi
fi
ei
n
n
∏i=1 pi und b := ∏i=1 pi teilt. Da nach Satz 18 die Zerlegung dieser zwei
Zahlen in Primfaktoren eindeutig ist, kann ihr größter gemeinsamer Teiler
keine anderen Primfaktoren als p1 , . . ., pn enthalten. Aus demselben Grund
darf pi in ggT (a, b) nur min(ei , fi )-mal auftreten. Daher ist g = ggT (a, b).
Die Behauptung für kgV (a, b) folgt nun aus Satz 16.
24
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
8. Gruppen
Definition 18 : Seien G eine Menge und ∗ : G×G → G eine Abbildung. Für
Elemente a, b ∈ G schreiben wir statt ∗(a, b) kurz a∗b. Das Paar (G, ∗) heißt
eine Gruppe, wenn die folgenden drei Bedingungen ( Gruppen-Axiome“)
”
erfüllt sind:
(1) Für alle Elemente a, b, c ∈ G ist
a ∗ (b ∗ c) = (a ∗ b) ∗ c =: a ∗ b ∗ c (Assoziativgesetz).
(2) Es gibt ein Element e ∈ G so, dass für alle a ∈ G gilt :
a ∗ e = e ∗ a = a (e heißt dann neutrales Element in G).
(3) Für alle Elemente a ∈ G gibt es ein b ∈ G so, dass
a ∗ b = b ∗ a = e ist (b heißt dann zu a inverses Element und wird mit
a−1 bezeichnet).
Eine Gruppe (G, ∗) heißt kommutativ oder abelsch, wenn zusätzlich gilt:
(4) Für alle a, b ∈ G ist a ∗ b = b ∗ a (Kommutativgesetz).
Ist (G, ∗) eine Gruppe, dann wird die Abbildung ∗ als Gruppenverkn üpfung,
Multiplikation oder, wenn (G, ∗) abelsch ist, als Addition bezeichnet. Wenn
aus dem Zusammenhang ersichtlich ist, welche Verknüpfung auf G betrachtet wird, schreibt man statt (G, ∗) kürzer G.
Beispiel 8 : ( Z , +), ({1, −1}, ·), ( Q , +) und ( Q \ {0}, ·) sind kommutative Gruppen.
Satz 21 : Seien (G, ∗) eine Gruppe und a, b, c ∈ G. Dann gilt:
(1)
(2)
(3)
(4)
Es gibt genau ein neutrales Element in G.
Zu jedem Element in G gibt es genau ein inverses Element in G.
Es ist (a ∗ b)−1 = b−1 ∗ a−1 .
Aus a ∗ b = a ∗ c oder b ∗ a = c ∗ a folgt b = c ( In einer Gruppe
”
kann gekürzt werden“).
Beweis: (1) Seien e und e0 neutrale Elemente in G. Dann ist e0 = e ∗ e0 und
e = e ∗ e0 , also e = e0 .
(2) Seien b und b0 zu a inverse Elemente. Dann ist
b = e ∗ b = (b0 ∗ a) ∗ b = b0 ∗ (a ∗ b) = b0 ∗ e = b0 .
(3) Es ist (a ∗ b) ∗ (b−1 ∗ a−1 ) = a ∗ (b ∗ (b−1 ∗ a−1 )) =
= a ∗ ((b ∗ b−1 ) ∗ a−1 ) = a ∗ (e ∗ a−1 ) = a ∗ a−1 = e und
(b−1 ∗ a−1 ) ∗ (a ∗ b) = b−1 ∗ (a−1 ∗ (a ∗ b)) = b−1 ∗ ((a−1 ∗ a) ∗ b) =
b−1 ∗ (e ∗ b) = b−1 ∗ b = e.
(4) Aus a ∗ b = a ∗ c folgt b = a−1 ∗ a ∗ b = a−1 ∗ a ∗ c = c.
25
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Definition 19 : Seien (G, ∗) eine Gruppe, m, n ∈ Z und
am , am+1 , . . ., an ∈ G. Dann ist für n > m
n
∏ ai := am ∗ am+1 ∗ . . . ∗ an := (. . . ((am ∗ am+1) ∗ am+2) ∗ . . . ∗ an−1 ) ∗ an .
i=m
Sprechweise: Das Produkt aller ai mit i von m bis n. Die Elemente am , am+1 , . . . , an
heißen Faktoren von ∏ni=m ai .
Für n = m setzt man
m
∏ ai := am ,
i=m
und für n < m vereinbart man
n
∏ ai := e
i=m
( leeres Produkt“), wobei e das neutrale Element von G ist.
”
Wenn (G, ∗) kommutativ ist, wird oft + statt ∗, −a statt a−1 und
n
n
∑ ai
i=m
statt
∏ ai
i=m
geschrieben. Sprechweise: Die Summe aller ai mit i von m bis n. Die Elemente am , am+1 , . . . , an heißen dann Summanden von ∑ni=m ai .
Hilfssatz 3 : Seien (G, ∗) eine Gruppe, m, k, n ∈ Z , m < k < n und a m , am+1 , . . ., an ∈
G. Dann gilt
(am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an ) = am ∗ am+1 ∗ . . . ∗ an .
Beweis: Wir beweisen die Behauptung durch Induktion nach n − k, der Anzahl der Faktoren von ak+1 ∗ . . . ∗ an . Für n − k = 1 ist sich die Behauptung (am ∗ . . . ∗ an−1 ) ∗ an = am ∗ . . . ∗ an , was nach Definition des Produktes
am ∗ . . . ∗ an−1 ∗ an richtig ist.
Sei nun n − k > 1. Aus dem Assoziativgesetz und der Induktionsannahme
(am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an−1 ) = am ∗ am+1 ∗ . . . ∗ an−1
folgt
(am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an ) = (am ∗ . . . ∗ ak ) ∗ ([ak+1 ∗ . . . ∗ an−1 ] ∗ an ) =
([am ∗ . . . ∗ ak ] ∗ [ak+1 ∗ . . . ∗ an−1 ]) ∗ an = (am ∗ am+1 ∗ . . . ∗ an−1 ) ∗ an =
am ∗ am+1 ∗ . . . ∗ an .
Satz 22 : (Allgemeines Assoziativgesetz)
Seien (G, ∗) eine Gruppe, s eine positive ganze Zahl, m, k1 , . . . , ks , n ganze
26
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Zahlen mit m < k1 < k2 < . . . ks < n und am , am+1 , . . . , an ∈ G. Dann gilt
(am ∗ . . . ∗ ak1 ) ∗ (ak1 +1 ∗ . . . ∗ ak2 ) ∗ . . . ∗ (aks +1 ∗ . . . ∗ an ) =
= am ∗ . . . ∗ a n ,
d.h. auf die Reihenfolge des Ausführens der Gruppenverknüpfung bei der
Berechnung von ∏ni=m ai kommt es nicht an, die Klammern können also
weggelassen werden.
Beweis: Wir beweisen die Behauptung durch Induktion nach s.
Für s = 1 folgt die Behauptung aus Lemma 3.
Sei s > 1. Nach Induktionsannahme und Lemma 3 ist dann
(am ∗ . . . ∗ ak1 ) ∗ (ak1 +1 ∗ . . . ∗ ak2 ) ∗ . . . ∗ (aks +1 ∗ . . . ∗ an ) =
[(am ∗. . .∗ak1 )∗(ak1 +1 ∗. . .∗ak2 )∗. . .∗(aks−1 +1 ∗. . .∗aks )]∗(aks +1 ∗. . .∗an ) =
= (am ∗ . . . ∗ aks ) ∗ (aks+1 ∗ . . . ∗ an ) = am ∗ . . . ∗ an .
Satz 23 : (Allgemeines Kommutativgesetz)
Seien (G, +) eine kommutative Gruppe, m, n ∈ Z mit n > m,
am , am+1 , . . ., an ∈ G und f eine bijektive Abbildung von
{m, m + 1, . . ., n} nach {m, m + 1, . . ., n}. Dann gilt
n
∑ ai =
i=m
n
∑ a f (i) ,
i=m
d.h. auf die Reihenfolge der Summanden kommt es bei der Berechnung von
∑ni=m ai nicht an, sie können beliebig umgeordnet werden.
Beweis: Wir beweisen die Behauptung durch Induktion nach n − m. Für
n − m = 1 ist die Behauptung richtig, weil die Gruppe kommutativ ist. Sei
nun n − m > 0. Wenn f (n) = n ist, dann folgt
n
n−1
i=m
i=m
∑ a f (i) = ( ∑ a f (i)) + an
und nach Induktionsannahme die Behauptung, weil die Einschränkung von
f auf {m, m + 1, . . ., n − 1} eine bijektive Abbildung nach
{m, m + 1, . . ., n − 1} ergibt.
Im anderen Fall ist f (n) < n. Sei k ∈ {m, m + 1, . . ., n} so, dass
f (k) = n
ist. Weil G kommutativ ist, ist
n
k−1
n
i=m
i=m
i=k+1
∑ a f (i) = ∑ a f (i) + an + ∑
a f (i) =
27
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
k−1
=
∑ a f (i) +
i=m
n−1
n
∑
a f (i) + an =
∑ ag(i) + an ,
i=m
i=k+1
wobei g die durch
g(i) := f (i), falls m ≤ i < k, und g(i) := f (i + 1), falls k ≤ i < n,
definierte bijektive Abbildung von {m, m + 1, . . ., n − 1} nach
{m, m + 1, . . ., n − 1} ist. Nach Induktionsannahme ist
n−1
n−1
i=m
i=m
∑ ag(i) =
∑ ai ,
also ist
n
n−1
i=m
i=m
∑ a f (i) =
∑ ag(i) + an =
n
∑ ai .
i=m
Definition 20 : Seien I eine endliche Menge, (G, +) eine kommutative Gruppe und (ai )i∈I eine Familie von Elementen in G. Dann ist
n
∑ ai := ∑ a f (i) ∈ G ,
i∈I
i=1
wobei f eine bijektive Abbildung von {1, 2, . . ., n := #(I)} nach I ist.
Nach Satz 23 hängt ∑i∈I ai nicht von der Wahl der bijektiven Abbildung f
ab.
Beispiel 9 : Sei I := {(0, 2), (1, 1), (2, 0)}, (G, +) := ( Z , +) und
a(0,2) := 3, a(1,1) := 4, a(2,0) := 1. Sei f die bijektive Abbildung von {1, 2, 3}
nach I mit f (1) = (1, 1), f (2) = (0, 2), f (3) = (2, 0). Dann ist
∑ ai = a(1,1) + a(0,2) + a(2,0) = 4 + 3 + 1 = 8 .
i∈I
9. Ringe und Körper
Definition 21 : Seien R eine Menge und + : R × R → R sowie
· : R × R → R Abbildungen. Wir schreiben statt +(a, b) kurz a + b“ und
”
statt ·(a, b) kurz a · b“ oder ab“. Das Tripel (R, +, ·) heißt ein Ring, wenn
”
”
die folgenden Bedingungen ( Ring-Axiome“) erfüllt sind:
”
(1) (R, +) ist eine abelsche Gruppe.
(2) Für alle a, b, c ∈ R ist (ab)c = a(bc) (Assoziativgesetz).
(3) Es gibt ein Element e ∈ R so, dass für alle a ∈ R gilt :
ea = ae = a (e heißt dann Einselement und wird mit 1R bezeichnet).
(4) Für alle a, b, c ∈ R ist a(b + c) = (ab) + (ac) und
(a + b)c = (ac) + (bc) (Distributivgesetz).
Ein Ring (R, +, ·) heißt kommutativ, wenn zusätzlich gilt:
28
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
(5) für alle a, b ∈ R ist ab = ba (Kommutativgesetz).
Ist (R, +, ·) ein Ring, dann heißt + die Addition und · die Multiplikation
des Ringes. Das neutrale Element von (R, +) heißt Nullelement und wird
0R geschrieben. Das zu a ∈ R bezüglich + inverse Element wird mit −a
bezeichnet. Die Subtraktion ist dann definiert durch
a − b := a + (−b).
Um Klammern einzusparen, wird verabredet, dass die Multiplikation immer
vor der Addition ausgeführt wird, ausgenommen bei gegenteiliger Klammerung. Zum Beispiel wird (ab) + c abgekürzt als ab + c.
Wenn aus dem Zusammenhang ersichtlich ist, welche Addition und
Multiplikation auf der Menge R betrachtet werden, so schreibt man statt
(R, +, ·) kurz R.
Beispiel 10 : ( Z , +, ·) und ( Q , +, ·) sind kommutative Ringe.
Definition 22 : Ein Element a eines Ringes R mit Einselement 1R ist invertierbar, wenn es ein Element b ∈ R mit
ab = 1R = ba
gibt. Das Element b heißt dann zu a (bezüglich ·) inverses Element und wird
mit a−1 bezeichnet.
Satz 24 : Die Menge aller invertierbaren Elemente eines Ringes R ist mit
der Multiplikation von R eine Gruppe. Das Einselement von R ist das neutrale Element dieser Gruppe. Für invertierbare Elemente a, b ∈ R ist
(ab)−1 = b−1 a−1
und (a−1 )−1 = a .
Beweis: Es ist
(ab)(b−1 a−1 ) = a(bb−1 )a−1 = 1 = b−1 (a−1 a)b = (b−1 a−1 )(ab) .
Definition 23 : Sei (R, +, ·) ein kommutativer Ring mit mindestens zwei
Elementen. R heißt ein Körper, wenn jedes Element von R \ {0} invertierbar
ist. Die Division in R ist dann durch
a/b := ab−1
definiert.
Beispiel 11 : ( Q , +, ·) ist ein Körper. Der Ring ( Z , +, ·) der ganzen Zahlen
ist kein Körper.
29
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Als Merkregel für diese Definitionen gilt: In einem Ring kann addiert, subtrahiert und multipliziert werden. In einem Körper kann zusätzlich noch
durch Elemente ungleich null dividiert werden. Die Ring-Axiome sind den
Rechenregeln für ganze Zahlen nachgebildet.
Satz 25 : Seien (R, +, ·) ein Ring und a, b, c ∈ R. Dann gilt:
(1)
(2)
(3)
(4)
Aus a + b = a + c folgt b = c.
0R · a = a · 0 R = 0R
(−a) · b = a · (−b) = −(a · b)
(−a) · (−b) = a · b.
Wenn R ein Körper und a 6= 0 ist, dann gilt:
(5) Aus a · b = a · c folgt b = c.
Beweis: (1) folgt nach Satz 21 durch Kürzen in der Gruppe (R, +).
(2) Aus 0R + 0R · a = 0R · a = (0R + 0R ) · a = 0R · a + 0R · a folgt nach (1),
dass 0R = 0R · a ist. Analog beweist man die zweite Behauptung.
(3) Aus (−a) · b + a · b = (−a + a) · b = 0R · b = 0R folgt (−a) · b = −(a · b).
Analog beweist man die zweite Behauptung.
(4) Nach (3) ist (−a) · (−b) = −(a · (−b)) = −(−(a · b)) = a · b .
(5) Aus a · b = a · c erhält man durch Multiplikation mit a−1 auf beiden
Seiten a−1 · a · b = a−1 · a · c und schließlich b = c.
Hilfssatz 4 : Seien R ein Ring, k eine positive ganze Zahl und
c, d1 , . . . , dk ∈ R. Dann gilt
!
!
k
k
c·
∑ di
=
∑ c · di und
i=1
i=1
k
k
i=1
i=1
∑ di · c = ∑ di · c .
Beweis: Wir zeigen die erste Behauptung durch Induktion nach k. Für k = 1
ist nichts zu zeigen. Sei nun k > 1 und die Behauptung gelte für k − 1. Dann
folgt mit Hilfe des Distributivgesetzes
!
!
!
∑ di
i=1
k−1
k−1
k
c·
= c·
∑ di + d k
i=1
k−1
=
!
∑ c · di + c · d k =
i=1
∑ di
= c·
i=1
k
∑ c · di .
i=1
Die zweite Behauptung wird analog bewiesen.
+ c · dk =
30
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Satz 26 : (Allgemeines Distributivgesetz)
Seien R ein Ring, m, n ∈ N und a1 , . . ., am , b1 , . . . , bn ∈ R. Dann gilt
!
!
!
!
i=1
·
n
m
n
m
∑ ai
∑ ai · b j
=∑
∑ bj
j=1
i=1
j=1
=
n
m
j=1
i=1
∑ ∑ ai · b j
Beweis: Sei a := ∑m
i=1 ai ∈ R. Nach Hilfssatz 4 ist
!
!
n
a·
∑ bj
=
j=1
n
n
m
j=1
j=1
i=1
∑ a · b j = ∑ ∑ ai
·bj =
n
m
j=1
i=1
.
∑ ∑ ai · b j
!
.
Seien I und J endliche Mengen, R ein Ring und (ai )i∈I , (b j ) j∈J Familien
in R. Mit der Schreibweise von Definition 20 erhält man aus Satz 26:
!
!
!
!
∑ ai
i∈I
·
∑ bj
=∑
j∈J
=
i∈I
∑
(i, j)∈I×J
∑ ai · b j
=
j∈J
ai · b j =:
∑
i∈I, j∈J
∑ ∑ ai · b j
j∈J
=
i∈I
ai · b j .
10. Restklassen
Sei n eine positive ganze Zahl.
Definition 24 : Für a ∈ Z heißt die Menge
ā := {a + z · n | z ∈ Z }
Restklasse von a modulo n. Die Menge
¯ 1,
¯ . . . , n − 1}
{ ā | a ∈ Z } = {0,
wird mit
Zn
(Sprechweise: Z modulo n) bezeichnet. Zwei ganze Zahlen a und b sind
zueinander kongruent modulo n (Schreibweise: a ≡ b mod (n) ), wenn sie
in derselben Restklasse modulo n liegen.
Satz 27 : Für ā,b¯∈ Z n ist
ā =b¯ oder ā ∩b¯= 0/ .
Beweis: Sei ā ∩b¯6= 0.
/ Dann gibt es Zahlen x, y ∈ Z so, dass a + xn = b + yn
ist. Dann ist für alle z ∈ Z
¯
a + zn = b + (y − x + z)n ∈ b¯ (also ā ⊆b)
31
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
und
b + zn = a + (x − y + z)n ∈ ā (alsob¯⊆ ā).
Satz 28 : Seien a, b ganze Zahlen und ā,b¯die Restklassen von a, b modulo
n.
Dann ist ā =b¯genau dann, wenn die Reste von a und b nach Division durch
n gleich sind.
Beweis: Sei r bzw. s der Rest von a bzw. b nach Division durch n. Es ist
¯
r ∈ ā und s ∈b.
Wenn r = s ist, folgt aus Satz 27, dass ā =b¯ist.
Wenn ā =b¯ist, gibt es eine ganze Zahl z mit b = a + zn. Also ist r = s.
32
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Satz 29 : Die Abbildungen
und
+ : Z n × Z n −→ Z n ,
¯ 7−→ ā +b¯:= a + b
( ā,b)
¯ 7−→ ā ·b¯:= ab
· : Z n × Z n −→ Z n , ( ā,b)
sind wohldefiniert. Mit diesen Rechenoperationen ist Z n ein kommutativer
Ring. Das Nullelement bzw. Einselement von Z n ist
0¯= {z · n | z ∈ Z } bzw. 1¯= {1 + z · n | z ∈ Z }.
Beweis: Wir zeigen zuerst, dass + und · wohldefiniert sind. Es seien a, c, b, d ∈
Z so, dass ā = c̄ und̄
b = d.¯Dann sind a − c und b − d Vielfache von n. Wegen
(a + b) − (c + d) = (a − c) + (b − d)
ist auch (a + b) − (c + d) ein Vielfaches von n, also a + b = c + d. Wegen
ab − cd = a(b − d) + (a − c)d
ist ab = cd. Nun kann leicht nachgeprüft werden, dass + und · die Rechenregeln eines kommutativen Ringes erfüllen.
Beispiel 12 : Am Computer können die Elemente von Z n durch die Zahlen
0, 1, . . ., n − 1
dargestellt werden. Dann wird für 0 ≤ a, b < n die Summe ā +b¯bzw. das
Produkt ā ·b¯ durch den Rest von a + b bzw. a · b nach Division durch n
dargestellt.
Eine andere Möglichkeit zur Darstellung der Restklassen modulo n ist die
durch die Zahlen
n
n−1
n
],
−[ ], −[ ] + 1, . . ., [
2
2
2
wobei [ 2n ] die größte ganze Zahl bezeichnet, die kleiner oder gleich n2 ist.
In der Programmiersprache C bedeutet das Rechnen im Datentyp unsigned int das Rechnen im Restklassenring Z n mit n = 232 . Als Summe von
232 − 1 und 1 wird daher 0 ausgegeben.
Satz 30 : Es seien a 6= 0 und n ≥ 2 ganze Zahlen.
(1) Die Restklasse ā ∈ Zn ist genau dann invertierbar, wenn
ggT (a, n) = 1 ist. In diesem Fall wird ā−1 wie folgt berechnet:
– Berechne mit dem erweiterten Euklidischen Algorithmus Zahlen u, v ∈ Z so, dass u · a + v · n = 1 ist.
– Dann ist ā−1 = ū.
(2) Z n ist genau dann ein Körper, wenn n eine Primzahl ist.
Beweis:
33
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
(1) Wenn ggT (a, n) = 1 und u · a + v · n = 1 ist, dann ist
1¯= ū · ā + v̄ · n̄ = ū · ā .
Wenn ā invertierbar ist, dann gibt es eine ganze Zahl b so, dass
ā ·b¯= 1¯ ist. Nach Satz 28 ist daher der Rest von ab nach Division durch n gleich 1, insbesondere ist n ein Teiler von ab − 1. Daher
teilt ggT (a, n) sowohl a als auch 1 − a · b, also muss ggT (a, n) gleich
1 sein.
(2) Seien n eine Primzahl und a ∈ Z . Dann ist a entweder ein Vielfaches
von n oder ggT (a, n) = 1. Daher folgt die Behauptung aus (1).
Beispiel 13 : Der Ring Z 2 ist ein Körper mit zwei Elementen.
KAPITEL 2
Systeme linearer Gleichungen
In diesem Kapitel werden mit m, n, p, q immer positive ganze Zahlen,
mit K ein Körper (z.B. Q oder Z p , p prim) und mit R ein kommutativer
Ring (z.B. Z , Q oder Z n ) bezeichnet.
1. Matrizen
Definition 25 : Eine m × n-Matrix mit Koeffizienten in R (oder eine m × nMatrix über R) ist eine Abbildung
A : {1, 2, . . ., m} × {1, 2, . . ., n} → R , (i, j) 7→ A(i, j) .
Eine Matrix wird üblicherweise als Familie


A11 A12 . . . A1n
 A21 A22 . . . A2n 
A = (Ai j )1≤i≤m = 
..
.. 
 ...
.
. 
1≤ j≤n
Am1 Am2 . . . Amn
geschrieben, wobei Ai j eine Abkürzung für A(i, j) ist und der i j-te Koeffizient von A (oder Koeffizient in der i-ten Zeile und j-ten Spalte von A) genannt
wird. Als Kurzschreibweise wird
A = (Ai j )i, j
verwendet. Anstelle von Matrix-Koeffizienten“ spricht man auch von Matrix”
”
Einträgen“. Eine m × 1-Matrix heißt eine m-Spalte,
eine 1 × n-Matrix eine n-Zeile. Die n-Zeile
Ai− := (Ai1 , Ai2 , . . . , Ain )
heißt i-te Zeile von A, die m-Spalte

A1 j
 A2 j 

A− j := 
 ... 

Am j
j-te Spalte von A. Die Menge aller m × n-Matrizen mit Koeffizienten in R
wird mit
Rm×n
bezeichnet. Matrizen mit Koeffizienten in Z oder Q werden kurz ganzzahlige oder rationale Matrizen genannt. 1 × 1-Matrizen mit Koeffizienten in
34
35
2. SYSTEME LINEARER GLEICHUNGEN
R werden üblicherweise mit den entsprechenden Elementen von R identifiziert, d.h.
R1×1 = R , (Ai j ) 1≤i≤1 = A11 .
1≤ j≤1
Definition 26 : Seien A, B ∈ Rm×n und r ∈ R. Dann heißt


A11 + B11 . . . A1n + B1n
..
..
 ∈ Rm×n
A + B := (Ai j + Bi j )1≤i≤m = 
.
.
1≤ j≤n
Am1 + Bm1 . . . Amn + Bmn
die Summe von A und B, und

rA11 . . .
r · A := (rAi j )1≤i≤m =  ...
1≤ j≤n

rA1n
..  ∈ Rm×n
.
rAm1 . . . rAmn
heißt das r-fache skalare Vielfache von A. Wir schreiben im Folgenden statt
r · A“ kurz rA“. Weiters vereinbaren wir, dass skalare Vielfache vor der
”
”
Summe berechnet werden, zum Beispiel ist rA + B zu lesen als (r · A) + B.
Satz 31 :
(1) (Rm×n , +) ist eine kommutative Gruppe, wobei das neutrale Element
die m × n-Nullmatrix


0R . . . 0R
..  ∈ Rm×n
0 =  ...
.
0R . . . 0R
und das zu A ∈ Rm×n inverse Element
−A = (−Ai j )1≤i≤m ∈ Rm×n
1≤ j≤n
ist.
(2) Für r, s ∈ R und A, B ∈ Rm×n ist
(r + s)A = rA + sA
und
(3) Für r, s ∈ R und
r(A + B) = rA + rB.
ist
ARm×n
(rs)A = r(sA) und 1R A = A .
Beweis: (1) Wir zeigen nur die Assoziativität, die anderen Eigenschaften
einer Gruppe werden analog bewiesen. Für A, B,C ∈ Rm×n ist
(A + B) +C = (Ai j + Bi j )i, j + (Ci, j )i, j = ((Ai j + Bi j ) +Ci j )i, j =
= (Ai j + (Bi j +Ci j ))i, j = (Ai j )i, j + (Bi j +Ci j )i, j = A + (B +C)
36
2. SYSTEME LINEARER GLEICHUNGEN
aufgrund des Assoziativgesetzes für die Addition in R.
(2), (3) Übung.
Definition 27 : Für A ∈ Rm×n und B ∈ Rn×p heißt
n
A · B := ( ∑ Aik Bk j )1≤i≤m ∈ Rm×p
1≤ j≤p
k=1
das Produkt von A und B (sprich A mal B“). Oft wird statt A · B nur AB
”
geschrieben. Zur Berechnung des Koeffizienten
n
(AB)i j =
∑ Aik Bk j
k=1
werden die Koeffizienten in der i-ten Zeile von A der Reihe nach mit den
entsprechenden Koeffizienten in der j-ten Spalte von B multipliziert und
anschließend alle diese Produkte addiert.
Im Spezialfall m = 1 und p = 1, d.h. A ist eine n-Zeile und B eine nSpalte, ergibt sich
 
B1
n
AB = (A1 , . . . , An )  ...  = A1 B1 + · · · + An Bn = ∑ Ai Bi .
i=1
Bn
Beispiel 14 : Ein Korb voller Waren werde durch die Zeile
S := (S1 , . . . , Sn ) ∈ Q 1×n
beschrieben, wobei Si die Stückzahl der Ware i im Korb angibt. Sei
 
P1

P := ...  ∈ Q n×1 ,
Pn
wobei Pi den Preis der Ware i in Euro angibt. Dann ist
n
SP = ∑ Si Pi ∈ Q
i=1
der Wert des ganzen Korbs.
37
2. SYSTEME LINEARER GLEICHUNGEN
Beispiel 15 : Die Waren 1, . . . , m werden aus Rohstoffen 1, . . ., n hergestellt, die von Lieferanten 1, . . ., p bezogen werden. Für die Erzeugung der
Ware i werden Qi j Einheiten des Rohstoffes j benötigt. Der Preis des Rohstoffes j beim Lieferanten k beträgt Pjk . Setzt man
Q := (Qi j )i, j ∈ Q m×n und P := (Pjk ) j,k ∈ Q n×p , dann ist
n
(QP)ik =
∑ Qi j Pjk
j=1
der Gesamtpreis der Rohstoffe für Ware i beim Lieferanten k. Sollen jeweils
Si Stück der Ware i produziert werden und setzt man
S = (S1 , . . . , Sm ) ∈ Q 1×n , dann ist (SQ)1 j die Anzahl der insgesamt benötigten Einheiten von Rohstoff j und
((SQ)P)1k
ist der Preis bei Lieferant k für alle benötigten Rohstoffe.
Satz 32 : Die Matrizenmultiplikation ist assoziativ, d.h. für Matrizen A ∈
Rm×n , B ∈ Rn×p und C ∈ R p×q gilt
(AB)C = A(BC).
Beweis: Da AB eine m × p-Matrix und BC eine n × q-Matrix ist, sind sowohl (AB)C als auch A(BC) m × q-Matrizen. Für 1 ≤ i ≤ m und 1 ≤ j ≤ q
ist
!
p
((AB)C)i j =
∑ (AB)ikCk j =
k=1
p n
=
p
n
k=1
`=1
n p
∑ ∑ Ai`B`k
∑ ∑ Ai`B`kCk j = ∑ ∑ Ai`B`kCk j
k=1 `=1
n
=
Ck j
∑ Ai`
`=1
`=1 k=1
p
∑ B`kCk j
k=1
!
n
=
∑ Ai`(BC)` j
`=1
= (A(BC))i j .
Definition 28 : Für Elemente i, j einer beliebigen Indexmenge ist das KroneckerDelta in R
(
1R falls i = j,
δi j :=
0R falls i 6= j.
38
2. SYSTEME LINEARER GLEICHUNGEN
Die Matrix

1
0
In := (δi j ) 1≤i≤n = 
 ...
1≤ j≤n
0
0
1
..
.
0
heißt n × n-Einheitsmatrix.

... 0
. . . 0
∈ Rn×n
. . .. 
. .
... 1
Satz 33 : Für eine beliebige Matrix A ∈ Rm×n ist
Im A = A
und AIn = A .
Beweis: Für 1 ≤ i ≤ m und 1 ≤ j ≤ n ist
(Im A)i j = ∑m
k=1 δik Ak j = Ai j ,
also Im A = A. Analog beweist man AIn = A.
Satz 34 : Für A, B ∈ Rm×n und C ∈ Rn×p gilt
(A + B)C = AC + BC.
Für A ∈ Rm×n und B,C ∈ Rn×p gilt
A(B +C) = AB + AC.
Für A ∈ Rm×n , B ∈ Rn×p und r ∈ R gilt
r(AB) = (rA)B = A(rB).
Für A ∈ Rm×n und r, s ∈ R gilt
(rs)A = r(sA).
Beweis: Übung.
Satz 35 : (Rn×n , +, ·) ist ein Ring mit Einselement In . Wegen
1 0
0 1
0 1
=
0 0
0 0
0 0
aber
0 1
0 0
1 0
0 0
=
0 0
0 0
ist Rn×n im Allgemeinen nicht kommutativ.
Beweis: Die Behauptung folgt aus Satz 32, Satz 33 und Satz 34.
39
2. SYSTEME LINEARER GLEICHUNGEN
Definition 29 : Eine Matrix A ∈ Rn×n heißt invertierbar, wenn es eine Matrix B ∈ Rn×n gibt mit
AB = In
und
BA = In .
In diesem Fall nennt man B die zu A inverse Matrix und schreibt
B = A−1 .
Sei
GLn (R) := {A ∈ Rn×n | A invertierbar}.
Nach Satz 24 ist (GLn (R), ·) eine Gruppe, sie heißt allgemeine lineare Gruppe (auf Englisch general linear group“).
”
Definition 30 : Sei A = (Ai j )1≤i≤m ∈ Rm×n . Dann heißt
1≤ j≤n
AT := (A ji )1≤i≤m ∈ Rn×m
1≤ j≤n
die transponierte Matrix von A.
Satz 36 : Für r ∈ R, A, B ∈ Rm×n und C ∈ GLn (R) gilt:
(1) (AT )T = A
(2) (A + B)T = AT + BT
(3) (rA)T = rAT
(4) (AB)T = BT AT (die Reihenfolge kehrt sich um !)
(5) (C −1 )T = (C T )−1 .
Beweis: Übung.
2. Elementare Umformungen
Definition 31 : Seien 1 ≤ k ≤ m und 1 ≤ ` ≤ n. Dann heißt die Matrix
Ek` ∈ Rm×n mit Koeffizienten
(
1R falls i = k und j = `,
(Ek` )i j := δik δ j` =
0R falls i 6= k oder j 6= `,
eine Standard-Matrix von Rm×n . Zum Beispiel sind die Standard-Matrizen
von Q 2×2
1 0
0 1
0 0
0 0
E11 =
, E12 =
, E21 =
und E22 =
.
0 0
0 0
1 0
0 1
Im Spezialfall m = 1 (oder n = 1) schreibt man statt E1` (bzw. Ek1 ) kurz
e` (bzw. ek ). Zum Beispiel sind die Standard-Zeilen von Q 1×3
e1 = (1, 0, 0) , e2 = (0, 1, 0) und e3 = (0, 0, 1)
40
2. SYSTEME LINEARER GLEICHUNGEN
und die Standard-Spalten von Q 2×1 sind
1
0
e1 =
und e2 =
.
0
1
Definition 32 : Die folgenden Matrizen heißen Elementarmatrizen in Rn×n :
Typ 1: In + rEk` , wobei r ∈ R und k 6= ` ist,
Typ 2: In − Ekk − E`` + Ek` + E`k , wobei k 6= ` ist,
Typ 3: In + (t − 1)Ekk , wobei t ∈ R invertierbar ist.
Zum Beispiel sind
0 1
1 0
1 2
∈ Q n×n
,
,
1 0
0 3
0 1
Elementarmatrizen vom Typ 1, Typ 2 bzw. Typ 3.
Hilfssatz 5 : Für Ek` ∈ Rm×m , A ∈ Rm×n und 1 ≤ i ≤ m ist
(
A`− falls i = k,
(Ek` A)i− =
0
falls i 6= k.
Beweis: Sei 1 ≤ j ≤ n. Wenn i 6= k ist, dann ist (Ek` A)i j = 0, weil außerhalb
der k-ten Zeile von Ek` nur Nullen stehen. Wenn i = k ist, dann ist (Ek` A)i j =
A` j , weil bei der Produktbildung die 1 in Ek` auf A` j trifft.
Satz 37 : Sei A ∈ Rm×n und seien P ∈ Rm×m sowie Q ∈ Rn×n Elementarmatrizen. Dann erhält man PA aus A, indem man
Typ 1: zur k-ten Zeile von A das r-fache der `-ten Zeile addiert,
Typ 2: die k-te und `-te Zeile von A vertauscht,
Typ 3: die k-te Zeile von A mit t multipliziert.
Diese Umformungen der Matrix A heißen elementare Zeilenumformungen.
Analog erhält man AQ aus A, indem man
Typ 1: zur `-ten Spalte von A das r-fache der k-ten Spalte addiert,
Typ 2: die k-te und `-te Spalte von A vertauscht,
Typ 3: die k-te Spalte von A mit t multipliziert.
Diese Umformungen der Matrix A heißen elementare Spaltenumformungen.
Beweis: Für P = In + rEk` , wobei r ∈ R und k 6= `, ist
PA = (In + rEk` )A = A + rEk` A. Nach Hilfssatz 5 ist
(
rA`− falls i = k,
(rEk` A)i− =
0
falls i 6= k.
41
2. SYSTEME LINEARER GLEICHUNGEN
Die anderen Fälle beweist man analog.
Satz 38 : Elementarmatrizen sind invertierbar, genauer gilt:
Typ 1: (In + rEk` )−1 = In − rEk`
Typ 2: (In − Ekk − E`` + Ek` + E`k )−1 = In − Ekk − E`` + Ek` + E`k
Typ 3: (In + (t − 1)Ekk )−1 = In + (t −1 − 1)Ekk .
Somit können alle elementaren Zeilen- oder Spaltenumformungen einer beliebigen Matrix durch elementare Zeilen- oder Spaltenumformungen wieder
rückgängig gemacht werden.
Beweis: Die Matrix
(In − rEk` )(In + rEk` ) = (In − rEk` )[(In + rEk` )In ]
erhält man aus Im , indem man zuerst zur k-ten Zeile das r-fache der `-ten
Zeile addiert und anschließend das r-fache der `-ten Zeile subtrahiert. Daher
ist
(In − rEk` )(In + rEk` ) = In .
Die anderen Fälle beweist man analog. Ist P eine Elementarmatrix, so bekommt man A aus B := PA wieder zurück, indem man B von links mit P −1
multipliziert.
3. Systeme linearer Gleichungen
Definition 33 : Ein System linearer Gleichungen mit Koeffizienten in K
(oder ein lineares Gleichungssystem über K) ist durch eine Matrix A ∈ K m×n
und eine Spalte b ∈ K m×1 gegeben. Die Lösungsmenge dieses Systems ist
L(A, b) := {x | x ∈ K n×1 mit Ax = b}.
Das System lösen heißt, die Menge L(A, b) zu berechnen. Das System heißt
homogen, wenn b die Nullspalte ist, ansonsten inhomogen.
Ohne Matrizen kann man das so formulieren: Gegeben sind Elemente
Ai j ∈ K und bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Gesucht sind alle n-Tupel
(x1 , . . . , xn ) mit Komponenten in K, sodass
A11 x1 + A12 x2 + · · · + A1n xn = b1
A21 x1 + A22 x2 + · · · + A2n xn = b2
..
..
..
.
.
.
Am1 x1 + Am2 x2 + · · · + Amn xn = bm
ist.
Das durch A ∈ K m×n und b ∈ K m×1 gegebene System linearer Gleichungen wird kurz mit (A, b)“ oder Ax = b“ bezeichnet. Die Zahl m heißt die
”
”
Anzahl der Gleichungen, die Zahl n die Anzahl der Unbekannten.
42
2. SYSTEME LINEARER GLEICHUNGEN
Aus der Definition sieht man, dass ein homogenes System linearer Gleichungen immer eine Lösung hat, und zwar die Nullspalte. Hingegen gibt es
inhomogene Systeme ohne Lösung, zum Beispiel das System
x1 + x 2 = 0
.
2x1 + 2x2 = 1
Beispiel 16 : Es soll eine Legierung aus bi Gramm der Metalle Mi , 1 ≤ i ≤
m, hergestellt werden. Zur Verfügung stehen beliebige Mengen von Legierungen L1 , . . . , Ln der Metalle M1 , . . . , Mm , wobei 1 Gramm der Legierung L j
jeweils Ai j Gramm des Metalls Mi enthält. Wieviele Gramm von L1 , . . . , Ln
müssen für die gewünschte Legierung verschmolzen werden ?
Das Zusammenschmelzen von x1 , . . ., xn Gramm der Legierungen L1 , . . ., Ln
gibt eine Legierung mit jeweils
n
∑ Ai j x j
j=1
Gramm des Metalls Mi . Gesucht ist somit L(A, b).
Satz 39 : Seien (A, b) ein System linearer Gleichungen über K und z ∈
L(A, b). Dann ist
L(A, b) = {z + v | v ∈ L(A, 0)}.
Beweis: Sei v ∈ L(A, 0). Dann ist A(z + v) = Az + Av = b + 0 = b, also
z + v ∈ L(A, b).
Sei x ∈ L(A, b). Dann ist A(x − z) = Ax − Az = b − b = 0, also x − z ∈
L(A, 0) und x = z + (x − z) ∈ {z + v | v ∈ L(A, 0)}.
Um die Lösungsmenge eines inhomogenen linearen Gleichungssystems
(A, b) zu bestimmen, genügt es somit, nur eine Lösung zu finden und die
Lösungsmenge
des
homogenen
linearen
Gleichungssystems
(A, 0) zu bestimmen.
Satz 40 : Seien A ∈ K m×n , r, s ∈ K und v, w ∈ L(A, 0). Dann ist auch rv +
sw ∈ L(A, 0) .
Beweis: A(rv + sw) = r(Av) + s(Aw) = 0 + 0 = 0.
Für die Lösungsmenge L eines Systems linearer Gleichungen gilt genau
eine der folgenden drei Aussagen:
(1) L ist leer ( es gibt keine Lösung“).
”
43
2. SYSTEME LINEARER GLEICHUNGEN
(2) L enthält genau ein Element ( eine Lösung existiert und ist eindeutig
”
bestimmt“).
(3) L enthält mindestens zwei Elemente.
Wenn K unendlich ist (z.B. K = Q ), dann enthält L im Fall (3) nach
Satz 39 und Satz 40 unendlich viele Elemente. Wie können wir L dann
durch endlich viele Daten beschreiben? Um diese Frage zu beantworten,
führen wir im nächsten Abschnitt die Begriffe Vektorraum“ und Basis“
”
”
ein.
4. Vektorräume
Beim Rechnen mit m × n-Matrizen mit Koeffizienten in einem Körper
K haben wir zwei Rechenoperationen kennengelernt:
(1) Die Addition von zwei m × n-Matrizen,
(2) Die Multiplikation eines Elementes von K (eines Skalars“) mit einer
”
m × n-Matrix.
Im Satz 31 wurden die dafür geltenden Rechenregeln angegeben.
Definition 34 : Sei V eine Menge und seien + : V × V → V sowie · : K ×
V → V Abbildungen. Wir schreiben statt +(v, w)“ kurz v + w“ und statt
”
”
·(r, v)“ kurz r · v oder nur rv“. Das Tripel (V, +, ·) ist ein Vektorraum über
”
”
”
K, wenn die folgenden drei Bedingungen erfüllt sind:
(1) (V, +) ist eine abelsche Gruppe.
(2) Für alle r, s ∈ K und für alle v, w ∈ V ist
r(v + w) = (rv) + (rw) und (r + s)v = (rv) + (sv) .
(3) Für alle r, s ∈ K und für alle v ∈ V ist (rs)v = r(sv) und 1K v = v .
Ist (V, +, ·) ein Vektorraum, dann heißen die Elemente von V Vektoren“,
”
+ Addition“ und · Skalarmultiplikation“. Statt (V, +, ·) wird oft nur V
”
”
geschrieben. Das neutrale Element von (V, +) wird mit 0V bezeichnet und
heißt der Nullvektor.
Man beachte, dass der Begriff Vektor“ erst nach dem Begriff Vektor”
”
raum“ eingeführt werden kann, so wie der Begriff Tiroler“ erst nach dem
”
Begriff Tirol“ eingeführt werden kann.
”
Die Eigenschaften von Vektoren können kurz so beschrieben werden:
Vektoren können miteinander addiert und mit Skalaren multipliziert werden. Dabei gelten die üblichen“ Rechenregeln.
”
Ein Beispiel aus der Physik: alle Kräfte, die in einem vorgegebenen
Punkt angreifen, bilden einen Vektorraum, weil sie addiert und mit Zahlen
multipiziert werden können und dabei obige Rechenregeln gelten. Daher
sind solche Kräfte Vektoren.
Die Addition und die Skalarmultiplikation von m × n-Matrizen mit Koeffizienten in einem Körper erfüllen die Rechenregeln eines Vektorraums.
Daher: Matrizen sind Vektoren“.
”
44
2. SYSTEME LINEARER GLEICHUNGEN
Satz 41 :
K n = {(a1 , . . . , an ) | a1 , . . ., an ∈ K}
mit der komponentenweisen Addition
(a1 , . . ., an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn )
und der komponentenweisen Skalarmultiplikation
r(a1 , . . . , an ) := (ra1 , . . ., ran )
ist ein Vektorraum über K und heißt Standard-Vektorraum über K der Dimension n. In diesem Vektorraum ist 0V = (0, . . ., 0) und
−(a1 , . . . , an ) = (−a1 , . . ., −an ).
Beweis: Übung.
Beispiel 17 : Ein Kaufhaus bietet n Waren an. Sei Ui j die Anzahl der am
Tag i verkauften Einheiten der Ware j. Dann gibt
Ui− = (Ui1 , . . . ,Uin )
den Umsatz am Tag i an,
U1− + · · · +Uk− =
k
k
i=1
i=1
∑ Ui1, . . ., ∑ Uin
!
ist der Umsatz vom ersten bis zum k-ten Tag, und
1
(U1− + · · · +Uk− ) ∈ K n
k
ist der durchschnittliche Tagesumsatz.
Satz 42 : Seien V ein Vektorraum über K, r ∈ K und v ∈ V . Dann gilt:
(1) Es ist rv = 0 genau dann, wenn r = 0 oder v = 0 ist.
(2) (−r)v = r(−v) = −(rv) .
Beweis: (1) Aus
0V + 0K v = 0K v = (0K + 0K )v = 0K v + 0K v
folgt durch Kürzen 0K v = 0V . Ebenso folgt aus
0V + r0V = r0V = r(0V + 0V ) = r0V + r0V
durch Kürzen r0V = 0V . Wenn umgekehrt rv = 0 aber r 6= 0 ist, dann ist r
invertierbar, weil K ein Körper ist, und
v = 1K v = (r−1 r)v = r−1 (rv) = r−1 0V = 0V .
(2) Wegen (rv)+(−r)v = [r +(−r)]v = 0K v = 0V ist −(rv) = (−r)v. Wegen
(rv) + (r(−v)) = r[v + (−v)] = r0V = 0V ist −(rv) = r(−v).
45
2. SYSTEME LINEARER GLEICHUNGEN
Definition 35 : Sei V ein Vektorraum über K. Eine Teilmenge U von V
heißt Untervektorraum oder linearer Unterraum von V , wenn die folgenden
drei Bedingungen erfüllt sind:
(1) 0V ∈ U
(2) Sind zwei Vektoren u, v Elemente von U , dann auch ihre Summe
u + v.
(3) Ist ein Vektor v Element von U , dann auch alle skalaren Vielfachen
rv, r ∈ K.
Man schreibt dann
U ≤K V
oder
U ≤ V.
Hilfssatz 6 : Seien (V, +, ·) ein Vektorraum über K und W ein Untervektorraum von V . Dann ist (W, +|W ×W , ·|K×W ) selbst ein Vektorraum über K.
Beweis: Übung.
Satz 43 : Die Lösungsmenge eines homogenen Systems linearer Gleichungen mit der komponentenweisen Addition und Skalarmultiplikation ist ein
Vektorraum.
Beweis: Folgt aus Satz 40 und Hilfssatz 6.
5. Erzeugendensysteme, lineare Unabhängigkeit und Basen
Definition 36 : Seien V ein Vektorraum über K und (vi )i∈I eine Familie von
Vektoren in V , wobei I eine beliebige Indexmenge (oft
{1, 2, . . ., n}) ist.
Eine Familie (ci )i∈I von Elementen in K heißt Koeffizientenfamilie, wenn
ci 6= 0 für nur endlich viele i ∈ I ist.
Ein Vektor w ∈ V heißt eine Linearkombination von (vi )i∈I , wenn es eine
Koeffizientenfamilie (ci )i∈I gibt, sodass
w = ∑ ci vi
i∈I
ist. Dabei ist im Fall einer unendlichen Indexmenge I obige Summe als die
endliche Summe über alle Indizes i ∈ I mit ci 6= 0 zu verstehen.
Die Menge aller Linearkombinationen von (vi )i∈I ist der kleinste Untervektorraum von V , der alle Vektoren vi , i ∈ I, enthält. Er heißt der von vi ,
i ∈ I, erzeugte Untervektorraum von V und wird mit
K hvi
| i ∈ Ii
oder
∑ Kvi
i∈I
46
2. SYSTEME LINEARER GLEICHUNGEN
bezeichnet. Wenn I = {1, . . ., n} ist, dann ist
n
K hvi
| i ∈ Ii = { ∑ ci vi | c1 , . . ., cn ∈ K} .
i=1
Definition 37 : Sei V ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren in V heißt ein Erzeugendensystem von V , wenn
K hvi
| i ∈ Ii = V
ist.
Definition 38 : Seien V ein Vektorraum über K und (vi )i∈I eine Familie
von Vektoren in V . Dann heißt (vi )i∈I linear unabhängig, wenn für jede
Koeffizientenfamilie (ci )i∈I aus
∑ ci vi = 0
i∈I
auch
ci = 0 für alle i ∈ I
folgt. Andernfalls heißt (vi )i∈I linear abhängig.
Beispiel 18 : Sei V ein Vektorraum über K. Ein einzelner Vektor v ∈ V ist
linear unabhängig genau dann, wenn v 6= 0 ist, weil aus rv = 0 nach Satz 42
r = 0 oder v = 0 folgt.
Satz 44 : Sei A ∈ K m×n .
(1) L(A, 0) ist genau dann der Nullraum, wenn die Spalten
(A−1 , . . ., A−n ) linear unabhängig sind.
(2) Für b ∈ K m×1 ist das lineare Gleichungssystem Ax = b genau dann
lösbar, wenn b eine Linearkombination der Spalten von A ist.
Beweis: Für y ∈ K n×1 ist
Ay = y1 A−1 + . . . yn A−n .
Definition 39 : Sei V ein Vektorraum über K. Eine Basis von V ist ein linear
unabhängiges Erzeugendensystem von V .
Satz 45 : Die Familie
(Ek` )1≤k≤m
1≤`≤n
47
2. SYSTEME LINEARER GLEICHUNGEN
der Standard-Matrizen (siehe Definition 31) ist eine Basis von
K m×n und heißt die Standardbasis von K m×n .
Insbesondere ist die Familie
(ei )1≤i≤n
der Standard-Zeilen (siehe Definition 31) eine Basis von K n und heißt die
Standardbasis von K n .
Beweis: Da für eine beliebige Matrix A ∈ K m×n
A=
∑
Ak` Ek`
1≤k≤m
1≤`≤n
ist, ist die Familie (Ek` )1≤k≤m ein Erzeugendensystem von K m×n . Um die
1≤`≤n
lineare Unabhängigkeit dieser Familie zu zeigen, nehmen wir an, dass für
gewisse ck` ∈ K
∑
ck` Ek` = 0
1≤k≤m
1≤`≤n
ist. Dann folgt für alle 1 ≤ i ≤ m und 1 ≤ j ≤ n
0=
∑
ck` (Ek` )i j = ci j ,
1≤k≤m
1≤`≤n
was zu zeigen war.
Satz 46 : Sei V ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren
in V ist genau dann eine Basis von V , wenn sich jeder Vektor in V in eindeutiger Weise als Linearkombination von (vi )i∈I schreiben lässt, d.h. für
alle w ∈ V gibt es genau eine Koeffizientenfamilie (ci )i∈I , sodass
w = ∑ ci vi
i∈I
ist. Diese Familie (ci )i∈I heißt dann die Koordinatenfamilie des Vektors w
bezüglich der Basis (vi )i∈I , und ci ∈ K heißt die Koordinate von w beim
Basisvektor vi .
Beweis: Wenn sich jeder Vektor aus V in eindeutiger Weise als Linearkombination von (vi )i∈I schreiben lässt, dann ist (vi )i∈I einerseits ein Erzeugendensystem von V und andererseits linear unabhängig, weil aus
∑ civi = 0V = ∑ 0K vi
i∈I
i∈I
48
2. SYSTEME LINEARER GLEICHUNGEN
auf Grund der Eindeutigkeit ci = 0K für alle i ∈ I folgt.
Seien umgekehrt (vi )i∈I eine Basis von V und w ∈ V . Da (vi )i∈I ein Erzeugendensystem von V ist, gibt es eine Koeffizientenfamilie (ci )i∈I mit
w = ∑ ci vi .
i∈I
Falls (di )i∈I eine weitere Koeffizientenfamilie in K mit
w = ∑ d i vi
i∈I
ist, erhält man durch Subtrahieren
0V = ∑(ci − di )vi .
i∈I
Da (vi )i∈I linear unabhängig ist, folgt ci − di = 0K für alle i ∈ I, also ci = di
für alle i ∈ I.
Beispiel 19 : Für A ∈ K m×n ist
∑
A=
Ak` Ek` ,
1≤k≤m
1≤`≤n
also ist A die Koordinatenfamilie von A bezüglich der Standardbasis (E k` )1≤k≤m
1≤`≤n
(und Ak` die Koordinate von A bei Ek` ).
Beispiel 20 : Seien V ein Vektorraum über K, (v1 , . . ., vn ) ∈ V n eine Basis
von V , w1 , . . . , w` ∈ V und u = ∑ni=1 ci vi ∈ V eine Linearkombination von
(v1 , . . . , vn ). Die Aufgabe
Überprüfe, ob u eine Linearkombination von (w1 , . . . , w` ) ist und
”
- wenn ja - berechne ein `-Tupel (d1 , . . ., d` ) mit u = ∑`j=1 d j w j .“
kann als System linearer Gleichungen formuliert werden:
Sei T die n × `-Matrix mit
n
w j := ∑ Ti j vi , 1 ≤ j ≤ ` .
i=1
Gesucht ist eine `-Spalte d ∈ K `×1 so, dass
n
∑ ci vi = u =
i=1
`
n
`
∑ d j w j = ∑ ( ∑ Ti j d j )vi
j=1
i=1 j=1
ist. Daher ist eine solche Spalte d eine Lösung des Systems linearer Gleichungen T x = c, wobei c die n-Spalte mit Einträgen c1 , . . ., cn ist.
Satz 47 : Jeder Vektorraum V über K besitzt eine Basis. Wenn V eine endliche Basis hat, dann enthalten je zwei Basen von V gleich viele Vektoren.
49
2. SYSTEME LINEARER GLEICHUNGEN
Beweis: wird weggelassen.
Definition 40 : Die Zahl
dimK (V ) := Anzahl der Elemente einer Basis von V
heißt die Dimension von V . Wenn dimK (V ) = n ist, dann nennt man V ndimensional. (Jeder Vektor in V kann durch n Zahlen eindeutig beschrieben
werden).
Ein Vektorraum V heißt endlich-dimensional, wenn er eine endliche Basis
hat, sonst heißt er unendlich-dimensional.
Beispiel 21 : Nach Satz 45 ist dimK (K m×n ) = m · n und
dimK (K n ) = n .
Nach Einführung des Begriffs Basis“ kann die Aufgabenstellung Be”
”
rechne die Lösungsmenge des linearen Gleichungssystems (A, b)“ präzisiert
werden:
Berechne irgendeine Lösung von (A, b) und eine Basis des Lösungsraums
”
von (A, 0)“.
Man beachte, dass damit nur endlich viele Daten zu berechnen sind, diese bestimmen aber vollständig die (möglicherweise unendliche) Lösungsmenge L(A, b).
6. Der Gauss-Algorithmus
Wir werden nun eine Methode zum Lösen eines linearen Gleichungssystems (A, b) kennenlernen. Zunächst betrachten wir einen Spezialfall, in
dem die Matrix A eine besonders einfache Gestalt hat. In diesem Fall können
wir die Lösungsmenge direkt anschreiben (Satz 48). Danach werden wir
den allgemeinen Fall auf den einfachen Fall zurückführen, indem wir die
Daten (A, b) schrittweise so verändern, dass die geänderten Daten (A 0 , b0 )
schließlich die einfache Gestalt haben und
L(A, b) = L(A0 , b0 )
ist (Satz 50 und Satz 52). Den Übergang von den Daten (A, b) zu (A0 , b0 )
nennt man die Gleichungen umformen“. Gilt dabei
”
L(A, b) = L(A0 , b0 ), dann sind die Umformungen zulässig“.
”
Definition 41 : Eine Matrix A ∈ K m×n hat Stufenform, wenn die folgenden
vier Bedingungen erfüllt sind:
(1) Ist Ai− = 0, dann sind auch A(i+1)− = · · · = Am− = 0.
(2) Der (von links gelesen) erste Koeffizient 6= 0 in jeder Zeile heißt
Pivot und ist 1.
50
2. SYSTEME LINEARER GLEICHUNGEN
(3) Der Pivot von Zeile i + 1 steht rechts vom Pivot von Zeile i.
(4) Der Pivot jeder Zeile ist der einzige Koeffizient 6= 0 in seiner Spalte.
Dann hat A die Gestalt

0 ... 0 1 ∗ ... ∗ 0 ∗ ... ∗ 0 ∗ ...
0 . . . . . . . . . . . . . . . . 0 1 ∗ . . . ∗ 0 ∗ . . .


0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 ∗ . . . ,
..
.

wobei die Sterne für beliebige Elemente von K stehen.
Satz 48 : Sei (A, b) ein System linearer Gleichungen über K mit
A ∈ K m×n in Stufenform. Seien r die Anzahl der Pivots,
d1 < d2 < · · · < dr die Spaltenindizes der Pivots und
 
 
0
1
 ... 
0 
 

e1 = 
 ...  , . . . , en = 0
0
1
die Standardspalten von K n×1 . Dann gilt:
(1) L(A, b) ist genau dann nicht leer, wenn für alle i > r gilt: bi = 0.
In diesem Fall ist
 
0
 ... 
 
0
 
b 
 1
0
 
r
 
z := ∑ bi edi =  ...  ∈ L(A, b),
 
i=1
0
 
 br 
 
0
.
 .. 
0
wobei b1 , . . ., br in den Zeilen d1 , . . . , dr stehen.
51
2. SYSTEME LINEARER GLEICHUNGEN
(2) Sei J := {1, . . ., n} \ {d1 , . . ., dr } und, für alle j ∈ J,


0
 .. 
 . 


 0 


−A1 j 
 0 


 . 
 .. 


r
 0 
,

w j := e j − ∑ Ai j edi = 

1


i=1
 0 


 .. 
 . 


 −Ar j 


 0 
 . 
 .. 
0
wobei −A1 j , . . . , −Ar j in den Zeilen d1 , . . ., dr sowie 1 in der Zeile j
stehen. Dann ist (w j ) j∈J eine K-Basis von L(A, 0).
Beweis: (1) Wenn L(A, b) nicht leer ist, dann gibt es ein x mit Ax = b, und
es folgt bi = Ai− x = 0 für i > r. Sei umgekehrt bi = 0 für i > r. Dann ist
r
r
i=1
i=1
Az = A( ∑ bi edi ) = ∑ bi Aedi =
r
r
i=1
i=1
∑ biA−di = ∑ biei = b,
also z ∈ L(A, b).
(2) Für alle j ∈ J ist
r
r
r
i=1
i=1
i=1
Aw j = A(e j − ∑ Ai j edi ) = Ae j − ∑ Ai j Aedi = A− j − ∑ Ai j ei = 0,
also w j ∈ L(A, 0).
Sei (t j ) j∈J eine Familie in K. Dann ist
∑ t jw j =
j∈J
r
∑ t j e j − ∑ ( ∑ t j Ai j )edi ,
i=1 j∈J
j∈J
daher ist t j die Koordinate von ∑ j∈J t j w j beim Standardbasisvektor e j , für
alle j ∈ J. Aus ∑ j∈J t j w j = 0 folgt somit t j = 0, j ∈ J. Daher ist (w j ) j∈J
linear unabhängig.
Es bleibt noch zu zeigen, dass jedes v ∈ L(A, 0) eine Darstellung
v=
∑ s jw j
j∈J
52
2. SYSTEME LINEARER GLEICHUNGEN
mit gewissen s j ∈ K besitzt. Aus Av = 0 folgt für alle i ≤ r:
n
0 = Ai− v =
∑ A i j v j = v di + ∑ A i j v j .
j∈J
j=1
Somit gilt für 1 ≤ i ≤ r
v di = − ∑ A i j v j
j∈J
und wir erhalten
r
v=
r
∑ v j e j + ∑ v di e di = ∑ v j e j − ∑ ∑ A i j v j
j∈J
j∈J
i=1
r
=
∑ v j e j − ∑ v j ∑ A i j e di
j∈J
=
j∈J
i=1
i=1
!
=
∑ vj
j∈J
j∈J
!
r
e di
e j − ∑ A i j e di
i=1
!
∑ v jw j ,
j∈J
was zu zeigen war.
Unser nächstes Ziel ist es, beliebige lineare Gleichungssysteme zu lösen. Ein erster Schritt dazu ist der folgende Satz.
Satz 49 : Sei (A, b) ein lineares Gleichungssystem mit A ∈ K m×n . Dann gilt
für beliebiges P ∈ GLm (K)
L(PA, Pb) = L(A, b).
Beweis: Ist y ∈ L(A, b), dann ist Ay = b, also auch PAy = Pb und y ∈
L(PA, Pb). Daher ist L(A, b) eine Teilmenge von L(PA, Pb).
Ist y ∈ L(PA, Pb), dann ist PAy = Pb, also auch Ay = P−1 PAy = P−1 Pb = b
und y ∈ L(A, b). Daher ist L(PA, Pb) eine Teilmenge von L(A, b).
Satz 49 legt nahe, zu einem gegebenen linearen Gleichungssystem (A, b)
eine invertierbare Matrix P zu suchen, sodass das Gleichungssystem (PA, Pb)
Stufenform hat. Dann kann die Lösungsmenge mit Satz 48 bestimmt werden.
Satz 50 : Jede Matrix A ∈ K m×n kann durch elementare Zeilenumformungen auf Stufenform gebracht werden, genauer gesagt gibt es ein P ∈ GL m (K),
das Produkt von höchstens mn Elementarmatrizen ist, sodass PA Stufenform
hat. Diese Matrix PA kann mit dem folgenden Algorithmus berechnet werden (Gauss-Elimination):
(1) Setze C := A, i := 1 und j := 1.
53
2. SYSTEME LINEARER GLEICHUNGEN
(2) Falls Ci j 6= 0 ist, gehe zu Schritt 4.
Ansonsten suche ein k ∈ {i + 1, . . ., m} mit Ck j 6= 0.
(3) Falls es kein k ∈ {i + 1, . . . , m} mit Ck j 6= 0 gibt, erhöhe j um 1 und
wiederhole Schritt 2.
Ansonsten vertausche die i-te und k-te Zeile von C und nenne die
neue Matrix wieder C. (Dann ist Ci j 6= 0).
(4) Multipliziere die i-te Zeile von C mit Ci−1
j und nenne die neue Matrix
wieder C. (Dann ist Ci j = 1).
(5) Für ` ∈ {1, . . ., m} \ {i} mit C` j 6= 0 subtrahiere das C` j -fache der
i-ten Zeile von der `-ten Zeile und nenne die neue Matrix wieder C.
(Dann ist C− j = ei ).
(6) Erhöhe i und j um 1 und gehe zu Schritt 2.
Der Algorithmus wird abgebrochen, sobald i > m oder j > n ist. Dann hat
die Matrix C Stufenform.
Beweis: Der Algorithmus bricht nach höchstens n Durchläufen ab, weil in
jedem Durchlauf j um 1 erhöht wird. Seien P1 , . . ., Ps die Elementarmatrizen zu den im Algorithmus der Reihe nach durchgeführten elementaren
Zeilenumformungen. Da pro Durchlauf höchstens m elementare Zeilenumformungen durchgeführt werden, ist s ≤ nm. Nach Satz 37 erhält man am
Ende des Algorithmus die Matrix
(Ps . . . (P2 (P1 A)) . . .) = (Ps . . . P2 P1 )A,
und nach Satz 38 ist
P := Ps . . . P2 P1 ∈ GLm (K).
Schließlich hat die Matrix PA Stufenform, weil in jedem Durchlauf die ersten j − 1 Spalten nicht mehr verändert werden und in der j-ten Spalte entsprechend umgeformt wird.
Der Beweis zeigt, dass man die Transformationsmatrix P erhält, indem
man die elementaren Zeilenumformungen nicht nur auf A, sondern auch auf
die Einheitsmatrix Im anwendet:
(A|Im ) → (P1 A|P1 Im ) → · · · → (Ps . . . P1 A|Ps . . . P1 Im ) = (PA|P).
Satz 51 : Sei A ∈ K m×m . Auf die folgende Weise kann überprüft werden,
ob A invertierbar ist und, wenn ja, die zu A inverse Matrix A−1 berechnet
werden:
Bringe A durch Gauss-Elimination auf Stufenform, wobei die elementaren Zeilenoperationen auch auf die Einheitsmatrix angewendet werden:
(A|Im ) → (PA|P).
54
2. SYSTEME LINEARER GLEICHUNGEN
Dann ist A invertierbar genau dann, wenn PA = Im gilt. In diesem Fall ist
A−1 = P .
Beweis: Wenn A invertierbar ist, dann sind A, P ∈ GLm (K) und somit auch
B := PA ∈ GLm (K). Da B Stufenform hat, ist B = Im oder Bm− = 0. Aus
Bm− = 0 würde aber
0 = Bm− (B−1 )−m = (BB−1 )mm = 1,
folgen, also muss B = Im sein. Umgekehrt folgt aus PA = Im auch
AP = P−1 (PA)P = Im und somit P = A−1 .
Satz 52 : Ein lineares Gleichungssystem Ax = b über dem Körper K kann
gelöst werden, indem man die Matrix A durch Gauss-Elimination auf Stufenform bringt und b mittransformiert. Praktisch führt man die elementaren Zeilenumformungen auf der erweiterten Matrix“ (A|b) aus und erhält
”
(PA|Pb). Dann ist
L(A, b) = L(PA, Pb),
und L(A, b) kann nach Satz 48 berechnet werden.
Insbesondere gibt es genau dann genau eine Lösung, wenn
In
c
und
Pb =
PA =
0
0
mit c ∈ K n×1 ist. Die eindeutige Lösung ist dann
 
c1
 ...  .
cn
Wenn A sogar invertierbar ist, dann hat (A, b) die eindeutige Lösung
A−1 b.
Beweis: Die Behauptung folgt aus Satz 49 und Satz 48.
Satz 53 : Ein homogenes lineares Gleichungssystem Ax = 0 über dem Körper
K hat immer die triviale Lösung 0. Wenn A ∈ K m×n mit m < n ist, d.h. es
sind weniger Gleichungen als Unbekannte vorhanden, dann gibt es auch
eine Lösung, die nicht trivial ist.
Beweis: Wenn m < n ist, dann kann PA ∈ K m×n nicht die Form
In
0
haben, und nach Satz 52 gibt es mehr als eine Lösung.
55
2. SYSTEME LINEARER GLEICHUNGEN
Definition 42 : Sei A ∈ K m×n . Der von den Spalten von A erzeugte Untervektorraum von K m×1 heißt der Spaltenraum von A. Der Rang von A ist die
Dimension des Spaltenraums von A. Schreibweise: rg(A).
Satz 54 : Seien A ∈ K m×n und P ∈ GLm (K) so, dass PA Stufenform hat. Sei
r die Anzahl der Pivots in PA. Dann ist r = rg(A) und die Dimension von
L(A, 0) ist n − rg(A).
Beweis: Nach Satz 48 ist n − r die Dimension von L(PA, 0). Da PA Stufenform hat, ist leicht nachzuprüfen, dass rg(PA) = r ist. Wenn die Spalten
S1 , . . . , Sr eine Basis des Spaltenraums von PA bilden, dann ist (P−1 S1 , . . . , P−1 Sr )
eine Basis des Spaltenraums von P−1 PA = A. Also ist rg(A) = rg(PA) und
wegen L(PA, 0) = L(A, 0) ist n − rg(A) die Dimension von L(A, 0).
KAPITEL 3
Rechnen mit Abbildungen
1. Permutationen
Satz 55 : Sei f : M → N eine Abbildung.
(1) Ist f bijektiv, dann gilt f ◦ f −1 = IdN und f −1 ◦ f = IdM .
(2) Ist g : N → M eine Abbildung mit f ◦ g = IdN und g ◦ f = IdM , dann
ist f bijektiv und g = f −1 .
Beweis: Übung.
Satz 56 : Seien f : M → N und g : N → P bijektive Abbildungen. Dann ist
auch g ◦ f bijektiv und es gilt
(g ◦ f )−1 = f −1 ◦ g−1 .
Beweis: Wegen
(g ◦ f ) ◦ ( f −1 ◦ g−1 ) = g ◦ ( f ◦ f −1 ) ◦ g−1 = g ◦ IdN ◦g−1 = IdP
und
( f −1 ◦ g−1 ) ◦ (g ◦ f ) = f −1 ◦ (g−1 ◦ g) ◦ f = f −1 ◦ IdN ◦ f = IdM
folgt die Behauptung aus Satz 55, (2).
Satz 57 : Sei M eine Menge. Dann ist
S(M) := {s | s : M → M bijektiv}
mit der Hintereinanderausführung von Abbildungen eine Gruppe mit neutralem Element IdM und heißt die symmetrische Gruppe von M.
Beweis: Folgt aus Satz 1 und Satz 56.
Definition 43 : Sei n ∈ N und [n] := {1, 2, . . ., n}. Dann nennt man bijektive Abbildungen von [n] nach [n] auch Permutationen der Zahlen 1, 2, . . ., n,
und
Sn := S([n])
56
57
3. RECHNEN MIT ABBILDUNGEN
heißt die Permutationsgruppe vom Grad n. Eine Permutation
σ : {1, 2, . . ., n} → {1, 2, . . ., n}
schreibt man oft in der Tabellenform
1
2
...
n
.
σ (1) σ (2) . . . σ (n)
Sn hat genau n! = n(n − 1) · · ·2 · 1 Elemente. Graphisch kann man eine
Permutation darstellen, indem man die Zahlen 1, 2, . . ., n anschreibt und für
1 ≤ i ≤ n einen Pfeil von i nach σ (i) zeichnet. Zum Beispiel hat
1 2 3 4 5 6 7
σ=
5 4 6 7 3 1 2
die folgende Darstellung:
6 3
6
?
1
-
5
7
K
A
A
A
A
A
- 4
2
Da σ : {1, 2, . . ., n} → {1, 2, . . ., n} bijektiv ist, ist jede Zahl Anfangs- und
Endpunkt von genau einem Pfeil.
Definition 44 : Sei ` ∈ N , ` ≥ 2, und seien j1 , . . ., j` paarweise verschiedene Elemente von {1, . . . , n}. Dann heißt die Abbildung


falls i 6∈ { j1 , . . . , j` },
i
τ : {1, 2, . . ., n} → {1, 2, . . ., n} , i 7→ jk+1 falls i = jk mit k < `,

j
falls i = j` ,
1
ein Zykel der Länge ` und wird mit
( j 1 , j2 , . . . , j ` )
bezeichnet. Ein Zykel der Länge 2 heißt eine Transposition oder Vertauschung von j1 und j2 . Zwei Zykel (i1 , . . ., ik ) und ( j1 , . . . , j` ) heißen disjunkt, wenn
{i1 , . . . , ik } ∩ { j1 , . . . , j` } = 0/
ist.
Satz 58 : Es seien (i1 , . . ., ik ) und ( j1 , . . . , j` ) zwei disjunkte Zykel.
Es gilt:
(i1 , . . ., ik )( j1 , . . ., j` ) = ( j1 , . . . , j` )(i1 , . . ., ik )
58
3. RECHNEN MIT ABBILDUNGEN
und
( j1 , j2 , . . . , j` )−1 = ( j` , j`−1 , . . ., j1 ) ,
insbesondere ist
( j1 , j2 )−1 = ( j2 , j1 ) = ( j1 , j2 ) .
Beweis: Der Zykel (i1 , . . . , ik ) vertauscht nur Elemente in {i1 , . . . , ik }, der
Zykel ( j1 , . . . , j` ) nur Elemente in { j1 , . . . , j` }. Daher spielt die Reihenfolge
keine Rolle. Man prüft leicht nach, dass ( j` , j`−1 , . . ., j1 ) die Umkehrabbildung von ( j1 , j2 , . . . , j` ) ist.
Definition 45 : Seien M eine Menge und f : M −→ M eine Abbildung. Ein
Element x ∈ M heißt ein Fixpunkt von f , wenn f (x) = x ist.
Satz 59 : Jede Permutation σ ∈ Sn ist Produkt paarweise disjunkter Zyklen
ρ1 , . . . , ρm , die eindeutig bis auf die Reihenfolge sind. Die Darstellung
σ = ρ 1 . . . ρm
heißt die Zyklenzerlegung von σ . Jene Elemente i ∈ {1, 2, . . ., n}, die nicht
in den Zyklen vorkommen, sind die Fixpunkte von σ .
Beweis: Man startet mit J := {1, . . ., n} und wiederholt die folgende Prozedur, bis J leer ist: Wähle ein j ∈ J und berechne
j, σ ( j), σ 2 ( j), σ 3 ( j), . . .
solange, bis wieder j kommt. Dann ist entweder j ein Fixpunkt oder ( j, σ ( j), . . .)
ein Zykel von σ . Streiche diese Elemente aus der Menge J.
Definition 46 : Sei σ ∈ Sn eine Permutation mit p Fixpunkten und m Zyklen. Dann heißt die Zahl
sign(σ ) := (−1)n−p−m
das Vorzeichen oder Signum von σ .
Da Idn keine Zyklen und n Fixpunkte hat, ist
sign(Idn ) = 1 .
Satz 60 : Jede Permutation σ ∈ Sn ist Produkt von Transpositionen τ1 , . . ., τr ∈
Sn , die im Allgemeinen nicht eindeutig bestimmt sind. Es gilt aber
(
1 falls r gerade ist,
sign(σ ) = (−1)r =
−1 falls r ungerade ist.
59
3. RECHNEN MIT ABBILDUNGEN
Eine Permutation σ heißt gerade bzw. ungerade, wenn sign(σ ) = 1 bzw. −1
ist. Zum Beispiel ist die Identität gerade und jede Transposition ungerade.
Beweis: Sei σ = ρ1 . . . ρm die Zyklenzerlegung von σ . Wegen
(i1 , . . . , ik ) = (i1 , i2 )(i2 , i3 ) . . . (ik−1 , ik )
kann man jeden Zykel ρi als Produkt von Transpositionen schreiben und
daher auch σ . Das Beispiel
1 2 3
= (12)(23) = (13)(12)
2 3 1
zeigt, dass diese Darstellung im Allgemeinen nicht eindeutig ist.
Die Aussage sign(σ ) = (−1)r beweisen wir durch Induktion nach r. Für
r = 0 ist σ die Identität und sign(σ ) = 1. Für r = 1 ist σ eine Transposition,
hat also nur einen Zykel und n − 2 Fixpunkte, also ist
sign(σ ) = (−1)n−(n−2)−1 = −1 .
Sei nun r ≥ 2, τ1 = (i, j) und ρ := τ2 . . . τr . Dann ist zu zeigen, dass
sign((i, j)ρ ) = − sign(ρ )
ist. Dazu untersuchen wir, wie sich die Transposition (i, j) auf die Zyklenzerlegung von ρ auswirkt, und unterscheiden 2 Fälle:
(1) Die Elemente i und j liegen im gleichen Zykel ( j1 , . . . , j` ) von ρ , wobei
wir dann j1 = i und jk = j mit 2 ≤ k ≤ ` annehmen können, d.h.
( j1 , . . . , j` ) = (i = j1 , . . . , jk−1 , j = jk , . . ., j` ) .
Für k = 2 ist dann i ein Fixpunkt von (i, j)ρ , und
für k ≥ 3 ist (i, j2 , . . ., jk−1 ) ein Zykel von (i, j)ρ .
Für k < ` ist ( j, jk+1 , . . . , j` ) ein Zykel von (i, j)ρ , und
für k = ` ist j ein Fixpunkt von (i, j)ρ .
Ansonsten bleibt bei der Zyklenzerlegung von ρ alles gleich, sodass die
Summe aus der Zahl der Fixpunkte und der Zahl der Zykel insgesamt um 1
steigt und sich damit das Vorzeichen ändert.
(2) Im anderen Fall ist i oder j Fixpunkt von ρ oder i, j liegen in verschiedenen Zyklen (i1 , i2 , . . ., ik ) bzw. ( j1 , j2 , . . ., j` ) von ρ , wobei wir i1 = i bzw.
j1 = j annehmen können. Dann ist
(i = i1 , . . . , ik , j = j1 , . . ., j` )
ein Zykel von (i, j)ρ , sodass insgesamt die Summe aus der Zahl der Fixpunkte und der Zahl der Zykel um 1 fällt und wiederum sich das Vorzeichen
ändert.
Satz 61 : Für Permutationen σ , τ ∈ Sn gilt
sign(σ τ ) = sign(σ ) · sign(τ ) .
60
3. RECHNEN MIT ABBILDUNGEN
Beweis: Nach Satz 60 gibt es Transpositionen σ1 , . . . , σr und τ1 , . . . , τs mit
σ = σ1 . . . σr bzw. τ = τ1 . . . τs . Dann ist σ τ = σ1 . . . σr τ1 . . . τs , also sign(σ τ ) =
(−1)r+s = (−1)r (−1)s = sign(σ ) sign(τ ).
2. Polynomiale Abbildungen
In diesem Abschnitt sei K ein Körper.
Definition 47 : Seien n ∈ N und a0 , a1 , . . . , an ∈ K. Dann heißt die Abbildung
n
f : K → K , z 7→ a0 + a1 z + a2 z + · · · + an z = ∑ ai zi ,
2
n
i=0
eine polynomiale Abbildung von K nach K. Die Elemente a0 , . . ., an heißen
Koeffizienten von f .
Mit polynomialen Abbildungen sind mehrere grundlegende Aufgaben
verbunden:
• Auswerten einer polynomialen Abbildung f mit Koeffizienten a 0 , . . ., an
in einem Element c von K: Berechne das Bild
n
f (c) =
∑ a i ci
i=0
von c unter der polynomialen Abbildung f . Es ist klar, dass dieses
Element von K immer durch Ausführen von Additionen und Multiplikationen in K berechnet werden kann. Darin liegt die rechneri”
sche Bedeutung“ der polynomialen Abbildungen.
• Interpolation durch eine polynomiale Abbildung: Gegeben sind eine
endliche Teilmenge E von K und eine Abbildung
g : E −→ K. Gesucht ist eine polynomiale Abbildung von K nach K,
deren Einschränkung auf E gleich g ist.
• Überprüfe die Gleichheit von zwei polynomialen Abbildungen: Zwei
polynomiale Abbildungen seien durch ihre Koeffizienten gegeben.
Wie kann man feststellen, ob diese zwei Abbildungen gleich sind?
Die Antwort ist nicht so leicht: zum Beispiel sind die polynomialen
Abbildungen
f : Z 2 −→ Z 2 , z 7−→ z , und g : Z 2 −→ Z 2 , z 7−→ z2 ,
gleich.
• Berechnen der Nullstellen einer polynomialen Abbildung f : Finde
alle Elemente c ∈ K mit der Eigenschaft, dass f (c) = 0 ist. Einfacher
zu beantwortende Fragen sind: Gibt es solche Elemente? Wenn ja,
wieviele?
61
3. RECHNEN MIT ABBILDUNGEN
Satz 62 : Es seien c ∈ K und f eine polynomiale Abbildung mit Koeffizienten a0 , . . ., an ∈ K. Mit dem folgenden Verfahren kann f (c) mit höchstens n
Additionen und höchstens n Multiplikationen in K berechnet werden:
• Setze i := n und w := an .
• Solange i 6= 0 ist, ersetze i durch i − 1 und dann w durch w · c + a i .
• Wenn i = 0 ist, dann ist f (c) = w.
Beweis:
n
∑ aici = (. . . ((anc + an−1 )c + an−2 )c + . . . + a1 )c + a0 .
i=0
Definition 48 : Es sei A ein Ring und ein K-Vektorraum. Dann ist A eine
K-Algebra, wenn für alle t ∈ K und alle a, b ∈ A
t · (ab) = a(t · b) = (t · a)b
ist. Eine Algebra ist kommutativ, wenn sie als Ring kommutativ ist.
Beispiel 22 : Die Menge K n×n aller n × n-Matrizen mit Koeffizienten in K
ist mit Addition, Skalarmultiplikation und Multiplikation von Matrizen eine
K-Algebra. Sie ist nur dann kommutativ, wenn n = 1 ist.
Satz 63 : Es seien M eine Menge und A := Abb(M, K) die Menge aller
Abbildungen von M in den Körper K. Für f , g ∈ A und c ∈ K und x ∈ M sei
( f g)(x) := f (x)g(x) , ( f + g)(x) := f (x) + g(x)
und
(c · f )(x) := c( f (x)) .
Mit den Rechenoperationen
A × A −→ A , ( f , g) 7−→ f + g ,
A × A −→ A , ( f , g) 7−→ f g ,
K × A −→ A , (c, g) 7−→ c · g ,
(punktweise Addition, Multiplikation, Skalarmultiplikation) ist A eine kommutative K-Algebra.
Beweis: Übung.
Definition 49 : Es sei R ein Ring und S eine nichtleere Teilmenge von R.
Dann ist S eine Unterring von R, wenn 1 ∈ S und für alle a, b ∈ S auch die
Elemente
a + b , −a und ab
62
3. RECHNEN MIT ABBILDUNGEN
in S enthalten sind.
Es sei A eine K-Algebra und B eine nichtleere Teilmenge von A. Dann ist B
eine Unteralgebra von A, wenn B ein Unterring und ein Untervektorraum
von A ist.
Ein Unterring bzw. eine Unteralgebra ist mit den auf diese Teilmenge
eingeschränkten Rechenoperationen selbst ein Ring bzw. eine Algebra.
Satz 64 : Die Menge der polynomialen Abbildungen von K nach K ist eine
K-Unteralgebra der Algebra Abb(K, K) aller Abbildungen von K nach K.
Beweis: Seien f und g polynomiale Abbildungen und a0 , . . ., an bzw. b0 , . . . , bm
ihre Koeffizienten. Für alle z ∈ K ist dann f (z) = ∑ni=0 ai zi und g(z) =
∑mj=1 b j z j . Daher ist für alle z ∈ K
!
!
n
( f · g)(z) = f (z)g(z) =
n
=∑
m
∑ ai z
i
i=0
m
∑ b jz j
j=0
n+m
k
k=0
i=0
∑ aib j zi+ j = ∑ ∑ aibk−i
i=0 j=0
!
zk ,
also f · g eine polynomiale Abbildung. Die anderen Eigenschaften einer
Unteralgebra sind leicht nachzuprüfen.
63
3. RECHNEN MIT ABBILDUNGEN
3. Lineare Abbildungen
In diesem Abschnitt seien V und W Vektorräume über einem Körper K.
Definition 50 : Eine Abbildung f : V → W heißt K-linear, wenn die folgenden zwei Bedingungen erfüllt sind:
(1) Für alle v, w ∈ V ist f (v + w) = f (v) + f (w) .
(2) Für alle c ∈ K und für alle v ∈ V ist f (cv) = c f (v) .
Beispiel 23 : Die Nullabbildung
0 : V → W , v 7→ 0W ,
und die Identität
sind K-linear.
IdV : V → V , v 7→ v ,
Beispiel 24 : Für jede Matrix A ∈ K m×n ist die Abbildung
K n×1 → K m×1 , x 7→ Ax ,
K-linear. Später werden wir sehen, dass jede lineare Abbildung vom Vektorraum aller m-Spalten in den Vektorraum aller n-Spalten durch Multiplikation mit einer Matrix gegeben ist.
Satz 65 : Seien f : V → W eine lineare Abbildung, (vi )i∈I eine Familie von
Vektoren in V und (ci )i∈I eine Koeffizientenfamilie. Dann gilt
f (∑ ci vi ) = ∑ ci f (vi ) ,
i∈I
i∈I
d.h. man kann eine lineare Abbildung durch die Linearkombination durch”
ziehen“. Speziell ist
f (0V ) = 0W
und, für alle v ∈ V ,
f (−v) = − f (v) .
Beweis: Sei J := {i ∈ I | ci 6= 0}. Dann kann die Behauptung umgeschrieben werden in
f ( ∑ c j v j ) = ∑ c j f (v j ) ,
j∈J
j∈J
wobei jetzt alle Summen endlich sind. Wir beweisen diese Aussage durch
Induktion nach
` := #(J) .
64
3. RECHNEN MIT ABBILDUNGEN
Für ` = 1 ist f (c1 v1 ) = c1 f (v1 ) nach Definition.
Sei nun ` > 1. Wir wählen ein Element k ∈ J und erhalten auf Grund der
Linearität und der Induktionsannahme
f ( ∑ c j v j ) = f (ck vk + ∑ c j v j ) = f (ck vk ) + f ( ∑ c j v j )
j∈J
j6=k
= ck f (vk ) + ∑ c j f (v j ) =
j6=k
j6=k
∑ c j f (v j ) ,
j∈J
was den Induktionsbeweis beendet. Schließlich ist
f (−v) = f ((−1K )v) = (−1K ) f (v) = − f (v) .
Satz 66 : Seien U ein Vektorraum über K und f : U → V sowie
g : V → W lineare Abbildungen. Dann gilt:
(1) Die Zusammensetzung g ◦ f : U → W , u 7→ g( f (u)) , ist K-linear.
(2) Wenn f bijektiv ist, dann ist die Umkehrabbildung
f −1 : V → U auch K-linear.
( Die Zusammensetzung von linearen Abbildungen ist linear. Die Umkehr”
abbildung einer bijektiven linearen Abbildung ist linear.“)
Beweis: Für v, w ∈ U und c ∈ K ist
(1) (g ◦ f )(v + w) = g( f (v + w)) = g( f (v) + f (w)) =
g( f (v)) + g( f (w)) = (g ◦ f )(v) + (g ◦ f )(w),
(g ◦ f )(cv) = g( f (cv)) = g(c f (v)) = cg( f (v)) = c(g ◦ f )(v),
(2) f ( f −1 (v) + f −1 (w)) = ( f ◦ f −1 )(v) + ( f ◦ f −1 )(w) = v + w,
also f −1 (v + w) = f −1 (v) + f −1 (w), und
f (c f −1 (v)) = c( f ◦ f −1 )(v) = cv, also f −1 (cv) = c f −1 (v).
Definition 51 : Eine lineare und bijektive Abbildung von V nach W heißt
Isomorphismus von Vektorräumen. V und W heißen isomorph, wenn es
einen Isomorphismus von V nach W (oder von W nach V ) gibt. Schreibweise: V ∼
= W.
Satz 67 :
(1) Jeder Vektorraum V über K der Dimension n ist zum Standard-Vektorraum
K n isomorph.
Nach Wahl einer Basis v := (v1 , . . ., vn ) erhält man einen Isomorphismus durch die Koordinaten-Abbildung
V −→ K n , x 7→ Koordinatentupel von x bezüglich v .
(2) Zwei endlich-dimensionale Vektorräume über K sind genau dann isomorph, wenn ihre Dimensionen gleich sind.
65
3. RECHNEN MIT ABBILDUNGEN
Beweis: (1) Nach Satz 46 ist die Abbildung
n
K n → V , (c1 , . . . , cn ) 7→ ∑ ci vi ,
i=1
bijektiv. Man prüft leicht nach, dass sie auch linear ist. Nach Satz 66 ist
dann die Koordinaten-Abbildung als Umkehrabbildung linear und bijektiv,
also ein Isomorphismus.
(2) Seien V , W endlich-dimensionale Vektorräume über K. Wenn V und W
isomorph sind, dann gibt es eine bijektive lineare Abbildung
f : V → W . Sei (v1 , . . . , vn ) eine Basis von V . Man prüft leicht nach, dass
dann ( f (v1 ), . . ., f (vn )) eine Basis von W ist, also ist dimK (V ) = n = dimK (W ).
Sei umgekehrt dimK (V ) = dimK (W ) =: n. Dann gibt es nach (1) Isomorphismen f : V → K n und g : W → K n . Nach Satz 66 ist dann auch
g−1 ◦ f : V → W ein Isomorphismus.
4. Die Matrix einer linearen Abbildung
In diesem Abschnitt seien V ein Vektorraum über K mit Dimension
n ∈ N , v := (v1 , . . ., vn ) eine Basis von V , W ein Vektorraum über K mit
Dimension m ∈ N und w := (w1 , . . . , wm ) eine Basis von W .
Satz 68 : Seien u1 , . . . , un ∈ W . Dann gibt es genau eine lineare Abbildung
f : V → W mit
f (vi ) = ui , 1 ≤ i ≤ n .
Somit kann eine lineare Abbildung zwischen Vektorräumen durch (beliebige) Vorgabe der Bilder einer Basis eindeutig definiert werden.
Beweis: Wenn eine derartige Abbildung f existiert, dann ist für einen Vektor x = ∑ni=1 ci vi ∈ V
n
f (x) = f ( ∑ ci vi ) =
i=1
n
n
i=1
i=1
∑ ci f (vi) = ∑ ciui ,
was die Eindeutigkeit der Abbildung beweist.
Um die Existenz einer solchen Abbildung zu zeigen, definieren wir eine
Abbildung f : V → W durch
n
f (x) :=
∑ ci u i ,
i=1
wobei c1 , . . ., cn ∈ K die Koordinaten von x ∈ V bezüglich der Basis v sind.
Dann ist f K-linear, weil für x = ∑ni=1 ci vi , y = ∑ni=1 di vi und t ∈ K wegen
x + y = ∑ni=1 (ci + di )vi und tx = ∑ni=1 (tci )vi
n
f (x + y) = ∑ (ci + di )ui =
i=1
n
n
i=1
i=1
∑ ciui + ∑ diui = f (x) + f (y)
66
3. RECHNEN MIT ABBILDUNGEN
sowie
f (tx) =
n
n
i=1
i=1
∑ tciui = t ∑ ciui
!
= t f (x)
ist. Schließlich gilt wegen v j = ∑ni=1 δi j vi für alle 1 ≤ j ≤ n:
n
f (v j ) = ∑ δi j ui = u j .
i=1
Definition 52 : Seien y ∈ V und c1 , . . . , cn ∈ K die Koordinaten von y bei
v1 , . . ., vn , also
n
y = ∑ ci vi .
i=1
Dann heißt die Spalte
 
c1
c :=  ...  ∈ K n×1
cn
die Koordinatenspalte von y bezüglich v.
Definition 53 : Seien f : V → W eine K-lineare Abbildung und
A1 j , . . . , Am j die Koordinaten von f (v j ) bezüglich w , d.h.
m
f (v j ) = ∑ Ai j wi , 1 ≤ j ≤ n .
i=1
Dann heißt
M( f , v, w) := (Ai j )1≤i≤m ∈ K m×n
1≤ j≤n
die Matrix von f bezüglich der Basen v und w.
Die j-te Spalte von M( f , v, w) ist also die Koordinatenspalte von f (v j )
bezüglich w.
Im Spezialfall V = W und v = w schreibt man statt M( f , v, v) kurz
M( f , v).
Beispiel 25 : Für 1 ≤ j ≤ n ist
IdV (v j ) = v j =
n
∑ δi j vi
i=1
und somit
M(IdV , v) = In .
Beispiel 26 : Sei A ∈ K m×n . Dann ist die Matrix der linearen Abbildung
K n×1 → K m×1 , x 7→ Ax ,
67
3. RECHNEN MIT ABBILDUNGEN
bezüglich der Standardbasen e = (e1 , . . ., en ) von K n×1 und
e0 = (e01 , . . . , e0m ) von K m×1 gleich A, weil für 1 ≤ j ≤ n
m
Ae j = A− j =
∑ Ai j e0i
i=1
ist. Daher ist jede lineare Abbildung von K n×1 nach K m×1 durch Multiplikation mit einer eindeutig bestimmten Matrix A ∈ K m×n gegeben. Oft
identifiziert man eine m × n-Matrix mit dieser linearen Abbildung.
Satz 69 : Seien U ein Vektorraum über K der Dimensionen ` mit Basis u
und f : V → W sowie g : W → U K-lineare Abbildungen. Dann ist
M(g ◦ f , v, u) = M(g, w, u) · M( f , v, w) ,
d.h. der Zusammensetzung von linearen Abbildungen entspricht die
Multiplikation der zugehörigen Matrizen.
Beweis: Seien A := M( f , v, w) ∈ K m×n und B := M(g, w, u) ∈ K `×m . Dann
ist für 1 ≤ j ≤ n
m
m
(g ◦ f )(v j ) = g( f (v j )) = g( ∑ Ai j wi ) = ∑ Ai j g(wi )
i=1
i=1
m
=
`
`
m
k=1
i=1
∑ Ai j ∑ Bkiuk = ∑ ∑ BkiAi j
i=1
k=1
!
uk
`
=
∑ (BA)k j uk ,
k=1
also BA = M(g ◦ f , v, u).
Satz 70 : Die lineare Abbildung f : V → W ist genau dann ein Isomorphismus, wenn die Matrix M( f , v, w) invertierbar ist. In diesem Fall ist
M( f −1 , w, v) = M( f , v, w)−1 .
Beweis: Wenn f ein Isomorphismus ist, dann ist nach Satz 66 die Umkehrabbildung f −1 linear und nach Satz 67 ist n = m. Aus f −1 ◦ f = IdV und
f ◦ f −1 = IdW folgt nach Satz 69
und
M( f −1 , w, v) · M( f , v, w) = M( f −1 ◦ f , v, v) = M(IdV , v, v) = In
M( f , v, w) · M( f −1 , w, v) = M( f ◦ f −1 , w, w) = M(IdW , w, w) = Im .
Wenn umgekehrt A := M( f , v, w) ∈ K m×n invertierbar ist, dann ist m = n
und es existiert B := A−1 ∈ K n×n . Definiert man nach Satz 68 eine lineare
68
3. RECHNEN MIT ABBILDUNGEN
Abbildung g : W → V durch
n
g(w j ) := ∑ Bi j vi
i=1
für 1 ≤ j ≤ n, so folgt nach Satz 69
und
M(g ◦ f , v, v) = M(g, w, v) · M( f , v, w) = BA = In = M(IdV , v, v)
M( f ◦ g, w, w) = M( f , v, w) · M(g, w, v) = AB = In = M(IdW , w, w) .
Daher ist g ◦ f = IdV und f ◦ g = IdW nach Satz 68, also f ein Isomorphismus und g = f −1 .
Nach Wahl von Basen im Definitionsbereich und im Bildbereich einer
linearen Abbildung ist diese eindeutig durch ihre Matrix bestimmt. Anstatt
mit linearen Abbildungen kann mit den entsprechenden Matrizen gerechnet
werden. Der Zusammensetzung von linearen Abbildungen entspricht die
Matrizenmultiplikation, dem Berechnen der Umkehrabbildung entspricht
das Invertieren von Matrizen.
69
3. RECHNEN MIT ABBILDUNGEN
5. Basiswechsel
In diesem Abschnitt seien V ein Vektorraum über K mit Dimension
n ∈ N , v := (v1 , . . ., vn ) eine Basis von V , W ein Vektorraum über K mit
Dimension m ∈ N und w := (w1 , . . . , wm ) eine Basis von W .
Definition 54 : Seien p und q positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p
ein p-Tupel von Vektoren in V . Für T ∈ K p×q sei
p
uT := (uT )1 , . . . , (uT )q :=
p
∑ Ti1ui, . . . , ∑ Tipui
i=1
i=1
!
∈ V q.
Die Bezeichnung uT ist eine Merkhilfe, weil man analog zur Matrizenrechnung über K den Vektor (uT ) j nach der Regel
Zeile u mal Spalte T− j“
”
berechnet.
Beispiel 27 : Sei c ∈ K n×1 . Dann ist vc ∈ V und c ist die Koordinatenspalte
von vc bezüglich v.
Satz 71 : Seien p, q, r positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p . Dann gilt:
(1) uI p = u
(2) Für T ∈ K p×q und U ∈ K q×r ist u(TU ) = (uT )U .
(3) Für T ∈ GL p (K) und u0 := uT gilt u = u0 T −1 .
Beweis: (1) gilt nach Definition, (2) rechnet man nach und (3) folgt aus
u = uIm = u(T T −1 ) = (uT )T −1 = u0 T −1 .
Satz 72 : Sei u := (u1 , . . . , uq ) ∈ V q . Dann gilt:
(1) Es gibt genau eine Matrix T ∈ K n×q mit
u = vT .
Diese Matrix T heißt die Transformationsmatrix von v zu u, und die
Spalten von T sind die Koordinatenspalten von
u1 , . . . , uq bezüglich v.
(2) Die Familie u ist genau dann eine Basis von V , wenn T invertierbar
ist.
Beweis: Übung.
70
3. RECHNEN MIT ABBILDUNGEN
Beispiel 28 : Seien f : V → W eine K-lineare Abbildung und
A := M( f , v, w) ∈ K m×n
die Matrix von f bezüglich v und w. Dann ist A die Transformationsmatrix
von w zu f (v) := ( f (v1 ), . . ., f (vn )), also
f (v) = wA .
Satz 73 : Seien u eine Basis von V und T ∈ GLn (K) die Transformationsmatrix von v zu u. Ist c die Koordinatenspalte von y ∈ V bezüglich v, dann
ist
T −1 c
die Koordinatenspalte von y bezüglich w , d.h. bei Basiswechsel mit der
Matrix T transformieren sich die Koordinaten“ mit der Matrix T −1 .
”
Beweis: Es ist y = vc = (uT −1 )c = u(T −1 c).
Satz 74 : Seien f : V → W eine K-lineare Abbildung,
A := M( f , v, w) ∈ K m×n
die Matrix von f bezüglich v und w und c ∈ K n×1 die Koordinatenspalte des
Vektors y ∈ V bezüglich der Basis v , d.h.
y = vc .
Dann ist Ac ∈ K m×1 die Koordinatenspalte von f (u) bezüglich der Basis w,
d.h.
f (y) = w(Ac) .
Beweis: Es ist
n
f (y) = f ( ∑ c j v j ) =
j=1
m
=
∑
i=1
n
n
∑ c j f (v j ) =
j=1
!
∑ Ai j c j w i =
j=1
n
m
j=1
i=1
∑ c j ∑ Ai j w i
m
∑ (Ac)iwi = w(Ac) .
i=1
Satz 75 : Sei f : V → W eine K-lineare Abbildung mit Matrix
A := M( f , v, w) ∈ K m×n .
Seien v0 eine weitere Basis von V , w0 eine weitere Basis von W , T ∈ GLn (K)
die Transformationsmatrix von v zu v0 und S ∈ GLm (K) die Transformationsmatrix von w zu w0 . Dann ist
M( f , v0 , w0 ) = S−1 AT .
71
3. RECHNEN MIT ABBILDUNGEN
Im Spezialfall V = W , v = w und v0 = w0 ist S = T und
M( f , v0 ) = T −1 AT .
Beweis: Nach Satz 74 ist für 1 ≤ j ≤ n
f (v0j ) = f (vT− j ) = wAT− j = (wS)(S−1 AT− j ) = w0 (S−1 AT )− j .
Definition 55 : Zwei Matrizen A, B ∈ K n×n heißen ähnlich, wenn es eine
Matrix T ∈ GLn (K) gibt mit
B = T −1 AT .
Zum Beispiel sind nach Satz 75 die Matrizen M( f , v) und M( f , v0 ) einer
linearen Abbildung f : V → V ähnlich.
Satz 76 : Sei f : V → V eine K-lineare Abbildung mit Matrix
A := M( f , v) ∈ K n×n .
Wenn B ähnlich zu A ist, dann gibt es eine Basis v0 von V mit
M( f , v0 ) = B .
Beweis: Sei T ∈ GLn (K) so, dass B = T −1 AT ist. Setze v0 := vT . Nach Satz
75 ist dann M( f , v0 ) = T −1 AT = B.
Ähnliche Matrizen beschreiben (bezüglich verschiedener Basen) dieselbe lineare Abbildung. Wird ein physikalisches Phänomen durch eine Abbildung von einem endlichdimensionalen Vektorraum V nach V beschrieben
und diese (nach Wahl einer Basis von V ) durch eine Matrix, dann haben
nur jene Eigenschaften dieser Matrix physikalische Bedeutung“, die sich
”
beim Übergang zu einer ähnlichen Matrix nicht ändern. Ein Beispiel für
eine solche Eigenschaft von Matrizen ist die Spur“.
”
Definition 56 : Sei A ∈ K n×n . Dann heißt
n
spur(A) := ∑ Aii
i=1
die Spur von A.
Satz 77 :
(1) Die Abbildung spur : K n×n −→ K ist linear.
(2) Für A, B ∈ K n×n gilt: spur(AB) = spur(BA) .
72
3. RECHNEN MIT ABBILDUNGEN
(3) Für A ∈ K n×n und T ∈ GLn (K) gilt:
spur(T −1 AT ) = spur(A).
(4) Seien V ein endlich-dimensionaler Vektorraum über K mit Basis v
und f : V → V eine lineare Abbildung mit Matrix A bezüglich v. Dann
ist
spur( f ) := spur(A)
unabhängig von der Wahl der Basis v und heißt Spur von f .
Beweis: (1) und (2) nachrechnen, (3) folgt aus (2), (4) aus (3).
KAPITEL 4
Polynome
In diesem Kapitel wird mit K immer ein Körper bezeichnet.
1. Der Polynomring
Definition 57 : Eine Folge (ci )i∈ N in K ist eine endliche Folge, wenn es
nur endlich viele Indizes i mit ci 6= 0 gibt.
Durch jede endliche Folge wird eine polynomiale Abbildung definiert.
Im Computer wird man daher diese Abbildungen durch endliche Folgen
darstellen. Allerdings können verschiedene endliche Folgen dieselbe polynomiale Abbildung definieren. Um den daraus entstehenden Problemen
zu entgehen, betrachten wir zunächst statt der Abbildungen die endlichen
Folgen. Wir definieren für sie Rechenoperationen, die den punktweisen Rechenoperationen für polynomiale Abbildungen entsprechen.
Satz 78 : Die Menge P aller endlichen Folgen in K mit den Abbildungen
+ : P × P −→ P
,
· : P × P −→ P
,
((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N + (di )i∈ N := (ci + di )i∈ N ,
i
((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N · (di )i∈ N := ( ∑ c j di− j )i∈ N ,
j=0
und
· : K × P −→ P , (c, (di )i∈ N ) 7−→ c · (di )i∈ N := (cdi )i∈ N ,
ist eine kommutative K-Algebra. Sie heißt Polynomring über K oder Algebra der Polynome mit Koeffizienten in K. Ihre Elemente heißen Polynome
mit Koeffizienten in K. Das Nullelement des Polynomringes ist die Folge
0 := (0, 0, 0, . . .), das Einselement ist die Folge 1 := (1, 0, 0, . . .).
Beweis: Übung.
Definition 58 : Es sei f = (c0 , c1 , c2 , . . .) 6= 0 ein Polynom mit Koeffizienten in K. Der Grad von f ist der größte Index i mit ci 6= 0 und wird mit
73
74
4. POLYNOME
gr( f ) bezeichnet. Das Element ci heißt i-ter Koeffizient von f . Der Koeffizient cgr( f ) heißt Leitkoeffizient von f und wird mit lk( f ) bezeichnet. Das
Polynom f heißt normiert, wenn lk( f ) = 1.
Die folgende Schreibweise ist zweckmäßig: Wir wählen irgendein Symbol,
zum Beispiel x, und schreiben
gr( f )
c0 + c1 x + c2 x2 + . . . + cgr( f ) xgr( f ) =
∑ ci xi
statt
(c0 , c1 , c2 , . . .) .
i=0
Wir sprechen dann von einem Polynom in der Variablen x mit Koeffizienten
in K. Für den Polynomring über K schreiben wir dann K[x]. Wir identifizieren Polynome vom Grad 0 mit ihrem nullten Koeffizienten und fassen K so
als Teilmenge von K[x] auf.
Statt Polynom mit Koeffizienten in K“ schreiben wir im weiteren nur Po”
”
lynom“.
Satz 79 : Es seien f 6= 0, g 6= 0 Polynome.
(1)
(2)
(3)
(4)
f g 6= 0
gr( f g) = gr( f ) + gr(g) und lk( f g) = lk( f ) · lk(g)
Wenn f + g 6= 0, dann ist gr( f + g) ≤ max(gr( f ), gr(g)) .
Das Polynom f ist genau dann invertierbar, wenn gr( f ) = 0 ist.
Beweis: Übung .
Satz 80 : (Division mit Rest von Polynomen)
Es seien f und g Polynome und g 6= 0. Dann gibt es eindeutig bestimmte
Polynome m und r mit den Eigenschaften
f = m·g+r
und
(r = 0 oder gr(r) < gr(g))
.
Die Polynome m bzw. r heißen polynomialer Quotient von f und g bzw.
Rest von f nach Division durch g. Die Polynome m und r können mit dem
folgenden Verfahren (Divisionsalgorithmus) berechnet werden:
• Setze m := 0 und r := f .
• Solange gr(r) ≥ gr(g) ist, ersetze m durch
m + lk(r) · lk(g)−1xgr(r)−gr(g)
und r durch
r − lk(r) · lk(g)−1xgr(r)−gr(g) g .
Beweis: Übung (analog dem Beweis des Satzes über die Division mit Rest
von ganzen Zahlen).
75
4. POLYNOME
Aus diesem Satz folgt, dass Polynomringe über Körpern und der Ring der
ganzen Zahlen algebraisch betrachtet“ einander sehr ähnlich sind.
”
Satz 81 : Es seien ( fi )i∈ N eine Familie von Polynomen so, dass für alle
i∈ N
gr( fi ) = i
ist. Dann ist ( fi )i∈ N eine K-Basis des Polynomrings über K.
Beweis: Sei (ci )i∈ N 6= 0 eine Koeffizientenfamilie in K. Sei k die größte
Zahl so, dass ck 6= 0 ist. Wegen gr( fk ) = k ist
ck · lk( fk ) = lk( ∑ ci fi ) 6= 0 ,
i∈ N
also auch ∑i∈ N ci fi 6= 0. Daher ist ( fi )i∈ N linear unabhängig.
Es sei h 6= 0 ein Polynom. Wir zeigen durch Induktion über gr(h), dass h
eine K-Linearkombination von ( f i )i∈ N ist.
Wenn gr(h) = 0 ist, dann ist h = lk(h) · lk( f 0)−1 · f0 .
Sei j := gr(h) > 0. Division mit Rest von h durch f j ergibt h = m · f j + r
mit r = 0 oder gr(r) < gr(h). Dann ist
j = gr(h) = gr(m · f j ) = gr(m) + j ,
also gr(m) = 0 und m ∈ K. Nach Induktionsannahme ist r eine K-Linearkombination
von ( fi )i∈ N , daher auch h.
Beispiel 29 : Die Familie (xi )i∈ N ist eine K-Basis von K[x] .
Für jedes Element a ∈ K ist ((x − a)i )i∈ N eine K-Basis von K[x] . Daher gibt
es für jedes Polynom h ∈ K[x] mit n := gr(h) eindeutig bestimmte Elemente
c0 , . . ., cn ∈ K so, dass
n
h=
∑ ci(x − a)i
i=0
ist.
2. Nullstellen von Polynomen
Definition 59 : Seien f = ∑ni=0 ci xi ∈ K[x] , A eine K-Algebra und a ∈ A.
Dann ist
n
f (a) :=
∑ ci a i ∈ A .
i=0
Sprechweise: f (a) ∈ A erhält man durch Einsetzen von a in f . Das Element a ist genau dann eine Nullstelle von f in A, wenn f (a) = 0 ist. Die
76
4. POLYNOME
polynomiale Abbildung
n
K −→ K , a 7−→ f (a) = ∑ ci ai ,
i=0
heißt die durch f definierte (polynomiale) Abbildung und wird oft wieder
mit f bezeichnet.
Definition 60 : Es seien f,g Polynome mit g 6= 0. Dann ist f Teiler von
g (oder: f teilt g), wenn es ein Polynom h ∈ K[x] gibt mit g = f h. Das
Polynom g heißt Vielfaches von f , wenn f ein Teiler von g ist.
Satz 82 :
(1) Ein Element a ∈ K ist genau dann Nullstelle eine Polynoms f ∈ K[x] ,
wenn das Polynom x − a ein Teiler von f ist.
(2) Jedes von Null verschiedene Polynom f ∈ K[x] hat in K
höchstens gr( f ) Nullstellen.
(3) Es seien f und g Polynome mit f 6= g. Dann haben die Graphen
(in K × K) der durch f und g definierten polynomialen Abbildungen
höchstens max(gr( f ), gr(g)) gemeinsame Elemente.
(4) Wenn K unendlich viele Elemente enthält, dann sind die Koeffizienten einer polynomialen Abbildung von K nach K eindeutig bestimmt.
Insbesondere müssen in diesem Fall Polynome und polynomiale Abbildungen nicht unterschieden werden.
Beweis:
(1) Division mit Rest von f durch x − a ergibt f = m · (x − a) + r, wobei
r = 0 oder gr(r) = 0, also r ∈ K ist. Daher ist
f (a) = m(a) · 0 + r = r ,
somit ist f (a) = 0 genau dann, wenn r = 0 ist.
(2) Wir beweisen die Aussage durch Induktion über n := gr( f ).
Wenn n = 0 ist, dann hat f wegen f 6= 0 keine Nullstellen.
Sei n > 0 und sei a ∈ K eine Nullstelle von f . Nach (1) gibt es ein
Polynom h ∈ K[x] mit f = (x − a) · h. Dann ist gr(h) = n − 1, nach
Induktionsvoraussetzung hat h daher höchstens n − 1 Nullstellen. Jede Nullstelle von (x − a) · h ist eine Nullstelle von h oder gleich a.
Daraus folgt die Behauptung.
(3) Die Menge der gemeinsamen Elemente der Graphen der durch f und
g definierten Abbildungen ist
{(a, f (a))| f (a) = g(a)} ,
ihre Anzahl ist daher die Anzahl der Nullstellen von f − g. Nach (2)
ist diese höchstens max(gr( f ), gr(g)).
77
4. POLYNOME
(4) Es seien f , g zwei Polynome so, dass für alle a ∈ K gilt: f (a) = g(a).
Da K unendlich ist, hat dann f − g beliebig viele Nullstellen. Nach
(2) ist daher f = g.
3. Interpolation
In diesem Abschnitt seien t0 , . . . ,tn paarweise verschiedene Elemente
von K und y0 , . . . , yn Elemente von K. Wir suchen ein Polynom f ∈ K[x]
mit der Eigenschaft
f (ti ) = yi , 0 ≤ i ≤ n .
Ein solches Polynom heißt interpolierendes Polynom. Die Elemente t 0 , . . . ,tn
heißen Stützstellen und y0 , . . . , yn Werte der Interpolationsaufgabe.
Satz 83 : (Lagrange-Interpolation) Es gibt genau ein interpolierendes Polynom vom Grad ≤ n und zwar
n
∑ yi · f i ,
i=0
wobei
1
· (x − t j ) ∈ K[x]
j6=i ti − t j
fi := ∏
ist, 0 ≤ i ≤ n .
Beweis: Für 0 ≤ i, k ≤ n ist fi (tk ) = δik . Daher ist für 0 ≤ k ≤ n
n
n
i=0
i=0
( ∑ yi · fi )(tk ) = ∑ yi δik = yk .
Der Grad von fi ist n, also ist der Grad von ∑ni=0 yi · fi kleiner oder gleich n.
Wenn f und g interpolierende Polynome vom Grad ≤ n sind, dann sind
die Elemente t0 , . . . ,tn Nullstellen von f − g. Aus Satz 82 folgt daher f = g.
78
4. POLYNOME
Satz 84 : (Newton-Interpolation) Das interpolierende Polynom kann wie
folgt berechnet werden:
• Setze k := 0 und h0 := y0 .
• Solange k < n ist, ersetze k durch k + 1, und setze
yk − hk−1 (tk )
ck := k−1
∏i=0 (tk − ti )
und
k−1
hk := hk−1 + ck ∏ (x − ti ) .
i=0
• Das interpolierende Polynom ist dann hn .
Beweis: Übung.
4. Der Euklidische Algorithmus für Polynome
Definition 61 : Es seien f1 , . . . , fn von Null verschiedene Polynome. Das
normierte Polynom größten Grades, das f 1 , . . . , fn teilt, heißt
größter gemeinsamer Teiler von f 1 , . . . , fn und wird mit
ggT ( f1 , . . . , fn ) bezeichnet. Das normierte Polynom kleinsten Grades, das
von f1 , . . . , fn geteilt wird, heißt kleinstes gemeinsames Vielfaches von f 1 , . . ., fn
und wird mit kgV ( f1 , . . . , fn ) bezeichnet.
Hilfssatz 7 : Es seien f , g, h Polynome, f 6= 0, g 6= 0 und f 6= h · g. Dann ist
ggT ( f , g) = ggT ( f − h · g, g) .
Beweis: Wenn t ein Teiler von f und g ist, dann gibt es Polynome u, v so,
dass f = t · u und g = t · v ist. Daher ist f − h · g = t · u − h ·t · v = t · (u − h · v),
also t auch ein Teiler von f − h · g.
Satz 85 : (Euklidischer Algorithmus für Polynome)
Es seien f , g Polynome, f 6= 0 und g 6= 0. Mit dem folgenden Verfahren kann
der größte gemeinsame Teiler von f und g berechnet werden:
• Solange keines der zwei Polynome ein Teiler der anderen ist, ersetze das Polynom größeren (oder gleichen) Grades durch seinen Rest
nach Division durch das andere.
• Wenn h, eines der zwei Polynome, ein Teiler des anderen ist, dann ist
ggT ( f , g) = lk(h)−1 h.
Beweis: Es seien a und b die Grade von f und g. Sei a ≥ b. Wenn f und g
verschieden sind, wird f im nächsten Schritt durch ein Polynom kleineren
79
4. POLYNOME
Grades ersetzt. Also liefert das Verfahren nach höchstens max(a, b) Schritten ein Ergebnis. In jedem Schritt wird ein Paar von Polynomen durch ein
anderes ersetzt, nach Hilfssatz 7 aber so, dass die größten gemeinsamen
Teiler der zwei Polynompaare gleich sind. Sobald eines der zwei Polynome
das andere teilt, ist dieses c · ggT ( f , g), für ein 0 6= c ∈ K.
Satz 86 : (Erweiterter Euklidischer Algorithmus)
Es seien f , g Polynome, f 6= 0 und g 6= 0. Es gibt Polynome u, v so, dass u f +
vg = ggT ( f , g) ist. Diese können mit dem folgenden Verfahren berechnet
werden:
• Setze A := (A1 , A2 , A3 ) := ( f , 1, 0) ∈ K[x] 3 und
B := (B1 , B2 , B3 ) := (g, 0, 1) ∈ K[x] 3 .
• Solange B1 das Polynom A1 nicht teilt, berechne den polynomialen
Quotienten m von A1 und B1 und setze C := B, B := A − mC := (A1 −
mC1 , A2 − mC2 , A3 − mC3 ) und A := C.
• Wenn B1 das Polynom A1 teilt, dann ist u := lk(B1 )−1 · B2 und v :=
lk(B1 )−1 · B3 .
Beweis: Wenn zwei Tripel von Polynomen S und T die Eigenschaft
S1 = f · S 2 + g · S 3
bzw. T1 = f · T2 + g · T3
haben, dann auch alle Tripel S − hT mit h ∈ K[x] . Die ersten zwei Tripel im
Algorithmus haben diese Eigenschaft, daher auch alle anderen auftretenden
Tripel. Für die ersten Komponenten der Tripel wird der euklidische Algorithmus durchgeführt, für das letzte Tripel B gilt daher lk(B1 ) · ggT ( f , g) =
f · B2 + g · B 3 .
Satz 87 : (Berechnung von kgV ( f , g))
Es seien f , g Polynome, f 6= 0 und g 6= 0. Sei z := lk( f )−1 lk(g)−1 ∈ K. Dann
ist
z· f
z·g
kgV ( f , g) =
·g =
·f .
ggT ( f , g)
ggT ( f , g)
Beweis: Es ist klar, dass ggTz·(ff ,g) · g = ggTz·g
( f ,g) · f ein Vielfaches von f und
von g ist. Sei h ein Polynom, das Vielfaches von f und von g ist. Dann gibt
es Polynome c, d mit h = c · f und h = d · g. Nach Satz 86 gibt es Polynome
u, v so, dass u · f + v · g = ggT ( f , g) ist. Dann ist
h=
=
u· f
v·g
u· f +v·g
·h =
·h+
·h =
ggT ( f , g)
ggT ( f , g)
ggT ( f , g)
f ·g
u· f ·d·g v·g·c· f
+
=
· (u · d + v · c) =
ggT ( f , g) ggT ( f , g) ggT ( f , g)
80
4. POLYNOME
=
ein Vielfaches von
z· f ·g
· z−1 · (u · d + v · c)
ggT ( f , g)
z· f ·g
.
ggT ( f , g)
Satz 88 : ( Lösen einer linearen Gleichung, deren Koeffizienten Polynome
”
sind“) Es seien f1 , . . . , fn von Null verschiedene Polynome, g := ggT ( f 1 , . . . , fn )
und h ein Polynom. Es ist
ggT ( f1 , . . ., fn ) = ggT ( f1 , ggT ( f2 , ggT ( f3 , ggT (. . ., fn ) . . .)) ,
also kann der größte gemeinsame Teiler mehrerer Polynome durch sukzessives Berechnen des größten gemeinsamen Teilers von je zwei Polynomen
berechnet werden.
Es gibt genau dann ein n-Tupel (x1 , . . . , xn ) von Polynomen mit
f 1 · x1 + . . . + f n · xn = h ,
wenn h ein Vielfaches von g ist. In diesem Fall kann ein solches n-Tupel wie
folgt berechnet werden:
• Berechne mit Satz 86 Polynome u1 , . . . , un so, dass
f1 · u1 + . . . + fn · un = g ist.
• Setze xi := ui · hg , 1 ≤ i ≤ n.
Beweis: Für jedes n-Tupel (x1 , . . . , xn ) von Polynomen wird f 1 · x1 + . . . +
fn · xn von g geteilt. Also ist die Bedingung, dass h ein Vielfaches von g ist,
notwendig für die Existenz einer Lösung. Wenn diese Bedingung erfüllt ist,
ist leicht nachzuprüfen, dass (u1 · gh , . . . , un · hg ) eine Lösung ist.
5. Irreduzible Polynome
Definition 62 : Ein Polynom f ∈ K[x] ist genau dann irreduzibel, wenn
f 6∈ K ist und wenn f in K[x] keine Teiler hat, deren Grad größer als 0 und
kleiner als gr( f ) ist.
Beispiel 30 : Alle Polynome mit Grad 1 sind irreduzibel.
Hilfssatz 8 : Es sei f ∈ K[x] ein irreduzibles Polynom mit Koeffizienten
in einem Körper K. Wenn f das Produkt zweier Polynome teilt, dann auch
eines dieser zwei Polynome.
Beweis: Es seien g, h ∈ K[x] so, dass f das Polynom gh teilt. Wir nehmen an, dass f das Polynom g nicht teilt. Weil f irreduzibel ist, ist dann
81
4. POLYNOME
ggT ( f , g) = 1. Nach Satz 86 gibt es Polynome u, v mit
u f + vg = 1. Weil f ein Teiler von u f h und vgh ist, teilt es auch h = 1 · h =
u f h + vgh.
Satz 89 : Zu jedem Polynom f ∈ K[x] mit positivem Grad gibt es bis auf die
Reihenfolge eindeutig bestimmte normierte irreduzible Polynome f 1 , . . ., fn
so, dass
n
f = lk( f ) ∏ fi
i=1
ist.
Beweis: Es sei 0 6= f ∈ K[x] ein Polynom mit positivem Grad. Wir zeigen
die Existenz einer Zerlegung in irreduzible Faktoren durch Induktion über
gr( f ).
Wenn gr( f ) = 1 ist, dann ist f irreduzibel.
Wenn gr( f ) > 1 ist, dann ist f entweder irreduzibel oder es gibt Polynome
g, h mit positivem Grad so, dass f = gh ist. Dann sind die Grade von g und h
aber kleiner als der von f . Nach Induktionsannahme sind g und h Produkte
von irreduziblen Elementen, also auch f .
Wenn f = p1 p2 . . . pn und f = q1 q2 . . . qm zwei Zerlegungen von f in irreduzible Elemente sind, dann gibt es nach Hilfssatz 8 einen Index j so, dass
q j das irreduzible Polynom pn teilt. Es gibt also ein invertierbares Element
u in K[x] so, dass pn = uq j ist. Daher ist
g := up1 p2 . . . pn−1 =
∏
qi .
1≤i≤m, i6= j
Der Grad von g ist kleiner als der von f , daher folgt aus der Induktionsannahme die Eindeutigkeit der irreduziblen Faktoren von g bis auf die Reihenfolge und Assoziiertheit. Wegen pn = uq j folgt daraus die Behauptung.
Satz 90 : In jedem Polynomring über einem Körper gibt es unendlich viele
normierte irreduzible Polynome.
Wenn K ein Körper mit endlich vielen Elementen ist, gibt es zu jeder natürlichen Zahl n unendlich viele normierte irreduzible Polynome in K[x] , deren
Grad größer als n ist.
Beweis: Wenn es nur endlich viele normierte irreduzible Polynome gäbe,
dann wäre ihr Produkt q ein Polynom und der Grad von q + 1 wäre größer
(oder gleich, wenn es nur ein normiertes irreduzibles Polynom gibt) als der
jedes irreduziblen Polynoms. Insbesondere wäre q + 1 kein normiertes irreduzibles Polynom. Nach Satz 89 gibt es ein normiertes irreduzibles Polynom p, das q + 1 teilt. Da p auch q teilt, würde p dann auch 1 teilen,
82
4. POLYNOME
Widerspruch.
Wenn K ein endlicher Körper und n eine natürliche Zahl ist, gibt es nur
endlich viele Polynome, deren Grad kleiner oder gleich n ist. Daraus folgt
die zweite Behauptung.
6. Die Anzahl der Nullstellen eines Polynoms
Im Satz 82 wurde eine obere Schranke für die Anzahl der Nullstellen
eines Polynoms angegeben, diese kann aber viel zu groß sein. Zum Beispiel
hat das Polynom xn für jedes n ∈ N in K nur eine Nullstelle.
Definition 63 : Es seien f 6= 0 ein Polynom mit Koeffizienten in K und a
eine Nullstelle von f in K. Die Vielfachheit der Nullstelle a von f ist die
größte ganze Zahl n mit der Eigenschaft, dass (x − a)n ein Teiler von f ist.
Eine Nullstelle ist einfach, wenn ihre Vielfachheit 1 ist, und mehrfach, wenn
ihre Vielfachheit größer als 1 ist.
Satz 91 : Die Abbildung
D : K[x] −→ K[x]
,
n
n
i=0
i=1
∑ cixi 7−→ ∑ icixi−1
heißt Differentiation oder Ableitung. Sie ist K-linear und erfüllt die Produktregel
für alle Polynome f , g ist D( f · g) = f · D(g) + D( f ) · g .
Insbesondere ist für alle positiven ganzen Zahlen k und alle Polynome f ∈
K[x]
D( f k ) = k · f k−1 · D( f ) .
Beweis: Übung.
Definition 64 : Für c ∈ K und a ∈ Z sei
a · c := vz(a)c + . . . + vz(a)c .
|
{z
}
|a| Summanden
Wenn für alle positiven ganzen Zahlen n gilt: n · 1 6= 0, dann ist K ein Körper
der Charakteristik 0. Schreibweise: char(K) = 0.
Wenn es eine positive ganze Zahl n mit n · 1 = 0 gibt und p die kleinste
positive ganze Zahl mit dieser Eigenschaft ist, dann ist K ein Körper der
Charakteristik p. Schreibweise: char(K) = p. Es ist leicht zu sehen, dass p
in diesem Fall eine Primzahl sein muss.
83
4. POLYNOME
Beispiel 31 : Q hat Charakteristik 0, Z p hat Charakteristik p.
Satz 92 : Es sei f 6= 0 ein Polynom.
(1) Ein Element a ∈ K ist genau dann eine mehrfache Nullstelle von f ,
wenn
f (a) = 0 und D( f )(a) = 0 ist.
(2) Wenn char(K) = 0 ist, dann hat das Polynom
f
ggT ( f , D( f ))
nur einfache Nullstellen und zwar genau die Nullstellen von f .
(3) Wenn char(K) = 0 ist, dann hat das Polynom f höchstens
gr( f ) − gr(ggT ( f , D( f )))
Nullstellen in K.
Beweis:
(1) Wenn a eine mehrfache Nullstelle von f ist, dann gibt es ein Polynom
h ∈ K[x] so, dass f = (x − a)2 · h. Dann ist
D( f ) = 2(x − a) · h + (x − a)2 · D(h) =
= (x − a) · (2h + (x − a) · D(h)) ,
also a eine Nullstelle von D( f ).
Sei nun umgekehrt a eine Nullstelle von f und von D( f ). Wir dividieren f mit Rest durch (x − a)2 :
f = m · (x − a)2 + r , gr(r) < 2 .
Dann ist
D( f ) = D(m) · (x − a)2 + 2m · (x − a) + D(r) .
Aus f (a) = 0 folgt 0 = r(a), also ist r = 0 oder
r = lk(r) · (x − a). Aus D( f )(a) = 0 folgt D(r) = 0. Daher ist r = 0
und (x − a)2 ein Teiler von f .
(2) Sei a eine Nullstelle von f und n ihre Vielfachheit. Dann gibt es ein
Polynom h mit f = (x − a)n · h und h(a) 6= 0. Wegen
D( f ) = n · (x − a)n−1 · h + (x − a)n · D(h) =
= (x − a)n−1 · (n · h + (x − a) · D(h))
wird ggT ( f , D( f )) von (x − a)n−1 geteilt. Wegen h(a) 6= 0 und weil
char(K) = 0 ist, wird n · h + (x − a) · D(h) nicht von (x − a) geteilt.
Somit werden D( f ) und ggT ( f , D( f )) nicht von (x − a)n geteilt. Daher ist a eine einfache Nullstelle von ggT ( f f,D( f )) .
(3) folgt aus (2).
84
4. POLYNOME
7. Polynome in mehreren Variablen
Es sei n eine positive ganze Zahl.
Zur Erinnerung: Eine Familie (ci )i∈ N n in K ist eine Koeffizienten-Familie
mit Indexmenge N n , wenn es nur endlich viele Indizes i ∈ N n mit ci 6= 0
gibt.
Auf N n betrachten wir die komponentenweise Addition:
für i, j ∈ N n ist
i + j := (i1 , . . ., in ) + ( j1 , . . ., jn ) := (i1 + j1 , . . . , in + jn ) .
Für jedes k ∈ N n gibt es nur endliche viele Paare (i, j) ∈ N n × N n mit der
Eigenschaft i + j = k.
Satz 93 : Die Menge Pn aller Koeffizienten-Familien in K mit Indexmenge
N n zusammen mit den Abbildungen
+ : Pn × Pn −→ Pn
,
((ci )i∈ N n , (di )i∈ N n ) 7−→ (ci )i∈ N n + (di )i∈ N n := (ci + di )i∈ N n ,
· : Pn × Pn −→ Pn
,
((ci )i∈ N n , (di )i∈ N n ) 7−→ (ci )i∈ N n · (di )i∈ N n := (
∑
i, j∈ N n ,i+ j=k
ci d j )k∈ N ,
und
· : K × Pn −→ Pn , (c, (di )i∈ N n ) 7−→ c · (di)i∈ N n := (cdi )i∈ N n ,
ist eine kommutative K-Algebra. Sie heißt Polynomring (in n Variablen)
über K oder Algebra der Polynome (in n Variablen) mit Koeffizienten in K.
Ihre Elemente heißen Polynome in n Variablen mit Koeffizienten in K. Das
Nullelement des Polynomringes in n Variablen ist die Familie 0 := (0)i∈ N n ,
das Einselement ist die Familie 1 := (δi0 )i∈ N n .
Beweis: Übung.
Definition 65 : Der Betrag eines Elementes
i ∈ N n ist die Zahl
|i| := |(i1 , . . . , in )| := i1 + i2 + . . . + in .
Es sei f = (ci )i∈ N n 6= 0 ein Polynom mit Koeffizienten in K. Der Grad von
f oder Totalgrad von f ist die größte Zahl in
{ |i| | i ∈ N n , ci 6= 0}
und wird mit gr( f ) bezeichnet. Das Polynom f heißt homogen vom Grad
d ∈ N , wenn für alle i ∈ N n mit ci 6= 0 gilt: |i| = d.
85
4. POLYNOME
Die folgende Schreibweise ist zweckmäßig: Wir wählen n Symbole, zum
Beispiel x1 , . . . , xn , und schreiben
∑ n ci xi
∑
oder
i1 ,...,in
i∈ N
ci1 ...in xi11 xi22 . . . xinn
statt (ci )i∈ N n .
Wir sprechen dann von einem Polynom in den Variablen x1 , . . . , xn mit Koeffizienten in K. Für den Polynomring über K schreiben wir dann K[x 1 , . . . , xn ]
oder, wenn n fest gewählt ist, K[x]. Wir identifizieren Polynome vom Grad 0
mit ihren nullten Koeffizienten und fassen K so als Teilmenge von K[x 1 , . . . , xn ]
auf. Die Polynome
x j := (δi j )i∈ N n ,
heißen Potenzprodukte in n Variablen.
j ∈ Nn ,
Satz 94 : Die Familie der Potenzprodukte (xi )i∈ N n ist eine K-Basis von
K[x1 , . . . , xn ].
Beweis: Übung.
Definition 66 : Es seien
f :=
∑
i1 ,...,in
ci1 ...in xi11 xi22 . . . xinn ∈ K[x1 , x2 , . . . , xn ]
ein Polynom und a := (a1 , . . . , an ) ein n-Tupel von Elementen einer KAlgebra A. Dann ist
f (a) :=
∑
i1 ,...,in
ci1 ...in ai11 ai22 . . . ainn
ein Element von A. Das n-Tupel a ist eine Nullstelle von f in An , wenn
f (a) = 0
ist.
Die Abbildung
K n −→ K , z 7−→ f (z) ,
heißt die durch f definierte polynomiale Abbildung und wird meistens wieder mit f bezeichnet.
Definition 67 : Ein System von polynomialen Gleichungen über K ist gegeben durch eine Teilmenge M ⊆ K[x1 , x2 , . . ., xn ]. Gesucht ist die Menge
NK n (M) := {z ∈ K n | für alle f ∈ M ist f (z) = 0}
aller gemeinsamen Nullstellen der Polynome in M. Diese heißt Nullstellenmenge von M. Eine Teilmenge N von K n ist eine algebraische Menge, wenn
sie die Nullstellenmenge einer Teilmenge von K[x1 , x2 , . . . , xn ] ist.
86
4. POLYNOME
Satz 95 : Beliebige Durchschnitte und endliche Vereinigungen von algebraischen Mengen sind wieder algebraisch.
Genauer formuliert: Wenn N1 , N2 , . . . ⊆ K n die Nullstellenmengen von M1 , M2 , . . . ⊆
K[x1 , . . . , xn ] sind, dann ist
\
i∈ N
und
k
[
i=1
Ni = N K n (
[
Mi )
i∈ N
Ni = NK n ({ f1 · f2 · . . . · fk | fi ∈ Mi , 1 ≤ i ≤ k}) .
Beweis: Übung.
Beispiel 32 : Die Nullstellenmenge von x21 − x22 in K 2 ist die Vereinigung
der zwei Geraden NK 2 (x1 + x2 ) und NK 2 (x1 − x2 ). Die Nullstellenmenge
von {x1 + x2 , x1 − x2 } ist der Punkt {(0, 0)}, der Durchschnitt dieser zwei
Geraden.
KAPITEL 5
Erweiterungen des Zahlenbereichs
In diesem Kapitel wird mit K immer ein Körper bezeichnet.
1. Algebraische Elemente und Minimalpolynome
In diesem Abschnitt sei A eine K-Algebra.
Definition 68 : Ein Element a ∈ A ist algebraisch über K, wenn es Nullstelle eines Polynoms f 6= 0 in K[x] ist.
Beispiel 33 : Die Matrix
0 −1
∈ Q 2×2
1 0
ist eine Nullstelle des Polynoms x2 + 1 ∈ Q [x], also algebraisch über Q .
Definition 69 : Es seien a ein über K algebraisches Element von A. Das
normierte Polynom kleinsten Grades in K[x], das a als Nullstelle hat, heißt
Minimalpolynom von a über K.
Satz 96 : Es seien a ein über K algebraisches Element in A, dessen Minimalpolynom f ∈ K[x] irreduzibel ist.
(1) Wenn g ∈ K[x] ein irreduzibles normiertes Polynom mit
g(a) = 0 ist, dann ist f = g.
(2) Es sei n der Grad von f . Dann ist
(1, a, a2 , . . . , an−1 )
eine K-Basis von K[a] := {h(a) | h ∈ K[x] }.
i
Wenn r = ∑n−1
i=0 ci x der Rest von h ∈ K[x] nach Division durch f
ist, dann ist (c0 , . . . , cn−1 ) das n-Tupel der Koordinaten von h(a)
bezüglich der Basis (1, a, a2 , . . . , an−1 ).
(3) Die kommutative Unteralgebra K[a] von A ist ein Körper. Es seien
h ∈ K[x] und h(a) 6= 0. Die Koordinaten von
h(a)−1 ∈ K[a] bezüglich der Basis (1, a, . . ., an−1 ) können wie folgt
berechnet werden:
87
88
5. ERWEITERUNGEN DES ZAHLENBEREICHS
– Berechne mit dem erweiterten Euklidischen Algorithmus Polynome u, v ∈ K[x] so, dass u f + vh = 1 ist.
i
– Berechne den Rest ∑n−1
i=0 di x von v nach Division durch f .
– Dann ist (d0 , . . . , dn−1 ) das gesuchte n-Tupel der Koordinaten
von h(a)−1 .
Beweis:
(1) Es sei r der Rest von g nach Division durch f . Dann ist a auch eine
Nullstelle von r. Wegen r = 0 oder gr(r) < gr( f ) folgt aus der Definition des Minimalpolynoms, dass r = 0 ist. Also wird das irreduzible
Polynom g von f geteilt, aus lk(g) = 1 = lk( f ) folgt daher f = g.
(2) Es seien h ∈ K[x] und m bzw. r der polynomiale Quotient bzw. Rest
von h nach Division durch f . Dann ist
h(a) = m(a) · f (a) + r(a) = r(a) ,
also ist h(a) eine K-Linearkombination von (1, a, . . ., an−1 ). Wäre
(1, a, . . ., an−1 ) nicht linear unabhängig, dann gäbe es ein n-Tupel
i
0 6= (d0 , . . ., dn−1 ) in K n mit ∑n−1
i=0 di a = 0. Dann wäre aber a die
i
Nullstelle des Polynoms 0 6= ∑n−1
i=0 di x , dessen Grad kleiner als der
von f ist. Widerspruch.
(3) Es seien h ∈ K[x] und h(a) 6= 0. Nach (2) können wir annehmen,
dass der Grad von h kleiner als n ist (falls nicht, ersetzen wir h durch
seinen Rest nach Division durch f ). Dann wird h nicht von f geteilt.
Weil f irreduzibel ist, ist daher ggT ( f , h) = 1. Mit dem erweiterten
Euklidischen Algorithmus können daher Polynome u, v ∈ K[x] so
berechnet werden, dass u f + vh = 1 ist. Dann ist v(a) ∈ K[a] und
1 = u(a) · f (a) + v(a) · h(a) = 0 + v(a) · h(a) ,
also h(a) invertierbar und h(a)−1 = v(a).
Wenn das Minimalpolynom eines algebraischen Elementes a bekannt
ist, dann kann am Computer in K[a] exakt gerechnet werden (wobei vorausgesetzt werden muss, dass man in K exakt rechnen kann). Die Elemente
von K[a] werden durch n-Tupel in K n dargestellt, und die Rechenoperationen werden mit Hilfe der Aussagen (2) und (3) von Satz 96 ausgeführt.
Die erste Aussage von Satz 96 kann verwendet werden, um das Minimalpolynom zu finden: es muss zunächst irgendein normiertes Polynom f ,
dessen Nullstelle a ist, gegeben sein. Dann wird überprüft, ob f irreduzibel ist. Wenn es irreduzibel ist, dann ist f das Minimalpolynom von a .
Wenn nicht, müssen wir einen Faktor g kleineren Grades mit g(a) = 0 finden und mit diesem von Neuem beginnen. Es gibt Verfahren zur effizienten
Faktorisierung von Polynomen, diese übersteigen aber den Rahmen dieser
Vorlesung.
89
5. ERWEITERUNGEN DES ZAHLENBEREICHS
√
Beispiel 34 : Es sei 3 2 die positive reelle Zahl, die Nullstelle von x3 − 2
ist. Wenn das Polynom x3 − 2 nicht irreduzibel über Q wäre, dann hätte es
einen Faktor vom Grad 1. Dieses Polynom hat aber keine Nullstelle in Q
(Übung), also auch
keinen Faktor vom
Grad
1. Daher ist x3 − 2 das Mini√
√
√
√
3
3
3
3
(1,
2,
4)
ist
eine
Q
-Basis
von
Q
[
2].
malpolynom von 2 über Q und
√
√
3
3
−1
Um die Koordinaten von (1 + 2 2 + 3 4) bezüglich dieser Basis zu berechnen, verwenden wir Satz 96. Es ist
(−3x − 50)(x3 − 2) + (x2 + 16x − 11)(3x2 + 2x + 1) = 89 ,
also
√
√
−11 16 √
1√
3
3
3
3
+
(1 + 2 2 + 3 4)−1 =
2+
4.
89
89
89
Schreibt man dieses Ergebnis in der Form
√
√
1
−11 + 16 3 2 + 3 4
√
√ =
89
(1 + 2 3 2 + 3 3 4)
an, so wird diese Berechnung oft als Rationalmachen des Nenners“ be”
zeichnet.
2. Existenz von Nullstellen
In diesem Abschnitt sei f ∈ K[x] ein irreduzibles normiertes Polynom.
Definition 70 : Eine Körper L, der K als Unterring enthält, heißt Körpererweiterung von K. Eine Körpererweiterung K ⊆ L ist endlich, wenn L als
K-Vektorraum endlichdimensional ist. Die Dimension dieses Vektorraums
heißt Grad der Körpererweiterung.
Ein irreduzibles Polynom f ∈ K[x] hat in K keine Nullstellen, daher
sucht man eine endliche Körpererweiterung K ⊆ L von möglichst kleinem
Grad, sodass das Polynom in L eine Nullstelle hat. Dazu gibt es zwei Möglichkeiten:
(1) Man sucht in einer bereits bekannten K-Algebra A nach einer Nullstelle a von f . Wenn man sie findet, dann ist K ⊆ K[a] die gesuchte
Körpererweiterung.
(2) Man konstruiert eine endliche Körpererweiterung, in der f eine Nullstelle haben muss.
Beispiel 35 : Wenn K = Q und f = x2 + 1 ist, dann hat f in der Q -Algebra
Q 2×2 die Nullstelle
0 −1
i :=
.
1 0
90
5. ERWEITERUNGEN DES ZAHLENBEREICHS
a −b
Also ist Q ⊆ Q [i] := {aI2 + bi =
| a, b ∈ Q } eine Körpererweib a
terung vom Grad 2.
Eine allgemeine Methode zur Konstruktion einer endlichen Körpererweiterung von kleinstmöglichem Grad, in der f eine Nullstelle hat, liefert
der folgende
Satz 97 : Es seien f ∈ K[x] irreduzibel, n := gr( f ) und V der von 1, x, x2 , . . . , xn−1
erzeugte Untervektorraum von K[x]. Mit der Multiplikation
· : V ×V −→ V , (g, h) 7−→ Rest von gh nach Division durch f ,
wird V zu einer K-Algebra, die sogar eine Körpererweiterung von K (vom
Grad n) ist. Das Element x ∈ V ist eine Nullstelle von f in V .
Das zu h ∈ V inverse Element kann wie folgt berechnet werden:
• Berechne mit dem erweiterten Euklidischen Algorithmus
Polynome u, v ∈ K[x] so, dass u f + vh = 1 ist.
• Der Rest von v nach Division durch f ist das zu h inverse Element.
Beweis: Übung.
Beispiel 36 : Seien K = Q , f = x2 + 1 und V := Q h1, xi. Wir betrachten V
wie in Satz 97 als zweidimensionale Körpererweiterung von Q . Dann hat
f in V die Nullstelle i := x.
Definition 71 : Ein Körper K ist algebraisch abgeschlossen, wenn jedes
Polynom in K[x] mit positivem Grad eine Nullstelle in K hat. Eine Körpererweiterung K ⊆ L von K heißt algebraischer Abschluss von K, wenn L algebraisch abgeschlossen ist und jedes Element von L algebraisch über K
ist.
91
5. ERWEITERUNGEN DES ZAHLENBEREICHS
Satz 98 : Jeder Körper hat einen algebraischen Abschluss. Ein algebraischer Abschluss von Q heißt Körper der algebraischen Zahlen.
Beweis: wird weggelassen.
Manche Eigenschaften von Polynomen sind besonders einfach zu beschreiben, wenn der Koeffizientenkörper algebraisch abgeschlossen ist:
Satz 99 : Ein Polynom mit Koeffizienten in einem algebraisch abgeschlossenen Körper K ist genau dann in K[x] irreduzibel, wenn sein Grad 1 ist.
Insbesondere gilt: Wenn f ∈ K[x] positiven Grad hat und z1 , . . . , zn die Nullstellen von f in K sind, dann gibt es eindeutig bestimmte positive ganze
Zahlen e1 , . . . , en so, dass
n
f = lk( f ) ∏(x − zi )ei
i=1
ist.
Beweis: Wenn K algebraisch abgeschlossen ist, hat jedes Polynom in K[x]
mit positivem Grad in K eine Nullstelle. Wenn z eine Nullstelle eines irreduziblen Polynoms f ist, dann wird f von x − z geteilt. Daher muss f =
lk( f )(x − z) sein.
Die zweite Aussage folgt nun aus Satz 89.
Satz 100 : Es sei K ein algebraisch abgeschlossener Körper der Charakteristik 0. Dann hat ein Polynom 0 6= f ∈ K[x] genau
gr( f ) − gr(ggT ( f , D( f ))
(paarweise verschiedene) Nullstellen.
Beweis: Folgt aus Satz 92 und Satz 99.
92
5. ERWEITERUNGEN DES ZAHLENBEREICHS
3. Endliche Körper
In diesem Abschnitt seien p eine positive Primzahl und L ein endlicher
Körper der Charakteristik p. Wir identifizieren n̄ ∈ Zp und n · 1L ∈ L und
fassen Z p so als Unterkörper von L auf.
Wir bezeichnen mit m die Dimension von L als Vektorraum über Z p . Dann
kann jedes Element von L eindeutig durch ein m-Tupel von Elementen in
Z p dargestellt werden. Insbesondere ist pm die Anzahl der Elemente von L.
Beispiel 37 : Das Polynom x2 +x+1 ist über Z 2 irreduzibel, also ist Z 2 h1, xi
mit der in Satz 97 definierten Multiplikation ein Körper der Charakteristik 2
mit 4 Elementen. Seine Elemente sind 0, 1, x und x + 1. Es ist x · (1 + x) = 1,
x2 = x + 1 und (x + 1)2 = x.
Satz 101 :
(1) Für alle positiven ganzen Zahlen m gibt es einen Körper L mit q :=
pm Elementen. Er wird häufig als Galoiskörper GF(q) bezeichnet.
(2) Jedes Element von L ist Nullstelle von xq − x.
m
(3) Das Polynom x p − x hat irreduzible Faktoren vom Grad m.
m
(4) Sei f ein irreduzibler Faktor vom Grad m von x p − x. Dann kann
GF(q) wie in Satz 97 als Körpererweiterung von Z p , die eine Nullstelle von f enthält, konstruiert werden.
Beweis: wird weggelassen.
Beispiel 38 : Ein linearer (n,k)-Code ist ein k-dimensionaler Untervektorraum eines n-dimensionalen Vektorraums über einem endlichen Körper L.
Seine Elemente heißen Worte des Codes. Wenn q = pm die Anzahl der
Elemente von L ist, dann enthält ein linearer (n, k) − Code über L genau
qk = pm·k Worte.
KAPITEL 6
Eigenwertprobleme
In diesem Kapitel sei K ein Körper.
1. Eigenwerte und Eigenvektoren
Beispiel 39 : Zwei Gewichte mit Masse m hängen hintereinander an zwei
Federn mit Federkonstante k.
H
H
H
H
H
H
X
X
X
X
X
X
@
@
@
@
@
@
x1
?
x2
H
H
H
H
H
H
?
Nach den Gesetzen der Mechanik gilt für die Auslenkungen aus der Ruhelage x1 bzw. x2 des ersten bzw. zweiten Gewichts
mx001 + kx1 − k(x2 − x1 ) = 0
mx002
+ k(x2 − x1 ) = 0 ,
wobei 00 die zweite Ableitung nach der Zeit bezeichnet. In Matrizenform
umgeschrieben erhält man
00 2k −k
x1
x1
= 0.
m 00 +
−k k
x2
x2
Wir untersuchen nun die Frage, ob es eine Schwingung der Form
x1 (t) = a1 sin(ω t)
x2 (t) = a2 sin(ω t)
93
94
6. EIGENWERTPROBLEME
gibt, wobei a1 , a2 die Amplituden sind und ω die Frequenz ist. In diesem
Fall wäre
a1
2k −k
a1
2
−mω sin(ω t)
+ sin(ω t)
=0
a2
a2
−k k
für alle reellen Zahlen t, also
2k −k
a1
2 a1
.
= mω
−k k
a2
a2
Daher suchen wir Spalten, die durch Multiplikation mit einer vorgegebenen
Matrix in ein skalares Vielfaches übergehen (Fortsetzung in Beispiel 43).
Definition 72 : Seien V ein Vektorraum über K und f : V → V eine lineare
Abbildung.
(1) Ein Vektor u ∈ V heißt Eigenvektor von f , wenn u 6= 0 ist und eine
Zahl λ ∈ K existiert mit
f (u) = λ u .
Dann heißt λ der Eigenwert von f zum Eigenvektor u.
(2) Für einen Eigenwert λ von f ist
E( f , λ ) := {x ∈ V | f (x) = λ x}
ein Untervektorraum von V , heißt der Eigenraum von f zum Eigenwert λ , und besteht aus dem Nullvektor sowie allen Eigenvektoren
von f zum Eigenwert λ .
Definition 73 : Sei A ∈ K n×n . Dann heißt u ∈ K n×1 Eigenvektor der Matrix
A und λ ∈ K Eigenwert von A, wenn u Eigenvektor bzw. λ Eigenwert der
Abbildung
K n×1 → K n×1 , x 7→ Ax ,
ist.
2. Determinanten
Definition 74 : Für A ∈ K n×n heißt
det(A) :=
∑
σ ∈Sn
sign(σ )Aσ (1)1 Aσ (2)2 . . . Aσ (n)n
die Determinante von A.
Beispiel 40 : Im Fall n = 1 ist Sn = {Id1 } und det(A) = A11 .
Im Fall n = 2 ist Sn = {Id2 , (1, 2)} und
A11 A12
det
= A11 A22 − A12 A21 .
A21 A22
95
6. EIGENWERTPROBLEME
Im Fall n = 3 ist Sn = {Id3 , (1, 2, 3), (1, 3, 2), (1, 3), (2, 3), (1, 2)} und

A11 A12 A13
det A21 A22 A23  = A11 A22 A33 + A21 A32 A13 + A31 A12 A23
A31 A32 A33
− A31 A22 A13 − A11 A32 A23 − A21 A12 A33 .

Für n ≥ 4 hat Sn mindestens 4! = 24 Elemente und die Definition der
Determinante ist für das praktische Rechnen nicht mehr geeignet.
Satz 102 : Für A ∈ K n×n ist
det(AT ) = det(A) ,
d.h. Transponieren ändert die Determinante nicht.
Beweis: Nach Definition ist
det(AT ) =
sign(σ ) ∏ (AT )σ ( j) j =
∑
sign(σ ) ∏ Aσ −1 (i)i ,
σ ∈Sn
=
n
∑
σ ∈Sn
j=1
n
∑
σ ∈Sn
n
sign(σ ) ∏ A jσ ( j)
j=1
i=1
wobei im Produkt i := σ ( j) gesetzt und umgeordnet wurde. Da die Abbildung Sn → Sn , σ 7→ σ −1 , bijektiv ist, kann man τ := σ −1 setzen und erhält
durch Umordnen der Summe
det(AT ) =
∑
τ ∈Sn
n
sign(τ ) ∏ Aτ (i)i = det(A) .
i=1
Definition 75 : Sei A ∈ K n×n .
(1) A hat obere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i > j
ist. Dann hat A unterhalb der Hauptdiagonalen
{(1, 1), (2, 2), . . ., (n, n)} nur Nulleinträge, d.h. A hat die Gestalt


∗ ∗ ... ∗
0 ∗
∗

. .
 .. . . . . . ...  ,
0 ...
0
∗
wobei ∗ für beliebige Körperelemente steht.
(2) A hat untere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i < j
ist. Dann hat A oberhalb der Hauptdiagonalen nur Nulleinträge, d.h.
96
6. EIGENWERTPROBLEME
A hat die Gestalt


∗ 0 ... 0
.
.

∗ ∗ . . .. 
.
.
..
 ..
. 0
∗ ∗ ... ∗
(3) A ist eine Dreiecksmatrix, wenn A obere oder untere Dreiecksform
hat.
(4) A hat Diagonalform, wenn Ai j = 0 für alle Indizes i, j mit i 6= j ist.
Dann hat A ausserhalb der Hauptdiagonalen nur Nulleinträge, d.h. A
hat die Gestalt


∗ 0 ... 0
. . .. 

. .
0 ∗
. .
.
 .. . . . . . 0
0 ... 0 ∗
Beispiel 41 : Jede quadratische Matrix in Stufenform hat obere Dreiecksform. Daher kann jede quadratische Matrix durch elementare Umformungen in obere Dreiecksform übergeführt werden.
Satz 103 : Die Determinante einer Dreiecksmatrix A ∈ K n×n ist das Produkt ihrer Diagonalelemente, also
det(A) = A11 A22 . . . Ann .
Insbesondere ist
det(In ) = 1 .
Beweis: Übung.
Da man Determinanten von Dreiecksmatrizen leicht ausrechnen kann,
liegt die Frage nahe, wie sich die Determinante bei elementaren Zeilenumformungen der Matrix ändert.
Satz 104 : Sei A ∈ K n×n .
(1) Sei B die Matrix, die man erhält, indem man eine Zeile von A mit
einem Element c ∈ K multipliziert.
Dann ist det(B) = c · det(A).
(2) Sei B die Matrix, die man erhält, indem man zwei Zeilen von A vertauscht. Dann ist det(B) = − det(A).
97
6. EIGENWERTPROBLEME
(3) Sei B die Matrix, die man erhält, indem man ein skalares Vielfaches
einer Zeile von A zu einer anderen Zeile von A addiert. Dann ist
det(B) = det(A).
(4) Die Aussagen (1) - (3) gelten analog für Spalten statt Zeilen.
(5) Die Determinante von A kann wie folgt berechnet werden: Forme A
durch elementare Zeilenumformungen (oder Spaltenumformungen)
vom Typ 1 (Addition eines Vielfachen einer Zeile zu einer anderen)
und vom Typ 2 (Vertauschung zweier Zeilen) in eine Matrix B in Dreiecksform um. Sei k die Zahl der ausgeführten Zeilenvertauschungen.
Dann ist
det(A) = (−1)k B11 B22 . . . Bnn .
Beweis: (1) - (3) nachprüfen, (4) folgt aus Satz 102 und (5) folgt aus
(1) - (3).
Satz 105 : Seien A, B ∈ K n×n und c ∈ K.
(1)
(2)
(3)
(4)
(5)
det(A · B) = det(A) · det(B) = det(B · A) .
Für alle T ∈ GLn (K) ist det(T −1 · A · T ) = det(A) .
A ist genau dann invertierbar, wenn det(A) 6= 0 ist.
1
.
Wenn A invertierbar ist, dann ist det(A−1 ) = det(A)
n
det(cA) = c det(A) .
Beweis:
(1) wird weggelassen.
(2) det(T −1 · A · T ) = det(T · (T −1 · A)) = det(A) .
(3) und (4) folgen aus (1).
(5) folgt aus Satz 104 .
Satz 106 : Seien V ein endlich-dimensionaler Vektorraum über K mit Basis
v und f : V → V eine lineare Abbildung mit Matrix A bezüglich v . Dann ist
det( f ) := det(A)
unabhängig von der Wahl der Basis v und heißt die Determinante von f . Es
ist f genau dann bijektiv, wenn det( f ) 6= 0 ist.
Beweis: Folgt aus Aussagen (2) und (3) in Satz 105 .
Definition 76 : Sei A ∈ K n×n . Für 1 ≤ i, j ≤ n heißt die Matrix
A(i, j) ∈ K (n−1)×(n−1) ,
98
6. EIGENWERTPROBLEME
die man aus A durch Weglassen der i-ten Zeile und j-ten Spalte erhält, die
i- j-te Streichungsmatrix.
Satz 107 : Sei A ∈ K n×n . Dann gilt:
(1) Für 1 ≤ j ≤ n ist
n
det(A) = ∑ (−1)i+ j Ai j det(A(i, j) )
i=1
(Entwicklung der Determinante nach der j-ten Spalte).
(2) Für 1 ≤ i ≤ n ist
n
det(A) =
∑ (−1)i+ j Ai j det(A(i, j))
j=1
(Entwicklung der Determinante nach der i-ten Zeile).
Beweis: wird weggelassen.
Wenn eine Matrix eine Spalte oder Zeile mit vielen Nullen besitzt, dann
ist zur Berechnung der Determinante die Entwicklung nach dieser Spalte
oder Zeile zu empfehlen.
Satz 108 : Sei A ∈ K n×n . Dann heißt die Matrix Ad(A) ∈ K n×n , definiert
durch
Ad(A)i j := (−1)i+ j det(A( j,i) )
für 1 ≤ i, j ≤ n, die zu A adjungierte Matrix, und es gilt
A · Ad(A) = Ad(A) · A = det(A) · In .
Wenn A invertierbar ist, dann ist
A−1 = det(A)−1 Ad(A) .
Beweis: wird weggelassen.
Beispiel 42 : Sei
a b
A=
∈ K 2×2 .
c d
Dann ist det(A) = ad − bc und, falls det(A) 6= 0 ist,
d −b
−1
−1
.
A = det(A)
−c a
99
6. EIGENWERTPROBLEME
3. Berechnung von Eigenwerten
Satz 109 : Seien V ein endlich-dimensionaler Vektorraum über K und f :
V → V eine lineare Abbildung. Dann ist λ ∈ K genau dann Eigenwert von
f , wenn
det(λ IdV − f ) = 0
ist. Die Abbildung
χ f : K → K , z 7→ det(z IdV − f ) ,
ist eine polynomiale Abbildung und heißt das charakteristische Polynom
von f . ( Die Eigenwerte von f sind die Nullstellen des charakteristischen
”
Polynoms.“)
Insbesondere: Die Abbildung f hat höchstens dimK (V ) Eigenwerte.
Wenn K algebraisch abgeschlossen und V 6= {0} ist, hat f mindestens einen
Eigenvektor.
Beweis: Es ist λ genau dann ein Eigenwert von f , wenn ein Vektor u ∈ V
mit u 6= 0 existiert, sodass f (u) = λ u ist. Dies ist äquivalent dazu, dass die
lineare Abbildung
λ IdV − f : V → V , v 7→ λ v − f (v) ,
nicht injektiv ist. Da die Abbildung IdV − f linear ist und die Dimensionen ihres Definitions- und Bildbereiches übereinstimmen, ist die Abbildung
λ IdV − f genau dann injektiv, wenn sie bijektiv ist (Übung). Nach Satz 106
ist λ IdV − f genau dann nicht bijektiv, wenn det(λ IdV − f ) = 0 ist.
Satz 109 legt folgendes Verfahren nahe, die Eigenwerte und Eigenvektoren einer linearen Abbildung f : V → V zu berechnen, falls V endlichdimensional ist:
(1) Wähle eine Basis v = (v1 , . . . , vn ) von V und bestimme die Matrix A
von f bezüglich v . Die Matrix von λ IdV − f bezüglich v ist dann
λ In − A .
(2) Finde alle λ ∈ K mit det(λ In − A) = 0, das heißt: berechne alle Nullstellen des charakteristischen Polynoms von f .
(3) Bestimme für jeden Eigenwert λ den Eigenraum E( f , λ ) durch Lösen
des homogenen Systems linearer Gleichungen
(λ In − A)x = 0.
Beispiel 43 : Wir lösen nun das Eigenwertproblem aus Beispiel 39. Hier ist
2k −k
A=
.
−k k
100
6. EIGENWERTPROBLEME
Wegen
λ − 2k
k
det(λ I2 − A) = det
= λ 2 − 3kλ + k2
k
λ −k
sind die Eigenwerte von A
√
3+ 5
λ1 =
k
und
2
Die zugehörigen Eigenräume sind
1√
bzw.
E(A, λ1 ) = R 1− 5
√
3− 5
λ2 =
k.
2
E(A, λ2 ) = R
2
wobei R der Körper der reellen Zahlen ist.
1√
1+ 5
2
,
Beispiel 44 : Sei A ∈ K n×n eine Dreiecksmatrix. Dann ist auch die Matrix
λ In − A eine Dreiecksmatrix, und nach Satz 103 ist
χA (z) = (z − A11 ) . . . (z − Ann ) .
Daher sind die Diagonalelemente einer Matrix in Dreiecksform ihre Eigenwerte.
Zum Beispiel ist 1 der einzige Eigenwert der Einheitsmatrix In .