Algorithmische Mathematik 1

Werbung
Algorithmische Mathematik 1
Ein Skriptum zur Vorlesung im WS
2004/05
Franz Pauer
4.Auflage
c 2005 F RANZ PAUER
I NNSBRUCK , Ö STERREICH
Vorwort
Das vorliegende Skriptum soll den Hörerinnen und Hörern der Vorlesung Algorithmische Mathematik 1“ im Wintersemester 2004/05 das Mit”
schreiben und Mitdenken in der Vorlesung erleichtern. Das Skriptum enthält
alle Algorithmen, Definitionen und Sätze der Vorlesung, aber fast keine Beispiele dazu. In der Vorlesung werden die Algorithmen, Definitionen und
Sätze motiviert, der Zusammenhang mit früheren Ergebnissen erläutert und
Beispiele dazu besprochen.
Die Hauptziele dieser Vorlesung sind:
• Zahlenbereiche, in denen exakt (also ohne zu runden) gerechnet werden kann, aufzubauen (Kapitel 1 und 5).
Dazu werden Möglichkeiten zur Darstellung von ganzen, rationalen
und algebraischen Zahlen sowie Verfahren zum Rechnen mit diesen
Zahlen vorgestellt. Grundlegend dafür sind die Division mit Rest,
der Euklidische Algorithmus und der erweiterte Euklidische Algorithmus.
• Systeme linearer Gleichungen zu lösen (Kapitel 2).
Die Fragen, wann es eine Lösung gibt, ob sie eindeutig ist und wie
Lösungen berechnet werden können, werden vollständig beantwortet. Weiters wird gezeigt, wie die Menge aller Lösungen durch endlich viele Daten beschrieben werden kann. Dazu muss die Matrizenrechnung eingeführt und auf die Theorie der Vektorräume eingegangen werden. Das zentrale Rechenverfahren zur Lösung von Systemen
linearer Gleichungen ist der Gauss-Algorithmus.
• Eigenwertprobleme zu lösen(Kapitel 6).
Dazu benötigte Hilfsmittel sind Determinanten und polynomiale Abbildungen.
Für diese drei Themen ist das Rechnen mit Abbildungen (Kapitel 3) und
mit Polynomen (Kapitel 4) von großer Bedeutung.
Im Kapitel 0 werden einige Grundbegriffe der Mathematik eingeführt.
Dieses Skriptum hat viel mit den Skripten Lineare Algebra (Dür, A.
und Pauer, F., Institut für Mathematik, Universität Innsbruck, 2004, 4. Auflage) und Algebra (Pauer, F., Institut für Mathematik, Universität Innsbruck,
2000, 2. Auflage) gemeinsam.
Von den ersten drei Auflagen (September 2001, 2002 und 2003) unterscheidet sich diese vierte Auflage nur durch einige Korrekturen und kleinere
Veränderungen.
ii
iii
Franz Pauer
VORWORT
Innsbruck, September 2004
Inhaltsverzeichnis
Vorwort
ii
Kapitel 0. Mengen und Abbildungen
1. Mengen
2. Durchschnitt, Vereinigung und Komplement
3. Abbildungen
4. Familien, Tupel, Folgen und kartesisches Produkt
5. Zusammengesetzte Aussagen
6. Der Induktionsbeweis
1
1
2
3
5
8
8
Kapitel 1. Rechnen mit ganzen und rationalen Zahlen
1. Rechenregeln für ganze Zahlen
2. Division mit Rest
3. Zifferndarstellung von Zahlen
4. Rationale Zahlen
5. Zifferndarstellung von rationalen Zahlen
6. Der Euklidische Algorithmus
7. Primzahlen
8. Gruppen
9. Ringe und Körper
10. Restklassen
10
10
11
12
15
18
19
22
24
27
30
Kapitel 2. Systeme linearer Gleichungen
1. Matrizen
2. Elementare Umformungen
3. Systeme linearer Gleichungen
4. Vektorräume
5. Erzeugendensysteme, lineare Unabhängigkeit und Basen
6. Der Gauss-Algorithmus
34
34
39
41
43
45
49
Kapitel 3. Rechnen mit Abbildungen
1. Permutationen
2. Polynomiale Abbildungen
3. Lineare Abbildungen
4. Die Matrix einer linearen Abbildung
5. Basiswechsel
56
56
60
63
65
69
Kapitel 4. Polynome
1. Der Polynomring
73
73
iv
v
INHALTSVERZEICHNIS
2.
3.
4.
5.
6.
7.
Nullstellen von Polynomen
Interpolation
Der Euklidische Algorithmus für Polynome
Irreduzible Polynome
Die Anzahl der Nullstellen eines Polynoms
Polynome in mehreren Variablen
75
77
78
80
82
84
Kapitel 5. Erweiterungen des Zahlenbereichs
1. Algebraische Elemente und Minimalpolynome
2. Existenz von Nullstellen
3. Endliche Körper
87
87
89
92
Kapitel 6. Eigenwertprobleme
1. Eigenwerte und Eigenvektoren
2. Determinanten
3. Berechnung von Eigenwerten
93
93
94
99
KAPITEL 0
Mengen und Abbildungen
1. Mengen
Definitionen setzen Vorwissen voraus. Zum Beispiel setzt die Definition
Ein Quadrat ist ein gleichseitiges Rechteck“
”
voraus, dass bekannt ist, was gleichseitig“ und Rechteck“ bedeuten. Die
”
”
Definition
Eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird“
”
setzt voraus, dass bekannt ist, was ganze Zahl“ und teilen“ bedeuten. Für
”
”
Definitionen wird häufig die folgende Kurzschreibweise verwendet:
zu definierender Begriff := definierende (schon bekannte) Begriffe .
Zum Beispiel:
Quadrat := gleichseitiges Rechteck
(in Worten: ein Quadrat ist ein gleichseitiges Rechteck)
und
gerade Zahl := ganze Zahl, die von 2 geteilt wird
(in Worten: eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird).
Der Begriff Menge“ ist jedoch ein Grundbaustein der Mathematik, der
”
nicht definiert, sondern nur umschrieben wird: Eine Menge ist eine Zusammenfassung unterscheidbarer Objekte. Diese heißen Elemente der Menge.
Eine Menge kann auf zwei Arten angegeben werden:
(1) durch Anschreiben der Elemente zwischen geschweiften Klammern,
zum Beispiel {7, 3, 5, 8, 1} , {Meier, Müller} ;
oder
(2) durch ihre Eigenschaften, zum Beispiel
{n | n ganze Zahl, n ist größer als 0 und kleiner als 7}
(Sprechweise: die Menge aller n, für die gilt: n ist eine ganze Zahl,
”
die größer als 0 und kleiner als 7 ist“ oder die Menge aller ganzen
”
Zahlen, die größer als 0 und kleiner als 7 sind“).
Bezeichnungen:
0/ := {}
leere Menge
(Menge ohne Elemente)
N := {0, 1, 2, 3, . . .}
Menge der natürlichen Zahlen
Z := {0, 1, −1, 2, −2, . . .}
Menge der ganzen Zahlen
Ist M eine Menge, so wird
1
2
0. MENGEN UND ABBILDUNGEN
e∈M
für e ist ein Element von M“ geschrieben, und analog
”
e∈
/M
für e ist kein Element von M“.
”
Auf logische Probleme, die bei der Einführung des Begriffes Menge“
”
auftreten, gehen wir hier nicht ein. Das Russell’sche Paradoxon“ zeigt,
”
dass man nicht zu sorglos sein darf:
Gilt für M := {A | A Menge, A ∈
/ A} die Beziehung M ∈ M ?
Beispiel 1 : 1 ∈ N , −1 6∈ N , 1 6∈ 0.
/
Definition 1 : M und N seien Mengen. M heißt Teilmenge von N, in Zeichen
M ⊂ N oder M ⊆ N ,
wenn jedes Element von M auch Element von N ist.
M 6⊂ N
bedeutet, dass M nicht Teilmenge von N ist. Die Mengen M und N sind
gleich, in Zeichen
M=N,
wenn M ⊂ N und N ⊂ M ist. Falls M und N nicht gleich sind, schreibt man
M 6= N .
Schließlich bedeutet
M$N,
dass M ⊂ N und M 6= N ist, und man nennt M eine echte Teilmenge von
N.
Beispiel 2 : Für alle Mengen N ist N ⊆ N und 0/ ⊆ N. Es ist {a, b, c} =
{b, a, c} = {c, a, b}, beim Anschreiben der Elemente einer Menge kann die
Reihenfolge also beliebig gewählt werden.
2. Durchschnitt, Vereinigung und Komplement
Definition 2 : M und N seien Mengen. Der Durchschnitt von M und N ist
die Menge
M ∩ N := {a | a ∈ M und a ∈ N} .
Die Mengen M und N sind disjunkt, wenn ihr Durchschnitt leer ist.
Die Vereinigung von M und N ist die Menge
M ∪ N := {a | a ∈ M oder a ∈ N} ,
3
0. MENGEN UND ABBILDUNGEN
wobei mit oder“ das einschließende Oder ( und-oder“) und nicht das aus”
”
schließende Oder ( entweder-oder“) gemeint ist. Das Komplement von N in
”
M bzw. die Mengendifferenz von M und N ist
M \ N := {a | a ∈ M und a 6∈ N} .
Beispiel 3 :
{1, 2, 3} ∩ {4, 3, 5} = {3} ,
{1, 2, 3} ∪ {4, 3, 5} = {1, 2, 3, 4, 5} ,
{1, 2, 3} \ {4, 3, 5} = {1, 2} .
Definition 3 : Sind M, N und P Mengen, so bedeutet
M ∩ (N ∪ P) ,
dass zuerst die Vereinigung von N und P gebildet wird und danach der
Durchschnitt von M mit N ∪ P. Analog wird für andere Verknüpfungen die
Reihenfolge durch Klammerung festgelegt.
3. Abbildungen
M und N seien Mengen. Eine Abbildung oder Funktion von M nach N ist
eine Vorschrift, die jedem Element von M genau ein Element von N zuordnet. M heißt dann der Definitionsbereich der Abbildung, N der Bildbereich.
Die Schreibweisen
f : M → N , m 7→ f (m) ,
oder
f : M −→
N
m 7→ f (m)
bedeuten, dass f eine Abbildung von M nach N ist, die dem Element m ∈
M das Element f (m) ∈ N zuordnet. Das Element f (m) heißt Bild von m
(bezüglich f ). Ein Element m ∈ M mit f (m) = n ∈ N heißt ein Urbild von
n (bezüglich f ).
Beispiel 4 : Die Abbildung
f : N → Z , z 7→ 2z − 3 ,
ordnet jeder natürlichen Zahl z die ganze Zahl 2z − 3 zu. Das Bild von 0
bzw. 1 bzw. 2 bezüglich f ist −3 bzw. −1 bzw. 1.
Definition 4 : Seien f : M → N und g : P → Q Abbildungen. Dann sind f
und g gleich, in Zeichen
f = g,
wenn gilt: M = P, N = Q und für alle m ∈ M ist f (m) = g(m).
4
0. MENGEN UND ABBILDUNGEN
Definition 5 : Sei M eine beliebige Menge. Dann heißt die Abbildung
IdM : M → M , m 7→ m ,
die identische Abbildung oder Identität auf M.
Definition 6 : Seien f : M → N eine Abbildung, A ⊂ M und B ⊂ N. Dann
heißt
f (A) := { f (a) | a ∈ A} ⊂ N
das Bild von A (bezüglich f ),
Bild( f ) := f (M)
heißt das Bild von f , und
f −1 (B) := {m ∈ M | f (m) ∈ B}
heißt das Urbild von B (bezüglich f ). Die Abbildung
f |A : A → N, a 7→ f (a),
heißt die Einschränkung von f auf A. Man sagt f bildet A auf B ab“, wenn
”
f (A) = B ist.
Definition 7 : Seien f : M → N und g : P → Q Abbildungen mit
Dann heißt die Abbildung
Bild( f ) ⊂ P .
g ◦ f : M → Q, m 7→ g( f (m)),
die Hintereinanderausführung oder Zusammensetzung von f und g (sprich
g nach f“). Oft wird statt g ◦ f nur g f geschrieben.
”
Beispiel 5 : Die Hintereinanderausführung von
und
ist
f : N → Z , z 7→ 2z + 1 ,
g : Z → Z , z 7→ 3z − 7 ,
g f : N → Z , z 7→ 6z − 4 .
Satz 1 : Seien f : M → N, g : P → Q und h : R → S Abbildungen mit
Bild( f ) ⊂ P und Bild(g) ⊂ R. Dann gilt
h ◦ (g ◦ f ) = (h ◦ g) ◦ f =: h ◦ g ◦ f ,
d.h. bei mehrfacher Hintereinanderausführung von Abbildungen kommt es
nicht auf die Reihenfolge an (die Hintereinanderausführung von Abbildungen ist assoziativ, auf das Setzen von Klammern kann verzichtet werden).
5
0. MENGEN UND ABBILDUNGEN
Beweis: Sowohl h ◦ (g ◦ f ) als auch (h ◦ g) ◦ f sind Abbildungen von M
nach S. Für jedes m ∈ M ist
(h ◦ (g ◦ f ))(m) = h((g ◦ f )(m)) = h(g( f (m))) = (h ◦ g)( f (m))
= ((h ◦ g) ◦ f )(m).
Definition 8 : Eine Abbildung f : M → N heißt injektiv bzw. surjektiv,
wenn jedes Element von N höchstens bzw. mindestens ein Urbild hat. Eine
Abbildung f : M → N heißt bijektiv, wenn jedes Element von N genau ein
Urbild hat.
Wenn f : M → N bijektiv ist, dann heißt die (ebenfalls bijektive) Abbildung
f −1 : N → M, n 7→ Urbild von n bezüglich f ,
die zu f inverse Abbildung oder die Umkehrabbildung von f .
Eine Abbildung ist also genau dann bijektiv, wenn sie sowohl injektiv
als auch surjektiv ist. Eine Abbildung ist genau dann surjektiv, wenn ihr Bild
und ihr Bildbereich gleich sind. Eine Abbildung ist genau dann injektiv,
wenn die Bilder von je zwei verschiedenen Elementen wieder verschieden
sind.
Definition 9 : Eine Menge M heißt endlich, wenn sie leer ist oder es ein
n ∈ N und eine bijektive Abbildung f : {1, . . ., n} → M gibt. Man nennt
dann
#(M) := n
die Anzahl der Elemente von M. Die leere Menge hat 0 Elemente.
M heißt unendlich, wenn M nicht endlich ist.
4. Familien, Tupel, Folgen und kartesisches Produkt
Eine Abbildung f : I → M wird manchmal in der Form
( f (i))i∈I
oder
( fi )i∈I
geschrieben und als Familie von Elementen in M, indiziert durch I, bezeichnet. I heißt dann die Indexmenge der Familie ( f i )i∈I . Die Familie ( fi )i∈I
heißt endlich, wenn I endlich ist.
Wichtige Spezialfälle sind:
(1) Eine Abbildung x : {1, 2, . . ., n} → M , i 7→ x(i) , wird in der Form
(x1 , . . ., xn ) = (xi )1≤i≤n = (xi )i∈{1,...,n}
geschrieben und heißt ein n-Tupel von Elementen in M. Das Element
xi heißt dann i-te Komponente von (x1 , . . . , xn ). In den Spezialfällen
6
0. MENGEN UND ABBILDUNGEN
n = 2, 3 nennt man (x1 , . . ., xn ) ein Paar bzw. Tripel. Die Menge aller
n-Tupel von Elementen in M wird mit
Mn
bezeichnet (sprich M hoch n“). Für x, y ∈ M n gilt
”
x=y
genau dann, wenn xi = yi für i = 1, . . ., n ist.
Ein Paar (a, b) enthält mehr Information“ als die Menge
”
{a, b}. Es ist {a, b} = {b, a}, aber (a, b) = (b, a) nur dann, wenn
a = b ist.
(2) Seien m ∈ N und I := {i ∈ N | i ≥ m}. Eine Abbildung
x : I → M , i 7→ x(i) , wird in der Form
(xi )i≥m
geschrieben und heißt eine Folge in M.
Man beachte, dass (xi )i≥m 6= {xi | i ≥ m} ist.
Definition 10 : M und N seien Mengen. Dann heißt
M × N := {(x, y) | x ∈ M und y ∈ N} ⊆ (M ∪ N)2
das kartesische Produkt von M und N. Die Abbildungen
pr1 : M × N → M , (x, y) 7→ x ,
und
pr2 : M × N → N , (x, y) 7→ y ,
heißen Projektionen auf den ersten bzw. zweiten Faktor.
Definition 11 : Sei f : M → N eine Abbildung. Dann heißt die Menge
Graph( f ) := {(m, f (m)) | m ∈ M} ⊆ M × N
der Graph von f .
Satz 2 : Zwei Abbildungen von M nach N sind genau dann gleich, wenn
ihre Graphen gleich sind.
Beweis: Es ist zu zeigen:
1. Wenn zwei Abbildungen von M nach N gleich sind, dann sind auch
ihre Graphen gleich.
2. Wenn die Graphen zweier Abbildungen von M nach N gleich sind,
dann sind diese zwei Abbildungen gleich.
Seien f und g Abbildungen von M nach N.
Zu 1): Wenn f = g ist, dann ist f (m) = g(m) für alle m ∈ M. Daher ist
Graph( f ) = {(m, f (m)) | m ∈ M} =
= {(m, g(m)) | m ∈ M} = Graph(g) .
7
0. MENGEN UND ABBILDUNGEN
Zu 2): Wenn Graph( f ) = Graph(g) ist, dann ist für alle m ∈ M das Paar
(m, f (m)) ein Element von Graph(g). In Graph(g) gibt es genau ein Element, dessen erste Komponente m ist, nämlich (m, g(m)). Also ist f (m) =
g(m) für alle m ∈ M, somit ist f = g.
Definition 12 : Sei (Mi )i∈I eine Familie von Mengen. Dann heißt
∏ Mi := {(xi)i∈I | für alle i ∈ I ist xi ∈ Mi}
i∈I
das kartesische Produkt der Mengen Mi , i ∈ I. Für j ∈ I heißt
pr j : ∏ Mi → M j , (xi )i∈I 7→ x j ,
i∈I
die Projektion auf den j-ten Faktor.
Im Spezialfall I = {1, . . . , n} wird für ∏i∈I Mi auch
n
∏ Mi
i=1
geschrieben.
oder
M1 × . . . × Mn
8
0. MENGEN UND ABBILDUNGEN
5. Zusammengesetzte Aussagen
Wir betrachten Aussagen A, B,C, . . . , die nach Vereinbarung entweder
wahr oder falsch sind. Mit Hilfe der Worte
und“
(Zeichen: ∧) ,
”
oder“
(Zeichen: ∨) ,
”
nicht“
(Zeichen: ¬) ,
”
wenn, dann“
(Zeichen: ⇒) ,
”
genau dann, wenn“ (Zeichen: ⇔)
”
bilden wir zusammengesetzte Aussagen, deren Wahrheitswert“ wir durch
”
die folgende Tabelle definieren. Dabei steht w für wahr“ und
”
f für falsch“.
”
A B A ∧ B A ∨ B ¬A A ⇒ B A ⇔ B
w w
w
w
f
w
w
w f
f
w
f
f
f
f w
f
w
w
w
f
f f
f
f
w
w
w
Für A ⇒ B verwendet man statt wenn A, dann B“ auch die Sprechwei”
sen aus A folgt B“ oder A impliziert B“.
”
”
Man beachte:
A ist genau dann wahr, wenn ¬A falsch ist. Das wird für indirekte Beweise
verwendet: anstatt zu zeigen, dass eine Aussage A wahr ist, wird gezeigt,
dass ihr Gegenteil“ ¬A falsch ist.
”
In der Mathematik bedeutet das Wort oder“ immer das nicht ausschließen”
de und-oder“ und nicht das ausschließende entweder-oder“.
”
”
Ist A falsch, dann ist die Aussage A ⇒ B immer wahr ( ex falso quodlibet“).
”
6. Der Induktionsbeweis
Sei m eine natürliche Zahl (meistens 0 oder 1) und sei
(Am , Am+1 , Am+2 , . . .) eine Folge von Aussagen.
Satz 3 : Wenn
(1) Am wahr ist und
(2) für alle n > m aus An−1 auch An folgt,
dann sind alle Aussagen An , n ≥ m , wahr.
Damit erhält man eine Methode, die Gültigkeit der Aussagen An , n ≥ m,
zu zeigen ( Beweis durch vollständige Induktion“): Es genügt zu zeigen,
”
dass (1) ( Induktionsanfang“) und (2) ( Induktionsschluss“) richtig sind.
”
”
Um zu zeigen, dass (2) richtig ist, nimmt man an, dass An−1 wahr ist ( In”
duktionsannahme“) und versucht damit zu zeigen, dass auch A n wahr ist.
Man könnte im Satz die Annahme (2) auch durch
(2’) für alle n > m aus Am , Am+1 , . . . , An−1 auch An folgt,
9
0. MENGEN UND ABBILDUNGEN
ersetzen.
Beweis: Wir benutzen die folgende Eigenschaft der natürlichen Zahlen: jede Teilmenge von N hat ein kleinstes Element. Wir führen den Beweis indirekt und nehmen an, dass nicht alle Aussagen An , n ≥ m , wahr sind. Dann
ist die Menge
M := {n ∈ N | n ≥ m und An ist falsch}
nicht leer. Daher gibt es eine kleinste Zahl k so, dass k ≥ m und Ak falsch
ist. Wegen (1) gilt k ≥ m + 1 , also k − 1 ≥ m. Weiters muss Ak−1 wahr sein,
weil k die kleinste Zahl in M ist. Aus (2) folgt nun, dass auch Ak wahr ist,
was einen Widerspruch bedeutet. Somit muss unsere Annahme am Anfang
des Beweises falsch sein, d.h. alle Aussagen An , n ≥ m , sind wahr.
Satz 4 : Sei n eine natürliche Zahl. Die Summe der Quadrate aller natürlichen Zahlen von 1 bis n ist S(n) := 61 (2n3 + 3n2 + n).
Beweis: Induktionsanfang: S(1) = 61 (2 + 3 + 1) = 1 = 12 , also ist die Aussage für n = 1 wahr.
Induktionsschluss: Wir nehmen an, dass die Summe der Quadrate aller natürlichen Zahlen von 1 bis n − 1 gleich S(n − 1) ist. Die Summe der Quadrate
aller natürlichen Zahlen von 1 bis n ist dann
Wegen
S(n − 1) + n2 .
1
S(n − 1) + n2 = (2(n − 1)3 + 3(n − 1)2 + n − 1) + n2 = S(n)
6
ist die Behauptung richtig.
KAPITEL 1
Rechnen mit ganzen und rationalen Zahlen
1. Rechenregeln für ganze Zahlen
Wir setzen die Menge Z := {. . ., −2, −1, 0, 1, 2, . . .} der ganzen Zahlen
mit der Addition Z × Z −→ Z , (a, b) 7−→ a + b, und der Multiplikation Z × Z −→ Z , (a, b) 7−→ a · b, als bekannt voraus. Dabei gelten die
folgenden Rechenregeln: Sind a, b, c ganze Zahlen, dann ist
• (a + b) + c = a + (b + c) =: a + b + c ( Die Addition von ganzen Zah”
len ist assoziativ“, das heißt: auf Klammern kann verzichtet werden).
• 0+a = a+0 = a
• a + (−a) = (−a) + a = 0 (dabei ist −a := (−1) · a)
• a + b = b + a ( Die Addition ist kommutativ“).
”
• (a · b) · c = a · (b · c) =: a · b · c ( Die Multiplikation ist assoziativ“).
”
• 1·a = a·1 = a
• a · b = b · a ( Die Multiplikation ist kommutativ“).
”
• (a + b) · c = (a · c) + (b · c) =: a · c + b · c ( Distributivgesetz“)
”
Sind m, n ∈ Z , m ≤ n und am , am+1 , . . . , an ∈ Z , dann schreiben wir
n
∑ ai
i=m
für am + am+1 + . . . + an und
n
∏ ai
i=m
für am · am+1 · . . . · an . (Sprechweise: Die Summe bzw. das Produkt aller ai
”
mit i von m bis n“).
Man prüft leicht nach:
Seien p, q ∈ Z , p ≤ q und b p , . . . , bq ∈ Z . Dann gilt
!
!
!
!
n
∑ ai ·
i=m
q
∑ bj
j=p
n
=
∑
i=m
q
∑ ai b j
j=p
=
q
n
j=p
i=m
∑ ∑ ai b j
.
Für a, b, c ∈ Z mit c 6= 0 folgt aus a · c = b · c, dass a = b ist. ( In Z kann
”
gekürzt werden“). Insbesondere folgt aus a · b = 0, dass a = 0 oder b = 0
ist.
Die Subtraktion ist durch Z × Z −→ Z , (a, b) 7−→ a − b := a + (−b),
gegeben.
Es sei ≤ die durch
a ≤ b :⇔ b − a ∈ N
10
11
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
definierte natürliche Ordnung der ganzen Zahlen, wir schreiben a < b für:
a ≤ b und a 6= b.
Für a, b, c ∈ Z gilt:
a≤a ,
aus a ≤ b und b ≤ a folgt a = b ,
aus a ≤ b und b ≤ c folgt a ≤ c ,
a ≤ b oder b ≤ a ,
a ≤ b genau dann, wenn a + c ≤ b + c ist
und
wenn c > 0 ist, dann ist a ≤ b genau dann, wenn a · c ≤ b · c ist.
Die ersten vier Eigenschaften bedeuten, dass ≤ eine totale Ordnung auf Z
ist, die letzten zwei, dass diese mit Addition und Multiplikation vertr äglich
ist.
Das Vorzeichen vz(a) einer ganzen Zahl a ist 1, wenn a ∈ N , und −1, wenn
a 6∈ N . Der Betrag |a| einer ganzen Zahl a ist vz(a) · a. Für Zahlen a, b ∈ Z
ist |a · b| = |a| · |b| und |a + b| ≤ |a| + |b|.
Eine ganze Zahl ist positiv bzw. negativ, wenn sie größer bzw. kleiner als 0
ist.
2. Division mit Rest
Wenn Sie einen Sack mit a Euromünzen haben, die Sie an b Personen
verteilen sollen (jede soll gleich viel bekommen), dann werden Sie wahrscheinlich zuerst jeder Person einen Euro geben und diesen Vorgang solange wiederholen, bis im Sack weniger als b Euromünzen sind. Sie haben
dann a mit Rest durch b dividiert.
Der folgende Satz ist grundlegend für alle Rechenverfahren für ganze Zahlen. Seine Bedeutung liegt darin, dass die drei Strukturen“ +, · und ≤
”
zueinander in Beziehung gesetzt werden.
Satz 5 : (Division mit Rest von ganzen Zahlen)
Zu je zwei ganzen Zahlen a und b mit b 6= 0 gibt es eindeutig bestimmte
ganze Zahlen m und r mit den Eigenschaften
a = m·b+r
und 0 ≤ r < |b| .
Die Zahlen m bzw. r heißen ganzzahliger Quotient von a und b bzw. Rest
von a nach Division durch b. Die Zahlen m und r können mit dem folgenden
Verfahren (Divisionsalgorithmus) berechnet werden:
• Falls a und b natürliche Zahlen sind:
Setze m := 0 und r := a.
Solange r ≥ b ist, ersetze r durch r − b und m durch m + 1.
• Falls a < 0 oder b < 0 ist:
Berechne wie oben n und s so, dass |a| = n · |b| + s und
0 ≤ s < |b| ist.
Wenn a ≥ 0 ist, dann setze m := −n und r := s.
12
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Wenn a < 0 und s > 0 ist, dann setze m := −vz(b) · (n + 1) und r :=
|b| − s.
Wenn a < 0 und s = 0 ist, dann setze m := −vz(b) · n und r := 0.
Beweis: Wenn a und b natürliche Zahlen sind, dann erhalten wir bei jedem
Ersetzen von r durch r − b eine um mindestens 1 kleinere Zahl. Also tritt
nach höchstens a Schritten der Fall r < b ein. Somit liefert das obige Verfahren nach endlich vielen Schritten ein Ergebnis m, r. Mit Induktion über
|a| ist leicht nachzuprüfen, dass diese Zahlen die angegebenen Bedingungen erfüllen.
Es seien m1 , m2 , r1 , r2 ganze Zahlen mit a = m1 · b + r1 = m2 · b + r2 , 0 ≤
r1 , r2 < |b| und o.E.d.A. ( ohne Einschränkung der Allgemeinheit“) r1 ≤ r2 .
”
Dann ist
|b| > r2 − r1 = |m1 − m2 | · |b| .
Daraus folgt m1 = m2 und r1 = r2 , also sind der ganzzahlige Quotient von
a und b und der Rest von a nach Division durch b eindeutig bestimmt.
3. Zifferndarstellung von Zahlen
Nehmen wir an, Sie kommen mit einem Sack voller Euromünzen in eine
Bank und wollen dieses Geld auf ihr Sparbuch einzahlen. Die Anzahl der
Euromünzen im Sack ist eine eindeutig bestimmte natürliche Zahl a. Bevor
diese Zahl in Ihr Sparbuch eingetragen werden kann, muss der Bankbeamte
ihre Zifferndarstellung (zur Basis 10) berechnen. Eine Zahl ist also nicht
immer schon in Zifferndarstellung gegeben, sondern diese ist eine Zusatz”
information“ über die Zahl. Wie wird die Zifferndarstellung zur Basis 10
von a ermittelt? Man bildet aus den Euromünzen solange Zehnerstapel“,
”
bis nur noch weniger als zehn Münzen übrigbleiben, das heißt: a wird mit
Rest durch 10 dividiert. Die Anzahl der übriggebliebenen Euromünzen ist
dann die Einerziffer“ von a. Macht man dasselbe nun mit den Zehner”
stapeln statt mit den Münzen, dann erhält man die Zehnerziffer“ von a,
”
usw.
Satz 6 : (Darstellung von Zahlen durch Ziffern)
Es seien a und b natürliche Zahlen mit a 6= 0 und b ≥ 2. Dann gibt es
eindeutig bestimmte natürliche Zahlen n, z0 , z1 , . . ., zn so, dass
zn 6= 0, 0 ≤ z0 , z1 , . . ., zn < b
und
a = zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 =
n
∑ zi b i
i=0
ist.
Wenn b fest gewählt ist, dann ist a durch die Zahlen n, z0 , z1 , . . . , zn eindeutig
13
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
bestimmt. Man wählt Zeichen für die Zahlen von 0 bis b − 1 und schreibt
dann
n
zn zn−1 . . . z0
statt
∑ zi b i
.
i=0
Die Zahlen z0 , z1 , . . ., zn heißen Ziffern von a zur Basis b (für b=2 bzw. 10:
Binärziffern“ bzw. Dezimalziffern“).
”
”
Die Ziffern zi von a 6= 0 zur Basis b können mit dem folgenden Verfahren
berechnet werden:
• Setze i := 0.
• Solange a nicht 0 ist: Die i-te Ziffer zi ist der Rest von a nach Division
durch b. Ersetze a durch den ganzzahligen Quotienten von a und b.
Ersetze i durch i + 1.
Beweis: Induktion über a:
Wenn a = 1 ist, ist n = 0 und z0 = 1.
Für a > 1 seien m bzw. r der ganzzahlige Quotient von a und b bzw. der Rest
von a nach Division durch b. Wegen b > 1 ist m < a, also gibt es nach Induktionsannahme eindeutig bestimmte Zahlen k, y0 , y1 , . . ., yk so, dass yk 6= 0,
0 ≤ y0 , y1 , . . ., yk < b und
m = yk bk + yk−1 bk−1 + . . . + y1 b1 + y0
ist. Dann ist
a = m · b + r = yk bk+1 + yk−1 bk + . . . + y1 b2 + y0 b + r ,
und yk , . . ., y0 , r sind die Ziffern von a. Aus der Eindeutigkeit von m und
r folgt aus der Induktionsannahme die Eindeutigkeit der Ziffern von a zur
Basis b.
Wird für die Zifferndarstellung einer Zahl die Basis b gewählt, dann
können alle Zahlen durch Aneinanderreihen von b verschiedenen Symbolen
angeschrieben werden. Eine kleine Basis (zum Beispiel 2) hat den Vorteil,
dass man nur wenige Symbole braucht und dass das kleine Einmaleins“
”
sehr einfach ist. Allerdings braucht man dann für größere Zahlen sehr viele
Ziffern.
Definition 13 : Es seien v = (v1 , . . ., vn ) und w = (w1 , . . . , wn ) zwei verschiedene n-Tupel von ganzen Zahlen und j die kleinste Zahl in {1, . . ., n}
mit der Eigenschaft, dass v j 6= w j ist.
Dann ist v lexikographisch kleiner als w (Schreibweise: v <lex w), wenn
v j < w j ist.
14
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beispiel 6 : (1, 2, 3, 4) <lex (1, 2, 4, 3) <lex (2, −7, −3, −5)
Satz 7 : (Vergleich von zwei Zahlen, die durch Ziffern dargestellt sind) Es
seien b, x, y positive natürliche Zahlen, b ≥ 2 und
xk , xk−1 , . . ., x0
y` , y`−1 , . . ., y0
bzw.
die Ziffern von x bzw. y bezüglich b.
Dann ist x genau dann kleiner als y, wenn
k < ` oder
(k = ` und (xk , xk−1 , . . . , x0 ) <lex (y` , y`−1 , . . . , y0 )) ist.
Beweis: Wenn k < ` ist, dann ist
k
x = ∑ xi b ≤
i
i=0
k
∑ (b − 1)b
i
k+1
=
i=0
k
∑ b − ∑ bi = bk+1 − 1 < bk+1 ≤ y .
i
i=1
i=0
Es seien k = ` und j die größte Zahl mit der Eigenschaft, dass x j 6= y j ist.
Wenn x j < y j ist, dann ist
j
∑ xi b
j
i
i=0
≤ x j b + (b − 1) < (x j + 1)b ≤ y j b ≤ ∑ yi bi
j
j
j
i=0
und
k
x=
j
∑
i= j+1
j
xi b i + ∑ xi b i <
i=0
k
∑
i= j+1
j
xi b i + ∑ yi b i = y .
i=0
Satz 8 : (Addition von zwei Zahlen, die durch Ziffern dargestellt sind) Es
seien b, x, y, k, ` natürliche Zahlen, b ≥ 2 und
xk , xk−1 , . . ., x0
bzw.
y` , y`−1 , . . ., y0
die Ziffern von x bzw. y bezüglich b. Für je zwei Zahlen in {0, . . ., b − 1} sei
die Zifferndarstellung ihrer Summe bekannt. (Wenn diese Summe gr ößer als
b − 1 ist, dann hat sie zwei Ziffern, die erste ist 1 und die zweite ist kleiner
als b − 1 ). O.E.d.A. sei ` ≤ k.
Dann können die Ziffern von x + y mit dem folgenden Verfahren berechnet
werden:
• Ermittle die Ziffern (x0 + y0 )1 und (x0 + y0 )0 von x0 + y0 . Setze (x +
y)0 := (x0 + y0 )0 , u0 := (x0 + y0 )1 und i := 0.
• Solange i < ` ist, setze i := i + 1 und ermittle die Ziffern
(xi + yi + ui−1 )1 und (xi + yi + ui−1 )0 von xi + yi + ui−1 .
Setze (x + y)i := (xi + yi + ui−1 )0 und ui := (xi + yi + ui−1 )1 ( i-ter
”
Übertrag“).
• Solange i < k ist, setze i := i + 1 und ermittle die Ziffern
(xi + ui−1 )1 und (xi + ui−1 )0 von xi + ui−1 .
Setze (x + y)i := (xi + ui−1 )0 und ui := (xi + ui−1 )1 .
• Wenn u` 6= 0 ist, setze (x + y)`+1 := u` .
15
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beweis: Übung.
Verfahren für die Subtraktion und Multiplikation können in ähnlicher
Weise angegeben werden. Hier wird nur noch das Verfahren für die Division
mit Rest in einem Satz formuliert. In Satz 5 wurde bereits ein Divisionsalgorithmus angegeben. Wenn eine Zifferndarstellung der gegebenen Zahlen
bekannt ist, kann dieses Verfahren mit Hilfe dieser zusätzlichen Information
verbessert werden.
Satz 9 : (Division mit Rest von Zahlen, die durch Ziffern dargestellt sind)
Es seien b, x, y, k, ` natürliche Zahlen, b ≥ 2, y > 0 und
xk , xk−1 , . . ., x0
bzw.
y` , y`−1 , . . ., y0
die Ziffern von x bzw. y bezüglich b. O.E.d.A. sei x ≥ y.
Die Ziffern des ganzzahligen Quotienten m von x und y können mit dem
folgenden Verfahren berechnet werden:
• Setze j := k − `, wenn ∑`i=0 xi+k−` bi ≥ y ist, und j := k − ` − 1, sonst.
• Solange j ≥ 0 ist, berechne (wie in Satz 5) den ganzzahligen Quotienten m j von ∑i≥0 xi+ j bi und y. Dieser ist die j-te Ziffer von m.
Ersetze x durch x − m j · y · b j und j durch j − 1.
Beweis: Übung.
Wenn zur Darstellung einer Zahl am Computer 32 bits (also 32 Binärziffern) zur Verfügung stehen, dann können in der Zweierkomplementdarstellung die Zahlen in
{−231 = −2147483648, . . ., −1, 0, 1, . . ., 231 − 1 = 2147483647}
(also insgesamt 232 Zahlen) dargestellt werden.
Ist a eine natürliche Zahl in diesem Zahlenbereich, dann wird a durch
0 a30 a29 . . . a1 a0
dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a zur Basis 2 sind.
Ist a eine negative Zahl in diesem Zahlenbereich, dann wird a durch
1 a30 a29 . . . a1 a0
dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a + 231 zur Basis 2 sind.
4. Rationale Zahlen
Es seien a und b ganze Zahlen, wobei b 6= 0 ist. Die Aufgabe Finde
”
eine Zahl z so, dass b · z = a ist“ bezeichnen wir als Gleichung“ b · x = a.
”
Eine Zahl z mit b · z = a heißt Lösung von b · x = a. Wenn |b| 6= 1 ist, dann
16
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
hat die Aufgabe b · x = 1 in Z keine Lösung. Um Lösungen zu erhalten,
müssen wir den Zahlenbereich erweitern“.
”
Die Aufgabe b · x = a wird durch das Paar (a, b) ∈ Z 2 eindeutig beschrieben, also liegt es nahe, die neuen Zahlen“ durch Paare von ganzen
”
Zahlen zu beschreiben. Allerdings sollten für t ∈ Z , t 6= 0, die Gleichungen
b · x = a und t · b · x = t · a dieselbe Lösung haben, daher sollen die Zahlenpaare (a, b) und (t · a,t · b) dieselbe neue Zahl“ beschreiben.
”
Definition 14 : Es seien a und b ganze Zahlen, wobei b 6= 0. Dann ist die
Menge
a
:= {(c, d) | c, d ∈ Z , ad = bc, d 6= 0}
b
die durch den Zähler“ a und den Nenner“ b gegebene rationale Zahl oder
”
”
Bruchzahl. (Beachte: Eine Bruchzahl ist durch Vorgabe von Zähler und
Nenner eindeutig bestimmt, aber umgekehrt sind Zähler und Nenner durch
die Bruchzahl nicht eindeutig bestimmt). Wir schreiben Q für die Menge
der rationalen Zahlen.
Für die Bruchzahl a1 schreiben wir oft nur a und fassen so Z als Teilmenge
von Q auf. ( Jede ganze Zahl ist eine rationale Zahl“).
”
Satz 10 : Es seien a0 , b0 ganze Zahlen und b0 6= 0. Dann sind die Bruchzah0
len ba und ab0 genau dann gleich, wenn a · b0 = a0 · b ist.
0
Beweis: Wenn ab = ba0 ist, dann ist insbesondere (a0 , b0 ) ∈ ab , also a · b0 =
a0 · b.
Sei umgekehrt a · b0 = a0 · b und (c, d) ∈ ab , also b · c = a · d. Dann ist zu
0
zeigen, dass (c, d) ∈ ba0 , also b0 · c = a0 · d ist.
Es ist
a · (b0 · c) = (a · b0) · c = (a0 · b) · c = a0 · (b · c) = a0 · (a · d) = a · (a0 · d) ,
also auch b0 · c = a0 · d.
Satz 11 : Für den Nenner einer Bruchzahl kann immer eine positive Zahl
gewählt werden. Dann wird die totale Ordnung ≤ auf Z durch
a c
≤ :⇔ a · d ≤ b · c
b d
zu einer totalen Ordnung auf Q erweitert.
Beweis: Zuerst ist zu zeigen, dass die Definition von ≤ nicht von der Wahl
von Zähler und positivem Nenner abhängt. Seien a, a0 , c, c0 ∈ Z und b, b0 , d, d 0
positive ganze Zahlen so, dass a · b0 = a0 · b, c · d 0 = c0 · d und a · d ≤ b · c ist.
17
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Dann ist
a0 · d 0 · b · d = a · d 0 · b 0 · d ≤ b · d 0 · b 0 · c = b 0 · c0 · b · d
und a0 · d 0 ≤ b0 · c0 .
Seien a, c, e ∈ Z , b, d, f positive ganze Zahlen so, dass ba ≤ dc und dc ≤ ef ist.
Es ist noch zu zeigen, dass dann auch ab ≤ ef ist. Aus a·d · f ≤ b·c· f ≤ b·d ·e
folgt a · f ≤ b · e und daher die Behauptung.
Wir werden nun die Rechenoperationen von Z auf Q fortsetzen.
Satz 12 : Die Abbildungen
+ : Q × Q −→ Q ,
a c
ad + bc
a c
,
( , ) 7−→ + :=
b d
b d
bd
und
a c
a c
ac
( , ) 7−→ · :=
,
b d
b d
bd
sind wohldefiniert. Diese Rechenoperationen in Q erfüllen die gleichen Rechenregeln wie Addition und Multiplikation in Z . Darüberhinaus hat jedes
Element ba ∈ Q \ {0} ein inverses Element ( ba )−1 mit der Eigenschaft
· : Q × Q −→ Q ,
a
a
( )−1 · = 1 ,
b
b
und zwar ist
a
b
( )−1 = .
b
a
Die Einschränkungen von + und · auf Z × Z stimmen mit der Addition und
der Multiplikation auf Z überein.
Beweis: Wir müssen zuerst zeigen, dass die Abbildungen + und · wohlde0
0
finiert sind, das heißt: wenn ba = ba0 und dc = dc 0 ist, dann muss auch
ad + bc a0 d 0 + b0 c0
=
bd
b0 d 0
und
a 0 c0
ac
= 0 0
bd b d
sein.
Aus a0 b = ab0 und c0 d = cd 0 folgt
(ad + bc)b0 d 0 = a0 bdd 0 + bb0 c0 d = bd(a0 d 0 + b0 c0 )
und
(ac)b0 d 0 = bd(a0 c0 ) .
Die Rechenregeln können leicht nachgeprüft werden.
18
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
5. Zifferndarstellung von rationalen Zahlen
Satz 13 : (Zifferndarstellung von rationalen Zahlen)
Es seien b, c, d, p positive ganze Zahlen mit b ≥ 2. Dann gibt es eindeutig
bestimmte natürliche Zahlen n, zn , . . . , z0 , z−1 , . . ., z−p so, dass
und
zn 6= 0 oder n = 0,
0 ≤ zn , . . . , z0 , z−1 , . . . , z−p < b
c
− (zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 + z−1 b−1 + . . . + z−p b−p ) < b−p
d
ist. Ist b fest gewählt, schreibt man
0≤
n
zn zn−1 . . . z0 .z−1 z−2 . . . z−p
statt
∑
zi b i .
i=−p
Die Zahlen zn , . . . , z0 , z−1 , . . ., z−p heißen Ziffern von a zur Basis b. Die
Ziffern zi von dc zur Basis b können wie folgt berechnet werden:
• Berechne (mit Satz 6) die Ziffern y0 , . . . , yk zur Basis b des ganzzahligen Quotienten m von c · b p und d .
• Setze zi := yi+p , −p ≤ i ≤ k − p =: n .
Beweis: Sei r der Rest von c · b p nach Division durch d. Wegen c · b p =
m · d + r ist dann
c · bp
m·d
r
=
+
,
d · bp d · bp d · bp
also
c
m r
r
= p + .b−p und
<1.
d b
d
d
Rationale Zahlen können also beliebig genau“ durch Zahlen der Form
”
zn zn−1 . . . z0 .z−1 z−2 . . .z−p angenähert werden, aber es gibt rationale Zahlen,
die für alle p von zn zn−1 . . . z0 .z−1 z−2 . . . z−p verschieden sind.
Eine rationale Zahl
z0 .z−1 z−2 . . . z−p Ee := z0 .z−1 z−2 . . . z−p · be
mit b ≥ 2 und z0 6= 0 ist in Exponentialform zur Basis b dargestellt. Die
Zahlen e und z0 .z−1 z−2 . . . z−p heißen Exponent und Mantisse.
Am Computer kann eine Zahl dann durch die Ziffern des Exponenten
und der Mantisse zur Basis 2 dargestellt werden. Die Anzahl dieser Ziffern
ist durch eine vorgegebene Zahl beschränkt. Die so am Computer verfügbaren Zahlen heißen Maschinenzahlen. Es gibt nur endlich viele Maschinenzahlen, alle Maschinenzahlen sind rationale Zahlen.
Beim Rechnen mit so dargestellten Zahlen gibt es im allgemeinen keine exakten Ergebnisse, sondern Rundungsfehler. Bei Rechenverfahren muss
daher darauf geachtet werden, dass sich die Fehler nicht akkumulieren. Fehlerabschätzungen sind erforderlich.
19
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beispiel 7 : Die Zahl 0.1 (Dezimaldarstellung) auf der Tastatur wird vom
Computer in Binärdarstellung 0.0001100110011001100 . . . umgewandelt und
zum Beispiel als
1.100110011001100110011001100110011001100 E − 4
gespeichert. Also ergibt schon die Eingabe von 0.1 einen Rundungsfehler!
Will man mit rationalen Zahlen am Computer exakt rechnen, kann man ab
als Zahlenpaar (a, b) eingeben. Dann müssen für Zahlenpaare die Rechenoperationen
(a, b) + (c, d) := (ad + bc, bd) und
definiert werden.
(a, b) · (c, d) := (ac, bd)
6. Der Euklidische Algorithmus
Es seien a, b, c ganze Zahlen und b 6= 0, c 6= 0. Dann ist
a a·c
=
∈Q.
b b·c
Der Übergang von der Darstellung dieser rationalen Zahl durch das Zahlenpaar (a · c, b · c) zu der durch (a, b) heißt durch c kürzen. Rechnet man
mit rationalen Zahlen, dann ist es sehr empfehlenswert, alle auftretenden
Brüche sofort durch möglichst große Zahlen zu kürzen. Dadurch werden
die weiteren Rechnungen oft wesentlich vereinfacht. In diesem Abschnitt
wird ein Verfahren zum optimalen Kürzen“ angegeben. Darüberhinaus
”
lernen wir ein Verfahren zur Berechnung einer Lösung einer ganzzahligen
”
linearen Gleichung“ kennen.
Definition 15 : Es seien a,b ganze Zahlen mit b 6= 0. Dann ist a Teiler von
b (oder: a teilt b), wenn es eine Zahl c ∈ Z gibt mit b = ac. Die Zahl b heißt
Vielfaches von a, wenn a ein Teiler von b ist.
Definition 16 : Der größte gemeinsame Teiler von zwei von Null verschiedenen ganzen Zahlen ist die größte ganze Zahl, die beide teilt. Das kleinste
gemeinsame Vielfache von zwei von Null verschiedenen ganzen Zahlen ist
die kleinste positive ganze Zahl, die Vielfaches von beiden ist.
Wir schreiben ggT (a, b) bzw. kgV (a, b) für den größten gemeinsamen Teiler bzw. das kleinste gemeinsame Vielfache zweier Zahlen a und b.
Hilfssatz 1 : Es seien a, b, c ∈ Z , a 6= 0, b 6= 0 und a 6= c · b. Dann ist
und
ggT (a, b) = ggT (|a|, |b|)
ggT (a, b) = ggT (a − c · b, b) .
20
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Beweis: Übung.
Satz 14 : (Euklidischer Algorithmus für ganze Zahlen)
Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Mit dem folgenden Verfahren kann der
größte gemeinsame Teiler von a und b berechnet werden:
• Ersetze a und b durch |a| und |b|.
• Solange die zwei Zahlen verschieden sind, ersetze die größere durch
die Differenz der größeren und der kleineren.
• Wenn die zwei Zahlen gleich sind, dann ist ggT (a, b) gleich dieser
Zahl.
Ersetzt man mehrfaches Abziehen derselben Zahl durch eine Division mit
Rest, dann hat dieses Verfahren die folgende Form:
• Ersetze a und b durch |a| und |b|.
• Solange keine der zwei Zahlen ein Teiler der anderen ist, ersetze die
größere der zwei Zahlen durch ihren Rest nach Division durch die
kleinere.
• Wenn eine der zwei Zahlen ein Teiler der anderen ist, dann ist sie der
ggT (a, b).
Beweis: Es ist ggT (a, b) = ggT (|a|, |b|). Also können wir annehmen, dass
a und b positive ganze Zahlen sind. Wenn sie verschieden sind, wird die
größere der zwei Zahlen (wir bezeichnen sie mit max(a, b)) im nächsten
Schritt durch eine kleinere positive ganze Zahl ersetzt. Also sind die zwei
Zahlen nach höchstens max(a, b) − 1 Schritten gleich. In jedem Schritt wird
ein Zahlenpaar durch ein anderes ersetzt, nach Lemma 1 aber so, dass die
größten gemeinsamen Teiler der zwei Zahlenpaare gleich sind. Sobald man
den größten gemeinsamen Teiler eines Zahlenpaares kennt (das ist spätestens dann der Fall, wenn die zwei Zahlen gleich sind), hat man ggT (a, b)
ermittelt.
Im Euklidischen Algorithmus wird die folgende Strategie zur Lösung
von Problemen verwendet: Wenn man eine Aufgabe nicht sofort lösen
kann, ersetzt man diese Aufgabe durch eine einfachere, die aber dieselbe
Lösungsmenge hat. Das wiederholt man solange, bis man bei einer Aufgabe landet, deren Lösungen man kennt. Diese Lösungen sind dann auch die
Lösungen der ursprünglichen Aufgabe.
Satz 15 : (Erweiterter Euklidischer Algorithmus)
Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Es gibt ganze Zahlen u, v so, dass u · a +
v · b = ggT (a, b) ist. Diese können mit dem folgenden Verfahren berechnet
werden:
21
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
• Setze A := (A1 , A2 , A3 ) := (|a|, 1, 0) ∈ Z 3 und
B := (B1 , B2 , B3 ) := (|b|, 0, 1) ∈ Z 3 .
• Solange B1 die Zahl A1 nicht teilt, berechne den ganzzahligen Quotienten m von A1 und B1 und setze C := B, B :=
A − m ·C := (A1 − m ·C1 , A2 − m ·C2 , A3 − m ·C3 ) und A := C.
• Wenn B1 die Zahl A1 teilt, dann ist u := vz(a) · B2 und v := vz(b) · B3
.
Beweis: Wenn zwei Zahlentripel S und T die Eigenschaft
S1 = |a| · S2 + |b| · S3
bzw. T1 = |a| · T2 + |b| · T3
haben, dann auch alle Tripel S − m · T mit m ∈ Z . Die ersten zwei Tripel
im Algorithmus haben diese Eigenschaft, daher auch alle anderen auftretenden Tripel. Für die ersten Komponenten der Tripel wird der euklidische
Algorithmus durchgeführt, für das letzte Tripel B gilt daher ggT (a, b) =
|a| · B2 + |b| · B3 = vz(a) · a · B2 + b · vz(b) · B3 .
Satz 16 : (Berechnung von kgV (a, b))
Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Dann ist
kgV (a, b) =
|b|
|a|
· |b| =
· |a| .
ggT (a, b)
ggT (a, b)
|a|
|b|
Beweis: Es ist klar, dass ggT (a,b) · |b| = ggT (a,b) · |a| ein Vielfaches von a
und von b ist. Sei z eine positive ganze Zahl, die Vielfaches von a und von
b ist. Dann gibt es ganze Zahlen c, d mit z = c · a und z = d · b. Nach Satz
15 gibt es Zahlen u, v so, dass u · a + v · b = ggT (a, b) ist. Dann ist
z=
=
u·a+v·b
u·a
v·b
·z =
·z+
·z =
ggT (a, b)
ggT (a, b)
ggT (a, b)
u·a·d·b v·b·c·a
a·b
+
=
· (u · d + v · c) =
ggT (a, b) ggT (a, b) ggT (a, b)
=
ein Vielfaches von
|a| · |b|
· vz(a · b) · (u · d + v · c)
ggT (a, b)
|a|
ggT (a,b)
· |b|.
Satz 17 : ( Lösen einer ganzzahligen linearen Gleichung“). Es seien a1 , . . . , an ∈
”
Z \ {0} und b ∈ Z . Die größte ganze Zahl, die a1 , . . ., an teilt, heißt größter
gemeinsamer Teiler von a1 , . . . , an und wird mit ggT (a1 , . . . , an ) bezeichnet.
Es ist
ggT (a1 , . . . , an ) = ggT (a1 , ggT (a2 , ggT (a3 , ggT (. . . , an ) . . .)) ,
22
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
also kann der größte gemeinsame Teiler von mehreren Zahlen durch sukzessives Berechnen des größten gemeinsamen Teilers von je zwei Zahlen
berechnet werden.
Es gibt genau dann ein n-Tupel (x1 , . . . , xn ) ∈ Z n mit
a1 · x1 + . . . + a n · xn = b ,
wenn b ein Vielfaches von g := ggT (a1 , . . ., an ) ist. In diesem Fall kann ein
solches n-Tupel wie folgt berechnet werden:
• Berechne mit Satz 15 Zahlen u1 , . . . , un so, dass
a1 · u1 + . . . + an · un = g ist.
• Setze xi := ui · bg , 1 ≤ i ≤ n.
Beweis: Für jedes n-Tupel (x1 , . . ., xn ) ∈ Z n wird a1 · x1 + . . . + an · xn von
g geteilt. Also ist die Bedingung, dass b ein Vielfaches von g ist, notwendig
für die Existenz einer Lösung. Wenn diese Bedingung erfüllt ist, ist leicht
nachzuprüfen, dass (u1 · bg , . . . , un · bg ) eine Lösung ist.
7. Primzahlen
Definition 17 : Eine ganze Zahl p ∈ Z heißt Primzahl, wenn
p 6= 0, p 6= 1, p 6= −1 und {1, −1, p, −p} die Menge der Teiler von p ist.
Hilfssatz 2 : Es seien p eine Primzahl und a, b ∈ Z .
Wenn p die Zahl a · b teilt, dann teilt p auch a oder b.
Beweis: Sei c eine ganze Zahl so, dass c · p = a · b ist. Wenn p die Zahl a
nicht teilt, dann ist ggT (a, p) = 1. Daher gibt es ganze Zahlen u und v so,
dass 1 = u · a + v · p ist. Dann ist
b = b · u · a + b · v · p = u · c · p + b · v · p = (u · c + b · v) · p ,
somit ist p ein Teiler von b.
Satz 18 : (Zerlegung in Primfaktoren)
Jede ganze Zahl, die größer als 1 ist, kann als Produkt von positiven Primzahlen geschrieben werden. Diese Primzahlen heißen Primfaktoren der Zahl
und sind bis auf die Reihenfolge eindeutig bestimmt.
Beweis: Es sei a eine ganze Zahl, die größer als 1 ist. Wir beweisen die
erste Aussage durch Induktion über a.
Wenn a = 2 ist, dann ist a eine Primzahl.
Wenn a > 2 ist, dann ist a entweder eine Primzahl oder es gibt ganze Zahlen
23
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
b, c mit 1 < b, c < a so, dass a = b · c ist. Nach Induktionsannahme sind b
und c Produkte von positiven Primzahlen, also auch a.
Wir beweisen noch die Eindeutigkeit der Primfaktorzerlegung. Es seien
a = p1 · p2 · . . . · pk und a = q1 · q2 · . . . · q` zwei Zerlegungen von a in Primfaktoren. Wir beweisen durch Induktion über die größere der zwei Zahlen
k, `, dass die Primfaktoren der zwei Zerlegungen bis auf die Reihenfolge
gleich sind. Weil p1 das Produkt q1 · q2 · . . . · q` teilt, gibt es nach Lemma 2
eine Zahl j ∈ {1, . . ., `} so, dass p1 = q j ist. Daher ist
p2 · . . . · pk =
∏
qi ,
1≤i≤`,i6= j
und die Behauptung folgt aus der Induktionsannahme.
Die Berechnung der Primfaktoren einer Zahl ist sehr aufwendig. Rechenverfahren, in denen Zahlen in Primfaktoren zerlegt werden müssen,
sollten nach Möglichkeit vermieden werden.
Satz 19 : Es gibt unendlich viele positive Primzahlen.
Beweis: Wenn es nur endlich viele positive Primzahlen gäbe, dann wäre
ihr Produkt q eine ganze Zahl und q + 1 wäre größer als jede Primzahl.
Insbesondere wäre q + 1 keine Primzahl. Nach Satz 18 gibt es eine Primzahl
p, die q+1 teilt. Da p auch q teilt, würde p dann auch 1 teilen, Widerspruch.
Satz 20 : (Berechnung von ggT und kgV zweier Zahlen, deren Primfaktoren bekannt sind).
Es seien p1 , . . . , pn paarweise verschiedene positive Primzahlen und e1 , . . . , en , f1 , . . ., fn
natürliche Zahlen. Mit min(ei , fi ) bzw. max(ei , fi ) bezeichnen wir die kleinere bzw. größere der zwei Zahlen ei und fi . Dann ist
n
n
i=1
i=1
n
n
i=1
i=1
n
ggT (∏ pei i , ∏ pi i ) = ∏ pi
und
f
min(ei , fi )
i=1
n
kgV (∏ pei i , ∏ pi i ) = ∏ pi
min(e , f )
f
max(ei , fi )
.
i=1
i i
. Es ist klar, dass g die Zahlen a :=
Beweis: Es sei g := ∏ni=1 pi
fi
ei
n
n
∏i=1 pi und b := ∏i=1 pi teilt. Da nach Satz 18 die Zerlegung dieser zwei
Zahlen in Primfaktoren eindeutig ist, kann ihr größter gemeinsamer Teiler
keine anderen Primfaktoren als p1 , . . ., pn enthalten. Aus demselben Grund
darf pi in ggT (a, b) nur min(ei , fi )-mal auftreten. Daher ist g = ggT (a, b).
Die Behauptung für kgV (a, b) folgt nun aus Satz 16.
24
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
8. Gruppen
Definition 18 : Seien G eine Menge und ∗ : G×G → G eine Abbildung. Für
Elemente a, b ∈ G schreiben wir statt ∗(a, b) kurz a∗b. Das Paar (G, ∗) heißt
eine Gruppe, wenn die folgenden drei Bedingungen ( Gruppen-Axiome“)
”
erfüllt sind:
(1) Für alle Elemente a, b, c ∈ G ist
a ∗ (b ∗ c) = (a ∗ b) ∗ c =: a ∗ b ∗ c (Assoziativgesetz).
(2) Es gibt ein Element e ∈ G so, dass für alle a ∈ G gilt :
a ∗ e = e ∗ a = a (e heißt dann neutrales Element in G).
(3) Für alle Elemente a ∈ G gibt es ein b ∈ G so, dass
a ∗ b = b ∗ a = e ist (b heißt dann zu a inverses Element und wird mit
a−1 bezeichnet).
Eine Gruppe (G, ∗) heißt kommutativ oder abelsch, wenn zusätzlich gilt:
(4) Für alle a, b ∈ G ist a ∗ b = b ∗ a (Kommutativgesetz).
Ist (G, ∗) eine Gruppe, dann wird die Abbildung ∗ als Gruppenverkn üpfung,
Multiplikation oder, wenn (G, ∗) abelsch ist, als Addition bezeichnet. Wenn
aus dem Zusammenhang ersichtlich ist, welche Verknüpfung auf G betrachtet wird, schreibt man statt (G, ∗) kürzer G.
Beispiel 8 : ( Z , +), ({1, −1}, ·), ( Q , +) und ( Q \ {0}, ·) sind kommutative Gruppen.
Satz 21 : Seien (G, ∗) eine Gruppe und a, b, c ∈ G. Dann gilt:
(1)
(2)
(3)
(4)
Es gibt genau ein neutrales Element in G.
Zu jedem Element in G gibt es genau ein inverses Element in G.
Es ist (a ∗ b)−1 = b−1 ∗ a−1 .
Aus a ∗ b = a ∗ c oder b ∗ a = c ∗ a folgt b = c ( In einer Gruppe
”
kann gekürzt werden“).
Beweis: (1) Seien e und e0 neutrale Elemente in G. Dann ist e0 = e ∗ e0 und
e = e ∗ e0 , also e = e0 .
(2) Seien b und b0 zu a inverse Elemente. Dann ist
b = e ∗ b = (b0 ∗ a) ∗ b = b0 ∗ (a ∗ b) = b0 ∗ e = b0 .
(3) Es ist (a ∗ b) ∗ (b−1 ∗ a−1 ) = a ∗ (b ∗ (b−1 ∗ a−1 )) =
= a ∗ ((b ∗ b−1 ) ∗ a−1 ) = a ∗ (e ∗ a−1 ) = a ∗ a−1 = e und
(b−1 ∗ a−1 ) ∗ (a ∗ b) = b−1 ∗ (a−1 ∗ (a ∗ b)) = b−1 ∗ ((a−1 ∗ a) ∗ b) =
b−1 ∗ (e ∗ b) = b−1 ∗ b = e.
(4) Aus a ∗ b = a ∗ c folgt b = a−1 ∗ a ∗ b = a−1 ∗ a ∗ c = c.
25
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Definition 19 : Seien (G, ∗) eine Gruppe, m, n ∈ Z und
am , am+1 , . . ., an ∈ G. Dann ist für n > m
n
∏ ai := am ∗ am+1 ∗ . . . ∗ an := (. . . ((am ∗ am+1) ∗ am+2) ∗ . . . ∗ an−1 ) ∗ an .
i=m
Sprechweise: Das Produkt aller ai mit i von m bis n. Die Elemente am , am+1 , . . . , an
heißen Faktoren von ∏ni=m ai .
Für n = m setzt man
m
∏ ai := am ,
i=m
und für n < m vereinbart man
n
∏ ai := e
i=m
( leeres Produkt“), wobei e das neutrale Element von G ist.
”
Wenn (G, ∗) kommutativ ist, wird oft + statt ∗, −a statt a−1 und
n
n
∑ ai
i=m
statt
∏ ai
i=m
geschrieben. Sprechweise: Die Summe aller ai mit i von m bis n. Die Elemente am , am+1 , . . . , an heißen dann Summanden von ∑ni=m ai .
Hilfssatz 3 : Seien (G, ∗) eine Gruppe, m, k, n ∈ Z , m < k < n und a m , am+1 , . . ., an ∈
G. Dann gilt
(am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an ) = am ∗ am+1 ∗ . . . ∗ an .
Beweis: Wir beweisen die Behauptung durch Induktion nach n − k, der Anzahl der Faktoren von ak+1 ∗ . . . ∗ an . Für n − k = 1 ist sich die Behauptung (am ∗ . . . ∗ an−1 ) ∗ an = am ∗ . . . ∗ an , was nach Definition des Produktes
am ∗ . . . ∗ an−1 ∗ an richtig ist.
Sei nun n − k > 1. Aus dem Assoziativgesetz und der Induktionsannahme
(am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an−1 ) = am ∗ am+1 ∗ . . . ∗ an−1
folgt
(am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an ) = (am ∗ . . . ∗ ak ) ∗ ([ak+1 ∗ . . . ∗ an−1 ] ∗ an ) =
([am ∗ . . . ∗ ak ] ∗ [ak+1 ∗ . . . ∗ an−1 ]) ∗ an = (am ∗ am+1 ∗ . . . ∗ an−1 ) ∗ an =
am ∗ am+1 ∗ . . . ∗ an .
Satz 22 : (Allgemeines Assoziativgesetz)
Seien (G, ∗) eine Gruppe, s eine positive ganze Zahl, m, k1 , . . . , ks , n ganze
26
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Zahlen mit m < k1 < k2 < . . . ks < n und am , am+1 , . . . , an ∈ G. Dann gilt
(am ∗ . . . ∗ ak1 ) ∗ (ak1 +1 ∗ . . . ∗ ak2 ) ∗ . . . ∗ (aks +1 ∗ . . . ∗ an ) =
= am ∗ . . . ∗ a n ,
d.h. auf die Reihenfolge des Ausführens der Gruppenverknüpfung bei der
Berechnung von ∏ni=m ai kommt es nicht an, die Klammern können also
weggelassen werden.
Beweis: Wir beweisen die Behauptung durch Induktion nach s.
Für s = 1 folgt die Behauptung aus Lemma 3.
Sei s > 1. Nach Induktionsannahme und Lemma 3 ist dann
(am ∗ . . . ∗ ak1 ) ∗ (ak1 +1 ∗ . . . ∗ ak2 ) ∗ . . . ∗ (aks +1 ∗ . . . ∗ an ) =
[(am ∗. . .∗ak1 )∗(ak1 +1 ∗. . .∗ak2 )∗. . .∗(aks−1 +1 ∗. . .∗aks )]∗(aks +1 ∗. . .∗an ) =
= (am ∗ . . . ∗ aks ) ∗ (aks+1 ∗ . . . ∗ an ) = am ∗ . . . ∗ an .
Satz 23 : (Allgemeines Kommutativgesetz)
Seien (G, +) eine kommutative Gruppe, m, n ∈ Z mit n > m,
am , am+1 , . . ., an ∈ G und f eine bijektive Abbildung von
{m, m + 1, . . ., n} nach {m, m + 1, . . ., n}. Dann gilt
n
∑ ai =
i=m
n
∑ a f (i) ,
i=m
d.h. auf die Reihenfolge der Summanden kommt es bei der Berechnung von
∑ni=m ai nicht an, sie können beliebig umgeordnet werden.
Beweis: Wir beweisen die Behauptung durch Induktion nach n − m. Für
n − m = 1 ist die Behauptung richtig, weil die Gruppe kommutativ ist. Sei
nun n − m > 0. Wenn f (n) = n ist, dann folgt
n
n−1
i=m
i=m
∑ a f (i) = ( ∑ a f (i)) + an
und nach Induktionsannahme die Behauptung, weil die Einschränkung von
f auf {m, m + 1, . . ., n − 1} eine bijektive Abbildung nach
{m, m + 1, . . ., n − 1} ergibt.
Im anderen Fall ist f (n) < n. Sei k ∈ {m, m + 1, . . ., n} so, dass
f (k) = n
ist. Weil G kommutativ ist, ist
n
k−1
n
i=m
i=m
i=k+1
∑ a f (i) = ∑ a f (i) + an + ∑
a f (i) =
27
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
k−1
=
∑ a f (i) +
i=m
n−1
n
∑
a f (i) + an =
∑ ag(i) + an ,
i=m
i=k+1
wobei g die durch
g(i) := f (i), falls m ≤ i < k, und g(i) := f (i + 1), falls k ≤ i < n,
definierte bijektive Abbildung von {m, m + 1, . . ., n − 1} nach
{m, m + 1, . . ., n − 1} ist. Nach Induktionsannahme ist
n−1
n−1
i=m
i=m
∑ ag(i) =
∑ ai ,
also ist
n
n−1
i=m
i=m
∑ a f (i) =
∑ ag(i) + an =
n
∑ ai .
i=m
Definition 20 : Seien I eine endliche Menge, (G, +) eine kommutative Gruppe und (ai )i∈I eine Familie von Elementen in G. Dann ist
n
∑ ai := ∑ a f (i) ∈ G ,
i∈I
i=1
wobei f eine bijektive Abbildung von {1, 2, . . ., n := #(I)} nach I ist.
Nach Satz 23 hängt ∑i∈I ai nicht von der Wahl der bijektiven Abbildung f
ab.
Beispiel 9 : Sei I := {(0, 2), (1, 1), (2, 0)}, (G, +) := ( Z , +) und
a(0,2) := 3, a(1,1) := 4, a(2,0) := 1. Sei f die bijektive Abbildung von {1, 2, 3}
nach I mit f (1) = (1, 1), f (2) = (0, 2), f (3) = (2, 0). Dann ist
∑ ai = a(1,1) + a(0,2) + a(2,0) = 4 + 3 + 1 = 8 .
i∈I
9. Ringe und Körper
Definition 21 : Seien R eine Menge und + : R × R → R sowie
· : R × R → R Abbildungen. Wir schreiben statt +(a, b) kurz a + b“ und
”
statt ·(a, b) kurz a · b“ oder ab“. Das Tripel (R, +, ·) heißt ein Ring, wenn
”
”
die folgenden Bedingungen ( Ring-Axiome“) erfüllt sind:
”
(1) (R, +) ist eine abelsche Gruppe.
(2) Für alle a, b, c ∈ R ist (ab)c = a(bc) (Assoziativgesetz).
(3) Es gibt ein Element e ∈ R so, dass für alle a ∈ R gilt :
ea = ae = a (e heißt dann Einselement und wird mit 1R bezeichnet).
(4) Für alle a, b, c ∈ R ist a(b + c) = (ab) + (ac) und
(a + b)c = (ac) + (bc) (Distributivgesetz).
Ein Ring (R, +, ·) heißt kommutativ, wenn zusätzlich gilt:
28
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
(5) für alle a, b ∈ R ist ab = ba (Kommutativgesetz).
Ist (R, +, ·) ein Ring, dann heißt + die Addition und · die Multiplikation
des Ringes. Das neutrale Element von (R, +) heißt Nullelement und wird
0R geschrieben. Das zu a ∈ R bezüglich + inverse Element wird mit −a
bezeichnet. Die Subtraktion ist dann definiert durch
a − b := a + (−b).
Um Klammern einzusparen, wird verabredet, dass die Multiplikation immer
vor der Addition ausgeführt wird, ausgenommen bei gegenteiliger Klammerung. Zum Beispiel wird (ab) + c abgekürzt als ab + c.
Wenn aus dem Zusammenhang ersichtlich ist, welche Addition und
Multiplikation auf der Menge R betrachtet werden, so schreibt man statt
(R, +, ·) kurz R.
Beispiel 10 : ( Z , +, ·) und ( Q , +, ·) sind kommutative Ringe.
Definition 22 : Ein Element a eines Ringes R mit Einselement 1R ist invertierbar, wenn es ein Element b ∈ R mit
ab = 1R = ba
gibt. Das Element b heißt dann zu a (bezüglich ·) inverses Element und wird
mit a−1 bezeichnet.
Satz 24 : Die Menge aller invertierbaren Elemente eines Ringes R ist mit
der Multiplikation von R eine Gruppe. Das Einselement von R ist das neutrale Element dieser Gruppe. Für invertierbare Elemente a, b ∈ R ist
(ab)−1 = b−1 a−1
und (a−1 )−1 = a .
Beweis: Es ist
(ab)(b−1 a−1 ) = a(bb−1 )a−1 = 1 = b−1 (a−1 a)b = (b−1 a−1 )(ab) .
Definition 23 : Sei (R, +, ·) ein kommutativer Ring mit mindestens zwei
Elementen. R heißt ein Körper, wenn jedes Element von R \ {0} invertierbar
ist. Die Division in R ist dann durch
a/b := ab−1
definiert.
Beispiel 11 : ( Q , +, ·) ist ein Körper. Der Ring ( Z , +, ·) der ganzen Zahlen
ist kein Körper.
29
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Als Merkregel für diese Definitionen gilt: In einem Ring kann addiert, subtrahiert und multipliziert werden. In einem Körper kann zusätzlich noch
durch Elemente ungleich null dividiert werden. Die Ring-Axiome sind den
Rechenregeln für ganze Zahlen nachgebildet.
Satz 25 : Seien (R, +, ·) ein Ring und a, b, c ∈ R. Dann gilt:
(1)
(2)
(3)
(4)
Aus a + b = a + c folgt b = c.
0R · a = a · 0 R = 0R
(−a) · b = a · (−b) = −(a · b)
(−a) · (−b) = a · b.
Wenn R ein Körper und a 6= 0 ist, dann gilt:
(5) Aus a · b = a · c folgt b = c.
Beweis: (1) folgt nach Satz 21 durch Kürzen in der Gruppe (R, +).
(2) Aus 0R + 0R · a = 0R · a = (0R + 0R ) · a = 0R · a + 0R · a folgt nach (1),
dass 0R = 0R · a ist. Analog beweist man die zweite Behauptung.
(3) Aus (−a) · b + a · b = (−a + a) · b = 0R · b = 0R folgt (−a) · b = −(a · b).
Analog beweist man die zweite Behauptung.
(4) Nach (3) ist (−a) · (−b) = −(a · (−b)) = −(−(a · b)) = a · b .
(5) Aus a · b = a · c erhält man durch Multiplikation mit a−1 auf beiden
Seiten a−1 · a · b = a−1 · a · c und schließlich b = c.
Hilfssatz 4 : Seien R ein Ring, k eine positive ganze Zahl und
c, d1 , . . . , dk ∈ R. Dann gilt
!
!
k
k
c·
∑ di
=
∑ c · di und
i=1
i=1
k
k
i=1
i=1
∑ di · c = ∑ di · c .
Beweis: Wir zeigen die erste Behauptung durch Induktion nach k. Für k = 1
ist nichts zu zeigen. Sei nun k > 1 und die Behauptung gelte für k − 1. Dann
folgt mit Hilfe des Distributivgesetzes
!
!
!
∑ di
i=1
k−1
k−1
k
c·
= c·
∑ di + d k
i=1
k−1
=
!
∑ c · di + c · d k =
i=1
∑ di
= c·
i=1
k
∑ c · di .
i=1
Die zweite Behauptung wird analog bewiesen.
+ c · dk =
30
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Satz 26 : (Allgemeines Distributivgesetz)
Seien R ein Ring, m, n ∈ N und a1 , . . ., am , b1 , . . . , bn ∈ R. Dann gilt
!
!
!
!
i=1
·
n
m
n
m
∑ ai
∑ ai · b j
=∑
∑ bj
j=1
i=1
j=1
=
n
m
j=1
i=1
∑ ∑ ai · b j
Beweis: Sei a := ∑m
i=1 ai ∈ R. Nach Hilfssatz 4 ist
!
!
n
a·
∑ bj
=
j=1
n
n
m
j=1
j=1
i=1
∑ a · b j = ∑ ∑ ai
·bj =
n
m
j=1
i=1
.
∑ ∑ ai · b j
!
.
Seien I und J endliche Mengen, R ein Ring und (ai )i∈I , (b j ) j∈J Familien
in R. Mit der Schreibweise von Definition 20 erhält man aus Satz 26:
!
!
!
!
∑ ai
i∈I
·
∑ bj
=∑
j∈J
=
i∈I
∑
(i, j)∈I×J
∑ ai · b j
=
j∈J
ai · b j =:
∑
i∈I, j∈J
∑ ∑ ai · b j
j∈J
=
i∈I
ai · b j .
10. Restklassen
Sei n eine positive ganze Zahl.
Definition 24 : Für a ∈ Z heißt die Menge
ā := {a + z · n | z ∈ Z }
Restklasse von a modulo n. Die Menge
¯ 1,
¯ . . . , n − 1}
{ ā | a ∈ Z } = {0,
wird mit
Zn
(Sprechweise: Z modulo n) bezeichnet. Zwei ganze Zahlen a und b sind
zueinander kongruent modulo n (Schreibweise: a ≡ b mod (n) ), wenn sie
in derselben Restklasse modulo n liegen.
Satz 27 : Für ā,b¯∈ Z n ist
ā =b¯ oder ā ∩b¯= 0/ .
Beweis: Sei ā ∩b¯6= 0.
/ Dann gibt es Zahlen x, y ∈ Z so, dass a + xn = b + yn
ist. Dann ist für alle z ∈ Z
¯
a + zn = b + (y − x + z)n ∈ b¯ (also ā ⊆b)
31
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
und
b + zn = a + (x − y + z)n ∈ ā (alsob¯⊆ ā).
Satz 28 : Seien a, b ganze Zahlen und ā,b¯die Restklassen von a, b modulo
n.
Dann ist ā =b¯genau dann, wenn die Reste von a und b nach Division durch
n gleich sind.
Beweis: Sei r bzw. s der Rest von a bzw. b nach Division durch n. Es ist
¯
r ∈ ā und s ∈b.
Wenn r = s ist, folgt aus Satz 27, dass ā =b¯ist.
Wenn ā =b¯ist, gibt es eine ganze Zahl z mit b = a + zn. Also ist r = s.
32
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
Satz 29 : Die Abbildungen
und
+ : Z n × Z n −→ Z n ,
¯ 7−→ ā +b¯:= a + b
( ā,b)
¯ 7−→ ā ·b¯:= ab
· : Z n × Z n −→ Z n , ( ā,b)
sind wohldefiniert. Mit diesen Rechenoperationen ist Z n ein kommutativer
Ring. Das Nullelement bzw. Einselement von Z n ist
0¯= {z · n | z ∈ Z } bzw. 1¯= {1 + z · n | z ∈ Z }.
Beweis: Wir zeigen zuerst, dass + und · wohldefiniert sind. Es seien a, c, b, d ∈
Z so, dass ā = c̄ und̄
b = d.¯Dann sind a − c und b − d Vielfache von n. Wegen
(a + b) − (c + d) = (a − c) + (b − d)
ist auch (a + b) − (c + d) ein Vielfaches von n, also a + b = c + d. Wegen
ab − cd = a(b − d) + (a − c)d
ist ab = cd. Nun kann leicht nachgeprüft werden, dass + und · die Rechenregeln eines kommutativen Ringes erfüllen.
Beispiel 12 : Am Computer können die Elemente von Z n durch die Zahlen
0, 1, . . ., n − 1
dargestellt werden. Dann wird für 0 ≤ a, b < n die Summe ā +b¯bzw. das
Produkt ā ·b¯ durch den Rest von a + b bzw. a · b nach Division durch n
dargestellt.
Eine andere Möglichkeit zur Darstellung der Restklassen modulo n ist die
durch die Zahlen
n
n−1
n
],
−[ ], −[ ] + 1, . . ., [
2
2
2
wobei [ 2n ] die größte ganze Zahl bezeichnet, die kleiner oder gleich n2 ist.
In der Programmiersprache C bedeutet das Rechnen im Datentyp unsigned int das Rechnen im Restklassenring Z n mit n = 232 . Als Summe von
232 − 1 und 1 wird daher 0 ausgegeben.
Satz 30 : Es seien a 6= 0 und n ≥ 2 ganze Zahlen.
(1) Die Restklasse ā ∈ Zn ist genau dann invertierbar, wenn
ggT (a, n) = 1 ist. In diesem Fall wird ā−1 wie folgt berechnet:
– Berechne mit dem erweiterten Euklidischen Algorithmus Zahlen u, v ∈ Z so, dass u · a + v · n = 1 ist.
– Dann ist ā−1 = ū.
(2) Z n ist genau dann ein Körper, wenn n eine Primzahl ist.
Beweis:
33
1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN
(1) Wenn ggT (a, n) = 1 und u · a + v · n = 1 ist, dann ist
1¯= ū · ā + v̄ · n̄ = ū · ā .
Wenn ā invertierbar ist, dann gibt es eine ganze Zahl b so, dass
ā ·b¯= 1¯ ist. Nach Satz 28 ist daher der Rest von ab nach Division durch n gleich 1, insbesondere ist n ein Teiler von ab − 1. Daher
teilt ggT (a, n) sowohl a als auch 1 − a · b, also muss ggT (a, n) gleich
1 sein.
(2) Seien n eine Primzahl und a ∈ Z . Dann ist a entweder ein Vielfaches
von n oder ggT (a, n) = 1. Daher folgt die Behauptung aus (1).
Beispiel 13 : Der Ring Z 2 ist ein Körper mit zwei Elementen.
KAPITEL 2
Systeme linearer Gleichungen
In diesem Kapitel werden mit m, n, p, q immer positive ganze Zahlen,
mit K ein Körper (z.B. Q oder Z p , p prim) und mit R ein kommutativer
Ring (z.B. Z , Q oder Z n ) bezeichnet.
1. Matrizen
Definition 25 : Eine m × n-Matrix mit Koeffizienten in R (oder eine m × nMatrix über R) ist eine Abbildung
A : {1, 2, . . ., m} × {1, 2, . . ., n} → R , (i, j) 7→ A(i, j) .
Eine Matrix wird üblicherweise als Familie


A11 A12 . . . A1n
 A21 A22 . . . A2n 
A = (Ai j )1≤i≤m = 
..
.. 
 ...
.
. 
1≤ j≤n
Am1 Am2 . . . Amn
geschrieben, wobei Ai j eine Abkürzung für A(i, j) ist und der i j-te Koeffizient von A (oder Koeffizient in der i-ten Zeile und j-ten Spalte von A) genannt
wird. Als Kurzschreibweise wird
A = (Ai j )i, j
verwendet. Anstelle von Matrix-Koeffizienten“ spricht man auch von Matrix”
”
Einträgen“. Eine m × 1-Matrix heißt eine m-Spalte,
eine 1 × n-Matrix eine n-Zeile. Die n-Zeile
Ai− := (Ai1 , Ai2 , . . . , Ain )
heißt i-te Zeile von A, die m-Spalte

A1 j
 A2 j 

A− j := 
 ... 

Am j
j-te Spalte von A. Die Menge aller m × n-Matrizen mit Koeffizienten in R
wird mit
Rm×n
bezeichnet. Matrizen mit Koeffizienten in Z oder Q werden kurz ganzzahlige oder rationale Matrizen genannt. 1 × 1-Matrizen mit Koeffizienten in
34
35
2. SYSTEME LINEARER GLEICHUNGEN
R werden üblicherweise mit den entsprechenden Elementen von R identifiziert, d.h.
R1×1 = R , (Ai j ) 1≤i≤1 = A11 .
1≤ j≤1
Definition 26 : Seien A, B ∈ Rm×n und r ∈ R. Dann heißt


A11 + B11 . . . A1n + B1n
..
..
 ∈ Rm×n
A + B := (Ai j + Bi j )1≤i≤m = 
.
.
1≤ j≤n
Am1 + Bm1 . . . Amn + Bmn
die Summe von A und B, und

rA11 . . .
r · A := (rAi j )1≤i≤m =  ...
1≤ j≤n

rA1n
..  ∈ Rm×n
.
rAm1 . . . rAmn
heißt das r-fache skalare Vielfache von A. Wir schreiben im Folgenden statt
r · A“ kurz rA“. Weiters vereinbaren wir, dass skalare Vielfache vor der
”
”
Summe berechnet werden, zum Beispiel ist rA + B zu lesen als (r · A) + B.
Satz 31 :
(1) (Rm×n , +) ist eine kommutative Gruppe, wobei das neutrale Element
die m × n-Nullmatrix


0R . . . 0R
..  ∈ Rm×n
0 =  ...
.
0R . . . 0R
und das zu A ∈ Rm×n inverse Element
−A = (−Ai j )1≤i≤m ∈ Rm×n
1≤ j≤n
ist.
(2) Für r, s ∈ R und A, B ∈ Rm×n ist
(r + s)A = rA + sA
und
(3) Für r, s ∈ R und
r(A + B) = rA + rB.
ist
ARm×n
(rs)A = r(sA) und 1R A = A .
Beweis: (1) Wir zeigen nur die Assoziativität, die anderen Eigenschaften
einer Gruppe werden analog bewiesen. Für A, B,C ∈ Rm×n ist
(A + B) +C = (Ai j + Bi j )i, j + (Ci, j )i, j = ((Ai j + Bi j ) +Ci j )i, j =
= (Ai j + (Bi j +Ci j ))i, j = (Ai j )i, j + (Bi j +Ci j )i, j = A + (B +C)
36
2. SYSTEME LINEARER GLEICHUNGEN
aufgrund des Assoziativgesetzes für die Addition in R.
(2), (3) Übung.
Definition 27 : Für A ∈ Rm×n und B ∈ Rn×p heißt
n
A · B := ( ∑ Aik Bk j )1≤i≤m ∈ Rm×p
1≤ j≤p
k=1
das Produkt von A und B (sprich A mal B“). Oft wird statt A · B nur AB
”
geschrieben. Zur Berechnung des Koeffizienten
n
(AB)i j =
∑ Aik Bk j
k=1
werden die Koeffizienten in der i-ten Zeile von A der Reihe nach mit den
entsprechenden Koeffizienten in der j-ten Spalte von B multipliziert und
anschließend alle diese Produkte addiert.
Im Spezialfall m = 1 und p = 1, d.h. A ist eine n-Zeile und B eine nSpalte, ergibt sich
 
B1
n
AB = (A1 , . . . , An )  ...  = A1 B1 + · · · + An Bn = ∑ Ai Bi .
i=1
Bn
Beispiel 14 : Ein Korb voller Waren werde durch die Zeile
S := (S1 , . . . , Sn ) ∈ Q 1×n
beschrieben, wobei Si die Stückzahl der Ware i im Korb angibt. Sei
 
P1

P := ...  ∈ Q n×1 ,
Pn
wobei Pi den Preis der Ware i in Euro angibt. Dann ist
n
SP = ∑ Si Pi ∈ Q
i=1
der Wert des ganzen Korbs.
37
2. SYSTEME LINEARER GLEICHUNGEN
Beispiel 15 : Die Waren 1, . . . , m werden aus Rohstoffen 1, . . ., n hergestellt, die von Lieferanten 1, . . ., p bezogen werden. Für die Erzeugung der
Ware i werden Qi j Einheiten des Rohstoffes j benötigt. Der Preis des Rohstoffes j beim Lieferanten k beträgt Pjk . Setzt man
Q := (Qi j )i, j ∈ Q m×n und P := (Pjk ) j,k ∈ Q n×p , dann ist
n
(QP)ik =
∑ Qi j Pjk
j=1
der Gesamtpreis der Rohstoffe für Ware i beim Lieferanten k. Sollen jeweils
Si Stück der Ware i produziert werden und setzt man
S = (S1 , . . . , Sm ) ∈ Q 1×n , dann ist (SQ)1 j die Anzahl der insgesamt benötigten Einheiten von Rohstoff j und
((SQ)P)1k
ist der Preis bei Lieferant k für alle benötigten Rohstoffe.
Satz 32 : Die Matrizenmultiplikation ist assoziativ, d.h. für Matrizen A ∈
Rm×n , B ∈ Rn×p und C ∈ R p×q gilt
(AB)C = A(BC).
Beweis: Da AB eine m × p-Matrix und BC eine n × q-Matrix ist, sind sowohl (AB)C als auch A(BC) m × q-Matrizen. Für 1 ≤ i ≤ m und 1 ≤ j ≤ q
ist
!
p
((AB)C)i j =
∑ (AB)ikCk j =
k=1
p n
=
p
n
k=1
`=1
n p
∑ ∑ Ai`B`k
∑ ∑ Ai`B`kCk j = ∑ ∑ Ai`B`kCk j
k=1 `=1
n
=
Ck j
∑ Ai`
`=1
`=1 k=1
p
∑ B`kCk j
k=1
!
n
=
∑ Ai`(BC)` j
`=1
= (A(BC))i j .
Definition 28 : Für Elemente i, j einer beliebigen Indexmenge ist das KroneckerDelta in R
(
1R falls i = j,
δi j :=
0R falls i 6= j.
38
2. SYSTEME LINEARER GLEICHUNGEN
Die Matrix

1
0
In := (δi j ) 1≤i≤n = 
 ...
1≤ j≤n
0
0
1
..
.
0
heißt n × n-Einheitsmatrix.

... 0
. . . 0
∈ Rn×n
. . .. 
. .
... 1
Satz 33 : Für eine beliebige Matrix A ∈ Rm×n ist
Im A = A
und AIn = A .
Beweis: Für 1 ≤ i ≤ m und 1 ≤ j ≤ n ist
(Im A)i j = ∑m
k=1 δik Ak j = Ai j ,
also Im A = A. Analog beweist man AIn = A.
Satz 34 : Für A, B ∈ Rm×n und C ∈ Rn×p gilt
(A + B)C = AC + BC.
Für A ∈ Rm×n und B,C ∈ Rn×p gilt
A(B +C) = AB + AC.
Für A ∈ Rm×n , B ∈ Rn×p und r ∈ R gilt
r(AB) = (rA)B = A(rB).
Für A ∈ Rm×n und r, s ∈ R gilt
(rs)A = r(sA).
Beweis: Übung.
Satz 35 : (Rn×n , +, ·) ist ein Ring mit Einselement In . Wegen
1 0
0 1
0 1
=
0 0
0 0
0 0
aber
0 1
0 0
1 0
0 0
=
0 0
0 0
ist Rn×n im Allgemeinen nicht kommutativ.
Beweis: Die Behauptung folgt aus Satz 32, Satz 33 und Satz 34.
39
2. SYSTEME LINEARER GLEICHUNGEN
Definition 29 : Eine Matrix A ∈ Rn×n heißt invertierbar, wenn es eine Matrix B ∈ Rn×n gibt mit
AB = In
und
BA = In .
In diesem Fall nennt man B die zu A inverse Matrix und schreibt
B = A−1 .
Sei
GLn (R) := {A ∈ Rn×n | A invertierbar}.
Nach Satz 24 ist (GLn (R), ·) eine Gruppe, sie heißt allgemeine lineare Gruppe (auf Englisch general linear group“).
”
Definition 30 : Sei A = (Ai j )1≤i≤m ∈ Rm×n . Dann heißt
1≤ j≤n
AT := (A ji )1≤i≤m ∈ Rn×m
1≤ j≤n
die transponierte Matrix von A.
Satz 36 : Für r ∈ R, A, B ∈ Rm×n und C ∈ GLn (R) gilt:
(1) (AT )T = A
(2) (A + B)T = AT + BT
(3) (rA)T = rAT
(4) (AB)T = BT AT (die Reihenfolge kehrt sich um !)
(5) (C −1 )T = (C T )−1 .
Beweis: Übung.
2. Elementare Umformungen
Definition 31 : Seien 1 ≤ k ≤ m und 1 ≤ ` ≤ n. Dann heißt die Matrix
Ek` ∈ Rm×n mit Koeffizienten
(
1R falls i = k und j = `,
(Ek` )i j := δik δ j` =
0R falls i 6= k oder j 6= `,
eine Standard-Matrix von Rm×n . Zum Beispiel sind die Standard-Matrizen
von Q 2×2
1 0
0 1
0 0
0 0
E11 =
, E12 =
, E21 =
und E22 =
.
0 0
0 0
1 0
0 1
Im Spezialfall m = 1 (oder n = 1) schreibt man statt E1` (bzw. Ek1 ) kurz
e` (bzw. ek ). Zum Beispiel sind die Standard-Zeilen von Q 1×3
e1 = (1, 0, 0) , e2 = (0, 1, 0) und e3 = (0, 0, 1)
40
2. SYSTEME LINEARER GLEICHUNGEN
und die Standard-Spalten von Q 2×1 sind
1
0
e1 =
und e2 =
.
0
1
Definition 32 : Die folgenden Matrizen heißen Elementarmatrizen in Rn×n :
Typ 1: In + rEk` , wobei r ∈ R und k 6= ` ist,
Typ 2: In − Ekk − E`` + Ek` + E`k , wobei k 6= ` ist,
Typ 3: In + (t − 1)Ekk , wobei t ∈ R invertierbar ist.
Zum Beispiel sind
0 1
1 0
1 2
∈ Q n×n
,
,
1 0
0 3
0 1
Elementarmatrizen vom Typ 1, Typ 2 bzw. Typ 3.
Hilfssatz 5 : Für Ek` ∈ Rm×m , A ∈ Rm×n und 1 ≤ i ≤ m ist
(
A`− falls i = k,
(Ek` A)i− =
0
falls i 6= k.
Beweis: Sei 1 ≤ j ≤ n. Wenn i 6= k ist, dann ist (Ek` A)i j = 0, weil außerhalb
der k-ten Zeile von Ek` nur Nullen stehen. Wenn i = k ist, dann ist (Ek` A)i j =
A` j , weil bei der Produktbildung die 1 in Ek` auf A` j trifft.
Satz 37 : Sei A ∈ Rm×n und seien P ∈ Rm×m sowie Q ∈ Rn×n Elementarmatrizen. Dann erhält man PA aus A, indem man
Typ 1: zur k-ten Zeile von A das r-fache der `-ten Zeile addiert,
Typ 2: die k-te und `-te Zeile von A vertauscht,
Typ 3: die k-te Zeile von A mit t multipliziert.
Diese Umformungen der Matrix A heißen elementare Zeilenumformungen.
Analog erhält man AQ aus A, indem man
Typ 1: zur `-ten Spalte von A das r-fache der k-ten Spalte addiert,
Typ 2: die k-te und `-te Spalte von A vertauscht,
Typ 3: die k-te Spalte von A mit t multipliziert.
Diese Umformungen der Matrix A heißen elementare Spaltenumformungen.
Beweis: Für P = In + rEk` , wobei r ∈ R und k 6= `, ist
PA = (In + rEk` )A = A + rEk` A. Nach Hilfssatz 5 ist
(
rA`− falls i = k,
(rEk` A)i− =
0
falls i 6= k.
41
2. SYSTEME LINEARER GLEICHUNGEN
Die anderen Fälle beweist man analog.
Satz 38 : Elementarmatrizen sind invertierbar, genauer gilt:
Typ 1: (In + rEk` )−1 = In − rEk`
Typ 2: (In − Ekk − E`` + Ek` + E`k )−1 = In − Ekk − E`` + Ek` + E`k
Typ 3: (In + (t − 1)Ekk )−1 = In + (t −1 − 1)Ekk .
Somit können alle elementaren Zeilen- oder Spaltenumformungen einer beliebigen Matrix durch elementare Zeilen- oder Spaltenumformungen wieder
rückgängig gemacht werden.
Beweis: Die Matrix
(In − rEk` )(In + rEk` ) = (In − rEk` )[(In + rEk` )In ]
erhält man aus Im , indem man zuerst zur k-ten Zeile das r-fache der `-ten
Zeile addiert und anschließend das r-fache der `-ten Zeile subtrahiert. Daher
ist
(In − rEk` )(In + rEk` ) = In .
Die anderen Fälle beweist man analog. Ist P eine Elementarmatrix, so bekommt man A aus B := PA wieder zurück, indem man B von links mit P −1
multipliziert.
3. Systeme linearer Gleichungen
Definition 33 : Ein System linearer Gleichungen mit Koeffizienten in K
(oder ein lineares Gleichungssystem über K) ist durch eine Matrix A ∈ K m×n
und eine Spalte b ∈ K m×1 gegeben. Die Lösungsmenge dieses Systems ist
L(A, b) := {x | x ∈ K n×1 mit Ax = b}.
Das System lösen heißt, die Menge L(A, b) zu berechnen. Das System heißt
homogen, wenn b die Nullspalte ist, ansonsten inhomogen.
Ohne Matrizen kann man das so formulieren: Gegeben sind Elemente
Ai j ∈ K und bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Gesucht sind alle n-Tupel
(x1 , . . . , xn ) mit Komponenten in K, sodass
A11 x1 + A12 x2 + · · · + A1n xn = b1
A21 x1 + A22 x2 + · · · + A2n xn = b2
..
..
..
.
.
.
Am1 x1 + Am2 x2 + · · · + Amn xn = bm
ist.
Das durch A ∈ K m×n und b ∈ K m×1 gegebene System linearer Gleichungen wird kurz mit (A, b)“ oder Ax = b“ bezeichnet. Die Zahl m heißt die
”
”
Anzahl der Gleichungen, die Zahl n die Anzahl der Unbekannten.
42
2. SYSTEME LINEARER GLEICHUNGEN
Aus der Definition sieht man, dass ein homogenes System linearer Gleichungen immer eine Lösung hat, und zwar die Nullspalte. Hingegen gibt es
inhomogene Systeme ohne Lösung, zum Beispiel das System
x1 + x 2 = 0
.
2x1 + 2x2 = 1
Beispiel 16 : Es soll eine Legierung aus bi Gramm der Metalle Mi , 1 ≤ i ≤
m, hergestellt werden. Zur Verfügung stehen beliebige Mengen von Legierungen L1 , . . . , Ln der Metalle M1 , . . . , Mm , wobei 1 Gramm der Legierung L j
jeweils Ai j Gramm des Metalls Mi enthält. Wieviele Gramm von L1 , . . . , Ln
müssen für die gewünschte Legierung verschmolzen werden ?
Das Zusammenschmelzen von x1 , . . ., xn Gramm der Legierungen L1 , . . ., Ln
gibt eine Legierung mit jeweils
n
∑ Ai j x j
j=1
Gramm des Metalls Mi . Gesucht ist somit L(A, b).
Satz 39 : Seien (A, b) ein System linearer Gleichungen über K und z ∈
L(A, b). Dann ist
L(A, b) = {z + v | v ∈ L(A, 0)}.
Beweis: Sei v ∈ L(A, 0). Dann ist A(z + v) = Az + Av = b + 0 = b, also
z + v ∈ L(A, b).
Sei x ∈ L(A, b). Dann ist A(x − z) = Ax − Az = b − b = 0, also x − z ∈
L(A, 0) und x = z + (x − z) ∈ {z + v | v ∈ L(A, 0)}.
Um die Lösungsmenge eines inhomogenen linearen Gleichungssystems
(A, b) zu bestimmen, genügt es somit, nur eine Lösung zu finden und die
Lösungsmenge
des
homogenen
linearen
Gleichungssystems
(A, 0) zu bestimmen.
Satz 40 : Seien A ∈ K m×n , r, s ∈ K und v, w ∈ L(A, 0). Dann ist auch rv +
sw ∈ L(A, 0) .
Beweis: A(rv + sw) = r(Av) + s(Aw) = 0 + 0 = 0.
Für die Lösungsmenge L eines Systems linearer Gleichungen gilt genau
eine der folgenden drei Aussagen:
(1) L ist leer ( es gibt keine Lösung“).
”
43
2. SYSTEME LINEARER GLEICHUNGEN
(2) L enthält genau ein Element ( eine Lösung existiert und ist eindeutig
”
bestimmt“).
(3) L enthält mindestens zwei Elemente.
Wenn K unendlich ist (z.B. K = Q ), dann enthält L im Fall (3) nach
Satz 39 und Satz 40 unendlich viele Elemente. Wie können wir L dann
durch endlich viele Daten beschreiben? Um diese Frage zu beantworten,
führen wir im nächsten Abschnitt die Begriffe Vektorraum“ und Basis“
”
”
ein.
4. Vektorräume
Beim Rechnen mit m × n-Matrizen mit Koeffizienten in einem Körper
K haben wir zwei Rechenoperationen kennengelernt:
(1) Die Addition von zwei m × n-Matrizen,
(2) Die Multiplikation eines Elementes von K (eines Skalars“) mit einer
”
m × n-Matrix.
Im Satz 31 wurden die dafür geltenden Rechenregeln angegeben.
Definition 34 : Sei V eine Menge und seien + : V × V → V sowie · : K ×
V → V Abbildungen. Wir schreiben statt +(v, w)“ kurz v + w“ und statt
”
”
·(r, v)“ kurz r · v oder nur rv“. Das Tripel (V, +, ·) ist ein Vektorraum über
”
”
”
K, wenn die folgenden drei Bedingungen erfüllt sind:
(1) (V, +) ist eine abelsche Gruppe.
(2) Für alle r, s ∈ K und für alle v, w ∈ V ist
r(v + w) = (rv) + (rw) und (r + s)v = (rv) + (sv) .
(3) Für alle r, s ∈ K und für alle v ∈ V ist (rs)v = r(sv) und 1K v = v .
Ist (V, +, ·) ein Vektorraum, dann heißen die Elemente von V Vektoren“,
”
+ Addition“ und · Skalarmultiplikation“. Statt (V, +, ·) wird oft nur V
”
”
geschrieben. Das neutrale Element von (V, +) wird mit 0V bezeichnet und
heißt der Nullvektor.
Man beachte, dass der Begriff Vektor“ erst nach dem Begriff Vektor”
”
raum“ eingeführt werden kann, so wie der Begriff Tiroler“ erst nach dem
”
Begriff Tirol“ eingeführt werden kann.
”
Die Eigenschaften von Vektoren können kurz so beschrieben werden:
Vektoren können miteinander addiert und mit Skalaren multipliziert werden. Dabei gelten die üblichen“ Rechenregeln.
”
Ein Beispiel aus der Physik: alle Kräfte, die in einem vorgegebenen
Punkt angreifen, bilden einen Vektorraum, weil sie addiert und mit Zahlen
multipiziert werden können und dabei obige Rechenregeln gelten. Daher
sind solche Kräfte Vektoren.
Die Addition und die Skalarmultiplikation von m × n-Matrizen mit Koeffizienten in einem Körper erfüllen die Rechenregeln eines Vektorraums.
Daher: Matrizen sind Vektoren“.
”
44
2. SYSTEME LINEARER GLEICHUNGEN
Satz 41 :
K n = {(a1 , . . . , an ) | a1 , . . ., an ∈ K}
mit der komponentenweisen Addition
(a1 , . . ., an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn )
und der komponentenweisen Skalarmultiplikation
r(a1 , . . . , an ) := (ra1 , . . ., ran )
ist ein Vektorraum über K und heißt Standard-Vektorraum über K der Dimension n. In diesem Vektorraum ist 0V = (0, . . ., 0) und
−(a1 , . . . , an ) = (−a1 , . . ., −an ).
Beweis: Übung.
Beispiel 17 : Ein Kaufhaus bietet n Waren an. Sei Ui j die Anzahl der am
Tag i verkauften Einheiten der Ware j. Dann gibt
Ui− = (Ui1 , . . . ,Uin )
den Umsatz am Tag i an,
U1− + · · · +Uk− =
k
k
i=1
i=1
∑ Ui1, . . ., ∑ Uin
!
ist der Umsatz vom ersten bis zum k-ten Tag, und
1
(U1− + · · · +Uk− ) ∈ K n
k
ist der durchschnittliche Tagesumsatz.
Satz 42 : Seien V ein Vektorraum über K, r ∈ K und v ∈ V . Dann gilt:
(1) Es ist rv = 0 genau dann, wenn r = 0 oder v = 0 ist.
(2) (−r)v = r(−v) = −(rv) .
Beweis: (1) Aus
0V + 0K v = 0K v = (0K + 0K )v = 0K v + 0K v
folgt durch Kürzen 0K v = 0V . Ebenso folgt aus
0V + r0V = r0V = r(0V + 0V ) = r0V + r0V
durch Kürzen r0V = 0V . Wenn umgekehrt rv = 0 aber r 6= 0 ist, dann ist r
invertierbar, weil K ein Körper ist, und
v = 1K v = (r−1 r)v = r−1 (rv) = r−1 0V = 0V .
(2) Wegen (rv)+(−r)v = [r +(−r)]v = 0K v = 0V ist −(rv) = (−r)v. Wegen
(rv) + (r(−v)) = r[v + (−v)] = r0V = 0V ist −(rv) = r(−v).
45
2. SYSTEME LINEARER GLEICHUNGEN
Definition 35 : Sei V ein Vektorraum über K. Eine Teilmenge U von V
heißt Untervektorraum oder linearer Unterraum von V , wenn die folgenden
drei Bedingungen erfüllt sind:
(1) 0V ∈ U
(2) Sind zwei Vektoren u, v Elemente von U , dann auch ihre Summe
u + v.
(3) Ist ein Vektor v Element von U , dann auch alle skalaren Vielfachen
rv, r ∈ K.
Man schreibt dann
U ≤K V
oder
U ≤ V.
Hilfssatz 6 : Seien (V, +, ·) ein Vektorraum über K und W ein Untervektorraum von V . Dann ist (W, +|W ×W , ·|K×W ) selbst ein Vektorraum über K.
Beweis: Übung.
Satz 43 : Die Lösungsmenge eines homogenen Systems linearer Gleichungen mit der komponentenweisen Addition und Skalarmultiplikation ist ein
Vektorraum.
Beweis: Folgt aus Satz 40 und Hilfssatz 6.
5. Erzeugendensysteme, lineare Unabhängigkeit und Basen
Definition 36 : Seien V ein Vektorraum über K und (vi )i∈I eine Familie von
Vektoren in V , wobei I eine beliebige Indexmenge (oft
{1, 2, . . ., n}) ist.
Eine Familie (ci )i∈I von Elementen in K heißt Koeffizientenfamilie, wenn
ci 6= 0 für nur endlich viele i ∈ I ist.
Ein Vektor w ∈ V heißt eine Linearkombination von (vi )i∈I , wenn es eine
Koeffizientenfamilie (ci )i∈I gibt, sodass
w = ∑ ci vi
i∈I
ist. Dabei ist im Fall einer unendlichen Indexmenge I obige Summe als die
endliche Summe über alle Indizes i ∈ I mit ci 6= 0 zu verstehen.
Die Menge aller Linearkombinationen von (vi )i∈I ist der kleinste Untervektorraum von V , der alle Vektoren vi , i ∈ I, enthält. Er heißt der von vi ,
i ∈ I, erzeugte Untervektorraum von V und wird mit
K hvi
| i ∈ Ii
oder
∑ Kvi
i∈I
46
2. SYSTEME LINEARER GLEICHUNGEN
bezeichnet. Wenn I = {1, . . ., n} ist, dann ist
n
K hvi
| i ∈ Ii = { ∑ ci vi | c1 , . . ., cn ∈ K} .
i=1
Definition 37 : Sei V ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren in V heißt ein Erzeugendensystem von V , wenn
K hvi
| i ∈ Ii = V
ist.
Definition 38 : Seien V ein Vektorraum über K und (vi )i∈I eine Familie
von Vektoren in V . Dann heißt (vi )i∈I linear unabhängig, wenn für jede
Koeffizientenfamilie (ci )i∈I aus
∑ ci vi = 0
i∈I
auch
ci = 0 für alle i ∈ I
folgt. Andernfalls heißt (vi )i∈I linear abhängig.
Beispiel 18 : Sei V ein Vektorraum über K. Ein einzelner Vektor v ∈ V ist
linear unabhängig genau dann, wenn v 6= 0 ist, weil aus rv = 0 nach Satz 42
r = 0 oder v = 0 folgt.
Satz 44 : Sei A ∈ K m×n .
(1) L(A, 0) ist genau dann der Nullraum, wenn die Spalten
(A−1 , . . ., A−n ) linear unabhängig sind.
(2) Für b ∈ K m×1 ist das lineare Gleichungssystem Ax = b genau dann
lösbar, wenn b eine Linearkombination der Spalten von A ist.
Beweis: Für y ∈ K n×1 ist
Ay = y1 A−1 + . . . yn A−n .
Definition 39 : Sei V ein Vektorraum über K. Eine Basis von V ist ein linear
unabhängiges Erzeugendensystem von V .
Satz 45 : Die Familie
(Ek` )1≤k≤m
1≤`≤n
47
2. SYSTEME LINEARER GLEICHUNGEN
der Standard-Matrizen (siehe Definition 31) ist eine Basis von
K m×n und heißt die Standardbasis von K m×n .
Insbesondere ist die Familie
(ei )1≤i≤n
der Standard-Zeilen (siehe Definition 31) eine Basis von K n und heißt die
Standardbasis von K n .
Beweis: Da für eine beliebige Matrix A ∈ K m×n
A=
∑
Ak` Ek`
1≤k≤m
1≤`≤n
ist, ist die Familie (Ek` )1≤k≤m ein Erzeugendensystem von K m×n . Um die
1≤`≤n
lineare Unabhängigkeit dieser Familie zu zeigen, nehmen wir an, dass für
gewisse ck` ∈ K
∑
ck` Ek` = 0
1≤k≤m
1≤`≤n
ist. Dann folgt für alle 1 ≤ i ≤ m und 1 ≤ j ≤ n
0=
∑
ck` (Ek` )i j = ci j ,
1≤k≤m
1≤`≤n
was zu zeigen war.
Satz 46 : Sei V ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren
in V ist genau dann eine Basis von V , wenn sich jeder Vektor in V in eindeutiger Weise als Linearkombination von (vi )i∈I schreiben lässt, d.h. für
alle w ∈ V gibt es genau eine Koeffizientenfamilie (ci )i∈I , sodass
w = ∑ ci vi
i∈I
ist. Diese Familie (ci )i∈I heißt dann die Koordinatenfamilie des Vektors w
bezüglich der Basis (vi )i∈I , und ci ∈ K heißt die Koordinate von w beim
Basisvektor vi .
Beweis: Wenn sich jeder Vektor aus V in eindeutiger Weise als Linearkombination von (vi )i∈I schreiben lässt, dann ist (vi )i∈I einerseits ein Erzeugendensystem von V und andererseits linear unabhängig, weil aus
∑ civi = 0V = ∑ 0K vi
i∈I
i∈I
48
2. SYSTEME LINEARER GLEICHUNGEN
auf Grund der Eindeutigkeit ci = 0K für alle i ∈ I folgt.
Seien umgekehrt (vi )i∈I eine Basis von V und w ∈ V . Da (vi )i∈I ein Erzeugendensystem von V ist, gibt es eine Koeffizientenfamilie (ci )i∈I mit
w = ∑ ci vi .
i∈I
Falls (di )i∈I eine weitere Koeffizientenfamilie in K mit
w = ∑ d i vi
i∈I
ist, erhält man durch Subtrahieren
0V = ∑(ci − di )vi .
i∈I
Da (vi )i∈I linear unabhängig ist, folgt ci − di = 0K für alle i ∈ I, also ci = di
für alle i ∈ I.
Beispiel 19 : Für A ∈ K m×n ist
∑
A=
Ak` Ek` ,
1≤k≤m
1≤`≤n
also ist A die Koordinatenfamilie von A bezüglich der Standardbasis (E k` )1≤k≤m
1≤`≤n
(und Ak` die Koordinate von A bei Ek` ).
Beispiel 20 : Seien V ein Vektorraum über K, (v1 , . . ., vn ) ∈ V n eine Basis
von V , w1 , . . . , w` ∈ V und u = ∑ni=1 ci vi ∈ V eine Linearkombination von
(v1 , . . . , vn ). Die Aufgabe
Überprüfe, ob u eine Linearkombination von (w1 , . . . , w` ) ist und
”
- wenn ja - berechne ein `-Tupel (d1 , . . ., d` ) mit u = ∑`j=1 d j w j .“
kann als System linearer Gleichungen formuliert werden:
Sei T die n × `-Matrix mit
n
w j := ∑ Ti j vi , 1 ≤ j ≤ ` .
i=1
Gesucht ist eine `-Spalte d ∈ K `×1 so, dass
n
∑ ci vi = u =
i=1
`
n
`
∑ d j w j = ∑ ( ∑ Ti j d j )vi
j=1
i=1 j=1
ist. Daher ist eine solche Spalte d eine Lösung des Systems linearer Gleichungen T x = c, wobei c die n-Spalte mit Einträgen c1 , . . ., cn ist.
Satz 47 : Jeder Vektorraum V über K besitzt eine Basis. Wenn V eine endliche Basis hat, dann enthalten je zwei Basen von V gleich viele Vektoren.
49
2. SYSTEME LINEARER GLEICHUNGEN
Beweis: wird weggelassen.
Definition 40 : Die Zahl
dimK (V ) := Anzahl der Elemente einer Basis von V
heißt die Dimension von V . Wenn dimK (V ) = n ist, dann nennt man V ndimensional. (Jeder Vektor in V kann durch n Zahlen eindeutig beschrieben
werden).
Ein Vektorraum V heißt endlich-dimensional, wenn er eine endliche Basis
hat, sonst heißt er unendlich-dimensional.
Beispiel 21 : Nach Satz 45 ist dimK (K m×n ) = m · n und
dimK (K n ) = n .
Nach Einführung des Begriffs Basis“ kann die Aufgabenstellung Be”
”
rechne die Lösungsmenge des linearen Gleichungssystems (A, b)“ präzisiert
werden:
Berechne irgendeine Lösung von (A, b) und eine Basis des Lösungsraums
”
von (A, 0)“.
Man beachte, dass damit nur endlich viele Daten zu berechnen sind, diese bestimmen aber vollständig die (möglicherweise unendliche) Lösungsmenge L(A, b).
6. Der Gauss-Algorithmus
Wir werden nun eine Methode zum Lösen eines linearen Gleichungssystems (A, b) kennenlernen. Zunächst betrachten wir einen Spezialfall, in
dem die Matrix A eine besonders einfache Gestalt hat. In diesem Fall können
wir die Lösungsmenge direkt anschreiben (Satz 48). Danach werden wir
den allgemeinen Fall auf den einfachen Fall zurückführen, indem wir die
Daten (A, b) schrittweise so verändern, dass die geänderten Daten (A 0 , b0 )
schließlich die einfache Gestalt haben und
L(A, b) = L(A0 , b0 )
ist (Satz 50 und Satz 52). Den Übergang von den Daten (A, b) zu (A0 , b0 )
nennt man die Gleichungen umformen“. Gilt dabei
”
L(A, b) = L(A0 , b0 ), dann sind die Umformungen zulässig“.
”
Definition 41 : Eine Matrix A ∈ K m×n hat Stufenform, wenn die folgenden
vier Bedingungen erfüllt sind:
(1) Ist Ai− = 0, dann sind auch A(i+1)− = · · · = Am− = 0.
(2) Der (von links gelesen) erste Koeffizient 6= 0 in jeder Zeile heißt
Pivot und ist 1.
50
2. SYSTEME LINEARER GLEICHUNGEN
(3) Der Pivot von Zeile i + 1 steht rechts vom Pivot von Zeile i.
(4) Der Pivot jeder Zeile ist der einzige Koeffizient 6= 0 in seiner Spalte.
Dann hat A die Gestalt

0 ... 0 1 ∗ ... ∗ 0 ∗ ... ∗ 0 ∗ ...
0 . . . . . . . . . . . . . . . . 0 1 ∗ . . . ∗ 0 ∗ . . .


0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 ∗ . . . ,
..
.

wobei die Sterne für beliebige Elemente von K stehen.
Satz 48 : Sei (A, b) ein System linearer Gleichungen über K mit
A ∈ K m×n in Stufenform. Seien r die Anzahl der Pivots,
d1 < d2 < · · · < dr die Spaltenindizes der Pivots und
 
 
0
1
 ... 
0 
 

e1 = 
 ...  , . . . , en = 0
0
1
die Standardspalten von K n×1 . Dann gilt:
(1) L(A, b) ist genau dann nicht leer, wenn für alle i > r gilt: bi = 0.
In diesem Fall ist
 
0
 ... 
 
0
 
b 
 1
0
 
r
 
z := ∑ bi edi =  ...  ∈ L(A, b),
 
i=1
0
 
 br 
 
0
.
 .. 
0
wobei b1 , . . ., br in den Zeilen d1 , . . . , dr stehen.
51
2. SYSTEME LINEARER GLEICHUNGEN
(2) Sei J := {1, . . ., n} \ {d1 , . . ., dr } und, für alle j ∈ J,


0
 .. 
 . 


 0 


−A1 j 
 0 


 . 
 .. 


r
 0 
,

w j := e j − ∑ Ai j edi = 

1


i=1
 0 


 .. 
 . 


 −Ar j 


 0 
 . 
 .. 
0
wobei −A1 j , . . . , −Ar j in den Zeilen d1 , . . ., dr sowie 1 in der Zeile j
stehen. Dann ist (w j ) j∈J eine K-Basis von L(A, 0).
Beweis: (1) Wenn L(A, b) nicht leer ist, dann gibt es ein x mit Ax = b, und
es folgt bi = Ai− x = 0 für i > r. Sei umgekehrt bi = 0 für i > r. Dann ist
r
r
i=1
i=1
Az = A( ∑ bi edi ) = ∑ bi Aedi =
r
r
i=1
i=1
∑ biA−di = ∑ biei = b,
also z ∈ L(A, b).
(2) Für alle j ∈ J ist
r
r
r
i=1
i=1
i=1
Aw j = A(e j − ∑ Ai j edi ) = Ae j − ∑ Ai j Aedi = A− j − ∑ Ai j ei = 0,
also w j ∈ L(A, 0).
Sei (t j ) j∈J eine Familie in K. Dann ist
∑ t jw j =
j∈J
r
∑ t j e j − ∑ ( ∑ t j Ai j )edi ,
i=1 j∈J
j∈J
daher ist t j die Koordinate von ∑ j∈J t j w j beim Standardbasisvektor e j , für
alle j ∈ J. Aus ∑ j∈J t j w j = 0 folgt somit t j = 0, j ∈ J. Daher ist (w j ) j∈J
linear unabhängig.
Es bleibt noch zu zeigen, dass jedes v ∈ L(A, 0) eine Darstellung
v=
∑ s jw j
j∈J
52
2. SYSTEME LINEARER GLEICHUNGEN
mit gewissen s j ∈ K besitzt. Aus Av = 0 folgt für alle i ≤ r:
n
0 = Ai− v =
∑ A i j v j = v di + ∑ A i j v j .
j∈J
j=1
Somit gilt für 1 ≤ i ≤ r
v di = − ∑ A i j v j
j∈J
und wir erhalten
r
v=
r
∑ v j e j + ∑ v di e di = ∑ v j e j − ∑ ∑ A i j v j
j∈J
j∈J
i=1
r
=
∑ v j e j − ∑ v j ∑ A i j e di
j∈J
=
j∈J
i=1
i=1
!
=
∑ vj
j∈J
j∈J
!
r
e di
e j − ∑ A i j e di
i=1
!
∑ v jw j ,
j∈J
was zu zeigen war.
Unser nächstes Ziel ist es, beliebige lineare Gleichungssysteme zu lösen. Ein erster Schritt dazu ist der folgende Satz.
Satz 49 : Sei (A, b) ein lineares Gleichungssystem mit A ∈ K m×n . Dann gilt
für beliebiges P ∈ GLm (K)
L(PA, Pb) = L(A, b).
Beweis: Ist y ∈ L(A, b), dann ist Ay = b, also auch PAy = Pb und y ∈
L(PA, Pb). Daher ist L(A, b) eine Teilmenge von L(PA, Pb).
Ist y ∈ L(PA, Pb), dann ist PAy = Pb, also auch Ay = P−1 PAy = P−1 Pb = b
und y ∈ L(A, b). Daher ist L(PA, Pb) eine Teilmenge von L(A, b).
Satz 49 legt nahe, zu einem gegebenen linearen Gleichungssystem (A, b)
eine invertierbare Matrix P zu suchen, sodass das Gleichungssystem (PA, Pb)
Stufenform hat. Dann kann die Lösungsmenge mit Satz 48 bestimmt werden.
Satz 50 : Jede Matrix A ∈ K m×n kann durch elementare Zeilenumformungen auf Stufenform gebracht werden, genauer gesagt gibt es ein P ∈ GL m (K),
das Produkt von höchstens mn Elementarmatrizen ist, sodass PA Stufenform
hat. Diese Matrix PA kann mit dem folgenden Algorithmus berechnet werden (Gauss-Elimination):
(1) Setze C := A, i := 1 und j := 1.
53
2. SYSTEME LINEARER GLEICHUNGEN
(2) Falls Ci j 6= 0 ist, gehe zu Schritt 4.
Ansonsten suche ein k ∈ {i + 1, . . ., m} mit Ck j 6= 0.
(3) Falls es kein k ∈ {i + 1, . . . , m} mit Ck j 6= 0 gibt, erhöhe j um 1 und
wiederhole Schritt 2.
Ansonsten vertausche die i-te und k-te Zeile von C und nenne die
neue Matrix wieder C. (Dann ist Ci j 6= 0).
(4) Multipliziere die i-te Zeile von C mit Ci−1
j und nenne die neue Matrix
wieder C. (Dann ist Ci j = 1).
(5) Für ` ∈ {1, . . ., m} \ {i} mit C` j 6= 0 subtrahiere das C` j -fache der
i-ten Zeile von der `-ten Zeile und nenne die neue Matrix wieder C.
(Dann ist C− j = ei ).
(6) Erhöhe i und j um 1 und gehe zu Schritt 2.
Der Algorithmus wird abgebrochen, sobald i > m oder j > n ist. Dann hat
die Matrix C Stufenform.
Beweis: Der Algorithmus bricht nach höchstens n Durchläufen ab, weil in
jedem Durchlauf j um 1 erhöht wird. Seien P1 , . . ., Ps die Elementarmatrizen zu den im Algorithmus der Reihe nach durchgeführten elementaren
Zeilenumformungen. Da pro Durchlauf höchstens m elementare Zeilenumformungen durchgeführt werden, ist s ≤ nm. Nach Satz 37 erhält man am
Ende des Algorithmus die Matrix
(Ps . . . (P2 (P1 A)) . . .) = (Ps . . . P2 P1 )A,
und nach Satz 38 ist
P := Ps . . . P2 P1 ∈ GLm (K).
Schließlich hat die Matrix PA Stufenform, weil in jedem Durchlauf die ersten j − 1 Spalten nicht mehr verändert werden und in der j-ten Spalte entsprechend umgeformt wird.
Der Beweis zeigt, dass man die Transformationsmatrix P erhält, indem
man die elementaren Zeilenumformungen nicht nur auf A, sondern auch auf
die Einheitsmatrix Im anwendet:
(A|Im ) → (P1 A|P1 Im ) → · · · → (Ps . . . P1 A|Ps . . . P1 Im ) = (PA|P).
Satz 51 : Sei A ∈ K m×m . Auf die folgende Weise kann überprüft werden,
ob A invertierbar ist und, wenn ja, die zu A inverse Matrix A−1 berechnet
werden:
Bringe A durch Gauss-Elimination auf Stufenform, wobei die elementaren Zeilenoperationen auch auf die Einheitsmatrix angewendet werden:
(A|Im ) → (PA|P).
54
2. SYSTEME LINEARER GLEICHUNGEN
Dann ist A invertierbar genau dann, wenn PA = Im gilt. In diesem Fall ist
A−1 = P .
Beweis: Wenn A invertierbar ist, dann sind A, P ∈ GLm (K) und somit auch
B := PA ∈ GLm (K). Da B Stufenform hat, ist B = Im oder Bm− = 0. Aus
Bm− = 0 würde aber
0 = Bm− (B−1 )−m = (BB−1 )mm = 1,
folgen, also muss B = Im sein. Umgekehrt folgt aus PA = Im auch
AP = P−1 (PA)P = Im und somit P = A−1 .
Satz 52 : Ein lineares Gleichungssystem Ax = b über dem Körper K kann
gelöst werden, indem man die Matrix A durch Gauss-Elimination auf Stufenform bringt und b mittransformiert. Praktisch führt man die elementaren Zeilenumformungen auf der erweiterten Matrix“ (A|b) aus und erhält
”
(PA|Pb). Dann ist
L(A, b) = L(PA, Pb),
und L(A, b) kann nach Satz 48 berechnet werden.
Insbesondere gibt es genau dann genau eine Lösung, wenn
In
c
und
Pb =
PA =
0
0
mit c ∈ K n×1 ist. Die eindeutige Lösung ist dann
 
c1
 ...  .
cn
Wenn A sogar invertierbar ist, dann hat (A, b) die eindeutige Lösung
A−1 b.
Beweis: Die Behauptung folgt aus Satz 49 und Satz 48.
Satz 53 : Ein homogenes lineares Gleichungssystem Ax = 0 über dem Körper
K hat immer die triviale Lösung 0. Wenn A ∈ K m×n mit m < n ist, d.h. es
sind weniger Gleichungen als Unbekannte vorhanden, dann gibt es auch
eine Lösung, die nicht trivial ist.
Beweis: Wenn m < n ist, dann kann PA ∈ K m×n nicht die Form
In
0
haben, und nach Satz 52 gibt es mehr als eine Lösung.
55
2. SYSTEME LINEARER GLEICHUNGEN
Definition 42 : Sei A ∈ K m×n . Der von den Spalten von A erzeugte Untervektorraum von K m×1 heißt der Spaltenraum von A. Der Rang von A ist die
Dimension des Spaltenraums von A. Schreibweise: rg(A).
Satz 54 : Seien A ∈ K m×n und P ∈ GLm (K) so, dass PA Stufenform hat. Sei
r die Anzahl der Pivots in PA. Dann ist r = rg(A) und die Dimension von
L(A, 0) ist n − rg(A).
Beweis: Nach Satz 48 ist n − r die Dimension von L(PA, 0). Da PA Stufenform hat, ist leicht nachzuprüfen, dass rg(PA) = r ist. Wenn die Spalten
S1 , . . . , Sr eine Basis des Spaltenraums von PA bilden, dann ist (P−1 S1 , . . . , P−1 Sr )
eine Basis des Spaltenraums von P−1 PA = A. Also ist rg(A) = rg(PA) und
wegen L(PA, 0) = L(A, 0) ist n − rg(A) die Dimension von L(A, 0).
KAPITEL 3
Rechnen mit Abbildungen
1. Permutationen
Satz 55 : Sei f : M → N eine Abbildung.
(1) Ist f bijektiv, dann gilt f ◦ f −1 = IdN und f −1 ◦ f = IdM .
(2) Ist g : N → M eine Abbildung mit f ◦ g = IdN und g ◦ f = IdM , dann
ist f bijektiv und g = f −1 .
Beweis: Übung.
Satz 56 : Seien f : M → N und g : N → P bijektive Abbildungen. Dann ist
auch g ◦ f bijektiv und es gilt
(g ◦ f )−1 = f −1 ◦ g−1 .
Beweis: Wegen
(g ◦ f ) ◦ ( f −1 ◦ g−1 ) = g ◦ ( f ◦ f −1 ) ◦ g−1 = g ◦ IdN ◦g−1 = IdP
und
( f −1 ◦ g−1 ) ◦ (g ◦ f ) = f −1 ◦ (g−1 ◦ g) ◦ f = f −1 ◦ IdN ◦ f = IdM
folgt die Behauptung aus Satz 55, (2).
Satz 57 : Sei M eine Menge. Dann ist
S(M) := {s | s : M → M bijektiv}
mit der Hintereinanderausführung von Abbildungen eine Gruppe mit neutralem Element IdM und heißt die symmetrische Gruppe von M.
Beweis: Folgt aus Satz 1 und Satz 56.
Definition 43 : Sei n ∈ N und [n] := {1, 2, . . ., n}. Dann nennt man bijektive Abbildungen von [n] nach [n] auch Permutationen der Zahlen 1, 2, . . ., n,
und
Sn := S([n])
56
57
3. RECHNEN MIT ABBILDUNGEN
heißt die Permutationsgruppe vom Grad n. Eine Permutation
σ : {1, 2, . . ., n} → {1, 2, . . ., n}
schreibt man oft in der Tabellenform
1
2
...
n
.
σ (1) σ (2) . . . σ (n)
Sn hat genau n! = n(n − 1) · · ·2 · 1 Elemente. Graphisch kann man eine
Permutation darstellen, indem man die Zahlen 1, 2, . . ., n anschreibt und für
1 ≤ i ≤ n einen Pfeil von i nach σ (i) zeichnet. Zum Beispiel hat
1 2 3 4 5 6 7
σ=
5 4 6 7 3 1 2
die folgende Darstellung:
6 3
6
?
1
-
5
7
K
A
A
A
A
A
- 4
2
Da σ : {1, 2, . . ., n} → {1, 2, . . ., n} bijektiv ist, ist jede Zahl Anfangs- und
Endpunkt von genau einem Pfeil.
Definition 44 : Sei ` ∈ N , ` ≥ 2, und seien j1 , . . ., j` paarweise verschiedene Elemente von {1, . . . , n}. Dann heißt die Abbildung


falls i 6∈ { j1 , . . . , j` },
i
τ : {1, 2, . . ., n} → {1, 2, . . ., n} , i 7→ jk+1 falls i = jk mit k < `,

j
falls i = j` ,
1
ein Zykel der Länge ` und wird mit
( j 1 , j2 , . . . , j ` )
bezeichnet. Ein Zykel der Länge 2 heißt eine Transposition oder Vertauschung von j1 und j2 . Zwei Zykel (i1 , . . ., ik ) und ( j1 , . . . , j` ) heißen disjunkt, wenn
{i1 , . . . , ik } ∩ { j1 , . . . , j` } = 0/
ist.
Satz 58 : Es seien (i1 , . . ., ik ) und ( j1 , . . . , j` ) zwei disjunkte Zykel.
Es gilt:
(i1 , . . ., ik )( j1 , . . ., j` ) = ( j1 , . . . , j` )(i1 , . . ., ik )
58
3. RECHNEN MIT ABBILDUNGEN
und
( j1 , j2 , . . . , j` )−1 = ( j` , j`−1 , . . ., j1 ) ,
insbesondere ist
( j1 , j2 )−1 = ( j2 , j1 ) = ( j1 , j2 ) .
Beweis: Der Zykel (i1 , . . . , ik ) vertauscht nur Elemente in {i1 , . . . , ik }, der
Zykel ( j1 , . . . , j` ) nur Elemente in { j1 , . . . , j` }. Daher spielt die Reihenfolge
keine Rolle. Man prüft leicht nach, dass ( j` , j`−1 , . . ., j1 ) die Umkehrabbildung von ( j1 , j2 , . . . , j` ) ist.
Definition 45 : Seien M eine Menge und f : M −→ M eine Abbildung. Ein
Element x ∈ M heißt ein Fixpunkt von f , wenn f (x) = x ist.
Satz 59 : Jede Permutation σ ∈ Sn ist Produkt paarweise disjunkter Zyklen
ρ1 , . . . , ρm , die eindeutig bis auf die Reihenfolge sind. Die Darstellung
σ = ρ 1 . . . ρm
heißt die Zyklenzerlegung von σ . Jene Elemente i ∈ {1, 2, . . ., n}, die nicht
in den Zyklen vorkommen, sind die Fixpunkte von σ .
Beweis: Man startet mit J := {1, . . ., n} und wiederholt die folgende Prozedur, bis J leer ist: Wähle ein j ∈ J und berechne
j, σ ( j), σ 2 ( j), σ 3 ( j), . . .
solange, bis wieder j kommt. Dann ist entweder j ein Fixpunkt oder ( j, σ ( j), . . .)
ein Zykel von σ . Streiche diese Elemente aus der Menge J.
Definition 46 : Sei σ ∈ Sn eine Permutation mit p Fixpunkten und m Zyklen. Dann heißt die Zahl
sign(σ ) := (−1)n−p−m
das Vorzeichen oder Signum von σ .
Da Idn keine Zyklen und n Fixpunkte hat, ist
sign(Idn ) = 1 .
Satz 60 : Jede Permutation σ ∈ Sn ist Produkt von Transpositionen τ1 , . . ., τr ∈
Sn , die im Allgemeinen nicht eindeutig bestimmt sind. Es gilt aber
(
1 falls r gerade ist,
sign(σ ) = (−1)r =
−1 falls r ungerade ist.
59
3. RECHNEN MIT ABBILDUNGEN
Eine Permutation σ heißt gerade bzw. ungerade, wenn sign(σ ) = 1 bzw. −1
ist. Zum Beispiel ist die Identität gerade und jede Transposition ungerade.
Beweis: Sei σ = ρ1 . . . ρm die Zyklenzerlegung von σ . Wegen
(i1 , . . . , ik ) = (i1 , i2 )(i2 , i3 ) . . . (ik−1 , ik )
kann man jeden Zykel ρi als Produkt von Transpositionen schreiben und
daher auch σ . Das Beispiel
1 2 3
= (12)(23) = (13)(12)
2 3 1
zeigt, dass diese Darstellung im Allgemeinen nicht eindeutig ist.
Die Aussage sign(σ ) = (−1)r beweisen wir durch Induktion nach r. Für
r = 0 ist σ die Identität und sign(σ ) = 1. Für r = 1 ist σ eine Transposition,
hat also nur einen Zykel und n − 2 Fixpunkte, also ist
sign(σ ) = (−1)n−(n−2)−1 = −1 .
Sei nun r ≥ 2, τ1 = (i, j) und ρ := τ2 . . . τr . Dann ist zu zeigen, dass
sign((i, j)ρ ) = − sign(ρ )
ist. Dazu untersuchen wir, wie sich die Transposition (i, j) auf die Zyklenzerlegung von ρ auswirkt, und unterscheiden 2 Fälle:
(1) Die Elemente i und j liegen im gleichen Zykel ( j1 , . . . , j` ) von ρ , wobei
wir dann j1 = i und jk = j mit 2 ≤ k ≤ ` annehmen können, d.h.
( j1 , . . . , j` ) = (i = j1 , . . . , jk−1 , j = jk , . . ., j` ) .
Für k = 2 ist dann i ein Fixpunkt von (i, j)ρ , und
für k ≥ 3 ist (i, j2 , . . ., jk−1 ) ein Zykel von (i, j)ρ .
Für k < ` ist ( j, jk+1 , . . . , j` ) ein Zykel von (i, j)ρ , und
für k = ` ist j ein Fixpunkt von (i, j)ρ .
Ansonsten bleibt bei der Zyklenzerlegung von ρ alles gleich, sodass die
Summe aus der Zahl der Fixpunkte und der Zahl der Zykel insgesamt um 1
steigt und sich damit das Vorzeichen ändert.
(2) Im anderen Fall ist i oder j Fixpunkt von ρ oder i, j liegen in verschiedenen Zyklen (i1 , i2 , . . ., ik ) bzw. ( j1 , j2 , . . ., j` ) von ρ , wobei wir i1 = i bzw.
j1 = j annehmen können. Dann ist
(i = i1 , . . . , ik , j = j1 , . . ., j` )
ein Zykel von (i, j)ρ , sodass insgesamt die Summe aus der Zahl der Fixpunkte und der Zahl der Zykel um 1 fällt und wiederum sich das Vorzeichen
ändert.
Satz 61 : Für Permutationen σ , τ ∈ Sn gilt
sign(σ τ ) = sign(σ ) · sign(τ ) .
60
3. RECHNEN MIT ABBILDUNGEN
Beweis: Nach Satz 60 gibt es Transpositionen σ1 , . . . , σr und τ1 , . . . , τs mit
σ = σ1 . . . σr bzw. τ = τ1 . . . τs . Dann ist σ τ = σ1 . . . σr τ1 . . . τs , also sign(σ τ ) =
(−1)r+s = (−1)r (−1)s = sign(σ ) sign(τ ).
2. Polynomiale Abbildungen
In diesem Abschnitt sei K ein Körper.
Definition 47 : Seien n ∈ N und a0 , a1 , . . . , an ∈ K. Dann heißt die Abbildung
n
f : K → K , z 7→ a0 + a1 z + a2 z + · · · + an z = ∑ ai zi ,
2
n
i=0
eine polynomiale Abbildung von K nach K. Die Elemente a0 , . . ., an heißen
Koeffizienten von f .
Mit polynomialen Abbildungen sind mehrere grundlegende Aufgaben
verbunden:
• Auswerten einer polynomialen Abbildung f mit Koeffizienten a 0 , . . ., an
in einem Element c von K: Berechne das Bild
n
f (c) =
∑ a i ci
i=0
von c unter der polynomialen Abbildung f . Es ist klar, dass dieses
Element von K immer durch Ausführen von Additionen und Multiplikationen in K berechnet werden kann. Darin liegt die rechneri”
sche Bedeutung“ der polynomialen Abbildungen.
• Interpolation durch eine polynomiale Abbildung: Gegeben sind eine
endliche Teilmenge E von K und eine Abbildung
g : E −→ K. Gesucht ist eine polynomiale Abbildung von K nach K,
deren Einschränkung auf E gleich g ist.
• Überprüfe die Gleichheit von zwei polynomialen Abbildungen: Zwei
polynomiale Abbildungen seien durch ihre Koeffizienten gegeben.
Wie kann man feststellen, ob diese zwei Abbildungen gleich sind?
Die Antwort ist nicht so leicht: zum Beispiel sind die polynomialen
Abbildungen
f : Z 2 −→ Z 2 , z 7−→ z , und g : Z 2 −→ Z 2 , z 7−→ z2 ,
gleich.
• Berechnen der Nullstellen einer polynomialen Abbildung f : Finde
alle Elemente c ∈ K mit der Eigenschaft, dass f (c) = 0 ist. Einfacher
zu beantwortende Fragen sind: Gibt es solche Elemente? Wenn ja,
wieviele?
61
3. RECHNEN MIT ABBILDUNGEN
Satz 62 : Es seien c ∈ K und f eine polynomiale Abbildung mit Koeffizienten a0 , . . ., an ∈ K. Mit dem folgenden Verfahren kann f (c) mit höchstens n
Additionen und höchstens n Multiplikationen in K berechnet werden:
• Setze i := n und w := an .
• Solange i 6= 0 ist, ersetze i durch i − 1 und dann w durch w · c + a i .
• Wenn i = 0 ist, dann ist f (c) = w.
Beweis:
n
∑ aici = (. . . ((anc + an−1 )c + an−2 )c + . . . + a1 )c + a0 .
i=0
Definition 48 : Es sei A ein Ring und ein K-Vektorraum. Dann ist A eine
K-Algebra, wenn für alle t ∈ K und alle a, b ∈ A
t · (ab) = a(t · b) = (t · a)b
ist. Eine Algebra ist kommutativ, wenn sie als Ring kommutativ ist.
Beispiel 22 : Die Menge K n×n aller n × n-Matrizen mit Koeffizienten in K
ist mit Addition, Skalarmultiplikation und Multiplikation von Matrizen eine
K-Algebra. Sie ist nur dann kommutativ, wenn n = 1 ist.
Satz 63 : Es seien M eine Menge und A := Abb(M, K) die Menge aller
Abbildungen von M in den Körper K. Für f , g ∈ A und c ∈ K und x ∈ M sei
( f g)(x) := f (x)g(x) , ( f + g)(x) := f (x) + g(x)
und
(c · f )(x) := c( f (x)) .
Mit den Rechenoperationen
A × A −→ A , ( f , g) 7−→ f + g ,
A × A −→ A , ( f , g) 7−→ f g ,
K × A −→ A , (c, g) 7−→ c · g ,
(punktweise Addition, Multiplikation, Skalarmultiplikation) ist A eine kommutative K-Algebra.
Beweis: Übung.
Definition 49 : Es sei R ein Ring und S eine nichtleere Teilmenge von R.
Dann ist S eine Unterring von R, wenn 1 ∈ S und für alle a, b ∈ S auch die
Elemente
a + b , −a und ab
62
3. RECHNEN MIT ABBILDUNGEN
in S enthalten sind.
Es sei A eine K-Algebra und B eine nichtleere Teilmenge von A. Dann ist B
eine Unteralgebra von A, wenn B ein Unterring und ein Untervektorraum
von A ist.
Ein Unterring bzw. eine Unteralgebra ist mit den auf diese Teilmenge
eingeschränkten Rechenoperationen selbst ein Ring bzw. eine Algebra.
Satz 64 : Die Menge der polynomialen Abbildungen von K nach K ist eine
K-Unteralgebra der Algebra Abb(K, K) aller Abbildungen von K nach K.
Beweis: Seien f und g polynomiale Abbildungen und a0 , . . ., an bzw. b0 , . . . , bm
ihre Koeffizienten. Für alle z ∈ K ist dann f (z) = ∑ni=0 ai zi und g(z) =
∑mj=1 b j z j . Daher ist für alle z ∈ K
!
!
n
( f · g)(z) = f (z)g(z) =
n
=∑
m
∑ ai z
i
i=0
m
∑ b jz j
j=0
n+m
k
k=0
i=0
∑ aib j zi+ j = ∑ ∑ aibk−i
i=0 j=0
!
zk ,
also f · g eine polynomiale Abbildung. Die anderen Eigenschaften einer
Unteralgebra sind leicht nachzuprüfen.
63
3. RECHNEN MIT ABBILDUNGEN
3. Lineare Abbildungen
In diesem Abschnitt seien V und W Vektorräume über einem Körper K.
Definition 50 : Eine Abbildung f : V → W heißt K-linear, wenn die folgenden zwei Bedingungen erfüllt sind:
(1) Für alle v, w ∈ V ist f (v + w) = f (v) + f (w) .
(2) Für alle c ∈ K und für alle v ∈ V ist f (cv) = c f (v) .
Beispiel 23 : Die Nullabbildung
0 : V → W , v 7→ 0W ,
und die Identität
sind K-linear.
IdV : V → V , v 7→ v ,
Beispiel 24 : Für jede Matrix A ∈ K m×n ist die Abbildung
K n×1 → K m×1 , x 7→ Ax ,
K-linear. Später werden wir sehen, dass jede lineare Abbildung vom Vektorraum aller m-Spalten in den Vektorraum aller n-Spalten durch Multiplikation mit einer Matrix gegeben ist.
Satz 65 : Seien f : V → W eine lineare Abbildung, (vi )i∈I eine Familie von
Vektoren in V und (ci )i∈I eine Koeffizientenfamilie. Dann gilt
f (∑ ci vi ) = ∑ ci f (vi ) ,
i∈I
i∈I
d.h. man kann eine lineare Abbildung durch die Linearkombination durch”
ziehen“. Speziell ist
f (0V ) = 0W
und, für alle v ∈ V ,
f (−v) = − f (v) .
Beweis: Sei J := {i ∈ I | ci 6= 0}. Dann kann die Behauptung umgeschrieben werden in
f ( ∑ c j v j ) = ∑ c j f (v j ) ,
j∈J
j∈J
wobei jetzt alle Summen endlich sind. Wir beweisen diese Aussage durch
Induktion nach
` := #(J) .
64
3. RECHNEN MIT ABBILDUNGEN
Für ` = 1 ist f (c1 v1 ) = c1 f (v1 ) nach Definition.
Sei nun ` > 1. Wir wählen ein Element k ∈ J und erhalten auf Grund der
Linearität und der Induktionsannahme
f ( ∑ c j v j ) = f (ck vk + ∑ c j v j ) = f (ck vk ) + f ( ∑ c j v j )
j∈J
j6=k
= ck f (vk ) + ∑ c j f (v j ) =
j6=k
j6=k
∑ c j f (v j ) ,
j∈J
was den Induktionsbeweis beendet. Schließlich ist
f (−v) = f ((−1K )v) = (−1K ) f (v) = − f (v) .
Satz 66 : Seien U ein Vektorraum über K und f : U → V sowie
g : V → W lineare Abbildungen. Dann gilt:
(1) Die Zusammensetzung g ◦ f : U → W , u 7→ g( f (u)) , ist K-linear.
(2) Wenn f bijektiv ist, dann ist die Umkehrabbildung
f −1 : V → U auch K-linear.
( Die Zusammensetzung von linearen Abbildungen ist linear. Die Umkehr”
abbildung einer bijektiven linearen Abbildung ist linear.“)
Beweis: Für v, w ∈ U und c ∈ K ist
(1) (g ◦ f )(v + w) = g( f (v + w)) = g( f (v) + f (w)) =
g( f (v)) + g( f (w)) = (g ◦ f )(v) + (g ◦ f )(w),
(g ◦ f )(cv) = g( f (cv)) = g(c f (v)) = cg( f (v)) = c(g ◦ f )(v),
(2) f ( f −1 (v) + f −1 (w)) = ( f ◦ f −1 )(v) + ( f ◦ f −1 )(w) = v + w,
also f −1 (v + w) = f −1 (v) + f −1 (w), und
f (c f −1 (v)) = c( f ◦ f −1 )(v) = cv, also f −1 (cv) = c f −1 (v).
Definition 51 : Eine lineare und bijektive Abbildung von V nach W heißt
Isomorphismus von Vektorräumen. V und W heißen isomorph, wenn es
einen Isomorphismus von V nach W (oder von W nach V ) gibt. Schreibweise: V ∼
= W.
Satz 67 :
(1) Jeder Vektorraum V über K der Dimension n ist zum Standard-Vektorraum
K n isomorph.
Nach Wahl einer Basis v := (v1 , . . ., vn ) erhält man einen Isomorphismus durch die Koordinaten-Abbildung
V −→ K n , x 7→ Koordinatentupel von x bezüglich v .
(2) Zwei endlich-dimensionale Vektorräume über K sind genau dann isomorph, wenn ihre Dimensionen gleich sind.
65
3. RECHNEN MIT ABBILDUNGEN
Beweis: (1) Nach Satz 46 ist die Abbildung
n
K n → V , (c1 , . . . , cn ) 7→ ∑ ci vi ,
i=1
bijektiv. Man prüft leicht nach, dass sie auch linear ist. Nach Satz 66 ist
dann die Koordinaten-Abbildung als Umkehrabbildung linear und bijektiv,
also ein Isomorphismus.
(2) Seien V , W endlich-dimensionale Vektorräume über K. Wenn V und W
isomorph sind, dann gibt es eine bijektive lineare Abbildung
f : V → W . Sei (v1 , . . . , vn ) eine Basis von V . Man prüft leicht nach, dass
dann ( f (v1 ), . . ., f (vn )) eine Basis von W ist, also ist dimK (V ) = n = dimK (W ).
Sei umgekehrt dimK (V ) = dimK (W ) =: n. Dann gibt es nach (1) Isomorphismen f : V → K n und g : W → K n . Nach Satz 66 ist dann auch
g−1 ◦ f : V → W ein Isomorphismus.
4. Die Matrix einer linearen Abbildung
In diesem Abschnitt seien V ein Vektorraum über K mit Dimension
n ∈ N , v := (v1 , . . ., vn ) eine Basis von V , W ein Vektorraum über K mit
Dimension m ∈ N und w := (w1 , . . . , wm ) eine Basis von W .
Satz 68 : Seien u1 , . . . , un ∈ W . Dann gibt es genau eine lineare Abbildung
f : V → W mit
f (vi ) = ui , 1 ≤ i ≤ n .
Somit kann eine lineare Abbildung zwischen Vektorräumen durch (beliebige) Vorgabe der Bilder einer Basis eindeutig definiert werden.
Beweis: Wenn eine derartige Abbildung f existiert, dann ist für einen Vektor x = ∑ni=1 ci vi ∈ V
n
f (x) = f ( ∑ ci vi ) =
i=1
n
n
i=1
i=1
∑ ci f (vi) = ∑ ciui ,
was die Eindeutigkeit der Abbildung beweist.
Um die Existenz einer solchen Abbildung zu zeigen, definieren wir eine
Abbildung f : V → W durch
n
f (x) :=
∑ ci u i ,
i=1
wobei c1 , . . ., cn ∈ K die Koordinaten von x ∈ V bezüglich der Basis v sind.
Dann ist f K-linear, weil für x = ∑ni=1 ci vi , y = ∑ni=1 di vi und t ∈ K wegen
x + y = ∑ni=1 (ci + di )vi und tx = ∑ni=1 (tci )vi
n
f (x + y) = ∑ (ci + di )ui =
i=1
n
n
i=1
i=1
∑ ciui + ∑ diui = f (x) + f (y)
66
3. RECHNEN MIT ABBILDUNGEN
sowie
f (tx) =
n
n
i=1
i=1
∑ tciui = t ∑ ciui
!
= t f (x)
ist. Schließlich gilt wegen v j = ∑ni=1 δi j vi für alle 1 ≤ j ≤ n:
n
f (v j ) = ∑ δi j ui = u j .
i=1
Definition 52 : Seien y ∈ V und c1 , . . . , cn ∈ K die Koordinaten von y bei
v1 , . . ., vn , also
n
y = ∑ ci vi .
i=1
Dann heißt die Spalte
 
c1
c :=  ...  ∈ K n×1
cn
die Koordinatenspalte von y bezüglich v.
Definition 53 : Seien f : V → W eine K-lineare Abbildung und
A1 j , . . . , Am j die Koordinaten von f (v j ) bezüglich w , d.h.
m
f (v j ) = ∑ Ai j wi , 1 ≤ j ≤ n .
i=1
Dann heißt
M( f , v, w) := (Ai j )1≤i≤m ∈ K m×n
1≤ j≤n
die Matrix von f bezüglich der Basen v und w.
Die j-te Spalte von M( f , v, w) ist also die Koordinatenspalte von f (v j )
bezüglich w.
Im Spezialfall V = W und v = w schreibt man statt M( f , v, v) kurz
M( f , v).
Beispiel 25 : Für 1 ≤ j ≤ n ist
IdV (v j ) = v j =
n
∑ δi j vi
i=1
und somit
M(IdV , v) = In .
Beispiel 26 : Sei A ∈ K m×n . Dann ist die Matrix der linearen Abbildung
K n×1 → K m×1 , x 7→ Ax ,
67
3. RECHNEN MIT ABBILDUNGEN
bezüglich der Standardbasen e = (e1 , . . ., en ) von K n×1 und
e0 = (e01 , . . . , e0m ) von K m×1 gleich A, weil für 1 ≤ j ≤ n
m
Ae j = A− j =
∑ Ai j e0i
i=1
ist. Daher ist jede lineare Abbildung von K n×1 nach K m×1 durch Multiplikation mit einer eindeutig bestimmten Matrix A ∈ K m×n gegeben. Oft
identifiziert man eine m × n-Matrix mit dieser linearen Abbildung.
Satz 69 : Seien U ein Vektorraum über K der Dimensionen ` mit Basis u
und f : V → W sowie g : W → U K-lineare Abbildungen. Dann ist
M(g ◦ f , v, u) = M(g, w, u) · M( f , v, w) ,
d.h. der Zusammensetzung von linearen Abbildungen entspricht die
Multiplikation der zugehörigen Matrizen.
Beweis: Seien A := M( f , v, w) ∈ K m×n und B := M(g, w, u) ∈ K `×m . Dann
ist für 1 ≤ j ≤ n
m
m
(g ◦ f )(v j ) = g( f (v j )) = g( ∑ Ai j wi ) = ∑ Ai j g(wi )
i=1
i=1
m
=
`
`
m
k=1
i=1
∑ Ai j ∑ Bkiuk = ∑ ∑ BkiAi j
i=1
k=1
!
uk
`
=
∑ (BA)k j uk ,
k=1
also BA = M(g ◦ f , v, u).
Satz 70 : Die lineare Abbildung f : V → W ist genau dann ein Isomorphismus, wenn die Matrix M( f , v, w) invertierbar ist. In diesem Fall ist
M( f −1 , w, v) = M( f , v, w)−1 .
Beweis: Wenn f ein Isomorphismus ist, dann ist nach Satz 66 die Umkehrabbildung f −1 linear und nach Satz 67 ist n = m. Aus f −1 ◦ f = IdV und
f ◦ f −1 = IdW folgt nach Satz 69
und
M( f −1 , w, v) · M( f , v, w) = M( f −1 ◦ f , v, v) = M(IdV , v, v) = In
M( f , v, w) · M( f −1 , w, v) = M( f ◦ f −1 , w, w) = M(IdW , w, w) = Im .
Wenn umgekehrt A := M( f , v, w) ∈ K m×n invertierbar ist, dann ist m = n
und es existiert B := A−1 ∈ K n×n . Definiert man nach Satz 68 eine lineare
68
3. RECHNEN MIT ABBILDUNGEN
Abbildung g : W → V durch
n
g(w j ) := ∑ Bi j vi
i=1
für 1 ≤ j ≤ n, so folgt nach Satz 69
und
M(g ◦ f , v, v) = M(g, w, v) · M( f , v, w) = BA = In = M(IdV , v, v)
M( f ◦ g, w, w) = M( f , v, w) · M(g, w, v) = AB = In = M(IdW , w, w) .
Daher ist g ◦ f = IdV und f ◦ g = IdW nach Satz 68, also f ein Isomorphismus und g = f −1 .
Nach Wahl von Basen im Definitionsbereich und im Bildbereich einer
linearen Abbildung ist diese eindeutig durch ihre Matrix bestimmt. Anstatt
mit linearen Abbildungen kann mit den entsprechenden Matrizen gerechnet
werden. Der Zusammensetzung von linearen Abbildungen entspricht die
Matrizenmultiplikation, dem Berechnen der Umkehrabbildung entspricht
das Invertieren von Matrizen.
69
3. RECHNEN MIT ABBILDUNGEN
5. Basiswechsel
In diesem Abschnitt seien V ein Vektorraum über K mit Dimension
n ∈ N , v := (v1 , . . ., vn ) eine Basis von V , W ein Vektorraum über K mit
Dimension m ∈ N und w := (w1 , . . . , wm ) eine Basis von W .
Definition 54 : Seien p und q positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p
ein p-Tupel von Vektoren in V . Für T ∈ K p×q sei
p
uT := (uT )1 , . . . , (uT )q :=
p
∑ Ti1ui, . . . , ∑ Tipui
i=1
i=1
!
∈ V q.
Die Bezeichnung uT ist eine Merkhilfe, weil man analog zur Matrizenrechnung über K den Vektor (uT ) j nach der Regel
Zeile u mal Spalte T− j“
”
berechnet.
Beispiel 27 : Sei c ∈ K n×1 . Dann ist vc ∈ V und c ist die Koordinatenspalte
von vc bezüglich v.
Satz 71 : Seien p, q, r positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p . Dann gilt:
(1) uI p = u
(2) Für T ∈ K p×q und U ∈ K q×r ist u(TU ) = (uT )U .
(3) Für T ∈ GL p (K) und u0 := uT gilt u = u0 T −1 .
Beweis: (1) gilt nach Definition, (2) rechnet man nach und (3) folgt aus
u = uIm = u(T T −1 ) = (uT )T −1 = u0 T −1 .
Satz 72 : Sei u := (u1 , . . . , uq ) ∈ V q . Dann gilt:
(1) Es gibt genau eine Matrix T ∈ K n×q mit
u = vT .
Diese Matrix T heißt die Transformationsmatrix von v zu u, und die
Spalten von T sind die Koordinatenspalten von
u1 , . . . , uq bezüglich v.
(2) Die Familie u ist genau dann eine Basis von V , wenn T invertierbar
ist.
Beweis: Übung.
70
3. RECHNEN MIT ABBILDUNGEN
Beispiel 28 : Seien f : V → W eine K-lineare Abbildung und
A := M( f , v, w) ∈ K m×n
die Matrix von f bezüglich v und w. Dann ist A die Transformationsmatrix
von w zu f (v) := ( f (v1 ), . . ., f (vn )), also
f (v) = wA .
Satz 73 : Seien u eine Basis von V und T ∈ GLn (K) die Transformationsmatrix von v zu u. Ist c die Koordinatenspalte von y ∈ V bezüglich v, dann
ist
T −1 c
die Koordinatenspalte von y bezüglich w , d.h. bei Basiswechsel mit der
Matrix T transformieren sich die Koordinaten“ mit der Matrix T −1 .
”
Beweis: Es ist y = vc = (uT −1 )c = u(T −1 c).
Satz 74 : Seien f : V → W eine K-lineare Abbildung,
A := M( f , v, w) ∈ K m×n
die Matrix von f bezüglich v und w und c ∈ K n×1 die Koordinatenspalte des
Vektors y ∈ V bezüglich der Basis v , d.h.
y = vc .
Dann ist Ac ∈ K m×1 die Koordinatenspalte von f (u) bezüglich der Basis w,
d.h.
f (y) = w(Ac) .
Beweis: Es ist
n
f (y) = f ( ∑ c j v j ) =
j=1
m
=
∑
i=1
n
n
∑ c j f (v j ) =
j=1
!
∑ Ai j c j w i =
j=1
n
m
j=1
i=1
∑ c j ∑ Ai j w i
m
∑ (Ac)iwi = w(Ac) .
i=1
Satz 75 : Sei f : V → W eine K-lineare Abbildung mit Matrix
A := M( f , v, w) ∈ K m×n .
Seien v0 eine weitere Basis von V , w0 eine weitere Basis von W , T ∈ GLn (K)
die Transformationsmatrix von v zu v0 und S ∈ GLm (K) die Transformationsmatrix von w zu w0 . Dann ist
M( f , v0 , w0 ) = S−1 AT .
71
3. RECHNEN MIT ABBILDUNGEN
Im Spezialfall V = W , v = w und v0 = w0 ist S = T und
M( f , v0 ) = T −1 AT .
Beweis: Nach Satz 74 ist für 1 ≤ j ≤ n
f (v0j ) = f (vT− j ) = wAT− j = (wS)(S−1 AT− j ) = w0 (S−1 AT )− j .
Definition 55 : Zwei Matrizen A, B ∈ K n×n heißen ähnlich, wenn es eine
Matrix T ∈ GLn (K) gibt mit
B = T −1 AT .
Zum Beispiel sind nach Satz 75 die Matrizen M( f , v) und M( f , v0 ) einer
linearen Abbildung f : V → V ähnlich.
Satz 76 : Sei f : V → V eine K-lineare Abbildung mit Matrix
A := M( f , v) ∈ K n×n .
Wenn B ähnlich zu A ist, dann gibt es eine Basis v0 von V mit
M( f , v0 ) = B .
Beweis: Sei T ∈ GLn (K) so, dass B = T −1 AT ist. Setze v0 := vT . Nach Satz
75 ist dann M( f , v0 ) = T −1 AT = B.
Ähnliche Matrizen beschreiben (bezüglich verschiedener Basen) dieselbe lineare Abbildung. Wird ein physikalisches Phänomen durch eine Abbildung von einem endlichdimensionalen Vektorraum V nach V beschrieben
und diese (nach Wahl einer Basis von V ) durch eine Matrix, dann haben
nur jene Eigenschaften dieser Matrix physikalische Bedeutung“, die sich
”
beim Übergang zu einer ähnlichen Matrix nicht ändern. Ein Beispiel für
eine solche Eigenschaft von Matrizen ist die Spur“.
”
Definition 56 : Sei A ∈ K n×n . Dann heißt
n
spur(A) := ∑ Aii
i=1
die Spur von A.
Satz 77 :
(1) Die Abbildung spur : K n×n −→ K ist linear.
(2) Für A, B ∈ K n×n gilt: spur(AB) = spur(BA) .
72
3. RECHNEN MIT ABBILDUNGEN
(3) Für A ∈ K n×n und T ∈ GLn (K) gilt:
spur(T −1 AT ) = spur(A).
(4) Seien V ein endlich-dimensionaler Vektorraum über K mit Basis v
und f : V → V eine lineare Abbildung mit Matrix A bezüglich v. Dann
ist
spur( f ) := spur(A)
unabhängig von der Wahl der Basis v und heißt Spur von f .
Beweis: (1) und (2) nachrechnen, (3) folgt aus (2), (4) aus (3).
KAPITEL 4
Polynome
In diesem Kapitel wird mit K immer ein Körper bezeichnet.
1. Der Polynomring
Definition 57 : Eine Folge (ci )i∈ N in K ist eine endliche Folge, wenn es
nur endlich viele Indizes i mit ci 6= 0 gibt.
Durch jede endliche Folge wird eine polynomiale Abbildung definiert.
Im Computer wird man daher diese Abbildungen durch endliche Folgen
darstellen. Allerdings können verschiedene endliche Folgen dieselbe polynomiale Abbildung definieren. Um den daraus entstehenden Problemen
zu entgehen, betrachten wir zunächst statt der Abbildungen die endlichen
Folgen. Wir definieren für sie Rechenoperationen, die den punktweisen Rechenoperationen für polynomiale Abbildungen entsprechen.
Satz 78 : Die Menge P aller endlichen Folgen in K mit den Abbildungen
+ : P × P −→ P
,
· : P × P −→ P
,
((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N + (di )i∈ N := (ci + di )i∈ N ,
i
((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N · (di )i∈ N := ( ∑ c j di− j )i∈ N ,
j=0
und
· : K × P −→ P , (c, (di )i∈ N ) 7−→ c · (di )i∈ N := (cdi )i∈ N ,
ist eine kommutative K-Algebra. Sie heißt Polynomring über K oder Algebra der Polynome mit Koeffizienten in K. Ihre Elemente heißen Polynome
mit Koeffizienten in K. Das Nullelement des Polynomringes ist die Folge
0 := (0, 0, 0, . . .), das Einselement ist die Folge 1 := (1, 0, 0, . . .).
Beweis: Übung.
Definition 58 : Es sei f = (c0 , c1 , c2 , . . .) 6= 0 ein Polynom mit Koeffizienten in K. Der Grad von f ist der größte Index i mit ci 6= 0 und wird mit
73
74
4. POLYNOME
gr( f ) bezeichnet. Das Element ci heißt i-ter Koeffizient von f . Der Koeffizient cgr( f ) heißt Leitkoeffizient von f und wird mit lk( f ) bezeichnet. Das
Polynom f heißt normiert, wenn lk( f ) = 1.
Die folgende Schreibweise ist zweckmäßig: Wir wählen irgendein Symbol,
zum Beispiel x, und schreiben
gr( f )
c0 + c1 x + c2 x2 + . . . + cgr( f ) xgr( f ) =
∑ ci xi
statt
(c0 , c1 , c2 , . . .) .
i=0
Wir sprechen dann von einem Polynom in der Variablen x mit Koeffizienten
in K. Für den Polynomring über K schreiben wir dann K[x]. Wir identifizieren Polynome vom Grad 0 mit ihrem nullten Koeffizienten und fassen K so
als Teilmenge von K[x] auf.
Statt Polynom mit Koeffizienten in K“ schreiben wir im weiteren nur Po”
”
lynom“.
Satz 79 : Es seien f 6= 0, g 6= 0 Polynome.
(1)
(2)
(3)
(4)
f g 6= 0
gr( f g) = gr( f ) + gr(g) und lk( f g) = lk( f ) · lk(g)
Wenn f + g 6= 0, dann ist gr( f + g) ≤ max(gr( f ), gr(g)) .
Das Polynom f ist genau dann invertierbar, wenn gr( f ) = 0 ist.
Beweis: Übung .
Satz 80 : (Division mit Rest von Polynomen)
Es seien f und g Polynome und g 6= 0. Dann gibt es eindeutig bestimmte
Polynome m und r mit den Eigenschaften
f = m·g+r
und
(r = 0 oder gr(r) < gr(g))
.
Die Polynome m bzw. r heißen polynomialer Quotient von f und g bzw.
Rest von f nach Division durch g. Die Polynome m und r können mit dem
folgenden Verfahren (Divisionsalgorithmus) berechnet werden:
• Setze m := 0 und r := f .
• Solange gr(r) ≥ gr(g) ist, ersetze m durch
m + lk(r) · lk(g)−1xgr(r)−gr(g)
und r durch
r − lk(r) · lk(g)−1xgr(r)−gr(g) g .
Beweis: Übung (analog dem Beweis des Satzes über die Division mit Rest
von ganzen Zahlen).
75
4. POLYNOME
Aus diesem Satz folgt, dass Polynomringe über Körpern und der Ring der
ganzen Zahlen algebraisch betrachtet“ einander sehr ähnlich sind.
”
Satz 81 : Es seien ( fi )i∈ N eine Familie von Polynomen so, dass für alle
i∈ N
gr( fi ) = i
ist. Dann ist ( fi )i∈ N eine K-Basis des Polynomrings über K.
Beweis: Sei (ci )i∈ N 6= 0 eine Koeffizientenfamilie in K. Sei k die größte
Zahl so, dass ck 6= 0 ist. Wegen gr( fk ) = k ist
ck · lk( fk ) = lk( ∑ ci fi ) 6= 0 ,
i∈ N
also auch ∑i∈ N ci fi 6= 0. Daher ist ( fi )i∈ N linear unabhängig.
Es sei h 6= 0 ein Polynom. Wir zeigen durch Induktion über gr(h), dass h
eine K-Linearkombination von ( f i )i∈ N ist.
Wenn gr(h) = 0 ist, dann ist h = lk(h) · lk( f 0)−1 · f0 .
Sei j := gr(h) > 0. Division mit Rest von h durch f j ergibt h = m · f j + r
mit r = 0 oder gr(r) < gr(h). Dann ist
j = gr(h) = gr(m · f j ) = gr(m) + j ,
also gr(m) = 0 und m ∈ K. Nach Induktionsannahme ist r eine K-Linearkombination
von ( fi )i∈ N , daher auch h.
Beispiel 29 : Die Familie (xi )i∈ N ist eine K-Basis von K[x] .
Für jedes Element a ∈ K ist ((x − a)i )i∈ N eine K-Basis von K[x] . Daher gibt
es für jedes Polynom h ∈ K[x] mit n := gr(h) eindeutig bestimmte Elemente
c0 , . . ., cn ∈ K so, dass
n
h=
∑ ci(x − a)i
i=0
ist.
2. Nullstellen von Polynomen
Definition 59 : Seien f = ∑ni=0 ci xi ∈ K[x] , A eine K-Algebra und a ∈ A.
Dann ist
n
f (a) :=
∑ ci a i ∈ A .
i=0
Sprechweise: f (a) ∈ A erhält man durch Einsetzen von a in f . Das Element a ist genau dann eine Nullstelle von f in A, wenn f (a) = 0 ist. Die
76
4. POLYNOME
polynomiale Abbildung
n
K −→ K , a 7−→ f (a) = ∑ ci ai ,
i=0
heißt die durch f definierte (polynomiale) Abbildung und wird oft wieder
mit f bezeichnet.
Definition 60 : Es seien f,g Polynome mit g 6= 0. Dann ist f Teiler von
g (oder: f teilt g), wenn es ein Polynom h ∈ K[x] gibt mit g = f h. Das
Polynom g heißt Vielfaches von f , wenn f ein Teiler von g ist.
Satz 82 :
(1) Ein Element a ∈ K ist genau dann Nullstelle eine Polynoms f ∈ K[x] ,
wenn das Polynom x − a ein Teiler von f ist.
(2) Jedes von Null verschiedene Polynom f ∈ K[x] hat in K
höchstens gr( f ) Nullstellen.
(3) Es seien f und g Polynome mit f 6= g. Dann haben die Graphen
(in K × K) der durch f und g definierten polynomialen Abbildungen
höchstens max(gr( f ), gr(g)) gemeinsame Elemente.
(4) Wenn K unendlich viele Elemente enthält, dann sind die Koeffizienten einer polynomialen Abbildung von K nach K eindeutig bestimmt.
Insbesondere müssen in diesem Fall Polynome und polynomiale Abbildungen nicht unterschieden werden.
Beweis:
(1) Division mit Rest von f durch x − a ergibt f = m · (x − a) + r, wobei
r = 0 oder gr(r) = 0, also r ∈ K ist. Daher ist
f (a) = m(a) · 0 + r = r ,
somit ist f (a) = 0 genau dann, wenn r = 0 ist.
(2) Wir beweisen die Aussage durch Induktion über n := gr( f ).
Wenn n = 0 ist, dann hat f wegen f 6= 0 keine Nullstellen.
Sei n > 0 und sei a ∈ K eine Nullstelle von f . Nach (1) gibt es ein
Polynom h ∈ K[x] mit f = (x − a) · h. Dann ist gr(h) = n − 1, nach
Induktionsvoraussetzung hat h daher höchstens n − 1 Nullstellen. Jede Nullstelle von (x − a) · h ist eine Nullstelle von h oder gleich a.
Daraus folgt die Behauptung.
(3) Die Menge der gemeinsamen Elemente der Graphen der durch f und
g definierten Abbildungen ist
{(a, f (a))| f (a) = g(a)} ,
ihre Anzahl ist daher die Anzahl der Nullstellen von f − g. Nach (2)
ist diese höchstens max(gr( f ), gr(g)).
77
4. POLYNOME
(4) Es seien f , g zwei Polynome so, dass für alle a ∈ K gilt: f (a) = g(a).
Da K unendlich ist, hat dann f − g beliebig viele Nullstellen. Nach
(2) ist daher f = g.
3. Interpolation
In diesem Abschnitt seien t0 , . . . ,tn paarweise verschiedene Elemente
von K und y0 , . . . , yn Elemente von K. Wir suchen ein Polynom f ∈ K[x]
mit der Eigenschaft
f (ti ) = yi , 0 ≤ i ≤ n .
Ein solches Polynom heißt interpolierendes Polynom. Die Elemente t 0 , . . . ,tn
heißen Stützstellen und y0 , . . . , yn Werte der Interpolationsaufgabe.
Satz 83 : (Lagrange-Interpolation) Es gibt genau ein interpolierendes Polynom vom Grad ≤ n und zwar
n
∑ yi · f i ,
i=0
wobei
1
· (x − t j ) ∈ K[x]
j6=i ti − t j
fi := ∏
ist, 0 ≤ i ≤ n .
Beweis: Für 0 ≤ i, k ≤ n ist fi (tk ) = δik . Daher ist für 0 ≤ k ≤ n
n
n
i=0
i=0
( ∑ yi · fi )(tk ) = ∑ yi δik = yk .
Der Grad von fi ist n, also ist der Grad von ∑ni=0 yi · fi kleiner oder gleich n.
Wenn f und g interpolierende Polynome vom Grad ≤ n sind, dann sind
die Elemente t0 , . . . ,tn Nullstellen von f − g. Aus Satz 82 folgt daher f = g.
78
4. POLYNOME
Satz 84 : (Newton-Interpolation) Das interpolierende Polynom kann wie
folgt berechnet werden:
• Setze k := 0 und h0 := y0 .
• Solange k < n ist, ersetze k durch k + 1, und setze
yk − hk−1 (tk )
ck := k−1
∏i=0 (tk − ti )
und
k−1
hk := hk−1 + ck ∏ (x − ti ) .
i=0
• Das interpolierende Polynom ist dann hn .
Beweis: Übung.
4. Der Euklidische Algorithmus für Polynome
Definition 61 : Es seien f1 , . . . , fn von Null verschiedene Polynome. Das
normierte Polynom größten Grades, das f 1 , . . . , fn teilt, heißt
größter gemeinsamer Teiler von f 1 , . . . , fn und wird mit
ggT ( f1 , . . . , fn ) bezeichnet. Das normierte Polynom kleinsten Grades, das
von f1 , . . . , fn geteilt wird, heißt kleinstes gemeinsames Vielfaches von f 1 , . . ., fn
und wird mit kgV ( f1 , . . . , fn ) bezeichnet.
Hilfssatz 7 : Es seien f , g, h Polynome, f 6= 0, g 6= 0 und f 6= h · g. Dann ist
ggT ( f , g) = ggT ( f − h · g, g) .
Beweis: Wenn t ein Teiler von f und g ist, dann gibt es Polynome u, v so,
dass f = t · u und g = t · v ist. Daher ist f − h · g = t · u − h ·t · v = t · (u − h · v),
also t auch ein Teiler von f − h · g.
Satz 85 : (Euklidischer Algorithmus für Polynome)
Es seien f , g Polynome, f 6= 0 und g 6= 0. Mit dem folgenden Verfahren kann
der größte gemeinsame Teiler von f und g berechnet werden:
• Solange keines der zwei Polynome ein Teiler der anderen ist, ersetze das Polynom größeren (oder gleichen) Grades durch seinen Rest
nach Division durch das andere.
• Wenn h, eines der zwei Polynome, ein Teiler des anderen ist, dann ist
ggT ( f , g) = lk(h)−1 h.
Beweis: Es seien a und b die Grade von f und g. Sei a ≥ b. Wenn f und g
verschieden sind, wird f im nächsten Schritt durch ein Polynom kleineren
79
4. POLYNOME
Grades ersetzt. Also liefert das Verfahren nach höchstens max(a, b) Schritten ein Ergebnis. In jedem Schritt wird ein Paar von Polynomen durch ein
anderes ersetzt, nach Hilfssatz 7 aber so, dass die größten gemeinsamen
Teiler der zwei Polynompaare gleich sind. Sobald eines der zwei Polynome
das andere teilt, ist dieses c · ggT ( f , g), für ein 0 6= c ∈ K.
Satz 86 : (Erweiterter Euklidischer Algorithmus)
Es seien f , g Polynome, f 6= 0 und g 6= 0. Es gibt Polynome u, v so, dass u f +
vg = ggT ( f , g) ist. Diese können mit dem folgenden Verfahren berechnet
werden:
• Setze A := (A1 , A2 , A3 ) := ( f , 1, 0) ∈ K[x] 3 und
B := (B1 , B2 , B3 ) := (g, 0, 1) ∈ K[x] 3 .
• Solange B1 das Polynom A1 nicht teilt, berechne den polynomialen
Quotienten m von A1 und B1 und setze C := B, B := A − mC := (A1 −
mC1 , A2 − mC2 , A3 − mC3 ) und A := C.
• Wenn B1 das Polynom A1 teilt, dann ist u := lk(B1 )−1 · B2 und v :=
lk(B1 )−1 · B3 .
Beweis: Wenn zwei Tripel von Polynomen S und T die Eigenschaft
S1 = f · S 2 + g · S 3
bzw. T1 = f · T2 + g · T3
haben, dann auch alle Tripel S − hT mit h ∈ K[x] . Die ersten zwei Tripel im
Algorithmus haben diese Eigenschaft, daher auch alle anderen auftretenden
Tripel. Für die ersten Komponenten der Tripel wird der euklidische Algorithmus durchgeführt, für das letzte Tripel B gilt daher lk(B1 ) · ggT ( f , g) =
f · B2 + g · B 3 .
Satz 87 : (Berechnung von kgV ( f , g))
Es seien f , g Polynome, f 6= 0 und g 6= 0. Sei z := lk( f )−1 lk(g)−1 ∈ K. Dann
ist
z· f
z·g
kgV ( f , g) =
·g =
·f .
ggT ( f , g)
ggT ( f , g)
Beweis: Es ist klar, dass ggTz·(ff ,g) · g = ggTz·g
( f ,g) · f ein Vielfaches von f und
von g ist. Sei h ein Polynom, das Vielfaches von f und von g ist. Dann gibt
es Polynome c, d mit h = c · f und h = d · g. Nach Satz 86 gibt es Polynome
u, v so, dass u · f + v · g = ggT ( f , g) ist. Dann ist
h=
=
u· f
v·g
u· f +v·g
·h =
·h+
·h =
ggT ( f , g)
ggT ( f , g)
ggT ( f , g)
f ·g
u· f ·d·g v·g·c· f
+
=
· (u · d + v · c) =
ggT ( f , g) ggT ( f , g) ggT ( f , g)
80
4. POLYNOME
=
ein Vielfaches von
z· f ·g
· z−1 · (u · d + v · c)
ggT ( f , g)
z· f ·g
.
ggT ( f , g)
Satz 88 : ( Lösen einer linearen Gleichung, deren Koeffizienten Polynome
”
sind“) Es seien f1 , . . . , fn von Null verschiedene Polynome, g := ggT ( f 1 , . . . , fn )
und h ein Polynom. Es ist
ggT ( f1 , . . ., fn ) = ggT ( f1 , ggT ( f2 , ggT ( f3 , ggT (. . ., fn ) . . .)) ,
also kann der größte gemeinsame Teiler mehrerer Polynome durch sukzessives Berechnen des größten gemeinsamen Teilers von je zwei Polynomen
berechnet werden.
Es gibt genau dann ein n-Tupel (x1 , . . . , xn ) von Polynomen mit
f 1 · x1 + . . . + f n · xn = h ,
wenn h ein Vielfaches von g ist. In diesem Fall kann ein solches n-Tupel wie
folgt berechnet werden:
• Berechne mit Satz 86 Polynome u1 , . . . , un so, dass
f1 · u1 + . . . + fn · un = g ist.
• Setze xi := ui · hg , 1 ≤ i ≤ n.
Beweis: Für jedes n-Tupel (x1 , . . . , xn ) von Polynomen wird f 1 · x1 + . . . +
fn · xn von g geteilt. Also ist die Bedingung, dass h ein Vielfaches von g ist,
notwendig für die Existenz einer Lösung. Wenn diese Bedingung erfüllt ist,
ist leicht nachzuprüfen, dass (u1 · gh , . . . , un · hg ) eine Lösung ist.
5. Irreduzible Polynome
Definition 62 : Ein Polynom f ∈ K[x] ist genau dann irreduzibel, wenn
f 6∈ K ist und wenn f in K[x] keine Teiler hat, deren Grad größer als 0 und
kleiner als gr( f ) ist.
Beispiel 30 : Alle Polynome mit Grad 1 sind irreduzibel.
Hilfssatz 8 : Es sei f ∈ K[x] ein irreduzibles Polynom mit Koeffizienten
in einem Körper K. Wenn f das Produkt zweier Polynome teilt, dann auch
eines dieser zwei Polynome.
Beweis: Es seien g, h ∈ K[x] so, dass f das Polynom gh teilt. Wir nehmen an, dass f das Polynom g nicht teilt. Weil f irreduzibel ist, ist dann
81
4. POLYNOME
ggT ( f , g) = 1. Nach Satz 86 gibt es Polynome u, v mit
u f + vg = 1. Weil f ein Teiler von u f h und vgh ist, teilt es auch h = 1 · h =
u f h + vgh.
Satz 89 : Zu jedem Polynom f ∈ K[x] mit positivem Grad gibt es bis auf die
Reihenfolge eindeutig bestimmte normierte irreduzible Polynome f 1 , . . ., fn
so, dass
n
f = lk( f ) ∏ fi
i=1
ist.
Beweis: Es sei 0 6= f ∈ K[x] ein Polynom mit positivem Grad. Wir zeigen
die Existenz einer Zerlegung in irreduzible Faktoren durch Induktion über
gr( f ).
Wenn gr( f ) = 1 ist, dann ist f irreduzibel.
Wenn gr( f ) > 1 ist, dann ist f entweder irreduzibel oder es gibt Polynome
g, h mit positivem Grad so, dass f = gh ist. Dann sind die Grade von g und h
aber kleiner als der von f . Nach Induktionsannahme sind g und h Produkte
von irreduziblen Elementen, also auch f .
Wenn f = p1 p2 . . . pn und f = q1 q2 . . . qm zwei Zerlegungen von f in irreduzible Elemente sind, dann gibt es nach Hilfssatz 8 einen Index j so, dass
q j das irreduzible Polynom pn teilt. Es gibt also ein invertierbares Element
u in K[x] so, dass pn = uq j ist. Daher ist
g := up1 p2 . . . pn−1 =
∏
qi .
1≤i≤m, i6= j
Der Grad von g ist kleiner als der von f , daher folgt aus der Induktionsannahme die Eindeutigkeit der irreduziblen Faktoren von g bis auf die Reihenfolge und Assoziiertheit. Wegen pn = uq j folgt daraus die Behauptung.
Satz 90 : In jedem Polynomring über einem Körper gibt es unendlich viele
normierte irreduzible Polynome.
Wenn K ein Körper mit endlich vielen Elementen ist, gibt es zu jeder natürlichen Zahl n unendlich viele normierte irreduzible Polynome in K[x] , deren
Grad größer als n ist.
Beweis: Wenn es nur endlich viele normierte irreduzible Polynome gäbe,
dann wäre ihr Produkt q ein Polynom und der Grad von q + 1 wäre größer
(oder gleich, wenn es nur ein normiertes irreduzibles Polynom gibt) als der
jedes irreduziblen Polynoms. Insbesondere wäre q + 1 kein normiertes irreduzibles Polynom. Nach Satz 89 gibt es ein normiertes irreduzibles Polynom p, das q + 1 teilt. Da p auch q teilt, würde p dann auch 1 teilen,
82
4. POLYNOME
Widerspruch.
Wenn K ein endlicher Körper und n eine natürliche Zahl ist, gibt es nur
endlich viele Polynome, deren Grad kleiner oder gleich n ist. Daraus folgt
die zweite Behauptung.
6. Die Anzahl der Nullstellen eines Polynoms
Im Satz 82 wurde eine obere Schranke für die Anzahl der Nullstellen
eines Polynoms angegeben, diese kann aber viel zu groß sein. Zum Beispiel
hat das Polynom xn für jedes n ∈ N in K nur eine Nullstelle.
Definition 63 : Es seien f 6= 0 ein Polynom mit Koeffizienten in K und a
eine Nullstelle von f in K. Die Vielfachheit der Nullstelle a von f ist die
größte ganze Zahl n mit der Eigenschaft, dass (x − a)n ein Teiler von f ist.
Eine Nullstelle ist einfach, wenn ihre Vielfachheit 1 ist, und mehrfach, wenn
ihre Vielfachheit größer als 1 ist.
Satz 91 : Die Abbildung
D : K[x] −→ K[x]
,
n
n
i=0
i=1
∑ cixi 7−→ ∑ icixi−1
heißt Differentiation oder Ableitung. Sie ist K-linear und erfüllt die Produktregel
für alle Polynome f , g ist D( f · g) = f · D(g) + D( f ) · g .
Insbesondere ist für alle positiven ganzen Zahlen k und alle Polynome f ∈
K[x]
D( f k ) = k · f k−1 · D( f ) .
Beweis: Übung.
Definition 64 : Für c ∈ K und a ∈ Z sei
a · c := vz(a)c + . . . + vz(a)c .
|
{z
}
|a| Summanden
Wenn für alle positiven ganzen Zahlen n gilt: n · 1 6= 0, dann ist K ein Körper
der Charakteristik 0. Schreibweise: char(K) = 0.
Wenn es eine positive ganze Zahl n mit n · 1 = 0 gibt und p die kleinste
positive ganze Zahl mit dieser Eigenschaft ist, dann ist K ein Körper der
Charakteristik p. Schreibweise: char(K) = p. Es ist leicht zu sehen, dass p
in diesem Fall eine Primzahl sein muss.
83
4. POLYNOME
Beispiel 31 : Q hat Charakteristik 0, Z p hat Charakteristik p.
Satz 92 : Es sei f 6= 0 ein Polynom.
(1) Ein Element a ∈ K ist genau dann eine mehrfache Nullstelle von f ,
wenn
f (a) = 0 und D( f )(a) = 0 ist.
(2) Wenn char(K) = 0 ist, dann hat das Polynom
f
ggT ( f , D( f ))
nur einfache Nullstellen und zwar genau die Nullstellen von f .
(3) Wenn char(K) = 0 ist, dann hat das Polynom f höchstens
gr( f ) − gr(ggT ( f , D( f )))
Nullstellen in K.
Beweis:
(1) Wenn a eine mehrfache Nullstelle von f ist, dann gibt es ein Polynom
h ∈ K[x] so, dass f = (x − a)2 · h. Dann ist
D( f ) = 2(x − a) · h + (x − a)2 · D(h) =
= (x − a) · (2h + (x − a) · D(h)) ,
also a eine Nullstelle von D( f ).
Sei nun umgekehrt a eine Nullstelle von f und von D( f ). Wir dividieren f mit Rest durch (x − a)2 :
f = m · (x − a)2 + r , gr(r) < 2 .
Dann ist
D( f ) = D(m) · (x − a)2 + 2m · (x − a) + D(r) .
Aus f (a) = 0 folgt 0 = r(a), also ist r = 0 oder
r = lk(r) · (x − a). Aus D( f )(a) = 0 folgt D(r) = 0. Daher ist r = 0
und (x − a)2 ein Teiler von f .
(2) Sei a eine Nullstelle von f und n ihre Vielfachheit. Dann gibt es ein
Polynom h mit f = (x − a)n · h und h(a) 6= 0. Wegen
D( f ) = n · (x − a)n−1 · h + (x − a)n · D(h) =
= (x − a)n−1 · (n · h + (x − a) · D(h))
wird ggT ( f , D( f )) von (x − a)n−1 geteilt. Wegen h(a) 6= 0 und weil
char(K) = 0 ist, wird n · h + (x − a) · D(h) nicht von (x − a) geteilt.
Somit werden D( f ) und ggT ( f , D( f )) nicht von (x − a)n geteilt. Daher ist a eine einfache Nullstelle von ggT ( f f,D( f )) .
(3) folgt aus (2).
84
4. POLYNOME
7. Polynome in mehreren Variablen
Es sei n eine positive ganze Zahl.
Zur Erinnerung: Eine Familie (ci )i∈ N n in K ist eine Koeffizienten-Familie
mit Indexmenge N n , wenn es nur endlich viele Indizes i ∈ N n mit ci 6= 0
gibt.
Auf N n betrachten wir die komponentenweise Addition:
für i, j ∈ N n ist
i + j := (i1 , . . ., in ) + ( j1 , . . ., jn ) := (i1 + j1 , . . . , in + jn ) .
Für jedes k ∈ N n gibt es nur endliche viele Paare (i, j) ∈ N n × N n mit der
Eigenschaft i + j = k.
Satz 93 : Die Menge Pn aller Koeffizienten-Familien in K mit Indexmenge
N n zusammen mit den Abbildungen
+ : Pn × Pn −→ Pn
,
((ci )i∈ N n , (di )i∈ N n ) 7−→ (ci )i∈ N n + (di )i∈ N n := (ci + di )i∈ N n ,
· : Pn × Pn −→ Pn
,
((ci )i∈ N n , (di )i∈ N n ) 7−→ (ci )i∈ N n · (di )i∈ N n := (
∑
i, j∈ N n ,i+ j=k
ci d j )k∈ N ,
und
· : K × Pn −→ Pn , (c, (di )i∈ N n ) 7−→ c · (di)i∈ N n := (cdi )i∈ N n ,
ist eine kommutative K-Algebra. Sie heißt Polynomring (in n Variablen)
über K oder Algebra der Polynome (in n Variablen) mit Koeffizienten in K.
Ihre Elemente heißen Polynome in n Variablen mit Koeffizienten in K. Das
Nullelement des Polynomringes in n Variablen ist die Familie 0 := (0)i∈ N n ,
das Einselement ist die Familie 1 := (δi0 )i∈ N n .
Beweis: Übung.
Definition 65 : Der Betrag eines Elementes
i ∈ N n ist die Zahl
|i| := |(i1 , . . . , in )| := i1 + i2 + . . . + in .
Es sei f = (ci )i∈ N n 6= 0 ein Polynom mit Koeffizienten in K. Der Grad von
f oder Totalgrad von f ist die größte Zahl in
{ |i| | i ∈ N n , ci 6= 0}
und wird mit gr( f ) bezeichnet. Das Polynom f heißt homogen vom Grad
d ∈ N , wenn für alle i ∈ N n mit ci 6= 0 gilt: |i| = d.
85
4. POLYNOME
Die folgende Schreibweise ist zweckmäßig: Wir wählen n Symbole, zum
Beispiel x1 , . . . , xn , und schreiben
∑ n ci xi
∑
oder
i1 ,...,in
i∈ N
ci1 ...in xi11 xi22 . . . xinn
statt (ci )i∈ N n .
Wir sprechen dann von einem Polynom in den Variablen x1 , . . . , xn mit Koeffizienten in K. Für den Polynomring über K schreiben wir dann K[x 1 , . . . , xn ]
oder, wenn n fest gewählt ist, K[x]. Wir identifizieren Polynome vom Grad 0
mit ihren nullten Koeffizienten und fassen K so als Teilmenge von K[x 1 , . . . , xn ]
auf. Die Polynome
x j := (δi j )i∈ N n ,
heißen Potenzprodukte in n Variablen.
j ∈ Nn ,
Satz 94 : Die Familie der Potenzprodukte (xi )i∈ N n ist eine K-Basis von
K[x1 , . . . , xn ].
Beweis: Übung.
Definition 66 : Es seien
f :=
∑
i1 ,...,in
ci1 ...in xi11 xi22 . . . xinn ∈ K[x1 , x2 , . . . , xn ]
ein Polynom und a := (a1 , . . . , an ) ein n-Tupel von Elementen einer KAlgebra A. Dann ist
f (a) :=
∑
i1 ,...,in
ci1 ...in ai11 ai22 . . . ainn
ein Element von A. Das n-Tupel a ist eine Nullstelle von f in An , wenn
f (a) = 0
ist.
Die Abbildung
K n −→ K , z 7−→ f (z) ,
heißt die durch f definierte polynomiale Abbildung und wird meistens wieder mit f bezeichnet.
Definition 67 : Ein System von polynomialen Gleichungen über K ist gegeben durch eine Teilmenge M ⊆ K[x1 , x2 , . . ., xn ]. Gesucht ist die Menge
NK n (M) := {z ∈ K n | für alle f ∈ M ist f (z) = 0}
aller gemeinsamen Nullstellen der Polynome in M. Diese heißt Nullstellenmenge von M. Eine Teilmenge N von K n ist eine algebraische Menge, wenn
sie die Nullstellenmenge einer Teilmenge von K[x1 , x2 , . . . , xn ] ist.
86
4. POLYNOME
Satz 95 : Beliebige Durchschnitte und endliche Vereinigungen von algebraischen Mengen sind wieder algebraisch.
Genauer formuliert: Wenn N1 , N2 , . . . ⊆ K n die Nullstellenmengen von M1 , M2 , . . . ⊆
K[x1 , . . . , xn ] sind, dann ist
\
i∈ N
und
k
[
i=1
Ni = N K n (
[
Mi )
i∈ N
Ni = NK n ({ f1 · f2 · . . . · fk | fi ∈ Mi , 1 ≤ i ≤ k}) .
Beweis: Übung.
Beispiel 32 : Die Nullstellenmenge von x21 − x22 in K 2 ist die Vereinigung
der zwei Geraden NK 2 (x1 + x2 ) und NK 2 (x1 − x2 ). Die Nullstellenmenge
von {x1 + x2 , x1 − x2 } ist der Punkt {(0, 0)}, der Durchschnitt dieser zwei
Geraden.
KAPITEL 5
Erweiterungen des Zahlenbereichs
In diesem Kapitel wird mit K immer ein Körper bezeichnet.
1. Algebraische Elemente und Minimalpolynome
In diesem Abschnitt sei A eine K-Algebra.
Definition 68 : Ein Element a ∈ A ist algebraisch über K, wenn es Nullstelle eines Polynoms f 6= 0 in K[x] ist.
Beispiel 33 : Die Matrix
0 −1
∈ Q 2×2
1 0
ist eine Nullstelle des Polynoms x2 + 1 ∈ Q [x], also algebraisch über Q .
Definition 69 : Es seien a ein über K algebraisches Element von A. Das
normierte Polynom kleinsten Grades in K[x], das a als Nullstelle hat, heißt
Minimalpolynom von a über K.
Satz 96 : Es seien a ein über K algebraisches Element in A, dessen Minimalpolynom f ∈ K[x] irreduzibel ist.
(1) Wenn g ∈ K[x] ein irreduzibles normiertes Polynom mit
g(a) = 0 ist, dann ist f = g.
(2) Es sei n der Grad von f . Dann ist
(1, a, a2 , . . . , an−1 )
eine K-Basis von K[a] := {h(a) | h ∈ K[x] }.
i
Wenn r = ∑n−1
i=0 ci x der Rest von h ∈ K[x] nach Division durch f
ist, dann ist (c0 , . . . , cn−1 ) das n-Tupel der Koordinaten von h(a)
bezüglich der Basis (1, a, a2 , . . . , an−1 ).
(3) Die kommutative Unteralgebra K[a] von A ist ein Körper. Es seien
h ∈ K[x] und h(a) 6= 0. Die Koordinaten von
h(a)−1 ∈ K[a] bezüglich der Basis (1, a, . . ., an−1 ) können wie folgt
berechnet werden:
87
88
5. ERWEITERUNGEN DES ZAHLENBEREICHS
– Berechne mit dem erweiterten Euklidischen Algorithmus Polynome u, v ∈ K[x] so, dass u f + vh = 1 ist.
i
– Berechne den Rest ∑n−1
i=0 di x von v nach Division durch f .
– Dann ist (d0 , . . . , dn−1 ) das gesuchte n-Tupel der Koordinaten
von h(a)−1 .
Beweis:
(1) Es sei r der Rest von g nach Division durch f . Dann ist a auch eine
Nullstelle von r. Wegen r = 0 oder gr(r) < gr( f ) folgt aus der Definition des Minimalpolynoms, dass r = 0 ist. Also wird das irreduzible
Polynom g von f geteilt, aus lk(g) = 1 = lk( f ) folgt daher f = g.
(2) Es seien h ∈ K[x] und m bzw. r der polynomiale Quotient bzw. Rest
von h nach Division durch f . Dann ist
h(a) = m(a) · f (a) + r(a) = r(a) ,
also ist h(a) eine K-Linearkombination von (1, a, . . ., an−1 ). Wäre
(1, a, . . ., an−1 ) nicht linear unabhängig, dann gäbe es ein n-Tupel
i
0 6= (d0 , . . ., dn−1 ) in K n mit ∑n−1
i=0 di a = 0. Dann wäre aber a die
i
Nullstelle des Polynoms 0 6= ∑n−1
i=0 di x , dessen Grad kleiner als der
von f ist. Widerspruch.
(3) Es seien h ∈ K[x] und h(a) 6= 0. Nach (2) können wir annehmen,
dass der Grad von h kleiner als n ist (falls nicht, ersetzen wir h durch
seinen Rest nach Division durch f ). Dann wird h nicht von f geteilt.
Weil f irreduzibel ist, ist daher ggT ( f , h) = 1. Mit dem erweiterten
Euklidischen Algorithmus können daher Polynome u, v ∈ K[x] so
berechnet werden, dass u f + vh = 1 ist. Dann ist v(a) ∈ K[a] und
1 = u(a) · f (a) + v(a) · h(a) = 0 + v(a) · h(a) ,
also h(a) invertierbar und h(a)−1 = v(a).
Wenn das Minimalpolynom eines algebraischen Elementes a bekannt
ist, dann kann am Computer in K[a] exakt gerechnet werden (wobei vorausgesetzt werden muss, dass man in K exakt rechnen kann). Die Elemente
von K[a] werden durch n-Tupel in K n dargestellt, und die Rechenoperationen werden mit Hilfe der Aussagen (2) und (3) von Satz 96 ausgeführt.
Die erste Aussage von Satz 96 kann verwendet werden, um das Minimalpolynom zu finden: es muss zunächst irgendein normiertes Polynom f ,
dessen Nullstelle a ist, gegeben sein. Dann wird überprüft, ob f irreduzibel ist. Wenn es irreduzibel ist, dann ist f das Minimalpolynom von a .
Wenn nicht, müssen wir einen Faktor g kleineren Grades mit g(a) = 0 finden und mit diesem von Neuem beginnen. Es gibt Verfahren zur effizienten
Faktorisierung von Polynomen, diese übersteigen aber den Rahmen dieser
Vorlesung.
89
5. ERWEITERUNGEN DES ZAHLENBEREICHS
√
Beispiel 34 : Es sei 3 2 die positive reelle Zahl, die Nullstelle von x3 − 2
ist. Wenn das Polynom x3 − 2 nicht irreduzibel über Q wäre, dann hätte es
einen Faktor vom Grad 1. Dieses Polynom hat aber keine Nullstelle in Q
(Übung), also auch
keinen Faktor vom
Grad
1. Daher ist x3 − 2 das Mini√
√
√
√
3
3
3
3
(1,
2,
4)
ist
eine
Q
-Basis
von
Q
[
2].
malpolynom von 2 über Q und
√
√
3
3
−1
Um die Koordinaten von (1 + 2 2 + 3 4) bezüglich dieser Basis zu berechnen, verwenden wir Satz 96. Es ist
(−3x − 50)(x3 − 2) + (x2 + 16x − 11)(3x2 + 2x + 1) = 89 ,
also
√
√
−11 16 √
1√
3
3
3
3
+
(1 + 2 2 + 3 4)−1 =
2+
4.
89
89
89
Schreibt man dieses Ergebnis in der Form
√
√
1
−11 + 16 3 2 + 3 4
√
√ =
89
(1 + 2 3 2 + 3 3 4)
an, so wird diese Berechnung oft als Rationalmachen des Nenners“ be”
zeichnet.
2. Existenz von Nullstellen
In diesem Abschnitt sei f ∈ K[x] ein irreduzibles normiertes Polynom.
Definition 70 : Eine Körper L, der K als Unterring enthält, heißt Körpererweiterung von K. Eine Körpererweiterung K ⊆ L ist endlich, wenn L als
K-Vektorraum endlichdimensional ist. Die Dimension dieses Vektorraums
heißt Grad der Körpererweiterung.
Ein irreduzibles Polynom f ∈ K[x] hat in K keine Nullstellen, daher
sucht man eine endliche Körpererweiterung K ⊆ L von möglichst kleinem
Grad, sodass das Polynom in L eine Nullstelle hat. Dazu gibt es zwei Möglichkeiten:
(1) Man sucht in einer bereits bekannten K-Algebra A nach einer Nullstelle a von f . Wenn man sie findet, dann ist K ⊆ K[a] die gesuchte
Körpererweiterung.
(2) Man konstruiert eine endliche Körpererweiterung, in der f eine Nullstelle haben muss.
Beispiel 35 : Wenn K = Q und f = x2 + 1 ist, dann hat f in der Q -Algebra
Q 2×2 die Nullstelle
0 −1
i :=
.
1 0
90
5. ERWEITERUNGEN DES ZAHLENBEREICHS
a −b
Also ist Q ⊆ Q [i] := {aI2 + bi =
| a, b ∈ Q } eine Körpererweib a
terung vom Grad 2.
Eine allgemeine Methode zur Konstruktion einer endlichen Körpererweiterung von kleinstmöglichem Grad, in der f eine Nullstelle hat, liefert
der folgende
Satz 97 : Es seien f ∈ K[x] irreduzibel, n := gr( f ) und V der von 1, x, x2 , . . . , xn−1
erzeugte Untervektorraum von K[x]. Mit der Multiplikation
· : V ×V −→ V , (g, h) 7−→ Rest von gh nach Division durch f ,
wird V zu einer K-Algebra, die sogar eine Körpererweiterung von K (vom
Grad n) ist. Das Element x ∈ V ist eine Nullstelle von f in V .
Das zu h ∈ V inverse Element kann wie folgt berechnet werden:
• Berechne mit dem erweiterten Euklidischen Algorithmus
Polynome u, v ∈ K[x] so, dass u f + vh = 1 ist.
• Der Rest von v nach Division durch f ist das zu h inverse Element.
Beweis: Übung.
Beispiel 36 : Seien K = Q , f = x2 + 1 und V := Q h1, xi. Wir betrachten V
wie in Satz 97 als zweidimensionale Körpererweiterung von Q . Dann hat
f in V die Nullstelle i := x.
Definition 71 : Ein Körper K ist algebraisch abgeschlossen, wenn jedes
Polynom in K[x] mit positivem Grad eine Nullstelle in K hat. Eine Körpererweiterung K ⊆ L von K heißt algebraischer Abschluss von K, wenn L algebraisch abgeschlossen ist und jedes Element von L algebraisch über K
ist.
91
5. ERWEITERUNGEN DES ZAHLENBEREICHS
Satz 98 : Jeder Körper hat einen algebraischen Abschluss. Ein algebraischer Abschluss von Q heißt Körper der algebraischen Zahlen.
Beweis: wird weggelassen.
Manche Eigenschaften von Polynomen sind besonders einfach zu beschreiben, wenn der Koeffizientenkörper algebraisch abgeschlossen ist:
Satz 99 : Ein Polynom mit Koeffizienten in einem algebraisch abgeschlossenen Körper K ist genau dann in K[x] irreduzibel, wenn sein Grad 1 ist.
Insbesondere gilt: Wenn f ∈ K[x] positiven Grad hat und z1 , . . . , zn die Nullstellen von f in K sind, dann gibt es eindeutig bestimmte positive ganze
Zahlen e1 , . . . , en so, dass
n
f = lk( f ) ∏(x − zi )ei
i=1
ist.
Beweis: Wenn K algebraisch abgeschlossen ist, hat jedes Polynom in K[x]
mit positivem Grad in K eine Nullstelle. Wenn z eine Nullstelle eines irreduziblen Polynoms f ist, dann wird f von x − z geteilt. Daher muss f =
lk( f )(x − z) sein.
Die zweite Aussage folgt nun aus Satz 89.
Satz 100 : Es sei K ein algebraisch abgeschlossener Körper der Charakteristik 0. Dann hat ein Polynom 0 6= f ∈ K[x] genau
gr( f ) − gr(ggT ( f , D( f ))
(paarweise verschiedene) Nullstellen.
Beweis: Folgt aus Satz 92 und Satz 99.
92
5. ERWEITERUNGEN DES ZAHLENBEREICHS
3. Endliche Körper
In diesem Abschnitt seien p eine positive Primzahl und L ein endlicher
Körper der Charakteristik p. Wir identifizieren n̄ ∈ Zp und n · 1L ∈ L und
fassen Z p so als Unterkörper von L auf.
Wir bezeichnen mit m die Dimension von L als Vektorraum über Z p . Dann
kann jedes Element von L eindeutig durch ein m-Tupel von Elementen in
Z p dargestellt werden. Insbesondere ist pm die Anzahl der Elemente von L.
Beispiel 37 : Das Polynom x2 +x+1 ist über Z 2 irreduzibel, also ist Z 2 h1, xi
mit der in Satz 97 definierten Multiplikation ein Körper der Charakteristik 2
mit 4 Elementen. Seine Elemente sind 0, 1, x und x + 1. Es ist x · (1 + x) = 1,
x2 = x + 1 und (x + 1)2 = x.
Satz 101 :
(1) Für alle positiven ganzen Zahlen m gibt es einen Körper L mit q :=
pm Elementen. Er wird häufig als Galoiskörper GF(q) bezeichnet.
(2) Jedes Element von L ist Nullstelle von xq − x.
m
(3) Das Polynom x p − x hat irreduzible Faktoren vom Grad m.
m
(4) Sei f ein irreduzibler Faktor vom Grad m von x p − x. Dann kann
GF(q) wie in Satz 97 als Körpererweiterung von Z p , die eine Nullstelle von f enthält, konstruiert werden.
Beweis: wird weggelassen.
Beispiel 38 : Ein linearer (n,k)-Code ist ein k-dimensionaler Untervektorraum eines n-dimensionalen Vektorraums über einem endlichen Körper L.
Seine Elemente heißen Worte des Codes. Wenn q = pm die Anzahl der
Elemente von L ist, dann enthält ein linearer (n, k) − Code über L genau
qk = pm·k Worte.
KAPITEL 6
Eigenwertprobleme
In diesem Kapitel sei K ein Körper.
1. Eigenwerte und Eigenvektoren
Beispiel 39 : Zwei Gewichte mit Masse m hängen hintereinander an zwei
Federn mit Federkonstante k.
H
H
H
H
H
H
X
X
X
X
X
X
@
@
@
@
@
@
x1
?
x2
H
H
H
H
H
H
?
Nach den Gesetzen der Mechanik gilt für die Auslenkungen aus der Ruhelage x1 bzw. x2 des ersten bzw. zweiten Gewichts
mx001 + kx1 − k(x2 − x1 ) = 0
mx002
+ k(x2 − x1 ) = 0 ,
wobei 00 die zweite Ableitung nach der Zeit bezeichnet. In Matrizenform
umgeschrieben erhält man
00 2k −k
x1
x1
= 0.
m 00 +
−k k
x2
x2
Wir untersuchen nun die Frage, ob es eine Schwingung der Form
x1 (t) = a1 sin(ω t)
x2 (t) = a2 sin(ω t)
93
94
6. EIGENWERTPROBLEME
gibt, wobei a1 , a2 die Amplituden sind und ω die Frequenz ist. In diesem
Fall wäre
a1
2k −k
a1
2
−mω sin(ω t)
+ sin(ω t)
=0
a2
a2
−k k
für alle reellen Zahlen t, also
2k −k
a1
2 a1
.
= mω
−k k
a2
a2
Daher suchen wir Spalten, die durch Multiplikation mit einer vorgegebenen
Matrix in ein skalares Vielfaches übergehen (Fortsetzung in Beispiel 43).
Definition 72 : Seien V ein Vektorraum über K und f : V → V eine lineare
Abbildung.
(1) Ein Vektor u ∈ V heißt Eigenvektor von f , wenn u 6= 0 ist und eine
Zahl λ ∈ K existiert mit
f (u) = λ u .
Dann heißt λ der Eigenwert von f zum Eigenvektor u.
(2) Für einen Eigenwert λ von f ist
E( f , λ ) := {x ∈ V | f (x) = λ x}
ein Untervektorraum von V , heißt der Eigenraum von f zum Eigenwert λ , und besteht aus dem Nullvektor sowie allen Eigenvektoren
von f zum Eigenwert λ .
Definition 73 : Sei A ∈ K n×n . Dann heißt u ∈ K n×1 Eigenvektor der Matrix
A und λ ∈ K Eigenwert von A, wenn u Eigenvektor bzw. λ Eigenwert der
Abbildung
K n×1 → K n×1 , x 7→ Ax ,
ist.
2. Determinanten
Definition 74 : Für A ∈ K n×n heißt
det(A) :=
∑
σ ∈Sn
sign(σ )Aσ (1)1 Aσ (2)2 . . . Aσ (n)n
die Determinante von A.
Beispiel 40 : Im Fall n = 1 ist Sn = {Id1 } und det(A) = A11 .
Im Fall n = 2 ist Sn = {Id2 , (1, 2)} und
A11 A12
det
= A11 A22 − A12 A21 .
A21 A22
95
6. EIGENWERTPROBLEME
Im Fall n = 3 ist Sn = {Id3 , (1, 2, 3), (1, 3, 2), (1, 3), (2, 3), (1, 2)} und

A11 A12 A13
det A21 A22 A23  = A11 A22 A33 + A21 A32 A13 + A31 A12 A23
A31 A32 A33
− A31 A22 A13 − A11 A32 A23 − A21 A12 A33 .

Für n ≥ 4 hat Sn mindestens 4! = 24 Elemente und die Definition der
Determinante ist für das praktische Rechnen nicht mehr geeignet.
Satz 102 : Für A ∈ K n×n ist
det(AT ) = det(A) ,
d.h. Transponieren ändert die Determinante nicht.
Beweis: Nach Definition ist
det(AT ) =
sign(σ ) ∏ (AT )σ ( j) j =
∑
sign(σ ) ∏ Aσ −1 (i)i ,
σ ∈Sn
=
n
∑
σ ∈Sn
j=1
n
∑
σ ∈Sn
n
sign(σ ) ∏ A jσ ( j)
j=1
i=1
wobei im Produkt i := σ ( j) gesetzt und umgeordnet wurde. Da die Abbildung Sn → Sn , σ 7→ σ −1 , bijektiv ist, kann man τ := σ −1 setzen und erhält
durch Umordnen der Summe
det(AT ) =
∑
τ ∈Sn
n
sign(τ ) ∏ Aτ (i)i = det(A) .
i=1
Definition 75 : Sei A ∈ K n×n .
(1) A hat obere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i > j
ist. Dann hat A unterhalb der Hauptdiagonalen
{(1, 1), (2, 2), . . ., (n, n)} nur Nulleinträge, d.h. A hat die Gestalt


∗ ∗ ... ∗
0 ∗
∗

. .
 .. . . . . . ...  ,
0 ...
0
∗
wobei ∗ für beliebige Körperelemente steht.
(2) A hat untere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i < j
ist. Dann hat A oberhalb der Hauptdiagonalen nur Nulleinträge, d.h.
96
6. EIGENWERTPROBLEME
A hat die Gestalt


∗ 0 ... 0
.
.

∗ ∗ . . .. 
.
.
..
 ..
. 0
∗ ∗ ... ∗
(3) A ist eine Dreiecksmatrix, wenn A obere oder untere Dreiecksform
hat.
(4) A hat Diagonalform, wenn Ai j = 0 für alle Indizes i, j mit i 6= j ist.
Dann hat A ausserhalb der Hauptdiagonalen nur Nulleinträge, d.h. A
hat die Gestalt


∗ 0 ... 0
. . .. 

. .
0 ∗
. .
.
 .. . . . . . 0
0 ... 0 ∗
Beispiel 41 : Jede quadratische Matrix in Stufenform hat obere Dreiecksform. Daher kann jede quadratische Matrix durch elementare Umformungen in obere Dreiecksform übergeführt werden.
Satz 103 : Die Determinante einer Dreiecksmatrix A ∈ K n×n ist das Produkt ihrer Diagonalelemente, also
det(A) = A11 A22 . . . Ann .
Insbesondere ist
det(In ) = 1 .
Beweis: Übung.
Da man Determinanten von Dreiecksmatrizen leicht ausrechnen kann,
liegt die Frage nahe, wie sich die Determinante bei elementaren Zeilenumformungen der Matrix ändert.
Satz 104 : Sei A ∈ K n×n .
(1) Sei B die Matrix, die man erhält, indem man eine Zeile von A mit
einem Element c ∈ K multipliziert.
Dann ist det(B) = c · det(A).
(2) Sei B die Matrix, die man erhält, indem man zwei Zeilen von A vertauscht. Dann ist det(B) = − det(A).
97
6. EIGENWERTPROBLEME
(3) Sei B die Matrix, die man erhält, indem man ein skalares Vielfaches
einer Zeile von A zu einer anderen Zeile von A addiert. Dann ist
det(B) = det(A).
(4) Die Aussagen (1) - (3) gelten analog für Spalten statt Zeilen.
(5) Die Determinante von A kann wie folgt berechnet werden: Forme A
durch elementare Zeilenumformungen (oder Spaltenumformungen)
vom Typ 1 (Addition eines Vielfachen einer Zeile zu einer anderen)
und vom Typ 2 (Vertauschung zweier Zeilen) in eine Matrix B in Dreiecksform um. Sei k die Zahl der ausgeführten Zeilenvertauschungen.
Dann ist
det(A) = (−1)k B11 B22 . . . Bnn .
Beweis: (1) - (3) nachprüfen, (4) folgt aus Satz 102 und (5) folgt aus
(1) - (3).
Satz 105 : Seien A, B ∈ K n×n und c ∈ K.
(1)
(2)
(3)
(4)
(5)
det(A · B) = det(A) · det(B) = det(B · A) .
Für alle T ∈ GLn (K) ist det(T −1 · A · T ) = det(A) .
A ist genau dann invertierbar, wenn det(A) 6= 0 ist.
1
.
Wenn A invertierbar ist, dann ist det(A−1 ) = det(A)
n
det(cA) = c det(A) .
Beweis:
(1) wird weggelassen.
(2) det(T −1 · A · T ) = det(T · (T −1 · A)) = det(A) .
(3) und (4) folgen aus (1).
(5) folgt aus Satz 104 .
Satz 106 : Seien V ein endlich-dimensionaler Vektorraum über K mit Basis
v und f : V → V eine lineare Abbildung mit Matrix A bezüglich v . Dann ist
det( f ) := det(A)
unabhängig von der Wahl der Basis v und heißt die Determinante von f . Es
ist f genau dann bijektiv, wenn det( f ) 6= 0 ist.
Beweis: Folgt aus Aussagen (2) und (3) in Satz 105 .
Definition 76 : Sei A ∈ K n×n . Für 1 ≤ i, j ≤ n heißt die Matrix
A(i, j) ∈ K (n−1)×(n−1) ,
98
6. EIGENWERTPROBLEME
die man aus A durch Weglassen der i-ten Zeile und j-ten Spalte erhält, die
i- j-te Streichungsmatrix.
Satz 107 : Sei A ∈ K n×n . Dann gilt:
(1) Für 1 ≤ j ≤ n ist
n
det(A) = ∑ (−1)i+ j Ai j det(A(i, j) )
i=1
(Entwicklung der Determinante nach der j-ten Spalte).
(2) Für 1 ≤ i ≤ n ist
n
det(A) =
∑ (−1)i+ j Ai j det(A(i, j))
j=1
(Entwicklung der Determinante nach der i-ten Zeile).
Beweis: wird weggelassen.
Wenn eine Matrix eine Spalte oder Zeile mit vielen Nullen besitzt, dann
ist zur Berechnung der Determinante die Entwicklung nach dieser Spalte
oder Zeile zu empfehlen.
Satz 108 : Sei A ∈ K n×n . Dann heißt die Matrix Ad(A) ∈ K n×n , definiert
durch
Ad(A)i j := (−1)i+ j det(A( j,i) )
für 1 ≤ i, j ≤ n, die zu A adjungierte Matrix, und es gilt
A · Ad(A) = Ad(A) · A = det(A) · In .
Wenn A invertierbar ist, dann ist
A−1 = det(A)−1 Ad(A) .
Beweis: wird weggelassen.
Beispiel 42 : Sei
a b
A=
∈ K 2×2 .
c d
Dann ist det(A) = ad − bc und, falls det(A) 6= 0 ist,
d −b
−1
−1
.
A = det(A)
−c a
99
6. EIGENWERTPROBLEME
3. Berechnung von Eigenwerten
Satz 109 : Seien V ein endlich-dimensionaler Vektorraum über K und f :
V → V eine lineare Abbildung. Dann ist λ ∈ K genau dann Eigenwert von
f , wenn
det(λ IdV − f ) = 0
ist. Die Abbildung
χ f : K → K , z 7→ det(z IdV − f ) ,
ist eine polynomiale Abbildung und heißt das charakteristische Polynom
von f . ( Die Eigenwerte von f sind die Nullstellen des charakteristischen
”
Polynoms.“)
Insbesondere: Die Abbildung f hat höchstens dimK (V ) Eigenwerte.
Wenn K algebraisch abgeschlossen und V 6= {0} ist, hat f mindestens einen
Eigenvektor.
Beweis: Es ist λ genau dann ein Eigenwert von f , wenn ein Vektor u ∈ V
mit u 6= 0 existiert, sodass f (u) = λ u ist. Dies ist äquivalent dazu, dass die
lineare Abbildung
λ IdV − f : V → V , v 7→ λ v − f (v) ,
nicht injektiv ist. Da die Abbildung IdV − f linear ist und die Dimensionen ihres Definitions- und Bildbereiches übereinstimmen, ist die Abbildung
λ IdV − f genau dann injektiv, wenn sie bijektiv ist (Übung). Nach Satz 106
ist λ IdV − f genau dann nicht bijektiv, wenn det(λ IdV − f ) = 0 ist.
Satz 109 legt folgendes Verfahren nahe, die Eigenwerte und Eigenvektoren einer linearen Abbildung f : V → V zu berechnen, falls V endlichdimensional ist:
(1) Wähle eine Basis v = (v1 , . . . , vn ) von V und bestimme die Matrix A
von f bezüglich v . Die Matrix von λ IdV − f bezüglich v ist dann
λ In − A .
(2) Finde alle λ ∈ K mit det(λ In − A) = 0, das heißt: berechne alle Nullstellen des charakteristischen Polynoms von f .
(3) Bestimme für jeden Eigenwert λ den Eigenraum E( f , λ ) durch Lösen
des homogenen Systems linearer Gleichungen
(λ In − A)x = 0.
Beispiel 43 : Wir lösen nun das Eigenwertproblem aus Beispiel 39. Hier ist
2k −k
A=
.
−k k
100
6. EIGENWERTPROBLEME
Wegen
λ − 2k
k
det(λ I2 − A) = det
= λ 2 − 3kλ + k2
k
λ −k
sind die Eigenwerte von A
√
3+ 5
λ1 =
k
und
2
Die zugehörigen Eigenräume sind
1√
bzw.
E(A, λ1 ) = R 1− 5
√
3− 5
λ2 =
k.
2
E(A, λ2 ) = R
2
wobei R der Körper der reellen Zahlen ist.
1√
1+ 5
2
,
Beispiel 44 : Sei A ∈ K n×n eine Dreiecksmatrix. Dann ist auch die Matrix
λ In − A eine Dreiecksmatrix, und nach Satz 103 ist
χA (z) = (z − A11 ) . . . (z − Ann ) .
Daher sind die Diagonalelemente einer Matrix in Dreiecksform ihre Eigenwerte.
Zum Beispiel ist 1 der einzige Eigenwert der Einheitsmatrix In .
Herunterladen