A A+B

Werbung
Einführung in die Mathematik 1
Ein Skriptum zur Vorlesung im
Wintersemester 2010/11
Franz Pauer
4. Auflage
c 2010 F RANZ PAUER
⃝
I NNSBRUCK , Ö STERREICH
Vorwort
Das vorliegende Skriptum soll den Hörerinnen und Hörern der Vorlesung Einführung in die Mathematik 1“ im Wintersemester 2010/11 das
”
Mitschreiben und Mitdenken in der Vorlesung erleichtern. Diese Vorlesung
richtet sich an Studierende der Bachelorstudien Technische Mathematik, Informatik und Physik, sowie der Lehramtsstudien in den Unterrichtsfächern
Mathematik, Informatik und Physik. Das Skriptum enthält alle Algorithmen, Definitionen und Sätze der Vorlesung, aber nur wenige Beispiele dazu.
In der Vorlesung werden die Algorithmen, Definitionen und Sätze motiviert,
der Zusammenhang mit früheren Ergebnissen erläutert und Beispiele dazu
besprochen.
Die Hauptziele dieser Vorlesung sind:
• Systeme linearer Gleichungen zu lösen.
Die Fragen, wann es eine Lösung gibt, ob sie eindeutig ist und wie
Lösungen berechnet werden können, werden vollständig beantwortet. Weiters wird gezeigt, wie die Menge aller Lösungen durch endlich viele Daten beschrieben werden kann. Dazu muss die Matrizenrechnung eingeführt und auf die Theorie der Vektorräume eingegangen werden. Das zentrale Rechenverfahren zur Lösung von Systemen
linearer Gleichungen ist der Gauss-Algorithmus.
• Mit Hilfe der Vektorrechnung Fragen aus der Geometrie zu beantworten.
Die Begriffe Vektorraum“ und Skalarprodukt“ bilden die wichtig”
”
sten Bausteine für ein mathematisches Modell der Geometrie der
Ebene und des Raumes. Dann wird gezeigt, wie einige geometrische
Fragen in diesem Modell beantwortet werden können.
• Eigenwertprobleme zu lösen.
Als Hilfsmittel für ihre Lösung werden die Begriffe Polynom, Permutation und Determinante eingeführt und wichtige Eigenschaften davon besprochen. Diese Begriffe sind auch für andere Anwendungen
von großer Bedeutung: Permutationen zum Beispiel für Sortieralgorithmen, Determinanten zum Beispiel für die Integralrechnung.
Im Kapitel 0 werden einige Grundbegriffe der Mathematik eingeführt.
ii
iii
VORWORT
Dieses Skriptum ist eine überarbeitete Fassung von Teilen der Skripten
Arne Dür und Franz Pauer: Lineare Algebra (5. Auflage), 2006.
und
Arne Dür und Franz Pauer: Analytische Geometrie (3. Auflage), 2005.
Am Ende jedes Kapitels sind als Lernhilfe einige Fragen angegeben.
Antworten und Erläuterungen dazu sind am Ende des Skriptums zu finden. Diese Fragen und Antworten hat Simone Graml zusammengestellt. Die
Zeichnung Translationen“ wurde von Anna Bombasaro, die Zeichnungen
”
in Kapitel 2, §5 und Kapitel 4, §10 wurden von Simone Graml, alle anderen wurden von Roman Liedl angefertigt. Hubert Herdlinger hat das Skriptum kritisch gelesen und mehrere Verbesserungen angeregt. Martin Huber
danke ich für die Anregung, die Abschnitte 5 in Kapitel 2 und 10 in Kapitel 4 (Anwendungen der Linearen Algebra in der Elektrotechnik) in das
Skriptum aufzunehmen, sowie für die Erlaubnis, dafür seine Materialien in
www.tech4math.com zu verwenden.
Die vierte Auflage des Skriptums unterscheidet sich von der dritten (August 2009) nur durch kleinere Korrekturen und Ergänzungen.
Innsbruck, September 2010
Inhaltsverzeichnis
Vorwort
ii
Kapitel 0. Mengen, Funktionen, Zahlen und Rechenregeln
§1. Mengen und Funktionen
§2. Familien, Tupel, Folgen und kartesisches Produkt
§3. Ganze Zahlen und rationale Zahlen
§4. Zusammengesetzte Aussagen
§5. Der Induktionsbeweis
§6. Zifferndarstellung von Zahlen
§7. Gruppen, Ringe und Körper
§8. Rechnen mit Summen und Produkten
§9. Fragen
1
1
4
5
8
8
9
14
18
22
Kapitel 1. Matrizenrechnung
§1. Matrizen
§2. Elementare Umformungen
§3. Fragen
24
24
29
32
Kapitel 2. Systeme linearer Gleichungen
§1. Systeme linearer Gleichungen
§2. Vektorräume
§3. Erzeugendensysteme, lineare Unabhängigkeit und Basen
§4. Der Gauss-Algorithmus
§5. Kirchhoff’sche Gesetze und Systeme linearer Gleichungen
§6. Dimension
§7. Fragen
33
33
35
38
41
47
50
56
Kapitel 3. Rechnen mit Funktionen
§1. Hintereinanderausführung von Funktionen
§2. Permutationen
§3. Polynomfunktionen
§4. Fragen
61
61
63
67
70
Kapitel 4. Vektorrechnung und Geometrie
§1. Rechnen mit Punkten
§2. Affine Unterräume
§3. Translationen
§4. Skalarprodukte
§5. Orthonormalbasen
72
72
75
79
81
84
iv
v
INHALTSVERZEICHNIS
§6.
§7.
§8.
§9.
§10.
§11.
Der Fußpunkt des Lotes
Winkel
Lineare Funktionen
Die Matrix einer linearen Funktion
Lineare Funktionen und Vierpole
Fragen
87
89
91
93
96
99
Kapitel 5. Determinanten, Eigenwerte und Polynome
§1. Determinanten
§2. Orientierung
§3. Volumen und Vektorprodukt
§4. Eigenwerte und Eigenvektoren
§5. Berechnung von Eigenwerten
§6. Polynome
§7. Nullstellen von Polynomen
§8. Komplexe Zahlen
§9. Interpolation
§10. Fragen
101
101
107
108
111
113
115
117
118
120
122
Kapitel 6. Antworten
§1. Mengen, Funktionen, Zahlen und Rechenregeln
§2. Matrizenrechnung
§3. Systeme linearer Gleichungen
§4. Rechnen mit Funktionen
§5. Vektorrechnung und Geometrie
§6. Determinanten, Eigenwerte und Polynome
124
124
125
125
128
129
130
KAPITEL 0
Mengen, Funktionen, Zahlen und Rechenregeln
§1. Mengen und Funktionen
Definitionen setzen Vorwissen voraus. Zum Beispiel setzt die Definition
Ein Quadrat ist ein gleichseitiges Rechteck“
”
voraus, dass bekannt ist, was gleichseitig“ und Rechteck“ bedeuten. Die
”
”
Definition
Eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird“
”
setzt voraus, dass bekannt ist, was ganze Zahl“ und teilen“ bedeuten. Für
”
”
Definitionen wird häufig die folgende Kurzschreibweise verwendet:
zu definierender Begriff := definierende (schon bekannte) Begriffe .
Zum Beispiel:
Quadrat := gleichseitiges Rechteck
(in Worten: ein Quadrat ist ein gleichseitiges Rechteck)
und
gerade Zahl := ganze Zahl, die von 2 geteilt wird
(in Worten: eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird).
Der Begriff Menge“ ist jedoch ein Grundbaustein der Mathematik, der
”
nicht definiert, sondern nur umschrieben wird: Eine Menge ist eine Zusammenfassung unterscheidbarer Objekte. Diese heißen Elemente der Menge.
Eine Menge kann auf zwei Arten angegeben werden:
(1) durch Anschreiben der Elemente zwischen geschweiften Klammern,
zum Beispiel {7, 3, 5, 8, 1}, {Meier, Müller};
oder
(2) durch ihre Eigenschaften, zum Beispiel
{n | n ganze Zahl, n ist größer als 0 und kleiner als 7}
(Sprechweise: die Menge aller n, für die gilt: n ist eine ganze Zahl,
”
die größer als 0 und kleiner als 7 ist“ oder die Menge aller ganzen
”
Zahlen, die größer als 0 und kleiner als 7 sind“).
Bezeichnungen:
0/ := {}
leere Menge
(Menge ohne Elemente)
N := {0, 1, 2, 3, . . .}
Menge der natürlichen Zahlen
Z := {0, 1, −1, 2, −2, . . .}
Menge der ganzen Zahlen
Ist M eine Menge, so wird
1
2
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
e∈M
für e ist ein Element von M“ geschrieben, und analog
”
e∈
/M
für e ist kein Element von M“.
”
Auf logische Probleme, die bei der Einführung des Begriffes Menge“
”
auftreten, gehen wir hier nicht ein. Das Russell’sche Paradoxon“ zeigt,
”
dass man nicht zu sorglos sein darf:
Gilt für M := {A | A Menge, A ∈
/ A} die Beziehung M ∈ M ?
Beispiel 1 : 1 ∈ N , −1 ̸∈ N , 1 ̸∈ 0.
/
Definition 2 : M und N seien Mengen. M heißt Teilmenge von N, in Zeichen
M ⊂ N oder M ⊆ N ,
wenn jedes Element von M auch Element von N ist.
M ̸⊂ N
bedeutet, dass M nicht Teilmenge von N ist. Die Mengen M und N sind
gleich, in Zeichen
M=N,
wenn M ⊂ N und N ⊂ M ist. Falls M und N nicht gleich sind, schreibt man
M ̸= N .
Schließlich bedeutet
M$N,
dass M ⊂ N und M ̸= N ist, und man nennt M eine echte Teilmenge von
N.
Beispiel 3 : Für alle Mengen N ist N ⊆ N und 0/ ⊆ N. Es ist {a, b, c} =
{b, a, c} = {c, a, b}, beim Anschreiben der Elemente einer Menge kann die
Reihenfolge also beliebig gewählt werden.
Definition 4 : M und N seien Mengen. Der Durchschnitt von M und N ist
die Menge
M ∩ N := {a | a ∈ M und a ∈ N} .
Die Mengen M und N sind disjunkt, wenn ihr Durchschnitt leer ist.
Die Vereinigung von M und N ist die Menge
M ∪ N := {a | a ∈ M oder a ∈ N} ,
3
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
wobei mit oder“ das einschließende Oder ( und-oder“) und nicht das aus”
”
schließende Oder ( entweder-oder“) gemeint ist.
”
Die (Mengen-)Differenz von M und N ist die Menge
M \ N := {a | a ∈ M und a ̸∈ N} .
Beispiel 5 :
{1, 2, 3} ∩ {4, 3, 5} = {3} ,
{1, 2, 3} ∪ {4, 3, 5} = {1, 2, 3, 4, 5} .
{1, 2, 3} \ {4, 3, 5} = {1, 2} .
Als zweiten Grundbaustein der Mathematik führen wir den Begriff
Funktion ein.
M und N seien Mengen. Eine Abbildung oder Funktion von M nach N ist
eine Vorschrift, die jedem Element von M genau ein Element von N zuordnet. M heißt dann der Definitionsbereich der Funktion, N der Bildbereich.
Die Schreibweisen
f : M → N , m 7→ f (m) ,
oder
f : M −→
N
m 7→ f (m)
bedeuten, dass f eine Funktion von M nach N ist, die dem Element m ∈
M das Element f (m) ∈ N zuordnet. Das Element f (m) heißt Bild von m
(bezüglich f ). Ein Element m ∈ M mit f (m) = n ∈ N heißt ein Urbild von
n (bezüglich f ).
Beispiel 6 : Die Funktion
f : N → Z , z 7→ 2z − 3 ,
ordnet jeder natürlichen Zahl z die ganze Zahl 2z − 3 zu. Das Bild von 0
bzw. 1 bzw. 2 bezüglich f ist −3 bzw. −1 bzw. 1. Ein Urbild von 5 ist 4.
Die Zahl 4 hat kein Urbild bezüglich f .
Definition 7 : Seien f : M → N und g : P → Q Funktionen. Dann sind f und
g gleich, in Zeichen
f = g,
wenn gilt: M = P, N = Q und für alle m ∈ M ist f (m) = g(m).
4
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
§2. Familien, Tupel, Folgen und kartesisches Produkt
Eine Funktion f : I → M wird manchmal in der Form
( f (i))i∈I
oder
( fi )i∈I
geschrieben und als Familie von Elementen in M, indiziert durch I, bezeichnet. I heißt dann die Indexmenge der Familie ( fi )i∈I . Die Familie ( fi )i∈I
heißt endlich, wenn I endlich ist. Wichtige Spezialfälle sind:
(1) Eine Funktion x : {1, 2, . . . , n} → M , i 7→ x(i) =: xi , wird in der Form
(x1 , . . . , xn ) = (xi )1≤i≤n = (xi )i∈{1,...,n}
geschrieben und heißt ein n-Tupel von Elementen in M. Das Element
xi heißt dann i-te Komponente von (x1 , . . . , xn ). In den Spezialfällen
n = 2, 3 nennt man (x1 , . . . , xn ) ein Paar bzw. Tripel. Die Menge aller
n-Tupel von Elementen in M wird mit
Mn
bezeichnet (sprich M hoch n“). Für x, y ∈ M n gilt
”
x=y
genau dann, wenn xi = yi für i = 1, . . . , n ist.
Ein Paar (a, b) enthält mehr Information“ als die Menge
”
{a, b}. Es ist {a, b} = {b, a}, aber (a, b) = (b, a) nur dann, wenn
a = b ist.
(2) Sei m ∈ N und I := {i ∈ N | i ≥ m}. Eine Funktion
x : I → M , i 7→ x(i) =: xi , wird in der Form
(xi )i≥m
geschrieben und heißt eine Folge in M.
Die Folge (xi )i≥m darf nicht mit der Menge {xi | i ≥ m} verwechselt
werden!
Definition 8 : M und N seien Mengen. Dann heißt
M × N := {(x, y) | x ∈ M und y ∈ N} ⊆ (M ∪ N)2
das kartesische Produkt von M und N.
Definition 9 : Sei f : M → N eine Funktion. Dann heißt die Menge
Graph( f ) := {(m, f (m)) | m ∈ M} ⊆ M × N
der Graph von f .
Beispiel 10 : Der Graph der Funktion
f : {1, 3, 4, 5} −→ N , z 7−→ 3z + 1 ,
5
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
ist
{(1, 4), (3, 10), (4, 13), (5, 16)} ⊆ {1, 3, 4, 5} × N .
Satz 11 : Zwei Funktionen von M nach N sind genau dann gleich, wenn
ihre Graphen gleich sind.
Beweis: Es ist zu zeigen:
1. Wenn zwei Funktionen von M nach N gleich sind, dann sind auch
ihre Graphen gleich.
2. Wenn die Graphen zweier Funktionen von M nach N gleich sind,
dann sind diese zwei Funktionen gleich.
Seien f und g Funktionen von M nach N.
Zu 1): Wenn f = g ist, dann ist f (m) = g(m) für alle m ∈ M. Daher ist
Graph( f ) = {(m, f (m)) | m ∈ M} =
= {(m, g(m)) | m ∈ M} = Graph(g) .
Zu 2): Wenn Graph( f ) = Graph(g) ist, dann ist für alle m ∈ M das Paar
(m, f (m)) ein Element von Graph(g). In Graph(g) gibt es genau ein Element, dessen erste Komponente m ist, nämlich (m, g(m)). Also ist f (m) =
g(m) für alle m ∈ M, somit ist f = g.
Definition 12 : Sei (Mi )i∈I eine Familie von Mengen. Dann heißt
∏ Mi := {(xi)i∈I | für alle i ∈ I ist xi ∈ Mi}
i∈I
das kartesische Produkt der Mengen Mi , i ∈ I.
Im Spezialfall I = {1, . . . , n} wird für ∏i∈I Mi auch
n
∏ Mi
oder
M1 × . . . × Mn
i=1
geschrieben.
§3. Ganze Zahlen und rationale Zahlen
Wir setzen die Menge Z := {. . . , −2, −1, 0, 1, 2, . . .} der ganzen Zahlen
mit der Addition Z × Z −→ Z , (a, b) 7−→ a + b, und der Multiplikation Z × Z −→ Z , (a, b) 7−→ a · b, als bekannt voraus. Dabei gelten die
folgenden Rechenregeln: Sind a, b, c ganze Zahlen, dann ist
• (a + b) + c = a + (b + c) =: a + b + c ( Die Addition von ganzen Zah”
len ist assoziativ“, das heißt: auf Klammern kann verzichtet werden).
• 0+a = a+0 = a
• a + (−a) = (−a) + a = 0 (dabei ist −a := (−1) · a)
• a + b = b + a ( Die Addition ist kommutativ“).
”
6
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
• (a · b) · c = a · (b · c) =: a · b · c ( Die Multiplikation ist assoziativ“).
”
• 1·a = a·1 = a
• a · b = b · a ( Die Multiplikation ist kommutativ“).
”
• (a + b) · c = (a · c) + (b · c) =: a · c + b · c ( Distributivgesetz“)
”
Für a, b, c ∈ Z mit c ̸= 0 folgt aus a · c = b · c, dass a = b ist. ( In Z
”
kann durch Zahlen ̸= 0 gekürzt werden“). Insbesondere folgt aus a · b = 0,
dass a = 0 oder b = 0 ist.
Sind m, n ∈ Z , m ≤ n und am , am+1 , . . . , an ∈ Z , dann schreiben wir
n
∑ ai
i=m
für am + am+1 + . . . + an und
n
∏ ai
i=m
für am · am+1 · . . . · an . (Sprechweise: Die Summe bzw. das Produkt aller ai
”
mit i von m bis n“).
Die Subtraktion ist durch Z × Z −→ Z , (a, b) 7−→ a − b := a + (−b),
gegeben.
Das Vorzeichen vz(a) einer ganzen Zahl a ist 1, wenn a ∈ N , und −1, wenn
a ̸∈ N ist. Der Betrag |a| einer ganzen Zahl a ist vz(a) · a.
Für ganze Zahlen a, b schreiben wir a ≤ b genau dann, wenn b − a ∈ N ist
(Sprechweise: a ist kleiner oder gleich b). Wir schreiben a < b für: a ≤ b
und a ̸= b (Sprechweise: a ist kleiner als b).
Eine ganze Zahl ist positiv bzw. negativ, wenn sie größer bzw. kleiner als 0
ist. Statt a · b schreibt man oft nur ab.
Es seien a und b ganze Zahlen, wobei b ̸= 0 ist. Die Aufgabe Finde
”
eine Zahl z so, dass b · z = a ist“ bezeichnen wir als Gleichung“ b · x = a.
”
Eine Zahl z mit b · z = a heißt Lösung von b · x = a. Wenn |b| ̸= 1 ist, dann
hat die Aufgabe b · x = 1 in Z keine Lösung. Um Lösungen zu erhalten,
müssen wir den Zahlenbereich erweitern“.
”
Die Aufgabe b · x = a wird durch das Paar (a, b) ∈ Z 2 eindeutig beschrieben, also liegt es nahe, die neuen Zahlen“ durch Paare von ganzen
”
Zahlen zu beschreiben. Allerdings sollten für t ∈ Z , t ̸= 0, die Gleichungen
b · x = a und t · b · x = t · a dieselbe Lösung haben, daher sollen die Zahlenpaare (a, b) und (t · a,t · b) dieselbe neue Zahl“ beschreiben.
”
Definition 13 : Es seien a und b ganze Zahlen, wobei b ̸= 0. Dann ist die
Menge
a
:= {(c, d) | c, d ∈ Z , ad = bc, d ̸= 0}
b
die durch den Zähler“ a und den Nenner“ b gegebene rationale Zahl oder
”
”
Bruchzahl. (Beachte: Eine rationale Zahl ist durch Vorgabe von Zähler und
Nenner eindeutig bestimmt, aber umgekehrt sind Zähler und Nenner durch
7
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
die rationale Zahl nicht eindeutig bestimmt). Wir schreiben Q für die Menge der rationalen Zahlen.
Für die Bruchzahl 1a schreiben wir oft nur a und fassen so Z als Teilmenge
von Q auf. ( Jede ganze Zahl ist eine rationale Zahl“).
”
Satz 14 : Es seien a′ , b′ ganze Zahlen und b′ ̸= 0. Dann sind die Bruchzah′
len ab und ab′ genau dann gleich, wenn a · b′ = a′ · b ist.
′
Beweis: Wenn ab = ba′ ist, dann ist insbesondere (a′ , b′ ) ∈ ab , also a · b′ =
a′ · b.
Sei umgekehrt a · b′ = a′ · b und (c, d) ∈ ab , also b · c = a · d. Dann ist zu
′
zeigen, dass (c, d) ∈ ab′ , also b′ · c = a′ · d ist.
Es ist
b · (b′ · c) = (b · c) · b′ = (a · d) · b′ = d · (a · b′ ) = d · (a′ · b) = b · (a′ · d) ,
wegen b ̸= 0 also auch b′ · c = a′ · d.
Wir werden nun die Rechenoperationen von Z auf Q fortsetzen.
Satz 15 : Die Funktionen
+ : Q × Q −→ Q ,
a c
a c
ad + bc
( , ) 7−→ + :=
,
b d
b d
bd
und
a c
ac
a c
,
( , ) 7−→ · :=
b d
b d
bd
sind wohldefiniert. Diese Rechenoperationen in Q erfüllen die gleichen Rechenregeln wie Addition und Multiplikation in Z . Darüberhinaus hat jedes
Element ab ∈ Q \ {0} ein inverses Element ( ab )−1 mit der Eigenschaft
a
a
( )−1 · = 1 ,
b
b
und zwar ist
a
b
( )−1 = .
b
a
Die Einschränkungen von + und · auf Z × Z stimmen mit der Addition und
der Multiplikation auf Z überein.
· : Q × Q −→ Q ,
Beweis: Wir müssen zuerst zeigen, dass die Funktionen + und · wohldefi′
′
niert sind, das heißt: wenn ba = ab′ und dc = dc ′ ist, dann muss auch
ad + bc a′ d ′ + b′ c′
=
bd
b′ d ′
und
ac
a′ c′
= ′ ′
bd b d
8
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
sein.
Aus a′ b = ab′ und c′ d = cd ′ folgt
(ad + bc)b′ d ′ = ab′ dd ′ + bb′ cd ′ = a′ bdd ′ + bb′ c′ d = bd(a′ d ′ + b′ c′ )
und
(ac)b′ d ′ = bd(a′ c′ ) .
Die Rechenregeln können leicht nachgeprüft werden.
§4. Zusammengesetzte Aussagen
Wir betrachten Aussagen A, B,C, . . . , die nach Vereinbarung entweder
wahr oder falsch sind. Mit Hilfe der Worte
und“
(Zeichen: ∧) ,
”
oder“
(Zeichen: ∨) ,
”
nicht“
(Zeichen: ¬) ,
”
wenn, dann“
(Zeichen: ⇒) ,
”
genau dann, wenn“ (Zeichen: ⇔)
”
bilden wir zusammengesetzte Aussagen, deren Wahrheitswert“ wir durch
”
die folgende Tabelle definieren. Dabei steht w für wahr“ und
”
f für falsch“.
”
A B A ∧ B A ∨ B ¬A A ⇒ B A ⇔ B
w w
w
w
f
w
w
w f
f
w
f
f
f
f w
f
w
w
w
f
f f
f
f
w
w
w
Für A ⇒ B verwendet man statt wenn A, dann B“ auch die Sprechwei”
sen aus A folgt B“ oder A impliziert B“.
”
”
Man beachte:
A ist genau dann wahr, wenn ¬A falsch ist. Das wird für indirekte Beweise
verwendet: anstatt zu zeigen, dass eine Aussage A wahr ist, wird gezeigt,
dass ihr Gegenteil“ ¬A falsch ist.
”
In der Mathematik bedeutet das Wort oder“ immer das nicht ausschließen”
de und-oder“ und nicht das ausschließende entweder-oder“.
”
”
Ist A falsch, dann ist die Aussage A ⇒ B immer wahr ( ex falso quodlibet“).
”
§5. Der Induktionsbeweis
Sei m eine natürliche Zahl (meistens 0 oder 1) und sei
(Am , Am+1 , Am+2 , . . .) eine Folge von Aussagen.
Satz 16 : Wenn
(1) Am wahr ist und
(2) für alle n > m aus An−1 auch An folgt,
dann sind alle Aussagen An , n ≥ m , wahr.
9
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Damit erhält man eine Methode, die Gültigkeit der Aussagen An , n ≥ m,
zu zeigen ( Beweis durch vollständige Induktion“): Es genügt zu zeigen,
”
dass (1) ( Induktionsanfang“) und (2) ( Induktionsschluss“) richtig sind.
”
”
Um zu zeigen, dass (2) richtig ist, nimmt man an, dass An−1 wahr ist ( In”
duktionsannahme“) und versucht damit zu zeigen, dass auch An wahr ist.
Man könnte im Satz die Annahme (2) auch durch
(2’) für alle n > m aus Am , Am+1 , . . . , An−1 auch An folgt,
ersetzen.
Beweis: Wir benutzen die folgende Eigenschaft der natürlichen Zahlen: jede nicht leere Teilmenge von N hat ein kleinstes Element. Wir führen den
Beweis indirekt und nehmen an, dass nicht alle Aussagen An , n ≥ m , wahr
sind. Dann ist die Menge
M := {n ∈ N | n ≥ m und An ist falsch}
nicht leer. Daher gibt es eine kleinste Zahl k so, dass k ≥ m und Ak falsch
ist. Wegen (1) gilt k ≥ m + 1 , also k − 1 ≥ m. Weiters muss Ak−1 wahr sein,
weil k die kleinste Zahl in M ist. Aus (2) folgt nun, dass auch Ak wahr ist,
was einen Widerspruch bedeutet. Somit muss unsere Annahme am Anfang
des Beweises falsch sein, d.h. alle Aussagen An , n ≥ m , sind wahr.
Satz 17 : Sei n eine natürliche Zahl. Die Summe der Quadrate aller natürlichen Zahlen von 1 bis n ist S(n) := 16 n(n + 1)(2n + 1).
Beweis: Induktionsanfang: S(1) = 16 (2 + 3 + 1) = 1 = 12 , also ist die Aussage für n = 1 wahr.
Induktionsschluss: Wir nehmen an, dass die Summe der Quadrate aller natürlichen Zahlen von 1 bis n − 1 gleich S(n − 1) ist. Die Summe der Quadrate aller natürlichen Zahlen von 1 bis n ist dann
S(n − 1) + n2 .
Wegen
1
S(n − 1) + n2 = (n − 1)n(2n − 1) + n2 = S(n)
6
ist die Behauptung richtig.
§6. Zifferndarstellung von Zahlen
Wenn Sie einen Sack mit a Euromünzen haben, die Sie an b Personen
verteilen sollen (jede soll gleich viel bekommen), dann werden Sie wahrscheinlich zuerst jeder Person einen Euro geben und diesen Vorgang solange wiederholen, bis im Sack weniger als b Euromünzen sind. Sie haben
dann a mit Rest durch b dividiert.
10
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Der folgende Satz ist grundlegend für alle Rechenverfahren für ganze Zahlen. Seine Bedeutung liegt darin, dass die drei Strukturen“ +, · und ≤
”
zueinander in Beziehung gesetzt werden.
Satz 18 : (Division mit Rest von ganzen Zahlen)
Zu je zwei ganzen Zahlen a und b mit b ̸= 0 gibt es eindeutig bestimmte
ganze Zahlen m und r mit den Eigenschaften
a = m·b+r
und
0 ≤ r < |b| .
Die Zahlen m bzw. r heißen ganzzahliger Quotient von a und b bzw. Rest
von a nach Division durch b. Die Zahlen m und r können mit dem folgenden
Verfahren (Divisionsalgorithmus) berechnet werden:
• Falls a und b natürliche Zahlen sind:
Setze m := 0 und r := a.
Solange r ≥ b ist, ersetze r durch r − b und m durch m + 1.
• Falls a < 0 oder b < 0 ist:
Berechne wie oben n und s so, dass |a| = n · |b| + s und
0 ≤ s < |b| ist.
Wenn a ≥ 0 ist, dann setze m := −n und r := s.
Wenn a < 0 und s > 0 ist, dann setze m := −vz(b) · (n + 1) und r :=
|b| − s.
Wenn a < 0 und s = 0 ist, dann setze m := −vz(b) · n und r := 0.
Beweis: Wenn a und b natürliche Zahlen sind, dann erhalten wir bei jedem
Ersetzen von r durch r − b eine um mindestens 1 kleinere Zahl. Also tritt
nach höchstens a Schritten der Fall r < b ein. Somit liefert das obige Verfahren nach endlich vielen Schritten ein Ergebnis m, r. Mit Induktion über
|a| ist leicht nachzuprüfen, dass diese Zahlen die angegebenen Bedingungen erfüllen.
Es seien m1 , m2 , r1 , r2 ganze Zahlen mit a = m1 · b + r1 = m2 · b + r2 , 0 ≤
r1 , r2 < |b| und o.E.d.A. ( ohne Einschränkung der Allgemeinheit“) r1 ≤ r2 .
”
Dann ist
|b| > r2 − r1 = |m1 − m2 | · |b| .
Daraus folgt m1 = m2 und r1 = r2 , also sind der ganzzahlige Quotient von
a und b und der Rest von a nach Division durch b eindeutig bestimmt.
Nehmen wir an, Sie kommen mit einem Sack voller Euromünzen in eine
Bank und wollen dieses Geld auf ihr Sparbuch einzahlen. Die Anzahl der
Euromünzen im Sack ist eine eindeutig bestimmte natürliche Zahl a. Bevor
diese Zahl in Ihr Sparbuch eingetragen werden kann, muss der Bankbeamte
ihre Zifferndarstellung (zur Basis 10) berechnen. Eine Zahl ist also nicht
immer schon in Zifferndarstellung gegeben, sondern diese ist eine Zusatz”
information“ über die Zahl. Wie wird die Zifferndarstellung zur Basis 10
11
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
von a ermittelt? Man bildet aus den Euromünzen solange Zehnerstapel“,
”
bis nur noch weniger als zehn Münzen übrigbleiben, das heißt: a wird mit
Rest durch 10 dividiert. Die Anzahl der übriggebliebenen Euromünzen ist
dann die Einerziffer“ von a. Macht man dasselbe nun mit den Zehner”
stapeln statt mit den Münzen, dann erhält man die Zehnerziffer“ von a,
”
usw.
Satz 19 : (Darstellung von Zahlen durch Ziffern)
Es seien a und b natürliche Zahlen mit a ̸= 0 und b ≥ 2. Dann gibt es
eindeutig bestimmte natürliche Zahlen n, z0 , z1 , . . . , zn so, dass
zn ̸= 0, 0 ≤ z0 , z1 , . . . , zn < b
und
n
a = zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 = ∑ zi bi
i=0
ist.
Wenn b fest gewählt ist, dann ist a durch die Zahlen n, z0 , z1 , . . . , zn eindeutig
bestimmt. Man wählt Zeichen für die Zahlen von 0 bis b − 1 und schreibt
dann
n
zn zn−1 . . . z0
statt
∑ zibi
.
i=0
Die Zahlen z0 , z1 , . . . , zn heißen Ziffern von a zur Basis b (für b=2 bzw. 10:
Binärziffern“ bzw. Dezimalziffern“).
”
”
Die Ziffern zi von a ̸= 0 zur Basis b können mit dem folgenden Verfahren
berechnet werden:
• Setze i := 0.
• Solange a nicht 0 ist: Die i-te Ziffer zi ist der Rest von a nach Division
durch b. Ersetze a durch den ganzzahligen Quotienten von a und b.
Ersetze i durch i + 1.
Beweis: Induktion über a:
Wenn a < b ist, ist n = 0 und z0 = a.
Für a ≥ b seien m bzw. r der ganzzahlige Quotient von a und b bzw. der
Rest von a nach Division durch b. Wegen b > 1 ist m < a und wegen a ≥ b
ist m > 0, also gibt es nach Induktionsannahme eindeutig bestimmte Zahlen
k, y0 , y1 , . . . , yk so, dass yk ̸= 0, 0 ≤ y0 , y1 , . . . , yk < b und
m = yk bk + yk−1 bk−1 + . . . + y1 b1 + y0
ist. Dann ist
a = m · b + r = yk bk+1 + yk−1 bk + . . . + y1 b2 + y0 b + r ,
und yk , . . . , y0 , r sind die Ziffern von a. Wegen der Eindeutigkeit von m und
r folgt aus der Induktionsannahme die Eindeutigkeit der Ziffern von a zur
Basis b.
12
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Wird für die Zifferndarstellung einer Zahl die Basis b gewählt, dann
können alle Zahlen durch Aneinanderreihen von b verschiedenen Symbolen
angeschrieben werden. Eine kleine Basis (zum Beispiel 2) hat den Vorteil,
dass man nur wenige Symbole braucht und dass das kleine Einmaleins“
”
sehr einfach ist. Allerdings braucht man dann für größere Zahlen sehr viele
Ziffern.
Beispiel 20 : Die Zifferndarstellung des heurigen Jahres zur Basis zehn ist
2010, zur Basis zwei aber 11111011010.
Definition 21 : Es seien v = (v1 , . . . , vn ) und w = (w1 , . . . , wn ) zwei verschiedene n-Tupel von ganzen Zahlen und j die kleinste Zahl in {1, . . . , n}
mit der Eigenschaft, dass v j ̸= w j ist.
Dann ist v genau dann lexikographisch kleiner als w, wenn v j < w j ist
(Schreibweise: v <lex w).
Beispiel 22 : (1, 2, 3, 4) <lex (1, 2, 4, 3) <lex (2, −7, −3, −5)
Satz 23 : (Vergleich von zwei Zahlen, die durch Ziffern dargestellt sind) Es
seien b, x, y positive natürliche Zahlen, b ≥ 2 und
xk , xk−1 , . . . , x0
bzw. yℓ , yℓ−1 , . . . , y0
die Ziffern von x bzw. y bezüglich b.
Dann ist x genau dann kleiner als y, wenn
k < ℓ oder
(k = ℓ und (xk , xk−1 , . . . , x0 ) <lex (yℓ , yℓ−1 , . . . , y0 )) ist.
Beweis: Wenn k < ℓ ist, dann ist
k
k
k+1
k
i=0
i=0
i=1
i=0
x = ∑ xi bi ≤ ∑ (b − 1)bi =
∑ bi − ∑ bi = bk+1 − 1 < bk+1 ≤ y .
Es seien k = ℓ und j die größte Zahl mit der Eigenschaft, dass x j ̸= y j ist.
Wenn x j < y j ist, dann ist
j
j
i=0
i=0
∑ xibi ≤ x j b j + (b j − 1) < (x j + 1)b j ≤ y j b j ≤ ∑ yibi
und
k
x=
∑
i= j+1
j
xi bi + ∑ xi bi <
i=0
k
∑
i= j+1
j
xi bi + ∑ yi bi = y .
i=0
13
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Wenn zur Darstellung einer Zahl am Computer 32 bits (also 32 Binärziffern) zur Verfügung stehen, dann können in der Zweierkomplementdarstellung die Zahlen in
{−231 = −2147483648, . . . , −1, 0, 1, . . . , 231 − 1 = 2147483647}
(also insgesamt 232 Zahlen) dargestellt werden.
Ist a eine natürliche Zahl in diesem Zahlenbereich, dann wird a durch
0 a30 a29 . . . a1 a0
dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a zur Basis 2 sind.
Ist a eine negative Zahl in diesem Zahlenbereich, dann wird a durch
1 a30 a29 . . . a1 a0
dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a + 231 zur Basis 2 sind.
Satz 24 : (Zifferndarstellung von rationalen Zahlen)
Es seien b, c, d, p positive ganze Zahlen mit b ≥ 2. Dann gibt es eindeutig
bestimmte natürliche Zahlen n, zn , . . . , z0 , z−1 , . . . , z−p so, dass
zn ̸= 0 oder n = 0,
0 ≤ zn , . . . , z0 , z−1 , . . . , z−p < b
und
c
− (zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 + z−1 b−1 + . . . + z−p b−p ) < b−p
d
ist. Ist b fest gewählt, schreibt man
0≤
n
zn zn−1 . . . z0 .z−1 z−2 . . . z−p
statt
∑
zi bi .
i=−p
Die Zahlen zn , . . . , z0 , z−1 , . . . , z−p heißen Ziffern von dc zur Basis b. Die
Ziffern zi von dc zur Basis b können wie folgt berechnet werden:
• Berechne (mit Satz 19) die Ziffern y0 , . . . , yk zur Basis b des ganzzahligen Quotienten m von c · b p und d .
• Setze zi := yi+p , −p ≤ i ≤ k − p =: n .
Beweis: Sei r der Rest von c · b p nach Division durch d. Wegen c · b p =
m · d + r ist dann
m·d
r
c · bp
=
+
,
p
p
d ·b
d ·b
d · bp
also
m r
c
= p + · b−p .
d b
d
Wegen 0 ≤ r < d ist
r
c m
< 1 und
−
< b−p .
d
d bp
14
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Rationale Zahlen können also beliebig genau“ durch Zahlen der Form
”
zn zn−1 . . . z0 .z−1 z−2 . . . z−p angenähert werden, aber es gibt rationale Zahlen,
die für alle p von zn zn−1 . . . z0 .z−1 z−2 . . . z−p verschieden sind.
Eine rationale Zahl
z0 .z−1 z−2 . . . z−p Ee := z0 .z−1 z−2 . . . z−p · be
mit b ≥ 2 und z0 ̸= 0 ist in Exponentialform zur Basis b dargestellt. Die
Zahlen e und z0 .z−1 z−2 . . . z−p heißen Exponent und Mantisse.
Am Computer kann eine Zahl durch die Ziffern des Exponenten und der
Mantisse zur Basis 2 dargestellt werden. Die Anzahl dieser Ziffern ist durch
eine vorgegebene Zahl beschränkt. Die so am Computer verfügbaren Zahlen
heißen Maschinenzahlen. Es gibt nur endlich viele Maschinenzahlen, alle
Maschinenzahlen sind rationale Zahlen.
Beim Rechnen mit so dargestellten Zahlen gibt es im allgemeinen keine exakten Ergebnisse, sondern Rundungsfehler. Bei Rechenverfahren muss
daher darauf geachtet werden, dass sich die Fehler nicht akkumulieren. Fehlerabschätzungen sind erforderlich.
Beispiel 25 : Die Zahl 0.1 (Dezimaldarstellung) auf der Tastatur wird vom
Computer in Binärdarstellung 0.0001100110011001100 . . . umgewandelt
und zum Beispiel als
1.100110011001100110011001100110011001100 E − 4
gespeichert. Also ergibt schon die Eingabe von 0.1 einen Rundungsfehler!
Will man mit rationalen Zahlen am Computer exakt rechnen, kann man ab
als Zahlenpaar (a, b) eingeben. Dann müssen für Zahlenpaare die Rechenoperationen
(a, b) + (c, d) := (ad + bc, bd) und
(a, b) · (c, d) := (ac, bd)
definiert werden.
§7. Gruppen, Ringe und Körper
Definition 26 : Sei G eine Menge und ∗ : G × G → G eine Funktion. Für
Elemente a, b ∈ G schreiben wir statt ∗(a, b) kurz a∗b. Das Paar (G, ∗) heißt
eine Gruppe, wenn die folgenden drei Bedingungen ( Gruppen-Axiome“)
”
erfüllt sind:
(1) Für alle Elemente a, b, c ∈ G ist
a ∗ (b ∗ c) = (a ∗ b) ∗ c =: a ∗ b ∗ c (Assoziativgesetz).
(2) Es gibt ein Element e ∈ G so, dass für alle a ∈ G gilt :
a ∗ e = e ∗ a = a (e heißt dann neutrales Element in G).
(3) Für alle Elemente a ∈ G gibt es ein b ∈ G so, dass
a ∗ b = b ∗ a = e ist (b heißt dann zu a inverses Element und wird mit
a−1 bezeichnet).
15
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Eine Gruppe (G, ∗) heißt kommutativ oder abelsch, wenn zusätzlich gilt:
(4) Für alle a, b ∈ G ist a ∗ b = b ∗ a (Kommutativgesetz).
Ist (G, ∗) eine Gruppe, dann wird die Funktion ∗ als Gruppenverknüpfung,
Multiplikation oder, wenn (G, ∗) abelsch ist, als Addition bezeichnet. Wenn
aus dem Zusammenhang ersichtlich ist, welche Verknüpfung auf G betrachtet wird, schreibt man statt (G, ∗) kürzer G.
Beispiel 27 : ( Z , +), ({1, −1}, ·), ( Q , +) und ( Q \ {0}, ·) sind kommutative Gruppen.
Satz 28 : Seien (G, ∗) eine Gruppe und a, b, c ∈ G. Dann gilt:
(1) Es gibt genau ein neutrales Element in G.
(2) Zu jedem Element in G gibt es genau ein inverses Element in G.
(3) Es ist (a ∗ b)−1 = b−1 ∗ a−1 .
(4) Aus a ∗ b = a ∗ c oder b ∗ a = c ∗ a folgt b = c ( In einer Gruppe
”
kann gekürzt werden“).
Beweis:
(1) Seien e und e′ neutrale Elemente in G. Dann ist e′ = e ∗ e′ und e =
e ∗ e′ , also e = e′ .
(2) Seien b und b′ zu a inverse Elemente. Dann ist
b = e ∗ b = (b′ ∗ a) ∗ b = b′ ∗ (a ∗ b) = b′ ∗ e = b′ .
(3) Es ist (a ∗ b) ∗ (b−1 ∗ a−1 ) = a ∗ (b ∗ (b−1 ∗ a−1 )) =
= a ∗ ((b ∗ b−1 ) ∗ a−1 ) = a ∗ (e ∗ a−1 ) = a ∗ a−1 = e und
(b−1 ∗ a−1 ) ∗ (a ∗ b) = b−1 ∗ (a−1 ∗ (a ∗ b)) = b−1 ∗ ((a−1 ∗ a) ∗ b) =
b−1 ∗ (e ∗ b) = b−1 ∗ b = e.
(4) Aus a ∗ b = a ∗ c folgt b = a−1 ∗ a ∗ b = a−1 ∗ a ∗ c = c.
Definition 29 : Seien R eine Menge und + : R × R → R sowie
· : R × R → R Funktionen. Wir schreiben statt +(a, b) kurz a + b“ und statt
”
·(a, b) kurz a · b“ oder ab“. Das Tripel (R, +, ·) heißt ein Ring, wenn die
”
”
folgenden Bedingungen ( Ring-Axiome“) erfüllt sind:
”
(1) (R, +) ist eine abelsche Gruppe.
(2) Für alle a, b, c ∈ R ist (ab)c = a(bc) (Assoziativgesetz).
(3) Es gibt ein Element e ∈ R so, dass für alle a ∈ R gilt :
ea = ae = a (e heisst dann Einselement und wird mit 1R bezeichnet).
(4) Für alle a, b, c ∈ R ist a(b + c) = (ab) + (ac) und
(a + b)c = (ac) + (bc) (Distributivgesetz).
Ein Ring (R, +, ·) heißt kommutativ, wenn zusätzlich gilt:
(5) Für alle a, b ∈ R ist ab = ba (Kommutativgesetz).
16
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Ist (R, +, ·) ein Ring, dann heißt + die Addition und · die Multiplikation
des Ringes. Das neutrale Element von (R, +) heißt Nullelement und wird
0R geschrieben. Das zu a ∈ R bezüglich + inverse Element wird mit −a
bezeichnet. Die Subtraktion ist dann definiert durch
a − b := a + (−b).
Um Klammern einzusparen, wird verabredet, dass die Multiplikation immer
vor der Addition ausgeführt wird, ausgenommen bei gegenteiliger Klammerung. Zum Beispiel wird (ab) + c abgekürzt als ab + c.
Wenn aus dem Zusammenhang ersichtlich ist, welche Addition und
Multiplikation auf der Menge R betrachtet werden, so schreibt man statt
(R, +, ·) kurz R.
Beispiel 30 : ( Z , +, ·) und ( Q , +, ·) sind kommutative Ringe.
Definition 31 : Ein Element a eines Ringes R mit Einselement 1R ist invertierbar, wenn es ein Element b ∈ R mit
ab = 1R = ba
gibt. Das Element b heißt dann zu a (bezüglich ·) inverses Element und wird
mit a−1 bezeichnet.
Satz 32 : Die Menge aller invertierbaren Elemente eines Ringes R ist mit
der Multiplikation von R eine Gruppe. Das Einselement von R ist das neutrale Element dieser Gruppe. Für invertierbare Elemente a, b ∈ R ist
(ab)−1 = b−1 a−1
und
(a−1 )−1 = a .
Beweis: Es ist
(ab)(b−1 a−1 ) = a(bb−1 )a−1 = 1 = b−1 (a−1 a)b = (b−1 a−1 )(ab) .
Definition 33 : Sei (R, +, ·) ein kommutativer Ring mit mindestens zwei
Elementen. R heißt ein Körper, wenn jedes Element von R\{0} invertierbar
ist. Die Division in R ist dann durch
a/b := ab−1
definiert.
Beispiel 34 : ( Q , +, ·) ist ein Körper. Der Ring ( Z , +, ·) der ganzen Zahlen
ist kein Körper.
17
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Als Merkregel für diese Definitionen gilt:
In einem Ring kann addiert, subtrahiert und multipliziert werden. In einem
Körper kann zusätzlich noch durch Elemente ungleich Null dividiert werden. Die Ring-Axiome sind den Rechenregeln für ganze Zahlen nachgebildet.
Satz 35 : Die Menge {0, 1} mit der Addition
0 + 0 = 0, 0 + 1 = 1 + 0 = 1, 1 + 1 = 0
und der Multiplikation
0 · 0 = 0 · 1 = 1 · 0 = 0, 1 · 1 = 1
ist ein Körper mit Nullelement 0 und Einselement 1.
Dieser Körper heißt binärer Körper und wird mit Z 2 (sprich Z modulo 2“)
”
bezeichnet.
Beweis: Übung.
Satz 36 : Seien (R, +, ·) ein Ring und a, b, c ∈ R. Dann gilt:
(1)
(2)
(3)
(4)
Aus a + b = a + c folgt b = c.
0R · a = a · 0R = 0R
(−a) · b = a · (−b) = −(a · b)
(−a) · (−b) = a · b.
Wenn R ein Körper und a =
̸ 0 ist, dann gilt:
(5) Aus a · b = a · c folgt b = c.
Beweis:
(1) folgt nach Satz 28 durch Kürzen in der Gruppe (R, +).
(2) Aus 0R + 0R · a = 0R · a = (0R + 0R ) · a = 0R · a + 0R · a folgt nach
(1), dass 0R = 0R · a ist. Analog beweist man die zweite Behauptung.
(3) Aus (−a) · b + a · b = (−a + a) · b = 0R · b = 0R folgt (−a) · b =
−(a · b). Analog beweist man die zweite Behauptung.
(4) Nach (3) ist (−a) · (−b) = −(a · (−b)) = −(−(a · b)) = a · b .
(5) Aus a · b = a · c erhält man a−1 · a · b = a−1 · a · c und schließlich b = c.
18
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
§8. Rechnen mit Summen und Produkten
Definition 37 : Seien (R, +, ·) ein Ring, n eine positive ganze Zahl und
a1 , a2 , . . . , an ∈ R. Dann sei
n
∑ ai := a1 + a2 + . . . + an := (. . . ((a1 + a2) + a3) + . . . + an−1) + an .
i=1
Sprechweise: Die Summe aller ai mit i von 1 bis n. Die Elemente
a1 , a2 , . . . , an heißen Summanden von ∑ni=1 ai .
Für n = 1 ist
1
∑ ai = a1 .
i=1
Es sei
n
∏ ai := a1 · a2 · . . . · an := (. . . ((a1 · a2) · a3) · . . . · an−1) · an .
i=1
Sprechweise: Das Produkt aller ai mit i von 1 bis n. Die Elemente
a1 , a2 , . . . , an heißen Faktoren von ∏ni=1 ai .
Für n = 1 ist
1
∏ ai = a1 .
i=1
Durch Induktion über n kann man zeigen, dass es beim Bilden einer
Summe oder eines Produktes nicht auf die Reihenfolge des Ausführens der
Rechenoperationen + bzw. · ankommt, die Klammern können also weggelassen werden ( Allgemeines Assoziativgesetz“).
”
Definition 38 : Eine Funktion f : M → N heißt bijektiv, wenn jedes Element von N genau ein Urbild hat.
Eine Menge M heißt endlich, wenn sie leer ist oder es eine positive ganze
Zahl n und eine bijektive Funktion f : {1, . . . , n} → M gibt. In diesem Fall
nennt man
#(M) := n
die Anzahl der Elemente von M. Wenn M leer ist, sei
#(0)
/ := 0 .
( Die leere Menge hat 0 Elemente“).
”
M heißt unendlich, wenn M nicht endlich ist.
19
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Satz 39 : (Allgemeines Kommutativgesetz) Seien (R, +, ·) ein kommutativer Ring, n eine positive ganze Zahl und a1 , a2 , . . . , an ∈ R und f eine bijektive Funktion von {1, . . . , n} nach {1, . . . , n}. Dann gilt
n
n
i=1
i=1
n
n
i=1
i=1
∑ ai = ∑ a f (i) ,
und
∏ ai = ∏ a f (i) ,
d.h. auf die Reihenfolge der Summanden bzw. Faktoren kommt es bei der
Berechnung von ∑ni=1 ai bzw. ∏ni=1 ai nicht an, sie können beliebig umgeordnet werden. werden.
Beweis: Induktion über n.
Definition 40 : Sei I eine endliche Menge, (R, +, ·) ein kommutativer Ring
und (ai )i∈I eine Familie von Elementen in R. Wenn I nicht leer ist, sei
n
∑ ai := ∑ a f (i) ∈ R
i∈I
i=1
und
n
∏ ai := ∏ a f (i) ∈ R ,
i∈I
i=1
wobei f eine bijektive Funktion von {1, 2, . . . , n := #(I)} nach I ist.
Nach Satz 39 hängt ∑i∈I ai nicht von der Wahl der bijektiven Funktion f ab.
Wenn I leer ist, vereinbaren wir
∑ ai := 0R
i∈0/
und
∏ ai := 1R .
i∈0/
Beispiel 41 : Sei I := {(0, 2), (1, 1), (2, 0)}, (R, +, ·) := ( Z , +, ·) und
a(0,2) := 3, a(1,1) := 4, a(2,0) := 1. Sei f die bijektive Funktion von {1, 2, 3}
nach I mit f (1) = (1, 1), f (2) = (0, 2), f (3) = (2, 0). Dann ist
∑ ai = a(1,1) + a(0,2) + a(2,0) = 4 + 3 + 1 = 8 .
i∈I
und
∏ ai = a(1,1) · a(0,2) · a(2,0) = 4 · 3 · 1 = 12 .
i∈I
20
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Beispiel 42 : Seien m, n ∈ Z, m < n, I := {m, m + 1, . . . , n} und
am , am+1 , . . . , an ∈ R. Die Funktion
f : {1, . . . , n − m + 1} −→ I , j 7−→ j + m − 1 ,
ist bijektiv, also ist
n−m+1
∑ ai = ∑
i∈I
a f (i) = am + am+1 + . . . + an .
i=1
In diesem Fall schreibt man oft
n
∑ ai
∑ ai
statt
i=m
i∈I
und analog
n
∏ ai
∏ ai .
statt
i=m
i∈I
Satz 43 : (Allgemeines Distributivgesetz)
Seien (R, +, ·) ein Ring, m, n ∈ N und a1 , . . . , am , b1 , . . . , bn ∈ R. Dann gilt
(
)
(
)
(
) (
)
m
∑ ai ·
i=1
n
n
m
∑ bj
∑ ai · b j
=∑
j=1
=
j=1
i=1
n
m
j=1
i=1
∑ ∑ ai · b j
.
Beweis: Durch Induktion über n bzw. m zeigt man für a ∈ R bzw. b j , 1 ≤
j ≤ n,
(
)
(
)
n
n
∑ bj
a·
=
j=1
∑ a·bj
j=1
Sei a := ∑m
i=1 ai ∈ R. Dann ist
(
)
a·
n
∑ bj
=
j=1
(
n
n
j=1
j=1
m
m
i=1
i=1
∑ ai · b j = ∑ ai · b j .
bzw
)
m
∑ a · b j = ∑ ∑ ai
·bj =
i=1
(
n
m
)
∑ ∑ ai · b j
j=1
.
i=1
Seien I und J endliche Mengen, R ein Ring und (ai )i∈I , (b j ) j∈J Familien
in R. Mit der Schreibweise von Definition 40 erhält man aus Satz 43:
)
)
(
)
(
) (
(
∑ ai
i∈I
·
∑ bj
j∈J
=
=∑
i∈I
∑
(i, j)∈I×J
∑ ai · b j
=
j∈J
ai · b j =:
∑
i∈I, j∈J
∑ ∑ ai · b j
j∈J
ai · b j .
i∈I
=
21
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
Beispiel 44 : Berechne die Summe aller Produkte i · j von Zahlen i in
{1, 2, . . . , m} mit Zahlen j in {1, 2, . . . , n}! Nach Satz 39 ist
m
∑ i = 1 + 2 + . . . + (m − 1) + m =
i=1
= (1 + m) + (2 + (m − 1)) + (3 + (m − 2)) + . . . =
Nach Satz 43 ist daher
(
m
n
m
∑ ∑ i· j = ∑i
i=1 j=1
i=1
) (
·
n
∑j
j=1
)
=
m(m + 1)
.
2
m · (m + 1) · n · (n + 1)
.
4
22
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
§9. Fragen
1. Es sind vier Funktionen gegeben.
f : N −→ Z , z 7−→ 16 − 4z2
g : N −→ Q , z 7−→ −4(z2 − 4)
h : N −→ Z , z 7−→ (4 − 2z)(4 + 2z)
i sei die Funktion von N nach Z , deren Graph {(z, 16 −4z2 ) | z ∈ N }
ist.
Welche der folgenden Aussagen sind wahr?
(a) Die Funktionen f und g sind gleich.
(b) Die Funktionen f und h sind gleich.
(c) Die Funktionen f und i sind gleich.
2. Es seien A := {1, 2, 3, 5, 6, 7, 9, 10}, B := {2, 5, 7, 10} und
C := {1, 3, 6, 9}.
Welche der folgenden Aussagen sind wahr?
(a)
(b)
(c)
(d)
B ∩C = A
(2 ∈ A) ∧ (2 ̸∈ B)
(C ⊆ A) ∨ (B ̸⊆ A)
B ∪C = A
3. Induktionsbeweis
Sei 1 ≤ m ≤ n eine natürliche Zahl und sei (A1 , A2 , ..., An ) eine Folge
von Aussagen.
Welche der folgenden Aussagen sind wahr?
(a) Ist die Aussage Am wahr und gilt für alle i ∈ {1, . . . , n − 1}:
wenn Ai wahr ist, dann auch Ai+1 , dann sind alle Aussagen
A1 , . . . , An wahr.
(b) Wenn A1 falsch ist, aber alle anderen Aussagen wahr sind, dann
gilt für alle i ∈ {1, . . . , n−1}: wenn Ai wahr ist, dann auch Ai+1 .
(c) Wenn eine der Aussagen A1 , . . . , An falsch ist, dann ist A1 falsch
oder es gibt einen Index i mit 1 ≤ i ≤ n − 1 so, dass Ai wahr und
Ai+1 falsch ist.
4. Division mit Rest
Berechne den ganzzahligen Quotient und den Rest von a nach Division duch b!
(a) a = 12, b = −5
(b) a = −12, b = 5
(c) a = −12, b = −5
5. Zifferndarstellung von rationalen Zahlen
Es seien x bzw. y die ganze Zahl, deren Zifferndarstellung zur Basis
zehn 7 bzw. 25 ist.
(a) Berechne die Zifferndarstellung von x und y zur Basis 2.
23
0. MENGEN, FUNKTIONEN, ZAHLEN UND RECHENREGELN
(b) Berechne die Zifferndarstellung der rationalen Zahl xy zur Basis
zwei mit vier Ziffern mit negativem Index.
(c) Berechne die Zifferndarstellung der rationalen Zahl xy zur Basis
zehn mit vier Ziffern mit negativem Index.
6. Gruppen, Ringe und Körper
Seien (R, +, ·) ein Ring und a, b, c Elemente von R. Welche der folgenden Aussagen sind wahr?
(a) (R, +) ist eine kommutative Gruppe.
(b) Wenn a · c = b · c ist, dann ist a = b.
(c) (R, +, ·) ist ein Körper, wenn alle Elemente von R invertierbar
sind.
7. Summen
Es seien a1 , . . . , an , b1 , . . . , bn Elemente eines Ringes. Welche der folgenden Aussagen sind wahr?
(a)
n
n
i=1
j=1
∑ ai · ∑ bi =
(b)
n
n
i=1
j=1
∑ ai · ∑ b j =
n
∑ ak bk
k=1
n
n
k=1
ℓ=1
∑ ak · ∑ bℓ
KAPITEL 1
Matrizenrechnung
In diesem Kapitel werden mit m, n, p, q immer positive ganze Zahlen
und mit K ein Körper (zum Beispiel Q oder Z 2 ) bezeichnet.
§1. Matrizen
Definition 45 : Eine m × n-Matrix mit Koeffizienten in K (oder eine m × nMatrix über K) ist eine Funktion
A : {1, 2, . . . , m} × {1, 2, . . . , n} → K , (i, j) 7→ A(i, j) .
Statt A(i, j) schreiben wir kurz Ai j . Eine Matrix wird üblicherweise als Familie


A11 A12 . . . A1n
 A21 A22 . . . A2n 
A = (Ai j )1≤i≤m = 
..
.. 
 ...
.
. 
1≤ j≤n
Am1 Am2 . . . Amn
geschrieben. Ai j heißt der i j-te Koeffizient von A (oder Koeffizient in der
i-ten Zeile und j-ten Spalte von A). Als Kurzschreibweise wird
A = (Ai j )i, j
verwendet. Anstelle von Matrix-Koeffizienten“ spricht man auch von
”
Matrix-Einträgen“. Eine m × 1-Matrix heißt eine m-Spalte,
”
eine 1 × n-Matrix eine n-Zeile. Die n-Zeile
Ai− := (Ai1 , Ai2 , . . . , Ain )
heißt i-te Zeile von A, die m-Spalte

A1 j
 A2 j 

A− j := 
 ... 

Am j
j-te Spalte von A. Die Zahl i bzw. j heißt Zeilenindex bzw. Spaltenindex
des Matrix-Eintrages Ai j .
Die Menge aller m × n-Matrizen mit Koeffizienten in K wird mit
K m×n
bezeichnet. Matrizen mit Koeffizienten in Z oder Q werden kurz ganzzahlige oder rationale Matrizen genannt.
24
25
1. MATRIZENRECHNUNG
1 × 1-Matrizen mit Koeffizienten in K werden üblicherweise mit den entsprechenden Elementen von K identifiziert, d.h.
K 1×1 = K
,
(Ai j ) 1≤i≤1 = A11 .
1≤ j≤1
1 × n-Matrizen mit Koeffizienten in K werden üblicherweise mit den entsprechenden n-Tupeln in K n identifiziert, d.h. die Funktionen
A : {1} × {1, . . . , n} −→ K , (1, i) 7−→ A(1, i) ,
und
{1, . . . , n} −→ K , i 7−→ A(1, i) ,
werden als gleich aufgefasst, obwohl ihre Definitionsbereiche
({1} × {1, . . . , n} und {1, . . . , n}) nicht gleich sind.
Definition 46 : Seien A, B ∈ K m×n und r, s ∈ K. Dann heißt


A11 + B11 . . . A1n + B1n
..
..
 ∈ K m×n
A + B := (Ai j + Bi j )1≤i≤m = 
.
.
1≤ j≤n
die Summe von A und B, und
Am1 + Bm1 . . . Amn + Bmn


rA11 . . . rA1n
..  ∈ K m×n
r · A := (rAi j )1≤i≤m =  ...
.
1≤ j≤n
rAm1 . . . rAmn
heißt das r-fache von A. Wir schreiben im Folgenden statt r · A“ kurz rA“.
”
”
Weiters vereinbaren wir, dass rA + sB immer (rA) + (sB) bedeutet (d.h. rA
und sB sind zuerst zu berechnen, dann die Summe von rA und sB).
Satz 47 :
(1) (K m×n , +) ist eine kommutative Gruppe, wobei das neutrale Element
die m × n-Nullmatrix


0K . . . 0K
..  ∈ K m×n
0 =  ...
.
0K . . . 0K
und das zu A ∈ K m×n inverse Element
−A = (−Ai j )1≤i≤m ∈ K m×n
1≤ j≤n
ist.
(2) Für r, s ∈ K und A, B ∈ K m×n ist
(r + s)A = rA + sA
26
1. MATRIZENRECHNUNG
und
r(A + B) = rA + rB.
(3) Für r, s ∈ K und A ∈ K m×n ist
(rs)A = r(sA) und 1K A = A .
Beweis:
(1) Wir zeigen nur die Assoziativität, die anderen Eigenschaften einer
Gruppe werden analog bewiesen. Für A, B,C ∈ K m×n ist
(A + B) +C = (Ai j + Bi j )i, j + (Ci, j )i, j = ((Ai j + Bi j ) +Ci j )i, j =
= (Ai j + (Bi j +Ci j ))i, j = (Ai j )i, j + (Bi j +Ci j )i, j = A + (B +C)
aufgrund des Assoziativgesetzes für die Addition in K.
(2) , (3) Übung.
Definition 48 : Für eine n-Zeile A und eine n-Spalte B heißt
 
B1
n
A · B := (A1 , . . . , An ) ·  ...  := A1 B1 + · · · + An Bn = ∑ Ai Bi
i=1
Bn
das Produkt von A und B (sprich A mal B“). Oft wird statt A · B nur AB
”
geschrieben.
Beispiel 49 : Ein Korb voller Waren werde durch die Zeile
S := (S1 , . . . , Sn ) ∈ Q 1×n
beschrieben, wobei Si die Stückzahl der Ware i im Korb angibt. Sei
 
P1
P :=  ...  ∈ Q n×1 ,
Pn
wobei Pi den Preis der Ware i in Euro angibt. Dann ist
n
SP = ∑ Si Pi ∈ Q
i=1
der Gesamtpreis (in Euro) für die Waren im Korb.
Definition 50 : Für A ∈ K m×n und B ∈ K n×p heißt
n
A · B := (Ai− · B− j )1≤i≤m := ( ∑ Aik Bk j )1≤i≤m ∈ K m×p
1≤ j≤p
k=1
1≤ j≤p
27
1. MATRIZENRECHNUNG
das Produkt von A und B (sprich A mal B“). Oft wird statt A · B nur AB
”
geschrieben. Zur Berechnung des Koeffizienten
n
(AB)i j =
∑ Aik Bk j
k=1
werden die Koeffizienten in der i-ten Zeile von A der Reihe nach mit den
entsprechenden Koeffizienten in der j-ten Spalte von B multipliziert und
anschließend alle diese Produkte addiert.
Im Spezialfall m = 1 und p = 1, d.h. A ist eine n-Zeile und B eine nSpalte, stimmen die Definitionen 48 und 50 überein.
Beispiel 51 : Die Waren 1, . . . , m werden aus Rohstoffen 1, . . . , n hergestellt, die von Lieferanten 1, . . . , p bezogen werden. Für die Erzeugung der
Ware i werden Qi j Einheiten des Rohstoffes j benötigt. Der Preis einer Einheit des Rohstoffes j beim Lieferanten k beträgt Pjk . Setzt man
Q := (Qi j )i, j ∈ Q m×n und P := (Pjk ) j,k ∈ Q n×p , dann ist
n
(QP)ik =
∑ Qi j Pjk
j=1
der Gesamtpreis der Rohstoffe für Ware i beim Lieferanten k. Sollen jeweils
Si Stück der Ware i produziert werden und setzt man
S = (S1 , . . . , Sm ) ∈ Q 1×n , dann ist (SQ)1 j die Anzahl der insgesamt benötigten Einheiten von Rohstoff j und
((SQ)P)1k
ist der Preis bei Lieferant k für alle benötigten Rohstoffe.
Satz 52 : Die Matrizenmultiplikation ist assoziativ, d.h. für Matrizen
A ∈ K m×n , B ∈ K n×p und C ∈ K p×q gilt
(AB)C = A(BC).
Beweis: Da AB eine m × p-Matrix und BC eine n × q-Matrix ist, sind sowohl (AB)C als auch A(BC) m × q-Matrizen. Für 1 ≤ i ≤ m und 1 ≤ j ≤ q
28
1. MATRIZENRECHNUNG
ist
p
((AB)C)i j =
Ck j
ℓ=1
n p
k=1
∑ ∑ AiℓBℓkCk j = ∑ ∑ AiℓBℓkCk j
k=1 ℓ=1
n
=
)
n
∑ (AB)ikCk j = ∑ ∑ AiℓBℓk
k=1
p n
=
(
p
∑ Aiℓ
ℓ=1
(
ℓ=1 k=1
)
p
∑ BℓkCk j
n
=
k=1
∑ Aiℓ(BC)ℓ j
ℓ=1
= (A(BC))i j .
Definition 53 : Für Elemente i, j einer beliebigen Indexmenge ist das
Kronecker-Delta in K
{
1K falls i = j ist,
δi j :=
0K falls i ̸= j ist.
Die Matrix

1
0
In := (δi j ) 1≤i≤n = 
 ...
1≤ j≤n
0
0
1
..
.
0

... 0
. . . 0
∈ K n×n
. . .. 
. .
... 1
heißt n × n-Einheitsmatrix.
Satz 54 : Für eine beliebige Matrix A ∈ K m×n ist
Im A = A und
AIn = A .
Beweis: Für 1 ≤ i ≤ m und 1 ≤ j ≤ n ist (Im A)i j = ∑m
k=1 δik Ak j = Ai j , also
Im A = A. Analog beweist man AIn = A.
Satz 55 : Für A, B ∈ K m×n und C ∈ K n×p gilt
(A + B)C = AC + BC.
Für A ∈ K m×n und B,C ∈ K n×p gilt
A(B +C) = AB + AC.
Für A ∈ K m×n , B ∈ K n×p und r ∈ K gilt
r(AB) = (rA)B = A(rB).
Beweis: Übung.
29
1. MATRIZENRECHNUNG
Satz 56 : (K n×n , +, ·) ist ein Ring mit Einselement In . Wegen
)
(
)(
) (
0 1
1 0
0 1
=
,
0 0
0 0
0 0
aber
(
0 1
0 0
)(
) (
)
1 0
0 0
=
,
0 0
0 0
ist K n×n im Allgemeinen nicht kommutativ.
Beweis: Die Behauptung folgt aus Satz 47, Satz 52, Satz 54 und Satz 55.
Definition 57 : Eine Matrix A ∈ K n×n heißt invertierbar, wenn es eine Matrix B ∈ K n×n gibt mit
AB = In
und
BA = In .
In diesem Fall nennt man B die zu A inverse Matrix und schreibt
B = A−1 .
Sei
GLn (K) := {A ∈ K n×n | A invertierbar}.
Nach Satz 32 ist (GLn (K), ·) eine Gruppe, sie heißt allgemeine lineare
Gruppe (auf Englisch general linear group“).
”
§2. Elementare Umformungen
Definition 58 : Seien 1 ≤ k ≤ m und 1 ≤ ℓ ≤ n. Dann heißt die Matrix
Ekℓ ∈ K m×n mit Koeffizienten
{
1K falls i = k und j = ℓ ist,
(Ekℓ )i j := δik δ jℓ =
0K falls i ̸= k oder j ̸= ℓ ist,
eine Standard-Matrix von K m×n . Zum Beispiel sind die Standard-Matrizen
von Q 2×2
(
)
(
)
(
)
(
)
1 0
0 1
0 0
0 0
E11 =
, E12 =
, E21 =
und E22 =
.
0 0
0 0
1 0
0 1
Im Spezialfall m = 1 (oder n = 1) schreibt man statt E1ℓ (bzw. Ek1 ) kurz
eℓ (bzw. ek ). Zum Beispiel sind die Standard-Zeilen von Q 1×3
e1 = (1, 0, 0) , e2 = (0, 1, 0) und e3 = (0, 0, 1)
und die Standard-Spalten von Q 2×1 sind
( )
( )
1
0
e1 =
und e2 =
.
0
1
30
1. MATRIZENRECHNUNG
Satz 59 : Für Ekℓ ∈ K m×m , A ∈ K m×n und 1 ≤ i ≤ m ist
{
Aℓ− falls i = k ist,
.
(Ekℓ A)i− =
0
falls i ̸= k ist
Beweis: Sei 1 ≤ j ≤ n. Dann ist
(Ekℓ A)i j =
m
m
p=1
p=1
∑ (Ekℓ)ipA p j = ∑ δkiδℓpA p j =
{
Aℓ j
= δki Aℓ j =
0
falls i = k ist,
.
falls i ̸= k ist
Definition 60 : Die folgenden Matrizen heißen Elementarmatrizen in K n×n :
Typ 1: In + rEkℓ , wobei r ∈ K, 1 ≤ k, ℓ ≤ n und k ̸= ℓ ist,
Typ 2: In − Ekk − Eℓℓ + Ekℓ + Eℓk , wobei 1 ≤ k, ℓ ≤ n und k ̸= ℓ ist,
Typ 3: In + (t − 1)Ekk , wobei 1 ≤ k, ℓ ≤ n und t ∈ K invertierbar ist.
Zum Beispiel sind
(
) (
) (
)
1 2
0 1
1 0
,
,
∈ Q 2×2
0 1
1 0
0 3
Elementarmatrizen vom Typ 1, Typ 2 bzw. Typ 3.
Satz 61 : Sei A ∈ K m×n und seien P ∈ K m×m sowie Q ∈ K n×n Elementarmatrizen. Dann erhält man PA aus A, indem man
Typ 1: zur k-ten Zeile von A das r-fache der ℓ-ten Zeile addiert,
Typ 2: die k-te und ℓ-te Zeile von A vertauscht,
Typ 3: die k-te Zeile von A mit t multipliziert.
Diese Umformungen der Matrix A heißen elementare Zeilenumformungen.
Analog erhält man AQ aus A, indem man
Typ 1: zur ℓ-ten Spalte von A das r-fache der k-ten Spalte addiert,
Typ 2: die k-te und ℓ-te Spalte von A vertauscht,
Typ 3: die k-te Spalte von A mit t multipliziert.
Diese Umformungen der Matrix A heißen elementare Spaltenumformungen.
Beweis: Für P = In + rEkℓ , wobei r ∈ K und k ̸= ℓ, ist
PA = (In + rEkℓ )A = A + rEkℓ A. Nach Satz 59 ist
{
rAℓ− falls i = k ist,
(rEkℓ A)i− =
0
falls i ̸= k ist.
Die anderen Fälle beweist man analog.
31
1. MATRIZENRECHNUNG
Wenn eine elementare Zeilenumformung von A ∈ K m×n durchgeführt
wird, entspricht das der Multiplikation (von links) einer gewissen Elementarmatrix P ∈ K m×m mit A. Wegen P · Im = P erhält man diese Elementarmatrix, indem man diese elementare Umformung an der Einheitsmatrix
Im durchführt. Zum Beispiel ist die Elementarmatrix in Q 2×2 , die der elementaren Umformung addiere zur ersten Zeile einer Matrix deren 4-fache
”
zweite Zeile“ entspricht, jene Matrix, die man erhält, indem man zur ersten
Zeile der Einheitsmatrix in Q 2×2 ihre 4-fache zweite Zeile addiert:
(
)
1 4
.
0 1
Satz 62 : Elementarmatrizen sind invertierbar, genauer gilt:
Typ 1: (In + rEkℓ )−1 = In − rEkℓ
Typ 2: (In − Ekk − Eℓℓ + Ekℓ + Eℓk )−1 = In − Ekk − Eℓℓ + Ekℓ + Eℓk
Typ 3: (In + (t − 1)Ekk )−1 = In + (t −1 − 1)Ekk .
Somit können alle elementaren Zeilen- oder Spaltenumformungen einer beliebigen Matrix durch elementare Zeilen- oder Spaltenumformungen wieder
rückgängig gemacht werden.
Beweis: Die Matrix
(In − rEkℓ )(In + rEkℓ ) = (In − rEkℓ )[(In + rEkℓ )In ]
erhält man aus In , indem man zuerst zur k-ten Zeile das r-fache der ℓ-ten
Zeile addiert und anschließend das r-fache der ℓ-ten Zeile subtrahiert. Daher
ist
(In − rEkℓ )(In + rEkℓ ) = In .
Die anderen Fälle beweist man analog. Ist P eine Elementarmatrix, so bekommt man A aus B := PA wieder zurück, indem man B von links mit P−1
multipliziert.
32
1. MATRIZENRECHNUNG
§3. Fragen
Im Folgenden seien K ein Körper und K m×n die Menge aller
m × n-Matrizen mit Koeffizienten in K.
1. Multiplikation von Matrizen
Sei A ∈ K m×n , B ∈ K n×p und A · B das Produkt der Matrizen A und B.
Der Koeffizient (A · B)i j der Matrix A · B in der i-ten Zeile und j-ten
Spalte ist
(a)
Ai j · Bi j
(b)
n
∑ Aik · Bk j
k=1
(c)
n
∑ Aki · B jk
k=1
2. Rechenregeln für Matrizen
Welche der folgenden Aussagen sind falsch?
(a) Die Matrizenmultiplikation ist kommutativ,
d.h. für alle Matrizen A, B ∈ K n×n ist A · B = B · A.
(b) Die Matrizenmultiplikation ist assoziativ,
d.h. für alle Matrizen A, B,C ∈ K n×n ist (A · B) ·C = A · (B ·C).
(c) Die Matrizenmultiplikation ist bezüglich der Addition distributiv, d.h. für alle Matrizen A, B,C ∈ K n×n ist
A · (B +C) = A · B + A ·C und (A + B) ·C = A ·C + B ·C.
3. Elementare Zeilenumformungen
Es sei P ∈ Q m×m eine Elementarmatrix, A ∈ Q m×n und P · A die Matrix, die man aus A erhält, indem man die 3-fache zweite Zeile von
A zur ersten Zeile addiert.
Dann ist P die Matrix, die man aus der Einheitsmatrix Im erhält, indem man
(a) die 3-fache zweite Spalte von Im zur ersten addiert.
(b) die 3-fache zweite Zeile von Im von der ersten subtrahiert.
(c) die 3-fache zweite Zeile von Im zur ersten addiert.
(d) die 3-fache zweite Spalte von Im von der ersten subtrahiert.
4. Invertierbare Matrizen
Welche der folgenden Aussagen sind wahr?
(a) Elementarmatrizen sind invertierbar.
(b) Für alle invertierbaren Matrizen A und B ist ihr Produkt A · B
invertierbar und es ist (A · B)−1 = B−1 · A−1 .
(c) Für alle invertierbaren Matrizen A und B ist ihr Produkt A · B
invertierbar und es ist (A · B)−1 = A−1 · B−1 .
KAPITEL 2
Systeme linearer Gleichungen
In diesem Kapitel werden mit m, n immer positive ganze Zahlen und mit
K ein Körper (zum Beispiel Q oder Z 2 ) bezeichnet.
§1. Systeme linearer Gleichungen
Definition 63 : Ein System linearer Gleichungen mit Koeffizienten in K ist
eine Aufgabe:
• Gegeben sind eine Matrix A ∈ K m×n und eine Spalte b ∈ K m×1 .
• Gesucht ist eine gute Beschreibung“ der Menge
”
L(A, b) := {x | x ∈ K n×1 mit Ax = b}
aller n-Spalten x (mit Koeffizienten in K), für die Ax = b ist.
Die Menge L(A, b) heißt Lösungsmenge des durch A und b gegebenen Systems linearer Gleichungen. Ihre Elemente heißen Lösungen dieses Systems.
Das durch A und b gegebene System linearer Gleichungen heißt homogen, wenn b die Nullspalte ist, ansonsten inhomogen.
Ohne Matrizen kann man das so formulieren: Gegeben sind Elemente
Ai j ∈ K und bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Gesucht ist eine gute
”
Beschreibung“ der Menge aller n-Tupel (x1 , . . . , xn ) mit Komponenten in
K, für die
A11 x1 + A12 x2 + · · · + A1n xn = b1
A21 x1 + A22 x2 + · · · + A2n xn = b2
..
..
..
.
.
.
Am1 x1 + Am2 x2 + · · · + Amn xn = bm
ist.
Das durch A ∈ K m×n und b ∈ K m×1 gegebene System linearer Gleichungen wird kurz mit (A, b)“ oder Ax = b“ bezeichnet. Die Zahl m heißt die
”
”
Anzahl der Gleichungen, die Zahl n die Anzahl der Unbekannten.
Wenn 0n bzw. 0m die Nullspalte in K n×1 bzw. K m×1 ist, dann ist
A0n = 0m , also hat ein homogenes System linearer Gleichungen immer mindestens eine Lösung, nämlich die Nullspalte. Hingegen gibt es inhomogene
Systeme linearer Gleichungen ohne Lösung, zum Beispiel
x1 + x2 = 0
2x1 + 2x2 = 1
33
.
34
2. SYSTEME LINEARER GLEICHUNGEN
Beispiel 64 : Es soll eine Legierung aus bi Gramm der Metalle Mi , 1 ≤
i ≤ m, hergestellt werden. Zur Verfügung stehen Legierungen L1 , . . . , Ln der
Metalle M1 , . . . , Mm , wobei 1 Gramm der Legierung L j jeweils Ai j Gramm
des Metalls Mi enthält. Wieviele Gramm von L1 , . . . , Ln müssen für die
gewünschte Legierung verschmolzen werden? Wir nehmen dabei an, dass
beim Verschmelzen der Legierungen die Masse erhalten bleibt.
Das Verschmelzen von x1 , . . . , xn Gramm der Legierungen
L1 , . . . , Ln ergibt dann eine Legierung mit jeweils
n
∑ Ai j x j
j=1
Gramm des Metalls Mi . Gesucht ist somit L(A, b).
Definition 63 ist noch unvollständig, weil wir noch nicht präzise vereinbart haben, was eine gute Beschreibung“ von L(A, b) ist. Um diese Defi”
nition zu vervollständigen, brauchen wir ein paar Vorüberlegungen. Grundlegend dafür sind zwei einfache Beobachtungen, die wir in den Sätzen 65
und 66 formulieren:
Satz 65 : Sei (A, b) ein System linearer Gleichungen mit Koeffizienten in K
und z irgendeine Lösung davon. (Wir nehmen also insbesondere an, dass
L(A, b) nicht leer ist). Dann ist
L(A, b) = {z + v | v ∈ L(A, 0)}.
Beweis: Sei v ∈ L(A, 0). Dann ist A(z + v) = Az + Av = b + 0 = b, also
z + v ∈ L(A, b).
Sei y ∈ L(A, b). Dann ist A(y − z) = Ay − Az = b − b = 0, also y − z ∈
L(A, 0) und y = z + (y − z) ∈ {z + v | v ∈ L(A, 0)}.
Um die Lösungsmenge eines inhomogenen Systems linearer Gleichungen (A, b) zu beschreiben, genügt es somit, nur eine Lösung zu finden und
die Lösungsmenge des homogenen linearen Gleichungssystems (A, 0) zu
beschreiben.
Satz 66 : Seien A ∈ K m×n , r, s ∈ K und v, w ∈ L(A, 0).
Dann ist auch rv + sw ∈ L(A, 0) .
Beweis: A(rv + sw) = r(Av) + s(Aw) = 0 + 0 = 0.
35
2. SYSTEME LINEARER GLEICHUNGEN
Für die Lösungsmenge L eines Systems linearer Gleichungen gilt genau
eine der folgenden drei Aussagen:
(1) L ist leer ( es gibt keine Lösung“).
”
(2) L enthält genau ein Element ( eine Lösung existiert und ist eindeutig
”
bestimmt“).
(3) L enthält mindestens zwei Elemente.
Im Fall (2) wird L durch die Angabe der eindeutig bestimmten Spalte,
die Lösung des gegebenen Systems linearer Gleichungen ist, gut beschrieben.
Im Fall (3) ist das aber schwieriger. Wenn K unendlich ist (z.B. K = Q ),
dann enthält L im Fall (3) nach Satz 65 und Satz 66 unendlich viele Elemente. Wie können wir L dann durch endlich viele Daten beschreiben? Um
diese Frage zu beantworten, führen wir im nächsten Abschnitt die Begriffe
Vektorraum“ und Basis“ ein.
”
”
§2. Vektorräume
Beim Rechnen mit m × n-Matrizen mit Koeffizienten in einem Körper
K haben wir zwei Rechenoperationen kennengelernt:
(1) Die Addition von zwei m × n-Matrizen,
(2) Die Multiplikation“ eines Elementes von K (eines Skalars“) mit
”
”
einer m × n-Matrix.
Im Satz 47 wurden die dafür geltenden Rechenregeln angegeben.
Definition 67 : Sei V eine Menge und seien
+ : V ×V → V
sowie · : K ×V → V
Funktionen. Wir schreiben statt +(v, w)“ kurz v + w“ und statt ·(r, v)“
”
”
”
kurz r · v oder nur rv“. Das Tripel (V, +, ·) ist ein Vektorraum über K,
”
”
wenn die folgenden drei Bedingungen erfüllt sind:
(1) (V, +) ist eine abelsche Gruppe.
(2) Für alle r, s ∈ K und für alle v, w ∈ V ist
r(v + w) = (rv) + (rw) und (r + s)v = (rv) + (sv) .
(3) Für alle r, s ∈ K und für alle v ∈ V ist (rs)v = r(sv) und 1K v = v .
Ist (V, +, ·) ein Vektorraum über K, dann heißen die Elemente von V Vekto”
ren“, die Elemente von K Skalare“, + Addition“ und · Skalarmultiplika”
”
”
tion“. Statt (V, +, ·) wird oft nur V geschrieben. Das neutrale Element von
(V, +) wird mit 0V bezeichnet und heißt der Nullvektor. Ein Vektor v heißt
ein skalares Vielfaches eines Vektors w, wenn es ein Element r ∈ K gibt mit
v = rw. In diesem Fall sagt man auch, daß v das r-fache von w ist.
Man beachte, dass der Begriff Vektor“ erst nach dem Begriff Vektor”
”
raum“ eingeführt werden kann, so wie der Begriff Tiroler“ erst nach dem
”
Begriff Tirol“ eingeführt werden kann.
”
36
2. SYSTEME LINEARER GLEICHUNGEN
Die Eigenschaften von Vektoren können kurz so beschrieben werden:
Vektoren können miteinander addiert und mit Skalaren multipliziert werden. Dabei gelten gewisse Rechenregeln.
Ein Beispiel aus der Physik: alle Kräfte, die in einem vorgegebenen
Punkt angreifen, bilden einen Vektorraum, weil sie addiert und mit Zahlen
multipiziert werden können und dabei obige Rechenregeln gelten. Daher
sind solche Kräfte Vektoren.
Die Addition und die Skalarmultiplikation von m × n-Matrizen mit Koeffizienten in einem Körper erfüllen die Rechenregeln eines Vektorraums.
Daher: Matrizen sind Vektoren“.
”
Die Addition und die (Skalar-)Multiplikation von rationalen Zahlen erfüllen die Rechenregeln eines Vektorraums. Daher: Rationale Zahlen sind
”
Vektoren“.
Satz 68 : Die Menge
K n = {(a1 , . . . , an ) | a1 , . . . , an ∈ K}
aller n-Tupel in K mit der komponentenweisen Addition
(a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn )
und der komponentenweisen Skalarmultiplikation
r(a1 , . . . , an ) := (ra1 , . . . , ran )
ist ein Vektorraum über K und heißt Standard-Vektorraum über K der Dimension n. In diesem Vektorraum ist 0V = (0, . . . , 0) und
−(a1 , . . . , an ) = (−a1 , . . . , −an ).
Beweis: Übung.
Beispiel 69 : Ein Kaufhaus bietet n Waren an. Sei Ui j die Anzahl der am
i-ten Tag verkauften Einheiten der j-ten Ware. Dann gibt
Ui− = (Ui1 , . . . ,Uin ) ∈ K n
den Umsatz am i-ten Tag an,
U1− + · · · +Uk− =
(
k
k
i=1
i=1
)
∑ Ui1, . . . , ∑ Uin
ist der Umsatz vom ersten bis zum k-ten Tag, und
1
(U1− + · · · +Uk− ) ∈ K n
k
ist der durchschnittliche Tagesumsatz während der ersten k Tage.
37
2. SYSTEME LINEARER GLEICHUNGEN
Satz 70 : Seien V ein Vektorraum über K, r ∈ K und v ∈ V . Dann gilt:
(1) Es ist rv = 0 genau dann, wenn r = 0 oder v = 0 ist.
(2) (−r)v = r(−v) = −(rv) .
Beweis:
(1) Aus
0V + 0K v = 0K v = (0K + 0K )v = 0K v + 0K v
folgt
0V + 0K v − 0K v = 0K v + 0K v − 0K v
und daher 0K v = 0V . Ebenso folgt aus
0V + r0V = r0V = r(0V + 0V ) = r0V + r0V ,
dass r0V = 0V ist. Wenn umgekehrt rv = 0 aber r ̸= 0 ist, dann ist r
invertierbar, weil K ein Körper ist, und
v = 1K v = (r−1 r)v = r−1 (rv) = r−1 0V = 0V .
(2) Wegen (rv) + (−r)v = [r + (−r)]v = 0K v = 0V ist −(rv) = (−r)v.
Wegen (rv) + (r(−v)) = r[v + (−v)] = r0V = 0V ist −(rv) = r(−v).
Definition 71 : Sei V ein Vektorraum über K. Eine Teilmenge U von V
heißt Untervektorraum von V , wenn die folgenden drei Bedingungen erfüllt
sind:
(1) 0V ∈ U
(2) Sind zwei Vektoren u, v Elemente von U, dann auch ihre Summe
u + v.
(3) Ist ein Vektor v Element von U, dann auch alle seine skalaren Vielfachen rv, r ∈ K.
Man schreibt dann
U ≤K V
oder kurz
U ≤ V.
Beispiel 72 : Sei V ein Vektorraum über einem Körper K. Dann sind {0},
V und Kv := {cv | c ∈ K} (für jeden Vektor v ∈ V ) Untervektorräume von V .
Satz 73 : Seien (V, +, ·) ein Vektorraum über K und W ein Untervektorraum von V . Dann ist W mit W ×W −→ W, (u, w) 7−→ u + w, und
K ×W −→ W, (c, w) 7−→ c · w, selbst ein Vektorraum über K.
Beweis: Übung.
38
2. SYSTEME LINEARER GLEICHUNGEN
Satz 74 : Die Lösungsmenge eines homogenen Systems linearer Gleichungen mit der komponentenweisen Addition und Skalarmultiplikation ist ein
Vektorraum. (Anders formuliert: Die Nullspalte ist eine Lösung, die Summe
zweier Lösungen ist wieder eine Lösung und alle skalaren Vielfachen von
Lösungen sind wieder Lösungen).
Beweis: Folgt aus Satz 66.
§3. Erzeugendensysteme, lineare Unabhängigkeit und Basen
Definition 75 : Seien V ein Vektorraum über K und v1 , . . . , vn Vektoren in
V . Ein Vektor w ∈ V heißt eine Linearkombination von v1 , . . . , vn , wenn es
Elemente c1 , . . . , cn in K gibt, sodass
n
w = c1 v1 + c2 v2 + . . . + cn vn (= ∑ ci vi )
i=1
ist.
Die Elemente c1 , . . . , cn heißen Koeffizienten von w bezüglich v1 , . . . , vn .
Die Menge
n
{ ∑ ci vi | c1 , . . . , cn ∈ K}
i=1
aller Linearkombinationen von v1 , . . . , vn ist ein Untervektorraum von V
(nachprüfen), enthält v1 , . . . , vn und heißt der von v1 , . . . , vn erzeugte Untervektorraum von V . Er wird mit
K ⟨v1 , . . . , vn ⟩
n
oder
∑ Kvi
i=1
bezeichnet.
Definition 76 : Sei V ̸= {0} ein Vektorraum über K. Ein n-Tupel (v1 , . . . , vn )
von Vektoren in V heißt genau dann ein Erzeugendensystem von V bzw. linear unabhängig in V bzw. eine Basis von V , wenn jeder Vektor in V auf
mindestens eine bzw. höchstens eine bzw. genau eine Weise als Linearkombination von (v1 , . . . , vn ) geschrieben werden kann.
Wir schreiben linear abhängig anstatt nicht linear unabhängig.
Satz 77 : Sei A ∈ K m×n und y ∈ K n×1 .
(1) Die Spalte Ay ist eine Linearkombination der Spalten A−1 , . . . , A−n
mit Koeffizienten y1 , . . . , yn , das heißt
Ay = y1 A−1 + . . . yn A−n .
(2) L(A, 0) enthält genau dann nur ein Element (und zwar 0 ∈ K n×1 ),
wenn das n-Tupel der Spalten (A−1 , . . . , A−n ) linear unabhängig ist.
39
2. SYSTEME LINEARER GLEICHUNGEN
(3) Für b ∈ K m×1 hat das lineare Gleichungssystem (A, b) genau dann
eine Lösung, wenn b ein Element des von den Spalten von A erzeugten Untervektorraums von K m×1 ist.
(4) Das n-Tupel (A−1 , . . . , A−n ) der Spalten von A ist genau dann eine
Basis von K m×1 , wenn für jede Spalte b ∈ K m×1 das System linearer
Gleichungen (A, b) genau eine Lösung hat.
Beweis: (1) ist leicht nachzurechnen, (2), (3) und (4) folgen aus (1).
Satz 78 : Sei V ̸= {0} ein Vektorraum über K und (v1 , . . . , vn ) ein n-Tupel
von Vektoren in V .
(1) Eine Basis von V ist ein linear unabhängiges Erzeugendensystem.
(2) Das n-Tupel (v1 , . . . , vn ) von Vektoren ist genau dann ein Erzeugendensystem von V , wenn
K ⟨v1 , . . . , vn ⟩ = V
ist.
(3) Das n-Tupel (v1 , . . . , vn ) von Vektoren ist genau dann linear unabhängig, wenn für jedes n-Tupel (c1 , . . . , cn ) ∈ K n aus
n
∑ ci vi = 0
i=1
folgt, dass
c1 = c2 = . . . = cn = 0
ist.
Beweis:
(1) und (2) folgen aus der Definition der Begriffe Erzeugendensystem,
linear unabhängig und Basis.
(3) Wenn sich jeder Vektor aus V auf höchstens eine Weise als Linearkombination von (v1 , . . . , vn ) schreiben lässt, dann folgt aus
n
n
i=1
i=1
∑ civi = 0V = ∑ 0K vi
auf Grund der Eindeutigkeit ci = 0K für 1 ≤ i ≤ n.
Sei umgekehrt (v1 , . . . , vn ) linear unabhängig in V und w ∈ V so, dass
es ein n-Tupel (c1 , . . . , cn ) ∈ K n mit
n
w = ∑ ci vi
i=1
40
2. SYSTEME LINEARER GLEICHUNGEN
gibt. Falls (d1 , . . . , dn ) ∈ K n eine weiteres n-Tupel mit
n
w = ∑ di vi
i=1
ist, erhält man
n
n
n
i=1
i=1
i=1
0V = w − w = ∑ ci vi − ∑ di vi = ∑ (ci − di )vi .
Nach Annahme folgt ci − di = 0K für 1 ≤ i ≤ n, also ci = di für
1 ≤ i ≤ n.
Beispiel 79 : Sei V ein Vektorraum über K. Ein einzelner Vektor v ∈ V ist
linear unabhängig genau dann, wenn v ̸= 0 ist, weil aus rv = 0 nach Satz 70
r = 0 oder v = 0 folgt.
Satz 80 : Das m · n-Tupel
(E11 , . . . , E1n , E21 , . . . , E2n , . . . , Em1 , . . . , Emn )
der Standard-Matrizen (siehe Definition 58) ist eine Basis von
K m×n und heißt die Standardbasis von K m×n .
Insbesondere ist das n-Tupel (e1 , . . . , en ) der Standard-Zeilen (siehe Definition 58) eine Basis von K n und heißt die Standardbasis von K n .
Beweis: Da für eine beliebige Matrix A ∈ K m×n
A=
∑
Akℓ Ekℓ
1≤k≤m
1≤ℓ≤n
ist, ist das m · n-Tupel (E11 , . . . , E1n , E21 , . . . , E2n , . . . , Em1 , . . . , Emn ) ein Erzeugendensystem von K m×n . Um die lineare Unabhängigkeit zu zeigen,
nehmen wir an, dass für gewisse ckℓ ∈ K
∑
ckℓ Ekℓ = 0
1≤k≤m
1≤ℓ≤n
ist. Dann folgt für alle 1 ≤ i ≤ m und 1 ≤ j ≤ n
0=
∑
ckℓ (Ekℓ )i j = ci j ,
1≤k≤m
1≤ℓ≤n
was zu zeigen war.
Nach Einführung des Begriffes Basis“ kann die Definition eines Sy”
stems linearer Gleichungen (A, b) präzisiert werden. Eine gute Beschrei”
bung von L(A, b)“ finden heißt:
41
2. SYSTEME LINEARER GLEICHUNGEN
Berechne irgendeine Lösung von (A, b) und eine Basis des Lösungsraums
”
von (A, 0)“.
Man beachte, dass damit nur endlich viele Daten zu berechnen sind, diese bestimmen aber vollständig die (möglicherweise unendliche) Lösungsmenge L(A, b).
§4. Der Gauss-Algorithmus
Wir werden nun eine Methode zum Lösen eines Systems linearer Gleichungen (A, b) kennenlernen. Zunächst betrachten wir einen Spezialfall,
in dem die Matrix A eine besonders einfache Gestalt hat. In diesem Fall
können wir die Lösungsmenge direkt anschreiben (Satz 84). Danach werden wir den allgemeinen Fall auf den einfachen Fall zurückführen, indem
wir die Daten (A, b) schrittweise so verändern, dass die geänderten Daten
(A′ , b′ ) schließlich die einfache Gestalt haben und
L(A, b) = L(A′ , b′ )
ist (Satz 87 und Satz 90).
Den Übergang von den Daten (A, b) zu (A′ , b′ ) nennt man die Gleichun”
gen umformen“. Gilt dabei L(A, b) = L(A′ , b′ ), dann sind die Umformungen
erlaubt“.
”
Definition 81 : Eine Matrix A ∈ K m×n hat Stufenform, wenn die folgenden
vier Bedingungen erfüllt sind:
(1) Ist Ai− = 0, dann sind auch A(i+1)− = · · · = Am− = 0.
(2) Der (von links gelesen) erste Koeffizient ̸= 0 in jeder Zeile heißt
Pivot und ist 1.
(3) Der Pivot in der Zeile i + 1 steht rechts vom Pivot in der Zeile i.
(4) Der Pivot jeder Zeile ist der einzige Koeffizient ̸= 0 in seiner Spalte.
Eine Matrix in Stufenform hat die Gestalt


0 ... 0 1 ∗ ... ∗ 0 ∗ ... ∗ 0 ∗ ...
0 . . . . . . . . . . . . . . . . 0 1 ∗ . . . ∗ 0 ∗ . . .


0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 ∗ . . . ,
..
.
wobei die Sterne für beliebige Elemente von K stehen.
Definition 82 : Der Spaltenraum bzw. Zeilenraum einer Matrix mit m Zeilen und n Spalten ist der Untervektorraum von K m×1 bzw. K 1×n , der von
den Spalten bzw. Zeilen dieser Matrix erzeugt wird.
Beispiel 83 : A ∈ K m×n sei eine Matrix in Stufenform mit r Pivots. Dann
ist das r-Tupel (e1 , . . . , er ) der ersten r Standard-Spalten in K m×1 eine Basis
42
2. SYSTEME LINEARER GLEICHUNGEN
des Spaltenraums von A.
Wenn p1 , . . . , pr die Spaltenindizes der Pivots sind, dann ist
A−p1
 
 
0
1
 .. 
0
.
 
= e1 =  ..  , . . . , A−pr = er =  
1
.
..
..
.
.
und
r
r
i=1
i=1
A−ℓ = ∑ Aiℓ ei = ∑ Aiℓ A−pi .
Satz 84 : Sei (A, b) ein System linearer Gleichungen über K mit
A ∈ K m×n in Stufenform. Sei r die Anzahl der Pivots,
p1 < p2 < · · · < pr die Spaltenindizes der Pivots und
{q1 , . . . , qn−r } := {1, . . . , n} \ {p1 , . . . , pr }. Dann gilt:
(1) L(A, b) ist genau dann nicht leer, wenn für alle i > r gilt: bi = 0.
In diesem Fall ist
 
0
 ... 
 
0
 
b 
 1
0
 
 
z :=  ...  ∈ L(A, b),
 
0
 
 br 
 
0
.
 .. 
0
wobei die Elemente b1 , . . . , br in den Zeilen mit Index p1 , . . . , pr stehen.
43
2. SYSTEME LINEARER GLEICHUNGEN
(2) Sei

0
 .. 
 . 
 0 


−A 
 1q j 
 0 


 . 
 .. 


 0 
,

w j := 

1


 0 


 .. 
 . 


 −Arq j 


 0 
 . 
 .. 

0
1 ≤ j ≤ n − r, wobei die Elemente −A1q j , . . . , −Arq j in den Zeilen mit
Index p1 , . . . , pr sowie 1 in der Zeile mit Index q j stehen.
Dann ist (w1 , . . . , wn−r ) eine K-Basis von L(A, 0).
Beweis: Seien e1 , . . . , em die Standardspalten von K m×1 . Dann ist
A−p1 = e1 , . . . , A−pr = er .
(1) Wenn L(A, b) nicht leer ist, dann gibt es ein y mit Ay = b, und es folgt
bi = Ai− y = 0 für i > r. Sei umgekehrt bi = 0 für i > r. Sei z ∈ K n×1 .
Nach Satz 77 ist Az = b genau dann, wenn
r
n
r
n−r
i=1
i=1
i=1
i=1
∑ biei = b = ∑ ziA−i = ∑ z pi A−pi + ∑ zqi A−qi =
r
n−r
i=1
i=1
= ∑ z pi ei + ∑ zqi A−qi
ist. Wählt man daher zqi := 0 für 1 ≤ i ≤ n − r und z pi := bi , 1 ≤ i ≤ r,
dann ist Az = b.
(2) Für 1 ≤ j ≤ n ist
r
r
i=1
i=1
A− j = ∑ Ai j ei = ∑ Ai j A−pi ,
also
r
A− j − ∑ Ai j A−pi = 0 .
i=1
44
2. SYSTEME LINEARER GLEICHUNGEN
Nach Satz 77 ist also w j ∈ L(A, 0).
Seien t1 , . . . ,tn−r ∈ K. Für 1 ≤ j ≤ n − r ist dann die q j -te Komponente der Spalte ∑n−r
i=1 ti wi gleich t j . Wenn die Linearkombination
gleich 0 ist, müssen auch alle t j , 1 ≤ j ≤ n − r gleich 0 sein. Daher
ist (w1 , . . . , wn−r ) linear unabhängig.
Es bleibt noch zu zeigen, dass jedes v ∈ L(A, 0) als Linearkombination von (w1 , . . . , wn−r ) geschrieben werden kann. Wir zeigen
dazu, dass
n−r
v=
∑ vq j w j
j=1
ist. Für 1 ≤ i ≤ n − r ist
n−r
n−r
j=1
j=1
( ∑ vq j w j )qi =
∑ vq j δi j = vqi ,
es genügt also zu zeigen, dass (∑n−r
j=1 vq j w j ) pi = v pi ist, 1 ≤ i ≤ r. Aus
Av = 0 folgt für alle i ≤ r:
n
0 = Ai− v =
∑ Ai j v j =
r
n−r
n−r
ℓ=1
j=1
j=1
∑ Aipℓ v pℓ + ∑ Aiq j vq j = v pi + ∑ Aiq j vq j .
j=1
Somit gilt für 1 ≤ i ≤ r
v pi =
n−r
n−r
n−r
j=1
j=1
j=1
∑ (−Aiq j )vq j =
∑ (w j ) pi vq j = ( ∑ vq j w j ) pi .
Beispiel 85 : Der Lösungsmenge der linearen Gleichung
((1 a2 a3 . . . an ), (b1 ))
(oder, anders geschrieben, x1 + a2 x2 + a3 x3 + . . . + an xn = b1 ) ist
 






b1
−a2
−a3
−an
0
 1 
 0 
 0 
 






0
 0 
 1 
 0 







{
 ...  +c1  ...  +c2  0  +. . .+cn−1  ...  | c1 , . . . , cn−1 ∈ K} .
 


 . 


0
 0 
 .. 
 0 
0
0
0
1
Unser nächstes Ziel ist es, beliebige Systeme linearer Gleichungen zu
lösen. Ein erster Schritt dazu ist der folgende Satz.
Satz 86 : Sei (A, b) ein System linearer Gleichungen mit A ∈ K m×n . Dann
gilt für alle P ∈ GLm (K)
L(PA, Pb) = L(A, b).
45
2. SYSTEME LINEARER GLEICHUNGEN
Beweis: Ist y ∈ L(A, b), dann ist Ay = b, also auch PAy = Pb und y ∈
L(PA, Pb). Daher ist L(A, b) eine Teilmenge von L(PA, Pb).
Ist y ∈ L(PA, Pb), dann ist PAy = Pb, also auch Ay = P−1 PAy = P−1 Pb = b
und y ∈ L(A, b). Daher ist L(PA, Pb) eine Teilmenge von L(A, b).
Satz 86 legt nahe, zu einem gegebenen System linearer Gleichungen
(A, b) eine invertierbare Matrix P zu suchen, sodass das System (PA, Pb)
Stufenform hat. Dann kann die Lösungsmenge mit Satz 84 bestimmt werden.
Satz 87 : Jede Matrix A ∈ K m×n kann durch elementare Zeilenumformungen auf Stufenform gebracht werden, genauer gesagt gibt es eine Matrix
P ∈ GLm (K), die Produkt von höchstens mn Elementarmatrizen ist, sodass
PA Stufenform hat. Diese Matrix PA kann mit dem folgenden Algorithmus
berechnet werden (Gauss-Elimination):
(1) Setze C := A, i := 1 und j := 1.
(2) Falls Ci j ̸= 0 ist, gehe zu Schritt 4.
Ansonsten suche ein k ∈ {i + 1, . . . , m} mit Ck j ̸= 0.
(3) Falls es kein k ∈ {i + 1, . . . , m} mit Ck j ̸= 0 gibt, erhöhe j um 1 und
wiederhole Schritt 2.
Ansonsten vertausche die i-te und k-te Zeile von C und nenne die
neue Matrix wieder C. (Dann ist Ci j ̸= 0).
(4) Multipliziere die i-te Zeile von C mit Ci−1
j und nenne die neue Matrix
wieder C. (Dann ist Ci j = 1).
(5) Für ℓ ∈ {1, . . . , m} \ {i} mit Cℓ j ̸= 0 subtrahiere das Cℓ j -fache der
i-ten Zeile von der ℓ-ten Zeile und nenne die neue Matrix wieder C.
(Dann ist C− j = ei ).
(6) Erhöhe i und j um 1 und gehe zu Schritt 2.
Der Algorithmus wird abgebrochen, sobald i > m oder j > n ist. Dann hat
die Matrix C Stufenform.
Beweis: Der Algorithmus bricht nach höchstens n Durchläufen ab, weil in
jedem Durchlauf j um 1 erhöht wird. Seien P1 , . . . , Ps die Elementarmatrizen zu den im Algorithmus der Reihe nach durchgeführten elementaren
Zeilenumformungen. Da pro Durchlauf höchstens m elementare Zeilenumformungen durchgeführt werden, ist s ≤ nm. Nach Satz 61 erhält man am
Ende des Algorithmus die Matrix
(Ps . . . (P2 (P1 A)) . . . ) = (Ps . . . P2 P1 )A,
und nach Satz 62 ist
P := Ps . . . P2 P1 ∈ GLm (K).
46
2. SYSTEME LINEARER GLEICHUNGEN
Schließlich hat die Matrix PA Stufenform, weil in jedem Durchlauf die ersten j − 1 Spalten nicht mehr verändert werden und in der j-ten Spalte entsprechend umgeformt wird.
Der Beweis zeigt, dass man die Matrix P erhält, indem man die elementaren Zeilenumformungen nicht nur auf A, sondern auch auf die Einheitsmatrix Im anwendet:
(A|Im ) → (P1 A|P1 Im ) → · · · → (Ps . . . P1 A|Ps . . . P1 Im ) = (PA|P).
Satz 88 : Sei A ∈ K m×m . Auf die folgende Weise kann überprüft werden,
ob A invertierbar ist und, wenn ja, die zu A inverse Matrix A−1 berechnet
werden:
Bringe A durch Gauss-Elimination auf Stufenform, wobei die elementaren Zeilenoperationen auch auf die Einheitsmatrix angewendet werden:
(A|Im ) → (PA|P).
Dann ist A invertierbar genau dann, wenn PA = Im ist. In diesem Fall ist
A−1 = P .
Insbesondere kann jede invertierbare Matrix als Produkt von Elementarmatrizen geschrieben werden.
Beweis: Wenn A invertierbar ist, dann sind A, P ∈ GLm (K) und somit auch
B := PA ∈ GLm (K). Da B Stufenform hat, ist B = Im oder Bm− = 0. Aus
Bm− = 0 würde aber
0 = Bm− (B−1 )−m = (BB−1 )mm = 1,
folgen, also muss B = Im sein. Umgekehrt folgt aus PA = Im auch
AP = P−1 (PA)P = Im und somit P = A−1 .
Beispiel 89 : Die Matrix
(
a b
A :=
c d
)
ist genau dann invertierbar, wenn ad − bc ̸= 0 ist. In diesem Fall ist
(
)
d −b
−1
−1
A := (ad − bc)
.
−c a
Satz 90 : Ein System linearer Gleichungen (A, b) über dem Körper K kann
gelöst werden, indem man die Matrix A durch Gauss-Elimination auf Stufenform bringt und b mittransformiert“. Dazu führt man die elementa”
ren Zeilenumformungen an der erweiterten Matrix“ (A|b) aus und erhält
”
47
2. SYSTEME LINEARER GLEICHUNGEN
(PA|Pb). Dann ist
L(A, b) = L(PA, Pb)
und L(A, b) kann nach Satz 84 berechnet werden.
Insbesondere gibt es genau dann genau eine Lösung, wenn
( )
( )
In
c
PA =
und
Pb =
0
0
mit c ∈ K n×1 ist. Die eindeutige Lösung ist dann
 
c1
 ...  .
cn
Wenn A invertierbar ist, dann hat (A, b) die eindeutige Lösung
A−1 b.
Beweis: Die Behauptung folgt aus Satz 86 und Satz 84.
Satz 91 : Ein homogenes System linearer Gleichungen (A, 0) über dem
Körper K hat immer die triviale Lösung 0. Wenn A ∈ K m×n mit m < n ist,
d.h. es sind weniger Gleichungen als Unbekannte vorhanden, dann gibt es
auch eine Lösung, die nicht trivial ist.
Beweis: Wenn m < n ist, dann kann PA ∈ K m×n nicht die Form
( )
In
0
haben, und nach Satz 90 gibt es mehr als eine Lösung.
§5. Kirchhoff’sche Gesetze und Systeme linearer Gleichungen
Mit den Methoden von §4 kann die folgende Aufgabe aus der Elektrotechnik gelöst werden.
In der folgenden Schaltung sind die Spannungen Uq1 und Uq2 , sowie die
Widerstände R1 , R2 , R3 , R4 , R5 bekannt. Gesucht sind die Ströme
I1 , I2 , I3 , I4 , I5 durch die Widerstände R1 , R2 , R3 , R4 , R5 .
Die Spannung wird in Volt (V ), die Stromstärke in Ampère (A) und der Widerstand in Ohm (Ω) gemessen.
48
2. SYSTEME LINEARER GLEICHUNGEN
Kr1
@
@
@
@
Uq1
?
@
@
@ @
@ @
R4 @ @
@
Uq2
@
?
@
@r
@
@
R2
R1
r
K2
R5
R3
K3
Wir beschreiben diese Aufgabe als System linearer Gleichungen. Für
die Modellierung brauchen wir die folgenden physikalischen Gesetze:
Ohm’sches Gesetz
R·I =U
(Widerstand mal Stromstärke ist Spannung)
Kirchhoff’sche Gesetze
Die Kirchhoff’schen Gesetze beschreiben jeweils den Zusammenhang
zwischen mehreren elektrischen Strömen bzw. zwischen mehreren elektrischen Spannungen in einem elektrischen Netzwerk.
Werden mehrere Leitungen in einem Punkt verbunden, nennt man diesen einen Knoten der Schaltung (im Bild oben sind K1 , K2 und K3 Knoten).
Leitungen zwischen zwei Knoten nennt man Zweige der Schaltung.
Für jeden Zweig wird eine Richtung vorgegeben, d.h. eine Reihenfolge seiner zwei Knoten.
Die Spannung und die Stromstärke haben positives Vorzeichen, wenn die
(angenommene) Richtung des Stroms mit der Richtung des Zweiges übereinstimmt, sonst negatives.
Ein Strom durch einen Zweig heißt in a zufließend, wenn a der zweite Knoten des Zweiges ist, und von a abfließend, wenn a der erste Knoten des
Zweiges ist.
1. Kirchhoff’sches Gesetz (Knotensatz):
Die Summe der zufließenden Ströme in einem Knoten ist gleich der
Summe der abfließenden Ströme.
Eine endliche Menge M ̸= {} von Zweigen mit der folgenden Eigenschaft
heißt Masche: Ist ℓ ∈ M und ist a ein Knoten von ℓ, dann gibt es einen eindeutig bestimmten Zweig k ∈ M \ {ℓ}, sodass a auch ein Knoten von k ist.
Auf die folgende Weise legen wir eine Umlaufrichtung der Masche fest: Es
sei M eine Masche und {a1 , . . . , an } die Menge aller Knoten dieser Masche.
Wir setzen an+1 := a1 . Wir können die Indizes so wählen, dass die Zweige
49
2. SYSTEME LINEARER GLEICHUNGEN
der Masche zwischen den Knoten ai und ai+1 , 1 ≤ i ≤ n + 1, verlaufen und
dass a1 der erste Knoten des Zweiges zwischen a1 und a2 ist.
Dann ist der Zweig zwischen ai und ai+1 in der Umlaufrichtung der Masche, wenn ai sein erster Knoten ist, sonst gegen die Umlaufrichtung.
2. Kirchhoff’sches Gesetz (Maschensatz):
Die Summe der Spannungen von Zweigen einer Masche in der Umlaufrichtung ist gleich der Summe der Spannungen von Zweigen einer Masche gegen die Umlaufrichtung.
Wir wählen Stromrichtungen von I j , für j = 1, . . . , 5 und Richtungen für
die Quellspannungen, somit auch Richtungen der Zweige.
I1 Kr1
I5
@
@
@@
Uq1
?
?
M3 R5
M1
I4 @@
I
2
R@
?
@
@ 6
@
@
6
I1
I5
@ @
@
@ R2
?
M2
R4 @ @
@
Uq2
R1
@@
?
@ @
I
I
4
2
R
I3 I3 - @
r
@r
K2
R3
K3
Aus den Kirchhoff’schen Gesetzen erhalten wir die folgenden Bedingungen für die Zahlen I1 , . . . , In :
Knotengleichungen:
K1 : I1 + I5 = I2 + I4
K2 :
I2
= I1 + I3
K3 : I3 + I4 =
I5
Maschengleichungen:
M1 :
I1 · R1 + I2 · R2
M2 :
I2 · R2 + I3 · R3
M3 :
I4 · R4 + I5 · R5
M4 :
I1 · R1 + I4 · R4
M5 : I2 · R2 + I3 · R3 + I5 · R5
M6 :
I1 · R1 +Uq2
=
Uq1
=
I4 · R4
=
Uq2
=
I3 · R3 +Uq1
=
Uq2
= Uq1 + I3 · R3 + I5 · R5
Die Bedingungen K1 , M4 , M5 , M6 folgen aus K2 , K3 , M1 , M2 , M3 , also
können wir sie weglassen.
50
2. SYSTEME LINEARER GLEICHUNGEN
Man erhält nun das System linearer Gleichungen
    

−1 1 −1 0
0
I1
0
0 0 1




1 −1 I2   0 


 R1 R2 0
   
0
0

 · I3  = Uq1  .
 0 R2 R3 −R4 0  I4   0 
I5
0 0 0
R4 R5
Uq2
Wir berechnen I1 , I2 , I3 , I4 , I5 für Uq1 = 18.6V, Uq2 = 13.2V und
R1 = 1.5 kΩ, R2 = 680 Ω, R3 = 470 Ω, R4 = 520 Ω, R5 = 710 Ω:

   

0
I1
−1
1 −1
0
0

  
 0
0
1
1
−1 
 I2   0 





1500 680 0
0
0  · I3  = 18.6
,

 0
680 470 −520 0  I4   0 
13.2
I5
0
0
0
520 710
die (eindeutig bestimmte) Lösung ist
I1 =
0.00859 A =
8.59 mA
I2 =
0.00841 A =
8.41 mA
I3 = −0.00018 A = −0.18 mA
I4 =
0.01083 A = 10.83 mA
I5 =
0.01066 A = 10.66 mA
Das negative Vorzeichen von I3 , bedeutet, dass dieser Strom gegen die gewählte Richtung des Zweiges fließt.
§6. Dimension
Satz 92 : Seien V ein Vektorraum über K, (u1 , . . . , um ) ein linear unabhängiges m-Tupel von Vektoren in V und v ∈ V mit
v ̸∈ K ⟨u1 , . . . , um ⟩ .
Dann ist auch das m + 1-Tupel (u1 , . . . , um , v) linear unabhängig.
Beweis: Seien c1 , . . . , cm ∈ K und d ∈ K mit
m
∑ c j u j + dv = 0 .
j=1
Wenn d ̸= 0 ist, wäre
m
v = − ∑ d −1 c j u j ∈ K ⟨u1 , . . . , um ⟩
j=1
im Widerspruch zur Voraussetzung. Somit ist d = 0 und, da (u1 , . . . , um )
linear unabhängig ist, auch c j = 0 für alle 1 ≤ j ≤ m.
Definition 93 : Ein Vektorraum V heißt endlich-erzeugt, wenn es ein endliches Erzeugendensystem von V gibt.
51
2. SYSTEME LINEARER GLEICHUNGEN
Satz 94 : Seien {0} =
̸ V ein endlich-erzeugter Vektorraum über K,
(w1 , . . . , wn ) ein Erzeugendensystem von V und (u1 , . . . , um ) ein linear unabhängiges m-Tupel von Vektoren in V .
Dann gilt:
(1) Aus (w1 , . . . , wn ) kann eine Basis ausgesondert werden, d.h. es gibt
eine Teilmenge {i1 , i2 , . . . iℓ } von {1, . . . , n}, sodass (wi1 , . . . , wiℓ ) eine
Basis von V ist.
Insbesondere hat jeder endlich-erzeugte Vektorraum V über K eine
Basis.
(2) (u1 , . . . , um ) kann durch Vektoren aus {w1 , . . . , wn } zu einer Basis ergänzt werden, d.h. es gibt Indizes j1 , . . . , jk ∈ {1, . . . , n} , sodass
(u1 , . . . , um , w j1 , . . . , w jk ) eine Basis von V ist.
Beweis:
(1) Wir beweisen die Aussage durch Induktion nach n. Für n = 1 ist
wegen {0} ̸= V auch w1 ̸= 0, also ist der Vektor w1 linear unabhängig
und somit eine Basis von V .
Sei nun n > 1. Wenn (w1 , . . . , wn ) linear unabhängig ist, dann ist
(w1 , . . . , wn ) eine Basis von V und die Behauptung bewiesen. Wenn
(w1 , . . . , wn ) linear abhängig ist, dann gibt es c1 , . . . , cn ∈ K so, dass
n
∑ ciwi = 0
i=1
aber ck ̸= 0 ist für ein k ∈ {1, . . . , n}. Es folgt wk = − ∑i̸=k c−1
k ci wi .
Dann ist auch (w1 , . . . , wk−1 , wk+1 , . . . , wn ) ein Erzeugendensystem
von V , weil es für einen beliebigen Vektor y ∈ V Elemente
d1 , . . . , dn ∈ K mit
n
y = ∑ di wi = ∑ (di − dk c−1
k ci )wi
i=1
i̸=k
gibt. Nach Induktionsannahme kann aus (w1 , . . . , wk−1 , wk+1 , . . . , wn )
eine Basis von V ausgesondert werden, also auch aus (w1 , . . . , wn ).
(2) Sei U der von u1 , . . . , um erzeugte Untervektorraum von V . Wir zeigen die Behauptung durch Induktion nach
p := #{i ∈ {1, . . . , n} | wi ̸∈ U} .
Für p = 0 ist wi ∈ U für alle i, daher U = V und (u1 , . . . , um ) eine
Basis von V . Sei nun p > 0. Dann gibt es ein j1 ∈ {1, . . . , n}, für
das w j1 ̸∈ U ist. Nach Satz 92 ist (u1 , . . . , um , w j1 ) linear unabhängig.
Nach Induktionsannahme kann (u1 , . . . , um , w j1 ) durch Vektoren aus
{w1 , . . . , wm } zu einer Basis von V ergänzt werden, also auch
(u1 , . . . , um ).
52
2. SYSTEME LINEARER GLEICHUNGEN
Satz 95 : Sei V ein endlich-erzeugter Vektorraum über K. Dann enthalten
je zwei Basen von V gleich viele Vektoren.
Beweis: Sei (v1 , . . . , vm ) ein Erzeugendensystem von V und (w1 , . . . , wn ) in
V linear unabhängig. Wir zeigen zuerst, dass n ≤ m sein muss.
Weil (v1 , . . . , vm ) ein Erzeugendensystem von V ist, können wir w j als Linearkombination von (v1 , . . . , vm ) schreiben:
m
w j = ∑ Ai j vi , 1 ≤ j ≤ n.
i=1
Wäre m < n, hätte die Matrix A := (Ai j )1≤i≤m, 1≤ j≤n mehr Spalten als Zeilen, also gäbe es nach Satz 91 eine n-Spalte x ̸= 0 mit Ax = 0. Daher wäre
n
∑ x j w j = ∑ x j (∑ Ai j vi) = ∑(∑ Ai j x j )vi = ∑ 0 · vi = 0 ,
j=1
j
i
i
j
i
im Widerspruch zu x ̸= 0 und (w1 , . . . , wn ) linear unabhängig.
Wenn nun sowohl (v1 , . . . , vm ) als auch (w1 , . . . , wn ) eine Basis ist, ist einerseits n ≤ m, weil (v1 , . . . , vm ) ein Erzeugendensystem von V und (w1 , . . . , wn )
linear unabhängig ist, und andererseits m ≤ n, weil auch (w1 , . . . , wn ) ein
Erzeugendensystem von V und (v1 , . . . , vm ) linear unabhängig ist.
Definition 96 : Sei {0} ̸= V ein endlich-erzeugter Vektorraum über K. Die
Zahl
dimK (V ) := Anzahl der Elemente einer Basis von V
(ist nach Satz 95 wohldefiniert und) heißt die Dimension von V .
Für den Nullraum {0} definieren wir: die leere Menge ist eine Basis von
{0} und dimK (V ) = 0.
Sprechweisen: Wenn dimK (V ) = n ist, dann nennt man V n-dimensional.
Ein endlich-erzeugter Vektorraum heißt endlich-dimensional. Ein nicht endlich-erzeugter Vektorraum W heißt unendlich-dimensional.
Die Dimension eines Vektorraums ist also die kleinste Anzahl von Zahlen (oder, allgemeiner, von Elementen von K), die für die vollständige Beschreibung eines Vektors in V nötig sind.
Beispiel 97 : Nach Satz 80 ist
dimK (K n ) = n und dimK (K m×n ) = m · n.
53
2. SYSTEME LINEARER GLEICHUNGEN
Definition 98 : Sei V ein Vektorraum über K, w ∈ V und (v1 , . . . , vn ) eine
Basis von V . Das eindeutig bestimmte n-Tupel (c1 , . . . , cn ) von Skalaren mit
n
w = ∑ ci vi
i=1
heißt das Koordinaten-n-Tupel des Vektors w bezüglich der Basis (v1 , . . . , vn ).
Das Element ci ∈ K heißt die Koordinate von w beim Basisvektor vi (oder
die i-te Koordinate von w bezüglich der Basis (v1 , . . . , vn )). Die Spalte
 
c1
 ...  ∈ K n×1
cn
heißt Koordinatenspalte des Vektors w bezüglich der Basis (v1 , . . . , vn ).
Satz 99 : Sei V ein Vektorraum über K und (v1 , . . . , vn ) eine Basis von V .
Seien w1 , . . . , wm ∈ V und T−1 , . . . , T−m deren Koordinatenspalten bezüglich
(v1 , . . . , vn ).
(1) Seien c1 , . . . , cn ∈ K. Die Koordinatenspalte von ∑m
i=1 ci wi bezüglich
(v1 , . . . , vn ) ist ∑m
c
T
.
(
Die
Koordinatenspalte
der Linearkomi
−i
i=1
”
bination ist die Linearkombination der Koordinatenspalten“).
(2) Das m-Tupel (w1 , . . . , wm ) ist genau dann ein Erzeugendensystem
von V bzw. linear unabhängig in V bzw. eine Basis von V , wenn
das entsprechende für das m-Tupel (T−1 , . . . , T−m ) seiner Koordinatenspalten gilt.
Beweis: (1) ist leicht nachzuprüfen, (2) folgt aus (1).
Satz 100 : Sei V ein Vektorraum über K der Dimension n und
(v1 , . . . , vn ) ∈ V n . Dann sind die folgenden Aussagen äquivalent:
(1) (v1 , . . . , vn ) ist eine Basis von V .
(2) (v1 , . . . , vn ) ist ein Erzeugendensystem von V .
(3) (v1 , . . . , vn ) ist linear unabhängig.
Beweis: Aus (1) folgen immer (2) und (3).
(2) ⇒ (1): Nach Satz 94 kann aus (v1 , . . . , vn ) eine Basis ausgesondert werden, die wegen dimK (V ) = n wieder aus n Vektoren besteht. Somit muss
(v1 , . . . , vn ) eine Basis sein.
(3) ⇒ (1): analog.
Definition 101 : Der Rang einer Matrix A ∈ K m×n ist die Dimension des
Spaltenraums von A (siehe Definition 82). Schreibweise: rg(A).
54
2. SYSTEME LINEARER GLEICHUNGEN
Satz 102 : Es sei A ∈ K m×n , P ∈ GLm (K), 1 ≤ ℓ ≤ n und
1 ≤ i1 < i2 < . . . < iℓ ≤ n. Dann gilt:
(1) Das ℓ-Tupel der Spalten (A−i1 , . . . , A−iℓ ) von A ist genau dann linear
unabhängig, wenn das n-Tupel der Spalten
((PA)−i1 = PA−i1 , . . . , (PA)−iℓ = PA−iℓ ) von PA linear unabhängig
ist.
(2) Das ℓ-Tupel der Spalten (A−i1 , . . . , A−iℓ ) von A ist genau dann ein
Erzeugendensystem des Spaltenraums von A, wenn das n-Tupel der
Spalten ((PA)−i1 , . . . , (PA)−iℓ ) von PA ein Erzeugendensystem des
Spaltenraums von PA ist.
(3) Das ℓ-Tupel der Spalten (A−i1 , . . . , A−iℓ ) ist genau dann eine Basis
des Spaltenraums von A, wenn das n-Tupel der Spalten
((PA)−i1 , . . . , (PA)−iℓ ) eine Basis des Spaltenraums von PA ist.
Insbesondere sind der Rang von A und von PA gleich.
Beweis:
(1) Seien c1 , . . . , cℓ ∈ K. Weil P invertierbar ist, ist
ℓ
ℓ
j=1
j=1
∑ c j (PA)−i j = P( ∑ c j A−i j ) = 0
genau dann, wenn
ℓ
∑ c j A−i j = 0
j=1
ist.
(2) Wir nehmen an, dass (A−i1 , . . . , A−iℓ ) ein Erzeugendensystem des
Spaltenraums von A ist. Sei S := ∑nj=1 d j (PA)− j = P · ∑nj=1 d j A− j
ein Element des Spaltenraums von PA. Dann gibt es Elemente
b1 , . . . , bℓ ∈ K so, dass ∑nj=1 d j A− j = ∑ℓj=1 b j A−i j ist. Dann ist
ℓ
S = P · ∑ b j A−i j =
j=1
ℓ
∑ b j (PA)−i j
j=1
eine Linearkombination von ((PA)−i1 , . . . , (PA)−iℓ ). Die andere Implikation wird analog gezeigt.
(3) Folgt aus (1) und (2).
Satz 103 : Seien A ∈ K m×n und P ∈ GLm (K) so, dass PA Stufenform hat.
Sei r die Anzahl der Pivots in PA. Dann ist r = rg(A) und die Dimension
von L(A, 0) ist n − rg(A).
55
2. SYSTEME LINEARER GLEICHUNGEN
Beweis: Nach Satz 84 ist n − r die Dimension von L(PA, 0). Da PA Stufenform hat, ist leicht nachzuprüfen, dass rg(PA) = r ist. Weiters ist L(PA, 0) =
L(A, 0). Also folgen die Behauptungen aus Satz 102.
Satz 104 : Sei A ∈ K m×n .
(1) Mit dem folgenden Verfahren kann rg(A) berechnet und aus dem nTupel der Spalten von A eine Basis des Spaltenraums von A ausgesondert werden:
Bringe A durch elementare Umformungen auf Stufenform PA. Sei
r die Anzahl der Pivots von PA, und die Pivots seien in den Spalten
mit Indizes p1 , . . . , pr . Dann ist rg(A) = r und (A−p1 , . . . , A−pr ) eine
Basis des Spaltenraums von A.
(2) Wenn die Spalten von A linear unabhängig sind, kann (A−1 , . . . , A−n )
mit dem folgenden Verfahren zu einer Basis von K m×1 ergänzt werden:
Bringe (A | Im ) durch elementare Umformungen wie in Satz 87
auf Stufenform Q(A | Im ). Dann stehen die Pivots in den Spalten mit
Indizes
1, 2, . . . , n, n + r1 , . . . , n + rm−n ,
und (A−p1 , . . . , A−pr , er1 , . . . , erm−n ) ist eine Basis von K m×1 . Dabei
sind die Spalten e j , j = r1 , . . . , rm−n , Standardspalten in K m×1 .
Beweis:
(1) Das r-Tupel (PA−p1 , . . . , PA−pr ) von Spalten ist eine Basis des Spaltenraums von PA, nach Satz 102 ist daher (A−p1 , . . . , A−pr ) eine Basis
des Spaltenraums von A.
(2) Der Spaltenraum von (A | Im ) ist K m×1 . Da die Spalten von A linear
unabhängig sind, stehen in den ersten Spalten n von Q(A | Im ) Pivots.
Wende (1) auf die Matrix (A | Im ) an.
56
2. SYSTEME LINEARER GLEICHUNGEN
§7. Fragen
Seien K ein Körper, V ein Vektorraum über K und (v1 , . . . , vn ) ein nTupel von Vektoren in V.
1. Erzeugendensystem
Welche der folgenden Aussagen sind wahr?
(a) Das n-Tupel (v1 , ..., vn ) von Vektoren ist ein Erzeugendensystem von V genau dann, wenn jedes Element von V eine Linearkombination von v1 , ..., vn ist.
(b) Das n-Tupel (v1 , ..., vn ) von Vektoren ist ein Erzeugendensystem von V genau dann, wenn sich jedes Element v ∈ V auf
genau eine Weise als Linearkombination von v1 , ..., vn darstellen lässt.
(c) Das n-Tupel (v1 , ..., vn ) von Vektoren ist ein Erzeugendensystem von V genau dann, wenn sich jedes Element v ∈ V auf
höchstens eine Weise als Linearkombination von v1 , ..., vn darstellen lässt.
2. Lineare Unabhängigkeit
Welche der folgenden Aussagen sind wahr?
(a) Ist das Tripel von Vektoren (v1 , v2 , v3 ) linear unabhängig, dann
ist das 4-Tupel (v1 , v2 , v3 , v4 ) linear abhängig.
(b) Besitzt ein Vektor v verschiedene Darstellungen als Linearkombination der Vektoren v1 , v2 , v3 , v4 , dann sind diese Vektoren linear abhängig.
(c) Ein n-Tupel (v1 , ..., vn ) von Vektoren heißt linear unabhängig,
wenn für alle c1 , . . . , cn ∈ K aus ∑ni=1 ci ·vi = 0 folgt, dass ci = 0,
für 1 ≤ i ≤ n, ist.
3. Basis eines Vektorraumes
Welche der folgenden Aussagen sind wahr?
(a) Eine Basis von V ist ein linear abhängiges Erzeugendensystem
von V.
(b) Nimmt man von einer Basis einen Vektor weg, so hat man immer noch ein Erzeugendensystem.
(c) Sind alle Vektoren eines Vektorraums Linearkombinationen der
Vektoren v1 , . . . , vn , und sind diese Vektoren linear unabhängig,
dann ist das n-Tupel (v1 , ..., vn ) eine Basis.
4. Welche der folgenden Aussagen sind falsch?
(a) Es sei V der von (1, 1, 1) und (2, 1, 3) erzeugte Untervektorraum von Q 3 , dann ist (−4, −1, −7) ∈ V .
(b) Die Vektoren (2, 1) und(4, 2) bilden eine Basis des Vektorraums Q 2 .
57
2. SYSTEME LINEARER GLEICHUNGEN
(c) Die Vektoren (3, 0, 2), (5, 2, 0), (7, −2, 1), (8, 0, 0) ∈ Q 3 sind linear unabhängig.
In den folgenden drei Aufgaben ist jeweils ein System linearer
Gleichungen in Form einer Matrix (A|b) angegeben. Bestimmen Sie
welche der drei Aussagen zutrifft und geben Sie die Lösungsmenge
L(A, b) an.
5. Lösungsmenge eines Systems linearer Gleichungen


1 0 0 −8
(A|b) =  0 1 0 −19 
0 0 1 0
(a) Das System linearer Gleichungen (A|b) hat genau eine Lösung.
(b) Das System linearer Gleichungen (A|b) hat keine Lösung.
(c) Das System linearer Gleichungen (A|b) hat mehr als eine Lösung.
L(A, b) = ?
6.
7.


1 0 23 13
(A|b) =  0 1 0 −2 
0 0 0 0
(a) Das System linearer Gleichungen (A|b) hat genau eine Lösung.
(b) Das System linearer Gleichungen (A|b) hat keine Lösung.
(c) Das System linearer Gleichungen (A|b) hat mehr als eine Lösung.
L(A, b) = ?


1 0 3
4
(A|b) =  0 1 −2 −3 
0 0 0 −7
(a) Das System linearer Gleichungen (A|b) hat genau eine Lösung.
(b) Das System linearer Gleichungen (A|b) hat keine Lösung.
(c) Das System linearer Gleichungen (A|b) hat mehr als eine Lösung.
L(A, b) = ?
8. Welche der folgenden Aussagen sind falsch?
(a) Ein System linearer Gleichungen mit gleich vielen Gleichungen wie Unbekannten hat immer genau eine Lösung.
(b) Ein homogenes System linearer Gleichungen hat immer mindestens eine Lösung.
(c) Ein System linearer Gleichungen über Q hat keine, genau eine
oder unendlich viele Lösungen.
58
2. SYSTEME LINEARER GLEICHUNGEN
Gauss Algorithmus
Berechnen Sie in den folgenden zwei Aufgaben mit dem Gauss-Algorithmus eine Spalte x ∈ Q 3×1 so, dass A · x = b ist und eine Basis
des Vektorraums L(A, 0) = {y ∈ Q 3×1 |A · y = 0}.
9.

0 2 1
A :=  0 1 5  ∈ Q 3×3 ,
0 3 2

4
b :=  11  ∈ Q 3×1
7
10.

0 3 1
A :=  3 2 5  ∈ Q 3×3 ,
1 4 2

1
b :=  −1  ∈ Q 3×1
0





1 0 2
Berechnen Sie die inverse Matrix von  2 0 1  ∈ Q 3×3 .
1 1 1
11. Berechnen der inversen Matrix

12. Begründen Sie:
Wendet man auf die Einheitsmatrix In dieselben elementaren Zeilenumformungen an, welche die Matrix A in die Einheitsmatrix In
überführen, so erhält man die inverse Matrix von A, d.h.
(A|In ) −→ (In |A−1 ).
13. Vektorraum
Welche der folgenden Aussagen sind wahr?
(a) Ein Vektorraum ist eine Menge von Pfeilen.
(b) Die Lösungsmenge eines Systems von homogenen linearen
Gleichungen (mit der komponentenweisen Addition und Skalarmultiplikation) ist ein Vektorraum.
(c) Sei K n×1 der Vektorraum aller Spalten mit n Zeilen. Dann ist
die Lösungsmenge eines Systems von linearen Gleichungen in
n Unbekannten ein Untervektorraum von K n×1 .
14. Dimension eines Vektorraums
Verschiedene Basen eines endlich erzeugten Vektorraums V über
K enthalten gleich viele Elemente.
(a) Die Aussage ist falsch.
(b) Die Aussage ist wahr.
15. Welche der folgenden Aussagen sind wahr?
Die Dimension des Vektorraums aller Matrizen mit 4 Zeilen und 5
Spalten, deren erste Zeile 0 ist, ist
59
2. SYSTEME LINEARER GLEICHUNGEN
(a)
(b)
(c)
(d)
(e)
20
4
15
höchstens 3
höchstens 5
16. Rang einer Matrix
Welche der folgenden Aussagen sind wahr?
(a) Die Anzahl der Spalten einer quadratischen Matrix ist gleich
dem Rang der Matrix.
(b) Die Anzahl der linear unabhängigen Spalten einer Matrix ist
gleich dem Rangder Matrix.
1 2 4

3 5 7  ist
17. Der Rang der Matrix
6 8 9
(a) 9
(b) 6
(c) 3
(d) 2
(e) 1


1 2 3
18. Der Rang der Matrix  7 8 9  ist
4 5 6
(a) 9
(b) 6
(c) 3
(d) 2
(e) 1


7
19. Gib die Koordinaten von  10  ∈ Q 3 bezüglich der Basis
11
     
1
1
1
( 1  ,  2  ,  2 )
1
1
3
an.
20. Auswahl einer Basis aus einem Erzeugendensystem
Es seien s1 , ..., sk ∈ K n×1 Spalten und V der von s1 , ..., sk erzeugte
Vektorraum. Um aus s1 , ..., sk eine Basis von V auszuwählen, bringt
man die Matrix (s1 |s2 |...|sk ) in Stufenform.
Seien i1 , ..., id die Indizes der Spalten mit Pivots.
Welche der folgenden Aussagen sind wahr?
(a) Das d-Tupel (s1 , ..., sd ) ist eine Basis von V.
60
2. SYSTEME LINEARER GLEICHUNGEN
(b) Die Spalten s j , deren Index j ein Element von
{1, ..., k} \ {i1 , ..., id } ist, bilden eine Basis von V.
(c) Das d-Tupel (si1 , ..., sid ) ist eine Basis von V.
21. Ergänzen einer linear unabhängigen Menge von Spalten zu einer Basis
Es seien s1 , ..., sk ∈ K n×1 linear unabhängige Spalten und e1 , ..., en
die Standardspalten in K n×1 .
Welche der folgenden Aussagen sind wahr?
(a) Die Spalten s1 , ..., sk , ek+1 , ..., en bilden eine Basis von K n×1 .
(b) Man bringt die Matrix (s1 |s2 |...|sk |e1 |...|en ) auf Stufenform.
Seien 1, 2, ..., k, k + i1 , ..., k + id die Indizes der Spalten mit Pivots, dann bilden die Spalten s1 , ..., sk , ei1 , .., eid eine Basis von
K n×1 .
(c) Man bringt die Matrix (s1 |s2 |...|sk |e1 |...|en ) auf Stufenform.
Seien 1, 2, ..., k, k + i1 , ..., k + id die Indizes der Spalten mit Pivots und { j1 , ..., jn−d } = {1, ..., n}\{i1 , ..., id }. Dann bilden die
Spalten s1 , ..., sk , e j1 , .., e jn−d eine Basis von K n×1 .
KAPITEL 3
Rechnen mit Funktionen
§1. Hintereinanderausführung von Funktionen
In diesem Abschnitt seien M, N, P und Q Mengen, die nicht leer sind.
Definition 105 : Seien f : M → N und g : P → Q Funktionen so, dass für
alle m ∈ M die Bilder f (m) Elemente von P sind (das ist zum Beispiel der
Fall, wenn N = P ist). Dann heißt die Funktion
g ◦ f : M → Q, m 7→ g( f (m)),
die Hintereinanderausführung oder Zusammensetzung von f und g (sprich
g nach f“). Oft wird statt g ◦ f nur g f geschrieben.
”
Beispiel 106 : Die Hintereinanderausführung von
f : N → N , z 7→ 2z + 1 ,
und
g : Z → Z , z 7→ 3z − 7 ,
ist
g f : N → Z , z 7→ 6z − 4 .
Die Hintereinanderausführung f g ist nicht definiert, weil zum Beispiel
g(0) = −7 keine natürliche Zahl ist.
Beispiel 107 : Die Hintereinanderausführung von
f : Q → Q , z 7→ z2 ,
und
g : Q → Q , z 7→ z + 1 ,
ist
g f : Q → Q , z 7→ z2 + 1 .
Die Hintereinanderausführung von g und f ist
f g : Q → Q , z 7→ (z + 1)2 .
Es ist ( f g)(3) = 16 und (g f )(3) = 10, also ist f g ̸= g f .
61
62
3. RECHNEN MIT FUNKTIONEN
Satz 108 : Seien f : M → N, g : P → Q und h : R → S Funktionen so, dass
für alle m ∈ M die Bilder f (m) Elemente von P sind und für alle p ∈ P die
Bilder g(p) Elemente von R sind. Dann gilt
h ◦ (g ◦ f ) = (h ◦ g) ◦ f =: h ◦ g ◦ f ,
d.h. bei mehrfacher Hintereinanderausführung von Funktionen kommt es
nicht auf die Reihenfolge an (die Hintereinanderausführung von Funktionen
ist assoziativ, auf das Setzen von Klammern kann verzichtet werden).
Beweis: Sowohl h ◦ (g ◦ f ) als auch (h ◦ g) ◦ f sind Funktionen von M nach
S. Für jedes m ∈ M ist
(h ◦ (g ◦ f ))(m) = h((g ◦ f )(m)) = h(g( f (m))) = (h ◦ g)( f (m))
= ((h ◦ g) ◦ f )(m).
Definition 109 : Die Funktion
IdM : M → M , m 7→ m ,
heißt die identische Funktion oder Identität auf M.
Beispiel 110 : Für alle Funktionen f : M −→ N ist
IdN ◦ f = f = f ◦ IdM .
Definition 111 : Sei f : M → N eine bijektive Funktion. Dann heißt die
(ebenfalls bijektive) Funktion
f −1 : N → M, n 7→ Urbild von n bezüglich f ,
die zu f inverse Funktion oder die Umkehrfunktion von f .
Beispiel 112 : Die zu
f : {1, 2, 3} −→ {1, 2, 3} , 1 7→ 2, 2 7→ 3, 3 7→ 1,
inverse Funktion ist
f −1 : {1, 2, 3} −→ {1, 2, 3} , 1 7→ 3, 2 7→ 1, 3 7→ 2.
Die zu
g : Q −→ Q , z 7−→ 3z + 1,
inverse Funktion ist
1
g−1 : Q −→ Q , z 7−→ (z − 1).
3
63
3. RECHNEN MIT FUNKTIONEN
Satz 113 : Sei f : M → N eine Funktion.
(1) Ist f bijektiv, dann gilt f ◦ f −1 = IdN und f −1 ◦ f = IdM .
(2) Ist g : N → M eine Funktion mit f ◦ g = IdN und g ◦ f = IdM , dann
ist f bijektiv und g = f −1 .
Beweis: Übung.
Satz 114 : Seien f : M → N und g : N → P bijektive Funktionen. Dann ist
auch g ◦ f bijektiv und es gilt
(g ◦ f )−1 = f −1 ◦ g−1 .
Beweis: Wegen
(g ◦ f ) ◦ ( f −1 ◦ g−1 ) = g ◦ ( f ◦ f −1 ) ◦ g−1 = g ◦ IdN ◦g−1 = IdP
und
( f −1 ◦ g−1 ) ◦ (g ◦ f ) = f −1 ◦ (g−1 ◦ g) ◦ f = f −1 ◦ IdN ◦ f = IdM
folgt die Behauptung aus Satz 113, (2).
Satz 115 : Es sei
S(M) := {s | s : M → M bijektiv}.
(1) S(M) mit der Hintereinanderausführung von Funktionen ist eine Gruppe mit neutralem Element IdM und heißt die symmetrische Gruppe
von M.
(2) Wenn M eine endliche Menge mit n Elementen ist, dann ist auch S(M)
endlich und hat n! := n · (n − 1) · · · 2 · 1 Elemente.
Beweis:
(1) Folgt aus Satz 108 und Satz 114.
(2) Übung
§2. Permutationen
Definition 116 : Eine bijektive Funktion von {1, 2, . . . , n} nach {1, 2, . . . , n}
heißt Permutation der Zahlen 1, 2, . . . , n. Wir bezeichnen mit Sn die Menge
aller Permutationen der Zahlen 1, 2, . . . , n. Sn zusammen mit der Hintereinanderausführung von Funktionen heißt die Permutationsgruppe vom Grad
n. Eine Permutation
σ : {1, 2, . . . , n} → {1, 2, . . . , n}
64
3. RECHNEN MIT FUNKTIONEN
schreibt man oft als 2 × n-Matrix
)
(
1
2
...
n
.
σ (1) σ (2) . . . σ (n)
Sn hat genau n! = n(n − 1) · · · 2 · 1 Elemente. Graphisch kann man eine
Permutation darstellen, indem man die Zahlen 1, 2, . . . , n anschreibt und für
1 ≤ i ≤ n einen Pfeil von i nach σ (i) zeichnet. Zum Beispiel hat
)
(
1 2 3 4 5 6 7
σ=
5 4 6 7 3 1 2
die folgende Darstellung:
6 3
6
?
1
- 5
7
KA
A
A
A
A
- 4
2
Da σ : {1, 2, . . . , n} → {1, 2, . . . , n} bijektiv ist, ist jede Zahl Anfangs- und
Endpunkt von genau einem Pfeil.
Definition 117 : Sei ℓ ∈ N , ℓ ≥ 2, und seien j1 , . . . , jℓ paarweise verschiedene Elemente von {1, . . . , n}. Dann heißt die Funktion


falls i ̸∈ { j1 , . . . , jℓ },
i
τ : {1, 2, . . . , n} → {1, 2, . . . , n} , i 7→ jk+1 falls i = jk mit k < ℓ,

j
falls i = jℓ ,
1
ein Zykel der Länge ℓ und wird mit
( j1 , j2 , . . . , jℓ ) oder
( j1 j2 . . . jℓ )
bezeichnet. Ein Zykel der Länge 2 heißt eine Transposition oder Vertauschung von j1 und j2 . Zwei Zykel (i1 , . . . , ik ) und ( j1 , . . . , jℓ ) heißen disjunkt, wenn
{i1 , . . . , ik } ∩ { j1 , . . . , jℓ } = 0/
ist.
Für n = 5 ist zum Beispiel
(
)
1 2 3 4 5
(2 4 1) = (1 2 4) = (4 1 2) =
.
2 4 3 1 5
65
3. RECHNEN MIT FUNKTIONEN
Satz 118 : Es seien (i1 , . . . , ik ) und ( j1 , . . . , jℓ ) zwei disjunkte Zykel.
Es gilt:
(i1 , . . . , ik )( j1 , . . . , jℓ ) = ( j1 , . . . , jℓ )(i1 , . . . , ik )
und
( j1 , j2 , . . . , jℓ )−1 = ( jℓ , jℓ−1 , . . . , j1 ) ,
insbesondere ist
( j1 , j2 )−1 = ( j2 , j1 ) = ( j1 , j2 ) .
Beweis: Der Zykel (i1 , . . . , ik ) vertauscht nur Elemente in {i1 , . . . , ik }, der
Zykel ( j1 , . . . , jℓ ) nur Elemente in { j1 , . . . , jℓ }. Daher spielt die Reihenfolge
keine Rolle. Man prüft leicht nach, dass ( jℓ , jℓ−1 , . . . , j1 ) die Umkehrabbildung von ( j1 , j2 , . . . , jℓ ) ist.
Definition 119 : Sei M eine Menge und f : M −→ M eine Funktion. Ein
Element x ∈ M heißt ein Fixpunkt von f , wenn f (x) = x ist.
Satz 120 : Jede Permutation σ ∈ Sn ist Produkt paarweise disjunkter Zyklen ρ1 , . . . , ρm , die eindeutig bis auf die Reihenfolge sind. Die Darstellung
σ = ρ1 . . . ρm
heißt die Zyklenzerlegung von σ . Jene Elemente i ∈ {1, 2, . . . , n}, die nicht
in den Zyklen vorkommen, sind die Fixpunkte von σ .
Die Zyklenzerlegung einer Permutation σ ∈ Sn kann wie folgt berechnet
werden:
Man startet mit J := {1, . . . , n} und wiederholt die folgende Prozedur, bis J
leer ist: Wähle ein j ∈ J und berechne
j, σ ( j), σ (σ ( j)), σ (σ (σ ( j))), . . .
solange, bis wieder j kommt. Dann ist entweder j ein Fixpunkt oder
( j, σ ( j), . . . ) ein Zykel von σ . Streiche diese Elemente aus der Menge J.
Beweis: Nachprüfen.
Definition 121 : Sei σ ∈ Sn eine Permutation mit p Fixpunkten und m Zyklen. Dann heißt die Zahl
sign(σ ) := (−1)n−p−m
das Vorzeichen oder Signum von σ .
66
3. RECHNEN MIT FUNKTIONEN
Beispiel 122 : Die Zyklenzerlegung der Permutation
(
)
1 2 3 4 5 6 7 8
σ=
5 8 6 4 3 1 2 7
ist σ = (1 5 3 6)(2 8 7), sie hat einen Fixpunkt und ihr Vorzeichen ist
(−1)8−1−2 = −1.
Beispiel 123 : Sei Idn ∈ Sn die durch Idn (i) = i, 1 ≤ i ≤ n definierte Permutation. Da Idn keine Zyklen und n Fixpunkte hat, ist
sign(Idn ) = 1 .
Jede Transposition τ ∈ Sn hat einen Zykel und n − 2 Fixpunkte, daher ist
sign(τ ) = (−1)n−(n−2)−1 = −1 .
Satz 124 : Jede Permutation σ ∈ Sn ist Produkt von Transpositionen
τ1 , . . . , τr ∈ Sn , die im Allgemeinen nicht eindeutig bestimmt sind. Es gilt
aber
{
1 falls r gerade ist,
sign(σ ) = (−1)r =
−1 falls r ungerade ist.
Eine Permutation σ heißt gerade bzw. ungerade, wenn sign(σ ) = 1 bzw. −1
ist. Zum Beispiel ist jede Transposition ungerade.
Beweis: Sei σ = ρ1 . . . ρm die Zyklenzerlegung von σ . Wegen
(i1 , . . . , ik ) = (i1 , i2 )(i2 , i3 ) . . . (ik−1 , ik )
kann man jeden Zykel ρi als Produkt von Transpositionen schreiben und
daher auch σ . Das Beispiel
(
)
1 2 3
= (12)(23) = (13)(12)
2 3 1
zeigt, dass diese Darstellung im Allgemeinen nicht eindeutig ist.
Die Aussage sign(σ ) = (−1)r beweisen wir durch Induktion nach r. Für
r = 0 ist σ = Idn und sign(σ ) = 1. Für r = 1 ist σ eine Transposition, also
ist sign(σ ) = −1.
Sei nun r ≥ 2, τ1 = (i, j) und ρ := τ2 . . . τr . Dann ist zu zeigen, dass
sign((i, j)ρ ) = − sign(ρ )
ist. Dazu untersuchen wir, wie sich die Transposition (i, j) auf die Zyklenzerlegung von ρ auswirkt, und unterscheiden 2 Fälle:
(1) Die Elemente i und j liegen im gleichen Zykel ( j1 , . . . , jℓ ) von ρ , wobei
wir dann j1 = i und jk = j mit 2 ≤ k ≤ ℓ annehmen können, d.h.
( j1 , . . . , jℓ ) = (i = j1 , . . . , jk−1 , j = jk , . . . , jℓ ) .
67
3. RECHNEN MIT FUNKTIONEN
Für k = 2 ist dann i ein Fixpunkt von (i, j)ρ , und
für k ≥ 3 ist (i, j2 , . . . , jk−1 ) ein Zykel von (i, j)ρ .
Für k < ℓ ist ( j, jk+1 , . . . , jℓ ) ein Zykel von (i, j)ρ , und
für k = ℓ ist j ein Fixpunkt von (i, j)ρ .
Ansonsten bleibt bei der Zyklenzerlegung von ρ alles gleich, sodass die
Summe aus der Zahl der Fixpunkte und der Zahl der Zykel insgesamt um 1
steigt und sich damit das Vorzeichen ändert.
(2) Im anderen Fall ist i oder j Fixpunkt von ρ oder i, j liegen in verschiedenen Zyklen (i1 , i2 , . . . , ik ) bzw. ( j1 , j2 , . . . , jℓ ) von ρ , wobei wir i1 = i bzw.
j1 = j annehmen können. Dann ist
(i = i1 , . . . , ik , j = j1 , . . . , jℓ )
ein Zykel von (i, j)ρ , sodass insgesamt die Summe aus der Zahl der Fixpunkte und der Zahl der Zykel um 1 fällt und wiederum sich das Vorzeichen
ändert.
Satz 125 : Für Permutationen σ , τ ∈ Sn gilt
sign(σ τ ) = sign(σ ) · sign(τ ) .
Insbesondere ist sign(σ −1 ) = sign(σ ).
Beweis: Nach Satz 124 gibt es Transpositionen σ1 , . . . , σr und τ1 , . . . , τs mit
σ = σ1 . . . σr bzw. τ = τ1 . . . τs . Dann ist σ τ = σ1 . . . σr τ1 . . . τs , also
sign(σ τ ) = (−1)r+s = (−1)r (−1)s = sign(σ ) sign(τ ). Wegen σ −1 · σ = Idn
ist
sign(σ −1 ) sign(σ ) = sign(σ −1 · σ ) = sign(Idn ) = 1 ,
also sign(σ −1 ) = sign(σ ).
§3. Polynomfunktionen
In diesem Abschnitt sei K ein Körper.
Definition 126 : Seien n ∈ N und a0 , a1 , . . . , an ∈ K. Dann heißt die Funktion
n
f : K → K , z 7→ a0 + a1 z + a2 z + · · · + an z = ∑ ai zi ,
2
n
i=0
eine Polynomfunktion von K nach K. Die Elemente a0 , . . . , an heißen Koeffizienten von f .
Mit Polynomfunktionen sind mehrere grundlegende Aufgaben verbunden:
68
3. RECHNEN MIT FUNKTIONEN
• Auswerten einer Polynomfunktion f mit Koeffizienten
a0 , . . . , an in einem Element c von K: Berechne das Bild
n
f (c) = ∑ ai ci
i=0
von c unter der Polynomfunktion f . Es ist klar, dass dieses Element
von K immer durch Ausführen von Additionen und Multiplikationen
in K berechnet werden kann. Darin liegt die rechnerische Bedeu”
tung“ der Polynomfunktionen.
• Interpolation durch eine Polynomfunktion: Gegeben sind eine endliche Teilmenge E von K und eine Funktion g : E −→ K. Gesucht ist
eine Polynomfunktion f von K nach K so, dass für alle z ∈ E gilt:
f (z) = g(z).
• Überprüfen der Gleichheit von zwei Polynomfunktionen: Zwei Polynomfunktionen seien durch ihre Koeffizienten gegeben. Wie kann
man feststellen, ob diese zwei Funktionen gleich sind? Die Antwort
ist nicht so leicht: zum Beispiel sind die Polynomfunktionen
f : Z 2 −→ Z 2 , z 7−→ z , und g : Z 2 −→ Z 2 , z 7−→ z2 ,
gleich.
• Berechnen der Nullstellen einer Polynomfunktion f : Finde alle Elemente c ∈ K mit der Eigenschaft, dass f (c) = 0 ist. Einfacher zu
beantwortende Fragen sind: Gibt es solche Elemente? Wenn ja, wieviele?
Satz 127 : Es sei c ∈ K und f eine Polynomfunktion mit Koeffizienten
a0 , . . . , an ∈ K. Mit dem folgenden Verfahren kann f (c) mit höchstens n Additionen und höchstens n Multiplikationen in K berechnet werden:
• Setze i := n und w := an .
• Solange i ̸= 0 ist, ersetze i durch i − 1 und dann w durch w · c + ai .
• Wenn i = 0 ist, dann ist f (c) = w.
Beweis: ∑ni=0 ai ci = (. . . ((an c + an−1 )c + an−2 )c + . . . + a1 )c + a0 .
Satz 128 : Sei M eine Menge und W ein Vektorraum über K. Dann ist die
Menge
F(M,W ) := { f | f : M → W }
aller Funktionen von M nach W mit der punktweisen Addition
( f + g)(m) := f (m) + g(m) für alle m ∈ M
und der punktweisen Skalarmultiplikation
(c f )(m) := c f (m) für alle m ∈ M
69
3. RECHNEN MIT FUNKTIONEN
ein Vektorraum über K und heißt Vektorraum der W -wertigen Funktionen
auf M.
Für M = N erhält man als Spezialfall den Vektorraum der Folgen in W
F( N ,W ) = {(an )n∈ N | für alle n ∈ N ist an ∈ W }
mit der komponentenweisen Addition
(an )n∈ N + (bn )n∈ N := (an + bn )n∈ N
und der komponentenweisen Skalarmultiplikation
c(an )n∈ N := (can )n∈ N .
Für M = {1, 2, . . . , n}, wobei n ∈ N ist, erhält man als Spezialfall den
Standard-Vektorraum von Satz 68.
Beweis: Übung.
Satz 129 : Die Menge der Polynomfunktionen von K nach K ist ein Untervektorraum des K-Vektorraums F(K, K) aller Funktionen von K nach K.
Beweis: Seien f und g Polynomfunktionen und a0 , . . . , an bzw.
b0 , . . . , bm ihre Koeffizienten. Ohne Einschränkung der Allgemeinheit sei
n ≥ m. Falls n > m ist, setzen wir bm+1 := 0, . . . , bn = 0. Für alle z ∈ K ist
dann f (z) = ∑ni=0 ai zi und g(z) = ∑ni=1 bi zi . Daher ist für alle z ∈ K
(
) (
)
n
( f + g)(z) = f (z) + g(z) =
∑ aizi +
i=0
n
∑ bizi
i=0
n
= ∑ (ai + bi )zi ,
i=0
also f + g eine Polynomfunktion (mit den Koeffizienten a0 + b0 , . . . , an +
bn ). Analog zeigt man, dass c f (für c ∈ K) eine Polynomfunktion ist.
Satz 130 : Es sei M eine Menge und F := F(M, K) die Menge aller Funktionen von M in den Körper K. Für f , g ∈ F und c ∈ K und m ∈ M sei
( f g)(m) := f (m)g(m) .
Mit den Rechenoperationen
F × F −→ F , ( f , g) 7−→ f + g ,
und
F × F −→ F , ( f , g) 7−→ f g ,
(punktweise Multiplikation) ist F ein kommutativer Ring.
Das Nullelement ist 0 : M −→ K , m 7−→ 0K , das Einselement ist
1 : M −→ K , m 7−→ 1K .
Beweis: Übung.
70
3. RECHNEN MIT FUNKTIONEN
Definition 131 : Es sei R ein Ring und S eine nichtleere Teilmenge von R.
Dann ist S ein Unterring von R, wenn 1 ∈ S und für alle a, b ∈ S auch die
Elemente
a + b , −a und ab
in S enthalten sind.
Ein Unterring ist mit den auf diese Teilmenge eingeschränkten Rechenoperationen selbst ein Ring.
Satz 132 : Die Menge der Polynomfunktionen von K nach K ist ein Unterring des Ringes F(K, K) aller Funktionen von K nach K.
Beweis: Seien f und g Polynomfunktionen und a0 , . . . , an bzw.
b0 , . . . , bm ihre Koeffizienten. Für alle z ∈ K ist dann f (z) = ∑ni=0 ai zi und
g(z) = ∑mj=1 b j z j . Daher ist für alle z ∈ K
(
)(
)
( f · g)(z) = f (z)g(z) =
n
∑ aiz
i=0
n
=∑
m
m
∑ b jz j
i
n+m
(
j=0
k
∑ aib j zi+ j = ∑ ∑ aibk−i
i=0 j=0
k=0
=
)
zk ,
i=0
also f · g eine Polynomfunktion. Die anderen Eigenschaften eines Unterringes folgen aus Satz 129.
§4. Fragen
1. Welche der folgenden Aussagen sind wahr?
(a) Sei N = {1, 2, 3, 4, 5}.
Eine bijektive Funktion von N nach N nennt man eine Permutation der Zahlen 1, ..., 5.
(
)
1 2 3 4 5
(b) Die Umkehrfunktion der Permutation
ist
2 3 4 5 1
(
)
1 2 3 4 5
.
1 5 4 3 2
2. Gegeben sei die Permutation in Tabellenform
(
)
1 2 3 4 5 6 7 8
s :=
.
1 5 7 3 6 8 4 2
Welche der folgenden Aussagen sind wahr?
(a) Die Zahl 1 ist ein Fixpunkt von s.
(b) Die Permutation s hat genau drei disjunkte Zykel.
(c) Das Vorzeichen von s ist 1.
(d) Die Permutation s ist ungerade.
KAPITEL 4
Vektorrechnung und Geometrie
In der Vorlesung Einführung in die Mathematik 2“ lernen Sie den Kör”
per ( R , +, ·) der reellen Zahlen und die Ordnungsrelation ≤ auf R kennen.
Ein Vektorraum über dem Körper der reellen Zahlen heißt kurz reeller Vektorraum.
§1. Rechnen mit Punkten
In diesem Abschnitt wird gezeigt, wie wir die Zeichenebene und den
Anschauungsraum nach Wahl eines Nullpunktes“ in natürlicher Weise“
”
”
als Vektorraum betrachten können.
Wir nehmen an, wir haben ein beliebig großes“ Zeichenblatt E und die
”
folgenden Zeichengeräte:
• einen beliebig fein gespitzten“ Bleistift,
”
• ein beliebig langes“ Lineal und
”
• ein Dreieck.
Wir betrachten das Zeichenblatt als Menge von Punkten“ und wählen
”
einen davon aus. Diesen ausgewählten Punkt nennen wir Nullpunkt und bezeichnen ihn mit 0 ∈ E.
Wir nehmen an, dass mit Lineal und Bleistift durch je zwei Punkte eine
Gerade“ gezeichnet werden kann und dass mit Lineal, Dreieck und Blei”
stift jede Gerade in jeden Punkt parallelverschoben“ werden kann.
”
P
1
2
A BBILDUNG 1. Parallelverschieben
Je zwei Punkten A, B ∈ E können wir wie folgt einen dritten Punkt, den
wir mit A + B bezeichnen, zuordnen:
71
72
4. VEKTORRECHNUNG UND GEOMETRIE
• Falls 0, A und B nicht auf einer Geraden liegen:
Zeichne eine Gerade durch 0 und B und verschiebe sie in den Punkt
A. Zeichne eine Gerade durch 0 und A und verschiebe sie in den
Punkt B.
Dann sei A + B der Schnittpunkt“ dieser zwei Geraden.
”
A+B
A
B
0
A BBILDUNG 2. Addieren von Punkten in allgemeiner Lage
• Falls 0, A und B auf einer Geraden liegen:
Wähle einen Punkt H ∈ E, der nicht auf dieser Geraden liegt.
Konstruiere wie oben die Punkte A + H und (A + H) + B.
Verschiebe die Gerade durch 0 und H in den Punkt (A + H) + B.
Dann sei A + B der Schnittpunkt dieser Geraden mit der Geraden
durch 0 und A.
A+B
(A+H)+B
B
A
A+H
H (Hilfspunkt)
0
A BBILDUNG 3. Addieren von Punkten in spezieller Lage
Wir nehmen nun zusätzlich an, dass das Lineal mit einer Skala versehen ist, aus der jede reelle Zahl abgelesen werden kann. Dann kann jeder
73
4. VEKTORRECHNUNG UND GEOMETRIE
reellen Zahl c und jedem Punkt A ∈ E ein weiterer Punkt, den wir mit c · A
bezeichnen, wie folgt zugeordnet werden:
• Zeichne mit dem Lineal eine Gerade durch 0, die den Punkt A nicht
enthält.
• Lege das Lineal so, dass die Zahl 0 über dem Punkt 0 liegt und zeichne dann die Punkte P bzw. Q, über denen die Zahlen 1 bzw. c liegen,
auf dieser Geraden ein.
• Verschiebe die Gerade durch A und P in den Punkt Q.
• Dann sei c ·A der Schnittpunkt dieser Geraden mit der Geraden durch
0 und A.
Q
c. A
c
P
A
1
0
0
A BBILDUNG 4. Multiplikation von Punkten mit Zahlen
Wir nehmen an, dass die so definierten Rechenoperationen + ( Additi”
on von Punkten“) und · ( Skalarmultiplikation von reellen Zahlen mit Punk”
ten“) die Rechenregeln eines Vektorraums erfüllen. Dann ist die Zeichenebene E ein Vektorraum und ihre Punkte sind Vektoren.
Zum zeichnerischen Subtrahieren zweier Punkte A und B beachte man,
dass (A − B) + B = A ist. Wir beschränken uns auf den Fall, dass 0, A und
B nicht auf einer Geraden liegen.
Zeichne die Gerade durch 0 und B und verschiebe sie in den Punkt A. Zeichne die Gerade durch A und B und verschiebe sie in den Punkt 0. Dann ist
der Schnittpunkt“ dieser zwei Geraden jener Punkt, den man zu B addieren
”
muss, um A zu bekommen, also A − B.
Alternativ könnte A − B (= A − (−B)) auch durch Addition von A und
−B erhalten werden.
74
4. VEKTORRECHNUNG UND GEOMETRIE
B
O
A
-B
A-B
Differenz zweier Punkte A und B
A BBILDUNG 5. Differenz zweier Punkte
Es sei A ein von 0 verschiedener Punkt. Die Gerade durch 0 und A ist
(nach Definition der Skalarmultiplikation) die Menge aller skalaren Vielfachen von A. Wenn die Punkte 0, A und B nicht auf einer Geraden liegen,
dann ist das Punktepaar (A, B) eine R-Basis des Vektorraums E. Wenn a
bzw. b die Koordinaten eines Punktes P bezüglich dieser Basis sind, dann
erhält man a · A (bzw. b · B) als Schnittpunkt der Geraden R · A mit der Geraden, die man erhält, indem man die Gerade durch 0 und B in den Punkt
P verschiebt (bzw. als Schnittpunkt der Geraden R · B mit der Geraden, die
man erhält, indem man die Gerade durch 0 und A in den Punkt P verschiebt).
Der Punkt P wird eindeutig durch das Zahlenpaar (a, b) beschrieben.
Die Wahl eines Nullpunktes 0 in der Ebene und von zwei Punkten A, B
so, dass 0, A und B nicht auf einer Geraden liegen, nennt man auch Wahl
eines Koordinatensystems. Man kann diese Wahl auch dadurch treffen, dass
man ein Paar von Geraden, die genau einen Punkt gemeinsam haben, und
auf jeder Geraden einen Punkt, der nicht der Schnittpunkt ist, wählt. Der
Schnittpunkt ist dann der Nullpunkt und das Paar der auf den Geraden
gewählten Punkte ist die Basis.
Analog kann der Anschauungsraum nach Wahl eines Nullpunktes 0 in
natürlicher Weise als Vektorraum betrachtet werden. Wir nehmen dazu an,
dass drei Punkte 0, A, B jeweils in einer Ebene“ liegen und definieren dann
”
A+B und c·A wie oben. Wenn die Punkte 0, A, B und C nicht in einer Ebene
liegen, dann ist das Punktetripel (A, B,C) eine R-Basis dieses Vektorraums.
§2. Affine Unterräume
Definition 133 : Sei V ein Vektorraum über einem Körper K. Eine Teilmenge Z von V heißt affiner Unterraum von V , wenn ein Vektor p ∈ V und
75
4. VEKTORRECHNUNG UND GEOMETRIE
ein Untervektorraum U von V existieren, sodass
Z = p +U := {p + u | u ∈ U}
ist. In diesem Fall heißt der Vektor p ein Aufpunkt von Z und U der zu Z
parallele Untervektorraum.
Satz 134 : Sei Z = p +U ein affiner Unterraum von V . Dann gilt:
(1) U = {w − z | w, z ∈ Z} =: Z − Z , insbesondere ist der zu Z parallele
Untervektorraum eindeutig durch Z bestimmt.
(2) Für alle q ∈ Z gilt Z = q +U , und somit kann jedes Element von Z
als Aufpunkt gewählt werden.
(3) Z ist ein Untervektorraum von V genau dann, wenn 0V ∈ Z ist.
Beweis:
(1) Für u ∈ U ist u = (p + u) − (p + 0) ∈ Z − Z, also U ⊂ Z − Z. Für
w, z ∈ Z gibt es umgekehrt u, v ∈ U mit w = p + u und z = p + v,
woraus w − z = (p + u) − (p + v) = u − v ∈ U folgt. Somit ist auch
Z − Z ⊂ U und insgesamt U = Z − Z.
(2) Zu q ∈ Z existiert v ∈ U mit q = p + v. Für w = p + u ∈ Z ist dann
w = q + (p − q + u) ∈ q +U, also Z ⊂ q +U. Für u ∈ U ist umgekehrt
q + u = p + (v + u) ∈ Z, also auch q +U ⊂ Z.
(3) Wenn 0V ∈ Z ist, dann ist Z = 0V + U = U ein Untervektorraum.
Wenn umgekehrt Z ein Untervektorraum ist, dann muss nach Definition Z den Nullvektor enthalten.
Satz 135 : Sei (A, b) ein System linearer Gleichungen über K und
z ∈ K n×1 eine Lösung. Dann ist die Lösungsmenge L(A, b) ein affiner Unterraum von K n×1 mit Aufpunkt z und parallelem Untervektorraum L(A, 0),
d.h.
L(A, b) = z + L(A, 0).
Weiters ist L(A, b) ein Untervektorraum von K n×1 genau dann, wenn b = 0
ist.
Beweis: Nach Satz 66 ist L(A, 0) ein Untervektorraum von K n×1 , und nach
Satz 65 somit L(A, b) = z + L(A, 0) ein affiner Unterraum von K n×1 . Nach
Satz 134 ist L(A, b) ein Untervektorraum genau dann, wenn L(A, b) die
Spalte 0 enthält, d.h. A · 0 = b ist.
76
4. VEKTORRECHNUNG UND GEOMETRIE
Definition 136 : Sei V ein Vektorraum über einem Körper K der Dimension
n und
Z = p +U
ein affiner Unterraum von V mit Aufpunkt p und parallelem Untervektorraum U. Dann heißt
dimK (Z) := dimK (U)
die Dimension von Z. Im Fall dimK (Z) = 0 heißt Y ein Punkt,
im Fall dimK (Z) = 1 eine Gerade, im Fall dimK (Z) = 2 eine Ebene und im
Fall dimK (Z) = n − 1 eine Hyperebene.
Beispiel 137 : Es sei E die Zeichenebene, die wir nach Wahl eines Nullpunktes 0 ∈ E als Vektorraum betrachten. Es sei P ein von 0 verschiedener
Punkt. Die Gerade“ durch 0 und P ist die Menge aller skalaren Vielfachen
”
von P, also ist sie ein eindimensionaler Untervektorraum von E. Die Gera”
de“ durch zwei Punkte P und Q erhält man, indem man die Gerade“ durch
”
0 und Q − P in den Punkt P verschiebt, also ist sie gleich dem eindimensionalen affinen Unterraum
P + R · (Q − P) = {P + c · (Q − P) | c ∈ R} .
Der intuitive Begriff“ Gerade“ stimmt also mit dem oben definierten Be”
”
griff Gerade überein.
Definition 138 : Sei V ein Vektorraum über K und Z ein affiner Unterraum
von V .
(1) Wenn ein Aufpunkt p ∈ Z und eine Basis (v1 , . . . , vk ) des parallelen
Untervektorraums von Z gegeben sind, dann lässt sich jedes Element
z ∈ Z schreiben als
k
z = p + ∑ ci vi
i=1
mit eindeutig bestimmten Elementen c1 , . . . , ck ∈ K, und man sagt,
dass Z in Parameterform gegeben ist.
(2) Sei V = K n×1 , b ∈ K n×1 und A ∈ K m×n ist so, dass
Z = L(A, b)
ist. Dann sagt man, dass Z durch das System linearer Gleichungen
(A, b) in impliziter Form gegeben ist.
Die Parameterform eines affinen Unterraums hat den Vorteil, dass beliebig
viele Elemente von Z angeschrieben werden können. Hingegen lässt sich
die Frage, ob eine Spalte y ∈ K n×1 in Z enthalten ist, leichter beantworten,
wenn Z in impliziter Form gegeben ist, und zwar durch Multiplikation von
A mit y.
77
4. VEKTORRECHNUNG UND GEOMETRIE
Definition 139 : Es seien V ein Vektorraum über einem Körper K und Z1 =
p1 +U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und
parallelen Untervektorräumen U1 , U2 .
Die affinen Unterräume Z1 und Z2 heißen parallel, wenn U1 ⊆ U2 oder
U2 ⊆ U1 ist.
Beispiel 140 : Ein affiner Unterraum und sein paralleler Untervektorraum
sind parallel. Jeder Punkt von V ist zu jedem affinen Unterraum von V parallel.
Beispiel 141 : Sei A ∈ K m×n eine Matrix und b, b′ ∈ K m×1 Spalten. Wenn
die Lösungsmengen der Systeme linearer Gleichungen (A, b) und (A, b′ )
nicht leer sind, dann sind sie parallel.
Insbesondere: Wenn a1 , a2 , b, b′ Elemente von K sind mit a1 ̸= 0 oder
a2 ̸= 0, dann sind die Mengen
{(x, y) ∈ K 2 | a1 x + a2 y = b} und
{(x, y) ∈ K 2 | a1 x + a2 y = b′ }
parallele Geraden.
Satz 142 : Es seien V ein Vektorraum über einem Körper K und Z1 =
p1 +U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und
parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann
ist Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0.
/
Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer
ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 .
Satz 143 : ( Strahlensatz“)
”
Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann
gibt es c, d ∈ K \ {0} so, dass
v2 = cv1
und w2 = dw1
ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1
bzw. v2 und w2 . Dann gilt:
(1) L1 und L2 sind genau dann parallel, wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ).
78
4. VEKTORRECHNUNG UND GEOMETRIE
Z1
v2
v1
0
w1
L1
w2
L2
Z2
A BBILDUNG 6. Strahlensatz
Beweis:
(1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw.
K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die
Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau
dann gleich K(cv1 − dw1 ), wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, ist c = d und
v2 − w2 = cv1 − cw1 = c(v1 − w1 ) .
§3. Translationen
Definition 144 : Es sei V ein Vektorraum über einem Körper K und v ∈ V .
Dann heißt die Funktion
tv : V −→ V , x 7−→ x + v ,
Translation oder Verschiebung um v in V .
Sei
T (V ) := {tv | v ∈ V }
die Menge aller Translationen in V .
Satz 145 :
(1) Jede Translation ist bijektiv, die Umkehrfunktion von tv ist t(−v) .
Die Hintereinanderausführung zweier Translationen ist wieder eine
Translation, für v, w ∈ V ist
tv ◦ tw = tv+w = tw ◦ tv .
(2) Mit
T (V ) × T (V ) −→ T (V ) , (s,t) 7−→ s ◦ t ,
79
4. VEKTORRECHNUNG UND GEOMETRIE
und
K × T (V ) −→ T (V ) , (c,tv ) 7−→ tcv ,
ist T (V ) ein Vektorraum ( Translationen sind Vektoren“).
”
Beweis: nachprüfen.
Definition 146 : Es sei M eine Menge. Wir bezeichnen ein Paar (a, e) ∈
M × M von Elementen als Pfeil in M mit Anfangspunkt a und Endpunkt e.
Ein Pfeil enthält mehr Information als eine Menge von zwei Punkten (die durch eine Strecke, die diese Punkte verbindet, dargestellt werden kann). Die Zusatzinformation“ ist die Reihenfolge der Punkte: es gibt
”
einen ersten ( Schaft“ des Pfeils) und einen zweiten Punkt ( Spitze“ des
”
”
Pfeils).
Ein Paar reeller Zahlen kann entweder als Punkt in der Zeichenebene
oder als Pfeil in R zeichnerisch dargestellt werden. Ein Pfeil im Vektorraum
R2 ist ein Element des vierdimensionalen Vektorraumes R2 × R2 . Elemente eines vierdimensionalen Vektorraumes können also zeichnerisch durch
Pfeile in der Ebene dargestellt werden.
A BBILDUNG 7. Addition von (Graphen von) Translationen
80
4. VEKTORRECHNUNG UND GEOMETRIE
Sei v ̸= 0. Der Graph der Translation tv ist die Menge
{(y, y + v) | y ∈ V } ⊆ V ×V .
Die Gerade durch die Punkte x ∈ V und x + v ist x + Rv, also sind für alle
y, z ∈ V die Geraden durch y und y + v bzw. durch z und z + v parallel.
§4. Skalarprodukte
In diesem Abschnitt sei V ein reeller Vektorraum.
Wir werden die folgende Eigenschaft der reellen Zahlen verwenden: Zu
jeder reellen Zahl a ≥ 0 gibt es genau eine reelle Zahl b√
≥ 0 mit b2 = a.
√
√
Schreibweise: b = a. Ist 0 ≤ a < b, dann ist auch a < b.
Definition 147 : Ein Skalarprodukt auf V ist eine Funktion
⟨−, −⟩ : V ×V −→ R ,
(v, w) 7−→ ⟨v, w⟩ ,
mit den folgenden Eigenschaften:
Für alle c ∈ R , u, v, w ∈ V gilt
(1) ⟨v, w⟩ = ⟨w, v⟩
( ⟨−, −⟩ ist symmetrisch“)
”
(2) ⟨u, c(v + w)⟩ = c⟨u, v⟩ + c⟨u, w⟩
( ⟨−, −⟩ ist linear in der zweiten Komponente“)
”
(3) Für v ̸= 0 ist ⟨v, v⟩ eine positive reelle Zahl
( ⟨−, −⟩ ist positiv definit“).
”
Aus (1) und (2) folgt:
⟨c(u + v), w⟩ = c⟨u, w⟩ + c⟨v, w⟩ .
( ⟨−, −⟩ ist auch linear in der ersten Komponente“, also zusammengefasst:
”
⟨−, −⟩ ist bilinear “)
”
Ein endlichdimensionaler reeller Vektorraum mit einem Skalarprodukt
heißt euklidischer Raum.
Satz 148 : Es seien ⟨−, −⟩ ein Skalarprodukt auf V , (v1 , . . . , vn ) eine Basis
von V und c1 , . . . , cn , d1 , . . . , dn reelle Zahlen. Dann ist
n
n
i=1
j=1
n
⟨ ∑ ci vi , ∑ d j v j ⟩ = ∑
n
∑ cid j ⟨vi, v j ⟩ ,
i=1 j=1
insbesondere ist das Skalarprodukt ⟨−, −⟩ durch seine Gram’sche Matrix
bezüglich der Basis (v1 , . . . , vn )
(⟨vi , v j ⟩)1≤i, j≤n
eindeutig bestimmt.
Beweis: Induktion über n.
81
4. VEKTORRECHNUNG UND GEOMETRIE
Definition 149 : Ist ⟨−, −⟩ ein Skalarprodukt auf V , dann heißen die Funktionen
√
d : V ×V −→ R , (v, w) 7−→ ||v − w|| := ⟨v − w, v − w⟩ ,
bzw.
|| · || : V −→ R ,
v 7−→ ||v|| :=
√
⟨v, v⟩ ,
die von ⟨−, −⟩ induzierte Metrik bzw. Norm auf V . Die Zahl d(v, w)
heißt Abstand zwischen v und w. Die Zahl ||v|| = d(v, 0) heißt Abstand zwischen v und 0, Norm, Betrag oder Länge von v.
Zwei Vektoren v, w stehen zueinander senkrecht oder orthogonal, wenn
⟨v, w⟩ = 0 ist. Schreibweise: v ⊥ w.
Beispiel 150 : Die Funktion
⟨−, −⟩ : R n × R n −→ R ,
n
((a1 , . . . , an ), (b1 , . . . , bn )) 7−→ ∑ ai bi ,
i=1
ist ein Skalarprodukt auf R n und heißt Standardskalarprodukt auf R n . Für
die Standardbasis (e1 , . . . , en ) von R n gilt
√
⟨ei , e j ⟩ = δi j , ∥ei ∥ = 1 und ∥ei − e j ∥ = 2(1 − δi j ), für 1 ≤ i, j ≤ n .
Beispiel 151 : (Für Studierende mit Kenntnissen aus Analysis). Es seien
a, b reelle Zahlen mit a < b und V der Vektorraum aller stetigen Funktionen
vom Intervall [a, b] nach R . Die Funktion
⟨−, −⟩ : V ×V −→ R ,
( f , g) 7−→
∫ b
a
f (x) · g(x)dx ,
ist ein Skalarprodukt auf V . Die Norm von f ∈ V ist
√
∥f∥ =
∫ b
f (x)2 dx
.
a
Satz 152 : Es seien V mit ⟨−, −⟩ ein reeller Vektorraum mit Skalarprodukt
und v, w Vektoren in V . Dann ist
|⟨v, w⟩| ≤ ∥v∥ · ∥w∥
( Cauchy-Schwarz’sche Ungleichung“).
”
Weiters sind die Zahlen |⟨v, w⟩| und ∥v∥ · ∥w∥ genau dann gleich, wenn v
und w linear abhängig sind.
Beweis: Wenn v = 0 oder w = 0 ist, dann ist |⟨v, w⟩| = 0 = ∥v∥ · ∥w∥.
Sei nun v ̸= 0 und w ̸= 0. Wenn v und w linear abhängig sind, gibt es ein
82
4. VEKTORRECHNUNG UND GEOMETRIE
0 ̸= c ∈ R mit w = c · v. Daher ist
|⟨v, w⟩| = |c|⟨v, v⟩ = |c| · ∥v∥2 = ∥v∥ · ∥w∥ .
Wenn v und w linear unabhängig sind, dann ist
0 ̸= w − (⟨v, w⟩/⟨v, v⟩)v
und
0 < ⟨w − (⟨v, w⟩/⟨v, v⟩)v, w − (⟨v, w⟩/⟨v, v⟩)v⟩ = ⟨w, w⟩ − ⟨v, w⟩2 /⟨v, v⟩ .
Daher ist
⟨v, w⟩2 < ∥v∥2 · ∥w∥2 .
Beispiel 153 : Für V = R n mit dem Standardskalarprodukt und a, b ∈ R n
ergibt sich
√
√
n
| ∑ ai bi | ≤
i=1
n
n
i=1
i=1
∑ a2i ∑ b2i
als Cauchy-Schwarz’sche Ungleichung.
Satz 154 : Es seien V mit ⟨−, −⟩ ein reeller Vektorraum mit Skalarprodukt,
c ∈ R und v, w Vektoren in V . Dann gilt:
(1) ∥v + w∥ ≤ ∥v∥ + ∥w∥ ( Dreiecksungleichung“).
”
(2) Wenn v und w zueinander orthogonal sind, dann ist
∥v − w∥2 = ∥v∥2 + ∥w∥2
( Satz von Pythagoras“).
”
(3) Wenn ∥v∥ = ∥w∥ ist, dann stehen v + w und v − w zueinander senkrecht ( Satz von Thales“).
”
(4) ∥v + w∥2 − ∥v − w∥2 = 4⟨v, w⟩ .
Insbesondere: Eine Parallelogramm ist genau dann ein Rechteck,
”
wenn seine Diagonalen gleich sind.“
Beweis:
(1) ∥v + w∥2 = ⟨v + w, v + w⟩ = ⟨v, v⟩ + ⟨v, w⟩ + ⟨w, v⟩ + ⟨w, w⟩ ≤
≤ (Satz 152) ∥v∥2 + ∥w∥2 + 2∥v∥ · ∥w∥ = (∥v∥ + ∥w∥)2 .
(2) ∥v − w∥2 = ⟨v, v⟩ − 0 + ⟨w, w⟩ = ∥v∥2 + ∥w∥2 .
(3) ⟨v + w, v − w⟩ = ⟨v, v⟩ − ⟨w, w⟩ = ∥v∥2 − ∥w∥2 = 0.
(4) ∥v + w∥2 − ∥v − w∥2 = ⟨v, v⟩ + 2⟨v, w⟩ + ⟨w, w⟩ −
− (⟨v, v⟩ − 2⟨v, w⟩ + ⟨w, w⟩) = 4⟨v, w⟩ .
Definition 155 : Eine Norm auf V ist eine Funktion
N : V −→ R ≥0 := {t ∈ R |t ≥ 0} , v 7−→ N(v) ,
mit den Eigenschaften:
83
4. VEKTORRECHNUNG UND GEOMETRIE
(1) Es gilt N(v) = 0 genau dann, wenn v = 0 ist.
(2) Für alle c ∈ R , v ∈ V ist N(cv) = |c|N(v) .
(3) Für alle v, w ∈ V ist N(v + w) ≤ N(v) + N(w) .
V zusammen mit einer Norm heißt normierter Raum .
Beispiel 156 : Ist ⟨v, v⟩ ein Skalarprodukt auf V , dann ist
∥ · ∥ : V −→ R
,
v 7−→ ∥v∥ ,
eine Norm.
Definition 157 : Es sei u ∈ V und v ∈ V, v ̸= 0 . Mit R ≥0 bezeichnen wir
die Menge aller nicht-negativen reellen Zahlen. Die Menge
R ≥0 v := {c · v | c ∈ R , c ≥ 0}
heißt Richtung in V . Die Menge
u + R ≥0 v := {u + c · v | c ∈ R , c ≥ 0}
heißt Halbgerade oder Strahl in V mit Anfangspunkt u und Richtung v.
Sei V ein normierter Raum. Zu jeder nicht-negativen Zahl a ∈ R und jeder Richtung H := {cv | c ∈ R , c ≥ 0} gibt es genau ein Element w ∈ H
mit ∥w∥ = a, und zwar a∥v∥−1 · v. Also ist jeder Vektor in einem normierten Raum durch Richtung und Betrag eindeutig bestimmt. Die Sprechweise
ein Vektor hat Betrag und Richtung“ ist daher sinnvoll, wenn von Ele”
menten eines Vektorraums mit Skalarprodukt oder (allgemeiner) mit Norm
gesprochen wird.
§5. Orthonormalbasen
Sei ⟨−, −⟩ ein Skalarprodukt auf einem reellen Vektorraum V .
Definition 158 : Ein n-Tupel (v1 , . . . , vn ) in V heißt orthonormal bezüglich
⟨−, −⟩, wenn für alle 1 ≤ i, j ≤ n
⟨vi , v j ⟩ = δi j
ist. Ein n-Tupel (v1 , . . . , vn ) in V heißt Orthonormalbasis (kurz: ON-Basis)
von V bezüglich ⟨−, −⟩, wenn sie eine Basis von V und orthonormal bezüglich ⟨−, −⟩ ist.
Beispiel 159 : Die Standardbasis von R n ist eine Orthonormalbasis bezüglich des Standardskalarproduktes.
84
4. VEKTORRECHNUNG UND GEOMETRIE
Beispiel 160 : Eine Basis (v1 , . . . , vn ) von V ist genau dann eine Orthonormalbasis bezüglich ⟨−, −⟩, wenn die Gram’sche Matrix
(⟨vi , v j ⟩)1≤i, j≤n
gleich der Einheitsmatrix In ist.
Satz 161 : Ein orthonormales n-Tupel ist linear unabhängig.
Insbesondere: Wenn V endlich-dimensional ist, dann ist jedes orthonormale
n-Tupel mit dim R (V ) Elementen eine ON-Basis von V .
Beweis: Sei (v1 , . . . , vn ) ein orthonormales n-Tupel und c1 , . . . cn ∈ R . Wenn
∑ni=1 ci vi = 0 ist, dann ist für 1 ≤ j ≤ n auch
n
n
i=1
i=1
0 = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = c j .
Satz 162 : Es sei w ∈ V und v := (v1 , . . . , vn ) eine ON-Basis von V . Dann
ist
n
w = ∑ ⟨vi , w⟩vi .
i=1
( Die Koordinate von w bei vi ist das Skalarprodukt von vi mit w“.)
”
Beweis: Sei w = ∑nj=1 c j v j . Für 1 ≤ i ≤ n ist dann
n
⟨vi , w⟩ = ⟨vi , ∑ c j v j ⟩ =
j=1
n
∑ c j ⟨vi, v j ⟩ =
j=1
n
∑ c j δ i j = ci .
j=1
Beispiel 163 : Es sei V := R 2 und ⟨−, −⟩ das Standardskalarprodukt. Dann
ist
3 4
4 3
(v1 := ( , ), v2 := ( , − ))
5 5
5 5
eine ON-Basis von V . Dann ist
7
1
(1, 1) = ⟨v1 , (1, 1)⟩v1 + ⟨v2 , (1, 1)⟩v2 = v1 + v2 .
5
5
Satz 164 : Es seien (v1 , . . . , vn ) eine ON-Basis von V , u1 , . . . , un ∈ V und
S−1 , . . . , S−n die Koordinatenspalten von u1 , . . . , un bezüglich der ON-Basis
(v1 , . . . , vn ). Dann ist
Si j = ⟨vi , u j ⟩ ,
1 ≤ i, j ≤ n und die folgenden Aussagen sind äquivalent:
(1) Das n-Tupel (u1 , . . . , un ) ist eine ON-Basis von V .
85
4. VEKTORRECHNUNG UND GEOMETRIE
(2) Die Spalten (S−1 , . . . , S−n ) bilden eine ON-Basis von R n×1 mit dem
Standardskalarprodukt.
Beweis: Mit Satz 162 folgt
n
n
k=1
ℓ=1
⟨ui , u j ⟩ = ⟨ ∑ Ski vk , ∑ Sℓ j vℓ ⟩ = ∑ Ski Sℓ j ⟨vk , vℓ ⟩ =
k,ℓ
= ∑ Ski Sℓ j δkℓ = ∑ Ski Sk j = ⟨S−i , S− j ⟩ ,
k,ℓ
k
damit ist die Behauptung leicht nachzuprüfen.
Satz 165 : Es sei (w1 , . . . , wn ) eine Basis von V . Mit dem folgenden Verfahren ( Schmidt’sches Orthonormalisierungsverfahren“) kann eine ON-Basis
”
(v1 , . . . , vn ) von V berechnet werden:
• u1 := w1
• Für 2 ≤ j ≤ n sei
j−1
u j := w j − ∑ (⟨ui , w j ⟩/⟨ui , ui ⟩)ui
• Für 1 ≤ j ≤ n sei
i=1
v j := ∥u j ∥−1 u j .
Insbesondere: Jeder euklidische Raum hat eine ON-Basis. Für alle j ist
R ⟨v1 , . . . , v j ⟩ = R ⟨w1 , . . . , w j ⟩.
Beweis: Nach Definition ist ⟨vi , vi ⟩ = 1, 1 ≤ i ≤ n. Es genügt also zu zeigen,
dass für alle 1 ≤ k < ℓ ≤ n die Vektoren uk und uℓ zueinander senkrecht
stehen. Das kann einfach nachgerechnet werden:
ℓ−1
⟨uk , uℓ ⟩ = ⟨uk , wℓ − ∑ (⟨ui , wℓ ⟩/⟨ui , ui ⟩)ui ⟩ =
i=1
ℓ−1
= ⟨uk , wℓ ⟩ − ∑ (⟨ui , wℓ ⟩/⟨ui , ui ⟩)δki ⟨uk , uk ⟩ = ⟨uk , wℓ ⟩ − ⟨uk , wℓ ⟩ = 0 .
i=1
Nach Satz 161 ist dann (v1 , . . . , vn ) linear unabhängig, wegen dim R (V ) = n
folgt mit Satz 100, dass (v1 , . . . , vn ) eine Basis ist.
Beispiel 166 : Es sei V der von w1 := (1, 0, 1) und w2 := (1, 2, 3) erzeugte Untervektorraum von R 3 . Wir betrachten V mit der Einschränkung des
Standardskalarproduktes
(von √
R 3 ) als euklidischen Raum.
√
Es ist ∥w1 ∥ = 2, ∥w2 ∥ = 14 und ⟨w1 , w2 ⟩ = 4, also ist (w1 , w2 ) keine
ON-Basis von V .
86
4. VEKTORRECHNUNG UND GEOMETRIE
Mit den Bezeichnungen von Satz 165 erhalten wir
• u1 := w1 ,
• u2 := w2 − (⟨u1 , w2 ⟩/⟨u1 , u1 ⟩)u1 = (1, 2, 3) − 42 (1, 0, 1) = (−1, 2, 1)
√
√
• v1 := 12 2(1, 0, 1), v2 := 16 6(−1, 2, 1).
(v1 , v2 ) ist eine ON-Basis von V .
§6. Der Fußpunkt des Lotes
Sei ⟨−, −⟩ ein Skalarprodukt auf einem reellen Vektorraum V .
Definition 167 : Es sei U ein endlich-dimensionaler Untervektorraum von
V . Dann ist
U ⊥ := {v ∈ V | für alle u ∈ U ist ⟨v, u⟩ = 0}
ein Untervektorraum von V und heißt das orthogonale Komplement von U
in V .
Satz 168 : Es sei U ein endlich-dimensionaler Untervektorraum von V ,
v ∈ V und (u1 , . . . , un ) eine ON-Basis von U.
(1) Der Vektor
n
pU (v) := ∑ ⟨ui , v⟩ui ∈ U
i=1
hängt nicht von der Wahl der ON-Basis (u1 , . . . , un ) ab und heißt
Fußpunkt des Lotes von v auf U.
(2) Jeder Vektor v ∈ V lässt sich eindeutig als Summe eines Vektors in U
und eines Vektors in U ⊥ schreiben, und zwar
v = pU (v) + (v − pU (v)) ,
wobei pU (v) ∈ U und (v − pU (v)) ∈ U ⊥ ist. Insbesondere ist
U ∩U ⊥ = {0} und V = U +U ⊥ := {y + y′ | y ∈ U, y′ ∈ U ⊥ }.
(3) Für v ∈ V und y ∈ U mit pU (v) ̸= y ist
∥v − y∥ > ∥v − pU (v)∥ ,
das heißt: pU (v) ist der eindeutig bestimmte Vektor in U, der von v
den kleinsten Abstand hat.
Beweis:
(1) Es sei (w1 , . . . , wn ) eine ON-Basis von U. Es ist zu zeigen, dass
pU (v) = ∑nk=1 ⟨wk , v⟩wk ∈ U ist. (Dann hängt pU (v) nicht von der
Wahl der ON-Basis in U ab). Nach Satz 162 ist
n
ui =
∑ ⟨w j , ui⟩w j , 1 ≤ i ≤ n .
j=1
87
4. VEKTORRECHNUNG UND GEOMETRIE
Daher ist
n
n
n
n
pU (v) = ∑ ⟨ui , v⟩ui = ∑ ⟨ ∑ ⟨w j , ui ⟩w j , v⟩ ∑ ⟨wk , ui ⟩wk =
i=1
i=1 j=1
n
=∑
n
k=1
n
∑ ∑ ⟨w j , ui⟩⟨w j , v⟩⟨wk , ui⟩wk =
i=1 j=1 k=1
n
=
n
n
∑ ( ∑ ⟨w j , v⟩ ∑ (⟨w j , ui⟩⟨wk , ui⟩))wk = ( cf. Satz 164 )
k=1 j=1
i=1
n
=
n
n
∑ ( ∑ ⟨w j , v⟩⟨w j , wk ⟩)wk = ∑ ⟨wk , v⟩wk .
k=1 j=1
k=1
(2) Für y ∈ U ist ⟨v, y⟩ = ⟨pU (v), y⟩, also
⟨v − pU (v), y⟩ = ⟨v, y⟩ − ⟨pU (v), y⟩ = 0 .
Daher ist v − pU (v) ∈ U ⊥ und v = pU (v) + (v − pU (v)) ∈ U + U ⊥ .
Wenn y ̸= 0 ist, dann ist 0 < ⟨y, y⟩, also y ̸∈ U ⊥ . Daher ist U ∩U ⊥ =
{0}.
(3) Für y ∈ U mit pU (v) ̸= y ist 0 ̸= pU (v) − y ∈ U und v − pU (v) ∈ U ⊥ .
Deshalb ist
∥v − y∥2 = ∥(v − pU (v)) + (pU (v) − y)∥2 =
= ∥v − pU (v)∥2 + ∥pU (v) − y∥2 > ∥v − pU (v)∥2 .
Beispiel 169 : Es sei 0 ̸= u ∈ V und U die Gerade R u. Dann ist ∥u∥−1 u
eine ON-Basis von U. Der Fußpunkt des Lotes von v ∈ V auf die Gerade U
ist
p R u (v) = ⟨∥u∥−1 u, v⟩∥u∥−1 u = (⟨u, v⟩/⟨u, u⟩)u .
Beispiel 170 : Satz 168 ermöglicht eine geometrische Interpretation des
Schmidt’schen Orthonormalisierungsverfahrens (Satz 165):
Seien u1 , . . . , u j−1 schon berechnet. Dann ist (v1 , . . . , v j−1 ) eine Orthonormalbasis des von v1 , . . . , v j−1 erzeugten Untervektorraums V j−1 . Der Vektor
j−1
∑ (⟨ui, w j ⟩/⟨ui, ui⟩)ui
i=1
ist dann der Fußpunkt des Lotes von w j auf V j−1 und u j der Fußpunkt des
⊥ . Wegen w ̸∈ V
Lotes von w j auf V j−1
j
j−1 ist u j ̸= 0.
Definition 171 : Es sei Z ein endlichdimensionaler affiner Unterraum von
V mit Aufpunkt z und parallelem Untervektorraum U. Der Vektor
pZ (v) := z + pU (v − z)
88
4. VEKTORRECHNUNG UND GEOMETRIE
heißt Fußpunkt des Lotes von v auf den affinen Unterraum Z.
Die Zahl ∥v − pZ (v)∥ heißt Abstand des Punktes v vom affinen Unterraum
Z.
Satz 172 : Es seien Z und Z ′ endlichdimensionale affine Unterräume von V
mit Aufpunkten z, z′ und parallelen Untervektorräumen U,U ′ . Seien u ∈ U,
u′ ∈ U ′ so, dass −u + u′ der Fußpunkt des Lotes von z − z′ auf U + U ′ ist.
Dann ist v := z + u ∈ Z, v′ := z′ + u′ ∈ Z ′ und für alle w ∈ Z, w′ ∈ Z ′ ist
∥w − w′ ∥ ≥ ∥v − v′ ∥ .
Die Zahl ∥v − v′ ∥ heißt Abstand der affinen Unterräume Z und Z ′ und ist
gleich dem Abstand des Punktes z − z′ vom Untervektorraum U +U ′ .
Beweis: Für alle x ∈ U, x′ ∈ U ′ ist
∥(z+x)−(z′ +x′ )∥ = ∥(z−z′ )−(x′ −x)∥ ≥ ∥(z−z′ )−(−u+u′ )∥ = ∥v−v′ ∥.
§7. Winkel
Sei V mit ⟨−, −⟩ ein euklidischer Raum.
Definition 173 : Es sei w ∈ V und r ∈ R ≥0 := {t ∈ R |t ≥ 0}. Die Menge
{v ∈ V | ∥v − w∥ = r}
heißt Kreis mit Mittelpunkt w und Radius r. Der Kreis mit Mittelpunkt w
und Radius 1 heißt Einheitskreis um u.
Es seien u, v, w ∈ V mit u ̸= 0, v ̸= 0. Wir möchten die Lage der zwei
Halbgeraden w + R ≥0 u und w + R ≥0 v zueinander durch eine Zahl beschreiben, welche der Länge des (kürzeren) Bogens“ zwischen w+∥u∥−1 u
”
und w + ∥v∥−1 v auf dem Einheitskreis um w entsprechen soll.
Diese Zahl soll nur von u und v, aber nicht von w abhängen. Wir nehmen
also im weiteren an, dass w = 0 ist. Sei
u′ := ∥u∥−1 u und
v′ := ∥v∥−1 v .
Der Fußpunkt des Lotes p R u (v) von v′ auf die Gerade R u ist dann
⟨u′ , v′ ⟩u′
(siehe Beispiel 169). Die Zahl |⟨u′ , v′ ⟩| ist der Abstand zwischen 0 und
p R u (v′ ), kann also leichter gemessen werden als die Länge des (kürzeren)
”
Bogens“ zwischen u′ und v′ . Nach Satz 152 ist −1 ≤ ⟨u′ , v′ ⟩ ≤ 1.
Wenn α ∈ [0, π ] die Länge des (kürzeren) Bogens“ zwischen u′ und v′
”
ist, setzen wir
cos(α ) := ⟨u′ , v′ ⟩ = ⟨u, v⟩/(∥u∥ · ∥v∥)
89
4. VEKTORRECHNUNG UND GEOMETRIE
(Sprechweise: Cosinus von α ). In der Analysis zeigt man, dass es zu jeder
Zahl z ∈ [−1, 1] genau ein α ∈ [0, π ] mit cos(α ) = z gibt. Anders formuliert:
die Funktion
cos : [0, π ] −→ [−1, 1] , α 7−→ cos(α ) ,
ist bijektiv. Für α ∈ [0, π ] bezeichnen wir mit sin(α ) (Sprechweise: Sinus
von α ) den Abstand von v′ zur Geraden R u. Aus dem Satz von Pythagoras
folgt sin(α )2 + cos(α )2 = 1.
Definition 174 : Es seien u, v, w ∈ V, u ̸= 0 und v ̸= 0. Die eindeutig bestimmte Zahl α ∈ [0, π ] mit
cos(α ) = ⟨u, v⟩/(∥u∥ · ∥v∥)
heißt Winkel zwischen den Halbgeraden w+ R ≥0 u und w+ R ≥0 v oder kurz
Winkel zwischen u und v.
Satz 175 : ( Cosinussatz“) Es seien v, w ∈ V mit v ̸= 0, w ̸= 0 und α der
”
Winkel zwischen v und w. Dann ist
∥v − w∥2 = ∥v∥2 + ∥w∥2 − 2∥v∥ · ∥w∥ · cos(α ) .
Beweis: ∥v − w∥2 = ⟨v − w, v − w⟩ = ∥v∥2 + ∥w∥2 − 2⟨v, w⟩ =
= ∥v∥2 + ∥w∥2 − 2∥v∥ · ∥w∥ · cos(α ) .
Satz 176 : ( Sinussatz “) Es seien u, v ∈ V mit u ̸= 0, v ̸= 0, β der Winkel
”
zwischen v − u und 0 − u und γ der Winkel zwischen 0 − v und u − v. Dann
ist
∥u∥ · sin(β ) = ∥v∥ · sin(γ ) .
Beweis: Da sin(β ) und sin(γ ) nicht negativ sind, genügt es zu zeigen, dass
⟨u, u⟩ · sin2 (β ) = ⟨v, v⟩ · sin2 (γ )
ist. Wegen
sin2 (β ) = 1 − cos2 (β ) = 1 −
ist das leicht nachzuprüfen.
⟨−u, v − u⟩2
⟨−u, −u⟩ · ⟨v − u, v − u⟩
90
4. VEKTORRECHNUNG UND GEOMETRIE
§8. Lineare Funktionen
In diesem Abschnitt seien V und W Vektorräume über einem Körper K.
Definition 177 : Eine Funktion f : V → W heißt K-linear, wenn die folgenden zwei Bedingungen erfüllt sind:
(1) Für alle v, w ∈ V ist f (v + w) = f (v) + f (w) .
( Das Bild der Summe ist die Summe der Bilder.“)
”
(2) Für alle c ∈ K und für alle v ∈ V ist f (cv) = c f (v) .
( Das Bild des c-fachen ist das c-fache des Bildes.“)
”
Beispiel 178 : Die Nullfunktion
0 : V → W , v 7→ 0W ,
und die Identität
IdV : V → V , v 7→ v ,
sind K-linear.
Beispiel 179 : Für jede Matrix A ∈ K m×n ist die Funktion
K n×1 → K m×1 , x 7→ Ax ,
K-linear. Später werden wir sehen, dass jede lineare Funktion vom Vektorraum aller m-Spalten in den Vektorraum aller n-Spalten durch Multiplikation mit einer Matrix gegeben ist.
Beispiel 180 : Ein Kaufhaus bietet n Waren an. Kauft jemand ai Einheiten
der i-ten Ware, 1 ≤ i ≤ n, so muss er p(a1 , . . . , an ) Euro zahlen. Die Funktion
p : Q n −→ Q , (a1 , . . . , an ) 7−→ p(a1 , . . . , an )
ist genau dann linear, wenn es keinen Mengenrabatt, keine Sonderaktionen
( nimm drei, zahl’ zwei“) oder ähnliches gibt, also:
”
(1) Nimmt man bei einem Einkauf ai und bei einem anderen Einkauf
bi Einheiten der i-ten Ware, 1 ≤ i ≤ n, dann bezahlt man in Summe
dasselbe, wie wenn man alles bei einem Einkauf genommen hätte
(p(a1 , . . . , an ) + p(b1 , . . . , bn ) = p(a1 + b1 , . . . , an + bn )).
(2) Kauft man von jeder Ware das c-fache, dann muss man c-mal soviel
zahlen (p(ca1 , . . . , can ) = c · p(a1 , . . . , an )).
Satz 181 : Seien f : V → W eine lineare Funktion, v1 , . . . , vn ∈ V und
c1 , . . . , cn ∈ K. Dann ist
n
n
i=1
i=1
f ( ∑ ci vi ) = ∑ ci f (vi ) .
91
4. VEKTORRECHNUNG UND GEOMETRIE
( Das Bild der Linearkombination ist die Linearkombination der Bilder.“)
”
Speziell ist
f (0V ) = 0W
und, für alle v ∈ V ,
f (−v) = − f (v) .
Beweis: Induktion nach n.
Satz 182 : Seien U ein Vektorraum über K und f : U → V sowie
g : V → W lineare Funktionen. Dann gilt:
(1) Die Zusammensetzung g ◦ f : U → W , u 7→ g( f (u)) , ist K-linear.
(2) Wenn f bijektiv ist, dann ist die Umkehrfunktion
f −1 : V → U auch K-linear.
( Die Zusammensetzung von linearen Funktionen ist linear. Die Umkehr”
funktion einer bijektiven linearen Funktion ist linear.“)
Beweis:
(1) Für v, w ∈ U und c ∈ K ist
(g ◦ f )(v + w) = g( f (v + w)) = g( f (v) + f (w)) =
=g( f (v)) + g( f (w)) = (g ◦ f )(v) + (g ◦ f )(w),
(g ◦ f )(cv) = g( f (cv)) = g(c f (v)) = cg( f (v)) = c(g ◦ f )(v),
(2) Für v, w ∈ V und c ∈ K ist
f ( f −1 (v) + f −1 (w)) = ( f ◦ f −1 )(v) + ( f ◦ f −1 )(w) = v + w,
also f −1 (v + w) = f −1 (v) + f −1 (w), und
f (c f −1 (v)) = c( f ◦ f −1 )(v) = cv, also f −1 (cv) = c f −1 (v).
Definition 183 : Eine lineare und bijektive Funktion von V nach W heißt
Isomorphismus von Vektorräumen. V und W heißen isomorph, wenn es
einen Isomorphismus von V nach W (oder von W nach V ) gibt. Schreibweise: V ∼
= W.
Satz 184 :
(1) Jeder Vektorraum V über K der Dimension n ist zum Standard-Vektorraum K n isomorph.
Nach Wahl einer Basis (v1 , . . . , vn ) erhält man einen Isomorphismus
durch
V −→ K n , u 7→ Koordinaten-n-Tupel von u bezüglich (v1 , . . . , vn ) .
(2) Zwei endlich-dimensionale Vektorräume über K sind genau dann isomorph, wenn ihre Dimensionen gleich sind.
92
4. VEKTORRECHNUNG UND GEOMETRIE
Beweis:
(1) Nach Satz 98 ist die Funktion
n
K n → V , (c1 , . . . , cn ) 7→ ∑ ci vi ,
i=1
bijektiv. Man prüft leicht nach, dass sie auch linear ist. Nach Satz 182
ist dann die Koordinaten-Funktion als Umkehrfunktion linear und bijektiv, also ein Isomorphismus.
(2) Seien V , W endlich-dimensionale Vektorräume über K. Wenn V und
W isomorph sind, dann gibt es eine bijektive lineare Funktion
f : V → W . Sei (v1 , . . . , vn ) eine Basis von V . Mit Satz 181 prüft man
leicht nach, dass dann ( f (v1 ), . . . , f (vn )) eine Basis von W ist, also
ist dimK (V ) = dimK (W ).
Sei umgekehrt dimK (V ) = dimK (W ) =: n. Dann gibt es nach (1)
Isomorphismen f : V → K n und g : W → K n . Nach Satz 182 ist dann
auch g−1 ◦ f : V → W ein Isomorphismus.
Aus Satz 184 folgt, dass man das Rechnen in jedem endlich-dimensionalen Vektorraum durch die Wahl einer Basis dieses Vektorraums auf das
(komponentenweise) Rechnen mit n-Tupeln zurückführen kann.
§9. Die Matrix einer linearen Funktion
In diesem Abschnitt sei V ein Vektorraum über K mit Dimension n ∈ N ,
v := (v1 , . . . , vn ) eine Basis von V , W ein Vektorraum über K mit Dimension
m ∈ N und w := (w1 , . . . , wm ) eine Basis von W .
Satz 185 : Seien u1 , . . . , un ∈ W . Dann gibt es genau eine lineare Funktion
f : V → W mit
f (vi ) = ui , 1 ≤ i ≤ n .
Somit kann eine lineare Funktion zwischen Vektorräumen durch (beliebige)
Vorgabe der Bilder einer Basis eindeutig definiert werden.
Beweis: Wenn eine derartige Funktion f existiert, dann ist für einen Vektor
∑ni=1 ci vi ∈ V
n
n
n
i=1
i=1
i=1
f ( ∑ ci vi ) = ∑ ci f (vi ) = ∑ ci ui ,
was die Eindeutigkeit der Funktion beweist.
Um die Existenz einer solchen Funktion zu zeigen, definieren wir eine
Funktion f : V → W durch
n
f (x) := ∑ ci ui ,
i=1
93
4. VEKTORRECHNUNG UND GEOMETRIE
wobei c1 , . . . , cn ∈ K die Koordinaten von x ∈ V bezüglich der Basis v sind.
Dann ist f K-linear, weil für x = ∑ni=1 ci vi , y = ∑ni=1 di vi und t ∈ K wegen
x + y = ∑ni=1 (ci + di )vi und tx = ∑ni=1 (tci )vi
n
n
n
i=1
i=1
i=1
f (x + y) = ∑ (ci + di )ui = ∑ ci ui + ∑ di ui = f (x) + f (y)
(
sowie
n
f (tx) = ∑ tci ui = t
i=1
)
n
∑ ci ui
= t f (x)
i=1
ist. Schließlich gilt wegen v j = ∑ni=1 δi j vi für alle 1 ≤ j ≤ n:
n
f (v j ) = ∑ δi j ui = u j .
i=1
Definition 186 : Seien f : V → W eine K-lineare Funktion und
A1 j , . . . , Am j die Koordinaten von f (v j ) bezüglich w , d.h.
m
f (v j ) = ∑ Ai j wi , 1 ≤ j ≤ n .
i=1
Dann heißt
M( f , v, w) := (Ai j )1≤i≤m ∈ K m×n
1≤ j≤n
die Matrix von f bezüglich der Basen v und w.
Die j-te Spalte von M( f , v, w) ist also die Koordinatenspalte von f (v j )
bezüglich w.
Im Spezialfall V = W und v = w schreibt man statt M( f , v, v) kurz
M( f , v).
Beispiel 187 : Für 1 ≤ j ≤ n ist
n
IdV (v j ) = v j = ∑ δi j vi
i=1
und somit
M(IdV , v) = In .
Beispiel 188 : Sei A ∈ K m×n . Dann ist die Matrix der linearen Abbildung
K n×1 → K m×1 , x 7→ Ax ,
bezüglich der Standardbasen (e1 , . . . , en ) von K n×1 und
(e′1 , . . . , e′m ) von K m×1 gleich A, weil für 1 ≤ j ≤ n
m
Ae j = A− j = ∑ Ai j e′i
i=1
94
4. VEKTORRECHNUNG UND GEOMETRIE
ist.
Wenn f : K n×1 → K m×1 eine lineare Funktion ist und A := M( f , e, e′ ), dann
ist
n
n
n
i=1
i=1
i=1
f (x) = f ( ∑ xi ei ) = ∑ xi f (ei ) = ∑ xi A−i = Ax .
Daher ist jede lineare Funktion von K n×1 nach K m×1 durch Multiplikation
mit einer eindeutig bestimmten Matrix A ∈ K m×n gegeben. Oft identifiziert
man eine m × n-Matrix mit dieser linearen Funktion.
Satz 189 : Seien U ein Vektorraum über K der Dimensionen ℓ mit Basis u
und f : V → W sowie g : W → U K-lineare Funktionen. Dann ist
M(g ◦ f , v, u) = M(g, w, u) · M( f , v, w) ,
d.h. der Zusammensetzung von linearen Funktionen entspricht die
Multiplikation der zugehörigen Matrizen.
Beweis: Sei A := M( f , v, w) ∈ K m×n und B := M(g, w, u) ∈ K ℓ×m . Dann ist
für 1 ≤ j ≤ n
m
m
(g ◦ f )(v j ) = g( f (v j )) = g( ∑ Ai j wi ) = ∑ Ai j g(wi )
i=1
m
= ∑ Ai j
i=1
ℓ
ℓ
k=1
k=1
(
i=1
m
∑ Bkiuk = ∑ ∑ BkiAi j
)
uk
i=1
ℓ
=
∑ (BA)k j uk ,
k=1
also BA = M(g ◦ f , v, u).
Satz 190 : Die lineare Funktion f : V → W ist genau dann ein Isomorphismus, wenn die Matrix M( f , v, w) invertierbar ist. In diesem Fall ist
M( f −1 , w, v) = M( f , v, w)−1 .
Beweis: Wenn f ein Isomorphismus ist, dann ist nach Satz 182 die Umkehrfunktion f −1 linear und nach Satz 184 ist n = m. Aus f −1 ◦ f = IdV
und f ◦ f −1 = IdW folgt nach Satz 189
M( f −1 , w, v) · M( f , v, w) = M( f −1 ◦ f , v, v) = M(IdV , v, v) = In
und
M( f , v, w) · M( f −1 , w, v) = M( f ◦ f −1 , w, w) = M(IdW , w, w) = Im .
95
4. VEKTORRECHNUNG UND GEOMETRIE
Wenn umgekehrt A := M( f , v, w) ∈ K m×n invertierbar ist, dann ist m = n
und es existiert B := A−1 ∈ K n×n . Definiert man nach Satz 185 eine lineare
Funktion g : W → V durch
n
g(w j ) := ∑ Bi j vi
i=1
für 1 ≤ j ≤ n, so folgt nach Satz 189
M(g ◦ f , v, v) = M(g, w, v) · M( f , v, w) = BA = In = M(IdV , v, v)
und
M( f ◦ g, w, w) = M( f , v, w) · M(g, w, v) = AB = In = M(IdW , w, w) .
Daher ist g ◦ f = IdV und f ◦ g = IdW nach Satz 185, also f ein Isomorphismus und g = f −1 .
Nach Wahl von Basen im Definitionsbereich und im Bildbereich einer
linearen Funktion ist diese eindeutig durch ihre Matrix bestimmt. Anstatt
mit linearen Funktionen kann mit den entsprechenden Matrizen gerechnet
werden. Der Zusammensetzung von linearen Abbildungen entspricht die
Matrizenmultiplikation, dem Berechnen der Umkehrabbildung entspricht
das Invertieren von Matrizen.
§10. Lineare Funktionen und Vierpole
In diesem Abschnitt wenden wir die Überlegungen von §9 auf eine Fragestellung der Elektrotechnik an.
Unter einem Vierpol versteht man ein elektrisches Schaltelement mit je zwei
Anschlüssen am Eingang und am Ausgang.
I
I
-1
-2
U1 ?
U
?2
Ein Vierpol wird mathematisch durch die Vierpolfunktion
R 2×1
R 2×1
(
) −→ (
)
U1
U2
7−→
I1
I2
modelliert, die dem Zahlenpaar (U1 , I1 ):=(Spannung am Eingang in Volt,
Stromstärke am Eingang in Ampère) das Zahlenpaar (U2 , I2 ):=(Spannung
am Ausgang in Volt, Stromstärke am Ausgang in Ampère) zuordnet. Wenn
diese Funktion linear ist (das bedeutet unter anderem, dass sich Ausgangsspannung und Ausgangsstrom verdoppeln, wenn man Eingangsspannung
und Eingangsstrom verdoppelt), können wir sie durch eine Matrix
96
4. VEKTORRECHNUNG UND GEOMETRIE
K ∈ R 2×2 , wir nennen sie Kettenmatrix, beschreiben:
( )
( )
U1
U2
=K·
.
I2
I1
Wir betrachten zwei einfache Vierpole:
1. Sei
I
-1
R
U1 ?
I
-2
U
?2
ein Vierpol mit einem Widerstand von R Ohm, der in Serie geschaltet ist. Dann ist die dazugehörige Funktion
f: (
R 2×1
R 2×1
(
)( )
) −→ (
)
1 −R
U1
U2
U1
=
7−→
0 1
I1
I2
I1
(
)
1 −R
Die Kettenmatrix dieses Vierpols ist KS :=
.
0 1
linear.
2. Sei
I
I
-1
U1 ?
-2
R
U
?2
ein Vierpol mit einem Widerstand von R Ohm, der parallel geschaltet ist. Dann ist die dazugehörige Funktion
g: (
R 2×1
R 2×1
) −→ (
)
(
)( )
1 0
U1
U2
U1
7−→
=
1
I1
I2
I1
−R 1
)
1 0
Die Kettenmatrix dieses Vierpols ist KP :=
.
− R1 1
linear.
(
Werden Vierpole mit den Vierpolfunktionen h und k und Kettenmatrizen L und M hintereinandergeschaltet (die Eingangsspannung bzw. die
Eingangsstromstärke des zweiten Vierpols ist die Ausgangsspannung bzw.
Ausgangsstromstärke des ersten), dann erhält man wieder einen Vierpol,
seine Vierpolfunktion ist die Hintereinanderausführung k ◦ h der Funktionen h und k. Die Kettenmatrix des neuen Vierpols ist daher das Produkt
M · L der Kettenmatrizen M und L.
97
4. VEKTORRECHNUNG UND GEOMETRIE
Wie erhält man nun die Vierpolfunktion des folgenden Vierpols?
I
-1
U1 ?
I
-2
R
R
U
R
?2
R
Dieser Vierpol entsteht durch Hinereinanderschaltung von vier Vierpolen, deren Vierpolfunktionen wir bereits kennen:
I
I
-1
U
?1
-2
R
U
?2
R
I
-5
-4
U
?3
I
I
-3
U
R
?4
R
U
?5
Die Vierpolfunktion davon ist g ◦ f ◦ f ◦ g ( f und g wie oben), die entsprechende Kettenmatrix ist daher
(
)
3 −2R
KP · KS · KS · KP =
.
− R4
3
98
4. VEKTORRECHNUNG UND GEOMETRIE
§11. Fragen
1. Affine Unterräume
Sei A ∈ K m×n . Welche der folgenden Aussagen sind wahr?
(a) rg(A) + dim(L(A, 0)) = Anzahl der Spalten von A.
(b) L(A, 0) ist ein Untervektorraum.
(c) L(A, 0) ist ein affiner Unterraum.
2. Sei A ∈ K m×n und b eine Linearkombination der Spalten von A. Welche der folgenden Aussagen sind wahr?
(a) dim(L(A, b)) = n − rg(A)
(b) L(A, b) ist ein Untervektorraum.
(c) L(A, b) ist ein affiner Unterraum.
3. Welche der folgenden Funktionen sind linear?
(a)
Q 2×1 −→ Q 2×1
( )
(
)
x
x+y
7−→
y
3x − 4y
(b)
Q 2×1 −→ Q 2×1
( )
(
)
x
3x + 2y − 2
7−→
y
x+4
(c)
Q 2×1 −→ Q 2×1
( )
( 2
)
x
x + 2y
7−→
y
xy
In den folgenden drei Beispielen sind die lineare Funktion
f : Q 2 −→ Q 2
(x, y) 7−→ (−2x + 3y, x − y),
eine Basis des Definitionsbereichs v und eine Basis des Bildbereichs
w gegeben.
4. Sei v = ((1, −1), (1, 1)) und w = ((1, 0), (0, 1)). Welche der folgenden Matrizen
ist die
(
) Matrix von f bezüglich der Basen v und w?
−2 3
(a)
1 −1
(
)
−5 1
(b)
2 0
99
(
4. VEKTORRECHNUNG UND GEOMETRIE
7 −10
(c)
−3 4
(
)
1 −2
(d)
0 − 12
)
5. Sei v = ((1, 0), (0, 1)) und w = ((1, 0), (0, 1)). Welche der folgenden
Matrizen
) von f bezüglich der Basen v und w?
( ist die Matrix
−2 3
(a)
1 −1
)
(
−5 1
(b)
2 0
(
)
7 −10
(c)
−3 4
)
(
1 −2
(d)
0 − 12
6. Sei v = ((1, 0), (0, 1)) und w = ((−2, 1), (2, −2)). Welche der folgenden Matrizen
ist die
(
) Matrix von f bezüglich der Basen v und w?
−2 3
(a)
1 −1
(
)
−5 1
(b)
2 0
(
)
7 −10
(c)
−3 4
(
)
1 −2
(d)
0 − 12
7. Seien K ein Körper, V,W Vektorräume über K, f eine lineare Funktion von V nach W und v bzw. w eine Basis von V bzw. W . Der Eintrag
in der i-ten Zeile und j-ten Spalte der Matrix von f bezüglich v und
w ist
(a) die Koordinate bei w j von f (vi )
(b) die Koordinate bei f (vi ) von w j
(c) die Koordinate bei wi von f (v j )
(d) die i-te Komponente des Bildes unter f des j-ten Standardbasisvektors.
8. Sei f , g lineare Funktionen von V nach V , v eine Basis von V und A
bzw. B die Matrix von f bzw. g bezüglich v.
Welche der folgenden Aussagen sind wahr?
(a) Die Matrix von f ◦ g bezüglich v ist B · A.
(b) Wenn f und g invertierbar sind, dann ist die Matrix von
( f ◦ g)−1 bezüglich v gleich B−1 · A−1 .
KAPITEL 5
Determinanten, Eigenwerte und Polynome
In diesem Kapitel sei K ein Körper und n eine positive ganze Zahl.
§1. Determinanten
Definition 191 : Für eine Matrix A ∈ K n×n heißt
det(A) :=
∑
σ ∈Sn
sign(σ )Aσ (1)1 Aσ (2)2 . . . Aσ (n)n ∈ K
die Determinante von A.
Beispiel 192 : Im Fall n = 1 ist Sn = {Id1 } und det(A) = A11 .
Im Fall n = 2 ist Sn = {Id2 , (1, 2)} und
(
)
A11 A12
det
= A11 A22 − A12 A21 .
A21 A22
Im Fall n = 3 ist Sn = {Id3 , (1, 2, 3), (1, 3, 2), (1, 3), (2, 3), (1, 2)} und


A11 A12 A13
det A21 A22 A23  = A11 A22 A33 + A21 A32 A13 + A31 A12 A23 −
A31 A32 A33
− A31 A22 A13 − A11 A32 A23 − A21 A12 A33 .
Für n ≥ 4 hat Sn mindestens 4! = 24 Elemente und die Berechnung
der Determinante nach Definition ist zu aufwändig. Wir suchen daher ein
Verfahren, mit dem man die Determinante schnell“ berechnen kann.
”
Definition 193 : Seien m eine positive ganze Zahl und A ∈ K m×n . Dann
heißt
AT := (A ji )1≤i≤m ∈ K n×m
1≤ j≤n
die transponierte Matrix von A.
Beispiel 194 :

T 

A11 A21 A31
A11 A12 A13
A21 A22 A23  = A12 A22 A32 
A13 A23 A33
A31 A32 A33
100
101
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
( )
3
(3 2) =
2
T
Satz 195 : Für A ∈ K n×n ist
det(AT ) = det(A) ,
d.h. Transponieren ändert die Determinante nicht.
Beweis: Nach Definition ist
det(AT ) =
∑
∑
sign(σ ) ∏ Aσ −1 (i)i ,
σ ∈Sn
=
n
sign(σ ) ∏ (AT )σ ( j) j =
σ ∈Sn
j=1
n
∑
σ ∈Sn
n
sign(σ ) ∏ A jσ ( j)
j=1
i=1
wobei im Produkt i := σ ( j) gesetzt und umgeordnet wurde. Da die Funktion Sn → Sn , σ 7→ σ −1 , bijektiv ist, kann man τ := σ −1 setzen und erhält
wegen sign(σ ) = sign(σ −1 )
det(AT ) =
∑
τ ∈Sn
n
sign(τ ) ∏ Aτ (i)i = det(A) .
i=1
Definition 196 : Sei A ∈ K n×n .
(1) A hat obere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i > j
ist. Dann hat A die Gestalt


∗ ∗ ... ∗
0 ∗
∗
. .

 .. . . . . . ...  ,
0 ...
0
∗
wobei ∗ für beliebige Elemente von K steht.
(2) A hat untere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i < j
ist. Dann hat A die Gestalt


∗ 0 ... 0
.
.

∗ ∗ . . .. 
.
.
... 
 ..
0
∗ ∗ ... ∗
(3) A ist eine Dreiecksmatrix, wenn A obere oder untere Dreiecksform
hat.
102
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
(4) A st eine Diagonalmatrix, wenn Ai j = 0 für alle Indizes i, j mit i ̸= j
ist. Dann hat A hat die Gestalt


∗ 0 ... 0
. . .. 

. .
0 ∗
.
. .
.
 .. . . . . 0
0 ... 0 ∗
Beispiel 197 : Jede quadratische Matrix in Stufenform hat obere Dreiecksform. Daher kann jede quadratische Matrix durch elementare Umformungen in obere Dreiecksform übergeführt werden.
Satz 198 : Sei σ ∈ Sn mit σ ̸= Idn . Dann gibt es eine Zahl
k ∈ {1, 2, . . . , n} mit σ (k) > k.
Beweis: Wenn es keine derartige Zahl k gibt, dann ist σ (i) ≤ i für alle
i ∈ {1, 2, . . . , n}, insbesondere σ (1) = 1, σ (2) = 2 usw., also σ = Idn im
Widerspruch zur Voraussetzung.
Satz 199 : Die Determinante einer Dreiecksmatrix A ∈ K n×n ist das Produkt ihrer Diagonalelemente, also
det(A) = A11 A22 . . . Ann .
Insbesondere ist
det(In ) = 1 .
Beweis: Sei A eine obere Dreiecksmatrix. Nach Satz 198 gibt zu jeder Permutation σ ∈ Sn , σ ̸= Idn , eine Zahl k ∈ {1, 2, . . . , n} mit σ (k) > k, also
Aσ (k)k = 0. Daher verschwinden in
det(A) =
∑
σ ∈Sn
n
sign(σ ) ∏ Aσ ( j) j
j=1
alle Summanden bis auf den Summanden zur Identität
A11 A22 . . . Ann .
Wenn B eine untere Dreiecksmatrix ist, dann ist BT eine obere Dreiecksmatrix und nach Satz 195 gilt
det(B) = det(BT ) = (BT )11 . . . (BT )nn = B11 . . . Bnn .
Satz 200 : Für τ ∈ Sn und A ∈ K n×n sei τ · A die durch
(τ · A)i j := Aiτ ( j) , 1 ≤ i, j ≤ n ,
103
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
definierte Matrix in K n×n . ( Die Matrix τ · A erhält man aus A, indem man
”
die Spalten von A mit τ −1 permutiert“.) Dann ist
det(τ · A) = sign(τ ) · det(A) .
Beweis: Es ist
det(τ · A) =
∑
σ ∈Sn
sign(σ )Aσ (1)τ (1) Aσ (2)τ (2) . . . Aσ (n)τ (n) .
Wir setzen ρ := σ τ −1 , dann ist σ = ρτ und nach Satz 125
sign(ρτ ) = sign(ρ ) sign(τ ). Daher ist
∑
σ ∈Sn
sign(σ )Aσ (1)τ (1) Aσ (2)τ (2) . . . Aσ (n)τ (n) =
= sign(τ )
∑
ρ ∈Sn
∑
ρ ∈Sn
n
sign(ρτ ) ∏ Aρ (τ (i))τ (i) =
i=1
n
sign(ρ ) ∏ Aρ ( j) j = sign(τ ) · det(A) .
j=1
Satz 201 : Wenn zwei Zeilen oder zwei Spalten einer Matrix gleich sind,
dann ist ihre Determinante gleich 0.
Beweis: Nach Satz 195 genügt es, die Aussage für Spalten zu beweisen.
Sei A ∈ K n×n eine Matrix und 1 ≤ i, j ≤ n so, dass i ̸= j und A−i = A− j ist.
Sei τ := (i, j) ∈ Sn die Vertauschung von i und j. Nach Satz 125 und
Satz 124 ist die Funktion
{ρ ∈ Sn | sign(ρ ) = 1} → {σ ∈ Sn | sign(σ ) = −1} , ρ 7→ ρτ ,
wohldefiniert und bijektiv, ihre Umkehrfunktion ist
{σ ∈ Sn | sign(σ ) = −1} → {ρ ∈ Sn | sign(ρ ) = 1} , σ 7→ σ τ .
Daher ist
∑
det(A) =
σ ∈Sn ,sign(σ )=1
∑
+
σ ∈Sn ,sign(σ )=1
=
∑
sign(σ )Aσ (1)1 Aσ (2)2 . . . Aσ (n)n +
sign(σ τ )Aσ (τ (1))1 Aσ (τ (2))2 . . . Aσ (τ (n))n =
(sign(σ )Aσ (1)1 Aσ (2)2 . . . Aσ (n)n −
σ ∈Sn ,sign(σ )=1
− sign(σ )Aσ (τ (1))1 Aσ (τ (2))2 . . . Aσ (τ (n))n ) = 0 ,
weil nach Voraussetzung Aσ (τ (1))1 . . . Aσ (τ (n))n = Aσ (1)1 . . . Aσ (n)n ist.
104
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Satz 202 : Seien A und B Matrizen in K n×n .
(1) det(A · B) = det(A) · det(B) = det(B · A) .
(2) Eine Matrix A ∈ K n×n ist genau dann invertierbar, wenn ihre Determinante nicht 0 ist. In diesem Fall ist
det(A−1 ) = det(A)−1 .
Beweis:
(1) Es ist
det(AB) =
∑
σ ∈Sn
=
∑
σ ∈Sn
n
=
∑
∑(∑
kn =1 σ ∈Sn
k1 =1
n
n
k1 =1
kn =1
sign(σ )( ∑ Aσ (1)k1 Bk1 1 ) . . . ( ∑ Aσ (n)kn Bkn n ) =
n
...
sign(σ )(AB)σ (1)1 (AB)σ (2)2 . . . (AB)σ (n)n =
sign(σ )Aσ (1)k1 Aσ (2)k2 . . . Aσ (n)kn )Bk1 1 Bk2 2 . . . Bkn n .
Seien 1 ≤ k1 , . . . , kn ≤ n und
τ : {1, . . . , n} −→ {1, . . . , n} , i 7−→ ki .
Es ist
∑
σ ∈Sn
sign(σ )Aσ (1)k1 Aσ (2)k2 . . . Aσ (n)kn
die Determinante der Matrix, deren i-te Spalte die ki -te Spalte von A
ist, 1 ≤ i ≤ n. Wir bezeichnen diese Matrix mit A(k1 , . . . , kn ).
Seien 1 ≤ k1 , . . . , kn ≤ n und
τ : {1, . . . , n} −→ {1, . . . , n} , i 7−→ ki .
Wenn τ bijektiv, also eine Permutation ist, dann ist
det(A(k1 , . . . , kn )) =
∑
σ ∈Sn
sign(σ )Aσ (1)τ (1) . . . Aσ (n)τ (n) = det(τ · A) ,
also nach Satz 200 gleich sign(τ ) · det(A). Wenn τ nicht bijektiv ist,
dann ist
det(A(k1 , . . . , kn )) = 0 (nach Satz 201).
Somit ist
n
det(AB) =
∑
k1 =1
=
n
...
∑ det(A(k1, . . . , kn))Bk11Bk22 . . . Bknn =
kn =1
∑ sign(τ ) det(A)Bτ (1)1 . . . Bτ (n)n = det(A) · det(B) .
τ ∈Sn
105
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
(2) Wenn die Matrix A invertierbar ist, dann gibt es eine Matrix
A−1 ∈ K n×n mit A · A−1 = In . Nach (1) ist dann
det(A) · det(A−1 ) = det(In ) = 1 ,
also kann die Zahl det(A) nicht 0 sein und det(A−1 ) = det(A)−1 .
Wenn die Matrix A nicht invertierbar ist, dann gibt es nach Satz 88
eine invertierbare Matrix P so, dass die letzte Zeile von P · A die
Nullzeile ist. Aus der Definition der Determinante folgt, dass dann
det(P · A) = 0 ist. Da det(P) nicht 0 ist, folgt aus (1), dass det(A) = 0
ist.
Da man Determinanten von Dreiecksmatrizen leicht ausrechnen kann,
liegt die Frage nahe, wie sich die Determinante bei elementaren Zeilenumformungen der Matrix ändert.
Satz 203 : Sei A ∈ K n×n .
(1) Sei B die Matrix, die man erhält, indem man eine Zeile von A mit
einem Element c ∈ K multipliziert. Dann ist det(B) = c · det(A).
Insbesondere ist det(c · A) = cn · det(A).
(2) Sei B die Matrix, die man erhält, indem man zwei Zeilen von A vertauscht. Dann ist det(B) = − det(A).
(3) Sei B die Matrix, die man erhält, indem man ein skalares Vielfaches
einer Zeile von A zu einer anderen Zeile von A addiert. Dann ist
det(B) = det(A).
(4) Die Aussagen (1) - (3) gelten analog für Spalten statt Zeilen.
(5) Die Determinante von A kann wie folgt berechnet werden: Forme A
durch elementare Zeilenumformungen (oder Spaltenumformungen)
vom Typ 1 (Addition eines Vielfachen einer Zeile zu einer anderen)
und vom Typ 2 (Vertauschung zweier Zeilen) in eine Matrix B in Dreiecksform um. Sei k die Zahl der ausgeführten Zeilenvertauschungen.
Dann ist
det(A) = (−1)k B11 B22 . . . Bnn .
Beweis:
(1) folgt direkt aus der Definition.
(2) ist ein Spezialfall von Satz 200.
(3) Die Matrix B ist das Produkt von A mit einer Elementarmatrix vom
Typ 1. Diese ist eine Dreiecksmatrix, deren Determinante 1 ist. Die
Behauptung folgt daher aus Satz 202.
(4) folgt aus Satz 195.
(5) folgt aus (2) und (3).
106
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
§2. Orientierung
Definition 204 : Es sei M eine Menge und R eine Teilmenge von M × M.
Dann heißt R Äquivalenzrelation auf M, wenn die folgenden drei Bedingungen erfüllt sind:
(1) Für alle m ∈ M ist (m, m) ∈ R ( R ist reflexiv“).
”
(2) Wenn (m, n) ∈ R ist, dann ist auch (n, m) ∈ R ( R ist symmetrisch“).
”
(3) Wenn (ℓ, m) ∈ R und (m, n) ∈ R ist, dann ist auch (ℓ, n) ∈ R
( R ist transitiv“).
”
Die Elemente m, n sind (bezüglich R) äquivalent , wenn (m, n) ∈ R ist
(Schreibweise: m ∼ n).
Die Äquivalenzklasse von m ∈ M ist die Menge
{n ∈ M | m ∼ n} .
Statt Element einer Äquivalenzklasse“ sagt man oft Repräsentant einer
”
”
Äquivalenzklasse“.
Satz 205 : Es sei M eine Menge und R eine Äquivalenzrelation auf M. Je
zwei Äquivalenzklassen sind disjunkt und die Vereinigung aller Äquivalenzklassen von R ist M.
Beweis: Übung.
Beispiel 206 : Die Menge
R := {((a, b), (c, d)) | a, b, c, d ∈ Z , b ̸= 0, d ̸= 0, ad = bc}
ist eine Äquivalenzrelation auf Z × Z \ {0}. Die Äquivalenzklasse von
(x, y) ∈ Z × Z \ {0} ist die rationale Zahl xy .
Definition 207 : Es seien V ein reeller Vektorraum und (v1 , . . . , vn ) sowie
(w1 , . . . , wn ) Basen von V . Die Matrix T ∈ K n×n , deren Spalten T−1 , . . . , T−n
die Koordinatenspalten von w1 , . . . , wn bezüglich der Basis (v1 , . . . , vn ) sind,
heißt Transformationsmatrix von (v1 , . . . , vn ) nach (w1 , . . . , wn ). Die Basen
(v1 , . . . , vn ) und (w1 , . . . , wn ) heißen gleich orientiert, wenn det(T ) > 0 ist,
und verschieden orientiert, wenn det(T ) < 0 ist. Durch
(v1 , . . . , vn ) ∼ (w1 , . . . , wn ) genau dann, wenn
(v1 , . . . , vn ) und (w1 , . . . , wn ) gleich orientiert sind
wird auf der Menge aller Basen von V eine Äquivalenzrelation definiert. Die
zwei Äquivalenzklassen bezüglich dieser Relation heißen Orientierungen
von V . Durch die Wahl einer Basis von V wird eine Orientierung (die Äquivalenzklasse dieser Basis) festgelegt. V zusammen mit einer Orientierung
107
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
heißt orientierter Vektorraum. Die Basen in der gegebenen Orientierung
heißen dann positiv orientiert, die anderen negativ orientiert.
Wird die Zeichenebene bzw. der physikalische Raum als reeller Vektorraum betrachtet, dann nennt man seine zwei Orientierungen Orientie”
rung im Uhrzeigersinn“ und Orientierung gegen den Uhrzeigersinn“ bzw.
”
Orientierung nach der Linken-Hand-Regel“ und Orientierung nach der
”
”
Rechten-Hand-Regel“.
Beispiel 208 : Die Standardbasis (e1 , . . . , en−1 , en ) von R n und die Basis
(e1 , . . . , en−1 , −en ) sind verschieden orientiert. Jede Basis von R n ist also
gleich orientiert wie genau eine dieser zwei Basen.
§3. Volumen und Vektorprodukt
Sei V mit ⟨−, −⟩ ein n-dimensionaler euklidischer Raum.
Definition 209 : Seien w1 , . . . , wn ∈ V . Die Menge
P(w1 , . . . , wn ) := {c1 w1 + . . . + cn wn | 0 ≤ ci ≤ 1, ci ∈ R }
heißt das von w1 , . . . , wn erzeugte Parallelotop. Wenn n = 2 ist, dann heißt
ein Parallelotop Parallelogramm. Es sei (v1 , . . . , vn ) eine ON-Basis von V
und S ∈ R n×n die Matrix, deren i-te Spalte die Koordinatenspalte von wi ∈
V bezüglich (v1 , . . . , vn ) ist, 1 ≤ i ≤ n. Die Zahl
vol(P(w1 , . . . , wn )) := | det(S)|
heißt das Volumen von P(w1 , . . . , wn ).
w2 + w3
w1 + w2 + w3
w2
w3
w1 + w2
w1 + w3
O
w1
A BBILDUNG 1. Parallelotop P(w1 , w2 , w3 )
108
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Satz 210 : Es seien (v1 , . . . , vn ) eine ON-Basis von V und w1 , . . . , wn Vektoren in V . Dann ist
√
vol(P(w1 , . . . , wn )) = det((⟨wi , w j ⟩)1≤i, j≤n ) .
Insbesondere: Das Volumen eines Parallelotops hängt nicht von der Wahl
der ON-Basis (v1 , . . . , vn ) ab. Wenn (w1 , . . . , wn ) eine ON-Basis von V ist,
dann ist vol(P(w1 , . . . , wn )) = 1.
Beweis: Sei S die Matrix, deren Spalten die Koordinatenspalten von
w1 , . . . , wn bezüglich (v1 , . . . , vn ) sind. Für 1 ≤ i, j ≤ n gilt nach Satz 164
⟨wi , w j ⟩ = ⟨S−i , S− j ⟩ = (ST · S)i j .
Daher ist
det((⟨wi , w j ⟩)1≤i, j≤n ) = det(ST · S) = det(S)2 = vol(P(w1 , . . . , wn ))2 .
Satz 211 : Es seien u, w ∈ V, u ̸= 0, w ̸= 0 und α der Winkel zwischen u
und w. Dann ist
vol(P(u, w)) = ∥u∥ · ∥w∥ · sin(α ) .
Beweis: Nach Satz 210 ist
(
)
⟨u, u⟩ ⟨u, w⟩
2
vol(P(u, w)) = det
= ∥u∥2 · ∥w∥2 − ⟨u, w⟩2 =
⟨u, w⟩ ⟨w, w⟩
= ∥u∥2 · ∥w∥2 · (1 − cos2 (α )) = (∥u∥ · ∥w∥ · sin(α ))2 .
Definition 212 : V sei ein dreidimensionaler orientierter euklidischer
Raum. Für u, w ∈ V sei u × w der eindeutig bestimmte Vektor in V mit den
drei Eigenschaften
• ∥u × w∥ = vol(P(u, w)),
• u × w und u stehen zueinander senkrecht, u × w und w stehen zueinander senkrecht,
• wenn u×w ̸= 0 ist, dann ist (u, w, u×w) eine positiv orientierte Basis
von V .
Dieser Vektor heißt das Vektorprodukt (oder Kreuzprodukt) von u und w.
Sprechweise: u Kreuz w“.
”
109
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Satz 213 : V sei ein dreidimensionaler euklidischer Raum, der durch eine
ON-Basis (v1 , v2 , v3 ) orientiert ist.
(1) v1 × v2 = v3 , v1 × v3 = −v2 , v2 × v3 = v1 .
(2) Ist (u, w) eine ON-Basis des von u und w erzeugten Untervektorraums, dann ist (u, w, u×w) eine wie (v1 , v2 , v3 ) orientierte ON-Basis
von V .
(3) Für ai , bi ∈ R , 1 ≤ i ≤ 3, ist
3
3
( ∑ ai vi ) × ( ∑ bi vi ) =
i=1
i=1
)
(
)
a1 a2
a1 a3
a2 a3
v .
v + det
v − det
= det
b1 b2 3
b1 b3 2
b2 b3 1
(4) Für u, u′ , w, w′ ∈ V, c, d ∈ R ist
(
)
(
c(u + u′ ) × w = c(u × w) + c(u′ × w) ,
u × (d(w + w′ )) = d(u × w) + d(u × w′ )
und u × w = −w × u .
(5) Für x, y, z ∈ V ist x × (y × z) = ⟨x, z⟩y − ⟨x, y⟩z .
(6) Für x, y, z ∈ V ist
(x × y) × z + (z × x) × y + (y × z) × x = 0 .
(Beachte: im Allgemeinen ist (x × y) × z ̸= x × (y × z)).
Beweis:
(1) und (2) folgen aus der Definition.
(3) Man rechnet nach, dass
(
)
(
)
(
)
a2 a3
a1 a3
a1 a2
det
v − det
v + det
v
b2 b3 1
b1 b3 2
b1 b2 3
die in der Definition von (∑3i=1 ai vi ) × (∑3i=1 bi vi ) geforderten Eigenschaften hat.
(4) Kann mit (3) nachgerechnet werden.
(5) Wenn {i, j, k} = {1, 2, 3} ist , dann ist vi × (v j × vk ) = 0. Wenn i ̸= k
bzw. i ̸= j, dann ist vi × (vi × vk ) = −vk und vi × (v j × vi ) = v j .
Sei x = ∑3i=1 ai vi , y = ∑3j=1 b j v j und z = ∑3k=1 ck vk . Dann ist
x × (y × z) = ∑i, j,k ai b j ck (vi × (v j × vk )) =
= − ∑i,k ai bi ck vk + ∑i, j ai b j ci v j = ⟨x, z⟩y − ⟨x, y⟩z .
(6) Nach (5) ist x × (y × z) + z × (x × y) + y × (z × x) =
= ⟨x, z⟩y − ⟨x, y⟩z + ⟨z, y⟩x − ⟨z, x⟩y + ⟨y, x⟩z − ⟨y, z⟩x = 0 .
110
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
§4. Eigenwerte und Eigenvektoren
Beispiel 214 : Zwei Gewichte mit Masse m hängen hintereinander an zwei
Federn mit Federkonstante k.
H
H
H
H
H
H
X
X
X
X
X
X
@
@
@
@
x1
@
@
?
x2
H
H
H
H
H
H
?
Nach den Gesetzen der Mechanik gilt für die Auslenkungen aus der Ruhelage x1 bzw. x2 des ersten bzw. zweiten Gewichts
mx1′′ + kx1 − k(x2 − x1 ) = 0
mx2′′
+ k(x2 − x1 ) = 0 ,
wobei ′′ die zweite Ableitung nach der Zeit bezeichnet. In Matrizenform
umgeschrieben erhält man
( ′′ ) (
)( )
x1
2k −k
x1
m ′′ +
= 0.
x2
−k k
x2
Wir untersuchen nun die Frage, ob es eine Schwingung der Form
x1 (t) = a1 sin(ω t)
x2 (t) = a2 sin(ω t)
gibt, wobei a1 , a2 die Amplituden sind und ω die Frequenz ist. In diesem
Fall wäre
( )
(
)( )
a1
2k −k
a1
2
+ sin(ω t)
=0
−mω sin(ω t)
a2
−k k
a2
für alle reellen Zahlen t, also
( )
(
)( )
2k −k
a1
2 a1
.
= mω
a2
−k k
a2
Daher suchen wir Spalten, die durch Multiplikation mit einer vorgegebenen
Matrix in ein skalares Vielfaches übergehen (Fortsetzung in Beispiel 222).
111
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Definition 215 : Sei A ∈ K n×n .
(1) Eine Spalte u ∈ K n×1 heißt Eigenvektor von A, wenn u ̸= 0 ist und
ein Element c ∈ K existiert mit
Au = cu .
(2) Ein Element c ∈ K heißt Eigenwert von A, wenn es eine Spalte u ∈
K n×1 gibt mit u ̸= 0 und
Au = cu .
Eine solche Spalte u heißt Eigenvektor von A zum Eigenwert c.
(3) Für einen Eigenwert c von A ist
E(A, c) := {y ∈ K n×1 | Ay = cy} = L(cIn − A, 0)
ein Untervektorraum von K n×1 , heißt der Eigenraum von A zum Eigenwert c, und besteht aus dem Nullvektor sowie allen Eigenvektoren von A zum Eigenwert c.
Definition 216 : Sei A ∈ K n×n . Eine Eigenbasis von A ist eine Basis von
K n×1 , deren Vektoren Eigenvektoren von A sind.
Beispiel 217 : Jede Spalte in K n×1 ist ein Eigenvektor der Einheitsmatrix
In zum Eigenwert 1. Jede Basis von K n×1 ist eine Eigenbasis von In .
Satz 218 : Seien A ∈ K n×n , ℓ eine positive ganze Zahl und u1 , . . . , uℓ Eigenvektoren von A zu paarweise verschiedenen Eigenwerten c1 , . . . , cℓ . Dann
ist das n-Tupel (u1 , . . . , uℓ ) linear unabhängig. Insbesondere hat A höchstens
n paarweise verschiedene Eigenwerte.
Wenn ℓ = n ist, A also n paarweise verschiedene Eigenwerte hat, dann ist
das n-Tupel (u1 , . . . , un ) von Eigenvektoren eine Eigenbasis von A.
Beweis: Wir zeigen die Behauptung durch Induktion nach ℓ . Für ℓ = 1
folgt die Behauptung aus u1 ̸= 0. Sei nun ℓ ≥ 2 und die Behauptung gelte
für ℓ − 1 Eigenvektoren. Für d1 , . . . , dℓ ∈ K mit
ℓ
0 = ∑ di ui
(1)
i=1
folgt
ℓ
ℓ
i=1
i=1
0 = A · 0 = ∑ di Aui = ∑ di ci ui .
Subtrahiert man davon das cℓ -fache von (1), so erhält man
ℓ−1
0=
∑ di(ci − cℓ)ui = 0 .
i=1
112
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Nach Induktionsannahme ist das (ℓ − 1)-Tupel (u1 , . . . , uℓ−1 ) linear unabhängig und somit di (ci − cℓ ) = 0 für i = 1, . . . , ℓ − 1. Da c1 , . . . , cℓ paarweise
verschieden sind, ist auch di = 0 für i = 1, . . . , ℓ − 1. Aus (1) folgt 0 = dℓ uℓ
und wegen uℓ ̸= 0 auch dℓ = 0.
Satz 219 : Sei A ∈ K n×n eine Matrix, die eine Eigenbasis hat. Sei T ∈ K n×n
eine Matrix, deren Spalten eine Eigenbasis von A bilden. Der Eigenwert von
T−i sei ci , 1 ≤ i ≤ n. Dann ist T −1 AT eine Diagonalmatrix und
(T −1 AT )ii = ci , 1 ≤ i ≤ n .
Beweis: Es seien ei , 1 ≤ i ≤ n, die Standardspalten in K n×1 . Für jede Matrix
B ∈ K n×n ist B · ei = B−i , 1 ≤ i ≤ n . Daher ist die i-te Spalte von T −1 AT
(T −1 AT )−i = (T −1 AT )ei = (T −1 A)Tei =
= T −1 (AT−i ) = T −1 (ci T−i ) = ci ei , 1 ≤ i ≤ n.
Beispiel 220 : Satz 219 kann zum Berechnen von großen Potenzen“ von
”
Matrizen A, die eine Eigenbasis haben, benutzt werden. Es ist nämlich
(T −1 AT )k = (T −1 AT )(T −1 AT ) . . . (T −1 AT ) = T −1 Ak T ,
daher
Ak = T (T −1 AT )k T −1 .
Der Aufwand für die Berechnung der k-ten Potenz der Diagonalmatrix
T −1 AT ist im allgemeinen wesentlich geringer als der für die Berechnung
von Ak .
§5. Berechnung von Eigenwerten
Satz 221 : Sei A ∈ K n×n . Dann ist c ∈ K genau dann ein Eigenwert von A,
wenn
det(cIn − A) = 0
ist. Die Funktion
χA : K → K , z 7→ det(zIn − A) ,
ist eine Polynomfunktion und heißt das charakteristische Polynom von A.
( Die Eigenwerte einer Matrix sind die Nullstellen ihres charakteristischen
”
Polynoms.“)
Beweis: Es ist c genau dann ein Eigenwert von A, wenn ein Vektor u ∈
K n×1 mit u ̸= 0 existiert, sodass Au = cu ist. Dies ist äquivalent dazu, dass
das durch cIn − A gegebene homogene System linearer Gleichungen eine
nicht-triviale Lösung hat. Das ist genau dann der Fall, wenn die Matrix
113
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
cIn − A nicht invertierbar ist. Nach Satz 202 ist diese Matrix genau dann
nicht invertierbar, wenn det(cIn − A) = 0 ist.
Satz 221 legt folgendes Verfahren nahe, die Eigenwerte und Eigenvektoren einer Matrix A ∈ K n×n zu berechnen:
(1) Finde alle c ∈ K mit det(cIn − A) = 0 ( Berechne alle Nullstellen des
”
charakteristischen Polynoms von A“).
(2) Bestimme für jeden Eigenwert c den Eigenraum E(A, c) durch Lösen
des homogenen Systems linearer Gleichungen (cIn − A, 0).
Beispiel 222 : Wir lösen nun das Eigenwertproblem aus Beispiel 214. Hier
ist
(
)
2k −k
A=
.
−k k
Wegen
(
)
c − 2k
k
det(cI2 − A) = det
= c2 − 3kc + k2
k
c−k
sind die Eigenwerte von A
√
√
1
1
c1 = (3 + 5)k
und
c2 = (3 − 5)k
2
2
(siehe Satz 232). Die zugehörigen Eigenräume sind
)
(
)
(
2√
2√
bzw.
E(A, c2 ) = R
,
E(A, c1 ) = R
1+ 5
1− 5
wobei R der Körper der reellen Zahlen ist.
Beispiel 223 : Sei A ∈ K n×n eine Dreiecksmatrix. Dann ist auch die Matrix
cIn − A eine Dreiecksmatrix, und nach Satz 199 ist
χA (z) = (z − A11 ) . . . (z − Ann ) .
Daher sind die Diagonalelemente einer Matrix in Dreiecksform ihre Eigenwerte.
Zum Beispiel sind 2 und 3 die Eigenwerte der Matrix


2 4 6 8
0 3 5 7


0 0 2 9 .
0 0 0 3
114
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
§6. Polynome
Definition 224 : Eine Folge (ci )i∈ N in K ist eine endliche Folge, wenn es
nur endlich viele Indizes i mit ci ̸= 0 gibt.
Durch jede endliche Folge wird eine Polynomfunktion definiert. Im
Computer wird man daher diese Funktionen durch endliche Folgen darstellen. Allerdings können verschiedene endliche Folgen dieselbe Polynomfunktion definieren. Um den daraus entstehenden Problemen zu entgehen,
betrachten wir zunächst statt der Funktionen die endlichen Folgen. Wir definieren für sie Rechenoperationen, die den punktweisen Rechenoperationen
für Polynomfunktionen entsprechen.
Satz 225 : Die Menge P aller endlichen Folgen in K mit den Funktionen
+ : P × P −→ P ,
((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N + (di )i∈ N := (ci + di )i∈ N ,
· : P × P −→ P ,
i
((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N · (di )i∈ N := ( ∑ c j di− j )i∈ N ,
j=0
und
· : K × P −→ P , (c, (di )i∈ N ) 7−→ c · (di )i∈ N := (cdi )i∈ N ,
ist ein kommutativer Ring und ein K-Vektorraum. Er heißt Polynomring
über K. Seine Elemente heißen Polynome mit Koeffizienten in K. Das Nullelement des Polynomringes ist die Folge 0 := (0, 0, 0, . . .), das Einselement
ist die Folge 1 := (1, 0, 0, . . .).
Beweis: Übung.
Definition 226 : Es sei f = (c0 , c1 , c2 , . . .) ̸= 0 ein Polynom mit Koeffizienten in K. Der Grad von f ist der größte Index i mit ci ̸= 0 und wird mit
gr( f ) bezeichnet. Das Element ci heißt i-ter Koeffizient von f . Der Koeffizient cgr( f ) heißt Leitkoeffizient von f und wird mit lk( f ) bezeichnet. Das
Polynom f heißt normiert, wenn lk( f ) = 1 ist.
Die folgende Schreibweise ist zweckmäßig: Wir wählen irgendein Symbol,
zum Beispiel x, und schreiben
gr( f )
2
c0 + c1 x + c2 x + . . . + cgr( f ) x
gr( f )
=
∑ ci x i
i=0
statt
(c0 , c1 , c2 , . . .) .
115
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Wir sprechen dann von einem Polynom in der Variablen x mit Koeffizienten
in K. Für den Polynomring über K schreiben wir dann K[x]. Wir identifizieren Polynome vom Grad 0 mit ihrem nullten Koeffizienten und fassen K so
als Teilmenge von K[x] auf.
Statt Polynom mit Koeffizienten in K“ schreiben wir im weiteren nur Po”
”
lynom“.
Satz 227 : Es seien f ̸= 0, g ̸= 0 Polynome.
(1)
(2)
(3)
(4)
f g ̸= 0
gr( f g) = gr( f ) + gr(g) und lk( f g) = lk( f ) · lk(g)
Wenn f + g ̸= 0 ist, dann ist gr( f + g) ≤ max(gr( f ), gr(g)) .
Das Polynom f ist genau dann invertierbar, wenn gr( f ) = 0 ist.
Beweis: Übung .
Satz 228 : (Division mit Rest von Polynomen)
Es seien f und g Polynome und g ̸= 0. Dann gibt es eindeutig bestimmte
Polynome m und r mit den Eigenschaften
f = m·g+r
und
(r = 0 oder gr(r) < gr(g))
.
Die Polynome m bzw. r heißen polynomialer Quotient von f und g bzw.
Rest von f nach Division durch g. Die Polynome m und r können mit dem
folgenden Verfahren (Divisionsalgorithmus) berechnet werden:
• Setze m := 0 und r := f .
• Solange gr(r) ≥ gr(g) ist, ersetze m durch
m + lk(r) · lk(g)−1 xgr(r)−gr(g)
und r durch
r − lk(r) · lk(g)−1 xgr(r)−gr(g) g .
Beweis: Übung (analog dem Beweis des Satzes über die Division mit Rest
von ganzen Zahlen).
Aus diesem Satz folgt, dass der Polynomring über einem Körper und der
Ring der ganzen Zahlen algebraisch betrachtet“ einander sehr ähnlich
”
sind.
116
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
§7. Nullstellen von Polynomen
Definition 229 : Sei f = ∑ni=0 ci xi ∈ K[x] und a ∈ K. Dann ist
n
f (a) := ∑ ci ai ∈ K .
i=0
Sprechweise: f (a) ∈ K erhält man durch Einsetzen von a in f . Das Element a ist genau dann eine Nullstelle von f in K, wenn f (a) = 0 ist. Die
Polynomfunktion
n
K −→ K , a 7−→ f (a) = ∑ ci ai ,
i=0
heißt die durch f definierte Polynomfunktion und wird oft wieder mit f
bezeichnet.
Definition 230 : Es seien f,g Polynome mit g ̸= 0. Dann ist f Teiler von
g (oder: f teilt g), wenn es ein Polynom h ∈ K[x] gibt mit g = f h. Das
Polynom g heißt Vielfaches von f , wenn f ein Teiler von g ist.
Satz 231 :
(1) Ein Element a ∈ K ist genau dann Nullstelle eine Polynoms f ∈ K[x],
wenn das Polynom x − a ein Teiler von f ist.
(2) Jedes von Null verschiedene Polynom f ∈ K[x] hat in K
höchstens gr( f ) Nullstellen.
(3) Es seien f und g Polynome mit f ̸= g. Dann haben die Graphen (in
K × K) der durch f und g definierten Polynomfunktionen höchstens
max(gr( f ), gr(g)) gemeinsame Elemente.
(4) Wenn K unendlich viele Elemente enthält, dann sind die Koeffizienten
einer Polynomfunktion von K nach K eindeutig bestimmt. Insbesondere müssen in diesem Fall Polynome und Polynomfunktionen nicht
unterschieden werden.
Beweis:
(1) Division mit Rest von f durch x − a ergibt f = m · (x − a) + r, wobei
r = 0 oder gr(r) = 0, also r ∈ K ist. Daher ist
f (a) = m(a) · 0 + r = r ,
somit ist f (a) = 0 genau dann, wenn r = 0 ist.
(2) Wir beweisen die Aussage durch Induktion über n := gr( f ).
Wenn n = 0 ist, dann hat f wegen f ̸= 0 keine Nullstellen.
Sei n > 0 und sei a ∈ K eine Nullstelle von f . Nach (1) gibt es ein
Polynom h ∈ K[x] mit f = (x − a) · h. Dann ist gr(h) = n − 1, nach
117
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Induktionsvoraussetzung hat h daher höchstens n − 1 Nullstellen. Jede Nullstelle von (x − a) · h ist eine Nullstelle von h oder gleich a.
Daraus folgt die Behauptung.
(3) Die Menge der gemeinsamen Elemente der Graphen der durch f und
g definierten Funktionen ist
{(a, f (a))| f (a) = g(a)} ,
ihre Anzahl ist daher die Anzahl der Nullstellen von f − g. Nach (2)
ist diese höchstens max(gr( f ), gr(g)).
(4) Es seien f , g zwei Polynome so, dass für alle a ∈ K gilt: f (a) = g(a).
Da K unendlich ist, hat dann f − g beliebig viele Nullstellen. Nach
(2) ist daher f = g.
Satz 232 : Seien p, q ∈ K und f := x2 + px + q ∈ K[x]. Wir nehmen an, dass
in K gilt: 2 := 1K + 1K ̸= 0. (Insbesondere ist K nicht der Körper Z 2 ).
Das Polynom f hat genau dann eine Nullstelle in K, wenn es in K ein
Element z mit
z2 = (p/2)2 − q
gibt. In diesem Fall sind
−(p/2) + z
und
− (p/2) − z
die Nullstellen von f .
Beweis: Es ist
x2 + px + q = (x + p/2)2 − (p/2)2 + q .
Für y ∈ K ist daher f (y) = 0 genau dann, wenn
(y + p/2)2 = (p/2)2 − q
ist. Wenn z ∈ K eine Nullstelle von
x2 − ((p/2)2 − q)
ist, dann auch −z. Mehr als zwei Nullstellen kann dieses Polynom nach
Satz 231 nicht haben. Wenn ein solches Element z existiert, dann muss y =
−(p/2) + z oder y = −(p/2) − z sein.
§8. Komplexe Zahlen
Definition 233 : Ein Körper K ist genau dann algebraisch abgeschlossen,
wenn jedes Polynom positiven Grades in K[x] (mindestens) eine Nullstelle
in K hat.
118
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Beispiel 234 : Die Körper Q und R sind nicht algebraisch abgeschlossen
(x2 + 1 ∈ Q [x] ⊆ R [x] hat keine Nullstelle in R ). Wenn K algebraisch abgeschlossen ist, dann hat jede Matrix in K n×n mindestens einen Eigenwert
in K.
Manche Eigenschaften von Polynomen sind besonders einfach zu beschreiben, wenn der Koeffizientenkörper algebraisch abgeschlossen ist:
Satz 235 : Seien K ein algebraisch abgeschlossener Körper, f ∈ K[x] ein
Polynom mit positivem Grad und z1 , . . . , zn die Nullstellen von f in K. Dann
gibt es eindeutig bestimmte positive ganze Zahlen d1 , . . . , dn so, dass
n
f = lk( f ) ∏(x − zi )di
i=1
ist.
Beweis: Wenn K algebraisch abgeschlossen ist, hat jedes Polynom in K[x]
mit positivem Grad in K eine Nullstelle. Wenn z eine Nullstelle von f ist,
dann wird f von x − z geteilt. Daher muss f = lk( f )(x − z)g sein, wobei g
ein normiertes Polynom vom Grad gr( f ) − 1 ist. Also kann die Behauptung
durch Induktion über gr( f ) bewiesen werden.
Zum Abschluss lernen wir einen algebraisch abgeschlossenen Körper
kennen: den Körper der komplexen Zahlen. Der Beweis dafür, dass er algebraisch abgeschlossen ist, wird in der Analysis geführt (weil dabei Eigenschaften der reellen Zahlen verwendet werden).
Satz 236 : Sei R der Körper der reellen Zahlen. Die Menge R × R mit
der Addition
(a1 , a2 ) + (b1 , b2 ) := (a1 + b1 , a2 + b2 )
und der Multiplikation
(a1 , a2 ) · (b1 , b2 ) := (a1 b1 − a2 b2 , a1 b2 + a2 b1 )
ist ein Körper mit Nullelement (0, 0) und Einselement (1, 0).
Dieser Körper heißt Körper der komplexen Zahlen und wird mit C bezeichnet.
Das zu (a1 , a2 ) ∈ C \ {(0, 0)} inverse Element ist
a1
−a2
(a1 , a2 )−1 = ( 2
, 2
).
2
a1 + a2 a1 + a22
Es ist (0, 1)2 = (−1, 0) = −(1, 0), also sind (0, 1) und (0, −1) die Nullstellen von x2 + 1 in C .
119
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
Beweis: Übung.
Definition 237 : Für z := (a1 , a2 ) ∈ C wird a1 + a2 i ∈ C geschrieben,
Re(z) := a1 bzw. Im(z) := a2 heißt Realteil bzw. Imaginärteil von z .
Statt 0 + a2 i bzw. a1 + 0i schreibt man einfach a2 i bzw. a1 . Die komplexe
Zahl a1 + a2 i := a1 − a2 i heißt die zu a1 + a2 i konjugierte komplexe Zahl.
Üblicherweise identifiziert man eine reelle Zahl a mit der komplexen Zahl
(a, 0) = a + 0i, weil hier reelle und komplexe Addition bzw. Multiplikation
übereinstimmen:
(a1 , 0) + (b1 , 0) = (a1 + b1 , 0) und
(a1 , 0) · (b1 , 0) = (a1 · b1 , 0).
Daher kann R als Teilmenge von C aufgefasst werden.
Für jede komplexe Zahl z ist
z · z = Re(z)2 + Im(z)2
eine (nicht negative) reelle Zahl. Daher ist
z−1 = (Re(z)2 + Im(z)2 )−1 z .
Beispiel 238 : Die Eigenwerte der Matrix
(
)
0 −1
∈ C 2×2
1 0
sind die Nullstellen von x2 + 1, also i und −i. Eine Eigenbasis dieser Matrix
ist
( ) ( )
1
1
(
,
).
−i
i
§9. Interpolation
In diesem Abschnitt seien t0 , . . . ,tn paarweise verschiedene Elemente
von K und y0 , . . . , yn Elemente von K. Wir suchen ein Polynom f ∈ K[x]
mit der Eigenschaft
f (ti ) = yi , 0 ≤ i ≤ n .
Ein solches Polynom heißt interpolierendes Polynom. Die Elemente
t0 , . . . ,tn heißen Stützstellen und y0 , . . . , yn Werte der Interpolationsaufgabe.
Satz 239 : (Lagrange-Interpolation) Es gibt genau ein interpolierendes Polynom vom Grad ≤ n und zwar
n
∑ yi · f i ,
i=0
120
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
wobei
1
· (x − t j ) ∈ K[x]
j̸=i ti − t j
fi := ∏
ist, 0 ≤ i ≤ n .
Beweis: Für 0 ≤ i, k ≤ n ist fi (tk ) = δik . Daher ist für 0 ≤ k ≤ n
n
n
i=0
i=0
( ∑ yi · fi )(tk ) = ∑ yi δik = yk .
Der Grad von fi ist n, also ist der Grad von ∑ni=0 yi · fi kleiner oder gleich n.
Wenn f und g interpolierende Polynome vom Grad ≤ n sind, dann sind
die Elemente t0 , . . . ,tn Nullstellen von f −g. Aus Satz 231 folgt daher f = g.
Satz 240 : (Newton-Interpolation) Das interpolierende Polynom kann wie
folgt berechnet werden:
• Setze k := 0 und h0 := y0 .
• Solange k < n ist, ersetze k durch k + 1, und setze
yk − hk−1 (tk )
ck := k−1
∏i=0 (tk − ti )
und
k−1
hk := hk−1 + ck ∏ (x − ti ) .
i=0
• Das interpolierende Polynom ist dann hn .
Beweis: Übung.
121
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
§10. Fragen
1. Die Determinante von A ∈ K n×n kann wie folgt definiert werden.
(a)
det(A) :=
∑
σ ∈Sn
sign(σ )(Aσ (1)σ (n) Aσ (2)σ (n−1) ...Aσ (n)σ (1) )
(b)
det(A) :=
∑
σ ∈Sn
sign(σ )A1σ (1) A2σ (2) ...Anσ (n)
(c)
det(A) :=
∑
σ ∈Sn
sign(σ )(Aσ (1)1 + Aσ (2)2 + ... + Aσ (n)n )
(d)
det(A) :=
∑
σ ∈Sn
sign(σ )Aσ (1)1 Aσ (2)2 ...Aσ (n)n
2. Sei A ∈ K n×n
Welche der folgende Aussagen sind wahr?
(a) det(AT ) = − det(A)
(b) Wenn A eine Dreiecksmatrix ist, dann ist
det(A) = A11 A22 ...Ann .


1 1 1
(c) Die Determinante der Matrix  2 2 2  ist Null.
1 1 3


1 0 2 4
 2 1 0 3 

3. Es sei A := 
 0 2 1 2 .
0 0 0 1
Welche der folgenden Aussagen sind wahr?
(a) det(A) = 9
(b) det(A) =
= A11 A22 A33 A44 + A12 A23 A34 A41 + A13 A24 A31 A42 + A14 A21 A32 A43 −
−A14 A23 A32 A41 − A11 A24 A33 A42 − A12 A21 A34 A43 − A13 A22 A31 A44
4. Welche der folgenden Aussagen sind für alle A ∈ K 3×3 wahr ?
Sei B die Matrix, die man aus A durch Multiplikation der ersten Zeile
von A mit 3 erhält.
(a) det(B) = det(A)3
(b) det(B) = 3 · det(A)
(c) det(B) = det(A) + 3
5. Welche der folgenden Aussagen sind für alle A ∈ K 3×3 wahr ?
122
5. DETERMINANTEN, EIGENWERTE UND POLYNOME
(a) det(3A) = 3 det(A)
(b) det(3A) = 33 det(A)
(c) det(3A) = 31 det(A)
6. Welche der folgenden Aussagen sind für alle A, B ∈ K n×n wahr ?
(a) det(A · B) = det(A) + det(B)
(b) det(A + B) = det(A) + det(B)
(c) det(A · B) = det(B) · det(A)


1 2 1
7. Sei A die Matrix  2 0 −2 .
−1 2 3
Welche der folgenden Aussagen sind wahr?
(a) Die Matrix A hat genau drei Eigenwerte, und zwar 0, 1 und 2.
(b) Die Eigenwerte erhält man, indem man die Nullstellen des charakteristischen
Polynoms von A berechnet.


1
(c)  0  ist ein Eigenvektor von A mit Eigenwert 2.
1
(d) Der Eigenraum von A zum Eigenwert 2 ist die Lösungsmenge
des
 Systems linearer
 Gleichungen
 
1 −2 −1
1
 −2 2


2
0 .
x=
1 −2 −1
1
8. Sei f := 19+27x+9x2 +x3 ∈ C [x] . Welche der folgenden Aussagen
sind wahr?
(a) Dieses Polynom hat mindestens vier Nullstellen.
(b) Eine der Nullstellen ist -1.
(c) Der Leitkoeffizient ist 19.
(d) f ist normiert.
KAPITEL 6
Antworten
§1. Mengen, Funktionen, Zahlen und Rechenregeln
1
3 4 5 6 7
a
X
b X
X
X
c X X X
d
X
1. Siehe Definition 7 und Satz 11.
2. Siehe Definition 2, Definition 4 und §4.
(a) Falsch, denn B ∩C = {}.
(b) Die Aussage 2 ∈ A ist wahr. Die Aussage 2 ̸∈ B ist falsch. Daher
ist (2 ∈ A) ∧ (2 ̸∈ B) falsch.
(c) Die Aussage C ⊆ A ist wahr. Die Aussage B ̸⊆ A ist falsch.
Daher ist (C ⊆ A) ∨ (B ̸⊆ A) wahr.
(d) Wahr, denn B ∪C = {1, 2, 3, 5, 6, 7, 9, 10} = A.
3.
2
(a) Diese Aussage ist nur dann wahr, wenn m = 1 ist. Wenn m > 1
ist, könnten zum Beispiel A1 falsch und A2 , . . . , An wahr sein.
(b) Wahr. Wenn A1 falsch ist, ist die Aussage wenn A1 wahr ist,
”
dann auch A2“ immer wahr. Siehe §4 von Kapitel 0.
(c) Wahr. Wenn nicht alle Aussagen A1 , . . . , An wahr sind, dann
muss eine der Voraussetzungen (1) oder (2) in Satz 16 falsch
sein.
4. Siehe Satz 18.
(a) Der ganzzahlige Quotient ist -2 und der Rest ist 2.
(b) Der ganzzahlige Quotient ist -3 und der Rest ist 3.
(c) Der ganzzahlige Quotient ist 3 und der Rest ist 3.
5.
(a) x = 111 und y = 11001
(b) 0, 0100 (siehe Satz 24).
(c) 0, 2800 (siehe Satz 24).
6.
(a) Wahr, siehe Definition 29.
(b) Falsch. Zum Beispiel: in ( Z , +, ·) ist 1 · 0 = 2 · 0, aber 1 ̸= 2.
Es gibt Ringe, in denen auch für c ̸= 0 Elemente a, b existieren
mit a ̸= b und a · c = b · c (siehe Kapitel 1).
123
124
6. ANTWORTEN
(c) Falsch. Siehe Definition 33.
7. Siehe Satz 43.
(a) Diese Aussage ist nur dann wahr, wenn n = 1 ist.
(b) Wahr, weil
n
∑ ai =
und
n
∑ ak
i=1
k=1
n
n
j=1
ℓ=1
∑ b j = ∑ bℓ
ist.
§2. Matrizenrechnung
1
1.
2.
2 3 4
a
X
X
b X
X
c
X
d
(a) Nur die Addition von Matrizen und die Multiplikation einer
Matrix mit einer Zahl erfolgen komponentenweise (siehe Definition 46), nicht aber die Multiplikation zweier Matrizen (siehe
Definition 50).
(b) Siehe Definition 50.
(c) Siehe Definition 50.
(a) Die Matrizenmultiplikation ist im Allgemeinen nicht kommutativ (siehe Satz 56).
(b) Siehe Satz 52.
(c) Siehe Satz 55.
3. Siehe Definition 60 und Satz 61.
4.
(a) Siehe Satz 62.
(b) Siehe Satz 32.
(c) Siehe Satz 32.
§3. Systeme linearer Gleichungen
1 2 3 4 5 6 7 8 9 10 11 12
a X
X
X
b
X
X
X
c
X X X
X
125
6. ANTWORTEN
13 14 15 16 17 18 19 20 21
a
b X
c
d
e
X
X
X
X
X
X
X
1. Siehe Definitionen 75 und 76.
2. Siehe Definition 76.
3. Siehe Definition 76.
(a) Es ist (−4, −1, −7) = 2 · (1, 1, 1) + (−3) · (2, 1, 3).
(b) Wegen 2 · (2, 1) − (4, 2) = (0, 0) sind die Vektoren (2, 1) und
(4, 2) linear abhängig.


3 5 7 8
(c) Nach Satz 91 hat das durch  0 2 −2 0  gegebene Sy2 0 1 0
stem homogener linearer Gleichungen eine nicht-triviale Lösung.


−8
5. L(A, b) = { −19 }
0
Siehe Satz 84.
4.




− 32
6. L(A, b) = { −2  + t ·  0  | t ∈ Q }
0
1
Siehe Satz 84.
1
3
7. L(A, b) = {}
Siehe Satz 84.
(
8.
(a) Falsch, denn zum Beispiel hat
1 1
1 1
)
(
·x =
2
2
)
unend-
lich viele Lösungen in Q 2×1 .
(b) Richtig, denn es gibt für ein homogenes System linearer Gleichungen immer zumindest eine Lösung, und zwar die Nullspalte.
(c) Siehe Sätze 84 und 90.
126


6. ANTWORTEN


0
1
9. L(A, b) = { 1  + t ·  0  | t ∈ Q }
2
0
Siehe Sätze 87 und 90.

−2
10. L(A, b) = { 0 }
1
Siehe Sätze 87 und 90.



− 13 23 0
11.  − 13 − 13 1 
2
− 13 0
3
Siehe Satz 88.
12. Sind P1 , ..., Pk Elementarmatrizen (P1 (P2 (...(Pk A)...))) = In ,
dann ist P1 , ...Pk die inverse Matrix von A. Aus
(P1 (P2 (...(Pk In )...))) = P1 , ...Pk = A−1
folgt die Behauptung.
13.
(a) Falsch, denn eine Menge von Pfeilen allein bildet keinen Vektorraum. Erst durch die Rechenoperationen Addition und Skalarmultiplikation wird ein Vektorraum definiert.
(b) Richtig, siehe Satz 74.
(c) Falsch. Die Aussage gilt nicht für alle Systeme linearer Gleichungen, sondern nur für homogene. Denn nur bei homogenen
Systemen linearer Gleichungen ist die Summe zweier Lösungen wieder eine Lösung und jedes Vielfache einer Lösung auch
wieder eine Lösung.
14. Siehe Satz 95.
15. (c) ist wahr. ,,Zum Anschreiben einer solchen Matrix können genau
15 Zahlen frei gewählt werden.”
16.
(a) trifft nur zu, wenn die Spalten linear unabhängig sind.
(b) Richtig, siehe Definition 101.
17. Der Rang der Matrix ist 3.
18. Der Rang der Matrix ist 2.
127
6. ANTWORTEN
19. Die Koordinaten des Vektors bezüglich der gegebenen Basis sind
(4,
berechnen,
 1, 2). Umsie zu 
 muss das durch
1 1 1
7
 1 2 2  und  10  gegebene System linearer Gleichungen
1 1 3
11
gelöst werden.
20. Satz 104 beschreibt ein Verfahren zur Auswahl einer Basis aus einem
EZS.
(a) Aus der Stufenform können Sie ablesen, welche Dimension
dieser Vektorraum hat. Sie können aber nicht daraus schließen,
dass dann die ersten d Spalten linear unabhängig und somit eine Basis sind.
(b) Falsch.
(c) Richtig.
21. Satz 104 beschreibt ein Verfahren, mit dem linear unabhängige Vektoren zu einer Basis ergänzt werden können.
(a) Falsch. Jede der Standardspalten ek+1 , ..., en könnte von den
Spalten s1 , ..., sk linear abhängig sein.
(b) Richtig.
(c) Falsch.
§4. Rechnen mit Funktionen
1 2
a X X
b
c
d
X
1.
(a) Richtig, siehe Definition 116.
(b) Falsch.
(
)
1 2 3 4 5
Die Umkehrfunktion ist
.
5 1 2 3 4
2.
(a) Richtig, da 1 auf 1 abgebildet wird. Siehe Definition 119.
(b) Falsch. Die Permutation besitzt nur zwei Zykel und zwar
(2, 5, 6, 8) und (3, 7, 4).
(c) Falsch, das Vorzeichen von s ist -1. Siehe Definition 121.
(d) Richtig, da das Vorzeichen von s gleich -1 ist. Siehe Definition
121.
128
6. ANTWORTEN
§5. Vektorrechnung und Geometrie
1 2 3 4 5 6 7 8
a X X X
X
b X
X
X
c X X
X
d
X
1.
(a) Richtig, siehe Satz 103.
(b) Richtig.
(c) Richtig, denn jeder Untervektorraum ist auch ein affiner Unterraum.
2. Da b eine Linearkombination der Spalten von A ist, ist L(A, b) nicht
leer.
(a) Richtig, denn dim(L(A, b)) = dim(L(A, 0)). Siehe Definition
136 und Satz 103.
(b) Falsch, nur für b = 0 ist 0 ∈ L(A, b).
(c) Richtig, siehe Satz 135.
3.
(a) Die Funktion ist nach Definition 177 linear.
Ein anderes Argument: Wegen
(
) (
)( )
x+y
1 1
x
=
3x − 4y
3 −4
y
ist die Funktion durch
Multiplikation der Spalten in
( die die )
1
1
Q 2×1 mit der Matrix
gegeben, also linear.
3 −4
(b) und (c) erfüllen die Bedingungen aus Definition 177 nicht und
sind somit auch nicht linear.
4. Siehe Definition 186.
5. Siehe Definition 186.
6. Siehe Definition 186.
7. Siehe Definition 186.
8.
(a) Falsch, die Matrix von f ◦ g ist A · B, siehe Satz 189.
(b) Richtig, siehe Satz 190.
129
6. ANTWORTEN
§6. Determinanten, Eigenwerte und Polynome
1
2
3 4 5 6 7 8
a
X
b X X
X X
X X
c
X
X X
d X
X
1. (b) und (d) sind wahr, siehe Definition 191 und Satz 195.
2.
(a) Falsch, siehe Satz 195.
(b) Richtig, siehe Satz 199.
(c) Richtig, weil die ersten zwei Spalten gleich sind (siehe Satz
201).
3.
(a) Richtig. Siehe Satz 203.
(b) Falsch. Siehe Definition 191.
4. Siehe Satz 203 (1).
5. Siehe Satz 203 (1).
6.
(a) Falsch, siehe Satz 202.
(b) Falsch.
(c) Richtig, siehe Satz 202.
7.
(a) Falsch. Die Eigenwerte der Matrix sind 0 und 2.
Denn es ist det(cI3 − A) = c3 − 4c2 + 4c = c(c − 2)2 .
Also ist det(cI3 − A) genau dann 0, wenn c gleich 0 oder 2 ist.
(b) Richtig, siehe 
Satz 221.
 
 
1 2 1
1
1





2 0 −2
0
(c) Richtig, denn
= 2 0 .
−1 2 3
1
1
(d) Falsch. Der Eigenraum zum Eigenwert 2 ist der Lösungsmenge
des homogenen Systems linearer Gleichungen
(2In − A)x = 0.
8.
(a)
(b)
(c)
(d)
Falsch, siehe Satz 231.
Richtig, denn f (−1) = 19 − 27 + 9 − 1 = 0.
Falsch, siehe Definition 226.
Richtig, siehe Definition 226.
Herunterladen