Scriptum: Mathematische Grundlagen MSE

Werbung
Mathematische Grundlagen MSE
WS 2011/12
H. Egger und M. Schlottbom
1. Dezember 2011
2
1
Vorbermerkungen
Als Grundlage für die Vorbereitung dieser Vorlesung dienten die Bücher
• R. Ansorge und H.-J. Oberle: Mathematik für Ingenieure, Band 1, 3te Auflage, WileyVCF, 2000.
• K. Meyberg und P. Vachenhauer: Höhere Mathematik, Band 1, Springer, 1999.
Reichliches Übungsmaterial kann in den Bänden
• Ansorge, Oberle, Übungsaufgaben
• Viele Autoren, Mathematik, Spektrum, 2010.
gefunden werden. Als weiterführende Literatur zu den Themenbereichen Analysis, Lineare Algebra und Numerik sei auf die Bücher
• Königsberger, Analysis,
• Fischer, Lineare Algebra,
• W. Dahmen und A. Reusken: Numerische Mathematik, 2te Auflage, Springer, 2008.
verwiesen. Im folgenden Skript werden elementare mathematische Begriffe eingeführt, sowie
Grundlagen der linearen Algebra und der eindimensionalen Analysis besprochen. Theoretische
Resultate werden an Beispielen veranschaulicht, und die tatsächliche Durchführung komplexer Rechnungen mittels numerischer Methoden wird anhand verschiedener Aufgabenstellungen
behandelt.
2
1
Grundlegende Begriffe
Die Mathematik beruht auf einigen (wenigen) Axiomen (Postulaten), in denen grundlegende Zusammenhänge festgestellt werden, die sich i.A. nicht beweisen lassen. In Definitionen
werden neue Begriffe eingeführt, und in mathematischen Sätzen werden aus einfachen Voraussetzungen kompliziertere Folgerungen hergeleitet. Die Sätze sind als Aussagen formuliert,
deren (immerwährende) Richtigkeit in Beweisen gezeigt wird. In dieser Definition-Satz-Beweis
Manier lässt sich das Gebäude der Mathematik schrittweise erweitern.
Weitere grundlegende Objekte der Mathematik sind Mengen und Funktionen. Im vorangehenden Beispiel wurde etwa bereits die Menge der natürlichen Zahlen verwendet. Die Variable
n wurde als Platzhalter für beliebige natürliche Zahlen verwendet, und die Bedeutung der
Symbole · oder = als bekannt vorausgesetzt.
Im folgenden Abschnitt werden diese Grundbegriffe näher erläutert. Weiterhin wird das Formulieren und Beweisen von mathematischen Sätzen anhand von Beispielen exemplarisch vorgestellt.
1.1
Aussagenlogik
Die Formulierung von mathematischen Sätzen (Resultaten) erfolgt in Aussagen.
Definition 1.1. Eine Aussage A ist ein feststellender Satz, dem ein eindeutiger Wahrheitswert w(A) zugewiesen werden kann. Wir definieren
w(A) = 1
w(A) = 0
:⇔
:⇔
A ist wahr,
A ist falsch.
Bemerkung 1.2. w(A) kann nur die Werte 0 oder 1 annehmen, Halbwahrheiten sind also
nicht zulässig. Das Symbol :⇔ dient zur Definition, also: der Wahrheitswert w(A) von A ist
per Definition 1 (0) falls A wahr (falsch) ist.
Beispiel 1.3.
• Die Erde ist eine Scheibe.
• 5 > 4.
4
Grundlegende Begriffe
Um keine mathematischen Aussagen handelt es sich jedoch bei
• Komm endlich her!
• 5 Sekunden ist ziemlich kurz.
• Wirklich?
Durch Verknüpfungen (Junktoren) lassen sich aus einfachen Aussagen kompliziertere bilden.
Definition 1.4. Für Aussagen A und B werden folgende Symbole (Junktoren) definiert:
¬A :
A∧B :
A∨B :
A⇒B:
nicht A
A und B
A oder B
falls A, dann B
(Negation),
(Konjunktion),
(Disjunktion),
(Implikation),
A⇔B:
A genau dann, wenn B
(Äquivalenz).
Der Wahrheitswert der verknüpften Aussagen ist in folgender Wahrheitstafel definiert:
A
1
1
0
0
B
1
0
1
0
¬A A ∧ B
0
1
0
0
1
0
1
0
A∨B
1
1
1
0
A⇒B
1
0
1
1
A⇔B
1
0
0
1
Bemerkung 1.5. Mathematische Sätze sind typischerweise als Implikation A ⇒ B formuliert. Dabei heißt A die Voraussetzung (Prämisse) und B die Behauptung (Folgerung,
Conclusio). Man beachte:
• Die Implikation A ⇒ B ist immer auch dann wahr, wenn die Voraussetzung A falsch ist,
egal ob die Behauptung B stimmt oder nicht! Z.B. ist die Aussage: “Falls ich morgen 1000
Jahre alt werde, bekommt jeder meiner Studenten eine Million Euro” wahr, und somit
wohl nicht einklagbar :)
• Die Voraussetzung A ist hinreichend für die Folgerung B (“wenn A dann B”); umgekehrt
ist die Folgerung B notwendig für A (“wenn B nicht stimmt, dann kann auch A nicht
wahr sein”; siehe unten).
Weiterhin sei bemerkt:
• Das Symbol ∨ mein ein einschließliches “oder”, also A ∨ B ist wahr, wenn zumindest eine
(oder beide) der Aussagen A oder B wahr sind.
• Das Äquivalenzsymbol ⇔ hat für Aussagen eine ähnliche Bedeutung, wie das Gleichheitszeichen für Zahlen.
1.1 Aussagenlogik
5
Beispiel 1.6. Sei x := 2. Die Aussagen A und B seien gegeben durch A :⇔ (x > 5) und
B :⇔ (x < 3). Wir erhalten verknüpfte Aussagen mit folgender Bedeutung:
• ¬A bedeutet: x ≤ 5. Die Aussage ist wahr (da x = 2).
• A ∧ B heißt: x > 5 und x < 3. Die Aussage ist falsch, da A falsch ist. Die Aussage wäre
sogar für jede reelle Zahl x falsch, da x nicht gleichzeitig größer als 5 und kleiner als 3
sein kann.
• A ∨ B heißt: x > 5 oder x < 3. Das stimmt, da B richtig ist. Die Aussage wäre falsch für
reelle Zahlen 3 ≤ x ≤ 5.
• A ⇒ B bedeutet: aus x > 5 folgt x < 3 (oder “wenn x > 5, dann auch x < 3). Da die
Voraussetzung nicht stimmt, ist die Aussage wahr!, und zwar nicht nur für x = 2, sondern
für jedes x ≤ 5!
• A ⇔ B heißt: x > 5 genau dann, wenn x < 3. Die Aussage A ist falsch, B is wahr. Die
Aussagen sind also nicht äquivalent, und somit w(A ⇔ B) = 0. Dies gilt wiederum für
jedes reelle x.
Anhand einer Wahrheitstabelle überzeugt man sich leicht, dass die Aussage
¬(¬A) ⇔ A,
immer gilt. Solche immer geltende Wahrheiten heißen Tautologien, und diese können als
“Rechenregeln” beim logischen Argumentieren verwendet werden.
Satz 1.7. Seien A und B Aussagen. Dann gilt
¬(¬A) ⇔ A,
(A ⇒ B) ⇔ ((¬B) ⇒ (¬A)),
(A ⇒ B) ⇔ (B ∨ (¬A)),
(A ⇒ B) ⇔ ¬(A ∧ (¬B)),
sowie die De Morgan’schen Regeln
¬(A ∧ B) ⇔ ((¬A) ∨ (¬B)),
¬(A ∨ B) ⇔ ((¬A) ∧ (¬B))
Beweis. Mit Wahrheitstafeln.
Oftmals hat man es mit Aussagen der folgenden Gestalt zu tun:
• Für alle reellen Zahlen x gilt x2 ≥ 0.
• Es gibt eine natürliche Zahl n mit n > 1.
Diese Aussagen beinhalten Teile der Form x2 ≥ 0 bzw. n > 1, welche erst durch Einsetzen eines
konkreten Objektes einen Sinn bekommen.
6
Grundlegende Begriffe
Definition 1.8. Eine Aussageform ist ein formaler Ausdruck der Art A(x), welcher durch
Einsetzen eines konkreten Objektes für die Variable x zu einer Aussage wird.
Beispiel 1.9. Wir betrachten die Aussageform A(x) welche für natürliche Zahlen durch
A(x) :⇔ x > 5
definiert sei. Für jedes x ≤ 5 ist diese Aussage falsch, während z.B. die Aussage A(6) wahr
ist. Man beachte, dass x vorderhand eine “freie” Variable ist, A(x) also keinen Wahrheitsgehalt
besitzt solange x kein Wert zugewiesen wurde.
Definition 1.10 (Quantoren). Sei M eine Menge, und A(x) eine Aussageform, welche für
x ∈ M wohldefiniert ist. Die Symbole ∀ und ∃, definiert durch
∀x ∈ M : A(x)
∃x ∈ M : A(x)
:⇔
:⇔
Für alle x ∈ M gilt A(x),
Es existiert ein x ∈ M für das A(x) gilt,
heißen All- bzw. Existenzquantor. Weiterhin verwenden wir den Quantor
∃!x ∈ M : A(x)
:⇔
A(x) stimmt für genau ein x ∈ M.
Zum Begriff der Menge sowie des Elementsymbols ∈ siehe weiter unten.
Bemerkung 1.11. Sei M = {1, 2, 3} gegeben. Man beachte
∀x ∈ M : (x > 5) ⇔ ((1 > 5) ∧ (2 > 5) ∧ (3 > 5))
sowie
∃x ∈ M : (x > 5) ⇔ ((1 > 5) ∨ (2 > 5) ∨ (3 > 5)).
Die Quantoren ∀ und ∃ erlauben also “und“- bzw. “oder“-Verkettungen vieler Aussagen gleicher
Gestalt kompakt darzustellen.
Beispiel 1.12. “Es gibt genau eine reelle Zahl r > 0 mit r·r = 2” lässt sich formal ausgedrücken
√
als: “∃!r > 0 reell : r · r = 2“. Diese Aussage ist wahr, und das richtige
√ r ist gegeben
√ r = 2.
Die Aussage “∃!r reell : r · r = 2“ ist jedoch falsch, da neben r = 2 auch r = − 2 Lösung
ist.
Beispiel 1.13. Sei A(x) :⇔ x > 5 wie oben definiert, und M = {5, 6}. Dann ist ∀x ∈ M : A(x)
eine falsche Aussage, denn
(∀x ∈ M : A(x)) ⇔ (5 > 5) ∧ (6 > 5)).
D.h., nicht “für alle x in M is x > 5”. Andererseits ist die Aussage ∃x ∈ M : A(x) wahr, denn
(∃x ∈ M : A(x)) ⇔ (5 > 5) ∨ (6 > 5)),
und die letzte Ungleichung ist korrekt bzw w(A(6)) = 1. “Es gibt ein x in M , sodass x > 5.”
1.2 Mengen und Relationen
7
Die DeMorgan’schen Regeln lassen sich wie folgt auf Quantoren erweitern.
Satz 1.14. Die Aussageform A(x) sei für x ∈ M wohldefiniert. Dann gilt
¬(∀x ∈ M : A(x)) ⇔ ∃x ∈ M : (¬A(x))
¬(∃x ∈ M : A(x)) ⇔ ∀x ∈ M : (¬A(x)) .
Beispiel 1.15. Man beachte das vorhergehende Beispiel zu Quantoren. Weiterhin gilt:
• Das Gegenteil von A :⇔ “alle Professoren unterrichten Mathematik” ist ¬A :⇔ “Es gibt
einen Professor, der nicht Mathematik unterrichtet”.
• Das Gegenteil von ∃x ∈ M : x > 5 ist ∀x ∈ M : x ≤ 5.
1.2
Mengen und Relationen
Im folgenden beschäftigen wir uns mit dem Begriff der Menge und elementaren Konstruktionsprinzipien für solche. Nach Georg Cantor verstehen wir unter einer Menge anschaulich eine
Zusammenfassung bestimmter, wohl unterscheidbarer Objekte zu einem Ganzen.
Bemerkung 1.16. Dieser Mengenbegriff ist nicht ganz widerspruchsfrei, wie folgendes Beispiel
belegt: “M sei die Menge aller Mengen, die sich nicht selbst enthalten”. Das ist ein typisches
Paradoxon, die “Russel’sche Antinomie”.
Mengen können auf verschiedene Arten angegeben werden, etwa durch
• Aufzählung der Elemente: M1 = {1, 2, 3} oder M2 = {∗, 0 a0 , M }, oder durch
• Angabe einer Vorschrift, wie die Elemente konstruiert werden können, z.B. M3 = {x :
x ist Bürger von Österreich} oder M = {x reelle Zahl : x < 5}.
Mit ∅ oder {} bezeichnen wir die leere Menge, welche kein Element enthält.
Definition 1.17. Sei M eine Menge, und x ein Objekt. Wir definieren die Symbole (Relationen)
a∈M
a 6∈ M
:⇔
:⇔
a ist Element von M,
¬(a ∈ M ).
Beispiel 1.18. Folgende Mengen werden immer wieder verwendet.
• Die Menge der natürlichen Zahlen N := {1, 2, 3, . . .} und N0 := {0, 1, 2, . . .}.
• Die Mengen der ganzen Zahlen Z := {0, −1, 1, −2, 2, . . .} sowie der rationalen Zahlen
Q := {q : q = m/n wobei m ∈ Z, n ∈ N}. Ist q = m/n, dann heißt m Zähler, und n
Nenner des Bruchs m/n.
8
Grundlegende Begriffe
• Die reellen Zahlen R := {r : r ist reelle Zahl }. Mehr dazu später.
Definition 1.19. Für zwei Mengen M und N definieren wir die folgenden Symbole
M ⊂ N :⇔ ∀x ∈ M : (x ∈ N )
M = N :⇔ ((M ⊂ N ) ∧ (N ⊂ M )
(Teilmenge)
(Gleichheit)
Gilt M ⊂ N , so heißt M Teilmenge von N . Das Gegenteil wird mit M 6⊂ N ausgedrückt.
Beispiel 1.20.
• Offene, halboffene, und geschlossene Intervalle. Für a, b ∈ R definieren wir folgende Teilmengen von R: [a, b] := {x ∈ R : a ≤ x ≤ b}, [a, b) := {x ∈ R : a ≤ b < c}, und
(a, b) = {x ∈ R : a < x < b}.
• Es gilt N ⊂ N0 ⊂ Z ⊂ Q ⊂ R.
• Für alle Mengen M gilt: {} ⊂ M .
• Sei M = {1, 2} und N = {1, 2, 3}. Dann gilt M ⊂ N , N 6⊂ M , also M 6= N .
Bemerkung 1.21. Für jede beliebige Aussageform A(x) gilt: ∀x ∈ {} : A(x). Über die leere
Menge darf man also alles behaupten.
Für die Konstruktion von Mengen aus bereits bekannten Mengen können folgende Operationen verwendet werden
Definition 1.22. Für Mengen M und N definieren wir die Symbole (Operationen)
M ∩N
M ∪N
M \N
:⇔
:⇔
:⇔
{x : (x ∈ M ) ∧ (x ∈ N )},
{x : (x ∈ M ) ∨ (x ∈ N )},
{x : (x ∈ M ) ∧ (x 6∈ N )},
(Durchschnitt)
(Vereinigung)
(Differenz).
Beispiel 1.23.
• Sei M = {1, 2, 3} und N = {2, 4, 7}. Dann ist M ∩ N = {2}, M ∪ N = {1, 2, 3, 4, 7} und
M \ N = {1, 3}.
• Sei M = {n ∈ N : n < 3} und N = {n ∈ N : n > 3}. Dann ist M ∩ N = {},
M ∪ N = N \ {3} und M \ N = M .
• Sei M = {x ∈ R : 0 ≤ x < 1} und N = {x ∈ R : x2 ≤ 1/4}. Dann ist N = {x ∈ R :
−1/2 ≤ x ≤ 1/2} und daher M ∩ N = {x ∈ R : 0 ≤ x ≤ 1/2}, M ∪ N = {x ∈ R : −1/2 ≤
x < 1} und M \ N = {x ∈ R : 1/2 < x < 1}.
Die elementaren Mengenoperationen lassen sich gut in so-genannten Venn-Diagrammen veranschaulichen.
1.2 Mengen und Relationen
9
Venn Diagramme
Für das “Rechnen” mit Mengen gelten, ähnlich wie beim Rechnen mit Zahlen, folgende Regeln.
Hierbei spielen ∩ bzw. ∪ die Rolle von · bzw. +.
Satz 1.24. Seien M , N , O Mengen. Dann gilt
M ∩ N = N ∩ M und M ∪ N = N ∪ M
(M ∩ N ) ∩ O = M ∩ (N ∩ O) und (M ∪ N ) ∪ O = M ∪ (N ∪ O)
(M ∪ N ) ∩ O = (M ∩ O) ∪ (N ∩ O)
(Kommutativität)
(Assoziativität)
(Distributivität)
Beweis. Wir zeigen nur die erste Behauptung, die restlichen folgen analog. Es gilt
x ∈ (M ∩ N ) ⇔ (x ∈ M ) ∧ (x ∈ N ) ⇔ (x ∈ N ) ∧ (x ∈ M ) ⇔ x ∈ (N ∩ M ).
Wir haben hier verwendet, dass die ∧ Verknüpfung kommutativ ist.
Definition 1.25. Zur Konstruktion von Mengen definieren wir
M ×N
P (M )
:⇔
:⇔
{(x, y) : (x ∈ M ) ∧ (y ∈ N )},
{N : N ⊂ M },
(Cartesisches Produkt)
(Potenzmenge).
Bemerkung 1.26. Beim Cartesischen Produkt bezeichnet (x, y) ein geordnetes Paar. Für diese
ist Gleichheit definiert durch
(x1 , y1 ) = (x2 , y2 )
:⇔
(x1 = x2 ) ∧ (y1 = y2 ).
Es kommt also auf die Reihenfolge an, und im Allgemeinen ist (x, y) 6= (y, x).
Beispiel 1.27. Sei M = {1, 2} und N = {3, 4, 5}. Dann ist
P (M ) = {{}, {1}, {2}, {1, 2}}
und
M × N = {(1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5)}.
Die Definitionen von Durchschnitt, Vereinigung und Cartesischem Produkt lassen sich sofort
auf mehrere Mengen verallgemeinern.
10
Grundlegende Begriffe
Definition 1.28. Mit Mi seien für 1 ≤ i ≤ n Mengen bezeichnet. Wir definieren
n
[
i=1
n
\
i=1
n
Y
Mi := M1 ∪ M2 ∪ . . . ∪ Mn := {x : ∃i ∈ {1, . . . , n} : (x ∈ Mi )}
Mi := M1 ∩ M2 ∩ . . . ∩ Mn := {x : ∀i ∈ {1, . . . , n} : (x ∈ Mi )}
Mi := M1 × M2 × . . . × Mn := {(x1 , . . . , xn ) : ∀i ∈ {1, . . . , n} : (xi ∈ Mi )}.
i=1
Bemerkung 1.29.
• Gilt M1 = M2 = . . . = Mn = M , dann schreiben wir auch M n :=
Qn
i=1
M.
• Das n-fache Cartesische Produkt besteht aus n-Tupeln (x1 , . . . , xn ), die angeordnete Folgen von je n Objekten sind; die Reihenfolge ist wichtig!
Beispiel 1.30. Mit R2 := R × R und R3 := R × R × R bezeichnen wir die Punkte (x, y) bzw
(x, y, z) in der Euklideschen Zahlenebene, bzw. dem Euklidischen dreidimensionalen Raum.
Beide werden in den folgenden Kapiteln häufig verwendet.
Als abschließendes Beispiel soll nochmals ausdrücklich auf den elementaren Zusammenhang
zwischen Mengen und Aussagen hingewiesen werden.
Sn
Bemerkung
Tn 1.31. Es gilt: x ∈ i=1 Mi ⇔ ∃i ∈ {1, . . . , n} : x ∈ Mi und in ähnlicher Weise
auch x ∈ i=1 Mi ⇔ ∀i ∈ {1, . . . , n} : x ∈ Mi . Es besteht also ein elementarer Zusammenhang
zu den Quantoren.
1.3
Abbildungen
Definition 1.32. Seien M und N Mengen. Eine Abbildung (Funktion) von M in N ist
eine Vorschrift, welche jedem Element x ∈ M genau ein Element y = f (x) ∈ N zuordnet.
Wir schreiben
f : M → N,
x 7→ f (x).
M heißt Definitionsbereich (Urbildbereich) und N Bildbereich (Wertemenge) von f . Mit
Graph(f ) := {(x, f (x)) : x ∈ M } ⊂ M × N
bezeichnet man den Graphen der Funktion f .
Bemerkung 1.33. Wichtig is hier, dass es für jedes x ∈ M genau ein y ∈ N mit y = f (x).
Dies wird durch das Symbol x 7→ f (x) ausgedrückt.
Beispiel 1.34.
1.3 Abbildungen
11
• f : R → R, x 7→ 2 · x ist eine Funktion.
• f : {a, b, c} → {1} mit f (a) = 1, f (b) = 1, f (c) = 1 ist eine Funktion.
• f : {a, b} → {1} mit f (a) = 1 ist keine Funktion. Dem Argument b is kein Funktionswert
zugewiesen.
Bemerkung 1.35.
• Handelt es sich bei M um eine Menge mit endlich vielen Elementen, so kann die Vorschrift
f (x) tabellarisch angegeben werden.
• Seien M, N ⊂ R. Dann kann f : M → N durch Darstllung des Funktionsgraphen veranschaulicht werden.
Wir wollen noch weitere Begriffe festlegen.
Definition 1.36. Für A ⊂ M und B ⊂ N heißen die Mengen
f (A) := {y ∈ N : ∃x ∈ A : y = f (x)} ⊂ N,
f (B) := {x ∈ M : f (x) ∈ B} ⊂ M
−1
das Bild von A bzw. das Urbild von B unter (der Funktion) f .
Beispiel 1.37. Wir betrachten die Funktion f : [0, 2] → R, x 7→ 2x + 1. Es ist dann f ([0, 2]) =
[1, 5] und f −1 ((1, 3)) = (0, 1). Man veranschauliche sich hierzu den Funktionsgraphen.
Definition 1.38. Eine Funktion f : M → N heißt
• injektiv, falls f (x1 ) = f (x2 ) ⇒ x1 = x2 für jedes x1 , x2 ∈ M .
Zwei verschiedene Argumente können also nicht dasselbe Bild erzeugen.
• surjektiv, falls ∀y ∈ N ∃x ∈ M : y = f (x).
D.h., jedes Element im Bildbereich wird tatsächlich angenommen.
• bijektiv, falls f injektiv und surjektiv ist.
Beispiel 1.39. Die Funktion f : [0, 1] → R, x 7→ 2x + 1 ist
• injektiv: Es gilt nämlich
f (x1 ) = f (x2 ) ⇔ 2x1 + 1 = 2x2 + 1 ⇔ 2x1 = 2x2 ⇔ x1 = x2 .
• nicht surjektiv: y = 0 liegt im Bildbereich, es gibt aber kein x im Urbildbereich [0, 1] für
das f (x) = 0 ist. Das sieht man durch Auflösen
f (x) = 0 ⇔ 2x + 1 = 0 ⇔ 2x = −1 ⇔ x = −1/2.
x = −1/2 wäre also die einzige Möglichkeit, um mit der Vorschrift f (x) = 2x + 1 den
Wert 0 zu erreichen. −1/2 liegt aber nicht im Definitionsbereich.
12
Grundlegende Begriffe
Es folgt, dass f auch nicht bijektiv ist.
Bemerkung 1.40. Eine Funktion kann surjektiv gemacht werden, indem man den Wertebereich auf diejenigen Werte einschränkt, die tatsächlich angenommen werden, d.h., jede Funktion
f : M → f (M ) ist automatisch surjektiv.
Beispiel 1.41. Wir definieren f : [0, 2] 7→ [1, 5] mit x 7→ 2x + 1 wie oben. Dann ist f surjektiv,
und mit obiger Überlegung auch injektiv, und somit bijektiv. Man veranschauliche sich den
Unterschied zu oben anhand des Funktionsgraphen.
Bemerkung 1.42. Für Funktionen f : M ⊂ R → N ⊂ R lässt sich anhand des Funktionsgraphen leicht entscheiden, ob Injektivität und/oder Surjektivität vorliegt.
Injektivität bzw. Surjektivität reeller Funktionen
Definition 1.43 (Hintereinanderausführung). Seien M , N , O Mengen, und f : M → N ,
g : N → O Funktionen. Dann ist mit
(g ◦ f ) : M → O,
x 7→ g(f (x))
eine Funktion (die Hintereinanderausführung von g und f ) definiert.
Bemerkung 1.44. Zur besseren Unterscheidung haben wir das Symbol y für Elemente der
Bildmenge N verwendet, und im Gegensatz dazu x für Elemente des Urbildbereiches.
Satz 1.45. Sei f : M → N , x 7→ f (x) bijektiv. Dann existiert eine Abbildung g : N → M ,
y 7→ g(y) sodass
(g ◦ f )(x) = g(f (x)) = x
for all x ∈ M.
Die Abbildung g heißt Umkehrabbildung und wird mit g = f −1 bezeichnet.
Bemerkung 1.46. Die einfache Abbildung idM : M → M , x 7→ x wird Identitätsabbildung
genannt. Obiger Satz liefert also f −1 ◦ f = idM . Ebenso gilt f ◦ f −1 = idN .
Beispiel 1.47. Wie gezeigt, ist die Funktion f : [0, 2] → [1, 5], x 7→ 2x + 1 bijektiv. Die
Umkehrabbildung erhält man, indem man die Gleichung y = 2x + 1 nach x auflöst (umkehrt).
Man erhält
y = 2x + 1 ⇔ y − 1 = 2x ⇔ (y − 1)/2 = x.
1.3 Abbildungen
13
Die Umkehrabbildung lautet also f −1 : [1, 5] → [0, 1], y 7→ (y − 1)/2. Zur Probe überprüfen wir
f −1 (f (x)) = x: Ersetzen von y durch f (x) liefert
f −1 (f (x)) = (f (x) − 1)/2 = ((2x + 1) − 1)/2 = 2x/2 = x,
was wir zeigen wollten.
Aufgaben
Aufgabe 1.1. Bilden Sie von jeder der folgenden Aussagen die Verneinung und stellen Sie fest,
ob jeweils die Aussage selbst oder ihre Verneinung wahr ist (mit Begründung).
(a) Jeder Mensch hat blaue Augen.
(b) ∀x ∈ Q ∃y ∈ Q : x · y = 1.
Aufgabe 1.2. Es seien A, B und C mathematische Aussagen. Zeigen Sie mit Hilfe von Wahrheitstafeln:
(a) (A ⇒ B) ⇐⇒ (¬B ⇒ ¬A),
(b) (A ∧ ¬B) ∨ (¬A ∧ B) ⇐⇒ ¬(A ⇔ B).
Aufgabe 1.3. Geben Sie folgende Mengen in aufzählender Form an:
(a) {x ∈ N : x5 = −1}, {x ∈ Z : x5 = −1},
(b) {(x, y) ∈ {1, 2, 3} × {4, 5, 6, 7} : x · y ist gerade},
(c) {x ∈ Z : 2 ≤ x2 ≤ 9},
(d) {x3 : x ∈ Z ∧ −2 ≤ x ≤ 3}.
Aufgabe 1.4. Seien K, L und M Mengen. Zeigen Sie:
(a) K \ (K \ L) = K ∩ L,
(b) K \ (L ∪ M ) = (K \ L) ∩ (K \ M ),
(c) K \ (L ∩ M ) = (K \ L) ∪ (K \ M ).
Aufgabe 1.5. Untersuchen Sie die folgenden Abbildungen auf Injektivität, Surjektivität und
Bijektivität:
(a) f1 : R → R, x 7→ exp(x),
(b) f2 : Z → Z, x 7→ 2x − 1,
(c) f3 : R → R, x 7→ 2x − 1,
14
Grundlegende Begriffe
(d) f4 : N × R → R, (x, y) 7→ x · y.
Skizzieren Sie die Funktionen fi für i ∈ {1, 2, 3}.
Aufgabe 1.6. Es seien A, B und C nicht-leere Mengen und f : A → B und g : B → C zwei
Abbildungen. Zeigen Sie:
(a) Wenn g ◦ f injektiv ist, dann muss auch f injektiv sein, aber g im Allgemeinen nicht.
(b) Wenn g ◦ f surjektiv ist, dann muss auch g surjektiv sein, aber f im Allgemeinen nicht.
2
Zahlenmengen und Rechentechniken
Im folgenden Kapitel betrachten wir die Zahlenmengen N und R der natürlichen bzw. reellen
Zahlen. Darüber hinaus wird die Menge C der komplexen Zahlen eingeführt.
2.1
Natürliche Zahlen
Nach unserem Verständnis ist die Menge der natürlichen Zahlen gegeben durch
N = {1, 2, 3, . . .}.
(2.1)
Bei genauerer Betrachtung stellt sich die Frage, was mit . . . gemeint ist. Die natürlichen Zahlen
lassen sich vollständig wie folgt charakterisieren:
Axiom 2.1 (Peano Axiome). Die Menge N der natürlichen Zahlen ist eine Menge mit folgenden
Eigenschaften:
1.
2.
3.
4.
5.
1∈N
∀n ∈ N : n + 1 ∈ N
∀n ∈ N : n + 1 6= 1
∀m, n ∈ N : (m 6= n ⇒ m + 1 6= n + 1)
1 ∈ M ∧ (∀n ∈ M : n + 1 ∈ M ) ⇒ N ⊂ M
Eins ist eine natürliche Zahl
jede natürliche Zahl hat einen “Nachfolger”
Eins hat keinen “Vorgänger”
Ungleichheit bleibt für Nachfolger erhalten
Induktionsaxiom
Ohne weiteres können wir die natürlichen Zahlen um das Element 0 ergänzen, und zwar
N0 := {0} ∪ N
mit
1 = 0 + 1.
In diesem Fall hat dann 1 einen Vorgänger, aber 0 nicht.
Die wesentliche Eigenschaft bei der Charakterisierung der natürlichen Zahlen ist das Induktionsaxiom, welches besagt, dass sich die natürlichen Zahlen durch Abzählen 1, 2, 3, . . . ausschöpfen
lassen. Das erklärt jetzt auch die Bedeutung der Punkte in (2.1).
Die Induktionseigenschaft erlaubt uns, folgende Symbole “induktiv“ (rekursiv) zu definieren.
16
Zahlenmengen und Rechentechniken
Definition 2.2. Für k ∈ N seien ak reelle Zahlen. Wir definieren
0
X
Summe:
Produkt:
n
X
und für n ∈ N :
ak := 0,
k=1
k=1
0
Y
n
Y
und für n ∈ N :
ak := 1,
k=1
ak := an +
ak := an ·
n−1
X
ak
k=1
n−1
Y
k=1
ak .
k=1
Bemerkung 2.3. Gilt ak = a für alle k ∈ N, dann folgt
n
n
X
Y
a=n·a
sowie
a =: an .
k=1
k=1
n
Hier bezeichnet a die n-te Potenz von a, und es gilt:
a0 := 1,
a1 = a,
Etwas informeller schreiben wir auch
n
X
ak = a1 + a2 + . . . + an
a2 = a · a,
sowie
k=1
n
Y
....
ak = a1 · a2 · . . . · an .
k=1
Bemerkung 2.4. In natürlicher Weise erweitern wir die Definition auf allgemeine Indices, und
zwar
n
n
X
Y
ak := am + am+1 + . . . + an
bzw.
ak := am · am+1 · . . . · an
k=m
k=m
Qn
Pn
falls m ≤ n ist, sowie k=m ak := 0 und k=m ak := 1 wenn m > n. Man überzeugt sich
leicht, dass eine Indexverschiebung bei entsprechender Anpassung der Grenzen das Ergebnis
nicht beeinträchtig. So erhält man z.B. für k → l + 1 (k wird durch l + 1 ersetzt)
n
X
ak =
k=1
l+1=n
X
al+1 =
l+1=1
n−1
X
al+1 .
l=0
Beispiel 2.5. Sei an := n + 1. Dann gilt
7
X
n=5
an = a5 + a6 + a7 = 6 + 7 + 8 = 21;
6
Y
an = a5 · a6 = 6 · 7 = 42.
n=5
Aus der Induktionseigenschaft lässt sich sofort das folgende wichtige Beweisprinzip ableiten,
mit dem wir verschiedene Sätze beweisen werden.
Satz 2.6 (Prinzip der vollständigen Induktion). Sei A(n) eine Aussageform, die für alle n ∈ N
definiert ist. Falls
1. A(1) wahr ist, und
(Induktionsanfang)
2. für alle n ∈ N aus A(n) auch A(n + 1) folgt. (Induktionsschluss)
Dann gilt die Aussage A(n) für alle n ∈ N. Formal ausgedrückt:
(A(1) ∧ (∀n ∈ N : A(n) =⇒ A(n + 1))) =⇒ (∀n ∈ N : A(n)).
2.1 Natürliche Zahlen
17
Bemerkung 2.7.
• Gilt der Induktionsanfang A(n0 ) für irgendein n0 ∈ N0 , und der Induktionsschluss für
alle n ≥ n0 . Dann gilt die Aussage A(n) ebenfalls (zumindest) für alle n ≥ n0 . Der Satz
wurde für n0 = 1 formuliert.
• Anstelle des Induktionsschlusses 2. kann man auch die Variante
2.’ für alle n ∈ N gilt: Aus A(m) für alle 1 ≤ m ≤ n folgt A(n + 1).
Wir dürfen als Voraussetzung also nicht nur A(n) sondern A(m) für alle m ≤ n verwenden.
Als erste Anwendung des Induktionsprinzips betrachten wir das folgende Beispiel.
Satz 2.8 (Der kleine Gauß). Für alle n ∈ N gilt
n
X
k = n(n + 1)/2.
k=1
Beweis. Die zu zeigende Aussage
hat die Form ∀n ∈ N : A(n), wobei die Aussageform A(n)
Pn
definiert ist durch A(n) :⇔ k=1 k = n(n + 1)/2. Zum Beweis verwenden wir das Prinzip der
vollständigen Induktion.
1. Induktionsanfang
(IA):
P1
Für n = 1 gilt: k=1 k = 1 sowie n(n + 1)/2 = 1(1 + 1)/2 = 1. Somit gilt A(1).
2a) Induktionsvoraussetzung (IV):
P
Für beliebiges n ∈ N gelte A(n) bereits, also nk=1 k = n(n + 1)/2 gilt für dieses n.
2b) Induktionsschluss (IS):
Zu P
zeigen ist, dass dann (A(n) ist nach Voraussetzung richtig) auch A(n+1) gilt, d.h., zu zeigen
zz
ist n+1
k=1 k = (n + 1)(n + 2)/2: Wir beginnen mit der linken Seite der Gleichung:
n+1
X
P
k = (n + 1) +
k=1
n
X
k
k=1
IV
= (n + 1) + n(n + 1)/2
= (n + 1)(1 + n/2) = (n + 1)(2 + n)/2,
was genau die zu zeigende Aussage A(n + 1) ist. Nach dem Prinzip der vollständigen Induktion
folgt somit die Richtigkeit von A(n) für all n ∈ N.
Wir führen weitere Symbole ein.
Definition 2.9. Für m, n ∈ N0 mit m ≤ n definieren wir:
Faktorielle (Fakultät):
Binomialkoeffizient:
n! :=
n
Y
k,
k=1
n
n!
.
:=
m
m!(n − m)!
18
Zahlenmengen und Rechentechniken
Beispiel 2.10.
• Nach Definition gilt auch 0! = 1.
Q
• 5! = 5k=1 k = 1 · 2 · 3 · 4 · 5 = 120.
Beispiel 2.11.
• Für alle n ∈ N gilt:
n
n
=
,
k
n−k
n
n
=
= 1,
0
n
n
n
=
= n,
1
n−1
was man sofort durch Einsetzen in die Definition sieht.
• Man kann in der Formel für den Binomialkoeffizienten ”kürzen“, und zwar
n
n!
n · (n − 1) · (n − k + 1) · (n − k)!
n n−1
n−k+1
=
=
= ·
···
.
k
k!(n − k)!
k · (k − 1) · . . . · 1 · (n − k)!
k k−1
1
Mit Hilfe der Binomialkoeffizienten können wir Potenzen von Summen zweier Zahlen ausrechnen.
Satz 2.12 (Binomische Formel). Seien a und b natürliche (reelle, komplexe) Zahlen. Dann gilt
für alle n ∈ N
n X
n 0 n
n n−k k
n n 0
n n−1 1
n
(a + b) =
a b =
a b +
a b + ... +
ab .
k
0
1
n
k=0
Beweis. Wir überprüfen die Formel für n = 1 und n = 2: Für n = 1 gilt zum einen
(a + b)1 = (a + b),
zum anderen haben wir
n X
n k n−k
1 1 0
1 0 1
a b
=
ab +
a b = a + b,
k
0
1
k=0
wobei wir a0 = 1 für alle reelle Zahlen a, sowie 10 = 11 = 1 verwendet haben. Somit gilt A(1).
Für n = 2 erhalten wir einerseits
(a + b)2 = (a + b) · (a + b) = a2 + a · b + b · a + b2 = a2 + 2ab + b2 .
Andererseits liefert die binomische Formel für n = 2
2 X
2 2−k k
2 2 0
2 1 1
2 0 2
a b =
ab +
ab +
a b = 1 · a2 + 2 · ab + 1 · b2 .
k
0
1
2
k=0
Das zeigt die Richtigkeit von A(2). Der allgemeine Fall A(n) folgt mit vollständiger Induktion;
Beweis siehe Übung.
2.1 Natürliche Zahlen
19
Unter den natürlichen Zahlen besonders ausgezeichnet sind sogenannte Primzahlen.
Definition 2.13.
• Für n ∈ N heißt eine natürliche Zahl m Teiler von n, falls es ein k ∈ N gibt, mit
n = k · m. Wir sagen ”m teilt n”, und schreiben m|n.
• Eine natürliche Zahl p > 1, die nur 1 und sich selbst als Teiler besitzt, heißt Primzahl.
Satz 2.14 (Hauptsatz der Arithmetik, Primfaktorzerlegung). Jede natürliche Zahl n >
1 lässt sich als Produkt von Primzahlpotenzen schreiben, d.h., es existiert ein k ≥ 1, Primzahlen
p1 , . . . pk sowie Exponenten r1 , . . . , rk (alle natürlich), sodass
n=
pr11
· ... ·
prkk
=
k
Y
pri i
i=1
gilt. Die Zahlen pi und ri sind bis auf Umordnung eindeutig bestimmt.
Beweis. Der Beweis wird hier nicht erbracht, kann aber relativ einfach mittels vollständiger
Induktion geführt werden.
Bemerkung 2.15. Für natürliche Zahlen m, n definieren wir den größten gemeinsamen
Teiler bzw. das kleinste gemeinsame Vielfache als
ggT(m, n) := max{k ∈ N : k|n ∧ k|m}
kgV(m, n) := min{k ∈ N : m|k ∧ n|k}.
und
Unter Benutzung der Primzahlzerlegung kann man einfache Formeln für ggT(m, n) und kgV(m, n)
angeben. Seien
r̂
r̃
m = p̃r̃11 · . . . · p̃k̃k̃ ,
n = p̂r̂11 · . . . · p̂k̂k̂
die Primzahlzerlegungen von m und k. Wir fassen alle vorkommenden Primzahlen zu einer
Menge {pj : 1 ≤ j ≤ k} = {p̃j : 1 ≤ j ≤ k̃} ∪ {p̂j : 1 ≤ j ≤ k̂}, und erweitern die
Primfaktorzerlegungen von m und n zu
0
m = pr11 · . . . · prkk ,
0
n = pr1 1 · . . . · prk k .
Man beachte, dass jetzt manche Exponenten ri auch null sein können und pri i = 1. Durch
Vergleich erhält man
ggT(m, n) =
k
Y
min{ri ,ri0 }
pi
und
kgV(m, n) =
i=1
k
Y
i=1
woraus durch einfache Rechnung sofort folgt, dass
ggT(m, n) · kgV(m, n) = m · n.
max{ri ,ri0 }
pi
,
20
Zahlenmengen und Rechentechniken
Wegen
2
m =
k
Y
pri i
2
=
i=1
k
Y
i
p2r
i
i=1
sieht man sofort ein, dass
2
ggT(m, n) =
k
Y
min{ri ,ri0 } 2
pi
i=1
=
k
Y
2 min{ri ,ri0 }
pi
i=1
=
k
Y
min{2ri ,2ri0 }
pi
= ggT(m2 , n2 ).
i=1
Die wichtigsten Ergebnisse fassen wir in folgendem Satz zusammen.
Satz 2.16. Seien m, n ∈ N. Dann gilt
ggT(m, n) · kgV(m, n) = m · n
und
ggT(m, n)2 = ggT(m2 , n2 ).
Bemerkung 2.17. Beinhalten die Primfaktorzerlegungen von m und n keine gemeinsamen
Primfaktoren, dann heißen m und n teilerfremd. Mit obiger Überlegung also
m, n teilerfremd :⇔ ggT(m, n) = 1.
2.2
Ganze, rationale und reelle Zahlen
Im Folgenden werden wir sehen, dass der Wunsch, bestimmte Gleichungen lösen zu können,
schrittweise Erweiterungen der Menge verfügbarer Zahlen nötig macht.
Ganze Zahlen:
Sei n ∈ N gegeben. Die einfache Gleichung
z+n=0
besitzt offensichtlich keine Lösung z ∈ N. Wir führen deshalb neue Zahlen (−n) ein, welche
gerade die Lösungen dieser Gleichungen sind. Dies führt uns auf die Menge der ganzen Zahlen
Z := N0 ∪ {(−n) : n ∈ N} = {0, 1, −1, 2, −2, . . .}
Man beachte: Die ganzen Zahlen z mit z > 0 sind wieder natürliche Zahlen.
Bemerkung 2.18. Die Definitionen von Symbolen für natürliche Zahlen aus dem vorhergehenden Abschnitt lassen sich größtenteils auf ganze Zahlen erweitern. Ist z.B. die ganze Zahl z < 0,
so gilt 0 < −z ∈ N. Jede ganze Zahl z ∈ Z \ {0} besitzt demnach ebenfalls eine (eindeutige)
Primfaktorzerlegung der Form
z = ±pr11 · . . . · prkk ,
wobei je nach Vorzeichen von z in der Formel + oder − zu wählen ist.
2.2 Ganze, rationale und reelle Zahlen
21
Rationale Zahlen:
Für gegebenes n ∈ N suchen wir nach einer Lösung der Gleichung
q · n = 1.
So ein q liegt im allgemeinen nicht in Z. Wir führen daher neue Zahlen nz als Lösung der
Gleichung q · n = z mit z ∈ Z ein. Die Menge aller solcher rationaler Zahlen wird mit
Q := {
z
: z ∈ Z, n ∈ N}.
n
bezeichnet.
Bemerkung 2.19.
• Für z = 0 gilt nz = 0. Für z 6= 0 können wir z und n in Primfaktoren zerlegen, und
dann den Bruch soweit kürzen, dass Zähler und Nenner keine gemeinsamen Primfaktoren
aufweisen. So gilt etwa
2·2·5
2·2
4
20
=
=
= .
15
3·5
3
3
Dieser Bruch lässt sich nicht weiter kürzen.
• Die Zahlen 20/15 und 4/3 sind gleich und lassen sich nicht unterscheiden. In Q kommt
daher eigentlich nur eine Zahl mit Wert 4/3 = 20/15 = ... vor.
Reelle Zahlen:
Wie das folgende Beispiel zeigt, reicht die Menge der rationalen Zahlen immer noch nicht aus,
um einfache Gleichungen der Form x · x = n mit n ∈ N zu lösen.
Satz 2.20 (Existenz irrationaler Zahlen). Es gibt keine Zahl x ∈ Q, sodass x · x = 2 gilt.
Beweis. Die Aussage lautet formal: A :⇔ ∀x ∈ Q : x · x 6= 2. Nach den deMorgan’schen
Regeln haben wir
A :⇔ ∀x ∈ Q : x · x 6= 2 ⇔ ¬(∃x ∈ Q : x · x = 2) ⇔ ¬(¬A).
Wir führen einen Widerspruchsbeweis, d.h., wir nehmen ¬A an, und zeigen, dass diese
Annahme falsch (und somit A richtig) ist.
Angenommen ¬A ist richtig, d.h., ∃x ∈ Q : x · x = 2. Daraus folgt, dass x = z/n mit z ∈ Z und
n ∈ N. Wir können ferner annehmen, dass z und n keine gemeinsamen Primfaktoren besitzen
(sonst zuvor kürzen). Die vollständige Annahme lautet also:
∃x ∈ Q : x · x = 2 ∧ (∃n ∈ N, z ∈ Z : (x = z/n) ∧ (ggT(z, n) = 1) .
22
Zahlenmengen und Rechentechniken
Nach Annahme gilt:
2=x·x=
z z
z2
· = 2,
n n
n
insbesondere ist n2 ein Teiler von z 2 , also ggT(n2 , z 2 ) ≥ n2 . Wegen z 2 6= 2 für alle z ∈ Z, folgt
n2 > 1. Aus Satz 2.16 folgern wir nun, dass
1 = ggT(n, z)2 = ggT(n2 , z 2 ) ≥ n2 > 1,
was einen Widerspruch ergibt.
Somit ist die Annahme ¬A falsch (widersprüchlich), und daher ist A wahr.
Die Lösung der Gleichung x2 = x · x = 2 nennen wir
√
2, die (Quadrat-)Wurzel aus 2.
Wir definieren im Folgenden die Menge der reellen Zahlen R, welche neben den rationalen
Zahlen auch alle Quadratwurzeln natürlicher Zahlen, aber noch viele weitere Zahlen enthält.
Die Menge R lässt sich durch folgende Rechenregeln charakterisieren.
Axiom 2.21 (Axiome der reellen Zahlen). Die Menge R der reellen Zahlen enthält Q. Darüber
hinaus gelten für alle x, y, z ∈ R folgende Regeln:
(1) Regeln der Addition
(A1)
(A2)
(A3)
(A4)
x + (y + z) = (x + y) + z
x+y =y+x
∃!0 ∈ R : x + 0 = 0 + x = x
∃!(−x) ∈ R : x + (−x) = (−x) + x = 0
(assoziativ)
(kommutativ)
(neutrales Element; 0 Element)
(inverses Element)
(2) Regeln der Multiplikation
(M 1)
(M 2)
(M 3)
(M 4)
(x · y) · z = x · (y · z)
x·y =y·x
∃!1 ∈ R \ {0} : x · 1 = 1 · x = x
1
1
1
x 6= 0 : ∃!( ) ∈ R : x · ( ) = ( ) · x = 1
x
x
x
(assoziativ)
(kommutativ)
(neutrales Element; 1 Element)
(inverses Element)
(3) Distributivgesetz
(D)
x · (y + z) = (x · y) + (x · z)
(distributiv)
2.2 Ganze, rationale und reelle Zahlen
23
(4) Ordnungseigenschaften
(O1)
(O2)
(O3)
(O4)
(O5)
(O6)
x≤y∨y ≤x
x≤x
x≤y∧y ≤x⇔x=y
x≤y∧y ≤z ⇒x≤z
x≤y ⇔x+z ≤y+z
x≤y∧z ≥0⇒x·z ≤y·z
(vergleichbar)
(reflexiv)
(eindeutig)
(transitiv)
(verträglich mit +)
(verträglich mit ·)
(5) Vollständigkeitsaxiom
Sei R = L ∪ R mit L, R 6= ∅ und ∀x ∈ L∀y ∈ R : x < y. Dann existiert genau eine Schnittzahl
z ∈ R sodass ∀x ∈ L, y ∈ R : x ≤ z ≤ y.
Bemerkung 2.22.
• Wir identifizieren die reellen Zahlen oft mit den Punkten der Zahlengeraden. Das Vollständigkeitsaxiom besagt, dass diese keine Löcher aufweist, d.h., schneidet man die Zahlengerade in zwei Stücke L und R, dann geschieht dies exakt bei einer Zahl z.
• Wir werden später noch andere Kriterien für Vollständigkeit kennenlernen.
Bemerkung 2.23 (Algebraische Strukturen).
• Jede beliebige Menge G mit einer Operation (Addition) + : G × G → G welche (A1)–
(A4) erfüllt heißt Abelsche- (oder kommutative) Gruppe. Gilt (A2) nicht, dann nur
Gruppe. Neben (R, +) sind auch (Z, +) oder (R \ {0}, ·) Abelsche Gruppen; (N, +) nicht.
• Eine Menge K mit Operationen + : K × K → K (Addition) und · : K × K → K
(Multiplikation) welche (A1)–(A4), (M1)–(M4) und (D) erfüllen, heißt Körper (kurz K
oder (K, +, ·)). Man überzeugt sich leicht, dass neben (R, +, ·) auch (Q, +, ·) ein Körper
ist; (Z, +, ·) jedoch nicht.
• Eine Menge M mit einer Relation ≤, welche (O1)–(O4) erfüllt, heißt angeordnet. Ist
(M, +, ·) ein Körper, und ≤ zusätzlich verträglich mit + und ·, dann heißt (M, +, ·, ≤)
angeordneter Körper. Als Beispiel seien R und Q genannt.
• R (bzw. (R, +, ·, ≤)) ist nach Definition
ein vollständiger (angeordneter) Körper, Q jedoch
√
nicht; man könnte Q ja bei z = 2 auseinander schneiden, und wie gezeigt liegt dieses z
nicht in Q.
Bemerkung 2.24. Mit Hilfe der Relation ≤ definieren wir für alle reellen Zahlen x, y
• x < y :⇔ x ≤ y ∧ x 6= y
• x ≥ y :⇔ y ≤ x und x > y :⇔ y < x.
Weiters können wir über die inversen Elemente folgende Operationen definieren:
24
Zahlenmengen und Rechentechniken
• / : R × R \ {0} → R, x/y := x · ( y1 )
• − : R × R → R, x − y := x + (−y)
Alle bekannten Rechenregeln für reelle Zahlen lassen sich auf obige Axiome zurückführen. Die
folgende unvollständige Aufzählung fasst einige dieser Folgerungen zusammen.
Satz 2.25. Seien x, y, z ∈ R. Dann gilt
(a)
(c)
(e)
(g)
x = y ⇔ x + z = y + z,
x · 0 = 0,
x 6= 0 ⇒ x · x > 0,
x, y ≥ 0 : x ≤ y ⇔ x2 ≤ y 2 .
(O3)
(b) x = y ⇔ x · z = y · z (z 6= 0),
(d) (−1) · x = (−x),
(f ) 1 > 0,
(O5)
(O3)
Beweis. (a): x = y ⇔ x ≤ y ∧ y ≤ x ⇔ x + z ≤ y + z ∧ y + z ≤ x + z ⇔ x + z = y + z;
(b): siehe Übung;
(a)
(M 3,A3)
(c): x · 0 = 0 ⇔ x · 0 + x = 0 + x ⇔
die letze Aussage ist nach (M3) wahr.
(a,A3)
(D)
(A3)
x · 0 + x · 1 = x ⇔ x · (0 + 1) = x ⇔ x · 1 = x, und
(M 3,D)
(A3,c)
(A3)
(d): (−1) · x = (−x) + x + (−1) · x = (−x) + (1 + (−1)) · x = (−x) + 0 = (−x).
c
(e): Sei x > 0. Dann ist mit (O6’) x · x > 0 · x = 0. Der Fall x < 0 folgt ähnlich (Übung: mit
x < 0 ⇔ −x > 0 und (−x) · (−x) = x · x).
(M 3)
(e)
(f): Es gilt 1 = 1 · 1 > 0.
(g): “⇒”: Sei x ≤ y. Aus (O6) folgt x2 ≤ xy ∧ xy ≤ y 2 . (O4) liefert x2 ≤ y 2 . “⇐” Sei x > y und
y > 0. Aus (O6) folgt x2 > xy ∧ xy > y 2 . Mit (O4) folgt x2 > y 2 .
Definition 2.26. Eine Menge M ⊂ R heißt nach oben (bzw. nach unten) beschränkt,
falls es eine Zahl a ∈ R (b ∈ R) gibt, sodass ∀x ∈ M : a ≤ x (x ≤ b) gilt. Die Zahlen a (bzw.
b) heißen obere (untere) Schranke.
Aus dem Vollständigkeitsaxiom können wir nun die Existenz von Schranken ableiten.
Satz 2.27. Jede nichtleere, nach oben (nach unten) beschränkte Menge M ⊂ R besitzt eine
größte untere (kleinste obere) Schranke
a = inf M
b = sup M
(Infimum; größte untere Schranke),
bzw.
(Supremum; kleinste obere Schranke).
Genauer, ist a (bzw. b) charakterisiert über die beiden Eigenschaften
(i) ∀x ∈ M : a ≤ x
(bzw. x ≤ b),
(ii) ∀a0 ∈ R : (∀x ∈ M : a0 ≤ x) ⇒ a0 ≤ a
(bzw. für alle oberen Schranken b0 gilt: b ≤ b0 ).
2.2 Ganze, rationale und reelle Zahlen
25
Beweis. Wir definieren die Mengen L := {x ∈ R : ∀y ∈ M : x < y} und R := {x ∈ R :
∃y ∈ M : x ≥ y} (die Menge L liegt “links” von M ). Die Menge L, R sind nicht leer (warum?),
haben kein gemeinsames Element, und es gilt L ∪ R = R. Nach dem Vollständigkeitsaxiom gibt
es eine Schnittzahl a mit
x≤a≤y
∀x ∈ L, y ∈ R.
(2.2)
Behauptung: a = inf M .
Zu zeigen sind die beiden folgenden Punkte
(i) ∀x ∈ M : a ≤ x,
(ii) ∀a0 ∈ R : a0 > a ⇒ (∃x ∈ M : x < a0 ) ,
zu (i): Da M ⊂ R, folgt aus a ≤ y für alle y ∈ R insbesondere a ≤ y für alle y ∈ M .
zu (ii): Sei a0 ∈ R mit a0 > a. Definiere c := (a + a0 )/2. Es gilt a < c < a0 . Aufgrund von (2.2)
folgt c ∈ R. Also existiert ein y ∈ M mit y ≤ c. Für dieses y gilt dann y < a0 . Damit gilt auch
(ii). Der Beweis für die Existenz des Supremums folgt analog.
Bemerkung 2.28. Die Aussage
des Satzen gilt nicht für die rationalen Zahlen Q: Die Menge
√
M := {q ∈ Q √
: 0 ≤ q ≤ 2} besitzt keine kleinste obere Schranke in Q. Die kleinste obere
Schranke wäre 2, und diese liegt nicht in Q! Die Menge Q ist nicht vollständig.
Definition 2.29. Das größte (kleinste) Element einer Menge heißt Maximum (bzw. Minimum) von M und wird mit max M (min M ) bezeichnet.
Nach obigem Satz besitzt jede beschränkte Menge ein Infimum und Supremum. Ein Maximum
oder Minimum braucht allerdings im Allgemeinen nicht vorzuliegen. Es gilt aber der folgende
Zusammenhang.
Satz 2.30. Sei M ⊂ R eine nach oben (nach unten) beschränkte Menge. Dann gilt:
M besitzt ein Maximum (Minimum)
⇔ sup M ∈ M (inf M ∈ M ).
In diesem Fall gilt sup M = max M bzw. inf M = min M .
Beweis. =⇒ : Falls M ein Maximum besitzt, dann erfüllt b := max M nach Definition die
Beziehung ∀x ∈ M : b ≥ x. Somit ist b obere Schranke. Da b ∈ M liegt, folgt für jede andere
obere Schranke b ≤ b0 . Somit ist b die kleinste obere Schranke.
=⇒ : Angenommen, das Supremum b := sup M liegt in M , d.h., b ∈ M und ∀x ∈ M : b ≥ x,
da b obere Schranke. Das zeigt, dass b auch Maximum ist.
Die Aussage folgt aus folgender Tautologie für Aussagen: (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A).
Wir haben ebenso gezeigt, dass, wenn ein Maximum existiert, dieses gleichzeitig die kleinste
obere Schranke ist. Die Aussagen für das Minimum folgen analog.
26
Zahlenmengen und Rechentechniken
Beispiel 2.31. Seien a, b ∈ R mit a < b. Dann gilt
inf(a, b) = a
und
sup(a, b) = b.
Das offene Intervall (a, b) besitzt jedoch kein Minimum oder Maximum. Für das geschlossene
Intervall [a, b] gilt hingegen
inf[a, b] = a = min[a, b]
sowie
sup[a, b] = b = max[a, b].
Beweis. Wir zeigen nur die Aussage a = inf(a, b). Nach Definition des offenen Intervalls
(a, b) := {x ∈ R : a < x < b} folgt, dass a untere Schranke ist (Eigenschaft (i) in der
Definition des Infimums). Zu zeigen bleibt, dass jede andere untere Schranke a0 kleiner gleich
a ist. Angenommen, es gäbe ein a0 ∈ R (a0 < b) sodass ∀x ∈ (a, b) : a0 ≤ x und a0 > a, also
eine untere Schranke die echt größer als a0 ist. Dann gilt für x0 := (a + a0 )/2 dass a < x0 < a0 .
Aus der ersten Bedingung folgt, dass x0 ∈ (a, b) ist, und aus der zweiten, dass a0 keine untere
Schranke für alle Elemente in (a, b) ist. Widerspruch zur Annahme.
Wir beschließen diesen Abschnitt mit dem folgenden Satz und einigen nützlichen Folgerungen.
Satz 2.32 (Satz von Archimedes). Die Menge N der natürlichen Zahlen ist nicht nach oben
beschränkt.
Beweis. Übung.
Folgerung 2.33. Es gelten folgende Sachverhalte:
1
< ε,
(ii) ∀x ∈ R∃n ∈ Z : n ≤ x < n + 1,
n
(iii) ∀x, y ∈ R mit y > x > 0 ∃n ∈ N : nx > y.
(i) ∀ε > 0 ∃n ∈ N : 0 <
Beweis. Übung.
2.2.1
Rechnen mit reellen Zahlen
Im Folgenden wird das Rechnen mit reellen Zahlen anhand von Beispielen demonstriert. Man
beachte, dass sich alle weiteren Regeln aus den obigen Axiomen herleiten lassen.
Variablen, Terme, Ausdrücke
Die Grundbausteine um (reelle, mathematische) Ausdrücke zu konstruieren sind Zahlen und
Variablen. Letztere stehen als Platzhalter für (reelle) Zahlen.
x = 1,
x+1
= 5y,
2
usw.
2.2 Ganze, rationale und reelle Zahlen
27
Durch Rechenoperationen haben wir Variablen und Zahlen zu Termen verknüpft. Beispiel für
Terme sind x, 1, (x + 1) oder x+1
.
2
= 5y einen Ausdruck (in den Variablen x, y, ...). Streng genommen
Wir nennen x = 1 bzw. x+1
2
handelt es sich dabei um eine Aussageform, also einen formalen Ausdruck ohne Wahrheitswert.
Gleichungen, äquivalente Umformungen
Bei Gleichungen der Form
A(x) :⇔
x+1
=5
2
stellt sich oft die Frage, ob es ein x (einen Wert für die Variable x) gibt, sodass die Gleichung
wahr ist. Formal kann man das formulieren als
B :⇔ ∃x ∈ R :
x+1
= 5.
2
Durch den Quantor haben wir die Aussageform (den formalen Ausdruck) A(x) in eine Aussage
überführt, und wir können dieser einen Wahrheitswert zuordnen. Hier würden wir erhalten:
w(B) = 1, es existiert eine Lösung der Gleichung.
Natürlich stellt sich jetzt die Frage, welches x (welche reelle Zahl – welcher Einsetzungswert
für die Variable x) Lösung der Gleichung ist. Hierzu benutzen wir die Rechenregeln aus den
Axiomen für reelle Zahlen, z.B.
∀x ∈ R : (
x+1
·2
−1
= 5 ⇔ x + 1 = 10 ⇔ x = 9).
2
Oftmals wird ∀x ∈ R nicht explizit angegeben, oder im Text als “Für jede reelle Zahl x gilt”,
oder “sei x eine beliebige reelle Zahl; dann gilt” formuliert.
Für jede reelle Zahl x gilt also:
x+1
= 5 ⇔ x = 9.
2
Bemerkung 2.34. Man beachte: Die “Rechenregeln”
∀x, y, z ∈ R : x = y ⇔ x + z = y + z
∀x, y, z ∈ R, z 6= 0 : x = y ⇔ x · z = y · z
folgen unmittelbar aus den Regeln (O1)–(O6).
Somit haben wir gezeigt:
x+1
B :⇔ ∃x ∈ R :
= 5 ⇔ ∃x ∈ R : x = 9 .
2
Offensichtlich ist x = 9 die Lösung des Problems, und B ist wahr.
28
Zahlenmengen und Rechentechniken
Die Menge aller x, für welche die Gleichung stimmt, nennen wir Lösungsmenge
L := {x ∈ R :
x+1
= 5} = {x ∈ R : x = 9} = {9}.
2
Achtung! Multiplizieren von Gleichungen mit 0 ist keine äquivalente Umformung, also
∀x, y ∈ R : x = y ⇒ x · 0 = y · 0,
aber die Umkehrung stimmt im Allgemeinen nicht, denn 1 · 0 = 2 · 0 = 0, aber 1 6= 2!
Brüche
Das sind Terme der Form
5x + 1
,
2
1
,...
x+2
Zähler
Nenner
Man beachte: Der Bruch ist nur dann definiert, wenn der Nenner ungleich 0 ist. Division durch
Null ist nicht erlaubt (nicht definiert). Für das zweite Beispiel machen wir also den Zusatz
1
, x 6= −2,
x+2
was bedeutet, dass der Term nur für x 6= −2 definiert ist.
Multiplizieren von Brüchen geschieht durch Multiplikation von Zähler und Nenner, also (für
alle a, b, c, d ∈ R mit b, d 6= 0 gilt)
a·c
a c
· =
.
b d
b·d
Brüche, die gleiche Faktoren im Zähler und Nenner enthalten, können gekürzt werden, also
2x
2x
x
=
= ,
2y
2y
y
y 6= 0.
(Nur) Brüche mit gleichem Zähler können durch entsprechendes Zusammenfassen der Zähler
addiert bzw. subtrahiert werden, also
(x + 1) + 1
x+2
x 2
x
x+1 1
+ =
=
= + = + 1.
2
2
2
2
2 2
2
Durch Erweitern (Multiplikation mit Termen der Form aa ) lassen sich Brüche immer auf gleichen
Nenner bringen. Etwa
1
1
1 x+2
1
2
x+2
2
x+4
+
= ·
+
· =
+
=
.
2 x+2
2 x+2 x+2 2
2 · (x + 2) 2 · (x + 2)
2 · (x + 2)
Den Kehrwert eines Bruches (= inverses Element bezüglich der Multiplikation) erhält man
durch Vertauschen von Zähler und Nenner, also
1/(a/b) = b/a,
a, b 6= 0.
2.2 Ganze, rationale und reelle Zahlen
29
Daraus ergibt sich auch die Formel zum Auflösen für Doppelbrüche:
a
b
c
d
=
a
c
a d
a·d
· (1/( )) = · =
.
b
d
b c
b·c
Potenzen
Für a ∈ R und n ∈ N haben wir definiert
n
a :=
n
Y
k=1
a = |a · a ·{z. . . · a} .
n mal
a heißt Basis und n der Exponent. Weiterhin definieren wir
∀a ∈ R : a0 := 1
0n = 0;
und
Man sieht sofort, dass für m, n ∈ N gilt
am · an = am+n
und
(am )n = am·n .
Unter Zuhilfenahme von a0 = 1 und am · an = am+n definieren wir
a−n := 1/(an ),
a 6= 0.
Für a ≥ 0 definieren wir die n-te Wurzel von a als diejenige positive reelle Zahl
Potenz gerade a ist, d.h.
√
√
1
und
( n a)n = a.
a n := n a
Es gilt beispielsweise
√ √
√
√
2
2
2· 2= 2· 2=2
und
√
3
n·
√
n
a, deren n-te
√
√
3
n · 3 n = n.
Diese Definition ist verträglich mit den Regeln a0 = 1 und (am )n = am·n .
Die Definitionen lassen sich für a ≥ 0 auf reelle Exponenten erweitern. Es gelten folgende
Rechengesetze: Seien a, b ≥ 0 und x, y ∈ R. Dann ist
ax · ay = ax+y
a−x = 1/(ax )
ax · bx = (a · b)x
a0 = 1
Lösen quadratischer Gleichungen
Sei a ∈ R. Dann gilt
(a)2 = a2 = (−a)2 .
(ax )y = ax·y
00 := 1.
30
Zahlenmengen und Rechentechniken
Die Gleichung x2 = a2 besitzt also (mindestens) zwei Lösungen, nämlich x = a sowie x = −a.
Wie später gezeigt wird, sind das die einzigen beiden Lösungen. Abstrakt können wir dies
ausdrücken durch
x2 = a2 ⇔ x = a ∨ x = −a kurz: x = ±a.
Als nächstes betrachten wir die allgemeine quadratische Gleichung
a · x2 + b · x + c = 0,
a, b, c ∈ R, a 6= 0.
Im Fall a = 0 vereinfacht sich die Gleichung. Gesucht sind Lösungen (Werte für) x, für welche
Gleichheit gilt. Wir definieren p := b/a und q := c/a. Die quadratische Gleichung ist dann
äquivalent zu (Division durch a)
x2 + px + q = 0.
Durch Nachrechnen sieht man, dass dies wiederum äquivalent ist zu
(x + p/2)2 = p2 /4 − q,
und durch Ziehen der Quadratwurzel auf beiden Seiten erhält man die Lösungen
p
p
bzw. äquivalent:
x = −p/2 ± p2 /4 − q,
x + p/2 = ± p2 /4 − q
wobei vorausgesezt werden muss, dass p2 /4 − q ≥ 0 ist.
Wir haben also die p-q-Lösungsformel für quadratische Gleichungen hergeleitet:
p
p
x2 + px + q = 0
⇔ x = −p/2 + p2 /4 − q ∨ x = −p/2 − p2 /4 − q.
Die Lösungsmenge der quadratischen Gleichung ist somit
p
L = {−p/2 ± p2 /4 − q} falls q ≤ p2 /4,
sonst L = ∅.
Ungleichungen, Abschätzen
Wir definieren zunächst:
x ≥ y :⇔ y ≤ x
und
x < y ⇔ (x ≤ y ∧ x 6= y).
Die Bedeutung des Symbols > sollte dann klar sein.
Beim Rechnen mit Ungleichungen benutzen wir (O1)–(O6). Aus diesen Regeln folgen auch
a ≤ b ⇒ (−a) ≥ (−b)
und
a≤b⇒
1
1
≥ ,
a
b
Beispiel 2.35. Sei y ∈ R gegeben. Man finde alle x, für welche
menge der Ungleichung.
Lösung: Es gilt
x+5y
3
a, b 6= 0.
≤ 1 gilt; also die Lösungs-
x + 5y
(O60 )
(O5)
≤ 1 ⇔ x + 5y ≤ 3 ⇔ x ≤ 3 − 5y.
3
Die Lösungsmenge ist also gegeben durch L(y) := {x ∈ R : x ≤ 3 − 5y}. Diese hängt noch vom
tatsächlichen Wert von y ab.
2.2 Ganze, rationale und reelle Zahlen
31
Bemerkung 2.36. Wir haben hier eine verschärfte Version von (O6) verwendet, nämlich:
(O60 ) :
∀z > 0 : x ≤ y ⇔ z · x ≤ z · y.
Beispiel 2.37. Gesucht sind Lösungen der Ungleichung
Lösung: Wie vorhin erhalten wir
x2 +5y
3
≥ 1 für gegebenes y ∈ R.
x2 + 5y
≥ 1 ⇔ x2 ≥ 3 − 5y.
3
Da x2 ≥ 0 für alle x ∈ R, gilt die letzte Ungleichung immer falls 3 − 5y ≤ 0. Für den Fall
3 − 5y > 0, gilt weiter
p
p
x2 + 5y
≥ 1 ⇔ x ≥ 3 − 5y ∨ x ≤ − 3 − 5y,
3
Die Lösungsmenge der Ungleichung ist also
p
p
L = R \ (− 3 − 5y, 3 − 5y),
falls y ≥ 3/5,
falls: y ≤ 3/5.
sonst: L = R.
(a, b) = {x ∈ R : x > a ∧ x < b} bezeichnet hierbei das offene Intervall.
Ungleichungen dienen oft zum Abschätzen komplizierter Ausdrücke.
Beispiel 2.38. Man zeige, dass n2 ≤ n2 für alle n ∈ N, n ≥ 2 gilt.
Lösung: Es gilt
n · (n − 1) · (n − 2)!
n n−1
n
n!
=
= ·
≤ n · n = n2 .
=
2!(n − 2)!
2 · 1 · (n − 2)!
2
1
2
Beträge
Für reelle Zahlen x ∈ R definieren wir den Betrag von x durch
x,
falls x ≥ 0
|x| :=
−x, falls x < 0.
Der Betrag misst die absolute Größe einer Zahl.
Beispiel 2.39. Sei y ∈ R, y ≥ 0 gegeben. Man berechne die Lösungsmenge der Ungleichung
|x − 1| ≤ y.
Lösung: Nach Definition des Betrags gilt:
|x − 1| ≤ y ⇔ (x − 1 ≤ y ∧ x − 1 ≥ 0) ∨ (−(x − 1) ≤ y ∧ x − 1 < 0)
⇔ (x ≤ y + 1 ∧ x ≥ 1) ∨ (x ≥ 1 − y ∧ x < 1).
Die Lösungsmenge ist demnach gegeben durch
L = [1, y + 1] ∪ [1 − y, 1) = [1 − y, 1 + y].
32
Zahlenmengen und Rechentechniken
Man überzeugt sich relativ leicht, dass der Betrag folgende Eigenschaften hat.
Satz 2.40. Für alle x, y ∈ R gilt
(B1)
(B2)
(B3)
|x| ≥ 0 ∧ (|x| = 0 ⇔ x = 0)
|x · y| = |x| · |y|
|x + y| ≤ |x| + |y|
(definit)
(homogen)
(Dreiecksungleichung).
Beweis. Mit Fallunterscheidung; siehe Übung.
2.2.2
Reellwertige Funktionen einer Variablen
Zur Auffrischung des Schulwissens wollen wir einige bekannte Funktionen der Form f : R → R,
x 7→ f (x) betrachten. Da sowohl Werte- als auch Definitionsbereich die reellen Zahlen sind,
sprechen wir von reell-wertigen Funktionen einer reellen Variablen. Solche Funktionen lassen
sich einfach durch Darstellung (eines Teiles) ihres Funktionsgraphen
graph(f ) := {(x, f (x)) : x ∈ R} ⊂ R × R
visualisieren.
Polynomfunktionen
Seien a0 , . . . , an ∈ R mit an 6= 0 gegeben. Die Funktion
pn : R → R,
x 7→ a0 + a1 x + a2 x2 + . . . + an xn
heißt Polynom(funktion) vom Grad n mit Koeffizienten ai . (Reelle) Lösungen der Gleichung
pn (x) = 0
nennen wir (reelle) Nullstellen von pn .
Beispiel 2.41. Sei pn (x) := x2 + x − 2 (das ist kurz für: pn : R → R, x 7→ x2 + x − 2). Gesucht
sind die Nullstellen von pn .
Lösung: Nach Definition der Nullstellen suchen wir also nach Lösungen der Gleichung
x2 + x − 2 = 0.
Nach der p-q-Formel ist die Lösungsmenge gegeben durch
p
L = {−1/2 ± 1/4 + 2} = {−2, 1},
und dies ist gerade die Menge der Nullstellen von pn .
2.2 Ganze, rationale und reelle Zahlen
33
Die einfachsten Polynomfunktionen sind die konstante Funktion sowie die Identitätsabbildung
p0 : R → R, x 7→ a0
bzw.
id : R → R, x 7→ x.
Wir schreiben auch kurz: p0 (x) = a0 bzw. id(x) = x.
Winkelfunktionen
Wir bezeichnen im Folgenden mit x den Winkel im Bogenlängenmaß. Die Funktionen sin(x)
und cos(x) sind durch folgende Skizze definiert
Definition der Winkelfunktionen
Aus der Skizze und dem Satz von Pythagoras folgt für jedes x ∈ R
| sin(x)| ≤ 1,
| cos(x)| ≤ 1 und
sin(x)2 + cos(x)2 = 1.
Weiter sieht man, dass sin und cos periodisch sind, d.h.,
sin(2πn + x) = sin(x),
cos(2πn + x) = cos(x)
∀x ∈ R, n ∈ Z.
Ebenfalls aus der Skizze ablesbar ist die Verschiebungsregel
cos(x) = sin(x + π/2).
Schließlich bemerken wir die Gültigkeit der folgenden Winkelsummensätze (Additionstheoreme)
sin(x ± y) = sin x · cos y ± sin y · cos x
cos(x ± y) = cos x · cos y ∓ sin x · sin y.
Diese Formeln werden wir später mit Hilfe komplexer Zahlen zeigen.
Exponentialfunktion und Logarithmus
Über die besondere Bedeutung der Euler’schen Zahl e ≈ 2.7182818 werden wir später noch
berichten. Wir definieren die Exponentialfunktion
exp : R → R,
x 7→ exp(x) := ex .
Aus der Definition ergeben sich sofort folgende elementare Eigenschaften:
exp(x + y) = exp(x) · exp(y)
exp(0) = 1,
exp(−x) = 1/ exp(x),
exp(x) > 0,
34
Zahlenmengen und Rechentechniken
welche für alle x ∈ R gelten. Wir werden später sehen, dass
x2 x 2
exp(x) = 1 + x +
+
+ ...
2!
3!
gilt. Hieraus sieht man auch, dass für x ≥ 0 die Abschätzung exp(x) ≥ 1 + x gilt.
Aus der Definition folgt weiterhin, dass die Exponentialfunktion streng monoton, und daher
injektiv ist. Schänkt man den Wertebereich geeignet ein, kann man eine Umkehrfunktion
log : R+ → R,
x 7→ log(x) = exp−1 (x).
Hierbei bezeichnet exp−1 die Umkehrfunktion der Exponentialfunktion.
Achtung: Mit log bezeichnen wir hier den natürlichen Logarithmus.
Beispiel 2.42. Nach Definition gilt exp(0) = 1 und exp(1) = e. Wendet man die Umkehrfunktion an, und benutzt dass f −1 (f (x)) = x gilt, so erhält man
0 = log(1),
1 = log(e) sowie
log(exp(x)) = x = exp(log(x)).
Weiterhin gelten folgende Rechenregeln, die sich sofort aus den Regeln für die Exponentialfunktion ergeben:
log(x · y) = log(x) + log(y),
log(xy ) = y · log(x),
log(1/x) = − log(x).
Auch die Logarithmusfunktion ist streng monoton wachsend.
Logarithmus und Exponentialfunktion
Aufgaben
Aufgabe 2.1. Berechnen Sie folgende Ausdrücke explizit und die Summen zusätzlich mit Formeln von diesem Blatt.
9
4
3 5
X
X
X
Y
1
1
3
2
a)
k
b)
c)
d)
k
2
k
k
k=3
k=0
k=0
k=1
2.2 Ganze, rationale und reelle Zahlen
35
Aufgabe 2.2. Sei n ∈ N0 . Zeigen Sie per vollständiger Induktion.
Pn
1
2
(a)
k=0 k = 6 n(n + 1)(2n + 1).
P
n+1
(b) Geometrische Summenformel: nk=0 q k = q q−1−1 für q ∈ R mit q 6= 1.
P
+ b)n .
(c) Binomische Formel: nk=0 nk akbn−k = (a
n
Hinweis: Verwenden Sie k−1
+ nk = n+1
falls k > 0.
k
Aufgabe 2.3. Zeigen Sie mit Hilfe von Aufgabe 2, dass
Pn
n
n
(a)
k=0 k = 2 für alle n ∈ N0 .
Pn
n
k
(b)
k=0 k (−1) = 0 für alle n ∈ N.
P
(c) (a − b) nk=0 ak bn−k = an+1 − bn+1 für alle n ∈ N0 und a, b ∈ R.
Hinweis: Für b 6= 0, verwenden Sie die geometrische Summenformel (A.2b) mit q = a/b.
Aufgabe 2.4. Sei n ∈ N. Transformieren Sie den (Lauf-) Index in der/dem Summe/Produkt.
P9
(a)
k=2 (k + 2), gemäß der Beziehung l = k + 1.
Q49
(b) k=23 (k − 1)(k + 2)(k + 5), gemäß der Beziehung l − 7 = −k.
Pn
1
(c)
k=1 k(k+1) , gemäß der Beziehung l − 1 = k.
Qp
Pn
3
(d)
s=4 (s + 2) , gemäß der Beziehung p + 1 = k und s − 2 = t.
p=5 p ·
Aufgabe 2.5. Seien x, y ∈ R. Zeigen Sie die folgenden Ungleichungen:
√
(a) Falls x, y ≥ 0, dann gilt xy ≤ x+y
.
2
√
√
√
(b) Falls x, y ≥ 0, dann gilt x + y ≤ x + y.
√
√
(c) Falls x, y > 0, dann gilt x + y ≤ √xy + √yx .
1
(d) Falls |x| < 1 und n ∈ N0 , dann gilt (1 + x)n ≤ (1−x)
n.
√
Aufgabe 2.6. Zeigen Sie, dass 3 keine rationale Zahl ist.
Aufgabe 2.7 (Satz von Archimedes). Zeigen Sie, dass die Menge N der natürlichen Zahlen
nicht nach oben beschränkt ist.
Hinweis: Nehmen Sie dazu an, N wäre nach oben beschränkt. Wenden Sie dann Satz 2.27 an
und führen Sie einen Widerspruch herbei.
Aufgabe 2.8. Zeigen Sie die Aussagen von Folgerung 2.33.
Aufgabe 2.9.
(a) Sei y ∈ R. Für welche x ∈ R gilt (x − y)2 ≤ 2?
(b) Für welche x ∈ R gilt |x3 − 5| ≤ 5?
(c) Für welche x ∈ R gilt
|x−1|
|x+1|+1
≤ 12 ?
36
Zahlenmengen und Rechentechniken
Aufgabe 2.10. Bestimmen Sie, ob die folgenden Mengen beschränkt sind und geben Sie gegebenenfalls Infimum, Supremum, Minimum und Maximum an.
(a) M = {x : x2 − 10x ≤ 24}.
|x|
: x ∈ R}.
(b) N = { 1+|x|
(c) P = { m+n
: m, n ∈ N}.
m·n
Aufgabe 2.11. Seien a, b ∈ R. Zeigen Sie mit Hilfe der Körper- und Ordnungsaxiome, dass
(a) −a ≥ −b, falls a ≤ b.
(b) (−1) · (−1) = 1.
(c) a2 ≥ 0 und a2 > 0 falls a 6= 0.
(d) a > 0 ⇒
(e)
1
a
≥
1
b
1
a
> 0.
für 0 < a ≤ b.
(f) (ab)−1 = a−1 b−1 für a, b 6= 0.
3
Komplexe Zahlen
Da für alle reellen Zahlen x das Quadrat x2 = x · x ≥ 0 und −1 < 0 ist, kann die Gleichung
x2 = −1
keine reelle Lösung besitzen. Wie zuvor erweitern wir unseren Zahlenbereich, um auch solche
Gleichungen lösen zu können. Wir definieren eine neue Zahl i mit der Eigenschaft i2 = −1.
Definition 3.1 (Komplexe Zahlen). Unter einer komplexen Zahl verstehen wir einen Ausdruck der Form
z = a + ib,
a, b ∈ R
Hierbei heißt a =: Re z Realteil und b =: Im z Imaginärteil von z. Für komplexe Zahlen gilt
z1 = z2 :⇔ Re(z1 ) = Re(z2 ) ∧ Im(z1 ) = Im(z2 ).
Die Menge aller komplexen Zahlen wird mit C bezeichnet.
Wir müssen noch festlegen, wie mit komplexen Zahlen überhaupt gerechnet wird.
Satz 3.2. Für komplexe Zahlen z1 = a1 + ib1 , z2 = a2 + ib2 definieren wir
Addition: z1 + z2 := (a1 + a2 ) + i(b1 + b2 )
Multiplikation: z1 · z2 := (a1 · a2 − b1 · b2 ) + i(a1 · b2 + b1 · a2 ).
Zusammen mit diesen Operationen bilden die komplexen Zahlen einen Körper, d.h., es gelten
die Körperaxiome (A1)–(A4), (M1)–(M4) und (D).
Beweis. Übung.
Bemerkung 3.3.
• Wir werden später sehen, dass auch die komplexen Zahlen vollständig sind, d.h., die
komplexe Zahlenebene hat keine “Löcher”.
• Die komplexen Zahlen lassen sich nicht anordnen: Wäre i > 0 (i < 0), dann müsste
−1 = i2 > 0 sein, was im Widerspruch zu 1 > 0 steht.
38
Komplexe Zahlen
Bemerkung 3.4. Jede reelle Zahl a ∈ R lässt sich mit der komplexen Zahl z = a + i0
identifizieren. In diesem Sinne gilt R ⊂ C. Weiters schreiben wir
a + i0 = a + 0i = a
sowie
0 + ib = ib = bi.
Komplexe Zahlen der Form a + i0 (bzw. 0 + ib) heißen (rein) reell (bzw imaginär).
Beispiel 3.5. Man überzeuge sich von der Richtigkeit der folgenden Aussagen:
• i2 = (−i)2 = −1.
• Sei z = a + ib. Dann gilt ∀x ∈ R : x · z = (x · a) + i(x · b).
Definition 3.6. Für jede komplexe Zahl z := a + ib ∈ C definieren wir:
• Konjugierte: z := a − ib
√
• Betrag: |z| := a2 + b2 (entspricht Abstand zum Nullpunkt)
• (Haupt-)Argument: Arg(z) := φ ∈ [0, 2π) für z 6= 0 (Winkel zur reellen Achse)
Beispiel 3.7. Mithilfe der Definitionen verifiziert man leicht die folgenden Regeln
• Re(z) = 12 (z + z) und Im(z) =
1
(z
2i
− z),
• z · z = |z|2 sowie z = z,
• z1 + z2 = z1 + z2 und z1 · z2 = z1 · z2 ,
welche für alle komplexen Zahlen z, z1 , z2 gelten.
Beispiel 3.8. Die Regeln für den Betrag einer reellen Zahl gelten wörtlich, d.h.
• |z| ≥ 0 und |z| = 0 ⇔ z = 0 (Definitheit)
• |z1 · z2 | = |z1 | · |z2 | (Homogenität)
• |z1 + z2 | ≤ |z1 | + |z2 | (Dreiecksungleichung).
Beispiel 3.9. Die Division komplexer Zahlen lässt sich wie folgt durchführen: Seien z1 , z2 ∈ C
gegeben. Dann erhält man durch Erweitern des Nenners
z1
z1 z2
z1 · z2
1
=
·
=
=
(z1 · z2 ).
z2
z2 z2
z2 · z2
|z2 |2
Die Division komplexer Zahlen lässt sich also auf Multiplikation komplexer und Division reeller
Zahlen zurückführen. Man beachte: Für z2 = 0 (|z2 |2 = 0), ist der Bruch nicht definiert!
39
Bemerkung 3.10. Wir können jede komplexe Zahl z = a + ib ∈ C mit dem Punkt (Vektor)
(a, b) ∈ R × R der Zahlenebene identifizieren
Darstellung komplexer Zahlen
Die Addition entspricht genau der Addition der Vektoren. Realteil Re(z) sowie Imaginärteil
Im(z) ergeben sich als Abschnitte auf der reellen bzw. imaginären Achse. Bei der Multiplikation wird die Länge der Vektoren multipliziert, und Ihre Winkel addiert (vgl. Satz Moivre).
Weiters lassen sich Argument und Betrag der komplexen Zahl leicht ablesen. Aus der Darstellung erkennt man
z = a + ib = |z| cos φ + i|z| sin φ = |z|(cos φ + i sin φ)
mit φ := Arg(z). Diese Form heißt Polarkoordinatendarstellung von z.
Bemerkung 3.11.
• Wir werden später sehen, dass auch die komplexen Zahlen vollständig sind: die komplexe
Zahlenebene hat keine “Löcher”.
• Die komplexen Zahlen lassen sich nicht anordnen: Wäre i > 0 (i < 0), dann müsste
−1 = i2 > 0 sein, was im Widerspruch zu 1 > 0 steht.
Mit Hilfe der Polarkoordinatendarstellung und der Winkelsummensätze erhält man folgendes
Ergebnis für ganzzahlige Potenzen komplexer Zahlen.
Satz 3.12 (Moivre). Sei z = |z|(cos φ + i sin φ). Dann gilt
z n = z · . . . · z = |z|n cos(nφ) + i sin(nφ) .
Beweis. Die Aussage kann elementar aus den Winkelsummensätzen hergeleitet werden. Sie
folgt jedoch leichter aus den Rechenregeln für die komplexe Exponentialfunktion (siehe unten).
Bemerkung 3.13. Die n-te Potenz einer komplexen Zahl lässt sich gut in der komplexen Ebene
visualisieren. Dabei wird einfach die Länge mit n potenziert, und der Winkel ver-n-facht.
Definition 3.14 (Euler’sche Formel). Für φ ∈ R definieren wir
exp(iφ) := eiφ := cos φ + i sin φ.
40
Komplexe Zahlen
Wir werden später sehen, dass diese Definition der Exponentialfunktion für komplexe Argumente mit der für natürliche (rationale, reelle) Argumente übereinstimmt. Die wesentliche Eigenschaft dieser Definition ist, dass sich alle Rechenregeln für Potenzen übertragen lassen.
Satz 3.15. Für alle a, b, c ∈ R und z1 , z2 ∈ C gilt
(ez1 )z2 = ez1 ·z2 ,
e−z1 = 1/ez1 ,
ex+iy = ex · eiy ,
ez1 +z2 = ez1 · ez2 ,
e0 = ei2mπ = 1,
ez1 +i2mπ = ez1
∀m ∈ Z.
Die Aussagen folgen zum Teil aus der Definition. Ein vollständiger Beweis wird später im Rahmen von Potenzreihen (und der Definition der Exponentialfunktion als Potenzreihe) erbracht.
Beispiel 3.16. Wir benutzen die Euler’sche Formel und die Rechenregeln für Potenzen um die
Formel von Moivre zu bestätigen. Es gilt mit φ = Arg(z) und x = elog x , dass
n
z n = |z|(cos φ + i sin φ) = (elog |z| · eiφ )n = en log |z| · einφ
n
= elog(|z| ) einφ = |z|n (cos(nφ) + i sin(nφ)).
Bemerkung 3.17. Ganz analog gilt für das Multiplizieren von komplexen Zahlen z1 und z2
mit Argumenten φ1 = Arg(z1 ), φ2 = Arg(z2 ), dass
z1 · z2 = |z1 |eiφ1 · |z2 |eiφ2 = |z1 ||z2 |ei(φ1 +φ2 ) .
Merkregel: Beim Multiplizieren von komplexen Zahlen werden die Beträge multipliziert, und
die Argumente addiert.
Die Foreml von Moivre kann auch dazu verwendet werden, um ganzzahlige Wurzeln aus einer
komplexen Zahl zu ziehen, d.h., Lösungen für die Gleichung
zn = a
für gegebenes a ∈ C zu bestimmen.
Folgerung 3.18 (Wurzeln). Für jede komplexe Zahl a 6= 0 und jedes n ∈ N gibt es genau n
verschiedene komplexe Zahlen z0 , . . . , zn−1 mit zkn = a für k = 0, . . . , n − 1.
Beweis. Jede Zahl z besitzt eine Polarkoordinatendarstellung z = |z|eiφ mit φ = Arg(z) ∈
!
[0, 2π), ebenso auch a = |a|eiα . Die Gleichung z n = a ist dann äquivalent zu
!
z n = |z|n einφ = a = |a|eiα = |a|ei(α+2kφ)
für ein k ∈ Z,
wobei im letzten Schritt verwendet wurde, dass ei2kπ = 1 gilt. Vergleicht man die Beträge und
Argumente der Zahlen, so erhält man die äquivalenten Bedingungen
|z| = |a|1/n
und
φ = (α + 2kπ)/n
für k ∈ Z.
41
Die Lösungsmenge der Gleichung besteht also aus allen Zahlen der Form
zk := |a|1/n ei(α+2kπ)/n ,
k ∈ Z.
Nutzt man wieder aus, dass ei2mπ = 0 für m ∈ Z, so sieht man, dass die Lösungsmenge bereits
gegeben ist durch
L = {zk ∈ C : 0 ≤ k ≤ n − 1},
es existieren also genau n verschiedene Wurzeln. Wir machen noch die Probe: Für zk ∈ L gilt
n
n
1/n i(α+2kπ)/n
zk = |a| e
= |a|ei(α+2kπ) = |a|eiα · ei2kπ = |a|eiα = a.
Bemerkung 3.19. Aus dem Beweis sieht man sogar noch mehr: Für jede komplexe Zahl a 6= 0
gibt es genau n verschiedene Wurzeln. Diese liegen gleichmäßig verteilt auf dem Kreis mit
Radius |a|1/n , d.h., der Abstand zwischen den Argumenten (Winkeln) der einzelnen Wurzeln
ist immer gleich. Man beachte hierzu die folgenden Beispiele und die zugehörige Darstellung
der Wurzeln.
Beispiel 3.20.
• Die Gleichung z 2 = 1 = ei0 hat zwei Lösungen, nämlich
z1 = ei0/2 = 1
und
z2 = ei(0+2π)/2 = eiπ = −1.
• Die n-ten Wurzeln von 1 = ei0 gegeben durch zk = ei2(k−1)π/n heißen Einheitswurzeln.
• Die Gleichung z 2 = −1 = eiπ hat ebenfalls zwei Lösungen, nämlich
z1 = eiπ/2 = i
und
z2 = ei(π+2π)/2 = ei3π/2 = −i.
• Für z 3 = −2(1 − i) gibt es drei Lösungen: Es gilt φ = Arg(z 3 ) = 3π/4 und |z 3 | = |2||(1 −
√
√ 3
√
√ i(3π/4)/3
erfüllen alle Wurzeln
|z| = 2 und es√gilt z1 = 2e
=
i)| = 2 2 = 2 . Somit
√
√
√
√
1
iπ/4
i(3π/4+2π)/3
i11π/12
2e
= 1 + i, z2 = 2e
= 2e
= 2 (−1 − 3 + i(−1 + 3)), sowie
√ i(3π/4+2·2π)/3
√
√ i19π/12 1
√
z3 = 2e
= 2e
= 2 (−1 + 3 + i(−1 − 3)).
Darstellung der Wurzeln komplexer Zahlen
42
Komplexe Zahlen
Man beachte: Die Wurzeln zk der Zahl a sind gerade die Nullstellen der komplexen Polynomfunktion z n − a = 0. Die folgenden Sätze zeigen, dass auch allgemeinere Polynome vom Grad
≤ n gerade wieder n Nullstellen besitzen.
Satz 3.21 (Hauptsatz der Algebra). Sei n ∈ N und pn (z) := an z n + an−1 z n−1 + . . . + a1 z 1 + a0
eine komplexe Polynomfunktion vom Grad n (d.h. ak ∈ C, an 6= 0). Dann hat pn mindestens
eine Nullstelle zn ∈ C, also pn (zn ) = 0.
Beweis. Der Beweis wird hier nicht erbracht.
Bemerkung 3.22. Ist z1 eine Nullstelle des Polynoms pn (z) vom Grad n, dann existiert genau
ein Polynom pn−1 (z) vom Grad n − 1 sodass
pn (z) = (z − z1 ) · pn−1 (z)
gilt. Dies zeigt man mit Hilfe der Polynomdivision. Hierzu ein Beispiel: Sei pn (z) = z 3 − z 2 −
z + 1. Dann ist z = 1 eine Nullstelle, und es gilt
z 3 − z 2 − z + 1 = (z − 1) · z 2 + z 2 +(−z 2 − z + 1) = (z − 1) · z 2 + (−z + 1)
{z
}
| {z }
|
=z 3
=−(z−1)
2
= (z − 1) · (z − 1).
Aus der Existenz einer Nullstelle folgt mittels Polynomdivision, dass sogar n Nullstellen vorliegen. Auch das folgende Ergebnis wird deshalb als “Hauptsatz der Algebra” bezeichnet.
Folgerung 3.23 (Hauptsatz der Algebra). Jedes komplexe Polynom vom Grad n besitzt genau
n komplexe Nullstellen zk , k = 1 . . . , n, und es gilt die Zerlegung in Linearfaktoren
pn (z) = an (z − z1 ) · . . . · (z − zn ).
Die Nullstellen sind bis auf Umordnung eindeutig.
Beweis. Wir zeigen die Existenz der Darstellung mittels vollständiger Induktion:
(IA): Jedes Polynom vom Grad 1 besitzt die Form p1 (z) = a1 z + a0 = a1 (z − a0 /a1 ), was die
Behauptung für n = 1 ist. Man beachte, dass a1 6= 0 (sonst wäre der Grad des Polynoms nicht
1), und dass die Darstellung eindeutig ist!
(IV): Für n ≥ 1 besitze jedes Polynom pn (z) eine eindeutige Zerlegung wie oben angegeben.
(IS): Sei pn+1 (z) = an+1 z n+1 + . . . + a0 ein Polynom vom Grad n + 1. Nach dem Hauptsatz der
Algebra existiert eine Nullstelle zn+1 sowie ein Polynom pn (z) vom Grad n mit pn+1 (z) = (z −
zn )pn (z). Für das Polynom pn (z) existiert aber nach Induktionsvoraussetzung eine Zerlegung
in Linearfaktoren, was die Behauptung für n + 1 zeigt.
Die Eindeutigkeit wird hier nicht gezeigt (vgl. aber mit dem Satz über Eindeutigkeit).
43
Bemerkung 3.24. Jedes Polynom mit komplexen (oder auch reellen) Koeffizienten besitzt also
genau n komplexe Nullstellen. Es kann ein und dieselbe Nullstelle auch mehrfach auftreten. Man
spricht dann von der (algebraischen) Vielfachheit der Nullstelle, z.B. hat
p3 (z) := (z 3 − z 2 − z + 1) = (z − 1)2 (z + 1)
die Nullstellen 1 (mit Vielfachheit 2) und −1 (mit Vielfachheit 1). Das ergibt (unter Berücksichtigung der Vielfachheit) genau 3 Nullstellen.
Satz 3.25 (Eindeutigkeit). Jedes komplexe Polynom pn (z) vom Grad n ist durch seine Werte
an n + 1 paarweise verschiedenen Stellen zk , k = 0, . . . , n, bereits eindeutig bestimmt.
Beweis. Seien pn (z) und p̃n (z) zwei Polynome mit
pn (zk ) = p̃n (zk ) ∀k ∈ {0, . . . , n},
d.h. pn − p̃n hat n + 1 paarweise verschiedene Nullstellen. Weiterhin hat die Differenz der
Polynome maximal Grad g ≤ n. Wäre g ≥ 1, dann hätte pn − p̃n nach der Folgerung aus dem
Hauptsatz der Algebra genau g Nullstellen, was einen Widerspruch ergäbe. Also ist g = 0, und
damit
pn (z) − p̃n (z) = pn (z0 ) − p̃n (z0 ) = 0 ∀z ∈ C.
Aufgaben
Aufgabe 3.1. Verifizieren Sie die Aussagen von Beispiel 3.5.
Aufgabe 3.2. Berechnen Sie Real-, Imaginärteil, Betrag und Argument für die komplexen
Zahlen
√
z1 = (1 + i),
z2 = −i,
z3 = 3 − i;
und skizzieren sie die Zahlen in der komplexen Ebene.
Aufgabe 3.3. Berechnen Sie für die Zahlen aus Aufgabe 3.2 jeweils zk , 1/zk sowie z 3 .
Aufgabe 3.4. Berechnen sie für die Zahlen aus Aufgabe 3.2 die Ausdrücke
a1 = z1 · z2 ,
a2 = z1 /z2 ,
a3 = (z2 + z3 )/z1 .
Aufgabe 3.5. Geben Sie die Resultate ak aus Aufgabe 3.4 in Polarkoordinatendarstellung an.
Aufgabe 3.6. Zeigen Sie, dass (C, +, ·) die Körperaxiome erfüllt.
Aufgabe 3.7. Skizzieren Sie die Mengen
M1 := {z ∈ C : |z − 1| ≤ 1},
M2 := {z ∈ C : −1 ≤ Re(z) ≤ Im(z) ≤ 1}.
44
Komplexe Zahlen
Aufgabe 3.8. Überprüfen Sie die Rechenregeln für die Konjugation aus Beispiel 3.7.
Aufgabe 3.9. Zeigen Sie per vollständiger Induktion, dass
n
Y
k=1
zk =
n
Y
k=1
zk
und
n
X
k=1
zk =
n
X
zk
∀zk ∈ C, k ∈ {1, . . . , n}.
k=1
Aufgabe 3.10. Verifizieren Sie die Regeln für den Betrag aus Beispiel 3.8.
Aufgabe 3.11. Man zeige mittels Euler’scher Formel die Darstellung der Winkelfunktionen:
1
cos φ = (eiφ + e−iφ )
2
und
sin φ =
1 iφ
(e − e−iφ ).
2i
Aufgabe 3.12. Beweisen Sie mit Hilfe der Euler’schen Formel, den Rechenregeln für Potenzen
sowie Aufgabe 3.11 die Winkelsummensätze
sin(x ± y) = sin x · cos y ± sin y · cos x
cos(x ± y) = cos x · cos y ∓ sin x · sin y.
Aufgabe 3.13. Berechnen Sie alle Lösungen der Gleichung (z −
√
2(−1 + i))4 = 16.
Aufgabe 3.14. Das Polynom p2 (z) := a2 z 2 + a1 z + a0 habe reelle Koeffizienten ak ∈ R. Zeigen
Sie mit Hilfe der Rechenregeln für die Konjugation, dass die beiden Nullstellen z1 , z2 von p2
komplex-konjugiert sind, d.h., z1 = z2 .
Aufgabe 3.15. Verallgemeinern Sie die Beobachtung aus Aufgabe 3.14 auf Polynome mit
beliebigem Grad.
Aufgabe 3.16. Zeigen Sie, dass jedes Polynome pn (z) mit ungeradem Grad n und reellen
Koeffizienten mindestens eine reelle Nullstelle besitzt.
Aufgabe 3.17. Das Polynom p4 (z) = z 4 + 3z 3 + 3z 2 + 2z + 1 lässt sich faktorisieren á la
p4 (z) = (z + 1) · p3 (z). Berechnen Sie mittels Polynomdivision (bzw. Koeffizientenverlgeich) das
Polynom p3 .
Aufgabe 3.18. Berechnen Sie alle Nullstellen von p3 (z) = z 3 + 2z 2 − z − 2.
Hinweis: Eine Nullstelle durch Probieren; dann Polynomdivision.
Aufgabe 3.19. Finden Sie alle Nullstellen von p3 (z) = z 3 − z 2 + z − 1.
4
Lineare Gleichungssysteme
Einführende Beispiele
Wir betrachten das lineare Gleichungssystem (LGLS)
x1 + x2 = 2
2x1 + x2 = 3
(I)
(II).
Wir sprechen von einem Gleichungssystem (GLS), da mehrere Gleichungen in mehreren Unbekannten gleichzeitig gelöst werden. Das GLS heißt linear, da die Unbekannten x1 und x2 nur
linear (in erster Potenz) auftreten.
Unter einer Lösung des GLS (I),(II) verstehen wir Zahlenpaare (x1 , x2 ) ∈ R × R, welche die
beiden Gleichungen (I) und (II) simultan lösen. Die Menge aller Lösungen
L := {(x1 , x2 ) ∈ R × R : (I) ∧ (II)}
= {(x1 , x2 ) ∈ R2 : (I)} ∩ {(x1 , x2 ) ∈ R2 : (II)}
heißt Lösungsmenge des GLS (I),(II).
Zur Bestimmung der Löungsmenge kann man wie folgt vorgehen: Addiert man zur zweiten
Gleichung das (−2)-fache der ersten, erhält man
−x2 = −1
(II’)
mit (II’) = (II)-2·(I). Man beachte: Löst (x1 , x2 ) die Gleichungen (I) und (II), dann auch die
Gleichung (II’). Dies folgt sofort aus den Axiomen für reelle Zahlen. Es folgt sogar, dass (x1 , x2 )
Lösung von (I) und (II) ist, genau dann wenn (x1 , x2 ) auch Lösung von (I) und (II’) ist. Das
heißt: Für alle (x1 , x2 ) ∈ R × R gilt
(I) ∧ (II) ⇔ (I) ∧ (II 0 ).
Wir nennen die Gleichungssysteme (I),(II) und (I),(II’) daher äquivalent. Das System
x1 + x 2 = 2
−x2 = −1
(I)
(II’)
46
Lineare Gleichungssysteme
kann relativ einfach gelöst werden. Multipliziert man die zweite Gleichung mit (−1) sieht man
sofort, dass x2 = 1 sein muss. Addiert man die zweite Gleichung zur ersten, erhält man das
System
x1 = 1
x2 = 1
(I’)
(II”),
welches wiederum äquivalent ist zu den Systemen (I),(II) sowie (I),(II’). Nun lässt sich die
Lösung aber sofort ablesen, und aufgrund der Äquivalenz erhalten wir: Das GLS (I),(II) besitzt
genau eine Lösung (x1 , x2 ) = (1, 1) in R × R. Die Lösungsmenge ist also gegeben durch
L = {(x1 , x2 ) ∈ R × R : (I) ∧ (II)} = {(1, 1)}.
Betrachtungen zur Lösbarkeit
Wie die folgenden Beispiele zeigen, muss ein lineares Gleichungssystem im Allgemeinen keine
(eindeutige) Lösung besitzen.
Beispiel 4.1. Wir betrachten zunächst die lineare Gleichung (System mit einer Gleichung und
einer Unbekannten)
a · x = y,
wobei a, y ∈ R gegeben seien. Um die Frage nach der Lösbarkeit zu beantworten, müssen drei
Fälle unterschieden werden:
Fall 1 (a 6= 0): Es existiert (für jedes y ∈ R) genau eine Lösung x = a−1 y.
Fall 2 (a = 0, y 6= 0): Wir haben es also mit der Gleichung 0 · x = y 6= 0 zu tun. Da 0 · x = 0
für alle x ∈ R ist, kann keine Lösung existieren.
Fall 3 (a = 0, y = 0): In diesem Fall reduziert sich die Gleichung auf 0 · x = 0, und jedes x ∈ R
ist Lösung der Gleichung. Man hat also unendlich viele Lösungen.
Dieselben Fälle treten auch bei LGLSen mit zwei Gleichungen in zwei Unbekannten auf.
Beispiel 4.2. Für gegebene Zahlen a, b ∈ R betrachten wir das lineare GLS
x1 + ax2 = b
2x1 + x2 = 3
(I)
(II).
Addiert man wie oben das (−2)-fache der ersten Zeile zur zweiten, erhält man das äquivalente
System
x1 + ax2 = b
(1 − 2a) x2 = 3 − 2b
Zur Lösung müssen wir wieder drei Fälle unterscheiden:
(I)
(II’).
47
Fall 1 (1 − 2a 6= 0): Die zweite Gleichung lässt sich in diesem Fall durch (1 − 2a) dividieren,
und das a/(1 − 2a)-fache der zweiten Gleichung kann von der ersten subtrahiert werden. Man
erhält das äquivalente System
x1 = b − a(3 − 2b)/(1 − 2a)
x2 = (3 − 2b)/(1 − 2a)
(I’)
(II”).
Für jedes beliebige b erhält man die eindeutige Lösung (x1 , x2 ) = (3 − 2b)/(1 − 2a), b −
a(3 − 2b)/(1 − 2a) .
Fall 2 (1 − 2a = 0, 3 − 2b 6= 0): Die Gleichung (II’) lautet dann 0 · x2 = 3 − 2b 6= 0, und es
existiert kein x2 welches diese Bedingung erfüllt. Es kann also keine Lösung existieren.
Fall 3 (1 − 2a = 0, 3 − 2b = 0): Die Gleichung (II’) lautet in diesem Fall 0 · x2 = 0, und diese
ist für jedes beliebige x2 ∈ R erfüllt. In diesem Fall ist also für jedes (x1 , x2 ) ∈ R × R
(I) ∧ (II) ⇔ (I) ∧ (II’) ⇔ (I).
Die Gleichung (I) lässt sich weiter umformen, und das System (I),(II) ist somit äquivalent zu
x1 = b − a · x2
(I”).
Für jede Wahl x2 = t ∈ R ist (x1 , x2 ) = (b − at, t) Lösung der Gleichung. Die Lösungsmenge
(diese hängt noch von den Werten für a und b ab) lautet also
L(a, b) = {(b − at, t) : t ∈ R}
falls 1 − 2a = 0, 3 − 2b = 0.
Geometrische Deutung
Bemerkung 4.3. Eine Gleichung in zwei Unbekannten hat als Lösungsmenge eine Gerade in
der Zahlenebene R × R (die Gleichung 0 · x1 + 0 · x2 = 0 hat als Lösungsmenge ganz R × R,
und 0 · x1 + 0 · x2 = c 6= 0 hat keine Lösung). Die Lösungsmenge eines Gleichungssystems von
n Gleichungen in 2 Unbekannten ergibt sich als Schnitt der Lösungsmengen, etwa
L = {(x1 , x2 ) ∈ R × R : (I) ∧ (II) ∧ (III)}
= {(x1 , x2 ) ∈ R : (I)} ∩ {(x1 , x2 ) ∈ R : (II)} ∩ {(x1 , x2 ) ∈ R : (III)}.
Der Fall 1 − 2a 6= 0 in obigem Beispiel bedeutet gerade, dass die beiden Lösungsgeraden zu
den Gleichungen (I) und (II) nicht parallel verlaufen. Im Fall 2 sind die Geraden parallel (aber
nicht gleich), und im Fall 3 sind die Geraden gleich.
48
Lineare Gleichungssysteme
Lösungsmenge eines Gleichungssystems mit 2 Unbekannten als Schnitt von Geraden
Bemerkung 4.4. Eine Gleichung in drei Unbekannten x1 , x2 , x3 hat als Lösungsmenge eine
Ebene im Zahlenraum R × R × R = R3 (abgesehen von den Spezialfällen). Die Lösungsmenge
eines Gleichungssytems von n Gleichungen erhält man wieder als Schnitt der Lösungsmengen
der einzelnen Gleichungen. Die Lösungsmenge des Gleichungssystems
x1 + x2 + x3 = 1
− x2 + x3 = 0
(I)
(II)
lässt sich wie folgt berechnen: Aus (II) folgt x2 = x3 , und Einsetzen in (I) liefert x1 = 1 − x2 −
x3 = 1 − 2x3 . Daraus folgt
L = {(x1 , x2 , x3 ) ∈ R3 : (I) ∧ (II)}
= {(x1 , x2 , x3 ) : (I)} ∩ {(x1 , x2 , x3 ) : (II)}
= {(x1 , x2 , x3 ) : x2 = x3 ∧ x1 = 1 − 2x3 } = {(1 − 2t, t, t) : t ∈ R},
wobei wir im letzten Schritt x3 durch die Variable t ersetzt haben. Die zweite Zeile drückt die
Lösungsmenge (Gerade) als Schnitt der durch die beiden Gleichungen beschriebenen Ebenen
aus.
Lösungsmenge eines Gleichungssystems in 3 Unbekannten als Schnitt von Ebenen
49
Allgemeine lineare Gleichungssysteme
Definition 4.5. Ein System
a11 x1
a21 x1
..
.
+ a12 x2
+ a22 x2
..
.
am1 x1 + am2 x2
+ . . . + a1n xn = y1
+ . . . + a2n xn = y2
..
..
..
.
.
.
+ . . . + amn xn = ym
(G1)
(G2)
..
.
(Gm)
mit reellen (komplexen) Koeffizienten aij und rechten Seiten yi für 1 ≤ i ≤ m und 1 ≤ j ≤
n heißt reelles (komplexes) lineares Gleichungssystem (LGLS) mit m Gleichungen in n
Unbekannten (x1 . . . . , xn ). Ein n-Tupel (l1 , . . . , ln ) ∈ Rn (bzw Cn ) heißt Lösung des LGLSs,
wenn bei Einsetzen der Werte li für xi alle Gleichungen simultan erfüllt werden. Die Menge
L := {(l1 , . . . , ln ) ∈ Rn : (l1 , . . . , ln ) ist Lösung} heißt Lösungsmenge des LGLSs.
Bemerkung 4.6.
• Ist y1 = y2 = . . . = ym = 0, so heißt das GLS homogen, sonst inhomogen.
• Gilt m > n (mehr Gleichungen als Unbekannte), so heißt das System überbestimmt,
im Falle m < n (weniger Gleichungen als Unbekannte) unterbestimmt.
Um die Lösungsmenge eines LGLSs zu bestimmen, gehen wir genauso vor, wie in den vorigen
Beispielen, d.h., wir überführen das GLS durch elementare Umformungen auf einfachere Gestalt,
die erlaubt die Lösungsmenge relativ einfach abzulesen.
Definition 4.7 (Elementare Zeilenumformungen). Unter einer elementaren Zeilenumformung verstehen wir
(i) das Vertauschen zweier Zeilen (Gleichungen): (Gi),(Gj)↔(Gj),(Gi)
(ii) das Multiplizieren einer Gleichung mit einer Zahl λ 6= 0: (Gi)↔ λ·(Gi)
(iii) das Addieren einer Zeile zu einer anderen: (Gi),(Gj)↔(Gi),(Gj)+(Gi).
Zwei Gleichungssysteme, die durch elementare Zeilenumformungen ineinander überführt werden
können heißen äquivalent.
Bemerkung 4.8. Die Symbole ↔ sind so zu verstehen, dass die Gleichungen auf der linken
Seite durch die Gleichungen auf der rechten Seite ersetzt werden. Dieses Ersetzen kann auch
rückgängig gemacht werden. Man beachte, dass für alle (x1 , . . . , xn ) ∈ Rn , alle 1 ≤ i, j ≤ m,
i 6= j und für alle λ 6= 0 gilt:
(Gi) ∧ (Gj) ⇔ Gj) ∧ (Gi)
(Gi) ⇔ λ · (Gj)
(Gi) ∧ (Gj) ⇔ Gi) ∧ (Gj) + (Gi) .
Die Lösungsmengen des Gleichungssystems bleiben bei elementaren Zeilenumformungen also
unverändert.
50
Lineare Gleichungssysteme
Als Folgerung aus dieser Bemerkung erhalten wir sofort das wesentliche Resultat:
Satz 4.9. Die Lösungsmenge eines linearen Gleichungssystems wird durch elementare Zeilenumformungen nicht verändert, d.h., äquivalente lineare Gleichungssysteme besitzen dieselben
Lösungen.
Beweis. Folgt sofort aus obiger Bemerkung mittels vollständiger Induktion.
Bemerkung 4.10. Man kann auch mehrere elementare Zeilenumformungen zusammenfassen,
etwa: (Gj)→(Gj) - 2·(Gi) entsteht aus drei elementaren Schritten
(Gi),(Gj)↔(-2)·(Gi),(Gj)↔ (-2)·(Gi),(Gj)+(-2)·(Gi)↔(Gi),(Gj)-2·(Gi).
Wie in den einführenden Beispielen verwenden wir die elementaren Zeilenumformungen, um
das LGLS auf einfache Form zu überführen.
Darstellung über Koeffizienteschemata
Ein LGLS ist bereits durch Angabe der Koeffizienten und rechten Seiten eindeutig bestimmt.
Durch das erweiterte Koeffizientenschema
1 a b
2 1 3
werden die zwei Gleichungen 1·x1 +a·x2 = b und 2·x1 +1·x2 = 3 beschrieben. Wir schreiben für
das erweiterte Koeffizientenschema auch kurz (A|y), und nennen A die Koeffizientenmatrix,
und b die rechte Seite des LGLSs.
Beispiel 4.11. Das angegebene Schema entspricht genau dem LGLS aus Beispiel 4.2. Beim
Umformen eines LGLSs, genügt es die Operationen auf das Koeffizientenschema anzuwenden.
Der erste Schritt in Beispiel 4.2 bestand aus dem Addieren des (−2)-fachen der ersten Zeile zur
zweiten, wodurch man
1
a
b
0 1 − 2a 3 − 2b
erhält. Falls 1 − 2a 6= 0 ist, kann man die zweite Zeile mit 1/(1 − 2a) multiplizieren, was zu
1 a
b
0 1 (3 − 2b)/(1 − 2a)
führt. Dieses Koeffizientenschema hat nun eine sehr einfache Form, aus der sich die Lösung
rasch ablesen lässt: Die zweite Zeile bedeutet x2 = (3 − 2b)/(1 − 2a). Und Umformen der ersten
Zeile liefert x1 = b − ax2 = b − a(3 − 2b)/(1 − 2a).
51
Gleichungssysteme in Zeilenstufenform
Definition 4.12. Ein lineares Gleichungssystem, dessen erweitertes Koeffizientenschema (A|y)
in jeder Zeile echt mehr führende Nullen als in ihren Vorgängern stehen hat, heißt in Zeilenstufenform. Die Anzahl der Zeilen der Matrix A, die nicht identisch null sind, heißt Rang
der Matrix A, kurz Rang(A).
Beispiel 4.13. Das inhomogene lineare

0 2
 0 0

 0 0

 0 0
0 0
GLS mit Koeffizientenschema

5 0 3 4 1 1
0 1 0 3 9 0 

0 0 5 1 6 9 

0 0 0 0 1 0 
0 0 0 0 0 a
ist in Zeilenstufenform, und es gilt Rang(A) = 4.
Rückwärtseinsetzen
Für ein LGLS in Zeilenstufenform lässt sich die Lösungsmenge sehr einfach durch Rückwärtseinsetzen berechnen. Jede Zeile (beginnend mit der letzten; daher rückwärts) erlaubt eine
Variable zu eliminieren. Nicht eliminierbare Variablen verbleiben als Unbekannte im System.
Für das LGLS aus Beispiel 4.13 erhält man:
Fall 1 (a 6= 0): Die letzte Zeile (und somit das ganze GLS) besitzt keine Lösung, also L = ∅.
Fall 2 (a = 0): Die letzte Zeile entspricht der Gleichung 0 = 0, welche immer erfüllt ist und
daher gestrichen werden kann. Aus der vorletzten Zeile erhält man
x7 = 0.
Zeile 3 entspricht der Gleichung 5x5 + x6 + x7 = 9. Verwendet man, dass x7 = 0 ist, erhält man
x5 = (9 − x6 − x7 )/5 =
9−x6
.
5
Die Unbekannte x6 kann nicht eliminiert werden, und bleibt als Variable in der Beschreibung
der Lösungsmenge. Aus Zeile 2 erhält man
x4 = 0 − 3x6 − 9x7 = −3x6 ,
und Zeile 1 liefert schließlich
x2 = (1 − 5x3 − 3x5 − 4x6 − x7 )/2 = (1 − 5x3 − 3/5(9 − x6 ) − 4x6 )/2
= − 11
− 52 x3 − 56 x6 .
5
Die Lösungsmenge des LGLSs ist daher im Fall a = 0 gegeben durch
L = {(x1 , . . . , x7 ) ∈ R7 : x2 = − 11
− 25 x3 − 65 x6 ∧ x4 = −3x6 ∧ x5 =
5
= { r, − 11
− 52 s − 65 t, s, −3t, 9−t
, t, 0 : r, s, t ∈ R},
5
5
9−x6
5
∧ x7 = 0}
52
Lineare Gleichungssysteme
wobei wir x1 , x3 , x6 durch die Variablen r, s, t ersetzt haben. Für jede Wahl der Variablen
r, s, t erhält man eine Lösung, z.B. liefert die Wahl r = 1, b = 0, c = 0 die spezielle Lösung
(x1 , . . . , x7 ) = (1, −11/5, 0, 0, 9/5, 0, 0).
Obiges Beispiel liefert folgende Aussage über die Lösbarkeit von LGLSen in Zeilenstufenform.
Satz 4.14. Das erweiterte Koeffizientenschema (A|y) sei in Zeilenstufenform. Dann trifft für
die Lösungsmenge L des zugehörigen linearen Gleichungssystems genau einer der folgenden
Fälle zu:
(1) Die rechte Seite yi zu einer Nullzeile in der Koeffizientenmatrix A ist ungleich 0. Dann
besitzt das LGLS keine Lösung.
(2) Die rechten Seiten yi zu allen Nullzeilen in A sind gleich 0. Dann besitzt das GLS mindestens eine Lösung.
Im zweiten Fall ist die Anzahl der freien Parameter in der Lösungsmenge gleich der Anzahl der
Unbekannten minus der Anzahl der Nicht-Nullzeilen von A, also n − Rang(A).
Lösen allgemeiner linearer Gleichungssysteme
Um die Lösungsmenge eines allgemeinen LGLSs zu bestimmen, bietet sich jetzt folgende Strategie an (vgl. vorangehende Beispiele):
(A) Mit Hilfe von elementaren Zeilenumformungen wird das LGLS auf ein äquivalentes
System in Zeilenstufenform überführt.
(B) Die Lösungsmenge des äquivalenten Systems in Zeilenstufenform wird mittels Rückwärtseinsetzen bestimmt.
Der zwiete Schritt (B) wurde bereits behandelt, und der folgende Satz belegt, dass (und wie)
auch der erste Schritt (A) immer durchführbar ist.
Satz 4.15. Jedes lineare Gleichungssystem lässt sich mit elementaren Zeilenumformungen auf
ein äquivalentes System in Zeilenstufenform überführen. Die Lösungsmenge bleibt dabei unverändert.
Beweis. Der Beweis ist konstruktiv, d.h., wir geben einen Algorithmus an, der das System in
Zeilenstufenform schrittweise konstruiert.
Schritt 0: Setze k := 1 (gerade zu bearbeitende Zeile)
Schritt 1: Falls k = m, stop; sonst
1a) Wähle eine Zeile i aus k ≤ i ≤ m mit minimaler Anzahl von führenden Nullen.
1b) Vertausche die Zeilen i und k.
53
1c) Subtrahiere geeignete Vielfache der (neuen) Zeile k von den Zeilen j mit k + 1 ≤ j ≤ m,
sodass die Zeilen j mindestens eine führende 0 mehr aufweisen als Zeile k.
Schritt 2: Setze k := k + 1 (nächste Zeile), und gehe zu Schritt 1.
Man beachte: Schritt 1 und 2 des Algorithmus werden ≤ m mal aufgerufen, d.h., der Algorithmus terminiert nach endlich vielen Operationen. Man überzeugt sich leicht (z.B. mittels
Induktion bzgl. k), dass das Gleichungssystem am Ende des Algorithmus Zeilenstufenform besitzt.
Bemerkung 4.16. Der Algorithmus zum Überführen auf Zeilenstufenform heißt Gauß’sches
Eliminationsverfahren (kurz: Gauß-Elimination). Durch geeignetes Addieren von Zeilen in
der Zeilenstufenform zu Ihren Vorgängern kann man weitere Zahlen im rechten oberen Teil der
Koeffizientenmatrix auf Null bringen. Man spricht dann von der reduzierten Zeilenstufenform
und dem Gauß-Jordan Algorithmus.
Zur Veranschaulichung ein weiteres Beispiel.
Beispiel 4.17. Wir betrachten das LGLS
x2
x1
x1 + 2x2
+ ax3 = b
+ x3 = 1
+ x3 = 0
Gesucht ist die Lösungsmenge in Abhängigkeit der Parameter a, b ∈ R.
Lösung: Wir führen elementare Zeilenumformungen auf dem Koeffizienteschema aus:
Zeile k=1:






1 0 1 1
1 0 1 1
0 1 a b
1c)Z3↔Z3−Z1
 0 1 a b 
 1 0 1 1  1b)Z1↔Z2
⇔  0 1 a b 
⇔
1 2 1 0
1 2 1 0
0 2 0 −1
Zeile k=2:


1 0
1
1
1c)Z3↔Z3−2·Z2
 0 1
.
a
b
⇔
0 0 1 − 2a −1 − 2b
Fall 1: (1 − 2a = 0 ∧ −1 − 2b 6= 0): Das Gleichungssystem besitzt keine Lösung, also L = {}.
Fall 2: (1 − 2a = 0 ∧ −1 − 2b = 0): In diesem Fall ist das GLS äquivalent zum reduzierten
System (Streichen der Nullzeile!)
1 0 1 1
.
0 1 a b
Die Löungsmenge wird durch Rückwärtseinsetzen konstruiert: Durch Umformen von Z2 erhält
man x2 = b − a · x3 , und Einsetzen in Z1 liefert x1 = 1 − x3 . Die Lösungsmenge ist also gegeben
54
Lineare Gleichungssysteme
durch
L = {(x1 , x2 , x3 ) ∈ R3 : x2 = b − a · x3 ∧ x1 = 1 − x3 }
= {(1 − t, b − a · t, t) : t ∈ R}
falls 2a = 1 ∧ 2b = −1.
Man beachte, dass für jedes fixe a, b ∈ R, die Lösungsmenge noch einen (n − Rang(A) = 3 − 2 =
1) freien Parameter t besitzt. Es gibt also unendlich viele Lösungen.
Fall 3: (1 − 2a 6= 0): In diesem Fall kann man x3 aus der letzten Zeile berechnen, also x3 =
(−1 − 2b)/(1 − 2a). Die beiden anderen Gleichungen werden wie im Fall 2 aufgelöst, und man
erhält
L = {(x1 , x2 , x3 ) ∈ R3 : x3 = (−1 − 2b)/(1 − 2a) ∧ x2 = b − a · x3 ∧ x1 = 1 − x3 }
= { 1 − (2b + 1)/(2a − 1), b − a(2b + 1)/(2a − 1), (2b + 1)/(2a − 1) },
falls 2a 6= 1.
In diesem Fall liegt für jede Wahl a, b ∈ R mit 2a 6= 1 genau eine Lösung vor, die Lösungsmenge
besitzt also keinen freien Parameter mehr (n − Rang(A) = 3 − 3 = 0).
Wir wählen jetzt fix a = 1 und b = 0.
 

1 0
1
1
1
 0 1


b
a
0
=
0 0 1 − 2a −1
0
Durch Einsetzen und weiteres Umformen erhalten wir



0 1
1
1 0 1 1
Z3↔(−1)·Z3
 0 1 1 0 
0 
1 1
⇔
0 −1 −1
0 0 1 1




1 0 1 1
1 0 0 0
Z2↔Z2−Z3
 0 1 0 −1  Z1↔Z1−Z3
 0 1 0 −1  .
⇔
⇔
0 0 1 1
0 0 1 1
An dem so (durch den Gauß-Jordan Algorithmus) erhaltenen System in reduzierter Zeilenstufenform lässt sich die Lösung besonders leicht ablesen, nämlich L = {(0, −1, 1)}.
Bemerkung 4.18. Man sieht anhand der Rechnung, dass das Ermitteln der Lösungsmenge aus
der Zeilenstufenform mittels Rückwärtseinsetzen deutlich weniger Arbeit ist, als das Umformen
von Zeilenstufenform in reduzierte Zeilenstufenform. Wir verwenden deshalb bevorzugt die
Gauß-Elimination mit Rückwärtseinsetzen, und nicht den Gauß-Jordan Algorithmus.
Der Gauß-Algorithmus
Im folgenden wollen wir kurz die Umsetzung des Gauß-Algorithmus auf dem Computer diskutieren. Wir verwenden hierfür Matlab Notation, und betrachten nur GLSe mit gleich vielen
Gleichungen wie Unbekannten, also m = n. Der Algorithmus soll abbrechen, falls keine eindeutige Lösung berechnet werden kann. Vergleichbare Algorithmen in anderen Programmiersprachen
findet man leicht im Internet.
Als Eingabe erhält man eine Koeffizientenmatrix A mit m = n Zeilen und n Unbekannten,
sowie eine rechte Seite y mit m = n Einträgen. Im ersten Schritt wird das GlS (also das
Koeffizientenschema) auf Zeilenstufenform gebracht.
55
function [A,y] = gauss_eliminate(A,y)
% Gauss-Elimination
% input: A ... n x n Matrix
%
y ... n x 1 Matrix
n = length(y);
for k=1:n-1 % loop over lines
% search for row largest entry at kth position
j=find(abs(A(k:n,k))==max(abs(A(k:n,k))),1)+k-1;
if abs(A(j,k))<1e-16, error(’matrix is close to singular’); return; end
% swap row k and row j
if j~=k,
r=A(k,k:n); A(k,k:n)=A(j,k:n); A(j,k:n)=r;
r=y(k); y(k)=y(j); y(j)=r;
end
% eliminate kth entry in rows with index >k
for j=k+1:n
alpha = A(j,k)/A(k,k);
A(j,k:n) = A(j,k:n) - alpha * A(k,k:n);
y(j) = y(j) - alpha * y(k);
end % j
end % k
Bei erfolgreicher Durchführung hat die Matrix A nun Zeilenstufenform, und das System kann
mit Rückwärtseinsetzen gelöst werden.
function x = backward_solve(A,y)
% Backward-Substitution
% input: A ... n x n upper triangular matrix
%
y ... n x 1 matrix
n = length(y);
x = 0*y;
for k=n:-1:1 % go backward from n to 1
x(k) = (y(k) - A(k,k:n)*x(k:n))/A(k,k);
end
Die Funktionstüchtigkeit des Algorithmus testen wir mit folgender Eingabe:
% Koeffizientenschema
A=[2,1;1,2];
56
Lineare Gleichungssysteme
y=[3;3];
% Gauss-Elimination
[B,z]=gauss_eliminate(A,y);
% Rueckwaertseinsetzen
x=backward_solve(B,z)
5
Vektorrechnung
Vektorräume
Die Elemente des Cartesischen Produkts R2 := R × R können mit Punkten in der Ebene
identifiziert werden. Ein Element v = (v1 , v2 ) ∈ R2 wird dabei mit dem Punkt in der Ebene
mit Koordinaten v1 und v2 identifiziert. Im geometrischen Kontext schreiben wir auch
v
v = 1 ∈ R2 ,
v2
und wir nennen v einen Spaltenvektor.
Bemerkung: Wir machen
vorderhand keinen Unterschied zwischen dem 2-Tupel (v1 , v2 ) und
dem Spaltenvektor vv12 , d.h., die Menge { vv12 : v1 , v2 ∈ R} aller Spaltenvektoren mit reellen
Koordinaten ist gerade wieder R2 .
Bemerkung 5.1. Vektoren im R2 bzw R3 tauchen häufig im Zusammenhang mit physikalischen oder technischen Fragestellungen auf, und werden dann gerne als gerichtete Größen
(Pfeile) dargestellt. Es kann Sinn machen, diese Pfeile in der Ebene zu verschieben, etwa, um
die entsprechenden Kräfte an einem bestimmten Punkt angreifen zu lassen, oder zur Darstellung der Addition von Vektoren (siehe unten). Die Koordinaten des Vektors (somit der Vektor
selbst) sind durch Länge und Richtung bereits eindeutig bestimmt (vgl. Polarkoordinaten bei
komplexen Zahlen).
Vektoren im R2 lassen sich komponentenweise addieren und mit reellen Zahlen multiplizieren,
und zwar gemäß
v1
w1
v1 + w1
v + w :=
+
=
v2
w2
v2 + w2
v
λv1
und λ · v := λ · 1 =
v2
λv2
58
Vektorrechnung
Addition und skalare Multiplikation von Vektoren im R2 .
Das Rechnen mit Vektoren lässt sich sofort auf den R3 bzw. den Rn , und auch noch auf weitere
Beispiele übertragen.
Definition 5.2. Sei (K, +, ·) ein Körper. Unter einem K-Vektorraum verstehen wir eine
nichtleere Menge V auf der Operationen
⊕ : V × V → V, (v, w) 7→ v ⊕ w
und
: K × V → V,
(λ, v) 7→ λ v
mit folgenden Eigenschaften definiert sind: Für alle u, v, w ∈ V und alle λ, µ ∈ K gilt
(u ⊕ v) ⊕ w = u ⊕ (v ⊕ w),
∃~0 ∈ V : v ⊕ ~0 = v,
v ⊕ w = w ⊕ v,
∃!(−v) ∈ V : v ⊕ (−v) = ~0,
sowie
λ (v ⊕ w) = (λ v) ⊕ (λ w),
(λ µ) v = λ (µ v)
(λ + µ) v = (λ v) ⊕ (µ v),
1 v = v.
Bemerkung 5.3.
• Für K = R (bzw. K = C) sprechen wir von einem “reellen” oder ”komplexen“ Vektorraum.
• Jeder Vektorraum muss zumindest ~0 enthalten (warum?). {} ist also kein Vektorraum!
• Für einen K-Vektorraum schreiben wir (V, K, ⊕, ) oder (V, ⊕, ) oder kurz V . Die Elemente v ∈ V heißen Vektoren (ein Vektor ist also gerade das Element eines Vektorraums)
und die Elemente λ ∈ K heißen Skalare. 1 bezeichnet das Einselement des Körpers, und
~0 das neutrale Element der Vektoraddition.
• Die Operationen ⊕ : V × V → V und : K × V → V heißen Vektoraddition bzw.
skalare Multiplikation. Da eigentlich keine Verwechslungen auftreten können, benutzen
wir meistens die einfachen Symbole + und · statt ⊕ und , sowie 0 anstelle von ~0.
• Die ersten vier Bedingungen besagen, dass (V, ⊕) eine Abel’sche Gruppe ist, d.h., die
Bedingungen (A1)–(A4) der Körperaxiome erfüllt.
59
Beispiel 5.4. Sei K ein Körper (typischerweise K = R oder K = C). Dann gilt:
• Jeder Körper K ist ein Vektorraum über sich selbst. In diesem Fall sind ⊕ und identisch
mit den Körperoperationen + und ·.
• Die Mengen Kn mit n ∈ N und den komponentenweisen Operationen
⊕ : Kn × Kn → Kn ,
: K × Kn → Kn ,
(v1 , . . . , vn ) ⊕ (w1 , . . . , wn ) := (v1 + w1 , . . . , vn + wn ),
λ (v1 , . . . , vn ) := (λv1 , . . . , λvn )
bilden K-Vektorräume. Häufig verwendet werden vor allem Rn bzw. Cn .
• Die Menge Πn := {p : K → K, x 7→ a0 +a1 x+. . .+an xn , ak ∈ K} aller Polynomfunktionen
vom Grad ≤ k mit Koeffizienten in K ist mit den punktweisen Operationen
(pn ⊕ qn )(x) := pn (x) + qn (x)
sowie
(λ pn )(x) := λ · pn (x)
ein K-Vektorraum. Ebenso ist die Menge Π := {p ∈ Πn : n ∈ N} aller Polynome beliebigen
Grades ein Vektorraum über K.
Der Nachweis, dass es sich bei den Beispielen tatsächlich um Vektorräume handelt, lässt sich
auf Rechnen im Körper K zurückführen, und wird zum Teil in der Übung erbracht.
Wir werden später im Rahmen der Vorlesung auch noch weitere Vektorräume (von Funktionen
und Folgen) kennenlernen.
Normen: Messen von Längen und Abständen
Wir betrachten vorerst den p
Vektorraum V = R. Der Abstand zwischen zwei Zahlen x, y ∈ R
ist gegeben durch |x − y| = (x − y)2 , also durch den Betrag der Zahl x − y.
Ganz ähnlich definieren wir auf dem Vektorraum V = R2 den Euklid’schen Abstand
p
kv − wk2 := (v1 − w1 )2 + (v2 − w2 )2 ,
welcher gerade der Länge (Euklid’schen Norm) des Vektors v − w in der Ebene entspricht.
Um Längen in allgemeinen Vektorräumen zu messen, benutzen wir die folgende Konstruktion.
Definition 5.5. Sei V ein Vektorraum über dem Körper K (hier R oder C). Eine Abbildung
k · k : V → R, v 7→ kvk, welche für alle v, w ∈ V und λ ∈ K die Bedingungen
kvk ≥ 0 und kvk = 0 ⇔ v = ~0
kλ · vk = |λ| kvk
kv + wk ≤ kvk + kwk
definit
homogen
Dreiecksungleichung
erfüllt, heißt eine Norm auf V , und (V, k · k) heißt normierter Raum.
60
Vektorrechnung
Bemerkung 5.6. Wie im R2 definieren wir in jedem normierten Raum (V, k · k) den Abstand
zwischen zwei Vektoren (Punkten) v, w ∈ V durch kv − wk.
Beispiel 5.7. Man zeige, dass die Abbildungen
kvk1 :=
kvk2 :=
n
X
|vk |,
k=1
n
X
2
|vk |
1/2
,
k=1
kvk∞ := sup{|vk | : 1 ≤ k ≤ n} = max{|vk | : 1 ≤ k ≤ n}
Normen auf dem Vektorraum Rn (bzw Cn ) definieren. Diese heißen Betragssummennorm,
Euklid’sche Norm und Maximums- bzw. Supremumsnorm.
Lösung: Wir betrachten nur die k · k1 Norm.
(i) Da |x| ≥ 0 für jede reelle Zahl x ∈ R folgt kvk1 ≥ 0. Andererseits ist eine Summe nichtnegativer Zahlen nur dann gleich null, wenn jeder Summand null ist. Dies zeigt die Definitheit.
(ii) Nach den bekannten Rechenregeln gilt
kλ · vk1
Def: λ·v
=
k(λv1 , . . . , λvn )k1
Def: Norm
=
n
X
|λvk |
k=1
Betrag
=
n
X
|λ||vk |
distributiv
=
k=1
|λ|
n
X
|vk |
Def: Norm
=
|λ| kvk1 .
k=1
(iii) Die Dreiecksungleichung folgt wiederum aus den Eigenschaften des Betrags für reelle Zahlen, also
kv + wk1 = k(v1 + w1 , . . . , vn + wn )k1 =
n
X
|vk + wk |
k=1
≤
n
X
k=1
(|vk | + |wk |) =
n
X
k=1
|vk | +
n
X
|wk | = kvk1 + kwk1 .
k=1
Der Nachweis der Normeigenschaften für k · k2 und k · k∞ geht ählich (siehe Übung). Zum
Nachweis der Dreiecksungleichung für die Euklid’sche Norm verwenden wir später die CauchySchwarz Ungleichung.
Beispiel 5.8. Man bestimme die Länge des Vektors v = 12 bezüglich der Normen kvkm für
m = 1, 2, ∞.
P
Lösung: (i) Es gilt kvk1 = 2k=1 |vk | = |1| + |2| = 3.p
√
P
(ii) Für m = 2 erhält man kvk2 = ( 2k=1 |vk |2 )1/2 = |1|2 + |2|2 = 5.
(iii) Die Maximumsnorm beträgt kvk∞ = max{|vk | : 1 ≤ k ≤ 2} = max{|1|, |2|} = 2.
Ein Vektor kann also verschiedene ”Längen“ besitzen, je nachdem in welcher Norm er gemessen
61
wird.
Mengen Mk := {v ∈ R2 : kvkk ≤ 1} für k = 1, 2, ∞.
Beispiel 5.9.
• Sei K = R (oder K = C). Dann definiert der Betrag | · | eine Norm auf K. Die Normeigenschaften folgen sofort aus denen des Betrags.
• Für a, b ∈ R mit a < b sei Π(a, b) := {p : (a, b) → R, p ∈ Πn für ein n ∈ N} der Raum
aller reellwertigen Polynomfunktionen auf dem Intervall (a, b). Für p ∈ Π(a, b) definieren
wir die Supremumsnorm
kpk∞ := sup{|p(x)| : x ∈ (a, b)}.
Anhand des Beispiels a = 0, b = 1, p(x) = x sieht man, dass das Supremum nicht notwendigerweise angenommen wird, also nicht durch das Maximum ersetzt werden kann! Die
Normeigenschaften zeigt man ähnlich wie für die Normen auf Rn ; siehe Übung.
Skalarprodukte und Winkel zwischen Vektoren
Neben dem Abstand kann auch der Winkel zwischen zwei Vektoren gemessen werden. Wir
erinnern an die elementare Formel
hv, wi2 := v1 w1 + v2 w2 = kvk2 kwk2 cos φ,
v, w ∈ R2 .
Hierbei ist φ der von v und w eingeschlossene Winkel ist (siehe Skizze).
Winkel zwischen zwei Vektoren in R2 .
62
Vektorrechnung
Wir fassen die wesentlichen Eigenschaften des Skalarproduktes h·, ·i zusammen. Wiederum
lässt sich diese Konstruktion auf Rn und allgemeine Vektorräume verallgemeinern.
Definition 5.10. Sei V ein R-Vektorraum. Eine Abbildung h·, ·i : V × V → R mit folgenden
Eigenschaften für alle v, w ∈ V und alle λ ∈ R
hv, vi ≥ 0 und hv, vi = 0 ⇔ v = ~0
hv, wi = hw, vi
hλ · u + v, wi = λhu, wi + hv, wi
positiv definit
symmetrisch
linear
heißt Skalarprodukt (inneres Produkt) auf V , und (V, h·, ·i) heißt Innenproduktraum.
Bemerkung 5.11.
• Unter Ausnutzung der Kommutativität (Symmetrie) folgt sofort, dass auch
hu, λ · v + wi = λhu, vi + hu, wi
für alle u, v, w ∈ V und λ ∈ R gilt: Das Skalarprodukt ist als Abbildung von V × V → R
bilinear, d.h., jeweils linear bezüglich des ersten und des zweiten Argumentes.
• Ein Skalarprodukt h·, ·i : V × V → C auf einem komplexen Vektorraum V muss anstelle
der Kommutativität die folgende leicht veränderte Eigenschaft erfüllen:
hv, wi = hw, vi
hermitesch
hieraus folgt, dass hv, vi ∈ R ist (und ≥ 0 überhaupt Sinn macht). Die Folgerung aus der
Linearität liest sich dann
hu, λ · v + wi = λhu, vi + hu, wi
semilinear
Das (komplexe) Skalarprodukt ist also linear bzgl. des ersten, und semilinear (1/2) bzgl.
des zweiten Arguments; in Summe also sesquilinear (1 12 -fach linear).
Beispiel 5.12.
• Auf Rn definiert die Vorschrift
hv, wi2 :=
n
X
vk wk
k=1
das sogenannte Euklid’sche Skalarprodukt. Für n = 2 erhalten wir den bekannten Fall.
• Sei w ∈ Rn mit wk > 0 für k = 1, . . . , n. Dann ist
hu, viw :=
n
X
wk uk vk
k=1
ein gewichtetes Euklid’sches Skalarpodukt auf Cn .
63
• Für reellwertige Polynomfunktionen in Πn (a, b) vom Grad ≤ n auf dem Intervall (a, b)
lässt sich ein Skalarpodukt definieren durch
Z b
hp, qi2 :=
p(x)q(x)dx.
a
Bevor wir die vom R2 bekannte Winkelmessung auf allgemeinen Vektorräumen definieren, zitieren wir noch einige wesentliche Eingeschaften, welche ein jedes Skalarpodukt besitzt.
Satz 5.13 (Cauchy-Schwarz Ungleichung). Sei h·, ·i ein Skalarprodukt auf dem reellen Vektorraum V . Dann gilt für alle v, w ∈ V
p
p
|hv, wi| ≤ hv, vi hw, wi.
(Die Aussage gilt mit ähnlichem Beweis auch auf komplexen Vektorräumen).
Beweis. Für den Fall w = 0 steht auf beiden Seiten 0, und die Ungleichung ist gezeigt. Wir
dürfen daher im folgenden annehmen, dass w 6= 0, und daher kwk2 = hw, wi > 0 aufgrund der
Definitheit. Für jedes t ∈ R gilt dann
definit
0 ≤ hv + t · w, v + t · wi
symmetrisch
=
bilinear
=
hv, vi + thv, wi + thw, vi + t2 hw, wi
hv, vi + 2thv, wi + t2 hw, wi = (∗).
Wir wählen nun t := −hv, wi/hw, wi, was erlaubt ist, da hw, wi =
6 0. Daraus folgt
0 ≤ (∗) = hv, vi − 2hv, wi2 /hw, wi + hv, wi2 /hw, wi
= hv, vi − hv, wi2 /hw, wi.
Wir bringen den negativen Term auf die linke Seite und multiplizieren mit hw, wi > 0. Das
führt auf
hv, wi2 ≤ hv, vihw, wi,
und die Behauptung folgt durch Ziehen der Wurzel auf beiden Seiten (vgl. Satz 2.25).
Bemerkung 5.14. Auf einem reellen Vektorraum ist das Skalarprodukt reellwertig, und der
Betrag
auf der linken Seite der Ungleichung kann weggelassen werden. Definiert man kvk :=
p
hv, vi, so lässt sich die Cauchy-Schwarz Ungleichung schreiben als
hv, wi ≤ kvkkwk.
Wie der folgende Satz belegt, ist k · k tatsächlich wieder eine Norm auf V .
Beispiel 5.15. Man überprüfe die Cauchy-Schwarz’sche Ungleichung
des
anhand −1
Euklid’schen
1
1
Skalarproduktes und aller Kombinationen von u = 2 , v = 1 , w = 1 , also hu, ui2 ,
hu, vi2 , . . .
64
Vektorrechnung
Satz 5.16. Sei V ein R-Vektorraum mit Skalarpodukt h·, ·i. Dann definiert die Vorschrift
p
kvk := hv, vi
eine Norm auf V . Wir nennen k · k die natürliche oder induzierte Norm.
(Wiederum lässt sich die Aussage auch auf komplexe Vektorräume übertragen).
Beweis. Der Nachweis, dass k · k definit und homogen ist, erfolgt in der Übung. Die Dreiecksungleichung folgt aus der Cauchy-Schwarz Ungleichung
kv + wk2
Definition
=
hv + w, v + wi
Cauchy-Schwarz
≤
bilinear
=
hv, vi + 2hv, wi + hw, wi
kvk2 + 2kvkkwk + kwk2
binom. Formel
=
(kvk + kwk)2 .
Die Behauptung folgt durch Ziehen der Wurzel auf beiden Seiten (vgl. Satz 2.25).
Die Winkelmessung erfolgt nun auf beliebigen Innenprodukträumen mit der aus dem R2 bekannten Formel.
Definition 5.17. Sei V ein reeller Vektorraum mit Skalarpodukt h·, ·i und induzierter Norm
k · k. Für 0 6= v, w ∈ V nennen wir φ ∈ [0, π) definiert durch
hv, wi = kvkkwk cos φ
den Winkel zwischen v und w. Gilt hv, wi = 0 (d.h. φ = π/2), so heißen v und w orthogonal;
wir schreiben dafür v ⊥ w.
Bemerkung 5.18. Für R2 mit dem Euklid’schen Skalarprodukt stimmt diese Definition genau
mit der bekannten Formel überein, und φ ist genau der Winkel zwischen den Vektoren.
Beispiel 5.19. Wir statten den Vektorraum R2 mit dem Euklid’schen Skalarprodukt
aus. 1
1
1
(a) Man berechne die Winkel zwischen allen Kombinationen von u = 1 , v = 2 , w = −1
.
1
2
(b) Wie muss a ∈ R gewählt werden, sodass v = 2 und w = a orthogonal zueinander stehen?
Man fertige zu den Beispielen jeweils auch Skizzen an.
Unterräume
In unserer Vorstellung ist der Vektorraum R2 (die Zahlenbebene) bereits im Vektorraum R3
(Zahlenraum) enthalten. Dies motiviert den folgenden Begriff.
Definition 5.20. Sei V ein Vektorraum über dem Körper K, und W ⊂ V eine Teilmenge. Ist
W wieder ein Vektorraum über K, so heißt W Unterraum (Teilraum) von V .
Satz 5.21. ∅ =
6 W ⊂ V ist ein Unterraum von V , genau dann wenn
∀v, w ∈ W, λ ∈ K :
v+w ∈W
und
λ · v ∈ W.
65
Bemerkung 5.22.
• Die Rechenregeln für Vektoraddition und skalare Multiplikation gelten für alle Elemente
in V und somit auch in W ; diese brauchen also nicht mehr überprüft werden. Somit genügt
es zu zeigen, dass man durch die Operationen nicht aus dem Unterraum ”hinausfällt“.
• Multipliziert man mit λ = 0 so erhält man sofort auch die notwendige Bedingung ~0 ∈ W .
Ein (Unter-)Vektorraum muss also immer auch den Null-Vektor enthalten!
Zur Veranschaulichung einige gebräuchliche Beispiele für Unterräume.
Beispiel 5.23.
• Jeder Vektorraum ist ein Unterraum von sich selbst. Ebenso ist für jeden Vektorraum V
der triviale Raum {~0} ein Unterraum.
• Sei V = R2 . Dann ist die Gerade W = {(x1 , x2 ) : x1 + x2 = 0} durch den Nullpunkt ein
Unterraum von V . Man stelle diesen Unterraum auch graphisch dar.
• Sei V = R3 . Dann ist die Menge der Punkte auf der Zahlenebene W := {(x, y, 0) : (x, y) ∈
R2 } ein Unterraum von R3 . In diesem Sinne ist R2 in R3 enthalten.
Unterräume des R2 .
• Die Menge W := {(x1 , . . . , xn ) ∈ Rn : x1 + x2 + . . . + xn = 0} ist ein Unterraum von Rn .
• Sei V = Πn der Vektorraum der Polynome vom Grad ≤ n. Dann ist Πm für m ≤ n ein
Unterraum von V .
• Die Menge Πn (a, b) von beschränkten Polynomen vom Grad ≤ n auf dem Intervall (a, b)
ist ein Unterraum des Vektorraums B((a, b)) von beschränkten, reellwertigen Funktionen
auf (a, b).
Zur Abgrenzung seien auch noch einige Gegenbeispiele genannt.
Beispiel 5.24. Man veranschauliche sich und begründe folgende Sachverhalte:
• Obwohl die leere Menge eine Teilmenge jeder anderen Menge ist, ist {} kein Vektorraum,
und somit kein Unterraum von irgendeinem Vektorraum V !
66
Vektorrechnung
• Die Mengen W1 = {(x, 1) : x ∈ R} und W2 := {(x1 , x2 ) ∈ R2 : x1 + x2 = 1} sind keine
Unterräume von R2 .
• Die Menge W = {v ∈ Rn : kvk2 ≤ 1} ist kein Unterraum von Rn .
Das folgende Resultat stellt einen Zusammenhang zu linearen Gleichungssystemen her.
Satz 5.25. Sei A die Koeffizientenmatrix eines (reellen) Gleichungssystems mit m Gleichungen
und n Unbekannten. Dann ist die Lösungsmenge L des homogenen GLSs (A|0) ein Unterraum
des Vektorraumes Rn .
Beweis. Wird später mit Matrixnotation in der Übung erbracht.
Affine Teilräume
Aus obigem Satz (und einem vorhergehenden Beispiel) folgt, dass die Menge
W0 := {(x1 , x2 ) ∈ R2 : x1 + x2 = 0} = {(t, −t) : t ∈ R},
welche eine Gerade durch den Nullpunkt beschreibt, ein Unterraum von R2 ist. Die Menge
W1 := {(x1 , x2 ) ∈ R2 : x1 + x2 = 1} = {(t, 1 − t) : t ∈ R},
welche auch eine Gerade beschreibt (die nicht durch den Nullpunkt geht), ist jedoch kein Unterraum von R2 (warum?). Jedes Element w1 ∈ W1 lässt sich allerdings schreiben als
t
0
t
0
w1 =
=
+
=
+ w0
mit w0 ∈ W0 .
1−t
1
−t
1
Das motiviert den folgenden Begriff.
Definition 5.26. Sei W0 ⊂ V ein Unterraum von V . Für gegebenes v ∈ V heißt die Menge
v + W0 := {v + w : w ∈ W0 }
ein affiner Teilraum von V .
Bemerkung 5.27.
• Jeder Unterraum von V ist zugleich auch affiner Teilraum von V (mit v = 0).
• Für alle v1 , v2 ∈ v + W0 gilt v1 − v2 ∈ W0 .
• Für jedes w ∈ W0 gilt v + W0 = (v + w) + W0 , d.h., die Darstellung eines affinen Teilraums
(die Wahl des Elementes v) ist nicht eindeutig.
• Die Menge {(x, y) ∈ R2 : y = x + x2 } = Graph(f ) mit f : R → R, x 7→ x + x2 , ist kein
(affiner) Teilraum von R2 .
67
Affine Teilräume des R2 .
Beispiel 5.28.
• Jede Gerade in R2 is affiner Teilraum von R2 . Eine Gerade ist Unterraum, genau dann
wenn sie durch den Ursprung verläuft.
• Punkte, Geraden und Ebenen in R3 sind affine Teilräume des R3 .
• Die Menge aller reellen Polynome p mit p(0) = 1 ist ein affiner Teilraum des Vektorraums
Π aller reellen Polynome.
Den Zusammenhang mit allgemeinen linearen GLSen liefert das folgende Resultat:
Satz 5.29. Sei (A|y) das Koeffizientenschema eines linearen GLSs mit m Gleichungen und n
Unbekannten. Dann ist die Lösungsmenge Ly ein affiner Teilraum von Rn . Ist xy eine spezielle
Lösung des inhomogenen Gleichungssystems (A|y), dann gilt
Ly = xy + L0 ,
L0 Lösungsmenge des homogenen Systems (A|0).
Beweis. Wird später mit Hilfe von Matrixnotation in der Übung erbracht.
Lineare Unabhängigkeit, Basis und Dimension eines Vektorraums
Im R2 lässt sich jeder Vektor
x
y
auch darstellen als
x
1
0
=x·
+y·
.
y
0
1
Wir erkennen in x und y gerade die Koordinaten des Punktes xy im Cartesischen Koordinaten
system. Man benötigt gerade zwei Vektoren, z.B. 10 und 01 um jeden Vektor in R2 darstellen
zu können, und wir nennen deshalt R2 einen zweidimensionalen Vektorraum.
Im folgenden wollen wir diese Art der Darstellung und den Begriff der Dimension auf allgemeine
Vektorräume erweitern.
68
Vektorrechnung
Definition 5.30. Sei V ein K-Vektorraum, und M ⊂ V eine Teilmenge von V . Wir nennen
Span(M ) := {v ∈ V : v =
n
X
λk · w k ,
wk ∈ M, λk ∈ K, n ∈ N}
k=1
die lineare Hülle (Spann, Aufspann) von M . Ein Ausdruck der Form
heißt Linearkombination der Vektoren wk .
Pn
k=1
λk · wk mit λk ∈ K
Satz 5.31. Span(M ) ist ein Unterraum von V .
Beweis. Aus der Definition folgt sofort, dass mit v und w ∈ Span(M ) auch v + w und λ · v in
Span(M ) liegen.
Beispiel 5.32.
• Sei M ⊂ V ein Unterraum von V . Dann gilt Span(M ) = M . Durch Vektoroperationen
landet man immer wieder im Unterraum.
• Sei M = { 10 }. Dann ist
1
Span(M ) = {v ∈ R : v = λ ·
, λ ∈ R} = {(λ, 0) : λ ∈ R}.
0
2
• Sei M = {(1/n, 0) : n ∈ N}. Dann ist Span(M ) = {(λ, 0) : λ ∈ R}.
• Sei M1 = { 10 , 01 } und M2 = { 10 , 01 , 11 }. Dann ist Span(M1 ) = Span(M2 ) = R2 .
In letztem Beispiel sieht man, dass der Vektor 11 nicht zur Vergößerung des Aufspanns beiträgt.
1
Das
ist
auch
kein
Wunder,
da
er
ja
selbst
als
Linearkombination
der
beiden
Vektoren
und
0
0
dargestellt werden kann, also
1
1
1
0
=1·
+1·
1
0
1
bzw.
1
0
1
0
1·
+1·
−1·
=
.
0
1
1
0
Definition 5.33. Sei V ein Vektorraum über einem Körper K.
• Eine nichtleere Menge M ⊂ V von Vektoren heißt linear unabhängig, falls für jedes
n ∈ N und jede Wahl unterschiedlicher Vektoren vk ∈ M , 1 ≤ k ≤ n gilt:
n
X
λk · vk = ~0
⇒
λk = 0 für alle k = 1, . . . , n.
k=1
• Eine Teilmenge M ⊂ V mit Span(M ) = V heißt Erzeugendensystem (EZS).
• Ein linear unabhängiges Erzeugendensystem B ⊂ V heißt Basis von V .
69
Überprüfung auf lineare Unabhängigkeit
m
Wir wollen kurz erläutern, wie man Teilmengen
Pm M = {vk ∈ V : 1 ≤ k ≤ n} ⊂ R auf lineare
Unabhängigkeit überprüft. Die Bedingung k=1 λk · vk = ~0 bedeutet, dass



  
v1,1
vn,1
0
 v1,2 
 vn,2  0



  
λ1 ·  ..  + . . . + λn ·  ..  =  ..  .
 . 
 .  .
v1,m
vn,m
0
Hierbei ist vk,j die jte Komponente des Vektors vk . Die angegebene Bedingung ist äquivalent
zum homogenen linearen Gleichungssystem
v1,1 λ1
v1,2 λ1
..
.
+ v2,1 λ2
+ v2,2 λ2
..
.
+ . . . + vn,1 λn
+ . . . + vn,2 λn
..
...
.
= 0
= 0
..
.
v1,m λ1 + v2,m λ2 + . . . + vn,m λn = 0.
Das zugehörige Koeffizientenschema lautet (A|0) wobei die Koeffizientenmatrix A = (v1 , v2 , . . . , vn )
durch Aneinanderreihen der Spaltenvektoren vk entsteht, also


v1,1 v2,1 . . . vn,1
 v1,2 v2,2 . . . vn,2 


A =  ..
..
..  .
 .
.
...
. 
v1,m v2,m . . . vn,m
Lineare Unabhängigkeit liegt vor, wenn das homogene GLS nur 0 als Lösung besitzt. Dies
können wir mit Hilfe der Gauß’schen Elimination überprüfen. Mit den Ergebnisse zur Lösung
linearer Gleichungssysteme erhalten wir die folgenden Resultate:
Satz 5.34.
(a) Jedes Erzeugendensystem des Rm besitzt mindestens m Elemente.
(b) Eine Menge {vk : 1 ≤ k ≤ n} ⊂ Rm mit n > m Elementen ist stets linear abhängig.
(c) Eine Basis des Rm besitzt genau m Elemente.
Beweis. (a) Mit Widerspruch: Wir nehmen zunächst an, dass M = {vk : 1 ≤ k ≤ n} ein
Erzeugendensystem mitPn < m Elementen ist, d.h, es lässt sich jeder Vektor v ∈ Rm als
Linearkombination v = nk=1 λk vk schreiben. Die ist nach obigen Überlegungen äquivalent zur
Aussage, dass das Gleichungssystem (A|v) mit m Gleichungen und n < m Unbekannten für
alle rechten Seiten v lösbar ist. Mit dem Gauß’schen Eliminationsverfahren lässt sich das GLS
70
Vektorrechnung
auf Zeilenstufenform bringen. Die zugehörige Koeffizientenmatrix besitzt mindestens m − n ≥ 1
Nullzeilen. Für m = 4, n = 3 hat das System etwas folgende Gestalt


U11 U12 U13 w1
 0 U22 U23 w2 


 0
0 U33 w3 
0
0
0 w4
Für rechte Seite w1 = w2 = w3 = 0 und w4 = 1 hat das System keine Lösung. Wir machen alle
Zeilenumformungen (A ↔ U ) wieder rückgängig, und erhalten das äquivalente urprüngliche
System (A|v). Für dieses existiert (da äquivalent zu (U |w)) keine Lösung; also ist M kein Erzeugendensystem. Somit gibt es kein Erzeugendensystem des Rm mit weniger als m Elementen.
(b) Zeigt man ähnlich wie (a); siehe Übung.
(c) Eine Basis B ⊂ Rm ist ein linear unabhängiges Erzeugendensystem. Es bezeichne |B| die
Anzahl der Elemente von B. Aus (a) folgt |B| ≥ m, und aus (b) folgt |B| ≤ m, und somit die
Behauptung.
Beispiel 5.35. Man überprüfe die Menge M = {(1, 2, 3), (1, 1, 1), (1, 2, 2)} ⊂ Rd auf lineare
Unabhängigkeit.
Lösung: Die Menge M ist lin. unabhängig, genau dann, wenn das GLS (A|0), wobei die Spalten
von A gerade die Vektoren in M sind, nur die triviale Lösung 0 besitzt. Mit dem Gauß-Verfahren
erhalten wir






1 1
1 0
1 1
1 0
1 1 1 0
 2 1 2 0  ⇔  0 −1 0 0  ⇔  0 −1 0 0  .
3 1 2 0
0 −2 −1 0
0 0 −1 0
Das äquivalente Zeilenstufensystem (und somit auch (A|0)) besitzt also nur die triviale Lösung
(0, 0, 0).
Beispiel 5.36. Ist die Menge M = {(1, 2), (2, 1), (1, 1)} ein Erzeugendensystem?
Lösung: Die Frage ob sich jeder Vektor yy12 als Linearkombination
y1
1
2
1
= λ1
+ λ2
+ λ3
,
λk ∈ R
y2
2
1
1
darstellen lässt, ist äquivalent zur Frage, ob das GLS (A|y) für alle rechten Seiten y lösbar ist,
wobei die Spalten von A die Vektoren in M sind. Der Gauß-Algorithmus liefert
1 2
1
y1
1 2 1 y1
⇔
,
2 1 1 y2
0 −3 −1 y2 − 2y1
und durch Rückwärtseinsetzen erhält man die Lösungsmenge
L(y1 , y2 ) = {(λ1 , λ2 , λ3 ) ∈ R3 : 3x2 = 2y1 − y2 − x3 ∧ x1 = y1 − 2x2 − x3 }
= {(y1 − 2(2y1 − y2 − t)/3 − t, (2y1 − y2 − t)/3, t) : t ∈ R}.
Somit ist gezeigt, das M ein EZS für R2 ist.
71
Beispiel 5.37. Man zeige, dass sich die Menge M aus dem vorhergehenden Beispiel durch
Streichen einer der Vektoren zu einer Basis umwandeln lässt.
Beispiel 5.38. Die Spalten der Matrix aus Beispiel 4.13 bilden kein Erzeugendensystem!
Die Menge bestehend aus dem zweiten, vierten, fünften und siebenten Spaltenvektor ist linear
unabhängig.
Bemerkung 5.39.
• Die Vektoren
e1 = (1, 0, 0, 0 . . . , 0),
e2 = (0, 1, 0, 0 . . . , 0),
e3 = (0, 0, 1, 0, . . . , 0),
...
die Einheitsvektoren des Rn . Die Menge {ek : 1 ≤ k ≤ n} ⊂ Rn ist linear unabhängig
und heißt kanonische Basis oder Einheitsbasis des Rn .
• Die Mengen B1 = { 10 , 01 } und B2 = { 10 , 11 } bilden jeweils Basen von R2 . Ein Vektorraum kann also viele verschiedene Basen besitzen.
• Die Menge {0} ist linear abhängig, und {v, w} ⊂ Rn ist linear abhängig, genau dann
wenn v = λw für ein w ∈ R; sonst linear unabhängig.
• Die Polynomfunktionen pk (x) := xk bilden eine Basis der Raums der Polynome, genauer:
Mn := {xk : 0 ≤ k ≤ n} ist eine Basis von Πn , und die Menge M := {xk : k ∈
N0 } bildet eine Basis des Raums Π aller (reellen) Polynome. Den Nachweis der linearen
Unabhängigkeit wird später in der Übung erbracht.
Ohne einen Beweis zu geben, fassen wir noch einige Aussagen über Basen zusammen.
Bemerkung 5.40.
• Jeder Vektorraum besitzt eine Basis.
• Jede lineare unabhängige Teilmenge M ⊂ V kann zu einer Basis ergänzt werden, und
jede Basis besitzt gleich viele (evtl unendlich viele∗ ) Elemente; vergleiche hiermit auch
die Aussagen über Basen des Rn weiter unten.
Definition 5.41. Sei V eine Vektorraum mit Basis B. Die Anzahl der Elemente in B heißt
Dimension von V , kurz Dim(V ). Ist Dim(V ) ∈ N0 , dann heißt V endlich dimensional,
sonst unendlich dimensional.
Bemerkung 5.42. Anstelle von Dim(V ) ∈ N0 schreiben wir auch Dim(N ) < ∞. Das Symbol
∞ steht hierbei für ”Unendlich“. Man beachte: ∞ ist weder natürlich noch reelle Zahl. Dim(V ) =
∞ meint hier, dass Dim(V ) > n für alle n ∈ N0 gilt.
Beispiel 5.43. Durch Angabe einer Basis sieht man:
• Dim(Rn ) = n, insbesondere Dim(R2 ) = 2
72
Vektorrechnung
• Dim(Πn ) = n + 1 und Dim(Π) = ∞. Der Raum aller Polynome ist unendlich dimensional!
Zur Veranschaulichung der Begriffe lineare Unabhängigkeit, Basis, Erzeugendensystem sowie
deren Überprüfung seien folgende Beispiele angeführt.
Beispiel 5.44. Ist die Menge M = {(1, 1, 0), (1, 0, 1), (0, 1, 1), (1, 1, 1)} (a) lineare unabhängig;
(b) ein Erzeugendensystem; (c) eine Basis? Gegebenenfalls überführe man die Menge M durch
Streichen oder Hinzufügen zusätzlicher Vektoren in eine Basis.
Lösung:
(a) M ist eine Teilmenge von R3 mit 4 Elementen, und kann daher nicht unabhängig
P4 sein. Aus
den Überlegungen zu Teil (b) sieht man ebenso, dass es Linearkombinationen k=1 λk vk = 0
mit (λ1 , . . . , λ4 ) 6≡ 0 gibt, also keine lineare Unabhängigkeit vorliegt.
3
(b)
P4 Ein EZS liegt vor, wenn jeder Vektor (x, y, z) ∈ R als Linearkombination (x, y, z) =
k=1 λk vk von Vektoren aus M dargestellt werden kann. Dies ist äquivalent zum GLS






x
x
1 1 0 1
1 1 0 1
1 1 0 1 x
 1 0 1 1 y  ↔  0 −1 1 0 y − x  ↔  0 −1 1 0
y − x .
0 1 1 1 z
0 1 1 1
z
0 0 2 1 z+y−x
Wir ersetzen λ3 durch t, und erhalten durch Rückwärtseinsetzen die Lösungsmenge
L = {(x − z + t, x − y + t, t, z + y − x − 2t) : t ∈ R}
= (x − z, x − y, 0, z + y − x) + {t · (1, 1, 1, −2) : t ∈ R}.
Das zeigt, dass sich jeder Vektor als Linearkombination darstellen lässt, es liegt also ein EZS
vor. Für die Wahl x = y = z = 0 sieht man, dass der Vektor 0 durch nicht-triviale Linearkombinationen dargestellt werden kann, also keine lineare Unahängigkeit vorliegt.
(c) Es handelt sich um keine Basis, da nicht linear unabhängig.
(d) Streicht man in obigem GLS die letzte oder vorletzte Spalte, so erhält man die Systeme




1 1 0
x
x
1 1 1
 0 −1 1
 0 −1 0
y−x 
y−x 
bzw
0 0 1 z+y−x
0 0 2 z+y−x
welche jeweils eindeutige Lösungen besitzten. Somit sind M1 = {(1, 1, 0), (1, 0, 1), (0, 1, 1)} und
M2 = {(1, 1, 0), (1, 0, 1), (1, 1, 1)} jeweils Basen des R3 .
Beispiel 5.45. (a) Man Überprüfe die Menge M = {(1, 1, 0), (1, 0, 1), (0, 1, −1)} auf lineare
Unabhängigkeit. (b) Man berechne die lineare Hülle (das Erzeugnis) von M , und bestimme
dessen Dimension. (c) Man überführe M durch Streichen und Hinzufügen von Vektoren zu
einer Basis.
P
Lösung: Die Frage, ob 3k=1 λk vk = 0 =⇒ λ1 = λ2 = λ3 = 0 is äquivalent zum GLS






1 1 0 0
1 1
0 0
1 1 0 0
 1 0 1 0  ↔  0 −1 1 0  ↔  0 −1 1 0 
0 1 −1 0
0 1 −1 0
0 0 0 0
73
(a) Die Lösungsmenge ist L = {(−t, t, t) : t ∈ R}. Es existieren also nicht-triviale Lösungen des
homogenen Systems, d.h., nicht-triviale Linearkombinationen die 0 ergeben. Also ist die Menge
M nicht linear unabhängig.
(b) Bringt man die dritte Spalte des GLS auf die rechte Seite, erhält man






1 1
0
1 1
0
1 1 0
 1 0 −1  ↔  0 −1 −1  ↔  0 −1 −1 
0 1 1
0 1 1.
0 0
0
Dies zeigt, dass sich der dritte Vektor durch die ersten beiden darstellen lässt, also v3 = −v1 +v2 .
Somit lässt sich die lineare Hülle von M schreiben als
Span(M ) = Span{(1, 1, 0), (1, 0, 1)} =: S.
Die verbleibenden Vektoren sind linear unabhängig (nach Definition der linearen Hülle) ein
Erzeugendensystem für S, also eine Basis. Damit ist die Dimension von S gleich 2.
(c) Mit derselben Rechnung wie oben sieht man, dass M̃ := {(1, 1, 0), (1, 0, 1), (0, 1, a)} für alle
a 6= −1 eine Basis des R3 darstellt.
Zur Überprüfung der linearen Unabhängigkeit sowie zur Darstellung des Aufspanns kann man
alternativ auch wie folgt vorgehen.
Beispiel 5.46. Wir ordnen die Vektoren in M als Zeilen einer Matrix
diese auf Zeilenstufenform.







1 1 0
1 1 0
1 1 0
1
 1 0 1 
 0 −1 1 
 0 −1 1 
 0







 0 1 1 ↔ 0 1 1 ↔ 0 0 2 ↔ 0
1 1 1
0 0 1
0 0 1
0
A an,und überführen
1
−1
0
0

0
1 

2 
0
Die ersten drei Vektoren (Achtung: wir haben die Reihenfolge der Zeilen / Vektoren hier nicht
vertauscht!) sind linear unabhängig. Der Vierte Vektor lässt sich als Linearkombination der
ersten drei darstellen. Weiters gilt
S := Span(M ) = Span{(1, 1, 0), (0, −1, 1), (0, 0, 2)} = R3 .
Die Dimension des Spans ist 3, und es liegt ein EZS vor. Die Basis des Spans ist aus obiger
Darstellung bereits ersichtlich.
74
Vektorrechnung
6
Matrizenrechnung und Lineare Abbildungen
auf Vektorräumen
Zur kompakten Darstellung von linearen Gleichungssystemen haben wir Koeffizientenmatrizen
der Form


a11 a12 . . . a1n
 a21 a22 . . . a2n 


A :=  ..
..
.. 
 .
. ...
. 
am1 am2 . . . amn
mit Einträgen aij ∈ R (oder C) verwendet. Ein rechteckiges Zahlenschema A dieser Form heißt
Matrix. Die Menge aller reellen (komplexen) Matrizen mit m Zeilen und n Spalten bezeichnen
wir mit Rm×n (bzw. Cm×n ). Zwei Matrizen sind genau dann gleich, wenn alle ihre Einträge
übereinstimmen.
Für eine Matrix A ∈ Rm×n (oder Cm×n ) definieren wir die Symbole
Ai,· := ai1 ai2 . . . ain
i-te Zeile,


a1j
 .. 
A·,j :=  . 
j-te Spalte,
amj
Aij := aij
(i, j)-ter Eintrag.
In Matlab Schreibweise entspricht dies A(i,:), A(:,j) und A(i,j). Zur bequemeren Darstellung geben wir oftmals nur die Elemente der Matrix an, wir schreiben also A = [Aij ] = [aij ].
Bemerkung 6.1. Die Matrizen
x1 x2 . . . xn ∈ R1×n
und
 
y1
 .. 
n×1
.∈R
yn
heißen naheliegenderweise Zeilen- bzw. Spaltenvektor. Wir werden später Vektoren im Rn
meistens mit Spaltenvektoren im Rn×1 identifizieren.
76
Matrizenrechnung und Lineare Abbildungen auf Vektorräumen
Für zwei Matrizen A, B ∈ Rm×n (oder Cm×n ) und λ ∈ R (oder C) definieren wir
A + B := [aij + bij ]
λ · A := [λ · aij ].
sowie
Satz 6.2. Die Mengen Rm×n (bzw. Cm×n ) sind reelle (komplexe) Vektorräume.
Beweis. Folgt elementar aus der Definition der Matrixaddition und der Multiplikation mit
Skalaren; siehe Übung.
Bemerkung 6.3. Im Folgenden seien noch einige Matrizen spezieller Form angeführt:
• Eine Matrix A ∈ Rn×n mit gleich vielen Zeilen wie Spalten heißt quadratisch.


d1 0 0
• D = diag(d1 , d2 , d3 ) :=  0 d2 0  ∈ R3×3 heißt Diagonalmatrix mit Diagonal0 0 d3
elementen d1 , d2 , d3 ; In Matlab z.B. diag([1,2,3]). In ähnlicher Weise definiert man
natürlich Diagonalmatrizen beliebiger Dimension. E := En := diag(1, 1, . . . , 1) ∈ Rn×n
heißt Einheits- oder Identitätsmatrix; in Matlab: E = eye(n).
• Matrizen der Form


l11 0 0 0
l21 l22 0 0 

L=
l31 l32 l33 0 
l41 l42 l43 l44

u11 u12 u13
U =  0 u22 u23 
0
0 u33

bzw.
heißen (linke) untere bzw. (rechte) obere Dreiecksmatrix.
• Eine Matrix mit Einträgen aij wobei aij = 0 für |i − j| > 1 heißt Tridiagonalmatrix.
Matrixmultiplikation
Definition 6.4. Für A ∈ Rm×N und B ∈ RN ×n sei C := A · B ∈ Rm×n definiert durch
C = [Cij ]
mit
Cij :=
XN
k=1
Aik · Bkj .
Bemerkung 6.5.
• Der (i, j)-te Eintrag Cij berechnet sich durch Multiplizieren und Aufsummieren der i-ten
Zeile von A und der j-ten Spalte von B.

 
 

a11 a12 . . . a1N
b11 b12 . . . b1n
c11 c12 . . . c1n
 a21 a22 . . . a2N   b21 b22 . . . b2n   c21 c22 . . . c2n 

 
 

 ..
..
..  ·  ..
..
..  =  ..
..
.. 
 .
. ...
.   .
. ...
.   .
. ... . 
am1 am2 . . . amN
bN1 bm2 . . . bmN
cm1 cm2 . . . cmn
77
• Die Multiplikation ist nur definiert, falls A gleich viele Spalten wie B Zeilen hat!
• Man beachte die Anzahl der Zeilen und Spalten des resultierenden Produkts!


1 2
1
0
Beispiel 6.6. Sei A =  1 0 und B =
. Dann ist
1 1
−1 1




1 2
3 2
1 0
A · B =  1 0 ·
= 1 0  ,
1 1
−1 1
0 1
aber das Produkt B · A ist nicht definiert! (warum?)
Der folgende Algorithmus veranschaulicht die Matrixmultiplikation in Matlab:
function C = mult(A,B)
% multiplies matrices A and B
m=size(A,1); % number of rows in A
n=size(B,2); % number of cols in B
if size(A,2) ~= size(B,1), error(’dimensions do not match’); end
C = zeros(m,n); % allocate memory
for i=1:m
for j=1:n
C(i,j) = A(i,:) * B(:,j); % = sum_k A(i,k) B(k,j)
end
end
Definition 6.7. Für A ∈ Rm×n definieren wir die transponierte Matrix A> ∈ Rn×m durch
(A> )ji := Aij für 1 ≤ i ≤ m und 1 ≤ j ≤ n.
Die transponierte Matrix entsteht also durch Vertauschen von Zeilen und Spalten.
Satz 6.8. Für Matrizen der richtigen Größe gelten die folgenden Rechenregeln:
(A · B) · C = A · (B · C),
>
>
>
(A · B) = B · A ,
A · E = E · A = A,
A · (B + C) = A · B + A · C
(A> )> = A,
An = A · An−1 = An−1 · A,
A0 := E.
Beachte: Im allgemeinen gilt nicht!, dass A · B gleich B · A ist, die Matrixmultiplikation ist
also nicht kommutativ!; vgl. Beispiel 6.6.
Beweis. Der Beweis wird teilweise in der Übung erbracht.
78
Matrizenrechnung und Lineare Abbildungen auf Vektorräumen
Beispiel 6.9. Für die Matrizen aus Beispiel 6.6 gilt z.B.
1 1
1 1 −1
3 1 0
>
>
B ·A =
·
=
= (A · B)> .
0 1
2 0 1
2 0 1
Beispiel 6.10. Das Euklid’sche Skalarpodukt zweier Vektoren x, y ∈ Rn×1 lässt sich schreiben
als
hx, yi2 = x> · y.
Wir haben hier wieder Vektoren Rn mit den Spaltenvektoren in Rn×1 identifiziert.
Bemerkung 6.11. Das Multiplizieren von Matrizen kann auch spalten- bzw. zeilenweise erfolgen. Es gilt


A1· · B


A · B·1 A · B·2 . . . A · B·n = A · B =  ... 
Am· · B
Also: multiplizieren von links mit A wirkt auf die Spalten von B (es werden Zeilenumformungen in B gemacht); multiplizieren von rechts mit B wirkt auf die Zeilen von A (es werden
Spaltenumformungen in A gemacht).
Definition 6.12. Sei A ∈ Rn×n . Gibt es eine quadratische Matrix M ∈ Rn×n , sodass
A·M =M ·A=E
(Einheitsmatrix)
ist, dann heißt M die inverse Matrix oder kurz Inverse von A, und wir schreiben M = A−1 .
Lemma 6.13. Die inverse Matrix ist eindeutig.
Beweis. Sei A ∈ Rn×n invertierbar und B, C ∈ Rn×n mit A · B = B · A = A · C = C · A = E.
Dann gilt B = B · E = B · (A · C) = (B · A) · C = E · C = C. Also B = C.
Bemerkung 6.14. Gibt es für eine nicht quadratische Matrix A ∈ Rm×n eine Matrix ML ∈
Rn×m mit ML · A = En , dann heißt ML Linksinverse zu A. Existiert ein MR ∈ Rn×m mit
A · MR = Em , dann heißt MR Rechtsinverse zu A.
Lineare Gleichungssysteme als Matrizengleichungen
Unter Zuhilfenahme der Matrixmultiplikation lässt sich das lineare Gleichungssystem
a11 x1
a21 x1
..
.
+ a12 x2
+ a22 x2
..
.
am1 x1 + am2 x2
+ . . . + a1n xn = y1
+ . . . + a2n xn = y2
..
..
..
.
.
.
+ . . . + amn xn = ym
79
mit Koeffizientenschema (A|y) jetzt kurz als Matrixgleichung
A·x=y
>
schreiben. Hierbei ist der (Spaltenvektor) x = x1 x2 . . . xn
die gesuchte Größe, und
>
y = y1 y2 . . . ym die vorgegebene rechte Seite. In Anlehnung an die Begriffe für lineare
Gleichungssysteme führen wir nun folgende Begriffe ein.
Definition 6.15. Die maximale Anzahl linear unabhängiger Zeilen- bzw. Spaltenvektoren von
A heißt Zeilen- bzw. Spaltenrang von A, kurz Z − Rang(A) bzw S − Rang(A).
Bemerkung 6.16.
• Z −Rang(A) = Dim(Span{A1,· , . . . , Am,· }) und S−Rang(A) = Dim(Span{A·,1 , . . . , A·,n }).
• Natürlich folgt sofort dass Z − Rang(A) ≤ m und S − Rang(A) ≤ n.
• Die lineare Unabhängigkeit der Spalten bzw. Zeilen lässt sich wiederum mit dem GaußAlgorithmus überprüfen.
Satz 6.17. Für jede Matrix A ∈ Rm×n gilt Z − Rang(A) = S − Rang(A) = Rang(A).
Beweis. Folgt mit Hilfe des Gauß-Algorithmus und der Tatsache, dass die Lösungsmenge eines
Gleichungssystems bei Äquivalenztransformationen nicht verändert wird. Beispiele hierzu in der
Übung.
Definition 6.18. Eine quadratische Matrix A ∈ Rn×n mit Rang(A) = n heißt regulär.
Als Folgerung aus dem Gauß-Algorithmus erhalten wir folgende Bedingung für die Existenz
einer Inversen.
Satz 6.19. Eine Matrix A ∈ Rn×n besitzt eine Inverse A−1 genau dann, wenn A regulär ist.
Beweis. Die Matrix A besitzt eine Inverse genau dann, wenn das zugehörige Gleichungssystem
A · x = y für jede rechte Seite y genau eine Lösung
x = E · x = (A−1 · A) · x = A−1 y
hat. Dies ist wiederum genau dann der Fall, wenn die Zeilenstufenform von A keine Nullzeilen
besitzt, also Rang(A) = n ist.
Folgerung 6.20. Ist A ∈ Rn×n regulär, dann hat das Gleichungssystem A · x = y für jede
rechte Seite y ∈ Rn×1 genau eine Lösung. Es gilt auch die Umkehrung.
80
Matrizenrechnung und Lineare Abbildungen auf Vektorräumen
Berechnung der Inversen
Zur Berechnung der Inversen, falls existent, kann man jetzt wie folgt vorgehen. Aus der Definition der Matrixmultiplikation erhält man
A · M = A · M·1 A · M·2 . . . A · M·n .
Das Multiplizieren einer Matrix M von links mit A entspricht also dem Multiplizieren der
einzelnen Spalten von M mit A. Die j-te Spalte M·j der Inversen kann man dann berechnen,
indem man das Gleichungssystem
A · M·j = E·j ,
1≤j≤n
löst. Da bei der Umformung auf Zeilenstufenform nur die Einträge der Matrix A relevant sind,
lassen sich alle Spalten gleichzeitig behandeln. Wir versuchen also das Gleichungssystem mit
Koeffizientenschema (A|E) mit n rechten Seiten E·1 , . . . E·n zu lösen. Zur Illustration ein kurzes
Beispiel:
2 1
Beispiel 6.21. Man berechne die Inverse der Matrix A =
.
1 2
Lösung: Wir wenden den Gauß-Algorithmus auf das System (A|E) an. Es gilt
1 12 12 0
2 1 1 0
2 1 1 0
↔
↔
(A|E) =
1 2 0 1
0 23 − 12 1
0 1 − 13 23
2
1 >
Für die erste Spalte auf der rechten Seite erhält man die Lösung M
·12 = ( 31 − 3 ) , und die
−3
3
zweite Spalte liefert M·2 = (− 13 23 ). Die Inverse ist also A−1 = M =
.
1
− 3 23
Durch weiteres Umformen der Zeilenstufenform (Gauß-Jordan Algorithmus) erhält man
1 0 23 − 13
(A|E) ↔
.
0 1 − 13 32
Dies entspricht gerade dem Gleichungssystem
E·M =
2
3
− 13
− 13
2
3
.
Die Inverse lässt sich also aus dem letzten System direkt ablesen.
Bemerkung 6.22.
• Ist die Matrix A nicht regulär, so besitzt die linke Seite der Zeilenstufenform eine echte
Nullzeile. Die Inverse existiert in diesem Fall nicht, und kann dementsprechend auch nicht
berechnet werden.
81
• Man beachte: Zum Berechnen der Inversen muss ein Gleichungssystem mit n rechten
Seiten berechnet werden. Das Aufstellen der inversen Matrix ist also zum Lösen eines
GLS (mit einer rechten Seite) nicht effizient. Die Darstellung der Lösung x = A−1 y kann
jedoch für theoretische Betrachtungen nützlich sein.
Wir führen weiters die folgenden Begriffe ein.
Definition 6.23. Für A ∈ Rm×n definieren wir
Bild(A) := {y ∈ Rm : ∃x ∈ Rn : y = Ax}
Kern(A) := {x ∈ Rn : A · x = 0}
Bild von A.
Kern von A.
Man überzeugt sich leicht, dass für eine Matrix A ∈ Rm×n mit Spalten A·j die folgenden
Zusammenehänge gelten:
Satz 6.24. Sei A ∈ Rm×n . Dann gilt
• Bild(A) ist ein Untervektorraum des Rm , Kern(A) ist ein Untervektorraum des Rn .
• Das Bild einer Matrix A wird durch ihre Spalten aufgespannt.
• Bild(A) = Span{A·j : 1 ≤ j ≤ n} sowie Bild(A> ) = Span{(Ai,· )> : 1 ≤ i ≤ m}.
• Dim(Bild(A)) = Rang(A) = Rang(A> ) = Dim(Bild(A> )).
Weiters gilten die folgende Dimensionsformel
• Dim(Kern(A)) + Dim(Bild(A)) = n und Dim(Kern(A> )) + Dim(Bild(A> )) = m.
Beweis. Die Sachverhalte folgen aus Betrachtung des Gauß’schen Eliminationsverfahren. Man
vergleiche die Dimensionsformeln mit den Aussagen über die Anzahl freier Parameter in der
Lösungsmenge von linearen Gleichungssystemen.
Bemerkung 6.25. Aus obigen Aussagen lassen sich folgende Einsichten über die Lösung linearer Gleichungssysteme gewinnen:
• Ein lineares GLS A · x = y ist genau dann lösbar, wenn y ∈ Bild(A) ist. Man beachte
hierzu, dass
n
X
A·x=y
⇔
xk A·k = y.
k=1
Das Lösen des GLSs ist also äquivalent zur Frage, ob y als Linearkombination der Spalten
von A dargestellt werden kann.
• Das GLS A · x = y ist für jede rechte Seite y ∈ Rm lösbar, wenn Bild(A) = Rm . Dies ist
genau dann der Fall, wenn der Rang von A gleich m ist.
• Der Kern von A ist gerade die Lösungsmenge des homogenen GLS A · x = 0.
82
Matrizenrechnung und Lineare Abbildungen auf Vektorräumen
• Die Dimension des Lösungsraumes von A · x = y (= minimale Anzahl von freien Parametern zur Darstellung der Lösungsmenge) ist gerade die Dimension des Kerns.
• Das GLS A·x = y besitzt höchstens eine Lösung, wenn Dim(Kern(A)) = 0 also Kern(A) =
{0}. Man beachte, dass Kern(A) ein Unterraum des Rn ist, und daher immer die 0 enthält.
Die LU Faktorisierung
Im Ffolgenden betrachten wir nochmals das Gauß’sche Eliminationsverfahren. Elementare Zeilenoperationen arbeiten auf den Zeilen von A, und können nach obiger Bemerkung durch Multiplikation mit einer Matrix von links realisiert werden.
1 1 0
Beispiel 6.26. Sei A =
. Dann gilt
2 1 1
0 1
1 1 0
2 1 1
·
=
1 0
2 1 1
1 1 0
0 1
Die Zeilen von A können also durch Multiplizieren von links mit B =
vertauscht
1 0
werden. Allgemeiner gilt
a b
A1·
a · A1· + b · A2·
·
=
c d
A2·
c · A1· + d · A2·
Durch Multiplizieren von links kann man also die Zeilen von A beliebig linear kombinieren.
Beispiel 6.27. Um mit größeren

1 0 0
0 a 0

0 0 1

0 c 0
0 0 0
Matrizen zu arbeiten, benutzen wir folgende Beobachtung.

   
A1·
0 0
A1·

  
b 0
 A2·   a · A2· + bA4· 





0 0 · A3·  = 
A3·

d 0 A4·  c · A2· + d · A4· 
0 1
A5·
A5·
Um die zweite und vierte Spalte zu modifizieren, multipliziert man mit einer Matrix B von links,
welche sich von einer Einheitsmatrix nur durch die Einträge Bij , i, j ∈ {2, 4} unterscheidet.
Die elementaren Zeilenumformungen im Gauß’schen Algorithmus können jetzt durch Multiplikation von links mit folgenden Elementarmatrizen bewerkstelligt werden.
• Vertauschen von Zeile i und j erreicht man durch Multiplikation mit der elementaren
Permutationsmatrix P ij , welche in Beispiel 6.27 durch Wahl a = 0, b = 1, c = 1, d = 0
entsteht. Siehe auch Beispiel 6.26; i.A. gilt P ij = E − (ei − ej ) · (ei − ej )> .
• Addieren des λ-fachen der Zeile i zur Zeile j > i wird durch Multiplikation mit der
elementaren linken unteren Dreiecksmatrix L̃ij erreicht, welche wie in Beispiel 6.27
durch Wahl a = 1, b = 0, c = λ, d = 1 entsteht; i.A. gilt L̃ij = E + λej e>
i .
83
Beispiel 6.28. Zur

0
1
1
Veranschaulichung diskutieren wir kurz die Umformung einer Matrix A





1 1 1
1 1 0 1
1 1 0 1
Z1↔Z2
Z3↔Z3−Z1
0 1 1 1
1 0 1 ↔ 0 1 1 1
↔
1 1 1
1 1 1 1
0 0 1 0
in Zeilenstufenform durch Multiplikation mit Elementarmatrizen. Der erste Schritt ist realisierbar durch Anwenden der Permuationsmatrix

 
 

0 1 0
0 1 1 1
1 1 0 1
P 12 · A = 1 0 0 · 1 1 0 1 = 0 1 1 1 =: A1
0 0 1
1 1 1 1
1 1 1 1
Den zweiten Schritt realisieren
trix,

1
13

0
L̃ · A1 =
−1
wir durch Multiplikation mit einer linken unteren Dreiecksma 
 

0 0
1 1 0 1
1 1 0 1
1 0 · 0 1 1 1 = 0 1 1 1 =: A2
0 1
1 1 1 1
0 0 1 0
Die resultierende rechte obere Dreiecksmatrix (= Zeilenstufenform) lässt sich also schreiben als
A2 = L̃13 · A1 = L13 · P 12 · A,
wobei L13 = (L̃13 )−1 .
Der Gauß-Algorithmus lässt sich damit formal wie folgt beschreiben:
A0 := A
for k = 1 : m do
Ak := L̃mk · . . . · L̃(k+1)k · P klk · Ak−1
end
Das Endresultat Am besitzt dann Zeilenstufenform.
Bemerkung 6.29.
• Das Ergebnis des Algorithmus verändert sich nicht,
Qmwennkl man alle benötigten Zeilenvertauschungen vorab ausführt. Wir nennen P := k=1 P k eine Permutationsmatrix.
Man beachte, dass P ij und somit auch P regulär und invertierbar ist.
• Die Überführung der Matrix P · A in Dreiecksstufenform erfolgt
durch
mit
Qm
QmMultiplizieren
kl
kl
linken unteren Dreiecksmatrizen L̃ , und wir definieren L := k=1 l=k+1 L̃ .
• Die inverse einer regulären linken unteren (rechten oberen) Dreiecksmatrix sowie das
Produkt von solchen Matrizen besitzt wieder dieselbe Gestalt. Insbesondere gilt
−1
−1
(m−1)m
(m−2)m
(m−2)(m−1)
13
12
L := L̃ = L̃
· L̃
· L̃
· . . . · L̃ · L̃
= (L̃12 )−1 · (L̃13 ) · . . . · (L̃(m−2)(m−1) )−1 · (L̃(m−2)m )−1 · (L̃(m−1)m )−1
84
Matrizenrechnung und Lineare Abbildungen auf Vektorräumen
Für das Hauptresultat dieses Abschnitts brauchen wir noch folgende Eigenscchaften von Produkten von Elementarmatrizen.
Satz 6.30. Seien Pk und L̃k elementare Permutations- bzw Dreiecksmatrizen. Dann gilt:
Q
• Die (algemeine) Permutationsmatrix P := k Pk = P1 · P2 · . . . ist regulär (invertierbar), und P −1 = P > .
Q
• Die Matrix L̃ := k L̃k = L̃1 · L̃2 · . . . ist regulär (invertierbar). Weiters sind L̃ und L̃−1
wieder linke untere Dreiecksmatrizen mit Einsen auf der Diagonale.
Beweis. Mit Induktion nach k; siehe Übung.
Die Zusammenfassung der obigen Beobachtungen liefert uns das folgende Resultat.
Satz 6.31 (LU-Faktorisierung (LR-Zerlegung)). Jede Matrix A ∈ Rm×n lässt sich zerlegen in
P · A = L · U,
wobei P ∈ Rm×m eine Permutationsmatrix ist, L ∈ Rm×m eine linke untere Dreiecksmatrix mit
Einsen auf der Diagonale, und U ∈ Rm×n eine rechte obere Dreiecksmatrix (also in Zeilenstufenform).
Die Zeilenstufenform U der Matrix erhält man dementsprechend einfach durch
U = L−1 · P · A.
Praktische Durchführung der LU Zerlegung
Die Darstellung des Gauß-Algorithmus über Produkte von Elementarmatrizen ist vor allem von
theoretischer Bedeutung. Hingegen ist die LU-Zerlegung auch von praktischer Relevanz, v.a.,
wenn GLSe mit mehrerern rechten Seiten gelöst werden sollen.
Das Lösen eine GLSs mittels LU-Zerlegung funktioniert dann wie folgt:
• Das GLS A · x = y ist äquivalent zu L · U · x = P · A · x = P · y = P y
• Rückwärtseinsetzen: Löse L · z = L · (U · x) = P y
• Vorwärtseinsetzen: Löse U · x = z
Im Folgenden seien die wesentlichen Schritte für den Fall durchdiskutiert, dass keine Zeilenvertauschungen notwendig sind.
85
% Ermittlung der LU Zerlegung
[L,U] = lu_decompose(A);
% matlab: [L,U,P]=lu(A);
% Permutation der rechten Seite: P*A*x = P*y
Py = y;
% matlab: Py = P*y;
% Rueckwaertseinsetzen: L*z = Py
z = backward_solve(L,Py); % matlab: z = L\Py;
% Vorwaertseinsetzen: U*x = z
x = forward_solve(U,z);
% matlab: x = U\z;
Der folgende Algorithmus beschreibt die LU-Zerlegung im Falle
Algorithmus) ohne Zeilenvertauschung auskommt. Der Ansatz

 
 
1
0 0 ...
U11 U12 U13 . . .
A11
L21 1 0 . . .  0 U22 U23 . . . A21

 
=
L31 L32 1 . . . ·  0
0 U33 . . . A31
...
...
...
dass diese (bzw der Gauß
A12 A13 . . .
A22 A23 . . .

A32 A33 . . .
erlaubt die Unbekannten Lij und Uij zeilenweise zu bestimmen.
• Die erste Zeile k = 1 liefert: U11 = A11 , U12 = A12 , U13 = A13 , usw.
• Die zweite Zeile k = 2 liefert
– Spalte j = 1: L21 U11 = A21 und daher L21 = A21 /U11 .
– Spalte j ≥ 2: L21 U1j + U2j = A2j woraus folgt: U2j = A2j − L2j U2j
• Die dritte Zeile k = 3 liefert
– Spalte j = 1: L31 U11 = A31 und daher L31 = A31 /U11 .
– Spalte j = 2: L31 U12 + L32 U22 = A32 , also L32 = (A32 − L31 U12 )/U22 .
– Spalte j ≥ 3: L31 U1j + L32 U2j + U3j = A3j woraus folgt: U3j = A3j − L31 U1j − L32 U2j
• u.s.w.
Man sieht, dass man aus den Spalten j < k der k-ten Zeile nacheinander die Koeffizienten Lkj
ermitteln kann, und aus den Spalten j ≥ k dann die noch unbekannten Koeffizienten Ukj . Führt
man die Rechnung fort, erhält man den folgenden Algorithmus.
function [L,U] = lu_decompose(A)
% lu decomposition of A without pivoting
m=size(A,1); n=size(A,2);
U=zeros(m,n); L=zeros(m,m);
86
Matrizenrechnung und Lineare Abbildungen auf Vektorräumen
for k=1:m
for j=1:k-1
L(k,j) = ( A(k,j) - L(k,1:j-1)*U(1:j-1,j) ) / U(j,j);
% = ( A(k,j) - sum_{l=1}^{j-1} L(k,l)*U(l,k) ) / U(j,j);
end
L(k,k) = 1; % nie verwendet!
if abs(A(k,k))<1e-12, error(’matrix is close to singular’); end
for j=k:n
U(k,j) = A(k,j) - L(k,1:k-1)*U(1:k-1,j);
% = A(k,j) - sum_{l=1}^{k-1} L(k,l)*U(l,j);
end
end
Das Vorwärts- und Rückwärtseinsetzen funktioniert analog zum Gauß-Algorithmus, vgl. Übung.
Im folgenden noch einige praktische Hinweise:
Bemerkung 6.32.
• Die Anzahl der arithmetischen Operationen (Multiplikationen) für die LU-Zerlegung ist
ca. n3 /3, und damit um etwa 1/3 geringer als das Multiplizieren zweier Matrizen!
• Das Vorwärts- bzw Rückwärtseinsetzen benötigt jeweils ca n2 /2 Multiplikationen.
• Die 1 Einträge der Matrix L sowie 0en in L und U brauchen nicht gespeichert werden.
In der Praxis werden daher typischerweise die Einträge von L und U über die Matrix A
gespeichert.
• Eine allgemeine Permuationsmatrix P kann durch Angabe eins Zeilevektors p gespeichert werden: Die Einträge pi bezeichnen dabei gerade die Position der i-ten Zeile (nach
Permutation). Sei P y = P · y. Dann gilt P y(p) = (P y(p1 ), P y(p2 ), . . .)> = y.
Lineare Abbildungen
Im folgenden identifizieren wir die Vektoren in Rn mit den Spaltenvektoren in Rn×1 . Eine Matrix
A ∈ Rm×n definiert dann eine Abbildung
LA : Rn → Rm ,
x 7→ A · x
zwischen den Vektorräumen Rn und Rm . Aus den Regeln für die Matrixmultiplikation folgt
sofort
A · (x + y) = A · x + A · y
sowie
A · (λ · x) = λ · (A · x).
Das motiviert den folgenden Begriff.
Definition 6.33. Eine Abbildung L : V → W , v 7→ L(v) zwischen K-Vektorräumen V und W
heißt linear, falls für alle Vektoren u, v ∈ V und alle Zahlen λ ∈ K gilt:
L(u + v) = L(u) + L(v)
und
L(λ · v) = λ · L(v).
87
Das Einsetzen in die Definition zeigt, dass die zu einer Matrix A gehörende Abbildung LA linear
ist. Es gilt allerdings auch die Umkehrung.
Satz 6.34. Sei L : Rn → Rm eine lineare Abbildung. Dann gibt es eine eindeutige Matrix
A ∈ Rm×n mit L = LA , d.h., L(x) = A · x für alle x ∈ Rn .
Beweis. Sei {e1 , . . . , en } die kanonische Basis des Rn . Dann lässt sich x als Linearkombination
x = x1 · e1 + x2 · e2 + . . . xn · en =
Xn
k=1
xk · e k
schreiben. Unter Ausnutzung der Linearität erhält man
X
L(x) = L(
xk · ek ) = L(x1 · e1 + . . . + xn · en )
X
= x1 · L(e1 ) + . . . + xn · L(en ) =
xk · L(en ).
Andererseits hat man für beliebiges A ∈ Rm×n
X
LA (x) = A · x = A · (
xk · ek ) = A · (x1 · e1 + . . . + xn · en )
X
= x1 · (A · e1 ) + . . . + xn · (A · en ) =
xk · (A · ek ).
Weiters beachte man, dass A · ek = A·k gerade die k-te Spalte von A ergibt. Vergleicht man
die beiden Ausdrücke, so liegt nahe, die k-te Spalte von A also A·k := L(ek ) festzulegen. Wie
obigen Rechnungen zeigen, gilt dann L(x) = LA (x) für alle x ∈ Rn .
Satz 6.35. Seien V und W normierte Vektorräume. Dann ist die Menge L(V, W W ) aller
linearen Abbildungen zwischen V und W ein Vektorraum. Weiters definiert die Vorschrift
kLkV →W = sup{kL(v)kW /kvkV : v ∈ V, v 6= 0} sup
06=v∈V
kL(v)kW
kvkV
eine Norm auf L(V, W ), die sogenannte Operatornorm. L(V, W ) ist somit ein normierter
Vektorraum. Man beachte, dass die Operatornorm von der Wahl der Normen für V audn W
abhängt!
Bemerkung 6.36. Für den Fall V = Rn und W = Rn wissen wir bereits, dass sich die
linearen Abbildungen über Matrizen darstellen lassen. Wir haben also L(Rn , Rm ) ' Rm×n , und
definieren dementsprechend die Matrixnormen
kAkRn →Rm := sup
06=x∈Rn
kA · xkRn
kxkRn
was gerade kAk = kLA k entspricht. Achtung: Die Matrixnorm hängt von der Wahl der Normen
für Rm und Rn ab!
88
Matrizenrechnung und Lineare Abbildungen auf Vektorräumen
Bemerkung 6.37. Aus der Definition der Matrixnorm erhält man sofort:
kA · xkRn →Rm ≤ kAkRn →Rn kxkRn
für alle x ∈ Rn .
Diese elementare Ungleichung wird oftmals verwendet! Gleiches gilt natürlich auch für allgemeine lineare Operatoren.
Im folgenden wollen wir einige gebräuchliche Matrixnormen kurz vorstellen.
Beispiel 6.38.
• Als Normen für Rm und Rn wählen wir jeweils die 1-Norm kvk1 :=
die zugeordnete Matrixnorm schreiben als
P
k
vk . Dann lässt sich
m
kAk1 := sup
x6=0
X
kA · xk1
= max
|Aij |.
1≤j≤n
kxk1
i=1
Die 1-Matrixnorm ist also gerade die maximale Spaltenbetragssumme, und heißt dementsprechend Spaltenbetragssummennorm.
• Wählt man die Maximumsnorm kvk∞ := maxk |vk | auf den Vektorräumen Rm und Rn ,
so erhält man
m
X
kA · xk∞
kAk∞ := sup
= max
|Aij |.
1≤i≤m
kxk∞
x6=0
j=1
Diese Norm heißt dementsprechend Zeilenbetragssummennorm.
P
• Die zur Euklid’sche Norm kvk2 = ( k |vk |2 )1/2 zugeordnete Matrixnorm
kAk2 := sup
x6=0
kA · xk2
kxk2
heißt Spektralnorm. Diese Lässt sich über die Singulärwerte der Matrix A charakterisieren.
Herunterladen