Mathematische Grundlagen MSE WS 2011/12 H. Egger und M. Schlottbom 1. Dezember 2011 2 1 Vorbermerkungen Als Grundlage für die Vorbereitung dieser Vorlesung dienten die Bücher • R. Ansorge und H.-J. Oberle: Mathematik für Ingenieure, Band 1, 3te Auflage, WileyVCF, 2000. • K. Meyberg und P. Vachenhauer: Höhere Mathematik, Band 1, Springer, 1999. Reichliches Übungsmaterial kann in den Bänden • Ansorge, Oberle, Übungsaufgaben • Viele Autoren, Mathematik, Spektrum, 2010. gefunden werden. Als weiterführende Literatur zu den Themenbereichen Analysis, Lineare Algebra und Numerik sei auf die Bücher • Königsberger, Analysis, • Fischer, Lineare Algebra, • W. Dahmen und A. Reusken: Numerische Mathematik, 2te Auflage, Springer, 2008. verwiesen. Im folgenden Skript werden elementare mathematische Begriffe eingeführt, sowie Grundlagen der linearen Algebra und der eindimensionalen Analysis besprochen. Theoretische Resultate werden an Beispielen veranschaulicht, und die tatsächliche Durchführung komplexer Rechnungen mittels numerischer Methoden wird anhand verschiedener Aufgabenstellungen behandelt. 2 1 Grundlegende Begriffe Die Mathematik beruht auf einigen (wenigen) Axiomen (Postulaten), in denen grundlegende Zusammenhänge festgestellt werden, die sich i.A. nicht beweisen lassen. In Definitionen werden neue Begriffe eingeführt, und in mathematischen Sätzen werden aus einfachen Voraussetzungen kompliziertere Folgerungen hergeleitet. Die Sätze sind als Aussagen formuliert, deren (immerwährende) Richtigkeit in Beweisen gezeigt wird. In dieser Definition-Satz-Beweis Manier lässt sich das Gebäude der Mathematik schrittweise erweitern. Weitere grundlegende Objekte der Mathematik sind Mengen und Funktionen. Im vorangehenden Beispiel wurde etwa bereits die Menge der natürlichen Zahlen verwendet. Die Variable n wurde als Platzhalter für beliebige natürliche Zahlen verwendet, und die Bedeutung der Symbole · oder = als bekannt vorausgesetzt. Im folgenden Abschnitt werden diese Grundbegriffe näher erläutert. Weiterhin wird das Formulieren und Beweisen von mathematischen Sätzen anhand von Beispielen exemplarisch vorgestellt. 1.1 Aussagenlogik Die Formulierung von mathematischen Sätzen (Resultaten) erfolgt in Aussagen. Definition 1.1. Eine Aussage A ist ein feststellender Satz, dem ein eindeutiger Wahrheitswert w(A) zugewiesen werden kann. Wir definieren w(A) = 1 w(A) = 0 :⇔ :⇔ A ist wahr, A ist falsch. Bemerkung 1.2. w(A) kann nur die Werte 0 oder 1 annehmen, Halbwahrheiten sind also nicht zulässig. Das Symbol :⇔ dient zur Definition, also: der Wahrheitswert w(A) von A ist per Definition 1 (0) falls A wahr (falsch) ist. Beispiel 1.3. • Die Erde ist eine Scheibe. • 5 > 4. 4 Grundlegende Begriffe Um keine mathematischen Aussagen handelt es sich jedoch bei • Komm endlich her! • 5 Sekunden ist ziemlich kurz. • Wirklich? Durch Verknüpfungen (Junktoren) lassen sich aus einfachen Aussagen kompliziertere bilden. Definition 1.4. Für Aussagen A und B werden folgende Symbole (Junktoren) definiert: ¬A : A∧B : A∨B : A⇒B: nicht A A und B A oder B falls A, dann B (Negation), (Konjunktion), (Disjunktion), (Implikation), A⇔B: A genau dann, wenn B (Äquivalenz). Der Wahrheitswert der verknüpften Aussagen ist in folgender Wahrheitstafel definiert: A 1 1 0 0 B 1 0 1 0 ¬A A ∧ B 0 1 0 0 1 0 1 0 A∨B 1 1 1 0 A⇒B 1 0 1 1 A⇔B 1 0 0 1 Bemerkung 1.5. Mathematische Sätze sind typischerweise als Implikation A ⇒ B formuliert. Dabei heißt A die Voraussetzung (Prämisse) und B die Behauptung (Folgerung, Conclusio). Man beachte: • Die Implikation A ⇒ B ist immer auch dann wahr, wenn die Voraussetzung A falsch ist, egal ob die Behauptung B stimmt oder nicht! Z.B. ist die Aussage: “Falls ich morgen 1000 Jahre alt werde, bekommt jeder meiner Studenten eine Million Euro” wahr, und somit wohl nicht einklagbar :) • Die Voraussetzung A ist hinreichend für die Folgerung B (“wenn A dann B”); umgekehrt ist die Folgerung B notwendig für A (“wenn B nicht stimmt, dann kann auch A nicht wahr sein”; siehe unten). Weiterhin sei bemerkt: • Das Symbol ∨ mein ein einschließliches “oder”, also A ∨ B ist wahr, wenn zumindest eine (oder beide) der Aussagen A oder B wahr sind. • Das Äquivalenzsymbol ⇔ hat für Aussagen eine ähnliche Bedeutung, wie das Gleichheitszeichen für Zahlen. 1.1 Aussagenlogik 5 Beispiel 1.6. Sei x := 2. Die Aussagen A und B seien gegeben durch A :⇔ (x > 5) und B :⇔ (x < 3). Wir erhalten verknüpfte Aussagen mit folgender Bedeutung: • ¬A bedeutet: x ≤ 5. Die Aussage ist wahr (da x = 2). • A ∧ B heißt: x > 5 und x < 3. Die Aussage ist falsch, da A falsch ist. Die Aussage wäre sogar für jede reelle Zahl x falsch, da x nicht gleichzeitig größer als 5 und kleiner als 3 sein kann. • A ∨ B heißt: x > 5 oder x < 3. Das stimmt, da B richtig ist. Die Aussage wäre falsch für reelle Zahlen 3 ≤ x ≤ 5. • A ⇒ B bedeutet: aus x > 5 folgt x < 3 (oder “wenn x > 5, dann auch x < 3). Da die Voraussetzung nicht stimmt, ist die Aussage wahr!, und zwar nicht nur für x = 2, sondern für jedes x ≤ 5! • A ⇔ B heißt: x > 5 genau dann, wenn x < 3. Die Aussage A ist falsch, B is wahr. Die Aussagen sind also nicht äquivalent, und somit w(A ⇔ B) = 0. Dies gilt wiederum für jedes reelle x. Anhand einer Wahrheitstabelle überzeugt man sich leicht, dass die Aussage ¬(¬A) ⇔ A, immer gilt. Solche immer geltende Wahrheiten heißen Tautologien, und diese können als “Rechenregeln” beim logischen Argumentieren verwendet werden. Satz 1.7. Seien A und B Aussagen. Dann gilt ¬(¬A) ⇔ A, (A ⇒ B) ⇔ ((¬B) ⇒ (¬A)), (A ⇒ B) ⇔ (B ∨ (¬A)), (A ⇒ B) ⇔ ¬(A ∧ (¬B)), sowie die De Morgan’schen Regeln ¬(A ∧ B) ⇔ ((¬A) ∨ (¬B)), ¬(A ∨ B) ⇔ ((¬A) ∧ (¬B)) Beweis. Mit Wahrheitstafeln. Oftmals hat man es mit Aussagen der folgenden Gestalt zu tun: • Für alle reellen Zahlen x gilt x2 ≥ 0. • Es gibt eine natürliche Zahl n mit n > 1. Diese Aussagen beinhalten Teile der Form x2 ≥ 0 bzw. n > 1, welche erst durch Einsetzen eines konkreten Objektes einen Sinn bekommen. 6 Grundlegende Begriffe Definition 1.8. Eine Aussageform ist ein formaler Ausdruck der Art A(x), welcher durch Einsetzen eines konkreten Objektes für die Variable x zu einer Aussage wird. Beispiel 1.9. Wir betrachten die Aussageform A(x) welche für natürliche Zahlen durch A(x) :⇔ x > 5 definiert sei. Für jedes x ≤ 5 ist diese Aussage falsch, während z.B. die Aussage A(6) wahr ist. Man beachte, dass x vorderhand eine “freie” Variable ist, A(x) also keinen Wahrheitsgehalt besitzt solange x kein Wert zugewiesen wurde. Definition 1.10 (Quantoren). Sei M eine Menge, und A(x) eine Aussageform, welche für x ∈ M wohldefiniert ist. Die Symbole ∀ und ∃, definiert durch ∀x ∈ M : A(x) ∃x ∈ M : A(x) :⇔ :⇔ Für alle x ∈ M gilt A(x), Es existiert ein x ∈ M für das A(x) gilt, heißen All- bzw. Existenzquantor. Weiterhin verwenden wir den Quantor ∃!x ∈ M : A(x) :⇔ A(x) stimmt für genau ein x ∈ M. Zum Begriff der Menge sowie des Elementsymbols ∈ siehe weiter unten. Bemerkung 1.11. Sei M = {1, 2, 3} gegeben. Man beachte ∀x ∈ M : (x > 5) ⇔ ((1 > 5) ∧ (2 > 5) ∧ (3 > 5)) sowie ∃x ∈ M : (x > 5) ⇔ ((1 > 5) ∨ (2 > 5) ∨ (3 > 5)). Die Quantoren ∀ und ∃ erlauben also “und“- bzw. “oder“-Verkettungen vieler Aussagen gleicher Gestalt kompakt darzustellen. Beispiel 1.12. “Es gibt genau eine reelle Zahl r > 0 mit r·r = 2” lässt sich formal ausgedrücken √ als: “∃!r > 0 reell : r · r = 2“. Diese Aussage ist wahr, und das richtige √ r ist gegeben √ r = 2. Die Aussage “∃!r reell : r · r = 2“ ist jedoch falsch, da neben r = 2 auch r = − 2 Lösung ist. Beispiel 1.13. Sei A(x) :⇔ x > 5 wie oben definiert, und M = {5, 6}. Dann ist ∀x ∈ M : A(x) eine falsche Aussage, denn (∀x ∈ M : A(x)) ⇔ (5 > 5) ∧ (6 > 5)). D.h., nicht “für alle x in M is x > 5”. Andererseits ist die Aussage ∃x ∈ M : A(x) wahr, denn (∃x ∈ M : A(x)) ⇔ (5 > 5) ∨ (6 > 5)), und die letzte Ungleichung ist korrekt bzw w(A(6)) = 1. “Es gibt ein x in M , sodass x > 5.” 1.2 Mengen und Relationen 7 Die DeMorgan’schen Regeln lassen sich wie folgt auf Quantoren erweitern. Satz 1.14. Die Aussageform A(x) sei für x ∈ M wohldefiniert. Dann gilt ¬(∀x ∈ M : A(x)) ⇔ ∃x ∈ M : (¬A(x)) ¬(∃x ∈ M : A(x)) ⇔ ∀x ∈ M : (¬A(x)) . Beispiel 1.15. Man beachte das vorhergehende Beispiel zu Quantoren. Weiterhin gilt: • Das Gegenteil von A :⇔ “alle Professoren unterrichten Mathematik” ist ¬A :⇔ “Es gibt einen Professor, der nicht Mathematik unterrichtet”. • Das Gegenteil von ∃x ∈ M : x > 5 ist ∀x ∈ M : x ≤ 5. 1.2 Mengen und Relationen Im folgenden beschäftigen wir uns mit dem Begriff der Menge und elementaren Konstruktionsprinzipien für solche. Nach Georg Cantor verstehen wir unter einer Menge anschaulich eine Zusammenfassung bestimmter, wohl unterscheidbarer Objekte zu einem Ganzen. Bemerkung 1.16. Dieser Mengenbegriff ist nicht ganz widerspruchsfrei, wie folgendes Beispiel belegt: “M sei die Menge aller Mengen, die sich nicht selbst enthalten”. Das ist ein typisches Paradoxon, die “Russel’sche Antinomie”. Mengen können auf verschiedene Arten angegeben werden, etwa durch • Aufzählung der Elemente: M1 = {1, 2, 3} oder M2 = {∗, 0 a0 , M }, oder durch • Angabe einer Vorschrift, wie die Elemente konstruiert werden können, z.B. M3 = {x : x ist Bürger von Österreich} oder M = {x reelle Zahl : x < 5}. Mit ∅ oder {} bezeichnen wir die leere Menge, welche kein Element enthält. Definition 1.17. Sei M eine Menge, und x ein Objekt. Wir definieren die Symbole (Relationen) a∈M a 6∈ M :⇔ :⇔ a ist Element von M, ¬(a ∈ M ). Beispiel 1.18. Folgende Mengen werden immer wieder verwendet. • Die Menge der natürlichen Zahlen N := {1, 2, 3, . . .} und N0 := {0, 1, 2, . . .}. • Die Mengen der ganzen Zahlen Z := {0, −1, 1, −2, 2, . . .} sowie der rationalen Zahlen Q := {q : q = m/n wobei m ∈ Z, n ∈ N}. Ist q = m/n, dann heißt m Zähler, und n Nenner des Bruchs m/n. 8 Grundlegende Begriffe • Die reellen Zahlen R := {r : r ist reelle Zahl }. Mehr dazu später. Definition 1.19. Für zwei Mengen M und N definieren wir die folgenden Symbole M ⊂ N :⇔ ∀x ∈ M : (x ∈ N ) M = N :⇔ ((M ⊂ N ) ∧ (N ⊂ M ) (Teilmenge) (Gleichheit) Gilt M ⊂ N , so heißt M Teilmenge von N . Das Gegenteil wird mit M 6⊂ N ausgedrückt. Beispiel 1.20. • Offene, halboffene, und geschlossene Intervalle. Für a, b ∈ R definieren wir folgende Teilmengen von R: [a, b] := {x ∈ R : a ≤ x ≤ b}, [a, b) := {x ∈ R : a ≤ b < c}, und (a, b) = {x ∈ R : a < x < b}. • Es gilt N ⊂ N0 ⊂ Z ⊂ Q ⊂ R. • Für alle Mengen M gilt: {} ⊂ M . • Sei M = {1, 2} und N = {1, 2, 3}. Dann gilt M ⊂ N , N 6⊂ M , also M 6= N . Bemerkung 1.21. Für jede beliebige Aussageform A(x) gilt: ∀x ∈ {} : A(x). Über die leere Menge darf man also alles behaupten. Für die Konstruktion von Mengen aus bereits bekannten Mengen können folgende Operationen verwendet werden Definition 1.22. Für Mengen M und N definieren wir die Symbole (Operationen) M ∩N M ∪N M \N :⇔ :⇔ :⇔ {x : (x ∈ M ) ∧ (x ∈ N )}, {x : (x ∈ M ) ∨ (x ∈ N )}, {x : (x ∈ M ) ∧ (x 6∈ N )}, (Durchschnitt) (Vereinigung) (Differenz). Beispiel 1.23. • Sei M = {1, 2, 3} und N = {2, 4, 7}. Dann ist M ∩ N = {2}, M ∪ N = {1, 2, 3, 4, 7} und M \ N = {1, 3}. • Sei M = {n ∈ N : n < 3} und N = {n ∈ N : n > 3}. Dann ist M ∩ N = {}, M ∪ N = N \ {3} und M \ N = M . • Sei M = {x ∈ R : 0 ≤ x < 1} und N = {x ∈ R : x2 ≤ 1/4}. Dann ist N = {x ∈ R : −1/2 ≤ x ≤ 1/2} und daher M ∩ N = {x ∈ R : 0 ≤ x ≤ 1/2}, M ∪ N = {x ∈ R : −1/2 ≤ x < 1} und M \ N = {x ∈ R : 1/2 < x < 1}. Die elementaren Mengenoperationen lassen sich gut in so-genannten Venn-Diagrammen veranschaulichen. 1.2 Mengen und Relationen 9 Venn Diagramme Für das “Rechnen” mit Mengen gelten, ähnlich wie beim Rechnen mit Zahlen, folgende Regeln. Hierbei spielen ∩ bzw. ∪ die Rolle von · bzw. +. Satz 1.24. Seien M , N , O Mengen. Dann gilt M ∩ N = N ∩ M und M ∪ N = N ∪ M (M ∩ N ) ∩ O = M ∩ (N ∩ O) und (M ∪ N ) ∪ O = M ∪ (N ∪ O) (M ∪ N ) ∩ O = (M ∩ O) ∪ (N ∩ O) (Kommutativität) (Assoziativität) (Distributivität) Beweis. Wir zeigen nur die erste Behauptung, die restlichen folgen analog. Es gilt x ∈ (M ∩ N ) ⇔ (x ∈ M ) ∧ (x ∈ N ) ⇔ (x ∈ N ) ∧ (x ∈ M ) ⇔ x ∈ (N ∩ M ). Wir haben hier verwendet, dass die ∧ Verknüpfung kommutativ ist. Definition 1.25. Zur Konstruktion von Mengen definieren wir M ×N P (M ) :⇔ :⇔ {(x, y) : (x ∈ M ) ∧ (y ∈ N )}, {N : N ⊂ M }, (Cartesisches Produkt) (Potenzmenge). Bemerkung 1.26. Beim Cartesischen Produkt bezeichnet (x, y) ein geordnetes Paar. Für diese ist Gleichheit definiert durch (x1 , y1 ) = (x2 , y2 ) :⇔ (x1 = x2 ) ∧ (y1 = y2 ). Es kommt also auf die Reihenfolge an, und im Allgemeinen ist (x, y) 6= (y, x). Beispiel 1.27. Sei M = {1, 2} und N = {3, 4, 5}. Dann ist P (M ) = {{}, {1}, {2}, {1, 2}} und M × N = {(1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5)}. Die Definitionen von Durchschnitt, Vereinigung und Cartesischem Produkt lassen sich sofort auf mehrere Mengen verallgemeinern. 10 Grundlegende Begriffe Definition 1.28. Mit Mi seien für 1 ≤ i ≤ n Mengen bezeichnet. Wir definieren n [ i=1 n \ i=1 n Y Mi := M1 ∪ M2 ∪ . . . ∪ Mn := {x : ∃i ∈ {1, . . . , n} : (x ∈ Mi )} Mi := M1 ∩ M2 ∩ . . . ∩ Mn := {x : ∀i ∈ {1, . . . , n} : (x ∈ Mi )} Mi := M1 × M2 × . . . × Mn := {(x1 , . . . , xn ) : ∀i ∈ {1, . . . , n} : (xi ∈ Mi )}. i=1 Bemerkung 1.29. • Gilt M1 = M2 = . . . = Mn = M , dann schreiben wir auch M n := Qn i=1 M. • Das n-fache Cartesische Produkt besteht aus n-Tupeln (x1 , . . . , xn ), die angeordnete Folgen von je n Objekten sind; die Reihenfolge ist wichtig! Beispiel 1.30. Mit R2 := R × R und R3 := R × R × R bezeichnen wir die Punkte (x, y) bzw (x, y, z) in der Euklideschen Zahlenebene, bzw. dem Euklidischen dreidimensionalen Raum. Beide werden in den folgenden Kapiteln häufig verwendet. Als abschließendes Beispiel soll nochmals ausdrücklich auf den elementaren Zusammenhang zwischen Mengen und Aussagen hingewiesen werden. Sn Bemerkung Tn 1.31. Es gilt: x ∈ i=1 Mi ⇔ ∃i ∈ {1, . . . , n} : x ∈ Mi und in ähnlicher Weise auch x ∈ i=1 Mi ⇔ ∀i ∈ {1, . . . , n} : x ∈ Mi . Es besteht also ein elementarer Zusammenhang zu den Quantoren. 1.3 Abbildungen Definition 1.32. Seien M und N Mengen. Eine Abbildung (Funktion) von M in N ist eine Vorschrift, welche jedem Element x ∈ M genau ein Element y = f (x) ∈ N zuordnet. Wir schreiben f : M → N, x 7→ f (x). M heißt Definitionsbereich (Urbildbereich) und N Bildbereich (Wertemenge) von f . Mit Graph(f ) := {(x, f (x)) : x ∈ M } ⊂ M × N bezeichnet man den Graphen der Funktion f . Bemerkung 1.33. Wichtig is hier, dass es für jedes x ∈ M genau ein y ∈ N mit y = f (x). Dies wird durch das Symbol x 7→ f (x) ausgedrückt. Beispiel 1.34. 1.3 Abbildungen 11 • f : R → R, x 7→ 2 · x ist eine Funktion. • f : {a, b, c} → {1} mit f (a) = 1, f (b) = 1, f (c) = 1 ist eine Funktion. • f : {a, b} → {1} mit f (a) = 1 ist keine Funktion. Dem Argument b is kein Funktionswert zugewiesen. Bemerkung 1.35. • Handelt es sich bei M um eine Menge mit endlich vielen Elementen, so kann die Vorschrift f (x) tabellarisch angegeben werden. • Seien M, N ⊂ R. Dann kann f : M → N durch Darstllung des Funktionsgraphen veranschaulicht werden. Wir wollen noch weitere Begriffe festlegen. Definition 1.36. Für A ⊂ M und B ⊂ N heißen die Mengen f (A) := {y ∈ N : ∃x ∈ A : y = f (x)} ⊂ N, f (B) := {x ∈ M : f (x) ∈ B} ⊂ M −1 das Bild von A bzw. das Urbild von B unter (der Funktion) f . Beispiel 1.37. Wir betrachten die Funktion f : [0, 2] → R, x 7→ 2x + 1. Es ist dann f ([0, 2]) = [1, 5] und f −1 ((1, 3)) = (0, 1). Man veranschauliche sich hierzu den Funktionsgraphen. Definition 1.38. Eine Funktion f : M → N heißt • injektiv, falls f (x1 ) = f (x2 ) ⇒ x1 = x2 für jedes x1 , x2 ∈ M . Zwei verschiedene Argumente können also nicht dasselbe Bild erzeugen. • surjektiv, falls ∀y ∈ N ∃x ∈ M : y = f (x). D.h., jedes Element im Bildbereich wird tatsächlich angenommen. • bijektiv, falls f injektiv und surjektiv ist. Beispiel 1.39. Die Funktion f : [0, 1] → R, x 7→ 2x + 1 ist • injektiv: Es gilt nämlich f (x1 ) = f (x2 ) ⇔ 2x1 + 1 = 2x2 + 1 ⇔ 2x1 = 2x2 ⇔ x1 = x2 . • nicht surjektiv: y = 0 liegt im Bildbereich, es gibt aber kein x im Urbildbereich [0, 1] für das f (x) = 0 ist. Das sieht man durch Auflösen f (x) = 0 ⇔ 2x + 1 = 0 ⇔ 2x = −1 ⇔ x = −1/2. x = −1/2 wäre also die einzige Möglichkeit, um mit der Vorschrift f (x) = 2x + 1 den Wert 0 zu erreichen. −1/2 liegt aber nicht im Definitionsbereich. 12 Grundlegende Begriffe Es folgt, dass f auch nicht bijektiv ist. Bemerkung 1.40. Eine Funktion kann surjektiv gemacht werden, indem man den Wertebereich auf diejenigen Werte einschränkt, die tatsächlich angenommen werden, d.h., jede Funktion f : M → f (M ) ist automatisch surjektiv. Beispiel 1.41. Wir definieren f : [0, 2] 7→ [1, 5] mit x 7→ 2x + 1 wie oben. Dann ist f surjektiv, und mit obiger Überlegung auch injektiv, und somit bijektiv. Man veranschauliche sich den Unterschied zu oben anhand des Funktionsgraphen. Bemerkung 1.42. Für Funktionen f : M ⊂ R → N ⊂ R lässt sich anhand des Funktionsgraphen leicht entscheiden, ob Injektivität und/oder Surjektivität vorliegt. Injektivität bzw. Surjektivität reeller Funktionen Definition 1.43 (Hintereinanderausführung). Seien M , N , O Mengen, und f : M → N , g : N → O Funktionen. Dann ist mit (g ◦ f ) : M → O, x 7→ g(f (x)) eine Funktion (die Hintereinanderausführung von g und f ) definiert. Bemerkung 1.44. Zur besseren Unterscheidung haben wir das Symbol y für Elemente der Bildmenge N verwendet, und im Gegensatz dazu x für Elemente des Urbildbereiches. Satz 1.45. Sei f : M → N , x 7→ f (x) bijektiv. Dann existiert eine Abbildung g : N → M , y 7→ g(y) sodass (g ◦ f )(x) = g(f (x)) = x for all x ∈ M. Die Abbildung g heißt Umkehrabbildung und wird mit g = f −1 bezeichnet. Bemerkung 1.46. Die einfache Abbildung idM : M → M , x 7→ x wird Identitätsabbildung genannt. Obiger Satz liefert also f −1 ◦ f = idM . Ebenso gilt f ◦ f −1 = idN . Beispiel 1.47. Wie gezeigt, ist die Funktion f : [0, 2] → [1, 5], x 7→ 2x + 1 bijektiv. Die Umkehrabbildung erhält man, indem man die Gleichung y = 2x + 1 nach x auflöst (umkehrt). Man erhält y = 2x + 1 ⇔ y − 1 = 2x ⇔ (y − 1)/2 = x. 1.3 Abbildungen 13 Die Umkehrabbildung lautet also f −1 : [1, 5] → [0, 1], y 7→ (y − 1)/2. Zur Probe überprüfen wir f −1 (f (x)) = x: Ersetzen von y durch f (x) liefert f −1 (f (x)) = (f (x) − 1)/2 = ((2x + 1) − 1)/2 = 2x/2 = x, was wir zeigen wollten. Aufgaben Aufgabe 1.1. Bilden Sie von jeder der folgenden Aussagen die Verneinung und stellen Sie fest, ob jeweils die Aussage selbst oder ihre Verneinung wahr ist (mit Begründung). (a) Jeder Mensch hat blaue Augen. (b) ∀x ∈ Q ∃y ∈ Q : x · y = 1. Aufgabe 1.2. Es seien A, B und C mathematische Aussagen. Zeigen Sie mit Hilfe von Wahrheitstafeln: (a) (A ⇒ B) ⇐⇒ (¬B ⇒ ¬A), (b) (A ∧ ¬B) ∨ (¬A ∧ B) ⇐⇒ ¬(A ⇔ B). Aufgabe 1.3. Geben Sie folgende Mengen in aufzählender Form an: (a) {x ∈ N : x5 = −1}, {x ∈ Z : x5 = −1}, (b) {(x, y) ∈ {1, 2, 3} × {4, 5, 6, 7} : x · y ist gerade}, (c) {x ∈ Z : 2 ≤ x2 ≤ 9}, (d) {x3 : x ∈ Z ∧ −2 ≤ x ≤ 3}. Aufgabe 1.4. Seien K, L und M Mengen. Zeigen Sie: (a) K \ (K \ L) = K ∩ L, (b) K \ (L ∪ M ) = (K \ L) ∩ (K \ M ), (c) K \ (L ∩ M ) = (K \ L) ∪ (K \ M ). Aufgabe 1.5. Untersuchen Sie die folgenden Abbildungen auf Injektivität, Surjektivität und Bijektivität: (a) f1 : R → R, x 7→ exp(x), (b) f2 : Z → Z, x 7→ 2x − 1, (c) f3 : R → R, x 7→ 2x − 1, 14 Grundlegende Begriffe (d) f4 : N × R → R, (x, y) 7→ x · y. Skizzieren Sie die Funktionen fi für i ∈ {1, 2, 3}. Aufgabe 1.6. Es seien A, B und C nicht-leere Mengen und f : A → B und g : B → C zwei Abbildungen. Zeigen Sie: (a) Wenn g ◦ f injektiv ist, dann muss auch f injektiv sein, aber g im Allgemeinen nicht. (b) Wenn g ◦ f surjektiv ist, dann muss auch g surjektiv sein, aber f im Allgemeinen nicht. 2 Zahlenmengen und Rechentechniken Im folgenden Kapitel betrachten wir die Zahlenmengen N und R der natürlichen bzw. reellen Zahlen. Darüber hinaus wird die Menge C der komplexen Zahlen eingeführt. 2.1 Natürliche Zahlen Nach unserem Verständnis ist die Menge der natürlichen Zahlen gegeben durch N = {1, 2, 3, . . .}. (2.1) Bei genauerer Betrachtung stellt sich die Frage, was mit . . . gemeint ist. Die natürlichen Zahlen lassen sich vollständig wie folgt charakterisieren: Axiom 2.1 (Peano Axiome). Die Menge N der natürlichen Zahlen ist eine Menge mit folgenden Eigenschaften: 1. 2. 3. 4. 5. 1∈N ∀n ∈ N : n + 1 ∈ N ∀n ∈ N : n + 1 6= 1 ∀m, n ∈ N : (m 6= n ⇒ m + 1 6= n + 1) 1 ∈ M ∧ (∀n ∈ M : n + 1 ∈ M ) ⇒ N ⊂ M Eins ist eine natürliche Zahl jede natürliche Zahl hat einen “Nachfolger” Eins hat keinen “Vorgänger” Ungleichheit bleibt für Nachfolger erhalten Induktionsaxiom Ohne weiteres können wir die natürlichen Zahlen um das Element 0 ergänzen, und zwar N0 := {0} ∪ N mit 1 = 0 + 1. In diesem Fall hat dann 1 einen Vorgänger, aber 0 nicht. Die wesentliche Eigenschaft bei der Charakterisierung der natürlichen Zahlen ist das Induktionsaxiom, welches besagt, dass sich die natürlichen Zahlen durch Abzählen 1, 2, 3, . . . ausschöpfen lassen. Das erklärt jetzt auch die Bedeutung der Punkte in (2.1). Die Induktionseigenschaft erlaubt uns, folgende Symbole “induktiv“ (rekursiv) zu definieren. 16 Zahlenmengen und Rechentechniken Definition 2.2. Für k ∈ N seien ak reelle Zahlen. Wir definieren 0 X Summe: Produkt: n X und für n ∈ N : ak := 0, k=1 k=1 0 Y n Y und für n ∈ N : ak := 1, k=1 ak := an + ak := an · n−1 X ak k=1 n−1 Y k=1 ak . k=1 Bemerkung 2.3. Gilt ak = a für alle k ∈ N, dann folgt n n X Y a=n·a sowie a =: an . k=1 k=1 n Hier bezeichnet a die n-te Potenz von a, und es gilt: a0 := 1, a1 = a, Etwas informeller schreiben wir auch n X ak = a1 + a2 + . . . + an a2 = a · a, sowie k=1 n Y .... ak = a1 · a2 · . . . · an . k=1 Bemerkung 2.4. In natürlicher Weise erweitern wir die Definition auf allgemeine Indices, und zwar n n X Y ak := am + am+1 + . . . + an bzw. ak := am · am+1 · . . . · an k=m k=m Qn Pn falls m ≤ n ist, sowie k=m ak := 0 und k=m ak := 1 wenn m > n. Man überzeugt sich leicht, dass eine Indexverschiebung bei entsprechender Anpassung der Grenzen das Ergebnis nicht beeinträchtig. So erhält man z.B. für k → l + 1 (k wird durch l + 1 ersetzt) n X ak = k=1 l+1=n X al+1 = l+1=1 n−1 X al+1 . l=0 Beispiel 2.5. Sei an := n + 1. Dann gilt 7 X n=5 an = a5 + a6 + a7 = 6 + 7 + 8 = 21; 6 Y an = a5 · a6 = 6 · 7 = 42. n=5 Aus der Induktionseigenschaft lässt sich sofort das folgende wichtige Beweisprinzip ableiten, mit dem wir verschiedene Sätze beweisen werden. Satz 2.6 (Prinzip der vollständigen Induktion). Sei A(n) eine Aussageform, die für alle n ∈ N definiert ist. Falls 1. A(1) wahr ist, und (Induktionsanfang) 2. für alle n ∈ N aus A(n) auch A(n + 1) folgt. (Induktionsschluss) Dann gilt die Aussage A(n) für alle n ∈ N. Formal ausgedrückt: (A(1) ∧ (∀n ∈ N : A(n) =⇒ A(n + 1))) =⇒ (∀n ∈ N : A(n)). 2.1 Natürliche Zahlen 17 Bemerkung 2.7. • Gilt der Induktionsanfang A(n0 ) für irgendein n0 ∈ N0 , und der Induktionsschluss für alle n ≥ n0 . Dann gilt die Aussage A(n) ebenfalls (zumindest) für alle n ≥ n0 . Der Satz wurde für n0 = 1 formuliert. • Anstelle des Induktionsschlusses 2. kann man auch die Variante 2.’ für alle n ∈ N gilt: Aus A(m) für alle 1 ≤ m ≤ n folgt A(n + 1). Wir dürfen als Voraussetzung also nicht nur A(n) sondern A(m) für alle m ≤ n verwenden. Als erste Anwendung des Induktionsprinzips betrachten wir das folgende Beispiel. Satz 2.8 (Der kleine Gauß). Für alle n ∈ N gilt n X k = n(n + 1)/2. k=1 Beweis. Die zu zeigende Aussage hat die Form ∀n ∈ N : A(n), wobei die Aussageform A(n) Pn definiert ist durch A(n) :⇔ k=1 k = n(n + 1)/2. Zum Beweis verwenden wir das Prinzip der vollständigen Induktion. 1. Induktionsanfang (IA): P1 Für n = 1 gilt: k=1 k = 1 sowie n(n + 1)/2 = 1(1 + 1)/2 = 1. Somit gilt A(1). 2a) Induktionsvoraussetzung (IV): P Für beliebiges n ∈ N gelte A(n) bereits, also nk=1 k = n(n + 1)/2 gilt für dieses n. 2b) Induktionsschluss (IS): Zu P zeigen ist, dass dann (A(n) ist nach Voraussetzung richtig) auch A(n+1) gilt, d.h., zu zeigen zz ist n+1 k=1 k = (n + 1)(n + 2)/2: Wir beginnen mit der linken Seite der Gleichung: n+1 X P k = (n + 1) + k=1 n X k k=1 IV = (n + 1) + n(n + 1)/2 = (n + 1)(1 + n/2) = (n + 1)(2 + n)/2, was genau die zu zeigende Aussage A(n + 1) ist. Nach dem Prinzip der vollständigen Induktion folgt somit die Richtigkeit von A(n) für all n ∈ N. Wir führen weitere Symbole ein. Definition 2.9. Für m, n ∈ N0 mit m ≤ n definieren wir: Faktorielle (Fakultät): Binomialkoeffizient: n! := n Y k, k=1 n n! . := m m!(n − m)! 18 Zahlenmengen und Rechentechniken Beispiel 2.10. • Nach Definition gilt auch 0! = 1. Q • 5! = 5k=1 k = 1 · 2 · 3 · 4 · 5 = 120. Beispiel 2.11. • Für alle n ∈ N gilt: n n = , k n−k n n = = 1, 0 n n n = = n, 1 n−1 was man sofort durch Einsetzen in die Definition sieht. • Man kann in der Formel für den Binomialkoeffizienten ”kürzen“, und zwar n n! n · (n − 1) · (n − k + 1) · (n − k)! n n−1 n−k+1 = = = · ··· . k k!(n − k)! k · (k − 1) · . . . · 1 · (n − k)! k k−1 1 Mit Hilfe der Binomialkoeffizienten können wir Potenzen von Summen zweier Zahlen ausrechnen. Satz 2.12 (Binomische Formel). Seien a und b natürliche (reelle, komplexe) Zahlen. Dann gilt für alle n ∈ N n X n 0 n n n−k k n n 0 n n−1 1 n (a + b) = a b = a b + a b + ... + ab . k 0 1 n k=0 Beweis. Wir überprüfen die Formel für n = 1 und n = 2: Für n = 1 gilt zum einen (a + b)1 = (a + b), zum anderen haben wir n X n k n−k 1 1 0 1 0 1 a b = ab + a b = a + b, k 0 1 k=0 wobei wir a0 = 1 für alle reelle Zahlen a, sowie 10 = 11 = 1 verwendet haben. Somit gilt A(1). Für n = 2 erhalten wir einerseits (a + b)2 = (a + b) · (a + b) = a2 + a · b + b · a + b2 = a2 + 2ab + b2 . Andererseits liefert die binomische Formel für n = 2 2 X 2 2−k k 2 2 0 2 1 1 2 0 2 a b = ab + ab + a b = 1 · a2 + 2 · ab + 1 · b2 . k 0 1 2 k=0 Das zeigt die Richtigkeit von A(2). Der allgemeine Fall A(n) folgt mit vollständiger Induktion; Beweis siehe Übung. 2.1 Natürliche Zahlen 19 Unter den natürlichen Zahlen besonders ausgezeichnet sind sogenannte Primzahlen. Definition 2.13. • Für n ∈ N heißt eine natürliche Zahl m Teiler von n, falls es ein k ∈ N gibt, mit n = k · m. Wir sagen ”m teilt n”, und schreiben m|n. • Eine natürliche Zahl p > 1, die nur 1 und sich selbst als Teiler besitzt, heißt Primzahl. Satz 2.14 (Hauptsatz der Arithmetik, Primfaktorzerlegung). Jede natürliche Zahl n > 1 lässt sich als Produkt von Primzahlpotenzen schreiben, d.h., es existiert ein k ≥ 1, Primzahlen p1 , . . . pk sowie Exponenten r1 , . . . , rk (alle natürlich), sodass n= pr11 · ... · prkk = k Y pri i i=1 gilt. Die Zahlen pi und ri sind bis auf Umordnung eindeutig bestimmt. Beweis. Der Beweis wird hier nicht erbracht, kann aber relativ einfach mittels vollständiger Induktion geführt werden. Bemerkung 2.15. Für natürliche Zahlen m, n definieren wir den größten gemeinsamen Teiler bzw. das kleinste gemeinsame Vielfache als ggT(m, n) := max{k ∈ N : k|n ∧ k|m} kgV(m, n) := min{k ∈ N : m|k ∧ n|k}. und Unter Benutzung der Primzahlzerlegung kann man einfache Formeln für ggT(m, n) und kgV(m, n) angeben. Seien r̂ r̃ m = p̃r̃11 · . . . · p̃k̃k̃ , n = p̂r̂11 · . . . · p̂k̂k̂ die Primzahlzerlegungen von m und k. Wir fassen alle vorkommenden Primzahlen zu einer Menge {pj : 1 ≤ j ≤ k} = {p̃j : 1 ≤ j ≤ k̃} ∪ {p̂j : 1 ≤ j ≤ k̂}, und erweitern die Primfaktorzerlegungen von m und n zu 0 m = pr11 · . . . · prkk , 0 n = pr1 1 · . . . · prk k . Man beachte, dass jetzt manche Exponenten ri auch null sein können und pri i = 1. Durch Vergleich erhält man ggT(m, n) = k Y min{ri ,ri0 } pi und kgV(m, n) = i=1 k Y i=1 woraus durch einfache Rechnung sofort folgt, dass ggT(m, n) · kgV(m, n) = m · n. max{ri ,ri0 } pi , 20 Zahlenmengen und Rechentechniken Wegen 2 m = k Y pri i 2 = i=1 k Y i p2r i i=1 sieht man sofort ein, dass 2 ggT(m, n) = k Y min{ri ,ri0 } 2 pi i=1 = k Y 2 min{ri ,ri0 } pi i=1 = k Y min{2ri ,2ri0 } pi = ggT(m2 , n2 ). i=1 Die wichtigsten Ergebnisse fassen wir in folgendem Satz zusammen. Satz 2.16. Seien m, n ∈ N. Dann gilt ggT(m, n) · kgV(m, n) = m · n und ggT(m, n)2 = ggT(m2 , n2 ). Bemerkung 2.17. Beinhalten die Primfaktorzerlegungen von m und n keine gemeinsamen Primfaktoren, dann heißen m und n teilerfremd. Mit obiger Überlegung also m, n teilerfremd :⇔ ggT(m, n) = 1. 2.2 Ganze, rationale und reelle Zahlen Im Folgenden werden wir sehen, dass der Wunsch, bestimmte Gleichungen lösen zu können, schrittweise Erweiterungen der Menge verfügbarer Zahlen nötig macht. Ganze Zahlen: Sei n ∈ N gegeben. Die einfache Gleichung z+n=0 besitzt offensichtlich keine Lösung z ∈ N. Wir führen deshalb neue Zahlen (−n) ein, welche gerade die Lösungen dieser Gleichungen sind. Dies führt uns auf die Menge der ganzen Zahlen Z := N0 ∪ {(−n) : n ∈ N} = {0, 1, −1, 2, −2, . . .} Man beachte: Die ganzen Zahlen z mit z > 0 sind wieder natürliche Zahlen. Bemerkung 2.18. Die Definitionen von Symbolen für natürliche Zahlen aus dem vorhergehenden Abschnitt lassen sich größtenteils auf ganze Zahlen erweitern. Ist z.B. die ganze Zahl z < 0, so gilt 0 < −z ∈ N. Jede ganze Zahl z ∈ Z \ {0} besitzt demnach ebenfalls eine (eindeutige) Primfaktorzerlegung der Form z = ±pr11 · . . . · prkk , wobei je nach Vorzeichen von z in der Formel + oder − zu wählen ist. 2.2 Ganze, rationale und reelle Zahlen 21 Rationale Zahlen: Für gegebenes n ∈ N suchen wir nach einer Lösung der Gleichung q · n = 1. So ein q liegt im allgemeinen nicht in Z. Wir führen daher neue Zahlen nz als Lösung der Gleichung q · n = z mit z ∈ Z ein. Die Menge aller solcher rationaler Zahlen wird mit Q := { z : z ∈ Z, n ∈ N}. n bezeichnet. Bemerkung 2.19. • Für z = 0 gilt nz = 0. Für z 6= 0 können wir z und n in Primfaktoren zerlegen, und dann den Bruch soweit kürzen, dass Zähler und Nenner keine gemeinsamen Primfaktoren aufweisen. So gilt etwa 2·2·5 2·2 4 20 = = = . 15 3·5 3 3 Dieser Bruch lässt sich nicht weiter kürzen. • Die Zahlen 20/15 und 4/3 sind gleich und lassen sich nicht unterscheiden. In Q kommt daher eigentlich nur eine Zahl mit Wert 4/3 = 20/15 = ... vor. Reelle Zahlen: Wie das folgende Beispiel zeigt, reicht die Menge der rationalen Zahlen immer noch nicht aus, um einfache Gleichungen der Form x · x = n mit n ∈ N zu lösen. Satz 2.20 (Existenz irrationaler Zahlen). Es gibt keine Zahl x ∈ Q, sodass x · x = 2 gilt. Beweis. Die Aussage lautet formal: A :⇔ ∀x ∈ Q : x · x 6= 2. Nach den deMorgan’schen Regeln haben wir A :⇔ ∀x ∈ Q : x · x 6= 2 ⇔ ¬(∃x ∈ Q : x · x = 2) ⇔ ¬(¬A). Wir führen einen Widerspruchsbeweis, d.h., wir nehmen ¬A an, und zeigen, dass diese Annahme falsch (und somit A richtig) ist. Angenommen ¬A ist richtig, d.h., ∃x ∈ Q : x · x = 2. Daraus folgt, dass x = z/n mit z ∈ Z und n ∈ N. Wir können ferner annehmen, dass z und n keine gemeinsamen Primfaktoren besitzen (sonst zuvor kürzen). Die vollständige Annahme lautet also: ∃x ∈ Q : x · x = 2 ∧ (∃n ∈ N, z ∈ Z : (x = z/n) ∧ (ggT(z, n) = 1) . 22 Zahlenmengen und Rechentechniken Nach Annahme gilt: 2=x·x= z z z2 · = 2, n n n insbesondere ist n2 ein Teiler von z 2 , also ggT(n2 , z 2 ) ≥ n2 . Wegen z 2 6= 2 für alle z ∈ Z, folgt n2 > 1. Aus Satz 2.16 folgern wir nun, dass 1 = ggT(n, z)2 = ggT(n2 , z 2 ) ≥ n2 > 1, was einen Widerspruch ergibt. Somit ist die Annahme ¬A falsch (widersprüchlich), und daher ist A wahr. Die Lösung der Gleichung x2 = x · x = 2 nennen wir √ 2, die (Quadrat-)Wurzel aus 2. Wir definieren im Folgenden die Menge der reellen Zahlen R, welche neben den rationalen Zahlen auch alle Quadratwurzeln natürlicher Zahlen, aber noch viele weitere Zahlen enthält. Die Menge R lässt sich durch folgende Rechenregeln charakterisieren. Axiom 2.21 (Axiome der reellen Zahlen). Die Menge R der reellen Zahlen enthält Q. Darüber hinaus gelten für alle x, y, z ∈ R folgende Regeln: (1) Regeln der Addition (A1) (A2) (A3) (A4) x + (y + z) = (x + y) + z x+y =y+x ∃!0 ∈ R : x + 0 = 0 + x = x ∃!(−x) ∈ R : x + (−x) = (−x) + x = 0 (assoziativ) (kommutativ) (neutrales Element; 0 Element) (inverses Element) (2) Regeln der Multiplikation (M 1) (M 2) (M 3) (M 4) (x · y) · z = x · (y · z) x·y =y·x ∃!1 ∈ R \ {0} : x · 1 = 1 · x = x 1 1 1 x 6= 0 : ∃!( ) ∈ R : x · ( ) = ( ) · x = 1 x x x (assoziativ) (kommutativ) (neutrales Element; 1 Element) (inverses Element) (3) Distributivgesetz (D) x · (y + z) = (x · y) + (x · z) (distributiv) 2.2 Ganze, rationale und reelle Zahlen 23 (4) Ordnungseigenschaften (O1) (O2) (O3) (O4) (O5) (O6) x≤y∨y ≤x x≤x x≤y∧y ≤x⇔x=y x≤y∧y ≤z ⇒x≤z x≤y ⇔x+z ≤y+z x≤y∧z ≥0⇒x·z ≤y·z (vergleichbar) (reflexiv) (eindeutig) (transitiv) (verträglich mit +) (verträglich mit ·) (5) Vollständigkeitsaxiom Sei R = L ∪ R mit L, R 6= ∅ und ∀x ∈ L∀y ∈ R : x < y. Dann existiert genau eine Schnittzahl z ∈ R sodass ∀x ∈ L, y ∈ R : x ≤ z ≤ y. Bemerkung 2.22. • Wir identifizieren die reellen Zahlen oft mit den Punkten der Zahlengeraden. Das Vollständigkeitsaxiom besagt, dass diese keine Löcher aufweist, d.h., schneidet man die Zahlengerade in zwei Stücke L und R, dann geschieht dies exakt bei einer Zahl z. • Wir werden später noch andere Kriterien für Vollständigkeit kennenlernen. Bemerkung 2.23 (Algebraische Strukturen). • Jede beliebige Menge G mit einer Operation (Addition) + : G × G → G welche (A1)– (A4) erfüllt heißt Abelsche- (oder kommutative) Gruppe. Gilt (A2) nicht, dann nur Gruppe. Neben (R, +) sind auch (Z, +) oder (R \ {0}, ·) Abelsche Gruppen; (N, +) nicht. • Eine Menge K mit Operationen + : K × K → K (Addition) und · : K × K → K (Multiplikation) welche (A1)–(A4), (M1)–(M4) und (D) erfüllen, heißt Körper (kurz K oder (K, +, ·)). Man überzeugt sich leicht, dass neben (R, +, ·) auch (Q, +, ·) ein Körper ist; (Z, +, ·) jedoch nicht. • Eine Menge M mit einer Relation ≤, welche (O1)–(O4) erfüllt, heißt angeordnet. Ist (M, +, ·) ein Körper, und ≤ zusätzlich verträglich mit + und ·, dann heißt (M, +, ·, ≤) angeordneter Körper. Als Beispiel seien R und Q genannt. • R (bzw. (R, +, ·, ≤)) ist nach Definition ein vollständiger (angeordneter) Körper, Q jedoch √ nicht; man könnte Q ja bei z = 2 auseinander schneiden, und wie gezeigt liegt dieses z nicht in Q. Bemerkung 2.24. Mit Hilfe der Relation ≤ definieren wir für alle reellen Zahlen x, y • x < y :⇔ x ≤ y ∧ x 6= y • x ≥ y :⇔ y ≤ x und x > y :⇔ y < x. Weiters können wir über die inversen Elemente folgende Operationen definieren: 24 Zahlenmengen und Rechentechniken • / : R × R \ {0} → R, x/y := x · ( y1 ) • − : R × R → R, x − y := x + (−y) Alle bekannten Rechenregeln für reelle Zahlen lassen sich auf obige Axiome zurückführen. Die folgende unvollständige Aufzählung fasst einige dieser Folgerungen zusammen. Satz 2.25. Seien x, y, z ∈ R. Dann gilt (a) (c) (e) (g) x = y ⇔ x + z = y + z, x · 0 = 0, x 6= 0 ⇒ x · x > 0, x, y ≥ 0 : x ≤ y ⇔ x2 ≤ y 2 . (O3) (b) x = y ⇔ x · z = y · z (z 6= 0), (d) (−1) · x = (−x), (f ) 1 > 0, (O5) (O3) Beweis. (a): x = y ⇔ x ≤ y ∧ y ≤ x ⇔ x + z ≤ y + z ∧ y + z ≤ x + z ⇔ x + z = y + z; (b): siehe Übung; (a) (M 3,A3) (c): x · 0 = 0 ⇔ x · 0 + x = 0 + x ⇔ die letze Aussage ist nach (M3) wahr. (a,A3) (D) (A3) x · 0 + x · 1 = x ⇔ x · (0 + 1) = x ⇔ x · 1 = x, und (M 3,D) (A3,c) (A3) (d): (−1) · x = (−x) + x + (−1) · x = (−x) + (1 + (−1)) · x = (−x) + 0 = (−x). c (e): Sei x > 0. Dann ist mit (O6’) x · x > 0 · x = 0. Der Fall x < 0 folgt ähnlich (Übung: mit x < 0 ⇔ −x > 0 und (−x) · (−x) = x · x). (M 3) (e) (f): Es gilt 1 = 1 · 1 > 0. (g): “⇒”: Sei x ≤ y. Aus (O6) folgt x2 ≤ xy ∧ xy ≤ y 2 . (O4) liefert x2 ≤ y 2 . “⇐” Sei x > y und y > 0. Aus (O6) folgt x2 > xy ∧ xy > y 2 . Mit (O4) folgt x2 > y 2 . Definition 2.26. Eine Menge M ⊂ R heißt nach oben (bzw. nach unten) beschränkt, falls es eine Zahl a ∈ R (b ∈ R) gibt, sodass ∀x ∈ M : a ≤ x (x ≤ b) gilt. Die Zahlen a (bzw. b) heißen obere (untere) Schranke. Aus dem Vollständigkeitsaxiom können wir nun die Existenz von Schranken ableiten. Satz 2.27. Jede nichtleere, nach oben (nach unten) beschränkte Menge M ⊂ R besitzt eine größte untere (kleinste obere) Schranke a = inf M b = sup M (Infimum; größte untere Schranke), bzw. (Supremum; kleinste obere Schranke). Genauer, ist a (bzw. b) charakterisiert über die beiden Eigenschaften (i) ∀x ∈ M : a ≤ x (bzw. x ≤ b), (ii) ∀a0 ∈ R : (∀x ∈ M : a0 ≤ x) ⇒ a0 ≤ a (bzw. für alle oberen Schranken b0 gilt: b ≤ b0 ). 2.2 Ganze, rationale und reelle Zahlen 25 Beweis. Wir definieren die Mengen L := {x ∈ R : ∀y ∈ M : x < y} und R := {x ∈ R : ∃y ∈ M : x ≥ y} (die Menge L liegt “links” von M ). Die Menge L, R sind nicht leer (warum?), haben kein gemeinsames Element, und es gilt L ∪ R = R. Nach dem Vollständigkeitsaxiom gibt es eine Schnittzahl a mit x≤a≤y ∀x ∈ L, y ∈ R. (2.2) Behauptung: a = inf M . Zu zeigen sind die beiden folgenden Punkte (i) ∀x ∈ M : a ≤ x, (ii) ∀a0 ∈ R : a0 > a ⇒ (∃x ∈ M : x < a0 ) , zu (i): Da M ⊂ R, folgt aus a ≤ y für alle y ∈ R insbesondere a ≤ y für alle y ∈ M . zu (ii): Sei a0 ∈ R mit a0 > a. Definiere c := (a + a0 )/2. Es gilt a < c < a0 . Aufgrund von (2.2) folgt c ∈ R. Also existiert ein y ∈ M mit y ≤ c. Für dieses y gilt dann y < a0 . Damit gilt auch (ii). Der Beweis für die Existenz des Supremums folgt analog. Bemerkung 2.28. Die Aussage des Satzen gilt nicht für die rationalen Zahlen Q: Die Menge √ M := {q ∈ Q √ : 0 ≤ q ≤ 2} besitzt keine kleinste obere Schranke in Q. Die kleinste obere Schranke wäre 2, und diese liegt nicht in Q! Die Menge Q ist nicht vollständig. Definition 2.29. Das größte (kleinste) Element einer Menge heißt Maximum (bzw. Minimum) von M und wird mit max M (min M ) bezeichnet. Nach obigem Satz besitzt jede beschränkte Menge ein Infimum und Supremum. Ein Maximum oder Minimum braucht allerdings im Allgemeinen nicht vorzuliegen. Es gilt aber der folgende Zusammenhang. Satz 2.30. Sei M ⊂ R eine nach oben (nach unten) beschränkte Menge. Dann gilt: M besitzt ein Maximum (Minimum) ⇔ sup M ∈ M (inf M ∈ M ). In diesem Fall gilt sup M = max M bzw. inf M = min M . Beweis. =⇒ : Falls M ein Maximum besitzt, dann erfüllt b := max M nach Definition die Beziehung ∀x ∈ M : b ≥ x. Somit ist b obere Schranke. Da b ∈ M liegt, folgt für jede andere obere Schranke b ≤ b0 . Somit ist b die kleinste obere Schranke. =⇒ : Angenommen, das Supremum b := sup M liegt in M , d.h., b ∈ M und ∀x ∈ M : b ≥ x, da b obere Schranke. Das zeigt, dass b auch Maximum ist. Die Aussage folgt aus folgender Tautologie für Aussagen: (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A). Wir haben ebenso gezeigt, dass, wenn ein Maximum existiert, dieses gleichzeitig die kleinste obere Schranke ist. Die Aussagen für das Minimum folgen analog. 26 Zahlenmengen und Rechentechniken Beispiel 2.31. Seien a, b ∈ R mit a < b. Dann gilt inf(a, b) = a und sup(a, b) = b. Das offene Intervall (a, b) besitzt jedoch kein Minimum oder Maximum. Für das geschlossene Intervall [a, b] gilt hingegen inf[a, b] = a = min[a, b] sowie sup[a, b] = b = max[a, b]. Beweis. Wir zeigen nur die Aussage a = inf(a, b). Nach Definition des offenen Intervalls (a, b) := {x ∈ R : a < x < b} folgt, dass a untere Schranke ist (Eigenschaft (i) in der Definition des Infimums). Zu zeigen bleibt, dass jede andere untere Schranke a0 kleiner gleich a ist. Angenommen, es gäbe ein a0 ∈ R (a0 < b) sodass ∀x ∈ (a, b) : a0 ≤ x und a0 > a, also eine untere Schranke die echt größer als a0 ist. Dann gilt für x0 := (a + a0 )/2 dass a < x0 < a0 . Aus der ersten Bedingung folgt, dass x0 ∈ (a, b) ist, und aus der zweiten, dass a0 keine untere Schranke für alle Elemente in (a, b) ist. Widerspruch zur Annahme. Wir beschließen diesen Abschnitt mit dem folgenden Satz und einigen nützlichen Folgerungen. Satz 2.32 (Satz von Archimedes). Die Menge N der natürlichen Zahlen ist nicht nach oben beschränkt. Beweis. Übung. Folgerung 2.33. Es gelten folgende Sachverhalte: 1 < ε, (ii) ∀x ∈ R∃n ∈ Z : n ≤ x < n + 1, n (iii) ∀x, y ∈ R mit y > x > 0 ∃n ∈ N : nx > y. (i) ∀ε > 0 ∃n ∈ N : 0 < Beweis. Übung. 2.2.1 Rechnen mit reellen Zahlen Im Folgenden wird das Rechnen mit reellen Zahlen anhand von Beispielen demonstriert. Man beachte, dass sich alle weiteren Regeln aus den obigen Axiomen herleiten lassen. Variablen, Terme, Ausdrücke Die Grundbausteine um (reelle, mathematische) Ausdrücke zu konstruieren sind Zahlen und Variablen. Letztere stehen als Platzhalter für (reelle) Zahlen. x = 1, x+1 = 5y, 2 usw. 2.2 Ganze, rationale und reelle Zahlen 27 Durch Rechenoperationen haben wir Variablen und Zahlen zu Termen verknüpft. Beispiel für Terme sind x, 1, (x + 1) oder x+1 . 2 = 5y einen Ausdruck (in den Variablen x, y, ...). Streng genommen Wir nennen x = 1 bzw. x+1 2 handelt es sich dabei um eine Aussageform, also einen formalen Ausdruck ohne Wahrheitswert. Gleichungen, äquivalente Umformungen Bei Gleichungen der Form A(x) :⇔ x+1 =5 2 stellt sich oft die Frage, ob es ein x (einen Wert für die Variable x) gibt, sodass die Gleichung wahr ist. Formal kann man das formulieren als B :⇔ ∃x ∈ R : x+1 = 5. 2 Durch den Quantor haben wir die Aussageform (den formalen Ausdruck) A(x) in eine Aussage überführt, und wir können dieser einen Wahrheitswert zuordnen. Hier würden wir erhalten: w(B) = 1, es existiert eine Lösung der Gleichung. Natürlich stellt sich jetzt die Frage, welches x (welche reelle Zahl – welcher Einsetzungswert für die Variable x) Lösung der Gleichung ist. Hierzu benutzen wir die Rechenregeln aus den Axiomen für reelle Zahlen, z.B. ∀x ∈ R : ( x+1 ·2 −1 = 5 ⇔ x + 1 = 10 ⇔ x = 9). 2 Oftmals wird ∀x ∈ R nicht explizit angegeben, oder im Text als “Für jede reelle Zahl x gilt”, oder “sei x eine beliebige reelle Zahl; dann gilt” formuliert. Für jede reelle Zahl x gilt also: x+1 = 5 ⇔ x = 9. 2 Bemerkung 2.34. Man beachte: Die “Rechenregeln” ∀x, y, z ∈ R : x = y ⇔ x + z = y + z ∀x, y, z ∈ R, z 6= 0 : x = y ⇔ x · z = y · z folgen unmittelbar aus den Regeln (O1)–(O6). Somit haben wir gezeigt: x+1 B :⇔ ∃x ∈ R : = 5 ⇔ ∃x ∈ R : x = 9 . 2 Offensichtlich ist x = 9 die Lösung des Problems, und B ist wahr. 28 Zahlenmengen und Rechentechniken Die Menge aller x, für welche die Gleichung stimmt, nennen wir Lösungsmenge L := {x ∈ R : x+1 = 5} = {x ∈ R : x = 9} = {9}. 2 Achtung! Multiplizieren von Gleichungen mit 0 ist keine äquivalente Umformung, also ∀x, y ∈ R : x = y ⇒ x · 0 = y · 0, aber die Umkehrung stimmt im Allgemeinen nicht, denn 1 · 0 = 2 · 0 = 0, aber 1 6= 2! Brüche Das sind Terme der Form 5x + 1 , 2 1 ,... x+2 Zähler Nenner Man beachte: Der Bruch ist nur dann definiert, wenn der Nenner ungleich 0 ist. Division durch Null ist nicht erlaubt (nicht definiert). Für das zweite Beispiel machen wir also den Zusatz 1 , x 6= −2, x+2 was bedeutet, dass der Term nur für x 6= −2 definiert ist. Multiplizieren von Brüchen geschieht durch Multiplikation von Zähler und Nenner, also (für alle a, b, c, d ∈ R mit b, d 6= 0 gilt) a·c a c · = . b d b·d Brüche, die gleiche Faktoren im Zähler und Nenner enthalten, können gekürzt werden, also 2x 2x x = = , 2y 2y y y 6= 0. (Nur) Brüche mit gleichem Zähler können durch entsprechendes Zusammenfassen der Zähler addiert bzw. subtrahiert werden, also (x + 1) + 1 x+2 x 2 x x+1 1 + = = = + = + 1. 2 2 2 2 2 2 2 Durch Erweitern (Multiplikation mit Termen der Form aa ) lassen sich Brüche immer auf gleichen Nenner bringen. Etwa 1 1 1 x+2 1 2 x+2 2 x+4 + = · + · = + = . 2 x+2 2 x+2 x+2 2 2 · (x + 2) 2 · (x + 2) 2 · (x + 2) Den Kehrwert eines Bruches (= inverses Element bezüglich der Multiplikation) erhält man durch Vertauschen von Zähler und Nenner, also 1/(a/b) = b/a, a, b 6= 0. 2.2 Ganze, rationale und reelle Zahlen 29 Daraus ergibt sich auch die Formel zum Auflösen für Doppelbrüche: a b c d = a c a d a·d · (1/( )) = · = . b d b c b·c Potenzen Für a ∈ R und n ∈ N haben wir definiert n a := n Y k=1 a = |a · a ·{z. . . · a} . n mal a heißt Basis und n der Exponent. Weiterhin definieren wir ∀a ∈ R : a0 := 1 0n = 0; und Man sieht sofort, dass für m, n ∈ N gilt am · an = am+n und (am )n = am·n . Unter Zuhilfenahme von a0 = 1 und am · an = am+n definieren wir a−n := 1/(an ), a 6= 0. Für a ≥ 0 definieren wir die n-te Wurzel von a als diejenige positive reelle Zahl Potenz gerade a ist, d.h. √ √ 1 und ( n a)n = a. a n := n a Es gilt beispielsweise √ √ √ √ 2 2 2· 2= 2· 2=2 und √ 3 n· √ n a, deren n-te √ √ 3 n · 3 n = n. Diese Definition ist verträglich mit den Regeln a0 = 1 und (am )n = am·n . Die Definitionen lassen sich für a ≥ 0 auf reelle Exponenten erweitern. Es gelten folgende Rechengesetze: Seien a, b ≥ 0 und x, y ∈ R. Dann ist ax · ay = ax+y a−x = 1/(ax ) ax · bx = (a · b)x a0 = 1 Lösen quadratischer Gleichungen Sei a ∈ R. Dann gilt (a)2 = a2 = (−a)2 . (ax )y = ax·y 00 := 1. 30 Zahlenmengen und Rechentechniken Die Gleichung x2 = a2 besitzt also (mindestens) zwei Lösungen, nämlich x = a sowie x = −a. Wie später gezeigt wird, sind das die einzigen beiden Lösungen. Abstrakt können wir dies ausdrücken durch x2 = a2 ⇔ x = a ∨ x = −a kurz: x = ±a. Als nächstes betrachten wir die allgemeine quadratische Gleichung a · x2 + b · x + c = 0, a, b, c ∈ R, a 6= 0. Im Fall a = 0 vereinfacht sich die Gleichung. Gesucht sind Lösungen (Werte für) x, für welche Gleichheit gilt. Wir definieren p := b/a und q := c/a. Die quadratische Gleichung ist dann äquivalent zu (Division durch a) x2 + px + q = 0. Durch Nachrechnen sieht man, dass dies wiederum äquivalent ist zu (x + p/2)2 = p2 /4 − q, und durch Ziehen der Quadratwurzel auf beiden Seiten erhält man die Lösungen p p bzw. äquivalent: x = −p/2 ± p2 /4 − q, x + p/2 = ± p2 /4 − q wobei vorausgesezt werden muss, dass p2 /4 − q ≥ 0 ist. Wir haben also die p-q-Lösungsformel für quadratische Gleichungen hergeleitet: p p x2 + px + q = 0 ⇔ x = −p/2 + p2 /4 − q ∨ x = −p/2 − p2 /4 − q. Die Lösungsmenge der quadratischen Gleichung ist somit p L = {−p/2 ± p2 /4 − q} falls q ≤ p2 /4, sonst L = ∅. Ungleichungen, Abschätzen Wir definieren zunächst: x ≥ y :⇔ y ≤ x und x < y ⇔ (x ≤ y ∧ x 6= y). Die Bedeutung des Symbols > sollte dann klar sein. Beim Rechnen mit Ungleichungen benutzen wir (O1)–(O6). Aus diesen Regeln folgen auch a ≤ b ⇒ (−a) ≥ (−b) und a≤b⇒ 1 1 ≥ , a b Beispiel 2.35. Sei y ∈ R gegeben. Man finde alle x, für welche menge der Ungleichung. Lösung: Es gilt x+5y 3 a, b 6= 0. ≤ 1 gilt; also die Lösungs- x + 5y (O60 ) (O5) ≤ 1 ⇔ x + 5y ≤ 3 ⇔ x ≤ 3 − 5y. 3 Die Lösungsmenge ist also gegeben durch L(y) := {x ∈ R : x ≤ 3 − 5y}. Diese hängt noch vom tatsächlichen Wert von y ab. 2.2 Ganze, rationale und reelle Zahlen 31 Bemerkung 2.36. Wir haben hier eine verschärfte Version von (O6) verwendet, nämlich: (O60 ) : ∀z > 0 : x ≤ y ⇔ z · x ≤ z · y. Beispiel 2.37. Gesucht sind Lösungen der Ungleichung Lösung: Wie vorhin erhalten wir x2 +5y 3 ≥ 1 für gegebenes y ∈ R. x2 + 5y ≥ 1 ⇔ x2 ≥ 3 − 5y. 3 Da x2 ≥ 0 für alle x ∈ R, gilt die letzte Ungleichung immer falls 3 − 5y ≤ 0. Für den Fall 3 − 5y > 0, gilt weiter p p x2 + 5y ≥ 1 ⇔ x ≥ 3 − 5y ∨ x ≤ − 3 − 5y, 3 Die Lösungsmenge der Ungleichung ist also p p L = R \ (− 3 − 5y, 3 − 5y), falls y ≥ 3/5, falls: y ≤ 3/5. sonst: L = R. (a, b) = {x ∈ R : x > a ∧ x < b} bezeichnet hierbei das offene Intervall. Ungleichungen dienen oft zum Abschätzen komplizierter Ausdrücke. Beispiel 2.38. Man zeige, dass n2 ≤ n2 für alle n ∈ N, n ≥ 2 gilt. Lösung: Es gilt n · (n − 1) · (n − 2)! n n−1 n n! = = · ≤ n · n = n2 . = 2!(n − 2)! 2 · 1 · (n − 2)! 2 1 2 Beträge Für reelle Zahlen x ∈ R definieren wir den Betrag von x durch x, falls x ≥ 0 |x| := −x, falls x < 0. Der Betrag misst die absolute Größe einer Zahl. Beispiel 2.39. Sei y ∈ R, y ≥ 0 gegeben. Man berechne die Lösungsmenge der Ungleichung |x − 1| ≤ y. Lösung: Nach Definition des Betrags gilt: |x − 1| ≤ y ⇔ (x − 1 ≤ y ∧ x − 1 ≥ 0) ∨ (−(x − 1) ≤ y ∧ x − 1 < 0) ⇔ (x ≤ y + 1 ∧ x ≥ 1) ∨ (x ≥ 1 − y ∧ x < 1). Die Lösungsmenge ist demnach gegeben durch L = [1, y + 1] ∪ [1 − y, 1) = [1 − y, 1 + y]. 32 Zahlenmengen und Rechentechniken Man überzeugt sich relativ leicht, dass der Betrag folgende Eigenschaften hat. Satz 2.40. Für alle x, y ∈ R gilt (B1) (B2) (B3) |x| ≥ 0 ∧ (|x| = 0 ⇔ x = 0) |x · y| = |x| · |y| |x + y| ≤ |x| + |y| (definit) (homogen) (Dreiecksungleichung). Beweis. Mit Fallunterscheidung; siehe Übung. 2.2.2 Reellwertige Funktionen einer Variablen Zur Auffrischung des Schulwissens wollen wir einige bekannte Funktionen der Form f : R → R, x 7→ f (x) betrachten. Da sowohl Werte- als auch Definitionsbereich die reellen Zahlen sind, sprechen wir von reell-wertigen Funktionen einer reellen Variablen. Solche Funktionen lassen sich einfach durch Darstellung (eines Teiles) ihres Funktionsgraphen graph(f ) := {(x, f (x)) : x ∈ R} ⊂ R × R visualisieren. Polynomfunktionen Seien a0 , . . . , an ∈ R mit an 6= 0 gegeben. Die Funktion pn : R → R, x 7→ a0 + a1 x + a2 x2 + . . . + an xn heißt Polynom(funktion) vom Grad n mit Koeffizienten ai . (Reelle) Lösungen der Gleichung pn (x) = 0 nennen wir (reelle) Nullstellen von pn . Beispiel 2.41. Sei pn (x) := x2 + x − 2 (das ist kurz für: pn : R → R, x 7→ x2 + x − 2). Gesucht sind die Nullstellen von pn . Lösung: Nach Definition der Nullstellen suchen wir also nach Lösungen der Gleichung x2 + x − 2 = 0. Nach der p-q-Formel ist die Lösungsmenge gegeben durch p L = {−1/2 ± 1/4 + 2} = {−2, 1}, und dies ist gerade die Menge der Nullstellen von pn . 2.2 Ganze, rationale und reelle Zahlen 33 Die einfachsten Polynomfunktionen sind die konstante Funktion sowie die Identitätsabbildung p0 : R → R, x 7→ a0 bzw. id : R → R, x 7→ x. Wir schreiben auch kurz: p0 (x) = a0 bzw. id(x) = x. Winkelfunktionen Wir bezeichnen im Folgenden mit x den Winkel im Bogenlängenmaß. Die Funktionen sin(x) und cos(x) sind durch folgende Skizze definiert Definition der Winkelfunktionen Aus der Skizze und dem Satz von Pythagoras folgt für jedes x ∈ R | sin(x)| ≤ 1, | cos(x)| ≤ 1 und sin(x)2 + cos(x)2 = 1. Weiter sieht man, dass sin und cos periodisch sind, d.h., sin(2πn + x) = sin(x), cos(2πn + x) = cos(x) ∀x ∈ R, n ∈ Z. Ebenfalls aus der Skizze ablesbar ist die Verschiebungsregel cos(x) = sin(x + π/2). Schließlich bemerken wir die Gültigkeit der folgenden Winkelsummensätze (Additionstheoreme) sin(x ± y) = sin x · cos y ± sin y · cos x cos(x ± y) = cos x · cos y ∓ sin x · sin y. Diese Formeln werden wir später mit Hilfe komplexer Zahlen zeigen. Exponentialfunktion und Logarithmus Über die besondere Bedeutung der Euler’schen Zahl e ≈ 2.7182818 werden wir später noch berichten. Wir definieren die Exponentialfunktion exp : R → R, x 7→ exp(x) := ex . Aus der Definition ergeben sich sofort folgende elementare Eigenschaften: exp(x + y) = exp(x) · exp(y) exp(0) = 1, exp(−x) = 1/ exp(x), exp(x) > 0, 34 Zahlenmengen und Rechentechniken welche für alle x ∈ R gelten. Wir werden später sehen, dass x2 x 2 exp(x) = 1 + x + + + ... 2! 3! gilt. Hieraus sieht man auch, dass für x ≥ 0 die Abschätzung exp(x) ≥ 1 + x gilt. Aus der Definition folgt weiterhin, dass die Exponentialfunktion streng monoton, und daher injektiv ist. Schänkt man den Wertebereich geeignet ein, kann man eine Umkehrfunktion log : R+ → R, x 7→ log(x) = exp−1 (x). Hierbei bezeichnet exp−1 die Umkehrfunktion der Exponentialfunktion. Achtung: Mit log bezeichnen wir hier den natürlichen Logarithmus. Beispiel 2.42. Nach Definition gilt exp(0) = 1 und exp(1) = e. Wendet man die Umkehrfunktion an, und benutzt dass f −1 (f (x)) = x gilt, so erhält man 0 = log(1), 1 = log(e) sowie log(exp(x)) = x = exp(log(x)). Weiterhin gelten folgende Rechenregeln, die sich sofort aus den Regeln für die Exponentialfunktion ergeben: log(x · y) = log(x) + log(y), log(xy ) = y · log(x), log(1/x) = − log(x). Auch die Logarithmusfunktion ist streng monoton wachsend. Logarithmus und Exponentialfunktion Aufgaben Aufgabe 2.1. Berechnen Sie folgende Ausdrücke explizit und die Summen zusätzlich mit Formeln von diesem Blatt. 9 4 3 5 X X X Y 1 1 3 2 a) k b) c) d) k 2 k k k=3 k=0 k=0 k=1 2.2 Ganze, rationale und reelle Zahlen 35 Aufgabe 2.2. Sei n ∈ N0 . Zeigen Sie per vollständiger Induktion. Pn 1 2 (a) k=0 k = 6 n(n + 1)(2n + 1). P n+1 (b) Geometrische Summenformel: nk=0 q k = q q−1−1 für q ∈ R mit q 6= 1. P + b)n . (c) Binomische Formel: nk=0 nk akbn−k = (a n Hinweis: Verwenden Sie k−1 + nk = n+1 falls k > 0. k Aufgabe 2.3. Zeigen Sie mit Hilfe von Aufgabe 2, dass Pn n n (a) k=0 k = 2 für alle n ∈ N0 . Pn n k (b) k=0 k (−1) = 0 für alle n ∈ N. P (c) (a − b) nk=0 ak bn−k = an+1 − bn+1 für alle n ∈ N0 und a, b ∈ R. Hinweis: Für b 6= 0, verwenden Sie die geometrische Summenformel (A.2b) mit q = a/b. Aufgabe 2.4. Sei n ∈ N. Transformieren Sie den (Lauf-) Index in der/dem Summe/Produkt. P9 (a) k=2 (k + 2), gemäß der Beziehung l = k + 1. Q49 (b) k=23 (k − 1)(k + 2)(k + 5), gemäß der Beziehung l − 7 = −k. Pn 1 (c) k=1 k(k+1) , gemäß der Beziehung l − 1 = k. Qp Pn 3 (d) s=4 (s + 2) , gemäß der Beziehung p + 1 = k und s − 2 = t. p=5 p · Aufgabe 2.5. Seien x, y ∈ R. Zeigen Sie die folgenden Ungleichungen: √ (a) Falls x, y ≥ 0, dann gilt xy ≤ x+y . 2 √ √ √ (b) Falls x, y ≥ 0, dann gilt x + y ≤ x + y. √ √ (c) Falls x, y > 0, dann gilt x + y ≤ √xy + √yx . 1 (d) Falls |x| < 1 und n ∈ N0 , dann gilt (1 + x)n ≤ (1−x) n. √ Aufgabe 2.6. Zeigen Sie, dass 3 keine rationale Zahl ist. Aufgabe 2.7 (Satz von Archimedes). Zeigen Sie, dass die Menge N der natürlichen Zahlen nicht nach oben beschränkt ist. Hinweis: Nehmen Sie dazu an, N wäre nach oben beschränkt. Wenden Sie dann Satz 2.27 an und führen Sie einen Widerspruch herbei. Aufgabe 2.8. Zeigen Sie die Aussagen von Folgerung 2.33. Aufgabe 2.9. (a) Sei y ∈ R. Für welche x ∈ R gilt (x − y)2 ≤ 2? (b) Für welche x ∈ R gilt |x3 − 5| ≤ 5? (c) Für welche x ∈ R gilt |x−1| |x+1|+1 ≤ 12 ? 36 Zahlenmengen und Rechentechniken Aufgabe 2.10. Bestimmen Sie, ob die folgenden Mengen beschränkt sind und geben Sie gegebenenfalls Infimum, Supremum, Minimum und Maximum an. (a) M = {x : x2 − 10x ≤ 24}. |x| : x ∈ R}. (b) N = { 1+|x| (c) P = { m+n : m, n ∈ N}. m·n Aufgabe 2.11. Seien a, b ∈ R. Zeigen Sie mit Hilfe der Körper- und Ordnungsaxiome, dass (a) −a ≥ −b, falls a ≤ b. (b) (−1) · (−1) = 1. (c) a2 ≥ 0 und a2 > 0 falls a 6= 0. (d) a > 0 ⇒ (e) 1 a ≥ 1 b 1 a > 0. für 0 < a ≤ b. (f) (ab)−1 = a−1 b−1 für a, b 6= 0. 3 Komplexe Zahlen Da für alle reellen Zahlen x das Quadrat x2 = x · x ≥ 0 und −1 < 0 ist, kann die Gleichung x2 = −1 keine reelle Lösung besitzen. Wie zuvor erweitern wir unseren Zahlenbereich, um auch solche Gleichungen lösen zu können. Wir definieren eine neue Zahl i mit der Eigenschaft i2 = −1. Definition 3.1 (Komplexe Zahlen). Unter einer komplexen Zahl verstehen wir einen Ausdruck der Form z = a + ib, a, b ∈ R Hierbei heißt a =: Re z Realteil und b =: Im z Imaginärteil von z. Für komplexe Zahlen gilt z1 = z2 :⇔ Re(z1 ) = Re(z2 ) ∧ Im(z1 ) = Im(z2 ). Die Menge aller komplexen Zahlen wird mit C bezeichnet. Wir müssen noch festlegen, wie mit komplexen Zahlen überhaupt gerechnet wird. Satz 3.2. Für komplexe Zahlen z1 = a1 + ib1 , z2 = a2 + ib2 definieren wir Addition: z1 + z2 := (a1 + a2 ) + i(b1 + b2 ) Multiplikation: z1 · z2 := (a1 · a2 − b1 · b2 ) + i(a1 · b2 + b1 · a2 ). Zusammen mit diesen Operationen bilden die komplexen Zahlen einen Körper, d.h., es gelten die Körperaxiome (A1)–(A4), (M1)–(M4) und (D). Beweis. Übung. Bemerkung 3.3. • Wir werden später sehen, dass auch die komplexen Zahlen vollständig sind, d.h., die komplexe Zahlenebene hat keine “Löcher”. • Die komplexen Zahlen lassen sich nicht anordnen: Wäre i > 0 (i < 0), dann müsste −1 = i2 > 0 sein, was im Widerspruch zu 1 > 0 steht. 38 Komplexe Zahlen Bemerkung 3.4. Jede reelle Zahl a ∈ R lässt sich mit der komplexen Zahl z = a + i0 identifizieren. In diesem Sinne gilt R ⊂ C. Weiters schreiben wir a + i0 = a + 0i = a sowie 0 + ib = ib = bi. Komplexe Zahlen der Form a + i0 (bzw. 0 + ib) heißen (rein) reell (bzw imaginär). Beispiel 3.5. Man überzeuge sich von der Richtigkeit der folgenden Aussagen: • i2 = (−i)2 = −1. • Sei z = a + ib. Dann gilt ∀x ∈ R : x · z = (x · a) + i(x · b). Definition 3.6. Für jede komplexe Zahl z := a + ib ∈ C definieren wir: • Konjugierte: z := a − ib √ • Betrag: |z| := a2 + b2 (entspricht Abstand zum Nullpunkt) • (Haupt-)Argument: Arg(z) := φ ∈ [0, 2π) für z 6= 0 (Winkel zur reellen Achse) Beispiel 3.7. Mithilfe der Definitionen verifiziert man leicht die folgenden Regeln • Re(z) = 12 (z + z) und Im(z) = 1 (z 2i − z), • z · z = |z|2 sowie z = z, • z1 + z2 = z1 + z2 und z1 · z2 = z1 · z2 , welche für alle komplexen Zahlen z, z1 , z2 gelten. Beispiel 3.8. Die Regeln für den Betrag einer reellen Zahl gelten wörtlich, d.h. • |z| ≥ 0 und |z| = 0 ⇔ z = 0 (Definitheit) • |z1 · z2 | = |z1 | · |z2 | (Homogenität) • |z1 + z2 | ≤ |z1 | + |z2 | (Dreiecksungleichung). Beispiel 3.9. Die Division komplexer Zahlen lässt sich wie folgt durchführen: Seien z1 , z2 ∈ C gegeben. Dann erhält man durch Erweitern des Nenners z1 z1 z2 z1 · z2 1 = · = = (z1 · z2 ). z2 z2 z2 z2 · z2 |z2 |2 Die Division komplexer Zahlen lässt sich also auf Multiplikation komplexer und Division reeller Zahlen zurückführen. Man beachte: Für z2 = 0 (|z2 |2 = 0), ist der Bruch nicht definiert! 39 Bemerkung 3.10. Wir können jede komplexe Zahl z = a + ib ∈ C mit dem Punkt (Vektor) (a, b) ∈ R × R der Zahlenebene identifizieren Darstellung komplexer Zahlen Die Addition entspricht genau der Addition der Vektoren. Realteil Re(z) sowie Imaginärteil Im(z) ergeben sich als Abschnitte auf der reellen bzw. imaginären Achse. Bei der Multiplikation wird die Länge der Vektoren multipliziert, und Ihre Winkel addiert (vgl. Satz Moivre). Weiters lassen sich Argument und Betrag der komplexen Zahl leicht ablesen. Aus der Darstellung erkennt man z = a + ib = |z| cos φ + i|z| sin φ = |z|(cos φ + i sin φ) mit φ := Arg(z). Diese Form heißt Polarkoordinatendarstellung von z. Bemerkung 3.11. • Wir werden später sehen, dass auch die komplexen Zahlen vollständig sind: die komplexe Zahlenebene hat keine “Löcher”. • Die komplexen Zahlen lassen sich nicht anordnen: Wäre i > 0 (i < 0), dann müsste −1 = i2 > 0 sein, was im Widerspruch zu 1 > 0 steht. Mit Hilfe der Polarkoordinatendarstellung und der Winkelsummensätze erhält man folgendes Ergebnis für ganzzahlige Potenzen komplexer Zahlen. Satz 3.12 (Moivre). Sei z = |z|(cos φ + i sin φ). Dann gilt z n = z · . . . · z = |z|n cos(nφ) + i sin(nφ) . Beweis. Die Aussage kann elementar aus den Winkelsummensätzen hergeleitet werden. Sie folgt jedoch leichter aus den Rechenregeln für die komplexe Exponentialfunktion (siehe unten). Bemerkung 3.13. Die n-te Potenz einer komplexen Zahl lässt sich gut in der komplexen Ebene visualisieren. Dabei wird einfach die Länge mit n potenziert, und der Winkel ver-n-facht. Definition 3.14 (Euler’sche Formel). Für φ ∈ R definieren wir exp(iφ) := eiφ := cos φ + i sin φ. 40 Komplexe Zahlen Wir werden später sehen, dass diese Definition der Exponentialfunktion für komplexe Argumente mit der für natürliche (rationale, reelle) Argumente übereinstimmt. Die wesentliche Eigenschaft dieser Definition ist, dass sich alle Rechenregeln für Potenzen übertragen lassen. Satz 3.15. Für alle a, b, c ∈ R und z1 , z2 ∈ C gilt (ez1 )z2 = ez1 ·z2 , e−z1 = 1/ez1 , ex+iy = ex · eiy , ez1 +z2 = ez1 · ez2 , e0 = ei2mπ = 1, ez1 +i2mπ = ez1 ∀m ∈ Z. Die Aussagen folgen zum Teil aus der Definition. Ein vollständiger Beweis wird später im Rahmen von Potenzreihen (und der Definition der Exponentialfunktion als Potenzreihe) erbracht. Beispiel 3.16. Wir benutzen die Euler’sche Formel und die Rechenregeln für Potenzen um die Formel von Moivre zu bestätigen. Es gilt mit φ = Arg(z) und x = elog x , dass n z n = |z|(cos φ + i sin φ) = (elog |z| · eiφ )n = en log |z| · einφ n = elog(|z| ) einφ = |z|n (cos(nφ) + i sin(nφ)). Bemerkung 3.17. Ganz analog gilt für das Multiplizieren von komplexen Zahlen z1 und z2 mit Argumenten φ1 = Arg(z1 ), φ2 = Arg(z2 ), dass z1 · z2 = |z1 |eiφ1 · |z2 |eiφ2 = |z1 ||z2 |ei(φ1 +φ2 ) . Merkregel: Beim Multiplizieren von komplexen Zahlen werden die Beträge multipliziert, und die Argumente addiert. Die Foreml von Moivre kann auch dazu verwendet werden, um ganzzahlige Wurzeln aus einer komplexen Zahl zu ziehen, d.h., Lösungen für die Gleichung zn = a für gegebenes a ∈ C zu bestimmen. Folgerung 3.18 (Wurzeln). Für jede komplexe Zahl a 6= 0 und jedes n ∈ N gibt es genau n verschiedene komplexe Zahlen z0 , . . . , zn−1 mit zkn = a für k = 0, . . . , n − 1. Beweis. Jede Zahl z besitzt eine Polarkoordinatendarstellung z = |z|eiφ mit φ = Arg(z) ∈ ! [0, 2π), ebenso auch a = |a|eiα . Die Gleichung z n = a ist dann äquivalent zu ! z n = |z|n einφ = a = |a|eiα = |a|ei(α+2kφ) für ein k ∈ Z, wobei im letzten Schritt verwendet wurde, dass ei2kπ = 1 gilt. Vergleicht man die Beträge und Argumente der Zahlen, so erhält man die äquivalenten Bedingungen |z| = |a|1/n und φ = (α + 2kπ)/n für k ∈ Z. 41 Die Lösungsmenge der Gleichung besteht also aus allen Zahlen der Form zk := |a|1/n ei(α+2kπ)/n , k ∈ Z. Nutzt man wieder aus, dass ei2mπ = 0 für m ∈ Z, so sieht man, dass die Lösungsmenge bereits gegeben ist durch L = {zk ∈ C : 0 ≤ k ≤ n − 1}, es existieren also genau n verschiedene Wurzeln. Wir machen noch die Probe: Für zk ∈ L gilt n n 1/n i(α+2kπ)/n zk = |a| e = |a|ei(α+2kπ) = |a|eiα · ei2kπ = |a|eiα = a. Bemerkung 3.19. Aus dem Beweis sieht man sogar noch mehr: Für jede komplexe Zahl a 6= 0 gibt es genau n verschiedene Wurzeln. Diese liegen gleichmäßig verteilt auf dem Kreis mit Radius |a|1/n , d.h., der Abstand zwischen den Argumenten (Winkeln) der einzelnen Wurzeln ist immer gleich. Man beachte hierzu die folgenden Beispiele und die zugehörige Darstellung der Wurzeln. Beispiel 3.20. • Die Gleichung z 2 = 1 = ei0 hat zwei Lösungen, nämlich z1 = ei0/2 = 1 und z2 = ei(0+2π)/2 = eiπ = −1. • Die n-ten Wurzeln von 1 = ei0 gegeben durch zk = ei2(k−1)π/n heißen Einheitswurzeln. • Die Gleichung z 2 = −1 = eiπ hat ebenfalls zwei Lösungen, nämlich z1 = eiπ/2 = i und z2 = ei(π+2π)/2 = ei3π/2 = −i. • Für z 3 = −2(1 − i) gibt es drei Lösungen: Es gilt φ = Arg(z 3 ) = 3π/4 und |z 3 | = |2||(1 − √ √ 3 √ √ i(3π/4)/3 erfüllen alle Wurzeln |z| = 2 und es√gilt z1 = 2e = i)| = 2 2 = 2 . Somit √ √ √ √ 1 iπ/4 i(3π/4+2π)/3 i11π/12 2e = 1 + i, z2 = 2e = 2e = 2 (−1 − 3 + i(−1 + 3)), sowie √ i(3π/4+2·2π)/3 √ √ i19π/12 1 √ z3 = 2e = 2e = 2 (−1 + 3 + i(−1 − 3)). Darstellung der Wurzeln komplexer Zahlen 42 Komplexe Zahlen Man beachte: Die Wurzeln zk der Zahl a sind gerade die Nullstellen der komplexen Polynomfunktion z n − a = 0. Die folgenden Sätze zeigen, dass auch allgemeinere Polynome vom Grad ≤ n gerade wieder n Nullstellen besitzen. Satz 3.21 (Hauptsatz der Algebra). Sei n ∈ N und pn (z) := an z n + an−1 z n−1 + . . . + a1 z 1 + a0 eine komplexe Polynomfunktion vom Grad n (d.h. ak ∈ C, an 6= 0). Dann hat pn mindestens eine Nullstelle zn ∈ C, also pn (zn ) = 0. Beweis. Der Beweis wird hier nicht erbracht. Bemerkung 3.22. Ist z1 eine Nullstelle des Polynoms pn (z) vom Grad n, dann existiert genau ein Polynom pn−1 (z) vom Grad n − 1 sodass pn (z) = (z − z1 ) · pn−1 (z) gilt. Dies zeigt man mit Hilfe der Polynomdivision. Hierzu ein Beispiel: Sei pn (z) = z 3 − z 2 − z + 1. Dann ist z = 1 eine Nullstelle, und es gilt z 3 − z 2 − z + 1 = (z − 1) · z 2 + z 2 +(−z 2 − z + 1) = (z − 1) · z 2 + (−z + 1) {z } | {z } | =z 3 =−(z−1) 2 = (z − 1) · (z − 1). Aus der Existenz einer Nullstelle folgt mittels Polynomdivision, dass sogar n Nullstellen vorliegen. Auch das folgende Ergebnis wird deshalb als “Hauptsatz der Algebra” bezeichnet. Folgerung 3.23 (Hauptsatz der Algebra). Jedes komplexe Polynom vom Grad n besitzt genau n komplexe Nullstellen zk , k = 1 . . . , n, und es gilt die Zerlegung in Linearfaktoren pn (z) = an (z − z1 ) · . . . · (z − zn ). Die Nullstellen sind bis auf Umordnung eindeutig. Beweis. Wir zeigen die Existenz der Darstellung mittels vollständiger Induktion: (IA): Jedes Polynom vom Grad 1 besitzt die Form p1 (z) = a1 z + a0 = a1 (z − a0 /a1 ), was die Behauptung für n = 1 ist. Man beachte, dass a1 6= 0 (sonst wäre der Grad des Polynoms nicht 1), und dass die Darstellung eindeutig ist! (IV): Für n ≥ 1 besitze jedes Polynom pn (z) eine eindeutige Zerlegung wie oben angegeben. (IS): Sei pn+1 (z) = an+1 z n+1 + . . . + a0 ein Polynom vom Grad n + 1. Nach dem Hauptsatz der Algebra existiert eine Nullstelle zn+1 sowie ein Polynom pn (z) vom Grad n mit pn+1 (z) = (z − zn )pn (z). Für das Polynom pn (z) existiert aber nach Induktionsvoraussetzung eine Zerlegung in Linearfaktoren, was die Behauptung für n + 1 zeigt. Die Eindeutigkeit wird hier nicht gezeigt (vgl. aber mit dem Satz über Eindeutigkeit). 43 Bemerkung 3.24. Jedes Polynom mit komplexen (oder auch reellen) Koeffizienten besitzt also genau n komplexe Nullstellen. Es kann ein und dieselbe Nullstelle auch mehrfach auftreten. Man spricht dann von der (algebraischen) Vielfachheit der Nullstelle, z.B. hat p3 (z) := (z 3 − z 2 − z + 1) = (z − 1)2 (z + 1) die Nullstellen 1 (mit Vielfachheit 2) und −1 (mit Vielfachheit 1). Das ergibt (unter Berücksichtigung der Vielfachheit) genau 3 Nullstellen. Satz 3.25 (Eindeutigkeit). Jedes komplexe Polynom pn (z) vom Grad n ist durch seine Werte an n + 1 paarweise verschiedenen Stellen zk , k = 0, . . . , n, bereits eindeutig bestimmt. Beweis. Seien pn (z) und p̃n (z) zwei Polynome mit pn (zk ) = p̃n (zk ) ∀k ∈ {0, . . . , n}, d.h. pn − p̃n hat n + 1 paarweise verschiedene Nullstellen. Weiterhin hat die Differenz der Polynome maximal Grad g ≤ n. Wäre g ≥ 1, dann hätte pn − p̃n nach der Folgerung aus dem Hauptsatz der Algebra genau g Nullstellen, was einen Widerspruch ergäbe. Also ist g = 0, und damit pn (z) − p̃n (z) = pn (z0 ) − p̃n (z0 ) = 0 ∀z ∈ C. Aufgaben Aufgabe 3.1. Verifizieren Sie die Aussagen von Beispiel 3.5. Aufgabe 3.2. Berechnen Sie Real-, Imaginärteil, Betrag und Argument für die komplexen Zahlen √ z1 = (1 + i), z2 = −i, z3 = 3 − i; und skizzieren sie die Zahlen in der komplexen Ebene. Aufgabe 3.3. Berechnen Sie für die Zahlen aus Aufgabe 3.2 jeweils zk , 1/zk sowie z 3 . Aufgabe 3.4. Berechnen sie für die Zahlen aus Aufgabe 3.2 die Ausdrücke a1 = z1 · z2 , a2 = z1 /z2 , a3 = (z2 + z3 )/z1 . Aufgabe 3.5. Geben Sie die Resultate ak aus Aufgabe 3.4 in Polarkoordinatendarstellung an. Aufgabe 3.6. Zeigen Sie, dass (C, +, ·) die Körperaxiome erfüllt. Aufgabe 3.7. Skizzieren Sie die Mengen M1 := {z ∈ C : |z − 1| ≤ 1}, M2 := {z ∈ C : −1 ≤ Re(z) ≤ Im(z) ≤ 1}. 44 Komplexe Zahlen Aufgabe 3.8. Überprüfen Sie die Rechenregeln für die Konjugation aus Beispiel 3.7. Aufgabe 3.9. Zeigen Sie per vollständiger Induktion, dass n Y k=1 zk = n Y k=1 zk und n X k=1 zk = n X zk ∀zk ∈ C, k ∈ {1, . . . , n}. k=1 Aufgabe 3.10. Verifizieren Sie die Regeln für den Betrag aus Beispiel 3.8. Aufgabe 3.11. Man zeige mittels Euler’scher Formel die Darstellung der Winkelfunktionen: 1 cos φ = (eiφ + e−iφ ) 2 und sin φ = 1 iφ (e − e−iφ ). 2i Aufgabe 3.12. Beweisen Sie mit Hilfe der Euler’schen Formel, den Rechenregeln für Potenzen sowie Aufgabe 3.11 die Winkelsummensätze sin(x ± y) = sin x · cos y ± sin y · cos x cos(x ± y) = cos x · cos y ∓ sin x · sin y. Aufgabe 3.13. Berechnen Sie alle Lösungen der Gleichung (z − √ 2(−1 + i))4 = 16. Aufgabe 3.14. Das Polynom p2 (z) := a2 z 2 + a1 z + a0 habe reelle Koeffizienten ak ∈ R. Zeigen Sie mit Hilfe der Rechenregeln für die Konjugation, dass die beiden Nullstellen z1 , z2 von p2 komplex-konjugiert sind, d.h., z1 = z2 . Aufgabe 3.15. Verallgemeinern Sie die Beobachtung aus Aufgabe 3.14 auf Polynome mit beliebigem Grad. Aufgabe 3.16. Zeigen Sie, dass jedes Polynome pn (z) mit ungeradem Grad n und reellen Koeffizienten mindestens eine reelle Nullstelle besitzt. Aufgabe 3.17. Das Polynom p4 (z) = z 4 + 3z 3 + 3z 2 + 2z + 1 lässt sich faktorisieren á la p4 (z) = (z + 1) · p3 (z). Berechnen Sie mittels Polynomdivision (bzw. Koeffizientenverlgeich) das Polynom p3 . Aufgabe 3.18. Berechnen Sie alle Nullstellen von p3 (z) = z 3 + 2z 2 − z − 2. Hinweis: Eine Nullstelle durch Probieren; dann Polynomdivision. Aufgabe 3.19. Finden Sie alle Nullstellen von p3 (z) = z 3 − z 2 + z − 1. 4 Lineare Gleichungssysteme Einführende Beispiele Wir betrachten das lineare Gleichungssystem (LGLS) x1 + x2 = 2 2x1 + x2 = 3 (I) (II). Wir sprechen von einem Gleichungssystem (GLS), da mehrere Gleichungen in mehreren Unbekannten gleichzeitig gelöst werden. Das GLS heißt linear, da die Unbekannten x1 und x2 nur linear (in erster Potenz) auftreten. Unter einer Lösung des GLS (I),(II) verstehen wir Zahlenpaare (x1 , x2 ) ∈ R × R, welche die beiden Gleichungen (I) und (II) simultan lösen. Die Menge aller Lösungen L := {(x1 , x2 ) ∈ R × R : (I) ∧ (II)} = {(x1 , x2 ) ∈ R2 : (I)} ∩ {(x1 , x2 ) ∈ R2 : (II)} heißt Lösungsmenge des GLS (I),(II). Zur Bestimmung der Löungsmenge kann man wie folgt vorgehen: Addiert man zur zweiten Gleichung das (−2)-fache der ersten, erhält man −x2 = −1 (II’) mit (II’) = (II)-2·(I). Man beachte: Löst (x1 , x2 ) die Gleichungen (I) und (II), dann auch die Gleichung (II’). Dies folgt sofort aus den Axiomen für reelle Zahlen. Es folgt sogar, dass (x1 , x2 ) Lösung von (I) und (II) ist, genau dann wenn (x1 , x2 ) auch Lösung von (I) und (II’) ist. Das heißt: Für alle (x1 , x2 ) ∈ R × R gilt (I) ∧ (II) ⇔ (I) ∧ (II 0 ). Wir nennen die Gleichungssysteme (I),(II) und (I),(II’) daher äquivalent. Das System x1 + x 2 = 2 −x2 = −1 (I) (II’) 46 Lineare Gleichungssysteme kann relativ einfach gelöst werden. Multipliziert man die zweite Gleichung mit (−1) sieht man sofort, dass x2 = 1 sein muss. Addiert man die zweite Gleichung zur ersten, erhält man das System x1 = 1 x2 = 1 (I’) (II”), welches wiederum äquivalent ist zu den Systemen (I),(II) sowie (I),(II’). Nun lässt sich die Lösung aber sofort ablesen, und aufgrund der Äquivalenz erhalten wir: Das GLS (I),(II) besitzt genau eine Lösung (x1 , x2 ) = (1, 1) in R × R. Die Lösungsmenge ist also gegeben durch L = {(x1 , x2 ) ∈ R × R : (I) ∧ (II)} = {(1, 1)}. Betrachtungen zur Lösbarkeit Wie die folgenden Beispiele zeigen, muss ein lineares Gleichungssystem im Allgemeinen keine (eindeutige) Lösung besitzen. Beispiel 4.1. Wir betrachten zunächst die lineare Gleichung (System mit einer Gleichung und einer Unbekannten) a · x = y, wobei a, y ∈ R gegeben seien. Um die Frage nach der Lösbarkeit zu beantworten, müssen drei Fälle unterschieden werden: Fall 1 (a 6= 0): Es existiert (für jedes y ∈ R) genau eine Lösung x = a−1 y. Fall 2 (a = 0, y 6= 0): Wir haben es also mit der Gleichung 0 · x = y 6= 0 zu tun. Da 0 · x = 0 für alle x ∈ R ist, kann keine Lösung existieren. Fall 3 (a = 0, y = 0): In diesem Fall reduziert sich die Gleichung auf 0 · x = 0, und jedes x ∈ R ist Lösung der Gleichung. Man hat also unendlich viele Lösungen. Dieselben Fälle treten auch bei LGLSen mit zwei Gleichungen in zwei Unbekannten auf. Beispiel 4.2. Für gegebene Zahlen a, b ∈ R betrachten wir das lineare GLS x1 + ax2 = b 2x1 + x2 = 3 (I) (II). Addiert man wie oben das (−2)-fache der ersten Zeile zur zweiten, erhält man das äquivalente System x1 + ax2 = b (1 − 2a) x2 = 3 − 2b Zur Lösung müssen wir wieder drei Fälle unterscheiden: (I) (II’). 47 Fall 1 (1 − 2a 6= 0): Die zweite Gleichung lässt sich in diesem Fall durch (1 − 2a) dividieren, und das a/(1 − 2a)-fache der zweiten Gleichung kann von der ersten subtrahiert werden. Man erhält das äquivalente System x1 = b − a(3 − 2b)/(1 − 2a) x2 = (3 − 2b)/(1 − 2a) (I’) (II”). Für jedes beliebige b erhält man die eindeutige Lösung (x1 , x2 ) = (3 − 2b)/(1 − 2a), b − a(3 − 2b)/(1 − 2a) . Fall 2 (1 − 2a = 0, 3 − 2b 6= 0): Die Gleichung (II’) lautet dann 0 · x2 = 3 − 2b 6= 0, und es existiert kein x2 welches diese Bedingung erfüllt. Es kann also keine Lösung existieren. Fall 3 (1 − 2a = 0, 3 − 2b = 0): Die Gleichung (II’) lautet in diesem Fall 0 · x2 = 0, und diese ist für jedes beliebige x2 ∈ R erfüllt. In diesem Fall ist also für jedes (x1 , x2 ) ∈ R × R (I) ∧ (II) ⇔ (I) ∧ (II’) ⇔ (I). Die Gleichung (I) lässt sich weiter umformen, und das System (I),(II) ist somit äquivalent zu x1 = b − a · x2 (I”). Für jede Wahl x2 = t ∈ R ist (x1 , x2 ) = (b − at, t) Lösung der Gleichung. Die Lösungsmenge (diese hängt noch von den Werten für a und b ab) lautet also L(a, b) = {(b − at, t) : t ∈ R} falls 1 − 2a = 0, 3 − 2b = 0. Geometrische Deutung Bemerkung 4.3. Eine Gleichung in zwei Unbekannten hat als Lösungsmenge eine Gerade in der Zahlenebene R × R (die Gleichung 0 · x1 + 0 · x2 = 0 hat als Lösungsmenge ganz R × R, und 0 · x1 + 0 · x2 = c 6= 0 hat keine Lösung). Die Lösungsmenge eines Gleichungssystems von n Gleichungen in 2 Unbekannten ergibt sich als Schnitt der Lösungsmengen, etwa L = {(x1 , x2 ) ∈ R × R : (I) ∧ (II) ∧ (III)} = {(x1 , x2 ) ∈ R : (I)} ∩ {(x1 , x2 ) ∈ R : (II)} ∩ {(x1 , x2 ) ∈ R : (III)}. Der Fall 1 − 2a 6= 0 in obigem Beispiel bedeutet gerade, dass die beiden Lösungsgeraden zu den Gleichungen (I) und (II) nicht parallel verlaufen. Im Fall 2 sind die Geraden parallel (aber nicht gleich), und im Fall 3 sind die Geraden gleich. 48 Lineare Gleichungssysteme Lösungsmenge eines Gleichungssystems mit 2 Unbekannten als Schnitt von Geraden Bemerkung 4.4. Eine Gleichung in drei Unbekannten x1 , x2 , x3 hat als Lösungsmenge eine Ebene im Zahlenraum R × R × R = R3 (abgesehen von den Spezialfällen). Die Lösungsmenge eines Gleichungssytems von n Gleichungen erhält man wieder als Schnitt der Lösungsmengen der einzelnen Gleichungen. Die Lösungsmenge des Gleichungssystems x1 + x2 + x3 = 1 − x2 + x3 = 0 (I) (II) lässt sich wie folgt berechnen: Aus (II) folgt x2 = x3 , und Einsetzen in (I) liefert x1 = 1 − x2 − x3 = 1 − 2x3 . Daraus folgt L = {(x1 , x2 , x3 ) ∈ R3 : (I) ∧ (II)} = {(x1 , x2 , x3 ) : (I)} ∩ {(x1 , x2 , x3 ) : (II)} = {(x1 , x2 , x3 ) : x2 = x3 ∧ x1 = 1 − 2x3 } = {(1 − 2t, t, t) : t ∈ R}, wobei wir im letzten Schritt x3 durch die Variable t ersetzt haben. Die zweite Zeile drückt die Lösungsmenge (Gerade) als Schnitt der durch die beiden Gleichungen beschriebenen Ebenen aus. Lösungsmenge eines Gleichungssystems in 3 Unbekannten als Schnitt von Ebenen 49 Allgemeine lineare Gleichungssysteme Definition 4.5. Ein System a11 x1 a21 x1 .. . + a12 x2 + a22 x2 .. . am1 x1 + am2 x2 + . . . + a1n xn = y1 + . . . + a2n xn = y2 .. .. .. . . . + . . . + amn xn = ym (G1) (G2) .. . (Gm) mit reellen (komplexen) Koeffizienten aij und rechten Seiten yi für 1 ≤ i ≤ m und 1 ≤ j ≤ n heißt reelles (komplexes) lineares Gleichungssystem (LGLS) mit m Gleichungen in n Unbekannten (x1 . . . . , xn ). Ein n-Tupel (l1 , . . . , ln ) ∈ Rn (bzw Cn ) heißt Lösung des LGLSs, wenn bei Einsetzen der Werte li für xi alle Gleichungen simultan erfüllt werden. Die Menge L := {(l1 , . . . , ln ) ∈ Rn : (l1 , . . . , ln ) ist Lösung} heißt Lösungsmenge des LGLSs. Bemerkung 4.6. • Ist y1 = y2 = . . . = ym = 0, so heißt das GLS homogen, sonst inhomogen. • Gilt m > n (mehr Gleichungen als Unbekannte), so heißt das System überbestimmt, im Falle m < n (weniger Gleichungen als Unbekannte) unterbestimmt. Um die Lösungsmenge eines LGLSs zu bestimmen, gehen wir genauso vor, wie in den vorigen Beispielen, d.h., wir überführen das GLS durch elementare Umformungen auf einfachere Gestalt, die erlaubt die Lösungsmenge relativ einfach abzulesen. Definition 4.7 (Elementare Zeilenumformungen). Unter einer elementaren Zeilenumformung verstehen wir (i) das Vertauschen zweier Zeilen (Gleichungen): (Gi),(Gj)↔(Gj),(Gi) (ii) das Multiplizieren einer Gleichung mit einer Zahl λ 6= 0: (Gi)↔ λ·(Gi) (iii) das Addieren einer Zeile zu einer anderen: (Gi),(Gj)↔(Gi),(Gj)+(Gi). Zwei Gleichungssysteme, die durch elementare Zeilenumformungen ineinander überführt werden können heißen äquivalent. Bemerkung 4.8. Die Symbole ↔ sind so zu verstehen, dass die Gleichungen auf der linken Seite durch die Gleichungen auf der rechten Seite ersetzt werden. Dieses Ersetzen kann auch rückgängig gemacht werden. Man beachte, dass für alle (x1 , . . . , xn ) ∈ Rn , alle 1 ≤ i, j ≤ m, i 6= j und für alle λ 6= 0 gilt: (Gi) ∧ (Gj) ⇔ Gj) ∧ (Gi) (Gi) ⇔ λ · (Gj) (Gi) ∧ (Gj) ⇔ Gi) ∧ (Gj) + (Gi) . Die Lösungsmengen des Gleichungssystems bleiben bei elementaren Zeilenumformungen also unverändert. 50 Lineare Gleichungssysteme Als Folgerung aus dieser Bemerkung erhalten wir sofort das wesentliche Resultat: Satz 4.9. Die Lösungsmenge eines linearen Gleichungssystems wird durch elementare Zeilenumformungen nicht verändert, d.h., äquivalente lineare Gleichungssysteme besitzen dieselben Lösungen. Beweis. Folgt sofort aus obiger Bemerkung mittels vollständiger Induktion. Bemerkung 4.10. Man kann auch mehrere elementare Zeilenumformungen zusammenfassen, etwa: (Gj)→(Gj) - 2·(Gi) entsteht aus drei elementaren Schritten (Gi),(Gj)↔(-2)·(Gi),(Gj)↔ (-2)·(Gi),(Gj)+(-2)·(Gi)↔(Gi),(Gj)-2·(Gi). Wie in den einführenden Beispielen verwenden wir die elementaren Zeilenumformungen, um das LGLS auf einfache Form zu überführen. Darstellung über Koeffizienteschemata Ein LGLS ist bereits durch Angabe der Koeffizienten und rechten Seiten eindeutig bestimmt. Durch das erweiterte Koeffizientenschema 1 a b 2 1 3 werden die zwei Gleichungen 1·x1 +a·x2 = b und 2·x1 +1·x2 = 3 beschrieben. Wir schreiben für das erweiterte Koeffizientenschema auch kurz (A|y), und nennen A die Koeffizientenmatrix, und b die rechte Seite des LGLSs. Beispiel 4.11. Das angegebene Schema entspricht genau dem LGLS aus Beispiel 4.2. Beim Umformen eines LGLSs, genügt es die Operationen auf das Koeffizientenschema anzuwenden. Der erste Schritt in Beispiel 4.2 bestand aus dem Addieren des (−2)-fachen der ersten Zeile zur zweiten, wodurch man 1 a b 0 1 − 2a 3 − 2b erhält. Falls 1 − 2a 6= 0 ist, kann man die zweite Zeile mit 1/(1 − 2a) multiplizieren, was zu 1 a b 0 1 (3 − 2b)/(1 − 2a) führt. Dieses Koeffizientenschema hat nun eine sehr einfache Form, aus der sich die Lösung rasch ablesen lässt: Die zweite Zeile bedeutet x2 = (3 − 2b)/(1 − 2a). Und Umformen der ersten Zeile liefert x1 = b − ax2 = b − a(3 − 2b)/(1 − 2a). 51 Gleichungssysteme in Zeilenstufenform Definition 4.12. Ein lineares Gleichungssystem, dessen erweitertes Koeffizientenschema (A|y) in jeder Zeile echt mehr führende Nullen als in ihren Vorgängern stehen hat, heißt in Zeilenstufenform. Die Anzahl der Zeilen der Matrix A, die nicht identisch null sind, heißt Rang der Matrix A, kurz Rang(A). Beispiel 4.13. Das inhomogene lineare 0 2 0 0 0 0 0 0 0 0 GLS mit Koeffizientenschema 5 0 3 4 1 1 0 1 0 3 9 0 0 0 5 1 6 9 0 0 0 0 1 0 0 0 0 0 0 a ist in Zeilenstufenform, und es gilt Rang(A) = 4. Rückwärtseinsetzen Für ein LGLS in Zeilenstufenform lässt sich die Lösungsmenge sehr einfach durch Rückwärtseinsetzen berechnen. Jede Zeile (beginnend mit der letzten; daher rückwärts) erlaubt eine Variable zu eliminieren. Nicht eliminierbare Variablen verbleiben als Unbekannte im System. Für das LGLS aus Beispiel 4.13 erhält man: Fall 1 (a 6= 0): Die letzte Zeile (und somit das ganze GLS) besitzt keine Lösung, also L = ∅. Fall 2 (a = 0): Die letzte Zeile entspricht der Gleichung 0 = 0, welche immer erfüllt ist und daher gestrichen werden kann. Aus der vorletzten Zeile erhält man x7 = 0. Zeile 3 entspricht der Gleichung 5x5 + x6 + x7 = 9. Verwendet man, dass x7 = 0 ist, erhält man x5 = (9 − x6 − x7 )/5 = 9−x6 . 5 Die Unbekannte x6 kann nicht eliminiert werden, und bleibt als Variable in der Beschreibung der Lösungsmenge. Aus Zeile 2 erhält man x4 = 0 − 3x6 − 9x7 = −3x6 , und Zeile 1 liefert schließlich x2 = (1 − 5x3 − 3x5 − 4x6 − x7 )/2 = (1 − 5x3 − 3/5(9 − x6 ) − 4x6 )/2 = − 11 − 52 x3 − 56 x6 . 5 Die Lösungsmenge des LGLSs ist daher im Fall a = 0 gegeben durch L = {(x1 , . . . , x7 ) ∈ R7 : x2 = − 11 − 25 x3 − 65 x6 ∧ x4 = −3x6 ∧ x5 = 5 = { r, − 11 − 52 s − 65 t, s, −3t, 9−t , t, 0 : r, s, t ∈ R}, 5 5 9−x6 5 ∧ x7 = 0} 52 Lineare Gleichungssysteme wobei wir x1 , x3 , x6 durch die Variablen r, s, t ersetzt haben. Für jede Wahl der Variablen r, s, t erhält man eine Lösung, z.B. liefert die Wahl r = 1, b = 0, c = 0 die spezielle Lösung (x1 , . . . , x7 ) = (1, −11/5, 0, 0, 9/5, 0, 0). Obiges Beispiel liefert folgende Aussage über die Lösbarkeit von LGLSen in Zeilenstufenform. Satz 4.14. Das erweiterte Koeffizientenschema (A|y) sei in Zeilenstufenform. Dann trifft für die Lösungsmenge L des zugehörigen linearen Gleichungssystems genau einer der folgenden Fälle zu: (1) Die rechte Seite yi zu einer Nullzeile in der Koeffizientenmatrix A ist ungleich 0. Dann besitzt das LGLS keine Lösung. (2) Die rechten Seiten yi zu allen Nullzeilen in A sind gleich 0. Dann besitzt das GLS mindestens eine Lösung. Im zweiten Fall ist die Anzahl der freien Parameter in der Lösungsmenge gleich der Anzahl der Unbekannten minus der Anzahl der Nicht-Nullzeilen von A, also n − Rang(A). Lösen allgemeiner linearer Gleichungssysteme Um die Lösungsmenge eines allgemeinen LGLSs zu bestimmen, bietet sich jetzt folgende Strategie an (vgl. vorangehende Beispiele): (A) Mit Hilfe von elementaren Zeilenumformungen wird das LGLS auf ein äquivalentes System in Zeilenstufenform überführt. (B) Die Lösungsmenge des äquivalenten Systems in Zeilenstufenform wird mittels Rückwärtseinsetzen bestimmt. Der zwiete Schritt (B) wurde bereits behandelt, und der folgende Satz belegt, dass (und wie) auch der erste Schritt (A) immer durchführbar ist. Satz 4.15. Jedes lineare Gleichungssystem lässt sich mit elementaren Zeilenumformungen auf ein äquivalentes System in Zeilenstufenform überführen. Die Lösungsmenge bleibt dabei unverändert. Beweis. Der Beweis ist konstruktiv, d.h., wir geben einen Algorithmus an, der das System in Zeilenstufenform schrittweise konstruiert. Schritt 0: Setze k := 1 (gerade zu bearbeitende Zeile) Schritt 1: Falls k = m, stop; sonst 1a) Wähle eine Zeile i aus k ≤ i ≤ m mit minimaler Anzahl von führenden Nullen. 1b) Vertausche die Zeilen i und k. 53 1c) Subtrahiere geeignete Vielfache der (neuen) Zeile k von den Zeilen j mit k + 1 ≤ j ≤ m, sodass die Zeilen j mindestens eine führende 0 mehr aufweisen als Zeile k. Schritt 2: Setze k := k + 1 (nächste Zeile), und gehe zu Schritt 1. Man beachte: Schritt 1 und 2 des Algorithmus werden ≤ m mal aufgerufen, d.h., der Algorithmus terminiert nach endlich vielen Operationen. Man überzeugt sich leicht (z.B. mittels Induktion bzgl. k), dass das Gleichungssystem am Ende des Algorithmus Zeilenstufenform besitzt. Bemerkung 4.16. Der Algorithmus zum Überführen auf Zeilenstufenform heißt Gauß’sches Eliminationsverfahren (kurz: Gauß-Elimination). Durch geeignetes Addieren von Zeilen in der Zeilenstufenform zu Ihren Vorgängern kann man weitere Zahlen im rechten oberen Teil der Koeffizientenmatrix auf Null bringen. Man spricht dann von der reduzierten Zeilenstufenform und dem Gauß-Jordan Algorithmus. Zur Veranschaulichung ein weiteres Beispiel. Beispiel 4.17. Wir betrachten das LGLS x2 x1 x1 + 2x2 + ax3 = b + x3 = 1 + x3 = 0 Gesucht ist die Lösungsmenge in Abhängigkeit der Parameter a, b ∈ R. Lösung: Wir führen elementare Zeilenumformungen auf dem Koeffizienteschema aus: Zeile k=1: 1 0 1 1 1 0 1 1 0 1 a b 1c)Z3↔Z3−Z1 0 1 a b 1 0 1 1 1b)Z1↔Z2 ⇔ 0 1 a b ⇔ 1 2 1 0 1 2 1 0 0 2 0 −1 Zeile k=2: 1 0 1 1 1c)Z3↔Z3−2·Z2 0 1 . a b ⇔ 0 0 1 − 2a −1 − 2b Fall 1: (1 − 2a = 0 ∧ −1 − 2b 6= 0): Das Gleichungssystem besitzt keine Lösung, also L = {}. Fall 2: (1 − 2a = 0 ∧ −1 − 2b = 0): In diesem Fall ist das GLS äquivalent zum reduzierten System (Streichen der Nullzeile!) 1 0 1 1 . 0 1 a b Die Löungsmenge wird durch Rückwärtseinsetzen konstruiert: Durch Umformen von Z2 erhält man x2 = b − a · x3 , und Einsetzen in Z1 liefert x1 = 1 − x3 . Die Lösungsmenge ist also gegeben 54 Lineare Gleichungssysteme durch L = {(x1 , x2 , x3 ) ∈ R3 : x2 = b − a · x3 ∧ x1 = 1 − x3 } = {(1 − t, b − a · t, t) : t ∈ R} falls 2a = 1 ∧ 2b = −1. Man beachte, dass für jedes fixe a, b ∈ R, die Lösungsmenge noch einen (n − Rang(A) = 3 − 2 = 1) freien Parameter t besitzt. Es gibt also unendlich viele Lösungen. Fall 3: (1 − 2a 6= 0): In diesem Fall kann man x3 aus der letzten Zeile berechnen, also x3 = (−1 − 2b)/(1 − 2a). Die beiden anderen Gleichungen werden wie im Fall 2 aufgelöst, und man erhält L = {(x1 , x2 , x3 ) ∈ R3 : x3 = (−1 − 2b)/(1 − 2a) ∧ x2 = b − a · x3 ∧ x1 = 1 − x3 } = { 1 − (2b + 1)/(2a − 1), b − a(2b + 1)/(2a − 1), (2b + 1)/(2a − 1) }, falls 2a 6= 1. In diesem Fall liegt für jede Wahl a, b ∈ R mit 2a 6= 1 genau eine Lösung vor, die Lösungsmenge besitzt also keinen freien Parameter mehr (n − Rang(A) = 3 − 3 = 0). Wir wählen jetzt fix a = 1 und b = 0. 1 0 1 1 1 0 1 b a 0 = 0 0 1 − 2a −1 0 Durch Einsetzen und weiteres Umformen erhalten wir 0 1 1 1 0 1 1 Z3↔(−1)·Z3 0 1 1 0 0 1 1 ⇔ 0 −1 −1 0 0 1 1 1 0 1 1 1 0 0 0 Z2↔Z2−Z3 0 1 0 −1 Z1↔Z1−Z3 0 1 0 −1 . ⇔ ⇔ 0 0 1 1 0 0 1 1 An dem so (durch den Gauß-Jordan Algorithmus) erhaltenen System in reduzierter Zeilenstufenform lässt sich die Lösung besonders leicht ablesen, nämlich L = {(0, −1, 1)}. Bemerkung 4.18. Man sieht anhand der Rechnung, dass das Ermitteln der Lösungsmenge aus der Zeilenstufenform mittels Rückwärtseinsetzen deutlich weniger Arbeit ist, als das Umformen von Zeilenstufenform in reduzierte Zeilenstufenform. Wir verwenden deshalb bevorzugt die Gauß-Elimination mit Rückwärtseinsetzen, und nicht den Gauß-Jordan Algorithmus. Der Gauß-Algorithmus Im folgenden wollen wir kurz die Umsetzung des Gauß-Algorithmus auf dem Computer diskutieren. Wir verwenden hierfür Matlab Notation, und betrachten nur GLSe mit gleich vielen Gleichungen wie Unbekannten, also m = n. Der Algorithmus soll abbrechen, falls keine eindeutige Lösung berechnet werden kann. Vergleichbare Algorithmen in anderen Programmiersprachen findet man leicht im Internet. Als Eingabe erhält man eine Koeffizientenmatrix A mit m = n Zeilen und n Unbekannten, sowie eine rechte Seite y mit m = n Einträgen. Im ersten Schritt wird das GlS (also das Koeffizientenschema) auf Zeilenstufenform gebracht. 55 function [A,y] = gauss_eliminate(A,y) % Gauss-Elimination % input: A ... n x n Matrix % y ... n x 1 Matrix n = length(y); for k=1:n-1 % loop over lines % search for row largest entry at kth position j=find(abs(A(k:n,k))==max(abs(A(k:n,k))),1)+k-1; if abs(A(j,k))<1e-16, error(’matrix is close to singular’); return; end % swap row k and row j if j~=k, r=A(k,k:n); A(k,k:n)=A(j,k:n); A(j,k:n)=r; r=y(k); y(k)=y(j); y(j)=r; end % eliminate kth entry in rows with index >k for j=k+1:n alpha = A(j,k)/A(k,k); A(j,k:n) = A(j,k:n) - alpha * A(k,k:n); y(j) = y(j) - alpha * y(k); end % j end % k Bei erfolgreicher Durchführung hat die Matrix A nun Zeilenstufenform, und das System kann mit Rückwärtseinsetzen gelöst werden. function x = backward_solve(A,y) % Backward-Substitution % input: A ... n x n upper triangular matrix % y ... n x 1 matrix n = length(y); x = 0*y; for k=n:-1:1 % go backward from n to 1 x(k) = (y(k) - A(k,k:n)*x(k:n))/A(k,k); end Die Funktionstüchtigkeit des Algorithmus testen wir mit folgender Eingabe: % Koeffizientenschema A=[2,1;1,2]; 56 Lineare Gleichungssysteme y=[3;3]; % Gauss-Elimination [B,z]=gauss_eliminate(A,y); % Rueckwaertseinsetzen x=backward_solve(B,z) 5 Vektorrechnung Vektorräume Die Elemente des Cartesischen Produkts R2 := R × R können mit Punkten in der Ebene identifiziert werden. Ein Element v = (v1 , v2 ) ∈ R2 wird dabei mit dem Punkt in der Ebene mit Koordinaten v1 und v2 identifiziert. Im geometrischen Kontext schreiben wir auch v v = 1 ∈ R2 , v2 und wir nennen v einen Spaltenvektor. Bemerkung: Wir machen vorderhand keinen Unterschied zwischen dem 2-Tupel (v1 , v2 ) und dem Spaltenvektor vv12 , d.h., die Menge { vv12 : v1 , v2 ∈ R} aller Spaltenvektoren mit reellen Koordinaten ist gerade wieder R2 . Bemerkung 5.1. Vektoren im R2 bzw R3 tauchen häufig im Zusammenhang mit physikalischen oder technischen Fragestellungen auf, und werden dann gerne als gerichtete Größen (Pfeile) dargestellt. Es kann Sinn machen, diese Pfeile in der Ebene zu verschieben, etwa, um die entsprechenden Kräfte an einem bestimmten Punkt angreifen zu lassen, oder zur Darstellung der Addition von Vektoren (siehe unten). Die Koordinaten des Vektors (somit der Vektor selbst) sind durch Länge und Richtung bereits eindeutig bestimmt (vgl. Polarkoordinaten bei komplexen Zahlen). Vektoren im R2 lassen sich komponentenweise addieren und mit reellen Zahlen multiplizieren, und zwar gemäß v1 w1 v1 + w1 v + w := + = v2 w2 v2 + w2 v λv1 und λ · v := λ · 1 = v2 λv2 58 Vektorrechnung Addition und skalare Multiplikation von Vektoren im R2 . Das Rechnen mit Vektoren lässt sich sofort auf den R3 bzw. den Rn , und auch noch auf weitere Beispiele übertragen. Definition 5.2. Sei (K, +, ·) ein Körper. Unter einem K-Vektorraum verstehen wir eine nichtleere Menge V auf der Operationen ⊕ : V × V → V, (v, w) 7→ v ⊕ w und : K × V → V, (λ, v) 7→ λ v mit folgenden Eigenschaften definiert sind: Für alle u, v, w ∈ V und alle λ, µ ∈ K gilt (u ⊕ v) ⊕ w = u ⊕ (v ⊕ w), ∃~0 ∈ V : v ⊕ ~0 = v, v ⊕ w = w ⊕ v, ∃!(−v) ∈ V : v ⊕ (−v) = ~0, sowie λ (v ⊕ w) = (λ v) ⊕ (λ w), (λ µ) v = λ (µ v) (λ + µ) v = (λ v) ⊕ (µ v), 1 v = v. Bemerkung 5.3. • Für K = R (bzw. K = C) sprechen wir von einem “reellen” oder ”komplexen“ Vektorraum. • Jeder Vektorraum muss zumindest ~0 enthalten (warum?). {} ist also kein Vektorraum! • Für einen K-Vektorraum schreiben wir (V, K, ⊕, ) oder (V, ⊕, ) oder kurz V . Die Elemente v ∈ V heißen Vektoren (ein Vektor ist also gerade das Element eines Vektorraums) und die Elemente λ ∈ K heißen Skalare. 1 bezeichnet das Einselement des Körpers, und ~0 das neutrale Element der Vektoraddition. • Die Operationen ⊕ : V × V → V und : K × V → V heißen Vektoraddition bzw. skalare Multiplikation. Da eigentlich keine Verwechslungen auftreten können, benutzen wir meistens die einfachen Symbole + und · statt ⊕ und , sowie 0 anstelle von ~0. • Die ersten vier Bedingungen besagen, dass (V, ⊕) eine Abel’sche Gruppe ist, d.h., die Bedingungen (A1)–(A4) der Körperaxiome erfüllt. 59 Beispiel 5.4. Sei K ein Körper (typischerweise K = R oder K = C). Dann gilt: • Jeder Körper K ist ein Vektorraum über sich selbst. In diesem Fall sind ⊕ und identisch mit den Körperoperationen + und ·. • Die Mengen Kn mit n ∈ N und den komponentenweisen Operationen ⊕ : Kn × Kn → Kn , : K × Kn → Kn , (v1 , . . . , vn ) ⊕ (w1 , . . . , wn ) := (v1 + w1 , . . . , vn + wn ), λ (v1 , . . . , vn ) := (λv1 , . . . , λvn ) bilden K-Vektorräume. Häufig verwendet werden vor allem Rn bzw. Cn . • Die Menge Πn := {p : K → K, x 7→ a0 +a1 x+. . .+an xn , ak ∈ K} aller Polynomfunktionen vom Grad ≤ k mit Koeffizienten in K ist mit den punktweisen Operationen (pn ⊕ qn )(x) := pn (x) + qn (x) sowie (λ pn )(x) := λ · pn (x) ein K-Vektorraum. Ebenso ist die Menge Π := {p ∈ Πn : n ∈ N} aller Polynome beliebigen Grades ein Vektorraum über K. Der Nachweis, dass es sich bei den Beispielen tatsächlich um Vektorräume handelt, lässt sich auf Rechnen im Körper K zurückführen, und wird zum Teil in der Übung erbracht. Wir werden später im Rahmen der Vorlesung auch noch weitere Vektorräume (von Funktionen und Folgen) kennenlernen. Normen: Messen von Längen und Abständen Wir betrachten vorerst den p Vektorraum V = R. Der Abstand zwischen zwei Zahlen x, y ∈ R ist gegeben durch |x − y| = (x − y)2 , also durch den Betrag der Zahl x − y. Ganz ähnlich definieren wir auf dem Vektorraum V = R2 den Euklid’schen Abstand p kv − wk2 := (v1 − w1 )2 + (v2 − w2 )2 , welcher gerade der Länge (Euklid’schen Norm) des Vektors v − w in der Ebene entspricht. Um Längen in allgemeinen Vektorräumen zu messen, benutzen wir die folgende Konstruktion. Definition 5.5. Sei V ein Vektorraum über dem Körper K (hier R oder C). Eine Abbildung k · k : V → R, v 7→ kvk, welche für alle v, w ∈ V und λ ∈ K die Bedingungen kvk ≥ 0 und kvk = 0 ⇔ v = ~0 kλ · vk = |λ| kvk kv + wk ≤ kvk + kwk definit homogen Dreiecksungleichung erfüllt, heißt eine Norm auf V , und (V, k · k) heißt normierter Raum. 60 Vektorrechnung Bemerkung 5.6. Wie im R2 definieren wir in jedem normierten Raum (V, k · k) den Abstand zwischen zwei Vektoren (Punkten) v, w ∈ V durch kv − wk. Beispiel 5.7. Man zeige, dass die Abbildungen kvk1 := kvk2 := n X |vk |, k=1 n X 2 |vk | 1/2 , k=1 kvk∞ := sup{|vk | : 1 ≤ k ≤ n} = max{|vk | : 1 ≤ k ≤ n} Normen auf dem Vektorraum Rn (bzw Cn ) definieren. Diese heißen Betragssummennorm, Euklid’sche Norm und Maximums- bzw. Supremumsnorm. Lösung: Wir betrachten nur die k · k1 Norm. (i) Da |x| ≥ 0 für jede reelle Zahl x ∈ R folgt kvk1 ≥ 0. Andererseits ist eine Summe nichtnegativer Zahlen nur dann gleich null, wenn jeder Summand null ist. Dies zeigt die Definitheit. (ii) Nach den bekannten Rechenregeln gilt kλ · vk1 Def: λ·v = k(λv1 , . . . , λvn )k1 Def: Norm = n X |λvk | k=1 Betrag = n X |λ||vk | distributiv = k=1 |λ| n X |vk | Def: Norm = |λ| kvk1 . k=1 (iii) Die Dreiecksungleichung folgt wiederum aus den Eigenschaften des Betrags für reelle Zahlen, also kv + wk1 = k(v1 + w1 , . . . , vn + wn )k1 = n X |vk + wk | k=1 ≤ n X k=1 (|vk | + |wk |) = n X k=1 |vk | + n X |wk | = kvk1 + kwk1 . k=1 Der Nachweis der Normeigenschaften für k · k2 und k · k∞ geht ählich (siehe Übung). Zum Nachweis der Dreiecksungleichung für die Euklid’sche Norm verwenden wir später die CauchySchwarz Ungleichung. Beispiel 5.8. Man bestimme die Länge des Vektors v = 12 bezüglich der Normen kvkm für m = 1, 2, ∞. P Lösung: (i) Es gilt kvk1 = 2k=1 |vk | = |1| + |2| = 3.p √ P (ii) Für m = 2 erhält man kvk2 = ( 2k=1 |vk |2 )1/2 = |1|2 + |2|2 = 5. (iii) Die Maximumsnorm beträgt kvk∞ = max{|vk | : 1 ≤ k ≤ 2} = max{|1|, |2|} = 2. Ein Vektor kann also verschiedene ”Längen“ besitzen, je nachdem in welcher Norm er gemessen 61 wird. Mengen Mk := {v ∈ R2 : kvkk ≤ 1} für k = 1, 2, ∞. Beispiel 5.9. • Sei K = R (oder K = C). Dann definiert der Betrag | · | eine Norm auf K. Die Normeigenschaften folgen sofort aus denen des Betrags. • Für a, b ∈ R mit a < b sei Π(a, b) := {p : (a, b) → R, p ∈ Πn für ein n ∈ N} der Raum aller reellwertigen Polynomfunktionen auf dem Intervall (a, b). Für p ∈ Π(a, b) definieren wir die Supremumsnorm kpk∞ := sup{|p(x)| : x ∈ (a, b)}. Anhand des Beispiels a = 0, b = 1, p(x) = x sieht man, dass das Supremum nicht notwendigerweise angenommen wird, also nicht durch das Maximum ersetzt werden kann! Die Normeigenschaften zeigt man ähnlich wie für die Normen auf Rn ; siehe Übung. Skalarprodukte und Winkel zwischen Vektoren Neben dem Abstand kann auch der Winkel zwischen zwei Vektoren gemessen werden. Wir erinnern an die elementare Formel hv, wi2 := v1 w1 + v2 w2 = kvk2 kwk2 cos φ, v, w ∈ R2 . Hierbei ist φ der von v und w eingeschlossene Winkel ist (siehe Skizze). Winkel zwischen zwei Vektoren in R2 . 62 Vektorrechnung Wir fassen die wesentlichen Eigenschaften des Skalarproduktes h·, ·i zusammen. Wiederum lässt sich diese Konstruktion auf Rn und allgemeine Vektorräume verallgemeinern. Definition 5.10. Sei V ein R-Vektorraum. Eine Abbildung h·, ·i : V × V → R mit folgenden Eigenschaften für alle v, w ∈ V und alle λ ∈ R hv, vi ≥ 0 und hv, vi = 0 ⇔ v = ~0 hv, wi = hw, vi hλ · u + v, wi = λhu, wi + hv, wi positiv definit symmetrisch linear heißt Skalarprodukt (inneres Produkt) auf V , und (V, h·, ·i) heißt Innenproduktraum. Bemerkung 5.11. • Unter Ausnutzung der Kommutativität (Symmetrie) folgt sofort, dass auch hu, λ · v + wi = λhu, vi + hu, wi für alle u, v, w ∈ V und λ ∈ R gilt: Das Skalarprodukt ist als Abbildung von V × V → R bilinear, d.h., jeweils linear bezüglich des ersten und des zweiten Argumentes. • Ein Skalarprodukt h·, ·i : V × V → C auf einem komplexen Vektorraum V muss anstelle der Kommutativität die folgende leicht veränderte Eigenschaft erfüllen: hv, wi = hw, vi hermitesch hieraus folgt, dass hv, vi ∈ R ist (und ≥ 0 überhaupt Sinn macht). Die Folgerung aus der Linearität liest sich dann hu, λ · v + wi = λhu, vi + hu, wi semilinear Das (komplexe) Skalarprodukt ist also linear bzgl. des ersten, und semilinear (1/2) bzgl. des zweiten Arguments; in Summe also sesquilinear (1 12 -fach linear). Beispiel 5.12. • Auf Rn definiert die Vorschrift hv, wi2 := n X vk wk k=1 das sogenannte Euklid’sche Skalarprodukt. Für n = 2 erhalten wir den bekannten Fall. • Sei w ∈ Rn mit wk > 0 für k = 1, . . . , n. Dann ist hu, viw := n X wk uk vk k=1 ein gewichtetes Euklid’sches Skalarpodukt auf Cn . 63 • Für reellwertige Polynomfunktionen in Πn (a, b) vom Grad ≤ n auf dem Intervall (a, b) lässt sich ein Skalarpodukt definieren durch Z b hp, qi2 := p(x)q(x)dx. a Bevor wir die vom R2 bekannte Winkelmessung auf allgemeinen Vektorräumen definieren, zitieren wir noch einige wesentliche Eingeschaften, welche ein jedes Skalarpodukt besitzt. Satz 5.13 (Cauchy-Schwarz Ungleichung). Sei h·, ·i ein Skalarprodukt auf dem reellen Vektorraum V . Dann gilt für alle v, w ∈ V p p |hv, wi| ≤ hv, vi hw, wi. (Die Aussage gilt mit ähnlichem Beweis auch auf komplexen Vektorräumen). Beweis. Für den Fall w = 0 steht auf beiden Seiten 0, und die Ungleichung ist gezeigt. Wir dürfen daher im folgenden annehmen, dass w 6= 0, und daher kwk2 = hw, wi > 0 aufgrund der Definitheit. Für jedes t ∈ R gilt dann definit 0 ≤ hv + t · w, v + t · wi symmetrisch = bilinear = hv, vi + thv, wi + thw, vi + t2 hw, wi hv, vi + 2thv, wi + t2 hw, wi = (∗). Wir wählen nun t := −hv, wi/hw, wi, was erlaubt ist, da hw, wi = 6 0. Daraus folgt 0 ≤ (∗) = hv, vi − 2hv, wi2 /hw, wi + hv, wi2 /hw, wi = hv, vi − hv, wi2 /hw, wi. Wir bringen den negativen Term auf die linke Seite und multiplizieren mit hw, wi > 0. Das führt auf hv, wi2 ≤ hv, vihw, wi, und die Behauptung folgt durch Ziehen der Wurzel auf beiden Seiten (vgl. Satz 2.25). Bemerkung 5.14. Auf einem reellen Vektorraum ist das Skalarprodukt reellwertig, und der Betrag auf der linken Seite der Ungleichung kann weggelassen werden. Definiert man kvk := p hv, vi, so lässt sich die Cauchy-Schwarz Ungleichung schreiben als hv, wi ≤ kvkkwk. Wie der folgende Satz belegt, ist k · k tatsächlich wieder eine Norm auf V . Beispiel 5.15. Man überprüfe die Cauchy-Schwarz’sche Ungleichung des anhand −1 Euklid’schen 1 1 Skalarproduktes und aller Kombinationen von u = 2 , v = 1 , w = 1 , also hu, ui2 , hu, vi2 , . . . 64 Vektorrechnung Satz 5.16. Sei V ein R-Vektorraum mit Skalarpodukt h·, ·i. Dann definiert die Vorschrift p kvk := hv, vi eine Norm auf V . Wir nennen k · k die natürliche oder induzierte Norm. (Wiederum lässt sich die Aussage auch auf komplexe Vektorräume übertragen). Beweis. Der Nachweis, dass k · k definit und homogen ist, erfolgt in der Übung. Die Dreiecksungleichung folgt aus der Cauchy-Schwarz Ungleichung kv + wk2 Definition = hv + w, v + wi Cauchy-Schwarz ≤ bilinear = hv, vi + 2hv, wi + hw, wi kvk2 + 2kvkkwk + kwk2 binom. Formel = (kvk + kwk)2 . Die Behauptung folgt durch Ziehen der Wurzel auf beiden Seiten (vgl. Satz 2.25). Die Winkelmessung erfolgt nun auf beliebigen Innenprodukträumen mit der aus dem R2 bekannten Formel. Definition 5.17. Sei V ein reeller Vektorraum mit Skalarpodukt h·, ·i und induzierter Norm k · k. Für 0 6= v, w ∈ V nennen wir φ ∈ [0, π) definiert durch hv, wi = kvkkwk cos φ den Winkel zwischen v und w. Gilt hv, wi = 0 (d.h. φ = π/2), so heißen v und w orthogonal; wir schreiben dafür v ⊥ w. Bemerkung 5.18. Für R2 mit dem Euklid’schen Skalarprodukt stimmt diese Definition genau mit der bekannten Formel überein, und φ ist genau der Winkel zwischen den Vektoren. Beispiel 5.19. Wir statten den Vektorraum R2 mit dem Euklid’schen Skalarprodukt aus. 1 1 1 (a) Man berechne die Winkel zwischen allen Kombinationen von u = 1 , v = 2 , w = −1 . 1 2 (b) Wie muss a ∈ R gewählt werden, sodass v = 2 und w = a orthogonal zueinander stehen? Man fertige zu den Beispielen jeweils auch Skizzen an. Unterräume In unserer Vorstellung ist der Vektorraum R2 (die Zahlenbebene) bereits im Vektorraum R3 (Zahlenraum) enthalten. Dies motiviert den folgenden Begriff. Definition 5.20. Sei V ein Vektorraum über dem Körper K, und W ⊂ V eine Teilmenge. Ist W wieder ein Vektorraum über K, so heißt W Unterraum (Teilraum) von V . Satz 5.21. ∅ = 6 W ⊂ V ist ein Unterraum von V , genau dann wenn ∀v, w ∈ W, λ ∈ K : v+w ∈W und λ · v ∈ W. 65 Bemerkung 5.22. • Die Rechenregeln für Vektoraddition und skalare Multiplikation gelten für alle Elemente in V und somit auch in W ; diese brauchen also nicht mehr überprüft werden. Somit genügt es zu zeigen, dass man durch die Operationen nicht aus dem Unterraum ”hinausfällt“. • Multipliziert man mit λ = 0 so erhält man sofort auch die notwendige Bedingung ~0 ∈ W . Ein (Unter-)Vektorraum muss also immer auch den Null-Vektor enthalten! Zur Veranschaulichung einige gebräuchliche Beispiele für Unterräume. Beispiel 5.23. • Jeder Vektorraum ist ein Unterraum von sich selbst. Ebenso ist für jeden Vektorraum V der triviale Raum {~0} ein Unterraum. • Sei V = R2 . Dann ist die Gerade W = {(x1 , x2 ) : x1 + x2 = 0} durch den Nullpunkt ein Unterraum von V . Man stelle diesen Unterraum auch graphisch dar. • Sei V = R3 . Dann ist die Menge der Punkte auf der Zahlenebene W := {(x, y, 0) : (x, y) ∈ R2 } ein Unterraum von R3 . In diesem Sinne ist R2 in R3 enthalten. Unterräume des R2 . • Die Menge W := {(x1 , . . . , xn ) ∈ Rn : x1 + x2 + . . . + xn = 0} ist ein Unterraum von Rn . • Sei V = Πn der Vektorraum der Polynome vom Grad ≤ n. Dann ist Πm für m ≤ n ein Unterraum von V . • Die Menge Πn (a, b) von beschränkten Polynomen vom Grad ≤ n auf dem Intervall (a, b) ist ein Unterraum des Vektorraums B((a, b)) von beschränkten, reellwertigen Funktionen auf (a, b). Zur Abgrenzung seien auch noch einige Gegenbeispiele genannt. Beispiel 5.24. Man veranschauliche sich und begründe folgende Sachverhalte: • Obwohl die leere Menge eine Teilmenge jeder anderen Menge ist, ist {} kein Vektorraum, und somit kein Unterraum von irgendeinem Vektorraum V ! 66 Vektorrechnung • Die Mengen W1 = {(x, 1) : x ∈ R} und W2 := {(x1 , x2 ) ∈ R2 : x1 + x2 = 1} sind keine Unterräume von R2 . • Die Menge W = {v ∈ Rn : kvk2 ≤ 1} ist kein Unterraum von Rn . Das folgende Resultat stellt einen Zusammenhang zu linearen Gleichungssystemen her. Satz 5.25. Sei A die Koeffizientenmatrix eines (reellen) Gleichungssystems mit m Gleichungen und n Unbekannten. Dann ist die Lösungsmenge L des homogenen GLSs (A|0) ein Unterraum des Vektorraumes Rn . Beweis. Wird später mit Matrixnotation in der Übung erbracht. Affine Teilräume Aus obigem Satz (und einem vorhergehenden Beispiel) folgt, dass die Menge W0 := {(x1 , x2 ) ∈ R2 : x1 + x2 = 0} = {(t, −t) : t ∈ R}, welche eine Gerade durch den Nullpunkt beschreibt, ein Unterraum von R2 ist. Die Menge W1 := {(x1 , x2 ) ∈ R2 : x1 + x2 = 1} = {(t, 1 − t) : t ∈ R}, welche auch eine Gerade beschreibt (die nicht durch den Nullpunkt geht), ist jedoch kein Unterraum von R2 (warum?). Jedes Element w1 ∈ W1 lässt sich allerdings schreiben als t 0 t 0 w1 = = + = + w0 mit w0 ∈ W0 . 1−t 1 −t 1 Das motiviert den folgenden Begriff. Definition 5.26. Sei W0 ⊂ V ein Unterraum von V . Für gegebenes v ∈ V heißt die Menge v + W0 := {v + w : w ∈ W0 } ein affiner Teilraum von V . Bemerkung 5.27. • Jeder Unterraum von V ist zugleich auch affiner Teilraum von V (mit v = 0). • Für alle v1 , v2 ∈ v + W0 gilt v1 − v2 ∈ W0 . • Für jedes w ∈ W0 gilt v + W0 = (v + w) + W0 , d.h., die Darstellung eines affinen Teilraums (die Wahl des Elementes v) ist nicht eindeutig. • Die Menge {(x, y) ∈ R2 : y = x + x2 } = Graph(f ) mit f : R → R, x 7→ x + x2 , ist kein (affiner) Teilraum von R2 . 67 Affine Teilräume des R2 . Beispiel 5.28. • Jede Gerade in R2 is affiner Teilraum von R2 . Eine Gerade ist Unterraum, genau dann wenn sie durch den Ursprung verläuft. • Punkte, Geraden und Ebenen in R3 sind affine Teilräume des R3 . • Die Menge aller reellen Polynome p mit p(0) = 1 ist ein affiner Teilraum des Vektorraums Π aller reellen Polynome. Den Zusammenhang mit allgemeinen linearen GLSen liefert das folgende Resultat: Satz 5.29. Sei (A|y) das Koeffizientenschema eines linearen GLSs mit m Gleichungen und n Unbekannten. Dann ist die Lösungsmenge Ly ein affiner Teilraum von Rn . Ist xy eine spezielle Lösung des inhomogenen Gleichungssystems (A|y), dann gilt Ly = xy + L0 , L0 Lösungsmenge des homogenen Systems (A|0). Beweis. Wird später mit Hilfe von Matrixnotation in der Übung erbracht. Lineare Unabhängigkeit, Basis und Dimension eines Vektorraums Im R2 lässt sich jeder Vektor x y auch darstellen als x 1 0 =x· +y· . y 0 1 Wir erkennen in x und y gerade die Koordinaten des Punktes xy im Cartesischen Koordinaten system. Man benötigt gerade zwei Vektoren, z.B. 10 und 01 um jeden Vektor in R2 darstellen zu können, und wir nennen deshalt R2 einen zweidimensionalen Vektorraum. Im folgenden wollen wir diese Art der Darstellung und den Begriff der Dimension auf allgemeine Vektorräume erweitern. 68 Vektorrechnung Definition 5.30. Sei V ein K-Vektorraum, und M ⊂ V eine Teilmenge von V . Wir nennen Span(M ) := {v ∈ V : v = n X λk · w k , wk ∈ M, λk ∈ K, n ∈ N} k=1 die lineare Hülle (Spann, Aufspann) von M . Ein Ausdruck der Form heißt Linearkombination der Vektoren wk . Pn k=1 λk · wk mit λk ∈ K Satz 5.31. Span(M ) ist ein Unterraum von V . Beweis. Aus der Definition folgt sofort, dass mit v und w ∈ Span(M ) auch v + w und λ · v in Span(M ) liegen. Beispiel 5.32. • Sei M ⊂ V ein Unterraum von V . Dann gilt Span(M ) = M . Durch Vektoroperationen landet man immer wieder im Unterraum. • Sei M = { 10 }. Dann ist 1 Span(M ) = {v ∈ R : v = λ · , λ ∈ R} = {(λ, 0) : λ ∈ R}. 0 2 • Sei M = {(1/n, 0) : n ∈ N}. Dann ist Span(M ) = {(λ, 0) : λ ∈ R}. • Sei M1 = { 10 , 01 } und M2 = { 10 , 01 , 11 }. Dann ist Span(M1 ) = Span(M2 ) = R2 . In letztem Beispiel sieht man, dass der Vektor 11 nicht zur Vergößerung des Aufspanns beiträgt. 1 Das ist auch kein Wunder, da er ja selbst als Linearkombination der beiden Vektoren und 0 0 dargestellt werden kann, also 1 1 1 0 =1· +1· 1 0 1 bzw. 1 0 1 0 1· +1· −1· = . 0 1 1 0 Definition 5.33. Sei V ein Vektorraum über einem Körper K. • Eine nichtleere Menge M ⊂ V von Vektoren heißt linear unabhängig, falls für jedes n ∈ N und jede Wahl unterschiedlicher Vektoren vk ∈ M , 1 ≤ k ≤ n gilt: n X λk · vk = ~0 ⇒ λk = 0 für alle k = 1, . . . , n. k=1 • Eine Teilmenge M ⊂ V mit Span(M ) = V heißt Erzeugendensystem (EZS). • Ein linear unabhängiges Erzeugendensystem B ⊂ V heißt Basis von V . 69 Überprüfung auf lineare Unabhängigkeit m Wir wollen kurz erläutern, wie man Teilmengen Pm M = {vk ∈ V : 1 ≤ k ≤ n} ⊂ R auf lineare Unabhängigkeit überprüft. Die Bedingung k=1 λk · vk = ~0 bedeutet, dass v1,1 vn,1 0 v1,2 vn,2 0 λ1 · .. + . . . + λn · .. = .. . . . . v1,m vn,m 0 Hierbei ist vk,j die jte Komponente des Vektors vk . Die angegebene Bedingung ist äquivalent zum homogenen linearen Gleichungssystem v1,1 λ1 v1,2 λ1 .. . + v2,1 λ2 + v2,2 λ2 .. . + . . . + vn,1 λn + . . . + vn,2 λn .. ... . = 0 = 0 .. . v1,m λ1 + v2,m λ2 + . . . + vn,m λn = 0. Das zugehörige Koeffizientenschema lautet (A|0) wobei die Koeffizientenmatrix A = (v1 , v2 , . . . , vn ) durch Aneinanderreihen der Spaltenvektoren vk entsteht, also v1,1 v2,1 . . . vn,1 v1,2 v2,2 . . . vn,2 A = .. .. .. . . . ... . v1,m v2,m . . . vn,m Lineare Unabhängigkeit liegt vor, wenn das homogene GLS nur 0 als Lösung besitzt. Dies können wir mit Hilfe der Gauß’schen Elimination überprüfen. Mit den Ergebnisse zur Lösung linearer Gleichungssysteme erhalten wir die folgenden Resultate: Satz 5.34. (a) Jedes Erzeugendensystem des Rm besitzt mindestens m Elemente. (b) Eine Menge {vk : 1 ≤ k ≤ n} ⊂ Rm mit n > m Elementen ist stets linear abhängig. (c) Eine Basis des Rm besitzt genau m Elemente. Beweis. (a) Mit Widerspruch: Wir nehmen zunächst an, dass M = {vk : 1 ≤ k ≤ n} ein Erzeugendensystem mitPn < m Elementen ist, d.h, es lässt sich jeder Vektor v ∈ Rm als Linearkombination v = nk=1 λk vk schreiben. Die ist nach obigen Überlegungen äquivalent zur Aussage, dass das Gleichungssystem (A|v) mit m Gleichungen und n < m Unbekannten für alle rechten Seiten v lösbar ist. Mit dem Gauß’schen Eliminationsverfahren lässt sich das GLS 70 Vektorrechnung auf Zeilenstufenform bringen. Die zugehörige Koeffizientenmatrix besitzt mindestens m − n ≥ 1 Nullzeilen. Für m = 4, n = 3 hat das System etwas folgende Gestalt U11 U12 U13 w1 0 U22 U23 w2 0 0 U33 w3 0 0 0 w4 Für rechte Seite w1 = w2 = w3 = 0 und w4 = 1 hat das System keine Lösung. Wir machen alle Zeilenumformungen (A ↔ U ) wieder rückgängig, und erhalten das äquivalente urprüngliche System (A|v). Für dieses existiert (da äquivalent zu (U |w)) keine Lösung; also ist M kein Erzeugendensystem. Somit gibt es kein Erzeugendensystem des Rm mit weniger als m Elementen. (b) Zeigt man ähnlich wie (a); siehe Übung. (c) Eine Basis B ⊂ Rm ist ein linear unabhängiges Erzeugendensystem. Es bezeichne |B| die Anzahl der Elemente von B. Aus (a) folgt |B| ≥ m, und aus (b) folgt |B| ≤ m, und somit die Behauptung. Beispiel 5.35. Man überprüfe die Menge M = {(1, 2, 3), (1, 1, 1), (1, 2, 2)} ⊂ Rd auf lineare Unabhängigkeit. Lösung: Die Menge M ist lin. unabhängig, genau dann, wenn das GLS (A|0), wobei die Spalten von A gerade die Vektoren in M sind, nur die triviale Lösung 0 besitzt. Mit dem Gauß-Verfahren erhalten wir 1 1 1 0 1 1 1 0 1 1 1 0 2 1 2 0 ⇔ 0 −1 0 0 ⇔ 0 −1 0 0 . 3 1 2 0 0 −2 −1 0 0 0 −1 0 Das äquivalente Zeilenstufensystem (und somit auch (A|0)) besitzt also nur die triviale Lösung (0, 0, 0). Beispiel 5.36. Ist die Menge M = {(1, 2), (2, 1), (1, 1)} ein Erzeugendensystem? Lösung: Die Frage ob sich jeder Vektor yy12 als Linearkombination y1 1 2 1 = λ1 + λ2 + λ3 , λk ∈ R y2 2 1 1 darstellen lässt, ist äquivalent zur Frage, ob das GLS (A|y) für alle rechten Seiten y lösbar ist, wobei die Spalten von A die Vektoren in M sind. Der Gauß-Algorithmus liefert 1 2 1 y1 1 2 1 y1 ⇔ , 2 1 1 y2 0 −3 −1 y2 − 2y1 und durch Rückwärtseinsetzen erhält man die Lösungsmenge L(y1 , y2 ) = {(λ1 , λ2 , λ3 ) ∈ R3 : 3x2 = 2y1 − y2 − x3 ∧ x1 = y1 − 2x2 − x3 } = {(y1 − 2(2y1 − y2 − t)/3 − t, (2y1 − y2 − t)/3, t) : t ∈ R}. Somit ist gezeigt, das M ein EZS für R2 ist. 71 Beispiel 5.37. Man zeige, dass sich die Menge M aus dem vorhergehenden Beispiel durch Streichen einer der Vektoren zu einer Basis umwandeln lässt. Beispiel 5.38. Die Spalten der Matrix aus Beispiel 4.13 bilden kein Erzeugendensystem! Die Menge bestehend aus dem zweiten, vierten, fünften und siebenten Spaltenvektor ist linear unabhängig. Bemerkung 5.39. • Die Vektoren e1 = (1, 0, 0, 0 . . . , 0), e2 = (0, 1, 0, 0 . . . , 0), e3 = (0, 0, 1, 0, . . . , 0), ... die Einheitsvektoren des Rn . Die Menge {ek : 1 ≤ k ≤ n} ⊂ Rn ist linear unabhängig und heißt kanonische Basis oder Einheitsbasis des Rn . • Die Mengen B1 = { 10 , 01 } und B2 = { 10 , 11 } bilden jeweils Basen von R2 . Ein Vektorraum kann also viele verschiedene Basen besitzen. • Die Menge {0} ist linear abhängig, und {v, w} ⊂ Rn ist linear abhängig, genau dann wenn v = λw für ein w ∈ R; sonst linear unabhängig. • Die Polynomfunktionen pk (x) := xk bilden eine Basis der Raums der Polynome, genauer: Mn := {xk : 0 ≤ k ≤ n} ist eine Basis von Πn , und die Menge M := {xk : k ∈ N0 } bildet eine Basis des Raums Π aller (reellen) Polynome. Den Nachweis der linearen Unabhängigkeit wird später in der Übung erbracht. Ohne einen Beweis zu geben, fassen wir noch einige Aussagen über Basen zusammen. Bemerkung 5.40. • Jeder Vektorraum besitzt eine Basis. • Jede lineare unabhängige Teilmenge M ⊂ V kann zu einer Basis ergänzt werden, und jede Basis besitzt gleich viele (evtl unendlich viele∗ ) Elemente; vergleiche hiermit auch die Aussagen über Basen des Rn weiter unten. Definition 5.41. Sei V eine Vektorraum mit Basis B. Die Anzahl der Elemente in B heißt Dimension von V , kurz Dim(V ). Ist Dim(V ) ∈ N0 , dann heißt V endlich dimensional, sonst unendlich dimensional. Bemerkung 5.42. Anstelle von Dim(V ) ∈ N0 schreiben wir auch Dim(N ) < ∞. Das Symbol ∞ steht hierbei für ”Unendlich“. Man beachte: ∞ ist weder natürlich noch reelle Zahl. Dim(V ) = ∞ meint hier, dass Dim(V ) > n für alle n ∈ N0 gilt. Beispiel 5.43. Durch Angabe einer Basis sieht man: • Dim(Rn ) = n, insbesondere Dim(R2 ) = 2 72 Vektorrechnung • Dim(Πn ) = n + 1 und Dim(Π) = ∞. Der Raum aller Polynome ist unendlich dimensional! Zur Veranschaulichung der Begriffe lineare Unabhängigkeit, Basis, Erzeugendensystem sowie deren Überprüfung seien folgende Beispiele angeführt. Beispiel 5.44. Ist die Menge M = {(1, 1, 0), (1, 0, 1), (0, 1, 1), (1, 1, 1)} (a) lineare unabhängig; (b) ein Erzeugendensystem; (c) eine Basis? Gegebenenfalls überführe man die Menge M durch Streichen oder Hinzufügen zusätzlicher Vektoren in eine Basis. Lösung: (a) M ist eine Teilmenge von R3 mit 4 Elementen, und kann daher nicht unabhängig P4 sein. Aus den Überlegungen zu Teil (b) sieht man ebenso, dass es Linearkombinationen k=1 λk vk = 0 mit (λ1 , . . . , λ4 ) 6≡ 0 gibt, also keine lineare Unabhängigkeit vorliegt. 3 (b) P4 Ein EZS liegt vor, wenn jeder Vektor (x, y, z) ∈ R als Linearkombination (x, y, z) = k=1 λk vk von Vektoren aus M dargestellt werden kann. Dies ist äquivalent zum GLS x x 1 1 0 1 1 1 0 1 1 1 0 1 x 1 0 1 1 y ↔ 0 −1 1 0 y − x ↔ 0 −1 1 0 y − x . 0 1 1 1 z 0 1 1 1 z 0 0 2 1 z+y−x Wir ersetzen λ3 durch t, und erhalten durch Rückwärtseinsetzen die Lösungsmenge L = {(x − z + t, x − y + t, t, z + y − x − 2t) : t ∈ R} = (x − z, x − y, 0, z + y − x) + {t · (1, 1, 1, −2) : t ∈ R}. Das zeigt, dass sich jeder Vektor als Linearkombination darstellen lässt, es liegt also ein EZS vor. Für die Wahl x = y = z = 0 sieht man, dass der Vektor 0 durch nicht-triviale Linearkombinationen dargestellt werden kann, also keine lineare Unahängigkeit vorliegt. (c) Es handelt sich um keine Basis, da nicht linear unabhängig. (d) Streicht man in obigem GLS die letzte oder vorletzte Spalte, so erhält man die Systeme 1 1 0 x x 1 1 1 0 −1 1 0 −1 0 y−x y−x bzw 0 0 1 z+y−x 0 0 2 z+y−x welche jeweils eindeutige Lösungen besitzten. Somit sind M1 = {(1, 1, 0), (1, 0, 1), (0, 1, 1)} und M2 = {(1, 1, 0), (1, 0, 1), (1, 1, 1)} jeweils Basen des R3 . Beispiel 5.45. (a) Man Überprüfe die Menge M = {(1, 1, 0), (1, 0, 1), (0, 1, −1)} auf lineare Unabhängigkeit. (b) Man berechne die lineare Hülle (das Erzeugnis) von M , und bestimme dessen Dimension. (c) Man überführe M durch Streichen und Hinzufügen von Vektoren zu einer Basis. P Lösung: Die Frage, ob 3k=1 λk vk = 0 =⇒ λ1 = λ2 = λ3 = 0 is äquivalent zum GLS 1 1 0 0 1 1 0 0 1 1 0 0 1 0 1 0 ↔ 0 −1 1 0 ↔ 0 −1 1 0 0 1 −1 0 0 1 −1 0 0 0 0 0 73 (a) Die Lösungsmenge ist L = {(−t, t, t) : t ∈ R}. Es existieren also nicht-triviale Lösungen des homogenen Systems, d.h., nicht-triviale Linearkombinationen die 0 ergeben. Also ist die Menge M nicht linear unabhängig. (b) Bringt man die dritte Spalte des GLS auf die rechte Seite, erhält man 1 1 0 1 1 0 1 1 0 1 0 −1 ↔ 0 −1 −1 ↔ 0 −1 −1 0 1 1 0 1 1. 0 0 0 Dies zeigt, dass sich der dritte Vektor durch die ersten beiden darstellen lässt, also v3 = −v1 +v2 . Somit lässt sich die lineare Hülle von M schreiben als Span(M ) = Span{(1, 1, 0), (1, 0, 1)} =: S. Die verbleibenden Vektoren sind linear unabhängig (nach Definition der linearen Hülle) ein Erzeugendensystem für S, also eine Basis. Damit ist die Dimension von S gleich 2. (c) Mit derselben Rechnung wie oben sieht man, dass M̃ := {(1, 1, 0), (1, 0, 1), (0, 1, a)} für alle a 6= −1 eine Basis des R3 darstellt. Zur Überprüfung der linearen Unabhängigkeit sowie zur Darstellung des Aufspanns kann man alternativ auch wie folgt vorgehen. Beispiel 5.46. Wir ordnen die Vektoren in M als Zeilen einer Matrix diese auf Zeilenstufenform. 1 1 0 1 1 0 1 1 0 1 1 0 1 0 −1 1 0 −1 1 0 0 1 1 ↔ 0 1 1 ↔ 0 0 2 ↔ 0 1 1 1 0 0 1 0 0 1 0 A an,und überführen 1 −1 0 0 0 1 2 0 Die ersten drei Vektoren (Achtung: wir haben die Reihenfolge der Zeilen / Vektoren hier nicht vertauscht!) sind linear unabhängig. Der Vierte Vektor lässt sich als Linearkombination der ersten drei darstellen. Weiters gilt S := Span(M ) = Span{(1, 1, 0), (0, −1, 1), (0, 0, 2)} = R3 . Die Dimension des Spans ist 3, und es liegt ein EZS vor. Die Basis des Spans ist aus obiger Darstellung bereits ersichtlich. 74 Vektorrechnung 6 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen Zur kompakten Darstellung von linearen Gleichungssystemen haben wir Koeffizientenmatrizen der Form a11 a12 . . . a1n a21 a22 . . . a2n A := .. .. .. . . ... . am1 am2 . . . amn mit Einträgen aij ∈ R (oder C) verwendet. Ein rechteckiges Zahlenschema A dieser Form heißt Matrix. Die Menge aller reellen (komplexen) Matrizen mit m Zeilen und n Spalten bezeichnen wir mit Rm×n (bzw. Cm×n ). Zwei Matrizen sind genau dann gleich, wenn alle ihre Einträge übereinstimmen. Für eine Matrix A ∈ Rm×n (oder Cm×n ) definieren wir die Symbole Ai,· := ai1 ai2 . . . ain i-te Zeile, a1j .. A·,j := . j-te Spalte, amj Aij := aij (i, j)-ter Eintrag. In Matlab Schreibweise entspricht dies A(i,:), A(:,j) und A(i,j). Zur bequemeren Darstellung geben wir oftmals nur die Elemente der Matrix an, wir schreiben also A = [Aij ] = [aij ]. Bemerkung 6.1. Die Matrizen x1 x2 . . . xn ∈ R1×n und y1 .. n×1 .∈R yn heißen naheliegenderweise Zeilen- bzw. Spaltenvektor. Wir werden später Vektoren im Rn meistens mit Spaltenvektoren im Rn×1 identifizieren. 76 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen Für zwei Matrizen A, B ∈ Rm×n (oder Cm×n ) und λ ∈ R (oder C) definieren wir A + B := [aij + bij ] λ · A := [λ · aij ]. sowie Satz 6.2. Die Mengen Rm×n (bzw. Cm×n ) sind reelle (komplexe) Vektorräume. Beweis. Folgt elementar aus der Definition der Matrixaddition und der Multiplikation mit Skalaren; siehe Übung. Bemerkung 6.3. Im Folgenden seien noch einige Matrizen spezieller Form angeführt: • Eine Matrix A ∈ Rn×n mit gleich vielen Zeilen wie Spalten heißt quadratisch. d1 0 0 • D = diag(d1 , d2 , d3 ) := 0 d2 0 ∈ R3×3 heißt Diagonalmatrix mit Diagonal0 0 d3 elementen d1 , d2 , d3 ; In Matlab z.B. diag([1,2,3]). In ähnlicher Weise definiert man natürlich Diagonalmatrizen beliebiger Dimension. E := En := diag(1, 1, . . . , 1) ∈ Rn×n heißt Einheits- oder Identitätsmatrix; in Matlab: E = eye(n). • Matrizen der Form l11 0 0 0 l21 l22 0 0 L= l31 l32 l33 0 l41 l42 l43 l44 u11 u12 u13 U = 0 u22 u23 0 0 u33 bzw. heißen (linke) untere bzw. (rechte) obere Dreiecksmatrix. • Eine Matrix mit Einträgen aij wobei aij = 0 für |i − j| > 1 heißt Tridiagonalmatrix. Matrixmultiplikation Definition 6.4. Für A ∈ Rm×N und B ∈ RN ×n sei C := A · B ∈ Rm×n definiert durch C = [Cij ] mit Cij := XN k=1 Aik · Bkj . Bemerkung 6.5. • Der (i, j)-te Eintrag Cij berechnet sich durch Multiplizieren und Aufsummieren der i-ten Zeile von A und der j-ten Spalte von B. a11 a12 . . . a1N b11 b12 . . . b1n c11 c12 . . . c1n a21 a22 . . . a2N b21 b22 . . . b2n c21 c22 . . . c2n .. .. .. · .. .. .. = .. .. .. . . ... . . . ... . . . ... . am1 am2 . . . amN bN1 bm2 . . . bmN cm1 cm2 . . . cmn 77 • Die Multiplikation ist nur definiert, falls A gleich viele Spalten wie B Zeilen hat! • Man beachte die Anzahl der Zeilen und Spalten des resultierenden Produkts! 1 2 1 0 Beispiel 6.6. Sei A = 1 0 und B = . Dann ist 1 1 −1 1 1 2 3 2 1 0 A · B = 1 0 · = 1 0 , 1 1 −1 1 0 1 aber das Produkt B · A ist nicht definiert! (warum?) Der folgende Algorithmus veranschaulicht die Matrixmultiplikation in Matlab: function C = mult(A,B) % multiplies matrices A and B m=size(A,1); % number of rows in A n=size(B,2); % number of cols in B if size(A,2) ~= size(B,1), error(’dimensions do not match’); end C = zeros(m,n); % allocate memory for i=1:m for j=1:n C(i,j) = A(i,:) * B(:,j); % = sum_k A(i,k) B(k,j) end end Definition 6.7. Für A ∈ Rm×n definieren wir die transponierte Matrix A> ∈ Rn×m durch (A> )ji := Aij für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Die transponierte Matrix entsteht also durch Vertauschen von Zeilen und Spalten. Satz 6.8. Für Matrizen der richtigen Größe gelten die folgenden Rechenregeln: (A · B) · C = A · (B · C), > > > (A · B) = B · A , A · E = E · A = A, A · (B + C) = A · B + A · C (A> )> = A, An = A · An−1 = An−1 · A, A0 := E. Beachte: Im allgemeinen gilt nicht!, dass A · B gleich B · A ist, die Matrixmultiplikation ist also nicht kommutativ!; vgl. Beispiel 6.6. Beweis. Der Beweis wird teilweise in der Übung erbracht. 78 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen Beispiel 6.9. Für die Matrizen aus Beispiel 6.6 gilt z.B. 1 1 1 1 −1 3 1 0 > > B ·A = · = = (A · B)> . 0 1 2 0 1 2 0 1 Beispiel 6.10. Das Euklid’sche Skalarpodukt zweier Vektoren x, y ∈ Rn×1 lässt sich schreiben als hx, yi2 = x> · y. Wir haben hier wieder Vektoren Rn mit den Spaltenvektoren in Rn×1 identifiziert. Bemerkung 6.11. Das Multiplizieren von Matrizen kann auch spalten- bzw. zeilenweise erfolgen. Es gilt A1· · B A · B·1 A · B·2 . . . A · B·n = A · B = ... Am· · B Also: multiplizieren von links mit A wirkt auf die Spalten von B (es werden Zeilenumformungen in B gemacht); multiplizieren von rechts mit B wirkt auf die Zeilen von A (es werden Spaltenumformungen in A gemacht). Definition 6.12. Sei A ∈ Rn×n . Gibt es eine quadratische Matrix M ∈ Rn×n , sodass A·M =M ·A=E (Einheitsmatrix) ist, dann heißt M die inverse Matrix oder kurz Inverse von A, und wir schreiben M = A−1 . Lemma 6.13. Die inverse Matrix ist eindeutig. Beweis. Sei A ∈ Rn×n invertierbar und B, C ∈ Rn×n mit A · B = B · A = A · C = C · A = E. Dann gilt B = B · E = B · (A · C) = (B · A) · C = E · C = C. Also B = C. Bemerkung 6.14. Gibt es für eine nicht quadratische Matrix A ∈ Rm×n eine Matrix ML ∈ Rn×m mit ML · A = En , dann heißt ML Linksinverse zu A. Existiert ein MR ∈ Rn×m mit A · MR = Em , dann heißt MR Rechtsinverse zu A. Lineare Gleichungssysteme als Matrizengleichungen Unter Zuhilfenahme der Matrixmultiplikation lässt sich das lineare Gleichungssystem a11 x1 a21 x1 .. . + a12 x2 + a22 x2 .. . am1 x1 + am2 x2 + . . . + a1n xn = y1 + . . . + a2n xn = y2 .. .. .. . . . + . . . + amn xn = ym 79 mit Koeffizientenschema (A|y) jetzt kurz als Matrixgleichung A·x=y > schreiben. Hierbei ist der (Spaltenvektor) x = x1 x2 . . . xn die gesuchte Größe, und > y = y1 y2 . . . ym die vorgegebene rechte Seite. In Anlehnung an die Begriffe für lineare Gleichungssysteme führen wir nun folgende Begriffe ein. Definition 6.15. Die maximale Anzahl linear unabhängiger Zeilen- bzw. Spaltenvektoren von A heißt Zeilen- bzw. Spaltenrang von A, kurz Z − Rang(A) bzw S − Rang(A). Bemerkung 6.16. • Z −Rang(A) = Dim(Span{A1,· , . . . , Am,· }) und S−Rang(A) = Dim(Span{A·,1 , . . . , A·,n }). • Natürlich folgt sofort dass Z − Rang(A) ≤ m und S − Rang(A) ≤ n. • Die lineare Unabhängigkeit der Spalten bzw. Zeilen lässt sich wiederum mit dem GaußAlgorithmus überprüfen. Satz 6.17. Für jede Matrix A ∈ Rm×n gilt Z − Rang(A) = S − Rang(A) = Rang(A). Beweis. Folgt mit Hilfe des Gauß-Algorithmus und der Tatsache, dass die Lösungsmenge eines Gleichungssystems bei Äquivalenztransformationen nicht verändert wird. Beispiele hierzu in der Übung. Definition 6.18. Eine quadratische Matrix A ∈ Rn×n mit Rang(A) = n heißt regulär. Als Folgerung aus dem Gauß-Algorithmus erhalten wir folgende Bedingung für die Existenz einer Inversen. Satz 6.19. Eine Matrix A ∈ Rn×n besitzt eine Inverse A−1 genau dann, wenn A regulär ist. Beweis. Die Matrix A besitzt eine Inverse genau dann, wenn das zugehörige Gleichungssystem A · x = y für jede rechte Seite y genau eine Lösung x = E · x = (A−1 · A) · x = A−1 y hat. Dies ist wiederum genau dann der Fall, wenn die Zeilenstufenform von A keine Nullzeilen besitzt, also Rang(A) = n ist. Folgerung 6.20. Ist A ∈ Rn×n regulär, dann hat das Gleichungssystem A · x = y für jede rechte Seite y ∈ Rn×1 genau eine Lösung. Es gilt auch die Umkehrung. 80 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen Berechnung der Inversen Zur Berechnung der Inversen, falls existent, kann man jetzt wie folgt vorgehen. Aus der Definition der Matrixmultiplikation erhält man A · M = A · M·1 A · M·2 . . . A · M·n . Das Multiplizieren einer Matrix M von links mit A entspricht also dem Multiplizieren der einzelnen Spalten von M mit A. Die j-te Spalte M·j der Inversen kann man dann berechnen, indem man das Gleichungssystem A · M·j = E·j , 1≤j≤n löst. Da bei der Umformung auf Zeilenstufenform nur die Einträge der Matrix A relevant sind, lassen sich alle Spalten gleichzeitig behandeln. Wir versuchen also das Gleichungssystem mit Koeffizientenschema (A|E) mit n rechten Seiten E·1 , . . . E·n zu lösen. Zur Illustration ein kurzes Beispiel: 2 1 Beispiel 6.21. Man berechne die Inverse der Matrix A = . 1 2 Lösung: Wir wenden den Gauß-Algorithmus auf das System (A|E) an. Es gilt 1 12 12 0 2 1 1 0 2 1 1 0 ↔ ↔ (A|E) = 1 2 0 1 0 23 − 12 1 0 1 − 13 23 2 1 > Für die erste Spalte auf der rechten Seite erhält man die Lösung M ·12 = ( 31 − 3 ) , und die −3 3 zweite Spalte liefert M·2 = (− 13 23 ). Die Inverse ist also A−1 = M = . 1 − 3 23 Durch weiteres Umformen der Zeilenstufenform (Gauß-Jordan Algorithmus) erhält man 1 0 23 − 13 (A|E) ↔ . 0 1 − 13 32 Dies entspricht gerade dem Gleichungssystem E·M = 2 3 − 13 − 13 2 3 . Die Inverse lässt sich also aus dem letzten System direkt ablesen. Bemerkung 6.22. • Ist die Matrix A nicht regulär, so besitzt die linke Seite der Zeilenstufenform eine echte Nullzeile. Die Inverse existiert in diesem Fall nicht, und kann dementsprechend auch nicht berechnet werden. 81 • Man beachte: Zum Berechnen der Inversen muss ein Gleichungssystem mit n rechten Seiten berechnet werden. Das Aufstellen der inversen Matrix ist also zum Lösen eines GLS (mit einer rechten Seite) nicht effizient. Die Darstellung der Lösung x = A−1 y kann jedoch für theoretische Betrachtungen nützlich sein. Wir führen weiters die folgenden Begriffe ein. Definition 6.23. Für A ∈ Rm×n definieren wir Bild(A) := {y ∈ Rm : ∃x ∈ Rn : y = Ax} Kern(A) := {x ∈ Rn : A · x = 0} Bild von A. Kern von A. Man überzeugt sich leicht, dass für eine Matrix A ∈ Rm×n mit Spalten A·j die folgenden Zusammenehänge gelten: Satz 6.24. Sei A ∈ Rm×n . Dann gilt • Bild(A) ist ein Untervektorraum des Rm , Kern(A) ist ein Untervektorraum des Rn . • Das Bild einer Matrix A wird durch ihre Spalten aufgespannt. • Bild(A) = Span{A·j : 1 ≤ j ≤ n} sowie Bild(A> ) = Span{(Ai,· )> : 1 ≤ i ≤ m}. • Dim(Bild(A)) = Rang(A) = Rang(A> ) = Dim(Bild(A> )). Weiters gilten die folgende Dimensionsformel • Dim(Kern(A)) + Dim(Bild(A)) = n und Dim(Kern(A> )) + Dim(Bild(A> )) = m. Beweis. Die Sachverhalte folgen aus Betrachtung des Gauß’schen Eliminationsverfahren. Man vergleiche die Dimensionsformeln mit den Aussagen über die Anzahl freier Parameter in der Lösungsmenge von linearen Gleichungssystemen. Bemerkung 6.25. Aus obigen Aussagen lassen sich folgende Einsichten über die Lösung linearer Gleichungssysteme gewinnen: • Ein lineares GLS A · x = y ist genau dann lösbar, wenn y ∈ Bild(A) ist. Man beachte hierzu, dass n X A·x=y ⇔ xk A·k = y. k=1 Das Lösen des GLSs ist also äquivalent zur Frage, ob y als Linearkombination der Spalten von A dargestellt werden kann. • Das GLS A · x = y ist für jede rechte Seite y ∈ Rm lösbar, wenn Bild(A) = Rm . Dies ist genau dann der Fall, wenn der Rang von A gleich m ist. • Der Kern von A ist gerade die Lösungsmenge des homogenen GLS A · x = 0. 82 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen • Die Dimension des Lösungsraumes von A · x = y (= minimale Anzahl von freien Parametern zur Darstellung der Lösungsmenge) ist gerade die Dimension des Kerns. • Das GLS A·x = y besitzt höchstens eine Lösung, wenn Dim(Kern(A)) = 0 also Kern(A) = {0}. Man beachte, dass Kern(A) ein Unterraum des Rn ist, und daher immer die 0 enthält. Die LU Faktorisierung Im Ffolgenden betrachten wir nochmals das Gauß’sche Eliminationsverfahren. Elementare Zeilenoperationen arbeiten auf den Zeilen von A, und können nach obiger Bemerkung durch Multiplikation mit einer Matrix von links realisiert werden. 1 1 0 Beispiel 6.26. Sei A = . Dann gilt 2 1 1 0 1 1 1 0 2 1 1 · = 1 0 2 1 1 1 1 0 0 1 Die Zeilen von A können also durch Multiplizieren von links mit B = vertauscht 1 0 werden. Allgemeiner gilt a b A1· a · A1· + b · A2· · = c d A2· c · A1· + d · A2· Durch Multiplizieren von links kann man also die Zeilen von A beliebig linear kombinieren. Beispiel 6.27. Um mit größeren 1 0 0 0 a 0 0 0 1 0 c 0 0 0 0 Matrizen zu arbeiten, benutzen wir folgende Beobachtung. A1· 0 0 A1· b 0 A2· a · A2· + bA4· 0 0 · A3· = A3· d 0 A4· c · A2· + d · A4· 0 1 A5· A5· Um die zweite und vierte Spalte zu modifizieren, multipliziert man mit einer Matrix B von links, welche sich von einer Einheitsmatrix nur durch die Einträge Bij , i, j ∈ {2, 4} unterscheidet. Die elementaren Zeilenumformungen im Gauß’schen Algorithmus können jetzt durch Multiplikation von links mit folgenden Elementarmatrizen bewerkstelligt werden. • Vertauschen von Zeile i und j erreicht man durch Multiplikation mit der elementaren Permutationsmatrix P ij , welche in Beispiel 6.27 durch Wahl a = 0, b = 1, c = 1, d = 0 entsteht. Siehe auch Beispiel 6.26; i.A. gilt P ij = E − (ei − ej ) · (ei − ej )> . • Addieren des λ-fachen der Zeile i zur Zeile j > i wird durch Multiplikation mit der elementaren linken unteren Dreiecksmatrix L̃ij erreicht, welche wie in Beispiel 6.27 durch Wahl a = 1, b = 0, c = λ, d = 1 entsteht; i.A. gilt L̃ij = E + λej e> i . 83 Beispiel 6.28. Zur 0 1 1 Veranschaulichung diskutieren wir kurz die Umformung einer Matrix A 1 1 1 1 1 0 1 1 1 0 1 Z1↔Z2 Z3↔Z3−Z1 0 1 1 1 1 0 1 ↔ 0 1 1 1 ↔ 1 1 1 1 1 1 1 0 0 1 0 in Zeilenstufenform durch Multiplikation mit Elementarmatrizen. Der erste Schritt ist realisierbar durch Anwenden der Permuationsmatrix 0 1 0 0 1 1 1 1 1 0 1 P 12 · A = 1 0 0 · 1 1 0 1 = 0 1 1 1 =: A1 0 0 1 1 1 1 1 1 1 1 1 Den zweiten Schritt realisieren trix, 1 13 0 L̃ · A1 = −1 wir durch Multiplikation mit einer linken unteren Dreiecksma 0 0 1 1 0 1 1 1 0 1 1 0 · 0 1 1 1 = 0 1 1 1 =: A2 0 1 1 1 1 1 0 0 1 0 Die resultierende rechte obere Dreiecksmatrix (= Zeilenstufenform) lässt sich also schreiben als A2 = L̃13 · A1 = L13 · P 12 · A, wobei L13 = (L̃13 )−1 . Der Gauß-Algorithmus lässt sich damit formal wie folgt beschreiben: A0 := A for k = 1 : m do Ak := L̃mk · . . . · L̃(k+1)k · P klk · Ak−1 end Das Endresultat Am besitzt dann Zeilenstufenform. Bemerkung 6.29. • Das Ergebnis des Algorithmus verändert sich nicht, Qmwennkl man alle benötigten Zeilenvertauschungen vorab ausführt. Wir nennen P := k=1 P k eine Permutationsmatrix. Man beachte, dass P ij und somit auch P regulär und invertierbar ist. • Die Überführung der Matrix P · A in Dreiecksstufenform erfolgt durch mit Qm QmMultiplizieren kl kl linken unteren Dreiecksmatrizen L̃ , und wir definieren L := k=1 l=k+1 L̃ . • Die inverse einer regulären linken unteren (rechten oberen) Dreiecksmatrix sowie das Produkt von solchen Matrizen besitzt wieder dieselbe Gestalt. Insbesondere gilt −1 −1 (m−1)m (m−2)m (m−2)(m−1) 13 12 L := L̃ = L̃ · L̃ · L̃ · . . . · L̃ · L̃ = (L̃12 )−1 · (L̃13 ) · . . . · (L̃(m−2)(m−1) )−1 · (L̃(m−2)m )−1 · (L̃(m−1)m )−1 84 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen Für das Hauptresultat dieses Abschnitts brauchen wir noch folgende Eigenscchaften von Produkten von Elementarmatrizen. Satz 6.30. Seien Pk und L̃k elementare Permutations- bzw Dreiecksmatrizen. Dann gilt: Q • Die (algemeine) Permutationsmatrix P := k Pk = P1 · P2 · . . . ist regulär (invertierbar), und P −1 = P > . Q • Die Matrix L̃ := k L̃k = L̃1 · L̃2 · . . . ist regulär (invertierbar). Weiters sind L̃ und L̃−1 wieder linke untere Dreiecksmatrizen mit Einsen auf der Diagonale. Beweis. Mit Induktion nach k; siehe Übung. Die Zusammenfassung der obigen Beobachtungen liefert uns das folgende Resultat. Satz 6.31 (LU-Faktorisierung (LR-Zerlegung)). Jede Matrix A ∈ Rm×n lässt sich zerlegen in P · A = L · U, wobei P ∈ Rm×m eine Permutationsmatrix ist, L ∈ Rm×m eine linke untere Dreiecksmatrix mit Einsen auf der Diagonale, und U ∈ Rm×n eine rechte obere Dreiecksmatrix (also in Zeilenstufenform). Die Zeilenstufenform U der Matrix erhält man dementsprechend einfach durch U = L−1 · P · A. Praktische Durchführung der LU Zerlegung Die Darstellung des Gauß-Algorithmus über Produkte von Elementarmatrizen ist vor allem von theoretischer Bedeutung. Hingegen ist die LU-Zerlegung auch von praktischer Relevanz, v.a., wenn GLSe mit mehrerern rechten Seiten gelöst werden sollen. Das Lösen eine GLSs mittels LU-Zerlegung funktioniert dann wie folgt: • Das GLS A · x = y ist äquivalent zu L · U · x = P · A · x = P · y = P y • Rückwärtseinsetzen: Löse L · z = L · (U · x) = P y • Vorwärtseinsetzen: Löse U · x = z Im Folgenden seien die wesentlichen Schritte für den Fall durchdiskutiert, dass keine Zeilenvertauschungen notwendig sind. 85 % Ermittlung der LU Zerlegung [L,U] = lu_decompose(A); % matlab: [L,U,P]=lu(A); % Permutation der rechten Seite: P*A*x = P*y Py = y; % matlab: Py = P*y; % Rueckwaertseinsetzen: L*z = Py z = backward_solve(L,Py); % matlab: z = L\Py; % Vorwaertseinsetzen: U*x = z x = forward_solve(U,z); % matlab: x = U\z; Der folgende Algorithmus beschreibt die LU-Zerlegung im Falle Algorithmus) ohne Zeilenvertauschung auskommt. Der Ansatz 1 0 0 ... U11 U12 U13 . . . A11 L21 1 0 . . . 0 U22 U23 . . . A21 = L31 L32 1 . . . · 0 0 U33 . . . A31 ... ... ... dass diese (bzw der Gauß A12 A13 . . . A22 A23 . . . A32 A33 . . . erlaubt die Unbekannten Lij und Uij zeilenweise zu bestimmen. • Die erste Zeile k = 1 liefert: U11 = A11 , U12 = A12 , U13 = A13 , usw. • Die zweite Zeile k = 2 liefert – Spalte j = 1: L21 U11 = A21 und daher L21 = A21 /U11 . – Spalte j ≥ 2: L21 U1j + U2j = A2j woraus folgt: U2j = A2j − L2j U2j • Die dritte Zeile k = 3 liefert – Spalte j = 1: L31 U11 = A31 und daher L31 = A31 /U11 . – Spalte j = 2: L31 U12 + L32 U22 = A32 , also L32 = (A32 − L31 U12 )/U22 . – Spalte j ≥ 3: L31 U1j + L32 U2j + U3j = A3j woraus folgt: U3j = A3j − L31 U1j − L32 U2j • u.s.w. Man sieht, dass man aus den Spalten j < k der k-ten Zeile nacheinander die Koeffizienten Lkj ermitteln kann, und aus den Spalten j ≥ k dann die noch unbekannten Koeffizienten Ukj . Führt man die Rechnung fort, erhält man den folgenden Algorithmus. function [L,U] = lu_decompose(A) % lu decomposition of A without pivoting m=size(A,1); n=size(A,2); U=zeros(m,n); L=zeros(m,m); 86 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen for k=1:m for j=1:k-1 L(k,j) = ( A(k,j) - L(k,1:j-1)*U(1:j-1,j) ) / U(j,j); % = ( A(k,j) - sum_{l=1}^{j-1} L(k,l)*U(l,k) ) / U(j,j); end L(k,k) = 1; % nie verwendet! if abs(A(k,k))<1e-12, error(’matrix is close to singular’); end for j=k:n U(k,j) = A(k,j) - L(k,1:k-1)*U(1:k-1,j); % = A(k,j) - sum_{l=1}^{k-1} L(k,l)*U(l,j); end end Das Vorwärts- und Rückwärtseinsetzen funktioniert analog zum Gauß-Algorithmus, vgl. Übung. Im folgenden noch einige praktische Hinweise: Bemerkung 6.32. • Die Anzahl der arithmetischen Operationen (Multiplikationen) für die LU-Zerlegung ist ca. n3 /3, und damit um etwa 1/3 geringer als das Multiplizieren zweier Matrizen! • Das Vorwärts- bzw Rückwärtseinsetzen benötigt jeweils ca n2 /2 Multiplikationen. • Die 1 Einträge der Matrix L sowie 0en in L und U brauchen nicht gespeichert werden. In der Praxis werden daher typischerweise die Einträge von L und U über die Matrix A gespeichert. • Eine allgemeine Permuationsmatrix P kann durch Angabe eins Zeilevektors p gespeichert werden: Die Einträge pi bezeichnen dabei gerade die Position der i-ten Zeile (nach Permutation). Sei P y = P · y. Dann gilt P y(p) = (P y(p1 ), P y(p2 ), . . .)> = y. Lineare Abbildungen Im folgenden identifizieren wir die Vektoren in Rn mit den Spaltenvektoren in Rn×1 . Eine Matrix A ∈ Rm×n definiert dann eine Abbildung LA : Rn → Rm , x 7→ A · x zwischen den Vektorräumen Rn und Rm . Aus den Regeln für die Matrixmultiplikation folgt sofort A · (x + y) = A · x + A · y sowie A · (λ · x) = λ · (A · x). Das motiviert den folgenden Begriff. Definition 6.33. Eine Abbildung L : V → W , v 7→ L(v) zwischen K-Vektorräumen V und W heißt linear, falls für alle Vektoren u, v ∈ V und alle Zahlen λ ∈ K gilt: L(u + v) = L(u) + L(v) und L(λ · v) = λ · L(v). 87 Das Einsetzen in die Definition zeigt, dass die zu einer Matrix A gehörende Abbildung LA linear ist. Es gilt allerdings auch die Umkehrung. Satz 6.34. Sei L : Rn → Rm eine lineare Abbildung. Dann gibt es eine eindeutige Matrix A ∈ Rm×n mit L = LA , d.h., L(x) = A · x für alle x ∈ Rn . Beweis. Sei {e1 , . . . , en } die kanonische Basis des Rn . Dann lässt sich x als Linearkombination x = x1 · e1 + x2 · e2 + . . . xn · en = Xn k=1 xk · e k schreiben. Unter Ausnutzung der Linearität erhält man X L(x) = L( xk · ek ) = L(x1 · e1 + . . . + xn · en ) X = x1 · L(e1 ) + . . . + xn · L(en ) = xk · L(en ). Andererseits hat man für beliebiges A ∈ Rm×n X LA (x) = A · x = A · ( xk · ek ) = A · (x1 · e1 + . . . + xn · en ) X = x1 · (A · e1 ) + . . . + xn · (A · en ) = xk · (A · ek ). Weiters beachte man, dass A · ek = A·k gerade die k-te Spalte von A ergibt. Vergleicht man die beiden Ausdrücke, so liegt nahe, die k-te Spalte von A also A·k := L(ek ) festzulegen. Wie obigen Rechnungen zeigen, gilt dann L(x) = LA (x) für alle x ∈ Rn . Satz 6.35. Seien V und W normierte Vektorräume. Dann ist die Menge L(V, W W ) aller linearen Abbildungen zwischen V und W ein Vektorraum. Weiters definiert die Vorschrift kLkV →W = sup{kL(v)kW /kvkV : v ∈ V, v 6= 0} sup 06=v∈V kL(v)kW kvkV eine Norm auf L(V, W ), die sogenannte Operatornorm. L(V, W ) ist somit ein normierter Vektorraum. Man beachte, dass die Operatornorm von der Wahl der Normen für V audn W abhängt! Bemerkung 6.36. Für den Fall V = Rn und W = Rn wissen wir bereits, dass sich die linearen Abbildungen über Matrizen darstellen lassen. Wir haben also L(Rn , Rm ) ' Rm×n , und definieren dementsprechend die Matrixnormen kAkRn →Rm := sup 06=x∈Rn kA · xkRn kxkRn was gerade kAk = kLA k entspricht. Achtung: Die Matrixnorm hängt von der Wahl der Normen für Rm und Rn ab! 88 Matrizenrechnung und Lineare Abbildungen auf Vektorräumen Bemerkung 6.37. Aus der Definition der Matrixnorm erhält man sofort: kA · xkRn →Rm ≤ kAkRn →Rn kxkRn für alle x ∈ Rn . Diese elementare Ungleichung wird oftmals verwendet! Gleiches gilt natürlich auch für allgemeine lineare Operatoren. Im folgenden wollen wir einige gebräuchliche Matrixnormen kurz vorstellen. Beispiel 6.38. • Als Normen für Rm und Rn wählen wir jeweils die 1-Norm kvk1 := die zugeordnete Matrixnorm schreiben als P k vk . Dann lässt sich m kAk1 := sup x6=0 X kA · xk1 = max |Aij |. 1≤j≤n kxk1 i=1 Die 1-Matrixnorm ist also gerade die maximale Spaltenbetragssumme, und heißt dementsprechend Spaltenbetragssummennorm. • Wählt man die Maximumsnorm kvk∞ := maxk |vk | auf den Vektorräumen Rm und Rn , so erhält man m X kA · xk∞ kAk∞ := sup = max |Aij |. 1≤i≤m kxk∞ x6=0 j=1 Diese Norm heißt dementsprechend Zeilenbetragssummennorm. P • Die zur Euklid’sche Norm kvk2 = ( k |vk |2 )1/2 zugeordnete Matrixnorm kAk2 := sup x6=0 kA · xk2 kxk2 heißt Spektralnorm. Diese Lässt sich über die Singulärwerte der Matrix A charakterisieren.