Grundlagen der Mathematik Irene I. Bouw Wintersemester 2013/2014 Inhaltsverzeichnis 1 Mengen und Funktionen 1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Logische Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 5 10 2 Beweismethoden 13 2.1 Der direkte Beweis und Varianten . . . . . . . . . . . . . . . . . . 13 2.2 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3 Binomialkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . 21 3 Äquivalenzrelationen 25 3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.2 Die ganze und rationale Zahlen . . . . . . . . . . . . . . . . . . . 27 3.3 Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4 Grenzwerte und die Definition der reellen Zahlen 4.1 Berechnung von Quadratwurzeln . . . . . . . . . . 4.2 Definition des Grenzwerts . . . . . . . . . . . . . . 4.3 Cauchy-Folgen . . . . . . . . . . . . . . . . . . . . 4.4 Definition der reellen Zahlen . . . . . . . . . . . . . 4.5 Die Vollständigkeit von R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 30 33 35 37 39 5 Unendliche Mengen 42 5.1 Gleichmätigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 5.2 Das Cantorsche Diagonalargument . . . . . . . . . . . . . . . . . 44 6 Die komplexe Zahlen 45 6.1 Definition der komplexen Zahlen . . . . . . . . . . . . . . . . . . 47 6.2 Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 1 A Einige weitere Begriffe A.1 Teilbarkeit . . . . . . . . A.2 Ungleichungen . . . . . A.3 Summen und Produkten A.4 Körper . . . . . . . . . . A.5 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Das griechische Alphabet 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 54 55 57 58 59 Mengen und Funktionen In diesem Kapitel führen wir einige in der Mathematik viel benutzte Objekte, wie Mengen und Funktionen, ein. Aus der Schule werden Sie ein intuitives Verständnis davon haben, was eine Menge oder eine Funktion ist. Wir besprechen diese Konzepte in diesem Kapitel nochmals um ein gemeinsames Verständnis dieser Objekte zu haben. Außerdem führen wir einheitliche Bezeichnungen ein. Im nächsten Kapitel werden wir uns mit Beweistechniken befassen. Viele der Beweise, die wir in Kapitel 2 studieren, zeigen Eigenschaften von Mengen, Zahlen und Funktionen. Diese Beweise bauen auf den Eigenschaften der in diesem Kapitel eingeführten Objekte auf. 1.1 Mengen Mengen spielen in allen Teilbereichen der Mathematik eine Rolle. Es ist erstaunlich, dass die Mengenlehre, also die Theorie der Mengen, erst seit dem 19ten Jahrhundert systematisch studiert wird. Hier finden Sie eine historische Übersicht der Geschichte der Mengenlehre: www-history.mcs.st-andrews.ac.uk/HistTopics/Beginnings of set theory.html Als Ausgangspunkt unserer Diskussion von Mengen, nehmen wir Cantors Mengenbegriff. Cantor definierte 1874 Mengen wie folgt: Unter eine Menge verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten (Elemente genannt) unserer Anschauung oder unseres Denken zu einem Ganzen. Cantors Mengendefinition ist keine Definition im mathematischen Sinne, da der Begriff nicht auf schon definierte Begriffe zurückgeführt wird. Es ist möglich den Begriff Menge durch Axiome zu charakterisieren. Dies ist alledings recht kompliziert. Für uns reicht ein intuitives Verständnis des Begriffs, wie er durch Cantors Definition beschrieben wird. Wenn man unendliche Menge betrachtet, führt dieser naive Mengenbegriff alledings leicht zu Widersprüchen. Cantors Mengenbegriff hört sich zunächst ziemlich abstrakt an. Wir möchten hier einige Aspekte betonen, die für uns wichtig sind. Bemerkung 1.1 (a) Eine Menge besteht aus Objekten. Die Elemente einer Menge brauchen also keine Zahlen sein. Beispielsweise können wir auch die 2 Menge der Studierenden dieser Vorlesung oder die Menge der Buchstaben des Alphabets betrachten. (b) Die Elemente einer Menge müssen wohlunterschieden sein, d.h. man muss sie von Einander unterscheiden können. Das gleiche Objekt kann also nicht zweimal in einer Menge enthalten sein. Außerdem ist die Reihenfolge, in der die Elemente aufgezählt wurden, unwichtig. Wenn x und y das gleiche Element einer Menge M bezeichnen, schreiben wir x = y. Wenn x und y verschiedene Elemente sind, schreiben wir x 6= y. Da die Elemente der Menge wohlunterschieden sind, können wir entscheiden welcher der beide Fälle zutrifft. (c) Die Objekte einer Menge müssen bestimmt sein, d.h. man muß entscheiden können, ob einem Objekt m in der Menge M enthalten ist oder nicht. In dieser Vorlesung bezeichnen wir Mengen immer mit Großbuchstaben und Elemente einer Menge mit Kleinbuchstaben. Es gibt verschiedene Möglichkeiten eine konkrete Menge zu definieren. Die einfachste ist die Aufzählung. Hier werden die Objekten der Mengen zwischen geschweiften Klammer aufgelistet: M := {a, b, c}, N := {1, 2, 3, . . .}. Hierbei deutet := an, dass hier ein Symbol definiert wird. Die Auslassungspunkte (· · · ) deuten an, dass die Reihe nach dem offensichtlichen Muster fortgesetzt wird. Dies ist manchmal sehr praktisch. Die Menge N der natürliche Zahlen beispielsweise besitzt unendlich viele Elemente, die man nicht alle Aufzählen kann. Wichtige Beispiele von Mengen sind: N = {1, 2, 3, . . .} N0 = {0, 1, 2, 3, . . .} Z = {0, ±1, ±2, . . .} Q R R>0 natürliche Zahlen, natürliche Zahlen mit Null, ganze Zahlen, rationale Zahlen, reelle Zahlen, positive reelle Zahlen. In dieser Vorlesung werden die natürlichen Zahlen N als bekannt vorausgesetzt. Die Mengen Z, Q und R werden wir in den Abschnitte 3.2 und 4.4 genau definieren. (Bis dahin werden wir diese Mengen trotzdem benutzen und uns auf Ihr Verständnis aus der Schule verlassen.) Sehr praktisch ist auch die Möglichkeit die Elemente einer Menge durch eine Eigenschaft zu definieren. Diese Eigenschaft steht dann hinter einem vertikalen Strich. Machmal wird hier auch ein Doppelpunkt benutzt. Ein Beispiel ist: E := {x ∈ Z | x ist gerade } = {0, ±2, ±4, . . .}, P := {n ∈ N>1 | n ist eine Primzahl} = {2, 3, 5, 7, 11, . . . , 37, . . .}. 3 Wir beschreiben einige oft benutzte Bezeichnungen für Mengen. • x ∈ S: Das Objekt x ist ein Element der Menge S. • x 6∈ S: Das Objekt x ist kein Element der Menge S. Beispiel: 0 6∈ N. • ∅: Die leere Menge. In der Schule wird diese Menge oft mit { } bezeichnet. • A ∩ B := {x | x ∈ A und x ∈ B}: Die Schnittmenge von A und B. Zwei Mengen A, B mit A ∩ B = ∅ heißen disjunkt. Ist A eine beliebige Menge, dann sind A und ∅ disjunkt, da A ∩ ∅ = ∅. • A ∪ B := {x | x ∈ A oder x ∈ B}: Die Vereinigung von A und B. Die Menge A ∪ B enthält also alle Objekte, die in A oder in B (oder in beide Mengen) enthalten sind. Wenn x sowohl in A als auch in B ist, dann ist x also auch in A ∪ B. Sind die beide Mengen A und B disjunkt, schreibt man manchmal auch A ⊔ B für die Vereinigung und sagt dazu disjunkte Vereinigung. Beispielsweise gilt für jede Menge A, dass A ∪ ∅ = A. • A ⊂ B: Die Menge A ist eine Teilmenge von B, d.h. alle Elemente von A sind auch in B. Die Mengen A und B dürfen auch gleich sein. Manchmal wird auch das Symbol A ⊆ B benutzt. Beispielsweise ist N ⊂ Z. • A ( B: Die Menge A ist eine Teilmenge von B, aber die beide Mengen sind nicht gleich. Es existiert also ein Element y ∈ B, das nicht in A ist. Man sagt auch: A ist eine echte Teilmenge von B. • A \ B := {x ∈ A | x 6∈ B}: Das Komplement von B in A, auch A ohne B genannt. Ist B ⊂ A und A aus der Kontext klar, schreibt man manchmal auch B c anstatt A \ B. • |A| = #A: Die Mächtigkeit oder Kardinalität der Menge. Wir werden dieses Symbol nur für Mengen mit endlich vielen Elementen (endliche Mengen genannt) benutzen. • A × B := {(a, b) | a ∈ A, b ∈ B}: Das kartesisches Produkt von A und B. Die Elemente (a, b) sind geordnete Paaren: Die Reihenfolge ist hier wichtig. Man kann dies auch mehrfach anwenden. Man schreibt An := A × · · · × A, wobei die Menge A auf der rechten Seite n Mal vorkommt. Beispielsweise ist R2 = {(x, y) | x, y ∈ R} die reelle Standardebene. • P(A) := {B | B ⊂ A}: Die Potenzmenge, d.h. die Menge aller Teilmengen. Wichtige Beispiele von Teilmengen der reelen Zahlen sind Intervalle. In dieser Vorlesung benutzen wir folgende Bezeichnungen. Seien a, b reelle Zahlen mit a < b. Dann gilt: • [a, b] := {x ∈ R | a ≤ x ≤ b}. 4 • [a, b) := {x ∈ R | a ≤ x < b}. • (a, b) := {x ∈ R | a < x < b}. • [a, ∞) := {x ∈ R | x ≥ a}. Da ∞ keine reelle Zahl ist, kann dies auch kein Element einer Teilmenge von R sein. • (−∞, b) := {x ∈ R | x < b}. Beispiel 1.2 (a) Die Menge Q := [−1, 1] × [−1, 1] ⊂ R2 ist ein Quadrat mit Mittelpunkt (0, 0) und Seitenlänge 2. (b) Sei S = {1, 2}. Dann ist die Potenzmenge P (S) = {∅, {1}, {2}, {1, 2}}. Insbesondere ist |P (S)| = 4. Der folgende Satz gibt einige Eigenschaften der Mengenoperationen, die wir oben eingeführt haben. Bitte beachten Sie den Klammern. Es ist hilfreich die Aussagen mit Venn–Diagrammen zu veranschaulichen. Den Beweis diskutieren wir im nächsten Kapitel (Lemma 2.1) und in den Übungsaufgaben. Satz 1.3 Seien A, B, C Mengen. Es gilt: (a) A ∪ B = B ∪ A und A ∩ B = B ∩ A (Kommutativgesetz), (b) (A∪B)∪C = A∪(B ∪C) und (A∩B)∩C = A∩(B ∩C) (Assoziativgesetz), (c) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) und (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C) (Distributivgesetz), (d) (Ac )c = A, (e) (A ∩ B)c = Ac ∪ B c und (A ∪ B)c = Ac ∩ B c (Regeln von De Morgan). 1.2 Logische Symbole Bevor wir uns im nächsten Kapitel mit mathematischen Beweisen befassen, diskutieren wir jetzt die Formulierung von mathematischen Aussagen. Logische Symbole liefern eine effiziente Art mathematische Aussagen kompakt darzustellen. Kleine Änderungen in der Formulierung, wie beispiesweise das Vertauschen zweier Symbole, ändert die Bedeutung oft radikal. Daher ist es wichtig sich mit der genauen Bedeutung der Symbole auseinanderzusetzen. Logische Symbole wie der Implikationspfeil “⇒” sollte man nie benutzen um etwa einen Zeilenumbruch anzugeben. Bei der Bearbeitung der Übungsaufgaben ist es oft ratsam die Aussagen als vollständige Deutsche Sätze zu formulieren, da so die Bedeutung leichter verständlich ist. 5 Eine Aussage ist eine Äußerung, die entweder wahr oder falsch ist. Alledings muß man nicht wissen, welches zutrifft. Es reicht, zu wissen, dass genau eine der Beiden zutrifft. Beispiele von Aussagen sind: • Es regnet. √ • 2∈ / Q. • Heute fällt die Vorlesung Grundlagen der Mathematik aus. • Es existieren unendlich viele Primzahlen. Keine Aussagen sind: • Guten Morgen liebe Studierenden. • Welche Musik hören Sie gerne? • 2 ⇒ gerade. Wir führen zunächst die wichtigsten sogenannten Junktoren ein. Dies sind Symbole mit denen wir Aussagen zu neuen Verbinden können. Seien A, B Aussagen. • A ⇒ B: Aussage A impliziert Aussage B. Dies bedeutet, dass B immer wahr ist, wenn A wahr ist. Dies entspricht B ⊂ A in der Mengenlehre. Beispiele sind: ∗ Wenn es regnet, ist die Straße naß. ∗ Wenn n ∈ N durch 4 teilbar ist, ist n auch durch 2 teilbar. • A ⇐ B: Aussage B impliziert Aussage A. Dies ist gleichbedeutet mit B ⇒ A. • A ⇔ B: Die Aussagen A und B sind äquivalent, d.h. B ist genau dann wahr, wenn A wahr ist. Dies entspricht A = B in der Mengenlehre. Die Aussagen Es regnet und Die Straße ist naß sind nicht äquivalent. Die Straße kann beispielsweise auch naß sein, weil ein Straßenputzfahrzeug vorbei gefahren ist. • ¬A: Die Aussage “nicht A”. Diese Aussage ist genau dann wahr, wenn die Aussage A falsch ist. Dies entspricht Ac in der Mengenlehre. • A ∧ B: Die Aussage “A und B”. Diese Aussage ist genau dann wahr, wenn A und B beide wahr sind. Dies entspricht A ∩ B in der Mengenlehre. • A∨B: Die Aussage “A oder B”. Diese Aussage ist genau dann wahr, wenn mindestens eine der Aussagen A, B wahr ist. Es dürfen also auch beide Aussagen wahr sein: Das mathematische “oder” ist nicht gleichbedeutend mit “entweder oder”. Das Symbol A ∨ B entspricht also A ∪ B in der Mengenlehre. 6 Die unterstehende Wahrheitstafel illustriert die Bedeutung der Aussagen aus obiger Liste. Für alle Möglichkeiten, ob die Aussagen A und B wahr (“w”) oder falsch (“f”) sind, finden Sie in der Tabelle ob die zusammengesetzte Aussage wahr oder falsch ist. A B A⇒B A⇔B A∧B A∨B w w w w w w w f f f f w f w w f f w f f w w f f . Besonders betonen möchten wir, dass die Aussage A ⇒ B genau dann wahr ist, wenn entweder A und B beide wahr sind oder wenn A falsch ist. Ist A falsch, sagt die Aussage A ⇒ B also nichts über die Wahrheit von B aus. Beispielsweise sind folgende Aussage wahr. • Wenn die Welt eine Scheibe ist, liegt Ulm auf dem Mond. • Wenn 6 eine Primzahl ist, ist 6 gerade. • Wenn der Hahn kräht auf dem Mist, dann ändert sich das Wetter oder es bleibt wie es ist. Die Aussage “Das Wetter ändert sich oder es bleibt wie es ist” ist eine Aussage der Form A ∨ ¬A. Solche Aussagen sind immer wahr und werden Tautologien genannt. Das folgende Lemma liefert zwei äquivalente Umformulierungen der Aussage “A ⇒ B”. Die Äquivalenz der ersten beiden Aussagen ist als Kontrapositionsgesetz bekannt. Die Name deutet schon an, dass dies eine wichtige Regel ist. Lemma 1.4 (Kontrapositionsgesetz) Seien A und B Aussagen. Die folgende drei Aussagen sind äquivalent: A ⇒ B, ¬B ⇒ ¬A, ¬A ∨ B. Beweis: Dies beweisen wir mit Hilfe einer Wahrheitstafel: A B ¬A ¬B A⇒B w w f f w w w w f f w f f f f w w f w w w f f w w w w w 7 ¬B ⇒ ¬A ¬A ∨ B Wir sehen, dass alle drei Aussagen genau dann falsch sind, wenn A wahr und B falsch ist. Alle drei Aussagen sind also äquivalent. ✷ Beispiel 1.5 Wir betrachten die Aussage Wenn heute Sonntag ist, gibt es keine Vorlesung. Dies ist eine (wahre) Aussage der Form A ⇒ B, mit A Heute ist Sontag. B Es gibt keine Vorlesung. Mit Hilfe des Kontrapositionsgesetzes können wir hieraus die folgende Aussage ableiten: Heute gibt es eine Vorlesung (“¬B”), also ist heute ist kein Sonntag (“¬A”). Folgende Aussage folgt NICHT: Es ist Montag, also gibt es heute eine Vorlesung. Die Aussage sagt nichts darüber aus, an welche Tagen Vorlesungen stattfinden. Die Aussage ¬A ∨ B ist in unserem Beispiel die Aussage: Heute ist nicht Sonntag oder es gibt keine Vorlesung. Wir kommen nun zur zweiten Sorte logischer Symbolen: die Quantoren. Wir betrachten eine Aussage A, die eine Variabele x enthält, die mehrere Werte annehmen kann. Um die Abhängigkeit von x anzudeuten, schreiben wir manchmal auch A(x) anstatt A. Es macht keinen Sinn zu fragen, ob A(x) wahr ist. Man kann aber fragen, für welche Werte von x die Aussage A(x) wahr ist. Quantoren quantifizieren für welche x die Aussage A(x) wahr ist. Die wichtigste Quantoren sind: • ∃x A(x): es existiert (mindestens) einen Wert für x, sodass die Aussage A(x) wahr ist. • ∀x A(x): für jeden möglichen Wert von x ist die Aussage A(x) wahr. Die folgenden Aussagen sind Beispiele warer Aussagen. (a) ∀x ∈ Z x2 ≥ 0. (b) ∃x ∈ Q ∀y ∈ Q y 2 6= x. Die erste Aussage sagt, dass das Quadrat einer ganzen Zahl immer nicht-negativ ist. Die zweite Aussage sagt, dass rationale Zahlen existieren, die keine Quadratzahl sind. Um zu zeigen, dass die Aussage wahr ist, müssen wir also eine konkrete Zahl x mit der gewünschten Eigenschaft angeben. Beispielsweise gilt dies für x = 2 (siehe Satz 2.6). Es ist wichtig die Reihenfolge der Quantoren zu betrachten. Betrachte die folgenden zwei Aussagen: (a) ∀x ∈ R ∃y ∈ R x + y = 1. 8 (b) ∃y ∈ R ∀x ∈ R x + y = 1. Die Aussage (a) sagt, dass wir für alle reelle Zahlen x eine reelle Zahl y mit x + y = 1 finden können. Die Zahl y darf also von x abhängen. Diese Aussage ist wahr: wähle y = 1 − x. Die Aussage (b) sagt, dass ein y ∈ R mit x + y = 1 für alle x existiert. Die Zahl y hängt hier also nicht von x ab. Diese Aussage ist falsch. Als nächstes betrachten wir die Negierung von Aussagen. Das folgende Lemma gibt einige wichtige Regeln. Vergleichen Sie die Aussagen (b) und (c) mit den Regeln von de Morgan (Satz 1.3.(e)). Lemma 1.6 Seien A und B Aussagen. Es gilt: (a) A ist äquivalent zu ¬¬A, (b) ¬(A ∧ B) ist äquivalent zu (¬A) ∨ (¬B), (c) ¬(A ∨ B) ist äquivalent zu (¬A) ∧ (¬B), (d) ¬∃x A(x) ist äquivalent zu ∀x ¬A(x), (e) ¬∀x A(x) ist äquivalent zu ∃x ¬A(x), (f) ¬(A ⇒ B) ist äquivalent zu A ∧ ¬B. Beweis: Die Aussagen (a), (b), (c) und (f) kann man mit Hilfe eines Wahrheitstafels beweisen. Wir überlassen dies der Leser/die Leserin als Übungsaufgabe. Für (d) betrachten wir die Menge M aller x für die Aussage A(x) wahr ist. Die Aussage ¬∃x A(x) sagt nun, dass kein x existiert, sodass A(x) wahr ist. Die Menge M ist also leer. Dies ist aber äquivalent zu der Aussage, dass für alle x die Aussage A(x) falsch, d.h. ¬A(x) wahr ist. Dies zeigt (d). Aussage (e) beweist man ähnlich. ✷ Wir geben nun konkrete Beispiele zu den Aussagen von Lemma 1.6. Ein komplizierteres Beispiel finden Sie in Beispiel 4.4.(b). Beispiel 1.7 (a) Sei A die Aussage es regnet. Dann ist ¬A die Aussage es regnet nicht und ¬¬A die Aussage es regnet nicht nicht. Das Letzte ist offensichtlich das gleiche als die Aussage, dass es regnet. (b) Wir betrachten nochmals die Aussage Wenn es heute Sonntag ist, gibt es keine Vorlesung aus Beispiel 1.5. Die Negierung dieser Aussage ist: heute ist Sonntag und es gibt eine Vorlesung. (c) Betrachte die Aussage ¬∃x ∈ Q x2 = 2. Diese Aussage sagt, dass keine rationale Zahl x mit x2 = 2 existiert. Anders gesagt: Alle rationale Zahlen x erfüllen x2 6= 2. In logische Symbole ausgedrückt ist dies: ∀x ∈ Q x2 6= 2. In Satz 2.6 werden wir diese Aussage zeigen. 9 (e) Wir betrachten die Aussage: ¬∃y ∈ R ∀x ∈ R x + y = 1. Diese Aussage ist äquivalent zu ∀y ∈ R ∃x ∈ R x + y 6= 1. 1.3 Funktionen Funktionen sind in der Mathematik mindestens genau so wichtig wie Mengen. Eine Funktion kann man als eine Relation zwischen Mengen auffassen. Wichtige Beispiele von Funktionen wie Sinus oder Exponentialfunktion kennen Sie schon aus der Schule. Definition 1.8 Eine Funktion (oder: Abbildung) ist eine Zuordnungsvorschrift, bei dem jedes Element des Definitionsbereichs X genau ein Element des Wertebereichs Y zugeordnet wird. Bezeichnung: f : X → Y, x 7→ f (x). Das Bild einer Funktion f : X → Y ist die Teilmenge {f (x) | x ∈ X} von Y . Für y ∈ Y heißt f −1 (y) := {x ∈ X | f (x) = y} das Urbild von y. Ähnlich definieren wir für eine Teilmenge Y1 ⊂ Y das Urbild als f −1 (Y1 ) := {x ∈ X | f (x) ∈ Y1 }. Ein wichtiges, aber relativ triviales Beispiel einer Funktion ist die Identität: IdM : M → M, m 7→ m. Diese Abbildung bildet jedes Element der Menge auf sich selbst ab. Bemerkung 1.9 (a) Beachte, dass der Pfeil 7→ die Zuordnungsvorschrift und der Pfeil → Definitions- und Wertebereich angibt. (b) Eine Funktion ordnet jedes x ∈ X genau einem Element f (x) ∈ Y zu. Das Element f (x) soll also eindeutig durch x bestimmt sein. Diese Eigenschaft einer Funktion nennt man auch Wohldefiniertheit. Beispielsweise ist die Zuordnung n 7→ die Primfaktoren vonn, N≥2 → N≥2 keine Funktion, da n mehr als einen Primfaktor besitzen kann. Die Zuordnung n 7→ { die Primfaktoren vonn}, N≥2 → P(N≥2 ) ist eine Funktion. Diesmal fassen wir die Menge der Primfaktoren von n als Element der Potenzmenge auf. Wir können Funktionen auch als Menge auffassen. Jede Funktion f : X → Y bestimmt seinen Graph: Γf := {(x, y) ∈ X × Y | y = f (x)}. 10 Umgekehrt definiert eine Teilmenge Z ⊂ X ×Y genau dann eine Funktion, wenn die Eigenschaft ∀x ∈ X |Z ∩ {x} × Y | = 1 erfüllt ist. Diese Eigenschaft sagt, dass jedes x ein eindeutiges y = f (x) zugeordnet wird. Wäre |Z ∩ {x} × Y | = 0, würde dieses x nirgendwo hin abbilden. Wäre |Z ∩ {x} × Y | > 1, würde dieses x auf mehr als ein y abgebildet. Beides ist laut Definition 1.8 nicht erlaubt. Definition 1.10 Seien f : A → B und g : B → C Funktionen. Die Funktion g ◦ f : A → C, x 7→ g(f (x)) heißt Verknüpfung (oder Komposition) von f mit g. Streng genommen enthält Definition 1.10 auch die Aussage, dass g ◦ f wieder eine Funktion ist. Hierzu muss man zeigen, dass die Zuordnung x 7→ g(f (x)) jedes x genau ein Element aus C zuordnet. Dies gilt, da f und g Funktionen sind. Sei nun h : C → D eine weitere Funktion. Es folgt aus der Definition, dass die beide Verknüpfungen h ◦ (g ◦ f ) : A → D und (h ◦ g) ◦ f : A → D gleich sind, beide bilden nämlich x auf h(g(f (x))) ab. Wichtig hierbei ist, dass die Funktionen jeweils in der gleichen Reihenfolge auftauchen, wie das folgende Beispiel erläutert. Beispiel 1.11 Sei f : R → R, x 7→ x2 und g : R → R, x 7→ 2x − 1. Dann ist g ◦ f : x 7→ 2x2 − 1, f ◦ g : x 7→ (2x − 1)2 . Beachte, dass die beide Funktionen nicht gleich sind. Beispielsweise ist g ◦f (0) = −1 und f ◦ g(0) = 1. Definition 1.12 Sei f : A → B eine Funktion und C ⊂ A eine Teilmenge. Die Einschränkung von f auf C ist definiert als f |C : C → B, x 7→ f (x). Die Zuordnungsvorschrift einer Einschränkung ist also gleich der ursprungliche Zuordnungsforschrift, aber der Definitionsbereich wird durch eine kleinere Menge ersetzt. Ein typisches Beispiel ist die Einschränkung der Sinus-Funktion von R auf dem Intervall [0, 2π]. Definition 1.13 Sei f : X → Y eine Funktion. (a) Die Funktion f heißt injektiv, wenn für alle x1 , x2 ∈ X gilt, dass f (x1 ) und f (x2 ) nur dann gleich sind, wenn x1 und x2 gleich sind. (b) Die Funktion f heißt surjektiv, wenn für alle y ∈ Y ein x ∈ X mit der Eigenschaft f (x) = y existiert. 11 (c) Die Funktion f heißt bijektiv, wenn f sowohl injektiv alsauch surjektiv ist. Bemerkung 1.14 Injektiv bedeutet, dass das Urbild f −1 (y) höchstens aus einem Element besteht. Zu jedes y ∈ Y bildet höchstens ein x ∈ X ab. Surjektiv bedeutet, dass das Urbild f −1 (y) mindestens aus einem Element besteht. Zu jedes y ∈ Y bildet mindestens ein x ∈ X ab. Eine Funktion f : X → Y ist also genau dann surjektiv, wenn f (X) = Y ist. Bijektiv bedeutet, dass das Urbild f −1 (y) genau aus einem Element besteht. Wir können die Elemente von Y ein eindeutiges Urbild x ∈ X zuordnen. Beispiel 1.15 (a) Die Funktion f : R → R, x 7→ x2 ist weder injektiv noch surjektiv. (b) Die Funktion f : R → [0, ∞), x 7→ x2 ist surjektiv, aber nicht injektiv. (c) Die Funktion g : R → R, x 7→ x3 ist sowohl injektiv alsauch surjektiv, also auch bijektiv. Lemma 1.16 Sei f : X → Y eine injektive Funktion. Dann existiert eine Funktion g : f (X) → X mit der Eigenschaft (1) f (x) = y ⇔ g(y) = x. Die Funktion g aus Lemma 1.16 heißt die Umkehrfunktion von f . Die Umkehrfunktion von f wird auch mit f −1 bezeichnet und erfüllt die Eigenschaft: f −1 ◦ f = IdX : X → X, f ◦ f −1 Idf (X) : f (X) → f (X). Beweis: Sei f : X → Y injektiv. Wir bemerken, dass die Funktion f : X → f (X) auch surjektiv, also bijektiv, ist. Wir definieren g : f (X) → X durch die Zuordnung y 7→ x, wobei x ein Element aus X mit f (x) = y ist. Da y ∈ f (X) ist, existiert ein solches Element x. Wir zeigen, dass diese Zuordnung eine Funktion definiert, also, dass g : x 7→ y wohldefiniert ist. Wir nehmen an, dass ein weiteres Element x′ ∈ X mit f (x′ ) = y existiert. Nun gilt f (x) = f (x′ ) = y. Da f injektiv ist, gilt also x = x′ . Dies zeigt, dass g wohldefiniert ist. Die Eigenschaft (1) ist offensichtlich erfüllt. ✷ Beispiel 1.17 (a) Das Caesar–Chiffre ist ein Verschlüsselungsverfahren, dass schon von Julius Caesar für seinen persönlichen Korrespondenz benutzt wurde. Um dem Nachricht zu verschlüsseln, wird jeder Buchstabe um drei verschoben: x a b c d ··· z f (x) d e 12 f g ··· c. Die Nachricht hallo wird also zu kdoor verschlüsselt. Um die Nachricht zu entschlüsseln wenden wir die Umkehrfunktion an: f (x) d e f g ··· c x a b c d ··· z. Damit man eine verschlüsselte Nachricht eindeutig entschlüsseln kann, ist es wichtig, das der Verschlüsselungsvorschrift bijektiv ist. Wenn wir beispielsweise die ite Buchstabe auf den 2ite Buchstabe abbilden, erhalten wir folgende Verschlüsselungsvorschrift: x a b c d ··· n o ··· f (x) b d f h ··· b f ··· . Wenn der verschlüsselte Nachricht die Buchstabe b enhählt, wissen wir nicht, ob dies ursprunglich eine a oder eine n war. Wir können die Nachricht also nicht eindeutig entschlüsseln. Mehr zu Verschlüsseln erfahren Sie nächstes Semester in der Vorlesung Elementare Zahlentheorie. (b) Die Funktion f : R → R, x 7→ x3 ist bijektiv. Die Umkehrfunktion ist g : R → R, y 7→ y 1/3 . (c) Die Funktion cos : [0, π] → [−1, 1] ist bijektiv. Die Umkehrfunktion heißt arccos : [−1, 1] → [0, π]. (d) Die Funktion exp : R → (0, ∞) ist bijektiv. Die Umkehrfunktion heißt log : (0, ∞) → R. Beachte, dass wir mit log der Logarithmus zur Basis e bezeichnen.) 2 Beweismethoden 2.1 Der direkte Beweis und Varianten In diesem Abschnitt beschreiben wir die erste drei Beweismethoden, die Varianten des direkten Beweises sind. Diese Methode beschreiben wir nun als erste. Der direkte Beweis. Ziel ist es eine Ausage der Form A ⇒ B zu beweisen. Der Beweis folgt folgende Schritten: Wir nehmen an, dass die Aussage A gilt. Wir versuchen hier aus die Aussage B abzuleiten. Hierzu benutzt man schon bekannte Sätze und Definitionen. Es gibt kein allgemeines Rezept, wie man dies am Einfachsten macht. Hier hilft nur learning by doing. Wir zeigen das Verfahren an Hand von einige Beispielbeweisen. Wir geben hier nicht nur den Beweis, sondern versuchen auch zu beschreiben, wie man hier vor geht. Dadurch ist der Beweis selbstverständlich viel ausführlicher als beispielsweise im Skript der Vorlesung Lineare Algebra. Als erste betrachten wir die erste Aussage von Satz 1.3.(c). 13 Lemma 2.1 Seien A, B, C Mengen. Dann gilt (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C). Beweis: Die Aussage ist zunächst nicht als Implikation formuliert. Wir benutzen, dass zwei Mengen M und N genau dann gleich sind, wenn M ⊂ N und N ⊂ M (Bemerkung 1.1.(d)). Wir müssen also folgende zwei Aussagen zeigen: (I) (A ∪ B) ∩ C ⊂ (A ∩ C) ∪ (B ∩ C), (II) (A ∪ B) ∩ C ⊃ (A ∩ C) ∪ (B ∩ C). Wir zeigen zunächst (I). Diese Aussage kann man als Implikation auffassen, in dem man (I) zu x ∈ (A ∪ B) ∩ C ⇒ x ∈ (A ∩ C) ∪ (B ∩ C) umformuliert. Jetzt legen wir los mit dem eigentlichen Beweis. Sei x ∈ (A ∪ B) ∩ C ein beliebiges Element, also ist x ∈ A ∪ B und x ∈ C (Dies folgt aus der Definition der Schnittmenge.) Die Definition der Vereinigung impliziert, dass mindestens eine der folgende Aussagen gilt: (i) x ∈ A und x ∈ C, d.h. x ∈ A ∩ C, (ii) x ∈ B und x ∈ C, d.h. x ∈ B ∩ C. Hieraus folgt, dass x ∈ (A ∩ C) ∪ (B ∩ C). Dies beweist (I). Wir zeigen (II). Sei dazu x ∈ (A∩C)∪(B ∩C), d.h. x ∈ A∩C oder x ∈ B ∩C. Wir nehmen an, dass x ∈ A ∩ C. Der andere Fall ist ähnlich. Es gilt x ∈ A und x ∈ C. Die Menge A ist eine Teilmenge von A ∪ B, also ist x ∈ A ∪ B. Wir schließen, dass x ∈ (A ∪ B) ∩ C ist. Dies zeigt (II) und daher die Aussage. ✷ Hier sind einige Bemerkungen zum Struktur des obigen Beweises. Bemerkung 2.2 (a) Am Anfang ist es wichtig genau hinzuschreiben, was man zeigen muss und was bekannt ist. Bei komplizierten Formeln ist es wichtig genau hinzuschreiben, was die einzele Symbole und Begriffe bedeuten. Der obige Beweis ist fast trivial, wenn man alle Definitionen genau hingeschrieben hat. (b) In Teil (II) des obigen Beweises machen wir einen Fallunterscheidung. Hier muss man aufpassen, dass die Fälle alle Möglichkeiten abdecken. (c) Bitte beachten Sie, dass Ihre Übungsblätter von studentischen Hilfkräfte korrigiert werden. Versuchen Sie möglichst klar zu formulieren. Wenn der Korrektor nicht versteht was Sie schreiben, bekommen Sie keine Punkte! Hier ist ein weiteres Beispiel eines direkten Beweises. Die Definition des Urbilds f −1 (Y ) finden Sie in Definition 1.8. 14 Lemma 2.3 Sei f : A → B eine Funktion und seien X1 , X2 ⊂ A und Y1 , Y2 ⊂ B Teilmengen. Dann gilt: (a) f (X1 ) \ f (X2 ) ⊂ f (X1 \ X2 ), (b) f −1 (Y1 \ Y2 ) = f −1 (Y1 ) \ f −1 (Y2 ). Beweis: Wir beweisen zuerst (a). Hierbei gehen wir wie im Beweis von Lemma 2.1. Sei y ∈ f (X1 ) \ f (X2 ). Da y ∈ f (X1 ) ist, existiert ein x ∈ X1 mit f (x) = y. Da y ∈ / f (X2 ), existiert kein x2 ∈ X2 mit f (x2 ) = y. Insbesondere gilt x ∈ / X2 . Also ist x ∈ X1 \ X2 . Wir schließen, dass y ∈ f (X1 \ X2 ) ist. Wir beweisen nun (b). Wir müssen folgende zwei Inklusionen zeigen: (I) f −1 (Y1 \ Y2 ) ⊂ f −1 (Y1 ) \ f −1 (Y2 ), (II) f −1 (Y1 \ Y2 ) ⊃ f −1 (Y1 ) \ f −1 (Y2 ). Wir zeigen zuerst (I). Sei x ∈ f −1 (Y1 \Y2 ). Dies bedeutet, dass f (x) ∈ Y1 \Y2 . Also gilt f (x) ∈ Y1 und f (x) ∈ / Y2 . Dies bedeutet, dass x ∈ f −1 (Y1 ) \ f −1 (Y2 ). Der Beweis von (II) ist ähnlich. ✷. Eine Variante des direkten Beweises ist der indirekte Beweis oder Beweis durch Kontroposition. Wir möchten wieder eine Aussage der Form A ⇒ B beweisen. Mit Hilfe des Kontropositionsgesetzes (Lemma 1.4) können wir dies zu ¬B ⇒ ¬A umformulieren. Wir nehmen an, dass B nicht gilt und versuchen hieraus abzuleiten, dass A auch nicht gilt. Beispiel 2.4 (a) Ein (nichtmathematisches) Beispiel eines indirekten Beweises ist der sogenannte “Alibibeweis”. Frau Z. wird beschuldigt am 01.04.2013 um 23.05 Uhr einen Einbruch auf einem Juweliersgeschäft verübt zu haben. Frau Z. behauptet unschuldig zu sein. Als Beweis führt Sie einen Blitzfoto für den fraglichen Uhrzeit an. Wir betrachten folgende Aussagen: (I) Frau Z. hat am 01.04.2013 um 23.05 Uhr den Einbruch begangen. (II) Frau Z. war am 01.04.2013 um 23.05 Uhr im Juweliersgeschäft. Aussage (I) impliziert (II). Außerdem gilt ¬(II). Hieraus leiten wir ab, dass auch ¬(I) gilt. Frau Z. wird also freigesprochen. (b) Sei n ∈ N. Wir zeigen die Aussage: n2 gerade ⇒ n gerade. Wir nehmen an, dass n ungerade ist, also existiert ein k ∈ N0 mit n = 2k +1. Dann gilt n2 = (2k + 1)2 = 4k 2 + 4k + 1 = 2(2k 2 + 2k) + 1. Also ist auch n2 ungerade. Dies beweist die Aussage. Beachte der Beweis mit dem direkten Beweis. Hier würde man annehmen, dass n2 gerade ist. Dies bedeutet, dass n2 = 2k für ein k ∈ N. Jetzt muss man ausnutzen, dass 2k eine Quadratzahl ist um hieraus abzuleiten, dass n auch gerade ist. Dies ist etwas komplizierter als der entsprechenden indirekten Beweis. 15 Eine dritte Variante ist der Widerspruchsbeweis auch reduktio ad absurdum genannt. Man möchte eine Aussage (I) zeigen. Man nimmt an, dass ¬ (I) gilt und versucht einen Widerspruch abzuleiten. Ein Widerspruch kann z.B. eine falsche Aussage wie 0 = 1 oder A ∧ ¬A sein. Ähnlich wie beim indirekten Beweis folgt hieraus, dass die Annahme ¬ (I) nicht gestimmt haben kann, also ist (I) wahr. Als Beispiel eines Widerspruchsbeweises betrachten wir der Satz von Euklid. Der Beweis benutzt den Fundamentalsatz der Arithmetik, der sagt, dass jede natürliche Zahl n ≥ 2 eine Primfaktorzerlegung besitzt, also als Produkt von Primzahlen geschrieben werden kann. Diese Zerlegung ist eindeutig bis auf Reihenfolge. Dieser Satz wird nächstes Semester in der Vorlesung Elementare Zahlentheorie bewiesen ([1, Theorem 1.2.4], siehe auch Theorem 2.14). Satz 2.5 (Euklid) Es existieren unendlich viele Primzahlen. Beweis: Annahme: Es existieren nur endlich viele Primzahlen. Sei P = {p1 , . . . , pr } die (endliche) Menge aller Primzahlen. Die Zahl 2 ist eine Primzahl, also ist P nicht leer. Sei N := 1 + p1 · p2 · · · pr . Dies ist eine natürliche Zahl größer gleich 2, also besitzt N eine Primfaktorzerlegung. Die Zahlen p1 , . . . , pr sind laut Annahme die einzige Primzahlen. Es existieren also Zahlen ai ∈ N0 , sodass N = pa1 1 · · · par r . Insbesondere teilt mindestens eine der pi die Zahl N . Wir nennen diese Aussage (I). Wir zeigen nun, dass keine der pi die Zahl N teilt. Dies ist die Aussage ¬ (I). Wenn pi | N , dann teilt pi auch N − p1 · p2 · · · pr = 1. Dies gilt aber nicht, da pi ≥ 2 ist. Also ist pi kein Teiler von N . Wir haben nun einen Widerspruch enthalten: Wir haben gezeigt, dass sowohl (I) alsauch ¬ (I) gilt. Wir schließen, dass die Annahme falsch ist. Dies beweist den Satz. ✷ Hier ist ein zweiter Widerspruchsbeweis. Satz 2.6 Es existiert kein x ∈ Q mit x2 = 2. Beweis: Annahme: Es existiert ein x ∈ Q mit x2 = 2. Wir dürfen annehmen, dass x ≥ 0 ist. Falls nämlich ein x ∈ Q mit x ≤ 0 und x2 = 2 existiert, erfüllt y := −x auch y 2 = 2 und außerdem gilt y ≥ 0. Die Zahl y erfüllt also die Anforderungen. Wir nehmen also an, dass x ≥ 0 eine rationale Zahl mit x2 = 2 ist. Offensichtlich ist x 6= 0. Wir können also x = p/q mit p, q ∈ N und p und q teilerfremd schreiben. Es folgt, dass p2 x2 = 2 = 2, q 16 also p2 = 2q 2 . Wir schreiben p = 2i · p′ und q = 2j · q ′ mit p′ , q ′ ungerade. (Hier benutzen wir wieder der Fundamentalsatz der Arithmetik.) Einsetzen in p2 = 2q 2 liefert 2i = 2j + 1. Diese Zahl ist also sowohl gerade als auch ungerade. Dies liefert einen Widerspruch. Die Annahme ist daher falsch und der Satz gezeigt. ✷ Im obigen Beweis steht der Satz “Wir durfen annehmen, dass x ≥ 0 ist.” Ein übliche Kurzform dieses Satzes ist “ oBdA ist x ≥ 0”, hierbei ist oBdA die Abkürzung von “ohne Beschränkung der Allgemeinheit”. In unserem Beweis bedeutet dies, dass wir keine Fallunterscheidung x ≥ 0 und x < 0 machen müssen, sondern, dass es reicht der Fall x ≥ 0 zu betrachten. Im Beweis haben wir begrundet wieso dies reicht. Hier sind noch einige weitere Möglichkeiten einen Beweis zu gestalten. Beweis durch Beweis einer starkeren Aussage. Manchmal ist es leichter eine starkere Aussage zu zeigen, als die, die man eigentlich zeigen möchte. Seien beispielsweise f, g : R → R zwei Funktionen von denen man zeigen möchte, dass für alle x im Definitionsbereich f (x) + sin(x) ≤ g(x) gilt. Dann reicht es zu zeigen, dass f (x) + 1 ≤ g(x), da sin(x) ≤ 1 ist. Die zweite Aussage ist meistens einfacher zu zeigen. Beweis einer Aussage der Form A ∧ B. Hier sollte man die beide Aussagen A und B einzeln zeigen. Beweis einer Aussage der Form A ∨ B. Hier sollte man annehmen, dass eine der beiden Aussagen (beispielsweise A) nicht gilt und zeigen, dass der andere (hier also B) gilt. Ein Beispiel ist der Beweis von Satz 3.7. Beweis einer Aussage der Form A ⇔ B. Hier zeigt man die beide Aussagen: (I) A ⇒ B, (II) B ⇒ A. Möchte man zeigen, dass drei Aussagen A, B, C äquivalent sind, reicht es folgende drei Aussagen zu zeigen: (I) A ⇒ B, (II) B ⇒ C, (III) C ⇒ A. Hat man diese drei Aussagen gezeigt, folgen auch die andere Richtungen. Beispielsweise folgt A ⇒ C aus der Verknüpfung von (I) und (II). Ein grundlegendes Prinzip ist das Schubfachprinzip (Englisch: pigeonhole principle). Es wurde erstmals von den deutschen Mathematiker Dirichlet (1805– 1859) formuliert. Dies ist folgende ziemlich offensichtliche Aussage. Lemma 2.7 (Das Schubfachprinzip) Seien n, m ∈ N mit n > m. Verteilt man n Objekte auf m Mengen, dann enthält mindestens eine der Mengen mehr als ein Objekt. 17 Beweis: Wenn die m Mengen alle höchstens ein Element enthalten, gibt es höchstens m Objekte. Dies widerspricht die Annahme m < n. Die Aussage folgt. ✷ Die folgende Aussage ist eine Anwendung des Schubfachprinzips. Lemma 2.8 Seien N und M endlichen Mengen und sei ϕ : M → N eine Abbildung. Dann ist ϕ genau dann injektiv, wenn ϕ surjektiv ist. Beweis: Übungsaufgabe ✷ 2.2 Vollständige Induktion Vollständige Induktion ist eine Beweismethode, um Aussagen zu zeigen, die von einer natürlichen Zahl n abhängen. Beispiele solcher Aussagen sind: (I) f (n) := n2 − n + 41 ist eine Primzahl für alle n ∈ N0 . (II) 1 + 2 + · · · n = n(n + 1)/2 für alle n ∈ N. Um eine solche Aussage zu zeigen, muss man also für jedes n die Behauptung zeigen. Man kann dies für kleines n einfach nachrechnen, aber nicht für alle n. Wenn die Aussage für kleines n gilt, bedeutet dies nicht, dass die Aussage auch wirklich stimmt: Die erste Aussage stimmt beispielsweise für n = 0, 1, 2, . . . , 40, aber nicht mehr für n = 41, da f (41) = 412 keine Primzahl ist. Das kleinste Gegenbeispiel kann also recht groß sein. Vollständige Induktion beruht auf der folgenden Eigenschaft der natürlichen Zahlen. Das Prinzip des kleinsten Kriminellen Sei S ⊂ N eine nicht-leere Teilmenge. Dann besitzt S ein kleinsten Element. Wir wenden dieses Prinzip an auf der obigen Aussagen (I) und definieren S := {n ∈ N | f (n) ist keine Primzahl} als die Menge der Zahlen n für die Aussage (I) nicht gilt. Das Prinzip des kleinsten Kriminelen sagt, dass es eine kleinste Zahl gibt für die die Aussage nicht gilt, diese Zahl ist also der “kleinste Kriminelle” oder auch das kleinste Gegenbeispiel. In unserem Fall ist dies also n = 41. Allgemein sagt dieses Prinzip also folgendes. Sei A(n) mit n ∈ N eine Folge von Aussagen. Wenn Aussage A(n) nicht für alle n ∈ N gilt, dann gibt es eine kleinste Zahl für die die Aussage nicht gilt. Hieraus leitet sich das Prinzip der vollständigen Induktion ab. Bei vollständigen Induktion zeigt man, dass es keine kleinste Zahl n für die eine Aussage A(n) falsch ist, gibt. Vollständige Induktion. Sei (A(n))n∈N eine Familie von Aussagen. Wir nehmen an, dass folgendes gilt: (IA) A(1) ist wahr. (Induktionsanfang) 18 (IS) Falls A(n) wahr ist, dann ist auch A(n + 1) wahr (Induktionsschritt). Dann ist die Aussage A(n) für alle n wahr. (Induktionsschluss) Wir überlegen uns, wieso das Prinzip der vollständige Induktion aus das des kleinsten Kriminellen folgt. Sei dazu A(n) wie oben. Wir nehmen an, dass (IA) und (IS) gelten. Sei S ⊂ N die Mengen der Zahlen für die A(n) nicht gilt. Wir behaupten, dass S = ∅, also, dass A(n) für alle n wahr ist. Wir nehmen an, dass S 6= ∅. Nach dem Prinzip des kleinsten Kriminellen existiert ein kleinstes Element n ∈ S. Wegen (IA) ist n 6= 1. Also ist A(n) falsch und A(n − 1) wahr. Dies widerspricht (IS). Dies zeigt, dass A(n) für alle n wahr ist. Wir betrachten zunächst ein Beispielbeweis. Lemma 2.9 Für alle n ∈ N gilt 2n > n. Beweis: Sei A(n) die Aussage 2n > n. (IA): Die Aussage A(1) ist wahr, da 21 = 2 > 1. (IS): Wir nehmen an, dass die Aussage A(n) für ein beliebiges n wahr ist, also, dass 2n > n ist. Diese Annahme heißt Induktionshypothese (IH). Es gilt 2n+1 = 2n · 2. Die Induktionshypothese zeigt also, dass I.H. 2n+1 = 2n · 2 > n · 2 = n + n ≥ n + 1. Bei der letzten Abschätzung haben wir benutzt, dass n ≥ 1 ist. Es gilt also die Aussage A(n + 1). Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für alle n ∈ N gilt. ✷ Bemerkung 2.10 (a) Strukturieren Sie bitte Beweise mit Induktion immer so wie vorgegeben, vor allem am Anfang. Geben Sie insbesondere an, wo Sie die Induktionshypothese benutzen. Wenn Sie im Induktionsschritt die Induktionshypothese nicht benutzt haben, haben Sie bestimmt einen Fehler gemacht. (b) Es ist wichtig, dass wir in der Induktionshypothese nichts über n annehmen. Um die Schlußfolgerung zu ziehen müßen wirnämlich die Induktionsschritt für alle n nacheinander anwenden. Hier sind noch zwei weitere Beweisen mit Induktion. Lemma 2.11 geht auf Gauß zurück, der die Aussage für n = 100 im Alter von 7 Jahren gefunden hat (siehe http://www-history.mcs.st-and.ac.uk/Biographies/Gauss.html Lemma 2.11 Für alle n ∈ N gilt 1 + 2 + · · · + n = n(n − 1)/2. 19 Beweis: Sei S(n) die Aussage 1 + 2 + · · · + n = n(n + 1)/2. (I.A.): Die Aussage S(1) ist offensichtlich wahr. (I.S.): Wir nehmen an, dass S(n) für ein beliebiges n gilt. Es gilt I.H. 1 + 2 + · · · + n + (n + 1) = n(n + 1)/2 + (n + 1) = (n + 1)[n/2 + 1] = (n + 1)(n + 2)/2. Also gilt S(n + 1). Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für alle n ∈ N gilt. ✷ Der folgende Satz illustriert, dass die Aussage nicht immer für alle natürliche Zahlen formuliert sein muss. Beachte, dass im unterstehenden Beweis im Induktionsanfang n = 5 genommen wird. Satz 2.12 Für alle n ∈ N≥5 gilt: 2 n > n2 . Wir bemerken, dass die Aussage für n = 1, 2, 3, 4 nicht stimmt. Die Aussage ist also nicht für alle natürliche Zahlen wahr. Vor wir den Beweis der Aussage für n ≥ 5 geben, überlegen wir uns auf einem Schmierzettel zunächst wieso die Aussage stimmt. Der Anfang ist ähnlich wie im Beweis von Lemma 2.9. Sei A(n) die Aussage aus dem Lemma. Wir nehmen an, dass A(n) wahr ist. Es gilt: I.H. 2n+1 = 2n · 2 > 2n2 . Wir müssen zeigen, dass 2n2 > (n + 1)2 = n2 + 2n + 1. Wir ziehen an beiden Seiten n2 ab und sehen, dass es reicht zu zeigen, dass n2 > 2n + 1 ist. Wir beweisen zunächst diese Aussage mit Induktion. Einsetzen von kleinen Werten zeigt, dass die Hilfsaussage auch für n = 3, 4 gilt. Lemma 2.13 Für n ∈ N≥3 gilt, dass n2 ≥ 2n + 1. Wir überlassen den Beweis von Lemma 2.13 als Übungsaufgabe und beweisen nun Satz 2.12. Beweis des Satzes: (I.A.) Für n = 5 gilt: 2n = 25 = 32 > 25 = n2 . (I.S.) Wir nehmen an, dass die Aussage für ein beliebiges n ≥ 5 gilt. Dann gilt: I.H. 2n+1 = 2n · 2 > 2n2 = n2 + n2 Lem. = n2 + 2n + 1 = (n + 1)2 . Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für alle n ∈ N≥5 gilt. ✷ 20 Zum Abschluß dieses Abschnittes beschreiben wir eine alternative Form der vollständigen Induktion. Hier sagt die Induktionshypothese nicht nur, dass die Aussage für ein beliebiges n gilt, sondern, dass die Aussage für alle m kleiner gleich n gilt. Zweite Form der vollständigen Induktion Sei (A(n))n∈N eine Familie von Aussagen. Wir nehmen an, dass folgendes gilt: (IA) A(1) ist wahr. (IS) Ist A(m) für alle m ≤ n wahr, ist auch A(n + 1) wahr. Dann ist die Aussage A(n) für alle n wahr. Als Anwendung zeigen wir die Existenz der Primfaktorzerlegung. Theorem 2.14 (Schwache Form der Fundamentalsatz der Arithmetik) Jeder Zahl n ∈ N≥2 lässt sich als ein Produkt von Primzahlen schreiben. Beweis: Vorbemerkung: Für n eine Primzahl ist die Aussage trivial: Das Produkt besteht nur aus einer Primzahl, nämlich die Zahl selber. (I.A.): Die Aussage stimmt für n = 2, da 2 eine Primzahl ist. (I.S.): Sei n ≥ 2 beliebig. Wir nehmen an, dass die Aussage für alle m ≤ n stimmt. Wir zeigen die Aussage für n + 1. Wir unterscheiden zwei Fälle. Fall I: Die Zahl n + 1 ist eine Primzahl. In diesem Fall folgt aus der Vorbemerkung, dass die Aussage stimmt. Fall II: Die Zahl n + 1 ist keine Primzahl. In diesem Fall existieren Zahlen 1 < m1 , m2 < n + 1 mit n + 1 = m1 · m2 . Dies folgt aus der Definition des Begriffs Primzahl (siehe Appendix A.1). Die Induktionshypothese impliziert, dass m1 und m2 ein Produkt von Primzahlen sind. Also ist auch n + 1 ein Produkt von Primzahlen. Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für alle n ∈ N gilt. ✷ Bemerke, dass die erste Version der Induktion hier nicht weiterhilft, da kein Bezug zwischen der Primfaktorzerlegung von n und von n + 1 besteht. 2.3 Binomialkoeffizienten Als Anwendung der vollständigen Induktion definieren wir in diesem Abschnitt die Binomialkoeffizienten. In den Beweisen der Eigenschaften benutzen wir immer wieder das Prinzip der vollständigen Induktion. Es gilt (1 + x)0 = 1, (2) (1 + x)1 = 1 + x, (1 + x)2 = 1 + 2x + x2 , (1 + x)3 = 1 + 3x + 3x2 + x3 . 21 Hierbei ist x eine Variabele. Die Koeffizienten in diesen Ausdrücke heißen Binomialkoeffizienten, da sie beim Ausmultiplizieren des Binoms (1 + x)n auftreten. Definition 2.15 Seien k, n ∈ N0 Zahlen mit k ≤ n. Wir definieren den Bino mialkoeffizienten nk durch die Gleichung n X n k n n n n (1 + x) = x = + x + ··· + x . k 0 1 n n k=0 Man nennt n k üblicherweise “n über k”. Einige Werte überlegt man sich relativ leicht. Beispielsweise gilt: n n n n = 1, = = n. (3) = n 1 n−1 0 Unser erstes Ziel ist es, eine Ausdruck für die Binomialkoeffizienten zu geben. Dazu werden wir folgendes Lemma benutzen. Die Aussage des Lemmas hängt von zwei Parameter k, n ab. Wir beweisen die Aussage mit Induktion nach n. Die Aussage A(n) ist daher die Aussage (4) für festes n und erlaubte Werte für k. Lemma 2.16 Für n ∈ N und 0 < k ≤ n gilt: n+1 n n (4) = + . k k−1 k Beweis: (I.A.) Sei n = 1. Der einzige erlaubte Wert für k ist k = 1. Aus (2) folgt, dass 21 = 2 und 10 = 11 = 1. Die Aussage stimmt also für n = 1. (I.S.) Wir nehmen an, dass die Aussage gilt für ein beliebiges n und alle 0 < k < n. Wir schreiben (1 + x)n+1 = (1 + x)n (1 + x) n n n n I.H. = + x + ···+ x (1 + x). 0 1 n Der Koeffizient von xk in (1 + x)n+1 ist also n+1 n n = ·1+ · 1. k k−1 k Dies zeigt die Aussage für n + 1 und 0 < k < n. Sei nun k = n. (Der Fall k = n müssen wir getrennt betrachten, da wir hier die Induktionshypothese nicht anwenden können.) In diesem Fall folgt die Aussage aus (3). Die Aussage des Lemmas folgt mit Induktion. ✷ 22 Die Aussage des Lemmas kann man mit Hilfe des Pascalsche Dreieck visualisieren: 1 1 1 1 1 1 2 3 4 1 3 6 .. . . 1 4 1 Das Diagram ist wie folgt aufgebaut. An den Außenseiten stehen 1en. Jede weitere Zahl bekommt man, indem man die zwei schräg darüber stehende Zahlen uisammenzählt. Dies ist genau die Aussage von Lemma 2.16. Das Dreieck wurde nach dem Französischen Mathematiker Blaise Pascal (1623–1662) genannt, siehe http://www-history.mcs.st-andrews.ac.uk/Biographies/Pascal.html. Das Pascalsche Dreieck war der chinesische Mathematiker Chia Hsien, der im 11. Jahrhundert lebte, bekannt. (Siehe http://www-history.mcs.st-andrews.ac.uk/Biographies/Jia Xian.html). Definition 2.17 Sei n ∈ N0 . Wir definieren n! (ausgesprochen n Fakultät) induktiv durch 0! = 1, (n + 1)! = (n + 1) · n!. Die Definition 0! = 1 impliziert, dass folgende Aussage auch für k = 0, n gilt. Satz 2.18 Für alle k, n ∈ N0 mit 0 ≤ k ≤ n gilt: n! n . = k!(n − k)! k Beweis: Wir zeigen die Aussage mit Induktion nach n. (I.A.) Sei n = 0. Der einzige mögliche Wert für k ist k = 0. Die Aussage gilt offensichtlich. (Hier benutzen wir 0! = 1.) (I.S.) Wir nehmen an, dass die Aussage für ein beliebeiger Zahl n und alle 0 ≤ k ≤ n gilt. Wir möchten nun Lemma 2.16 anwenden. Da dieses Lemma nur für 0 < k < n + 1 gilt, betrachten wir zunächst die Fälle k = 0 und k = n + 1 getrennt. Fall I: k = 0, n + 1. Dieser Fall folgt wieder aus (3). Fall II: k 6= 0, n + 1. Sei nun 0 < k < n + 1. Lemma 2.16 zeigt, dass n+1 n n = + . k k−1 k 23 Wir wenden die Induktionshypothese auf den beiden Binomialkoeffizienten auf der rechten Seitenan. Wir schließen, dass n+1 n! n! = + k (k − 1)!(n − k + 1)! k!(n − k)! 1 1 n! + = (k − 1)!(n − k)! n − k + 1 k n! (n + 1)! k+n−k+1 = = . (k − 1)!(n − k)! k(n − k + 1) k!(n + 1 − k)! Dies zeigt die Aussage für n + 1 und 0 < k ≤ n. Die Aussage des Satzes folgt also mit Induktion. ✷ Korrolar 2.19 Seien k, n ∈ N0 mit 0 ≤ k ≤ n. Sei X eine Menge mit n Elemente. Dann ist die Anzahl der Teilmengen Y ⊂ X mit k Elemente gleich n . Insbesondere ist nk ∈ N. k Beweis: Wir beweisen die Aussage mit Induktion nach n. (I.A.): Die Aussage ist offensichtlich richtig für n = 0. (I.S.): Wir nehmen an, dass die Aussage für n1 stimmt. Wir zeigen die Aussage für n + 1. Wir bemerken zunächst, dass die Aussage auch offensichtlich für k = 0 und k = n + 1 richtig ist. Wir durfen also o.B.d.A. annehmen, dass 0 < k < n + 1 ist. Wir schreiben X = {x1 , x2 , . . . , xn+1 }. Wir betrachten alle Teilmengen Y ⊂ X mit k Elemente. Wir unterscheiden zwei Fälle: (a) xn+1 ∈ / Y, (b) xn+1 ∈ Y . In Fall (a) ist Y ⊂ X ′ := X \ {xn+1 } = {x1 , x2 , . . . , xn }. Da |X ′ | = n, können wir die Induktionshypothese anwenden. Wir schließen, dass X genau n+1 Teilmengen Y mit |Y | = k und xn+1 ∈ / Y besitzt. k In Fall (b) ist Y ′ := Y \ {xn+1 } ⊂ X ′ eine Teilmenge mit |Y ′ | = k − 1 n und |X ′ | = n. Die Induktionshypothese impliziert also, dass X ′ genau k−1 n solche Teilmengen besitzt. Wir schließen, dass X genau k−1 Teilmengen Y mit |Y | = k und xn+1 ∈ Y besitzt. Insgesamt besitzt X also n+1 n + k k−1 Teilmengen mit k Elemente. Die Aussage für n + 1 und 0 < k < n + 1 folgt also aus Lemma 2.16. Das Korollar folgt mit Induktion. ✷ 24 3 Äquivalenzrelationen In diesem Kapitel besprechen wir Äquivalenzrelationen. Als Anwendung definieren wir Q und Z/mZ. 3.1 Definition In der Mathematik möchten wir oft Objekten, die nicht gleich sind, doch als gleich betrachten. In der Deutschen Sprache entspricht dies der Unterschied zwischen “dasselbe” und “ das Gleiche”. Wenn zwei Studierenden beide ein Kopie des Skriptes Lineare Algebra besitzen, dann besitzen sie das gleiche Skript, aber nicht dasselbe Exemplar des Skriptes. Ein weiteres Beispiel ist das Konzept von kongruenten Dreiecken. In manche Beweisen der ebenen Geometrie betrachtet man kongruente Dreiecken als gleich, auch wenn es verschiedene Dreiecken sind. Vor wir definieren was eine Äquivalenzrelation ist, betrachten wir zunächst Relationen. Definition 3.1 Seien X und Y Mengen. Eine Teilmenge R ⊂ X × Y heißt Relation. Eine Relation stellt eine Beziehung zwischen Elemente von X und Y her. Ist X = Y , nennen wir R eine Relation auf X ist. Beispiel 3.2 (a) Sei f : X → Y eine Funktion. Der Graph Γf = {(x, y) ∈ X × Y | y = f (x)} von f definiert eine Relation. (b) Das Symbol ≤ definiert eine Relation auf R, nämlich R = {(x, y) ∈ R2 | x ≤ y}. Definition 3.3 Eine Relation R ⊂ M × M heißt Äquivalenzrelation, wenn folgende drei Bedingungen erfüllt sind: Ä1 ∀x ∈ M (x, x) ∈ R (Reflexivität), Ä2 (x, y) ∈ R ⇒ (y, x) ∈ R (Symmetrie), Ä3 (x, y), (y, z) ∈ R ⇒ (x, z) ∈ R (Transitivität). Ist R eine Äquivalenzrelation, schreiben wir x ∼ y anstatt (x, y) ∈ R (ausgesprochen: x ist äquivalent zu y). Beispiel 3.4 (a) Die Relation ≤ aus Beispiel 3.2.(b) ist keine Äquivalenzrelation: Die Relation ist reflexiv und transitiv, aber nicht symmetrisch. Die Relation ≤ ist antisymmetrisch. Dies bedeutet, dass aus (x, y) ∈ R und (y, x) ∈ R folgt, dass x = y ist. Für die Relation ≤ gilt sogar folgende stärkere Eigenschaft: Ist x 6= y dann gilt immer entweder x ≤ y oder y ≤ x. 25 (b) Sei f : X → Y eine Funktion. Wir definieren eine Äquivalenzrelation auf X durch x ∼ x′ genau dann, wenn f (x) = f (x′ ). Überprüfen Sie, dass dies in der Tat eine Äquivalenzrelation ist. (c) Sei L ⊂ R2 eine Gerade durch dem Ursprung (0, 0). Dann ist L ein Untervektorraum von R2 . Wir definieren eine Relation auf R2 durch v ∼ w genau dann, wenn v−w ∈ L. Wir zeigen, dass dies eine Äquivalenzrelation ist. Hierbei benutzen wir, dass L ⊂ R2 ein Untervektorraum ist. ∗ v − v = (0, 0) ∈ L für alle v ∈ R2 , also ist ∼ reflexiv. ∗ Sei v ∼ w, also v − w ∈ L. Dann ist w − v = −(v − w) auch in L, also w ∼ v. Dies zeigt, dass ∼ symmetrisch ist. ∗ Sei v ∼ w und w ∼ u, also v − w ∈ L und w − u ∈ L. Dann ist auch v − u = (v − w) + (w − u) ∈ L, also v ∼ u. Dies zeigt, dass ∼ transitiv ist. Definition 3.5 Sei ∼ eine Äquivalenzrelation auf einer Menge M und sei a ∈ M . Die Äquivalenzklasse Ca von a ist die Menge alle Elemente b ∈ M mit b ∼ a. Wir schreiben M/ ∼ für die Menge der Äquivalenzclasses. Beispiel 3.6 (a) Wir betrachten die Äquivalenzrelation aus Beispiel 3.4.(b). Sei x ∈ X und y = f (x). Die Äquivalenzklasse von x ist das Urbild f −1 (y) von y. Die Menge R2 / ∼ der Äquivalenzklassen kann man mit dem Bild f (X) identifizieren. (b) Die Äquivalenzklassen der Äquivalenzrelation aus Beispiel 3.4.(c) sind die Geraden in R2 parallel zu L. Wir sehen, dass in beiden Fällen aus obigen Beispiel die Menge eine disjunkte Vereinigung der Äquivalenzklassen ist. Der folgende Satz sagt, dass dies immer der Fall ist. Satz 3.7 Sei ∼ eine Äquivalenzrelation. Zwei Äquivalenzklassen sind entweder gleich oder disjunkt. Beweis: Seien Ca und Cb zwei Äquivalenzklassen. Wir nehmen an, dass Ca und Cb nicht disjunkt sind. Wir müssen zeigen, dass Ca = Cb . (Vergleichen Sie die Diskussion zu Beweis einer Aussage der Form A ∨ B in Abschnitt 2.1.) Da Ca ∩ Cb 6= ∅, existiert ein Element c ∈ Ca ∩ Cb . Also gilt c ∼ a und c ∼ b. Aus der Symmetrie der Äquivalenzrelation folgt auch a ∼ c. Behauptung I: Ca ⊂ Cb . Sei d ∈ Ca , also d ∼ a. Aus der Transitivität und die Tatsache a ∼ c folgt, dass auch d ∼ c. Mit c ∼ b folgt jetzt d ∼ b, also d ∈ Cb . Dies zeigt die Behauptung. 26 Behauptung II: Cb ⊂ Ca . Diese Behauptung folgt ähnlich. (Vertausche a und b im Beweis von Behauptung I.) Behauptungen I+II zeigen, dass Ca = Cb und der Satz folgt. ✷ 3.2 Die ganze und rationale Zahlen Wir konstruieren daraus die ganze und die rationale Zahlen aus den natürlichen Zahlen N = {1, 2, 3, . . .}. Wir benutzen dabei die Ergebnisse von Abschnitt 3.1 und geben so weitere Beispiele von Äquivalenzrelationen. Die Konstruktion erläutert wie man in der Mathematik aus bekannten Objekte neuen konstruieren kann. Obwohl diese Konstruktion vieleicht etwas kompliziert aussieht, liefert dies die “gleiche” Zahlen wie aus der Schule bekannt. Konstruktion der ganzen Zahlen Um die ganzen aus den natürlichen zahlen zu konstruieren, bemerken wir, dass wir zwei natürliche Zahlen zwar immer addieren aber im Allgemeinen nicht subtrahieren können. Wir möchten die natürliche Zahlen daher so erweitern, dass die Subtraktion immer möglich ist. Dazu betrachten wir die Differenz zweier natürlichen Zahlen. Wir definieren eine Äquivalenzrelation ∼Z auf der Menge N × N durch (a, b) ∼ (c, d) ⇔ a + d = b + c. Man überprüft leicht, dass dies in der Tat eine Äquivalenzrelation ist. Zwei Paaren (a, b) und (c, d) natürlicher Zahlen sind genau dann äquivalent, wenn a − b = c − d. Insbesondere ist (a, b) zu alle Paaren (a + x, b + x) für x ∈ N äquivalent. Die Äquivalenzklasse C(a,b) eines Paares (a, b) kann man also mit dem Differenz a − b identifizieren. Wir schreiben N2 / ∼Z für die Menge der Äquivalenzklassen. Wir identifizieren die Elemente dieser Menge mit den uns bekannten ganzen Zahlen durch die Zuordnung ψ : Z → N2 / ∼ Z , x 7→ C(x+y,y) . Hierbei ist y = y eine natürliche Zahl, sodass x + y > 0 ist. Bemerke, dass die Äquivalenzklasse C(x+y,y) nicht von der Wahl von y abhängt, da (x + y, y) ∼ (x + y ′ , y ′ ). Außerdem ist ψ offenichtlich eine Bijektion. (Die Umkehrabbildung schickt C(a,b) auf der ganzen Zahl a − b.) Die bekannte Strukturen +, −, ·, < auf Z kann man auch in Termen dieser Definition einführen. Beispielsweise ist die Subtraktion zweier Äquivalenzklassen definiert als C(a,b) − C(c,d) = C(a−c,b−d) . Da (a − b) − (c − d) = (a − c) − (b − d) entspricht dies die übliche Subtraktion auf Z. Wir sehen, dass die Äquivalenzklasse von (a, b) also in der Tat die Differenz der ganzen Zahlen a und b entspricht. Wir verzichten hier auf der Diskussion der anderen Operationen. Konstruktion der rationalen Zahlen Wir konstruieren die rationalen Zahlen aus den ganzen Zahlen. Wir möchten 27 die ganzen Zahlen so erweitern, dass man durch jede ganze Zahl b 6= 0 teilen kann. Sei M = {(a, b) ∈ Z2 | b 6= 0}. Wir definieren eine Äquivalenzrelation auf M , sodass die Äquivalenzklasse des Paares (a, b) die Zahl a/b entspricht. Die Definition der Äquivalenzrelation ist motiviert durch die Beobachtung, dass zwei Brüche a/b und c/d genau dann die gleiche rationale Zahl definieren, wenn ad = bc. Dies sieht man am Einfachsten, wenn man die Differenz auf einem Hauptnenner bringt: a c ad − bc − = . b d bd Wir definieren eine Äquivalenzrelation ∼Q auf M durch (a, b) ∼Q (c, d) ⇔ ad = bc. Dies ist in der Tat eine Äquivalenzrelation. Die Reflexivität und Symmetrie sind offensichtlich. Wir überprüfen die Transitivität. Dazu nehmen wir an, dass (a, b) ∼Q (c, d) und (c, d) ∼Q (e, f ). Dies bedeutet, dass ad = bc und cf = de. Hieraus folgt, dass adcf = bcde. Ist cd 6= 0, dann folgt, dass af = be, also (a, b) ∼ (e, f ). Betrachten wir also den Fall, dass cd = 0 ist. Da d 6= 0, folgt c = 0. Aus ad = bc und b 6= 0 folgt, dass a = 0. Ebenso folgt aus cf = de und d 6= 0, dass e = 0. In diesem Fall gilt also auch, dass af = be(= 0), also (a, b) ∼ (e, f ). Dies zeigt die Transitivität. Die rationale Zahl a/b ∈ Q entspricht nun also die Äquivalenzklasse des Paares (a, b). Wir bemerken, dass jede Äquivalenzklasse x ∈ Q ein eindeutiger Representant (a, b) mit a ∈ Z und b ∈ N und ggT(a, b) = 1 enthält. 3.3 Kongruenzen Definition 3.8 Sei m ∈ N. Zwei Zahlen a, b ∈ Z heißen kongruent modulo m, wenn m | (a − b). (Bezeichnung: a ≡ b (mod m).) Die Zahl m heißt Modul der Kongrenz. Die Bedingung m | (a − b) bedeutet, dass eine ganze Zahl k mit a = b + km existiert. Dies ist äquivalent zu der Aussage, dass a und b den gleichen Rest nach Division durch m haben. Beispielsweise ist 200 ≡ 11 (mod 9), da 200 = 11 + 9 · 21. Alternativ haben 200 und 11 beide den Rest 2 nach Division durch 9. Lemma 3.9 Kongruenz modulo m ist eine Äquivalenzrelation. Beweis: Übungsaufgabe. ✷ Definition 3.10 Wir bezeichnen mit Z/mZ die Mengen der Äquivalenzklassen der Kongruenz modulo m. Diese Äquivalenzklassen nennen wir Kongruenzklassen. Wenn m aus der Kontext klar ist, schreiben wir oft ā für die Kongruenzklasse von a. 28 Jede Zahl a ∈ Z ist kongruent modulo m zu seiner Rest r nach Division durch m. Die Rest erfüllt 0 ≤ r < m (Appendix A.1). Zwei verschiedene Zahlen r1 , r2 aus der Menge {0, 1, . . . , m − 1} sind zu Einander nicht kongruent modulo m. Dies zeigt, dass Z/mZ = {0, 1, . . . , m − 1}. Insbesondere ist die Kardinalität von Z/mZ genau m. Eine Menge von Zahlen a0 , . . . , am−1 , sodass jede ganze Zahl kongruent (modulo m) zu genau einer dieser Zahlen ist, heißt vollständiges Restsystem (mod m). Die Zahlen 0, 1, . . . , m − 1 bilden ein vollständiges Restsystem (mod m). Beispiel 3.11 Sei m = 4. Es gilt 0 = {. . . , −8, −4, 0, 4, . . .}, 1 = {. . . , −7, −3, 1, 5, . . .} 2 = {. . . , −6, −2, 2, 6, . . .} 3 = {. . . , −5, −1, 3, 7, . . .}. Wir bemerken, dass −2, −1, 0, 1 auch ein vollständiges Restsystem (mod 4) ist. Addition (bzw. Multiplikation) ganzer Zahlen definiert auch eine Addition (bzw. Multiplikation) auf Z/mZ durch ¯ b, ā + b̄ := a + ¯ ā · b̄ := ab. Wir zeigen, dass die Addition und Multiplikation) wohldefiniert sind. Dies bedeutet, dass die Addition und Multiplikation nicht von den gewählten Representanten der Kongruenzklassen abhängen. Seien a ≡ a′ (mod m) und b ≡ b′ (mod m). Dann existieren Zahlen k, ℓ, sodass a′ = a + km, b′ = b + ℓm. Also ist a′ + b′ = (a + b) + (k + ℓ)m ≡ a + b (mod m), a′ · b′ = (a + km)(b + ℓm) = ab + (aℓ + bk + kℓ)m ≡ ab (mod m). Dies zeigt, dass a + b und a′ + b′ (bzw. ab und a′ b′ ) die gleiche Kongruenzklasse (mod m) definieren. Das folgende Lemma gibt eine Anwendung von Modulorechnen. Dazu betrachten wir die Darstellung einer natürlichen Zahl n im 10ersystem mit Ziffern ai ∈ {0, 1, . . . , 9} als n = (ak ak−1 · · · a2 a1 a0 )10 = ak · 10k + ak−1 · 10k−1 + · · · + a2 · 102 + a1 · 10 + a0 . 29 Lemma 3.12 (Dreierregel) Die Zahl n = (ak ak−1 · · · a2 a1 a0 )10 ist genau dann durch 3 teilbar, wenn die Quersumme Q(n) := k X i=0 ai ≡ 0 (mod 3) ist. Beweis: Wir bemerken, dass 10 ≡ 1 (mod 3). Daher ist n = ak · 10k + ak−1 · 10k−1 + · · · + a2 · 102 + a1 · 10 + a0 ≡ ak · 1k + ak−1 · 1k−1 + · · · + a2 · 12 + a1 · 1 + a0 = Q(n) (mod 3). Dies impliziert, dass n genau dann durch 3 teilbar ist, wenn Q(n) durch drei teilbar ist. ✷ 4 Grenzwerte und die Definition der reellen Zahlen In diesem Kapitel definieren wir die reellen Zahlen, ausgehend von den rationalen Zahlen. Wir besprechen diese Definition relativ ausführlich um zu illustrieren wie man die Konzepte der Mathematik systematisch aufbauen kann. Wir werden sehen, dass dies ziemlich mühsam ist. Wenn wir im Studium die Grundlagen der Mathematik systematisch würden, würden man nicht besonders weit kommen. Außerdem wäre da Studium dann relativ langweilig, da man sich hauptsächlich mit formalen Argumenten befassen würden. Ein beschränktes Thema, wie die Definition der reellen Zahlen, kann tatsächlich systematisch aufgebaut worden. In diesem Kapitel geben wir hiervon einen kleinen Ausschnitt. √ In der Schule haben Sie gelernt mit nichtrationalen Zahlen wie 2 und π zu rechnen. Historisch gesehen sind diese Zahlen weniger selbstverständlich, als wir vieleicht denken. √ In der klassischen griechischen Mathematik verursachte die Entdeckung, dass 2 keine rationale Zahl ist (Satz 2.6), große Verwirrung. Hier finden Sie mehr zur Geschichte der reellen Zahlen: http://www-history.mcs.st-andrews.ac.uk/HistTopics/Real numbers 1.html. Die moderne Definition der reellen Zahlen beruht auf dem Begriff der Grenzwert: Reelle Zahlen werden definiert als Grenzwerte von Folgen rationaler Zahlen. In diesem Kapitel befassen wir uns daher zunächst mit diesem Begrif. Im ersten Abschnitt betrachten wir zunächst eine historische Definition des Grenzwertes. √ 4.1 Berechnung von Quadratwurzeln Wir haben gesehen, dass 2 eine irrationale Zahl ist (Satz 2.6). Für konkreten Berechnungen ist es daher hilfreich diese Zahl durch eine geeignete rationale Zahl anzunähern. In diesem Abschnitt besprechen wir das Heron-Verfahren zur Berechnung von Näherungswerte von 30 Quadratwurzeln. Dieses Verfahren ist nach dem Mathematiker Heron (Alexandrien, Egypten, ∼ 10–75) benannt (Siehe http://www-history.mcs.st-and.ac.uk/Biographies/Heron.html). Die Methode war aber schon babylonischen Mathematiker etwa 2000 vor Chr. bekannt. Diese Methode ist im Wesentliche ein Spezialfall der Newton-Methode, die in der Vorlesung Numerik I besprochen wird. Die Methode wird heute immer noch benutzt, obwohl sie schon 4000 Jahren alt ist! Sei a ∈ Q>0 die Zahl wovon wir die Quadratswurzel annähern möchten. Wir fangen an mit irgendeinem Näherungswert x0 6= 0 der gesuchten Quadratwurzel. Heron betrachtete a ∈ N und wählte die kleinste Quadratzahl großer gleich a. Die Methode funktioniert aber für beliebigen√Startwerte. Wir definieren induktiv Näherungen für a durch der Forschrift 1 a a + x2n (5) xn+1 = xn + = . 2 xn 2xn Wir scheiben (xn )n≥0 für die Folge der Näherungen. Als √ Beispiel wählen wir a = 2 und Startwert x0 = 1. Die erste Näherungen für 2 sind 1 2 3 x1 = 1+ = , 2 1 2 17 2 1 3 = + = 1, 4166 . . . x2 = 2 2 3/2 12 1 17 577 2 x3 = = + = 1, 4142156 . . . 2 12 17/12 408 √ Da 2 = 1, 41421356 . . . sehen wir, dass schon nach der zweiten Iteration des Verfahrens die erste drei Stellen richtig sind. Nach der dritten Iteration sind sogar die erste 6 Stellen richtig. In der Praxis funktioniert dieses Verfahren immer sehr schnell. (Man kann hier eine genaue Aussage zeigen, aber darauf verzichten wir in dieser Vorlesung.) Wir erklären √ die Idee hinter die Methode. Einfachheitshalber nehmen wir an, dass 1 ≤ x0 < a =: b ist. Dann ist b2 = a die Flächeninhalt eines Quadrats Qa mit Seitenlänge b. Der Rechteck R0 mit Seitenlängen x0 und a/x0 hat ebenfalls Flächeninhalt a. Unsere Annahme impliziert, dass x0 < a/x0 . Dieses Rechteck ist unsere erste Näherung des Quadrats Qa . Um eine bessere Näherung zu bekommen, ersetzen wir x0 durch dem Mittelwert a 1 x0 + x1 = 2 x0 der Seitenlängen. Wir bemerken, dass √ a a 1 ≤ x0 < < b = a < x1 < . x1 x0 Im konkreten Fall ist dies klar. Im allgemeinem Fall folgt dies aus der Annahme 1 ≤ x0 ≤ b. 31 a/x0 R0 a/x1 R1 x0 x1 Abbildung 1: Das Heron–Verfahren Das Rechteck R1 mit Seitenlängen x1 und a/x1 ist eine bessere Näherung für dem Quadrat Qa (siehe Abbildung 1). Ebenso ist x1 eine bessere Näherung für dem Quadratwurzel b als x0 . Wiederholt man das Verfahren, wird die Näherung immer besser. Die obige Betrachtung erläutert die Idee hinter das Heron-Verfahren. So ähnlich könnte Heron es sich auch überlegt haben. Die mathematische Aussage, die man zeigen möchte ist “die Folge (xn )n∈N0 konvergiert zur Grenzwert b”. Dies bedeutet nicht nur, dass unsere Näherungen immer besser werden, sondern auch, dass mann jede erwünschte Genauigkeit erreicht, wenn man das Verfahren oft genug wiederholt. Das ist nicht das gleiche, also zu sagen, dass die erhaltene Näherung immer besser wird. Auch wenn die Näherung immer besser wird, könnte es sein, dass der Zuwachs an Genauigkeit irgendwann so klein ist, dass egal wie Lange man rechnet, nie wieder eine neue Nachkommastelle richtig wird. Bei dem Heron–Verfahen ist dies nicht der Fall. Man kann zeigen, dass sich die Anzahl der Stellen, die schon richtig sind, in jedem Schritt verdoppelt. In der Numerik nennt man dies quadratische Konvergenz. Wir zitieren nun die Beschreibung des Verfahren durch Heron (zitiert nach de √ Mactutor-Webseite). Heron berechnet eine Näherung für 720. Er identifiziert diese Zahl mit dem Quadrat Q720 mit Flächeninhalt 720. Anstatt die Formel (5) zu geben, beschreibt Heron die benötigte Rechenschritte. Variabele und das Gleichheitszeichen waren in Herons Zeit noch nicht erfunden. Heron macht zwar keine genaue Aussage darüber, √ wie viel die Näherung in jedem Schritt besser wird, aber er bemerkt, dass | a − xi | in jedem Schritt “viel besser” wird. Er war sich dieser zentralen Punkt also sehr wohl bewußt. Since 720 has not its side rational, we can obtain its side within a very small difference as follows. Since the next succeeding square number is 729, which has 27 for its side, divide 720 by 27. This gives 26 2/3. Add 27 to this, making 53 2/3, and take half this or 26 5/6. The side of 720 will therefore be very nearly 26 5/6. In fact, if we multiply 26 5/6 by itself, the product is 720 1/36, so the difference in the square is 1/36. If we desire to make the difference 32 smaller still than 1/36, we shall take 720 1/36 instead of 729 (or rather we should take 26 5/6 instead of 27), and by proceeding in the same way we shall find the resulting difference much less than 1/36. Im nächsten Abschnitt geben wir eine genaue Definition der Folgenkonvergenz. 4.2 Definition des Grenzwerts Definition 4.1 Eine (reelle) Folge ist eine Abbildung N → R, n 7→ xn . Bezeichnung: (xn )n∈N . Beispiel 4.2 Wir betrachten die Folge definiert durch n 1 (6) an = 1 + . n Beispielsweise ist a1 = 2, a2 = 2, 25, a10 = 2, 5937·, a100 = 2, 7048 · · · , a1000 = 2, 7169 · · · . Man kann zeigen, dass diese Folge die eulersche Zahl e annähert. Diese Zahl ist sogar als Grenzwert der Folge definiert. Obige Werte zeigen, dass die ai die eulersche Zahl nur sehr langszam nähern. Folgende Definition formalisiert die intuitive Idee, dass die Glieder xn einer Folge sich den Grenzwert b immer besser annähern. Hier finden Sie ein Lied zur Definition: http://www.haverford.edu/astronomy/songs/lehrer/delta.htm Definition 4.3 Eine Folge (xn )n∈N heißt konvergent mit Grenzwert b falls (7) ∀ǫ > 0 ∃N ∈ N ∀n ≥ N |xn − b| < ǫ. Bezeichnung limn→∞ xn = b oder auch xn → b. Die Menge Bǫ (b) := {x ∈ R | |x − b| < ǫ} = (b − ǫ, b + ǫ) ist ein Interval um b. Dieses Interval ist nicht-leer, wenn ǫ wie in Definition 4.3 größer Null ist. Falls ǫ sehr klein ist, bedeutet xn ∈ Bǫ (b) also, dass xn eine sehr gute Näherung von b ist. Definition 4.3 sagt daher, dass für ǫ > 0, also insbesondere für sehr kleine Werte, wir ein N finden, sodass alle xn mit n ≥ N sehr gute Näherungen von b sind. Nicht nur ist xN eine gute Näherung, aber für alle größere n wird der Näherung xn nicht mehr wesentlich schlechter. Diese Eigenschaft gilt für 33 beliebig kleine ǫ > 0. Dies bedeutet, dass die Folgeglieder den Wert b beliebig gut annähern. Es ist wichtig die Reihenfolge der Quantoren in der Definition zu beachten. Der Wert N aus (7) wird in Abhängigkeit von ǫ gewählt. Manchmal schreiben wir daher auch N = N (ǫ) um die Abhängigkeit von ǫ zu betonen. Selbstverständlich muss man N um so größer wählen, um so kleiner ǫ ist. Die Aussage ∀ǫ > 0 ∃N ∈ N ∀n ≥ N |xn − b| < ǫ bedeutet, dass die Folge ab dem Wert N konstant ist, d.h. xn = b ∀n ≥ N . Dies sieht man wie folgt. Für n ≥ N gilt die Ungleichung |xn −b| < ǫ für alle ǫ > 0. Dies bedeutet aber, dass xn in der Schnittmenge der Intervalle (b − ǫ, b + ǫ) liegt. Diese Schnittmenge enthält nur b, also ist xb = b. Beispiel 4.4 (a) Wir definieren eine Folge an = 1/n für n ∈ N. Diese Folge konvergiert gegen a = 0. Wir zeigen dies mit Hilfe von Definition 4.3. Wir müssen uns überlegen, wie wir N in Abhänhigkeit von ǫ wählen sollen. Dazu betrachten wir zunächst folgende Hilfsrechnung: 1 − 0 = 1 < ǫ ⇔ n > 1 . n n ǫ Damit also |an − a| < ǫ ist, soll n größer als 1/ǫ sein. Wir wählen daher 1 + 1. N= ǫ Hierbei sind [·] die Gauß-Klammer, siehe Appendix A.2. Selbstverständlich könnte man N auch noch größer wählen. Jetzt schreiben wir den Beweis so auf, wie Sie dies auf dem Übungsblatt machen sollten. Sei ǫ > 0 beliebig. Wähle N = [ 1ǫ ] + 1. Dann gilt für alle n ≥ N , dass 1 − 0 = 1 ≤ 1 < ǫ. n n N Also konvergiert die Folge (an )n∈N mit Grenzwert 0. (b) Wir betrachten nun die Folge definiert durch bn = (−1)n für alle n ∈ N. Wir möchten mit Hilfe von Definition 4.3 zeigen, dass diese Folge nicht konvergiert, also divergiert. Wir möchten also zeigen, dass keine Zahl b existiert, sodass die Folge konvergiert mit Grenzwert b. Überlegen Sie sich, dass wir folgende Aussage zeigen müssen (vergleich Lemma 1.6): ∀b ∈ R ∃ǫ > 0 ∀N ∈ N ∃n ≥ N |an − b| > ǫ. Sei b ∈ R beliebig. Wir nehmen zuerst an, dass b 6= 1. Dann ist |a2m − b| = |1 − b| 6= 0. Wähle ǫ = |1 − b|/2. Für beliebiges N ∈ N existiert eine gerade 34 Index n = 2m > N . Für ein solches n gilt also |an − b| > ǫ. Der Beweis für b = 1 ist ähnlich, aber dieses Mal betrachten wir die Folgeglieder a2m+1 = −1. (c) Wir betrachten die Folge cn = 1−10−n = 0, 9 · · · , 9. (Die Zahl cn enthält n − 1 Nachkommastellen 9.) Wir zeigen, dass die Folge (cn )n≥2 konvergent mit Grenzwert 1 ist. Sei ǫ > 0 beliebig. Wähle N = [max(0, − log10 (ǫ))] + 1. Es gilt also, das N eine natürliche Zahl mit N > − log10 (ǫ) ist. Für alle n ≥ N gilt daher, dass |cn − 1| = 10−n ≤ 10−N < 10log10 (ǫ) = ǫ. Hier haben wir benutzt, dass −N < log10 (ǫ) ist. In der Vorlesung Analysis I werden Sie verschiedene Kriterien lernen, um Konvergenz einer Folge zu überprüfen und Rechenregel um Grenzwerte von konvergente Folgen zu bestimmen. Das folgende Lemma gibt eine erste solche Rechenregel. Lemma 4.5 Seien (an )n∈N und (bn )n∈N konvergente Folgen mit lim = a, lim bn = b. n→∞ n→∞ Dann sind die Folgen (an ± bn )n und (an · bn )n auch konvergent mit Grenzwert a ± b und a · b. Beweis: Wir beweisen die Aussage für (an − bn ) und überlassen die andere Teile als Übungsaufgabe. Wir bemerken, dass |(an − bn ) − (a − b)| = |(an − a) − (bn − b)| ≤ |an − a| + |bn − b| wegen der Dreiecksungleichung (Appendix A.2). Sei ǫ > 0 beliebig. Definition 4.3 impliziert, dass Zahlen N1 , N2 mit |an − a| < ǫ/2 |bn − b| < ǫ/2 ∀n ≥ N1 , ∀n ≥ N2 . Wir wählen N = max(N1 , N2 ). Dann gilt für n ≥ N , dass |(an − bn ) − (a − b)| ≤ |an − a| + |bn − b| ≤ Also ist (an − bn )n konvergent mit Grenzwert a − b. ǫ ǫ + = ǫ. 2 2 ✷ 4.3 Cauchy-Folgen Um Definition 4.3 anwenden zu können, ist es notwendig den Grenzwert der Folge zu kennen. Dies ist nicht immer praktikabel. Beispielsweise möchten wir die eulersche Zahl e als Grenzwert der Folge (6) definieren. Wir können e also nicht im Beweis der Konvergenz der Folge benutzen. In diesem Abschnitt besprechen wir ein alternatives Kriterium zur Überprüfung der Konvergenz einer Folge, dass der Grenzwert nicht benutzt. 35 Definition 4.6 Eine (reelle) Folge (an )n∈N heißt Cauchy–Folge, wenn ∀ǫ > 0 ∃N ∈ N ∀n ≥ N ∀p ∈ N |an+p − an | < ǫ. In Definition 4.6 vergleichen wir an mit allen folgenden Folgeglieder an+p anstatt mit dem Grenzwert wie wir es in Definition 4.3 taten. In einer CauchyFolge nähern sich die Folgeglieder also beliebig gut an. Der folgende Satz zeigt, dass jede konvergente Folge auch eine Cauchy–Folge ist. Die Umkehrung gilt auch. Der Beweis der Umkehrung benutzt die Definition der reellen Zahlen, die wir im Abschnitt 4.4 diskutieren (siehe Satz 4.19). Mehr Details werden nächstes Semester in der Vorlesung Analysis I besprochen. Satz 4.7 Sei (an )n∈N eine konvergente Folge. Dann ist (an )n∈N eine Cauchy– Folge, Wir besprechen zuerst ein Lemma, dass im Beweis von Satz 4.7 benutzt wird. Definition 4.8 Eine Folge (an )n∈N heißt beschränkt, wenn C ∈ R mit |an | ≤ C existiert. Die Bedingung aus Definition 4.8 bedeutet, dass die an im Interval [−C, C] liegen und nicht daher beliebig groß oder beliebig klein werden, wenn n gegen unendlich strebt. Die Zahl C (bzw. −C) heißt obere (bzw. untere) Schranke der Folge. Lemma 4.9 Jede konvergente Folge ist beschränkt. Beweis: Sei (an )n∈N eine konvergente Folge mit Grenzwert a. Sei ǫ = 1. Die Konvergenz der Folge impliziert die Existenz einer Zahl N mit |an − a| < ǫ = 1 für alle n ≥ N . Für n ≥ N gilt also −1 + a < an < 1 + a. Dies zeigt, dass (8) |an | ≤ max(|a − 1|, |a + 1|), ∀n ≥ N. Die Menge M := {a1 , . . . , aN −1 } ist endlich und besitzt deswegen auch ein größtes Element. Sei aj das Maximum von M . Insbesondere gilt (9) ai ≤ aj für i = 1, . . . , N − 1. Wir definieren C = max(|a − 1|, |a + 1|, aj ). Gleichungen (8) und (9) implizieren, dass |an | ≤ C, ∀n ∈ N. Also ist die Folge beschränkt. ✷ Lemma 4.9 zeigt, dass Beschränktheit eine notwendige Bedingung für die Konvergenz ist. Beispielsweise ist die Folge (n)n∈N nicht beschränkt und also auch nicht konvergent. (Der Grenzwert in Definition 4.3 ist eine reelle Zahl, ∞ ist hier als Grenzwert nicht erlaubt.) 36 Beschränktheit ist nicht hinreichend für Konvergenz. Beispielsweise ist die Folge ((−1)n )n∈N beschränkt, aber nicht konvergent. Wir zeigen nun Satz 4.7. Beweis des Satzes: Sei (an )n eine konvergente Folge mit Grenzwert a und sei ǫ > 0 beliebig. Da die Folge konvergent ist, existiert ein N > 0, sodass |an − a| < ǫ , 2 ∀n ∈ N. (Man sollte den zu ǫ/2 gehörige Wert N = N (ǫ/2) wählen.) Sei nun n ≥ N und p ∈ N. Es gilt n + p > n ≥ N , also |an+p − an | = |an+p − a + a − an |. Aus der Dreieckungleichung folgt |an+p − an | ≤ |an+p − a| + |a − an | < ǫ ǫ + = ǫ. 2 2 Dies zeigt, dass (an )n eine Cauchy–Folge ist. ✷ 4.4 Definition der reellen Zahlen In diesem Abschnitt geben wir eine formale Definition der reellen Zahlen. In Abschnitt 4.1 haben wir die Folge 2 1 xn−1 + x0 = 1, xn = 2 xn−1 definiert. Für jedes n ∈ N ist √ die Näherung xn eine rationale Zahl. Der Grenzwert der Folge (xn )n∈N ist aber 2 was keine rationale Zahl ist (Satz 2.6). Wir sagen, dass Q unvollständig ist: Es existieren konvergente Folgen rationaler Zahlen, die kein Grenzwert in Q besitzen. Wir möchten die reelle Zahlen als Grenzwerte solcher Folgen konstruieren. Da Definition 4.6 Bezug auf den reellen Zahlen nimmt, passen wir die Definition etwas an. Die Ergebnisse aus Abschnitt 4.3 übertragen sich. Definition 4.10 Eine Folge (an )n∈N mit an ∈ Q für alle n heißt rationale Cauchy–Folge, wenn ∀ǫ ∈ Q>0 ∃N ∈ N ∀n ≥ N ∀p ∈ N |an+p − an | < ǫ. Wir schreiben CF für die Menge der rationalen Cauchy–Folgen. Es existieren mehrere Cauchy–Folgen mit dem gleichen Grenzwert, diese müssen wir mit Hilfe einer geeigneten Äquivalenzrelation auf CF identifizieren. Definition 4.11 Eine (rationale) Nullfolge ist eine (rationale) Cauchy–Folge mit Grenzwert 0. 37 Beispielsweise ist (1/n)n∈N eine Nullfolge. Wir definieren eine Äquivalenzrelation auf die Menge CF durch (an )n∈N ∼R (bn )n∈N ⇔ (an − bn )n∈N eine Nullfolge ist. Sind (an )n und (bn )n konvergente Folgen mit Grenzwert a und b, dann sagt Lemma 4.5, dass (an − bn )n eine konvergente Folge mit Grenzwert a − b ist. Die konvergente Folgen (an )n und (bn )n sind also genau dann äquivalent, wenn sie den gleichen Grenzwert haben. Lemma 4.12 Die Relation ∼R ist eine Äquivalenzrelation. Beweis: Seien (an )n und (bn )n rationale Cauchy–Folgen. Reflexivität: Die Folge (an −an )n = (0)n ist eine Nullfolge, also ist (an )n ∼R (an )n . Symmetrie: Wir bemerken, dass |bn − an | = |an − bn |. Falls also (an − bn )n eine Nullfolge ist, ist auch (bn − an ) eine Nullfolge. Transitivität: Wir nehmen an, dass (an − bn )n und (bn − cn )n Nullfolgen sind. Lemma 4.5 impliziert, dass die Folge (an − cn ) = (an − bn )n + (bn − cn )n auch konvergent ist und den Grenzwert 0 + 0 = 0 besitzt. ✷ Definition 4.13 Wir definieren die Menge der reellen Zahlen als R = CF / ∼R . Ist (an )n ∈ CF eine rationale Cauchy–Folge, bezeichnet [(an )n ] ∈ R die von der Folge definierte reelle Zahl. Jeder Äquivalenzklasse rationaler Cauchy–Folgen “ist” also eine reelle Zahl. Man sollte sich diese Zahl A vorstellen als der Grenzwert der Folge (an )n . Im nächsten Abschnitt sehen wir, dass A auch wirklich die Grenzwert der Folge ist (siehe der Beweis von Satz 4.19). Jede rationale Zahl r ∈ Q definiert auch eine reelle Zahl, indem wir r mit der Äquivalenzklasse der konstanten Folge an = r für alle n identifizieren. Wir können also Q als Teilmenge von R auffassen. Wir definieren die Adddition und Multiplikation auf R durch [(an )n ] + [(bn )n ] = [(an + bn )n ], [(an )n ] · [(bn )n ] = [(an · bn ]n . Mit Hilfe von Lemma 4.5 zeigt man, dass die Addition und Multiplikation wohldefiniert ist, d.h. der Grenzwert von (an + bn )n hängt nur von der Äquivalenzklassen [(an )n ] und [(bn )n ] und nicht von der gewählte Folge ab. Beispiel 4.14 In der Schule werd eine reele Zahl üblicherweise als Dezimalbruchzerlegung betrachtet. Zahlen gegeben durch eine Dezimalbruchzerlegung sind auch reelle Zahlen im Sinne von Definition 4.13. 38 Sei ξ = x0 , x1 x2 . . . mit x0 ∈ Z und xi ∈ {0, 1, . . . , 9} (i ∈ N). Wir definieren eine Folge rationaler Zahlen (an )n durch an = x0 , x1 x2 · · · xn . Wir behaupten, dass (an ) eine rationale Cauchy–Folge ist. Sei ǫ > 0 beliebig und wähle N = max(− log10 (ǫ), 1). Dann gilt für n ≥ N und p ∈ N, dass |an+p − an | = 0, 0 · · · 0xn+1 · · · xn+p < 10−n ≤ ǫ. Wir schließen, dass (an )n eine Cauchy–Folge ist. Insbesondere definiert (an )n eine reelle Zahl. Umgekehrt kann man zeigen, dass jede reelle Zahl im Sinne von Definition 4.13 durch einer Dezimalbruchzerlegung gegeben werden kann. Sei x = [(an )n ] ∈ R eine reelle Zahl. Die rationale Zahlen an besitzen eine Dezimalbruchzerlegung. Definition 4.6 zeigt, dass ein N existiert, sodass die erste m Nachkommastellen der Dezimalbruchzerlegung von an gleich sind für alle n ≥ N . (Hierbei haben wir ǫ = 10−m in Definition 4.6 gewählt.) Eine Dezimalbruchzerlegung von x findet man also indem man m gegen unendlich laufen läßt. 4.5 Die Vollständigkeit von R In diesem Abschnitt betrachten wir eine sehr wichtige Eigenschaft der reellen Zahlen: Die Vollständigkeit (Satz 4.19). Satz 4.19 sagt sehr informel, dass die reelle Achse “keine Lücken” besitzt. Die genaue Aussage ist, dass jede reelle Cauchy–Folge einen Grenzwert in R besitzt. Man kann die Menge der reellen Zahlen also nicht noch weiter vergrößern, indem man die Grenzwerte der reellen Cauchy–Folgen hinzunimmt. Reelle Cauchy–Folgen wurden in Definition 4.6 definiert, also vor wir die reelle Zahlen eingeführt hatten. Damit dieser Definition für die von uns definierten reellen Zahlen Sinn ergibt, müssen wir definieren was x < y für x, y ∈ R bedeutet. Definition 4.16 formuliert dies in Termen der rationalen Cauchy–Folgen, da die reelle Zahlen Äquivalenzklassen von Cauchy–Folgen sind. Definition 4.15 Eine rationale Cauchy–Folge (an )n∈N ∈ CF heißt positiv, wenn ein k ∈ N existiert, sodass höchstens endlich viele n ∈ N mit an ≤ 1/k existieren. Man kann die Bedingung aus Definition 4.15 auch als ∃k ∈ N ∃N ∈ N ∀n ≥ N an ≥ 1 k schreiben. Die Bedingung aus Definition 4.15 bedeutet, dass die Folgeglieder für n genügend groß weit genug von Null wegbleiben, damit der Grenzwert der Folge nicht Null sein kann. Dies überlegt man sich mit Hilfe von Definition 4.3. Damit der Grenzwert einer Cauchy–Folge (an )n positiv ist, reicht es nicht, dass die Folgeglieder positiv sind. Beispielsweise besitzt die Folge (1/n)n den 39 Grenzwert Null. Dies ist keine positive Folge, da für alle ǫ > 0 und alle genügend große n die Ungleichung |1/n − 0| = 1/n < ǫ gilt. Wir schreiben nun P ⊂ CF für die Menge der positive Cauchy–Folgen und N ⊂ CF für die Menge der Nullfolgen. Definition 4.16 Seien (an )n , (bn )n ∈ CF zwei rationale Cauchy–Folgen. Wir definieren [(an )n ] > [(bn )n ] durch (an − bn )n ∈ P. Wir haben nun zwei Definitionen für Cauchy–Folgen: Neben der reellen Cauchy–Folgen (Definition 4.6) haben wir in Definition 4.10 die rationale Cauchy– Folgen definiert. In Definition 4.10 ist ǫ eine beliebige positive rationale Zahl statt eine reelle Zahl. Folgender Satz zeigt, dass dies kein Unterschied macht. Insbesondere impliziert dieser Satz, dass rationale Cauchy–Folgen auch reelle Cauchy–Folgen sind. Satz 4.17 (Q liegt dicht in R) Seien x < y reelle Zahlen. Dann existiert eine rationale Zahl q ∈ Q mit x < q < y. Beweis: Wir wählen rationale Cauchy–Folgen (an )n , (bn )n korrespondierend zu x und y. Die Bedingung x < y bedeutet, dass ein k > 0 und ein N existiert mit 1 ∀n ≥ N. bn − an > ǫ := k Da (an )n und (bn )n Cauchy–Folgen sind, existieren N1 , N2 ∈ N, sodass ǫ , 4 ǫ |bn+p − bn | < , 4 |an+p − an | < ∀n ≥ N1 ∀p ∈ N, ∀n ≥ N2 ∀p ∈ N. Wir definieren M = max(N, N1 , N2 ) und q = aM + ǫ/2. Da aM und ǫ rationale Zahlen sind, ist q auch eine rationale Zahl. Für alle n ≥ M und p ∈ N gilt an − aM ≤ |an − aM | < ǫ/4. Dies impliziert, dass an + ǫ/4 < aM + ǫ/2 = q. Definition 4.15 impliziert, daher, dass x < q ist. Evenso gilt für n ≥ M und p ∈ N, dass bM − bn ≤ |bM − bn | < ǫ/4, also bM − ǫ/4 < bn . Mit bM − aM > ǫ folgt also bn > 3ǫ/4 + xM > xM + ǫ/2 = q. Hieraus folgt wieder y > q. ✷ Korrolar 4.18 Jede rationale Cauchy–Folge ist auch eine reelle Cauchy–Folge. Satz 4.19 R ist vollständig, d.h. jede reelle Cauchy–Folge besitzt ein Grenzwert in R. Beweis: Sei (an )n∈N eine reelle Cauchy–Folge. Satz 4.17 impliziert, dass ein αn ∈ Q mit an < αn < an + 1/n existiert. Behauptung 1: Die Folge (αn )n∈N ist eine rationale Cauchy–Folge. 40 Wir beweisen Behauptung 1. Sei ǫ > 0 beliebig. Da (an )n eine Cauchy–Folge ist, existiert ein N ∈ N mit |an+p − an | < ǫ 3 für alle n ≥ N und alle p ∈ N. Definiere nun K = max([3/ǫ] + 1, N ). Insbesondere ist 1/K < ǫ/3. Für alle n ≥ K und p ∈ N gilt |αn+p − αn | = |(αn+p − an+p ) + (an+p − an ) + (an − αn )| ≤ |αn+p − an+p | + |(an+p − an | + |αn − an |. Hier haben wir die Dreiecksungleichung benutzt. Die Definition von K impliziert also, dass |αn+p − αn | ≤ 1 ǫ 1 + + < ǫ, n+p 3 n da 1/(n + p) und 1/n kleiner gleich 1/K < ǫ/3 sind. Dies zeigt Behauptung 1. Die rationale Cauchy–Folge (αn )n definiert eine reelle Zahl A := [(αn )n ]. Behauptung 2: Die Folge (αn )n ist konvergent mit Grenzwert A. Um die Behauptung zu zeigen, überprüfen wir die Bedingung aus Definition 4.3. Sei ǫ > 0 beliebig und sei N ∈ N mit |αn+p − αn | < ǫ für alle n ≥ N und p ∈ N. Die Zahle N existiert, da (αn )n eine rationale Cauchy–Folge ist (Definition 4.10). Definition 4.16 impliziert |A − αn | < ǫ, ∀n ≥ N. Hier haben wir die rationale Zahl αn als konstante Folge aufgefasst. Dies zeigt die Behauptung. Behauptung 3: Die Folge (an )n ist konvergent mit Grenzwert A. Wir überprüfen wieder die Bedingung aus Definition 4.3. Sei ǫ > 0 beliebig. Wähle L1 ∈ N, sodass |A − αn | < ǫ/2 für alle n ≥ L1 . (Die Existenz von L1 folgt aus Behauptung 1.) Satz 4.17 impliziert, dass ein L2 ∈ N mit 1/L2 < ǫ/2 existiert. Sei L = max(L1 , L2 ). Es gilt |A − an | = |A − αn + αn − an | ≤ |A − αn | + |αn − aN | < Dies zeigt Behauptung 3 und den Satz. 41 1 ǫ + ≤ ǫ. 2 n ✷ 5 Unendliche Mengen Die zentrale Frage dieses Kapitel ist, ob Mengen wie beispielsweise N, N0 und Z gleichmächtig sind, also gleich viele Elemente haben. Sind N, M endliche Mengen mit N ( M , dann ist die Kardinalität von N echt kleiner als der Kardinalität von M . Dies folgt aus dem Schubfachprinzip. Übertragt man dies auf unendlichen Mengen, würde man erwarten, dass N als echte Teilmenge von N0 kleinere Kardinalität als N0 besitzt. In Bemerkung 5.2 werden wir sehen, dass wir N0 auch in N einbetten können. Größere und kleinere Kardinalität wäre also nicht wohldefiniert. ir brauchen also eine bessere Definition. 5.1 Gleichmätigkeit Sei M eine endliche nicht leere Menge. Wir schreiben n = |M |. Es existiert eine Bijektion ϕ : M → {1, 2, . . . , n} gegeben durch eine Abzählung de Elemente von M . Zwei endliche Mengen N und M besitzen genau dann die gleiche Mächtigkeit, wenn eine Bijektion zwischen N und M existiert. Diesmal schicken wir das ite Element von N auf dem ite Element von M . Dies motiviert folgende Definition. Definition 5.1 (a) Seien N, M beliebige, nicht notwendigerweise endliche, Mengen. Die Mächtigkeit von N ist kleiner gleich die Mächtigkeit von M , wenn eine injektive Abbildung ϕ : N → M existiert. (Bezeichnung: |N | ≤ |M |.) (b) Zwei Mengen N und M sind gleich mächtig, wenn eine Bijektion ϕ : N → M existiert. (Bezeichnung: |M | = |N |.) (c) Eine (unendliche) Menge heißt abzählbar, wenn M die gleiche Mächtigkeit wie N besitzt. Eine unendliche Menge, die nicht abzählbar ist, heißt überabzählbar. Man zeigt leicht, dass Gleichmächtigkeit eine Äquivalenzrelation ist. Die Mächtigkeit einer unendlichen Menge kann man durch eine Kardinalzahl angeben. Die Mächtigkeit von N ist ℵ0 . (Der Index 0 kommt daher, dass N die kleinste unendliche Menge ist.) Die Buchstabe ℵ ist die erste Buchstabe des hebräischen Alphabet und heißt Aleph. Die weitere Kardinalzahlen sind ℵ1 , ℵ2 , . . .. Bemerkung 5.2 (Das Hilbert–Hotel) Der folgende Satz sagt, dass die Mengen N, N0 und Z gleichmätig sind. Bevor wir den eigentlichen Beweis geben, besprechen wir zuerst eine Veranschaulichung des ersten Teil des Beweises, siehe auch folgendes Video: http://www.youtube.com/watch?v=faQBrAQ87l4 Es gibt auch ein Kurzfilm zu diesem Satz. Hier sehen Sie einem Ausschnitt: https://www.vismath.eu/de/filme/hotel-hilbert Das Hilbert–Hotel ist ein Hotel mit abzählbar unendlich viele Zimmer, die mit 1, 2, 3, . . . nummeriert sind (Abbildung 2). Alle Zimmer sind belegt als ein neuer Gast eintrifft und nach einem Zimmer fragt. Im Hilbert–Hotel ist für den neuen Gast trotzdem Platz. Der Manager sagt alle bereits eingecheckte Gäste, dass sie im nächsten Zimmer umziehen sollten, also der Gast aus Zimmer 1 in 42 1 2 ··· 3 Abbildung 2: Das Hilbert–Hotel Zimmer 2, der Gast aus Zimmer 2 in Zimmer 3 usw. Der neu angekommene Gast kann nun im frei gewordenen Zimmer 1 ziehen. In einem Zimmer mit nur endlich viele Zimmer funktioniert dies wegen das Schubfachprinzip leider nicht. Satz 5.3 Die Mengen N0 und Z sind abzählbar. Beweis: Wir definieren eine Abbildung ϕ : N0 → N durch ϕ : n 7→ n + 1. Dies ist offensichtlich eine Bijektion: Die Umkehrabbildung ist ϕ−1 : m 7→ m − 1. Wir schließen, dass N abzählbar ist. Wir definieren eine Abbildung ψ : Z → N0 falls 0 x 7→ 2x − 1 falls −2x falls durch x = 0, x > 0, . x < 0. Die folgende Tabelle gibt einige Bilder der Abbildung ψ: ··· −3 −2 −1 0 1 6 4 2 0 1 2 3 ··· 3 5 Wir schließen, dass |Z| = |N0 |. Da N0 abzählbar ist, ist Z es auch. (Alternativ definiert auch ϕ ◦ ψ eine Bijektion zwischen Z und N.) ✷ Satz 5.4 Die Menge Q ist abzählbar. Beweis: Es reicht zu zeigen, dass die Menge Q>0 abzählbar ist. Ähnlich wie im Beweis von Satz 5.3 leitet man hieraus ab, dass Q auch abzählbar ist. Eine rationale Zahl x ∈ Q>0 kann man eindeutig als Bruch x = a/b mit a, b ∈ N teilerfremd darstellen (Abschnitt 3.2). Wir identifizieren die Zahl x mit dem Paar (a, b) ∈ R2 . Abbildung 3 beschreibt eine Aufzählung dieser Paaren, oder äquivalent eine Abbildung ϕ : N → Q>0 . Bemerke, dass wir die Paare (a, b) mit ggT(a, b) 6= 1 weglassen. Im Bild ist dies mit einem Kreuz gekennzeichnet. Um die Aufzählung zu erhalten, folgt man die angegebene Schlangenlinie, anfangend mit (1, 1). Man erhalt also folgende Aufzählung der positiven rationalen Zahlen: 1, 2 = 2/1, 1/2, 1/3, 2/3, 3/2, 3 = 3/1, 4 = 4/1, 4/3, 3/4, 1/4, 1/5, · · ·. ✷ Das Argument aus Satz 5.4 zeigt auch, dass Z × Z abzählbar ist. 43 5 4 t × t × 3 t t × t 2 t × t × 1 t t t t 1 2 3 4 Abbildung 3: Die Abzählbarkeit von Q>0 5.2 Das Cantorsche Diagonalargument In diesem Abschnitt zeigen wir, dass R überabzählbar ist. Hierzu benutzen wir das Cantorsche Diagonalargument, das von Cantor (1845–1918) gefunden wurde. Cantor war zunächst selber überrast von seiner Entdeckung. Nachdem er in 1877 gezeigt hat, dass das Interval [0, 1] die gleiche Mächtigkeit als Rn für beliebiges n ∈ N besitzt, schreib er an Dedekind je le vois, mais je le crois pas. (Ich sehe es, aber ich glaube es nicht. Siehe http://www-groups.dcs.st-and.ac.uk/history/Biographies/Cantor.html ) Satz 5.5 Die Menge R ist überabzählbar. Beweis: Es reicht zu zeigen, dass die Menge [0, 1) ⊂ R überabzählbar ist. Jede reelle Zahl x ∈ [0, 1) lässt sich als Dezimalzahl (10) x = 0, x1 x2 x3 · · · mit xi ∈ {0, 1, . . . , 9} darstellen (Beispiel 4.14). Diese Darstellung ist nicht eindeutig. Existiert ein Index N , sodass xN 6= 9 und xi = 9 für alle i > N , ist x auch durch x = 0, x1 x2 · · · (xN + 1) gegeben. (Dies folgt wie in Beispiel 4.4.(c).) Wir schließen daher die Dezimalbruchzerlegungen (10) für den einem N mit xi = 9 für alle i > N aus. Mit dieser Einschränkung können wir jede reelle Zahl x ∈ [0, 1] eindeutig in der Form (10) darstellen, da der Differenz zwei verschiedene solcher Darstellungen positiv ist. 44 Wir nehmen an, dass [0, 1) abzählbar ist und schreiben ϕ : N → [0, 1) für die zugehörige Bijektion. Wir schreiben xi = ϕ(i). Es gilt also [0, 1) = {xi | i ∈ N} als Teilmengen von R. Wir konstruieren nun eine reelle Zahl y ∈ [0, 1), die nicht in {xi | i ∈ N} enthalten ist und erhalten so einen Widerspruch. Wir schreiben xi = ϕ(i) = 0, xi1 xi2 xi3 · · · . Die Zahl xij ∈ {0, 1, . . . , 9} ist also die jte Nachkommastelle von xi . Besitzt xi eine endliche Dezimalbruchzerlegung, ergänzen wir mit 0. Für alle i ∈ N wählen wir yi ∈ {0, 1, . . . , 9}, sodass yi 6= xii und kein Index N existiert, sodass yi = 9 für alle i > N . Dies ist offensichtlich möglich. Beispielsweise können wir yi 6= 9, xii für alle i wählen. Wir betrachten die Zahl y := 0, y1 y2 y3 · · · . Offensichtlich ist y ∈ [0, 1). Unsere Annahme impliziert, dass ein Index j mit y = xj existiert. Wegen der Eindeutigkeit der Dezimalbruchzerlegung impliziert dies, dass beide Zahlen die gleiche Nachkommastellen besitzen, also yi = xji für alle i. Dies widerspricht yi 6= xii . Wir schließen, dass [0, 1) überabzählbar ist. ✷ Satz 5.5 sagt, dass die Mächtigkeit von R echt größer ist als die von N. Die Kardinalität von R ist also eine Kardinalzahl ℵi mit i > 0. Die Kontinuumshypothese, aufgestellt von Cantor, sagt, dass die Kardinalität von R gleich ℵ1 ist. Anders gesagt: Es existiert keine Teilmenge M ⊂ R mit ℵ0 = |N| < |M | < |R|. Es ist bekannt, dass man die Kontinuumshypothese nicht aus den Zermelo– Fränkel-Axiomen der Mengenleere ableiten kann. (Es sei denn die Axiomen der Mengenleere sind widerspruchlich. Ob dies der Fall ist, ist nicht bekannt.) Daher heißt die Aussage eine Hypothese: Es ist nicht möglich die Aussage zu beweisen, man kann sie aber als zusätzliches Axiom annehmen. 6 Die komplexe Zahlen In diesem Abschnitt definieren wir die komplexe Zahlen C ausgehend von den reellen Zahlen. Die wichtigste komplexe nicht-reele Zahl ist die imaginäre Einheit i. Diese Zahl ist eine Lösung der Gleichung x2 + 1 = 0. Für reelle Zahlen x ∈ R 2 gilt x2 + 1 > 0, also besitzt die √ Gleichung x + 1 = 0 keine Lösung in R. Man schreibt manchmal auch i = −1. Euler (1707–1783) rechnete schon mit der Zahl i. Von ihm stammt auch die Formel (11) eiπ = −1, 45 die manchmal “die schönste Formel der Mathematik” genannt wird (siehe Abschnitt 6.2). Richtig eingeführt wurden die komplexe Zahlen von Gauß. Er zeigte den Fundamentalsatz der Algebra, der sagt, dass jede Gleichung xn + an−1 xn−1 + · · · + a0 = 0 mit ai ∈ R eine Lösung in C besitzt. Komplexe Zahlen waren aber schon früher in der Mathematik in Erscheinung getreten. Der italianische Mathematiker Cardano (1501–1576) publizierte in 1545 in seinem Buch Ars Magna eine Methode zur Bestimmung der Nullstellen kubischer Gleichungen der Form x3 = 3px + 2q. (Man kann zeigen, dass jede kubische Gleichung auf diese Form gebraucht werden kann.) In moderner Bezeichnung geschrieben, sagt das Ergebnis, dass q q p p 3 3 2 3 (12) q + q − p + q − q 2 − p3 eine Lösung der Gleichung x3 = 3px+2q ist. Dieser Formel ist also eine Verallgemeinerung der sogenannten Mitternachtsformel zur Bestimmung der Nullstellen einer quadratischen Gleichung. Cardano machte eine merkwürdige Entdeckung als er versuchte mit seiner Formel die Gleichung x3 = 15x + 4 zu lösen. Die Funktion f (x) := x3 − 15x − 4 besitzt genau eine positive Lösung, nämlich x = 4 (Abbildung 4). Cardano kannte keine negative Zahlen, daher betrachte er nur die positive Lösungen. (Für eine Berechnung der negative Lösungen, siehe Beispiel A.13.) 100 50 K6 K4 K2 0 2 x 4 6 K50 K100 Abbildung 4: Graph der Funktion f (x) = x3 − 15x − 4 Einsetzen der Werte p = 5, q = 2 in (12) sollte daher die Lösung x = 4 2 3 2 3 2 ergeben. Cardano bemerkte, p dass in diesem Fall q −p = 2 −5 = −11 ist. Dies 2 3 bedeutet, dass die Zahl q − p , die als Zwischenwert in seiner Berechnung vorkam, keine reelle Zahl ist. Im Endergebnis kürzt sich dieses Zwischenergebnis aber wieder raus, wenn man richtig rechnet, da das Endergebnis x = 4 sein 46 sollte. Cardano macht in seinem Buch ein Versuch dies zu nachzurechnen, aber offensichtlich verstand er nicht was er machte. Er sagt dies sei eben subtil wie nützlos. (Zitiert nach http://www-history.mcs.st-and.ac.uk/HistTopics/Quadratic etc equations.html) Um Cardanos Berechnung richtig auszuführen, braucht man komplexe Zahlen. Dies zeigt, dass komplexe Zahlen nützlich sind, auch wenn man nur an einer reellen Lösung einer reellen Gleichung interessiert ist. Cardano war nicht der Entdecker der Formel (12). Er bekam die Formel von Tartaglia unter der Versprechung, dass er die Formel nicht veröffentlichen würde. Diese Versprechen hat er nicht gehalten. Hier finden Sie die spannende Geschichte von Tartaglia und Cardano mit vielen Zitaten aus deren Korrespondenz: http://www-history.mcs.st-and.ac.uk/HistTopics/Tartaglia v Cardan.html 6.1 Definition der komplexen Zahlen Wir definieren komplexe Zahlen als Ausdrücke a + bi, a, b ∈ R. Wir schreiben C = {a + bi | a, b ∈ R} für die Menge der komplexen Zahlen. Wir fassen R = {z = a + bi ∈ C | b = 0} als Teilmenge von C auf. Für eine komplexe Zahl z = a + bi ∈ C nennen wir a = ℜ(z) der Realteil und b = ℑ(z) der Imaginärteil von z. Zwei komplexe Zahlen sind also genau dann gleich, wenn Realteil und Imaginärteil gleich sind. Zur Veranschaulichung identifizieren wir C durch a + bi 7→ (a, b) mit der Ebene R2 und fassen komplexe Zahlen als Punkte der “komplexe Ebene” wie in Abbildung 5 auf. Da diese Darstellung von Gauß stammt, nennt man diese Ebene auch Gaußsche Zahlenebene. Die horizontale Achse nennen wir reelle Achse und die vertikale imaginäre Achse. z+w 2 1 z w 1 2 Abbildung 5: Addition komplexer Zahlen Die Addition auf C ist definiert durch (a + bi) + (c + di) = (a + c) + (b + d)i. 47 Dies entspricht die Addition von Vektoren in R2 (Abbildung 5). Die Multiplikation ist definiert als (a + bi) · (c + di) = (ab − cd) + (ad + bc)i. Addition und Multiplikation komplexer Zahlen sind bestimmt durch die Operationen auf R und die Eigenschaft i2 = −1. Definition 6.1 Die komplexe Konjugation ist definiert durch ¯ : C → C, z = a + bi 7→ z̄ = a − bi. √ √ Die Zahl |z| := z · z̄ = a2 + b2 heißt (komplexe) Betrag von z. Der Betrag einer komplexen Zahl eine nicht-negative reelle Zahl ist, nämlich die Länge von z aufgefasst als Vektor in der komplexen Ebene. Das folgende Lemma formuliert einige Eigenschaften des Betrags, die wir hier nicht beweisen möchten. Lemma 6.2 Es gilt (a) |z1 z2 | = |z1 | · |z2 |, (b) (Dreiecksungleichung) |z1 + z2 | ≤ |z1 | + |z2 |, (c) der Betrag von z ∈ C ist genau dann Null, wenn z = 0. Mit Hilfe des Betrags können wir leicht die multiplikative Inverse z −1 einer komplexen Zahl z = a + bi 6= 0 berechnen, indem wir benutzen, dass z · z̄ = |z|2 ∈ R ist. Es gilt a −b z̄ 1 + 2 i. = 2 = 2 2 z |z| a +b a + b2 Wichtig ist komplexe Zahlen immer in der Form a + bi darzustellen. Ansonsten ist es schwer festzustellen, ob zwei komplexe Zahlen gleich sind oder nicht. Beispiel 6.3 (a) Wir diskutieren wie man die Quadratwurzeln einer komplexen Zahl ziehen kann. Sei z = a + bi 6= 0 eine komplexe Zahl. Wir suchen alle Lösungen der Gleichung w2 = z. Wir werden zeigen, dass diese Gleichung immer zwei komplexe Lösungen besitzt. Unser Beweis liefert gleichzeitig eine Methode zur Berechnung der Quadratwurzeln einer konkreten Zahl. Wir schreiben w = c + di mit c, d ∈ R. Da w2 = (c2 − d2 ) + 2cdi ist, liefert dies das Gleichungssystem (13) (14) c2 − d2 = a, 2cd = b. 48 Fall 1: Wir betrachten zuerst der Fall c = 0. Gleichung (14) impliziert, dass b = 0. Also ist z = a ∈ R \ {0} und (13) sagt, dass −d2 = a. Insbesondere ist a < 0 und d2 = −a = |a|. Die Lösungen des Gleichungssystem sind daher p w = ± |a|i. Fall 2: Sei c 6= 0. Auflösen von (13) nach d liefert (15) d= b . 2c Einsetzen in der ersten Gleichung und Multiplikation mit 4c2 liefert 4c4 − b2 = 4ac2 oder die äquivalente Gleichung: 4c4 − 4ac2 − b2 = 0. Dies ist eine quadratische Gleichung in c2 . Mit Hilfe der Mitternachtsformel finden wir √ √ 4a ± 16a2 + 16b2 a ± a2 + b 2 2 c = = . 8 2 √ √ Wir erinnern uns, dass c ∈ R\{0}, also c2 > 0 ist. Da a2 + b2 ≥ a2 = |a| ≥ a ist, folgt, dass √ a + a2 + b 2 2 . (16) c = 2 Wir haben angenommen, dass z = a + bi 6= 0 und daher a2 + b2 > 0. Dies impliziert, dass (16) genau zwei Lösungen mit c, d ∈ R besitzt. (b) Als Anwendung berechnen wir die Quadratwurzeln von z = 1 + i. Eine alternative Methode wird in Beispiel 6.9.(b) vorgestellt. Einsetzen von a = b = 1 in (16) liefert √ 1+ 2 2 c = . 2 Also p p √ √ 1+ 2 2+2 2 =± c=± √ . 2 2 √ (Bei der letzten Gleichung haben wir Zähler und Nenner mit 2 ergänzt.) Gleichung (15) liefert 1 1 = ±p √ 2c 2+2 2 p √ Wir ergänzen Zähler und Nenner mit −2 + 2 2, um der Nenner möglichst weit zu vereinfachen. Dies liefert p √ −2 + 2 2 d=± . 2 d= 49 Die gesuchte Quadratwurzeln sind daher q q √ √ 1 ± 2 + 2 2 + −2 + 2 2i . 2 Beachte, dass das Vorzeichen von d durch das von c bestimmt wird. Wir überlassen es dem Leser/der Leserin zu überprüfen, dass dies in der Tat die gesuchte Quadratwurzeln sind. 6.2 Polarkoordinaten Polarkoordinaten sind eine weitere Möglichkeit komplexe Zahlen darzustellen. Die Grundlage dieser Darstellung bildet folgende Definition der komplexe Exponentialfunktion. Definition 6.4 Für x ∈ R definieren wir eix = cos(x) + i sin(x). Insbesondere finden wir eiπ = cos(π)+i sin(π) = −i (Formel von Euler (11)). Das folgende Lemma zeigt, dass die komplexe e-Funktion aus Definition 6.4 die übliche Rechenregel erfüllt. Die Aussage von Lemma 6.5.(a) kann man gut nutzen, um sich die Additionstheoreme für den trigoneometrischen Funktionen zu merken. Lemma 6.5 Seien x, y ∈ R. Es gilt: (a) ei(x+y) = eix · eiy , (b) der Betrag von eix ist 1. Beweis: Es gilt ei(x+y) = cos(x + y) + i sin(x + y). Die Additionstheoreme implizieren, dass ei(x+y) = (cos(x) cos(y) − sin(x) sin(y)) + i (cos(x) sin(y) + cos(y) sin(x)) = (cos(x) + i sin(y)) (cos(y) + i sin(y)) = eix · eiy . Dies impliziert (a). Teil (b) folgt aus der Relation cos2 (x) + sin2 (x) = 1. ✷ Lemma 6.5.(b) zeigt, dass die komplexe Zahlen der Form eiϕ auf dem komplexen Einheitskreis K := {z ∈ C | |z| = 1} liegen. Umgekehrt kann man jede z ∈ K schreiben als z = cos ϕ + i sin ϕ, wobei ϕ die Winkel von z, aufgefasst als Vektor in der komplexen Ebene, mit der positiven reellen Achse ist. Die folgende Definition verallgemeinert dies für beliebige komplexe Zahlen. Das Argument von z = 0 nicht definiert ist. Definition 6.6 Sei z = a + bi eine komplexe Zahl mit z 6= 0. Das Argument ϕ ∈ (−π, π) von z ist definiert als der Winkel von z, aufgefasst als Vektor in der komplexen Ebene, mit der positiven reellen Achse. 50 iR r cos(ϕ) z r ϕ r sin(ϕ) R |z| = r Abbildung 6: Polarkoordinaten Der folgende Satz folgt unmittelbar aus obiger Beobachtung (siehe Abbildung 6). Satz 6.7 Sei z ∈ C \ {0} eine komplexe Zahl mit Argument ϕ und Betrag r = |z|. Es gilt (a) z = |z|eiϕ = |z|(cos(ϕ) + i sin(ϕ)), (b) ℜ(z) = |z| cos(ϕ), ℑ(z) = |z| sin(ϕ). Lemma 6.8 Seien z = reiϕ und w = seiψ zwei komplexe Zahlen mit z, w 6= 0 in Polarkoordinaten. Insbesondere gilt r, s ∈ R>0 und ϕ, ψ ∈ (−π, π]. Dann gilt (a) |z · w| = |z| · |w|. (b) Das Argument von z · w ist kongruent zu ϕ + ψ (mod 2π). Beweis: Dies folgt aus Lemma 6.5. Sei w = re iϕ ✷ 6= 0 eine komplexe Zahl. Wir betrachten die Abbildung ρ : C → C, z 7→ w · z als Abbildung der komplexen Ebene. Lemma 6.8 impliziert, dass ρ eine Drehung um der Winkel ϕ verknüpft mit einer Streckung um r ist. Wir berechnen die Polarkoordinaten z = reiϕ von z = x+iy 6= 0. Falls x 6= 0 gilt p y tan(ϕ) = . r = |z| = x2 + y 2 , x Man kann das Argument ϕ von z auch mit Hilfe der Arkustangens ausdrücken. Hier braucht man alledings einen Fallunterscheidung, da der Tangens π-periodisch 51 ist. Daher besitzt die Gleichung tan(ϕ) = y/x für x 6= 0 zwei Lösungen mit ϕ ∈ (−π, π]. Es gilt: y für x > 0, arctan( x ) y arctan( x ) + π für x < 0 und y ≥ 0, ϕ = arctan( yx ) − π für x < 0 und y < 0, π für x = 0 und y > 0, 2 − π für x = 0 und y < 0. 2 Anstatt diese Formeln anzuwenden, sollte man lieber geometrisch überlegen im welchem Interval ϕ in einem konkreten Beispiel liegt. Beispiel 6.9 (a) Wir schreiben die komplexe Zahl z = 1−i in Polarkoordinaten. Wir berechnen √ tan(ϕ) = −1. |z| = 2, Die Lösungen der Gleichung tan(ϕ) = −1 mit ϕ ∈ (−π, π] sind ϕ ∈ {3π/4, −π/4}. Da z im 4tem Quadrant der komplexen Ebene liegt, ist ϕ = −π/4. Es gilt also p z = (2)e−πi/4 . (b) In Beispiel 6.3.(b) haben wir die Quadratwurzel von z := 1 + i berechnet. Wir lösen diese Aufgabe nochmals mit Hilfe√von Polarkoordinaten. Wie in (a) berechnet man, dass 1 + i = 2eπi/4 . Sei w ∈ C mit w2 = z. Wir schreiben w = reiϕ . Lemma 6.8 impliziert also w2 = r2 e2iϕ . Dies liefert √ 2ϕ ≡ π/4 (mod 2π), r2 = 2, also r= √ 4 2, ϕ ∈ {π/8, π/8 − π = −7π/8}. In Beispiel 6.3.(b) haben wir berechnet, dass q q √ √ 1 w1 := 2 + 2 2 + −2 + 2 2i . 2 einer der Quadratwurzeln ist. Da w in ersten Quadrant der komplexen Ebene liegt, gilt ϕ = π/8. Die andere Winkel gehört zum zweiten Quadratwurzel −w von z. Wir schließen, dass q q √ √ √ 1 4 2 + 2 2 + −2 + 2 2i = 2eiπ/8 . w= 2 Insbesondere impliziert dies, dass p √ 2+2 2 √ , cos(π/8) = 242 p √ −2 + 2 2 √ sin(π/8) = . 242 52 2 •ζ8 = i ζ83• •ζ8 ζ84 = −1• 0 •ζ8 = 1 • ζ85 •6 ζ8 = −i •7 ζ8 Abbildung 7: Die 8te Einheitswurzel Die Lösungen in C der Gleichung zn = 1 heißen nte Einheitswurzeln. Mit Hilfe der Polarkoordinaten können wir diese Lösungen leicht berechnen. Wir schreiben ζn = eiπ/n = cos(π/n) + i sin(π/n). Lemma 6.10 Die nte Einheitswurzel sind ζnj = ejiπ/n = cos(jπ/n) + i sin(jπ/n), j = 0, 1, . . . , n − 1. Insbesondere besitzt die Gleichung z n = 1 genau n Lösungen in C. Beweis: Dies folgt aus Lemma 6.8. ✷ Abbildung 7 zeigt die 8te Einheitswurzeln. A Einige weitere Begriffe A.1 Teilbarkeit Wir wiederholen einige wohl bekannte Begriffe über Teilbarkeit ganzer Zahlen. Diese Begrife werden in der Vorlesung Elementare Zahlentheorie ausführlicher besprochen. Definition A.1 Seien a 6= 0 und b ganze Zahlen. Wir sagen das b durch a teilbar ist, wenn eine ganze Zahl c mit b = a · c existiert. Wenn diese Bedingung erfüllt ist, heißt a ein Teiler von b. Wir benutzen die Bezeichnung a | b für ‘a teilt b’ und a ∤ b für ‘a teilt b nicht’. 53 Definition A.2 Eine Zahl n ∈ N≥2 heißt Primzahl, wenn 1 und n die einzige positive Teiler von n sind. Eine natürliche Zahl n ≥ 2 heißt zusammengesetzt, wenn n keine Primzahl ist. Definition A.3 Seien a, b ∈ Z zwei ganze Zahlen, die nicht beide Null sind. Der größte gemeinsame Teiler von a und b ist die größte natürliche Zahl, die sowohl a als b teilt. (Bezeichnung: ggT(a, b).) Zwei Zahlen mit ggT(a, b) = 1 heißen teilerfremd. Satz A.4 Seien a, b ganze Zahlen mit b > 0. (a) Es existieren eindeutige ganze Zahlen q, r mit a = bq + r und 0 ≤ r < b. Wir nennen q den Quotienten und r den Rest der Division. (b) Die Zahl b ist genau dann ein Teiler von a, wenn r = 0. Beweis: Ein Beweis des Satzes finden Sie in [1, Satz 1.1.5]. ✷ A.2 Ungleichungen Die Menge R de reellen Zahlen besitzt eine Ordnung ≤ (Abschnitt 4.5). Für zwei reelle Zahlen a, b ∈ R ist also definiert ob a ≤ b gilt. Anstatt a ≤ b kann man auch b ≥ a schreiben. Die Schreibweise a < b bedeutet, dass a ≤ und a 6= b ist. Die Ordnung auf R ist eine Wohlordnung. Dies bedeutet, dass folgende Eingeschafte erfüllt sind. Für mehr Details verweisen wir auf der Vorlesung Analysis I. Definition A.5 Eine Relation ≤ auf einer Menge K heißt Wohlordnung, wenn für alle a, b, c ∈ K gilt: (O1) a ≤ a (Reflexivität), (O2) a ≤ b, b ≤ a ⇒ a = b, (Antisymmetrie), (O3) a ≤ b, b ≤ c ⇒ a ≤ c, (Transitivität). (O4) Es gibt a ≤ b oder b ≤ a. Sei x ∈ R. Das Symbol |x| = ( −x x falls x < 0, falls x ≥ 0 bezeichnet der absolut Betrag von x. Insbesondere ist |x| ≥ 0, x ≤ |x| für alle x ∈ R. Die Ungleichung |x| ≤ a ist äquivalent zu −a ≤ x ≤ a. 54 Beispiel A.6 (a) Wir bestimmen alle x ∈ R mit (17) |x − 2| ≥ 1. Ist x − 2 ≥ 0, dann ist |x − 2| = x − 2. Die Ungleichung (17) ist daher in diesem Fall äquivalent zu x − 2 ≥ 1, also zu x ≥ 3. Ist x − 2 ≤ 0, dann ist |x − 2| = −(x − 2). Die Ungleichung (17) ist daher in diesem Fall äquivalent zu −x + 2 ≥ 1, also zu x ≤ 1. Die Lösungsmenge ist daher (−∞, 1] ∪ [3, ∞). (b) Wir zeigen, dass 2x2 − 2xy + y 2 − 2x + 2 > 0 ist für alle x, y ∈ R. Dazu bemerken wir dass 2x2 − 2xy + y 2 − 2x + 2 = (x − y)2 + (x − 1)2 + 1. Für alle z ∈ R gilt z 2 ≥ 0. Es folgt 2x2 − 2xy + y 2 − 2x + 2 ≥ 0 + 0 + 1 > 0. Die sogenannte Dreiecksungleichung, der üblicherweise eine Aussage über Längen von Vektoren ist, gilt auch für reelle Zahlen. Man zeigt das folgende Lemma beispielsweise indem man die verschiedene mögliche Vorzeichen für a, b, a + b unterscheidet. Wir überlassen dies dem Leser/der Leserin. Lemma A.7 (Dreiecksungleichung) Seien a, b ∈ R. Dann gilt |a + b| ≤ |a| + |b|. Man sollte den Absolutbetrag nicht mit dem sogenannten Gauß–Klammer verwechseln. Sei a ∈ R. Dann bezeichnet der Gauß–Klammer [a] ∈ Z der größte ganze Zahl mit [a] ≤ a. Manchmal schreibt man auch ⌊a⌋ anstatt [a]. Beispiels√ weise ist [π] = 3 und [− 2] = −2. Eine Variante ist der obere Gauß–Klammer definiert als der kleinsten ganzen Zahl größer gleich a. Bezeichnung: ⌈a⌉. Wir bemerken, dass die Zahlen [a] und ⌈a⌉ genau dann gleich sind, wenn a ∈ Z ist. A.3 Summen und Produkten Sind xi verschiedene Ausdrücken, die möglicherweise vom Index i abhängen, schreiben wir x1 + x2 + · · · + xn = n X xi i=1 als Abkürzung für die Summe der xi . Das Summenzeichen Großbuchstabe Sigma. 55 P ist die griechische Am Einfachsten versteht man dies an Hand von einigen Beispiele: n X i=1 n X i=1 n X i=1 i = 1 + 2 + 3 + · · · + n, i 2 = 1 2 + 2 2 + 3 2 + · · · + n2 , mi = m1 + m2 + m3 · · · + mn . (1) Hängt c nicht von der Index i ab, gilt n X cxi = c xi . i=1 i=1 Insbesondere gilt n X n X c = cn. i=1 (2) Summen mit dem gleichen Laufindex kann man zusammenfassen: n X i=1 xi + n X yi = i=1 n X (xi + yi ). i=1 Selbstverständlich kann man diese Regel auch benutzen, um Summen aus Einander zu ziehen. Eine Doppelsumme ist eine Summe mit zwei (oder mehr) Laufindizes. Hier ist es wichtig die Grenzen zu beachten. Beispiel A.8 (a) Wir betrachten die Doppelsumme n X m X xi yj . i=1 j=1 Hier werden alle Ausdrücke xi yj mit 1 ≤ i ≤ n und 0 ≤ j ≤ m aufsummiert. Insgesamt besitzt der Ausdruck also n · m Terme. Für n = m = 2 finden wir beispiesweise n X n X xi yj = x1 y1 + x1 y2 + x2 y1 + x2 y2 . i=1 j=1 (b) Wir betrachten nun die Doppelsumme n n X X i=1 j=i 56 xi yj . Beachte, dass die Grenzen der inneren Summe von i abhängen. Hier werden alle Ausdrücke xi yj mit 1 ≤ i ≤ n und i ≤ j ≤ n aufsummiert. Für n = 2 finden wir beispielsweise n X n X xi yj = x1 y1 + x1 y2 + x2 y2 . i=1 j=1 Ähnlich benutzt man die griechische GroßBuchstabe Π um Produkte darzustellen: n Y xi = x1 · x2 · x3 · · · xn . i=1 A.4 Körper Definition A.9 Eine Menge K zusammen mit 2 Verknüpfungen +:K ×K →K (a, b) 7→ a + b, ·:K ×K →K (a, b) 7→ a · b, heißt Körper, falls folgende Bedingungen erfüllt sind: (K1) (K, +) ist eine kommutative Gruppe, d.h. (a) die Addition ist assoziativ, d.h. a + (b + c) = (a + b) + c für alle a, b, c ∈ K, (b) es existiert ein neutrales Element 0, sodass 0 + a = a + 0 = a für alle a ∈ K, (c) für jedes a ∈ K existiert ein negatives Element −a mit a + (−a) = (−a) + a = 0, (d) die Addition ist kommutativ, d.h. a + b = b + a für alle a, b ∈ K, (K2) (K \ {0}, ·) ist eine kommutative Gruppe, das heißt (a) die Multiplikation ist assoziativ, das heißt a · (b · c) = (a · b) · c für alle a, b, c ∈ K \ {0}, (b) es existiert ein Einheitselement 1 so, dass 1 · a = a · 1 = a für alle a ∈ K \ {0}, (c) für jedes a ∈ K \ {0} existiert ein inverses Element a−1 mit a · a−1 = a−1 · a = 1, (d) die Multiplikation ist kommutativ, das heißt a · b = b · a für alle a, b ∈ K \ {0}, (K3) es gelten die Distributivgesetze: a · (b + c) = a · b + a · c, für alle a, b, c, ∈ K. 57 (a + b) · c = a · c + b · c, Beispiele von Körpern sind Q, R und C. Die Menge Z ist kein Körper, da nur ±1 in Z ein multiplikatives Inverse besitzen. Ist p eine Primzahl, kann man zeigen, dass Fp := Z/pZ mit Addition und Multiplikation modulo p auch ein Körper ist. Hierbei ist F die Abkürzung des englischen Begriffs für Körper: field. A.5 Polynome In diesem Abschnitt fassen wir einige Definitionen und Eigenschaften von Polynomen zusammen. Für Beweisen und mehr Details verweisen wir auf dem Skript der Vorlesung Elemente der Algebra [2, Abschnitt 3]. Definition A.10 Sei K ein Körper. Pn (a) Ein Polynom mit Koeffizienten in K ist ein Ausdruck f = i=0 ai xi mit Koeffizienten ai ∈ K. Wir schreiben K[x] für die Menge der Polynome mit Koeffizienten in K. (b) Das Nullpolynom f = 0 ist das Polynom, dessen Koeffizienten alle Null sind. (c) Ist f 6= 0 nicht das Nullpolynom ist, heißt die größte Zahl n so, dass an 6= 0 ist, der Grad von f (Bezeichnung: Grad(f ).) Den Grad des Nullpolynoms definieren wir als −∞. P (d) Ist f = i ai xi ein Polynom von Grad n, dann heißt an xn führende Term von f . Ein Polynom vom Grad n mit führendem Term xn heißt normiert. (e) Seien f (x), g(x) ∈ R[x] mit g(x) 6= 0. Wir sagen, dass g(x) ein Teiler von f (x) ist, falls ein Polynom h(x) ∈ R[x] mit f (x) = g(x)h(x) existiert. Der folgende Satz ist ein Analogon der Division mit Rest in Z (Satz A.4). Satz A.11 (Polynomdivision) Sei K ein Körper und seien f (x), g(x) ∈ K[x] Polynome mit f g 6= 0. Es existieren eindeutige Polynome q(x) und r(x) ∈ K[x] mit f (x) = q(x)g(x) + r(x), wobei Grad(r) < Grad(g) ist. Korrolar A.12 Sei f (x) ∈ R[x] ein Polynom. Es gilt a ∈ R genau dann eine Nullstelle von f ist, wenn ein Polynom q(x) ∈ R[x] mit f (x) = q(x)(x − a) existiert. Beweis: Die Aussage folgt aus Satz A.11, siehe [2, Kor. 3.3.3]. 58 ✷ Beispiel A.13 Als Anwendung berechnen wir alle Lösungen der Gleichung x3 − 15x − 4 = 0, den wir in der Einleitung von Kapitel 4.4 betrachtet haben. Wir haben schon gesehen, dass diese Gleichung die Lösung x = 4 besitzt. Dies bedeutet, dass x3 − 15x − 4 durch x − 4 teilbar ist (Appendix A.5). Wir führen die Division mit Hilfe von Polynomdivision durch und finden: (18) x3 − 15x − 4 : x − 4 = x2 + 4x + 1 − x3 + 4x2 4x2 − 15x − 4x2 + 16x x−4 −x+4 0 Die weitere Lösungen der Gleichung erfüllen also x2 + 4x + 1 = 0. Mit Hilfe der Mitternachtsformel finden wir √ √ −4 ± 16 − 4 = −2 ± 3. x= 2 Die andere zwei Lösungen der Gleichung sind also in der Tat in R<0 , wie man auch aus Abbildung 4 erkennen kann. B Das griechische Alphabet α A Alpha ν N Ny β B Beta ξ Ξ Xi γ Γ Gamma o O Omikron δ ∆ Delta π Π Pi ǫ, ε E Epsilon ρ P Rho ζ Z Zeta σ Σ Sigma η H Eta τ T Tau θ, ϑ Θ Theta υ Υ Ypsilon ι I Jota φ, ϕ Φ Phi κ K Kappa χ X Chi λ Λ Lambda ψ Ψ Psi µ M My ω Ω Omega 59 Literatur [1] I.I. Bouw, Elementare Zahlentheorie. Vorlesungsskript, Sommersemester 2010. [2] I.I. Bouw, Elemente der Algebra. Vorlesungsskript, Wintersemester 2012/13. 60