Grundlagen der Mathematik Irene I. Bouw1 Wintersemester 2013/2014, 2014/15 1 überarbeitet für das Wintersemester 2014/15 von J.-W. Liebezeit 2 Gesetzt mit LATEX. Grafiken mit gnuplot und TikZ. Inhaltsverzeichnis 1 Mengen und Funktionen 1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Logische Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 8 13 2 Beweismethoden 17 2.1 Der direkte Beweis und Varianten . . . . . . . . . . . . . . . . . . 17 2.2 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . 23 2.3 Binomialkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . 26 3 Äquivalenzrelationen 31 3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.2 Die ganzen und rationalen Zahlen . . . . . . . . . . . . . . . . . . 33 3.3 Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4 Grenzwerte und die Definition der reellen Zahlen 4.1 Berechnung von Quadratwurzeln . . . . . . . . . . 4.2 Definition des Grenzwerts . . . . . . . . . . . . . . 4.3 Cauchy-Folgen . . . . . . . . . . . . . . . . . . . . 4.4 Definition der reellen Zahlen . . . . . . . . . . . . . 4.5 Die Vollständigkeit von R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 40 43 44 46 5 Unendliche Mengen 49 5.1 Gleichmächtigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.2 Das Cantorsche Diagonalargument . . . . . . . . . . . . . . . . . 52 6 Die komplexen Zahlen 55 6.1 Definition der komplexen Zahlen . . . . . . . . . . . . . . . . . . 57 6.2 Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 A Einige weitere Begriffe A.1 Teilbarkeit . . . . . . . . A.2 Ungleichungen . . . . . A.3 Summen und Produkte . A.4 Körper . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 65 65 67 68 4 INHALTSVERZEICHNIS A.5 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 B Das griechische Alphabet 71 Literaturverzeichnis 73 Kapitel 1 Mengen und Funktionen In diesem Kapitel führen wir einige in der Mathematik häufig benutzte Objekte, wie Mengen und Funktionen, ein. Aus der Schule werden Sie ein intuitives Verständnis dafür haben, was eine Menge oder eine Funktion ist. Wir besprechen diese Konzepte in diesem Kapitel nochmals, um ein gemeinsames Verständnis dieser Objekte zu haben. Außerdem führen wir einheitliche Bezeichnungen ein. Im nächsten Kapitel werden wir uns mit Beweistechniken befassen. Viele der Beweise, die wir in Kapitel 2 studieren, zeigen Eigenschaften von Mengen, Zahlen und Funktionen. Diese Beweise bauen auf den Eigenschaften der in diesem Kapitel eingeführten Objekte auf. 1.1 Mengen Mengen spielen in allen Teilbereichen der Mathematik eine Rolle. Es ist erstaunlich, dass die Mengenlehre, also die Theorie der Mengen, erst seit dem 19ten Jahrhundert systematisch studiert wird. Hier finden Sie eine historische Übersicht der Geschichte der Mengenlehre: www-history.mcs.st-andrews.ac.uk/HistTopics/Beginnings of set theory.html Als Ausgangspunkt unserer Diskussion von Mengen, nehmen wir Cantors Mengenbegriff. Cantor definierte 1874 Mengen wie folgt: Unter eine Menge verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten (Elemente genannt) unserer Anschauung oder unseres Denkens zu einem Ganzen. Cantors Mengendefinition ist keine Definition im mathematischen Sinne, da der Begriff nicht auf schon definierte Begriffe zurückgeführt wird. Es ist möglich den Begriff Menge durch Axiome zu charakterisieren. Dies ist allerdings recht kompliziert. Für uns reicht ein intuitives Verständnis des Begriffs, wie er durch Cantors Definition beschrieben wird. Wenn man unendliche Menge betrachtet, führt dieser naive Mengenbegriff leicht zu Widersprüchen. Cantors Mengenbegriff hört sich zunächst ziemlich abstrakt an. Wir möchten hier einige Aspekte betonen, die für uns wichtig sind. 5 6 KAPITEL 1. MENGEN UND FUNKTIONEN Bemerkung 1.1.1. (a) Eine Menge besteht aus Objekten. Die Elemente einer Menge brauchen also keine Zahlen zu sein. Beispielsweise können wir auch die Menge der Studierenden dieser Vorlesung oder die Menge der Buchstaben des Alphabets betrachten. (b) Die Elemente einer Menge müssen wohlunterschieden sein, d. h., man muss sie von Einander unterscheiden können. Das gleiche Objekt kann also nicht zweimal in einer Menge enthalten sein. Außerdem ist die Reihenfolge, in der die Elemente aufgezählt wurden, unwichtig. Wenn x und y das gleiche Element einer Menge M bezeichnen, schreiben wir x = y. Wenn x und y verschiedene Elemente sind, schreiben wir x 6= y. Da die Elemente der Menge wohlunterschieden sind, können wir entscheiden welcher der beiden Fälle zutrifft. (c) Die Objekte einer Menge müssen bestimmt sein, d. h., man muß entscheiden können, ob ein Objekt m in der Menge M enthalten ist oder nicht. In dieser Vorlesung bezeichnen wir Mengen immer mit Großbuchstaben und Elemente einer Menge mit Kleinbuchstaben. Es gibt verschiedene Möglichkeiten eine konkrete Menge zu definieren. Die einfachste ist die Aufzählung. Hier werden die Objekte der Mengen zwischen geschweiften Klammer aufgelistet: M := { a, b, c } , N := { 1, 2, 3, . . . } . Hierbei deutet := an, dass hier ein Symbol definiert wird. Die Auslassungspunkte (. . . ) deuten an, dass die Folge nach dem offensichtlichen Muster fortgesetzt wird. Dies ist manchmal sehr praktisch. Die Menge N der natürliche Zahlen beispielsweise besitzt unendlich viele Elemente, die man nicht alle Aufzählen kann. Wichtige Beispiele von Mengen sind: N = { 1, 2, 3, . . . } natürliche Zahlen, N0 = { 0, 1, 2, 3, . . . } natürliche Zahlen mit Null, Z = { 0, ±1, ±2, . . . } ganze Zahlen, Q rationale Zahlen, R reelle Zahlen, R>0 positive reelle Zahlen. In dieser Vorlesung werden die natürlichen Zahlen N als bekannt vorausgesetzt. Die Mengen Z, Q und R werden wir in den Abschnitte 3.2 und 4.4 genau definieren. (Bis dahin werden wir diese Mengen trotzdem benutzen und uns auf Ihr Verständnis aus der Schule verlassen.) Sehr praktisch ist auch die Möglichkeit, die Elemente einer Menge durch eine Eigenschaft zu definieren. Diese Eigenschaft steht dann hinter einem vertikalen Strich. Manchmal wird hier auch ein Doppelpunkt benutzt. Ein Beispiel ist: E := { x ∈ Z | x ist gerade } = { 0, ±2, ±4, . . . } , P := { n ∈ N>1 | n ist eine Primzahl } = { 2, 3, 5, 7, 11, . . . , 37, . . . } . 1.1. MENGEN 7 Wir beschreiben einige oft benutzte Bezeichnungen für Mengen. • x ∈ S: Das Objekt x ist ein Element der Menge S. • x 6∈ S: Das Objekt x ist kein Element der Menge S. Beispiel: 0 6∈ N. • ∅: Die leere Menge. In der Schule wird diese Menge oft mit { } bezeichnet. • A ∩ B := { x | x ∈ A und x ∈ B }: Die Schnittmenge von A und B. Zwei Mengen A, B mit A ∩ B = ∅ heißen disjunkt. Ist A eine beliebige Menge, dann sind A und ∅ disjunkt, da A ∩ ∅ = ∅. • A ∪ B := { x | x ∈ A oder x ∈ B }: Die Vereinigung von A und B. Die Menge A ∪ B enthält also alle Objekte, die in A oder in B (oder in beiden Mengen) enthalten sind. Beispielsweise gilt für jede Menge A, dass A∪∅ = A. Sind die beide Mengen A und B disjunkt, schreibt man manchmal auch · für die Vereinigung und sagt dazu disjunkte Vereinigung. A t B oder A∪B • A ⊂ B: Die Menge A ist eine Teilmenge von B, d. h. alle Elemente von A sind auch in B. Die Mengen A und B dürfen auch gleich sein. Manchmal wird auch das Symbol A ⊆ B benutzt. Beispielsweise ist N ⊂ Z. • A ( B: Die Menge A ist eine Teilmenge von B, aber die beiden Mengen sind nicht gleich. Es existiert also ein Element y ∈ B, das nicht in A ist. Man sagt auch: A ist eine echte Teilmenge von B. • A \ B := { x ∈ A | x 6∈ B }: Das Komplement von B in A. Diese Menge wird auch A ohne B genannt. Ist B ⊂ A und A aus dem Kontext klar, schreibt man manchmal auch B c anstatt A \ B. • |A| = #A: Die Mächtigkeit oder Kardinalität der Menge. Wir werden dieses Symbol nur für Mengen mit endlich vielen Elementen (endliche Mengen genannt) benutzen. • A × B := { (a, b) | a ∈ A, b ∈ B }: Das kartesische Produkt von A und B. Die Elemente (a, b) sind geordnete Paare: Die Reihenfolge ist hier wichtig. Man kann diese Konstruktion auch mehrfach anwenden: Man schreibt An := A × . . . × A, wobei die Menge A auf der rechten Seite n Mal vorkommt. Beispielsweise ist R2 = { (x, y) | x, y ∈ R } die reelle Standardebene. • P(A) := { B | B ⊂ A }: Die Potenzmenge, d. h. die Menge aller Teilmengen (siehe Beispiel 1.1.2.(b)). Wichtige Beispiele von Teilmengen der reelen Zahlen sind Intervalle. In dieser Vorlesung benutzen wir folgende Bezeichnungen. Seien a, b reelle Zahlen mit a < b. Dann gilt: • [a, b] := { x ∈ R | a ≤ x ≤ b }. 8 KAPITEL 1. MENGEN UND FUNKTIONEN • [a, b) := { x ∈ R | a ≤ x < b }. • (a, b) := { x ∈ R | a < x < b }. • [a, ∞) := { x ∈ R | x ≥ a }. Das Symbol ∞ ist keine reelle Zahl ist und kann daher auch kein Element einer Teilmenge von R sein. • (−∞, b) := { x ∈ R | x < b }. Beispiel 1.1.2. (a) Die Menge Q := [−1, 1] × [−1, 1] ⊂ R2 ist ein Quadrat mit Mittelpunkt (0, 0) und Seitenlänge 2. (b) Sei S = { 1, 2 }. Dann ist die Potenzmenge P(S) = { ∅, { 1 } , { 2 } , { 1, 2 } } . Insbesondere ist |P(S)| = 4. Die Elemente von P(S) sind Mengen und keine Zahlen. Zum Beispiel ist 2 ∈ / P. Der folgende Satz gibt einige Eigenschaften der Mengenoperationen, die wir oben eingeführt haben. Bitte beachten Sie die Klammern. Es ist hilfreich die Aussagen mit Venn–Diagrammen zu veranschaulichen. Den Beweis diskutieren wir im nächsten Kapitel (Lemma 2.1.1) und in den Übungsaufgaben. Satz 1.1.3. Seien A, B, C Mengen. Es gilt: (a) A ∪ B = B ∪ A und A ∩ B = B ∩ A (Kommutativgesetz), (b) (A∪B)∪C = A∪(B ∪C) und (A∩B)∩C = A∩(B ∩C) (Assoziativgesetz), (c) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) und (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C) (Distributivgesetz), (d) (Ac )c = A, (e) (A ∩ B)c = Ac ∪ B c und (A ∪ B)c = Ac ∩ B c (Regeln von De Morgan, auch De Morgansche Gesetze genannt). 1.2 Logische Symbole Bevor wir uns im nächsten Kapitel mit mathematischen Beweisen befassen, diskutieren wir jetzt die Formulierung von mathematischen Aussagen. Logische Symbole liefern eine effiziente Art und Weise, mathematische Aussagen kompakt darzustellen. Kleine Änderungen in der Formulierung, wie beispielsweise das Vertauschen zweier Symbole, ändert die Bedeutung oft radikal. Daher ist es wichtig, sich mit der genauen Bedeutung der Symbole auseinanderzusetzen. Logische Symbole wie den Implikationspfeil “⇒” sollte man nie benutzen, um etwa einen Zeilenumbruch anzugeben. 1.2. LOGISCHE SYMBOLE 9 Bei der Bearbeitung der Übungsaufgaben ist es oft ratsam, die Aussagen als vollständige deutsche Sätze zu formulieren, da so ihre Bedeutung leichter verständlich ist. Eine Aussage ist eine Äußerung, die entweder wahr oder falsch ist. Man muß dabei nicht wissen, welches zutrifft. Es reicht, zu wissen, dass genau eines von beidem zutrifft. Beispiele von Aussagen sind: • Es regnet. √ / Q. • 2∈ • Heute fällt die Vorlesung Grundlagen der Mathematik aus. • Es existieren unendlich viele Primzahlen. Keine Aussagen sind: • Guten Morgen liebe Studierenden. • Welche Musik hören Sie gerne? • 2 ⇒ gerade. Wir führen zunächst die wichtigsten sogenannten Junktoren ein. Dies sind Symbole mit denen wir Aussagen zu Neuen verbinden können. Dafür seien A und B Aussagen. • A ⇒ B: Aussage A impliziert Aussage B. Dies bedeutet, dass B immer wahr ist, wenn A wahr ist. Dies entspricht B ⊂ A in der Mengenlehre. Beispiele sind: ∗ Wenn es regnet, ist die Straße naß. ∗ Wenn n ∈ N durch 4 teilbar ist, ist n auch durch 2 teilbar. • A ⇐ B: Aussage B impliziert Aussage A. Dies ist gleichbedeutend mit B ⇒ A. • A ⇔ B: Die Aussagen A und B sind äquivalent, d. h. B ist genau dann wahr, wenn A wahr ist. Dies entspricht A = B in der Mengenlehre. Die Aussagen Es regnet und Die Straße ist naß sind nicht äquivalent. Die Straße kann beispielsweise auch naß sein, weil ein Straßenputzfahrzeug vorbei gefahren ist. • ¬A: Die Aussage “nicht A”. Diese Aussage ist genau dann wahr, wenn die Aussage A falsch ist. Dies entspricht Ac in der Mengenlehre. • A ∧ B: Die Aussage “A und B”. Diese Aussage ist genau dann wahr, wenn A und B beide wahr sind. Dies entspricht A ∩ B in der Mengenlehre. 10 KAPITEL 1. MENGEN UND FUNKTIONEN • A ∨ B: Die Aussage “A oder B”. Diese Aussage ist genau dann wahr, wenn mindestens eine der Aussagen A, B wahr ist. Es dürfen also auch beide Aussagen wahr sein: Das (mathematische, logische) “oder” ist nicht gleichbedeutend mit “entweder, oder”. Das Symbol A∨B entspricht A∪B in der Mengenlehre. Die untenstehende Wahrheitstafel illustriert die Bedeutung der Aussagen aus obiger Liste. Für alle Möglichkeiten, ob die Aussagen A und B wahr (“w”) oder falsch (“f”) sind, zeig die Tabelle, ob die zusammengesetzte Aussage wahr oder falsch ist. A B A⇒B A⇔B A∧B A∨B w w w w w w w f f f f w f w w f f w f f w w f f Besonders betonen möchten wir, dass die Aussage A ⇒ B genau dann wahr ist, wenn entweder A und B beide wahr sind oder wenn A falsch ist. Ist A falsch, sagt die Aussage A ⇒ B also nichts über die Wahrheit von B aus. Beispielsweise sind folgende Aussagen wahr: • Wenn die Welt eine Scheibe ist, liegt Ulm auf dem Mond. • Wenn 6 eine Primzahl ist, ist 6 gerade. • Wenn der Hahn kräht auf dem Mist, dann ändert sich das Wetter oder es bleibt wie es ist. Die Aussage “Das Wetter ändert sich oder es bleibt wie es ist” ist eine Aussage der Form A ∨ ¬A. Solche Aussagen sind immer wahr und werden Tautologien genannt. Das folgende Lemma liefert zwei äquivalente Umformulierungen der Aussage “A ⇒ B”. Die Äquivalenz der ersten beiden Aussagen ist als Kontrapositionsgesetz bekannt. Der Name deutet schon an, dass dies eine wichtige Regel ist. Lemma 1.2.1 (Kontrapositionsgesetz). Seien A und B Aussagen. Die folgenden drei Aussagen sind äquivalent: A ⇒ B, ¬B ⇒ ¬A, ¬A ∨ B. 1.2. LOGISCHE SYMBOLE 11 Beweis. Dies beweisen wir mit Hilfe einer Wahrheitstafel: ¬A ¬B A B A⇒B ¬B ⇒ ¬A ¬A ∨ B w w f f w w w w f f w f f f f w w f w w w f f w w w w w Wir sehen, dass alle drei Aussagen genau dann falsch sind, wenn A wahr und B falsch ist. Alle drei Aussagen sind also äquivalent. Beispiel 1.2.2. Wir betrachten die Aussage Wenn heute Sonntag ist, gibt es keine Vorlesung. Dies ist eine (wahre) Aussage der Form A ⇒ B, mit A Heute ist Sontag. B Es gibt keine Vorlesung. Mit Hilfe des Kontrapositionsgesetzes können wir hieraus die folgende Aussage ableiten: Heute gibt es eine Vorlesung (“¬B”), also ist heute ist kein Sonntag (“¬A”). Folgende Aussage folgt NICHT: Es ist Montag, also gibt es heute eine Vorlesung. Die Aussage sagt nichts darüber aus, an welche Tagen Vorlesungen stattfinden. Die Aussage ¬A ∨ B ist in unserem Beispiel die Aussage: Heute ist nicht Sonntag oder es gibt keine Vorlesung. Wir kommen nun zur zweiten Sorte logischer Symbole: die Quantoren. Wir betrachten eine Aussage A, die eine Variable x enthält, die mehrere Werte annehmen kann. Um die Abhängigkeit von x anzudeuten, schreiben wir manchmal auch A(x) anstatt A. Es macht keinen Sinn zu fragen, ob A(x) wahr ist. Man kann aber fragen, für welche Werte von x die Aussage A(x) wahr ist. Quantoren quantifizieren für welche x die Aussage A(x) wahr ist. Die wichtigsten Quantoren sind: • ∃x A(x): es existiert (mindestens) ein Wert für x, sodass die Aussage A(x) wahr ist. • ∀x A(x): für jeden möglichen Wert von x ist die Aussage A(x) wahr. Die folgenden Aussagen sind Beispiele wahrer Aussagen. (a) ∀x ∈ Z x2 ≥ 0. (b) ∃x ∈ Q ∀y ∈ Q y 2 6= x. 12 KAPITEL 1. MENGEN UND FUNKTIONEN Die erste Aussage sagt, dass das Quadrat einer ganzen Zahl immer nicht-negativ ist. Die zweite Aussage sagt, dass rationale Zahlen existieren, die keine Quadratzahl sind. Um zu zeigen, dass die Aussage wahr ist, müssen wir also eine konkrete Zahl x mit der gewünschten Eigenschaft angeben. Beispielsweise gilt dies für x = 2 (siehe Satz 2.1.7). Es ist wichtig die Reihenfolge der Quantoren zu betrachten. Betrachte die folgenden zwei Aussagen: (a) ∀x ∈ R ∃y ∈ R x + y = 1. (b) ∃y ∈ R ∀x ∈ R x + y = 1. Die Aussage (a) sagt, dass wir für alle reellen Zahlen x eine reelle Zahl y mit x + y = 1 finden können. Die Zahl y darf also von x abhängen. Diese Aussage ist wahr: Wähle y = 1 − x. Die Aussage (b) sagt, dass ein y ∈ R mit x + y = 1 für alle x existiert. Die Zahl y hängt hier also nicht von x ab. Diese Aussage ist falsch. Als nächstes betrachten wir die Negierung von Aussagen. Viele Beweisstrategien benutzen die Negierung von Aussage (siehe der indirekte Beweis und der Widerspruchsbeweis in Abschnitt 2.1). Um diese Methoden erfolgreich anzuwenden, muss man Aussagen korrekt negieren. Am Anfang haben hiermit viele Studierende Schwierigkeiten. Beispielsweise ist die Negierung der Aussage Ich möchte Kaffee nicht Ich möchte Tee sondern Ich möchte keinen Kaffee. Das folgende Lemma gibt einige wichtige Regeln. Vergleichen Sie die Aussagen (b) und (c) mit den Regeln von de Morgan (Satz 1.1.3.(e)). Lemma 1.2.3. Seien A und B Aussagen. Es gilt: (a) A ist äquivalent zu ¬¬A, (b) ¬(A ∧ B) ist äquivalent zu (¬A) ∨ (¬B), (c) ¬(A ∨ B) ist äquivalent zu (¬A) ∧ (¬B), (d) ¬∃x A(x) ist äquivalent zu ∀x ¬A(x), (e) ¬∀x A(x) ist äquivalent zu ∃x ¬A(x), (f) ¬(A ⇒ B) ist äquivalent zu A ∧ ¬B. Beweis. Die Aussagen (a), (b), (c) und (f) kann man mit Hilfe einer Wahrheitstafel beweisen. Wir überlassen dies der Leserin/dem Leser als Übungsaufgabe. Für (d) betrachten wir die Menge M aller x für die Aussage A(x) wahr ist. Die Aussage ¬∃x A(x) sagt nun, dass kein x existiert, sodass A(x) wahr ist. Die Menge M ist also leer. Dies ist äquivalent zu der Aussage, dass für alle x die Aussage A(x) falsch, d. h. ¬A(x) wahr ist. Dies zeigt (d). Aussage (e) beweist man ähnlich. 1.3. FUNKTIONEN 13 Wir geben konkrete Beispiele zu den Aussagen von Lemma 1.2.3. Ein komplizierteres Beispiel finden Sie in Beispiel 4.2.4.(b). Beispiel 1.2.4. (a) Sei A die Aussage es regnet. Dann ist ¬A die Aussage es regnet nicht und ¬¬A die Aussage es regnet nicht nicht. Die letzte Aussage ist äquivalent zur Aussage es regnet. (b) Wir betrachten nochmals die Aussage Wenn heute Sonntag ist, gibt es keine Vorlesung aus Beispiel 1.2.2. Die Negierung dieser Aussage ist: heute ist Sonntag und es gibt eine Vorlesung. (c) Betrachte die Aussage ¬∃x ∈ Q x2 = 2. Diese Aussage sagt, dass keine rationale Zahl x mit x2 = 2 existiert. Anders gesagt: Alle rationalen Zahlen x erfüllen x2 6= 2. In logischen Symbole ausgedrückt ist dies: ∀x ∈ Q x2 6= 2. In Satz 2.1.7 werden wir diese Aussage zeigen. (d) Wir betrachten die Aussage: ¬∃y ∈ R ∀x ∈ R x + y = 1. Diese Aussage ist äquivalent zu ∀y ∈ R ∃x ∈ R x + y 6= 1. 1.3 Funktionen Funktionen sind in der Mathematik mindestens genau so wichtig wie Mengen. Eine Funktion kann man als eine Relation zwischen Mengen auffassen. Wichtige Beispiele von Funktionen wie Sinus oder Exponentialfunktion kennen Sie schon aus der Schule. Definition 1.3.1. Eine Funktion (oder: Abbildung) ist eine Zuordnungsvorschrift, bei dem jedes Element des Definitionsbereichs X genau einem Element des Wertebereichs Y zugeordnet wird. Bezeichnung: f : X → Y , x 7→ f (x). Das Bild einer Funktion f : X → Y ist die Teilmenge { f (x) | x ∈ X } von Y . Für y ∈ Y heißt f −1 (y) := { x ∈ X | f (x) = y } das Urbild von y. Ähnlich definieren wir für eine Teilmenge Y1 ⊂ Y das Urbild als f −1 (Y1 ) := { x ∈ X | f (x) ∈ Y1 } . Ein wichtiges, aber triviales Beispiel einer Funktion ist die Identität: IdM : M → M, m 7→ m. Diese Abbildung bildet jedes Element der Menge auf sich selbst ab. 14 KAPITEL 1. MENGEN UND FUNKTIONEN Bemerkung 1.3.2. (a) Beachte, dass der Pfeil 7→ die Zuordnungsvorschrift und der Pfeil → den Definitions- und Wertebereich angibt. (b) Eine Funktion ordnet jedes x ∈ X genau einem Element f (x) ∈ Y zu. Das Element f (x) soll also eindeutig durch x bestimmt sein. Diese Eigenschaft einer Funktion nennt man auch Wohldefiniertheit. Beispielsweise ist die Zuordnung n 7→ die Primfaktoren von n, N≥2 → N≥2 keine Funktion, da n mehr als einen Primfaktor besitzen kann. Die Zuordnung n 7→ { die Primfaktoren von n}, N≥2 → P(N≥2 ) ist eine Funktion. Diesmal fassen wir die Menge der Primfaktoren von n als Element der Potenzmenge auf. Wir können Funktionen auch als Menge auffassen. Jede Funktion f : X → Y bestimmt seinen Graph: Γf := { (x, y) ∈ X × Y | y = f (x) } . Umgekehrt definiert eine Teilmenge Z ⊂ X ×Y genau dann eine Funktion, wenn die Eigenschaft ∀x ∈ X |Z ∩ { x } × Y | = 1 erfüllt ist. Diese Eigenschaft sagt, dass jedem x ein eindeutiges y = f (x) zugeordnet wird. Wäre |Z ∩ {x} × Y | = 0, würde dieses x nirgendwohin abbilden. Wäre |Z ∩ {x} × Y | > 1, würde dieses x auf mehr als ein y abgebildet werden. Beides ist laut Definition 1.3.1 nicht erlaubt. Definition 1.3.3. Seien f : A → B und g : B → C Funktionen. Die Funktion g ◦ f : A → C, x 7→ g(f (x)) heißt Verknüpfung (oder Komposition oder Hintereinanderausführung) von f mit g. Streng genommen enthält Definition 1.3.3 auch die Aussage, dass g◦f wieder eine Funktion ist. Hierzu muss man zeigen, dass die Zuordnung x 7→ g(f (x)) jedes x genau einem Element aus C zuordnet. Dies gilt, da f und g Funktionen sind. Sei nun h : C → D eine weitere Funktion. Es folgt aus der Definition, dass die beide Verknüpfungen h ◦ (g ◦ f ) : A → D und (h ◦ g) ◦ f : A → D gleich sind: Beide bilden x auf h(g(f (x))) ab. Wichtig ist hierbei, dass die Funktionen jeweils in der gleichen Reihenfolge auftauchen, wie das folgende Beispiel erläutert: Beispiel 1.3.4. Sei f : R → R, x 7→ x2 und g : R → R, x 7→ 2x − 1. Dann ist g ◦ f : x 7→ 2x2 − 1, f ◦ g : x 7→ (2x − 1)2 . Beachte, dass die beide Funktionen nicht gleich sind. Beispielsweise ist g ◦f (0) = −1 und f ◦ g(0) = 1. 1.3. FUNKTIONEN 15 Definition 1.3.5. Sei f : A → B eine Funktion und C ⊂ A eine Teilmenge. Die Einschränkung von f auf C ist definiert als f |C : C → B, x 7→ f (x). Die Zuordnungsvorschrift einer Einschränkung ist also der ursprunglichen Zuordnungsvorschrift gleich, aber der Definitionsbereich wird durch eine kleinere Menge ersetzt. Ein typisches Beispiel ist die Einschränkung der Sinus-Funktion von R auf dem Intervall [0, 2π]. Definition 1.3.6. Sei f : X → Y eine Funktion. (a) Die Funktion f heißt injektiv, wenn für alle x1 , x2 ∈ X gilt, dass f (x1 ) und f (x2 ) nur dann gleich sind, wenn x1 und x2 gleich sind. (b) Die Funktion f heißt surjektiv, wenn für alle y ∈ Y ein x ∈ X mit der Eigenschaft f (x) = y existiert. (c) Die Funktion f heißt bijektiv, wenn f sowohl injektiv als auch surjektiv ist. Bemerkung 1.3.7. Injektivität einer Funktion bedeutet, dass das Urbild f −1 (y) höchstens aus einem Element besteht. Zu jedem y ∈ Y bildet höchstens ein x ∈ X ab. Surjektivität einer Funktion bedeutet, dass das Urbild f −1 (y) mindestens aus einem Element besteht. Zu jedem y ∈ Y bildet mindestens ein x ∈ X ab. Eine Funktion f : X → Y ist also genau dann surjektiv, wenn f (X) = Y ist. Bijektivität einer Funktion bedeutet, dass das Urbild f −1 (y) genau aus einem Element besteht. Wir können die Elemente von Y einem eindeutigen Urbild x ∈ X zuordnen. Beispiel 1.3.8. surjektiv. (a) Die Funktion f : R → R, x 7→ x2 ist weder injektiv noch (b) Die Funktion f : R → [0, ∞), x 7→ x2 ist surjektiv, aber nicht injektiv. (c) Die Funktion g : R → R, x 7→ x3 ist sowohl injektiv als auch surjektiv, also bijektiv. Satz 1.3.9. Sei f : X → Y eine injektive Funktion. Dann existiert eine Funktion g : f (X) → X mit der Eigenschaft (1.1) f (x) = y ⇔ g(y) = x. Beweis. Sei f : X → Y injektiv. Wir bemerken, dass die Funktion f : X → f (X) auch surjektiv, also bijektiv, ist. Wir definieren g : f (X) → X durch die Zuordnung y 7→ x, wobei x ein Element aus X mit f (x) = y ist. Da y ∈ f (X) ist, existiert ein solches Element x. Wir zeigen, dass diese Zuordnung eine Funktion definiert, also, dass g : x 7→ y wohldefiniert ist. Wir nehmen an, dass ein weiteres Element x0 ∈ X mit f (x0 ) = y existiert. Nun gilt f (x) = f (x0 ) = y. Da f injektiv ist, gilt also x = x0 . Dies zeigt, dass g wohldefiniert ist. Die Eigenschaft (1.1) ist offensichtlich erfüllt. 16 KAPITEL 1. MENGEN UND FUNKTIONEN Die Funktion g aus Satz 1.3.9 heißt Umkehrfunktion von f . Die Umkehrfunktion von f wird auch mit f −1 bezeichnet und erfüllt die Eigenschaft: f −1 ◦ f = IdX : X → X, f ◦ f −1 = Idf (X) : f (X) → f (X). Wir benutzen die gleiche Bezeichung für die Umkehrfunktiom einer bijektiven Abbildung und das Urbild. Ist f : X → Y bijektiv, dann besteht das Urbild f −1 (y) für alle y ∈ Y aus einem Element. Dies definiert die Zuordnungsvorschrift der Umkehrfunktion. Beispiel 1.3.10. (a) Die Caesar–Chiffre ist ein Verschlüsselungsverfahren, das schon von Julius Caesar für seine persönliche Korrespondenz benutzt wurde. Um die Nachricht zu verschlüsseln, wird jeder Buchstabe um drei verschoben: a b c d ··· z x f (x) d e f g ··· c. Die Nachricht hallo wird also zu kdoor verschlüsselt. Um die Nachricht zu entschlüsseln, wenden wir die Umkehrfunktion an: y = f (x) d e f g ··· c f −1 (y) = x a b d ··· z. c Damit man eine verschlüsselte Nachricht eindeutig entschlüsseln kann, ist es wichtig, dass die Verschlüsselungsvorschrift bijektiv ist. Wenn wir beispielsweise den iten Buchstaben auf den 2iten Buchstaben abbilden, erhalten wir folgende Verschlüsselungsvorschrift: x a b f (x) b d f c ··· n o ··· h ··· b f ··· . d Wenn die verschlüsselte Nachricht den Buchstabe b enhält, wissen wir nicht, ob dies ursprunglich ein a oder ein n war. Wir können die Nachricht also nicht eindeutig entschlüsseln. Mehr zum Verschlüsseln erfahren Sie nächstes Semester in der Vorlesung Elementare Zahlentheorie. (b) Die Funktion f : R → R, x 7→ x3 ist bijektiv. Die Umkehrfunktion ist g : R → R, y 7→ y 1/3 . (c) Die Funktion cos : [0, π] → [−1, 1] ist bijektiv. Die Umkehrfunktion heißt arccos : [−1, 1] → [0, π]. (d) Die Funktion exp : R → (0, ∞) ist bijektiv. Die Umkehrfunktion heißt log : (0, ∞) → R. Beachte, dass wir mit log den Logarithmus zur Basis e bezeichnen. Kapitel 2 Beweismethoden 2.1 Der direkte Beweis und Varianten In diesem Abschnitt beschreiben wir die ersten drei Beweismethoden, die Varianten des direkten Beweises sind. Diese Methode beschreiben wir nun als Erste. Der direkte Beweis. Ziel ist es eine Aussage der Form A ⇒ B zu beweisen. Der Beweis folgt folgende Schritten: Wir nehmen an, dass die Aussage A gilt. Wir versuchen hieraus die Aussage B abzuleiten. Hierzu benutzt man schon bekannte Sätze und Definitionen. Es gibt kein allgemeines Rezept, wie man dies am Einfachsten macht. Hier hilft nur learning by doing. Wir zeigen das Verfahren anhand von einigen Beispielbeweisen. Wir geben hier nicht nur den Beweis, sondern versuchen auch zu beschreiben, wie man hier vor geht. Dadurch ist der Beweis selbstverständlich viel ausführlicher als beispielsweise im Skript der Vorlesung Lineare Algebra. Wir beweisen die erste Aussage von Satz 1.1.3.(c). Lemma 2.1.1. Seien A, B, C Mengen. Dann gilt (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C). Beweis. Die Aussage ist zunächst nicht als Implikation formuliert. Wir benutzen, dass zwei Mengen M und N genau dann gleich sind, wenn M ⊂ N und N ⊂ M (Übungsaufgabe). Wir müssen die folgenden zwei Aussagen zeigen: (I) (A ∪ B) ∩ C ⊂ (A ∩ C) ∪ (B ∩ C), (II) (A ∪ B) ∩ C ⊃ (A ∩ C) ∪ (B ∩ C). Wir zeigen zunächst (I). Diese Aussage kann man als Implikation auffassen, indem man (I) zu x ∈ (A ∪ B) ∩ C ⇒ x ∈ (A ∩ C) ∪ (B ∩ C) 17 18 KAPITEL 2. BEWEISMETHODEN umformuliert. Jetzt legen wir los mit dem eigentlichen Beweis. Sei x ∈ (A ∪ B) ∩ C ein beliebiges Element, also ist x ∈ A ∪ B und x ∈ C (dies folgt aus der Definition der Schnittmenge). Die Definition der Vereinigung impliziert, dass mindestens eine der folgenden Aussagen gilt: • x ∈ A und x ∈ C, d. h. x ∈ A ∩ C, • x ∈ B und x ∈ C, d. h. x ∈ B ∩ C. Hieraus folgt, dass x ∈ (A ∩ C) ∪ (B ∩ C). Dies beweist (I). Wir zeigen (II). Sei dazu x ∈ (A ∩ C) ∪ (B ∩ C), d. h. x ∈ A ∩ C oder x ∈ B ∩ C. Wir nehmen an, dass x ∈ A ∩ C. Der andere Fall ist ähnlich. Es gilt x ∈ A und x ∈ C. Die Menge A ist eine Teilmenge von A ∪ B, also ist x ∈ A ∪ B. Wir schließen, dass x ∈ (A ∪ B) ∩ C ist. Dies zeigt (II) und daher die Aussage. Hier sind einige Bemerkungen zur Struktur des obigen Beweises. Bemerkung 2.1.2. (a) Am Anfang ist es wichtig genau hinzuschreiben, was man zeigen muss und was bekannt ist. Bei komplizierten Formeln ist es wichtig genau hinzuschreiben, was die einzelnen Symbole und Begriffe bedeuten. Der obige Beweis ist fast trivial, wenn man alle Definitionen genau hingeschrieben hat. (b) In Teil (II) des obigen Beweises machen wir eine Fallunterscheidung. Hier muss man aufpassen, dass die Fälle alle Möglichkeiten abdecken. (c) Bitte beachten Sie, dass Ihre Übungsblätter von studentischen Hilfkräften korrigier werden. Versuchen Sie möglichst klar zu formulieren. Wenn der Korrektor nicht versteht was Sie schreiben, bekommen Sie keine Punkte! Wir betrachten ein weiteres Beispiel eines direkten Beweises. Die Definition des Urbilds f −1 (Y ) haben wir in Definition 1.3.1 gegeben. Lemma 2.1.3. Sei f : A → B eine Funktion und seien X1 , X2 ⊂ A und Y1 , Y2 ⊂ B Teilmengen. Dann gilt: (a) f (X1 ) \ f (X2 ) ⊂ f (X1 \ X2 ), (b) f −1 (Y1 \ Y2 ) = f −1 (Y1 ) \ f −1 (Y2 ). Beweis. Wir beweisen zuerst (a). Hierbei gehen wir wie im Beweis von Lemma 2.1.1 vor. Sei y ∈ f (X1 ) \ f (X2 ). Da y ∈ f (X1 ) ist, existiert ein x ∈ X1 mit f (x) = y. Da y ∈ / f (X2 ), existiert kein x2 ∈ X2 mit f (x2 ) = y. Insbesondere gilt x ∈ / X2 . Also ist x ∈ X1 \ X2 . Wir schließen, dass y ∈ f (X1 \ X2 ) ist. Wir beweisen nun (b). Wir müssen folgende zwei Inklusionen zeigen: (I) f −1 (Y1 \ Y2 ) ⊂ f −1 (Y1 ) \ f −1 (Y2 ), (II) f −1 (Y1 \ Y2 ) ⊃ f −1 (Y1 ) \ f −1 (Y2 ). 2.1. DER DIREKTE BEWEIS UND VARIANTEN 19 Wir zeigen zuerst (I). Sei x ∈ f −1 (Y1 \ Y2 ). Dies bedeutet, dass f (x) ∈ Y1 \ Y2 . Also gilt f (x) ∈ Y1 und f (x) ∈ / Y2 . Dies bedeutet, dass x ∈ f −1 (Y1 ) \ f −1 (Y2 ). Der Beweis von (II) ist ähnlich. Eine Variante des direkten Beweises ist der indirekte Beweis oder Beweis durch Kontraposition. Wir möchten wieder eine Aussage der Form A ⇒ B beweisen. Mit Hilfe des Kontrapositionsgesetzes (Lemma 1.2.1) können wir dies zu ¬B ⇒ ¬A umformulieren. Wir nehmen an, dass B nicht gilt und versuchen hieraus abzuleiten, dass A auch nicht gilt. Beispiel 2.1.4. Ein (nichtmathematisches) Beispiel eines indirekten Beweises ist der sogenannte “Alibi-Beweis”. Frau Z. wird beschuldigt, am 01.04.2013 um 23.05 Uhr einen Einbruch in einem Juweliergeschäft verübt zu haben. Frau Z. behauptet, unschuldig zu sein. Als Beweis führt Sie ein Blitzerfoto für die fragliche Uhrzeit an. Wir betrachten folgende Aussagen: (I) Frau Z. hat am 01.04.2013 um 23.05 Uhr den Einbruch begangen. (II) Frau Z. war am 01.04.2013 um 23.05 Uhr im Juweliersgeschäft. Aussage (I) impliziert (II). Außerdem gilt ¬(II). Hieraus leiten wir ab, dass auch ¬(I) gilt. Frau Z. wird also freigesprochen. Eine dritte Variante ist der Widerspruchsbeweis auch reduktio ad absurdum genannt. Man möchte eine Aussage (I) zeigen. Man nimmt an, dass ¬ (I) gilt und versucht einen Widerspruch abzuleiten. Ein Widerspruch kann z.B. eine falsche Aussage wie 0 = 1 oder A ∧ ¬A sein. Ähnlich wie beim indirekten Beweis folgt hieraus, dass die Annahme ¬ (I) nicht gestimmt haben kann, also ist (I) wahr. Wir beweisen folgende Aussage mit allen drei Methoden. Überlegen Sie sich, welche Methode Sie in diesem Fall am Einfachsten finden. Der direkte Beweis benutzt dabei den Fundamentalsatz der Arithmetik, der besagt, dass jede natürliche Zahl n ≥ 2 eine Primfaktorzerlegung besitzt, also als Produkt von Primzahlen geschrieben werden kann. Diese Zerlegung ist bis auf die Reihenfolge eindeutig. Dieser Satz wird nächstes Semester in der Vorlesung Elementare Zahlentheorie bewiesen ([1, Theorem 1.2.4], siehe auch Theorem 2.2.6). Lemma 2.1.5. Sei n ∈ N. Ist n2 gerade, dann ist auch n gerade. Beweis. Sei n ∈ N eine beliebige Zahl. Die Aussage des Lemmas ist von der Form A ⇒ B, wobei A die Aussage n2 ist gerade und B die Aussage n ist gerade (beachte, dass n eine feste, aber beliebige Zahl ist. Die Zahl n ist also keine Variable in den Aussage A und B. Dies ist eine alternative Formulierung für “∀n ∈ N gilt Folgendes). 20 KAPITEL 2. BEWEISMETHODEN (I) Der direkte Beweis Wir nehmen an, dass n2 gerade ist. Dies bedeutet, dass ein k ∈ N mit n2 = 2k existiert. Wir schreiben n = 2 · m mit m ungerade und ≥ 0 (dies ist wegen des Fundamentalsatzes der Arithmetik möglich). Die Zahl n ist genau dann gerade, wenn > 0 ist. Es folgt, dass 2k = n2 = 22 · m2 . Wir schließen, dass > 0 ist. Also ist n gerade. (II) Der indirekte Beweis Wir nehmen an, dass n ungerade ist. Es existiert also ein k ∈ N0 mit n = 2k + 1 (dies ist die Definition einer ungeraden Zahl). Es gilt n2 = (2k + 1)2 = 4k 2 + 4k + 1 = 2(2k 2 + 2k) + 1. Also ist auch n2 ungerade. Dies beweist die Aussage. (III) Der Widerspruchsbeweis Wir nehmen an, dass die Aussage des Lemmas nicht gilt. Lemma 1.2.3.(f) besagt, dass dies äquivalent ist zu der Aussage, dass n2 gerade und n ungerade ist (“A ∧ ¬B”). Die Annahme, dass n ungerade ist, bedeutet, dass ein k ∈ N mit n = 2k + 1 existiert. Wie im indirekten Beweis folgt, dass n2 ungerade ist. Dies widerspricht die Annahme, dass n2 gerade ist. Die Aussage des Lemmas folgt. Wir bemerken, dass in dieser Situation der Widerspruchsbeweis fast identisch mit dem indirekten Beweis ist. Wir bevorzügen hier den indirekten Beweis, da die Struktur des Beweises einfacher ist. Als Beispiel eines Widerspruchsbeweises betrachten wir den Satz von Euklid. Satz 2.1.6 (Euklid). Es existieren unendlich viele Primzahlen. Beweis. Annahme: Es existieren nur endlich viele Primzahlen. Sei P = { p1 , . . . , pr } die (endliche) Menge aller Primzahlen. Die Zahl 2 ist eine Primzahl, also ist P nicht leer. Sei N := 1 + p1 · p2 · · · pr . Dies ist eine natürliche Zahl größer gleich 2, also besitzt N eine Primfaktorzerlegung. Die Zahlen p1 , . . . , pr sind laut Annahme die einzigen Primzahlen. Es existieren also Zahlen ai ∈ N0 , sodass N = pa1 1 · · · par r . Insbesondere teilt mindestens eine der pi die Zahl N . Wir bezeichnen diese Aussage mit (I). Wir zeigen nun, dass keine der pi die Zahl N teilt. Dies ist die Aussage ¬ (I). Wenn pi | N , dann teilt pi auch N − p1 · p2 · · · pr = 1. Dies gilt aber nicht, da pi ≥ 2 ist. Also ist pi kein Teiler von N . Wir haben nun einen Widerspruch enthalten: Wir haben gezeigt, dass sowohl (I) als auch ¬ (I) gilt. Wir schließen, dass die Annahme falsch ist. Dies beweist den Satz. 2.1. DER DIREKTE BEWEIS UND VARIANTEN 21 Als ein zweites Beispiel für einen Widerspruchsbeweis zeigen wir Satz 2.1.7. Es existiert kein x ∈ Q mit x2 = 2. Beweis. Annahme: Es existiert ein x ∈ Q mit x2 = 2. Wir dürfen annehmen, dass x ≥ 0 ist. Falls nämlich ein x ∈ Q mit x ≤ 0 und x2 = 2 existiert, erfüllt y := −x auch y 2 = 2 und außerdem gilt y ≥ 0. Die Zahl y erfüllt also die Anforderungen. Wir nehmen also an, dass x ≥ 0 eine rationale Zahl mit x2 = 2 ist. Offensichtlich ist x 6= 0. Wir können also x = p/q mit p, q ∈ N und p und q teilerfremd schreiben. Es folgt, dass p2 x2 = 2 = 2, q also p2 = 2q 2 . Wir schreiben p = 2i · p0 und q = 2j · q 0 mit p0 , q 0 ungerade (hier benutzen wir wieder den Fundamentalsatz der Arithmetik). Einsetzen in p2 = 2q 2 liefert 2i = 2j + 1. Diese Zahl ist also sowohl gerade als auch ungerade. Dies liefert einen Widerspruch. Die Annahme ist daher falsch und der Satz gezeigt. Im obigen Beweis steht der Satz “Wir dürfen annehmen, dass x ≥ 0 ist.” Ein übliche Kurzform dieses Satzes ist “ o.B.d.A. ist x ≥ 0”, hierbei ist o.B.d.A. die Abkürzung von “ohne Beschränkung der Allgemeinheit”. In unserem Beweis bedeutet dies, dass wir keine Fallunterscheidung x ≥ 0 und x < 0 machen müssen, sondern, dass es reicht der Fall x ≥ 0 zu betrachten. Im Beweis haben wir begründet wieso dies reicht. Wir geben noch einige weitere Möglichkeiten an, einen Beweis zu gestalten. Beweis durch Beweis einer stärkeren Aussage. Manchmal ist es leichter, eine stärkere Aussage zu zeigen, als die, die man eigentlich zeigen möchte. Seien beispielsweise f, g : R → R zwei Funktionen von denen man zeigen möchte, dass für alle x im Definitionsbereich f (x) + sin(x) ≤ g(x) gilt. Dann reicht es zu zeigen, dass f (x) + 1 ≤ g(x), da sin(x) ≤ 1 ist. Die zweite Aussage ist meistens einfacher zu zeigen. Beweis einer Aussage der Form A ∧ B. Hier sollte man die beiden Aussagen A und B einzeln zeigen. Beweis einer Aussage der Form A ∨ B. Hier sollte man annehmen, dass eine der beiden Aussagen (beispielsweise A) nicht gilt und zeigen, dass die andere (hier also B) gilt. Ein Beispiel ist der Beweis von Satz 3.1.7. Beweis einer Aussage der Form A ⇔ B. Hier zeigt man die beiden Aussagen: (I) A ⇒ B, 22 KAPITEL 2. BEWEISMETHODEN (II) B ⇒ A. Möchte man zeigen, dass drei Aussagen A, B, C äquivalent sind, reicht es folgende drei Aussagen zu zeigen: (I) A ⇒ B, (II) B ⇒ C, (III) C ⇒ A. Hat man diese drei Aussagen gezeigt, folgen auch die anderen Richtungen. Beispielsweise folgt A ⇒ C aus der Verknüpfung von (I) und (II). Es ist auch möglich eine andere Auswahl von Implikationen zu zeigen. Beispielsweise reicht es auch A ⇔ B und A ⇔ C zu zeigen. Ob die von Ihnen gezeigten Aussagen ausreichen, zieht man am Einfachsten, wenn man die Implikationen grafisch darstellt. Hat man beispielsweise folgende Implikationen gezeigt, folgt nicht, dass die Aussagen A, B, C äquivalent sind: A B C Denn die Implikation C ⇒ A wurde hier noch nicht gezeigt. Ein grundlegendes Prinzip ist das Schubfachprinzip (Englisch: pigeonhole principle). Es wurde erstmals von dem deutschen Mathematiker Dirichlet (1805 - 1859) formuliert. Dabei handelt es sich um die folgende ziemlich offensichtliche Aussage. Lemma 2.1.8 (Das Schubfachprinzip). Seien n, m ∈ N mit n > m. Verteilt man n Objekte auf m Mengen, dann enthält mindestens eine der Mengen mehr als ein Objekt. Beweis. Wenn die m Mengen alle höchstens ein Element enthalten, gibt es höchstens m Objekte. Dies widerspricht der Annahme m < n. Die Aussage folgt. Die folgende Aussage ist eine Anwendung des Schubfachprinzips. Lemma 2.1.9. Seien N und M endliche Mengen und sei ϕ : M → N eine Abbildung. Dann ist ϕ genau dann injektiv, wenn ϕ surjektiv ist. Beweis. Übungsaufgabe 2.2. VOLLSTÄNDIGE INDUKTION 2.2 23 Vollständige Induktion Vollständige Induktion ist eine Beweismethode, um Aussagen zu zeigen, die für alle natürlichen Zahlen n wahr sein sollen. Beispiele solcher Aussagen sind: (I) f (n) := n2 − n + 41 ist eine Primzahl für alle n ∈ N0 . (II) 1 + 2 + · · · n = n(n + 1)/2 für alle n ∈ N. Um eine solche Aussage zu zeigen, muss man für jedes n die Behauptung zeigen. Man kann dies für kleines n einfach nachrechnen, aber nicht für alle n. Wenn die Aussage für kleines n gilt, bedeutet dies nicht, dass die Aussage auch wirklich stimmt: Die erste Aussage stimmt beispielsweise für n = 0, 1, 2, . . . , 40, aber nicht mehr für n = 41, da f (41) = 412 keine Primzahl ist. Das kleinste Gegenbeispiel kann also recht groß sein. Vollständige Induktion beruht auf der folgenden Eigenschaft der natürlichen Zahlen. Das Prinzip des kleinsten Kriminellen Sei S ⊂ N eine nicht-leere Teilmenge. Dann besitzt S ein kleinstes Element. Wir wenden dieses Prinzip auf die obige Aussage (I) an und definieren S := { n ∈ N | f (n) ist keine Primzahl } als die Menge der Zahlen n für die die Aussage (I) nicht gilt. Das Prinzip des kleinsten Kriminellen sagt, dass es eine kleinste Zahl gibt für die die Aussage nicht gilt, diese Zahl ist also der “kleinste Kriminelle” oder auch das kleinste Gegenbeispiel. In unserem Fall ist dies n = 41. Allgemein sagt dieses Prinzip also Folgendes. Sei A(n) mit n ∈ N eine Familie von Aussagen. Wenn Aussage A(n) nicht für alle n ∈ N gilt, dann gibt es eine kleinste Zahl für die die Aussage nicht gilt. Hieraus leitet sich das Prinzip der vollständigen Induktion ab. Bei vollständiger Induktion zeigt man, dass keine kleinste Zahl n, für die eine Aussage A(n) falsch ist, existiert. Vollständige Induktion. Sei (A(n))n∈N eine Familie von Aussagen. Wir nehmen an, dass folgendes gilt: (IA) A(1) ist wahr. (Induktionsanfang) (IS) Falls A(n) wahr ist, dann ist auch A(n + 1) wahr (Induktionsschritt). Dann ist die Aussage A(n) für alle n wahr. (Induktionsschluss) Wir überlegen uns, wieso das Prinzip der vollständigen Induktion aus dem der kleinsten Kriminellen folgt. Sei dazu A(n) wie oben. Wir nehmen an, dass (IA) und (IS) gelten. Sei S ⊂ N die Mengen der Zahlen für die A(n) nicht gilt. Wir behaupten, dass S = ∅, also, dass A(n) für alle n wahr ist. Wir nehmen an, dass S 6= ∅. Nach dem Prinzip des kleinsten Kriminellen existiert ein kleinstes Element n ∈ S. Wegen (IA) ist n 6= 1. Also ist A(n) falsch 24 KAPITEL 2. BEWEISMETHODEN und A(n − 1) wahr. Dies widerspricht (IS). Dies zeigt, dass A(n) für alle n wahr ist. Wir betrachten zunächst einen Beispielbeweis. Lemma 2.2.1. Für alle n ∈ N gilt 2n > n. Beweis. Sei A(n) die Aussage 2n > n. (IA): Die Aussage A(1) ist wahr, da 21 = 2 > 1. (IS): Wir nehmen an, dass die Aussage A(n) für ein beliebiges n wahr ist, also, dass 2n > n ist. Diese Annahme heißt Induktionshypothese (IH). Es gilt 2n+1 = 2n · 2. Die Induktionshypothese zeigt also, dass I.H. 2n+1 = 2n · 2 > n · 2 = n + n ≥ n + 1. Bei der letzten Abschätzung haben wir benutzt, dass n ≥ 1 ist. Es gilt also die Aussage A(n + 1). Aus dem Prinzip der vollständigen Induktion folgt, dass die Aussage für alle n ∈ N gilt. Bemerkung 2.2.2. (a) Strukturieren Sie bitte Beweise mit Induktion immer so wie vorgegeben, vor allem am Anfang. Geben Sie insbesondere an, wo Sie die Induktionshypothese benutzen. Wenn Sie im Induktionsschritt die Induktionshypothese nicht benutzt haben, haben Sie bestimmt einen Fehler gemacht. (b) Es ist wichtig, dass wir in der Induktionshypothese nichts über n annehmen. Um die Schlußfolgerung zu ziehen, müssen wir nämlich den Induktionsschritt für alle n nacheinander anwenden. Hier sind noch zwei weitere Beweise mit Induktion. Lemma 2.2.3 geht auf Gauß zurück, der die Aussage für n = 100 im Alter von 7 Jahren gefunden hat (siehe http://www-history.mcs.st-and.ac.uk/Biographies/Gauss.html) Lemma 2.2.3. Für alle n ∈ N gilt 1 + 2 + ··· + n = n(n − 1) . 2 Beweis. Sei S(n) die Aussage 1 + 2 + · · · + n = n(n+1) . 2 (I.A.): Die Aussage S(1) ist offensichtlich wahr. (I.S.): Wir nehmen an, dass S(n) für ein beliebiges n gilt. Es gilt n(n + 1) + (n + 1) 2 hn i (n + 1)(n + 2) = (n + 1) +1 = . 2 2 I.H. 1 + 2 + · · · + n + (n + 1) = 2.2. VOLLSTÄNDIGE INDUKTION 25 Also gilt S(n + 1). Aus dem Prinzip der vollständigen Induktion folgt, dass die Aussage für alle n ∈ N gilt. Die Aussage A(n),die man mit vollständigen Induktion zeigen möchte, muss nicht immer für alle natürliche Zahlen gelten. Die Aussage im folgenden Satz müssen wir nur für n ≥ 5 zeigen. Für n = 3, 4 stimmt die Aussage nicht. Wir fangen daher mit dem Induktionsanfang bei n = 5 an. Im Beweis benutzen wir diese Annahme: Für n = 3, 4 stimmt der Induktionsanfang nicht. Im Induktionsschritt (genauer in Lemma 2.2.5) benutzen wir n 6= 1, 2. Satz 2.2.4. Für alle n ∈ N≥5 gilt: 2n > n2 . Bevor wir den Beweis der Aussage geben, überlegen wir uns auf einem Schmierzettel zunächst wieso die Aussage stimmt. Der Anfang ist ähnlich wie im Beweis von Lemma 2.2.1. Sei A(n) die Aussage aus dem Satz. Wir nehmen an, dass A(n) wahr ist. Es gilt: I.H. 2n+1 = 2n · 2 > 2n2 . Wir müssen zeigen, dass 2n2 > (n + 1)2 = n2 + 2n + 1. Wir ziehen an beiden Seiten n2 ab und sehen, dass es reicht zu zeigen, dass n2 > 2n + 1 ist. Wir beweisen zunächst diese Aussage mit Induktion. Einsetzen von kleinen Werten zeigt, dass die Hilfsaussage auch für n = 3, 4 gilt. Lemma 2.2.5. Für n ∈ N≥3 gilt, dass n2 ≥ 2n + 1. Wir überlassen den Beweis von Lemma 2.2.5 als Übungsaufgabe und beweisen Satz 2.2.4. Beweis von Satz 2.2.4. (I.A.) Für n = 5 gilt: 2n = 25 = 32 > 25 = n2 . (I.S.) Wir nehmen an, dass die Aussage für ein beliebiges n ≥ 5 gilt. Dann gilt: I.H. 2n+1 = 2n · 2 > 2n2 = n2 + n2 2.2.5 ≥ n2 + 2n + 1 = (n + 1)2 . Aus dem Prinzip der vollständigen Induktion folgt, dass die Aussage für alle n ∈ N≥5 gilt. Zum Abschluß dieses Abschnittes beschreiben wir eine alternative Form der vollständigen Induktion. Hier sagt die Induktionshypothese nicht nur, dass die Aussage für ein beliebiges n gilt, sondern, dass die Aussage für alle m kleiner gleich n gilt. Zweite Form der vollständigen Induktion Sei (A(n))n∈N eine Familie von Aussagen. Wir nehmen an, dass Folgendes gilt: 26 KAPITEL 2. BEWEISMETHODEN (IA) A(1) ist wahr. (IS) Ist A(m) für alle m ≤ n wahr, ist auch A(n + 1) wahr. Dann ist die Aussage A(n) für alle n ∈ N wahr. Als Anwendung zeigen wir die Existenz der Primfaktorzerlegung. Dies ist eine shwache Form des Fundamentalsatzes der Arithmetik. Theorem 2.2.6. Jede Zahl n ∈ N≥2 lässt sich als ein Produkt von Primzahlen schreiben. Beweis. Vorbemerkung: Für eine Primzahl n ist die Aussage trivial: Das Produkt besteht nur aus einer Primzahl, nämlich der Zahl selber. (I.A.): Die Aussage stimmt für n = 2, da 2 eine Primzahl ist. (I.S.): Sei n ≥ 2 beliebig. Wir nehmen an, dass die Aussage für alle m ≤ n stimmt. Wir zeigen die Aussage für n + 1. Wir unterscheiden zwei Fälle. Fall I: Die Zahl n + 1 ist eine Primzahl. In diesem Fall stimmt die Aussage nach der Vorbemerkung. Fall II: Die Zahl n + 1 ist keine Primzahl. In diesem Fall existieren Zahlen 1 < m1 , m2 < n + 1 mit n + 1 = m1 · m2 . Dies folgt aus der Definition des Begriffs Primzahl (siehe Appendix A.1). Die Induktionshypothese impliziert, dass m1 und m2 ein Produkt von Primzahlen sind. Also ist auch n + 1 ein Produkt von Primzahlen. Aus dem Prinzip der vollständigen Induktion folgt, dass die Aussage für alle n ∈ N gilt. Bemerke, dass die erste Version der Induktion hier nicht weiterhilft, da kein Bezug zwischen der Primfaktorzerlegung von n und von n + 1 besteht. 2.3 Binomialkoeffizienten Als Anwendung der vollständigen Induktion definieren wir in diesem Abschnitt die Binomialkoeffizienten. In den Beweisen der Eigenschaften benutzen wir immer wieder das Prinzip der vollständigen Induktion. Es gilt (1 + x)0 = 1, (2.1) (1 + x)1 = 1 + x, (1 + x)2 = 1 + 2x + x2 , (1 + x)3 = 1 + 3x + 3x2 + x3 . Hierbei ist x eine Variable. Die Koeffizienten in diesen Ausdrücken heißen Binomialkoeffizienten, da sie beim Ausmultiplizieren des Binoms (1 + x)n auftreten. 2.3. BINOMIALKOEFFIZIENTEN 27 Definition 2.3.1. Seien k, n ∈ N0 Zahlen mit k ≤ n. Wir definieren den Binomialkoeffizienten nk durch die Gleichung n (1 + x) = n X n k=0 Man nennt n k n n n n x = + x + ··· + x . k 0 1 n k üblicherweise “n über k”. Einige Werte überlegt man sich relativ leicht. Beispielsweise gilt: n n n n (2.2) = = 1, = = n. 0 n 1 n−1 Unser erstes Ziel ist es, einen Ausdruck für den Binomialkoeffizienten zu geben. Dazu benutzen wir folgendes Lemma. Die Aussage des Lemmas hängt von zwei Parametern k, n ab. Wir beweisen die Aussage nicht mit Induktion sondern direkt aus der Definition der Binomialkoefizienten. Lemma 2.3.2. Für n ∈ N und 0 < k ≤ n gilt: n+1 n n (2.3) = + . k k−1 k Beweis. Sei n ∈ N und 0 < k ≤ n. Wir schreiben (1 + x)n+1 = (1 + x)n · (1 + x). Der Binomialkoeffizient n+1 ist der Koeffizient von xk in (1 + x)n+1 . Der k Koeffizient von xk in der rechten Seite von (2.4) ist (der Koeffizient von xk in (1 + x)n )· (der Koeffizient von 1 in (1 + x)) + (der Koeffizient von xk+1 in (1 + x)n )· (der Koeffizient von x in (1 + x)). Wir finden n+1 n n = ·1+ · 1. k k−1 k (2.4) Die Aussage folgt. Die Aussage des Lemmas kann man mit Hilfe des Pascalschen Dreiecks visualisieren: 1 1 1 1 1 1 2 3 4 1 3 6 .. . . 1 4 1 28 KAPITEL 2. BEWEISMETHODEN Das Diagramm ist wie folgt aufgebaut: An den Außenseiten stehen Einsen. Jede weitere Zahl bekommt man, indem man die zwei schräg darüber stehenden Zahlen zusammenzählt. Dies ist genau die Aussage von Lemma 2.3.2. Das Dreieck wurde nach dem Französischen Mathematiker Blaise Pascal (1623–1662) benannt, siehe http://www-history.mcs.st-andrews.ac.uk/Biographies/Pascal.html. Das Pascalsche Dreieck war den chinesischen Mathematiker Chia Hsien, der im 11. Jahrhundert lebte, bekannt, siehe http://www-history.mcs.st-andrews.ac.uk/Biographies/Jia Xian.html. Auf der Wikipedia-Seite http://de.wikipedia.org/wiki/Yang Hui finden Sie die älteste bekannte Abbildung des Pascalschen Dreiecks aus einem chinesischen MatheBuch aus dem Jahre 1261. Definition 2.3.3. Sei n ∈ N0 . Wir definieren n! (ausgesprochen n Fakultät) induktiv durch 0! = 1, (n + 1)! = (n + 1) · n!. Die Definition 0! = 1 sorgt dafür, dass folgende Aussage auch für k = 0, n gilt. Satz 2.3.4. Für alle k, n ∈ N0 mit 0 ≤ k ≤ n gilt: n n! . = k!(n − k)! k Beweis. Wir zeigen die Aussage mit Induktion nach n. Die Aussage A(n) ist die Aussage, dass die Formel aus dem Satz für festes n und alle mögliche Werte von k gilt. (I.A.) Sei n = 0. Der einzige mögliche Wert für k ist k = 0. Die Aussage gilt offensichtlich. (Hier benutzen wir 0! = 1.) (I.S.) Wir nehmen an, dass die Aussage für eine beliebige Zahl n und alle 0 ≤ k ≤ n gilt. Wir müssen die Aussage für n + 1 und alle 0 ≤ k ≤ n + 1 zeigen. Wir möchten Lemma 2.3.2 anwenden. Da dieses Lemma nur für 0 < k ≤ n gilt, betrachten wir zunächst die Fälle k = 0 und k = n + 1 getrennt. Fall I: k = 0, n + 1. Dieser Fall folgt aus (2.2). Fall II: k 6= 0, n + 1. Sei 0 < k < n + 1. Lemma 2.3.2 zeigt, dass n+1 n n = + . k k−1 k Wir wenden die Induktionshypothese auf die beiden Binomialkoeffizienten auf 2.3. BINOMIALKOEFFIZIENTEN 29 der rechten Seite an. Wir schließen, dass n+1 n! n! = + (k − 1)!(n − k + 1)! k!(n − k)! k n! 1 1 = + (k − 1)!(n − k)! n − k + 1 k n! k+n−k+1 (n + 1)! = = . (k − 1)!(n − k)! k(n − k + 1) k!(n + 1 − k)! Dies zeigt die Aussage für n + 1 und 0 < k ≤ n. Die Aussage des Satzes folgt mit Induktion. Korrolar 2.3.5. Seien k, n ∈ N0 mit 0 ≤ k ≤ n. Sei X eine Menge mit n Elementen. Dann ist die Anzahl der Teilmengen Y ⊂ X mit k Elementen gleich n . Insbesondere ist nk ∈ N. k Beweis. Wir beweisen die Aussage mit Induktion nach n. (I.A.): Die Aussage ist offensichtlich richtig für n = 0. (I.S.): Wir nehmen an, dass die Aussage für n stimmt. Wir zeigen die Aussage für n + 1: Zunächst bemerken wir, dass die Aussage für k = 0 und k = n + 1 richtig ist. Also dürfen wir o.B.d.A. annehmen, dass 0 < k < n + 1 ist. Wir schreiben X = { x1 , x2 , . . . , xn+1 } und betrachten alle Teilmengen Y ⊂ X mit k Elementen. Es gibt nun zwei Fälle: (I) xn+1 ∈ / Y, (II) xn+1 ∈ Y . In Fall (I) ist Y ⊂ X 0 := X \ { xn+1 } = { x1 , x2 , . . . , xn }. Da |X 0 | = n, können wir die Induktionshypothese anwenden. Wir schließen, dass X genau n Teilmengen Y mit |Y | = k und xn+1 ∈ / Y besitzt. k In Fall (II) ist Y 0 := Y \ { xn+1 } ⊂ X 0 eine Teilmenge mit |Y 0 | = k − 1 n und |X 0 | = n. Die Induktionshypothese impliziert also, dass X 0 genau k−1 n solche Teilmengen besitzt. Wir schließen, dass X genau k−1 Teilmengen Y mit |Y | = k und xn+1 ∈ Y besitzt. Insgesamt besitzt X also n+1 n + k k−1 Teilmengen mit k Elementen. Die Aussage für n + 1 und 0 < k < n + 1 folgt daher aus Lemma 2.3.2. Das Korollar folgt mit Induktion. 30 KAPITEL 2. BEWEISMETHODEN Kapitel 3 Äquivalenzrelationen In diesem Kapitel besprechen wir Äquivalenzrelationen. Als Anwendung definieren wir Q und Z/mZ. 3.1 Definition In der Mathematik möchten wir oft Objekte, die nicht gleich sind, als gleich betrachten. In der Deutschen Sprache entspricht dies dem Unterschied zwischen “dasselbe” und “ das Gleiche”. Wenn zwei Studierende beide ein Kopie des Skriptes Lineare Algebra besitzen, dann besitzen sie das gleiche Skript, aber nicht dasselbe Exemplar des Skriptes. Ein weiteres Beispiel ist das Konzept von kongruenten Dreiecken. In manchen Beweisen der ebenen Geometrie betrachtet man kongruente Dreiecke als gleich, auch wenn es verschiedene Dreiecken sind. Bevor wir definieren was eine Äquivalenzrelation ist, betrachten wir zunächst den allgemeineren Begriff Relation. Definition 3.1.1. Seien X und Y Mengen. Eine Teilmenge R ⊂ X × Y heißt Relation. Eine Relation stellt eine Beziehung zwischen Elementen von X und Y her. Ist X = Y , nennen wir R eine Relation auf X. Beispiel 3.1.2. (a) Sei f : X → Y eine Funktion. Der Graph Γf = { (x, y) ∈ X × Y | y = f (x) } von f definiert eine Relation. (b) Das Symbol ≤ definiert eine Relation auf R, nämlich R = (x, y) ∈ R2 x ≤ y . Definition 3.1.3. Eine Relation R ⊂ M × M heißt Äquivalenzrelation, wenn folgende drei Bedingungen erfüllt sind: (Ä1) ∀x ∈ M (x, x) ∈ R (Reflexivität), 31 32 KAPITEL 3. ÄQUIVALENZRELATIONEN (Ä2) (x, y) ∈ R ⇒ (y, x) ∈ R (Symmetrie), (Ä3) (x, y), (y, z) ∈ R ⇒ (x, z) ∈ R (Transitivität). Ist R eine Äquivalenzrelation, schreiben wir x ∼ y anstatt (x, y) ∈ R (ausgesprochen: x ist äquivalent zu y). Beispiel 3.1.4. (a) Die Relation ≤ aus Beispiel 3.1.2.(b) ist keine Äquivalenzrelation: Die Relation ist reflexiv und transitiv, aber nicht symmetrisch. Die Relation ≤ ist antisymmetrisch. Dies bedeutet, dass aus (x, y) ∈ R und (y, x) ∈ R folgt, dass x = y ist. Für die Relation ≤ gilt sogar folgende stärkere Eigenschaft: Ist x 6= y dann gilt immer entweder x ≤ y oder y ≤ x. (b) Sei f : X → Y eine Funktion. Wir definieren eine Äquivalenzrelation auf X durch x ∼ x0 genau dann, wenn f (x) = f (x0 ). Überprüfen Sie, dass dies in der Tat eine Äquivalenzrelation ist. (c) Sei L ⊂ R2 eine Gerade durch dem Ursprung (0, 0). Dann ist L ein Untervektorraum von R2 . Wir definieren eine Relation auf R2 durch v ∼ w genau dann, wenn v−w ∈ L. Wir zeigen, dass dies eine Äquivalenzrelation ist. Hierbei benutzen wir, dass L ⊂ R2 ein Untervektorraum ist. • v − v = (0, 0) ∈ L für alle v ∈ R2 , also ist ∼ reflexiv. • Sei v ∼ w, also v − w ∈ L. Dann ist w − v = −(v − w) auch in L, also w ∼ v. Dies zeigt, dass ∼ symmetrisch ist. • Sei v ∼ w und w ∼ u, also v − w ∈ L und w − u ∈ L. Dann ist auch v − u = (v − w) + (w − u) ∈ L, also v ∼ u. Dies zeigt, dass ∼ transitiv ist. Definition 3.1.5. Sei ∼ eine Äquivalenzrelation auf einer Menge M und sei a ∈ M . Die Äquivalenzklasse Ca von a ist die Menge aller Elemente b ∈ M mit b ∼ a. Wir schreiben M/ ∼ für die Menge der Äquivalenzklassen. Beispiel 3.1.6. (a) Wir betrachten die Äquivalenzrelation aus Beispiel 3.1.4.(b). Sei x ∈ X und y = f (x). Die Äquivalenzklasse von x ist das Urbild f −1 (y) von y. Die Menge X/ ∼ der Äquivalenzklassen kann man mit dem Bild f (X) identifizieren. (b) Die Äquivalenzklassen der Äquivalenzrelation aus Beispiel 3.1.4.(c) sind die Geraden in R2 parallel zu L. Man kann zeigen, dass die Menge der Äquivalenzklassen wieder ein Vektorraum ist. Man nennt diesen Vektorraum den Quotientenvektorraum (Bezeichnung: R2 /L). Wir sehen, dass in beiden Fällen aus obigem Beispiel die Menge eine disjunkte Vereinigung der Äquivalenzklassen ist. Der folgende Satz zeigt dies für beliebige Äquivalenzrelationen. 3.2. DIE GANZEN UND RATIONALEN ZAHLEN 33 Satz 3.1.7. Sei ∼ eine Äquivalenzrelation. Zwei Äquivalenzklassen sind entweder gleich oder disjunkt. Beweis. Seien Ca und Cb zwei Äquivalenzklassen. Wir nehmen an, dass Ca und Cb nicht disjunkt sind. Wir müssen zeigen, dass Ca = Cb (siehe die Diskussion zum Beweis einer Aussage der Form A ∨ B in Abschnitt 2.1). Da Ca ∩ Cb 6= ∅, existiert ein Element c ∈ Ca ∩ Cb . Also gilt c ∼ a und c ∼ b. Aus der Symmetrie der Äquivalenzrelation folgt auch a ∼ c. Behauptung I: Ca ⊂ Cb . Sei d ∈ Ca , also d ∼ a. Aus der Transitivität und der Tatsache a ∼ c folgt, dass auch d ∼ c. Mit c ∼ b folgt jetzt d ∼ b, also d ∈ Cb . Dies zeigt die Behauptung. Behauptung II: Cb ⊂ Ca . Diese Behauptung folgt ähnlich (vertausche a und b im Beweis von Behauptung I). Behauptungen I+II zusammen zeigen, dass Ca = Cb und damit folgt der Satz. 3.2 Die ganzen und rationalen Zahlen Wir konstruieren die ganzen und rationalen Zahlen aus den natürlichen Zahlen N = { 1, 2, 3, . . . }. Wir benutzen dabei die Ergebnisse von Abschnitt 3.1 und geben so weitere Beispiele von Äquivalenzrelationen. Die Konstruktion erläutert wie man in der Mathematik aus bekannten Objekten Neuen konstruieren kann. Die Konstruktion sieht vielleicht kompliziert aus, liefert aber die “gleichen” Zahlen wie aus der Schule bekannt. Konstruktion der ganzen Zahlen Um die Ganzen aus den natürlichen Zahlen zu konstruieren, bemerken wir, dass wir zwei natürliche Zahlen zwar immer addieren aber im Allgemeinen nicht subtrahieren können. Wir möchten die natürlichen Zahlen daher so erweitern, dass die Subtraktion immer möglich ist. Dazu betrachten wir die Differenz zweier natürlicher Zahlen. Wir definieren eine Äquivalenzrelation ∼Z auf der Menge N × N durch (a, b) ∼ (c, d) ⇔ a + d = b + c. Man überprüft leicht, dass dies in der Tat eine Äquivalenzrelation ist. Zwei Paare (a, b) und (c, d) natürlicher Zahlen sind genau dann äquivalent, wenn a − b = c − d. Insbesondere ist (a, b) zu allen Paaren (a + x, b + x) für x ∈ N äquivalent. Die Äquivalenzklasse C(a,b) eines Paares (a, b) kann man also mit der Differenz a − b identifizieren. Wir schreiben N2 / ∼Z für die Menge der Äquivalenzklassen. Wir identifizieren die Elemente dieser Menge mit den uns bekannten ganzen Zahlen durch die Zuordnung ψ : Z → N2 / ∼Z , x 7→ C(x+y,y) . 34 KAPITEL 3. ÄQUIVALENZRELATIONEN Hierbei ist y eine natürliche Zahl, sodass x + y > 0 ist. Bemerke, dass die Äquivalenzklasse C(x+y,y) nicht von der Wahl von y abhängt, da (x + y, y) ∼ (x + y 0 , y 0 ). Die Abbildung ψ ist offensichtlich eine Bijektion (die Umkehrabbildung schickt C(a,b) auf der ganzen Zahl a − b). Die bekannten Strukturen +, −, ·, < auf Z kann man auch in Termen dieser Definition einführen. Beispielsweise ist die Subtraktion zweier Äquivalenzklassen definiert als C(a,b) − C(c,d) = C(a−c,b−d) . Da (a−b)−(c−d) = (a−c)−(b−d) entspricht dies der üblichen Subtraktion auf Z. Wir sehen, dass die Äquivalenzklasse von (a, b) also in der Tat der Differenz der ganzen Zahlen a und b entspricht. Wir verzichten hier auf die Diskussion der anderen Operationen. Konstruktion der rationalen Zahlen Wir konstruieren die rationalen Zahlen aus den ganzen Zahlen. Wir möchten die ganzen Zahlen so erweitern, dass man durch jede ganze Zahl b 6= 0 teilen kann. Sei M = (a, b) ∈ Z2 b 6= 0 . Wir definieren eine Äquivalenzrelation auf M , sodass die Äquivalenzklasse des Paares (a, b) der Zahl ab entspricht. Die Definition der Äquivalenzrelation ist motiviert durch die Beobachtung, dass zwei Brüche ab und dc genau dann die gleiche rationale Zahl definieren, wenn ad = bc. Dies sieht man am Einfachsten, indem man die Differenz auf einen Hauptnenner bringt: a c ad − bc − = . b d bd Wir definieren die gesuchte Äquivalenzrelation ∼Q auf M durch (a, b) ∼Q (c, d) ⇔ ad = bc. Dies ist in der Tat eine Äquivalenzrelation: Die Reflexivität und Symmetrie sind offensichtlich. Nehmen wir an, dass (a, b) ∼Q (c, d) und (c, d) ∼Q (e, f ). Dies bedeutet, dass ad = bc und cf = de. Außerdem sind b, d, f ungleich Null. Es folgt, dass adf = bcf = bde. Wegen der Kommutativität der Multiplikation folgt d(af − bc) = 0. Nach Annahme ist d 6= 0. Hieraus folgt, dass af = bc, also (a, b) ∼Q (e, f ). Also ist ∼Q transitiv. Der rationalen Zahl ab ∈ Q entspricht die Äquivalenzklasse des Paares (a, b). Wir bemerken, dass jede Äquivalenzklasse x ∈ Q einen eindeutigen Repräsentanten (a, b) mit a ∈ Z und b ∈ N und ggT(a, b) = 1 enthält. 3.3. KONGRUENZEN 3.3 35 Kongruenzen In diesem Abschnitt besprechen wir die Äquivalenzrelation der Kongruenz modulo m. Diese Kongruenzen spielen in der Zahlentheorie eine wichtige Rolle. Definition 3.3.1. Sei m ∈ N. Zwei Zahlen a, b ∈ Z heißen kongruent modulo m, wenn m | (a − b). Bezeichnung: a ≡ b (mod m). Die Zahl m heißt Modul der Kongruenz. Die Bedingung m | (a − b) bedeutet, dass eine ganze Zahl k mit a = b + km existiert. Dies ist äquivalent zu der Aussage, dass a und b den gleichen Rest nach Division durch m haben. Beispielsweise ist 200 ≡ 11 (mod 9), da 200 = 11 + 9 · 21. Alternativ haben 200 und 11 beide den Rest 2 nach Division durch 9. Lemma 3.3.2. Kongruenz modulo m ist eine Äquivalenzrelation. Beweis. Übungsaufgabe. Definition 3.3.3. Wir bezeichnen mit Z/mZ die Mengen der Äquivalenzklassen der Kongruenz modulo m. Diese Äquivalenzklassen nennen wir Kongruenzklassen. Wenn m aus dem Kontext klar ist, schreiben wir oft ā für die Kongruenzklasse von a. Jede Zahl a ∈ Z ist kongruent modulo m zu ihrem Rest r nach Division durch m. Der Rest erfüllt 0 ≤ r < m (Appendix A.1). Zwei verschiedene Zahlen r1 , r2 aus der Menge { 0, 1, . . . , m − 1 } sind zu einander nicht kongruent modulo m. Dies zeigt, dass Z/mZ = 0, 1, . . . , m − 1 . Insbesondere ist die Kardinalität von Z/mZ genau m. Eine Menge von Zahlen a0 , . . . , am−1 , sodass jede ganze Zahl kongruent (modulo m) zu genau einer dieser Zahlen ist, heißt vollständiges Restsystem (mod m). Die Zahlen 0, 1, . . . , m − 1 bilden also ein vollständiges Restsystem (mod m). Beispiel 3.3.4. Sei m = 4. Es gilt 0 = { . . . , −8, −4, 0, 4, . . . } , 1 = { . . . , −7, −3, 1, 5, . . . } 2 = { . . . , −6, −2, 2, 6, . . . } 3 = { . . . , −5, −1, 3, 7, . . . } . Wir bemerken, dass −2, −1, 0, 1 auch ein vollständiges Restsystem (mod 4) ist. Addition (bzw. Multiplikation) ganzer Zahlen definiert auch eine Addition (bzw. Multiplikation) auf Z/mZ durch ¯ b, ā + b̄ := a + ¯ ā · b̄ := ab. 36 KAPITEL 3. ÄQUIVALENZRELATIONEN Wir zeigen, dass die Addition und Multiplikation (modulo m) wohldefiniert sind. Dies bedeutet, dass die Addition und Multiplikation nicht von den gewählten Repräsentanten der Kongruenzklassen abhängen. Seien a ≡ a0 (mod m) und b ≡ b0 (mod m). Dann existieren Zahlen k, `, sodass a0 = a + km, b0 = b + `m. Also ist a0 + b0 = (a + b) + (k + `)m ≡ a + b (mod m), a0 · b0 = (a + km)(b + `m) = ab + (a` + bk + k`)m ≡ ab (mod m). Dies zeigt, dass a + b und a0 + b0 (bzw. ab und a0 b0 ) die gleiche Kongruenzklasse (mod m) definieren. Das folgende Lemma gibt eine Anwendung der Modulorechnung. Dazu betrachten wir die Darstellung einer natürlichen Zahl n im Dezimalsystem mit Ziffern ai ∈ { 0, 1, . . . , 9 } als n = (ak ak−1 · · · a2 a1 a0 )10 = ak · 10k + ak−1 · 10k−1 + · · · + a2 · 102 + a1 · 10 + a0 . Lemma 3.3.5 (Dreierregel). Die Zahl n = (ak ak−1 · · · a2 a1 a0 )10 ist genau dann durch 3 teilbar, wenn die Quersumme Q(n) := k X ai ≡ 0 (mod 3) i=0 ist. Beweis. Wir bemerken, dass 10 ≡ 1 (mod 3). Daher ist n = ak · 10k + ak−1 · 10k−1 + · · · + a2 · 102 + a1 · 10 + a0 ≡ ak · 1k + ak−1 · 1k−1 + · · · + a2 · 12 + a1 · 1 + a0 = Q(n) (mod 3). Dies impliziert, dass n genau dann durch 3 teilbar ist, wenn Q(n) durch drei teilbar ist. Kapitel 4 Grenzwerte und die Definition der reellen Zahlen In diesem Kapitel definieren wir die reellen Zahlen ausgehend von den rationalen Zahlen. Wir besprechen diese Definition relativ ausführlich um zu illustrieren wie die Konzepte der Mathematik systematisch aufgebaut werden. Wir werden sehen, dass dies ziemlich mühsam ist. Wenn wir im Studium alle Grundlagen der Mathematik systematisch einführen würden, würde man nicht besonders weit kommen. Außerdem wäre das Studium dann relativ langweilig. √ In der Schule haben Sie gelernt mit nichtrationalen Zahlen wie 2 und π zu rechnen. Historisch gesehen sind diese Zahlen weniger selbstverständlich, als Sie vielleicht denken. In √ der klassischen griechischen Mathematik verursachte die Entdeckung, dass 2 keine rationale Zahl ist (Satz 2.1.7), große Verwirrung. Hier finden Sie mehr zur Geschichte der reellen Zahlen: http://www-history.mcs.st-andrews.ac.uk/HistTopics/Real numbers 1.html. Die moderne Definition der reellen Zahlen beruht auf dem Begriff des Grenzwerts: Reelle Zahlen werden definiert als Grenzwerte von Folgen rationaler Zahlen. In diesem Kapitel befassen wir uns daher zunächst mit Grenzwerten. Im ersten Abschnitt betrachten wir die historische Definition des Grenzwerts. 4.1 Berechnung von Quadratwurzeln √ Wir haben gesehen, dass 2 eine irrationale Zahl ist (Satz 2.1.7). Für konkrete Berechnungen ist es hilfreich, diese Zahl durch eine geeignete rationale Zahl anzunähern. In diesem Abschnitt besprechen wir das Heron-Verfahren zur Berechnung von Näherungswerten von Quadratwurzeln. Dieses Verfahren ist nach dem Mathematiker Heron (Alexandrien, Ägypten, ∼ 10 - 75) benannt (siehe http://www-history.mcs.st-and.ac.uk/Biographies/Heron.html). 37 38KAPITEL 4. GRENZWERTE UND DIE DEFINITION DER REELLEN ZAHLEN Die Methode war babylonischen Mathematiker schon etwa 2000 vor Christus bekannt. Diese Methode ist im Wesentlichen ein Spezialfall der NewtonMethode, die in der Numerik besprochen wird. Die Methode wird heute immer noch benutzt, obwohl sie schon 4000 Jahren alt ist! Sei a ∈ Q>0 die Zahl, von der wir die Quadratswurzel näherungsweise bestimmen möchten. Wir fangen an mit irgendeinem Näherungswert x0 6= 0 der gesuchten Quadratwurzel. Heron betrachtete a ∈ N und wählte die kleinste Quadratzahl größer gleich a. Die Methode funktioniert aber für beliebige Startwerte. √ Wir definieren induktiv Näherungen für a durch der Vorschrift 1 a a + x2n xn + (4.1) xn+1 = = . 2 xn 2xn Wir schreiben (xn )n≥0 für die Folge der Näherungen. Als √ Beispiel wählen wir a = 2 und Startwert x0 = 1. Die ersten Näherungen für 2 sind 1 2 3 x1 = 1+ = , 2 1 2 2 17 1 3 + = = 1, 4166 . . . x2 = 2 2 3/2 12 1 17 2 577 + = = 1, 4142156 . . . x3 = 2 12 17/12 408 √ Da 2 = 1, 41421356 . . . ist, sehen wir, dass schon nach der zweiten Iteration des Verfahrens die ersten drei Stellen richtig sind. Nach der dritten Iteration sind sogar die ersten 6 Stellen richtig. In der Praxis funktioniert dieses Verfahren immer sehr schnell (man kann hier eine genaue Aussage zeigen, aber darauf verzichten wir in dieser Vorlesung). Wir erklären √ die Idee hinter die Methode. Einfachheitshalber nehmen wir an, dass 1 ≤ x0 < a =: b ist. Dann ist b2 = a der Flächeninhalt eines Quadrats Qa mit Seitenlänge b. Das Rechteck R0 mit Seitenlängen x0 und a/x0 hat ebenfalls Flächeninhalt a. Unsere Annahme impliziert, dass x0 < a/x0 . Dieses Rechteck ist unsere erste Näherung des Quadrats Qa . Um eine bessere Näherung zu bekommen, ersetzen wir x0 durch den Mittelwert 1 a x1 = x0 + 2 x0 der Seitenlängen. Wir bemerken, dass 1 ≤ x0 < √ a a < b = a < x1 < . x1 x0 Im konkreten Fall ist dies klar. Im allgemeinem Fall folgt dies aus der Annahme 1 ≤ x0 ≤ b. 4.1. BERECHNUNG VON QUADRATWURZELN 39 a x0 R0 a x1 R1 x0 x1 Abbildung 4.1: Das Heron-Verfahren Das Rechteck R1 mit Seitenlängen x1 und a/x1 ist eine bessere Näherung für das Quadrat Qa (siehe Abbildung 4.1). Ebenso ist x1 eine bessere Näherung für die Quadratwurzel b als x0 . Wiederholt man das Verfahren, wird die Näherung immer besser. Die obige Betrachtung erläutert die Idee hinter dem Heron-Verfahren. So ähnlich könnte Heron es sich auch überlegt haben. Die mathematische Aussage, die man zeigen möchte ist: die Folge (xn )n∈N0 konvergiert zum Grenzwert b. Dies bedeutet nicht nur, dass unsere Näherungen immer besser werden, sondern auch, dass mann jede erwünschte Genauigkeit erreicht, wenn man das Verfahren oft genug wiederholt. Das ist nicht das Gleiche, als zu sagen, dass die erhaltene Näherung immer besser wird. Auch wenn die Näherung immer besser wird, könnte es sein, dass der Zuwachs an Genauigkeit irgendwann so klein ist, dass egal wie lange man rechnet, nie wieder eine neue Nachkommastelle richtig wird. Bei dem Heron-Verfahen ist dies nicht der Fall. Man kann zeigen, dass sich die Anzahl der Stellen, die schon richtig sind, in jedem Schritt verdoppelt. In der Numerik nennt man dies quadratische Konvergenz. Wir zitieren nun die Beschreibung des Verfahrens durch Heron (zitiert nach der Mactutor-Webseite ([3]): Since 720 has not its side rational, we can obtain its side within a very small difference as follows. Since the next succeeding square number is 729, which has 27 for its side, divide 720 by 27. This gives 26 2/3. Add 27 to this, making 53 2/3, and take half this or 26 5/6. The side of 720 will therefore be very nearly 26 5/6. In fact, if we multiply 26 5/6 by itself, the product is 720 1/36, so the difference in the square is 1/36. If we desire to make the difference smaller still than 1/36, we shall take 720 1/36 instead of 729 (or rather we should take 26 5/6 instead of 27), and by proceeding in the same way we shall find the resulting difference much less than 1/36. 40KAPITEL 4. GRENZWERTE UND DIE DEFINITION DER REELLEN ZAHLEN √ Heron berechnet hier eine Näherung für 720. Er identifiziert diese Zahl mit dem Quadrat Q720 mit Flächeninhalt 720. Anstatt die Formel (4.1) zu geben, beschreibt Heron die Rechenschritte (Variablen und das Gleichheitszeichen waren in Herons Zeit noch nicht erfunden). Heron macht zwar keine genaue Aussage darüber, √ um wie viel die Näherung in jedem Schritt besser wird, aber er bemerkt, dass | a − xi | in jedem Schritt “viel besser” wird. Er war sich diesem zentralen Punkt also sehr wohl bewußt. 4.2 Definition des Grenzwerts Im diesem Abschnitt geben wir eine genaue Definition der Folgenkonvergenz. Definition 4.2.1. Eine (reelle) Folge ist eine Abbildung N → R, n 7→ xn . Bezeichnung: (xn )n∈N . Beispiel 4.2.2. Wir betrachten die Folge definiert durch n 1 (4.2) an = 1 + . n Beispielsweise ist a1 = 2, a2 = 2, 25, a10 = 2, 5937·, a100 = 2, 7048 · · · , a1000 = 2, 7169 · · · . Man kann zeigen, dass diese Folge konvergiert. Die eulersche Zahl e ist definiert als der Grenzwert der Folge (siehe Definition 4.2.3 für die genaue Definition des Grenzwerts). Obige Werte zeigen, dass sich die ai der eulerschen Zahl nur sehr langsam annähern. Folgende Definition formalisiert die intuitive Idee, dass die Glieder xn einer Folge sich dem Grenzwert b immer besser annähern. Hier finden Sie ein Lied zur Definition: http://www-history.mcs.st-and.ac.uk/Extras/Lehrer Songs.html Definition 4.2.3. Eine Folge (xn )n∈N heißt konvergent mit Grenzwert b falls (4.3) ∀ε > 0 ∃N ∈ N ∀n ≥ N |xn − b| < ε. Bezeichnung: limn→∞ xn = b oder auch xn → b für n → ∞. Die Menge Bε (b) := { x ∈ R k x − b| < ε } = (b − ε, b + ε) ist ein Intervall um b. Dieses Intervall ist nicht-leer, wenn ε wie in Definition 4.2.3 echt größer Null ist. Falls ε sehr klein ist, bedeutet xn ∈ Bε (b) also, dass xn eine sehr 4.2. DEFINITION DES GRENZWERTS 41 gute Näherung von b ist. Definition 4.2.3 sagt daher, dass wir für alle ε > 0, also insbesondere für sehr kleine Werte, ein N finden, sodass alle xn mit n ≥ N sehr gute Näherungen von b sind. Nicht nur ist xN eine gute Näherung, sondern für alle größeren Werte n wird die Näherung xn nicht mehr wesentlich schlechter. Diese Eigenschaft gilt für beliebig kleine ε > 0. Dies bedeutet, dass die Folgeglieder den Wert b beliebig gut annähern. Es ist wichtig die Reihenfolge der Quantoren in der Definition zu beachten. Der Wert N aus (4.3) wird in Abhängigkeit von ε gewählt. Manchmal schreiben wir daher auch N = N (ε) um die Abhängigkeit von ε zu betonen. Im Allgemeinen muss man N um so größer wählen, um so kleiner ε ist. Wir betrachten die Aussage ∃N ∈ N ∀ε > 0 ∀n ≥ N |xn − b| < ε. Wir haben hier die Reihenfolge der Quantoren aus (4.3) geändert. Diese Aussage bedeutet, dass die Folge ab dem Wert N konstant ist, d. h. xn = b, ∀n ≥ N . Dies sieht man wie folgt. Für n ≥ N gilt die Ungleichung |xn − b| < ε für alle ε > 0. Dies bedeutet aber, dass xn in der Schnittmenge der Intervalle (b − ε, b + ε) liegt. Diese Schnittmenge enthält nur b, also ist xn = b. Beispiel 4.2.4. (a) Wir definieren eine Folge an = 1/n für n ∈ N. Diese Folge konvergiert gegen a = 0. Wir zeigen dies mit Hilfe von Definition 4.2.3. Wir müssen uns überlegen, wie wir N in Abhängigkeit von ε wählen sollen. Dazu betrachten wir zunächst folgende Hilfsrechnung: 1 − 0 = 1 < ε ⇔ n > 1 . n n ε Damit also |an − a| < ε ist, soll n größer als 1/ε sein. Wir wählen daher 1 + 1. N= ε Hierbei ist [·] die Gauß-Klammer, siehe Appendix A.2. Selbstverständlich könnte man N auch noch größer wählen. Jetzt schreiben wir den Beweis so auf, wie Sie dies auf dem Übungsblatt machen sollten. Sei ε > 0 beliebig. Wähle N = [ 1ε ] + 1. Dann gilt für alle n ≥ N , dass 1 − 0 = 1 ≤ 1 < ε. n n N Also konvergiert die Folge (an )n∈N mit Grenzwert 0. (b) Wir betrachten nun die Folge definiert durch bn = (−1)n für alle n ∈ N. Wir möchten mit Hilfe von Definition 4.2.3 zeigen, dass diese Folge nicht konvergiert. Wir sagen die Folge divergiert. Wir möchten also zeigen, 42KAPITEL 4. GRENZWERTE UND DIE DEFINITION DER REELLEN ZAHLEN dass keine Zahl b existiert, sodass die Folge konvergiert mit Grenzwert b. Überlegen Sie sich, dass wir folgende Aussage zeigen müssen (vergleichen Sie mit Lemma 1.2.3): ∀b ∈ R ∃ε > 0 ∀N ∈ N ∃n ≥ N |an − b| ≥ ε. Sei b ∈ R beliebig. Wir nehmen zuerst an, dass b 6= 1. Dann ist |a2m − b| = |1 − b| = 6 0. Wähle ε = |1 − b|/2. Für beliebiges N ∈ N existiert ein gerader Index n = 2m > N . Für ein solches n gilt also |an − b| = |1 − b| > ε. Der Beweis für b = 1 ist ähnlich, aber dieses Mal betrachten wir die Folgeglieder a2m+1 = −1. (c) Wir betrachten die Folge cn = 1 − 10−n = 0, 9 · · · , 9 (die Zahl cn enthält n − 1 Nachkommastellen). Wir zeigen, dass die Folge (cn )n≥2 konvergent mit Grenzwert 1 ist. Sei ε > 0 beliebig. Wähle N = [max(0, − log10 (ε))] + 1. Es gilt also, das N eine natürliche Zahl mit N > − log10 (ε) ist. Für alle n ≥ N gilt daher, dass |cn − 1| = 10−n ≤ 10−N < 10log10 (ε) = ε. Hier haben wir benutzt, dass −N < log10 (ε) ist. In der Vorlesung Analysis I werden Sie verschiedene Kriterien lernen, um die Konvergenz einer Folge zu überprüfen und Rechenregeln um Grenzwerte konvergenter Folgen zu bestimmen. Das folgende Lemma gibt eine erste solche Rechenregel. Lemma 4.2.5. Seien (an )n∈N und (bn )n∈N konvergente Folgen mit lim = a, n→∞ lim bn = b. n→∞ Dann sind die Folgen (an ± bn )n und (an · bn )n auch konvergent mit Grenzwert a ± b und a · b. Beweis. Wir beweisen die Aussage für (an − bn ) und überlassen die anderen Teile als Übungsaufgabe. Wir bemerken, dass |(an − bn ) − (a − b)| = |(an − a) − (bn − b)| ≤ |an − a| + |bn − b| aufgrund der Dreiecksungleichung (Appendix A.2). Sei ε > 0 beliebig. Definition 4.2.3 impliziert, dass Zahlen N1 , N2 existieren mit ε ∀n ≥ N1 |an − a| < , 2 ε ∀n ≥ N2 |bn − b| < . 2 Wir wählen N = max(N1 , N2 ). Dann gilt für n ≥ N , dass ε ε |(an − bn ) − (a − b)| ≤ |an − a| + |bn − b| < + = ε. 2 2 Also ist (an − bn )n konvergent mit Grenzwert a − b. 4.3. CAUCHY-FOLGEN 4.3 43 Cauchy-Folgen Um Definition 4.2.3 anwenden zu können, ist es notwendig, den Grenzwert der Folge zu kennen. Dies ist nicht immer praktikabel. Beispielsweise definieren wir die Eulersche Zahl e als Grenzwert der Folge (4.2). Wir können e also nicht im Beweis der Konvergenz der Folge benutzen. In diesem Abschnitt besprechen wir ein alternatives Kriterium zur Überprüfung der Konvergenz einer Folge, das den Grenzwert nicht benutzt. Definition 4.3.1. Eine (reelle) Folge (an )n∈N heißt Cauchy–Folge, wenn ∀ε > 0 ∃N ∈ N ∀n ≥ N ∀p ∈ N |an+p − an | < ε. In Definition 4.3.1 vergleichen wir an mit allen folgenden Folgegliedern an+p anstatt mit dem Grenzwert, wie wir es in Definition 4.2.3 taten. In einer CauchyFolge nähern sich die Folgeglieder gegenseitig beliebig gut an. Der folgende Satz zeigt, dass jede konvergente Folge auch eine Cauchy–Folge ist. Die Umkehrung gilt in R auch. Der Beweis der Umkehrung benutzt die Definition der reellen Zahlen, die wir im Abschnitt 4.4 diskutieren (siehe Satz 4.5.5). Mehr Details werden nächstes Semester in der Vorlesung Analysis I besprochen. Satz 4.3.2. Sei (an )n∈N eine konvergente Folge. Dann ist (an )n∈N eine Cauchy– Folge. Wir beweisen zuerst ein Lemma, dass im Beweis von Satz 4.3.2 benutzt wird. Definition 4.3.3. Eine Folge (an )n∈N heißt beschränkt, wenn C ∈ R mit |an | ≤ C existiert. Die Bedingung aus Definition 4.3.3 bedeutet, dass die an im Intervall [−C, C] liegen und daher nicht beliebig groß oder beliebig klein werden, wenn n gegen unendlich strebt. Die Zahl C (bzw. −C) heißt obere (bzw. untere) Schranke der Folge. Lemma 4.3.4. Jede konvergente Folge ist beschränkt. Beweis. Sei (an )n∈N eine konvergente Folge mit Grenzwert a. Sei ε = 1. Die Konvergenz der Folge impliziert die Existenz einer Zahl N mit |an − a| < ε = 1 für alle n ≥ N . Für n ≥ N gilt also −1 + a < an < 1 + a. Dies zeigt, dass (4.4) ∀n ≥ N |an | ≤ max { | a − 1|, |a + 1| } . Die Menge M := { | a1 |, . . . , |aN −1 | } ist endlich und besitzt deswegen ein größtes Element. Sei |aj | das Maximum von M . Insbesondere gilt (4.5) |ai | ≤ |aj | für i = 1, . . . , N − 1. Wir definieren C = max { | a − 1|, |a + 1|, |aj | }. Die Gleichungen (4.4) und (4.5) implizieren, dass ∀n ∈ N |an | ≤ C. Die Folge ist also beschränkt. 44KAPITEL 4. GRENZWERTE UND DIE DEFINITION DER REELLEN ZAHLEN Lemma 4.3.4 zeigt, dass Beschränktheit eine notwendige Bedingung für die Konvergenz ist. Beispielsweise ist die Folge (n)n∈N nicht beschränkt und daher auch nicht konvergent (der Grenzwert in Definition 4.2.3 ist eine reelle Zahl, ∞ ist hier als Grenzwert nicht erlaubt). Beschränktheit ist nicht hinreichend für Konvergenz. Beispielsweise ist die Folge ((−1)n )n∈N beschränkt, aber nicht konvergent (Beispiel 4.2.4.(b)). Wir zeigen nun Satz 4.3.2. Beweis von Satz 4.3.2. Sei (an )n eine konvergente Folge mit Grenzwert a und sei ε > 0 beliebig. Da die Folge konvergent ist, existiert ein N > 0, sodass ∀n ∈ N |an − a| < ε 2 (Man muss den zu /2 gehörigen Wert N = N (ε/2) wählen). Sei nun n ≥ N und p ∈ N. Es gilt n + p > n ≥ N , also |an+p − a| < ε . 2 Aus der Dreiecksungleichung folgt |an+p − an | = |an+p − a + a − an | ≤ |an+p − a| + |a − an | < ε ε + = ε. 2 2 Dies zeigt, dass (an )n eine Cauchy-Folge ist. 4.4 Definition der reellen Zahlen In diesem Abschnitt geben wir eine formale Definition der reellen Zahlen. In Abschnitt 4.1 haben wir die Folge 1 2 x0 = 1, xn = xn−1 + 2 xn−1 betrachtet. Für jedes n ∈ N ist die √ Näherung xn eine rationale Zahl. Der Grenzwert der Folge (xn )n∈N ist aber 2 was keine rationale Zahl ist (Satz 2.1.7). Es existieren also konvergente Folgen rationaler Zahlen, die keinen Grenzwert in Q besitzen. Wir sagen: Q ist unvollständig. Wir möchten die reelle Zahlen als Grenzwerte solcher Folgen konstruieren. Da Definition 4.3.1 Bezug auf die reellen Zahlen nimmt, passen wir die Definition etwas an. Die Ergebnisse aus Abschnitt 4.3 übertragen sich. Definition 4.4.1. Eine Folge (an )n∈N mit an ∈ Q für alle n heißt rationale Cauchy-Folge, wenn ∀ε ∈ Q>0 ∃N ∈ N ∀n ≥ N ∀p ∈ N |an+p − an | < ε. Wir schreiben CF für die Menge der rationalen Cauchy-Folgen. 4.4. DEFINITION DER REELLEN ZAHLEN 45 Es existieren mehrere Cauchy-Folgen mit dem gleichen Grenzwert, diese müssen wir mit Hilfe einer geeigneten Äquivalenzrelation auf CF identifizieren. Definition 4.4.2. Eine (rationale) Nullfolge ist eine (rationale) Cauchy-Folge mit Grenzwert 0. Beispielsweise ist (1/n)n∈N eine Nullfolge (Beispiel 4.2.4.(a)). Wir definieren eine Äquivalenzrelation auf der Menge CF durch (an )n∈N ∼R (bn )n∈N ⇔ (an − bn )n∈N ist eine Nullfolge. Sind (an )n und (bn )n konvergente Folgen mit Grenzwert a und b, dann sagt Lemma 4.2.5, dass (an − bn )n eine konvergente Folge mit Grenzwert a − b ist. Zwei konvergente Folgen (an )n und (bn )n sind also genau dann äquivalent, wenn sie den gleichen Grenzwert haben. Lemma 4.4.3. Die Relation ∼R ist eine Äquivalenzrelation. Beweis. Seien (an )n und (bn )n rationale Cauchy-Folgen. Reflexivität: Die Folge (an − an )n = (0)n ist eine Nullfolge, also ist (an )n äquivalent zu sich selbst. Symmetrie: Wir bemerken, dass |bn − an | = |an − bn |. Falls also (an − bn )n eine Nullfolge ist, ist auch (bn − an ) eine Nullfolge. Transitivität: Wir nehmen an, dass (an − bn )n und (bn − cn )n Nullfolgen sind. Lemma 4.2.5 impliziert, dass die Folge (an − cn )n = (an − bn + bn − cn )n auch konvergent ist und den Grenzwert 0 + 0 = 0 besitzt. Definition 4.4.4. Wir definieren die Menge der reellen Zahlen als R = CF/ ∼R . Ist (an )n ∈ CF eine rationale Cauchy-Folge, bezeichnet [(an )n ] ∈ R die von der Folge definierte reelle Zahl. Jede Äquivalenzklasse rationaler Cauchy-Folgen “ist” also eine reelle Zahl. Man sollte sich diese Zahl A als den Grenzwert der Folge (an )n vorstellen. Im nächsten Abschnitt sehen wir, dass A auch wirklich der Grenzwert der Folge ist (siehe den Beweis von Satz 4.5.5). Jede rationale Zahl r ∈ Q definiert auch eine reelle Zahl, indem wir r mit der Äquivalenzklasse der konstanten Folge (an = r)n identifizieren. Wir können Q als Teilmenge von R auffassen. Wir definieren die Adddition und Multiplikation auf R durch [(an )n ] + [(bn )n ] = [(an + bn )n ], [(an )n ] · [(bn )n ] = [(an · bn ]n . Mit Hilfe von Lemma 4.2.5 zeigt man, dass die Addition und Multiplikation wohldefiniert sind, d. h. der Grenzwert von (an + bn )n hängt nur von den Äquivalenzklassen [(an )n ] und [(bn )n ] und nicht von der gewählten Folge ab. 46KAPITEL 4. GRENZWERTE UND DIE DEFINITION DER REELLEN ZAHLEN Beispiel 4.4.5. In der Schule wird eine reelle Zahl üblicherweise als Dezimalbruchentwicklung betrachtet. Zahlen, die durch eine Dezimalbruchentwicklung gegeben sind, sind auch reelle Zahlen im Sinne von Definition 4.4.4. Sei ξ = x0 , x1 x2 . . . mit x0 ∈ Z und xi ∈ { 0, 1, . . . , 9 } (i ∈ N). Wir definieren eine Folge rationaler Zahlen (an )n durch an = x0 , x1 x2 . . . xn . Wir behaupten, dass (an ) eine rationale Cauchy-Folge ist. Sei ε > 0 beliebig und wähle N = max { − log10 (ε), 1 }. Dann gilt für n ≥ N und p ∈ N, dass |an+p − an | = 0, 0 . . . 0xn+1 . . . xn+p < 10−n ≤ ε. Wir schließen, dass (an )n eine Cauchy-Folge ist. Insbesondere definiert (an )n eine reelle Zahl. Umgekehrt kann man zeigen, dass jede reelle Zahl im Sinne von Definition 4.4.4 durch eine Dezimalbruchentwicklung gegeben werden kann. Sei x = [(an )n ] ∈ R eine reelle Zahl. Die rationalen Zahlen an besitzen eine Dezimalbruchentwicklung. Definition 4.3.1 zeigt, dass ein N existiert, sodass die ersten m Nachkommastellen der Dezimalbruchentwicklung von an für alle n ≥ N gleich sind (hierbei haben wir in Definition 4.3.1 ε = 10−m gewählt). Eine Dezimalbruchentwicklung von x findet man also indem man m gegen unendlich laufen läßt. 4.5 Die Vollständigkeit von R In diesem Abschnitt betrachten wir eine sehr wichtige Eigenschaft der reellen Zahlen: Die Vollständigkeit (Satz 4.5.5). Satz 4.5.5 sagt sehr informell, dass die reelle Achse “keine Lücken” besitzt. Die genaue Aussage ist, dass jede reelle Cauchy-Folge einen Grenzwert in R besitzt. Man kann die Menge der reellen Zahlen also nicht noch weiter vergrößern, indem man die Grenzwerte der reellen Cauchy-Folgen hinzunimmt. Reelle Cauchy-Folgen wurden in Definition 4.3.1 definiert, also bevor wir die reellen Zahlen eingeführt hatten. Damit diese Definition für die von uns definierten reellen Zahlen Sinn ergibt, müssen wir definieren was x < y für x, y ∈ R bedeutet. Definition 4.5.2 formuliert dies in Termen der rationalen Cauchy-Folgen, da reelle Zahlen Äquivalenzklassen von Cauchy-Folgen sind. Definition 4.5.1. Eine rationale Cauchy-Folge (an )n∈N ∈ CF heißt positiv, wenn ein k ∈ N existiert, sodass höchstens endlich viele n ∈ N mit an ≤ k1 existieren. Man kann die Bedingung aus Definition 4.5.1 auch als ∃k ∈ N ∃N ∈ N ∀n ≥ N an > 1 k 4.5. DIE VOLLSTÄNDIGKEIT VON R 47 schreiben. Die Bedingung aus Definition 4.5.1 bedeutet, dass die Folgenglieder für n genügend groß, ausreichend weit von Null wegbleiben. Alle Glieder der Folge 1 sind positiv, aber der Grenzwert ist Null (Beispiel 4.2.4.(a)). Diese Folge n n ist nicht positiv im Sinne von Definition 4.5.1: Für alle ε > 0 und alle genügend großen n gilt die Ungleichung |1/n − 0| = n1 < ε. Wir schreiben P ⊂ CF für die Menge der positiven Cauchy-Folgen und N ⊂ CF für die Menge der Nullfolgen. Definition 4.5.2. Seien (an )n , (bn )n ∈ CF zwei rationale Cauchy-Folgen. Wir definieren [(an )n ] > [(bn )n ] durch die Bedingung (an − bn )n ∈ P. Wir haben nun zwei Versionen der Definition der Cauchy-Folgen: Neben den reellen Cauchy-Folgen (Definition 4.3.1) haben wir in Definition 4.4.1 die rationalen Cauchy-Folgen definiert. In Definition 4.4.1 ist ε eine beliebige positive rationale Zahl statt einer reellen Zahl. Folgender Satz zeigt, dass dies keinen Unterschied macht. Insbesondere impliziert dieser Satz, dass rationale CauchyFolgen auch reelle Cauchy-Folgen sind. Satz 4.5.3 (Q liegt dicht in R). Seien x < y reelle Zahlen. Dann existiert eine rationale Zahl q ∈ Q mit x < q < y. Beweis. Wir wählen rationale Cauchy-Folgen (an )n , (bn )n korrespondierend zu x und y. Die Bedingung x < y bedeutet, dass ein k > 0 und ein N existiert mit ∀n ≥ N bn − an > ε := 1 . k Da (an )n und (bn )n Cauchy-Folgen sind, existieren N1 , N2 ∈ N, sodass ε , 4 ε |bn+p − bn | < , 4 |an+p − an | < ∀n ≥ N1 ∀p ∈ N, ∀n ≥ N2 ∀p ∈ N. Wir definieren M = max { N, N1 , N2 } und q = aM + 2ε . Da aM und ε rationale Zahlen sind, ist q auch eine rationale Zahl. Für alle n ≥ M und p ∈ N gilt an − aM ≤ |an − aM | < 4ε (hier benutzen wir die Ungleichung M ≥ N1 ). Dies impliziert, dass an + 4ε < aM + /2 = q. Definition 4.5.1 impliziert daher, dass x < q ist. Ebenso gilt für n ≥ M und p ∈ N, dass bM − bn ≤ |bM − bn | < 4ε , also bM − 4ε < bn . Mit bM − aM > ε folgt also bn > 3 4ε + xM > xM + 2ε = q. Hieraus folgt wieder y > q. Korrolar 4.5.4. Jede rationale Cauchy-Folge ist auch eine reelle Cauchy-Folge. Satz 4.5.5. R ist vollständig, d. h. jede reelle Cauchy-Folge besitzt einen Grenzwert in R. 48KAPITEL 4. GRENZWERTE UND DIE DEFINITION DER REELLEN ZAHLEN Beweis. Sei (an )n∈N eine reelle Cauchy-Folge. Satz 4.5.3 impliziert, dass ein αn ∈ Q mit an < αn < an + n1 existiert. Behauptung 1: Die Folge (αn )n∈N ist eine rationale Cauchy-Folge. Wir beweisen Behauptung 1. Sei ε > 0 beliebig. Da (an )n eine Cauchy-Folge ist, existiert ein N ∈ N mit ε |an+p − an | < 3 für alle n ≥ N und alle p ∈ N. 3 1 ε Definiere nun K = max ε + 1, N . Insbesondere ist K < 3 . Für alle n ≥ K und p ∈ N gilt |αn+p − αn | = |(αn+p − an+p ) + (an+p − an ) + (an − αn )| ≤ |αn+p − an+p | + |(an+p − an | + |αn − an |. Hier haben wir die Dreiecksungleichung benutzt. Die Definition von K impliziert also, dass |αn+p − αn | ≤ 1 ε 1 + + < ε, n+p 3 n da 1/(n + p) und 1/n kleiner gleich 1/K < ε/3 sind. Dies zeigt Behauptung 1. Die rationale Cauchy-Folge (αn )n definiert eine reelle Zahl A := [(αn )n ]. Behauptung 2: Die Folge (αn )n ist konvergent mit Grenzwert A. Um die Behauptung zu zeigen, überprüfen wir die Bedingung aus Definition 4.2.3. Sei ε > 0 beliebig und sei N ∈ N mit |αn+p − αn | < ε für alle n ≥ N und p ∈ N. Die Zahl N existiert, da (αn )n eine rationale Cauchy-Folge ist (Definition 4.4.1). Definition 4.5.2 impliziert ∀n ≥ N |A − αn | < ε. Hier haben wir die rationale Zahl αn als konstante Folge aufgefasst. Dies zeigt die Behauptung. Behauptung 3: Die Folge (an )n ist konvergent mit Grenzwert A. Wir überprüfen wieder die Bedingung aus Definition 4.2.3. Sei ε > 0 beliebig. Wähle L1 ∈ N, sodass |A − αn | < 2ε für alle n ≥ L1 (die Existenz von L1 folgt dabei aus Behauptung 2). Satz 4.5.3 impliziert, dass ein L2 ∈ N mit 1/L2 < 2ε existiert. Für n ≥ L2 gilt also, dass |αn − an | < 1 1 ε ≤ < . n L2 2 Sei L = max { L1 , L2 }. Für alle n ≥ L gilt, dass |A − an | = |A − αn + αn − an | ≤ |A − αn | + |αn − an | < Dies zeigt Behauptung 3 und damit auch den Satz. ε 1 + < ε. 2 n Kapitel 5 Unendliche Mengen Die zentrale Frage dieses Kapitels ist, ob Mengen mit unendlich vielen Elementen wie beispielsweise N, N0 und Z gleich viele Elemente haben. Für unendliche Mengen ist die Frage der Gleichmächtigkeit komplizierter als für endliche Mengen. Sind N, M endliche Mengen mit N ( M , dann ist die Kardinalität von N echt kleiner als die Kardinalität von M . Dies folgt aus dem Schubfachprinzip (Lemma 2.1.8). Überträgt man dies auf unendliche Mengen, würde man erwarten, dass N als echte Teilmenge von N0 eine kleinere Kardinalität als N0 besitzt. Wir können aber N0 auch in N einbetten (Bemerkung 5.1.2). Unsere intuitive Definition der Gleichmächtigkeit ist daher leider nicht wohldefiniert: Wir brauchen eine bessere Definition. 5.1 Gleichmächtigkeit Als Motivation von Definition 5.1.1 betrachten wir zunächst die Situation von endlichen Mengen. Sei M eine endliche, nicht-leere Menge. Wir schreiben n = |M |. Es existiert eine Bijektion ϕ : M → { 1, 2, . . . , n } gegeben durch eine Abzählung der Elemente von M . Zwei endliche Mengen N und M besitzen genau dann die gleiche Mächtigkeit, wenn eine Bijektion zwischen N und M existiert: Wir schicken das i-te Element von N auf das i-te Element von M . Definition 5.1.1. (a) Seien N, M beliebige, nicht notwendigerweise endliche, Mengen. Die Mächtigkeit von N ist kleiner gleich der Mächtigkeit von M , wenn eine injektive Abbildung ϕ : N → M existiert. Bezeichnung: |N | ≤ |M |. (b) Zwei Mengen N und M sind gleich mächtig, wenn eine Bijektion ϕ : N → M existiert. Bezeichnung: |M | = |N |. (c) Eine (unendliche) Menge heißt abzählbar, wenn M die gleiche Mächtigkeit 49 50 KAPITEL 5. UNENDLICHE MENGEN 1 2 3 ... Abbildung 5.1: Das Hilbert–Hotel wie N besitzt. Eine unendliche Menge, die nicht abzählbar ist, heißt überabzählbar. Man zeigt leicht, dass Gleichmächtigkeit eine Äquivalenzrelation ist. Die Mächtigkeit einer unendlichen Menge kann man durch eine Kardinalzahl angeben. Die Mächtigkeit von N ist ℵ0 (der Index 0 kommt daher, dass N die kleinste unendliche Menge ist). Der Buchstabe ℵ ist der erste Buchstabe des hebräischen Alphabets und heißt Aleph. Die weitere Kardinalzahlen sind ℵ1 , ℵ2 , . . . . Bemerkung 5.1.2 (Das Hilbert-Hotel). Satz 5.1.3 sagt, dass die Mengen N, N0 und Z gleichmätig sind. Bevor wir den eigentlichen Beweis geben, besprechen wir zuerst eine Veranschaulichung des ersten Teil des Beweises, siehe auch folgendes Video: http://www.youtube.com/watch?v=faQBrAQ87l4 Es gibt auch einen Kurzfilm zu diesem Satz. Hier sehen Sie einen Ausschnitt: https://www.vismath.eu/de/filme/hotel-hilbert Das Hilbert-Hotel ist ein Hotel mit abzählbar unendlich vielen Zimmern, die mit 1, 2, 3, . . . nummeriert sind (Abbildung 5.1). Alle Zimmer sind belegt als ein neuer Gast eintrifft und nach einem Zimmer fragt. Im Hilbert-Hotel ist für den neuen Gast Platz, obwohl alle Zimmer belegt sind: Der Manager sagt allen bereits eingecheckten Gästen, dass sie ins nächste Zimmer umziehen sollen, also der Gast aus Zimmer 1 ins Zimmer 2, der Gast aus Zimmer 2 ins Zimmer 3 usw. Der neu angekommene Gast kann nun in das frei gewordenen Zimmer 1 ziehen. In einem Hotel mit nur endlich vielen Zimmern funktioniert dies wegen des Schubfachprinzips leider nicht. Satz 5.1.3. Die Mengen N0 und Z sind abzählbar. Beweis. Wir definieren eine Abbildung ϕ : N0 → N durch ϕ : n 7→ n + 1. Dies ist offensichtlich eine Bijektion: Die Umkehrabbildung ist ϕ−1 : m 7→ m − 1. Wir schließen, dass N abzählbar ist. 5.1. GLEICHMÄCHTIGKEIT 51 Wir definieren eine Abbildung ψ : Z → N0 durch 0 x 7→ 2x − 1 −2x falls x = 0, falls x > 0, falls x < 0. Die folgende Tabelle beschreibt ψ: ··· −3 −2 −1 0 1 2 3 ··· ··· 6 4 2 0 1 3 5 ··· Wir schließen, dass |Z| = |N0 |. Da N0 abzählbar ist, ist Z es auch. Alternativ definiert auch ϕ ◦ ψ eine Bijektion zwischen Z und N. Satz 5.1.4. Die Menge Q ist abzählbar. Beweis. Es reicht zu zeigen, dass die Menge Q>0 abzählbar ist. Ähnlich wie im Beweis von Satz 5.1.3 leitet man hieraus ab, dass Q auch abzählbar ist. Eine rationale Zahl x ∈ Q>0 kann man eindeutig als Bruch x = a/b mit a, b ∈ N teilerfremd darstellen (Abschnitt 3.2). Wir identifizieren die Zahl x mit dem Paar (a, b) ∈ R2 . Abbildung 5.2 beschreibt eine Aufzählung dieser Paare, oder äquivalent eine Abbildung ϕ : N → Q>0 . Bemerke, dass wir die Paare (a, b) mit ggT(a, b) 6= 1 weglassen. Im Bild ist dies mit einem Kreuz gekennzeichnet. Um die Aufzählung zu erhalten, folgt man der angegebenen 5 × 4 × × 3 × 2 × 1 1 2 3 4 Abbildung 5.2: Die Abzählbarkeit von Q>0 Schlangenlinie, beginnend mit (1, 1). Man erhalt also: 1, 2 = 2/1, 1/2, 1/3, 2/3, 3/2, 3 = 3/1, 4 = 4/1, 4/3, 3/4, 1/4, 1/5, . . . . Das Argument aus Satz 5.1.4 zeigt auch, dass Z × Z abzählbar ist. 52 5.2 KAPITEL 5. UNENDLICHE MENGEN Das Cantorsche Diagonalargument In diesem Abschnitt zeigen wir, dass R überabzählbar ist. Hierzu benutzen wir das Cantorsche Diagonalargument, das von Cantor (1845 - 1918) gefunden wurde. Cantor war zunächst selbst überrascht von seiner Entdeckung. Nachdem er im Jahre 1877 gezeigt hat, dass das Intervall [0, 1] die gleiche Mächtigkeit wie Rn für beliebiges n ∈ N besitzt, schrieb er an Dedekind je le vois, mais je le crois pas. (Ich sehe es, aber ich glaube es nicht. Siehe http://www-groups.dcs.st-and.ac.uk/history/Biographies/Cantor.html ) Satz 5.2.1. Die Menge R ist überabzählbar. Beweis. Es reicht zu zeigen, dass die Menge [0, 1) ⊂ R überabzählbar ist. Jede reelle Zahl x ∈ [0, 1) lässt sich als Dezimalzahl (5.1) x = 0, x1 x2 x3 . . . mit xi ∈ { 0, 1, . . . , 9 } darstellen (Beispiel 4.4.5). Diese Darstellung ist nicht eindeutig. Existiert ein Index N , sodass xN 6= 9 und xi = 9 für alle i > N , ist x auch durch x = 0, x1 x2 . . . (xN + 1) gegeben (dies folgt wie in Beispiel 4.2.4.(c)). Wir schließen daher die Dezimalbruchentwicklungen (5.1) für das eine N mit xi = 9 für alle i > N aus. Mit dieser Einschränkung können wir jede reelle Zahl x ∈ [0, 1) eindeutig in der Form (5.1) darstellen, da die Differenz zweier verschiedenen solcher Darstellungen positiv ist. Wir nehmen an, dass [0, 1) abzählbar ist und schreiben ϕ : N → [0, 1) für die zugehörige Bijektion. Wir schreiben xi = ϕ(i). Es gilt also [0, 1) = xi i ∈ N als Teilmengen von R. Wir konstruieren eine reelle Zahl y ∈ [0, 1), die nicht in xi i ∈ N enthalten ist und erhalten so einen Widerspruch. Wir schreiben xi = ϕ(i) = 0, xi1 xi2 xi3 . . . . Die Zahl xij ∈ { 0, 1, . . . , 9 } ist also die jte Nachkommastelle von xi . Besitzt xi eine endliche Dezimalbruchzerlegung, ergänzen wir mit 0. Für alle i ∈ N wählen wir yi ∈ { 0, 1, . . . , 9 }, sodass yi 6= xii und kein Index N existiert, sodass yi = 9 für alle i > N . Dies ist offensichtlich möglich. Beispielsweise können wir yi 6= 9, xii für alle i wählen. Wir betrachten die Zahl y := 0, y1 y2 y3 . . . . Offensichtlich ist y ∈ [0, 1).Da ϕ : N → [0, 1) eine Bijektion ist, existiert ein Index j mit y = ϕ(j) = xj . Wegen der Eindeutigkeit der Dezimalbruchentwicklung impliziert dies, dass beide Zahlen die gleiche Nachkommastellen besitzen, also yi = xji für alle i. Dies widerspricht yj 6= xjj . Wir schließen, dass [0, 1) überabzählbar ist. 5.2. DAS CANTORSCHE DIAGONALARGUMENT 53 Satz 5.2.1 sagt, dass die Mächtigkeit von R echt größer ist als die von N. Die Kardinalität von R ist also eine Kardinalzahl ℵi mit i > 0. Die Kontinuumshypothese, aufgestellt von Cantor, sagt, dass die Kardinalität von R gleich ℵ1 ist. Anders gesagt: Es existiert keine Teilmenge M ⊂ R mit ℵ0 = |N| < |M | < |R|. Es ist bekannt, dass man die Kontinuumshypothese nicht aus den ZermeloFränkel-Axiomen der Mengenlehre ableiten kann (es sei denn, die Axiomen der Mengenlehre sind widersprüchlich. Ob dies der Fall ist, ist nicht bekannt). Daher nennt man die Aussage Hypothese: Es ist nicht möglich die Aussage zu beweisen, man kann sie aber als zusätzliches Axiom annehmen. 54 KAPITEL 5. UNENDLICHE MENGEN Kapitel 6 Die komplexen Zahlen In diesem Abschnitt definieren wir die komplexen Zahlen C ausgehend von den reellen Zahlen. Die wichtigste komplexe nicht-reele Zahl ist die imaginäre Einheit i. Diese Zahl ist eine Lösung der Gleichung x2 + 1 = 0. Für reelle Zahlen x ∈ R 2 gilt x2 + 1 > 0, also besitzt die √ Gleichung x + 1 = 0 keine Lösung in R. Man schreibt manchmal auch i = −1. Euler (1707 - 1783) rechnete schon mit der Zahl i. Von ihm stammt auch die Formel (6.1) eiπ = −1, die manchmal “die schönste Formel der Mathematik” genannt wird (siehe Abschnitt 6.2). Richtig eingeführt wurden die komplexe Zahlen von Gauß. Er zeigte den Fundamentalsatz der Algebra, der sagt, dass jede Gleichung xn + an−1 xn−1 + · · · + a0 = 0 mit ai ∈ R eine Lösung in C besitzt. Komplexe Zahlen waren aber schon früher in der Mathematik in Erscheinung getreten. Der italianische Mathematiker Cardano (1501 - 1576) publizierte im Jahre 1545 in seinem Buch Ars Magna eine Methode zur Bestimmung der Nullstellen kubischer Gleichungen der Form x3 = 3px + 2q (man kann zeigen, dass jede kubische Gleichung auf diese Form gebracht werden kann). In moderner Bezeichnung geschrieben, sagt das Ergebnis, dass q q p p 3 3 2 3 (6.2) q + q − p + q − q 2 − p3 eine Lösung der Gleichung x3 = 3px + 2q ist. Diese Formel ist also eine Verallgemeinerung der sogenannten Mitternachtsformel zur Bestimmung der Nullstellen einer quadratischen Gleichung. Cardano machte eine merkwürdige Entdeckung als er versuchte mit seiner Formel die Gleichung x3 = 15x + 4 zu lösen. Die Funktion f (x) := x3 − 15x − 4 55 56 KAPITEL 6. DIE KOMPLEXEN ZAHLEN besitzt genau eine positive Lösung, nämlich x = 4 (Abbildung 6.1). Cardano kannte keine negative Zahlen, daher betrachte er nur die positiven Lösungen (für eine Berechnung der negativen Lösungen, siehe Beispiel A.5.4). 100 50 -6 -4 -2 0 2 4 6 -50 -100 Abbildung 6.1: Graph der Funktion f (x) = x3 − 15x − 4 Einsetzen der Werte p = 5, q = 2 in (6.2) sollte daher die Lösung x = 4 ergeben. Cardano bemerkte, dass p in diesem Fall q 2 − p3 = 22 − 53 = −112 < 0 ist. Dies bedeutet, dass die Zahl q 2 − p3 , die als Zwischenwert in seiner Berechnung vorkam, keine reelle Zahl ist. Im Endergebnis kürzt sich dieses Zwischenergebnis aber wieder raus, wenn man richtig rechnet. Cardano macht in seinem Buch einen Versuch, dies zu nachzurechnen, aber offensichtlich verstand er nicht was er machte. Er sagt dies sei ebenso subtil wie nutzlos. (Zitiert nach http://www-history.mcs.st-and.ac.uk/HistTopics/Quadratic etc equations.html) Um Cardanos Berechnung richtig auszuführen, braucht man komplexe Zahlen. Dies zeigt, dass komplexe Zahlen nützlich sind, auch wenn man nur an einer reellen Lösung einer reellen Gleichung interessiert ist. Cardano war nicht der Entdecker der Formel (6.2). Er bekam die Formel von Tartaglia, nachdem er ihm versprochen hatte, die Formel nicht zu veröffentlichen. Dieses Versprechen hat er nicht gehalten. Hier finden Sie die spannende Geschichte von Tartaglia und Cardano mit vielen Zitaten aus deren Korrespondenz: http://www-history.mcs.st-and.ac.uk/HistTopics/Tartaglia v Cardan.html 6.1. DEFINITION DER KOMPLEXEN ZAHLEN 6.1 57 Definition der komplexen Zahlen Wir definieren komplexe Zahlen als Ausdrücke a + bi, a, b ∈ R. Wir schreiben C = { a + bi | a, b ∈ R } für die Menge der komplexen Zahlen. Im Folgenden fassen wir R = { z = a + bi ∈ C | b = 0 } als Teilmenge von C auf. Für eine komplexe Zahl z = a + bi ∈ C nennen wir a = <(z) den Realteil und b = =(z) den Imaginärteil von z. Zwei komplexe Zahlen sind also genau dann gleich, wenn Realteil und Imaginärteil gleich sind. Eine komplexe Zahl z ist reell, wenn =(z) = 0. Zur Veranschaulichung identifizieren wir C durch a + bi 7→ (a, b) mit der Ebene R2 und fassen komplexe Zahlen als Punkte der “komplexen Ebene” wie in Abbildung 6.2 auf. Da diese Darstellung von Gauß stammt, nennt man diese Ebene auch Gaußsche Zahlenebene. Die horizontale Achse nennen wir reelle Achse und die vertikale imaginäre Achse. z+w 2 z w 1 1 2 Abbildung 6.2: Addition komplexer Zahlen Die Addition auf C ist definiert durch (a + bi) + (c + di) = (a + c) + (b + d)i. Dies entspricht der Addition von Vektoren in R2 (Abbildung 6.2). Die Multiplikation ist definiert als (a + bi) · (c + di) = (ab − cd) + (ad + bc)i. Addition und Multiplikation komplexer Zahlen sind bestimmt durch die Operationen auf R und die Eigenschaft i2 = −1. 58 KAPITEL 6. DIE KOMPLEXEN ZAHLEN Definition 6.1.1. Die komplexe Konjugation ist definiert durch Die Zahl |z| := √ : C → C, z = a + bi 7→ z = a − bi. √ z · z = a2 + b2 heißt (komplexer) Betrag von z. Der Betrag einer komplexen Zahl ist eine nicht-negative reelle Zahl, nämlich die Länge von z aufgefasst als Vektor in der komplexen Ebene. Das folgende Lemma formuliert einige Eigenschaften des Betrags, die wir hier nicht beweisen. Lemma 6.1.2. Es gilt (a) |z1 z2 | = |z1 | · |z2 |, (b) |z1 + z2 | ≤ |z1 | + |z2 | (Dreiecksungleichung), (c) der Betrag von z ∈ C ist genau dann Null, wenn z = 0. Mit Hilfe des Betrags können wir leicht die multiplikative Inverse z −1 einer komplexen Zahl z = a + bi 6= 0 berechnen, indem wir benutzen, dass z · z = |z|2 ∈ R ist. Es gilt 1 z̄ a −b = 2 = 2 + 2 i. 2 z |z| a +b a + b2 Bei Berechnungen ist es wichtig, komplexe Zahlen immer in der Form a + bi darzustellen. Ansonsten ist es schwer festzustellen, ob zwei komplexe Zahlen gleich sind oder nicht. Beispiel 6.1.3. (a) Wir diskutieren wie man die Quadratwurzel einer komplexen Zahl ziehen kann. Sei z = a + bi 6= 0 eine komplexe Zahl. Wir suchen alle Lösungen der Gleichung w2 = z. Wir werden zeigen, dass diese Gleichung immer zwei komplexe Lösungen besitzt. Unser Beweis liefert gleichzeitig eine Methode zur Berechnung der Quadratwurzeln einer konkreten Zahl. Wir schreiben w = c + di mit c, d ∈ R. Da w2 = (c2 − d2 ) + 2cdi ist, liefert dies das Gleichungssystem (6.3) c2 − d2 = a, (6.4) 2cd = b. Fall 1: Wir betrachten zuerst den Fall c = 0. Gleichung (6.4) impliziert, dass b = 0. Also ist z = a ∈ R \ { 0 } und (6.3) sagt, dass −d2 = a. Insbesondere ist a < 0 und d2 = −a = |a|. Die Lösungen des Gleichungssystems sind daher p w = ± |a|i. Fall 2: Sei c 6= 0. Auflösen von (6.3) nach d liefert 6.1. DEFINITION DER KOMPLEXEN ZAHLEN (6.5) d= 59 b . 2c Einsetzen in die erste Gleichung und Multiplikation mit 4c2 liefert 4c4 − b2 = 4ac2 oder die äquivalente Gleichung: 4c4 − 4ac2 − b2 = 0. Dies ist eine quadratische Gleichung in c2 . Mit Hilfe der Mitternachtsformel finden wir √ √ 4a ± 16a2 + 16b2 a ± a2 + b2 2 c = = . 8 2 √ √ Wir erinnern uns, dass c ∈ R \ { 0 }, also c2 > 0 ist. Da a2 + b2 ≥ a2 = |a| ≥ a ist, folgt, dass √ a + a 2 + b2 2 (6.6) c = . 2 Wir haben angenommen, dass z = a + bi 6= 0 und daher a2 + b2 > 0. Dies impliziert, dass (6.6) genau zwei Lösungen mit c, d ∈ R besitzt. (b) Als Anwendung berechnen wir die Quadratwurzeln von z = 1 + i. Eine alternative Methode wird in Beispiel 6.2.6.(b) vorgestellt. Einsetzen von a = b = 1 in (6.6) liefert √ 1+ 2 2 c = . 2 Also p p √ √ 1+ 2 2+2 2 √ c=± =± 2 2 √ (Bei der letzten Gleichung haben wir Zähler und Nenner mit 2 ergänzt). Die Gleichung (6.5) liefert 1 1 = ±p √ . 2c 2+2 2 p √ Wir ergänzen Zähler und Nenner mit −2 + 2 2, um den Nenner möglichst weit zu vereinfachen. Dies liefert p √ −2 + 2 2 d=± . 2 d= Die gesuchten Quadratwurzeln sind daher q q √ √ 1 ± 2 + 2 2 + −2 + 2 2i . 2 Beachte, dass das Vorzeichen von d durch das von c bestimmt wird. Wir überlassen es dem Leser/der Leserin zu überprüfen, dass dies in der Tat die gesuchte Quadratwurzeln sind. 60 KAPITEL 6. DIE KOMPLEXEN ZAHLEN 6.2 Polarkoordinaten Polarkoordinaten sind eine weitere Möglichkeit komplexe Zahlen darzustellen. Die Grundlage dieser Darstellung bildet folgende Definition der komplexen Exponentialfunktion. Definition 6.2.1. Für x ∈ R definieren wir eix = cos(x) + i sin(x). Insbesondere finden wir eiπ = cos(π) + i sin(π) = −1 (Formel von Euler (6.1)). Das folgende Lemma zeigt, dass die komplexe e-Funktion aus Definition 6.2.1 die üblichen Rechenregeln erfüllt. Die Aussage von Lemma 6.2.2.(a) kann man auch nutzen, um sich die Additionstheoreme für die trigoneometrischen Funktionen zu merken. Lemma 6.2.2. Seien x, y ∈ R. Es gilt: (a) ei(x+y) = eix · eiy , (b) der Betrag von eix ist 1. Beweis. Es gilt ei(x+y) = cos(x + y) + i sin(x + y). Die Additionstheoreme implizieren, dass ei(x+y) = (cos(x) cos(y) − sin(x) sin(y)) + i (cos(x) sin(y) + cos(y) sin(x)) = (cos(x) + i sin(y)) (cos(y) + i sin(y)) = eix · eiy . Dies impliziert (a). Teil (b) folgt aus der Relation cos2 (x) + sin2 (x) = 1. Lemma 6.2.2.(b) zeigt, dass die komplexen Zahlen der Form eiϕ auf dem komplexen Einheitskreis K := { z ∈ C k z| = 1 } liegen. Umgekehrt kann man jede z ∈ K schreiben als z = cos ϕ + i sin ϕ, wobei ϕ die Winkel von z, aufgefasst als Vektor in der komplexen Ebene, mit der positiven reellen Achse ist. Die folgende Definition verallgemeinert dies für beliebige komplexe Zahlen. Das Argument von z = 0 ist nicht definiert. Definition 6.2.3. Sei z = a + bi eine komplexe Zahl mit z 6= 0. Das Argument ϕ ∈ (−π, π] von z ist definiert als der Winkel von z, aufgefasst als Vektor in der komplexen Ebene, mit der positiven reellen Achse. Der folgende Satz folgt unmittelbar aus obiger Beobachtung (siehe Abbildung 6.3). Satz 6.2.4. Sei z ∈ C \ { 0 } eine komplexe Zahl mit Argument ϕ und Betrag r = |z|. Es gilt (a) z = |z|eiϕ = |z|(cos(ϕ) + i sin(ϕ)), 6.2. POLARKOORDINATEN 61 iR z r sin(ϕ) r ϕ r cos(ϕ) R |z| = r Abbildung 6.3: Polarkoordinaten (b) <(z) = |z| cos(ϕ), =(z) = |z| sin(ϕ). Lemma 6.2.5. Seien z = reiϕ und w = seiψ zwei komplexen Zahlen mit z, w 6= 0 in Polarkoordinaten gegeben. Insbesondere gelte r, s ∈ R>0 und ϕ, ψ ∈ (−π, π]. Dann gilt (a) |z · w| = |z| · |w|. (b) Das Argument von z · w ist kongruent zu ϕ + ψ (mod 2π). Beweis. Dies folgt aus Lemma 6.2.2. Sei w = reiϕ 6= 0 eine komplexe Zahl. Wir betrachten die Abbildung ρ : C → C, z 7→ w · z als Abbildung der komplexen Ebene. Lemma 6.2.5 impliziert, dass ρ eine Drehung um den Winkel ϕ verknüpft mit einer Streckung um r ist. Wir berechnen die Polarkoordinaten z = reiϕ von z = x+iy 6= 0. Falls x 6= 0 gilt p y r = |z| = x2 + y 2 , tan(ϕ) = . x Man kann das Argument ϕ von z auch mit Hilfe des Arcustangens ausdrücken. Hier braucht man allerdings eine Fallunterscheidung, da der Tangens π-periodisch 62 KAPITEL 6. DIE KOMPLEXEN ZAHLEN ist. Daher besitzt die Gleichung tan(ϕ) = y/x für x 6= 0 zwei Lösungen mit ϕ ∈ (−π, π]. Es gilt: y für x > 0, arctan( x ) y arctan( x ) + π für x < 0 und y ≥ 0, ϕ = arctan( xy ) − π für x < 0 und y < 0, π für x = 0 und y > 0, 2 − π für x = 0 und y < 0. 2 Anstatt diese Formeln anzuwenden, sollte man lieber geometrisch überlegen, in welchem Intervall ϕ im konkreten Fall liegt. Beispiel 6.2.6. (a) Wir schreiben die komplexe Zahl z = 1 − i in Polarkoordinaten. Wir berechnen √ |z| = 2, tan(ϕ) = −1. Die Lösungen der Gleichung tan(ϕ) = −1 mit ϕ ∈ (−π, π] sind ϕ ∈ {3π/4, −π/4}. Da z im 4ten Quadrant der komplexen Ebene liegt, ist ϕ = −π/4. Es gilt also √ z = 2e−πi/4 . (b) Im Beispiel 6.1.3.(b) haben wir die Quadratwurzeln von z := 1 + i berechnet. Wir lösen diese Aufgabe nochmals mit Hilfe von Polarkoordinaten. √ Wie in (a) berechnet man, dass 1 + i = 2eπi/4 . Sei w ∈ C mit w2 = z. Wir schreiben w = reiϕ . Lemma 6.2.5 impliziert also w2 = r2 e2iϕ . Dies liefert √ r2 = 2, 2ϕ ≡ π/4 (mod 2π), also r= √ 4 2, ϕ ∈ { π/8, π/8 − π = −7π/8 } . In Beispiel 6.1.3.(b) haben wir berechnet, dass q q √ √ 1 w1 := 2 + 2 2 + −2 + 2 2i . 2 eine der Quadratwurzeln ist. Da w im ersten Quadrant der komplexen Ebene liegt, gilt ϕ = π/8. Der andere Winkel gehört zur zweiten Quadratwurzel −w von z. Wir schließen, dass 1 w= 2 q √ q 2+2 2+ Insbesondere impliziert dies, dass p √ 2+2 2 √ cos(π/8) = , 242 √ √ 4 −2 + 2 2i = 2eiπ/8 . p √ −2 + 2 2 √ sin(π/8) = . 242 6.2. POLARKOORDINATEN 63 ζ82 = i ζ83 ζ81 ζ80 = 1 ζ84 = −1 ζ85 ζ87 ζ86 = −i Abbildung 6.4: Die 8te Einheitswurzel Die Lösungen in C der Gleichung zn = 1 heißen n-te Einheitswurzeln. Mit Hilfe der Polarkoordinaten können wir diese Lösungen leicht berechnen. Wir schreiben ζn = eiπ/n = cos(π/n) + i sin(π/n). Lemma 6.2.7. Die nte Einheitswurzeln sind ζnj = ejiπ/n = cos(jπ/n) + i sin(jπ/n), j = 0, 1, . . . , n − 1. Insbesondere besitzt die Gleichung z n = 1 genau n Lösungen in C. Beweis. Dies folgt aus Lemma 6.2.5. Abbildung 6.4 zeigt die achten Einheitswurzeln. 64 KAPITEL 6. DIE KOMPLEXEN ZAHLEN Anhang A Einige weitere Begriffe A.1 Teilbarkeit Wir wiederholen einige wohl bekannte Begriffe über Teilbarkeit ganzer Zahlen. Diese Begriffe werden in der Vorlesung Elementare Zahlentheorie ausführlicher besprochen. Definition A.1.1. Seien a 6= 0 und b ganze Zahlen. Wir sagen, dass b durch a teilbar ist, wenn eine ganze Zahl c mit b = a · c existiert. Wenn diese Bedingung erfüllt ist, heißt a ein Teiler von b. Wir benutzen die Bezeichnung a | b für ‘a teilt b’ und a - b für ‘a teilt b nicht’. Definition A.1.2. Eine Zahl n ∈ N≥2 heißt Primzahl, wenn 1 und n die einzigen positiven Teiler von n sind. Eine natürliche Zahl n ≥ 2 heißt zusammengesetzt, wenn n keine Primzahl ist. Definition A.1.3. Seien a, b ∈ Z zwei ganze Zahlen, die nicht beide Null sind. Der größte gemeinsame Teiler von a und b ist die größte natürliche Zahl, die sowohl a als b teilt (Bezeichnung: ggT(a, b)). Zwei Zahlen mit ggT(a, b) = 1 heißen teilerfremd. Satz A.1.4. Seien a, b ganze Zahlen mit b > 0. (a) Es existieren eindeutige ganze Zahlen q, r mit a = bq + r und 0 ≤ r < b. Wir nennen q den Quotienten und r den Rest der Division. (b) Die Zahl b ist genau dann ein Teiler von a, wenn r = 0. Beweis. Einen Beweis des Satzes finden Sie in [1, Satz 1.1.5]. A.2 Ungleichungen Die Menge R der reellen Zahlen besitzt eine Ordnung ≤ (Abschnitt 4.5). Für zwei reelle Zahlen a, b ∈ R ist also definiert ob a ≤ b gilt. Anstatt a ≤ b kann 65 66 ANHANG A. EINIGE WEITERE BEGRIFFE man auch b ≥ a schreiben. Die Schreibweise a < b bedeutet, dass a ≤ b und a 6= b ist. Die Ordnung auf R ist eine Wohlordnung. Dies bedeutet, dass folgende Eingeschaften erfüllt sind. Definition A.2.1. Eine Relation ≤ auf einer Menge K heißt Wohlordnung, wenn für alle a, b, c ∈ K gilt: (O1) a ≤ a (Reflexivität), (O2) a ≤ b, b ≤ a ⇒ a = b, (Antisymmetrie), (O3) a ≤ b, b ≤ c ⇒ a ≤ c, (Transitivität). (O4) Es gibt a ≤ b oder b ≤ a. Sei x ∈ R. Das Symbol ( |x| = −x x falls x < 0, falls x ≥ 0 bezeichnet den Absolutbetrag von x. Insbesondere ist |x| ≥ 0, x ≤ |x| für alle x ∈ R. Die Ungleichung |x| ≤ a ist äquivalent zu −a ≤ x ≤ a. Beispiel A.2.2. (A.1) (a) Wir bestimmen alle x ∈ R mit |x − 2| ≥ 1. Ist x − 2 ≥ 0, dann ist |x − 2| = x − 2. Die Ungleichung (A.1) ist daher in diesem Fall äquivalent zu x − 2 ≥ 1, also zu x ≥ 3. Ist x − 2 ≤ 0, dann ist |x − 2| = −(x − 2). Die Ungleichung (A.1) ist daher in diesem Fall äquivalent zu −x + 2 ≥ 1, also zu x ≤ 1. Die Lösungsmenge der Ungleichung ist (−∞, 1] ∪ [3, ∞). (b) Wir zeigen, dass 2x2 − 2xy + y 2 − 2x + 2 > 0 ist für alle x, y ∈ R. Dazu bemerken wir dass 2x2 − 2xy + y 2 − 2x + 2 = (x − y)2 + (x − 1)2 + 1. Für alle z ∈ R gilt z 2 ≥ 0. Es folgt (x − y)2 + (x − 1)2 + 1 ≥ 0 + 0 + 1 > 0. A.3. SUMMEN UND PRODUKTE 67 Die sogenannte Dreiecksungleichung, die üblicherweise eine Aussage über Längen von Vektoren ist, gilt auch für reelle Zahlen. Man zeigt das folgende Lemma beispielsweise indem man die verschiedenen möglichen Vorzeichen für a, b, a + b unterscheidet. Wir überlassen dies dem Leser/der Leserin. Lemma A.2.3 (Dreiecksungleichung). Seien a, b ∈ R. Dann gilt |a + b| ≤ |a| + |b|. Man sollte den Absolutbetrag nicht mit der sogenannten Gauß-Klammer verwechseln. Sei a ∈ R, dann bezeichnet die Gauß–Klammer [a] ∈ Z die größte ganze Zahl mit [a] ≤ a. Manchmal schreibt man auch bac anstatt [a]. Beispiels√ weise ist [π] = 3 und [− 2] = −2. Eine Variante ist die obere Gauß–Klammer definiert als die kleinste ganze Zahl größer gleich a. Bezeichnung: dae. Wir bemerken, dass die Zahlen [a] und dae genau dann gleich sind, wenn a ∈ Z ist. A.3 Summen und Produkte Sind xi verschiedene Ausdrücke, die möglicherweise vom Index i abhängen, schreiben wir n X x1 + x2 + · · · + xn = xi i=1 P als Abkürzung für die Summe der xi . Das Summenzeichen ist der griechische Großbuchstabe Sigma. Am Einfachsten versteht man dies anhand von einigen Beispielen: n X i = 1 + 2 + 3 + · · · + n, i=1 n X i2 = 12 + 22 + 32 + · · · + n2 , i=1 n X mi = m1 + m2 + m3 · · · + mn . i=1 (a) Hängt c nicht vom Index i ab, gilt n X cxi = c i=1 n X i=1 Insbesondere gilt n X i=1 c = cn. xi . 68 ANHANG A. EINIGE WEITERE BEGRIFFE (b) Summen mit dem gleichen Laufindex kann man zusammenfassen: n X xi + i=1 n X yi = i=1 n X (xi + yi ). i=1 Selbstverständlich kann man diese Regel auch benutzen, um Summen auseinander zu ziehen. Eine Doppelsumme ist eine Summe mit zwei (oder mehr) Laufindizes. Hier ist es wichtig, die Grenzen zu beachten. Beispiel A.3.1. (a) Wir betrachten die Doppelsumme n X m X xi yj . i=1 j=1 Hier werden alle Ausdrücke xi yj mit 1 ≤ i ≤ n und 0 ≤ j ≤ m aufsummiert. Insgesamt besitzt der Ausdruck also n · m Terme. Für n = m = 2 finden wir beispiesweise n X n X xi yj = x1 y1 + x1 y2 + x2 y1 + x2 y2 . i=1 j=1 (b) Wir betrachten nun die Doppelsumme n X n X xi yj . i=1 j=i Beachte, dass die Grenzen der inneren Summe von i abhängen. Hier werden alle Ausdrücke xi yj mit 1 ≤ i ≤ n und i ≤ j ≤ n aufsummiert. Für n = 2 finden wir beispielsweise 2 2 X X xi yj = x1 y1 + x1 y2 + x2 y2 . i=1 j=i Ähnlich benutzt man den griechischen Großbuchstaben Π um Produkte darzustellen: n Y xi = x1 · x2 · x3 · · · xn . i=1 A.4 Körper Definition A.4.1. Eine Menge K zusammen mit 2 Verknüpfungen +:K ×K →K ·:K ×K →K (a, b) 7→ a + b, (a, b) 7→ a · b, heißt Körper, falls folgende Bedingungen erfüllt sind: A.5. POLYNOME 69 (K1) (K, +) ist eine kommutative Gruppe, d. h. (a) die Addition ist assoziativ, d. h. a + (b + c) = (a + b) + c für alle a, b, c ∈ K, (b) es existiert ein neutrales Element 0, sodass 0 + a = a + 0 = a für alle a ∈ K, (c) für jedes a ∈ K existiert ein negatives Element −a mit a + (−a) = (−a) + a = 0, (d) die Addition ist kommutativ, d. h. a + b = b + a für alle a, b ∈ K, (K2) (K \ { 0 } , ·) ist eine kommutative Gruppe, d. h. (a) die Multiplikation ist assoziativ, d. h. a · (b · c) = (a · b) · c für alle a, b, c ∈ K \ { 0 }, (b) es existiert ein Einheitselement 1 so, dass 1 · a = a · 1 = a für alle a ∈ K \ { 0 }, (c) für jedes a ∈ K \ { 0 } existiert ein inverses Element a−1 mit a · a−1 = a−1 · a = 1, (d) die Multiplikation ist kommutativ, das heißt a · b = b · a für alle a, b ∈ K \ { 0 }, (K3) es gelten die Distributivgesetze: a · (b + c) = a · b + a · c, (a + b) · c = a · c + b · c, für alle a, b, c, ∈ K. Beispiele von Körpern sind Q, R und C. Die Menge Z ist kein Körper, da nur ±1 in Z ein multiplikatives Inverse besitzen. Ist p eine Primzahl, kann man zeigen, dass Fp := Z/pZ mit Addition und Multiplikation modulo p auch ein Körper ist. Hierbei ist F die Abkürzung des englischen Begriffs für Körper: field. A.5 Polynome In diesem Abschnitt fassen wir einige Definitionen und Eigenschaften von Polynomen zusammen. Für Beweise und mehr Details verweisen wir auf das Skript der Vorlesung Elemente der Algebra [2, Abschnitt 3]. Definition A.5.1. Sei K ein Körper. Pn (a) Ein Polynom mit Koeffizienten in K ist ein Ausdruck f (x) = i=0 ai xi mit Koeffizienten ai ∈ K. Wir schreiben K[x] für die Menge der Polynome mit Koeffizienten in K. (b) Das Nullpolynom f (x) = 0 ist das Polynom, dessen Koeffizienten alle Null sind. 70 ANHANG A. EINIGE WEITERE BEGRIFFE (c) Ist f (x) 6= 0 nicht das Nullpolynom, nennt man die größte Zahl n mit an 6= 0 der Grad von f (Bezeichnung: Grad(f )). Den Grad des Nullpolynoms definieren wir als −∞. P (d) Ist f (x) = i ai xi ein Polynom von Grad n, dann heißt an xn der führende Term von f . Ein Polynom vom Grad n mit führendem Term xn heißt normiert. (e) Seien f (x), g(x) ∈ K[x] mit g(x) 6= 0. Wir sagen, dass g(x) ein Teiler von f (x) ist, falls ein Polynom h(x) ∈ K[x] mit f (x) = g(x)h(x) existiert. Der folgende Satz ist ein Analogon der Division mit Rest in Z (Satz refdivsatz). Satz A.5.2 (Polynomdivision). Sei K ein Körper und seien f (x), g(x) ∈ K[x] Polynome mit g(x) 6= 0. Es existieren eindeutige Polynome q(x) und r(x) ∈ K[x] mit f (x) = q(x)g(x) + r(x), wobei Grad(r) < Grad(g) ist. Korrolar A.5.3. Sei K ein Körper und f (x) ∈ K[x] ein Polynom. Eine Zahl a ∈ K ist genau dann eine Nullstelle von f , wenn ein Polynom q(x) ∈ K[x] mit f (x) = q(x)(x − a) existiert. Beweis. Die Aussage folgt aus Satz A.5.2, siehe [2, Kor. 3.3.3]. Beispiel A.5.4. Als Anwendung berechnen wir alle reelle Lösungen der Gleichung x3 − 15x − 4 = 0, die wir in der Einleitung von Abschnitt 4.4 betrachtet haben. Wir haben schon gesehen, dass diese Gleichung die Lösung x = 4 besitzt. Dies bedeutet, dass x3 − 15x − 4 durch x − 4 teilbar ist (Korollar A.5.3). Wir führen die Division mit Hilfe von Polynomdivision durch und finden: (A.2) x3 − 15x − 4 : x − 4 = x2 + 4x + 1 − x3 + 4x2 4x2 − 15x − 4x2 + 16x x−4 −x+4 0 Die weiteren Lösungen der Gleichung erfüllen also x2 + 4x + 1 = 0. Mit Hilfe der Mitternachtsformel finden wir √ √ −4 ± 16 − 4 = −2 ± 3. x= 2 Die anderen zwei Lösungen der Gleichung sind also in der Tat in R<0 , wie man auch aus Abbildung 6.1 erkennen kann. Anhang B Das griechische Alphabet α A Alpha ν N Ny β B Beta ξ Ξ Xi γ Γ Gamma o O Omikron δ ∆ Delta π Π Pi , ε E Epsilon ρ P Rho ζ Z Zeta σ Σ Sigma η H Eta τ T Tau θ, ϑ Θ Theta υ Υ Ypsilon ι I Jota φ, ϕ Φ Phi κ K Kappa χ X Chi λ Λ Lambda ψ Ψ Psi µ M My ω Ω Omega 71 72 ANHANG B. DAS GRIECHISCHE ALPHABET Literaturverzeichnis [1] I.I. Bouw, Elementare Zahlentheorie. Vorlesungsskript, Sommersemester 2010. [2] I.I. Bouw, Elemente der Algebra. Vorlesungsskript, Wintersemester 2012/13. [3] The Mactutor history of http://www-history.mcs.st-and.ac.uk 73 mathematics archive,