Mathematik-Brückenkurs für alle, die sich für Mathematik interessieren µFSR, TU Dresden Version vom 6. Oktober 2016, Fehler, Ideen, Anmerkungen und Verbesserungsvorschläge bitte an [email protected] Inhaltsverzeichnis 1 Mengenlehre und Logik 1.1 Aussagen . . . . . . . . . . . . 1.2 Logische Junktoren . . . . . . 1.3 Quantoren . . . . . . . . . . . 1.4 Was ist eine Menge? . . . . . 1.5 Mengenkonstruktionen . . . . 1.6 Gewitterwolken am Horizont . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 5 6 8 10 12 2 Relationen und Funktionen 2.1 Was ist eine Relation? . . . . . . 2.2 Was ist eine Funktion? . . . . . . 2.3 besondere Arten von Relationen 2.4 surjektiv, injektiv, bijektiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 16 17 21 23 . . . . . . . . . 27 27 30 31 32 33 33 34 35 36 4 Vollständige Induktion 4.1 Die Idee der vollständigen Induktion . . . . . . . . . . . . . . . . . . . . 4.2 Natürliche Zahlen – die Peano-Axiome . . . . . . . . . . . . . . . . . . . 39 39 43 5 Algebra 5.1 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Körper mit Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47 49 50 6 Komplexe Zahlen 6.1 Motivation und Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Definition und erste Eigenschaften . . . . . . . . . . . . . . . . . . . . . . 52 52 53 . . . . . . 3 Beweistechniken 3.1 Was ist ein Beweis? . . . . . . . . . 3.2 Ein Bisschen Material – Geometrie 3.3 Direkter Beweis . . . . . . . . . . . 3.4 Widerspruchsbeweis . . . . . . . . 3.5 Beweis durch Kontraposition . . . 3.6 Beweis durch Fallunterscheidung . 3.7 Mehr Geometrie . . . . . . . . . . . 3.8 Äquivalenzen . . . . . . . . . . . . 3.9 Beweis durch (Gegen-) Beispiel . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 57 7 Kombinatorik 7.1 Zählen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Graphen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 59 6.3 6.4 3 1 Mengenlehre und Logik 1.1 Aussagen Mathematik und Logik sind eng miteinander verwandt, denn in beiden Wissenschaften ist uns sehr daran gelegen, dass alle Begriffe eine klare und scharf umrissene Bedeutung haben. Die Mathematik verwendet Logik, weil das Denken unter diesen strengen Bedingungen nicht immer intuitiv ist; in solchen Fällen wollen wir also die gefühlsmäßige Komponente eliminieren und vielmehr genau festgelegt haben, was wir als wahr (was auch immer das heißen mag) ansehen wollen. Als Beispiel für die Ungenauigkeiten natürlicher Sprache und alltäglichen Denkens möchten wir Folgende drei Punkte anführen: • Was ist das Gegenteil von „ein Paar“ (im Sinne einer kleinen Anzahl)? Je nach Kontext könnte es „keine“ (zum Beispiel auf die Frage „Haben wir noch ein Paar saure Gurken?“) oder „viele“ sein. Zum Beispiel sind „nicht nur ein Paar“ Flüchtlinge auf dem Weg nach Deutschland. • Eine Katze hat einen Schwanz mehr als keine Katze. Keine Katze hat zwei Schwänze. Damit hat jede Katze drei Schwänze. • Die Wahrscheinlichkeit, beim Münzwurf nach zehnmal „Zahl“ noch einmal „Zahl“ zu werfen, ist genau so groß wie die Wahrscheinlichkeit nach zehntausendmal „Zahl“ noch einmal „Zahl“ zu werfen. Trotzdem werden im Mittel „Kopf“ und „Zahl“ gleich häufig auftreten. Wir wollen nun keine philosophische Diskussion der Frage, was wahr oder falsch bedeuten sollen, beginnen, sondern uns zunächst darauf zurückziehen, zu sagen, dass jeder eine ungefähre Vorstellung hat, was diese Wörter bedeuten sollen. Unsere erste Definition ist deshalb auch noch eher umgangssprachlich zu verstehen: Definition 1.1 (Aussage). Eine Aussage ist ein Ausdruck aus natürlicher Sprache oder (mathematische oder andere) Notation, für den man sinnvoll entscheiden kann, ob er wahr oder falsch ist. Die folgende erste Aufgabe soll unser Gefühl für den Begriff der Aussage stärken. Aufgrund der eher ungenauen Natur unserer Definition ist die Antwort nicht immer ganz klar, es kommt also auf das Nachdenken und die Begründung an! Aufgabe 1.1. Welche der folgenden Ausdrücke sind Aussagen? Begründe! Wenn der Ausdruck eine Aussage ist, entscheide, ob sie wahr oder falsch ist! 4 1. 1 + 1 = 2 2. In Dresden ist das Wetter gut. 3. Ich mag Mathematik. 4. Johann Sebastian Bach. 5. Pferde sind Paarhufer. 6. Dieser Satz ist eine Aussage. 7. Dieser Satz ist keine Aussage. 8. Dieser Satz ist eine wahre Aussage. 9. Dieser Satz ist eine falsche Aussage. 1.2 Logische Junktoren Logische Junktoren konstruieren aus gegebenen Aussagen eine neue Aussage. Definition 1.2 (logischer Junktor, Wahrheitstabelle). Für zwei Aussagen a und b sind die Junktoren • Negation, geschrieben ¬ • (inklusives) Oder, auch Disjuktion, geschrieben ∨ • Und, auch Konjunktion, geschrieben ∧ • Implikation, geschrieben ⇒ • Äquivalenz, auch Biimplikation, geschrieben ⇔ • exklusives Oder, geschrieben ⊕ oder Y definiert durch folgende Tabelle: a 0 0 1 1 b 0 1 0 1 ¬a 1 1 0 0 a∨b 0 1 1 1 a∧b 0 0 0 1 a⇒b 1 1 0 1 a⇔b 1 0 0 1 a⊕b 0 1 1 0 Tabelle 1.1: Wahrheitstabelle der logischen Junktoren Die Tabelle nennt man eine Wahrheitstabelle. Sie ist folgendermaßen zu verstehen: Die Eins steht für „wahr“, die Null für „falsch“. Im Kopf rechts neben dem Doppelstrich stehen 5 zusammengesetzte Aussagen, links neben dem Doppelstrich stehen die Teilaussagen. In jeder Zeile steht unter der zusammengesetzten Aussage ihr Wahrheitswert in Abhängigkeit von den Wahrheitswerten ihrer Teilaussagen. Definition 1.3 (Präzedenz der logischen Junktoren). Um Klammern zu sparen, versehen wir die logischen Operatoren mit einer Präzedenzreihenfolge: ¬ ∧, ∨, ⊕ ⇒, ⇔ Junktoren, die hier weiter oben stehen, binden stärker als die, die weiter unten stehen. Das bedeutet, dass z.B. der Ausdruck ¬ a ∧ b ⇒ c und der Ausdruck ((¬ a) ∧ b) ⇒ c das Selbe bedeuten. Hier ist zu beachten, dass Ausdrücke mit mehreren Junktoren gleicher Präzedenz hintereinander im Allgemeinen immer noch Klammern benötigen, um eindeutig zu sein. Betrachte dazu folgende Wahrheitstabelle: a 0 0 1 1 b 0 1 0 1 a⊕b 0 1 1 0 b∨a 0 1 1 1 a ⊕ (b ∨ a) 0 1 0 0 ( a ⊕ b) ∨ a 0 1 1 1 Tabelle 1.2: Klammern sind wichtig Aufgabe 1.2. Stelle die Wahrheitstabellen für folgende Aussagen auf: a ⇒ b, b ⇒ a, ¬ a ∨ b, ¬b ⇒ ¬ a, a ⇔ b, ( a ⇒ b) ∧ (b ⇒ a), a ⊕ b, ( a ∨ b) ∧ ¬( a ∧ b). Was fällt dir auf? Formuliere die gefundenen logischen Sachverhalte in natürlicher Sprache und gib Beispiele. Aufgabe 1.3. Beweise die De Morgan’schen Regeln: ¬( a ∨ b) = ¬ a ∧ ¬b und ¬( a ∧ b) = ¬ a ∨ ¬b für Aussagen a und b. Was bedeuten sie in natürlicher Sprache? Beweise h A ⇔ Bi ⇒ h A ⇒ Bi Die nächste Aufgabe ist etwas schwerer, hier muss man schon eine richtig gute Idee haben. Aufgabe 1.4. Gibt es eine zusammengesetzte Aussage mit Teilaussagen a, b und c (jede mindestens einmal!), die genau die Junktoren ∧ und ∨ benutzt (jeden mindestens einmal!), und bei der Klammersetzung den Wahrheitswert nicht verändert? Begründe! 1.3 Quantoren Man möchte auch Aussagen wie „Es gibt eine Zahl, die größer ist als 5“ oder „Alle nichttrivialen Nullstellen der Riemann’schen Zetafunktion haben Realteil 1/2“ formal 6 logisch aufschreiben können. Dann kann man nämlich einmal gefundene abstrakte Gesetzmäßigkeiten „wiederverwerten“. Definition 1.4 (Quantor, Individuenbereich). Der Allquantor ∀ und der Existenzquantor ∃ werden wie folgt verwendet, um Aussagen zu bilden: Für eine Aussage A( x ), die von x abhängt (z.B. „x ist blau oder x = π1 “), werden folgende neue Aussagen erklärt: Schreibweise ∃ x : A( x ) ∃!x : A( x ) ∀ x : A( x ) @x : A( x ) Sprechweise „Es gibt (mindestens) ein x, sodass A( x ) gilt.“ „Es gibt genau ein x, sodass A( x ) gilt.“ „Für alle x gilt A( x ).“ „Es gibt kein x, sodass A( x ) gilt.“ Tabelle 1.3: die Quantoren Die Gesamtheit aller Gegenstände x, über die man die Aussagen mit Quantoren bildet, wird Individuenbereich oder Diskursuniversum genannt. Wenn nichts weiter gesagt ist, nehmen wir als Individuenbereich schlicht alle Objekte der Welt und unseres Denkens. Wie Abschnitt 1.6 diskutieren wird, ist der letzte Satz obiger Definition in gewisser Weise sehr naiv. Das hat weitreichende logisch-philosophische Konsequenzen, die uns fürs Erste jedoch nicht stören. Man kann insbesondere Aussagen mit mehreren Quantoren schreiben: Sei der Individuenbereich die Gesamtheit aller Menschen. Bezeichne L( a, b) die Aussage „a liebt b.“. Dann kann man die Aussage „Jeder Mensch liebt (mindestens) einen Menschen“ als ∀ a∃b : L( a, b) schreiben. Hier ist zu beachten, dass die Reihenfolge der Quantoren wichtig ist: ∃b∀ a : L( a, b) bedeutet nämlich „Es gibt (mindestens) einen Menschen, den alle Menschen lieben“. Verkürzung von n Quantoren: ∀ a1 · · · ∀ an : A( a1 , . . . , an ) :⇔ ∀ a1 · · · an : A( a1 , . . . , an ) Aufgabe 1.5. Sei der Individuenbereich die Gesamtheit aller männlichen und weiblichen Pokemon. Schreibe die folgenden Aussagen mit Quantoren und Junktoren, wobei du nur die Aussagen K ( x, y, z) für „z ist ein Kind von x und y“ und M ( x ) für „x ist männlich“ verwendest! Für die Zwecke dieser Aufgabe (und nur dafür) nehmen wir an, dass jedes Pokemon entweder männlich oder nicht männlich, was weiblich sei, ist. 1. a ist ein Einzelkind. 2. a ist ein Cousin von b. 3. a hat genau eine Schwester. 4. Niemand ist sein eigener Vater. Aufgabe 1.6. Schreibe die Aussagen ∃!x : A( x ) und @x : A( x ), wobei du nur die Quantoren ∃ und ∀ verwendest! 7 Aufgabe 1.7. Verneine die Aussagen ∀ x : A( x ) und ∃ x : A( x )! Welches Prinzip fällt dir auf? Kann man es auch auf eine Aussage wie ∀ x ∃y, z : B( x, y, z) anwenden? Wie verhalten sich die Quantoren @ und ∃!? Aufgabe 1.8. Gib jeweils beispielhafte Aussagen A( x ) und B( x ) (und einen Individuenbereich) an, die belegen, dass im Allgemeinen (∀ x : A( x ) ∨ B( x )) 6= (∀ x : A( x )) ∨ (∀ x : B( x )) und (∃ x : A( x ) ∧ B( x )) 6= (∃ x : A( x )) ∧ (∃ x : B( x ))! Es gilt: weiteres 1.4 Was ist eine Menge? Einer (vielleicht sogar der) der wichtigsten und grundlegendsten Begriffe der modernen Mathematik ist der der Menge. Sehen wir uns also eine Möglichkeit an, zu sagen, was eine Menge sein soll. Wir betreiben hier zunächst die sogenannte naive Mengenlehre. Unter einer „Menge“ verstehen wir jede Zusammenfassung M von wohlunterschiedenen Objecten m unserer Anschauung oder unseres Denkens (welche die „Elemente“ von M genannt werden) zu einem Ganzen. – Georg Cantor Bevor wir uns mit Cantors Definition befassen, führen wir ein wenig Notation ein: • Mengen schreiben wir mit den geschwungenen Klammern „{“ und „}“ begrenzt. • Wir können die Elemente einer Menge aufzählen, wie in {3, Γ, grün, ∞}, d oder auch {1, 2, 4, 8, 16, . . .}, wenn klar ist, wie die Aufzählung weitergehen soll. • Aussagen wie „3 ist Element der Menge M“ schreiben wir folgendermaßen: 3 ∈ M. Aussagen wie „5 ist nicht Element der Menge M“ schreiben wir folgendermaßen: 5 6∈ M. • Wir können Mengen auch in der Form { x | A( x )} schreiben, wobei A( x ) eine Aussage über x ist. Diese Schreibweise bedeutet, dass die Menge alle x enthalten soll, für die A( x ) wahr ist. Weiterhin scheiben wir für eine Menge M auch { x ∈ M | A( x )} und meinen damit die Menge { x | x ∈ M ∧ A( x )}. Dass ein solches Objekt wieder eine Menge ist, ist für unsere naive Mengenlehre anschaulich klar, in einer axiomatischen Mengenlehre muss es gefordert (Aussonderungsaxiom) oder bewiesen werden. ∀y : y ∈ { x | A( x )} ⇔ A(y) Cantors Definition des Mengenbegriffes benötigt noch einige Klarstellungen: • Cantor sagt, dass eine Menge allein durch ihre Elemente bestimmt wird. Diese Eigenschaft nennt man Extensionalität. In axiomatischen Mengenlehren wie der 8 Zermelo-Fraenkel-Mengenlehre ist das ein Axiom. Beispielsweise sind die Mengen A := {1, −1} und B := { x ∈ R| x ist eine Lösung der Gleichung x2 = 1} gleich, weil sie die gleichen Elemente erhalten. Sehr oft fragt man in der Mathematik danach, ob zwei unterschiedlich gegebene Mengen gleich sind. • Mit der Extensionalität hängt eine weitere Forderung Cantors sehr eng zusammen: Jede Menge enthält jedes ihrer Elemente genau einmal. Ansonsten könnte man eines der Elemente mehrfach angeben und hätte dann verschiedene „Darstellungen“ dessen, was wir als eine Menge betrachten wollen, im Widerspruch zur Extensionalität. • Weder der Begriff der Menge noch der Begriff des Elements sind streng formal definiert. Auch werden sie in den Axiomen der Zermelo-Fraenkel-Mengenlehre, die das Fundament der modernen Mathematik bildet, nicht definiert. Vielmehr ergeben sich die Bedeutungen durch die axiomatisch festgelegten Beziehungen zwischen den Begriffen. David Hilbert soll einmal über seine Axiome der Geometrie gesagt haben, man könne, statt über Punkte, Geraden und Ebenen zu reden, jederzeit auch Tische, Stühle und Bierseidel sagen. Eine Veranschaulichung dessen, was eine Menge ist, die Richard Dedekind zugeschrieben wird, ist das Bild eines Sackes, der gewisse, voneinander unterscheidbare Dinge enthält (insbesondere also jedes nur einmal!). Eine Menge ist dann der Inhalt dieses Sackes. Insbesondere ist diese Anschauung hilfreich für die leere Menge ∅, die nicht schlicht „nichts“ ist, sondern der Inhalt eines leeren Sackes; es mag zunächst etwas esoterisch erscheinen, aber die Menge {∅} ist nicht leer, denn sie hat ein Element, nämlich die leere Menge. ∅ := {}, {∅} = {{}} Wir führen eine neue Schreibweise ein: Für eine Menge M und Aussagen A( x ), B( x ) schreiben wir Schreibweise ∀ x ∈ M : A( x ) ∃ x ∈ M : B( x ) Bedeutung ∀ x : x ∈ M ⇒ A( x ) ∃ x : x ∈ M ∧ B( x ) Sprechweise „Für alle x ∈ M gilt A( x ).“ „Es gibt ein x ∈ M, für das B( x ) gilt.“ In der Folge werden wir, weil unser Mengenbegriff extensional ist, (fast) alle Eigenschaften von Mengen extensional (das heißt über ihre Elemente) definieren. So auch jetzt: Definition 1.5 (Obermenge und Untermenge). Seien A und B zwei Mengen. • A und B heißen gleich, geschrieben A = B genau dann, wenn ∀ x : x ∈ A ⇔ x ∈ B. • A heißt Teilmenge oder Untermenge von B, geschrieben A ⊆ B genau dann, wenn ∀ x : x ∈ A ⇒ x ∈ B. • A heißt Obermenge von B, geschrieben A ⊇ B, wenn B eine Untermenge von A ist. 9 • A heißt echte Teilmenge oder echte Untermenge von B, geschrieben A ( B, falls (∀ x : x ∈ A ⇒ x ∈ B) ∧ (∃ x : x ∈ B ∧ x 6∈ A). • A heißt echte Obermenge von B, falls B eine echte Untermenge von A ist. Manche Autoren schreiben auch A ⊂ B für A ( B. Hier ist aber Vorsicht geboten, weil viele Autoren (insbesondere im englischen Sprachraum) A ⊂ B für A ⊆ B verwenden. Die hier gewählte Schreibweise A ( B umgeht diese Stolperfalle, weil sie ganz deutlich macht, dass man ausschließen will, dass die Mengen A und B gleich sind. Eine Bemerkung zum Unterschied zwischen Elementbeziehung und Teilmengenbeziehung: Für die Menge A := {∗, {∅}, 1, {grün, blau, rot}, X } gilt zum Beispiel 1 ∈ A, aber grün 6∈ A; ferner gilt {∅} ∈ A, ∅ ⊂ A (nach Aufgabe 1.11, siehe unten) und ∅ 6∈ A; außerdem ist {∅} 6⊆ A aber {{∅}} ⊆ A. Aufgabe 1.9. Seien A( x ), B( x ) Aussagen mit A( x ) ⇒ B( x ). Zeige, dass dann { x | A( x )} ⊆ { x | B( x )}! Was kann man über die anderen Junnktoren sagen? (d.h. zum Beispiel: wie stehen die Mengen { x | A( x ) ∨ B( x )} und { x | A( x )} und { x | B( x )} miteinander in Beziehung?) Aufgabe 1.10. Zeige, dass für zwei Mengen A und B gilt, dass A = B ⇔ ( A ⊆ B) ∧ ( B ⊆ A)! (Diese Eigenschaft wird oft verwendet, um zu zeigen, dass zwei Mengen gleich sind.) Aufgabe 1.11. Beweise, dass jede Menge eine Obermenge der leeren Menge ist! Beweise: h∅ ( A ⇔ ∅ 6= A ⇔ (∃ x )( x ∈ A)i und h∀ x ∈ {} : A( x )i = > sowie h∃ x ∈ {} : A( x )i = ⊥ 1.5 Mengenkonstruktionen Wir wollen aus gegebenen Mengen neue Mengen konstruieren. Definition 1.6 (Schnittmenge, Vereinigungsmenge, Differenz, symmetrische Differenz). Seien A und B Mengen. Dann bezeichnet • A ∪ B die Vereinigungsmenge von A und B, die definiert ist durch ∀ x : ( x ∈ A) ∨ ( x ∈ B) ⇔ x ∈ ( A ∪ B) • A ∩ B die Schnittmenge von A und B, die definiert ist durch ∀ x : ( x ∈ A) ∧ ( x ∈ B) ⇔ x ∈ ( A ∩ B) • A \ B die Differenzmenge von A und B, die definiert ist durch ∀ x : ( x ∈ A) ∧ ( x 6∈ B) ⇔ x ∈ ( A \ B) • A4 B die symmetrische Differenz von A und B, die definiert ist durch ∀ x : ( x ∈ A) ⊕ ( x ∈ B) ⇔ x ∈ ( A4 B) Diese gerade definierten Beziehungen zwischen Mengen (und auch ⊆ und ⊇) kann man durch so genannte Venn-Diagramme (nach John Venn) veranschaulichen: 10 B A C Abbildung 1.1: Venn-Diagramm, in dem die Menge ( B ∩ C ) \ A hervorgehoben ist Venn-Diagramme kann man auch verwenden, um Beweise über Mengen zu veranschaulichen. Aufgabe 1.12. Beweise, dass die symmetrische Differenz tatsächlich symmetrisch ist, d.h. dass für je zwei Mengen A und B gilt, dass A4 B = B4 A! Dazu kannst du entweder direkt anhand der Definition arbeiten oder die Aussage von Aufgabe 1.10 verwenden oder zuerst (z.B. mit einem Venn-Diagramm) veranschaulichen, dass A4 B = ( A \ B) ∪ ( B \ A) und dann benutzen, dass für beliebige Mengen M und N die Aussage M ∪ N = N ∪ M in offensichtlicher Weise gilt. Wir wollen nun noch zwei etwas komplexere Mengenkonstruktionen betrachten. Definition 1.7 (Potenzmenge). Sei A eine Menge, dann ist die Potenzmenge P( A) von A definiert als die Menge aller Teilmengen von A. Beachte, dass die Potenzmenge einer Menge stets die leere Menge enthält, wie Aufgabe 1.11 zeigt! Die Potenzmenge von A wird auch manchmal mit 2 A bezeichnet, weil sie, wenn | A| die Anzahl der Elemente von A bezeichnet, 2| A| Elemente hat. Beachte, dass P(∅) = {∅} 6= ∅! Aufgabe 1.13. Schreibe die Potenzmenge der Menge A := {∅, {∅}} auf! Gibt es eine Menge, deren Potenzmenge A ist? Aufgabe 1.14. Die Menge A habe n Elemente. Erkläre, warum P( A) dann 2n Elemente hat! Definition 1.8 (kartesisches Produkt). Seien A und B Mengen. Dann ist das kartesische Produkt A × B definiert als die Menge der Paare ( a, b), sodass a ∈ A und b ∈ B. Was ein Paar sein soll, müssen wir hier noch erklären: Ein Paar ist wie eine zweielementige Menge eine Zusammenfassung zweier Objekte, bei der es aber auf die Reihenfolge der Elemente ankommt. Während also { a, b} = {b, a} ist (unsere Mengenlehre ist extensional!), gilt ( a, b) 6= (b, a). 11 Für Ausdrücke wie A × B × C ist a priori nicht klar, was sie bedeuten sollen; mit Klammern ( A × B) × C erhält man nach Definition Objekte der Form (( a, b), c), mit Klammern A × ( B × C ) erhält man Objekte der Form ( a, (b, c)). Es ist aber naheliegend, diese miteinander zu identifizieren und mit ( a, b, c) zu bezeichnen. Damit ist A1 × A2 × · · · × An = {( a1 , a2 , . . . , an )| a1 ∈ A1 , a2 ∈ A2 , . . . , an ∈ An }. Objekte wie ( a1 , a2 , . . . , an ) bezeichnet man als n-Tupel. Paare sind also 2-Tupel. Aufgabe 1.15. Seien A und B Mengen. Beweise A × B = ∅ ⇔ A = ∅ ∨ B = ∅! Aufgabe 1.16. Sei A eine Menge mit n Elementen und B eine Menge mit m Elementen. Wie viele Elemente hat A × B? Begründe! Wir schließen diesen Abschnitt mit einer sehr umfangreichen Aufgabe ab, die nicht vollständig bearbeitet werden muss, aber unser Gefühl für alles bisher definierte noch einmal stärkt. Aufgabe 1.17. Wir alle kennen aus der Schule das Distributivgesetz der Multiplikation und Addition reller Zahlen: Für a, b, c ∈ R gilt a · (b + c) = a · b + a · c. Für welche der bis jetzt definierten Mengenoperationen gelten auch Distributivgesetze? Wenn Distributivgesetze gelten, gib sie an! Ebenso wissen wir, dass die Addition reller Zahlen monoton ist, das heißt, für Zahlen a, b, α, β ∈ R gilt a ≤ α ∧ b ≤ β ⇒ a + b ≤ α + β. Welche der bis jetzt definierten Mengenoperationen sind monoton (wobei man natürlich „≤“ mit „⊆“ ersetzen muss)? Du kannst dir, wenn du unsicher bist, mit Venn-Diagrammen helfen. 1.6 Gewitterwolken am Horizont Wir schließen dieses Kapitel mit einem Ausflug in die Geschichte der Mathematik und Philosophie ab. Um die Jahrhundertwende zum letzten Jahrhundert gab es Bestrebungen, die Mathematik auf ein axiomatisches Fundament zu setzen, das heißt, sich eine handvoll Axiome genannte Aussagen festzulegen, die Alle anerkennen, und auf die alle anderen wahren Aussagen mittels Schlussregeln (Logik) zurückgeführt – bewiesen – werden sollen. Man hatte den schon von Leibniz stammenden Wunsch, dann einfach zu sagen, dass wahre Aussagen schlicht die beweisbaren Aussagen sind. Leibniz fasste diese Idee in dem Wort „calculemus!“ (lateinisch für „Rechnen wir!“) zusammen; er stellte sich also eine Rechenvorschrift (oder sogar eine Maschine?) vor, die für eine gegebene Frage in endlicher Zeit die Antwort mittels der Logik aus den Axiomen herleitet. Bei den Bestrebungen zur Axiomatisierung der Mathematik fiel die Wahl, in welcher Sprache die Axiome formuliert werden sollen, zumeist auf die der Mengenlehre oder der Logik. Besonders hervorzuheben sind hier die Bemühungen der Göttinger Mathematiker um David Hilbert, die einen großen Teil der damals existierenden Mathematik auf verschiedene Axiomensysteme der Mengenlehre zurückführten (die zum Teil 12 in leicht abgeänderter Form noch heute in Gebrauch sind, z.B. die Zermelo-FraenkelAxiome) und auf der Seite der Logik die revolutionäre Begriffsschrift von Gottlob Frege. Das Problem aller dieser Bemühungen war (und ist), dass unser intuitiver Begriff einer Menge viele Paradoxa ermöglicht, deren berühmtestes zweifelsohne die Russel’sche Antinomie (nach Bertrand Russel, der sie 1903 publizierte) ist. Wir formulieren die Idee von Russel einmal als Frage: Enthält die Menge aller Mengen, die sich nicht selbst enthalten, sich selbst? Das ist vielleicht noch ein wenig zu stark formuliert, um es auf Anhieb zu verstehen, deswegen nähern wir uns schrittweise: 1. Eine Menge, so wie wir sie definiert haben, kann Mengen als Elemente enthalten, zum Beispiel auch sich selbst. 2. Wir können Mengen über Aussagen definieren, zum Beispiel ist { M| M ist eine Menge mit zwei Elementen} eine Menge, nämlich die Menge aller zweielementigen Mengen. 3. Sei nun R die Menge aller Mengen, die sich nicht selbst enthalten, also R : = { M | M 6 ∈ M }. Jetzt kommt das Problem: Angenommen R ∈ R. Dann muss nach Definition R 6∈ R sein, weil R nur die Mengen enthält, die sich nicht selbst enthalten. Angenommen R 6∈ R. Dann muss nach Definition von R aber R ∈ R gelten. Damit defR kann man die Frage, ob R sich selbst enthält, nicht beantworten. R ∈ R ⇔ R ∈ {M | M ∈ / M} ⇔ R ∈ { x | x ∈ / x } ⇔ R ∈ { x | A( x )} ⇔ A( R) ⇔ R ∈ / R, wobei A( x ) := x ∈ / x definiert wird. Bevor weiter über die Implikationen der Russel’schen Antinomie reden, wollen wir noch eine andere, sehr bekannte und nicht ganz ernsthafte Formulierung ansehen, um die Idee noch besser zu verstehen: Der Barbier von Sevilla ist der Mann in Sevilla, der alle Sevillaner, die sich nicht selbst rasieren, rasiert. Rasiert er sich selbst? Wenn er sich selbst rasiert, gehört er zu den Männern, die nicht vom Barbier rasiert werden, rasiert sich also nicht selbst. Wenn er sich selbst aber nicht rasiert, wird er vom Barbier rasiert, aber er ist ja der Barbier, also rasiert er sich selbst. Es ist offensichtlich, dass Russels Entdeckung ein vernichtender Schlag für die Bemühungen, die Mathematik vollständig auf die so genannte naive Mengenlehre, die wir hier auch betrachtet haben, zurückzuführen, war. Eine Wissenschaft, die solche Paradoxa schon in ihren Grundlagen enthält, will man aus verständlichen Gründen nicht haben. Das Problem unserer naiven Mengenlehre und Logik, das der Russelschen Antinomie zugrunde liegt, ist folgendes: Wenn wir den Individuenbereich von Quantoren nicht einschränken, also einfach alles erlauben, können wir Konstruktionen wie die 13 Menge aller Mengen, die sich nicht selbst enthalten nicht vermeiden. Wie aber soll man die Individuenbereiche sinnvoll einschränken, um einerseits Paradoxa wie die Russel’sche Antinomie auszuschließen und andererseits noch eine Theorie zu erhalten, die halbwegs aussagekräftig ist? Eine Möglichkeit hat Russel selbst angegeben, indem er jeder Menge einen Typ zuordet: Mengen im hier definierten Sinne werden dabei als Klassen bezeichnet. Alle Mengen vom ersten Typ enthalten nur Urelemente (Elemente der Klasse { X |@Y : Y ∈ X }), Mengen des zweiten Typs enthalten nur Mengen des ersten Typs, Mengen des dritten Typs nur Mengen des zweiten Typs und so weiter. Damit werden Ausdrücke wie M ∈ M und M 6∈ M, die man für die Russel’sche Antinomie braucht, von vorne herein ausgeschlossen. Eine ähnliche (wenn auch wesentlich kompliziertere) Typentheorie liegt den berühmten Principia Mathematica, einem dreibändigen Werk von Russel und Alfred North Whitehead, das den wohl umfangreichsten Versuch darstellt, alle (grundlegenden) mathematischen Wahrheiten aus einem Satz von Axiomen und Schlussregeln herzuleiten, zugrunde. Der Leibniz’sche Traum vom „calculemus!“ schien gerettet. Schließlich vollständig zerstört wurde der Traum erst 1931 von Kurt Gödel mit seinem ersten Unvollständigkeitssatz. Er zeigte, dass die Begriffe der Wahrheit und Beweisbarkeit nicht vereinbar sind. Genauer bewies er folgenden Satz: Jedes hinreichend mächtige, rekursiv aufzählbare formale System ist entweder widersprüchlich oder unvollständig. Was bedeutet das? • Gödel versteht unter eine Aussage eine Kette von Zeichen, die einer bestimmten Syntax, das heißt bestimmten Bildungsregeln, genügen müssen. Für Aussagen definiert man auf irgendeine Weise einen Begriff der Wahrheit in Bezug auf ein Modell, das heißt etwas, von dem man sich vorstellt, das es von den Aussagen beschrieben wird. • Ein formales System besteht aus einer Sprache, also der Menge der erlaubten Aussagen, Axiomen, also Aussagen, die man als wahr kennt, und Schlussregeln, also (rein syntaktischen) Regeln, wie man aus bekannten wahren Aussagen neue wahre Aussagen herleiten (also beweisen) kann. • Dass das System rekursiv aufzählbar ist, ist eine technische Vorausetzung, die fordert, dass es einen Algorithmus gibt, der alle Ausdrücke des Systems aufzählt. (Dieser Algorithmus läuft natürlich potentiell unendlich lange, wenn es unendlich viele Ausdrücke gibt) • Das System ist hinreichend mächtig, wenn es zum Beispiel die natürlichen Zahlen {1, 2, 3, . . .} mit ihrer Addition und Multiplikation beschreiben kann. • Das System heißt widersprüchlich, wenn es eine Aussage gibt, die in ihm beweisbar ist, und deren Negation ebenfalls beweisbar ist. 14 • Das System heißt vollständig, wenn für jede Aussage gilt, dass sie oder ihre Negation beweisbar ist. Damit ist jeder Versuch, eine Maschine zu bauen die alles Beweisen kann, von vorne herein zum Scheitern verurteilt: entweder, man hat eine Mathematik, die wiedersprüchlich ist oder es gibt wahre Aussagen, die man nicht beweisen kann. Tatsächlich verwendet man heutzutage fast überall in der Mathematik die naive Mengenlehre und dort, wo es wirklich darauf ankommt, beruft man sich meist auf eine Version der Zermelo-Fraenkel-Mengenlehre oder die etwas allgemeinere NeumannBernays-Gödel-Mengenlehre oder noch allgemeinere Ackermann-Mengenlehre. Von diesen Mengenlehren weiß man, dass sie widerspruchsfrei sind, also gibt es mit dem Gödel’schen Unvollstängikeitssatz in jedem Fall unbeweisbare Aussagen. Genaueres zu den Gödel’schen Unvollständigkeitssätzen kann man in Dirk Hoffmanns Buch Die Gödel’schen Unvollständigkeitssätze sehr verdaulich aufbereitet lesen. Vorlesungen zu diesen Themen wie „Theoretische Informatik“oder „Formale Systeme“aus der Informatik Fakultät könnt ihr auch als Nebenfach Informatik besuchen. 15 2 Relationen und Funktionen 2.1 Was ist eine Relation? Wir haben alle eine Vorstellung davon, was eine Relation sein sollte: Etwas, das wir verwenden, um Beziehungen zwischen Objekten darstellen zu können. Folgendes Bild stellt zum Beispiel die Beziehungen zwischen den Hauptfiguren von Mozarts Oper „Così fan tutte“ dar, dabei bedeutet ein Pfeil mit einem „♥“, dass die Figur, von der der Pfeil ausgeht, die andere Figur liebt, eine Verbindung mit einem „K“, dass die Figuren Komplizen sind, und eine Verbindung mit einem „=“, dass die Figuren in Wirklichkeit ein und die selbe Person sind. = „Albanier“ 1 ♥ Ferrando K „Arzt“ = Despina Dorabella ♥ ♥ K ♥ ♥ K Guglielmo Fiordiligi ♥ = „Albanier“ 2 Abbildung 2.1: Beziehungen zwischen Figuren in „Così fan tutte“ Unser Begriff einer Relation kann die gerichteten Beziehungen (also hier die Pfeile mit Herzchen) formalisieren. Definition 2.1 (Relation). Eine Relation R zwischen zwei Mengen A und B ist eine Teilmenge des kartesischen Produktes A × B also R ⊆ A × B. Für ( a, b) ∈ R schreibt man manchmal auch aRb und sagt „a steht in Relation zu b“, wenn keine Missvertändnisse zu befürchten sind. Notation und Sprechweise sollen 16 also auch andeuten, dass etwas in einer Beziehung steht. Ein Beispiel für die Notation ist die uns allen bekannte Relation „≤“ auf den reellen Zahlen: Wir schreiben a ≤ b, wenn wir ( a, b) ∈≤ meinen. Da die Elemente des kartesichen Produktes A × B Paare – also geordnet – sind können wir die Richtung der Beziehung darstellen. In der Situation unseres einführenden Beispiels bezeichne A die Menge der Figuren in „Così fan tutte“. Dann ist die LiebesRelation die Menge ♥ = (Ferrando, Dorabella), (Guglielmo, Fiordiligi), (Dorabella, Ferrando), (Fiordiligi, Guglielmo), (Dorabella, „Albanier“ 2), (Fiordiligi, „Albanier“ 1) ⊆ A × A. Aufgabe 2.1. Wie könnte man die ungerichteten Beziehungen (Komplizenschaft und Identität) aus unserem Beispiel mengenmäßig definieren? Aufgabe 2.2. Man könnte auch meinen, dass die drei Komplizen Ferrando, Guglielmo und Despina in einer Beziehung stehen, zu der drei Menschen gehören und nicht in drei „Paarbeziehungen“. Wie könnte man so eine mehrstellige Relation modellieren? 2.2 Was ist eine Funktion? Die mengentheoretische Definition des Funktionenbegriffs war einer der großen Schritte auf dem Weg zu unserem heutigen Mathematikverständnis. Noch Ende des neunzehnten Jahrhunderts verstand man unter einer Funktion im Wesentlichen – pointiert formuliert – „Irgendetwas, für das man zu gegebenen Argumenten Werte ausrechnen kann“. Definition 2.2 (Funktion). Seien A und B Mengen. Eine Funktion oder Abbildung f von A nach B, geschrieben f : A → B ist eine spezielle Relation f ⊆ A × B, sodass es 1. (linkstotal) h∀ a ∈ A : ( a, b) ∈ f i und 2. ((rechts-) eindeutig) ∀ a ∈ A ∀b, d ∈ B : ( a, b) ∈ R ∧ ( a, d) ∈ R ⇒ b = d Für ( a, b) ∈ f schreibt man f ( a) = b. Die Menge A nennt man auch den Definitionsbereich von f und B den Wertebereich von f . Zur Sprechweise: Man sagt, f bilde a ∈ A auf f ( a) ∈ B ab. Wie passt unser intuitiver Funktionsbegriff zu dieser Definition? Wir wollen, dass wir für jedes Element a des Definitionsbereiches A ein Element des Wertebereiches bekommen; das ist die Forderung 1 unserer Definition. Ferner wollen wir, dass eine Funktion eindeutig in dem Sinne ist, dass jedem Argument a ∈ A auch nur ein (eindeutig bestimmter) Funktionswert f ( a) ∈ B zugeordnet wird; das ist die Forderung 2. 17 Für viele Menschen ist zum Beispiel der Ausdruck x2 eine Funktion. Für uns Mathematiker ist hingegen zum Beispiel f :R→R x 7→ f ( x ) = x2 eine Funktion. Zu einer Funktion gehören: 1. ein Definitionsbereich (A in der Definition) 2. ein Wertebereich (B in der Definition. Der Wertebereich ist hier also einfach nur die Menge, in die f abbildet und kann daher echt größer als die Menge der Funktionswerte, die f annimmt sein!) 3. eine Angabe der Zuordnung von Elementen des Definitionsbereichs zu Elementen des Wertebereichs. Diese Zuordnung kann folgendermaßen angegeben werden: a) direkt: Für eine Funktion f mit einem Definitionsbereich, der nur endlich viele Elemente hat, kann man jede einzelne Zuordnung einzeln angeben. Ist zum Beispiel A = {1, 2, 3} und B = { a, b, c, d, e}, kann man f folgendermaßen schreiben: f :A→B 1 7→ d, 2 7→ d, 3 7→ a Zur direkten Angabe von Funktionen kann man auch eine Wertetabelle verwenden, in obigem Beispiel wäre das x f (x) 1 d 2 d 3 a . b) durch eine Zuordnungsvorschrift wie f : R → {0, 1} ( 0, falls x ≥ 0 x 7→ 1, sonst oder eben f :R→R x 7→ x2 . 18 Definition 2.3 (Verkettung von Funktionen). Für Mengen A, B und C und Funktionen f : A → B und g : B → C heißt die Funktion (g ◦ f ) : A → C a 7→ ( g ◦ f )( a) := g( f ( a)), gesprochen „g nach f “ oder „g Kringel f “, die Verkettung von f mit g. Eine der wichtigsten Fragen, die sich der kampferporbte Mathematiker nach jeder Definition stellt, ist die nach der so genannten Wohldefiniertheit. Das kann vielerlei bedeuten, hier ist die Frage: Kann man g auf f ( a) anwenden? Die Antwort ist natürlich „ja“, weil f ( a) ∈ B und damit f ( a) im Definitionsberech von g liegt. Wir schließen jetzt einen ganzen Block Definitionen an, die uns dann am Ende des Abschnittes viel Stoff zur Diskussion in Aufgaben bieten: Definition 2.4 (Umkehrfunktion). Sei f : A → B eine Funktion. Falls es eine Funktion g : B → A gibt, sodass ( g ◦ f )( a) = a für alle a ∈ A und ( f ◦ g)(b) = b für alle b ∈ B, dann nennt man die Funktion g die Umkehrfunktion oder Inverse von f und bezeichnet sie mit f −1 . Äquivalente Definition: Sei die Umkehrrelation R−1 einer Relation R definiert durch R−1 := {(b, a) | ( a, b) ∈ R}. Zu einer Funktion f ist somit immer die Umkehrrelation f −1 definiert. Falls f −1 auch wiederum eine Funktion ist, dann ist die Umkehrfunktion durch die Umkehrrelation definiert. ( f −1 := f −1 ) (Beachte doppeldeutige Bezeichnung) Definition 2.5 (Bildmenge, Urbildmenge). Sei f : A → B eine Funktion. Für à ⊆ A definieren wir die Bildmenge (auch das Bild) von à unter f durch f [ Ã] := {b ∈ B|∃ a ∈ à : f ( a) = b}. Für b ∈ B definieren wir die Urbildmenge (auch das Urbild) von b unter f durch f −1 (b) := { a ∈ A | f ( a) = b}. Ebenso definieren wir für B̃ ⊆ B die Urbildmenge (auch das Urbild) von B̃ unter f durch f −1 [ B̃] := { a ∈ A | f ( a) ∈ B̃}. Obige Definition ist ein Beispiel für etwas, das in der mathematischen Notation oft vorkommt: Auch wenn f und f −1 eigentlich Symbole sind, die Funktionen bezeichnen, die auf Elemente von A beziehungsweise B angewendet werden und Elemente von B beziehungsweise A als Funktionswerte annehmen, verwenden wir sie auch, um Funktionen P( A) → P( B) oder B → P( A) oder P( B) → P( A) zu bezeichnen. Wir tun das aber in einer so naheligenden Weise, dass wohl kaum Missverständnisse zu befürchten sind. Trotz Allem ist es aber stets empfehlenswert, im Zweifel noch einmal genau aufzuschreiben, was man mit seiner Notation meint, denn mathematische Notation ist ein Kommunikationsmittel! Definition 2.6 (Einschränkung von Funktionen). Sei f : A → B eine Funktion und seien à ⊆ A und B̃ ⊆ B. Dann bezeichnen 1. f | à die Einschränkung von f auf Ã, die definiert ist als die Funktion f | à : à → B mit f | à ( a) = f ( a) für alle a ∈ Ã. 19 2. falls f ( A) ⊆ B̃, bezeichnet f | B̃ die Einschränkung von f auf B̃, die definiert ist als die Funktion f | B̃ : A → B̃ mit f | B̃ ( a) = f ( a) für alle a ∈ Ã. 3. falls f ( Ã) ⊆ B̃, bezeichnet f | B̃à die Einschränkung von f auf à und B̃, die definiert ist als die Funktion f | B̃à : à → B̃ mit f | B̃à ( a) = f ( a) für alle a ∈ Ã. Eine Bemerkung ist hier angebracht: Formulierungen wie „die Funktion f | à : à → B mit f | à ( a) = f ( a) für alle a ∈ Ó müssen uns sofort auffallen, denn hier ist eine Behauptung versteckt, nämlich die, dass es genau eine solche Funktion gibt! An solchen Stellen ist man als Leser aufgefordert, zu überprüfen, dass die Behauptung stimmt. Das wollen wir hier einmal am Beispiel der ersten der obigen drei Definitionen tun. Dazu überlegen wir uns zuerst, dass es überhaupt eine solche Funktion gibt. Wenn f eine Funktion von A nach B ist, dann gilt insbesondere für jedes a ∈ Ã, dass es genau ein b ∈ B mit f ( a) = b gibt, da aber f à ( a) = f ( a) für jedes a ∈ A gilt, haben wir damit Forderung 1 aus Definition 2.2 (Funktion) überprüft. Genauso können wir auch die zweite Forderung überprüfen. Damit gibt es mindestens eine Funktion f | à : à → B mit f | à ( a) = f ( a) für alle a ∈ Ã. Um einzusehen, dass es auch höchstens eine solche Funktion gibt, nehmen wir an, es gebe eine weitere Funktion g : à → B mit g( a) = f ( a) für alle a ∈ Ã. Dann gilt für alle a ∈ Ã, dass g( a) = f ( a) = f | à ( a) und damit sind die Funktionen g und f | à als Teilmengen des kartesischen Produktes Ã × B gleich. Da unsere Mengenlehre extensional ist, können wir g und f | à also nicht als Mengen unterscheiden, daher gilt g = f | à Definition 2.7 (einige algebraische Eigenschaften von Funktionen). Sei f : A → B eine Funktion und gelte A ⊇ B. 1. f heißt die Identität, falls f ( x ) = x für alle x ∈ A. Man bezeichnet die Identität mit id oder auch mit id A , wenn man den Definitionsbereich (der in diesem Fall mit dem Wertebereich übereinstimmt) betonen will. 2. f heißt idempotent, falls f ◦ f = f ist, d. h. f ( f ( x )) = f ( x ) für alle x ∈ A 3. f heißt eine Involution, falls f ◦ f = id ist, also f ( f ( x )) = x für alle x ∈ A 4. f hat einen Fixpunkt in a ∈ A, falls f ( a) = a gilt. Für allgemeinen Definitions- und Wertebereich A und B definieren wir noch: 5. f heißt konstant, falls ∃b ∈ B∀ a ∈ A : f ( a) = b Aufgabe 2.3. Seien f : A → B und g : B → C Funktionen. Zeige, dass g ◦ f konstant ist, wenn mindestens eine der Funktionen f und g konstant ist! Gilt die Umkehrung auch, das heißt: Folgt aus der Konstanz von g ◦ f schon, dass mindestens eine der Funktionen f und g konstant ist? Begründe! Aufgabe 2.4. Sei f : A → B eine Funktion und gebe es eine Funktion g : B → A mit g ◦ f = id A . Gib ein Beispiel dafür an, dass f dann noch keine Umkehrfunktion haben muss! 20 Aufgabe 2.5. Gib ein Beispiel für eine Funktion f : A → A an, wobei A eine beliebige Menge ist, sodass f eine Involution, aber nicht die Identität ist! Gib auch ein Beispiel einer idempotenten Funktion, die nicht die Identität ist! Aufgabe 2.6. Sei f : A → A eine Funktion, die eine Umkehrfunktion f −1 und einen Fixpunkt a ∈ A hat. Hat f −1 dann auch einen Fixpunkt und wenn ja, welchen? Begründe! Aufgabe 2.7. Sei f : A → B eine Funktion und à ⊆ A. Zeige, dass dann f | à = f ∩ ( Ã × B) ist! (Dabei betrachten wir die Funktion f ganz streng im Sinne von Definition 2.2 als Menge von Paaren.) Die folgende Aufgabe ist wieder sehr umfangreich, muss also nicht vollständig bearbeitet werden: Aufgabe 2.8. Welche der bislang definierten Mengenoperationen „vertragen sich“ mit der Bildmenge oder der Urbildmenge? Genauer: Seien f : A → B eine Funktion, M, N ⊆ A und O, P ⊆ B. Gelten zum Beispiel f ( M ∩ N ) = f ( M) ∩ f ( N ) oder f −1 (O \ P) = f −1 (O) \ f −1 ( P)? Überlege dir, welche ähnlichen Ausdrücke (also mit anderen Mengenoperationen) gelten! Sind Bildmenge und Urbildmenge monoton, d.h. gilt für eine beliebige Funktion f : A → B, M, N ⊆ A und O, P ⊆ B mit M ⊆ N und O ⊆ P, dass f ( A) ⊆ B und f −1 (O) ⊆ f −1 ( P)? 2.3 besondere Arten von Relationen Das Konzept der Raleation ist so allgemein, dass man manche Relationen, die besonders schöne Eigenschaften haben, gesondert betrachten will, um etwas stärkere Aussagen machen zu können. Wenn man dann mit einer Relation mit einer (oder mehererer) dieser Eigenschaften zu tun hat, kann man sofort auf einen ganzen Schatz an „vorgefertigten“ Aussagen zurückgreifen. Definition 2.8 (reflexiv, transitiv, symmetrisch, antisymmetrisch). Eine Relation R ⊆ A × A heißt 1. reflexiv, falls für alle a ∈ A gilt, dass ( a, a) ∈ R 2. transitiv, falls für alle a, b, c ∈ A gilt, dass ( a, b) ∈ R ∧ (b, c) ∈ R ⇒ ( a, c) ∈ R 3. symmetrisch, falls für alle ( a, b) ∈ R gilt, dass auch (b, a) ∈ R 4. antisymmetrisch, falls für alle ( a, b) ∈ R gilt, dass, wenn (b, a) ∈ R ist, schon a = b gelten muss. Wir wollen uns innehalten und überlegen, ob diese Namen tatsächlich sinnvoll sind (das ist auch eine der Sachen, die man immer machen sollte, wenn man eine Definition sieht. Oft kann man in der Mathematik aus dem Namen schon viel über eine Sache lernen – sei es auch nur, dass der Name schlecht gewählt ist). Reflexivität, Transitivität und Symmetrie sind gut nachzuvollziehen. Das Wort „antisymmetrisch“ tut so, als sei es das Gegenteil von „symmetrisch“. Das tatsächlich nicht der Fall: 21 Aufgabe 2.9. Sei R ⊆ A × A eine Relation. Beweise, dass R nicht antisymmetrisch sein muss, wenn wenn R nicht symmetrisch ist und umgekehrt. Folgende Augfabe ist recht umfangreich, muss also nicht unbedingt übertrieben detailreich bearbeitet werden. Es kommt auf die Intuition an! Aufgabe 2.10. Seien R, S ⊆ A × A Relationen. Wie vertragen sich die oben definierten Eigenschaften mit der Vereinigung und dem Durchschnitt? Das heißt: Wenn R und S zum Beispiel reflexiv/transitiv/symmetrisch/antisymmetrisch ist, sind R ∩ S und R ∪ S dann auch reflexiv/transitiv/symmetrisch/antisymmetrisch? Definition 2.9 (Ordnungsrelation). Eine Ordnungsrelation ist eine Relation die reflexiv, transitiv und antisymmetrisch ist. Ordnungsrelationen verallgemeinern das Konzept von „≤“, wie folgende Aufgabe zeigt: Aufgabe 2.11. Überlege dir, dass die Relation ≤ auf den reellen Zahlen eine Ordnungsrelation ist! Allerdings müssen nicht alle Ordnungsrelationen einen so einfachen linearen Charakter wie ≤ haben, wie folgende Aufgabe zeigt: Aufgabe 2.12. Vervollständige folgendes Bild indem du so vier Pfeilspitzen hinzufügst, dass die Menge R, die für jeden der Pfeile ein Paar ( a, b) aus seinem Anfangspunkt a und seinem Endpunkt b und auch noch für jedes a ∈ {1, 2, 3, 4, 5, 6} das Paar ( a, a) enthält, eine Ordnungsrelation wird! 2 1 3 6 5 4 Welches Prinzip fällt dir auf? (Welche Konfigurationen sind verboten)? Definition 2.10 (Äquivalenzrelation). Eine Äquivalenzrelation ist eine Relation, die reflexiv, transitiv und symmetrisch ist. 22 Ordnungsrelationen verallgemeinern das Konzept von „=“, wie folgende Aufgabe zeigt: Aufgabe 2.13. Überlege dir, dass die Relation = auf den reellen Zahlen eine Ordnungsrelation ist! Auch die Idee „( a ≤ b ∧ b ≤ a) ⇒ a = b“ überträgt sich auf Äquivalenzrelationen und Ordnungsrelationen: Aufgabe 2.14. Sei S ⊆ A × A eine Ordnungsrelation. Zeige, dass dann R := {( a, b) ∈ A : S( a, b) ∧ S(b, a)} eine Äquivalenzrelation ist. 2.4 surjektiv, injektiv, bijektiv Wir wollen nun noch zum Schluss die wichtigen Eindeutigkeitseigenschaften von Funktionen erklären. Definition 2.11 (surjektiv, injektiv, bijektiv). Sei f : A → B eine Funktion. Dann heißt f 1. surjektiv, falls es für jedes b ∈ B mindestens ein a ∈ A gibt, sodass f ( a) = b. 2. injektiv, falls es für jedes b ∈ B höchstens ein a ∈ A gibt, sodass f ( a) = b. 3. bijektiv, falls f sowohl surjektiv als auch injektiv ist. Wenn man die Injektivität einer Funtion f : A → B überprüfen will, kann man das natürlich an Hand der Definition tun. Es bietet gibt jedoch auch die Möglichkeit, zu überprüfen, ob für alle a1 , a2 ∈ A gilt, dass aus f ( a1 ) = f ( a2 ) schon folgt, dass a1 = a2 , denn diese Eigenschaft ist äquivalent zu Definition, wie folgende Überlegung zeigt: Sei f : A → B eine Funktion mit ∀ a1 , a2 ∈ A : ( f ( a1 ) = f ( a2 )) ⇒ ( a1 = a2 ). Sei b ∈ B. Dann gibt es entweder ein a ∈ A mit f ( a) = b oder nicht. Falls es keines gibt, ist die Definition für „ f ist injektiv“ erfüllt. Wenn es aber ein solches a und noch ein weiteres ã mit f ( a) = f ( ã) = b gibt, muss nach Voraussetzung a = ã sein und damit gibt es genau ein a ∈ A mit f ( a) = b; die Definition ist also auch dann erfüllt. Wenn andererseits f injektiv ist, dann folgt ∀ a1 , a2 ∈ A : ( f ( a1 ) = f ( a2 )) ⇒ ( a1 = a2 ) unmittelbar. Die Eigenschaften „injektiv“, „surjektiv“ und „bijektiv“ versteht man am Besten, wenn man sie viel benutzt, darum hier einen ganzen Block an Aufgaben dazu: Aufgabe 2.15. Welche der folgenden Funktionen sind surjektiv/injektiv/bijekiv? Begründe! 1. f : N → N; n 7→ n + 1 2. g : {1, 2, 3} → {1, 2}; n 7→ 1 3. h : R \ {0} → {−1, 1}; x 7→ x |x| 4. j : R → R; x 7→ x + 1 23 Aufgabe 2.16. Seien f : A → B und g : B → C Funktionen. Zeige, dass, falls g ◦ f injektiv ist, schon f injektiv sein muss! Zeige auch, dass, wenn g ◦ f surjektiv ist, schon g surjektiv sein muss! Auch in diesem Kapitel soll es wieder eine Knobelaufgabe geben: Aufgabe 2.17. Seien A und B Mengen mit m beziehungsweise n Elementen. Wie viele injektive/surjektive/bijektive Funktionen f : A → B gibt es? Aufgabe 2.18. Sei f : A → B eine Funktion. Zeige, dass f eine Umkehrfunktion hat, wenn f bijektiv ist! Du darfst dabei ohne Beweis verwenden, dass jede surjektive Funktion eine Rechtsinverse hat, das heißt dass es für jede surjektive Funktion g : X → Y eine Funktion h : Y → X mit g ◦ h = idY gibt. (Zum Beweis dieser Aussage benötigt man nämlich das sogenannte Auswahlaxiom, das wir noch nicht kennen) Zum Ende des Kapitels wollen wir noch einen kleinen Ausflug in die Mengenlehre unternehmen. Wir interessieren uns dafür, zu vergleichen, ob eine Menge A mehr Elemente hat als eine Menge B. Wenn beide Mengen nur endlich viele Elemente haben, ist die Lösung einfach: man zählt einfach die Elemente der beiden Mengen. Es gibt aber auch eine Möglichkeit, ohne Zählen festzustellen, welche der Mengen größer ist: Definition 2.12 (Mächtigkeit einer Menge). Seien A und B zwei Mengen. Dann sagen wir 1. A ist mindestens so mächtig wie B, geschrieben | A| ≥ | B|, wenn es eine surjektive Funktion f : A → B gibt. 2. A ist höchstens so mächtig wie B, geschrieben | A| ≤ | B|, wenn es eine injektive Funktion f : A → B gibt. 3. A ist (echt) mächtiger als B, geschrieben | A| > | B|, wenn A mindestens so mächtig wie B ist, aber B nicht auch mindestens so mächtig ist wie A. 4. A ist (echt) weniger mächtig als B, geschrieben | A| < | B|, falls B echt mächtiger als A ist. 5. A und B sind gleichmächig, geschrieben | A| = | B|, wenn es eine bijektive Funktion f : A → B gibt. Was ist die Idee hinter dieser Definition? Wenn man zum Beispiel einen Bus hat mit einer Anzahl Sitzen und eine andere Anzahl Menschen, die mit dem Bus fahren wollen, gibt es zwei Möglichkeiten, festzustellen, ob es gleich viele Sitze wie Menschen gibt: Entweder, man zählt oder man bittet alle, sich hinzusetzen. Wenn jemand stehenbleibt, gibt es weniger Sitze als Menschen, wenn ein Sitz leer bleibt, gibt es mehr Sitze als Menschen. Das Hinsetzenlassen kann man auch als Funktion von der Menge der Menschen in die Menge der Sitze verstehen: jedem Menschen wird ein Sitz zugeordnet. Wenn jeder seinen eigenen Sitz bekommen hat, ist die Funktion injektiv und es muss, wie schon bemerkt, mindestens so viele Sitze wie Menschen geben. Wenn sich mehrere Leute einen Sitz teilen müssen, ist die Funktion surjektiv und es gibt 24 höchstens so viele Sitze als Menschen. Wenn jeder genau einen Sitz bekommen hat und alle Sitze besetzt sind, ist die Funktion bijektiv und es gibt genau so viele Sitze wie Menschen. Was ist nun der Grund dafür, dass wir die Mächtigkeit von Mengen nicht einfach durch Zählen definieren? Der eine – systematische – Grund ist, dass wir eigentlich noch gar nicht wissen, was Zahlen sind. Der andere – viel spannendere – Grund ist, das sich unsere Definition auch auf Mengen mit unendlich vielen Elementen übertragen lässt. Wir können also auch entscheiden, ob zwei Mengen mit unendlich vielen Elementen gleich viele Elemente haben. Bevor wir mit einer Betrachtung dieser neuen Idee das Kapitel abschließen, noch zwei letzte Aufgaben: Aufgabe 2.19. Sei A eine Menge. Zeige, dass dann |P( A)| ≥ | A|. Aufgabe 2.20. Seien A und B Mengen, wobei A ⊆ B. Mache dir klar, das dann auch | A| ≤ | B |. Jetzt wird es spannend: Während die Aussage der letzten Aufgabe für endliche Mengen auch noch gilt, wenn man „⊆“ mit „(“ und „≤“ mit „<“ erstetzt, überträgt sich das nicht auf Mengen mit unendlich vielen Elementen. Betrachte dazu die Mengen N = {1, 2, 3, . . .} und N \ {1} = {2, 3, 4, . . .}. Dann ist die Funktion f : N → N \ {1}; n 7→ n + 1 bijektiv, also gilt |N| = |N \ {1}|, obwohl N ⊇ N \ {1}. Man könnte jetzt sagen das man das noch nicht verwunderlich findet, weil ja „∞ − 1 = ∞“ gilt (was auch immer das bedeutet). Ein ähnliches Beispiel, aber eine Spur schärfer liefert die uns allen bekannte Exponentialfunktion exp : R → (0, ∞); x 7→ e x (dabei bedeutet (0, ∞) die Menge { x ∈ R|0 < x < ∞}). Auch diese Funktion ist bijektiv, also hat die Menge der reellen Zahlen die gleiche Mächtigkeit wie die Menge der positiven reellen Zahlen. (In diesem Absatz haben wir zwei einfach zu überprüfende Behauptungen über die Funktionen f und exp gemacht, die nicht begründet wurden. Das ist in fast allen Texten über Mathematik üblich, um nicht unnötig lange Texte zu bekommen. In solchen Situationen ist man als Leser immer angehalten, jede der Behauptungen zu prüfen, wenn sie einem nicht unmittelbar klar ist.) Die gerade gezeigten Beispiele geben Anlass zu folgender Frage: Haben alle Mengen mit unendlich vielen Elementen die gleiche Mächtigkeit? Die verblüffende Antwort ist „nein“. Als Georg Cantor diese Tatsache als Erster feststellte, war das für viele Mathematiker seiner Zeit ein Grund, die Mengenlehre insgesamt als unnütz oder falsch abzulehnen. Es entsponn sich in den Jahren darauf ein Streit in der mathematischen Welt, der bisweilen mit religiösem Eifer geführt wurde. Auf der einen Seite standen die Formalisten um David Hilbert und die göttiger Mathematiker als Befürworter der Mengenlehre, auf der anderen Seite die Intuitionisten um Luitzen Egbertus Jan Brouwer oder auch Jules Henri Poincaré. Wir wollen uns einmal Cantors Argument anschauen, mit dem er man zeigen kann, dass |R| > |N|. Zunächst wissen wir aus Aufgabe 2.20, dass |R| ≥ |N|, weil N ⊆ R. Wir bemerken weiterhin, dass es, ebenfalls wegen Aufgabe 2.20, ausreicht, zu zeigen, dass |(0, 1)| > |N|, da (0, 1) := { x ∈ R|0 < x < 1} ⊆ R. Nun gehen wir vom Gegenteil 25 aus und nehmen an, es gebe eine surjektive Funktion f : N → (0, 1). Man kann diese Funktion als eine Aufzählung der reellen Zahlen in (0, 1) bezeichnen. Wenn eine solche Funktion existiert, können wir sie auch durch eine unendlich lange Wertetabelle angeben, ungefähr so: n 1 2 3 4 .. . f (n) 0, 0, 0, 0, .. . 1 1 5 3 .. . 4 2 5 1 .. . 6 3 5 4 .. . 0 1 5 1 .. . 0 2 5 5 .. . 0 3 5 9 .. . 0 1 5 2 .. . 0 2 5 6 .. . 0 3 5 5 .. . 0 1 5 3 .. . ... ... ... ... Leere Stellen am rechten Ende der Tabelle füllen wir dabei mit Nullen auf. Cantor zeigt nun, dass es zu viele reelle Zahlen zwischen 0 und 1 gibt, um sie selbst auf eine solche unendlich lange Liste zu schreiben. Dafür muss man nur zwei Sachen bemerken: 1. Da f nach Annahme surjektiv ist, gibt es für jede reelle Zahl x ∈ (0, 1) eine natürliche Zahl n mit f (n) = x. 2. Wir konstruieren nun eine Zahl c ∈ (0, 1), die nicht auf der Liste ist: Sie fängt mit „0,“ an und ihre erste Nachkommastelle ist eine beliebige Ziffer, die nicht die erste Nachkommastelle der ersten Zahl auf der Liste ist. Damit gilt c 6= f (1). Die zweite Nachkommastelle von c ist eine beliebige anere Ziffer als die zweite Nachkommastelle der zweiten Zahl auf der Liste, damit ist c 6= f (2). Allgemein ist die n-te Nachkommastelle von c stets unterschiedlich zu der n-ten Nachkommastelle von f (n) zu wählen, womit für alle n ∈ N gilt, dass c 6= f (n). Da aber nach unserer Konstruktion c ∈ (0, 1) ist, widersprechen sich Punkt 1 und Punkt 2, also kann es keine surjektive Funktion N → (0, 1) geben, also gibt es echt mehr reelle Zahlen als natürliche Zahlen: Unendlichkeit ist nicht gleich Unendlichkeit. Wir schließen, indem wir noch einmal Bezug zum Abschluss des letzten Kapitels nehmen: Dort hatten wir gesagt, dass es innerhalb unserer auf (zum Beispiel) der Zermelo-Fraenkel-Mengenlehre beruhenden Mathematik unbeweisbare Aussagen gibt. Eine dieser Aussagen ist die sogenannte Kontinuumsphypothese, die Cantor 1878 aufgestellt hat: Es gibt keine Menge, deren Mächtigkeit zwischen der Mächtigkeit der natürlichen Zahlen und der Mächtigkeit der reellen Zahlen liegt. Diese Aussage lässt sich mit den Zermelo-Fraenkel-Axiomen (mit dem Auswahlaxiom) nicht widerlegen, wie Gödel 1938 bewies. Paul Cohen bewies in den 1960er Jahren, dass sie sich ebenfalls nicht beweisen lässt. Wir können uns also in gewisser Weise „aussuchen“, ob wir eine Mathematik mit oder ohne Kontinuumshypothese haben wollen. 26 3 Beweistechniken 3.1 Was ist ein Beweis? Wir haben bereits viele Aufgaben der Form „Beweise, dass . . . “ bearbeitet. Es wird also höchste Zeit, dass wir uns mit dem Begriff des Beweises eingehender beschäftigen. Wir wollen uns dem Begriff von zweimal zwei jeweils gegensätzlichen Richtungen nähern: • Induktion vs. Deduktion: In einer klassischen, aristotelischen Wissenschaftstheorie funktioniert wissenschaftliche Wahrheitsfindung so, wie folgendes Bild darstellt: Theorie (allgemein) Deduktion Induktion Empirie (speziell) Abbildung 3.1: Induktion und Deduktion Das induktive Schließen ist also das „verallgemeinernde“ Schließen von einem Beispiel auf die zugrundeliegende Theorie: Ein Wissenschaftler macht also ein Experiment und erachtet dabei (hoffend, das das funktioniert) einige der Parameter seines Experimentes für unwichtig, um vom Ergebnis des Experiments abstrahierend einen Satz zu finden, den er für wahr erachtet. Ausgehend von einer Menge solcher Wahrheiten bedient er sich hingegen im deduktiven Teil seiner Wahrheitsfindung der Logik, um Vorhersagen über die Spezialfälle, die ihm in der Empirie begegnen, zu machen. (Diese Vorhersagen werden dann wieder überprüft und der Kreislauf aus Induktion und Deduktion beginnt erneut) Die Grundlage der Deduktion ist das Prinzip, dass, wenn alle Annahmen wahr und ihre Bedeutung klar und unzweideutig ist, auch alle mittels logischen Schließens aus ihnen gewonnenen Aussagen wahr sind. Es ist noch zu erwähnen, das dieses Modell der wissenschaftlichen Wahrheitsfindung nicht in allen (modernen) Schulen der Wissenschaftsphilosophie anerkannt ist. Insbesondere ist nach Karl Popper auch das Schließen von der Empirie auf die Theorie deduktiv, indem man den Wert von Experimenten in der Falsifikation von Theorien sieht. Damit sind alle Regeln des induktiven Schließens bestenfalls Hilfsmittel, um eine Theorie zu finden, die dann falsifiziert werden kann und da- 27 mit der ganze wissenschaftliche Erkenntnisprozess deduktiv. (Etwas ungeschliffen könnte man diesen Standpunkt mit „Experimente können nichts beweisen, sondern nur widerlegen“ zusammenfassen.) In der Mathematik will man (mindestens seit der Jahrhundertwende) ausgehend von Axiomen (also einer sehr kleinen Theorie im Sinne von Abbildung 3.1) rein deduktiv vorgehen. Ein Beweis im Sinne der Mathematik soll also nicht nur eine Aneinanderreihung plausibler Argumente sein sondern stets deduktiv – vom Allgemeinen auf das Spezielle, in jedem Schritt logisch begründbar. Argumente wie „Alle bislang beobachteten Schwäne weiß, also können wir davon ausgehen, dass alle Schwäne weiß sind“ sind in der Mathematik nicht erlaubt. Es ist eine philosophische Frage, ob die Mathematik streng betrachtet einen Gegenstand außer sich selbst hat, ob es also eine empirische Seite der Mathematik überhaupt gibt. • Intuition vs. Formalismus: Angenommen, wir haben eine Aussage A in einer Sprache L (zum Beispiel der Mathematik), die bewiesen werden soll. Der Beweis soll auch in der Sprache L formuliert werden. Was dann einen Beweis B von A ausmacht, ist ein Urteil U, das heißt eine Aussage in der so genannten metaSprache, die wir verwendet haben, um die Sprache L zu definieren. U soll gerade die Aussage „B ist ein gültiger Schluss.“ sein. Wenn U wahr ist, dann ist B ein gültiger Beweis, sonst nicht. Im Falle unsereres täglichen Mathematikgebrauchs kommt erschwerend hinzu, dass wir meist mathematische Begriffe und natürliche Sprache gemischt verwenden, sodass Sprache und meta-Sprache schwer voneinander zu trennen sind. Es sollte uns als Menschen schon möglich sein, U zu prüfen und einen Beweis als Beweis zu erkennen, wenn wir einen sehen; allerdings ist es wohl (bislang?) nicht möglich, in allen Fällen festzulegen, wann U wahr ist, sodass man diese Aufgabe einem Computer geben könnte. Wenn man hingegen einen vorgeblichen Beweis in einer klar umrissenen formalen Sprache hat, erwarten wir schon, dass auch ein Computer urteilen kann. Wenn wir aber die Sprache des Beweises ganz genau festlegen, also uns ein formales System aussuchen, sind wir wieder an die Aussage des Gödel’schen Unvollständigkeitssatzes gebunden und damit wird unser Begriff eines Beweises wieder nicht genau das tun, was wir von ihm erwarten. Es wird wahre Aussagen geben, die wir nicht formal beweisen können. Man kann also wieder einmal sagen, dass das Konzept der Wahrheit sich der Formalisierung entzieht, oder, anders ausgedrückt: Wenn wir annehmen, dass die alle Wahrheit, die wir in der Mathematik finden können, durch Beweise entsteht (das ist diskutabel!), ist es unmöglich, die Regeln, was ein Beweis sein soll, auf vollständig formalisierte Weise anzugeben, ohne das Wesentliche zu verlieren. Der letzte Punkt, den wir dieser Diskussion hinzufügen wollen ist Folgender: Im Wesentlichen ist Mathematik etwas, das Menschen machen, und Beweise dienen 28 der Kommunikation zwischen Menschen. Wenn man das Gefühl hat, etwas ist ein Beweis, ist es auch meistens einer. Wer gerne ein wenig die Welt der ganz formalen Beweise erkunden will, kann das zum Beispiel auf metamath.org tun. Folgende Aufgaben sollen Diskussionsstoff bieten: Aufgabe 3.1. Welche der folgenden Schlüsse sind induktiv, welche sind deduktiv? (Die Antwortmöglichkeiten sind diskutabel, es kommt auf die Begründung an!) 1. „Der Angeklagte war zum Tatzeitpunkt nicht am Tatort, also kann er nicht der Täter sein.“ 2. „Von einem repräsentativ ausgewählten Teil der Bevölkerung würden sich 58% Montag eine neue Digitalkamera kaufen, wenn Sonntag Bundestagswahl wäre. Wahlen heizen also die Nachfrage nach Digitalkameras an.“ 3. „Wenn es regnet, wird der Boden nass. Der Boden ist nicht nass, also hat es nicht geregnet.“ 4. „Ich habe mich auf eine Krankheit testen lassen und der Test ist negativ ausgefallen. Also bin ich nicht krank.“ 5. „Das Gravitationsgesetz und das Coulomb’sche Gesetz der Elektrostatik haben die gleiche mathematische Form. Deswegen können wir annehmen, dass die Elektronen sich auf elliptischen Bahnen um den Atomkern bewegen, so wie die Planeten um die Sonne.“ Aufgabe 3.2. Welche der folgenden in mathematischer und deutscher Sprache formulierten Aussagen sind meta-Aussagen (d.h. Aussagen über Mathematik), welche sind mathematische Aussagen? 1. Die Aussage A ⇒ B ist, bei gegebenen Axiomen S1 , S2 , . . ., beweisbar genau dann, wenn die Aussage B beweisbar ist, wenn man A, S1 , S2 , . . . als Axiome nimmt. (Deduktionstheorem) 2. Wenn die Kontinuumshypothese gilt, dann gibt es eine Zerlegung der Ebene in zwei Mengen A und B, wobei A höchstens durch die Menge der Ordinaten und B durch die der Abszissen abgezählt werden kann. (was auch immer das bedeutet) (Sierpiński 1919) 3. Die Kontinuumshypothese ist von den Axiomen der Zermelo-Fraenkel-Mengenlehre unabhängig. 4. Wir werden die Riemann’sche Vermutung vielleicht niemals beweisen. 29 3.2 Ein Bisschen Material – Geometrie Naturgemäß wollen wir uns in einem Kapitel über Beweise viele Beweise anschauen. Damit wir auch etwas Interessantes zum Beweisen haben, nehmen wir die ebene und räumliche Geometrie im Axiomensystem von David Hilbert als Gegenstand. Schon Euklid hat in seinen Elementen, die für viele Jahrhunderte der Standard für Beweistechniken schlechthin waren, eine Axiomatisierung der Geometrie gegeben. Insofern reihen wir uns hier in eine der ältesten Traditionen der Mathematik ein, wenn wir unsere Beweistechniken am Beispiel einer axiomatischen Geometrie studieren. Die Objekte unserer Geometrie sind Punkte, Geraden und Ebenen. Wir beueichnen die Menge der Punkte mit P , die Menge der Geraden mit G und die Menge der Ebenen mit E . Keiner dieser Begriffe wird definiert; stattdessen ergeben sich die Bedeutungen implizit aus den in den Axiomen festgelegten Beziehungen. Als strengem Formalisten war es Hilbert nur daran gelegen, die logische Struktur, die unsereren Gedanken über Geometrie zugrundeliegt, zu formulieren. Ob wir uns also tatsächlich die Punkte, Ebenen und Geraden des dreidimensionalen Raumes vorstellen oder die berühmten „Tische, Stühle und Bierseidel“, wird für unsere Übelegungen bedeutungslos sein. Trotzdem werden wir, mit jeder geometrischen Aussage, die wir aus den Axiomen beweisen, in einer gewissen Weise die Veranschaulichung mittels der gewohnten Geometrie immer weiter „rechtfertigen“, weil wir feststellen werden, dass die Begriffe sich tatsächlich so verhalten, wie wir es erwarten. Hilbert fasste seine Axiome in fünf Gruppen zusammen. Wir wollen aber nur die Axiome der ersten zwei Gruppen (in leicht veränderter Form) betrachten. Die erste Gruppe enthält die Axiome der Inzidenz. Implizit definieren sie Begriffe wie „liegen auf“, „verbinden“, . . . , die heutzutage mit dem allgemeineren Wort der Inzidenz zusammengefasst werden. Dieser Begriff verallgemeinert Konzepte wie „Punkt liegt auf Gerade“ oder „Gerade liegt auf Ebene“. Die Inzidenzrelation I ⊆ (P ∪ G ∪ E ) × (P ∪ G ∪ E ) ist eine Relation auf der Menge aller Punkte, Ebenen und Geraden. Sie ist per Definition symmetrisch, das heißt für „Punkt liegt auf Gerade“ können wir „Punkt inzidiert mit Gerade“ oder „Gerade inzidiert mit Punkt“ sagen. Um Schreibarbeit zu sparen, bezeichnen wir ab jetzt Punkte stets mit Großbuchstaben, Geraden stets mit Kleinbuchstaben und Ebenen mit kleinen griechischen Buchstaben. Bei Aussagen mit Quantoren ist, wenn nichts dabeisteht, der Individuenbereich stets H. Die Axiome der Gruppe I beschreiben Eigenschaften der Inzidenzrelation I. Wir schreiben sie einmal formal logisch auf, einmal in einer natürlichsprachlichen Version, die wir auch meist verwenden werden, wenn keine Missverständnisse zu befürchten sind. I.1 ∀ P, Q : P 6= Q ⇒ (∃!g : PIg ∧ QIg) – Für zwei verschiedene Punkte P und Q gibt es eine genau eine Gerade g, die durch P und Q geht. I.2 ∀ g, P, Q : gIP ∧ gIQ ⇒ (@h : h 6= g ∧ hIP ∧ hIQ) – Für jede Gerade g und je zwei Punkte P und Q auf g ist g die einzige Gerade, die durch P und Q geht. I.3 ∀ g∃ P, Q : gIP ∧ gIQ ∧ p 6= q – Auf jeder Geraden liegen mindestens zwei ver- 30 schiedene Punkte. Ferner ∀ε∃ P, Q, R∀ g : εIP ∧ εIQ ∧ εIR ∧ P 6= Q ∧ Q 6= R ∧ R 6= P ∧ ( gIP ∧ gIQ ⇒6 ( gIR)) – Auf jeder Ebene liegen mindestens drei nicht in einer Geraden gelegene, verschiedene Punkte. I.4 ∀ P, Q, R : P 6= Q ∧ Q 6= R ∧ R 6= P ∧ (@ g : gIP ∧ gIQ ∧ gIR) ⇒ (∃!ε : εIP ∧ εIQ ∧ εIR) – Für drei verschiedene Punkte P, Q und R, die nicht auf einer Geraden liegen, gibt es genau eine Ebene ε, auf der P, Q und R liegen. I.5 ∀ε, P, Q, R : εIP ∧ εIQ ∧ εIR ∧ (@ g : gIP ∧ gIQ ∧ gIR) ⇒ (@δ : δ 6= ε ∧ δIP ∧ δIQ ∧ δIR) – Für jede Ebene ε und je drei Punkte P, Q und R auf ε, die nicht auf einer Geraden liegen, ist ε die einzige Ebene, auf der P, Q und R liegen. I.6 ∀ P, Q, g, ε : PIg ∧ QIg ∧ εIg ⇒ (∀ R : RIg ⇒ RIε) – Wenn zwei Punkte P und Q einer Geraden g in einer Ebene ε liegen, liegt jeder Punkt auf g in ε. I.7 ∀ε, δ, P : PIε ∧ PIδ ⇒ (∃ Q : Q 6= P ∧ εIQ ∧ δIQ) – Wenn zwei Ebenen ε und δ einen Punkt P gemeinsam haben, gibt es noch einen weiteren Punkt, den sie gemeinsam haben. I.8 ∃ P, ε : ¬( PIε) – Es gibt eine Ebene und einen Punkt, der nicht auf dieser Ebene liegt. Aufgabe 3.3. Axiom I.8 ist ein typisches Beispiel einer Reichhaltigkeitsforderung. Wozu brauchen wir es? Aufgabe 3.4. Ist die Inzidenzrelation transitiv? Begründe! 3.3 Direkter Beweis Mit den Axiomen der Gruppe I haben wir schon einmal etwas Stoff, um über Beweise zu reden. Sehen wir uns also einen Satz und seinen Beweis an: Satz 3.1. Seien zwei Ebenen gegeben, die einen Punkt gemeinsam haben. Dann stimmen entweder die Ebenen überein oder es gibt eine Gerade, auf der alle ihre gemeinsamen Punkte liegen. Beweis. Seien ε und δ zwei Ebenen, die einen Punkt P gemeinsam haben. Nach Axiom I.7 gibt es noch einen weiteren Punkt Q, den ε und δ gemeinsam haben. Durch P und Q verläuft nach Axiom I.1 genau eine Gerade g. Sei R ein weiterer Punkt, den ε und δ gemeinsam haben. Wenn R nicht auf g liegt, gibt es nach Axiom I.4 genau eine Ebene, die P, Q und R enthält, also muss dann δ = ε sein. Dieser Beweis hat sozusagen die Urform aller Beweise: Man will eine Implikation A ⇒ B beweisen und tut das, indem man jede Implikation in der Kette A ⇒ H1 ⇒ H2 ⇒ · · · ⇒ B zeigt. Beachte, dass jeder Satz des Beweises eine Formulierung wie „nach Axiom . . . “ enthält. Der deduktive Charakter mathematischer Beweise wird also auch sprachlich deutlich, leider oft auf Kosten einer abwechslungsreichen Sprache. 31 Aufgabe 3.5. Schreibe einen direkten Beweis für folgende Aussage: „Es gibt mindestens drei verschiedene Geraden.“ Aufgabe 3.6. Schreibe einen direkten Beweis für folgende Ausssage: „Seien f , g und h drei Geraden und A, B, C drei Punkte, sodass A auf f und g liegt, B auf g und h liegt und C auf h und f liegt. Falls dann A = B ist und C 6= A, stimmen schon alle drei Geraden überein.“ Aufgabe 3.7. Zum Beispiel der erste Teil von Aufgabe 1.9, die Aufgaben 1.11, 1.12, 2.6, 2.14, 2.16, 2.18 und 2.19 lassen sich gut mit direkten Beweisen lösen. Hier kannst du üben, einen direkten Beweis zu schreiben. 3.4 Widerspruchsbeweis Sehen wir noch einen Satz und seinen Beweis an. Wir nennen den Satz aber nicht einen Satz, sondern ein Lemma, weil er eher den Charakter einer Hilfsaussage hat. Wo man die Grenze zwischen einem Lemma und einem Satz zieht, ist nicht ganz klar und im Wesentlichen eine Geschmacksfrage. Lemmata (oder Lemmas) dienen im Wesentlichen zwei Zwecken: erstens möchte man vielleicht eine Hilfsaussage „abkapseln“, um sie wiederverwenden zu können, andererseits kann man durch die Verwendung von Lemmata einen großen, unübersichtlichen Beweis in kleine, verdauliche Teile zerlegen. Lemma 3.2. Für jede Gerade gibt es einen Punkt, der nicht auf der Geraden liegt. Beweis. Angenommen, es gebe eine Gerade g, sodass alle Punkte auf g liegen. Nach Axiom I.8 gibt es eine Ebene ε und einen Punkt P, der nicht auf ε liegt. Nach Axiom I.3 gibt es drei verschiedene Punkte R, S, T, die auf ε liegen. Nach unserer Annahme liegen alle der Punkte P, Q, R, S auf g. Axiom I.6 muss damit insbesondere P auf ε liegen, das ist ein Widerspruch. Also muss unsere Annahme falsch sein und damit gibt es für jede Gerade g einen Punkt, der nicht auf g liegt. Die Strategie des Widerspruchsbeweises ist es, wenn eine Aussage A zu beweise ist, zu zeigen, dass ¬ A eine falsche Aussage ist. In unserem Beispiel ist A die Aussage „Für jede Gerade gibt es einen Punkt, der nicht auf der Geraden liegt“. Nach Aufgabe 1.7 ist die Negation von A gerade: „Es gibt eine Gerade, auf der alle Punkte liegen“. Diese Aussage widerlegen wir im Beweis, indem wir zeigen, dass sie den Axiomen widerspricht. Die dem zugrundeliegende logische Tatsache ist, dass, wenn S1 , . . . , Sn wahr sind (also die Axiome), der Wahrheitswert von S1 ∧ · · · ∧ Sn ∧ A gerade der Wahrheitswert von A ist. Aufgabe 3.8. Seien ε und δ zwei verschiedene Ebenen, die einen Punkt gemeinsam haben. Dann wissen wir aus Satz 3.1, dass es eine Gerade g gibt, die alle gemeinsamen Punkte von ε und δ enthält. Schreibe einen Widerspruchsbeweis für die folgende Aussage: „Alle Punkte von g liegen in ε und δ.“ Aufgabe 3.9. Schreibe einen Widerspruchsbeweis dafür, √ dass die Wurzel aus 2 irrational ist, d.h. dafür, dass es keine ganzen Zahlen p und q mit 2 = p/q gibt. 32 Aufgabe 3.10. Zum Beispiel die Aufgaben 2.18, 2.19 (das ist nicht ganz einfach, aber nett) und 2.20 lassen sich gut mit Widerspruchsbeweisen lösen. Hier kannst du üben, einen Widerspruchsbeweis zu schreiben. 3.5 Beweis durch Kontraposition Sehen wir uns noch einen Satz mit seinem Beweis an: Satz 3.3. Je zwei voneinander verschiedene Geraden schneiden sich in höchstens einem Punkt. Beweis. Seien h und g zwei Geraden. Wir zeigen, dass, wenn es zwei Punkte P und Q gibt, die beide sowohl auf g als auch auf h liegen, g und h übereinstimmen: Nach Axiom I.1 gibt es genau eine Gerade i, die durch P und Q geht. Nach Axiom I.2 ist i die einzige Gerade, die durch P und Q geht. Da P und Q auch auf g liegen, stimmen nach Axiom I.2 g und i überein. Mit selbigem Argument stimmen auch h und i überein. Damit folgt h = i = g. Diese Art, Beweise zu formulieren, nennt man Beweis durch Kontraposition. Man will eine Implikation A ⇒ B beweisen (hier: Aus der Vierschiedenheit zweier Geraden folgt, dass sie höchstens einen Punkt gemeinsam haben). Da aber, wie wir uns in Aufgabe 1.2 überlegt haben, A ⇒ B und ¬ B ⇒ ¬ A äquivalent sind, beweist man einfach die zweite Aussage (hier: aus der Tatsache, dass es mindestens zwei Punkte gibt, die sowohl auf g als auch auf h liegen, folgt, dass g und h übereinstimmen). Aufgabe 3.11. Formuliere den Beweis von Satz 3.3 in einen direkten Beweis um. Aufgabe 3.12. Zum Beispiel die Aufgaben 1.9, 2.3 und 2.20 lassen sich gut mit Kontrapositionsbeweisen lösen. Hier kannst du üben, einen Kontrapositionsbeweis zu schreiben. 3.6 Beweis durch Fallunterscheidung Sehen wir uns noch einen Satz mit seinem Beweis an: Satz 3.4. Wenn sich zwei Geraden schneiden, liegen alle ihre Punkte in einer Ebene. Beweis. Seien g und h zwei Geraden, die sich in einem Punkt P schneiden. Nach Satz 3.3 gilt dann entweder h = g oder es gibt keinen weiteren Schnittpunkt von h und g. Betrachten wir beide Fälle einzeln: • Falls h = g dann gibt es nach Axiom I.3 noch mindestens einen weiteren Punkt Q auf der Geraden g. Nach Lemma 3.2 gibt es noch einen weiteren Punkt R, der nicht auf g liegt. Nach Axiom I.4 gibt es also eine Ebene ε, die die Punkte P, Q und R enthält. Nach Axiom I.6 liegen auch alle Punkte von g in ε, also ist in diesem Falle die behauptung gezeigt. 33 • Sei nun g 6= h und P der einzige Schnittpunkt von h und g. Dann gibt es nach Axiom I.3 noch einen weiteren Punkt Q auf g und einen weiteren Punkt R auf h. Weiters liegt nach Axiom I.2 wegen g 6= h der Punkt R nicht auf g und ist damit insbesondere verschieden von Q. Damit sagt Axiom I.4 wieder, dass es eine Ebene ε gibt, die P, Q und R enthält. Nach Axiom I.6 liegen ferner alle Punkte von h und alle Punkte von g in ε, also ist auch in diesem Fall die Behauptung gezeigt. Beweise wie den gerade abgeschlossenen nennt man Beweis durch Fallunterscheidung. Man will eine Implikation A ⇒ B zeigen (hier: Daraus, dass sich zwei Geraden schneiden, folgt, dass alle ihre Punkte in einer Ebene liegen). Dieses Problem zerlegt man folgendermaßen in Teilprobleme: Vielleicht gibt es Aussagen H1 , H2 , sodass die Implikationen A ∧ Hi ⇒ B leichter zu beweisen sind (hier: H1 ist die Aussage „g = h“ und H2 die Aussage „g 6= h und P ist der einzige Schnittpunkt von g und h“). Wenn H1 ∨ H2 eine wahre Aussage ist (hier wurde das von Satz 3.3 bewiesen), folgt aus der Wahrheit aller Implikationen A ∧ Hi ⇒ B die Implikation A ⇒ B: Aufgabe 3.13. Überlege dir, dass aus der Wahrheit von H1 ∨ H2 und A ∧ H1 ⇒ B und A ∧ H1 ⇒ B folgt, dass A ⇒ B gilt! Du kannst zum Beispiel die Ergebnisse von Aufgabe 1.2 und die De Morgan’schen Regeln benutzen oder eine Wahrheitstafel. Aufgabe 3.14. Zum Beispiel die Aufgabe 2.17 lässt sich gut mit Beweis durch Fallunterscheidung lösen. Hier kannst du üben, einen Beweis durch Fallunterscheidung zu schreiben. 3.7 Mehr Geometrie Die Axiome der Gruppe II definieren implizit den Begriff zwischen als Beziehung dreier Punkte. Formal werden Eigenschaften einer dreistelligen Relation Z := {( A, B, C ) ∈ {Menge der Punkte}| B liegt zwischen A und C } beschrieben. Wir notieren ( A, B, C ) ∈ Z durch A[ B]C. II.1 Seien A, B und C Punkte. Falls B zwischen A und C liegt, liegt B auch zwischen C und A. Ferner existiert dann eine Gerade g, auf der alle drei Punkte liegen. II.2 Zu zwei verschiedenen Punkten A und C gibt es stets wenigstens einen weiteren Punkt B, der zwischen A und C liegt, und wenigstens einen weiteren Punkt D, so dass C zwischen A und D liegt. II.3 Von drei Punkten auf einer Geraden gibt es höchstens einen, der zwischen den anderen liegt. Definition 3.5 (Strecke). Für zwei Punkte A und B ist die Strecke AB die Menge der Punkte, die zwischen A und B liegen. 34 II.4 Seien A, B und C drei Punkte, die nicht auf einer Geraden liegen und g eine Gerade in der Ebene, die A, B und C enthält, die keinen der Punkte A, B und C trifft. Wenn dann g einen Punkt der Strecke AB trifft, trifft g auch einen Punkt der Strecke BC oder einen Punkt der Strecke CA. Dieses Axiom ist auch als Satz von Pasch bekannt und das erste der Axiome, die bei Euklid noch nicht auftauchen. Euklid und seine Schüler erachteten solcherlei für offensichtlich, auch wenn es nicht aus den anderen Axiomen folgte. Es stellt sich aber heraus, dass, wenn man eine Geometrie haben will die sich wie erwartet verhält und in der man nicht sagen will, dass irgendetwas offensichtlich sei, man den Satz von Pasch oder eine andere, vor dem Hintergrund der anderen Axiome äquivalente Aussage benötigt. Aufgabe 3.15. Formuliere das Axiom II.4 in natürlicher Sprache und veranschauliche es dir mit einem Bild. 3.8 Äquivalenzen Satz 3.6. Seien g und h zwei Geraden. Dann sind folgende Aussagen äquivalent: 1. g und h schneiden einander. 2. Für jeden Punkt A auf g gibt es einen Punkt B auf h und einen Punkt C auf g, sodass B zwischen A und C liegt. 3. Es gibt einen Punkt A auf g und einen Punkt B auf h und einen Punkt C auf g, sodass B zwischen A und C liegt. Beweis. „1⇒2“ Es schneiden sich die beiden Geraden g und h im Punkt B. Sei A ein beliebiger Punkt auf g. Da g und h sich in B schneiden, muss B auch auf g liegen. Nach Axiom II.2 gibt es einen Punkt C, sodass B zwischen A und C liegt. C muss nach Axiom II.1 auf g liegen. „2⇒3“ Gilt, weil es nach Axiom I.3 einen Punkt auf g gibt. („für alle“⇒„es gibt“!) „3⇒1“ Seien A, C ein Punkte auf g und B ein Punkt auf H, sodass A[ B]C. Dann liegt nach Axiom II.1 B auch auf g, also schneiden sich g und h in B. Aufgabe 3.16. Zeige, dass folgende Aussagen äquivalent sind: 1. Auf jeder Ebene liegen unendlich viele verschiedene Punkte. 2. Auf jeder Geraden liegen unendlich viele verschiedene Punkte. 3. Auf jeder Geraden liegen zwei verschiedene Punkte. 35 3.9 Beweis durch (Gegen-) Beispiel Beweise durch Beispiel eignen sich zum Beispiel, wenn man zeigen soll, dass etwas, dass bestimmte Eigenschaften hat, existiert. Wir haben viele solche Aufgaben schon bearbeitet. Auch kann man, wenn man eine Aussage über alle Elemente einer Menge widerlegen will, einfach ein Element der Menge angeben, für das die Aussage nicht gilt und hat damit einen Beweis durch Gegenbeispiel erbracht. Wir wollen jetzt einen großen Beweis durch Beispiel anfangen: Alle die Axiome und Aussagen, die wir bislang gesehen haben, treffen auf unsere erste anschauliche Vorstellung von Punkten, Ebenen und Geraden zu. Wir wollen in diesem Abschnitt beweisen, dass das Poincaré’sche Halbebenenmodell der hyperbolischen Ebene die Axiome, die wir bislang betrachtet haben, erfüllt. Damit werden wir einen typischen Beweis durch Beispiel erbringen, dass es eine Struktur gibt, die tatsächlich die von den Axiomen beschriebenen Eigenschaften hat. Weil wir uns aber auf eine ebene Geometrie beschränken wollen, ersetzen wir ein paar unserer Axiome durch schwächere Formulierungen, die alle Aussagen über unterschiedliche Ebenen ausschließen. Die Menge der Ebenen sei jetzt leer. Axiome mit „’“ treten dabei an Stelle der Versionen ohne „’“. Alle nicht aufgeführten Axiome bleiben unverändert. I.3’ Auf jeder Geraden liegen mindestens zwei verschiedene Punkte. I.8’ Es gibt eine Gerade und einen Punkt, der nicht auf der Geraden liegt. II.4’ Seien A, B und C drei Punkte, die nicht auf einer Geraden liegen und g eine Gerade, die keinen der Punkte A, B und C trifft. Wenn dann g einen Punkt der Strecke AB trifft, trifft g auch einen Punkt der Strecke BC oder einen Punkt der Strecke CA. Die Axiome I.4, I.5, I.6, und I.7 werden ersatzlos gestrichen. Folgende Aufgabe zeigt, dass wir uns mit dieser Veränderung eine Ebene aus unserer bislang betrachteten Geometrie „ausschneiden“, dass also „in jeder Ebene die Axiome I.1, I.2, I.3’, I.8’ gelten“. Eigentlich interessant (da nicht ganz so einfach wie die anderen) ist aber nur die Aussage über I.8’: Aufgabe 3.17. Zeige, dass es in jeder Ebene ε eine Gerade g und einen Punkt, der nicht auf g liegt, gibt. Definition 3.7 (Poincaré’sches Halbebenenmodell der hyperbolischen Ebene). Sei die Menge der Punkte definiert als die Punkte der bekannten x-y-Ebene mit positiver y-Koordinate: P := {( x, y) ∈ R × R|y > 0} Ferner sei die Menge der Geraden definiert als die Vereinigung der Menge der auf der x-Achse senkrecht stehenden Halbgeraden mit der Menge der Halbkreise mit Mittelpunkt auf der x- 36 Achse: G := {(ξ, η ) ∈ R × R|η > 0}ξ ∈ R ∪ 2 2 2 ∪ {(ξ, η ) ∈ R × R|(ξ − x ) + η = r ∧ η > 0} x ∈ R ∧ r > 0 Die Inzidenzrelation I ⊆ (P ∪ G) × (P ∪ G) sei definiert durch PIg :⇔ gIP :⇔ P ∈ g für alle P ∈ P und g ∈ G . Die „zwischen“-Relation sei definiert dadurch, dass A[ B]C, genau dann, wenn es eine Gerade g gibt, auf der A, B und C liegen und 1. falls g von der Form {( x, y) ∈ R2 |y > 0} ist, für die y-Koordinaten von A, B und C (bezeichnet mit y A , y B , yC ) gilt, dass y A ≤ y B ≤ yC oder yC ≤ y B ≤ y A . 2. falls g von der Form {( x, y) ∈ R2 |( x − m)2 + y2 = r2 ∧ y > 0} ist, für die yKoordinaten von A, B und C (bezeichnet mit x A , x B , xC ) gilt, dass x A ≤ x B ≤ xC oder xC ≤ x B ≤ x A . y .. . .. . x Abbildung 3.2: ein paar Punkte und Geraden im Poincaré’schen Halbebenenmodell der hyperbolischen Ebene Definition 3.8 (Dreieck). Für drei Punkte A, B und C bezeichnet ABC das Dreieck mit den Ecken A, B und C. Es ist definiert als die Menge der Punkte der Strecken AB, BC und CA. Diese Strecken heißen die Seiten des Dreiecks. Definition 3.9 (Parallele). Zwei Geraden heißen parallel, falls sie sich in keinem Punkt schneiden. Diese Aufgabe zeigt, dass die hyperbolische Ebene noch ein paar Eigenschaften hat, die wir von unserer Geometrie nicht gewöhnt sind: Aufgabe 3.18. Sei g eine Gerade der hyperbolischen Ebene und P einer ihrer Punkte. Wie viele Parallelen, die durch P verlaufen, hat g? Wir wollen die hyperbolischen Winkel als die Winkel, die man im Poincaré’schen Modell misst, verstehen (normalerweise macht man das nicht so!). Gib ein Beispiel eines (hyperbolischen) Dreiecks mit Innenwinkelsumme kleiner als π! (am Besten ohne zu rechnen!) 37 Diese Aufgabe ist sehr umfangreich, wiederholt viel vom Abiturstoff (über Schnittpunkte von Kreisen etc.) und wird uns nun den ganzen Rest des Abschnittes beschäftigen: Aufgabe 3.19. Zeige, dass das Poincaré’sche Halbebenenmodell der hyperbolischen Ebene die Axiome I.1, I.2, I.3’, I.8’, II.1, II.2, II.3 und II.4’ erfüllt. 38 4 Vollständige Induktion 4.1 Die Idee der vollständigen Induktion Die vollständigen Induktion ist ein Beweisverfahren für Aussagen über alle natürlichen Zahlen. Bevor wir beginnen, ein Haarspalter-Caveat: Im Sinne des Anfangs von Kapitel 3 ist der Name „vollständige Induktion“ falsch (sofern Namen überhaupt falsch sein können), denn es handelt sich um eine deduktive Art des Schließens. Eine der schönsten Erklärungen, was vollständige Induktion ist, kommt aus dem Buch The Art of Computer Programming von Donald Ervin Knuth. Wir übernehmen diese Erklärung hier direkt: Sei P(n) eine Aussage über die natürliche Zahl n; beispielsweise könnte P(n) „n mal (n + 3) ist eine gerade Zahl“ oder „falls n ≥ 10, dann ist 2n > n3 “ sein. Angenommen, wir wollen P(n) für alle n ∈ N beweisen. Eine wichtige Möglichkeit, das zu tun, ist 1. zu beweisen, dass P(1) wahr ist 2. zu beweisen, dass „wenn alle der Aussagen P(1), P(2), . . . , P(n) wahr sind, dann auch P(n) gilt“. Dieser Beweis sollte für jede natürliche Zahl n gelten. Als Beispiel betrachten wir folgende Folge von Gleichungen: 1 = 12 , 1 + 3 = 22 , 1 + 3 + 5 = 32 , 1 + 3 + 5 + 7 = 42 , 1 + 3 + 5 + 7 + 9 = 52 . Man kann die allgemeine Eigenschaft als 1 + 3 + · · · + (2n − 1) = n2 schreiben. Diese Gleichung sei nun mit P(n) bezeichnet; wir wollen beweisen, dass P(n) für alle n ∈ N wahr ist. Wenn wir uns an die Vorgehensweise oben halten, haben wir: 1. „P(1) ist wahr, weil 1 = 12 .“ 2. „Wenn alle Aussagen P(1), P(2), . . . , P(n) wahr sind, ist insbesondere P(n) wahr; indem wir darin zu beiden Seiten 2n + 1 addieren, erhalten wir 1 + 3 + · · · + (2n − 1) + (2n + 1) = n2 + 2n + 1 = (n + 1)2 , was beweist, dass P(n + 1) ebenfalls stimmt“ 39 Wir können diese Methode als algorithmische Beweismethode auffassen. Tatsächlich druckt der folgende Algorithmus einen Beweis von P(n) für jedes n ∈ N, angenommen, man hat Punkte 1 und 2 ausgetüftelt: Schritt 1 Setze k = 1 und, drucke den Beweis aus Punkt 1. Schritt 2 Falls k = n, beende den Algorithmus; der geforderte Beweis ist ausgedruckt. Schritt 3 Entsprechend Punkt 2 drucke einen Beweis, dass „wenn P(1), P(2), . . . , P(k ) wahr sind, auch P(k + 1) wahr ist“. Drucke auch „Wir haben schon bewiesen, dass P(1), P(2), . . . , P(k ) wahr sind, also ist P(k + 1) wahr“. Schritt 4 Erhöhe k um 1 und fahre bei Schritt 2 fort. Da dieser Algorithmus offensichtlich für jedes gegebene n ∈ N einen Beweis für P(n) druckt, ist diese Beweistechnik logisch zulässig. Diese Technik des Beweisens, nur die Punkt 1 und 2 zu beweisen, nennt man Beweis durch vollständige Induktion, Punkt 1 nennt man den Induktionsanfang und Punkt 2 den Induktionssschritt. Die Variable n, die im Induktionsschrit auftaucht, nennt man Induktionsvairable. Im Induktionsschritt wird die Induktionsvoraussetzung, hier „P(1), P(2), . . . , P(n) sind wahr“, verwendet. Ein Hinweis zur Schreibweise für Summen und Produkte: Für einen Term T (i ) der von i abhängt, und m, n ∈ N mit m ≤ n bedeutet n ∑ T ( i ) = T ( m ) + T ( m + 1) + T ( m + 2) + · · · + T ( n − 2) + T ( n − 1) + T ( n ) i =m und n ∏ T ( i ) = T ( m ) · T ( m + 1) · T ( m + 2) · · · T ( n − 2) · T ( n − 1) · T ( n ). i =m Sehen wir uns nun einmal an, wie man einen Induktionsbeweis formal richtig aufschreibt: Satz 4.1. Es gilt für alle n ∈ N, dass n ∑i i =1 3 = n ( n + 1) 2 2 . Beweis. Wir beweisen die Behauptung durch vollständige Induktion nach n. Induktionsanfang (n = 1): Es gilt ∑1i=1 i3 = 13 = 1 = ((1(1 + 1))/2)2 . 2 n ( n +1) Induktionsvoraussetzung: Gelte für ein n ∈ N, dass ∑in=1 i3 = . 2 40 Induktionsschritt: Für n wie in der Induktionsvoraussetzung gilt n +1 n i =1 i =1 ∑ i 3 = ∑ i 3 + ( n + 1)3 2 n ( n + 1) + ( n + 1)3 2 (n2 + 4(n + 1))(n + 1)2 n2 ( n + 1)2 + 4( n + 1)3 = = 4 4 2 2 2 ( n + 2) ( n + 1) (n + 1)(n + 2) = = 4 2 Induktionsvoraussetzung = und damit gilt die Behauptung auch für n + 1. Induktionsbeweise muss (und kann!) man üben, darum einmal einen ganzen Block an Übungen: Aufgabe 4.1. Beweise mit vollständiger Induktion, dass ∑in=1 i = 21 n(n + 1) für alle n ∈ N! Kennzeichne dabei Induktionsanfang, Induktionshypothese und Induktionsschritt! Aufgabe 4.2. Beweise mit vollständiger Induktion, dass für q 6= 1 und alle n ∈ N die Formel n ∑ qk = k =0 1 − q n +1 1−q gilt. (Partialsumme der geometrischen Reihe) Aufgabe 4.3. Beweise mit vollständiger Induktion, dass für a1 , a2 , . . . , an > 0 mit ∏nk=1 ak = 1 gilt, dass ∑nk=1 ak ≥ 1. Folgere die Ungleichung vom geometrischen und arithmetischen Mittel: Es gilt für alle x1 , x2 , . . . , xn > 0 s n 1 n n ∏ xk ≤ n ∑ xk . k =1 k =1 Aufgabe 4.4. Für welche n ∈ N gilt 2n ≥ n2 ? Stelle eine Vermutung auf und beweise sie mit vollständiger Induktion. Aufgabe 4.5. Folgende Aufgabe ist aus dem Buch The Art of Computer Programming von Donald Knuth: Etwas kann am folgenden Beweis nicht stimmen. Was ist es? „Satz. Sei a > 0. Dann gilt für jedes n ∈ N, dass an−1 = 1. Beweis. Sei a > 0. Induktionsanfang: Für n = 1 gilt an−1 = a0 = 1. Induktionshypothese: Gelte für ein n ∈ N, dass ak−1 = 1 für alle k ∈ N mit k ≤ n. Induktionsschritt: Sei n wie in der Induktionshypothese. Dann gilt a n −1 · a n −1 1·1 a(n+1)−1 = an = (n−1)−1 = = 1. 1 a Also gilt die Behauptung auch für n + 1.“ 41 Aufgabe 4.6. Angenommen, es gibt 3- und 5-Taler-Münzen. Beweise mit vollständiger Induktion, dass man jede Rechnung von mehr als 7 Talern bezahlen kann, ohne Wechselgeld zu kriegen! (Wir nehmen an, dass man nur runde Beträge bezahlen muss, es also keine halben Taler gibt.) Die nächste Aufgabe enthält Teilaufgaben unterschiedlichen Schwierigkeitsgrades: Aufgabe 4.7. Die Fibonacci-Zahlen (nach Leonardo Bonacci, bekannt als Fibonacci) sind eine Zahlenfolge, definiert ist durch f 0 := 0, f 1 := 1 und für alle n ≥ 2 durch f n := f n−1 + f n−2 . Eine solche Definition nennt man eine induktive Definition. Die ersten Glieder der Folge sind also 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, . . .. Beweise folgende Eigenschaften der FibonacciZahlen durch vollständige Induktion: 1. Für alle n ≥ 0 gilt ∑in=0 f i = f n+2 − 1. 2. Für alle n ≥ 0 und m ≥ 1 gilt f m+n = f n+1 f m + f n f m−1 . Tip: Mache den Induktionsanfang für m = 1 und m = 2. 3. Für alle n ≥ 1 gilt f n+1 f n−1 − f n2 = (−1)n (Identität von Cassini, nach Giovanni Domenico Cassini). Was at diese Formel mit folgendem Bilderrätsel zu tun? ? 4. Für alle n ≥ 3 ist f 2n−1 die Länge der Hypotenuse eines rechtwinkligen Dreiecks mit ganzzahligen Seitenlängen. (Erinnerung: Die Hypotenuse eines rechtwinkligen Dreiecks ist die Seite, die dem rechten Winkel gegenüberliegt. Sie ist die längste der Seiten des Dreiecks. Die anderen Seiten heißen Katheten. In jedem rechtwinkligen Dreieck gilt der Satz des Pythagoras: a2 + b2 = c2 , wobei a und b die Längen der Katheten und c die Länge der Hypotenuse bezeichnen. Diesen Satz darfst du ohne Beweis verwenden.) Aufgabe 4.8. Quicksort ist ein Algorithmus zum Sortieren von Listen. Die Arbeitsweise des Algorithmus wird von folgendem Pseudocode illustiert. Dabei ist liste die zu sortierende Liste. Die Funktion concat(l1,l2) nimmt zwei Listen l1 und l2 und fügt sie zur Liste, die zuerst die Elemente von l1 und dann die Elemente von l2 enthält, zusammen. Die Funktion 42 append(l,a) nimmt eine Liste l und hängt das Element a an. Die Funktion createlist(l) legt eine leere Liste mit Namen l an. Die Funktion laenge(l) gibt an, wie viele Elemente die Liste l hat. Der Befehl return gibt den den Wert des ihm folgenden Ausdruckes zurück. function quicksort(liste) falls laenge(liste) > 1 e:= irgendein Element von liste createlist(links) createlist(rechts) für alle a in liste falls e < a append(links,a) sonst append(rechts,a) ende ende return concat(quicksort(links),quicksort(rechts)) sonst return liste ende ende Beweise durch Induktion nach n, dass der Algorithmus eine Liste mit n verschiedenen (d.h. für je zwei ist eines immer strikt größer) Elementen aufsteigend sortiert! Wir haben jetzt schon viele Induktionsbeweise durchgeführt, ohne uns systematische gedanken zu machen, warum wir überhaupt so argumentieren dürfen. Die Tatsache, auf der Beweise mittels vollständiger Indukion beruhen, dass man mit der Idee „von einer Zahl zu ihrem Nachfolger gehen“ alle natürlichen Zahlen erreicht, ist für unser Gefühl selbstverständlich. Tatsächlich ist es aber eine Eigenschaft, die wir fordern müssen, wenn wir die natürlichen Zahlen definieren. Darum ist der nächste Abschnitt einem axiomatischen Zuganz zu den natürlichen Zahlen gewidmet, der „nachträglich“ rechtfertigt, was wir hier getan haben. 4.2 Natürliche Zahlen – die Peano-Axiome Wer Zahlen mag, ist bislang in diesem Brückenkurs ein wenig kurz gekommen. Jetzt fangen wir an, ernsthaft über Zahlen zu reden. Dies sind die berühmten PeanoAxiome der natürlichen Zahlen, welche die Menge N der natürlichen Zahlen und ihre Eigenschaften festlegen: P1 0 ∈ N P2 ∀n ∈ N : Sn ∈ N P3 ∀n ∈ N : Sn 6= 0 43 P4 ∀m, n : Sn = Sm ⇒ m = n P5 0 ∈ X ∧ (∀n ∈ N : n ∈ X ⇒ Sn ∈ X ) ⇒ X ⊇ N Wenn wir Sn als „Nachfolger von n“ lesen, können wir obige Axiome folgendermaßen verstehen: P1 0 ist eine natürliche Zahl. („0“ ist hier erst einmal nur ein Symbol und hat nichts mit der uns bekannten Zahl zu tun; wie im letzten Kapitel sollen unsere Axiome nur die Struktur der natürlichen Zahlen einfangen. Bedeutungen ergeben sich auch hier implizit) P2 Jede natürliche Zahl n hat einen Nachfolger Sn, der auch eine natürliche Zahl ist. P3 0 ist kein Nachfolger einer natürlichen Zahl P4 Enthält die Menge X die 0 und für jede natürliche Zahl auch ihren Nachfolger, dann enthält X schon alle natürlichen Zahlen Das letzte Axiom heißt auch Induktionsaxiom. Wir werden sehen, dass es die Grundlage für die Beweismethode der vollständigen Induktion bildet. Achtung: hier fangen die natürlichen Zahlen mit Null an! Folgende Aufgabe illustriert, wozu wir Axiom P3 brauchen. Aufgabe 4.9. Zeige, dass die Menge Ñ := {0, 1, 2} mit S0 = 1,S1 := 2, und S2 := 0 alle der Peano-Axiome außer P3 erfüllt. Definition 4.2 (Addition und Multiplikation). Wir definieren die Funktionen ·, + : N × N → N durch n + 0 :=n n + Sm :=S(n + m) n · 0 : =0 n · Sm :=(n · m) + n für alle n, m ∈ N. Obige Definition ist ein Beispiel dessen, was man eine rekursive oder induktive Definition nennt. Die Möglichkeit, solche Definitionen aufschreiben zu können, macht den Umgang mit den natürlichen Zahlen so schön. Weil nämlich die Menge {0, S0, SS0, SSS0, SSSS0, . . .} nach Axiom P5 alle natürlichen Zahlen enthält, wissen wir mit den Informationen, die uns die Definition gibt, schon für alle natürlichen Zahlen m, n, was m + n und m · n bedeuten. Wir definieren 1 := S0 und nennen 1 Eins. Aufgabe 4.10. Beweise Sn = n + 1 für alle n ∈ N. 44 Mit dieser Aufgabe haben wir jetzt die Berechtigung erworben, Ausagen über natürliche Zahlen so mit vollständiger Induktion zu beweisen, wie wir es im ersten Abschnitt des Kapitels vorgestellt haben. Wir können die Menge {0, S0, SS0, SSS0, SSSS0, . . .} jetzt nämlich als {0, 1, 1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . .} schreiben und wissen immer noch wegen Axiom P5, dass sie alle natürlichen Zahlen enthält. Natürlich wollen wir von nun an nicht alle natürlichen Zahlen als 1 + 1 + 1 + · · · + 1 schreiben. Deswegen wollen wir ab jetzt die natürliche Zahl SSS | {z. . . S} 0 n mal mit dem gewohnten Symbol, nämlich der bekannten Zahl n, bezeichnen, also zum Beispiel SSSSS0 mit 5. Für uns sind diese Zeichen ab jetzt aber immer im Sinne der Peano-Axiome zu verstehen und alle Eigenschaften der natürlichen Zahlen, die wir verwenden wollen, müssen aus den Axiomen hergeleitet werden! Aufgrund der induktiven Natur der natürlichen Zahlen werden wir fast alle Beweise von Eigenschaften natürlicher Zahlen Induktionsbeweise sein, so auch der des folgenden Satzes, indem sogar ein Induktionsbeweis in einem anderen verschachtelt ist: Satz 4.3 (Kommutativgesetz für die Addition). Es gilt das Kommutativgesetz der Addition natürlicher Zahlen, d.h. für m, n ∈ N gilt m + n = n + m. Beweis. Wir gehen in drei Schritten vor: 1. Es gilt m + 0 = 0 + m für alle natürlichen Zahlen m. Wir zeigen diese Behauptung durch vollständige Induktion: Induktionsanfang (m = 0): Es gilt 0 + 0 = 0 + 0. Induktionshypothese: Es gebe ein m ∈ N mit m + 0 = 0 + m. Induktionsschritt: Dann gilt Sm + 0 Definition von + = Definition von + = Induktionsvoraussetzung = Definition von + = Sm S ( m + 0) S (0 + m ) 0 + Sm. 2. Es gilt m + Sn = Sm + n für alle natürlichen Zahlen m und n. Wir zeigen die Behauptung durch vollständige Induktion nach n: Induktionsanfang (n = 0): m + S0 Definition von + = Definition von + = Definition von + = 45 S ( m + 0) Sm Sm + 0 Induktionshypothese: Es gebe n ∈ N mit m + Sn = Sm + n für alle m ∈ N. Induktionsschritt: Dann gilt m + SSn Definition von + = Induktionsvoraussetzung = Definition von + = S(m + Sn) S(Sm + n) Sm + Sn. 3. Für m, n ∈ N gilt m + n = n + m. Wir zeigen die Behauptung durch vollständige Induktion nach m: Induktionsanfang m = 0: Siehe Schritt 1. Induktionshypothese: Es gebe ein m ∈ N mit m + n = n + m für alle n ∈ N. Induktionsschritt: Dann gilt n + Sm Definition von + = Induktionsvoraussetzung = Definition von + = S(n + m) S(m + n) m + Sn Schritt 2 = Sm + n Die folgende Aufgabe ist nicht so streng formal wie die anderen. Tatsächlich vermischt sie absichtlich unsere intuitive Vorstellung von den natürlichen Zahlen mit den axiomatisch definierten natürlichen Zahlen. Das Distributivgesetz kann man natürlich auch ohne solcherlei ungenaues Terrain zu betreten beweisen. Die Aufgabe sollte am Besten an der Tafel gelöst werden, damit sie Diskussionsstoff bietet. Aufgabe 4.11. Beweise mit vollständiger Induktion, dass für alle n, m ∈ N m·n = 0+m | +m+ {z· · · + m} n-mal gilt. Folgere daraus, dass für alle m, n, o ∈ N das Distributivgesetz m · (n + o ) = m · n + m · o der Addition und Multiplikation gilt. Welche Probleme siehst du mit dieser Vorgehensweise? Aufgabe 4.12. Beweise mit vollständiger Induktion das Kommutativgesetz der Multiplikation, d.h. m · n = n · m für alle m, n ∈ N. Du wirst vermutlich viele der bisher bewiesenen Eigenschaften der natürlichen Zahlen benötigen. Du darfst auch das Distributivgesetz verwenden. Begründe jeden deiner Schritte mit einer zuvor bewiesenen Eigenschaft oder einem der Axiome P1-P5! 46 5 Algebra In diesem Kapitel wollen wir die Betrachtungen rund um die Frage „Was sind Zahlen?“, die wir im letzten Kapitel angefangen haben, fortsetzen. Nur soll unser Fokus nun eher auf den Eigenschaften der Rechenoperationen als den Zahlen selbst liegen. Diesen Teil der Mathematik nennt man Algebra. Sie beschäftigt sich mit algebraischen Strukturen; in diesem Kapitel wollen wir zwei algebraische Strukturen kennenlernen: Gruppen und Körper. 5.1 Gruppen Eine Bewegung ist eine Funktion f : R2 → R2 , die Länge beibehält, Stauchen und Strecken sind also verboten. Für eine gegebene geometrische Figure in der Ebene ist eine Symmetrie dieser Figur eine Bewegung, nach der die Figur gleich aussieht. Betrache ein gleichseitiges Dreieck ABC in der Ebene. Dann muss eine Symmetrie des Dreiecks jede Ecke des Dreiecks auf eine Ecke abbilden; um das ewinzusehen, nehme man an, f sei eine Symmetrie von ABC und ABC habe Seitenlänge 1. Dann müssen f ( A), f ( B) und f (C ) Ecken sein, weil die Entfernungen zwischen den Punkten 1 sein müssen und die größte Entfernung, die zwei Punkte von ABC haben können, gerade 1 ist, die von je zwei Ecken angenommen wird. Wir wollen die Symmetrien aufschreiben, indem wir angeben, wohin die Punkte A, B, C abgebildet werden. Beispielsweise bezeichne ( ACB) die Symmetrie, die A fest lässt und B und C vertauscht. Sie ist gerade die Spiegelung an der Geraden, die durch A und den Mittelpunkt der Strecke BC geht. Es gibt noch zwei weitere solche Spiegelungen, nämlich ( BAC ) und (CBA). Ferner gibt es noch zwei Drehungen, nämlich ( BCA) und (CAB) und die „triviale“ Symmetrie ( ABC ). Die spannende Beobachtung ist nun, dass man mit diesen Symmetrien „rechnen“ kann, wenn man die Menge {( ABC ), ( BCA), (CAB), ( ACB), ( BAC ), (CBA)} mit der Hintereinanderausführung von Funktionen als Rechenoperation betrachtet. Das Konzept, eine Menge mit einer Rechenoperation auszustatten, ist die Idee der Definition, was eine Gruppe sein soll: Definition 5.1. Ein Paar ( G, ∗) aus einer Menge G und einer Funktion ∗ : G × G → G; ( a, b) 7→ a ∗ b, heißt eine Gruppe, falls 1. ein Assoziativgesetz gilt, das heißt, falls für alle a, b, c ∈ G gilt, dass ( a ∗ b) ∗ c = a ∗ ( b ∗ c ). 2. es ein neutrales Element gibt, das heißt, falls es e ∈ G gibt, sodass für alle a ∈ G gilt, dass e ∗ a = a ∗ e = a 47 3. jedes Element ein inverses Element hat, das heißt, falls es für jedes a ∈ G ein a−1 ∈ G gibt, sodass a ∗ a−1 = a−1 ∗ a = e, wobei e das neutrale Element von G ist. Dann nennt man ∗ die Verknüpfung der Gruppe. Man kann die Verküpfung einer endlichen Gruppe auch in einer sogenannten Verknüpfungtafel darstellen. Hier ist die Verknüpfungstafel de Gruppe aus dem Beipiel, wobei i := ( ABC ), d1 := ( BCA), d2 := (CAB), s1 := ( ACB), s2 := ( BAC ), s3 = (CBA). ◦ i d1 d2 s1 s2 s3 i i d1 d2 s1 s2 s3 d1 d1 d2 i s3 s1 s2 d2 d2 i d1 s2 s3 s1 s1 s1 s2 s3 i d1 d2 s2 s2 s3 s1 d2 i d1 s3 s3 s1 s2 d1 d2 i Abbildung 5.1: die Verknüpfungstafel der Gruppe aus dem Beispiel Die Tafel ist so zu verstehen, dass in der j-ten Spalte der i-ten Zeile der Tabelle das Produkt des i-ten mit dem j-ten Element der Gruppe steht. Aufgabe 5.1. Überzeuge dich davon, dass die Menge der Symmetrien des gleichseitigen Dreiecks aus dem Beispiel mit der Hintereinanderausführung tatsächlich eine Gruppe bildet! Aufgabe 5.2. Welche der folgenden Paare von Menge und Verknüpfung sind Gruppen? Begründe! 1. (N, +) 2. (N, ·) 3. (R, +) 4. (R \ {0}, ·) 5. ({ f : M → M | f ist bijektiv}, ◦) für eine Menge M 6. (Z, −) Aufgabe 5.3. Zeige, dass jede Gruppe genau ein neutrales Element hat und dass jedes ihrer Elemente genau ein inverses Element hat. Aufgabe 5.4. Sei ( G, ∗) eine Gruppe. Zeige, dass ( a ∗ b)−1 = b−1 ∗ a−1 für alle a, b ∈ G. Aufgabe 5.5. Beweise die Kürzregel: Für jede Gruppe ( G, ∗) und a, b, c ∈ G gilt a ∗ b = a ∗ c ∨ b ∗ a = c ∗ a ⇒ b = c. Was bedeutet sie für die Verknüpfungstafel? 48 Definition 5.2 (abelsche Gruppe). Eine Gruppe ( G, ∗) heißt abelsch (nach Niels Abel), falls in ihr das Kommutativgesetz gilt, d.h. falls für alle a, b ∈ G a∗b = b∗a gilt. Aufgabe 5.6. Vervollständige folgende Verknüpfungstafel so, dass sie eine abelsche Gruppe beschreibt. Du hast dann die Klein’sche Vierergruppe (nach Felix Klein) gefunden. ◦ 1 a b c 1 a a 1 b c c Definition 5.3 (zyklische Gruppe). Eine Gruppe ( G, ∗) heißt zyklisch, falls es a ∈ G gibt, sodass es für jedes b ∈ G eine natürliche Zahl n mit an := |a ∗ a ∗{z· · · ∗ }a = b n-mal gibt. Das Element a wird Erzeuger von G genannt. Aufgabe 5.7. Zeige, dass jede zyklische Gruppe abelsch ist. Aufgabe 5.8. Zeige, dass jede Gruppe mit drei Elementen eine zyklische Gruppe ist. 5.2 Körper Wenn man algebraische Strukturen mit mehr als einer Operation betrachtet, ist es natürlich, zunächst von dem gewohnten Rechnen mit den reellen Zahlen zu abstrahieren. Eine Möglichkeit, das zu tun, sind Körper. Definition 5.4. Ein Tripel (F, +, ·) aus einer Menge F und Funktionen +, · : F2 → F heißt ein Körper, falls es 0, 1 ∈ F mit 0 6= 1 gibt, sodass 1. (F, +) eine abelsche Gruppe mit neutralem Element 0 ist. 2. (F \ {0}, ·) eine abelsche Gruppe mit neutralem Element 1 ist. 3. das Distributivgesetz gilt, d.h. falls für alle a, b, c ∈ F gilt, dass a · (b + c) = a · c + a · b. Für a ∈ F bezeichnet man das inverse Element von a in (F, +) mit − a und das inverse Element von a in (F, ·) mit a−1 . Wenn keine Missverständnisse zu befürchten sind, schreibt man auch F statt (F, +, ·). 49 Aufgabe 5.9. Welche der folgenden Tripel (F, +, ·) sind Körper? 1. (N, +, ·) 2. (Z, +, ·) 3. (R, +, ·) 4. (R, +, ÷) 5. F2 := ({0, 1}, +, ·) mit + und · gemäß folgender Verknüpfungstafeln: + 0 1 0 0 1 · 0 1 1 1 0 0 0 0 1 0 1 Aufgabe 5.10. Sei (F, +, ·) ein Körper. Zeige, dass dann für alle a ∈ F gilt, dass 0 · a = 0. Aufgabe 5.11. Sei (F, +, ·) ein Körper. Verwende Aufgabe 5.10, um zu zeigen , dass − a = (−1) · a für alle a ∈ F. Aufgabe 5.12. Sei (F, +, ·) ein Körper. Verwende Aufgaben 5.10 und 5.11, um zu zeigen, dass dann a · b = (− a) · (−b) für alle a, b ∈ F gilt. Aufgabe 5.13. Wie viele verschiedene Körper mit drei Elementen gibt es? 5.3 Körper mit Ordnung Definition 5.5 (totale Ordnungsrelation). Eine Ordnungsrelation R ⊆ A2 heißt total, falls für alle a, b ∈ A gilt, dass a ≤ b oder b ≤ a. (kein entweder-oder!) Definition 5.6 (geordneter Körper). Ein Quadrupel (F, +, ·, ≤) aus einem Körper (F, +, ·) und einer totalen Ordnungsrelation ≤ auf F definiert ist, heißt geordneter Körper (oder auch angeordneter Körper), falls sich die Ordnung mit den Körperoperationen verträgt, das heißt, falls für a, b, c ∈ F gilt: 1. a ≤ b ⇒ a + c ≤ b + c 2. a ≤ b ∧ 0 ≤ c ⇒ a · c ≤ b · c Elemente a ∈ F mit a ≤ 0 und a 6= 0 heißen negativ, Elemente mit 0 ≤ a und a 6= 0 heißen positiv. Wir schreiben für a, b ∈ F: 1. a < b, wenn a ≤ b und a 6= b 2. a ≥ b, wenn b ≤ a 3. a > b, wenn b < a 50 Aufgabe 5.14. Sei ( F, +, ·, ≤) ein geordneter Körper. Zeige, dass dann a < 0 ⇔ − a > 0 für alle a ∈ F. Aufgabe 5.15. Sei ( F, +, ·, ≤) ein geordneter Körper. Verwende Aufgabe 5.14, um zu zeigen, dass dann a2 := a · a > 0 für alle a ∈ F mit a 6= 0. Aufgabe 5.16. Verwende Aufgaben 5.12 und 5.15 um zu zeigen, dass in jedem geordneten Körper 0 < 1 gilt! Aufgabe 5.17. Verwende Aufgabe 5.16, um mit vollständiger Induktion zu zeigen, dass in jedem geordneten Körper 0 < 1| + 1 +{z· · · + 1} n-mal für alle n ∈ N gilt. Folgere daraus unter Verwendung von Aufgabe 5.5, dass jeder geordnete Körper unendlich viele Elemente haben muss. 51 6 Komplexe Zahlen 6.1 Motivation und Einführung In den reellen Zahlen hat die Gleichung x2 = −1 bekanntlich keine Lösung. Wir haben auch mit den Aufgaben 5.14 und 5.15 bewiesen, dass diese Gleichung in keinem geordneten Körper lösbar ist. Die komplexen Zahlen werden ein Körper sein, in dem diese Gleichung eine Lösung hat; damit können die komplexen Zahlen schon kein geordneter Körper mehr sein. Weiterhin werden wir die reellen Zahlen mit einer Teilmenge der komplexen Zahlen solcherart identifizieren können, dass im Sinne dieser Identifikation die Rechenoperationen der komplexen Zahlen die der reellen Zahlen erweitern. 2 Wenn wir die Gleichung rein formal √ x = −1 lösen wollen, könnten wir zunächst √ Lösungen mit x1,2 = ± −1 angeben; dabei entspricht dem Symbol −1 keine reelle Zahl und es ist auch nicht klar, was die Wurzel überhaupt bedeuten soll. Man behilft sich hier, indem man die neue Zahl i einführt, die darüber definiert ist, das sie die Gleichung i2 = −1 √ erfüllt; dann ist „i = −1“. Historisch bedingt heißt i die imaginäre Einheit. Fügt man i den reellen Zahlen hinzu und rechnet wie gewohnt mit Multiplikation und Addition, wobei man i2 stets mit −1 ersetzt, erhält man viele neue Zahlen wie zum Beispiel 2i, 4 + 7i, −98 + 2i , . . .. All diese Zahlen sind von der Form a + bi für reelle Zahlen a und b. Die Menge dieser Zahlen nennt man die komplexen Zahlen und bezeichnet sie mit C. Es gilt zum Beispiel ( a + bi) + (c + di) = a + c + (b + d)i und ( a + bi)(c + di) = ac − bd + ( ad + bc)i. Es wird sich herausstellen, dass diese Idee schon einen Körper liefert, der alle die Eigenschaften hat, die wir uns wünschen. In der Folge werden wir die komplexen Zahlen als Paare reeller Zahlen definieren; dabei wird das Paar ( a, b) die Zahl a + ib bezeichnen. Addition und Multiplikation werden wir entsprechend obiger Formeln erklären. 52 6.2 Definition und erste Eigenschaften Definition 6.1 (komplexe Zahlen). Die Menge C der komplexen Zahlen ist die Menge aller Paare reeller Zahlen. Für ( a, b), (c, d) ∈ C definieren wir Addition und Multiplikation durch ( a, b) + (c, d) := ( a + c, b + d) und ( a, b) · (c, d) := ( ac − bd, ad + bc). Für ( a, b) ∈ C heißt <( a, b) := a der Realteil von ( a, b) und =( a, b) := b der Imaginärteil von ( a, b). Die einführenden Überlegungen werden mit dieser Definition durch folgende Schreibweisen abgebildet: Schreibweise 6.2. Wir schreiben ( a, b) ∈ C als a + bi und behandeln das Smybol i beim Rechnen so, als wäre es eine reelle Zahl mit i2 = −1. Man rechnet leicht nach, dass diese Konvention mit der Definition der komplexen Zahlen konsistent ist und dass die Zahl i aus der Einführung dem Paar (0, 1) entspricht. (Das haben wir in der Einführung gemacht) Weiterhin fassen wir R als Teilmenge von C auf, indem wir a ∈ R mit der Zahl ( a, 0) (beziehungsweise a + 0i) identifizieren. Aufgabe 6.1. Überzeuge dich davon, dass unsere Schreibweise und die Definition der Rechenoperationen auf C zu den bekannten Rechenoperationen auf R passt, d.h. überprüfe, dass für a, b ∈ R gilt, dass ( a, 0) + (b, 0) = ( a + b, 0) und ( a, 0) · (b, 0) = ( a · b, 0) und ( a, b) = ( a, 0) + (b, 0) · (0, 1). Proposition 6.3. (C, +, ·) mit + und · aus der Definition ist ein Körper. Beweis. Zuerst bemerken wir, dass offensichtlich (C, +) eine abelsche Gruppe mit dem neutralen Element 0 + 0i ist. Dass (C \ {0}, ·) eine abelsche Gruppe mit dem neutralen Element 1 + 0i ist, soll Aufgabe 6.4 zeigen. Wir zeigen jetzt das Distributivgesetz. Seien ( a, α), (b, β), (c, γ) ∈ C. Dann gilt ( a, α) · ((b, β) + (c, γ)) =( a, α) · (b + c, β + γ) =( a(b + c) − α( β + γ), a( β + γ) + α(b + c)) =( ab + ac − αβ − αγ, aβ + aγ + αb + αc) =( ab − αβ, aβ + αb) + ( ac − αγ, aγ + αc) =( a, α) · (b, β) + ( a, α) · (b, β). Wie wir eingangs schon bemerkt haben, kann C kein geordneter Körper sein, da in geordneten Körpern die Gleichung x2 = −1 keine Lösung hat. Trotzdem kann man komplexe Zahlen dem Betrag nach vergleichen: 53 Definition 6.4 (Betrag). Wir definieren die Betragsfunktion | · | : C → [0, ∞) durch q |z| := (<(z))2 + (=(z))2 . Diese Definition (und auch die der komplexen Zahlen) ist nicht nur algebraisch motiviert sondern auch geometrisch. Wir können die komplexen Zahlen auch als Punkte der Ebene auffassen, wobei eine Koordinate der Realteil und die andere der Imaginärteil ist. Dann ist der Betrag einer komplexen Zahl gerade der Abstand des zu der Zahl gehörigen Punktes zum Koordinatenursprung: = <(z) z |z| =(z) φ < Abbildung 6.1: Die komplexen Zahlen als Punkte der Ebene Mit dieser Betrachtungsweise verhält sich auch die Addition komplexer Zahlen wie die gewohnte Addition von Vektoren. Ferner erhält man aus dieser Anschauung eine weiter Darstellung der komplexen Zahlen: Jedes z ∈ C lässt sich schreiben als z = |z|(cos φ + i sin φ), wobei φ = arctan(=(z)/<(z)) der Winkel zwischen der Verbindugsstrecke von 0 mit z und der positiven reellen Achse ist. Wir setzen die Funktionen sin und cos als im Prizip aus der Schule bekannt voraus. Definition 6.5 (konjugiert komplexe Zahl). Für z = a + ib ∈ C bezeichnet z̄ := a − ib die konjugiert komplexe Zahl von z. Aufgabe 6.2. Beweise folgende Formeln für z, w ∈ C: 1. <(z) = (z + z̄)/2 und =(z) = (z − z̄)/(2i) 2. z ∈ R ⇔ z̄ = z 3. z̄¯ = z 4. z + w = z̄ + w̄ und z · w = z̄ · w̄ 54 5. |z + w| ≤ |z| + |w| (Dreiecksungleichung) 6. |zw| = |z| · |w| 7. z · z̄ | z |2 =1 Aufgabe 6.3. Bestimme für z = a + bi und y = c + di die Größen <(z/y) und =(z/y) (als Ausdrücke in a, b, c, d mit den von den reellen Zahlen gewohnten Rechenoperationen)! Aufgabe 6.4. Rechne nach, dass (C \ {0}, ·) tatsächlich eine abelsche Gruppe ist und vervollständige damit den Beweis von Proposition 6.3. Du kannst die letzte Behauptung in Aufgabe 6.2 verwenden. Aufgabe 6.5. Skizziere folgende Mengen in der komplexen Zahlenebene: 1. {z ∈ C|1 ≥ |z|} 2. {z ∈ C|<(z) ≤ =(z)} 3. {z ∈ C|<(z2 ) = −1} 4. {z ∈ C||z| ≤ |z + 1|} 6.3 Exponentialfunktion Wie bereits erwähnt, setzen wir die Funktionen sin und cos als aus der Schule bekannt voraus. Zur Definition der Exponentialfunktion werden wir einige Eigenschaften dieser Funktionen benötigen: sin und cos sind Funktionen R → [0, 1]. Sie sind 2π-periodisch, das heißt für alle α ∈ R gilt cos(α + 2π ) = cos(α) und sin(α + 2π ) = sin(α). Wir erinnern uns weiters, dass einem rechtwinkligen Dreieck mit Hypothenuse der Länge 1 gilt, dass sin(α) die Länge der dem Winkel α gegenüberliegenden Katheten und cos(α) die Länge der an α gelegenen Katheten ist. Mit dem Satz des Pythagoras gilt also (cos(α))2 + (sin(α))2 = 1. Satz 6.6 (Additionstheoreme). Für α, β ∈ R gilt sin(α + β) = sin(α) cos( β) + sin( β) cos(α) und cos(α + β) = cos(α) cos( β) − sin(α) sin( β). Beweis. Wir wollen einen geometrischen Beweis des Additionstheorems für den Sinus vorstellen. Das andere Additionstheorem ist Übungsaufgabe 6.6. 55 y B r=1 D 0 x A Aufgabe 6.6. Beweise das Additionstheorem für den Cosinus! Definition 6.7 (komplexe Exponentialfunktion). Wir definieren die Exponentialfunktion auf den komplexen Zahlen durch exp : C →C z 7→ exp(<(z))(cos(=(z)) + i sin(=(z))). hierbei bezeichnet auf der rechten Seite des Zuordnungspfeils exp die bekannte Exponentialfunktion auf den rellen Zahlen und sin und cos die ebenfalls als bekannt vorausgesetzten Winkelfunktionen auf R. Für exp(z) schreibt man auch ez . Folgende Proposition zeigt, dass die so definierte Exponentialfunktion die Exponentialfunktion auf R verallgemeinert in dem Sinne, dass beide Funktionen die gleiche Funktionalgleichung erfüllen: Proposition 6.8. Für a, b ∈ C gilt exp( a + b) = exp( a) exp(b). Ferner gilt exp(0) = 1. Aufgabe 6.7. Beweise Proposition 6.8! (Du wirst dafür die Additionstheoreme verwenden müssen) Aufgabe 6.8. Schreibe die Zahl a + ib ∈ C (es seien a, b ∈ R) in der Form c · exp(iφ) mit c ≥ 0, φ ∈ R! Diese Darstellung der komplexen Zahlen nennt man Exponentialdarstellung. Für Ausdrücke wie ab mit komplexen Zahlen a und b können wir bislang nicht sagen, was sie bedeuten sollen. Wir werden es hier auch nicht definieren, weil es den Rahmen des Kurses bei Weitem sprengen würde. Natürliche Exponenten hingegen wollen wir in der naheliegenden Weise definieren: 56 Definition 6.9 (natürliche Exponenten). Für z ∈ C und definieren wir induktiv z0 = 1 z n +1 = z · z n (n ∈ N ∪ {0}) Aufgabe 6.9. Beweise mit vollständiger Induktion, dass für alle a ∈ C und n ∈ N ∪ {0} die Formel exp( a)n = exp(na) gilt! Du kannst dazu Proposition 6.8 benutzen. 6.4 Wurzeln Definition 6.10 (Wurzel). In einem Körper F heißt für n ∈ N und a ∈ F heißt eine Lösung der Gleichung zn := z| · z{z · · · }z = a n-mal eine n-te Wurzel von a Aufgabe 6.10. Sei F ein Körper. Zeige mit vollständiger Induktion, dass jedes a ∈ F für jedes n ∈ N höchstens n verschiedene n-te Wurzeln hat! Du darfst dabei ohne Beweis verwenden, dass man in jedem Körper wie aus der Schule bekannt Polynomdivision durchführen kann: Sei p ein Polynom mit höchstem Exponenten n und Koeffizienten in F. Dann gilt für k ∈ F genau dann p(k ) = 0, wenn es ein Polynom q mit Koeffizienten in F und höchstem Exponenten n − 1 gibt, für das p( x ) = ( x − k) · q( x ) für alle x ∈ F gilt. Die Wurzelfunktionen auf den reellen Zahlen werden erst dadurch zu Funktionen, dass uns aus den Lösungen der Gleichung x n = a eine (die einzige) nichtnegative Zahl aussuchen und diese dann als die Wurzel bezeichnen. Diese Idee lässt sich nicht ohne weiteres auf die komplexen Zahlen übertragen, weil wir für komplexe Zahlen nicht mehr sinnvoll von „positiv“ und „negativ“ sprechen können. Trotz dessen definieren wir auch hier die n-ten Wurzeln einer Zahl als Lösung einer Gleichung. Nach Aufgabe 6.10 kann jedes a ∈ C höchstens n Wurzeln haben. Folgende Proposition zeigt, dass a tatsächlich n Wurzeln hat. Proposition 6.11. Für a = ceiφ ∈ C (c ≥ 0, φ ∈ R) sind die Zahlen √ iφ 2πi zk = n c exp +k n n für k ∈ {0, 1, . . . , n − 1} Lösungen der Gleichung zn = a. Allgemeiner ist der Satz, dass jedes Polynom mit komplexen Koeffizienten und höchstem Exponenten n genau n komplexe Nullstellen (vielleicht mache davon mehrfach) hat, wahr. Man nennt diesen Satz den Fundamentalsatz der Algebra. Aufgabe 6.11. Beweise Proposition 6.11! Dazu kannst du Aufgabe 6.9 verwenden. 57 Aufgabe 6.12. Skizziere für ein paar kleine n ∈ N die Mengen {z ∈ C|zn = 1}! Was fällt dir auf? Aufgabe 6.13. Zeige, dass für n ∈ N die Menge {z ∈ C|zn = 1} eine zyklische Gruppe bezüglich der Multiplikation der komplexen Zahlen bildet! Was stellt die Gruppe geometrisch dar? n√ o 2+3i Aufgabe 6.14. Berechne z̄, |z|, <(z), =(z), <(1/z) und =(1/z) für z ∈ i, 12 +5i ! 58 7 Kombinatorik 7.1 Zählen Die Kombinatorik ist die Mathematik dessen, was man zählen kann. Fragen wie „wie viele?“ sind typische Probleme der Kombinatorik. Auch Probleme, die danach fragen, ob irgendeine endliche Struktur irgendwelche gegebenen Eigenschaften hat, bezeichnet man meist als kombinatorisch. Wir haben also schon viele kombinatorische Aufgaben gesehen (Aufgaben 1.4, 2.12, 2.17, 4.6, 5.6, 5.8 und 5.13) Es gibt eine Reihe, häufig umgangssprachlich formulierte, Prinzipien, die einem Beweise in der Kombinatorik erleichtern. Dieses ist als Schubfachprinzip oder im Englischen pigeonhole principle bekannt: Wenn man n Dinge auf m Kisten verteilt und n > m, dann muss es eine Kiste Geben, die mehr als ein Ding bekommt. Das nächste kann man vielleicht als Produktprinzip bezeichnen: Wenn man n Möglichkeiten hat, etwas mit einer Sache zu tun und m Möglichkeiten, etwas anderes mit einer anderen Sache zu tun, gibt es insgesamt m · n Möglichkeiten, beides zu tun. Diese hier wollen wir Summenprinzip nennen: Wenn man n Möglichkeiten hat, etwas mit einer Sache zu tun und m Möglichkeiten, etwas anderes mit einer anderen Sache zu tun, gibt es insgesamt m + n Möglichkeiten, eines der beiden Dinge zu tun. Dieses heißt das Prinzip von Exlusion und Inklusion Aufgabe 7.1. Formuliere das Schubfachprinzip formal als eine Aussage über Funktionen. Aufgabe 7.2. 7.2 Graphen Definition 7.1 (Graph). Ein Graph ist ein Paar (V, E) aus einer V, deren Elemente man Ecken oder Knoten nennt und einer Menge E, deren Elemente man Kanten nennt. E hat als Elemente zweielementige Teilmengen von V. 59