Friedrich-Schiller-Universität Jena Institut für Mathematik Wintersemester 2013/14 Elemente der Mathematik – Lehramt Mathematik Regelschule – – B.A. Ergänzungsfach Mathematik – Simon King Stand 4. Februar 2014 Inhaltsverzeichnis 1 Logik und Beweistechniken 1.1 Aussagen . . . . . . . . . . . . . . . 1.1.1 Typische Missverständnisse 1.2 Tautologien . . . . . . . . . . . . . 1.3 Beweistechniken . . . . . . . . . . . 1.4 Ausblick auf ein späteres Kapitel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 3 4 6 2 Mengen 2.1 Der Mengenbegriff . . . . . . . . . . . . . . . . . 2.2 Beispiele von Mengen und Mengenkonstruktionen 2.3 Aussageformen und Quantoren: Prädikatenlogik . 2.4 Die Russell–Antinomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 11 12 3 Abbildungen und Relationen 3.1 Abbildungen . . . . . . . . . 3.1.1 Das Auswahlaxiom . 3.2 Binäre Relationen . . . . . . 3.2.1 Äquivalenzrelationen 3.2.2 Ordnungsrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 14 17 19 20 21 . . . . . . . 22 23 23 24 26 27 27 29 . . . . . . . . . . 30 30 31 32 34 35 36 36 39 39 40 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Natürliche Zahlen und Induktion 4.1 Natürliche Zahlen als Kardinalzahlen . . . . . . . 4.1.1 Gleichmächtigkeit . . . . . . . . . . . . . . 4.1.2 (Un-)endliche Mengen . . . . . . . . . . . 4.2 Natürliche Zahlen als Ordinalzahlen . . . . . . . . 4.3 Die Peano–Axiome in Beweisen und Definitionen . 4.3.1 Vollständige Induktion . . . . . . . . . . . 4.3.2 Rekursive Definitionen . . . . . . . . . . . 5 Elementare Arithmetik 5.1 Addition . . . . . . . . . . . . . . . . . . . 5.1.1 Kommutativität der Addition . . . 5.1.2 Assoziativität der Addition . . . . . 5.2 Multiplikation . . . . . . . . . . . . . . . . 5.2.1 Kommutativität der Multiplikation 5.2.2 Assoziativität der Multiplikation . 5.3 Die Wohlordnung der natürlichen Zahlen . 5.4 Die Umkehroperationen . . . . . . . . . . 5.4.1 Subtraktion . . . . . . . . . . . . . 5.4.2 Division mit Rest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Abstrakte Algebra 6.1 Magmen und Monoide . . . . . . . . . . . . . . . . . . . . . . 6.2 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Symmetriegruppen . . . . . . . . . . . . . . . . . . . . 6.2.2 Symmetrische Gruppen . . . . . . . . . . . . . . . . . . 6.2.3 Anwendungen und einfache Eigenschaften von Gruppen 6.2.4 Untergruppen . . . . . . . . . . . . . . . . . . . . . . . 6.2.5 Der Satz von Lagrange . . . . . . . . . . . . . . . . . . 6.2.6 Die Ordnung eines Elements . . . . . . . . . . . . . . . 6.2.7 Gruppenhomomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 43 43 44 44 46 48 49 49 7 Ringe und Körper 7.1 Die ganzen Zahlen . . . . . . . . . . . . . . 7.2 Quotientenkörper und die rationalen Zahlen 7.3 Restklassenringe . . . . . . . . . . . . . . . . 7.3.1 Anwendungen . . . . . . . . . . . . . 7.4 Die reellen Zahlen . . . . . . . . . . . . . . . 7.5 Polynome . . . . . . . . . . . . . . . . . . . 7.5.1 Der größte gemeinsame Teiler . . . . 7.6 Die komplexen Zahlen . . . . . . . . . . . . 7.6.1 Die Gaußsche Zahlenebene . . . . . . 7.6.2 Komplexe Zahlen und Polynome . . . . . . . . . . . . . . . . . . . . . . . 51 52 55 58 59 61 62 65 67 68 69 . . . . . 71 71 71 72 73 74 8 Elementare Kombinatorik 8.1 Exponentialfunktion . . . . . . . . 8.2 Fakultät . . . . . . . . . . . . . . . 8.3 Binomialkoeffizienten . . . . . . . . 8.3.1 Der kleine Satz von Fermat 8.4 Das Vorzeichen einer Permutation . Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 ii 1 Logik und Beweistechniken Alle Menschen sind Säugetiere. Aber daraus folgt noch lange nicht, dass jedes Säugetier ein Mensch ist. In diesem Abschnitt geht es darum, welche Schlussfolgerungen zulässig sind. Außerdem wird einiges an Notation eingeführt. Bemerkung 1.1 Logik ist ein eigenständiges Teilgebiet der Mathematik mit entsprechenden Spezialvorlesungen in höheren Semestern. Es geht dabei zum Beispiel um die Frage, ob sich alle wahren Aussagen auch beweisen lassen. Auch „nichtzweiwertige Logiken“ können thematisiert werden. Das alles ist jedoch nicht Gegenstand dieser Vorlesung. 1.1 Aussagen Es geht in diesem Abschnitt um die klassische zweiwertige Aussagenlogik: Aussagen sind entweder wahr oder falsch. Wir kürzen wahr als W und falsch als F ab und benutzen Großbuchstaben P, Q, ... als Platzhalter für Aussagen. „Jeder Mensch ist ein Säugetier“ ist eine wahre Aussage. „Die Eins ist eine negative Zahl“ ist auch eine Aussage, allerdings eine falsche. Dagegen sind „Was möchten Sie trinken?“, „Ein Kännchen Kaffee“ und „Holen Sie den Geschäftsführer!“ jeweils keine Aussagen im Sinne der Logik, auch wenn sich sprachpragmatisch dahinter zum Teil Aussagen verbergen, etwa „Ich möchte ein Kännchen Kaffee trinken“. Bemerkung 1.2 In der Sprachwissenschaft unterscheidet man Syntax, Semantik und Pragmatik. In der Pragmatik geht es um den Inhalt konkreter sprachlicher Äußerungen, was jedoch nicht Gegenstand der Aussagenlogik ist. Die Syntax untersucht strukturelle Eigenschaften von (natürlichen oder künstlichen) Sprachen, unabhängig von der Bedeutung. Syntaktische Regeln spielen auch in der Aussagenlogik eine Rolle. Die Semantik befasst sich mit der Bedeutung sprachlicher Ausdrücke, losgelöst von den konkreten sprachlichen Äußerungen. Darum geht es auch in der Aussagenlogik. Verneinung Aussagen können verneint werden: aus „Ich mag Schokolade“ wird etwa „Ich mag Schokolade nicht“. Bei der Verneinung von komplexen Aussagen, wie etwa „Wenn der Koch betrunken ist, dann ist die Suppe versalzen oder die Bohnen sind nicht gar“, muss man jedoch vorsichtig sein. Bezeichnung Ist P eine Aussage, so bezeichnet ¬P die verneinte Aussage. 1 Aussagen zusammensetzen Man kann zwei Aussagen zu einer Aussage zusammenfassen, etwa „Der Eisverkäufer ist da und ich habe gerade Taschengeld bekommen“, oder „Wenn du mir einen deiner Lollis gibst, dann bin ich dein bester Freund“. Die verschiedenen Wege, Aussagen zusammenzufassen, kann man gut mit Wahrheitstafeln voneinander unterscheiden. Wir betrachten die folgenden vier grundlegenden Arten, zwei Aussagen zu einer neuen Aussage zu verknüpfen: a) Und: „Ich mag Schokolade und ich hasse Pilze.“ Notation: P ∧Q, gesprochen „P und Q“. b) Oder: „Ich werde den Rasen mähen oder Unkraut jäten (oder vielleicht sogar beides).“ Notation: P ∨ Q, gesprochen „P oder Q“. c) Implikation: „Wenn es morgen regnet, dann bleibe ich auf jedem Fall zu Hause (aber vielleicht tue ich das sowieso).“ Notation: P ⇒ Q, gesprochen „Wenn P , dann Q“ bzw. „Aus P folgt Q“. d) Äquivalenz: „Wenn du sofort die Spülmaschine leerst, bekommst du einen Kakao – sonst aber nicht.“ Notation: P ⇔ Q, gesprochen „P genau dann wenn Q“. Hier sind die zugehörigen Wahrheitstafeln: P Q ¬P P ∧ Q P ∨ Q P ⇒ Q P ⇔ Q F F W F F W W F W W F F W W W F F F W F F W W F W W W W 1.1.1 Typische Missverständnisse Im „echten LebenTM “ kommt es häufig zu Missverständnissen bei der Verwendung zusammengesetzter Aussagen. P ∨Q ist nur falsch, wenn P, Q beide falsch sind. Im Alltag jedoch wird „P oder Q“ bisweilen im Sinne von „entweder P oder Q“ verwendet. In der Mathematik wird zwischen diesen beiden Aussagen deutlich unterschieden. Noch mehr Konfusion herrscht im Umgang mit Implikationen. P ⇒ Q ist nur falsch, wenn P wahr und Q falsch ist. Im Alltag wird P ⇒ Q bisweilen mit P ⇔ Q verwechselt, ist also auch dann falsch, wenn P falsch und Q wahr ist. Darüber hinaus werden Wenn–Dann–Konstruktionen auch im zeitlichen oder im irrealen Sinne verwendet: • „Wenn ich groß bin, werde ich Feuerwehrmann“ wird als Aussage über die Zukunft gebraucht und impliziert, dass ich einmal groß sein werde. 2 • „Wenn ich reich wäre, würde ich mir eine eigene Insel kaufen“ wird im irrealen Sinne gebraucht und impliziert, dass ich nicht reich bin. In der Aussagenlogik impliziert P ⇒ Q jedoch weder die Wahrheit noch die Unwahrheit von P . 1.2 Tautologien Vergleichen wir die Wahrheitstafeln von P ∧ (¬Q) und ¬(P ⇒ Q): P Q ¬Q P ⇒ Q P ∧ (¬Q) ¬(P ⇒ Q) (¬(P ⇒ Q)) ⇔ (P ∧ (¬Q)) F F W W F F W F W F W F F W W F W F W W W W F F W W W F Aus der Wahrheitstafel erkennen wir: die Verneinung von P ⇒ Q ist P ∧ (¬Q); und die Aussage (¬(P ⇒ Q)) ⇔ (P ∧(¬Q)) ist immer wahr, egal welche Aussagen P, Q sind. Eine solche immer wahre Aussage nennt man eine Tautologie. Das Wort „Tautologie“ stammt aus dem Griechischen und bedeutet wörtlich „dasselbe Sagendes“. Nach dem oben gesagten ist also (¬(P ⇒ Q)) ⇔ (P ∧ (¬Q)) eine Tautologie. Weitere Tautologien sind P ⇔ ¬(¬P ) und die de Morgan’schen Regeln ¬(P ∧ Q) ⇔ (¬P ) ∨ (¬Q) ¬(P ∨ Q) ⇔ (¬P ) ∧ (¬Q) wie in den Übungsaufgaben nachgewiesen werden soll. Dagegen ist (P ⇒ Q) ⇒ (Q ⇒ P ) keine Tautologie, denn dies ist eine Aussage, die nicht für alle Aussagen P, Q wahr ist: P Q P ⇒ Q Q ⇒ P (P ⇒ Q) ⇒ (Q ⇒ P ) F F W W W F W W F F W F F W W W W W W W Das ist gut so, denn mit P : „Dieses Tier ist eine Maus“ und Q : „Dieses Tier ist ein Vierbeiner“ hätten wir sonst gezeigt, dass wenn Mäuse Vierbeiner sind, dann müssen auch Vierbeiner Mäuse sein – was natürlich falsch ist. 3 1.3 Beweistechniken Die Aussage (P ⇒ Q) ⇔ (¬Q ⇒ ¬P ) eine Tautologie: P Q ¬P ¬Q P ⇒ Q ¬Q ⇒ ¬P (P ⇒ Q) ⇔ (¬Q ⇒ ¬P ) F F W W W W W F W W F W W W F F W W F F W W W F F W W W Die Aussagen P ⇒ Q und (¬Q) ⇒ (¬P ) haben also die gleichen Wahrheitstafeln und sind daher zueinander bedeutungsgleich. Darüber hinaus ist auch (P ∧¬Q) ⇒ F zu P ⇒ Q bedeutungsgleich. Will man zeigen, dass Aussage Q aus Aussage P folgt, so gibt es drei verschiedene Strategien. Welche der drei am besten passt, hängt vom jeweiligen Problem ab. • Der direkte Beweis P ⇒ Q: Wir nehmen an, dass P wahr ist, und folgern daraus (zum Beispiel durch eine Rechnung), dass Q wahr sein muss. • Der Beweis durch Kontraposition ¬Q ⇒ ¬P : Wir nehmen an, dass Q falsch ist, und folgern daraus, dass P falsch sein muss. • Der Widerspruchsbeweis (P ∧ ¬Q) ⇒ F : Wir nehmen an, dass P wahr ist und Q falsch. Hieraus leiten wir einen Widerspruch her. Anwendung in der Praxis Mit Hilfe eines Beweises durch Kontraposition und eines Widerspruchsbeweises beweisen wir eine√Aussage, die zuerst im 5. Jhdt. v. Chr. von den Pythagoreern1 bewiesen wurde: 2 is irrational. Wir folgen im Wesentlichen dem von Euklid2 überlieferten Beweis. Der Vollständigkeit halber geben wir am Ende des Abschnitts noch ein Beispiel eines direkten Beweises. Wir setzen hier voraus, dass die Grundrechenarten mit natürlichen, rationalen und reellen Zahlen aus der Schule bekannt sind. Der Aufbau des Zahlenbereichs wird später in der Vorlesung systematisch behandelt werden. Wir verwenden hier das für die Mathematik sehr typische Schema „Definition – Satz – Beweis“, das Ihnen bestimmt noch oft begegnen wird: Zuerst werden wir einige Begriffe definieren, mit denen die zu beweisende Aussage (der Satz) formuliert wird, der dann schließlich bewiesen wird. Im Beweis des Satzes wird wiederum ein Hilfssatz mit zugehöriger Definition und Beweis verwendet. Einen Hilfssatz nennt man häufig „Lemma“ (Mehrzahl: „Lemmata“). Definition 1.3 Eine reelle Zahl x heißt irrational, genau dann wenn es keine gilt. ganze Zahlen m und n > 0 gibt, für die x = m n 1 2 Pythagoras von Samos, ca. 570 v. Chr. bis nach 510 v. Chr. Euklid lebte im 3. Jhdt. v. Chr vermutlich in Alexandria 4 Bemerkung 1.4 Definitionen sind wahre Aussagen und sind meist aus drei Teilaussagen zusammengesetzt: Der Voraussetzung V (hier: „x ist eine reelle Zahl“), dem zu definierenden Begriff B (hier: „x heißt irrationale“) und der definierenden Eigenschaft E (hier: „Es gibt keine ganzen Zahlen m und n, für die x = m gilt“). n Die Bedeutung von B wird erst durch die Definition festgelegt, und zwar so, dass V ⇒ (B ⇐⇒ E) eine Tautologie ist. Bemerkung 1.5 Es kommt vor, dass man einen Begriff definiert und sich dann (möglicherweise erst nach Jahren intensiver Arbeit) herausstellt, dass es kein Beispiel für diesen Begriff gibt. Das macht aber nichts, denn auch ein solches negatives Ergebnis kann interessant sein. Definition 1.6 Es sei y eine positive reelle Zahl. x heißt Quadratwurzel von y √ (notiert als x = y), genau dann wenn x eine positive reelle Zahl ist mit x2 = y. Im Lemma benötigen wir noch folgende Definition. Definition 1.7 Eine natürliche Zahl n heißt gerade ⇐⇒ es gibt eine natürliche Zahl m, so dass n = 2 · m. Bemerkung 1.8 Wir verwenden im Beweis die aus der Schule bekannte Tatsache, dass es für jede natürliche Zahl n eine natürliche Zahl m gibt, so dass entweder n = 2 · m oder n = 2 · m + 1 gilt. √ Satz 1.9 Wenn x = 2, dann ist x irrational. Wir formulieren und beweisen nun ein Lemma, mit dessen Hilfe wir auch Satz 1.9 beweisen. Das Ende eines Beweises wird in mathematischen Texten meist extra markiert. Klassisch wäre „q.e.d“ für das lateinische „quod erat demonstrandum“ („was zu beweisen war“). Wir verwenden hier einfach ein schwarzes Kästchen als Beweisendzeichen. Lemma 1.10 Es sei n eine ganze Zahl. Wenn n2 gerade ist, dann ist n gerade. Beweis. Wie führen einen Beweis durch Kontraposition. Wenn eine ganze Zahl n nicht gerade ist, dann gibt es eine ganze Zahl m mit n = 2m + 1 (siehe Bemerkung 1.8). Damit ist n2 = (2m + 1)2 = 4 · (m2 + m) + 1, also ist n2 nicht gerade. Beweis von Satz√1.9. Diesmal führen wir einen Widerspruchsbeweis: Wir nehmen an, dass x = 2 und dass gleichzeitig x nicht irrational ist. Mit anderen Worten, wir nehmen an, der Satz sei falsch. Aus dem zweiten Teil der Annahme folgt, dass es ganze Zahlen m und n > 0 mit x = m gibt. Wie aus der Schule bekannt ist, kann man gemeinsame Teiler n von Zähler und Nenner eines Bruches kürzen, ohne den Wert des Bruches zu 5 verändern. Wir können also (ohne eine zusätzliche Annahme!) erreichen, dass m und n teilerfremd sind. Zusammen mit dem ersten Teil der Annahme und der Definition der Qua 2 2 m dratwurzel folgt, dass n = m = 2. Daher ist m2 = 2n2 , also ist m2 gerade. n2 Wegen Lemma 1.10 folgt, dass m gerade ist. Nach Definition gibt es also eine ganze Zahl r mit m = 2r. Aus m2 = 2n2 folgt dann 4r2 = 2n2 , also n2 = 2r2 , also ist n2 gerade. Wiederum wegen Lemma 1.10 folgt, dass auch n gerade ist. Aber m und n sind teilerfremd, also können sie nicht beide gerade (also durch 2 teilbar) sein. Unsere Annahme, dass der Satz falsch ist, führte zu einem Widerspruch. Der Satz ist also wahr. Der Vollständigkeit halber führen wir noch einen kleinen direkten Beweis. Lemma 1.11 Wenn n eine gerade Zahl ist, dann ist n2 eine gerade Zahl. Beweis. Wir führen einen direkten Beweis. n ist gerade. Also gibt es nach Definition eine natürliche Zahl m mit n = 2m. Damit ist n2 = (2m)2 = 2 · (2m2 ). Also ist (wieder nach Definition) n2 eine gerade Zahl. 1.4 Ausblick auf ein späteres Kapitel In einigen der oben verwendeten Aussagen traten bereits so genannte Quantoren auf: Es gibt eine natürliche Zahl m, so dass n = 2 · m; jede Maus ist ein Säugetier. Durch Quantoren lassen sich Aussagen über Elemente von Mengen formulieren. Wir werden daher im kommenden Kapitel zunächst auf den Mengenbegriff eingehen, bevor wir uns in Abschnitt 2.3 den Quantoren und damit noch einmal der Logik zuwenden. 6 2 Mengen 2.1 Der Mengenbegriff Wer Mathematik-Vorlesungen besucht, wird mit sehr vielen Definitionen konfrontiert. Eine zufriedenstellende Definition des Mengenbegriffs ist aber in den ersten Semestern nicht dabei, stattdessen wird erwartet, dass man ungefähr weiß, was eine Menge ist. Traditionell gibt man anstelle einer formalen Definition das folgende Zitat von Georg Cantor [1845–1918], dem Begründer der Mengenlehre, wieder: Unter einer ‚Menge‘ verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objecten m unsrer Anschauung oder unseres Denkens (welche die ‚Elemente‘ von M genannt werden) zu einem Ganzen. (G. Cantor, 1895) Somit bilden die rationalen Zahlen eine Menge, und die Städte Thüringens mit mehr als 50.000 Einwohnern bilden eine andere. Eine andere informelle Beschreibung des Mengenbegriffs stammt von Felix Hausdorff [1868–1942]: Eine Menge ensteht durch Zusammenfassung von Einzeldingen zu einem Ganzen. Eine Menge ist eine Vielheit, als Einheit gedacht. (F. Hausdorff, 1927) Allerdings sind manche Zusammenfassungen, die man sich vorstellen kann, – die Zusammenfassung aller Mengen, zum Beispiel — so groß, dass man sie nicht als Mengen durchgehen lassen kann. „Zusammenfassungen von Einzeldingen“ können nur Mengen genannt werden, wenn sie noch weitere Eigenschaften besitzen: Mengen erfüllen die Zermelo3 –Fraenkel4 –Axiome. Aus diesen Axiomen folgt, dass die Gesamtheit aller Mengen keine Menge bildet (Satz 2.13). Diese Axiome haben sich in fast 100 Jahren mathematischer Arbeit bewährt; es traten insbesondere keine Widersprüche zutage. Kurt Gödel [1906–1978] hat allerdings bewiesen, dass man die Widerspruchsfreiheit der Zermelo–Fraenkel– Mengenlehre nicht beweisen kann. Anstatt die Zermelo–Fraenkel–Axiome alle aufzulisten, werden wir lediglich einige Grundbeispiele und Konstruktionsmöglichkeiten von Mengen angeben, welche für die „normale“ mathematische Arbeit ausreichen, und benennen meist auch das Axiom, auf dem die jeweilige Konstruktion basiert. Wer an einer genauen Formulierung der Axiome interessiert ist, kann sie anhand des Namens leicht in einem Lexikon nachlesen. 3 4 Ernst Zermelo [1871–1953] Abraham Fraenkel [1892–1965] 7 2.2 Beispiele von Mengen und Mengenkonstruktionen Mengen bestehen aus Elementen. Ist x ein Element der Menge M , so drückt man diese Tatsache durch die Bezeichung x ∈ M aus. Statt ¬(x ∈ M ) schreibt man x∈ / M . Für die Menge Z der ganzen Zahlen gilt zum Bespiel 1 ∈ Z aber 12 6∈ Z. Wir werden später noch definieren, wann eine Menge unendlich heißt, und dann ist eine endliche Menge einfach eine Menge, die nicht unendlich ist. Aber soweit sind wir noch nicht. Wir verwenden daher zunächst den intuitiven Begriff: Eine Menge M heißt endlich, wenn sie nur endlich viele Elemente enthält. Deren Anzahl nennt man die Mächtigkeit oder Kardinalität |M |. Es gibt im wesentlichen drei Methoden, eine Menge anzugeben: a) Man listet alle Elemente auf, etwa M = {1, 3, 4, 6} mit |M | = 4. Das geht natürlich nur im Falle von endlichen Mengen. b) Man startet mit einer bestehenden Menge und bildet eine neue Menge aus genau den Elementen, die eine bestimmte vorgegebene Eigenschaft erfüllen, zum Beispiel M = {n ∈ N | n ist durch 3 teilbar und n2 hat als letzte Ziffer eine 4} . Dies nennt man Aussonderungsaxiom; vgl. Axiom 2.12. c) Man startet mit einer bestehenden Menge und ersetzt nach einem vorgegebenen Bildungsgesetz jedes ihrer Elemente durch ein anderes „Object unserer Anschauung oder unseres Denkens“. Zum Beispiel kann man für jede natürliche Zahl n die Menge aller regelmäßigen n–Ecke bilden; die Gesamtheit dieser Mengen bildet die Menge {{Regelmäßige n–Ecke} | n ∈ N} Dass man auf diese Weise stets wieder eine Menge erhält, besagt das Ersetzungsaxiom. Man beachte, dass im letzten Beispiel die Elemente der Menge selbst wieder Mengen sind. Die letzten beiden Konstruktionsmethoden können wir natürlich nur nutzen, wenn uns bereits Mengen zur Verfügung stehen. Dies sind zum Beispiel die folgenden Mengen: ∅ Die leere Menge ∅ = {}, die keine Elemente enthält. Dass es die leere Menge gibt, wird im Leermengenaxiom festgelegt. N Die Menge N = {0, 1, 2, 3, 4, 5, . . .} aller natürlichen Zahlen — zumindest nach DIN–Norm 5473 gehört die Null zu den natürlichen Zahlen. Die Existenz von N folgt aus dem Unendlichkeitsaxiom. 8 N∗ Die Menge N∗ = {1, 2, 3, 4, 5, . . .} aller positiver natürlicher Zahlen — wieder nach DIN-Norm 5473. Z Die Menge Z = {. . . , −2, −1, 0, 1, 2, . . .} aller ganzen Zahlen Q Die Menge der rationalen Zahlen R Die Menge der reellen Zahlen C Die Menge der komplexen Zahlen (kommt noch) Bemerkung 2.1 DIN–Norm 5473 wird von vielen Mathematikern ignoriert. Sie sollten also immer auf den Kontext achten, ob 0 ∈ N. Wer N = {1, 2, 3, 4, ...} verwendet, der schreibt meistens N0 = {0, 1, 2, 3, ...}. Axiom 2.2 (Gleichheit von Mengen, Extensionalitätsaxiom) Zwei Mengen M, N sind genau dann gleich (symbolisch M = N ), wenn jedes Element aus M auch ein Element aus N und jedes Element aus N auch ein Element aus M ist. Beachten Sie hierzu: • Die Mengen {1, 2, 3} und {1, 2, 2, 3} sind gleich, denn jedes Element der ersten Menge ist Element der zweiten, und auch umgekehrt. Beide Mengen haben auch genau drei Elemente. • Es ist unerheblich, auf welche Weise eine Menge beschrieben wird. Es kommt einzig darauf an, welche Elemente sie enthält. Beispiel Die Mengen {x ∈ Z | x4 − 5x2 + 4 = 0} und {−2, −1, 1, 2} sind trotz der unterschiedlichen Beschreibung gleich. Definition 2.3 (Teilmengen) Eine Menge N heißt eine Teilmenge einer Menge M , wenn jedes Element von N auch ein Element aus M ist. Bezeichnung: N ⊆ M . Somit gilt: Lemma 2.4 Es ist genau dann M = N , wenn sowohl N ⊆ M als auch M ⊆ N gelten. Sind M, N Mengen, so kann man folgende neue Mengen bilden: a) die Vereinigung M ∪ N , welche alle Elemente von M und alle Elemente von N enthält; b) den Schnitt M ∩ N , welcher aus allen Elementen von M besteht, welche zugleich Elemente von N sind; 9 c) die Differenzmenge M \ N , die aus allen Elementen von M besteht, welche zuglich nicht Elemente von N sind. Das geht bildlich und in Formeln so: M N M ∪N M N M ∩N M N M \N M ∪ N = {x | (x ∈ M ) ∨ (x ∈ N )} M ∩ N = {x | (x ∈ M ) ∧ (x ∈ N )} M \ N = {x ∈ M | x 6∈ N } Dass M ∪ N eine Menge ist, folgt aus dem Paarmengen- und dem Vereinigungsaxiom. Für die Mengeneigenschaft von M ∩ N und M \ N benötigen wir kein neues Axiom, es genügt das oben erwähnte Aussonderungsaxiom. Bemerkung 2.5 Die obigen bildlichen Veranschaulichungen von Mengen sind Beispiele von Venn–Diagrammen (John Venn [1834–1923]). Venn–Diagramme gibt es mit beliebig vielen Mengen, doch sind die Diagramme mit mehr als drei Mengen nicht mehr so schön symmetrisch. Definition 2.6 Zwei Mengen M, N sind disjunkt, genau dann wenn M ∩ N = ∅. Axiom 2.7 (Potenzmengenaxiom) Es sei M eine Menge. Dann bildet die Gesamtheit aller Teilmengen von M selbst eine Menge, welche die Potenzmenge P(M ) von M genannt wird. Symbolisch: P(M ) = {N | N ⊆ M } Definition 2.8 Sind A, B zwei Mengen, so definiert man das direkte Produkt A × B als die Menge aller geordnete Paare (a, b) mit a ∈ A und b ∈ B. Das Wort „geordnet“ bedeutet, dass z.B. (1, 2) 6= (2, 1). Allgemeiner definiert man für Mengen A1 , A2 , . . . , An das direkte Produkt A1 × A2 × · · · × An = {(a1 , a2 , . . . , an ) | ai ∈ Ai für alle i = 1, ..., n} . Die Elemente dieses Produkts nennt man (geordnete) n-Tupel5 . Für die Bildung des direkten Produkts benötigt man nur die bereits oben genannten Axiome. 5 Wenn man später die Mengenlehre axiomatisieren will, stellt man sich die Frage, was für ein Objekt ein geordnetes Paar sein soll. Die heute allgemein akzeptierte Antwort lautet: das geordnete Paar (a, b) ist die Menge {{a}, {a, b}}. Beachten Sie, dass diese Menge im Fall a = b aus nur einem Element besteht. 10 2.3 Aussageformen und Quantoren: Prädikatenlogik Eine Aussageform ist eine Aussage mit einem oder mehreren freien Variablen. Es hängt vom Wert der Variable(n) ab, ob die Aussage wahr oder falsch ist. Eine Aussageform mit n Variablen nennt man auch n–stelliges Prädikat. Beispiel Schreibt man etwa P (x) für die Aussageform „x ist eine reelle Zahl, die x2 − x = 0 erfüllt“, so ist P (0) eine wahre und P (3) eine falsche Aussage. Beispiel Schreibt man Q(x, y) für die Aussageform „xy + 3x = 2“, so ist Q(0, 1) falsch und Q(1, −1) wahr. Dagegen ist Q(1, y) die Aussageform „y+3 = 2“ mit nur einer Variable. Gerade machten wir das 1–stellige Prädikat P (x) zu einer Aussage, indem wir den Wert x = 3 einsetzten. Man kann aber auch Quantoren6 benutzen, um aus Aussageformen Aussagen zu machen. Wir benötigen drei Quantoren: ∀ „für alle“ Bsp: „∀x : x ∈ R ⇒ x2 ≥ 0“ ist die (wahre) Aussage, dass Quadrate reeller Zahlen größer oder gleich Null sind. ∃ „es gibt (mindestens) ein“ √ Bsp: „∃x : x ∈ Q ∧ x2 = 2“ ist die (falsche) Aussage, dass 2 rational ist. ∃! „es gibt genau ein“ Bsp: „∃!x : x ∈ Z ∧ x2 = y“ ist eine Aussageform, die für y = 0 wahr ist, aber für y = 3 bzw. y = 4 falsch ist, denn dort gibt es keine bzw. zwei Möglichkeiten für x. Bemerkung 2.9 Es gibt noch andere Schreibweisen für Quantoren. Die Schreibweise „∃x“ wurde von Giuseppe Peano [1858–1932] vorgeschlagen, während die Schreibweise „∀x“ von Gerhard Gentzen [1909–1945] stammt. Statt „∃x“ findet W V man auch „ x “ bzw. „(Ex)“ und statt „∀x“ wird auch „ x “ bzw. „(x)“ verwendet. Mit Hilfe von Quantoren kann man die Gleichheit von Mengen M und N symbolisch wie folgt aufschreiben: M =N ⇐⇒ ∀x : (x ∈ M ⇔ x ∈ N ) . Auch N ⊆ M lässt sich symbolisch definieren: N ⊆M ⇐⇒ ∀x : (x ∈ N ⇒ x ∈ M ) . Die Definition einer geraden Zahl sieht unter Verwendung von Quantoren wie folgt aus. ∀n : 6 (n ∈ Z ⇒ (n ist gerade ⇐⇒ Alternativname: Quantifikatoren. 11 ∃m : (m ∈ Z ∧ n = 2 · m))) Quantoren beziehen sich auf die Gesamtheit aller „Objecte unserer Anschauung oder unseres Denkens“. Oft möchte man aber nur etwas über die Elemente einer bestimmten Menge aussagen. Dazu verwendet man die folgenden abkürzenden Schreibweisen. Notation 2.10 Es sei M eine Menge und P (x) eine Aussageform. a) Statt ∀x : (x ∈ M ⇒ P (x)) schreibt man ∀x ∈ M : P (x). b) Statt ∃x : (x ∈ M ∧ P (x)) schreibt man ∃x ∈ M : P (x). c) Statt ∃!x : (x ∈ M ∧ P (x)) schreibt man ∃!x ∈ M : P (x). Aussagen mit ∀ und ∃ werden gemäß der folgenden Beobachtung negiert. Beobachtung 2.11 Es sei P (x) ein 1–stelliges Prädikat. Die Äquivalenz ¬ (∀x : P (x)) ⇐⇒ ∃x : ¬P (x) ist eine Tautologie. Wir haben oben schon das Aussonderungsaxiom kennengelernt, das wir mittels Aussageformen nun wie folgt formulieren können. Axiom 2.12 (Aussonderungsaxiom) Es sei M eine Menge und P (x) eine Aussageform. Die Gesamtheit der Elemente x von M , für die P (x) eine wahre Aussage ist, ist selbst wieder eine Menge, die als {x ∈ M | P (x)} oder {x | x ∈ M ∧ P (x)} notiert wird. 2.4 Die Russell–Antinomie Gottlob Frege [1848–1925], der in Jena als Professor tätig war, entwickelte eine Mengenlehre auf Grundlage der Idee, dass es zu jedem Begriff eine Menge gebe, die genau die Objekte enthält, welche unter diesen Begriff fallen. Mit anderen Worten: Frege dachte, dass für jede Aussageform P (x) durch {x | P (x)} (die Gesamtheit genau derjenigen Objekte, für die P (x) zu einer wahren Aussage wird) eine Menge beschrieben wird. Dies nennt man das Abstraktionsprinzip. Bertrand Russell [1872–1970] fand jedoch heraus, dass sich aus dem Abstraktionsprinzip ein Widerspruch ergibt: Wählt man für P (x) die Aussageform „x ist eine Menge ∧ x ∈ / x“, so wäre {x | P (x)} eine Menge, die sich gleichzeitig enthält und nicht enthält. Russell wies Frege 1902 in einem Brief darauf hin und 12 erschütterte damit die Grundlagen eines bereits im Druck befindlichen Buches von Frege. Wir zeigen nun mit Russells Antinomie, dass die Gesamtheit aller Mengen keine Menge bildet, falls man die Gültigkeit des Aussonderungsaxioms akzeptiert. Satz 2.13 Wenn das Aussonderungsaxiom 2.12 gilt, dann ist die Gesamtheit aller Mengen keine Menge. Beweis. Wir führen einen Widerspruchsbeweis. Wir nehmen also an, dass das Aussonderungsaxiom wahr ist und dass die Gesamtheit aller Mengen eine Menge M bildet. Um den Satz zu beweisen, müssen wir aus dieser Annahme einen Widerspruch herleiten. Da M eine Menge ist, folgt aus dem Aussonderungsaxiom, dass auch {x ∈ M|x∈ / x} eine Menge ist, die wir R nennen. Nach der Definition von R gilt also: x ∈ M ⇒ (x ∈ R ⇔ x ∈ / x). Wir setzen nun R für x ein. Da R eine Menge ist, gilt R ∈ M (M ist ja die Menge aller Mengen). Daher folgt R ∈ R ⇔ R ∈ / R. Das ist ein Widerspruch, und somit ist der Satz bewiesen. 13 3 Abbildungen und Relationen 3.1 Abbildungen Definition 3.1 Es seien X, Y Mengen. Eine Abbildung f : X → Y von X nach Y ist eine Vorschrift, die jedem Element x ∈ X genau ein Element f (x) ∈ Y zuordnet. Man spricht auch von der Abbildung x 7→ f (x). Eine äquivalente Definition lautet so: Alternativ-Definition 3.2 Eine Abbildung f : X → Y ist eine Teilmenge F ⊆ X × Y mit der folgenden Eigenschaft: zu jedem x ∈ X gibt es genau ein Element y ∈ Y derart, dass das Paar (x, y) in F liegt. Symbolisch: ∀x ∈ X : ∃!y ∈ Y : (x, y) ∈ F Man schreibt dann y = f (x). Man sieht an der Alternativ-Definition insbesondere, dass die Gesamtheit aller Abbildungen von X nach Y eine Menge bildet (Übungsaufgabe). Notation 3.3 Die Menge aller Abbildungen von X nach Y wird mit Y X oder Abb(X, Y ) bezeichnet. Beispiel 3.4 a) Die Vorschrift „f (x) = 2x3 − sin(x)“ definiert eine Abbildung f : R → R. b) Abbildungen müssen aber keineswegs durch schöne Formel definiert wer√ den. So kann man eine Abbildung f : {0, 1, 3, 8, 9} → {−1, π, 2, 21 } durch f (0) = π, f (1) = −1, f (3) = −1, f (8) = 12 und f (9) = −1 definieren. c) Die Vorschrift „f (x) = das y mit y 2 = x“ definiert aus zwei Gründen keine Abbildung f : R → R. Erstens wird zu negativen Zahlen wie z.B. −1 keinen Wert f (x) zugeordnet; und zweitens wird zu positiven Zahlen mehr als einen Wert zugeordnet, z.B. f (1) = 1 und f (1) = −1. Definition 3.5 Sind f : X → Y und g : Y → Z Abbildungen, so wird deren Verknüpfung g ◦ f : X → Z so definiert: für jedes x ∈ X ist (g ◦ f )(x) = g(f (x)). Lemma 3.6 Verknüpfung von Abbildungen ist assoziativ, d.h. sind f : X → Y , g : Y → Z und h : Z → W Abbildungen, so sind die Abbildungen h ◦ (g ◦ f ) und (h ◦ g) ◦ f : X → W gleich. Beweis. Für jedes x ∈ X haben beide Abbildungen den Wert h(g(f (x))). 14 Definition 3.7 Sei f : X → Y eine Abbildung. a) Sei A ⊆ X eine Teilmenge. Die eingeschränkte Abbildung f |A : A → Y wird definiert durch f |A (x) = f (x) für jedes x ∈ A. b) Ist A ⊆ X eine Teilmenge, so bezeichnet man mit f (A) die Bildmenge f (A) = {f (x) | x ∈ A} von A. Insbesondere nennt man f (X) das Bild 7 von f , es ist also Bild(f ) = {f (x) | x ∈ X}. c) Ist B ⊆ Y , so definiert man die Urbildmenge 8 f −1 (B) ⊆ X durch f −1 (B) = {x ∈ X | f (x) ∈ B} . Ist B die Teilmenge {b}, die aus einem Element b ∈ Y besteht, so schreibt man f −1 (b) statt f −1 ({b}). Beachten Sie aber, dass f −1 (b) kein Element von X ist, sondern eine Teilmenge von X. Beispiel Sei f : R → R die Abbildung x 7→ x2 . Dann f −1 ({−2, 0, 9}) = {−3, 0, 3}, f −1 (−1) = ∅ und f −1 (4) = {−2, 2}. Am Beispiel sieht man, dass für eine Abbildung f : X → Y nicht unbedingt jedes Element von Y im Bild von f liegt, und dass manche Elemente von Y mehrfach von f „getroffen“ werden. Dies gibt Anlass zur folgenden Definition. Definition 3.8 Eine Abbildung f : X → Y heißt injektiv, genau dann wenn keine zwei Elemente von X das gleiche Bild in Y haben, d.h. wenn jedes y ∈ Y höchstens ein Urbild in X hat; symbolisch: ∀x1 ∈ X : ∀x2 ∈ X : f (x1 ) = f (x2 ) ⇒ x1 = x2 . surjektiv, genau dann wenn Bild(f ) = Y gilt, d.h. wenn es zu jedem y ∈ Y mindestens ein x ∈ X mit f (x) = y gibt; symbolisch: ∀y ∈ Y : ∃x ∈ X : f (x) = y. bijektiv oder eine Bijektion, genau dann wenn sie sowohl injektiv als auch surjektiv ist. Anders gesagt, wenn es zu jedem y ∈ Y genau ein x ∈ X gibt mit f (x) = y; sybolisch: ∀y ∈ Y : ∃!x ∈ X : f (x) = y. Lemma 3.9 Seien f : X → Y und g : Y → Z Abbildungen. a) Ist die Verknüpfung g ◦ f injektiv, so muss f injektiv sein. b) Ist die Verknüpfung g ◦ f surjektiv, so muss g surjektiv sein. 7 8 Auf Englisch “image” Auf Englisch “preimage”. Andere Bezeichnung: „Faser“, englisch “fibre“ 15 Beweis. S. Übungsblatt. Weder surjektiv noch injektiv Surjektiv aber nicht injektiv Injektiv aber nicht surjektiv Bijektiv Sei X eine Menge. Die Identitätsabbildung IdX : X → X wird so definiert: für jedes x ∈ X ist IdX (x) = x. Lemma 3.10 Sei f : X → Y eine Abbildung. a) Ist f injektiv und X nicht leer, so gibt es eine — nach Lemma 3.9 zwangsweise surjektive — Abbildung g : Y → X mit g ◦ f = IdX . b) Ist f surjektiv, so gibt es eine — nach Lemma 3.9 zwangsweise injektive — Abbildung g : Y → X mit f ◦ g = IdY . c) f ist genau dann bijektiv, wenn es eine Abbildung g : Y → X gibt mit den beiden Eigenschaften g ◦ f = IdX und f ◦ g = IdY . In diesem Fall ist g bereits durch jede einzelne der beiden Eigenschaften charakterisiert.9 Mit anderen Worten: Wenn f bijektiv ist und h : Y → X eine Abbildung ist, für die h ◦ f = IdX oder f ◦ h = IdY , dann ist g = h. Definition 3.11 Es sei f : X → Y eine bijektive Abbildung. Die nach Lemma 3.10 c) eindeutig bestimmte Abbildung g : Y → X mit g ◦ f = IdX heißt Umkehrabbildung und wird mit f −1 bezeichnet. Aus dem Kontext wird jeweils klar, ob mit f −1 (y) für y ∈ Y das Urbild (also eine Teilmenge von X) oder das Ergebnis der Umkehrabbildung (also ein Element von X) gemeint ist. Hier werden wir uns bemühen, konsequent f −1 ({y}) zu schreiben, wenn wir das Urbild und nicht das Ergebnis der Umkehrabbildung meinen. 9 Das heißt, g ist die einzige Abbildung, die die eine oder die andere Eigenschaft hat. 16 Beweis von Lemma 3.10. a) Da X nicht leer ist, dürfen wir ein Element x0 ∈ X wählen. Sei y ∈ Y . Ist y ∈ Bild(f ), so gibt es wegen Injektivität genau ein x ∈ X mit f (x) = y, und wir setzen g(y) = dieses x. Ist y 6∈ Bild(f ), so können wir g(y) = x0 setzen. Somit ist g überall definiert, und es ist g ◦ f = IdX . b) Für jedes y ∈ Y ist die Urbildmenge f −1 ({y}) = {x ∈ X | f (x) = y} nicht leer, weshalb wir zu jedem y ∈ Y ein Element xy ∈ f −1 ({y}) wählen dürfen (beachte dazu aber Abschnitt 3.1.1). Durch g : y 7→ xy ist dann eine Abbildung g : Y → X definiert, und es ist (f ◦ g)(y) = f (g(y)) = f (xy ) = y. c) „⇒“: Wenn f bijektiv ist, gibt es zu jedem y ∈ Y genau ein Element xy ∈ X mit f (xy ) = y. Definieren wir g : Y → X durch g(y) = xy , so gilt f ◦ g = IdY sofort, denn f ◦ g(y) = f (xy ) = y. Sei jetzt x ∈ X und z = g(f (x)). Es ist f (z) = f (g(f (x))) = (f ◦ g)(f (x)) = f (x), denn f ◦ g = IdY . Also z = x, denn f ist injektiv. Das heißt, g ◦ f = IdX . „⇐“: Es sei g : Y → X eine Abbildung mit den Eigenschaften g ◦ f = IdX und f ◦ g = IdY . Identitätsabbildungen sind injektiv und surjektiv. Somit ist g ◦ f injektiv, weshalb nach Lemma 3.9 auch f injektiv ist. Außerdem ist f ◦ g surjektiv und deshalb auch f surjektiv. Also ist f bijektiv. Eindeutigkeit von g: Sei h : Y → X eine Abbildung mit h ◦ f = IdX . Für jedes y ∈ Y gibt es ein x ∈ X mit f (x) = y, denn f ist surjektiv. Also h(y) = h(f (x)) = x = g(f (x)) = g(y). Da dies für jedes y ∈ Y gilt, ist g = h. Sei nun f ◦ h = IdY . Für jedes y ∈ Y gilt also f (h(y)) = y = f (g(y)). Insbesondere gilt h(y) ∈ f −1 ({y}) und g(y) ∈ f −1 ({y}). Weil f injektiv ist, sind Urbilder eindeutig, und daher h(y) = g(y). Da dies für jedes y ∈ Y gilt, ist g = h. 3.1.1 Das Auswahlaxiom In Teil b) des Beweises von Lemma 3.10 haben wir verwendet, dass wir für alle y ∈ Y gleichzeitig jeweils ein beliebiges Urbildelement wählen können. Auf den ersten Blick erscheint dies harmlos, doch es erfordert ein eigens konzipiertes Axiom, das Auswahlaxiom. Es besagt: Wenn M eine Menge paarweise disjunkter nicht-leerer Mengen ist (das heißt, ∀M, N ∈ M : M ∩ N 6= ∅ ⇒ M = N und ∀M ∈ M : M 6= ∅), dann gibt es eine „Auswahlmenge“ A, so dass ∀M ∈ M : |A ∩ M | = 1. In Beweisteil b) betrachtet man die Menge M = {f −1 ({y}) | y ∈ Y }. Wenn für y1 , y2 ∈ Y gilt, dass x ∈ f −1 ({y1 }) ∩ f −1 ({y2 }), dann folgt nach Definition der Urbildmenge y1 = f (x) = y2 . Die Urbildmengen von zwei verschiedenen Elementen von Y sind also disjunkt. Da f surjektiv ist, gilt zudem f −1 ({y}) 6= ∅ 17 für alle y ∈ Y . Nach dem Auswahlaxiom gibt es also eine Menge A, so dass für jedes y ∈ Y die Menge A ∩ f −1 ({y}) genau ein Element enthält; dieses Element nennen wir xy und definieren dann g : Y → X durch g(y) = xy . Die Existenz der Abbildung g (der Auswahlfunktion) und die Existenz der Menge A sind untrennbar verknüpft, denn es gilt A = {g(y) | y ∈ Y }. Ist A gegeben, so ist dadurch g bestimmt. Ist g gegeben, so ist {g(y) | y ∈ Y } nach dem Ersetzungsaxiom eine Menge, und durch diese wird die Aussage des Auswahlaxioms erfüllt. Die Abbildung g wird also als Auswahlregel verwendet. Das Auswahlaxiom erscheint einleuchtend und mit ihm lassen sich manche sehr „elegante“ Sätze beweisen. Andererseits lassen sich mit ihm auch Sätze beweisen, die der Intuition eklatant widersprechen. Es wurde daher untersucht, ob das Auswahlaxiom vielleicht den Zermelo–Fraenkel–Axiomen widerspricht (in diesem Fall dürfte man es natürlich nicht verwenden) oder ob es vielleicht aus den Zermelo–Fraenkel–Axiomen folgt (in diesem Fall wäre es also kein Axiom, sondern ein Theorem). Es zeigte sich: • Wenn M nur endlich viele Mengen enthält, gilt für M das Auswahlaxiom. Der Beweis erfordert vollständige Induktion, die wir noch kennen lernen werden. • Wenn die Elemente von M Mengen mit einer besonderen Struktur sind, kann man oft eine Auswahlfunktion explizit angeben, so dass das Auswahlaxiom in diesem Fall gilt: – Wenn M ⊆ P(N) ist, dann kann man aus jedem M ∈ M jeweils das kleinste Element wählen. – Wenn alle Elemente von M jeweils Dreiecke sind, dann kann man aus diesen Dreiecken jeweils den Schwerpunkt auswählen. • Wenn die übrigen Zermelo–Fraenkel–Axiome widerspruchsfrei sind, dann entstehen durch Hinzunahme des Auswahlaxioms keine Widersprüche. Dies bewies Kurt Gödel [1906–1978] im Jahre 1938. • Wenn die übrigen Zermelo–Fraenkel–Axiome widerspruchsfrei sind, dann entstehen durch Hinzunahme der Negation des Auswahlaxioms ebenfalls keine Widersprüche. Dies bewies Paul Cohen [1934–2007] im Jahre 1963. Dies Ergebnisse von Gödel und Cohen besagen also, dass das Auswahlaxiom von den übrigen Zermelo–Fraenkel–Axiomen unabhängig ist. Es gilt als guter Stil, in Beweisen das Auswahlaxiom nur zu verwenden, wenn es nicht anders geht. Bemerkung 3.12 Wenn f : X → Y eine bijektive Abbildung ist, dann besteht für jedes y ∈ Y die Urbildmenge f −1 ({y}) jeweils aus einem einzelnen Element. Bei der Konstruktion der Umkehrabbildung f −1 : Y → X müssen wir also nicht 18 wählen. Die Umkehrabbildung einer bijektiven Abbildung existiert also auch ohne das Auswahlaxiom. 3.2 Binäre Relationen Wir führen Relationen ein. Die wichtigsten Relationen sind Äquivalenzrelationen (etwa „Peter und Sabine haben den gleichen Geburtstag“) sowie Ordnungsrelationen (etwa „Jena hat weniger Einwohner als Erfurt“). Definition 3.13 Sei X eine Menge. Eine (binäre bzw. zweistellige) Relation auf X ist eine Teilmenge R ⊆ X × X. Sind x, y ∈ X, so schreibt man meistens x R y anstelle von (x, y) ∈ R. Somit ist x R y eine Aussage, also entweder wahr oder falsch. Eine Relation heißt • reflexiv, falls x R x gilt für jedes x ∈ X. • symmetrisch, falls x R y genau dann gilt, wenn y R x gilt. • transitiv, falls x R z aus x R y und y R z folgt. Bemerkung 3.14 Für jedes n ∈ N kann man n-stellige (oder n-äre) Relationen als Teilmengen von X ×X × · · · × X} definieren. Beispielsweise ist „x, y, z bilden {z | n mal die Ecken eines gleichseitigen Dreiecks“ eine 3-stellige Relation of R2 . In dieser Vorlesung spielen aber nur zweistellige Relationen eine Rolle. Beispiel 3.15 a) Die Relation „besucht die gleiche Klasse wie“, definiert auf der Menge der SchülerInnen einer Schule, ist reflexiv (jedes Kind besucht die gleich Klasse wie es selbst), symmetrisch (wenn Peter die gleiche Klasse wie Sabine besucht, dann besucht Sabine auch die gleiche Klasse wie Peter) und transitiv (wenn Peter die gleiche Klasse wie Sabine besucht und Sabine die gleiche Klasse wie Paul besucht, dann besuchen Peter und Paul die gleiche Klasse). b) Die Relation „mag“ ist nicht notwendig reflexiv (nicht jeder Mensch mag sich selbst), nicht notwendig symmetrisch (vielleicht mag Peter Sabine, aber Sabine mag nicht Peter) und nicht notwendig transitiv (wenn Peter Sabine mag und Sabine Paul mag, dann ist es möglich, dass Peter Paul nicht mag). c) Sei f : X → X eine Abbildung. Der Graph von f ist die Teilmenge F ⊆ X × X gegeben durch F = {(x, f (x)) | x ∈ X} . 19 Wie jede Teilmenge von X ×X ist auch der Funktionsgraph F eine Relation auf X. Gemäß Alternativ–Definition 3.2 ist f durch diese Relation eindeutig bestimmt. 3.2.1 Äquivalenzrelationen Definition 3.16 Eine Äquivalenzrelation ist eine Relation, die reflexiv, symmetrisch und transitiv ist. Typischerweise bezeichnet man eine Äquivalenzrelation mit ∼, also x ∼ y anstelle von x R y. Beispiele • X = alle Städte Deutschlands: Relation „liegt im gleichen Bundesland wie“ ist eine Äquivalenzrelation. • X = die Kinder aus der 6b: Relation „hat den gleichen Geburtstag wie“ ist eine Äquivalenzrelation. • X = R3 mit der Relation „(u1 , u2 , u3 ) R (v1 , v2 , v3 ) ⇔ stimmen an mindestens zwei Stellen überein“: Die Relation ist reflexiv und symmetrisch, aber nicht transitiv, denn (1, 1, 1) R (1, 1, 2) und (1, 1, 2) R (1, 2, 2), aber nicht (1, 1, 1) R (1, 2, 2). Also ist es keine Äquivalenzrelation. Definition 3.17 Ist ∼ eine Äquivalenzrelation auf der Menge X, so nennt man die Menge [x] = [x]∼ = {y ∈ X | y ∼ x} die Äquivalenzklasse eines Elements x ∈ X. Ist ∼ eine Äquivalenzrelation auf der Menge X, so bezeichnet man mit X/∼ die Menge der Äquivalenzklassen: X/∼ = {[x] | x ∈ X}. Beispiel 3.18 Brüche sind durch Zähler und Nenner gegeben. Zwei Brüche sind gleich, wenn sie nach vollständigem Kürzen den gleichen Zähler und Nenner haben. Dies ist eine Äquivalenzrelation und die Menge Q der rationalen Zahlen kann man also als Menge von Äquivalenzklassen von Brüchen betrachten. Lemma 3.19 Sei ∼ eine Äquivalenzrelation auf der Menge X. Dann ist x ∈ [x] für jedes x ∈ X, wegen Reflexivität. Außerdem sind für x, y ∈ X folgende drei Aussagen äquivalent: a) x ∼ y b) [x] ∩ [y] 6= ∅. c) [x] = [y] Beweis. Wir zeigen a) ⇒ b) ⇒ c) ⇒ a). a) ⇒ b) Aus x ∼ y folgt x ∈ [y]. Wegen Reflexivität ist aber auch x ∈ [x]. Daher ist x ∈ [x] ∩ [y], also [x] ∩ [y] 6= ∅. 20 b) ⇒ c) Wenn [x] ∩ [y] 6= ∅, dann gibt es ein z ∈ [x] ∩ [y]. Wir wollen nun zeigen, dass [x] ⊆ [y]; wenn also w ∈ [x], so wollen wir zeigen, dass auch w ∈ [y]. Aus w ∈ [x] folgt w ∼ x. Wegen z ∈ [x] ist z ∼ x, also x ∼ z wegen Symmetrie. Aus w ∼ x und x ∼ z folgt w ∼ z wegen Transitivität. Aufgrund von z ∈ [y] gilt z ∼ y, also aus w ∼ z folgt w ∼ y wegen Transitivität, also w ∈ [y], was zu zeigen war. Analog folgt [y] ⊆ [x], also [y] = [x], also c). c) ⇒ a) Wenn [x] = [y], dann x ∈ [x] = [y], daher x ∼ y. Bemerkung 3.20 Laut des Lemmas stellen die Äquivalenzklassen von ∼ eine Partition der Menge X dar, d.h. X ist die Vereinigung von paarweise disjunkten, nichtleeren Äquivalenzklassen. 3.2.2 Ordnungsrelationen Definition 3.21 Eine Relation R auf X heißt • antisymmetrisch, genau dann wenn für x, y ∈ X aus x R y und y R x folgt, dass x = y. • linear, falls für x, y ∈ X mindestens eins aus x R y und y R x gelten muss. Definition 3.22 Eine Teilordnung ist eine Relation, die reflexiv, antisymmetrisch und transitiv ist. Eine lineare Ordnung heißt eine Ordnung, Totalordnung oder lineare Ordnung. Beispiel 3.23 • Auf X = R ist ≤ eine Totalordnung. Vorsicht: streng genommen ist < in diesem Sinne keine Ordnung, da nicht reflexiv. • X = Menge aller Menschen: „ist Nachkomme von“ ist eine Teilordnung, aber keine Totalordnung. • X eine Menge von Mengen: „ist Teilmenge von“ ist eine Teilordnung, aber keine Totalordnung (Übung). 21 4 Natürliche Zahlen und Induktion Die Fähigkeit, kleine Mengen nach ihrer Größe vergleichen zu können, scheint angeboren zu sein.10 Für die jeweiligen Größen von kleinen Mengen lernen Kinder Zahlwörter („eins“, „zwei“, „drei“, „vier“, „fünf“) und lernen gleichzeitig, dass die Größen und damit auch die Zahlwörter in einer festen Reihenfolge stehen (man nimmt immer ein Ding hinzu): Sie lernen in beschränktem Umfang zu zählen. Um auch für eine größere Menge entscheiden zu können, ob sie gleich groß zu einer anderen Menge ist, kann man eine „Anschauungshilfe“ verwenden. So war gemäß archäologischer Funde (Ishango–Knochen, ca. 20000 Jahre alt und damit älter als der Ackerbau) das Kerbholz vermutlich bereits in der Steinzeit bekannt. Dies setzt die Erkenntnis voraus, dass „gleich viel“ herauskommt, wenn man etwa für jedes Tier einer Herde eine Kerbe in ein Stück Holz oder Knochen ritzt oder einen Knoten in eine Schnur knüpft. Das geht auch, wenn man für diese Zahlen keine Zahlwörter zur Verfügung hat. In der Schule soll über kleine Zahlen und über die Verwendung von Anschauungshilfen hinaus gegangen werden. Man lernt, dass man Zahlen statt mit einer Knotenschnur kompakter mit einem Stellenwertsystems darstellen kann. Außerdem lernt man in der Schule das Rechnen mit natürlichen Zahlen: Addition N × N → N, (m, n) 7→ m + n und Multiplikation N × N → N, (m, n) 7→ m · n. Man lernt, dass dabei folgende Axiome jeweils für alle `, m, n ∈ N gelten: (N1) ` + (m + n) = (` + m) + n (Assoziativität der Addition) (N2) m + n = n + m (Kommutativität der Addition) (N3) m + 0 = m (Neutralität der Null in der Addition) (N4) ` · (m · n) = (` · m) · n (Assoziativität der Multiplikation) (N5) m · n = n · m (Kommutativität der Multiplikation) (N6) n · 1 = n (Neutralität der Eins in der Multiplikation) (N7) ` · (m + n) = ` · m + ` · n (Distributivgesetz). Ferner möchte man mit den Umkehroperationen „−“ und „÷“ rechnen — auch dann, wenn dies in N nicht möglich ist. So kommt man auf Z und schließlich auf Q, für die die obigen Axiome immer noch gelten. Da Axiome (N1)–(N7) also nicht nur durch die natürlichen Zahlen, sondern auch durch Z und Q und viele weitere mathematische Strukturen erfüllt werden, sind diese Axiome nicht geeignet für eine Definition der natürlichen Zahlen. In dieser Beschreibung werden mehrere Sichtweisen auf die natürlichen Zahlen berührt, die im weiteren Verlauf der Vorlesung thematisiert werden sollen: 10 Sie existiert zum Teil auch bei Tieren. Eine Störung dieser Fähigkeit kann bei Kindern zu Dyskalkulie führen. 22 Kardinalzahlen: Was heißt es für Mengen, „gleich groß“ zu sein? Was sind endliche Mengen? Ordinalzahlen, Induktion: Wie kann man die natürlichen Zahlen durch ihre Abfolge beim Zählen formal beschreiben und dies in Beweisen ausnutzen? Arithmetik: Wie rechnet man mit natürlichen Zahlen? Algebra: In welchen anderen mathematischen Konstruktionen kann man einige der obigen Axiome wiederfinden, und welche Strukturaussagen kann man aus den jeweils geltenden Axiomen herleiten? 4.1 4.1.1 Natürliche Zahlen als Kardinalzahlen Gleichmächtigkeit Definition 4.1 Seien A, B Mengen. • A und B heißen gleichmächtig, Bezeichnung |A| = |B|, genau dann wenn es eine Bijektion f : A → B gibt. • Gibt es eine injektive Abbildung f : A → B, so schreibt man |A| ≤ |B|. • A heißt echte Teilmenge von B, Bezeichnung A ( B, genau dann wenn A ⊆ B und A 6= B. Beispiel 4.2 a) Wenn man beim Zählen einer Tierherde für jedes Tier einen Knoten in eine Schnur knüpft, erzeugt man ein bijektive Abbildung von der Herde in die Menge der Knoten. Die Menge der Knoten und die Tierherde sind also gleichmächtig. b) Kerbhölzer wurden früher zur Dokumentierung von Schuldverhältnissen benutzt. Die Anzahl der Kerben (quer über einen Stab) entsprach der Höhe der Schulden. Das Holz wurde dann längs gespalten, so dass jede Kerbe in der Mitte geteilt wurde, und jede Vertragspartei erhielt eine Holzhälfte. Die beiden Hälften wiesen jeweils die gleiche Anzahl von Halb-Kerben auf. Jede Vertragspartei war damit in der Lage, die Höhe der Schulden nachzuweisen, und nachträgliche Manipulationen konnten nachgewiesen werden, indem man die beiden Holzhälften wieder passend aneinander legte. c) Wenn A ⊆ B, dann ist |A| ≤ |B|, denn (IdB ) |A : A → B ist injektiv. Bemerkung 4.3 Da die Gesamtheit aller Mengen keine Menge bildet, kann man „Gleichmächtigkeit“ streng genommen nicht als Relation bezeichnen. Allerdings ist sie reflexiv, symmetrisch und transitiv (Übung!) und damit fast so etwas wie eine Äquivalenzrelation. 23 4.1.2 (Un-)endliche Mengen Intuitiv ist klar: Die Mächtigkeit |X| einer endlichen Menge X ist eine natürliche Zahl, und für jede natürliche Zahl gibt es eine endlich Menge dieser Mächtigkeit. Man könnte die natürlichen Zahlen also mit den Mächtigkeiten endlicher Mengen identifizieren. Problem: Wie kann man den Begriff einer endlichen Menge definieren, ohne den Begriff der natürlichen Zahl vorauszusetzen? Wir gehen einerseits von einem intuitiven Verständnis des Begriffes „endliche Menge“ aus; dabei gehen wir auch von einem intuitiven Verständnis dafür aus, was natürliche Zahlen sind. Ein Appell an die Intuition ist natürlich kein Ersatz für eine Definition. Daher geben wir auch noch eine von Richard Dedekind [1831– 1916] stammende formale Definition dieses Begriffs. Wir zeigen dann Gründe dafür auf, dass beide Begriffe übereinstimmen. Definition 4.4 (intuitiv unendlich) Eine Menge X heißt unendlich, genau dann wenn es eine nicht-endende Folge x0 , x1 , x2 , ... von Elementen von X gibt, so dass für jedes n = 0, 1, 2, ... gilt: xn+1 ∈ X \ {x0 , x1 , x2 , ..., xn }. Andernfalls heißt X endlich. Das Problem dieser Begriffsbeschreibung ist, dass wir hier bereits ein intuitives Verständnis der natürlichen Zahlen („n = 0, 1, 2, ...“, „n + 1“) verwenden. Streng genommen handelt es sich also nicht um eine Definition, aber trotzdem können wir zeigen, dass dadurch im Wesentlichen der gleiche Begriff wie durch die folgende „echte“ Definition beschrieben wird. Definition 4.5 (Dedekind–unendlich) Eine Menge heißt unendlich, genau dann wenn sie gleichmächtig zu einer echten Teilmenge ist. Sonst heißt sie endlich. Bemerkung 4.6 Man kann leicht zeigen (Übung): Eine Menge X ist unendlich, genau dann wenn es eine injektive aber nicht surjektive Abbildung φ : X → X gibt. Wenn wir nun zeigen, dass Dedekinds Begriff der unendlichen Menge mit unserem intuitiven Begriff übereinstimmt, so kann das natürlich kein „echter“ Beweis sein, da ja einer der vorkommenden Begriffe nicht „echt“ definiert wurde. Aber zumindest sollte argumentativ klar werden, dass Dedekinds formaler Unendlichkeitsbegriff unserem intuitiven Begriff entspricht. Lemma 4.7 Wenn eine Menge X0 im Sinne von Definition 4.5 unendlich ist, dann ist sie auch im Sinne von Definition 4.4 unendlich. Beweis. Wenn X0 unendlich im Sinne von Definition 4.5 ist, dann gibt es eine injektive nicht surjektive Abbildung φ : X0 → X0 . Wir bezeichnen X1 = φ(X0 ). Da φ nicht surjektiv ist, ist X1 eine echte Teilmenge von X0 . 24 Wir definieren weiter X2 = φ(X1 ), X3 = φ(X2 ) usw. Wegen X1 ⊆ X0 gilt auch φ(X1 ) ⊆ φ(X0 ), also X2 ⊂ X1 . Entsprechend gilt X3 ⊆ X2 , X4 ⊆ X3 usw. Da X1 eine echte Teilmenge von X0 ist, gibt es ein x0 ∈ X0 \X1 . Wir definieren x1 = φ(x0 ), x2 = φ(x1 ), usw. Es ist x1 = φ(x0 ) ∈ φ(X0 ) = X1 . Wir beweisen nun: x1 ∈ / φ(X1 ) = X2 . Wäre nämlich x1 ∈ φ(X1 ) = X2 , so gäbe es ein x ∈ X1 mit x1 = φ(x) = φ(x0 ). Da φ injektiv ist, würde daraus x = x0 folgen. Das wäre ein Widerspruch, denn x0 ∈ X0 \ X1 , aber x ∈ X1 . Also ist x1 ∈ / X2 . Wir haben im vorigen Abschnitt gezeigt, dass x1 ∈ X1 \ X2 , und in gleicher Weise folgt x2 ∈ X2 \ X3 , x3 ∈ X3 \ X4 und so weiter. Wir wissen bereits, dass X0 ⊇ X1 ⊇ X2 ⊇ · · · , und dies impliziert X0 \ X1 ⊆ X0 \ X2 ⊆ X0 \ X3 ⊆ · · · : Wenn wir nämlich von X0 eine kleinere Menge abziehen (X2 ⊆ X1 ), dann ist die Differenzmenge größer (X0 \ X2 ⊇ X0 \ X1 ). Wir zeigen abschließend, dass die x0 , x1 , x2 , ... paarweise verschieden sind. Es sei n = 0, 1, 2, .... Nach dem vorigen Absatz gilt x0 ∈ X0 \X1 ⊆ X0 \X2 ⊆ · · · , x1 ∈ X1 \ X2 ⊆ X0 \ X2 ⊆ X0 \ X3 und so weiter. Wir finden also {x0 , x1 , x2 , ..., xn } ⊆ X0 \ Xn+1 . Weil aber xn+1 ∈ Xn+1 , muss xn+1 folglich von allen x0 , x1 , x2 , ... verschieden sein, denn diese liegen ja gerade nicht in Xn+1 . Also ist xn+1 ∈ X0 \ {x0 , x1 , x2 , ..., xn }. Dies gilt für alle n = 0, 1, 2, ..., daher ist X0 unendlich im Sinne von Definition 4.4. Lemma 4.8 Wenn eine Menge X0 im Sinne von Definition 4.4 unendlich ist, dann ist sie auch im Sinne von Definition 4.5 unendlich. Beweis. Wenn X0 im Sinne von Definition 4.4 unendlich ist, dann gibt es eine nicht endende Folge x0 , x1 , x2 , ... von Elementen von X0 , so dass für jedes n = 0, 1, 2, ... gilt: xn+1 ∈ X0 \{x0 , x1 , x2 , ..., xn }. Insbesondere ist stets xn+1 6= x0 . Wir definieren eine Abbildung φ : X0 → X0 wie folgt: φ(xn ) = xn+1 φ(x) = x für n = 0, 1, 2, ... für x ∈ X0 \ {x0 , x1 , x2 , ...} Offensichtlich ist die Abbildung φ nicht surjektiv, denn x0 ∈ / φ(X0 ). Wir werden nun zeigen, dass φ injektiv ist. Für jedes y ∈ X0 \ {x0 } ist also zu zeigen, dass das Urbild φ−1 ({y}) aus höchstens einem Element besteht. Hier unterscheiden wir zwei Fälle. a) Wenn y ∈ X0 \ {x0 , x1 , x2 , ...}, dann ist φ−1 ({y}) = {y}. b) Wenn y ∈ {x1 , x2 , x3 ...}, dann ist φ−1 ({y}) ⊂ {x0 , x1 , x2 , ...}, und wenn y = xi dann ist xi−1 ∈ φ−1 ({y}). Es bleibt zu zeigen, dass dies das einzige Urbild ist: Wenn xj ∈ φ−1 ({xi }), dann müssen wir j = i − 1 beweisen. i) Sei j ≥ i. Dann folgt φ(xj ) = xj+1 ∈ X0 \ {x0 , x1 , x2 , ..., xj } und xi ∈ {x0 , x1 , x2 , ..., xj }. Also ist φ(xj ) 6= xi , Widerspruch. 25 ii) Sei j < i − 1. Dann ist φ(xj ) = xj+1 ∈ {x0 , x1 , x2 , ..., xi−1 }, aber xi ∈ X0 \ {x0 , x1 , x2 , ..., xi−1 }, Widerspruch. Da wir j ≥ i und j < i − 1 ausgeschlossen haben, muss j = i gelten. Wir haben also gezeigt: φ : X0 → X0 ist injektiv aber nicht surjektiv. Also ist X0 unendlich im Sinne von Definition 4.5. Wir erhalten somit eine erste hinreichend genaue Beschreibung der Menge der natürlichen Zahlen. Axiom 4.9 (Natürliche Zahlen als Kardinalzahlen) Es gibt eine Menge N von endlichen Mengen (im Sinne von Definition 4.5), so dass es für jede endliche Menge E genau ein Element e ∈ N gibt, so dass E und e gleichmächtig sind. Die Menge N heißt Menge der natürlichen Zahlen. 4.2 Natürliche Zahlen als Ordinalzahlen Für eine Dedekind–unendliche Menge X gibt es eine injektive nicht surjektive Abbildung φ : X → X. Im Beweis von Lemma 4.7 haben wir mittels φ eine unendliche Folge x0 , x1 , x2 , ... von Elementen von X konstruiert. Dabei hat φ jedes dieser Elemente auf das jeweils „nächste“ abgebildet. Durch φ ist also eine Reihenfolge von Elementen gegeben — genau, wie es auch beim Zählen eine Reihenfolge gibt. Diese Beobachtung ist der Schlüssel für eine Definition von natürlichen Zahlen, die Giuseppe Peano [1858–1932] 1889 vorschlug. Im Vergleich zu Axiom 4.9 haben die Peano–Axiome den Vorteil, dass sie gleichzeitig eine sehr mächtige Beweistechnik liefern, nämlich die vollständige Induktion. Axiom 4.10 (Peano–Axiome, natürliche Zahlen als Ordinalzahlen) Es gibt eine Menge N, ein Element 0 ∈ N und eine Abbildung φ : N → N mit folgenden Eigenschaften: a) φ ist injektiv b) Bild φ = N \ {0} c) Wenn für eine Teilmenge T ⊆ N sowohl 0 ∈ T als auch φ(T ) ⊆ T gelten, dann ist T = N. Die Menge N heißt Menge der natürlichen Zahlen. Eigenschaften a) und b) sorgen dafür, dass N eine unendliche Menge im Sinne von Definition 4.5 ist, und definieren die Zahl 0. Die dritte Eigenschaft besagt, dass N die „kleinste“ unendliche Menge ist. Axiome 4.9 und 4.10 besagen im Wesentlichen das gleiche, man kann also natürliche Zahlen sowohl als Kardinal- als auch als Ordinalzahlen beschreiben. Das werden wir allerdings nicht beweisen. Wir werden ab jetzt N stets im Sinne von Axiom 4.10 auffassen, wenn nichts anderes gesagt wird. 26 4.3 Die Peano–Axiome in Beweisen und Definitionen Es seien N, 0 und φ wie in Axiom 4.10. Wenn n eine natürliche Zahl ist, so schreibt man statt φ(n) meist n + 1 (das ist nur eine Schreibweise und keine Addition) oder auch n0 und nennt diese Zahl den Nachfolger von n. Wegen Axiom 4.10.c) kann man jede natürliche Zahl aus der Null gewinnen, wenn man oft genug φ anwendet. Wir können also die natürlichen Zahlen schreiben als 0, 0 + 1, (0 + 1) + 1, ((0 + 1) + 1) + 1, (((0 + 1) + 1) + 1) + 1, ... oder auch 0, 00 , 000 , 0000 , .... Wir können jetzt zählen, jedoch noch nicht rechnen. Doch Zählen ist genug für sehr wichtige Beweis– und Definitionstechniken, die wir in den folgenden Unterkapiteln erklären. In den Beispielen betrachten wir das Rechnen mit natürlichen Zahlen als Schulstoff, den wir erst später in der Vorlesung thematisieren. 4.3.1 Vollständige Induktion Da wir alle natürlichen Zahlen schrittweise aus der Null erhalten können, können wir auch schrittweise Beweise führen: Wenn eine Aussage für die Null gilt und wenn zudem die Wahrheit der Aussage beim Schritt auf die jeweils nächste Zahl erhalten bleibt, dann folgt, dass die Aussage für alle natürlichen Zahlen gilt. Man startet also bei einem Beispiel (der Null) und schreitet dann fort auf das nächste und übernächste Beispiel, um auf diese Weise eine allgemeine Aussage zu beweisen. In der Philosophie nennt man einen Schluss von Beispielen auf allgemeine Erkenntnisse einen Induktionsschluss 11 , im Gegensatz zum Deduktionsschluss 12 , bei dem allgemeine Prinzipien auf ein konkretes Beispiel angewandt werden. Ein Induktionsschluss wird in der Philosophie meist als formal fragwürdig angesehen, denn wie sollte man von ein paar Beispielen formal auf eine allgemeine Aussage kommen. Daher muss an dieser Stelle betont werden, dass es beim oben skizzierten schrittweisen Beweis nicht nur um „ein paar Beispiele“ geht: Axiom 4.10.c) besagt, dass wir auf diese Weise alle nur möglichen Beispiele und damit den Allgemeinfall betrachten. Man spricht daher in der Mathematik von der „vollständigen Induktion“, die gemäß des folgenden Lemmas eine formal zulässige Schlusstechnik ist. Entgegen ihres Namens ist sie deduktiv. Ihre Bedeutung für die mathematische Arbeit ist enorm. Lemma 4.11 (Prinzip der vollständigen Induktion) Es sei P (n) eine Aussageform. Es gelte Induktionsanfang: P (0) = W , und Induktionsschritt: ∀n ∈ N : (P (n) ⇒ P (n + 1)). Dann gilt ∀n ∈ N : P (n). 11 12 von lat. inducere: ’herbeiführen’, ’veranlassen’, ’einführen’ von lat. deducere: ’ableiten’, ’fortführen’ 27 Beweis. Wir definieren T = {n ∈ N : P (n)}, was nach dem Aussonderungsaxiom eine Teilmenge von N ist. Nach Definition von T gilt: ∀n ∈ T : P (n). Wegen des Induktionsanfangs ist 0 ∈ T . Es sei nun n ∈ T . Es gilt also P (n). Wegen des Induktionsschritts folgt P (n + 1). Also ist auch n + 1 = φ(n) ∈ T . Da dies für alle n ∈ T gilt, folgt φ(T ) ⊂ T . Nach Axiom 4.10.c) folgt T = N. Wir erhalten also ∀n ∈ N : P (n). In vielen (aber sicher nicht allen) Fällen beweist man den Induktionsschritt durch einen direkten Beweis. Man setzt also voraus, dass P (n) wahr ist — dies nennt man die Induktionsannahme —, und beweist, dass dann auch P (n + 1) wahr sein muss. Den Induktionsschritt kann man aber auch anders beweisen: Durch Kontraposition oder durch einen Widerspruchsbeweis, ja, es kommt sogar vor, dass man den Beweis des Induktionsschrittes wieder mittels vollständiger Induktion führt. Wir werden noch viele Beweise durch vollständige Induktion führen. Hier ist ein erstes Beispiel. Beispiel 4.12 Sei an = 0 + 1 + 2 + 3 + · · · n. Dann gilt an = n(n+1) 2 für alle n ∈ N. Beweis durch vollständige Induktion über n. Induktionsanfang: Tatsächlich ist a0 = 0 = 0·1 . 2 Induktionsschritt: Die Induktionsannahme ist an = dass dann auch an+1 = (n+1)(n+2) gilt: 2 n(n+1) . 2 Wir beweisen nun, n(n + 1) + (n + 1) 2 n(n + 1) + 2(n + 1) (n + 1)(n + 2) = = , 2 2 an+1 = an + (n + 1) = wie erwünscht. Nach dem Prinzip der vollständigen Induktion ist dadurch die Behauptung bewiesen für alle n ∈ N. Bemerkung 4.13 Eine vollständige Induktion muss nicht unbedingt bei n = 0 beginnen. Man kann zum Beispiel n = 5 als Induktionsanfang wählen und mit dem Induktionsschritt ∀n ∈ N : ((n ≥ 5 ∧ P (n)) ⇒ P (n + 1)) arbeiten. Es folgt dann P (n) für alle natürlichen Zahlen n ≥ 5. 28 4.3.2 Rekursive Definitionen Wenn n ∈ N \ {0}, dann gibt es wegen Axiom 4.10.b) eine natürliche Zahl, die durch φ auf n abgebildet wird. Diese Zahl ist eindeutig bestimmt, denn φ ist injektiv nach Axiom 4.10.a). Man nennt sie den Vorgänger n − 1 von n (n − 1 ist wieder nur eine Bezeichnung und keine Subtraktion). Insbesondere ist n der Vorgänger von φ(n). Man kann eine Abbildung f : N → X definieren, indem man • f (0) ∈ X angibt; und • für jedes n ≥ 1 beschreibt, wie man f (n) aus f (n − 1) berechnen kann. Eine solche Definition einer Abbildung heißt rekursiv. Allgemein kann eine rekursive Definition auch bei einem anderen Anfangswert als Null beginnen: Man erhält eine Abbildung von {n ∈ N : n ≥ Anfangswert} nach X. Beispiel n-Fakultät: n! = 1 · 2 · 3 · · · · · (n − 1) · n ist rekusiv definiert durch 0! = 1, und n! = n · (n − 1)! für n ≥ 1. Zum Beispiel 3! = 3 · 2! = 3 · 2 · 1! = 3 · 2 · 1 · 0! = 3 · 2 · 1 · 1 = 6. Notation 4.14 Es sei n ∈ N und es seien a0 , a1 , . . . , an Zahlen. Die Summe P Q Pn ai und das Produkt ni=0 ai werden rekursiv definiert durch 0i=0 ai = a0 = i=0 Q0 i=0 ai und n X i=0 ai = n−1 X n Y ! ai + an i=0 i=0 ai = n−1 Y ! ai · an . i=0 Beispiel Für a0 = 2, a1 = 3 und a2 = 5 ist 2 X 2 Y ai = (2 + 3) + 5 = 10 i=0 i=0 29 ai = (2 · 3) · 5 = 30 . 5 Elementare Arithmetik Wir können nun mittels rekursiver Definitionen und vollständiger Induktion die Grundrechenarten definieren und einige Struktureigenschaften beweisen. Es seien dazu wieder N, 0 ∈ N und φ : N → N wie in Axiom 4.10. Manche einfacheren Beweise werden als Hausaufgaben gestellt. Im Skript werden diese Beweise erscheinen, nachdem die entsprechenden Hausaufgaben abgegeben wurden. In den Beweisen achten wir zunächst darauf, in jedem Beweisschritt genau zu sagen, auf welches schon bekannte Ergebnis wir uns jeweils berufen. Das wird später etwas laxer gehandhabt werden, denn sobald wir alle Axiome (N1)– (N7) bewiesen haben, werden wir sie in Rechnungen mit den natürlichen Zahlen nicht mehr weiter erwähnen. Definition 5.1 1 = φ(0). Lemma 5.2 Für alle n ∈ N gilt φ(n) 6= n. Beweis durch vollständige Induktion nach n. Induktionsanfang n = 0: Nach Axiom 4.10.b) ist 0 ∈ / Bild(φ), also φ(0) 6= 0. Induktionsschritt: Die Induktionsannahme ist φ(n) 6= n. Weil φ gemäß Axiom 4.10.a) injektiv ist, folgt φ (φ(n)) 6= φ(n). Damit ist der Induktionsschritt bewiesen, und nach dem Prinzip der vollständigen Induktion folgt daraus das Lemma. 5.1 Addition Der Vorgänger von n ∈ N \ {0} wird wieder mit n − 1 bezeichnet. Um Verwechslungen mit der nun zu definierenden Addition auf N zu vermeiden, verwenden wir für den Nachfolger von n die Notation φ(n) statt n + 1. Für eine natürliche Zahl n betrachten wir + n als eine Abbildung von N nach N: Diese Abbildung bildet m ∈ N auf m + n ∈ N ab und ist rekursiv wie folgt definiert. Definition 5.3 Es sei n ∈ N. Für beliebige m ∈ N definieren wir a) m + 0 = m (dies ist der Fall n = 0) und b) m + n = φ (m + (n − 1)), falls n 6= 0. Am Anfang von Abschnitt 4 erinnerten wir an einige aus der Schule bekannte Axiome (N1)–(N7) für die Grundrechenarten. Wir erkennen, dass Axiom (N3) (Neutralität der Null in der Addition) direkt aus Definition 5.3 folgt. In den beiden folgenden Abschnitten werden wir (N2) und schließlich (N1) beweisen. 30 Bemerkung 5.4 Für alle n ∈ N ist φ(n) = n + 1, wobei wir die rechte Seite der Gleichung diesmal nicht als Schreibweise, sondern als Summe betrachten. Beweis. Es ist 0 der Vorgänger von 1. Definition 5.3 gilt natürlich auch mit geänderten Namen. Es gilt also n+1 = φ(n+0) nach Definition 5.3.b) und weiter n + 0 = n nach Definition 5.3.a). Also ist n + 1 = φ(n). 5.1.1 Kommutativität der Addition Ziel dieses Abschnitts ist ein Beweis von Axiom (N2) (Kommutativität der Addition). Allerdings benötigen wir vorher noch zwei Lemmata. Nach Definition ist die Null neutral bei Addition von rechts. Das folgende Lemma sagt aus, dass es auch neutral von links ist. Lemma 5.5 Für alle n ∈ N gilt 0 + n = n. Beweis durch Induktion über n. Induktionsanfang n = 0: Wegen Definition 5.3.a) gilt 0 + 0 = 0. Induktionsschritt: Die Induktionsannahme ist 0+n = n. Wir haben zu zeigen, dass dann auch 0 + φ(n) = φ(n) gilt. 0 + φ(n) = φ (0 + (φ(n) − 1)) nach Definition 5.3.b) = φ (0 + n) , denn n ist der Vorgänger von φ(n) = φ(n) nach Induktionsannahme Damit ist der Induktionsschritt und nach dem Prinzip der vollständigen Induktion auch das Lemma bewiesen. Als nächstes beweisen wir: Lemma 5.6 Es seien m, n ∈ N. Dann gilt φ(m) + n = φ(m + n). Beweis durch vollständige Induktion über n. Induktionsanfang n = 0: Nach zweimaliger Anwendung von Definition 5.3.a) gilt φ(m) + 0 = φ(m) = φ(m + 0). Induktionsschritt: Die Induktionsannahme ist φ(m) + n = φ(m + n), und wir haben zu zeigen, dass φ(m) + φ(n) = φ (m + φ(n)). Wir nutzen wieder, dass n der Vorgänger von φ(n) ist und erhalten: φ(m) + φ(n) = φ (φ(m) + n) nach Definition 5.3.b) = φ (φ(m + n)) nach Induktionsannahme = φ (m + φ(n)) nach Definition 5.3.b) Damit sind der Induktionsschritt und wegen des Prinzips der vollständigen Induktion auch das Lemma bewiesen. 31 Satz 5.7 Es seien m, n ∈ N. Dann gilt m + n = n + m. Beweis durch vollständige Induktion über m. Induktionsanfang m = 0: Nach Lemma 5.5 gilt 0 + n = n, und nach Definition 5.3.a) gilt außerdem n = n+0. Damit ist der Induktionsanfang bewiesen. Induktionsschritt: Die Induktionsannahme ist m + n = n + m. Wir müssen beweisen, dass φ(m) + n = n + φ(m) folgt. Wir erhalten φ(m) + n = = = = φ(m + n) wegen Lemma 5.6 φ(n + m) nach Induktionsannahme φ (n + (φ(m) − 1)) , da m Vorgänger von φ(m) ist n + φ(m) nach Definition 5.3 Nach dem Prinzip der Vollständigen Induktion folgt daraus der Satz. 5.1.2 Assoziativität der Addition Ziel dieses Abschnitts ist ein Beweis von Axiom (N1) (Assoziativität der Addition). Eine Möglichkeit wäre, die Assoziativität der Addition auf die schon bekannte Assoziativität der Verknüpfung von Abbildungen nach Lemma 3.6 zurückführen. In der Vorlesung wurde dies versucht, aber wir werden hier im Skript doch einen Induktionsbeweis führen. Definition 5.8 Es seien N, 0 ∈ N und φ : N → N wie in Axiom 4.10. Wir definieren φ0 = IdN und dann rekursiv φn = φ ◦ φn−1 für n ∈ N \ {0}. Lemma 5.9 Für alle n ∈ N gilt n = φn (0). Beweis durch vollständige Induktion über n. Induktionsanfang n = 0: Es ist φ0 = IdN , also φ0 (0) = IdN (0) = 0. Induktionsschritt: Die Induktionsannahme ist n = φn (0). Wir müssen φ(n) = φφ(n) (0) zeigen. Da n der Vorgänger von φ(n) ist, erhalten wir φφ(n) (0) = (φ ◦ φn ) (0) nach Definition 5.8 = φ (φn (0)) nach Definition 3.5 = φ(n) wegen der Induktionsannahme Wir haben gerade den Induktionsschritt bewiesen, und nach dem Prinzip der vollständigen Induktion folgt daraus das Lemma. Lemma 5.10 Für alle m, n ∈ N gilt m + n = (φn ◦ φm ) (0). 32 Beweis durch vollständige Induktion nach n. Induktionsanfang n = 0: Es ist m + 0 = m nach Definition 5.3, und es ist φm (0) = m nach Lemma 5.9. Ferner ist φ0 = IdN nach Definition 5.8, also ist (φ0 ◦ φm ) (0) = φm (0) = m = m + 0. Induktionsschritt: Die Induktionsannahme ist m + n = (φn ◦ φm ) (0) und es ist zu zeigen, dass m + φ(n) = φφ(n) ◦ φm (0) folgt. Es gilt φφ(n) = φ ◦ φn nach Definition 5.8 und weil n der Vorgänger von φ(n) ist. Also folgt m + φ(n) = = = = = = φ(m + n) nach Definition 5.3 φ ((φn ◦ φm ) (0)) nach Induktionsannahme φ (φn (φm (0))) nach Definition 3.5 (φ ◦ φn ) (φm (0)) nach Definition 3.5 φφ(n) (φm (0)) φφ(n) ◦ φm (0) nach Definition 3.5 Damit ist der Induktionsschritt bewiesen. Nach dem Prinzip der vollständigen Induktion folgt daraus das Lemma. Bemerkung: In der Vorlesung wurde ein Beweis ohne vollständige Induktion vorgelegt. Aber dabei wurde eine Aussage verwendet, die zwar wahr ist, die wir hier aber nicht bewiesen haben. Letztlich ist ein Induktionsbeweis doch einfacher. Satz 5.11 Für alle `, m, n ∈ N gilt ` + (m + n) = (` + m) + n. Beweis durch vollständige Induktion nach n. Induktionsanfang n = 0: Es gelten `+(m+0) = `+m sowie (`+m)+0 = `+m jeweils nach Definition 5.3.a). Induktionsschritt: Die Induktionsannahme ist ` + (m + n) = (` + m) + n, und wir wollen ` + (m + φ(n)) = (` + m) + φ(n) beweisen. ` + (m + φ(n)) = = = = ` + φ(m + n) nach Definition 5.3.b) φ(` + (m + n)) nach Definition 5.3.b) φ((` + m) + n) nach Induktionsannahme (` + m) + φ(n) nach Definition 5.3.b) Nach dem Prinzip der vollständigen Induktion folgt daraus der Satz. 33 5.2 Multiplikation Bekanntlich bedeutet das Produkt m · n für m, n ∈ N, dass man m n–mal zur Null addiert bzw. n m–mal zur Null addiert. Damit erhält man folgende rekursive Definition der Multiplikation auf N. Definition 5.12 Es sei n ∈ N. Für beliebige m ∈ N definieren wir a) m · 0 = 0 (dies ist der Fall n = 0) und b) m · n = (m · (n − 1)) + m, falls n 6= 0. Aus der Schule ist die Konvention „Punkt- vor Strichrechnung“ bekannt. Das heißt, statt (m · (n − 1)) + m kann man einfach m · (n − 1) + m schreiben. Wir beweisen zunächst Axiom (N6) (Neutralität der Eins). Lemma 5.13 Für alle m ∈ N gilt: m · 1 = m. Beweis. Diesmal ist keine vollständige Induktion nötig. Der Vorgänger von 1 ist 0 nach Definition 5.1. Also gilt m · 1 = (m · 0) + m nach Definition 5.12.b), weiter (m · 0) + m = 0 + m nach Definition 5.12.a), und schließlich 0 + m = m nach Lemma 5.2. In der Definition der Multiplikation kann man das Distributivgesetz (Axiom (N7)) bereits erahnen. Nun beweisen wir es. Satz 5.14 ` · (m + n) = ` · m + ` · n für alle `, m, n ∈ N. Beweis durch vollständige Induktion über n. Induktionsanfang n = 0: Die Aussage des Satzes gilt für n = 0, denn ` · (m + 0) = ` · m nach Definition 5.3.a) = ` · m + 0 nach Definition 5.3.a) = ` · m + ` · 0 nach Definition 5.12.a). Induktionsschritt: Die Induktionsannahme ist ` · (m + n) = ` · m + ` · n. Wir müssen ` · (m + φ(n)) = ` · m + ` · φ(n) beweisen. ` · (m + φ(n)) = = = = = = = ` · (m + (n + 1)) nach Bemerkung 5.4 ` · ((m + n) + 1) (Assoziativität der Addition, Satz 5.11) ` · (φ(m + n)) nach Bemerkung 5.4 ` · (m + n) + ` nach Definition 5.12.b) (` · m + ` · n) + ` nach Induktionsannahme ` · m + (` · n + `) (Assoziativität der Addition, Satz 5.11) ` · m + ` · φ (n) nach Definition 5.12.b), womit der Induktionsschritt und damit auch der Satz bewiesen sind. 34 5.2.1 Kommutativität der Multiplikation Der Beweis der Kommutativität der Multiplikation (Axiom (N5)) ist etwas aufwändiger. Wie im Fall der Addition beweisen wir zuerst einige Lemmata. Lemma 5.15 Für alle n ∈ N gilt 0 · n = 0 Beweis durch vollständige Induktion über n. Induktionsanfang n = 0: Es ist 0 · 0 = 0 nach Definition 5.12.a). Induktionsschritt: Die Induktionsannahme ist 0·n = 0 für n ∈ N. Wir beweisen 0 · φ(n) = 0: 0 · φ(n) = 0 · n + 0 nach Definition 5.12.b) = 0 + 0 nach Induktionsannahme = 0 nach Definition 5.3.a) Lemma 5.16 Für alle m, n ∈ N gilt (m + 1) · n = m · n + n Beweis durch vollständige Induktion über n. Induktionsanfang n = 0: Es gelten (m + 1) · 0 = 0 nach Definition 5.12.a) und m · 0 + 0 = 0 + 0 = 0 nach Definition 5.12.a) und Definition 5.3.a). Induktionsschritt: Die Induktionsannahme ist (m + 1) · n = m · n + n und wir wollen (m + 1) · (n + 1) = m · (n + 1) + (n + 1) beweisen. Wir erhalten (m + 1) · (n + 1) = = = = = = = = (m + 1) · n + (m + 1) nach Definition 5.12.b) (m · n + n) + (m + 1) nach Induktionsannahme m · n + (n + (m + 1)) nach Satz 5.11 m · n + ((n + m) + 1) nach Satz 5.11 m · n + ((m + n) + 1) nach Satz 5.7 m · n + (m + (n + 1)) nach Satz 5.11 (m · n + m) + (n + 1) nach Satz 5.11 m · (n + 1) + (n + 1) nach Definition 5.12.b). Satz 5.17 Für alle m, n ∈ N gilt m · n = n · m. Beweis durch vollständige Induktion über n. Den Induktionsanfang für n = 0 haben wir in Lemma 5.15 bewiesen. Induktionsschritt: Die Induktionsannahme ist m · n = n · m, und wir müssen m · (n + 1) = (n + 1) · m beweisen. Wir finden: m · (n + 1) = m · n + m nach Definition 5.12.b) = n · m + m nach Induktionsannahme = (n + 1) · m nach Lemma 5.16. 35 5.2.2 Assoziativität der Multiplikation In diesem Abschnitt schließen wir den Beweis der Axiome (N1)–(N7) ab. Es fehlt jetzt nur noch Axiom (N4). Satz 5.18 Für alle `, m, n ∈ N gilt ` · (m · n) = (` · m) · n. Beweis durch Induktion über n. Induktionsanfang n = 0: Es gilt ` · (m · 0) = ` · 0 = 0 = (` · m) · 0 durch mehrfache Anwendung von Definition 5.12.a). Induktionsschritt: Unsere Induktionsannahme ist ` · (m · n) = (` · m) · n. Zum Beweis des Induktionsschrittes und damit des Satzes ist ` · (m · (n + 1)) = (` · m) · (n + 1) zu zeigen. ` · (m · (n + 1)) = = = = 5.3 ` · (m · n + m) nach Definition 5.12.b) ` · (m · n) + ` · m nach Satz 5.14 (` · m) · n + ` · m nach Induktionsannahme (` · m) · (n + 1) nach Definition 5.12.b). Die Wohlordnung der natürlichen Zahlen Wir möchten nun die aus der Schule bekannte Ordnung auf den natürlichen Zahlen definieren und eine wichtige Eigenschaft dieser Ordnung beweisen. Definition 5.19 Für m, n ∈ N ist m ≤ n („m kleiner oder gleich n“) ⇐⇒ ∃` ∈ N : m + ` = n. Natürlich wollen wir beweisen: Satz 5.20 ≤ ist eine Totalordnung auf N. Dazu brauchen wir allerdings erst wieder Hilfssätze. Lemma 5.21 Für alle n ∈ N ist φn injektiv. Beweis durch vollständige Induktion über n. Induktionsanfang n = 0: φ0 = IdN ist injektiv. Induktionsschritt: Die Induktionsannahme besagt, dass φn injektiv ist. Nach Definition 5.8 ist φφ(n) = φ ◦ φn . Wegen der Peano–Axiome 4.10 ist φ injektiv und nach Induktionsannahme ist φn injektiv. Die Verknüpfung zweier injektiver Abbildungen ist injektiv (leichte Übung). Lemma 5.22 Es seien `, m, n ∈ N. Wenn m + ` = n + `, dann ist m = n. 36 Beweis. Nach Lemma 5.10 ist m+` = φ` (φm (0)) und n+` = φ` (φn (0)). Nach Lemma 5.21 ist φ` injektiv. Wenn also m + ` = n + ` = φ` (φm (0)) = φ` (φn (0)), dann folgt φm (0) = φn (0). Wegen Lemma 5.9 folgt daraus m = n, also die Behauptung. Lemma 5.23 Es sei m, n ∈ N. Wenn m + n = 0, dann ist m = n = 0. Beweis durch Widerspruch. Wir nehmen an, dass n 6= 0. Dann ist 0 = m + n = φ (m + (n − 1)) nach Definition 5.3.b). Aber 0 ∈ / Bild(φ) wegen Axiom 4.10.b), also Widerspruch. Also gilt n = 0, und daraus folgt 0 = m + n = m + 0 = m. Lemma 5.24 Es sei m, n ∈ N, m ≤ n und m 6= n. Dann ist m + 1 ≤ n. Beweis. Wegen m ≤ n gibt es ein ` ∈ N mit m + ` = n. Weil m 6= n gilt ` 6= 0. Also hat ` einen Vorgänger, (` − 1) ∈ N. Es ist (` − 1) + 1 = ` nach Bemerkung 5.4. Mit den schon bewiesenen Rechengesetzen für die Addition folgt weiter n = = = = m+` m + ((` − 1) + 1) m + (1 + (` − 1)) (m + 1) + (` − 1) Also ist m + 1 ≤ n. Beweis von Satz 5.20. Wir müssen zeigen, dass ≤ reflexiv, transitiv, antisymmetrisch und linear ist. Reflexivität: Für alle n ∈ N gilt n + 0 = n, also ist n ≤ n. Transitivität: Es seien k, m, n ∈ N und k ≤ m und m ≤ n. Nach Definition 5.19 gibt es `1 , `2 ∈ N mit k + `1 = m und m + `2 = n. Wegen Assoziativität der Addition ist n = (k + `1 ) + `2 = k + (`1 + `2 ), also k ≤ n. Antisymmetrie: Für m, n ∈ N seien m ≤ n und n ≤ m. Es gibt also `1 , `2 ∈ N mit n = m + `1 und m = n + `2 . Daraus folgt m = m + (`1 + `2 ). Nach Definition 5.3 ist auch m = m + 0. Also folgt `1 + `2 = 0 aus Lemma 5.22 und `1 = `2 = 0 aus Lemma 5.23. Das bedeutet m = m+0 = m+`1 = n. Linearität: Es sei n ∈ N. Wir beweisen durch vollständige Induktion über k, dass ∀k ∈ N : k ≤ n ∨ n ≤ k. Der Induktionsanfang ist k = 0. Wegen n = 0 + n gilt 0 ≤ n nach Definition 5.19, also insbesondere auch 0 ≤ n ∨ n ≤ 0. Für den Induktionsschritt haben wir die Induktionsannahme k ≤ n∨n ≤ k. Wir müssen zeigen, dass k + 1 ≤ n ∨ n ≤ k + 1. Wir unterscheiden die Fälle n ≤ k und k ≤ n (mindestens einer davon gilt nach Induktionsannahme): 37 a) Wenn n ≤ k, dann gibt es ein ` ∈ N mit n + ` = k. Wegen n + (` + 1) = (n + `) + 1 = k + 1 folgt n ≤ k + 1. b) Es sei k ≤ n. Wir haben die Unter-Fälle k = n und k 6= n. i) Wenn k = n, dann ist n ≤ k wegen der schon gezeigten Reflexivität von ≤. Den Fall n ≤ k haben wir schon behandelt. ii) Wenn k 6= n, dann folgt mit Lemma 5.24 k + 1 ≤ n. In jedem Fall folgt k+1 ≤ n∨n ≤ k+1. Nach dem Prinzip der vollständigen Induktion folgt daraus die Behauptung, also die Linearität von ≤. Die Totalordnung ≤ auf N hat noch eine weitere sehr nützliche Eigenschaft, die wir im Rest dieses Abschnitts beweisen wollen: Jede Teilmenge von N hat ein kleinstes Element. Dies gibt Anlass zu einer weiteren Definition. Definition 5.25 Es sei X eine Menge und ≤ eine Teilordnung auf X. a) Ein Element ymin ∈ Y ist ein Minimum einer Teilmenge Y ⊆ X, genau dann wenn ∀y ∈ Y : ymin ≤ y. b) Man nennt ≤ eine Wohlordnung, genau dann wenn ≤ eine Totalordnung ist und zudem jede nicht-leere Teilmenge von X ein Minimum hat. Beispiel 5.26 Nicht jede (teil-)geordnete Menge hat ein Minimum: • T = Z hat bezüglich der aus der Schule bekannten Ordnung offenbar kein Minimum, denn sie ist nach unten unbeschränkt. • T = { n1 : n ∈ N} ⊆ Q hat kein Minimum — obwohl T nach unten be1 schränkt ist! —, denn n+1 < n1 . Wenn es ein Minimum gibt, dann ist es nach folgendem Lemma eindeutig. Lemma 5.27 (und Notation) Es sei X eine Menge mit einer Teilordnung ≤. Dann hat jede Teilmenge Y ⊂ X höchstens ein Minimum. Wenn Y ein Minimum hat, notiert man dieses als min(Y ). Beweis. Es seien y0 , y1 ∈ Y Minima von Y . Dann gilt ∀y ∈ Y : y0 ≤ y, also auch y0 ≤ y1 , und ebenso ∀y ∈ Y : y1 ≤ y, also auch y1 ≤ y0 . Aus y0 ≤ y1 und y1 ≤ y0 folgt aber y0 = y1 , denn Teilordnungen sind antisymmetrisch. Bemerkung 5.28 Das Auswahlaxiom (Abschnitt 3.1.1) ist gleichbedeutend zu der Aussage, dass es auf jeder Menge eine Wohlordnung gibt. Allerdings wäre eine solche Wohlordnung auf Q unverträglich mit den Grundrechenarten auf Q. Satz 5.29 Die Totalordnung ≤ auf N ist eine Wohlordnung. 38 Beweis durch Widerspruch. Wir nehmen an, es gebe eine nicht-leere Teilmenge Y ⊂ N, welche kein Minimum hat. Dann definieren wir T = {x ∈ N | ∀y ∈ Y : x ≤ y} Es gilt ∀n ∈ N : 0 ≤ n, also ist 0 ∈ T . Es sei x ∈ T , also ∀y ∈ Y : x ≤ y. Da nach Voraussetzung Y kein Minimum hat, folgt x ∈ / Y , also ∀y ∈ Y : x 6= y. Mit Lemma 5.24 erhalten wir ∀y ∈ Y : x + 1 ≤ y. Also ist φ(x) = x + 1 ∈ T . Dies gilt für alle x ∈ T , also ist φ(T ) ⊂ T . Nach Axiom 4.10.c) schließen wir T = N. Wir zeigten soeben: ∀x ∈ N : ∀y ∈ Y : x ≤ y. Es ist aber nach Voraussetzung Y 6= ∅. Es gibt also ein y0 ∈ Y ⊆ N. Wir setzen x = y0 +1 und y = y0 und erhalten y0 + 1 ≤ y0 . Nach Definition 5.19 ist aber auch y0 ≤ y0 + 1. Wir wissen bereits, dass ≤ antisymmetrisch ist. Also folgt y0 = y0 +1. Das steht aber im Widerspruch zu Lemma 5.2. Also war unsere Annahme falsch: Es gibt keine Teilmenge von N ohne Minimum und damit ist der Satz bewiesen. 5.4 Die Umkehroperationen In der Grundschule lernt man nicht nur addieren und multiplizieren, sondern auch subtrahieren und dividieren (mit Rest). Darum geht es in diesem Abschnitt. Den Übergang von N auf Z aud Q werden wir allerdings erst später vollziehen. 5.4.1 Subtraktion Lemma 5.30 (und Definition) Es seien m, n ∈ N und m ≤ n. Dann gibt es ein eindeutig durch m und n bestimmtes d ∈ N mit m + d = n. Wir nennen d die Differenz von n und m und bezeichnen sie als n − m. Beweis. Wegen m ≤ n gibt es nach Definition 5.19 ein d ∈ N mit m + d = n. Wir zeigen noch, dass es eindeutig bestimmt ist: Wenn e ∈ N mit m + e = n, dann gilt m + d = m + e; wegen Lemma 5.22 folgt daraus d = e. Bemerkung 5.31 Es sei n ∈ N, n 6= 0. Dann hat n einen Vorgänger, und dieser Vorgänger ist die Differenz von n und 1. Unsere Schreibweise „n − 1“ für den Vorgänger von n war also gerechtfertigt. Beweis. Übung. Lemma 5.32 Es sei m, n ∈ N, m ≤ n. Dann gilt n − m ≤ n. Beweis. Nach Definition 5.30 ist n = m + (n − m), also auch n = (n − m) + m wegen Kommutativität. Weil m ∈ N ist n − m ≤ n gemäß Definition 5.19. 39 5.4.2 Division mit Rest Wir schreiben m < n für m, n ∈ N, wenn m ≤ n und zudem m 6= n. Satz 5.33 (und Definition) Es seien m, n ∈ N, m 6= 0. Dann gibt es eindeutig bestimmte q, r ∈ N, so dass n=m·q+r und r < m. Man bezeichnet n als Dividend, m als Divisor, q als Ganzzahlquotient und r als Divisionsrest von n und m. Beweis. Es sei Y = {n − m · q | q ∈ N ∧ m · q ≤ n}. Dies ist eine Teilmenge von N und ist außerdem nicht leer, denn n ∈ Y (nämlich für q = 0). Daher hat sie ein Minimum r = min(Y ) nach Satz 5.29. Nach Definition von r gibt es ein q ∈ N mit r = n − m · q. Nach Definition 5.30 folgt n = m · q + r. Wir nehmen an, r < m sei falsch, und werden daraus einen Widerspruch herleiten. r 6< m ist gleichbedeutend mit ¬(r ≤ m) ∨ r = m. Aus r = m folgt m ≤ r, und wegen Linearität von ≤ folgt m ≤ r auch aus ¬(r ≤ m). Es folgt also m ≤ r, und damit ist die Differenz r − m definiert. Wir zeigen, dass r − m ∈ Y : n = = = = m·q+r m · q + ((r − m) + m) nach Definition 5.30 (m · q + m) + (r − m) (Rechengesetze für die Addition) m · (q + 1) + (r − m) nach Definition 5.12 Also ist r − m = n − m · (q + 1) in Y . Es ist aber r − m ≤ r nach Lemma 5.32, und r − m 6= r, weil m 6= 0. Das ist aber ein Widerspruch zu Lemma 5.27, denn wir haben ja r = min(Y ) definiert. Aus diesem Widerspruch folgt r < m. Der Eindeutigkeitsbeweis für q und r wird zunächst als Übungsaufgabe gestellt; der Beweis wird noch im Skript erscheinen. 40 6 Abstrakte Algebra Wir haben die Assoziativität der Addition auf N bewiesen. Aus der Schule ist die Assoziativität auch für Z bekannt. Ferner gibt es für jedes z ∈ Z ein −z ∈ Z, so dass z + (−z) = 0. Man findet derartige Rechengesetze auch in vielen anderen Strukturen: Wie wir gesehen haben, ist etwa die Komposition von Abbildungen ebenfalls assoziativ. Daher sollte man untersuchen, welche Gemeinsamkeiten all diese Strukturen haben. Dies ist die Aufgabe der (abstrakten) Algebra. 6.1 Magmen und Monoide Definition 6.1 Es sei M eine Menge. a) Eine (innere) Verknüpfung auf M ist eine Abbildung ∗ : M × M → M . Für x, y ∈ M schreibt man meist x ∗ y statt ∗(x, y). b) Ein Magma (M, ∗) besteht aus einer Menge M und einer Verknüpfung ∗ auf M . Das Magma heißt kommutativ, falls ∀x, y ∈ M : x ∗ y = y ∗ x. Das Magma heißt assoziativ, falls ∀x, y, z ∈ M : (x ∗ y) ∗ z = x ∗ (y ∗ z). Ein assoziatives Magma nennt man auch Halbgruppe. Beispiel 6.2 a) (N, +) ist ein Magma, nach Satz 5.7 kommutativ und nach Satz 5.11 assoziativ. b) (N, ·) ist nach Sätzen 5.17 und 5.18 ebenfalls ein kommutatives assoziatives Magma. c) (N, −) ist kein Magma, denn m − n ist nicht für alle m, n ∈ N definiert (d.h. die Differenz liegt nicht immer in N). d) (Z, −) ist ein Magma, aber nicht kommutativ, denn 3 − 5 6= 5 − 3. Es ist auch nicht assoziativ, denn (1 − 2) − 3 = −4, aber 1 − (2 − 3) = 2. e) Es sei X eine Menge. Dann ist (Abb(X, X), ◦) ein Magma (die Verknüpfung zweier Abbildungen von X nach X ist wieder eine Abbildung von X nach X). Es ist assoziativ wegen Lemma 3.6. Bemerkung 6.3 (zum Assoziativgesetz) Wenn man in einem Magma rechnet, muss man im Allgemeinen Klammern setzen, da x∗(y∗z) 6= (x∗y)∗z. In einem assoziativen Magma hingegen hängt das Ergebnis einer Kette von Verknüpfungen nicht von den gesetzten Klammern ab, weshalb man sie meist weglässt. Man beachte aber, dass die „Kosten“ einer Rechnung in manchen Anwendungen sehr wohl von der Klammerung abhängen. 41 Definition 6.4 Ein Magma (M, ∗) heißt linkskürzbar, genau dann wenn ∀a, x, y ∈ M : a ∗ x = a ∗ y ⇒ x = y. Es heißt rechtskürzbar, genau dann wenn ∀a, x, y ∈ M : x ∗ a = y ∗ a ⇒ x = y. Es heißt kürzbar, genau dann wenn es sowohl linksals auch rechtskürzbar ist. Beispiel 6.5 a) (N, +) ist kürzbar, wie in Lemma 5.22 bewiesen. b) (Z \ {0}, ·) ist kürzbar, (Z, ·) hingegen nicht. c) (Abb({1, 2}, {1, 2}), ◦) ist weder rechts- noch linkskürzbar. Für a : {1, 2} → {1, 2} mit a(1) = a(2) = 1 und x = Id{1,2} gilt nämlich a = x ◦ a = a ◦ a = a ◦ x, aber a 6= x. Definition 6.6 Ein Monoid (M, ∗, e) besteht aus einem assoziativen Magma (M, ∗) zusammen mit e ∈ M , so dass e ∗ x = x ∗ e = x für alle x ∈ M . Das Element e heißt neutrales Element des Monoids. Manchmal ist aus dem Kontext klar, welche Verknüpfung gemeint ist und was das neutrale Element ist. Man würde dann einfach sagen, dass M ein Monoid ist, und man würde unter Umständen sogar einfach xy statt x ∗ y schreiben. Beispiel 6.7 a) (N, +, 0) ist ein (kommutatives) Monoid, ebenso (N, ·, 1). b) Für eine Menge X ist (Abb(X, X), ◦, IdX ) ein Monoid. Definition 6.8 Es sei (M, ∗, e) ein Monoid und x ∈ M . Ähnlich wie in Definition 5.8 definieren wir rekursiv x0 = e und xn+1 = xn ∗ x für n ∈ N. Bemerkung Wenn wir das Monoid (R, ·, 1) betrachten, dann ist xn für x ∈ R und n ∈ N genau das, was man in der Schule als n-te Potenz von x kennen gelernt hat, nämlich das n-fache Produkt von x mit sich selbst. Wenn wir hingegen das Monoid (N, +, 0) betrachten, dann ist xn = n · x für x, n ∈ N, wie man durch Vergleich der rekursiven Definitionen 5.12 und 6.8 erkennt. Lemma 6.9 Es sei (M, ∗, e) ein Monoid, x ∈ M und m, n ∈ N. Dann gelten a) xm+n = xm ∗ xn und b) (xm )n = xm·n . 42 Beweis. a) Der Beweis erfolgt durch vollständige Induktion über n. Für n = 0 gilt xm+0 = xm , aber auch xm ∗ x0 = xm ∗ e nach Definition 6.8 und = xm denn e ist neutrales Element. Für den Induktionsschritt nehmen wir an, xm+n = xm ∗ xn sei bewiesen, und wir zeigen xm+n+1 = xm+n ∗ x1 = xm+n ∗ x0 ∗ x = xm+n ∗ (e ∗ x) nach Definition 6.8 = = = = xm+n ∗ x denn e ist neutrales Element (xm ∗ xn ) ∗ x nach Induktionsannahme xm ∗ (xn ∗ x) denn Monoide sind assoziativ xm ∗ xn+1 nach Definition 6.8 Daraus folgt Aussage a). b) Übung. 6.2 Gruppen Eine Gruppe ist ein Monoid, in dem jedes Element „invertierbar“ im Sinne folgender Definition ist. Definition 6.10 Ein Monoid (G, ∗, e) ist eine Gruppe, genau dann wenn es zu jedem x ∈ G ein x0 ∈ G gibt mit x ∗ x0 = e = x0 ∗ x. Die Mächtigkeit von G (im Fall einer endlichen Menge also die Anzahl der Elemente) bezeichnet man als die Ordnung der Gruppe. Wir stellen zunächst einige wichtige Beispiele von Gruppen vor. 6.2.1 Symmetriegruppen Es sei K ein geometrischer Körper, zum Beispiel ein Würfel. Eine Symmetrie ist eine Bewegung (Rotation, Spiegelung etc.), die K auf sich selbst abbildet. „Nichts tun“ bildet K auf sich ab, ist also eine Symmetrie — das neutrale Element. Wenn man zwei Symmetrien hintereinandersetzt, erhält man wieder eine Symmetrie — die innere Verknüpfung. Jede Bewegung kann man umkehren, und wenn man erst eine Bewegung und dann die umgekehrte Bewegung durchführt, ist das Resultat genau so wie „nichts tun“ — dies entspricht x0 ∗ x = e. 43 Das reguläre n-Eck Pn hat Rotations- und Achsensymmetrien. Die Menge der Symmetrien von Pn heißt die Diedergruppe Dn . Man kann zeigen, dass Dn immer 2n Elemente hat. Beispiel: Achsensymmetrien des Dreiecks und des Quadrats: B A B C A 6.2.2 D C Symmetrische Gruppen Sei Ω eine Menge. Eine Bijektion σ : Ω → Ω nennt man eine Permutation von Ω. Sind σ, τ zwei Permutationen von Ω, dann ist auch τ ◦σ eine Bijektion Ω → Ω, also eine Permutation. Auch IdΩ ist eine Permutation. Für jede Permutation τ ist auch die Umkehrabbildung τ −1 : Ω → Ω eine Permutation, und τ ◦τ −1 = τ −1 ◦τ = IdΩ . Wir setzen Sym(Ω) := die Menge aller Permutationen von Ω. Man nennt Sym(Ω) die symmetrische Gruppe auf Ω. Im wichtigen Fall Ω = {1, 2, . . . , n} setzen wir Sn := Sym({1, 2, . . . , n}). Es gibt verschiedene Wege, um Permutationen σ ∈ Sn hinzuschreiben. Ein Weg ist ! 1 2 3 ... n σ= . σ(1) σ(2) σ(3) . . . σ(n) ! 1 2 3 So ist etwa σ = die Permutation von {1, 2, 3} mit σ(1) = 3, σ(2) = 2 3 2 1 und σ(3) = 1. ! 1 2 3 Sei τ = , ein weiteres Element von S3 . Dann σ ◦ τ 6= τ ◦ σ, denn 2 1 3 ! ! 1 2 3 σ◦τ = 2 3 1 6.2.3 1 2 3 τ ◦σ = . 3 1 2 Anwendungen und einfache Eigenschaften von Gruppen Eine kommutative Gruppe nennt man auch abelsch.Die Bezeichnung „abelsch“ wird zu Ehren von Niels Henrik Abel [1802–1829] verwendet. Er war zusammen mit Évariste Galois [1811–1832] einer der Begründer der Gruppentheorie, wobei Permutationen auch vorher schon studiert wurden. Definition 6.10 mag unscheinbar wirken, aber die Bedeutung von Gruppen für die Mathematik und die Naturwissenschaften ist kaum zu überschätzen: • Abel bewies mittels Gruppen, dass es keine „Lösungsformel“ für allgemeine Gleichungen 5-ten Grades gibt. Diesen Ansatz verallgemeinerte Galois. 44 • Man kann Geometrie auf Grundlage der Gruppentheorie betreiben, denn die längenerhaltenden Abbildungen bilden eine Gruppe. Diese Sichtweise geht auf Felix Klein [1849–1925] und Sophus Lie [1842–1899] zurück. • In der Festkörperphysik treten „kristallographische Gruppen“ als Symmetrien von Kristallen auf. Sie wurden um 1890 herum unabhängig von Arthur Schoenflies [1853–1928], Jewgraf Stepanowitsch Fjodorow [1853–1919] und William Barlow [1845–1934] klassifiziert. • Erhaltungsgrößen (z.B. Energie, Drehimpuls, Impuls) entsprechen nach dem Noether–Theorem Symmetrien physikalischer Gleichungen (Zeitinvarianz, Rotationssymmetrie, Translationssymmetrie). Emmy Noether [1882–1935] war die erste (allerdings nicht beamtete) Professorin in Deutschland. • Die Grundgleichungen des Elektromagnetismus (Maxwell–Gleichungen) sowie der speziellen Relativitätstheorie sind invariant unter den „Lorentz– Transformationen“ und diese bilden eine Gruppe, benannt nach Hendrik Antoon Lorentz [1853–1928]. • Weite Teile der Quantenmechanik lassen sich durch die Untersuchung von Gruppen verstehen. Elementarteilchen etwa lassen sich als so genannte irreduzible Darstellungen von Symmetriegruppen der zugrunde liegenden Feldgleichungen beschreiben. So kamen Marray Gell–Mann [*1929] und George Zweig [*1937] 1964 auf das Quark–Modell. • Die „Klassifikation endlicher einfacher Gruppen“ darf als eine der bedeutendsten wissenschaftlichen Gemeinschaftsleistungen des 20. und beginnenden 21. Jahrhunderts gelten. Über 100 Mathematiker trugen in über 500 Fachartikeln von insgesamt rund 15000 Seiten über einen Zeitraum von mehr als 80 Jahren dazu bei. Lemma 6.11 (und Definition) Sei G eine Gruppe. a) Das neutrale Element e ist eindeutig. b) Für jedes x ∈ G ist x0 ∈ G (wie in Definition 6.10) eindeutig. Daher schreiben wir ab jetzt x−1 statt x0 . Man nennt x−1 das zu x inverse Element.13 c) G ist ein kürzbares Magma. d) Es ist (x ∗ y)−1 = y −1 ∗ x−1 für alle x, y ∈ G. e) Für jedes x ∈ G gilt (x−1 )−1 = x. f) Es ist e−1 = e. 13 Man findet für das zu x inverse Element manchmal auch die Notation x. 45 Beweise. a): Sind e1 , e2 zwei neutrale Elemente, so muss e1 ∗ e2 = e1 gelten (da e2 neutral) und gleichzeitig e1 ∗ e2 = e2 (da e1 neutral). Also e1 = e2 . b): Sind a, b beide zu x invers, so ist a ∗ x = x ∗ b = e. Also a = a ∗ e = a ∗ (x ∗ b) = (a ∗ x) ∗ b = e ∗ b = b . c): Sei a, x, y ∈ G. Aus a ∗ x = a ∗ y folgt a−1 ∗ (a ∗ x) = a−1 ∗ (a ∗ y). Es ist aber a−1 ∗ (a ∗ x) = (a−1 ∗ a) ∗ x = e ∗ x = x und analog a−1 ∗ (a ∗ y) = y. Wenn also a ∗ x = a ∗ y, dann folgt x = y. Damit ist die Linkskürzbarkeit bewiesen und der Beweis für Rechtskürzbarkeit ist analog. d): Nach c) reicht es zu zeigen: (x ∗ y) ∗ (y −1 ∗ x−1 ) = e. (x ∗ y) ∗ (y −1 ∗ x−1 ) = ((x ∗ y) ∗ y −1 ) ∗ x−1 = (x ∗ (y ∗ y −1 )) ∗ x−1 = (x ∗ e) ∗ x−1 = x ∗ x−1 = e . e): Folgt aus c), denn x−1 ∗ (x−1 )−1 = e = x−1 ∗ x. f): Folgt aus c), denn e ∗ e = e. Beispiel 6.12 Sind G1 , G2 , . . . , Gn Gruppen, so definiert man die Produktgruppe Qn i=1 Gi = G1 × G2 × · · · × Gn durch (g1 , g2 , . . . , gn ) ∗ (h1 , h2 , . . . , hn ) = (g1 ∗ h1 , g2 ∗ h2 , . . . , gn ∗ hn ) . Nachweis der Gruppeneigenschaft: Siehe Übung. 6.2.4 Untergruppen Definition 6.13 Sei G eine Gruppe und H ⊆ G eine Teilmenge. Man nennt H eine Untergruppe von G falls e ∈ H und für alle h, k ∈ H ist hk ∈ H und h−1 ∈ H. Anders gesagt: H ist selbst eine Gruppe bzgl. der Gruppenoperation auf G. Bezeichnung: H ≤ G. ( × Beispiele {+1, −1} ≤ R ; Z ≤ Q; !) 1 2 3 Id, 2 1 3 ≤ S3 . Für jede Gruppe G ist {e} ≤ G und G ≤ G. Lemma 6.14 (und Definition) Sei G eine Gruppe und X ⊆ G. Dann a) hXi := {exn1 1 xn2 2 · · · xnr r | r ≥ 0, xi ∈ X oder x−1 i ∈ X, ni ∈ N} ist eine Untergruppe von G. b) hXi ist die kleinste Untergruppe von G, die X enthält. Das heißt, für H ≤ G gilt: X ⊆ H ⇔ hXi ≤ H. 46 Beweis. a): Der Fall r = 0 zeigt e ∈ hXi. Sind g, h ∈ hXi dann haben g, h Darstellungen g = exn1 1 xn2 2 · · · xnr r und h = ey1m1 y2m2 · · · ysms , jeweils mit xi ∈ X oder −1 x−1 i ∈ X für i = 1, ..., r bzw. yj ∈ X oder yj ∈ X, für j = 1, ..., s. Also gh = exn1 1 xn2 2 · · · xnr r ey1m1 y2m2 · · · ysms = exn1 1 xn2 2 · · · xnr r y1m1 y2m2 · · · ysms ∈ hXi und g −1 = x−1 r nr = e x−1 r x−1 r−1 nr nr−1 x−1 r−1 · · · x−1 1 nr−1 n1 · · · x−1 1 e−1 n1 ∈ hXi . −1 = xi für i = 1, ..., r, wegen LemFür das Inverse nutzen wir, dass x−1 i ma 6.11.e), d.h. die angegebene Darstellung von g −1 ist ein Produkt von Potenzen von Elementen, die selbst in X liegen oder deren Inverse in X liegen, wie verlangt. b): Es ist X ⊆ hXi (Fall r = n1 = 1). Es bleibt zu zeigen: Ist H eine Untergruppe von G mit X ⊆ H, dann ist auch hXi ⊆ H. Sei x ∈ X ⊆ H. Da H eine (Unter-)Gruppe ist, liegen auch alle Potenzen xn in H, für alle n ∈ N. Mit x ∈ X ⊂ H liegt auch das Inverse x−1 in H. Auch Produkte von Elementen von H liegen wieder in H. Folglich (Induktion über r) liegen alle Ausdrücke der Form exn1 1 xn2 2 · · · xnr r in H, wobei ni ∈ N und xi ∈ X oder x−1 i ∈ X für i = 1, ..., r. Also hXi ⊆ H. Notation 6.15 Sei G eine Gruppe und X ⊆ G eine Teilmenge. Wir nennen hXi die von X erzeugte Untergruppe von G. Ist hXi = G, so nennen wir X ein Erzeugendensystem von G. Ist X = {g1 , . . . , gn }, so schreiben wir hg1 , . . . , gn i für hXi. Gibt es g ∈ G mit G = hgi, so heißt G zyklisch mit Erzeuger g. Wir haben zwar Z immer noch nicht offiziell kennen gelernt, aber wir definieren schon n x−n = (x−1 ) , für x ∈ G und n ∈ N. ◦ Beispiel 6.16 (Z, +, 0) ist zyklisch mit Erzeuger 1.*Eine Drehung durch 90 ! !+und 1 2 3 1 2 3 eine beliebige Spiegelung erzeugen D4 . Es ist S3 = , . 2 3 1 2 1 3 Lemma 6.17 Ist G = hgi zyklisch, dann ist G abelsch und G = {g n | n ∈ Z}. Beweis. 2. Aussage folgt aus Konstruktion von hXi; 1. folgt aus 2. Beispiele S3 und D4 sind nichtabelsch, also nicht zyklisch. D2 (das ist die Symmetriegruppe des Rechtecks) ist abelsch aber nicht zyklisch. ◦ Für n ≥ 1 sei ρn : R2 → R2 die Drehung durch 360 gegen dem Uhrzeigersinn n r um den Ursprung. Dann ist Cn := {ρn | r ∈ Z} eine abelsche Gruppe, und es ist Cn = hρn i Cn = {Id, ρn , ρ2n , . . . , ρnn−1 } , also |Cn | = n. Für jedes n ≥ 1 gibt es also eine zyklische Gruppe mit Ordnung n. 47 6.2.5 Der Satz von Lagrange Beispiel Die Diedergruppe D3 ist {Id, ρ, ρ2 , σA , σB , σC }, mit ρ = Drehung durch 120◦ gegen Uhrzeigersinn, und σA = Spiegelung in der Seitenhalbierenden durch A, usw. B C A Hier sind alle Untergruppen von D3 : {Id} hσB i = {Id, σB } hρi = {Id, ρ, ρ2 } hσC i = {Id, σC } hσA i = {Id, σA } D3 = {Id, ρ, ρ2 , σA , σB , σC } Es gibt keine weiteren, im wesentlichen weil jede zyklische Gruppe hgi in dieser Liste auftaucht, und – wie man nachrechnen kann – hρ, σA i = hσA , σB i = D3 ist. Diese sechs Untergruppen haben Ordnungen 1, 3, 2, 2, 2 bzw. 6. Somit ist für jede Untergruppe H ≤ D3 die Gruppenordnung |H| ein Teiler der Gruppenordnung |D3 | = 6. Nach dem Satz von Lagrange14 ist dies kein Zufall. Satz (Lagrange) Sei G eine endliche Gruppe und H ≤ G eine Untergruppe. Dann ist |G| durch |H| teilbar. Beispiel Nachweis mittels Lagrange, dass ρ4 und eine beliebige Spiegelung D4 erzeugen. Beweis. Wir definieren die Relation ∼ auf G durch g ∼ g 0 genau dann, wenn es h ∈ H gibt mit g 0 = gh. Diese Relation ist reflexiv (h = 1), symmetrisch (g = g 0 h−1 ) und transitiv (ist auch g 00 = g 0 h0 , dann g 00 = g · hh0 und hh0 ∈ H), also ist ∼ eine Äquivalenzrelation. Für g ∈ G ist die Äquivalenzklasse [g] also gegeben durch [g] = {gh | h ∈ H}. Ferner gilt gh = gh0 genau dann, wenn h = h0 ist. Daher ist H → [g], h 7→ gh eine Bijektion, folglich |[g]| = |H|. Also: G ist die disjunkte Vereinigung aller Äquivalenzklassen, und jede Äquivalenzklasse hat |H| Elemente. Daher gilt |G| = (Anzahl der Äquivalenzklassen) · |H| . Insbesondere ist |G| durch |H| teilbar. 14 Joseph–Louis Lagrange [1736–1813] verstarb vor der Axiomatisierung der Gruppentheorie. 48 Beispiel Sei H eine Untergruppe des S4 . Lagrange: Wegen |S4 | = 24 ist |H| ∈ {1, 2, 3, 4,*6, 8, 12, 24}. Man kann nachweisen, dass jede Ordnung vorkommt: so ! !+ 1 2 3 4 1 2 3 4 hat etwa , die Ordnung 8. 2 3 4 1 4 3 2 1 Beispiel Es ist |S5 | = 5! = 120. Natürlich ist 120 durch 15 teilbar, trotzdem kann man zeigen, dass S5 keine Untergruppe der Ordnung 15 hat. 6.2.6 Die Ordnung eines Elements Definition 6.18 Sei G eine Gruppe und g ∈ G. Die Ordnung ord(g) des Elements g ist die Ordnung der zyklischen Untergruppe hgi: ord(g) := |hgi|. ! Beispiel 1 2 3 hat Ordnung 3, denn 2 3 1 * !+ 1 2 3 2 3 1 ( ! !) 1 2 3 1 2 3 = Id, , 2 3 1 3 1 2 . Lemma 6.19 Sei G eine endliche Gruppe. a) Ist g ∈ G und ord(g) = n, dann n | |G| und hgi = {e, g, g 2 , . . . , g n−1 }. b) G zyklisch ⇔ es gibt g ∈ G gibt mit ord(g) = |G|. c) Ist p eine Primzahl, so ist jede Gruppe der Ordnung p zyklisch. Beweis. a): Lagrange: n | |G|. Sei r ≥ 1 die kleinste Zahl derart, dass die Liste e, g, g 2 , . . . , g r eine Wiederholung enthält. Dann g r = g s für ein 0 ≤ s < r, also g r−s = e, daher wegen Minimalität ist s = 0, und g r = e ist die erste Wiederholung. Nach Lemma 6.17 ist hgi = {e, g, . . . , g r−1 }, denn zu jedem m ∈ Z gibt es i ∈ Z und j ∈ {0, . . . , r − 1} mit m = ir + j, also g m = g j . Daher r = n. b): Definition von „zyklisch“. c): Sei |G| = p und g ∈ G mit g 6= e. Nach a) ist ord(g) ∈ {1, p}, und ord(g) 6= 1 wegen g 6= e. Also ord(g) = p und G = hgi. 6.2.7 Gruppenhomomorphismen Definition 6.20 Seien G, H Gruppen. Eine Abbildung f : G → H heißt ein Homomorphismus, falls f (x ∗ y) = f (x) ∗ f (y) gilt für alle x, y ∈ G. Bemerkung Übungsserie: Dann auch f (eG ) = eH und f (x−1 ) = f (x)−1 . Beispiele f : Z → Z, f (n) = 2n, ist ein Homomorphismus der additiven Gruppe (Z, +, 0): f (−n) = 2 · (−n) = −f (n) und f (m + n) = 2(m + n) = 2m + 2n = f (m) + f (n). Später lernen wir das Vorzeichen einer Permutation kennen: ein Homomorphimus ε : Sn → {+1, −1}. 49 Definition 6.21 Es sei G eine Gruppe. Eine Untergruppe H ≤ G heißt normale Untergruppe bzw. Normalteiler, genau dann wenn ∀g ∈ G, ∀h ∈ H : g ∗ h ∗ g −1 ∈ H. In Zeichen: H E G. Es ist stets {eG } E G und G E G. Wenn G außer diesen keine weiteren Normalteiler besitzt, nennt man G eine einfache Gruppe. Lemma 6.22 (und Definition) Sei f : G → H ein Gruppenhomomorphismus. Wir definieren Kern(f ) := {g ∈ G | f (g) = eH }. Es ist Bild(f ) ≤ H und Kern(f ) E G. Beweis. Wegen f (g1 ) ∗ f (g2 ) = f (g1 ∗ g2 ), eH = f (eG ) und f (g)−1 = f (g −1 ) ist Bild(f ) ≤ H. Wegen f (eG ) = eH ist eG ∈ Kern(f ). Sind g, g 0 ∈ Kern(f ), dann f (g ∗ g 0 ) = f (g) ∗ f (g 0 ) = eH ∗ eH = eH , also g ∗ g 0 ∈ Kern(f ); und −1 f (g −1 ) = f (g)−1 = e−1 ∈ Kern(f ), und Kern(f ) ≤ G. Es ist sogar H = eH , also g −1 Kern(g) E G, denn f (g ∗ k ∗ g ) = f (g) ∗ f (k) ∗ f (g −1 ) = f (g) ∗ eH ∗ f (g)−1 = eH . Es gilt übrigens auch eine Umkehrung des obigen Lemmas: Wenn K E G eine normale Untergruppe ist, dann gibt es eine Gruppe H und einen Gruppenhomomorphismus f : G → H mit Kern(f ) = K. Definition 6.23 Ein bijektiver Homomorphismus heißt ein Isomorphismus. Gibt es einen Isomorphismus f : G → H, so heißen G und H isomorph, Bezeichnung G∼ = H. Beispiel S3 und D3 sind isomorph: indem man bei einer Symmetrie des Dreiecks nur die Auswirkung auf den drei Ecken betrachtet, erhält man eine Abbildung D3 → S3 , die ein bijektiver Homomorphismus ist. Lemma 6.24 Ist f : G → H ein Isomorphismus, dann ist auch f −1 : H → G ein Isomorphismus. Beweis. Seien h1 , h2 ∈ H. Da f bijektiv ist, gibt es g1 , g2 ∈ G mit f (gi ) = hi , also f −1 (hi ) = gi . Nun, f (g1 g2 ) = f (g1 )f (g2 ) = h1 h2 , also f −1 (h1 h2 ) = g1 g2 = f −1 (h1 )f −1 (h2 ). Also ist f −1 ein Isomorphismus. Bemerkung Zwei Gruppen sind isomorph, wenn Sie – abgesehen davon, dass die Elemente anders heißen – gleich sind. Insbesondere haben isomorphe Gruppen die gleiche Ordnung. 50 7 Ringe und Körper Viele wichtige algebraische Strukturen — etwa Z, Q, R und viele aus der Schule möglicherweise nicht bekannte Strukturen, wie die komplexen Zahlen C, Polynome und quadratische Matrizen — haben nicht nur eine einzelne innere Verknüpfung (wie eine Gruppe), sondern zwei, die durch das Distributivgesetz miteinander verbunden sind. Derartige Strukturen sind der Gegenstand dieses Kapitels. Definition 7.1 Ein Ring (R, +, ·, 0) (meist sagt man kurz: Ein Ring R) besteht aus einer Menge R zusammen mit zwei inneren Verknüpfungen + und · auf R und einem Element 0 ∈ R, so dass gilt: (R1) (R, +, 0) ist eine abelsche Gruppe. (R2) (R, ·) ist ein assoziatives Magma (d.h. eine Halbgruppe). (R3) Distributivgesetze: Für alle x, y, z ∈ R gelten x · (y + z) = x · y + x · z und (x + y) · z = x · z + y · z. Wenn es ein 1 ∈ R gibt, so dass (R, ·, 1) ein Monoid ist, so heißt (R, +, ·, 0, 1) (oder kurz R) ein unitärer Ring. Ist (R, ·) ein kommutatives Magma, so heißt der Ring kommutativ. Notation 7.2 Es sei R ein Ring und x ∈ R. Das Inverse von x bezüglich + (das „additive Inverse“) notiert man als −x. Definition 7.3 Ein unitärer Ring (R, +, ·, 0, 1) heißt Körper, falls (R \ {0}, ·, 1) eine abelsche Gruppe ist. Beispiel 7.4 a) Aus der Schule sind der unitären Ringe Z, Q und R bekannt. b) Q und R sind Körper. c) ({0}, +, ·, 0, 0) mit 0 + 0 = 0 und 0 · 0 = 0 ist ein unitärer Ring. Hier gilt also 0 = 1. Man nennt diesen Ring den trivialen Ring oder Nullring. Bemerkung 7.5 Wenn R ein Ring ist und (R \ {0}, ·, 1) lediglich eine Gruppe, aber nicht unbedingt kommutativ ist, heißt R Schiefkörper. Nach dem Satz von Wedderburn15 von 1905 ist jeder endliche Schiefkörper ein Körper. Es gibt allerdings unendliche Schiefkörper, die kein Körper sind, z.B. die „Quaternionen“. 15 Joseph Wedderburn [1882–1948] 51 Lemma 7.6 Es sei (R, +, ·, 0) ein Ring. Dann gilt für alle x, y ∈ R: a) 0 · x = x · 0 = 0. b) −(x · y) = (−x) · y = x · (−y). Beweis. a) Da (R, +, 0) eine Gruppe ist, gilt 0 + 0 = 0 und auch 0 · x + 0 = 0 · x. Also ist 0 · x + 0 = 0 · x = (0 + 0) · x = 0 · x + 0 · x nach dem Distributivgesetz. Gruppen sind aber nach Lemma 6.11.c (links-)kürzbar. Also folgt 0 · x = 0. Entsprechend beweist man x · 0 = 0. b) Wir finden (x · y) + ((−x) · y) = (x + (−x)) · y (Distributivgesetz) = 0 · y nach Definition des additiven Inversen = 0 nach a). Es ist also ((−x) · y) das additive Inverse von x · y. Analog zeigt man auch, dass auch x · (−y) das additive Inverse von x · y ist. Wie man es für ganze Zahlen aus der Schule kennt, definieren wir allgemeiner: Definition 7.7 Es sei R ein kommutativer Ring und f, g ∈ R. Es teilt f g (in Zeichen: f |g), genau dann wenn es ein h ∈ R gibt mit g = f · h. Bemerkung 7.8 Es kommt sehr darauf an, welchen Ring wir betrachten. Es sei etwa f = 5 und g = 3. Zwar teilt f nicht g in R = Z, aber f |g in R = Q, denn mit h = 35 ∈ Q folgt f · h = g. 7.1 Die ganzen Zahlen Auf N haben wir zwei innere Verknüpfungen + und ·, so dass (N, ·) und (N, +) jeweils kommutative Halbgruppen sind und zudem das Distributivgesetz gilt. Eine solche Struktur nennt man einen kommutativen Halbring. Darüber hinaus ist (N, +, 0) ein kürzbares Monoid. In der Schule kam man von N auf Z durch Hinzunahme von Differenzen: Für m, n ∈ N ist m − n auch dann eine ganze Zahl, wenn m < n. Dabei ist allerdings zu beachten, dass man die gleiche Differenz auch für andere Zahlen m̃, ñ ∈ N erhalten kann: Es sollte m − n = m̃ − ñ sein, genau dann wenn m + ñ = m̃ + n. Die Gleichheit von Differenzen lässt sich durch die folgende Äquivalenzrelation auf beliebige kommutative kürzbare Monoide verallgemeinern. 52 Lemma 7.9 (und Definition) Es sei (H, +) ein assoziatives kommutatives kürzbares Magma. Auf H × H definieren wir eine Relation ∼ durch (x1 , y1 ) ∼ (x2 , y2 ) ⇐⇒ x1 + y2 = x2 + y1 für alle (x1 , y1 ), (x2 , y2 ) ∈ H × H. Dann ist ∼ eine Äquivalenzrelation. Wir definieren R(H) = (H × H) / ∼. Beweis. Reflexivität ∀(x, y) ∈ H : x + y = x + y, also (x, y) ∼ (x, y). Symmetrie Seien (x1 , y1 ), (x2 , y2 ) ∈ H × H und (x1 , y1 ) ∼ (x2 , y2 ). Dann ist x1 + y2 = x2 + y1 , also auch x2 + y1 = xy + y2 , das heißt (x2 , y2 ) ∼ (x1 , y1 ). Transitivität Seien (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) ∈ H × H, (x1 , y1 ) ∼ (x2 , y2 ) und (x2 , y1 ) ∼ (x3 , y3 ). Also x1 + y2 = x2 + y1 und x2 + y3 = x3 + y2 . Durch Addition der Gleichungen folgt mit Assoziativität, Kommutativität und Kürzbarkeit von (H, +): ⇒ (x1 + y2 ) + (x2 + y3 ) = (x2 + y1 ) + (x3 + y2 ) (x2 + y2 ) + (x1 + y3 ) = (x2 + y2 ) + (x3 + y1 ) ⇒ x1 + y3 = x3 + y1 und daher (x1 , y1 ) ∼ (x3 , y3 ). Lemma 7.10 Es sei (H, +, 0) ein kommutatives kürzbares Monoid und ∼ und R(H) wie in Lemma 7.9.16 Die Abbildung ι : H → R(H) gegeben durch ι(x) = [(x, 0)] ist injektiv. Beweis. Es seien x, y ∈ H mit ι(x) = ι(y), also [(x, 0)] = [(y, 0)]. Nach Lemma 3.19 ist dies gleichbedeutend mit (x, 0) ∼ (y, 0), also x + 0 = y + 0. Da 0 neutrales Element für + ist, folgt x = y. Also ist ι injektiv. Wie erwähnt entspricht [(x1 , y1 )] der Differenz x1 − y1 . Nach dem, was man in der Schule gelernt hat, kann man Differenzen natürlicher Zahlen addieren (x1 − y1 ) + (x2 − y2 ) = (x1 + x2 ) − (y1 + y2 ) und „Ausmultiplizieren“ (x1 − y1 ) · (x2 − y2 ) = (x1 · x2 + y1 · y2 ) − (x1 · y2 + x2 · y1 ) . Nach folgendem Satz, den wir hier allerdings nicht vollständig beweisen, kann man diese Rechenregeln verallgemeinern. 16 Das geht, denn (H, +) ist ja insbesondere ein assoziatives kommutatives kürzbares Magma. 53 Satz 7.11 (und Definition) Es sei (H, +, 0) ein kommutatives kürzbares Monoid und (H, ·) ein assoziatives Magma, so dass das Distributivgesetz gilt, also ∀x, y, z ∈ H : x · (y + z) = (x · y) + (x · z) und ∀x, y, z ∈ H : (x + y) · z = (x · z) + (y · z). Dann sind auf R(H) zwei innere Verknüpfungen + und · definiert durch [(x1 , y1 )] + [(x2 , y2 )] = [(x1 + x2 , y1 + y2 )] und [(x1 , y1 )] · [(x2 , y2 )] = [(x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 )] , durch die (R(H), +, ·, [(0, 0)]) zu einem Ring wird. Dieser Ring ist kommutativ, wenn (H, ·) kommutativ ist. Wenn (H, ·, 1) zudem ein Monoid ist, dann ist (R(H), +, ·, [(0, 0)] , [(1, 0)]) ein unitärer Ring. Korollar 7.12 (und Definition) Z = R(N) mit Addition und Multiplikation wie in Satz 7.11 ist ein kommutativer unitärer Ring, den man den Ring der ganzen Zahlen nennt. Hier einige Anmerkungen zum Beweis von Satz 7.11: Als erstes ist zu beweisen, dass die Verknüpfungen + und · auf R(H) „wohldefiniert“ sind: Wenn (x1 , y1 ) ∼ (x̃1 , ỹ1 ) und (x2 , y2 ) ∼ (x̃2 , ỹ2 ), dann folgen (x1 + x2 , y1 + y2 ) ∼ (x̃1 + x̃2 , ỹ1 + ỹ2 ) und (x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 ) ∼ (x̃1 · x̃2 + ỹ1 · ỹ2 , x̃1 · ỹ2 + ỹ1 · x̃2 ) . Wohldefiniertheit der Addition: Wenn x1 + ỹ1 = x̃1 +y1 und x2 + ỹ2 = x̃2 +y2 , dann folgt (x1 + x2 ) + (ỹ1 + ỹ2 ) = (x̃1 + x̃2 ) + (y1 + y2 ) (hier benutzen wir Kommutativ- und Assoziativgesetz), also (x1 + x2 , y1 + y2 ) ∼ (x̃1 + x̃2 , ỹ1 + ỹ2 ). Wohldefiniertheit der Multiplikation: Sei (x1 , y1 ) ∼ (x̃1 , ỹ1 ). Wir zeigen (x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 ) ∼ (x̃1 · x2 + ỹ1 · y2 , x̃1 · y2 + ỹ1 · x2 ). Mit der Assoziativität und Kommutativität von + und dem Distributivgesetz auf H folgt x1 · x2 + y1 · y2 + x̃1 · y2 + ỹ1 · x2 = (x1 + ỹ1 ) · x2 + (x̃1 + y1 ) · y2 = (x̃1 + y1 ) · x2 + (x1 + ỹ1 ) · y2 , denn (x1 , y1 ) ∼ (x̃1 , ỹ1 ) = x̃1 · x2 + ỹ1 · y2 + x1 · y2 + y1 · x2 Analog folgt (x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 ) ∼ (x1 · x̃2 + y1 · ỹ2 , x1 · ỹ2 + y1 · x̃2 ) aus (x2 , y2 ) ∼ (x̃2 , ỹ2 ). Zusammen folgt die Wohldefiniertheit der Multiplikation. Der Beweis, dass R(H) ein Ring ist, erfolgt durch direktes Nachrechnen, was wir aus Zeitgründen weglassen. 54 7.2 Quotientenkörper und die rationalen Zahlen Im vorigen Abschnitt zeigten wir, wie man unter gewissen zusätzlichen Voraussetzungen zu einem gegebenen Halbring H einen Ring konstruieren kann, der den Halbring enthält. Dazu haben wir auf H × H eine Relation so definiert, dass (m1 , n1 ) ∼ (m2 , n2 ) genau der aus der Schule bekannten Gleichheit von Differenzen m1 − n1 = m2 − n2 entspricht. Bei der Konstruktion von Q geht man ganz ähnlich vor. Eine rationale Zahl = q·a ist ja ein Bruch pq mit p, q ∈ Z und q 6= 0. Es ist pq = ab genau dann, wenn p·b q·b q·b ist, das heißt p a = ⇐⇒ p · b = q · a . q b Das ist offensichtlich völlig analog zu der im vorigen Abschnitt betrachteten Äquivalenzrelation — wir haben lediglich + durch · ersetzt. Eine wichtige Voraussetzung im vorigen Abschnitt war, dass (H, +, 0) ein kommutatives kürzbares Monoid ist. Analog müssen wir hier voraussetzen, dass wir einen unitären Ring (R, +, ·, 0, 1) haben, so dass (R \ {0}, ·, 1) ein kommutatives kürzbares Monoid ist. Definition 7.13 Es sei (R, +, ·, 0) ein Ring. Ein Element x ∈ R \ {0} heißt Nullteiler, wenn es ein y ∈ R \ {0} gibt, so dass x · y = 0 oder y · x = 0. Der Ring heißt nullteilerfrei, wenn er keine Nullteiler enthält. Definition 7.14 Ein unitärer Ring (R, +, ·, 0, 1) heißt Integritätsbereich, genau dann wenn der Ring kommutativ und nullteilerfrei und zudem 1 6= 0 ist. Beispiel 7.15 Körper sind Integritätsbereiche, denn aus x·y = 0 und x 6= 0 folgt 0 = x−1 · x · y = y. Auch Z ist ein Integritätsbereich, nach Hausaufgabe 8.4 a). Beweis der Hausaufgabe. Es seien m, n ∈ Z, m 6= 0 6= n. Wir müssen zeigen, dass m · n 6= 0. Wenn wir das Vorzeichen von m oder n ändern, so ändert sich nach den Rechenregeln in Ringen (Lemma 7.6) nur das Vorzeichen von m · n. Wir können also bis auf die Wahl des Vorzeichens voraussetzen, dass m, n ∈ N \ {0}. Dann hat aber m einen Vorgänger m − 1 ∈ N und es gilt m · n = (m − 1) · n + n. Wäre m · n = 0, so wären also nach Lemma 5.23 sowohl (m − 1) · n = 0 als auch n = 0. Das steht aber im Widerspruch zur Voraussetung n ∈ N \ {0}. Also kann m · n nicht Null sein. Lemma 7.16 Ein unitärer Ring (R, +, ·, 0, 1) ist genau dann ein Integritätsbereich, wenn (R \ {0}, ·, 1) ein kommutatives kürzbares Monoid ist. Beweis. Es sei (R, +, ·, 0, 1) ein Integritätsbereich. Dann ist (R, ·, 1) ein kommutatives Monoid. Weil es keine Nullteiler gibt, ist die Multiplikation eine innere 55 Verknüpfung auf R \ {0}, und wegen 1 6= 0 ist (R \ {0}, ·, 1) ein kommutatives Monoid. Wäre (R \ {0}, ·, 1) nicht kürzbar17 , so gäbe es ein x, y, z ∈ R \ {0} mit x 6= y, so dass x · z = y · z. Es folgte dann x · z − y · z = (x − y) · z = 0, und wegen x 6= y ist x − y 6= 0. Also wäre z ein Nullteiler, aber das gibt es in einem Integritätsbereich nicht. Also ist (R \ {0}, ·, 1) kürzbar. Umgekehrt sei (R \ {0}, ·, 1) ein kommutatives Monoid18 . Es folgt zunächst 1 ∈ R \ {0}, also 1 6= 0. Für alle x ∈ R gilt stets 0 · x = x · 0 = 0, und für alle y ∈ R \ {0} gilt nach Voraussetzung zudem x · y = y · x. Also ist (R, ·, 1) ein kommutatives Monoid, der Ring ist also kommutativ. Es bleibt zu zeigen, dass der Ring nullteilerfrei ist. Wäre der Ring nicht nullteilerfrei, so gäbe es x, y ∈ R \ {0} mit x · y = 0. Dann aber wäre (R \ {0}, ·, 1) kein Monoid (· wäre keine innere Verknüpfung). Also ist der Ring ein Integritätsbereich.19 Wir erhalten: Lemma 7.17 Es sei (R, +, ·, 0, 1) ein Integritätsbereich. a) Auf R × (R \ {0}) ist eine Äquivalenzrelation ∼ definiert durch (x1 , y1 ) ∼ (x2 , y2 ) ⇐⇒ x1 · y2 = x2 · y1 für alle (x1 , y1 ), (x2 , y2 ) ∈ R × (R \ {0}). Wir definieren Quot(R) = (R × (R \ {0})) / ∼ b) Die Abbildung ι : R → Quot(R) gegeben durch ι(x) = [(x, 1)] ist injektiv. Beweis. Wegen Lemma 7.16 ist (R \ {0}, ·, 1) ein kommutatives kürzbares Monoid. Daher sind Lemmata 7.9 und 7.10 auf es anwendbar. a) Wegen Lemma 7.9 ist die Einschränkung von ∼ auf (R \ {0}) × (R \ {0}) eine Äquivalenzrelation. Für alle x, y, z ∈ R mit y 6= 0 6= z gilt: (x, y) ∼ (0, z) ⇐⇒ x · z = 0 · y = 0 ⇐⇒ x = 0 wegen Nullteilerfreiheit. Daher ist ∼ auf R×(R\{0}) eine Äquivalenzrelation, wobei {(0, x) : x ∈ R \ {0}} eine Äquivalenzklasse ist und alle anderen Äquivalenzklassen auch Äquivalenzklassen auf (R \ {0}) × (R \ {0}) sind. b) Folgt direkt aus Lemma 7.10 und der Tatsache, dass (0, 1) 6∼ (y, 1) für y 6= 0 (siehe oben). 17 Wegen der Kommutativität sind links- und rechtskürzbar gleichbedeutend. Wir brauchen Kürzbarkeit nicht voraussetzen! 19 Wie schon gezeigt folgt daraus, dass (R \ {0}, ·, 1) kürzbar ist. 18 56 Nach den aus der Schule bekannten Bruchrechenregeln gilt p a pb + qa + = q b qb p a pa · = q b qb für alle a, b, p, q ∈ Z, b, q 6= 0. Diese Rechenregeln lassen sich direkt auf Quot(R) übertragen. Satz 7.18 (und Definition) Es sei R ein Integritätsbereich. Mit den Operationen [(p, q)] + [(a, b)] = [(pb + qa, qb)] [(p, q)] · [(a, b)] = [(pa, qb)] ist (Quot(R), +, ·, [(0, 1)], [(1, 1)]) ein Körper. Man nennt ihn den Quotientenkörper20 von R. Da Z ein Integritätsbereich ist, können wir definieren: Definition 7.19 Der Körper der rationalen Zahlen ist Q = Quot(Z) mit den im vorigen Satz gegebenen Verknüpfungen. Beweis von Satz 7.18. Wir schreiben ab jetzt statt [(a, b)] einfach ab . Im folgenden sind alle Brüche als Elemente von Quot(R) aufzufassen. Zuerst müssen wir zeigen, dass Addition und Multiplikation wohldefiniert 0 0 0 0 sind. Das heißt, ist pq0 = pq und ab0 = ab , dann sollten auch pq0 + ab0 = pq + ab und p0 q0 · a0 b0 = p q · a b gelten. Man beachte: es ist pq 0 = p0 q und ab0 = a0 b. Also p 0 a0 p 0 b 0 + q 0 a0 p0 qbb0 + qq 0 a0 b pq 0 bb0 + qq 0 ab0 pb + qa p a + = = = = = + , 0 0 0 0 0 0 0 0 q b qb qq bb qq bb qb q b 0 0 0 0 0 0 0 0 pa p qa b pq ab pa p a p a · 0 = 0 0 = 0 0 = 0 0 = = · . 0 q b qb qq bb qq bb qb q b Die Ringaxiome lassen sich jetzt nachweisen, zum Beispiel p a c p ad + bc pad + pbc pqad + pqbc pa pc p a p c = + = · = = + = · + · . 2 q b d q bd qbd q bd qb qd q b q d Nullelement: pq + 10 = p q · = pq = 11 , und pq · q p pq 20 p·1+q·0 q·1 p 1 = q 1 = pq . Einselement: ist analog. englisch: fraction field 57 p q · 1 1 = p·1 q·1 = pq . Inversen: 7.3 Restklassenringe Wir haben schon verschiedentlich Division mit Rest thematisiert: Zu a, b ∈ N mit a 6= 0 gibt es q, r ∈ N und r < a mit b = a · q + r. nach Bonusaufgabe 8.6* sind q und r eindeutig durch a, b bestimmt. Beweis der Bonusaufgabe. Es seien q1 , q2 , r1 , r2 ∈ N mit r1 , r2 < a und b = a · q1 + r1 = a · q2 + r2 . Durch Umbenennen können wir erreichen, dass q1 ≤ q2 . Es gibt also k ∈ N mit q2 = q1 + k. Es folgt also (unter Anwendung der üblichen Rechenregeln) a · q2 + r2 = a · q1 + (a · k + r2 ) = a · q1 + r1 . Da (N, +) kürzbar ist, folgt r1 = a · k + r2 . Wäre k > 0, so wäre r1 = a + (a · (k − 1) + r2 ) und damit r1 ≥ a. Das stünde im Widerspruch zur Voraussetzung, also ist k = 0 und damit q1 = q2 und r1 = a · 0 + r2 = r2 . Wegen der Eindeutigkeit können wir quo(b, a) = q und rem(b, a) = r definieren. Für jedes a ∈ N \ {0} erhalten wir eine Relation ∼a auf N, gegeben durch m ∼a n ⇐⇒ rem(m, a) = rem(n, a). Dies ist ziemlich offensichtlich eine Äquivalenzrelation, die bereits in Hausaufgaben vorkam. Die Äquivalenzklasse von n ∈ N ist [n]a = {rem(n, a) + k · a : k ∈ N}. Statt m ∼a n schreibt man meist m ≡ n (mod a) („m ist kongruent zu n modulo a“). Im Rest dieses Abschnitts halten wir a ∈ N\{0} fest. Zur Abkürzung schreiben wir qm = quo(m, a) und m = rem(m, a) für alle m ∈ N. Für alle m, n ∈ N gilt m ≡ n (mod a) ⇐⇒ m = n und daher [m]a = [m]a . Lemma 7.20 Für alle m, n ∈ N gilt m + n = m + n und m · n = m · n. Beweis. Es ist m + n = qm+n · a + m + n und auch m + n = (qm + qn ) · a + (m + n) = (qm + qn + qm+n ) · a + m + n Daraus folgt der erste Teil der Behauptung. Es ist m · n = qm·n · a + m · n und auch m · n = (qm · qn · a + qm · n + m · qn + qm·n ) · a + m · n Daraus folgt der zweite Teil der Behauptung. Satz 7.21 (und Definition) Es sei a ∈ N\{0}. Auf N/∼a definieren wir innere Verknüpfungen [m]a + [n]a = [m + n]a und [m]a · [n]a = [m · n]a für alle m, n ∈ N. Dadurch wird (N/∼a , +, ·, [0]a , [1]a ) zu einem kommutativen unitären Ring, den man als Restklassenring bezeichnet und meist als N/aN, N/a, Z/aZ oder Z/a notiert.21 Er hat genau a Elemente. 21 Man kann ∼a analog auf Z statt nur auf N definieren, daher die Notationen. 58 Beweis. Nach Lemma 7.20 sind + und · auf N/∼a wohldefiniert. Die Ringaxiome folgen ebenfalls wegen des Lemmas aus der Gültigkeit der entsprechenden Axiome in N. Die Elemente des Restklassenrings sind [0]a , [1]a , ..., [a − 1]a : Diese sind paarweise verschieden, und wegen [a]a = [0]a gibt es keine weiteren Elemente. Bekanntlich ist eine Primzahl eine natürliche Zahl p > 1, die nur durch 1 und sich selbst teilbar ist. Ebenso sollte aus der Schule bekannt sein: Wenn eine Primzahl p ein Produkt m · n teilt, dann teilt sie einen der Faktoren m, n. Satz 7.22 Es sei p eine Primzahl. Dann ist N/pN ein Körper. Beweis. Wir wissen bereits, dass N/pN ein kommutativer Ring ist. Wegen p > q ist [0]p 6= [1]p . Wir zeigen nun, dass N/pN Nullteilerfrei ist. Angenommen, es wären m, n ∈ N, m, n < p, so dass [m]p ·[n]p = [m·n]p = [0]p . Das ist gleichbedeutend mit p | (m·n). Da p prim ist, folgt p | m oder p | n. Also ist [m]p = [0]p oder [n]p = [0]p , der Ring ist also nullteilerfrei. Wegen Lemma 7.16 ist also (N/pN \ {[0]p }, ·, [1]p ) ein kürzbares endliches Monoid. Nach Hausaufgabe 9.5 ist es also eine Gruppe und daher N/pN ein Körper. Bemerkung 7.23 Eliakim Hastings Moore [1862–1932] „klassifizierte“ alle endlichen Körper (d.h. er zeigte, wie man jeden endlichen Körper bis auf Isomorphie konstruieren kann). Insbesondere ist die Ordnung jedes endlichen Körpers eine Primzahlpotenz, und für jede Primzahlpotenz (d.h. pn für p prim und n ∈ N>0 ) gibt es einen endlichen Körper dieser Ordnung. Vorsicht: N/pn N ist zwar ein kommutativer Ring und hat genau pn viele Elemente, aber ist für n > 1 kein Körper (z.B. ist für n > 1 sowohl p 6≡ 0 (mod pn ) als auch pn−1 6≡ 0 (mod pn ), aber p · pn−1 = pn ≡ 0 (mod pn ). 7.3.1 Anwendungen Rechnen „modulo n“ bietet sich besonders bei periodischen Vorgängen an, etwa im Zusammenhang mit Kalendern. Außerdem ist a|b ⇐⇒ b ≡ 0 (mod a), d.h. man kann damit Teilbarkeit untersuchen. Wir lösen zunächst einige alte Übungsaufgaben, die Sie vermutlich umständlicher mit vollständiger Induktion gelöst haben, und betrachten dann einige Teilbarkeitsregeln. Hausaufgabe 6.1 c): 5n + 7 ist durch 4 teilbar, für alle n ∈ N. Beweis. 5n + 7 ≡ 1n + 3 ≡ 4 ≡ 0 (mod 4). 59 Hausaufgabe 7.5: n3 − n ist durch 3 teilbar, für alle n ∈ N. Beweis. Der Rest von n bei Division durch 3 ist entweder 0, 1 oder 2. Es ist 03 − 0 = 0 13 − 1 = 0 23 − 2 = 6 ≡ 0 (mod 3) Bemerkung 7.24 Das Ergebnis von Hausaufgabe 7.5 ist kein Zufall. In einer anderen Hausaufgabe sollen Sie zeigen: Wenn p eine Primzahl ist, dann ist np − n durch p teilbar, für alle n ∈ N. Teilbarkeitsregeln Es sei n ∈ N eine Zahl mit Ziffern z0 , z1 , z2 , ..., zl im Dezimalsystem. Das heißt: P n = li=0 10i zi . Aus der Schule wissen Sie, wie man an den Ziffern relativ leicht erkennt, ob n durch 2, 3, 4, 5, 9 oder 11 teilbar ist. Für einige dieser Teilbarkeitsregeln führen wir hier den Beweis, manche werden (ggf. verallgemeinert) in den Hausaufgaben bewiesen, und außerdem stellen wir noch eine Teilbarkeitsregel für 7 vor. Teilbarkeit durch 2 bzw. 5: 2 | n bzw. 5 | n genau dann wenn 2 | z0 bzw. 5 | z0 . Beweis. Es ist 10 ≡ 0 (mod 2), also n = z0 + 10z1 + 100z2 + ... ≡ z0 + 0z1 + 0z2 + ... = z0 (mod 2). Ebenso modulo 5, da 10 ≡ 0 (mod 5). Teilbarkeit durch 2k bzw. 5k für k ∈ N>0 : 2k | n bzw. 5k | n genau dann P i i k Pk−1 wenn 2k | k−1 i=0 10 zi bzw. 5 | i=0 10 zi . Beweis: Übung. Teilbarkeit durch 3 bzw. 9: 3 | n bzw. 9 | n genau dann wenn 3 | li=0 zi P P bzw. 9 | li=0 zi . Beweis: Übung. Man nennt li=0 zi die Quersumme von n. P Teilbarkeit durch 11: 11 | n genau dann wenn 11 | z0 − z1 + z2 − z3 ± P P ... = li=0 (−1)i zi . Mann nennt li=0 (−1)i zi die alternierende Quersumme von n. Beispiel: 123456 hat alternierende Quersumme 6 − 5 + 4 − 3 + 2 − 1 = +3, also nicht durch 11 teilbar. Bei der alternierenden Quersumme fängt man rechts an. Beweis. Es ist 10 ≡ −1 (mod 11). Also ist n ≡ 60 Pl i i=0 (−1) zi (mod 11). Teilbarkeit durch 7: 7 | n genau dann wenn 7 | z0 + 3z1 + 2z2 − z3 − 3z4 − 2z5 + z6 + ...; man summiert also die Ziffern (beginnend mit der Einerziffer) mit den Vorfaktoren 1, 3, 2, −1, −3,−2, ... (ab hier wiederholen sich die Vorfaktoren periodisch). Man nennt dies eine gewichtete Quersumme. Beweis. Es ist 100 101 102 ≡ 3 · 3 103 ≡ 3 · 2 104 ≡ 3 · (−1) 105 ≡ 3 · (−3) 106 ≡ 3 · (−2) = −6 = ≡ ≡ ≡ = ≡ ≡ ... 1 3 (mod 7) 2 (mod 7) −1 (mod 7) −3 (mod 7) −2 (mod 7) 1 (mod 7) Beispiel 7.25 422625 ist durch 3, durch 7 und durch 53 = 125 teilbar. Teilbarkeit durch 3: 5 + 2 + 6 + 2 + 2 + 4 = 21 ist durch 3 teilbar. Teilbarkeit durch 125: Die aus den letzten drei Ziffern gebildete Zahl (also 625) ist durch 125 teilbar. Teilbarkeit durch 7: 5 + 3 · 2 + 2 · 6 − 2 − 3 · 2 − 2 · 4 = 7. 7.4 Die reellen Zahlen Eine ordentliche Konstruktion der reellen Zahlen R gehört zur Analysis und würde den Rahmen dieser Lehrveranstaltung sprengen. Wir setzen daher den Zahlenstrahl R als bekannt voraus: Reelle Zahlen bilden einen Körper und lassen sich als Dezimalzahlen mit ggf. unendlich vielen Nachkommastellen darstellen. Jede reelle Zahl lässt sich beliebig gut durch Brüche approximieren. So kann man etwa π = 3, 14159265... approximieren durch 3/1, 31/10, 314/100, 3141/1000. Es ist Q ⊆ R. Elemente von R \ Q heißen irrational; wir hatten schon in Satz 1.9 √ gezeigt, dass 2 irrational ist. Außerdem gibt es auf R eine Totalordnung ≤, die verträglich ist mit den Grundrechenarten: Für alle a, b, c ∈ R gilt a ≤ b =⇒ a + c ≤ b + c a ≤ b ∧ 0 ≤ c =⇒ a · c ≤ b · c 0 1 0 < a ≤ b =⇒ 1b ≤ < a Eng verknüpft mit der Approximationseigenschaft ist folgende Aussage: Archimedisches Axiom Für jedes x ∈ R gibt es ein n ∈ N mit n > x. 61 Das Axiom ist nach Archimedes von Syrakus [ca. 287 v.Chr.–212 v. Chr.] benannt, stammt aber vermutlich von Eudoxos von Knidos [4. Jhdt. v. Chr.]. Lemma 7.26 a) Zwischen zwei verschiedenen rationalen Zahlen findet man immer mindestens eine irrationale Zahl. b) Zwischen zwei verschiedenen reellen Zahlen findet man immer mindestens eine rationale Zahl. √ Beweis. Sei x < y und x, y ∈ Q. Wir definieren z = x + 22 (y − x). Es ist √ √ . Das 1 < 2 < 2, also ist x < z < y. Nach der Definition von z gilt 2 = 2(z−x) y−x √ heißt: Wären x, y, z alle rational, so wäre auch 2 rational, Widerspruch. Da wir x, y ∈ Q voraussetzen, muss folglich z irrational sein. Dies beweist Aussage a). Nun seien x < y beliebige reelle Zahlen, also y − x > 0. Nach dem Archimedi1 , d.h. n1 < y − x. Ferner gibt es `, m ∈ N schen Axiom gibt es n ∈ N mit n > y−x mit ` ≥ −nx und m ≥ ny, also − n` ≤ x < y ≤ m . Irgendwo also zwischen −` n 1 > x. Wegen < y − x ist r+1 aber und +m gibt es ein r ∈ Z mit nr ≤ x und r+1 n n n r+1 immer noch kleiner als y, also x < n < y. Das beweist Aussage b). 7.5 Polynome In der Schule haben Sie unter Anderem auch das Rechnen mit „Unbekannten“ gelernt, etwa (X +1)·(X −1) = X 2 −1. Ausdrücke, die nur durch Anwendung von +, − und · auf Zahlen und eine „Unbekannte“ X entstehen, heißen Polynome. Definition 7.27 Ein Polynom ist eine Funktion f : R → R der Art f (X) = n X ai X i mit a0 , a1 , . . . , an ∈ R. i=0 Die a0 , ..., an heißen Koeffizienten von f . Ist an 6= 0, so hat f den Grad n = deg(f ). Der Grad ist nicht definiert, falls alle Koeffizienten Null sind (Nullpolynom).22 Ist an = 1, so heißt f normiert. Der Koeffizient a0 = f (0) heißt konstanter Term von f . Die Menge aller Polynome bezeichnet man mit R[X]. Beispiele 13X 3 − 4X 2 + 5X − 1 hat Grad 3. Das Polynom 0X 6 − X 5 + X 4 + 0X 3 + 0X 2 + 0X + 1 hat Grad 5, nicht 6, und man würde es normalerweise als −X 5 + X 4 + 1 schreiben. Streng genommen heißt das, was wir gerade definiert haben, „PolynomfunkP tion“, während ein Polynom eine „formale Summe“ ni=0 ai X i mit Elementen a1 , ..., an eines Ringes (nicht unbedingt R!) ist. 22 In manchen Büchern wird in diesem Fall deg(f ) = −∞ definiert. 62 Notation Oft schreibt man ein Polynom f in der Form f = i≥0 ai X i . Dabei ist ai = 0 gemeint, falls i > deg(f ) ist oder f das Nullpolynom ist. P Bemerkung 7.28 In der Analysis zeigt man, das zwei (reelle) Polynome nur dann gleich sind, wenn der Grad und alle Koeffizienten gleich sind. Insbesondere ist ∀X ∈ R : f (X) = 0 genau dann, wenn alle Koeffizienten Null sind. Für Polynome mit Koeffizienten in endlichen Ringen gilt dies nicht! So ist X 7→ X 3 − X Null als Funktion N/3N → N/3N. Grund: x3 − x ≡ 0 (mod 3) für alle x ∈ N. Polynome kann man addieren und multiplizieren. Beispiele Es ist (X 3 − X + 17) + (−2X 3 + X 2 + 3X + 1) = (1 − 2)X 3 + X 2 + (−1 + 3)X + (17 + 1) = −X 3 + X 2 + 2X + 18 , und (X 3 − X + 17)(X 2 + 2X − 3) = (X 5 + 2X 4 − 3X 3 ) + (−X 3 − 2X 2 + 3X) + (17X 2 + 34X − 51) = X 5 + 2X 4 − 4X 3 + 15X 2 + 37X − 51 . Allgemein sind Addition und Multiplikation von Polynomen so definiert: X i≥0 ai X i + X bi X i = i≥0 X X ai X i b j X j i≥0 j≥0 (ai + bi )X i X i≥0 = X (ai · bj )X i+j = n≥0 i,j≥0 X X (ai · bj ) X n . i+j=n So wird R[X] zu einem kommutativen unitären Ring: Das Nullelement ist die konstante Funktion 0 und das Einselement die konstante Funktion 1. Bemerkung 7.29 Polynome ähneln der Darstellung von Zahlen in einem Stellenwertsystem. Eine natürliche Zahl im Dezimalsystem darstellen, heißt ja, sie P in der Form i≥0 zi 10i mit Koeffizienten z0 , z1 , ... ∈ {0, 1, ..., 9} zu schreiben. Die Grundrechenarten mit Polynomen sind sogar in gewissem Sinne „leichter“ als die Grundrechenarten für Dezimalzahlen: Beim Addieren und Multiplizieren von Dezimalzahlen hat man bekanntlich den „Übertrag“ zu berücksichtigen; bei Polynomen gibt es so etwas nicht. Lemma 7.30 Für Polynome f, g ∈ R[X], die beide 6= 0 sind, gelten deg(f · g) = deg(f ) + deg(g) deg(f + g) ≤ max (deg(f ), deg(g)) oder f + g = 0. 63 Beispiel f = X 2 + X und g = −X 2 haben Grad 2, aber f + g = X hat Grad 1. Beweis. Sei f = ni=0 ai X i mit deg(f ) = n, also an 6= 0; und sei g = Pm j j=0 bj X , mit deg(g) = m, also bm 6= 0. Dann P f ·g = n X ! m X ai X i b j X j i=0 j=0 = n X m X ai bj X i+j . i=0 j=0 Der größte Wert von i + j ist n + m. Dies kommt nur bei i = n, j = m vor. Also f · g = an bm X n+m + (Terme von kleineren Grad) . Daraus folgt deg(f · g) ≤ deg(f ) + deg(g). Weil R nullteilerfrei ist, gilt an bm 6= 0, da an , bm beide 6= 0. Also deg(f g) = n + m = deg(f ) + deg(g). P Ferner ist f + g = i≥0 (ai + bi )X i . Wenn i > max (deg(f ), deg(g)), dann ist ai = bi = 0, also auch ai +bi = 0. Daher ist deg(f +g) ≤ max (deg(f ), deg(g)). In den natürlichen Zahlen (und entsprechend in den ganzen Zahlen) kann man nach Satz/Definition 5.33 mit Rest dividieren. Nach dem folgenden Lemma ist auch für Polynome Division mit Rest möglich (allgemein: Für Polynome mit Koeffizienten in einem Körper). Zunächst aber ein kleines Beispiel: Wir berechnen (x4 + x2 + 2) : (2 · x2 − x) mit Rest. Der Ablauf ist schrittweise und völlig analog zur schriftlichen Division ganzer Zahlen aus der Schule. (x4 + x3 − 2x +2) : (2x2 − 1) = (1/2x2 + 1/2x + 1/4) Rest (−3/2x + 9/4) 2 4 −x +1/2x +x 3 +1/2x2 −x3 +1/2x 2 +1/2x − 3/2x −1/2x2 +1/4 −3/2x +9/4 Lemma 7.31 (Polynomdivision mit Rest) Es seine f, g ∈ R[X] zwei Polynome mit g 6= 0. Dann gibt es Polynome q, r ∈ R[X] mit f =q·g+r und r = 0 ∨ deg(r) < deg(g) . Beweis. Wenn f = 0, dann stimmt die Aussage, mit q = r = 0. Wir betrachten daher ab jetzt den Fall f 6= 0, so dass deg(f ) definiert ist. Der Beweis erfolgt durch Induktion über deg(f ). Induktionsanfang: Ist deg(f ) < deg(g), dann funktioniert q = 0 und r = f . 64 Induktionsschritt: Sei deg(f ) = n ≥ m = deg(g). Also f = nr=0 ar X r und P s 6 0. Da f und bamn X n−m g beide die Gestalt g= m s=0 bs X mit an , bm beide = P an X n + (Terme von kleinerem Grad) haben, setzen wir f1 = f − bamn X n−m g. Hierfür brauchen wir, dass R ein Körper und bm 6= 0 ist. Wir erhalten deg(f1 ) < n. Nach Induktionsannahme gibt es Polynome q1 , r1 mit f1 = q1 · g + r1 und deg(r1 ) < deg(g). Also f = f1 + für q(X) = an X n−m bm an n−m X ·g =q·g+r bm + q1 (X) und r(X) = r1 (X). Lemma 7.32 Sei f ∈ R[X] ein Polynom vom Grad n. Für λ ∈ R gilt: f (λ) = 0 ⇐⇒ das Polynom X − λ ∈ R[X] teilt f . Beweis. ⇐: Ist h ∈ R[X] mit f = (X − λ) · h, dann f (λ) = (λ − λ) · h(λ) = 0 · h(λ) = 0. ⇒: Wir nutzen Polynomdivision. Es gibt q, r ∈ R[X], so dass f = (X − λ)q + r, mit deg(r) < deg(X − λ) = 1. Das heißt, r ist eine konstante Funktion: r(X) = µ für ein µ ∈ R. Wir setzen X = λ ein: f (λ) = (λ − λ) · q(λ) + r(λ) = µ. Ist also f (λ) = 0, dann ist auch µ = r = 0 und damit f = (X − λ)q, also (X − λ)|f . 7.5.1 Der größte gemeinsame Teiler In der Schule — spätestens im Zusammenhang mit Bruchrechnung — lernt man den Begriff des „größten gemeinsamen Teilers“ (ggT) zweier ganzer Zahlen. Vielleicht haben Sie ggT(99, 78) so bestimmt: 99 = 32 · 11 und 78 = 2 · 3 · 13, also ggT(99, 78) = 3. Leider ist die Zerlegung von großen Zahlen in Primfaktoren sehr schwer. Mit Hilfe der Division mit Rest kann man jedoch den ggT auch ohne Primfaktorzerlegung berechnen — und zwar nicht nur in Z, sondern auch in R[X] und allgemein in jedem Ring, in dem es Division mit Rest gibt. Im Rest dieses Abschnitts sei R = Z oder R = R[X]. Definition 7.33 Sei a, b ∈ R \ {0}. Ein g ∈ R ist ein größter gemeinsamer Teilervon a, b, falls g|a und g|b und zudem für alle h ∈ R mit h|a und h|b bereits h|g folgt. Meist schreibt man dann g = ggT(a, b). Bemerkung ggT(a, b) ist nicht eindeutig. So ist auch −3 ein größter gemeinsamer Teiler von 99 und 78. Für R = Z kann man aber stets ggT(a, b) > 0 wählen, und für R = R[X] kann man ggT(a, b) als normiertes Polynom wählen. Dadurch erreicht man Eindeutigkeit. Lemma 7.34 Für a, b ∈ R \ {0} gilt: 65 a) Wenn rem(a, b) = 0, dann ist b ein ggT(a, b). b) g ∈ R ist ein ggT(a, b) genau dann wenn es ein ggT(b, rem(a, b)) ist. Beweis. a) Klar, denn rem(a, b) = 0 heißt b|a. b) Division mit Rest war ja definiert durch a = quo(a, b) · b + rem(a, b). Wenn g|b und g| rem(a, b), dann teilt g auch deren Summe, also g|a. Wenn g|a und g|b, dann teilt g auch quo(a, b) · b und damit auch rem(a, b) = a − quo(a, b) · b. Jeder gemeinsame Teiler von b und rem(a, b) ist also gemeinsamer Teiler von a und b, und umgekenrt. Daraus folgt die Behauptung. Damit kann man ggT(99, 78) schrittweise berechnen: 99 = 1 · 78 + 21 78 = 3 · 21 + 15 21 = 1 · 15 + 6 15 = 2 · 6 + 3 6=2·3+0 Der ggT der beiden unterstrichenen Zahlen ist nach dem Lemma in jeder Zeile gleich, also ggT(99, 78) = 3. Dies nennt man den euklidischen Algorithmus. Nach endlich vielen Schritten endet das Verfahren (Rest 0 in der letzten Zeile), da ja der Rest jedes Schrittes zum Divisor des nächsten Schrittes wird und der dann berechnete Rest in jedem Fall kleiner als der Divisor ist. Die berechneten Reste werden also in jedem Schritt echt kleiner als im vorigen Schritt.23 Man erhält sogar noch mehr: In der vorletzten Zeile sieht man, wie man den ggT aus den beiden unterstrichenen Zahlen ausrechnen kann: 3 = 15 − 2 · 6. Man kann jeweils die darüberstehende Gleichung einsetzen und erhält: 3 = 15 − 2 · 6 = 15 − 2 · (21 − 1 · 15) = 3 · 15 − 2 · 21 = 3 · (78 − 3 · 21) − 2 · 21 = 3 · 78 − 11 · 21 = 3 · 78 − 11 · (99 − 78) = 14 · 78 − 11 · 99 Dies nennt man den erweiterten euklidischen Algorithmus. Da er sich für alle Zahlen — allgemeiner für alle a, b ∈ R \ {0} — anwenden lässt, ist er zugleich ein Beweis des folgenden Lemmas. Lemma 7.35 (Lemma von Bézout) Für a, b ∈ R \ {0} existiert ggT(a, b) ∈ R (allerdings nur bis auf Normierung, siehe oben), und es gibt s, t ∈ R mit ggT(a, b) = s · a + t · b. 23 Bei Polynomdivision: Der Grad des Restes wird in jedem Schritt echt kleiner als im vorigen Schritt. 66 Korollar 7.36 Sei n ∈ N>0 und m ∈ Z. Dann ist [m]n ∈ Z/nZ invertierbar (also eine Einheit) genau dann wenn ggT(m, n) = 1. Beweis. [m]n ∈ Z/nZ invertierbar heißt: Es gibt s ∈ Z mit s·m ≡ 1 (mod n). Nach Definition von ≡ heißt das: Es gibt t ∈ Z mit s·m+t·n = 1, also ggT(m, n) = 1. Nach dem Lemma von Bézout kann man auch umgekehrt schließen. 7.6 Die komplexen Zahlen Vermutlich haben Sie in der Schule die Vorstellung verinnerlicht, dass das Wurzelziehen aus negativen Zahlen „nicht geht“. Die komplexen Zahlen bilden einen Körper, der R enthält, und in dem man aus jeder Zahl Wurzeln ziehen kann. Definition 7.37 Der Körper C der komplexen Zahlen besteht aus der Menge R2 , zusammen mit der üblichen komponentenweise Addition (a, b) + (c, d) := (a + c, b + d) und mit der folgenden Multiplikationsregel: (a, b) · (c, d) := (ac − bd, ad + bc) . (*) Notation 7.38 Ist z = (a, b) ∈ C, so nennt man a√bzw. b den reellen Teil <(z) bzw. den imaginären Teil =(z) von z. Durch |z| := a2 + b2 ∈ R wird der Betrag von z definiert. Beachte: |z| ist ≥ 0, und |z| = 0 ⇒ z = (0, 0). Man schreibt i = (0, 1) ∈ C und identifiziert a ∈ R mit (a, 0) ∈ C. Für b ∈ R folgt dann ib = (0, 1) · (b, 0) = (0, b), also gilt a + ib = (a, b). Mit dieser Schreibweise lautet die Multiplikationsregel: (a + ib) · (c + id) = (ac − bd) + i(ad + bc) . (**) Insbesondere gilt i2 = −1. Lemma 7.39 C ist ein Körper. Beweis. Offensichtlich ist (R2 , +) eine abelsche Gruppe. Multiplikation kommutativ mit Einselement 1 = 1 + 0i = (1, 0): folgt aus (**). Multiplikation assoziativ: (a + ib) ((c + id)(e + if )) = (a + ib) ((ce − df ) + i(cf + de)) = (ace − adf − bcf − bde) + i(acf + ade + bce − bdf ) ((a + ib)(c + id)) (e + if ) = ((ac − bd) + i(ad + bc)) (e + if ) = (ace − bde − adf − bcf ) + i(acf − bdf + ade + bce) . 67 Die Distributivgesetze: (a + ib) ((c + id) + (e + if )) = (a + ib) ((c + e) + i(d + f )) = (a(c + e) − b(d + f )) + i (a(d + f ) + b(c + e)) = ((ac − bd) + i(ad + bc)) + ((ae − bf ) + i(af + be)) = (a + ib)(c + id) + (a + ib)(e + if ) Multiplikative Inverse: Für a+ib 6= 0 ist a2 +b2 6= 0. Wegen (a+ib)(a−ib) = a2 +b2 folgt 1 (a + ib)−1 = 2 (a − ib) . a + b2 Somit ist C tatsächlich ein Körper. Definition 7.40 Für z ∈ C ist die konjugierte komplexe Zahl z̄ gegeben durch a + ib = a − ib ∈ C . Lemma 7.41 Seien z, w ∈ C. Dann a) z + w = z̄ + w̄. b) zw = z̄ · w̄. c) Es ist z ∈ R genau dann, wenn z = z̄. d) z · z̄ = |z|2 . Für z 6= 0 gilt also z −1 = z̄ . |z|2 Beweis. Übung. 7.6.1 Die Gaußsche Zahlenebene Definition 7.42 Stellt man die komplexe Zahl a + ib ∈ C als den Punkt (a, b) der Ebene R2 dar, hat man C mit der Ebene identifiziert. Dies nennt man die Gaußsche Zahlenebene 24 , oder auch das Arganddiagramm 25 , obwohl sie eigentlich zuerst 1797 von Caspar Wessel [1745–1818] beschrieben wurde. Einige Aspekte der komplexen Zahlen lassen so geometrische Deutungen zu: • Addition von komplexen Zahlen ist die übliche Vektoraddition in R2 (Kräfteparallelogramm). • Komplexe Konjugation a + ib = a − ib ist die Spiegelung in der x-Achse. 24 25 Carl Friedrich Gauß [1777–1855] beschrieb sie in einem Brief von 1811. Jean–Robert Argand [1768–1822] beschrieb sie schon 1806 68 • Polarkoordinaten: Sei z = a + ib ∈ C. Seien (r, θ) die Polarkoordinaten (Bogenmaß) des Punkts (a, b) ∈ R2 , also r ≥ 0 und a = r cos(θ), b = r sin(θ). Dann z = a + ib = r(cos(θ) + i sin(θ)). Daher ist a2 + b2 = r2 cos2 (θ)+r2 sin2 (θ). Man kann zeigen cos2 (θ)+sin2 (θ) = 1, also r2 = a2 +b2 und damit r = |z|. Man nennt θ das Argument arg(z). • Multiplikation: Ist eine zweite Zahl w = s(cos(φ) + i sin(φ)) ∈ C gegeben, dann zw = rs(cos(θ) + i sin(θ))(cos(φ) + i sin(φ)) = rs((cos(θ) cos(φ) − sin(θ) sin(φ)) + i(cos(θ) sin(φ) + sin(θ) cos(φ))) = rs(cos(θ + φ) + i sin(θ + φ)) . Also |zw| = |z| |w|, und arg(zw) = arg(z) + arg(w). Lemma 7.43 C enthält alle Wurzeln: Für jedes 0 6= z ∈ C und für jedes n ≥ 1 hat die Gleichung wn = z genau n verschiedene Lösungen in C. Beweis. Seien (r, θ) die Polarkoordinaten von z und√(s, φ) die Polarkoordinaten von w. Die Gleichung wn = z ist äquivalent zu s = n r und nφ ≡ θ (mod 2π). Also φ ∈ { nθ , θ+2π , θ+4π , . . . , θ+2(n−1)π }. n n n Beispiel Es sei z ∈ C und z 5 = 1. Es folgt |z 5 | = |z|5 = 1. Weil |z| eine positive reelle Zahl ist, folgt |z| = 1. Ferner muss arg(z 5 ) = 5 arg(z) durch 2π teilbar sein. Daher hat die Gleichung z 5 = 1 fünf verschiedene Lösungen z ∈ C: , 4π , 6π , 8π }. z = cos(θ) + i sin(θ) für θ ∈ {0, 2π 5 5 5 5 7.6.2 Komplexe Zahlen und Polynome Lemma 7.44 Sei p(X) ein Polynom mit reellen Koeffizienten. Ist z ∈ C eine Nullstelle von p(X), dann ist auch z̄ eine Nullstelle. Somit treten die nichtreellen Nullstellen von p(X) immer paarweise auf. Beweis. Es ist p(X) = Daher ist Pn 0 = 0 = p(z) = r=0 n X r=0 ar X r , und für jedes r ist ar ∈ R, d.h. ar = ar . ar z r = n X r=0 ar z r = n X ar z̄ r = p(z̄) . r=0 Beispiel Die Nullstellen von X 2 + 1 sind i und ī = −i. Auch bei X 2 + X + 1 √ gibt es die nicht reellen Nullstellen ω = − 12 + i 23 und ω̄. p 2 1 2 2 Beispiel √ 2Für p, q ∈ C ist X +pX +q2 = (X + 2 ) − 4 (p −4q). Nach Lemma 7.43 existiert p − 4q ∈ C. Daher ist X + pX + q = 0 immer lösbar in C, mit Lösungen √ −p ± p2 − 4q X= . 2 69 Einen Beweis des folgenden wichtigen Satzes würde den Rahmen dieser Lehrveranstaltung sprengen. Fundamentalsatz der Algebra Jedes Polynom vom Grad ≥ 1 mit Koeffizienten aus C hat mindestens eine Nullstelle in C. Anders gesagt: Über C lässt sich jedes Polynom als Produkt von linearen Faktoren schreiben. 70 8 Elementare Kombinatorik Man kann die Kombinatorik als die „Kunst des Zählens“ betrachten: Man untersucht, wie viele Elemente eine mathematische Struktur besitzt. Eine erste Blüte erlebte sie mit dem Entstehen der Wahrscheinlichkeitstheorie im 17. Jahrhundert (z.B. Blaise Pascal [1623–1662]: Bei der Wahrscheinlichkeitsanalyse von Glücksspielen ist es nämlich wichtig, die Anzahl sämtlicher möglicher (gleich wahrscheinlicher) Spielergebnisse und die Anzahl der zum Sieg führenden Spielergebnisse zu bestimmen. Allerdings gab es auch schon lange vorher Untersuchungen, die man der Kombinatorik zurechnen kann. Dabei kann man alles mögliche zählen: Teilmengen, Abbildungen, aber auch geometrische Strukturen („Auf wie vielen verschiedenen Wegen kann man in einem Rechteckgitter von der linken unteren in die rechte obere Ecke gelangen, ohne einen Gitterpunkt zweimal zu besuchen?“), Gruppenelemente („Wie viele Elemente von Sn = Sym({1, 2, ..., n}) haben einen Zykel der Länge ≥ n2 ?“) oder Gruppen („Wie viele Isomorphieklassen von Gruppen der Ordnung n ∈ N gibt es?“). Anwendungen der Kombinatorik gibt es auch in der theoretischen Physik, besonders der statistischen Mechanik. 8.1 Exponentialfunktion Hier ist der Grund, warum die Potenzmenge Potenzmenge heißt: Lemma 8.1 Es sei M eine endliche Menge. Dann gibt es genau 2|M | Teilmengen von M . Mit anderen Worten: |P(M )| = 2|M | . Beweis. Jede Teilmenge T ⊆ M ist dadurch bestimmt, welche Elemente von M in T liegen und welche nicht. Wenn man nun für jedes Element von M separat wählt, ob das Element in einer bestimmten Teilmenge liegt oder nicht, so gibt es dafür insgesamt 2|M | viele Wahlmöglichkeiten. Durch jede Wahl entsteht eine Teilmenge, und durch zwei unterschiedliche Wahlen entstehen auch unterschiedliche Teilmengen. 8.2 Fakultät Lemma 8.2 Für n ∈ N sind die folgenden vier Zahlen gleich: a) Die Anzahl der Wege, n verschiedene Objekte durchzunummerieren. b) Die Anzahl der Bijektionen f : A → B, wobei die Mengen A und B jeweils n Elemente haben. c) Die Ordnung |Sn | der symmetrischen Gruppe Sn . d) n! 71 Beweis. Wir zeigen b) = d) per Induktion über n. Zur Erinnerung: 0! = 1! = 1 und (n + 1)! = n! · (n + 1). Induktionsanfang: Die Aussage ist wahr für n = 0, nach Definition von 0!. Induktionsschritt: Sei n ≥ 1. Wähle a ∈ A. Es gibt n Möglichkeiten für den Wert von f (a) ∈ B. Hat man f (a) jetzt gewählt, dann gibt es laut Induktionsannahme (n−1)! Bijektionen zwischen A\{a} und B \{b}, d.h. diese Wahl von f (a) führt zu (n − 1)! verschiedene Bijektionen zwischen A und B. Also insgesamt (n − 1)! · n = n! Bijektionen. Ist A eine Menge mit n Elementen, so ist eine Durchnummerierung von A das gleiche wie eine Bijektion von {1, 2, . . . , n} nach A. Eine Permutation aus Sn ist eine Bijektion von {1, 2, . . . , n} nach sich selbst. Daraus folgen die anderen Aussagen des Lemmas. 8.3 Binomialkoeffizienten ! n Definition 8.3 Für n ∈ N0 und k ∈ {0, 1, 2, . . . , n} ist ∈ N0 die Anzahl der k k-elementigen Teilmengen einer n-elementigen Menge. Lemma 8.4 Für n ∈ N0 und 0 ≤ k ≤ n gelten: ! a) n n! = k k!(n − k)! b) n n = n−k k c) n n = = 1 und 0 n ! ! ! ! ! n = n. 1 ! d) Für k < n ist ! ! n+1 n n = + . k+1 k k+1 e) Ist p eine Primzahl und 1 ≤ k ≤ p − 1, dann ist p k ! durch p teilbar. Beweis. d): Sei A eine Menge mit n + 1 Elementen, und sei a ∈ A. Eine (k + 1)-elementige Teilmenge besteht entweder aus k + 1 Elementen aus A \ {a}, n oder aus a zzgl. k Elemente aus A \ {a}. Es gibt k+1 Teilmengen der ersten Sorte, und nk der zweiten. c) folgt aus der Definition. b): Man kann eine k-elementige Teilmenge auch dadurch beschreiben, dass man sagt, welche n − k Elemente nicht drin liegen. 72 a): Induktion über n. Folgt aus c) falls k ∈ {0, 1, n}, daher wahr für n ≤ 2. Nun sei n ≥ 3 und 0 < k < n. Nach d) und Induktionsannahme ist ! ! ! n n−1 n−1 (n − 1)! (n − 1)! = + = + k k k−1 k!(n − 1 − k)! (k − 1)!(n − k)! (n − 1)!(n − k) + (n − 1)!k n! = = . k!(n − k)! k!(n − k)! e): p teilt p! aber weder k! (denn k < p) noch (p − k)! (denn k > 0). Binomischer Lehrsatz Sei!R ein kommutativer Ring und a, b ∈ R. Für alle n X n r n−r n ∈ N0 gilt (a + b)n = ab . r=0 r Beweis. Induktion über n. Klar für n = 1, Definitionssache für n = 0. Nun sei n ≥ 2. Dann n n−1 (a + b) = (a + b) · (a + b) = (a + b) n−1 X ! n − 1 r n−1−r ab r r=0 = n−1 X r=0 = n X r=1 X n−1 n − 1 r+1 n−1−r n−1 a b + ar bn−r r r r=0 ! X n−1 n − 1 r n−r n−1 ab + ar bn−r r−1 r r=0 ! = b n + an + = b n + an + n−1 X r=1 n−1 X r=1 8.3.1 ! ! " ! !# n−1 n−1 + r−1 r ar bn−r n n r n−r n r n−r X ab . ab = r r=0 r ! ! Der kleine Satz von Fermat Satz 8.5 (Kleiner Satz von Fermat) Es sei p ∈ N eine Primzahl. Dann gilt np ≡ n (mod p) für alle n ∈ N. Diesen Satz kann man auf zwei Arten beweisen: Gruppentheoretisch und kombinatorisch. Für den gruppentheoretischen Beweis betrachten wir die Einheitengruppe von Z/pZ. Definition 8.6 Es sei (R, +, ·, 0, 1) ein unitärer Ring. x ∈ R heißt invertierbar oder eine Einheit, wenn es ein y ∈ R gibt mit x·y = y·x = 1. Die Einheitengruppe von R ist (R× , ·, 1), wobei R× := {x ∈ R : x invertierbar}. Es wurde in den Übungen gezeigt, dass die Einheitengruppe tatsächlich eine Gruppe ist. 73 Beweis des kleinen Satzes von Fermat mit Hilfe des Satzes von Lagrange. Offenbar ist 0p ≡ 0 (mod p), denn p > 1. Wir betrachten nun n 6= 0. Da p prim ist, ist (Z/pZ, +, ·, 0, 1) nach Satz 7.22 ein Körper. Er enthält genau p Elemente. Also ist die Einheitengruppe (Z/pZ)× = ((Z/pZ) \ {[0]}, ·, 1) und hat die Ordnung p − 1. Nach dem Satz von Lagrange teilt die Ordnung jedes Elementes [n] ∈ (Z/pZ)× die Ordnung der Gruppe. Also ist [n]p−1 = [1] und nach Definition der „Kongruenz modulo p“ ist das gleichbedeutend mit np−1 ≡ 1 (mod p). Multiplikation mit n ergibt np ≡ n (mod p). Beweis des kleinen Satzes von Fermat mit vollständiger Induktion über n. Induktionsverankerung n = 0: Es ist 0p = 0, da ja Primzahlen nicht Null sind. Für den Induktionsschritt haben wir die Induktionsannahme, dass np ≡ n (mod p). Mit anderen Worten: np − n ist durch p teilbar. Es ist zu beweisen, dass dann auch (n + 1)p − (n + 1) durch p teilbar ist. Nach Induktionsannahme ist (n + 1)p − (n + 1) ≡ (n + 1)p − (np + 1) (mod p). P Nach dem binomischen Lehrsatz ist (n + 1)p = pk=0 kp nk · 1n−k . Für k = 0 p hat man den Summanden 1, für k = p hat man den Summanden n , also ist Pp−1 p k p p p n−k (n + 1) − (n + 1) = k=1 k n · 1 . Nach Lemma 8.4 ist k in jedem der verbliebenden Summanden durch p teilbar. Daher ist (n + 1)p − (np + 1) und somit auch (n + 1)p − (n + 1) durch p teilbar. 8.4 Das Vorzeichen einer Permutation Definition 8.7 Das Vorzeichen ε(σ) einer Permutation σ ∈ Sn ist ε(σ) := σ(j) − σ(i) . j−i 1≤i<j≤n Y ! ! 1 2 3 1 2 3 Beispiel ε = +1 und ε = −1. 2 3 1 3 2 1 Definition 8.8 Eine Permutation σ ∈ Sn nennt mant Transposition, wenn sie lediglich zwei Elemente vertauscht, d.h. wenn es ein n0 ∈ {1, ..., n} gibt, so dass σ(n0 ) 6= n0 , σ(σ(n0 )) = n0 und σ(k) = k für alle k ∈ {1, ..., n} mit n0 6= k 6= σ(n0 ). ! 1 2 3 Beispiel ist eine Transposition, aber 3 2 1 sind keine Transpositionen. ! 1 2 3 2 3 1 ! und Lemma 8.9 Sei n ≥ 1 und σ ∈ Sn . a) Es ist ε(σ) = (−1)N für N = Anzahl der Paare i, j mit i < j und σ(i) > σ(j) . 74 1 2 3 1 2 3 b) Für σ, τ ∈ Sn ist ε(στ ) = ε(σ)ε(τ ): das Vorzeichen ist ein Gruppenhomomorphismus ε : Sn → {+1, −1}. c) Ist σ ∈ Sn eine Transposition, so ist ε(σ) = −1. Beweis. a): Jedes Paar i < j kommt einmal als j − i im Nenner und einmal als ±(j − i) im Zähler: + falls σ −1 (j) > σ −1 (i) und − sonst. b): Wegen σ(i) − σ(j) σ(j) − σ(i) = j−i i−j hängt σ(j)−σ(i) j−i nur vom ungeordneten Paar i, j ab. Nun, ε(στ ) = Y i<j στ (j) − στ (i) Y στ (j) − στ (i) = j−i τ (j) − τ (i) i<j ! = Y i<j τ (j) − τ (i) j−i ! στ (j) − στ (i) ε(τ ) , τ (j) − τ (i) (i) und i<j σττ (j)−στ = ε(σ), denn für jedes ungeeordnete Paar a, b kommt σ(b)−σ(a) (j)−τ (i) b−a genau einmal im Produkt vor. c): Es gibt also i < j mit σ(i) = j, σ(j) = i und σ(`) = ` sonst. Die Anzahl der Paare in Teil a) ist also ungerade: das Paar i, j, sowie die beiden Paare i, ` und `, j für jedes i < ` < j. Q Lemma 8.10 Sei n ∈ N. a) Jedes σ ∈ Sn lässt sich als ein Produkt von Transpositionen schreiben. b) Ist σ ∈ Sn ein Produkt von N Transpositionen, so ist ε(σ) = (−1)N . Für gegebenes σ ist N daher entweder immer gerade (Vorzeichen +1) oder immer ungerade (Vorzeichen −1). Beweis. a): Induktion über m0 = max{m | σ(m) 6= m}. Induktionsanfang: ist m0 < 2, dann σ = Id. Für den Induktionsschritt bemerken wir zunächst, dass σ(m0 ) < m0 : Wenn nämlich m0 6= σ(m0 ), dann ist auch σ(m0 ) 6= σ (σ(m0 )), denn σ ist injektiv. Sowohl m0 als auch σ(m0 ) werden also durch σ nicht auf sich selbst abgebildet. Weil m0 maximal ist unter allen Elementen, die durch σ nicht auf sich selbst abgebildet werden, ist σ(m0 ) < m0 . Sei τ die Transposition, die m0 und σ(m0 ) vertauscht. Dann hat σ 0 := τ σ einen kleineren Wert von m0 , und σ = τ σ 0 . b): Folgt aus a) und Lemma 8.9 b) und c). 75 ! 1 2 3 Beispiel hat Vorzeichen −1 denn es ist eine Transposition. 3 2 1 ! ! ! ! 1 2 3 1 2 3 1 2 3 1 2 3 hat Vorzeichen +1, denn = . 2 3 1 2 3 1 3 2 1 2 1 3 76 Index 0, 26 1, 30 Abbildung, 14 bijektiv, 15 eingeschränkte, 15 injektiv, 15 surjektiv, 15 Abstraktionsprinzip, 12 Addition (natürliche Zahlen), 30 Äquivalenzklasse, 20 Äquivalenzrelation, 20 antisymmetrisch, 21 Arganddiagramm, 68 assoziativ, 41 Aussage, 1 Aussageform, 11 Aussonderungsaxiom, 12 Auswahlaxiom, 17 Beweis direkter, 4 durch Kontraposition, 4 durch Widerspruch, 4 Bijektion, 15 bijektiv, 15 Bild, 15 Binomialkoeffizient, 72 Binomischer Lehrsatz, 73 C, 67 Dedekind–unendlich, 24 Differenz, 39 Differenzmenge, 10 direkter Beweis, 4 direktes Produkt, 10 disjunkt, 10 Dividend, 40 Divisionsrest, 40 Divisor, 40 Einheit, 67, 73 Einheitengruppe, 73 Eins, 30 Element, 7 endlich, 24 Erzeugendensystem, 47 euklidischer Algorithmus, 66 erweiterter, 66 Extensionalitätsaxiom, 9 Fakultät, 29, 71 ganze Zahlen, 54 Ganzzahlquotient, 40 Gaußsche Zahlenebene, 68 ggT, 65 Gleichheit von Mengen, 9 gleichmächtig, 23 größter gemeinsamer Teiler, 65 Gruppe, 43 abelsche, 44 symmetrische, 44 zyklische, 47 Halbgruppe, 41 Homomorphismus, 49 Induktion, 27 vollständige, 27 Induktionsanfang, 27 Induktionsannahme, 28 Induktionsschritt, 27 injektiv, 15 Integritätsbereich, 55 Inverses, 45, 67 additiv, 51 invertierbar, 43, 67, 73 irrationale Zahl, 4 isomorph, 50 Isomorphismus, 50 77 Kardinalität, 8 Kardinalzahl, 23 Kern (einer Abbildung), 50 Koeffizient eines Polynoms, 62 Körper, 51 kommutativ, 41 komplexe Zahlen, 67 konjugierte komplexe Zahl, 68 Kontraposition, 4 kürzbar, 42 Mächtigkeit, 8, 24 Magma, 41 assoziatives, 41 kommutatives, 41 kürzbares, 42 Menge, 7 endliche, 8, 24 leere, 8 unendliche, 24 Minimum, 38 Monoid, 42 Multiplikation (natürlicher Zahlen), 34 N, 26 Nachfolger, 27 natürliche Zahl, 26 Normalteiler, 50 Null, 26 Nullring, 51 Nullteiler, 55 nullteilerfrei, 55 Ordinalzahl, 26 Ordnung (Gruppenelement), 49 Ordnung (Gruppe), 43 Ordnung (Relation), 21 lineare, 21 Teil-, 21 Peano–Axiome, 26 Permutation, 71 Polynom, 62 normiertes, 62 Potenzieren, 42 Potenzmenge, 10 Potenzmengenaxiom, 10 Prädikat, 11 prim, 59 Primzahl, 59 Produkt direktes, 10 Q, 57 Quadratwurzel, 5 Quersumme, 60 alternierende, 60 gewichtete, 61 Quotientenkörper, 57 R, 61 reelle Zahlen, 61 Rekursion, 29 Relation, 19 Äquivalenz-, 20 antisymmetrisch, 21 linear, 21 reflexiv, 19 symmetrisch, 19 transitiv, 19 Restklassenring, 58 Ring, 51 kommutativ, 51 trivialer, 51 unitär, 51 Russel–Antinomie, 12 Schnitt, 9 surjektiv, 15 Symmetrie, 43 symmetrische Gruppe, 44, 71 Teilbarkeit, 52 Teiler größter gemeinsamer, 65 Teilmenge, 9 echte, 23 78 Teilordnung, 21 Term konstanter, 62 Totalordnung, 21 Umkehrabbildung, 16 unendlich, 24 Unendlichkeitsaxiom, 8 Untergruppe, 46 erzeugte, 46, 47 normale, 50 Urbildmenge, 15 Vereinigung, 9 Verknüpfung innere, 41 von Abbildungen, 14 vollständige Induktion, 27 Vorgänger, 29 Widerspruchsbeweis, 4 Wohlordnung, 38 Z, 54 Zahlen ganze, 54 gerade, 5 irrationale, 4 Kardinal-, 23 komplexe, 67 natürliche, 26 Ordinal-, 26 Prim-, 59 rationale, 57 reelle, 61 79