Skript - Fakultät für Mathematik und Informatik - Friedrich

Friedrich-Schiller-Universität Jena
Institut für Mathematik
Wintersemester 2013/14
Elemente der Mathematik
– Lehramt Mathematik Regelschule –
– B.A. Ergänzungsfach Mathematik –
Simon King
Stand 4. Februar 2014
Inhaltsverzeichnis
1 Logik und Beweistechniken
1.1 Aussagen . . . . . . . . . . . . . . .
1.1.1 Typische Missverständnisse
1.2 Tautologien . . . . . . . . . . . . .
1.3 Beweistechniken . . . . . . . . . . .
1.4 Ausblick auf ein späteres Kapitel .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
3
4
6
2 Mengen
2.1 Der Mengenbegriff . . . . . . . . . . . . . . . . .
2.2 Beispiele von Mengen und Mengenkonstruktionen
2.3 Aussageformen und Quantoren: Prädikatenlogik .
2.4 Die Russell–Antinomie . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
8
11
12
3 Abbildungen und Relationen
3.1 Abbildungen . . . . . . . . .
3.1.1 Das Auswahlaxiom .
3.2 Binäre Relationen . . . . . .
3.2.1 Äquivalenzrelationen
3.2.2 Ordnungsrelationen .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
14
14
17
19
20
21
.
.
.
.
.
.
.
22
23
23
24
26
27
27
29
.
.
.
.
.
.
.
.
.
.
30
30
31
32
34
35
36
36
39
39
40
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Natürliche Zahlen und Induktion
4.1 Natürliche Zahlen als Kardinalzahlen . . . . . . .
4.1.1 Gleichmächtigkeit . . . . . . . . . . . . . .
4.1.2 (Un-)endliche Mengen . . . . . . . . . . .
4.2 Natürliche Zahlen als Ordinalzahlen . . . . . . . .
4.3 Die Peano–Axiome in Beweisen und Definitionen .
4.3.1 Vollständige Induktion . . . . . . . . . . .
4.3.2 Rekursive Definitionen . . . . . . . . . . .
5 Elementare Arithmetik
5.1 Addition . . . . . . . . . . . . . . . . . . .
5.1.1 Kommutativität der Addition . . .
5.1.2 Assoziativität der Addition . . . . .
5.2 Multiplikation . . . . . . . . . . . . . . . .
5.2.1 Kommutativität der Multiplikation
5.2.2 Assoziativität der Multiplikation .
5.3 Die Wohlordnung der natürlichen Zahlen .
5.4 Die Umkehroperationen . . . . . . . . . .
5.4.1 Subtraktion . . . . . . . . . . . . .
5.4.2 Division mit Rest . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Abstrakte Algebra
6.1 Magmen und Monoide . . . . . . . . . . . . . . . . . . . . . .
6.2 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.1 Symmetriegruppen . . . . . . . . . . . . . . . . . . . .
6.2.2 Symmetrische Gruppen . . . . . . . . . . . . . . . . . .
6.2.3 Anwendungen und einfache Eigenschaften von Gruppen
6.2.4 Untergruppen . . . . . . . . . . . . . . . . . . . . . . .
6.2.5 Der Satz von Lagrange . . . . . . . . . . . . . . . . . .
6.2.6 Die Ordnung eines Elements . . . . . . . . . . . . . . .
6.2.7 Gruppenhomomorphismen . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
43
43
44
44
46
48
49
49
7 Ringe und Körper
7.1 Die ganzen Zahlen . . . . . . . . . . . . . .
7.2 Quotientenkörper und die rationalen Zahlen
7.3 Restklassenringe . . . . . . . . . . . . . . . .
7.3.1 Anwendungen . . . . . . . . . . . . .
7.4 Die reellen Zahlen . . . . . . . . . . . . . . .
7.5 Polynome . . . . . . . . . . . . . . . . . . .
7.5.1 Der größte gemeinsame Teiler . . . .
7.6 Die komplexen Zahlen . . . . . . . . . . . .
7.6.1 Die Gaußsche Zahlenebene . . . . . .
7.6.2 Komplexe Zahlen und Polynome . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
51
52
55
58
59
61
62
65
67
68
69
.
.
.
.
.
71
71
71
72
73
74
8 Elementare Kombinatorik
8.1 Exponentialfunktion . . . . . . . .
8.2 Fakultät . . . . . . . . . . . . . . .
8.3 Binomialkoeffizienten . . . . . . . .
8.3.1 Der kleine Satz von Fermat
8.4 Das Vorzeichen einer Permutation .
Index
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
ii
1
Logik und Beweistechniken
Alle Menschen sind Säugetiere. Aber daraus folgt noch lange nicht, dass jedes
Säugetier ein Mensch ist. In diesem Abschnitt geht es darum, welche Schlussfolgerungen zulässig sind. Außerdem wird einiges an Notation eingeführt.
Bemerkung 1.1 Logik ist ein eigenständiges Teilgebiet der Mathematik mit entsprechenden Spezialvorlesungen in höheren Semestern. Es geht dabei zum Beispiel
um die Frage, ob sich alle wahren Aussagen auch beweisen lassen. Auch „nichtzweiwertige Logiken“ können thematisiert werden. Das alles ist jedoch nicht Gegenstand dieser Vorlesung.
1.1
Aussagen
Es geht in diesem Abschnitt um die klassische zweiwertige Aussagenlogik: Aussagen sind entweder wahr oder falsch. Wir kürzen wahr als W und falsch als F
ab und benutzen Großbuchstaben P, Q, ... als Platzhalter für Aussagen.
„Jeder Mensch ist ein Säugetier“ ist eine wahre Aussage. „Die Eins ist eine negative Zahl“ ist auch eine Aussage, allerdings eine falsche. Dagegen sind „Was möchten Sie trinken?“, „Ein Kännchen Kaffee“ und „Holen Sie den Geschäftsführer!“
jeweils keine Aussagen im Sinne der Logik, auch wenn sich sprachpragmatisch
dahinter zum Teil Aussagen verbergen, etwa „Ich möchte ein Kännchen Kaffee
trinken“.
Bemerkung 1.2 In der Sprachwissenschaft unterscheidet man Syntax, Semantik und Pragmatik. In der Pragmatik geht es um den Inhalt konkreter sprachlicher
Äußerungen, was jedoch nicht Gegenstand der Aussagenlogik ist. Die Syntax untersucht strukturelle Eigenschaften von (natürlichen oder künstlichen) Sprachen,
unabhängig von der Bedeutung. Syntaktische Regeln spielen auch in der Aussagenlogik eine Rolle. Die Semantik befasst sich mit der Bedeutung sprachlicher
Ausdrücke, losgelöst von den konkreten sprachlichen Äußerungen. Darum geht es
auch in der Aussagenlogik.
Verneinung Aussagen können verneint werden: aus „Ich mag Schokolade“ wird
etwa „Ich mag Schokolade nicht“. Bei der Verneinung von komplexen Aussagen,
wie etwa „Wenn der Koch betrunken ist, dann ist die Suppe versalzen oder die
Bohnen sind nicht gar“, muss man jedoch vorsichtig sein.
Bezeichnung Ist P eine Aussage, so bezeichnet ¬P die verneinte Aussage.
1
Aussagen zusammensetzen Man kann zwei Aussagen zu einer Aussage zusammenfassen, etwa „Der Eisverkäufer ist da und ich habe gerade Taschengeld
bekommen“, oder „Wenn du mir einen deiner Lollis gibst, dann bin ich dein bester Freund“. Die verschiedenen Wege, Aussagen zusammenzufassen, kann man
gut mit Wahrheitstafeln voneinander unterscheiden.
Wir betrachten die folgenden vier grundlegenden Arten, zwei Aussagen zu
einer neuen Aussage zu verknüpfen:
a) Und: „Ich mag Schokolade und ich hasse Pilze.“ Notation: P ∧Q, gesprochen
„P und Q“.
b) Oder: „Ich werde den Rasen mähen oder Unkraut jäten (oder vielleicht
sogar beides).“ Notation: P ∨ Q, gesprochen „P oder Q“.
c) Implikation: „Wenn es morgen regnet, dann bleibe ich auf jedem Fall zu
Hause (aber vielleicht tue ich das sowieso).“ Notation: P ⇒ Q, gesprochen
„Wenn P , dann Q“ bzw. „Aus P folgt Q“.
d) Äquivalenz: „Wenn du sofort die Spülmaschine leerst, bekommst du einen
Kakao – sonst aber nicht.“ Notation: P ⇔ Q, gesprochen „P genau dann
wenn Q“.
Hier sind die zugehörigen Wahrheitstafeln:
P Q ¬P P ∧ Q P ∨ Q P ⇒ Q P ⇔ Q
F F W
F
F
W
W
F
W
W
F
F W W
W F F
F
W
F
F
W W F
W
W
W
W
1.1.1
Typische Missverständnisse
Im „echten LebenTM “ kommt es häufig zu Missverständnissen bei der Verwendung
zusammengesetzter Aussagen.
P ∨Q ist nur falsch, wenn P, Q beide falsch sind. Im Alltag jedoch wird „P oder
Q“ bisweilen im Sinne von „entweder P oder Q“ verwendet. In der Mathematik
wird zwischen diesen beiden Aussagen deutlich unterschieden.
Noch mehr Konfusion herrscht im Umgang mit Implikationen. P ⇒ Q ist
nur falsch, wenn P wahr und Q falsch ist. Im Alltag wird P ⇒ Q bisweilen mit
P ⇔ Q verwechselt, ist also auch dann falsch, wenn P falsch und Q wahr ist.
Darüber hinaus werden Wenn–Dann–Konstruktionen auch im zeitlichen oder im
irrealen Sinne verwendet:
• „Wenn ich groß bin, werde ich Feuerwehrmann“ wird als Aussage über die
Zukunft gebraucht und impliziert, dass ich einmal groß sein werde.
2
• „Wenn ich reich wäre, würde ich mir eine eigene Insel kaufen“ wird im
irrealen Sinne gebraucht und impliziert, dass ich nicht reich bin.
In der Aussagenlogik impliziert P ⇒ Q jedoch weder die Wahrheit noch die
Unwahrheit von P .
1.2
Tautologien
Vergleichen wir die Wahrheitstafeln von P ∧ (¬Q) und ¬(P ⇒ Q):
P Q ¬Q P ⇒ Q P ∧ (¬Q) ¬(P ⇒ Q) (¬(P ⇒ Q)) ⇔ (P ∧ (¬Q))
F F W
W
F
F
W
F W F
W
F
F
W
W F W
F
W
W
W
W
F
F
W
W W F
Aus der Wahrheitstafel erkennen wir: die Verneinung von P ⇒ Q ist P ∧ (¬Q);
und die Aussage (¬(P ⇒ Q)) ⇔ (P ∧(¬Q)) ist immer wahr, egal welche Aussagen
P, Q sind. Eine solche immer wahre Aussage nennt man eine Tautologie. Das
Wort „Tautologie“ stammt aus dem Griechischen und bedeutet wörtlich „dasselbe
Sagendes“.
Nach dem oben gesagten ist also (¬(P ⇒ Q)) ⇔ (P ∧ (¬Q)) eine Tautologie.
Weitere Tautologien sind
P ⇔ ¬(¬P )
und die de Morgan’schen Regeln
¬(P ∧ Q) ⇔ (¬P ) ∨ (¬Q)
¬(P ∨ Q) ⇔ (¬P ) ∧ (¬Q)
wie in den Übungsaufgaben nachgewiesen werden soll.
Dagegen ist (P ⇒ Q) ⇒ (Q ⇒ P ) keine Tautologie, denn dies ist eine
Aussage, die nicht für alle Aussagen P, Q wahr ist:
P Q P ⇒ Q Q ⇒ P (P ⇒ Q) ⇒ (Q ⇒ P )
F F
W
W
W
F W
W
F
F
W F
F
W
W
W W
W
W
W
Das ist gut so, denn mit P : „Dieses Tier ist eine Maus“ und Q : „Dieses Tier ist
ein Vierbeiner“ hätten wir sonst gezeigt, dass wenn Mäuse Vierbeiner sind, dann
müssen auch Vierbeiner Mäuse sein – was natürlich falsch ist.
3
1.3
Beweistechniken
Die Aussage (P ⇒ Q) ⇔ (¬Q ⇒ ¬P ) eine Tautologie:
P Q ¬P ¬Q P ⇒ Q ¬Q ⇒ ¬P (P ⇒ Q) ⇔ (¬Q ⇒ ¬P )
F F W W
W
W
W
F W W F
W
W
W
F
F
W
W F F W
W W F
F
W
W
W
Die Aussagen P ⇒ Q und (¬Q) ⇒ (¬P ) haben also die gleichen Wahrheitstafeln
und sind daher zueinander bedeutungsgleich. Darüber hinaus ist auch (P ∧¬Q) ⇒
F zu P ⇒ Q bedeutungsgleich.
Will man zeigen, dass Aussage Q aus Aussage P folgt, so gibt es drei verschiedene Strategien. Welche der drei am besten passt, hängt vom jeweiligen Problem
ab.
• Der direkte Beweis P ⇒ Q: Wir nehmen an, dass P wahr ist, und folgern
daraus (zum Beispiel durch eine Rechnung), dass Q wahr sein muss.
• Der Beweis durch Kontraposition ¬Q ⇒ ¬P : Wir nehmen an, dass Q falsch
ist, und folgern daraus, dass P falsch sein muss.
• Der Widerspruchsbeweis (P ∧ ¬Q) ⇒ F : Wir nehmen an, dass P wahr ist
und Q falsch. Hieraus leiten wir einen Widerspruch her.
Anwendung in der Praxis Mit Hilfe eines Beweises durch Kontraposition
und eines Widerspruchsbeweises beweisen wir eine√Aussage, die zuerst im 5. Jhdt.
v. Chr. von den Pythagoreern1 bewiesen wurde: 2 is irrational. Wir folgen im
Wesentlichen dem von Euklid2 überlieferten Beweis. Der Vollständigkeit halber
geben wir am Ende des Abschnitts noch ein Beispiel eines direkten Beweises.
Wir setzen hier voraus, dass die Grundrechenarten mit natürlichen, rationalen
und reellen Zahlen aus der Schule bekannt sind. Der Aufbau des Zahlenbereichs
wird später in der Vorlesung systematisch behandelt werden.
Wir verwenden hier das für die Mathematik sehr typische Schema „Definition
– Satz – Beweis“, das Ihnen bestimmt noch oft begegnen wird: Zuerst werden
wir einige Begriffe definieren, mit denen die zu beweisende Aussage (der Satz)
formuliert wird, der dann schließlich bewiesen wird. Im Beweis des Satzes wird
wiederum ein Hilfssatz mit zugehöriger Definition und Beweis verwendet. Einen
Hilfssatz nennt man häufig „Lemma“ (Mehrzahl: „Lemmata“).
Definition 1.3 Eine reelle Zahl x heißt irrational, genau dann wenn es keine
gilt.
ganze Zahlen m und n > 0 gibt, für die x = m
n
1
2
Pythagoras von Samos, ca. 570 v. Chr. bis nach 510 v. Chr.
Euklid lebte im 3. Jhdt. v. Chr vermutlich in Alexandria
4
Bemerkung 1.4 Definitionen sind wahre Aussagen und sind meist aus drei Teilaussagen zusammengesetzt: Der Voraussetzung V (hier: „x ist eine reelle Zahl“),
dem zu definierenden Begriff B (hier: „x heißt irrationale“) und der definierenden
Eigenschaft E (hier: „Es gibt keine ganzen Zahlen m und n, für die x = m
gilt“).
n
Die Bedeutung von B wird erst durch die Definition festgelegt, und zwar so, dass
V ⇒ (B ⇐⇒ E) eine Tautologie ist.
Bemerkung 1.5 Es kommt vor, dass man einen Begriff definiert und sich dann
(möglicherweise erst nach Jahren intensiver Arbeit) herausstellt, dass es kein
Beispiel für diesen Begriff gibt. Das macht aber nichts, denn auch ein solches
negatives Ergebnis kann interessant sein.
Definition 1.6 Es sei y eine positive reelle Zahl. x heißt Quadratwurzel von y
√
(notiert als x = y), genau dann wenn x eine positive reelle Zahl ist mit x2 = y.
Im Lemma benötigen wir noch folgende Definition.
Definition 1.7 Eine natürliche Zahl n heißt gerade ⇐⇒ es gibt eine natürliche
Zahl m, so dass n = 2 · m.
Bemerkung 1.8 Wir verwenden im Beweis die aus der Schule bekannte Tatsache, dass es für jede natürliche Zahl n eine natürliche Zahl m gibt, so dass
entweder n = 2 · m oder n = 2 · m + 1 gilt.
√
Satz 1.9 Wenn x = 2, dann ist x irrational.
Wir formulieren und beweisen nun ein Lemma, mit dessen Hilfe wir auch
Satz 1.9 beweisen. Das Ende eines Beweises wird in mathematischen Texten meist
extra markiert. Klassisch wäre „q.e.d“ für das lateinische „quod erat demonstrandum“ („was zu beweisen war“). Wir verwenden hier einfach ein schwarzes Kästchen als Beweisendzeichen.
Lemma 1.10 Es sei n eine ganze Zahl. Wenn n2 gerade ist, dann ist n gerade.
Beweis. Wie führen einen Beweis durch Kontraposition. Wenn eine ganze Zahl
n nicht gerade ist, dann gibt es eine ganze Zahl m mit n = 2m + 1 (siehe Bemerkung 1.8). Damit ist n2 = (2m + 1)2 = 4 · (m2 + m) + 1, also ist n2 nicht
gerade.
Beweis von Satz√1.9. Diesmal führen wir einen Widerspruchsbeweis: Wir nehmen an, dass x = 2 und dass gleichzeitig x nicht irrational ist. Mit anderen
Worten, wir nehmen an, der Satz sei falsch.
Aus dem zweiten Teil der Annahme folgt, dass es ganze Zahlen m und n > 0
mit x = m
gibt. Wie aus der Schule bekannt ist, kann man gemeinsame Teiler
n
von Zähler und Nenner eines Bruches kürzen, ohne den Wert des Bruches zu
5
verändern. Wir können also (ohne eine zusätzliche Annahme!) erreichen, dass
m und n teilerfremd sind.
Zusammen mit dem
ersten Teil der Annahme und der Definition der Qua 2
2
m
dratwurzel folgt, dass n = m
= 2. Daher ist m2 = 2n2 , also ist m2 gerade.
n2
Wegen Lemma 1.10 folgt, dass m gerade ist. Nach Definition gibt es also eine
ganze Zahl r mit m = 2r.
Aus m2 = 2n2 folgt dann 4r2 = 2n2 , also n2 = 2r2 , also ist n2 gerade.
Wiederum wegen Lemma 1.10 folgt, dass auch n gerade ist. Aber m und n sind
teilerfremd, also können sie nicht beide gerade (also durch 2 teilbar) sein. Unsere
Annahme, dass der Satz falsch ist, führte zu einem Widerspruch. Der Satz ist
also wahr.
Der Vollständigkeit halber führen wir noch einen kleinen direkten Beweis.
Lemma 1.11 Wenn n eine gerade Zahl ist, dann ist n2 eine gerade Zahl.
Beweis. Wir führen einen direkten Beweis. n ist gerade. Also gibt es nach
Definition eine natürliche Zahl m mit n = 2m. Damit ist n2 = (2m)2 = 2 · (2m2 ).
Also ist (wieder nach Definition) n2 eine gerade Zahl.
1.4
Ausblick auf ein späteres Kapitel
In einigen der oben verwendeten Aussagen traten bereits so genannte Quantoren
auf: Es gibt eine natürliche Zahl m, so dass n = 2 · m; jede Maus ist ein Säugetier.
Durch Quantoren lassen sich Aussagen über Elemente von Mengen formulieren.
Wir werden daher im kommenden Kapitel zunächst auf den Mengenbegriff eingehen, bevor wir uns in Abschnitt 2.3 den Quantoren und damit noch einmal der
Logik zuwenden.
6
2
Mengen
2.1
Der Mengenbegriff
Wer Mathematik-Vorlesungen besucht, wird mit sehr vielen Definitionen konfrontiert. Eine zufriedenstellende Definition des Mengenbegriffs ist aber in den ersten
Semestern nicht dabei, stattdessen wird erwartet, dass man ungefähr weiß, was
eine Menge ist. Traditionell gibt man anstelle einer formalen Definition das folgende Zitat von Georg Cantor [1845–1918], dem Begründer der Mengenlehre,
wieder:
Unter einer ‚Menge‘ verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objecten m unsrer Anschauung oder
unseres Denkens (welche die ‚Elemente‘ von M genannt werden) zu
einem Ganzen. (G. Cantor, 1895)
Somit bilden die rationalen Zahlen eine Menge, und die Städte Thüringens
mit mehr als 50.000 Einwohnern bilden eine andere. Eine andere informelle Beschreibung des Mengenbegriffs stammt von Felix Hausdorff [1868–1942]:
Eine Menge ensteht durch Zusammenfassung von Einzeldingen zu
einem Ganzen. Eine Menge ist eine Vielheit, als Einheit gedacht.
(F. Hausdorff, 1927)
Allerdings sind manche Zusammenfassungen, die man sich vorstellen kann,
– die Zusammenfassung aller Mengen, zum Beispiel — so groß, dass man sie
nicht als Mengen durchgehen lassen kann. „Zusammenfassungen von Einzeldingen“ können nur Mengen genannt werden, wenn sie noch weitere Eigenschaften
besitzen: Mengen erfüllen die Zermelo3 –Fraenkel4 –Axiome. Aus diesen Axiomen
folgt, dass die Gesamtheit aller Mengen keine Menge bildet (Satz 2.13).
Diese Axiome haben sich in fast 100 Jahren mathematischer Arbeit bewährt;
es traten insbesondere keine Widersprüche zutage. Kurt Gödel [1906–1978] hat
allerdings bewiesen, dass man die Widerspruchsfreiheit der Zermelo–Fraenkel–
Mengenlehre nicht beweisen kann.
Anstatt die Zermelo–Fraenkel–Axiome alle aufzulisten, werden wir lediglich
einige Grundbeispiele und Konstruktionsmöglichkeiten von Mengen angeben, welche für die „normale“ mathematische Arbeit ausreichen, und benennen meist auch
das Axiom, auf dem die jeweilige Konstruktion basiert. Wer an einer genauen
Formulierung der Axiome interessiert ist, kann sie anhand des Namens leicht in
einem Lexikon nachlesen.
3
4
Ernst Zermelo [1871–1953]
Abraham Fraenkel [1892–1965]
7
2.2
Beispiele von Mengen und Mengenkonstruktionen
Mengen bestehen aus Elementen. Ist x ein Element der Menge M , so drückt man
diese Tatsache durch die Bezeichung x ∈ M aus. Statt ¬(x ∈ M ) schreibt man
x∈
/ M . Für die Menge Z der ganzen Zahlen gilt zum Bespiel 1 ∈ Z aber 12 6∈ Z.
Wir werden später noch definieren, wann eine Menge unendlich heißt, und
dann ist eine endliche Menge einfach eine Menge, die nicht unendlich ist. Aber
soweit sind wir noch nicht. Wir verwenden daher zunächst den intuitiven Begriff:
Eine Menge M heißt endlich, wenn sie nur endlich viele Elemente enthält. Deren
Anzahl nennt man die Mächtigkeit oder Kardinalität |M |.
Es gibt im wesentlichen drei Methoden, eine Menge anzugeben:
a) Man listet alle Elemente auf, etwa M = {1, 3, 4, 6} mit |M | = 4. Das geht
natürlich nur im Falle von endlichen Mengen.
b) Man startet mit einer bestehenden Menge und bildet eine neue Menge aus
genau den Elementen, die eine bestimmte vorgegebene Eigenschaft erfüllen,
zum Beispiel
M = {n ∈ N | n ist durch 3 teilbar und n2 hat als letzte Ziffer eine 4} .
Dies nennt man Aussonderungsaxiom; vgl. Axiom 2.12.
c) Man startet mit einer bestehenden Menge und ersetzt nach einem vorgegebenen Bildungsgesetz jedes ihrer Elemente durch ein anderes „Object
unserer Anschauung oder unseres Denkens“. Zum Beispiel kann man für
jede natürliche Zahl n die Menge aller regelmäßigen n–Ecke bilden; die
Gesamtheit dieser Mengen bildet die Menge
{{Regelmäßige n–Ecke} | n ∈ N}
Dass man auf diese Weise stets wieder eine Menge erhält, besagt das Ersetzungsaxiom.
Man beachte, dass im letzten Beispiel die Elemente der Menge selbst wieder
Mengen sind. Die letzten beiden Konstruktionsmethoden können wir natürlich
nur nutzen, wenn uns bereits Mengen zur Verfügung stehen. Dies sind zum Beispiel die folgenden Mengen:
∅ Die leere Menge ∅ = {}, die keine Elemente enthält. Dass es die leere Menge
gibt, wird im Leermengenaxiom festgelegt.
N Die Menge N = {0, 1, 2, 3, 4, 5, . . .} aller natürlichen Zahlen — zumindest nach
DIN–Norm 5473 gehört die Null zu den natürlichen Zahlen. Die Existenz
von N folgt aus dem Unendlichkeitsaxiom.
8
N∗ Die Menge N∗ = {1, 2, 3, 4, 5, . . .} aller positiver natürlicher Zahlen — wieder
nach DIN-Norm 5473.
Z Die Menge Z = {. . . , −2, −1, 0, 1, 2, . . .} aller ganzen Zahlen
Q Die Menge der rationalen Zahlen
R Die Menge der reellen Zahlen
C Die Menge der komplexen Zahlen (kommt noch)
Bemerkung 2.1 DIN–Norm 5473 wird von vielen Mathematikern ignoriert. Sie
sollten also immer auf den Kontext achten, ob 0 ∈ N. Wer N = {1, 2, 3, 4, ...}
verwendet, der schreibt meistens N0 = {0, 1, 2, 3, ...}.
Axiom 2.2 (Gleichheit von Mengen, Extensionalitätsaxiom)
Zwei Mengen M, N sind genau dann gleich (symbolisch M = N ), wenn jedes
Element aus M auch ein Element aus N und jedes Element aus N auch ein
Element aus M ist.
Beachten Sie hierzu:
• Die Mengen {1, 2, 3} und {1, 2, 2, 3} sind gleich, denn jedes Element der
ersten Menge ist Element der zweiten, und auch umgekehrt. Beide Mengen
haben auch genau drei Elemente.
• Es ist unerheblich, auf welche Weise eine Menge beschrieben wird. Es kommt
einzig darauf an, welche Elemente sie enthält.
Beispiel Die Mengen {x ∈ Z | x4 − 5x2 + 4 = 0} und {−2, −1, 1, 2} sind
trotz der unterschiedlichen Beschreibung gleich.
Definition 2.3 (Teilmengen)
Eine Menge N heißt eine Teilmenge einer Menge M , wenn jedes Element von
N auch ein Element aus M ist. Bezeichnung: N ⊆ M .
Somit gilt:
Lemma 2.4 Es ist genau dann M = N , wenn sowohl N ⊆ M als auch M ⊆ N
gelten.
Sind M, N Mengen, so kann man folgende neue Mengen bilden:
a) die Vereinigung M ∪ N , welche alle Elemente von M und alle Elemente von
N enthält;
b) den Schnitt M ∩ N , welcher aus allen Elementen von M besteht, welche
zugleich Elemente von N sind;
9
c) die Differenzmenge M \ N , die aus allen Elementen von M besteht, welche
zuglich nicht Elemente von N sind.
Das geht bildlich und in Formeln so:
M
N
M ∪N
M
N
M ∩N
M
N
M \N
M ∪ N = {x | (x ∈ M ) ∨ (x ∈ N )}
M ∩ N = {x | (x ∈ M ) ∧ (x ∈ N )}
M \ N = {x ∈ M | x 6∈ N }
Dass M ∪ N eine Menge ist, folgt aus dem Paarmengen- und dem Vereinigungsaxiom. Für die Mengeneigenschaft von M ∩ N und M \ N benötigen wir kein
neues Axiom, es genügt das oben erwähnte Aussonderungsaxiom.
Bemerkung 2.5 Die obigen bildlichen Veranschaulichungen von Mengen sind
Beispiele von Venn–Diagrammen (John Venn [1834–1923]). Venn–Diagramme
gibt es mit beliebig vielen Mengen, doch sind die Diagramme mit mehr als drei
Mengen nicht mehr so schön symmetrisch.
Definition 2.6 Zwei Mengen M, N sind disjunkt, genau dann wenn M ∩ N = ∅.
Axiom 2.7 (Potenzmengenaxiom)
Es sei M eine Menge. Dann bildet die Gesamtheit aller Teilmengen von M selbst
eine Menge, welche die Potenzmenge P(M ) von M genannt wird. Symbolisch:
P(M ) = {N | N ⊆ M }
Definition 2.8 Sind A, B zwei Mengen, so definiert man das direkte Produkt
A × B als die Menge aller geordnete Paare (a, b) mit a ∈ A und b ∈ B. Das Wort
„geordnet“ bedeutet, dass z.B. (1, 2) 6= (2, 1).
Allgemeiner definiert man für Mengen A1 , A2 , . . . , An das direkte Produkt
A1 × A2 × · · · × An = {(a1 , a2 , . . . , an ) | ai ∈ Ai für alle i = 1, ..., n} .
Die Elemente dieses Produkts nennt man (geordnete) n-Tupel5 .
Für die Bildung des direkten Produkts benötigt man nur die bereits oben genannten Axiome.
5
Wenn man später die Mengenlehre axiomatisieren will, stellt man sich die Frage, was für
ein Objekt ein geordnetes Paar sein soll. Die heute allgemein akzeptierte Antwort lautet: das
geordnete Paar (a, b) ist die Menge {{a}, {a, b}}. Beachten Sie, dass diese Menge im Fall a = b
aus nur einem Element besteht.
10
2.3
Aussageformen und Quantoren: Prädikatenlogik
Eine Aussageform ist eine Aussage mit einem oder mehreren freien Variablen. Es
hängt vom Wert der Variable(n) ab, ob die Aussage wahr oder falsch ist. Eine
Aussageform mit n Variablen nennt man auch n–stelliges Prädikat.
Beispiel Schreibt man etwa P (x) für die Aussageform „x ist eine reelle Zahl,
die x2 − x = 0 erfüllt“, so ist P (0) eine wahre und P (3) eine falsche Aussage.
Beispiel Schreibt man Q(x, y) für die Aussageform „xy + 3x = 2“, so ist
Q(0, 1) falsch und Q(1, −1) wahr. Dagegen ist Q(1, y) die Aussageform „y+3 =
2“ mit nur einer Variable.
Gerade machten wir das 1–stellige Prädikat P (x) zu einer Aussage, indem wir
den Wert x = 3 einsetzten. Man kann aber auch Quantoren6 benutzen, um aus
Aussageformen Aussagen zu machen. Wir benötigen drei Quantoren:
∀ „für alle“
Bsp: „∀x : x ∈ R ⇒ x2 ≥ 0“ ist die (wahre) Aussage, dass Quadrate reeller
Zahlen größer oder gleich Null sind.
∃ „es gibt (mindestens) ein“
√
Bsp: „∃x : x ∈ Q ∧ x2 = 2“ ist die (falsche) Aussage, dass 2 rational ist.
∃! „es gibt genau ein“
Bsp: „∃!x : x ∈ Z ∧ x2 = y“ ist eine Aussageform, die für y = 0 wahr ist,
aber für y = 3 bzw. y = 4 falsch ist, denn dort gibt es keine bzw. zwei
Möglichkeiten für x.
Bemerkung 2.9 Es gibt noch andere Schreibweisen für Quantoren. Die Schreibweise „∃x“ wurde von Giuseppe Peano [1858–1932] vorgeschlagen, während die
Schreibweise „∀x“ von Gerhard Gentzen [1909–1945] stammt. Statt „∃x“ findet
W
V
man auch „ x “ bzw. „(Ex)“ und statt „∀x“ wird auch „ x “ bzw. „(x)“ verwendet.
Mit Hilfe von Quantoren kann man die Gleichheit von Mengen M und N
symbolisch wie folgt aufschreiben:
M =N
⇐⇒
∀x : (x ∈ M ⇔ x ∈ N ) .
Auch N ⊆ M lässt sich symbolisch definieren:
N ⊆M
⇐⇒
∀x : (x ∈ N ⇒ x ∈ M ) .
Die Definition einer geraden Zahl sieht unter Verwendung von Quantoren wie
folgt aus.
∀n :
6
(n ∈ Z
⇒
(n ist gerade
⇐⇒
Alternativname: Quantifikatoren.
11
∃m : (m ∈ Z ∧ n = 2 · m)))
Quantoren beziehen sich auf die Gesamtheit aller „Objecte unserer Anschauung
oder unseres Denkens“. Oft möchte man aber nur etwas über die Elemente einer
bestimmten Menge aussagen. Dazu verwendet man die folgenden abkürzenden
Schreibweisen.
Notation 2.10 Es sei M eine Menge und P (x) eine Aussageform.
a) Statt ∀x : (x ∈ M ⇒ P (x)) schreibt man ∀x ∈ M : P (x).
b) Statt ∃x : (x ∈ M ∧ P (x)) schreibt man ∃x ∈ M : P (x).
c) Statt ∃!x : (x ∈ M ∧ P (x)) schreibt man ∃!x ∈ M : P (x).
Aussagen mit ∀ und ∃ werden gemäß der folgenden Beobachtung negiert.
Beobachtung 2.11 Es sei P (x) ein 1–stelliges Prädikat. Die Äquivalenz
¬ (∀x : P (x)) ⇐⇒ ∃x : ¬P (x)
ist eine Tautologie.
Wir haben oben schon das Aussonderungsaxiom kennengelernt, das wir mittels
Aussageformen nun wie folgt formulieren können.
Axiom 2.12 (Aussonderungsaxiom) Es sei M eine Menge und P (x) eine
Aussageform. Die Gesamtheit der Elemente x von M , für die P (x) eine wahre Aussage ist, ist selbst wieder eine Menge, die als
{x ∈ M | P (x)}
oder
{x | x ∈ M ∧ P (x)}
notiert wird.
2.4
Die Russell–Antinomie
Gottlob Frege [1848–1925], der in Jena als Professor tätig war, entwickelte eine
Mengenlehre auf Grundlage der Idee, dass es zu jedem Begriff eine Menge gebe,
die genau die Objekte enthält, welche unter diesen Begriff fallen. Mit anderen
Worten: Frege dachte, dass für jede Aussageform P (x) durch {x | P (x)} (die
Gesamtheit genau derjenigen Objekte, für die P (x) zu einer wahren Aussage
wird) eine Menge beschrieben wird. Dies nennt man das Abstraktionsprinzip.
Bertrand Russell [1872–1970] fand jedoch heraus, dass sich aus dem Abstraktionsprinzip ein Widerspruch ergibt: Wählt man für P (x) die Aussageform
„x ist eine Menge ∧ x ∈
/ x“, so wäre {x | P (x)} eine Menge, die sich gleichzeitig
enthält und nicht enthält. Russell wies Frege 1902 in einem Brief darauf hin und
12
erschütterte damit die Grundlagen eines bereits im Druck befindlichen Buches
von Frege.
Wir zeigen nun mit Russells Antinomie, dass die Gesamtheit aller Mengen
keine Menge bildet, falls man die Gültigkeit des Aussonderungsaxioms akzeptiert.
Satz 2.13 Wenn das Aussonderungsaxiom 2.12 gilt, dann ist die Gesamtheit aller Mengen keine Menge.
Beweis. Wir führen einen Widerspruchsbeweis. Wir nehmen also an, dass das
Aussonderungsaxiom wahr ist und dass die Gesamtheit aller Mengen eine Menge
M bildet. Um den Satz zu beweisen, müssen wir aus dieser Annahme einen
Widerspruch herleiten.
Da M eine Menge ist, folgt aus dem Aussonderungsaxiom, dass auch {x ∈
M|x∈
/ x} eine Menge ist, die wir R nennen. Nach der Definition von R gilt
also: x ∈ M ⇒ (x ∈ R ⇔ x ∈
/ x).
Wir setzen nun R für x ein. Da R eine Menge ist, gilt R ∈ M (M ist ja die
Menge aller Mengen). Daher folgt R ∈ R ⇔ R ∈
/ R. Das ist ein Widerspruch,
und somit ist der Satz bewiesen.
13
3
Abbildungen und Relationen
3.1
Abbildungen
Definition 3.1 Es seien X, Y Mengen. Eine Abbildung f : X → Y von X nach
Y ist eine Vorschrift, die jedem Element x ∈ X genau ein Element f (x) ∈ Y
zuordnet. Man spricht auch von der Abbildung x 7→ f (x).
Eine äquivalente Definition lautet so:
Alternativ-Definition 3.2 Eine Abbildung f : X → Y ist eine Teilmenge F ⊆
X × Y mit der folgenden Eigenschaft: zu jedem x ∈ X gibt es genau ein Element
y ∈ Y derart, dass das Paar (x, y) in F liegt. Symbolisch:
∀x ∈ X : ∃!y ∈ Y : (x, y) ∈ F
Man schreibt dann y = f (x).
Man sieht an der Alternativ-Definition insbesondere, dass die Gesamtheit aller
Abbildungen von X nach Y eine Menge bildet (Übungsaufgabe).
Notation 3.3 Die Menge aller Abbildungen von X nach Y wird mit Y X oder
Abb(X, Y ) bezeichnet.
Beispiel 3.4
a) Die Vorschrift „f (x) = 2x3 − sin(x)“ definiert eine Abbildung f : R → R.
b) Abbildungen müssen aber keineswegs durch schöne Formel definiert
wer√
den. So kann man eine Abbildung f : {0, 1, 3, 8, 9} → {−1, π, 2, 21 } durch
f (0) = π, f (1) = −1, f (3) = −1, f (8) = 12 und f (9) = −1 definieren.
c) Die Vorschrift „f (x) = das y mit y 2 = x“ definiert aus zwei Gründen keine
Abbildung f : R → R. Erstens wird zu negativen Zahlen wie z.B. −1 keinen
Wert f (x) zugeordnet; und zweitens wird zu positiven Zahlen mehr als einen
Wert zugeordnet, z.B. f (1) = 1 und f (1) = −1.
Definition 3.5 Sind f : X → Y und g : Y → Z Abbildungen, so wird deren
Verknüpfung g ◦ f : X → Z so definiert: für jedes x ∈ X ist (g ◦ f )(x) = g(f (x)).
Lemma 3.6 Verknüpfung von Abbildungen ist assoziativ, d.h. sind f : X → Y ,
g : Y → Z und h : Z → W Abbildungen, so sind die Abbildungen h ◦ (g ◦ f ) und
(h ◦ g) ◦ f : X → W gleich.
Beweis. Für jedes x ∈ X haben beide Abbildungen den Wert h(g(f (x))).
14
Definition 3.7 Sei f : X → Y eine Abbildung.
a) Sei A ⊆ X eine Teilmenge. Die eingeschränkte Abbildung f |A : A → Y wird
definiert durch f |A (x) = f (x) für jedes x ∈ A.
b) Ist A ⊆ X eine Teilmenge, so bezeichnet man mit f (A) die Bildmenge
f (A) = {f (x) | x ∈ A} von A. Insbesondere nennt man f (X) das Bild 7
von f , es ist also Bild(f ) = {f (x) | x ∈ X}.
c) Ist B ⊆ Y , so definiert man die Urbildmenge 8 f −1 (B) ⊆ X durch
f −1 (B) = {x ∈ X | f (x) ∈ B} .
Ist B die Teilmenge {b}, die aus einem Element b ∈ Y besteht, so schreibt
man f −1 (b) statt f −1 ({b}). Beachten Sie aber, dass f −1 (b) kein Element
von X ist, sondern eine Teilmenge von X.
Beispiel Sei f : R → R die Abbildung x 7→ x2 . Dann f −1 ({−2, 0, 9}) =
{−3, 0, 3}, f −1 (−1) = ∅ und f −1 (4) = {−2, 2}.
Am Beispiel sieht man, dass für eine Abbildung f : X → Y nicht unbedingt jedes
Element von Y im Bild von f liegt, und dass manche Elemente von Y mehrfach
von f „getroffen“ werden. Dies gibt Anlass zur folgenden Definition.
Definition 3.8 Eine Abbildung f : X → Y heißt
injektiv, genau dann wenn keine zwei Elemente von X das gleiche Bild in Y
haben, d.h. wenn jedes y ∈ Y höchstens ein Urbild in X hat; symbolisch:
∀x1 ∈ X : ∀x2 ∈ X : f (x1 ) = f (x2 ) ⇒ x1 = x2 .
surjektiv, genau dann wenn Bild(f ) = Y gilt, d.h. wenn es zu jedem y ∈ Y
mindestens ein x ∈ X mit f (x) = y gibt; symbolisch:
∀y ∈ Y : ∃x ∈ X : f (x) = y.
bijektiv oder eine Bijektion, genau dann wenn sie sowohl injektiv als auch surjektiv ist. Anders gesagt, wenn es zu jedem y ∈ Y genau ein x ∈ X gibt
mit f (x) = y; sybolisch:
∀y ∈ Y : ∃!x ∈ X : f (x) = y.
Lemma 3.9 Seien f : X → Y und g : Y → Z Abbildungen.
a) Ist die Verknüpfung g ◦ f injektiv, so muss f injektiv sein.
b) Ist die Verknüpfung g ◦ f surjektiv, so muss g surjektiv sein.
7
8
Auf Englisch “image”
Auf Englisch “preimage”. Andere Bezeichnung: „Faser“, englisch “fibre“
15
Beweis. S. Übungsblatt.
Weder surjektiv noch injektiv
Surjektiv aber nicht injektiv
Injektiv aber nicht surjektiv
Bijektiv
Sei X eine Menge. Die Identitätsabbildung IdX : X → X wird so definiert: für
jedes x ∈ X ist IdX (x) = x.
Lemma 3.10 Sei f : X → Y eine Abbildung.
a) Ist f injektiv und X nicht leer, so gibt es eine — nach Lemma 3.9 zwangsweise surjektive — Abbildung g : Y → X mit g ◦ f = IdX .
b) Ist f surjektiv, so gibt es eine — nach Lemma 3.9 zwangsweise injektive —
Abbildung g : Y → X mit f ◦ g = IdY .
c) f ist genau dann bijektiv, wenn es eine Abbildung g : Y → X gibt mit den
beiden Eigenschaften g ◦ f = IdX und f ◦ g = IdY .
In diesem Fall ist g bereits durch jede einzelne der beiden Eigenschaften
charakterisiert.9 Mit anderen Worten: Wenn f bijektiv ist und h : Y → X
eine Abbildung ist, für die h ◦ f = IdX oder f ◦ h = IdY , dann ist g = h.
Definition 3.11 Es sei f : X → Y eine bijektive Abbildung. Die nach Lemma 3.10 c) eindeutig bestimmte Abbildung g : Y → X mit g ◦ f = IdX heißt
Umkehrabbildung und wird mit f −1 bezeichnet.
Aus dem Kontext wird jeweils klar, ob mit f −1 (y) für y ∈ Y das Urbild (also eine
Teilmenge von X) oder das Ergebnis der Umkehrabbildung (also ein Element von
X) gemeint ist. Hier werden wir uns bemühen, konsequent f −1 ({y}) zu schreiben,
wenn wir das Urbild und nicht das Ergebnis der Umkehrabbildung meinen.
9
Das heißt, g ist die einzige Abbildung, die die eine oder die andere Eigenschaft hat.
16
Beweis von Lemma 3.10.
a) Da X nicht leer ist, dürfen wir ein Element x0 ∈ X wählen. Sei y ∈ Y . Ist
y ∈ Bild(f ), so gibt es wegen Injektivität genau ein x ∈ X mit f (x) = y,
und wir setzen g(y) = dieses x. Ist y 6∈ Bild(f ), so können wir g(y) = x0
setzen. Somit ist g überall definiert, und es ist g ◦ f = IdX .
b) Für jedes y ∈ Y ist die Urbildmenge f −1 ({y}) = {x ∈ X | f (x) = y}
nicht leer, weshalb wir zu jedem y ∈ Y ein Element xy ∈ f −1 ({y}) wählen
dürfen (beachte dazu aber Abschnitt 3.1.1). Durch g : y 7→ xy ist dann eine
Abbildung g : Y → X definiert, und es ist (f ◦ g)(y) = f (g(y)) = f (xy ) = y.
c) „⇒“: Wenn f bijektiv ist, gibt es zu jedem y ∈ Y genau ein Element
xy ∈ X mit f (xy ) = y. Definieren wir g : Y → X durch g(y) = xy , so
gilt f ◦ g = IdY sofort, denn f ◦ g(y) = f (xy ) = y. Sei jetzt x ∈ X und
z = g(f (x)). Es ist f (z) = f (g(f (x))) = (f ◦ g)(f (x)) = f (x), denn
f ◦ g = IdY . Also z = x, denn f ist injektiv. Das heißt, g ◦ f = IdX .
„⇐“: Es sei g : Y → X eine Abbildung mit den Eigenschaften g ◦ f = IdX
und f ◦ g = IdY . Identitätsabbildungen sind injektiv und surjektiv.
Somit ist g ◦ f injektiv, weshalb nach Lemma 3.9 auch f injektiv ist.
Außerdem ist f ◦ g surjektiv und deshalb auch f surjektiv. Also ist f
bijektiv.
Eindeutigkeit von g: Sei h : Y → X eine Abbildung mit h ◦ f = IdX .
Für jedes y ∈ Y gibt es ein x ∈ X mit f (x) = y, denn f ist surjektiv.
Also h(y) = h(f (x)) = x = g(f (x)) = g(y). Da dies für jedes y ∈ Y
gilt, ist g = h.
Sei nun f ◦ h = IdY . Für jedes y ∈ Y gilt also f (h(y)) = y = f (g(y)).
Insbesondere gilt h(y) ∈ f −1 ({y}) und g(y) ∈ f −1 ({y}). Weil f injektiv ist, sind Urbilder eindeutig, und daher h(y) = g(y). Da dies für
jedes y ∈ Y gilt, ist g = h.
3.1.1
Das Auswahlaxiom
In Teil b) des Beweises von Lemma 3.10 haben wir verwendet, dass wir für alle y ∈
Y gleichzeitig jeweils ein beliebiges Urbildelement wählen können. Auf den ersten
Blick erscheint dies harmlos, doch es erfordert ein eigens konzipiertes Axiom, das
Auswahlaxiom. Es besagt: Wenn M eine Menge paarweise disjunkter nicht-leerer
Mengen ist (das heißt, ∀M, N ∈ M : M ∩ N 6= ∅ ⇒ M = N und ∀M ∈ M : M 6=
∅), dann gibt es eine „Auswahlmenge“ A, so dass ∀M ∈ M : |A ∩ M | = 1.
In Beweisteil b) betrachtet man die Menge M = {f −1 ({y}) | y ∈ Y }. Wenn
für y1 , y2 ∈ Y gilt, dass x ∈ f −1 ({y1 }) ∩ f −1 ({y2 }), dann folgt nach Definition
der Urbildmenge y1 = f (x) = y2 . Die Urbildmengen von zwei verschiedenen
Elementen von Y sind also disjunkt. Da f surjektiv ist, gilt zudem f −1 ({y}) 6= ∅
17
für alle y ∈ Y . Nach dem Auswahlaxiom gibt es also eine Menge A, so dass für
jedes y ∈ Y die Menge A ∩ f −1 ({y}) genau ein Element enthält; dieses Element
nennen wir xy und definieren dann g : Y → X durch g(y) = xy .
Die Existenz der Abbildung g (der Auswahlfunktion) und die Existenz der
Menge A sind untrennbar verknüpft, denn es gilt A = {g(y) | y ∈ Y }. Ist
A gegeben, so ist dadurch g bestimmt. Ist g gegeben, so ist {g(y) | y ∈ Y }
nach dem Ersetzungsaxiom eine Menge, und durch diese wird die Aussage des
Auswahlaxioms erfüllt. Die Abbildung g wird also als Auswahlregel verwendet.
Das Auswahlaxiom erscheint einleuchtend und mit ihm lassen sich manche
sehr „elegante“ Sätze beweisen. Andererseits lassen sich mit ihm auch Sätze beweisen, die der Intuition eklatant widersprechen. Es wurde daher untersucht,
ob das Auswahlaxiom vielleicht den Zermelo–Fraenkel–Axiomen widerspricht (in
diesem Fall dürfte man es natürlich nicht verwenden) oder ob es vielleicht aus
den Zermelo–Fraenkel–Axiomen folgt (in diesem Fall wäre es also kein Axiom,
sondern ein Theorem).
Es zeigte sich:
• Wenn M nur endlich viele Mengen enthält, gilt für M das Auswahlaxiom.
Der Beweis erfordert vollständige Induktion, die wir noch kennen lernen
werden.
• Wenn die Elemente von M Mengen mit einer besonderen Struktur sind,
kann man oft eine Auswahlfunktion explizit angeben, so dass das Auswahlaxiom in diesem Fall gilt:
– Wenn M ⊆ P(N) ist, dann kann man aus jedem M ∈ M jeweils das
kleinste Element wählen.
– Wenn alle Elemente von M jeweils Dreiecke sind, dann kann man aus
diesen Dreiecken jeweils den Schwerpunkt auswählen.
• Wenn die übrigen Zermelo–Fraenkel–Axiome widerspruchsfrei sind, dann
entstehen durch Hinzunahme des Auswahlaxioms keine Widersprüche. Dies
bewies Kurt Gödel [1906–1978] im Jahre 1938.
• Wenn die übrigen Zermelo–Fraenkel–Axiome widerspruchsfrei sind, dann
entstehen durch Hinzunahme der Negation des Auswahlaxioms ebenfalls
keine Widersprüche. Dies bewies Paul Cohen [1934–2007] im Jahre 1963.
Dies Ergebnisse von Gödel und Cohen besagen also, dass das Auswahlaxiom von
den übrigen Zermelo–Fraenkel–Axiomen unabhängig ist. Es gilt als guter Stil, in
Beweisen das Auswahlaxiom nur zu verwenden, wenn es nicht anders geht.
Bemerkung 3.12 Wenn f : X → Y eine bijektive Abbildung ist, dann besteht
für jedes y ∈ Y die Urbildmenge f −1 ({y}) jeweils aus einem einzelnen Element.
Bei der Konstruktion der Umkehrabbildung f −1 : Y → X müssen wir also nicht
18
wählen. Die Umkehrabbildung einer bijektiven Abbildung existiert also auch ohne
das Auswahlaxiom.
3.2
Binäre Relationen
Wir führen Relationen ein. Die wichtigsten Relationen sind Äquivalenzrelationen
(etwa „Peter und Sabine haben den gleichen Geburtstag“) sowie Ordnungsrelationen (etwa „Jena hat weniger Einwohner als Erfurt“).
Definition 3.13 Sei X eine Menge. Eine (binäre bzw. zweistellige) Relation
auf X ist eine Teilmenge R ⊆ X × X. Sind x, y ∈ X, so schreibt man meistens x R y anstelle von (x, y) ∈ R. Somit ist x R y eine Aussage, also entweder
wahr oder falsch.
Eine Relation heißt
• reflexiv, falls x R x gilt für jedes x ∈ X.
• symmetrisch, falls x R y genau dann gilt, wenn y R x gilt.
• transitiv, falls x R z aus x R y und y R z folgt.
Bemerkung 3.14 Für jedes n ∈ N kann man n-stellige (oder n-äre) Relationen
als Teilmengen von X
×X ×
· · · × X} definieren. Beispielsweise ist „x, y, z bilden
{z
|
n mal
die Ecken eines gleichseitigen Dreiecks“ eine 3-stellige Relation of R2 . In dieser
Vorlesung spielen aber nur zweistellige Relationen eine Rolle.
Beispiel 3.15
a) Die Relation „besucht die gleiche Klasse wie“, definiert auf der Menge der
SchülerInnen einer Schule, ist reflexiv (jedes Kind besucht die gleich Klasse
wie es selbst), symmetrisch (wenn Peter die gleiche Klasse wie Sabine besucht, dann besucht Sabine auch die gleiche Klasse wie Peter) und transitiv
(wenn Peter die gleiche Klasse wie Sabine besucht und Sabine die gleiche
Klasse wie Paul besucht, dann besuchen Peter und Paul die gleiche Klasse).
b) Die Relation „mag“ ist nicht notwendig reflexiv (nicht jeder Mensch mag
sich selbst), nicht notwendig symmetrisch (vielleicht mag Peter Sabine, aber
Sabine mag nicht Peter) und nicht notwendig transitiv (wenn Peter Sabine
mag und Sabine Paul mag, dann ist es möglich, dass Peter Paul nicht mag).
c) Sei f : X → X eine Abbildung. Der Graph von f ist die Teilmenge F ⊆
X × X gegeben durch
F = {(x, f (x)) | x ∈ X} .
19
Wie jede Teilmenge von X ×X ist auch der Funktionsgraph F eine Relation
auf X. Gemäß Alternativ–Definition 3.2 ist f durch diese Relation eindeutig
bestimmt.
3.2.1
Äquivalenzrelationen
Definition 3.16 Eine Äquivalenzrelation ist eine Relation, die reflexiv, symmetrisch und transitiv ist. Typischerweise bezeichnet man eine Äquivalenzrelation
mit ∼, also x ∼ y anstelle von x R y.
Beispiele
• X = alle Städte Deutschlands: Relation „liegt im gleichen Bundesland wie“
ist eine Äquivalenzrelation.
• X = die Kinder aus der 6b: Relation „hat den gleichen Geburtstag wie“ ist
eine Äquivalenzrelation.
• X = R3 mit der Relation „(u1 , u2 , u3 ) R (v1 , v2 , v3 ) ⇔ stimmen an mindestens zwei Stellen überein“: Die Relation ist reflexiv und symmetrisch, aber
nicht transitiv, denn (1, 1, 1) R (1, 1, 2) und (1, 1, 2) R (1, 2, 2), aber nicht
(1, 1, 1) R (1, 2, 2). Also ist es keine Äquivalenzrelation.
Definition 3.17 Ist ∼ eine Äquivalenzrelation auf der Menge X, so nennt man
die Menge [x] = [x]∼ = {y ∈ X | y ∼ x} die Äquivalenzklasse eines Elements
x ∈ X. Ist ∼ eine Äquivalenzrelation auf der Menge X, so bezeichnet man mit
X/∼ die Menge der Äquivalenzklassen: X/∼ = {[x] | x ∈ X}.
Beispiel 3.18 Brüche sind durch Zähler und Nenner gegeben. Zwei Brüche sind
gleich, wenn sie nach vollständigem Kürzen den gleichen Zähler und Nenner haben. Dies ist eine Äquivalenzrelation und die Menge Q der rationalen Zahlen kann
man also als Menge von Äquivalenzklassen von Brüchen betrachten.
Lemma 3.19 Sei ∼ eine Äquivalenzrelation auf der Menge X. Dann ist x ∈ [x]
für jedes x ∈ X, wegen Reflexivität. Außerdem sind für x, y ∈ X folgende drei
Aussagen äquivalent:
a) x ∼ y
b) [x] ∩ [y] 6= ∅.
c) [x] = [y]
Beweis. Wir zeigen a) ⇒ b) ⇒ c) ⇒ a).
a) ⇒ b) Aus x ∼ y folgt x ∈ [y]. Wegen Reflexivität ist aber auch x ∈ [x]. Daher
ist x ∈ [x] ∩ [y], also [x] ∩ [y] 6= ∅.
20
b) ⇒ c) Wenn [x] ∩ [y] 6= ∅, dann gibt es ein z ∈ [x] ∩ [y]. Wir wollen nun
zeigen, dass [x] ⊆ [y]; wenn also w ∈ [x], so wollen wir zeigen, dass auch
w ∈ [y]. Aus w ∈ [x] folgt w ∼ x. Wegen z ∈ [x] ist z ∼ x, also x ∼ z
wegen Symmetrie. Aus w ∼ x und x ∼ z folgt w ∼ z wegen Transitivität.
Aufgrund von z ∈ [y] gilt z ∼ y, also aus w ∼ z folgt w ∼ y wegen
Transitivität, also w ∈ [y], was zu zeigen war.
Analog folgt [y] ⊆ [x], also [y] = [x], also c).
c) ⇒ a) Wenn [x] = [y], dann x ∈ [x] = [y], daher x ∼ y.
Bemerkung 3.20 Laut des Lemmas stellen die Äquivalenzklassen von ∼ eine
Partition der Menge X dar, d.h. X ist die Vereinigung von paarweise disjunkten,
nichtleeren Äquivalenzklassen.
3.2.2
Ordnungsrelationen
Definition 3.21 Eine Relation R auf X heißt
• antisymmetrisch, genau dann wenn für x, y ∈ X aus x R y und y R x folgt,
dass x = y.
• linear, falls für x, y ∈ X mindestens eins aus x R y und y R x gelten muss.
Definition 3.22 Eine Teilordnung ist eine Relation, die reflexiv, antisymmetrisch und transitiv ist. Eine lineare Ordnung heißt eine Ordnung, Totalordnung
oder lineare Ordnung.
Beispiel 3.23
• Auf X = R ist ≤ eine Totalordnung. Vorsicht: streng genommen ist < in
diesem Sinne keine Ordnung, da nicht reflexiv.
• X = Menge aller Menschen: „ist Nachkomme von“ ist eine Teilordnung,
aber keine Totalordnung.
• X eine Menge von Mengen: „ist Teilmenge von“ ist eine Teilordnung, aber
keine Totalordnung (Übung).
21
4
Natürliche Zahlen und Induktion
Die Fähigkeit, kleine Mengen nach ihrer Größe vergleichen zu können, scheint
angeboren zu sein.10 Für die jeweiligen Größen von kleinen Mengen lernen Kinder
Zahlwörter („eins“, „zwei“, „drei“, „vier“, „fünf“) und lernen gleichzeitig, dass die
Größen und damit auch die Zahlwörter in einer festen Reihenfolge stehen (man
nimmt immer ein Ding hinzu): Sie lernen in beschränktem Umfang zu zählen.
Um auch für eine größere Menge entscheiden zu können, ob sie gleich groß zu
einer anderen Menge ist, kann man eine „Anschauungshilfe“ verwenden. So war
gemäß archäologischer Funde (Ishango–Knochen, ca. 20000 Jahre alt und damit
älter als der Ackerbau) das Kerbholz vermutlich bereits in der Steinzeit bekannt.
Dies setzt die Erkenntnis voraus, dass „gleich viel“ herauskommt, wenn man etwa
für jedes Tier einer Herde eine Kerbe in ein Stück Holz oder Knochen ritzt oder
einen Knoten in eine Schnur knüpft. Das geht auch, wenn man für diese Zahlen
keine Zahlwörter zur Verfügung hat.
In der Schule soll über kleine Zahlen und über die Verwendung von Anschauungshilfen hinaus gegangen werden. Man lernt, dass man Zahlen statt mit einer
Knotenschnur kompakter mit einem Stellenwertsystems darstellen kann.
Außerdem lernt man in der Schule das Rechnen mit natürlichen Zahlen: Addition N × N → N, (m, n) 7→ m + n und Multiplikation N × N → N, (m, n) 7→ m · n.
Man lernt, dass dabei folgende Axiome jeweils für alle `, m, n ∈ N gelten:
(N1) ` + (m + n) = (` + m) + n (Assoziativität der Addition)
(N2) m + n = n + m (Kommutativität der Addition)
(N3) m + 0 = m (Neutralität der Null in der Addition)
(N4) ` · (m · n) = (` · m) · n (Assoziativität der Multiplikation)
(N5) m · n = n · m (Kommutativität der Multiplikation)
(N6) n · 1 = n (Neutralität der Eins in der Multiplikation)
(N7) ` · (m + n) = ` · m + ` · n (Distributivgesetz).
Ferner möchte man mit den Umkehroperationen „−“ und „÷“ rechnen — auch
dann, wenn dies in N nicht möglich ist. So kommt man auf Z und schließlich auf
Q, für die die obigen Axiome immer noch gelten. Da Axiome (N1)–(N7) also nicht
nur durch die natürlichen Zahlen, sondern auch durch Z und Q und viele weitere
mathematische Strukturen erfüllt werden, sind diese Axiome nicht geeignet für
eine Definition der natürlichen Zahlen.
In dieser Beschreibung werden mehrere Sichtweisen auf die natürlichen Zahlen
berührt, die im weiteren Verlauf der Vorlesung thematisiert werden sollen:
10
Sie existiert zum Teil auch bei Tieren. Eine Störung dieser Fähigkeit kann bei Kindern zu
Dyskalkulie führen.
22
Kardinalzahlen: Was heißt es für Mengen, „gleich groß“ zu sein? Was sind
endliche Mengen?
Ordinalzahlen, Induktion: Wie kann man die natürlichen Zahlen durch ihre
Abfolge beim Zählen formal beschreiben und dies in Beweisen ausnutzen?
Arithmetik: Wie rechnet man mit natürlichen Zahlen?
Algebra: In welchen anderen mathematischen Konstruktionen kann man einige
der obigen Axiome wiederfinden, und welche Strukturaussagen kann man
aus den jeweils geltenden Axiomen herleiten?
4.1
4.1.1
Natürliche Zahlen als Kardinalzahlen
Gleichmächtigkeit
Definition 4.1 Seien A, B Mengen.
• A und B heißen gleichmächtig, Bezeichnung |A| = |B|, genau dann wenn
es eine Bijektion f : A → B gibt.
• Gibt es eine injektive Abbildung f : A → B, so schreibt man |A| ≤ |B|.
• A heißt echte Teilmenge von B, Bezeichnung A ( B, genau dann wenn
A ⊆ B und A 6= B.
Beispiel 4.2
a) Wenn man beim Zählen einer Tierherde für jedes Tier einen Knoten in
eine Schnur knüpft, erzeugt man ein bijektive Abbildung von der Herde in
die Menge der Knoten. Die Menge der Knoten und die Tierherde sind also
gleichmächtig.
b) Kerbhölzer wurden früher zur Dokumentierung von Schuldverhältnissen benutzt. Die Anzahl der Kerben (quer über einen Stab) entsprach der Höhe
der Schulden. Das Holz wurde dann längs gespalten, so dass jede Kerbe
in der Mitte geteilt wurde, und jede Vertragspartei erhielt eine Holzhälfte.
Die beiden Hälften wiesen jeweils die gleiche Anzahl von Halb-Kerben auf.
Jede Vertragspartei war damit in der Lage, die Höhe der Schulden nachzuweisen, und nachträgliche Manipulationen konnten nachgewiesen werden,
indem man die beiden Holzhälften wieder passend aneinander legte.
c) Wenn A ⊆ B, dann ist |A| ≤ |B|, denn (IdB ) |A : A → B ist injektiv.
Bemerkung 4.3 Da die Gesamtheit aller Mengen keine Menge bildet, kann man
„Gleichmächtigkeit“ streng genommen nicht als Relation bezeichnen. Allerdings
ist sie reflexiv, symmetrisch und transitiv (Übung!) und damit fast so etwas wie
eine Äquivalenzrelation.
23
4.1.2
(Un-)endliche Mengen
Intuitiv ist klar: Die Mächtigkeit |X| einer endlichen Menge X ist eine natürliche
Zahl, und für jede natürliche Zahl gibt es eine endlich Menge dieser Mächtigkeit.
Man könnte die natürlichen Zahlen also mit den Mächtigkeiten endlicher Mengen identifizieren. Problem: Wie kann man den Begriff einer endlichen Menge
definieren, ohne den Begriff der natürlichen Zahl vorauszusetzen?
Wir gehen einerseits von einem intuitiven Verständnis des Begriffes „endliche
Menge“ aus; dabei gehen wir auch von einem intuitiven Verständnis dafür aus,
was natürliche Zahlen sind. Ein Appell an die Intuition ist natürlich kein Ersatz
für eine Definition. Daher geben wir auch noch eine von Richard Dedekind [1831–
1916] stammende formale Definition dieses Begriffs. Wir zeigen dann Gründe
dafür auf, dass beide Begriffe übereinstimmen.
Definition 4.4 (intuitiv unendlich) Eine Menge X heißt unendlich, genau
dann wenn es eine nicht-endende Folge x0 , x1 , x2 , ... von Elementen von X gibt,
so dass für jedes n = 0, 1, 2, ... gilt: xn+1 ∈ X \ {x0 , x1 , x2 , ..., xn }. Andernfalls
heißt X endlich.
Das Problem dieser Begriffsbeschreibung ist, dass wir hier bereits ein intuitives
Verständnis der natürlichen Zahlen („n = 0, 1, 2, ...“, „n + 1“) verwenden. Streng
genommen handelt es sich also nicht um eine Definition, aber trotzdem können wir
zeigen, dass dadurch im Wesentlichen der gleiche Begriff wie durch die folgende
„echte“ Definition beschrieben wird.
Definition 4.5 (Dedekind–unendlich) Eine Menge heißt unendlich, genau
dann wenn sie gleichmächtig zu einer echten Teilmenge ist. Sonst heißt sie endlich.
Bemerkung 4.6 Man kann leicht zeigen (Übung): Eine Menge X ist unendlich,
genau dann wenn es eine injektive aber nicht surjektive Abbildung φ : X → X
gibt.
Wenn wir nun zeigen, dass Dedekinds Begriff der unendlichen Menge mit
unserem intuitiven Begriff übereinstimmt, so kann das natürlich kein „echter“
Beweis sein, da ja einer der vorkommenden Begriffe nicht „echt“ definiert wurde. Aber zumindest sollte argumentativ klar werden, dass Dedekinds formaler
Unendlichkeitsbegriff unserem intuitiven Begriff entspricht.
Lemma 4.7 Wenn eine Menge X0 im Sinne von Definition 4.5 unendlich ist,
dann ist sie auch im Sinne von Definition 4.4 unendlich.
Beweis. Wenn X0 unendlich im Sinne von Definition 4.5 ist, dann gibt es eine
injektive nicht surjektive Abbildung φ : X0 → X0 . Wir bezeichnen X1 = φ(X0 ).
Da φ nicht surjektiv ist, ist X1 eine echte Teilmenge von X0 .
24
Wir definieren weiter X2 = φ(X1 ), X3 = φ(X2 ) usw. Wegen X1 ⊆ X0 gilt
auch φ(X1 ) ⊆ φ(X0 ), also X2 ⊂ X1 . Entsprechend gilt X3 ⊆ X2 , X4 ⊆ X3 usw.
Da X1 eine echte Teilmenge von X0 ist, gibt es ein x0 ∈ X0 \X1 . Wir definieren
x1 = φ(x0 ), x2 = φ(x1 ), usw. Es ist x1 = φ(x0 ) ∈ φ(X0 ) = X1 . Wir beweisen nun:
x1 ∈
/ φ(X1 ) = X2 . Wäre nämlich x1 ∈ φ(X1 ) = X2 , so gäbe es ein x ∈ X1 mit
x1 = φ(x) = φ(x0 ). Da φ injektiv ist, würde daraus x = x0 folgen. Das wäre ein
Widerspruch, denn x0 ∈ X0 \ X1 , aber x ∈ X1 . Also ist x1 ∈
/ X2 .
Wir haben im vorigen Abschnitt gezeigt, dass x1 ∈ X1 \ X2 , und in gleicher
Weise folgt x2 ∈ X2 \ X3 , x3 ∈ X3 \ X4 und so weiter. Wir wissen bereits, dass
X0 ⊇ X1 ⊇ X2 ⊇ · · · , und dies impliziert X0 \ X1 ⊆ X0 \ X2 ⊆ X0 \ X3 ⊆ · · · :
Wenn wir nämlich von X0 eine kleinere Menge abziehen (X2 ⊆ X1 ), dann ist die
Differenzmenge größer (X0 \ X2 ⊇ X0 \ X1 ).
Wir zeigen abschließend, dass die x0 , x1 , x2 , ... paarweise verschieden sind. Es
sei n = 0, 1, 2, .... Nach dem vorigen Absatz gilt x0 ∈ X0 \X1 ⊆ X0 \X2 ⊆ · · · , x1 ∈
X1 \ X2 ⊆ X0 \ X2 ⊆ X0 \ X3 und so weiter. Wir finden also {x0 , x1 , x2 , ..., xn } ⊆
X0 \ Xn+1 . Weil aber xn+1 ∈ Xn+1 , muss xn+1 folglich von allen x0 , x1 , x2 , ...
verschieden sein, denn diese liegen ja gerade nicht in Xn+1 . Also ist xn+1 ∈
X0 \ {x0 , x1 , x2 , ..., xn }. Dies gilt für alle n = 0, 1, 2, ..., daher ist X0 unendlich im
Sinne von Definition 4.4.
Lemma 4.8 Wenn eine Menge X0 im Sinne von Definition 4.4 unendlich ist,
dann ist sie auch im Sinne von Definition 4.5 unendlich.
Beweis. Wenn X0 im Sinne von Definition 4.4 unendlich ist, dann gibt es
eine nicht endende Folge x0 , x1 , x2 , ... von Elementen von X0 , so dass für jedes
n = 0, 1, 2, ... gilt: xn+1 ∈ X0 \{x0 , x1 , x2 , ..., xn }. Insbesondere ist stets xn+1 6= x0 .
Wir definieren eine Abbildung φ : X0 → X0 wie folgt:
φ(xn ) = xn+1
φ(x) = x
für n = 0, 1, 2, ...
für x ∈ X0 \ {x0 , x1 , x2 , ...}
Offensichtlich ist die Abbildung φ nicht surjektiv, denn x0 ∈
/ φ(X0 ). Wir werden
nun zeigen, dass φ injektiv ist. Für jedes y ∈ X0 \ {x0 } ist also zu zeigen, dass
das Urbild φ−1 ({y}) aus höchstens einem Element besteht. Hier unterscheiden
wir zwei Fälle.
a) Wenn y ∈ X0 \ {x0 , x1 , x2 , ...}, dann ist φ−1 ({y}) = {y}.
b) Wenn y ∈ {x1 , x2 , x3 ...}, dann ist φ−1 ({y}) ⊂ {x0 , x1 , x2 , ...}, und wenn
y = xi dann ist xi−1 ∈ φ−1 ({y}). Es bleibt zu zeigen, dass dies das einzige
Urbild ist: Wenn xj ∈ φ−1 ({xi }), dann müssen wir j = i − 1 beweisen.
i) Sei j ≥ i. Dann folgt φ(xj ) = xj+1 ∈ X0 \ {x0 , x1 , x2 , ..., xj } und
xi ∈ {x0 , x1 , x2 , ..., xj }. Also ist φ(xj ) 6= xi , Widerspruch.
25
ii) Sei j < i − 1. Dann ist φ(xj ) = xj+1 ∈ {x0 , x1 , x2 , ..., xi−1 }, aber
xi ∈ X0 \ {x0 , x1 , x2 , ..., xi−1 }, Widerspruch.
Da wir j ≥ i und j < i − 1 ausgeschlossen haben, muss j = i gelten.
Wir haben also gezeigt: φ : X0 → X0 ist injektiv aber nicht surjektiv. Also ist X0
unendlich im Sinne von Definition 4.5.
Wir erhalten somit eine erste hinreichend genaue Beschreibung der Menge der
natürlichen Zahlen.
Axiom 4.9 (Natürliche Zahlen als Kardinalzahlen) Es gibt eine Menge N
von endlichen Mengen (im Sinne von Definition 4.5), so dass es für jede endliche
Menge E genau ein Element e ∈ N gibt, so dass E und e gleichmächtig sind. Die
Menge N heißt Menge der natürlichen Zahlen.
4.2
Natürliche Zahlen als Ordinalzahlen
Für eine Dedekind–unendliche Menge X gibt es eine injektive nicht surjektive
Abbildung φ : X → X. Im Beweis von Lemma 4.7 haben wir mittels φ eine
unendliche Folge x0 , x1 , x2 , ... von Elementen von X konstruiert. Dabei hat φ
jedes dieser Elemente auf das jeweils „nächste“ abgebildet. Durch φ ist also eine
Reihenfolge von Elementen gegeben — genau, wie es auch beim Zählen eine
Reihenfolge gibt. Diese Beobachtung ist der Schlüssel für eine Definition von
natürlichen Zahlen, die Giuseppe Peano [1858–1932] 1889 vorschlug. Im Vergleich
zu Axiom 4.9 haben die Peano–Axiome den Vorteil, dass sie gleichzeitig eine sehr
mächtige Beweistechnik liefern, nämlich die vollständige Induktion.
Axiom 4.10 (Peano–Axiome, natürliche Zahlen als Ordinalzahlen)
Es gibt eine Menge N, ein Element 0 ∈ N und eine Abbildung φ : N → N mit
folgenden Eigenschaften:
a) φ ist injektiv
b) Bild φ = N \ {0}
c) Wenn für eine Teilmenge T ⊆ N sowohl 0 ∈ T als auch φ(T ) ⊆ T gelten,
dann ist T = N.
Die Menge N heißt Menge der natürlichen Zahlen.
Eigenschaften a) und b) sorgen dafür, dass N eine unendliche Menge im Sinne
von Definition 4.5 ist, und definieren die Zahl 0. Die dritte Eigenschaft besagt,
dass N die „kleinste“ unendliche Menge ist.
Axiome 4.9 und 4.10 besagen im Wesentlichen das gleiche, man kann also
natürliche Zahlen sowohl als Kardinal- als auch als Ordinalzahlen beschreiben.
Das werden wir allerdings nicht beweisen. Wir werden ab jetzt N stets im Sinne
von Axiom 4.10 auffassen, wenn nichts anderes gesagt wird.
26
4.3
Die Peano–Axiome in Beweisen und Definitionen
Es seien N, 0 und φ wie in Axiom 4.10. Wenn n eine natürliche Zahl ist, so schreibt
man statt φ(n) meist n + 1 (das ist nur eine Schreibweise und keine Addition)
oder auch n0 und nennt diese Zahl den Nachfolger von n. Wegen Axiom 4.10.c)
kann man jede natürliche Zahl aus der Null gewinnen, wenn man oft genug φ
anwendet. Wir können also die natürlichen Zahlen schreiben als 0, 0 + 1, (0 + 1) +
1, ((0 + 1) + 1) + 1, (((0 + 1) + 1) + 1) + 1, ... oder auch 0, 00 , 000 , 0000 , ....
Wir können jetzt zählen, jedoch noch nicht rechnen. Doch Zählen ist genug für
sehr wichtige Beweis– und Definitionstechniken, die wir in den folgenden Unterkapiteln erklären. In den Beispielen betrachten wir das Rechnen mit natürlichen
Zahlen als Schulstoff, den wir erst später in der Vorlesung thematisieren.
4.3.1
Vollständige Induktion
Da wir alle natürlichen Zahlen schrittweise aus der Null erhalten können, können
wir auch schrittweise Beweise führen: Wenn eine Aussage für die Null gilt und
wenn zudem die Wahrheit der Aussage beim Schritt auf die jeweils nächste Zahl
erhalten bleibt, dann folgt, dass die Aussage für alle natürlichen Zahlen gilt.
Man startet also bei einem Beispiel (der Null) und schreitet dann fort auf
das nächste und übernächste Beispiel, um auf diese Weise eine allgemeine Aussage zu beweisen. In der Philosophie nennt man einen Schluss von Beispielen
auf allgemeine Erkenntnisse einen Induktionsschluss 11 , im Gegensatz zum Deduktionsschluss 12 , bei dem allgemeine Prinzipien auf ein konkretes Beispiel angewandt werden. Ein Induktionsschluss wird in der Philosophie meist als formal
fragwürdig angesehen, denn wie sollte man von ein paar Beispielen formal auf
eine allgemeine Aussage kommen.
Daher muss an dieser Stelle betont werden, dass es beim oben skizzierten
schrittweisen Beweis nicht nur um „ein paar Beispiele“ geht: Axiom 4.10.c) besagt, dass wir auf diese Weise alle nur möglichen Beispiele und damit den Allgemeinfall betrachten. Man spricht daher in der Mathematik von der „vollständigen
Induktion“, die gemäß des folgenden Lemmas eine formal zulässige Schlusstechnik
ist. Entgegen ihres Namens ist sie deduktiv. Ihre Bedeutung für die mathematische
Arbeit ist enorm.
Lemma 4.11 (Prinzip der vollständigen Induktion)
Es sei P (n) eine Aussageform. Es gelte
Induktionsanfang: P (0) = W , und
Induktionsschritt: ∀n ∈ N : (P (n) ⇒ P (n + 1)).
Dann gilt ∀n ∈ N : P (n).
11
12
von lat. inducere: ’herbeiführen’, ’veranlassen’, ’einführen’
von lat. deducere: ’ableiten’, ’fortführen’
27
Beweis. Wir definieren T = {n ∈ N : P (n)}, was nach dem Aussonderungsaxiom eine Teilmenge von N ist. Nach Definition von T gilt: ∀n ∈ T : P (n).
Wegen des Induktionsanfangs ist 0 ∈ T . Es sei nun n ∈ T . Es gilt also P (n).
Wegen des Induktionsschritts folgt P (n + 1). Also ist auch n + 1 = φ(n) ∈ T . Da
dies für alle n ∈ T gilt, folgt φ(T ) ⊂ T . Nach Axiom 4.10.c) folgt T = N. Wir
erhalten also ∀n ∈ N : P (n).
In vielen (aber sicher nicht allen) Fällen beweist man den Induktionsschritt durch
einen direkten Beweis. Man setzt also voraus, dass P (n) wahr ist — dies nennt
man die Induktionsannahme —, und beweist, dass dann auch P (n + 1) wahr sein
muss. Den Induktionsschritt kann man aber auch anders beweisen: Durch Kontraposition oder durch einen Widerspruchsbeweis, ja, es kommt sogar vor, dass
man den Beweis des Induktionsschrittes wieder mittels vollständiger Induktion
führt. Wir werden noch viele Beweise durch vollständige Induktion führen. Hier
ist ein erstes Beispiel.
Beispiel 4.12
Sei an = 0 + 1 + 2 + 3 + · · · n. Dann gilt an =
n(n+1)
2
für alle n ∈ N.
Beweis durch vollständige Induktion über n.
Induktionsanfang: Tatsächlich ist a0 = 0 =
0·1
.
2
Induktionsschritt: Die Induktionsannahme ist an =
dass dann auch an+1 = (n+1)(n+2)
gilt:
2
n(n+1)
.
2
Wir beweisen nun,
n(n + 1)
+ (n + 1)
2
n(n + 1) + 2(n + 1)
(n + 1)(n + 2)
=
=
,
2
2
an+1 = an + (n + 1) =
wie erwünscht.
Nach dem Prinzip der vollständigen Induktion ist dadurch die Behauptung bewiesen für alle n ∈ N.
Bemerkung 4.13 Eine vollständige Induktion muss nicht unbedingt bei n = 0
beginnen. Man kann zum Beispiel n = 5 als Induktionsanfang wählen und mit
dem Induktionsschritt ∀n ∈ N : ((n ≥ 5 ∧ P (n)) ⇒ P (n + 1)) arbeiten. Es folgt
dann P (n) für alle natürlichen Zahlen n ≥ 5.
28
4.3.2
Rekursive Definitionen
Wenn n ∈ N \ {0}, dann gibt es wegen Axiom 4.10.b) eine natürliche Zahl, die
durch φ auf n abgebildet wird. Diese Zahl ist eindeutig bestimmt, denn φ ist
injektiv nach Axiom 4.10.a). Man nennt sie den Vorgänger n − 1 von n (n − 1
ist wieder nur eine Bezeichnung und keine Subtraktion). Insbesondere ist n der
Vorgänger von φ(n). Man kann eine Abbildung f : N → X definieren, indem man
• f (0) ∈ X angibt; und
• für jedes n ≥ 1 beschreibt, wie man f (n) aus f (n − 1) berechnen kann.
Eine solche Definition einer Abbildung heißt rekursiv.
Allgemein kann eine rekursive Definition auch bei einem anderen Anfangswert
als Null beginnen: Man erhält eine Abbildung von {n ∈ N : n ≥ Anfangswert}
nach X.
Beispiel n-Fakultät: n! = 1 · 2 · 3 · · · · · (n − 1) · n ist rekusiv definiert durch
0! = 1, und n! = n · (n − 1)! für n ≥ 1. Zum Beispiel 3! = 3 · 2! = 3 · 2 · 1! =
3 · 2 · 1 · 0! = 3 · 2 · 1 · 1 = 6.
Notation 4.14 Es sei n ∈ N und es seien a0 , a1 , . . . , an Zahlen. Die Summe
P
Q
Pn
ai und das Produkt ni=0 ai werden rekursiv definiert durch 0i=0 ai = a0 =
i=0
Q0
i=0 ai und
n
X
i=0
ai =
n−1
X
n
Y
!
ai + an
i=0
i=0
ai =
n−1
Y
!
ai · an .
i=0
Beispiel Für a0 = 2, a1 = 3 und a2 = 5 ist
2
X
2
Y
ai = (2 + 3) + 5 = 10
i=0
i=0
29
ai = (2 · 3) · 5 = 30 .
5
Elementare Arithmetik
Wir können nun mittels rekursiver Definitionen und vollständiger Induktion die
Grundrechenarten definieren und einige Struktureigenschaften beweisen. Es seien
dazu wieder N, 0 ∈ N und φ : N → N wie in Axiom 4.10.
Manche einfacheren Beweise werden als Hausaufgaben gestellt. Im Skript werden diese Beweise erscheinen, nachdem die entsprechenden Hausaufgaben abgegeben wurden. In den Beweisen achten wir zunächst darauf, in jedem Beweisschritt
genau zu sagen, auf welches schon bekannte Ergebnis wir uns jeweils berufen. Das
wird später etwas laxer gehandhabt werden, denn sobald wir alle Axiome (N1)–
(N7) bewiesen haben, werden wir sie in Rechnungen mit den natürlichen Zahlen
nicht mehr weiter erwähnen.
Definition 5.1 1 = φ(0).
Lemma 5.2 Für alle n ∈ N gilt φ(n) 6= n.
Beweis durch vollständige Induktion nach n.
Induktionsanfang n = 0: Nach Axiom 4.10.b) ist 0 ∈
/ Bild(φ), also φ(0) 6= 0.
Induktionsschritt: Die Induktionsannahme ist φ(n) 6= n. Weil φ gemäß Axiom 4.10.a) injektiv ist, folgt φ (φ(n)) 6= φ(n). Damit ist der Induktionsschritt bewiesen, und nach dem Prinzip der vollständigen Induktion folgt
daraus das Lemma.
5.1
Addition
Der Vorgänger von n ∈ N \ {0} wird wieder mit n − 1 bezeichnet. Um Verwechslungen mit der nun zu definierenden Addition auf N zu vermeiden, verwenden
wir für den Nachfolger von n die Notation φ(n) statt n + 1.
Für eine natürliche Zahl n betrachten wir + n als eine Abbildung von N nach
N: Diese Abbildung bildet m ∈ N auf m + n ∈ N ab und ist rekursiv wie folgt
definiert.
Definition 5.3 Es sei n ∈ N. Für beliebige m ∈ N definieren wir
a) m + 0 = m (dies ist der Fall n = 0) und
b) m + n = φ (m + (n − 1)), falls n 6= 0.
Am Anfang von Abschnitt 4 erinnerten wir an einige aus der Schule bekannte
Axiome (N1)–(N7) für die Grundrechenarten. Wir erkennen, dass Axiom (N3)
(Neutralität der Null in der Addition) direkt aus Definition 5.3 folgt. In den
beiden folgenden Abschnitten werden wir (N2) und schließlich (N1) beweisen.
30
Bemerkung 5.4 Für alle n ∈ N ist φ(n) = n + 1, wobei wir die rechte Seite der
Gleichung diesmal nicht als Schreibweise, sondern als Summe betrachten.
Beweis. Es ist 0 der Vorgänger von 1. Definition 5.3 gilt natürlich auch mit
geänderten Namen. Es gilt also n+1 = φ(n+0) nach Definition 5.3.b) und weiter
n + 0 = n nach Definition 5.3.a). Also ist n + 1 = φ(n).
5.1.1
Kommutativität der Addition
Ziel dieses Abschnitts ist ein Beweis von Axiom (N2) (Kommutativität der Addition). Allerdings benötigen wir vorher noch zwei Lemmata. Nach Definition ist
die Null neutral bei Addition von rechts. Das folgende Lemma sagt aus, dass es
auch neutral von links ist.
Lemma 5.5 Für alle n ∈ N gilt 0 + n = n.
Beweis durch Induktion über n.
Induktionsanfang n = 0: Wegen Definition 5.3.a) gilt 0 + 0 = 0.
Induktionsschritt: Die Induktionsannahme ist 0+n = n. Wir haben zu zeigen,
dass dann auch 0 + φ(n) = φ(n) gilt.
0 + φ(n) = φ (0 + (φ(n) − 1)) nach Definition 5.3.b)
= φ (0 + n) , denn n ist der Vorgänger von φ(n)
= φ(n) nach Induktionsannahme
Damit ist der Induktionsschritt und nach dem Prinzip der vollständigen
Induktion auch das Lemma bewiesen.
Als nächstes beweisen wir:
Lemma 5.6 Es seien m, n ∈ N. Dann gilt φ(m) + n = φ(m + n).
Beweis durch vollständige Induktion über n.
Induktionsanfang n = 0: Nach zweimaliger Anwendung von Definition 5.3.a)
gilt φ(m) + 0 = φ(m) = φ(m + 0).
Induktionsschritt: Die Induktionsannahme ist φ(m) + n = φ(m + n), und wir
haben zu zeigen, dass φ(m) + φ(n) = φ (m + φ(n)).
Wir nutzen wieder, dass n der Vorgänger von φ(n) ist und erhalten:
φ(m) + φ(n) = φ (φ(m) + n) nach Definition 5.3.b)
= φ (φ(m + n)) nach Induktionsannahme
= φ (m + φ(n)) nach Definition 5.3.b)
Damit sind der Induktionsschritt und wegen des Prinzips der vollständigen
Induktion auch das Lemma bewiesen.
31
Satz 5.7 Es seien m, n ∈ N. Dann gilt m + n = n + m.
Beweis durch vollständige Induktion über m.
Induktionsanfang m = 0: Nach Lemma 5.5 gilt 0 + n = n, und nach Definition 5.3.a) gilt außerdem n = n+0. Damit ist der Induktionsanfang bewiesen.
Induktionsschritt: Die Induktionsannahme ist m + n = n + m. Wir müssen
beweisen, dass φ(m) + n = n + φ(m) folgt. Wir erhalten
φ(m) + n =
=
=
=
φ(m + n) wegen Lemma 5.6
φ(n + m) nach Induktionsannahme
φ (n + (φ(m) − 1)) , da m Vorgänger von φ(m) ist
n + φ(m) nach Definition 5.3
Nach dem Prinzip der Vollständigen Induktion folgt daraus der Satz.
5.1.2
Assoziativität der Addition
Ziel dieses Abschnitts ist ein Beweis von Axiom (N1) (Assoziativität der Addition). Eine Möglichkeit wäre, die Assoziativität der Addition auf die schon bekannte
Assoziativität der Verknüpfung von Abbildungen nach Lemma 3.6 zurückführen.
In der Vorlesung wurde dies versucht, aber wir werden hier im Skript doch einen
Induktionsbeweis führen.
Definition 5.8 Es seien N, 0 ∈ N und φ : N → N wie in Axiom 4.10. Wir
definieren φ0 = IdN und dann rekursiv φn = φ ◦ φn−1 für n ∈ N \ {0}.
Lemma 5.9 Für alle n ∈ N gilt n = φn (0).
Beweis durch vollständige Induktion über n.
Induktionsanfang n = 0: Es ist φ0 = IdN , also φ0 (0) = IdN (0) = 0.
Induktionsschritt: Die Induktionsannahme ist n = φn (0). Wir müssen φ(n) =
φφ(n) (0) zeigen. Da n der Vorgänger von φ(n) ist, erhalten wir
φφ(n) (0) = (φ ◦ φn ) (0) nach Definition 5.8
= φ (φn (0)) nach Definition 3.5
= φ(n) wegen der Induktionsannahme
Wir haben gerade den Induktionsschritt bewiesen, und nach dem Prinzip
der vollständigen Induktion folgt daraus das Lemma.
Lemma 5.10 Für alle m, n ∈ N gilt m + n = (φn ◦ φm ) (0).
32
Beweis durch vollständige Induktion nach n.
Induktionsanfang n = 0: Es ist m + 0 = m nach Definition 5.3, und es ist
φm (0) = m nach Lemma 5.9. Ferner ist φ0 = IdN nach Definition 5.8, also
ist (φ0 ◦ φm ) (0) = φm (0) = m = m + 0.
Induktionsschritt: Die Induktionsannahme
ist m + n = (φn ◦ φm ) (0) und es
ist zu zeigen, dass m + φ(n) = φφ(n) ◦ φm (0) folgt. Es gilt φφ(n) = φ ◦ φn
nach Definition 5.8 und weil n der Vorgänger von φ(n) ist. Also folgt
m + φ(n) =
=
=
=
=
=
φ(m + n) nach Definition 5.3
φ ((φn ◦ φm ) (0)) nach Induktionsannahme
φ (φn (φm (0))) nach Definition 3.5
(φ ◦ φn ) (φm (0)) nach Definition 3.5
φφ(n) (φm (0))
φφ(n) ◦ φm (0) nach Definition 3.5
Damit ist der Induktionsschritt bewiesen.
Nach dem Prinzip der vollständigen Induktion folgt daraus das Lemma.
Bemerkung: In der Vorlesung wurde ein Beweis ohne vollständige Induktion
vorgelegt. Aber dabei wurde eine Aussage verwendet, die zwar wahr ist, die wir
hier aber nicht bewiesen haben. Letztlich ist ein Induktionsbeweis doch einfacher.
Satz 5.11 Für alle `, m, n ∈ N gilt ` + (m + n) = (` + m) + n.
Beweis durch vollständige Induktion nach n.
Induktionsanfang n = 0: Es gelten `+(m+0) = `+m sowie (`+m)+0 = `+m
jeweils nach Definition 5.3.a).
Induktionsschritt: Die Induktionsannahme ist ` + (m + n) = (` + m) + n, und
wir wollen ` + (m + φ(n)) = (` + m) + φ(n) beweisen.
` + (m + φ(n)) =
=
=
=
` + φ(m + n) nach Definition 5.3.b)
φ(` + (m + n)) nach Definition 5.3.b)
φ((` + m) + n) nach Induktionsannahme
(` + m) + φ(n) nach Definition 5.3.b)
Nach dem Prinzip der vollständigen Induktion folgt daraus der Satz.
33
5.2
Multiplikation
Bekanntlich bedeutet das Produkt m · n für m, n ∈ N, dass man m n–mal zur
Null addiert bzw. n m–mal zur Null addiert. Damit erhält man folgende rekursive
Definition der Multiplikation auf N.
Definition 5.12 Es sei n ∈ N. Für beliebige m ∈ N definieren wir
a) m · 0 = 0 (dies ist der Fall n = 0) und
b) m · n = (m · (n − 1)) + m, falls n 6= 0.
Aus der Schule ist die Konvention „Punkt- vor Strichrechnung“ bekannt. Das
heißt, statt (m · (n − 1)) + m kann man einfach m · (n − 1) + m schreiben. Wir
beweisen zunächst Axiom (N6) (Neutralität der Eins).
Lemma 5.13 Für alle m ∈ N gilt: m · 1 = m.
Beweis. Diesmal ist keine vollständige Induktion nötig. Der Vorgänger von 1
ist 0 nach Definition 5.1. Also gilt m · 1 = (m · 0) + m nach Definition 5.12.b),
weiter (m · 0) + m = 0 + m nach Definition 5.12.a), und schließlich 0 + m = m
nach Lemma 5.2.
In der Definition der Multiplikation kann man das Distributivgesetz (Axiom (N7))
bereits erahnen. Nun beweisen wir es.
Satz 5.14 ` · (m + n) = ` · m + ` · n für alle `, m, n ∈ N.
Beweis durch vollständige Induktion über n.
Induktionsanfang n = 0: Die Aussage des Satzes gilt für n = 0, denn
` · (m + 0) = ` · m nach Definition 5.3.a)
= ` · m + 0 nach Definition 5.3.a)
= ` · m + ` · 0 nach Definition 5.12.a).
Induktionsschritt: Die Induktionsannahme ist ` · (m + n) = ` · m + ` · n. Wir
müssen ` · (m + φ(n)) = ` · m + ` · φ(n) beweisen.
` · (m + φ(n)) =
=
=
=
=
=
=
` · (m + (n + 1)) nach Bemerkung 5.4
` · ((m + n) + 1) (Assoziativität der Addition, Satz 5.11)
` · (φ(m + n)) nach Bemerkung 5.4
` · (m + n) + ` nach Definition 5.12.b)
(` · m + ` · n) + ` nach Induktionsannahme
` · m + (` · n + `) (Assoziativität der Addition, Satz 5.11)
` · m + ` · φ (n) nach Definition 5.12.b),
womit der Induktionsschritt und damit auch der Satz bewiesen sind.
34
5.2.1
Kommutativität der Multiplikation
Der Beweis der Kommutativität der Multiplikation (Axiom (N5)) ist etwas aufwändiger. Wie im Fall der Addition beweisen wir zuerst einige Lemmata.
Lemma 5.15 Für alle n ∈ N gilt 0 · n = 0
Beweis durch vollständige Induktion über n.
Induktionsanfang n = 0: Es ist 0 · 0 = 0 nach Definition 5.12.a).
Induktionsschritt: Die Induktionsannahme ist 0·n = 0 für n ∈ N. Wir beweisen
0 · φ(n) = 0:
0 · φ(n) = 0 · n + 0 nach Definition 5.12.b)
= 0 + 0 nach Induktionsannahme
= 0 nach Definition 5.3.a)
Lemma 5.16 Für alle m, n ∈ N gilt (m + 1) · n = m · n + n
Beweis durch vollständige Induktion über n.
Induktionsanfang n = 0: Es gelten (m + 1) · 0 = 0 nach Definition 5.12.a) und
m · 0 + 0 = 0 + 0 = 0 nach Definition 5.12.a) und Definition 5.3.a).
Induktionsschritt: Die Induktionsannahme ist (m + 1) · n = m · n + n und wir
wollen (m + 1) · (n + 1) = m · (n + 1) + (n + 1) beweisen. Wir erhalten
(m + 1) · (n + 1) =
=
=
=
=
=
=
=
(m + 1) · n + (m + 1) nach Definition 5.12.b)
(m · n + n) + (m + 1) nach Induktionsannahme
m · n + (n + (m + 1)) nach Satz 5.11
m · n + ((n + m) + 1) nach Satz 5.11
m · n + ((m + n) + 1) nach Satz 5.7
m · n + (m + (n + 1)) nach Satz 5.11
(m · n + m) + (n + 1) nach Satz 5.11
m · (n + 1) + (n + 1) nach Definition 5.12.b).
Satz 5.17 Für alle m, n ∈ N gilt m · n = n · m.
Beweis durch vollständige Induktion über n.
Den Induktionsanfang für n = 0 haben wir in Lemma 5.15 bewiesen.
Induktionsschritt: Die Induktionsannahme ist m · n = n · m, und wir müssen
m · (n + 1) = (n + 1) · m beweisen. Wir finden:
m · (n + 1) = m · n + m nach Definition 5.12.b)
= n · m + m nach Induktionsannahme
= (n + 1) · m nach Lemma 5.16.
35
5.2.2
Assoziativität der Multiplikation
In diesem Abschnitt schließen wir den Beweis der Axiome (N1)–(N7) ab. Es fehlt
jetzt nur noch Axiom (N4).
Satz 5.18 Für alle `, m, n ∈ N gilt ` · (m · n) = (` · m) · n.
Beweis durch Induktion über n.
Induktionsanfang n = 0: Es gilt ` · (m · 0) = ` · 0 = 0 = (` · m) · 0 durch
mehrfache Anwendung von Definition 5.12.a).
Induktionsschritt: Unsere Induktionsannahme ist ` · (m · n) = (` · m) · n. Zum
Beweis des Induktionsschrittes und damit des Satzes ist ` · (m · (n + 1)) =
(` · m) · (n + 1) zu zeigen.
` · (m · (n + 1)) =
=
=
=
5.3
` · (m · n + m) nach Definition 5.12.b)
` · (m · n) + ` · m nach Satz 5.14
(` · m) · n + ` · m nach Induktionsannahme
(` · m) · (n + 1) nach Definition 5.12.b).
Die Wohlordnung der natürlichen Zahlen
Wir möchten nun die aus der Schule bekannte Ordnung auf den natürlichen
Zahlen definieren und eine wichtige Eigenschaft dieser Ordnung beweisen.
Definition 5.19 Für m, n ∈ N ist m ≤ n („m kleiner oder gleich n“)
⇐⇒ ∃` ∈ N : m + ` = n.
Natürlich wollen wir beweisen:
Satz 5.20 ≤ ist eine Totalordnung auf N.
Dazu brauchen wir allerdings erst wieder Hilfssätze.
Lemma 5.21 Für alle n ∈ N ist φn injektiv.
Beweis durch vollständige Induktion über n.
Induktionsanfang n = 0: φ0 = IdN ist injektiv.
Induktionsschritt: Die Induktionsannahme besagt, dass φn injektiv ist. Nach
Definition 5.8 ist φφ(n) = φ ◦ φn . Wegen der Peano–Axiome 4.10 ist φ injektiv und nach Induktionsannahme ist φn injektiv. Die Verknüpfung zweier
injektiver Abbildungen ist injektiv (leichte Übung).
Lemma 5.22 Es seien `, m, n ∈ N. Wenn m + ` = n + `, dann ist m = n.
36
Beweis. Nach Lemma 5.10 ist m+` = φ` (φm (0)) und n+` = φ` (φn (0)). Nach
Lemma 5.21 ist φ` injektiv. Wenn also m + ` = n + ` = φ` (φm (0)) = φ` (φn (0)),
dann folgt φm (0) = φn (0). Wegen Lemma 5.9 folgt daraus m = n, also die
Behauptung.
Lemma 5.23 Es sei m, n ∈ N. Wenn m + n = 0, dann ist m = n = 0.
Beweis durch Widerspruch. Wir nehmen an, dass n 6= 0. Dann ist 0 = m +
n = φ (m + (n − 1)) nach Definition 5.3.b). Aber 0 ∈
/ Bild(φ) wegen Axiom 4.10.b),
also Widerspruch. Also gilt n = 0, und daraus folgt 0 = m + n = m + 0 = m.
Lemma 5.24 Es sei m, n ∈ N, m ≤ n und m 6= n. Dann ist m + 1 ≤ n.
Beweis. Wegen m ≤ n gibt es ein ` ∈ N mit m + ` = n. Weil m 6= n gilt
` 6= 0. Also hat ` einen Vorgänger, (` − 1) ∈ N. Es ist (` − 1) + 1 = ` nach
Bemerkung 5.4. Mit den schon bewiesenen Rechengesetzen für die Addition folgt
weiter
n =
=
=
=
m+`
m + ((` − 1) + 1)
m + (1 + (` − 1))
(m + 1) + (` − 1)
Also ist m + 1 ≤ n.
Beweis von Satz 5.20. Wir müssen zeigen, dass ≤ reflexiv, transitiv, antisymmetrisch und linear ist.
Reflexivität: Für alle n ∈ N gilt n + 0 = n, also ist n ≤ n.
Transitivität: Es seien k, m, n ∈ N und k ≤ m und m ≤ n. Nach Definition 5.19
gibt es `1 , `2 ∈ N mit k + `1 = m und m + `2 = n. Wegen Assoziativität der
Addition ist n = (k + `1 ) + `2 = k + (`1 + `2 ), also k ≤ n.
Antisymmetrie: Für m, n ∈ N seien m ≤ n und n ≤ m. Es gibt also `1 , `2 ∈ N
mit n = m + `1 und m = n + `2 . Daraus folgt m = m + (`1 + `2 ). Nach
Definition 5.3 ist auch m = m + 0. Also folgt `1 + `2 = 0 aus Lemma 5.22
und `1 = `2 = 0 aus Lemma 5.23. Das bedeutet m = m+0 = m+`1 = n.
Linearität: Es sei n ∈ N. Wir beweisen durch vollständige Induktion über k,
dass ∀k ∈ N : k ≤ n ∨ n ≤ k.
Der Induktionsanfang ist k = 0. Wegen n = 0 + n gilt 0 ≤ n nach Definition 5.19, also insbesondere auch 0 ≤ n ∨ n ≤ 0.
Für den Induktionsschritt haben wir die Induktionsannahme k ≤ n∨n ≤ k.
Wir müssen zeigen, dass k + 1 ≤ n ∨ n ≤ k + 1. Wir unterscheiden die Fälle
n ≤ k und k ≤ n (mindestens einer davon gilt nach Induktionsannahme):
37
a) Wenn n ≤ k, dann gibt es ein ` ∈ N mit n + ` = k. Wegen n + (` + 1) =
(n + `) + 1 = k + 1 folgt n ≤ k + 1.
b) Es sei k ≤ n. Wir haben die Unter-Fälle k = n und k 6= n.
i) Wenn k = n, dann ist n ≤ k wegen der schon gezeigten Reflexivität von ≤. Den Fall n ≤ k haben wir schon behandelt.
ii) Wenn k 6= n, dann folgt mit Lemma 5.24 k + 1 ≤ n.
In jedem Fall folgt k+1 ≤ n∨n ≤ k+1. Nach dem Prinzip der vollständigen
Induktion folgt daraus die Behauptung, also die Linearität von ≤.
Die Totalordnung ≤ auf N hat noch eine weitere sehr nützliche Eigenschaft, die
wir im Rest dieses Abschnitts beweisen wollen: Jede Teilmenge von N hat ein
kleinstes Element. Dies gibt Anlass zu einer weiteren Definition.
Definition 5.25 Es sei X eine Menge und ≤ eine Teilordnung auf X.
a) Ein Element ymin ∈ Y ist ein Minimum einer Teilmenge Y ⊆ X, genau
dann wenn ∀y ∈ Y : ymin ≤ y.
b) Man nennt ≤ eine Wohlordnung, genau dann wenn ≤ eine Totalordnung ist
und zudem jede nicht-leere Teilmenge von X ein Minimum hat.
Beispiel 5.26 Nicht jede (teil-)geordnete Menge hat ein Minimum:
• T = Z hat bezüglich der aus der Schule bekannten Ordnung offenbar kein
Minimum, denn sie ist nach unten unbeschränkt.
• T = { n1 : n ∈ N} ⊆ Q hat kein Minimum — obwohl T nach unten be1
schränkt ist! —, denn n+1
< n1 .
Wenn es ein Minimum gibt, dann ist es nach folgendem Lemma eindeutig.
Lemma 5.27 (und Notation) Es sei X eine Menge mit einer Teilordnung ≤.
Dann hat jede Teilmenge Y ⊂ X höchstens ein Minimum. Wenn Y ein Minimum
hat, notiert man dieses als min(Y ).
Beweis. Es seien y0 , y1 ∈ Y Minima von Y . Dann gilt ∀y ∈ Y : y0 ≤ y, also
auch y0 ≤ y1 , und ebenso ∀y ∈ Y : y1 ≤ y, also auch y1 ≤ y0 . Aus y0 ≤ y1 und
y1 ≤ y0 folgt aber y0 = y1 , denn Teilordnungen sind antisymmetrisch.
Bemerkung 5.28 Das Auswahlaxiom (Abschnitt 3.1.1) ist gleichbedeutend zu
der Aussage, dass es auf jeder Menge eine Wohlordnung gibt. Allerdings wäre
eine solche Wohlordnung auf Q unverträglich mit den Grundrechenarten auf Q.
Satz 5.29 Die Totalordnung ≤ auf N ist eine Wohlordnung.
38
Beweis durch Widerspruch. Wir nehmen an, es gebe eine nicht-leere Teilmenge Y ⊂ N, welche kein Minimum hat. Dann definieren wir
T = {x ∈ N | ∀y ∈ Y : x ≤ y}
Es gilt ∀n ∈ N : 0 ≤ n, also ist 0 ∈ T . Es sei x ∈ T , also ∀y ∈ Y : x ≤ y. Da
nach Voraussetzung Y kein Minimum hat, folgt x ∈
/ Y , also ∀y ∈ Y : x 6= y. Mit
Lemma 5.24 erhalten wir ∀y ∈ Y : x + 1 ≤ y. Also ist φ(x) = x + 1 ∈ T . Dies gilt
für alle x ∈ T , also ist φ(T ) ⊂ T . Nach Axiom 4.10.c) schließen wir T = N.
Wir zeigten soeben: ∀x ∈ N : ∀y ∈ Y : x ≤ y. Es ist aber nach Voraussetzung
Y 6= ∅. Es gibt also ein y0 ∈ Y ⊆ N. Wir setzen x = y0 +1 und y = y0 und erhalten
y0 + 1 ≤ y0 . Nach Definition 5.19 ist aber auch y0 ≤ y0 + 1. Wir wissen bereits,
dass ≤ antisymmetrisch ist. Also folgt y0 = y0 +1. Das steht aber im Widerspruch
zu Lemma 5.2. Also war unsere Annahme falsch: Es gibt keine Teilmenge von N
ohne Minimum und damit ist der Satz bewiesen.
5.4
Die Umkehroperationen
In der Grundschule lernt man nicht nur addieren und multiplizieren, sondern auch
subtrahieren und dividieren (mit Rest). Darum geht es in diesem Abschnitt. Den
Übergang von N auf Z aud Q werden wir allerdings erst später vollziehen.
5.4.1
Subtraktion
Lemma 5.30 (und Definition) Es seien m, n ∈ N und m ≤ n. Dann gibt es
ein eindeutig durch m und n bestimmtes d ∈ N mit m + d = n. Wir nennen d die
Differenz von n und m und bezeichnen sie als n − m.
Beweis. Wegen m ≤ n gibt es nach Definition 5.19 ein d ∈ N mit m + d = n.
Wir zeigen noch, dass es eindeutig bestimmt ist: Wenn e ∈ N mit m + e = n,
dann gilt m + d = m + e; wegen Lemma 5.22 folgt daraus d = e.
Bemerkung 5.31 Es sei n ∈ N, n 6= 0. Dann hat n einen Vorgänger, und dieser
Vorgänger ist die Differenz von n und 1. Unsere Schreibweise „n − 1“ für den
Vorgänger von n war also gerechtfertigt.
Beweis. Übung.
Lemma 5.32 Es sei m, n ∈ N, m ≤ n. Dann gilt n − m ≤ n.
Beweis. Nach Definition 5.30 ist n = m + (n − m), also auch n = (n − m) + m
wegen Kommutativität. Weil m ∈ N ist n − m ≤ n gemäß Definition 5.19.
39
5.4.2
Division mit Rest
Wir schreiben m < n für m, n ∈ N, wenn m ≤ n und zudem m 6= n.
Satz 5.33 (und Definition) Es seien m, n ∈ N, m 6= 0. Dann gibt es eindeutig
bestimmte q, r ∈ N, so dass
n=m·q+r
und r < m. Man bezeichnet n als Dividend, m als Divisor, q als Ganzzahlquotient
und r als Divisionsrest von n und m.
Beweis. Es sei Y = {n − m · q | q ∈ N ∧ m · q ≤ n}. Dies ist eine Teilmenge
von N und ist außerdem nicht leer, denn n ∈ Y (nämlich für q = 0). Daher hat
sie ein Minimum r = min(Y ) nach Satz 5.29.
Nach Definition von r gibt es ein q ∈ N mit r = n − m · q. Nach Definition 5.30
folgt n = m · q + r. Wir nehmen an, r < m sei falsch, und werden daraus einen
Widerspruch herleiten.
r 6< m ist gleichbedeutend mit ¬(r ≤ m) ∨ r = m. Aus r = m folgt m ≤ r,
und wegen Linearität von ≤ folgt m ≤ r auch aus ¬(r ≤ m). Es folgt also m ≤ r,
und damit ist die Differenz r − m definiert. Wir zeigen, dass r − m ∈ Y :
n =
=
=
=
m·q+r
m · q + ((r − m) + m) nach Definition 5.30
(m · q + m) + (r − m) (Rechengesetze für die Addition)
m · (q + 1) + (r − m) nach Definition 5.12
Also ist r − m = n − m · (q + 1) in Y . Es ist aber r − m ≤ r nach Lemma 5.32,
und r − m 6= r, weil m 6= 0. Das ist aber ein Widerspruch zu Lemma 5.27, denn
wir haben ja r = min(Y ) definiert.
Aus diesem Widerspruch folgt r < m. Der Eindeutigkeitsbeweis für q und
r wird zunächst als Übungsaufgabe gestellt; der Beweis wird noch im Skript
erscheinen.
40
6
Abstrakte Algebra
Wir haben die Assoziativität der Addition auf N bewiesen. Aus der Schule ist die
Assoziativität auch für Z bekannt. Ferner gibt es für jedes z ∈ Z ein −z ∈ Z, so
dass z + (−z) = 0. Man findet derartige Rechengesetze auch in vielen anderen
Strukturen: Wie wir gesehen haben, ist etwa die Komposition von Abbildungen
ebenfalls assoziativ. Daher sollte man untersuchen, welche Gemeinsamkeiten all
diese Strukturen haben. Dies ist die Aufgabe der (abstrakten) Algebra.
6.1
Magmen und Monoide
Definition 6.1 Es sei M eine Menge.
a) Eine (innere) Verknüpfung auf M ist eine Abbildung ∗ : M × M → M . Für
x, y ∈ M schreibt man meist x ∗ y statt ∗(x, y).
b) Ein Magma (M, ∗) besteht aus einer Menge M und einer Verknüpfung ∗
auf M . Das Magma heißt kommutativ, falls ∀x, y ∈ M : x ∗ y = y ∗ x. Das
Magma heißt assoziativ, falls ∀x, y, z ∈ M : (x ∗ y) ∗ z = x ∗ (y ∗ z).
Ein assoziatives Magma nennt man auch Halbgruppe.
Beispiel 6.2
a) (N, +) ist ein Magma, nach Satz 5.7 kommutativ und nach Satz 5.11 assoziativ.
b) (N, ·) ist nach Sätzen 5.17 und 5.18 ebenfalls ein kommutatives assoziatives
Magma.
c) (N, −) ist kein Magma, denn m − n ist nicht für alle m, n ∈ N definiert
(d.h. die Differenz liegt nicht immer in N).
d) (Z, −) ist ein Magma, aber nicht kommutativ, denn 3 − 5 6= 5 − 3. Es ist
auch nicht assoziativ, denn (1 − 2) − 3 = −4, aber 1 − (2 − 3) = 2.
e) Es sei X eine Menge. Dann ist (Abb(X, X), ◦) ein Magma (die Verknüpfung
zweier Abbildungen von X nach X ist wieder eine Abbildung von X nach
X). Es ist assoziativ wegen Lemma 3.6.
Bemerkung 6.3 (zum Assoziativgesetz) Wenn man in einem Magma rechnet, muss man im Allgemeinen Klammern setzen, da x∗(y∗z) 6= (x∗y)∗z. In einem
assoziativen Magma hingegen hängt das Ergebnis einer Kette von Verknüpfungen
nicht von den gesetzten Klammern ab, weshalb man sie meist weglässt.
Man beachte aber, dass die „Kosten“ einer Rechnung in manchen Anwendungen sehr wohl von der Klammerung abhängen.
41
Definition 6.4 Ein Magma (M, ∗) heißt linkskürzbar, genau dann wenn ∀a, x, y ∈
M : a ∗ x = a ∗ y ⇒ x = y. Es heißt rechtskürzbar, genau dann wenn ∀a, x, y ∈
M : x ∗ a = y ∗ a ⇒ x = y. Es heißt kürzbar, genau dann wenn es sowohl linksals auch rechtskürzbar ist.
Beispiel 6.5
a) (N, +) ist kürzbar, wie in Lemma 5.22 bewiesen.
b) (Z \ {0}, ·) ist kürzbar, (Z, ·) hingegen nicht.
c) (Abb({1, 2}, {1, 2}), ◦) ist weder rechts- noch linkskürzbar. Für a : {1, 2} →
{1, 2} mit a(1) = a(2) = 1 und x = Id{1,2} gilt nämlich a = x ◦ a = a ◦ a =
a ◦ x, aber a 6= x.
Definition 6.6 Ein Monoid (M, ∗, e) besteht aus einem assoziativen Magma
(M, ∗) zusammen mit e ∈ M , so dass e ∗ x = x ∗ e = x für alle x ∈ M . Das
Element e heißt neutrales Element des Monoids.
Manchmal ist aus dem Kontext klar, welche Verknüpfung gemeint ist und was
das neutrale Element ist. Man würde dann einfach sagen, dass M ein Monoid ist,
und man würde unter Umständen sogar einfach xy statt x ∗ y schreiben.
Beispiel 6.7
a) (N, +, 0) ist ein (kommutatives) Monoid, ebenso (N, ·, 1).
b) Für eine Menge X ist (Abb(X, X), ◦, IdX ) ein Monoid.
Definition 6.8 Es sei (M, ∗, e) ein Monoid und x ∈ M . Ähnlich wie in Definition 5.8 definieren wir rekursiv x0 = e und xn+1 = xn ∗ x für n ∈ N.
Bemerkung Wenn wir das Monoid (R, ·, 1) betrachten, dann ist xn für x ∈ R
und n ∈ N genau das, was man in der Schule als n-te Potenz von x kennen gelernt
hat, nämlich das n-fache Produkt von x mit sich selbst. Wenn wir hingegen das
Monoid (N, +, 0) betrachten, dann ist xn = n · x für x, n ∈ N, wie man durch
Vergleich der rekursiven Definitionen 5.12 und 6.8 erkennt.
Lemma 6.9 Es sei (M, ∗, e) ein Monoid, x ∈ M und m, n ∈ N. Dann gelten
a) xm+n = xm ∗ xn und
b) (xm )n = xm·n .
42
Beweis.
a) Der Beweis erfolgt durch vollständige Induktion über n. Für n = 0 gilt
xm+0 = xm , aber auch
xm ∗ x0 = xm ∗ e nach Definition 6.8 und
= xm denn e ist neutrales Element.
Für den Induktionsschritt nehmen wir an, xm+n = xm ∗ xn sei bewiesen,
und wir zeigen
xm+n+1 = xm+n ∗ x1 = xm+n ∗ x0 ∗ x = xm+n ∗ (e ∗ x) nach Definition 6.8
=
=
=
=
xm+n ∗ x denn e ist neutrales Element
(xm ∗ xn ) ∗ x nach Induktionsannahme
xm ∗ (xn ∗ x) denn Monoide sind assoziativ
xm ∗ xn+1 nach Definition 6.8
Daraus folgt Aussage a).
b) Übung.
6.2
Gruppen
Eine Gruppe ist ein Monoid, in dem jedes Element „invertierbar“ im Sinne folgender Definition ist.
Definition 6.10 Ein Monoid (G, ∗, e) ist eine Gruppe, genau dann wenn es zu
jedem x ∈ G ein x0 ∈ G gibt mit x ∗ x0 = e = x0 ∗ x. Die Mächtigkeit von G (im
Fall einer endlichen Menge also die Anzahl der Elemente) bezeichnet man als die
Ordnung der Gruppe.
Wir stellen zunächst einige wichtige Beispiele von Gruppen vor.
6.2.1
Symmetriegruppen
Es sei K ein geometrischer Körper, zum Beispiel ein Würfel. Eine Symmetrie ist
eine Bewegung (Rotation, Spiegelung etc.), die K auf sich selbst abbildet. „Nichts
tun“ bildet K auf sich ab, ist also eine Symmetrie — das neutrale Element. Wenn
man zwei Symmetrien hintereinandersetzt, erhält man wieder eine Symmetrie —
die innere Verknüpfung. Jede Bewegung kann man umkehren, und wenn man erst
eine Bewegung und dann die umgekehrte Bewegung durchführt, ist das Resultat
genau so wie „nichts tun“ — dies entspricht x0 ∗ x = e.
43
Das reguläre n-Eck Pn hat Rotations- und Achsensymmetrien. Die Menge der
Symmetrien von Pn heißt die Diedergruppe Dn . Man kann zeigen, dass Dn immer
2n Elemente hat. Beispiel: Achsensymmetrien des Dreiecks und des Quadrats:
B
A
B
C
A
6.2.2
D
C
Symmetrische Gruppen
Sei Ω eine Menge. Eine Bijektion σ : Ω → Ω nennt man eine Permutation von Ω.
Sind σ, τ zwei Permutationen von Ω, dann ist auch τ ◦σ eine Bijektion Ω → Ω, also
eine Permutation. Auch IdΩ ist eine Permutation. Für jede Permutation τ ist auch
die Umkehrabbildung τ −1 : Ω → Ω eine Permutation, und τ ◦τ −1 = τ −1 ◦τ = IdΩ .
Wir setzen Sym(Ω) := die Menge aller Permutationen von Ω. Man nennt
Sym(Ω) die symmetrische Gruppe auf Ω. Im wichtigen Fall Ω = {1, 2, . . . , n} setzen wir Sn := Sym({1, 2, . . . , n}). Es gibt verschiedene Wege, um Permutationen
σ ∈ Sn hinzuschreiben. Ein Weg ist
!
1
2
3
...
n
σ=
.
σ(1) σ(2) σ(3) . . . σ(n)
!
1 2 3
So ist etwa σ =
die Permutation von {1, 2, 3} mit σ(1) = 3, σ(2) = 2
3 2 1
und σ(3) = 1.
!
1 2 3
Sei τ =
, ein weiteres Element von S3 . Dann σ ◦ τ 6= τ ◦ σ, denn
2 1 3
!
!
1 2 3
σ◦τ =
2 3 1
6.2.3
1 2 3
τ ◦σ =
.
3 1 2
Anwendungen und einfache Eigenschaften von Gruppen
Eine kommutative Gruppe nennt man auch abelsch.Die Bezeichnung „abelsch“
wird zu Ehren von Niels Henrik Abel [1802–1829] verwendet. Er war zusammen mit Évariste Galois [1811–1832] einer der Begründer der Gruppentheorie,
wobei Permutationen auch vorher schon studiert wurden. Definition 6.10 mag
unscheinbar wirken, aber die Bedeutung von Gruppen für die Mathematik und
die Naturwissenschaften ist kaum zu überschätzen:
• Abel bewies mittels Gruppen, dass es keine „Lösungsformel“ für allgemeine
Gleichungen 5-ten Grades gibt. Diesen Ansatz verallgemeinerte Galois.
44
• Man kann Geometrie auf Grundlage der Gruppentheorie betreiben, denn
die längenerhaltenden Abbildungen bilden eine Gruppe. Diese Sichtweise
geht auf Felix Klein [1849–1925] und Sophus Lie [1842–1899] zurück.
• In der Festkörperphysik treten „kristallographische Gruppen“ als Symmetrien von Kristallen auf. Sie wurden um 1890 herum unabhängig von Arthur
Schoenflies [1853–1928], Jewgraf Stepanowitsch Fjodorow [1853–1919] und
William Barlow [1845–1934] klassifiziert.
• Erhaltungsgrößen (z.B. Energie, Drehimpuls, Impuls) entsprechen nach dem
Noether–Theorem Symmetrien physikalischer Gleichungen (Zeitinvarianz,
Rotationssymmetrie, Translationssymmetrie). Emmy Noether [1882–1935]
war die erste (allerdings nicht beamtete) Professorin in Deutschland.
• Die Grundgleichungen des Elektromagnetismus (Maxwell–Gleichungen) sowie der speziellen Relativitätstheorie sind invariant unter den „Lorentz–
Transformationen“ und diese bilden eine Gruppe, benannt nach Hendrik
Antoon Lorentz [1853–1928].
• Weite Teile der Quantenmechanik lassen sich durch die Untersuchung von
Gruppen verstehen. Elementarteilchen etwa lassen sich als so genannte irreduzible Darstellungen von Symmetriegruppen der zugrunde liegenden Feldgleichungen beschreiben. So kamen Marray Gell–Mann [*1929] und George
Zweig [*1937] 1964 auf das Quark–Modell.
• Die „Klassifikation endlicher einfacher Gruppen“ darf als eine der bedeutendsten wissenschaftlichen Gemeinschaftsleistungen des 20. und beginnenden 21. Jahrhunderts gelten. Über 100 Mathematiker trugen in über 500
Fachartikeln von insgesamt rund 15000 Seiten über einen Zeitraum von
mehr als 80 Jahren dazu bei.
Lemma 6.11 (und Definition) Sei G eine Gruppe.
a) Das neutrale Element e ist eindeutig.
b) Für jedes x ∈ G ist x0 ∈ G (wie in Definition 6.10) eindeutig. Daher schreiben wir ab jetzt x−1 statt x0 . Man nennt x−1 das zu x inverse Element.13
c) G ist ein kürzbares Magma.
d) Es ist (x ∗ y)−1 = y −1 ∗ x−1 für alle x, y ∈ G.
e) Für jedes x ∈ G gilt (x−1 )−1 = x.
f) Es ist e−1 = e.
13
Man findet für das zu x inverse Element manchmal auch die Notation x.
45
Beweise.
a): Sind e1 , e2 zwei neutrale Elemente, so muss e1 ∗ e2 = e1 gelten (da e2 neutral)
und gleichzeitig e1 ∗ e2 = e2 (da e1 neutral). Also e1 = e2 .
b): Sind a, b beide zu x invers, so ist a ∗ x = x ∗ b = e. Also
a = a ∗ e = a ∗ (x ∗ b) = (a ∗ x) ∗ b = e ∗ b = b .
c): Sei a, x, y ∈ G. Aus a ∗ x = a ∗ y folgt a−1 ∗ (a ∗ x) = a−1 ∗ (a ∗ y). Es ist aber
a−1 ∗ (a ∗ x) = (a−1 ∗ a) ∗ x = e ∗ x = x und analog a−1 ∗ (a ∗ y) = y. Wenn also
a ∗ x = a ∗ y, dann folgt x = y. Damit ist die Linkskürzbarkeit bewiesen und der
Beweis für Rechtskürzbarkeit ist analog.
d): Nach c) reicht es zu zeigen: (x ∗ y) ∗ (y −1 ∗ x−1 ) = e.
(x ∗ y) ∗ (y −1 ∗ x−1 ) = ((x ∗ y) ∗ y −1 ) ∗ x−1
= (x ∗ (y ∗ y −1 )) ∗ x−1 = (x ∗ e) ∗ x−1 = x ∗ x−1 = e .
e): Folgt aus c), denn x−1 ∗ (x−1 )−1 = e = x−1 ∗ x.
f): Folgt aus c), denn e ∗ e = e.
Beispiel 6.12 Sind G1 , G2 , . . . , Gn Gruppen, so definiert man die Produktgruppe
Qn
i=1 Gi = G1 × G2 × · · · × Gn durch
(g1 , g2 , . . . , gn ) ∗ (h1 , h2 , . . . , hn ) = (g1 ∗ h1 , g2 ∗ h2 , . . . , gn ∗ hn ) .
Nachweis der Gruppeneigenschaft: Siehe Übung.
6.2.4
Untergruppen
Definition 6.13 Sei G eine Gruppe und H ⊆ G eine Teilmenge. Man nennt
H eine Untergruppe von G falls e ∈ H und für alle h, k ∈ H ist hk ∈ H und
h−1 ∈ H. Anders gesagt: H ist selbst eine Gruppe bzgl. der Gruppenoperation
auf G. Bezeichnung: H ≤ G.
(
×
Beispiele {+1, −1} ≤ R ; Z ≤ Q;
!)
1 2 3
Id,
2 1 3
≤ S3 . Für jede Gruppe
G ist {e} ≤ G und G ≤ G.
Lemma 6.14 (und Definition) Sei G eine Gruppe und X ⊆ G. Dann
a) hXi := {exn1 1 xn2 2 · · · xnr r | r ≥ 0, xi ∈ X oder x−1
i ∈ X, ni ∈ N} ist eine Untergruppe von G.
b) hXi ist die kleinste Untergruppe von G, die X enthält. Das heißt, für H ≤ G
gilt: X ⊆ H ⇔ hXi ≤ H.
46
Beweis.
a): Der Fall r = 0 zeigt e ∈ hXi. Sind g, h ∈ hXi dann haben g, h Darstellungen g = exn1 1 xn2 2 · · · xnr r und h = ey1m1 y2m2 · · · ysms , jeweils mit xi ∈ X oder
−1
x−1
i ∈ X für i = 1, ..., r bzw. yj ∈ X oder yj ∈ X, für j = 1, ..., s. Also
gh = exn1 1 xn2 2 · · · xnr r ey1m1 y2m2 · · · ysms
= exn1 1 xn2 2 · · · xnr r y1m1 y2m2 · · · ysms ∈ hXi und
g −1 = x−1
r
nr = e x−1
r
x−1
r−1
nr nr−1
x−1
r−1
· · · x−1
1
nr−1
n1
· · · x−1
1
e−1
n1
∈ hXi .
−1
= xi für i = 1, ..., r, wegen LemFür das Inverse nutzen wir, dass x−1
i
ma 6.11.e), d.h. die angegebene Darstellung von g −1 ist ein Produkt von Potenzen von Elementen, die selbst in X liegen oder deren Inverse in X liegen, wie
verlangt.
b): Es ist X ⊆ hXi (Fall r = n1 = 1). Es bleibt zu zeigen: Ist H eine
Untergruppe von G mit X ⊆ H, dann ist auch hXi ⊆ H. Sei x ∈ X ⊆ H. Da H
eine (Unter-)Gruppe ist, liegen auch alle Potenzen xn in H, für alle n ∈ N. Mit
x ∈ X ⊂ H liegt auch das Inverse x−1 in H. Auch Produkte von Elementen von
H liegen wieder in H. Folglich (Induktion über r) liegen alle Ausdrücke der Form
exn1 1 xn2 2 · · · xnr r in H, wobei ni ∈ N und xi ∈ X oder x−1
i ∈ X für i = 1, ..., r. Also
hXi ⊆ H.
Notation 6.15 Sei G eine Gruppe und X ⊆ G eine Teilmenge. Wir nennen
hXi die von X erzeugte Untergruppe von G. Ist hXi = G, so nennen wir X ein
Erzeugendensystem von G. Ist X = {g1 , . . . , gn }, so schreiben wir hg1 , . . . , gn i
für hXi. Gibt es g ∈ G mit G = hgi, so heißt G zyklisch mit Erzeuger g. Wir
haben zwar Z immer noch nicht offiziell kennen gelernt, aber wir definieren schon
n
x−n = (x−1 ) , für x ∈ G und n ∈ N.
◦
Beispiel 6.16 (Z, +, 0) ist zyklisch mit Erzeuger 1.*Eine Drehung
durch 90
!
!+und
1 2 3
1 2 3
eine beliebige Spiegelung erzeugen D4 . Es ist S3 =
,
.
2 3 1
2 1 3
Lemma 6.17 Ist G = hgi zyklisch, dann ist G abelsch und G = {g n | n ∈ Z}.
Beweis. 2. Aussage folgt aus Konstruktion von hXi; 1. folgt aus 2.
Beispiele S3 und D4 sind nichtabelsch, also nicht zyklisch. D2 (das ist die
Symmetriegruppe des Rechtecks) ist abelsch aber nicht zyklisch.
◦
Für n ≥ 1 sei ρn : R2 → R2 die Drehung durch 360
gegen dem Uhrzeigersinn
n
r
um den Ursprung. Dann ist Cn := {ρn | r ∈ Z} eine abelsche Gruppe, und es ist
Cn = hρn i
Cn = {Id, ρn , ρ2n , . . . , ρnn−1 } ,
also |Cn | = n. Für jedes n ≥ 1 gibt es also eine zyklische Gruppe mit Ordnung n.
47
6.2.5
Der Satz von Lagrange
Beispiel Die Diedergruppe D3 ist {Id, ρ, ρ2 , σA , σB , σC }, mit ρ = Drehung
durch 120◦ gegen Uhrzeigersinn, und σA = Spiegelung in der Seitenhalbierenden
durch A, usw.
B
C
A
Hier sind alle Untergruppen von D3 :
{Id}
hσB i = {Id, σB }
hρi = {Id, ρ, ρ2 }
hσC i = {Id, σC }
hσA i = {Id, σA }
D3 = {Id, ρ, ρ2 , σA , σB , σC }
Es gibt keine weiteren, im wesentlichen weil jede zyklische Gruppe hgi in dieser
Liste auftaucht, und – wie man nachrechnen kann – hρ, σA i = hσA , σB i = D3 ist.
Diese sechs Untergruppen haben Ordnungen 1, 3, 2, 2, 2 bzw. 6. Somit ist für
jede Untergruppe H ≤ D3 die Gruppenordnung |H| ein Teiler der Gruppenordnung |D3 | = 6. Nach dem Satz von Lagrange14 ist dies kein Zufall.
Satz (Lagrange) Sei G eine endliche Gruppe und H ≤ G eine Untergruppe.
Dann ist |G| durch |H| teilbar.
Beispiel Nachweis mittels Lagrange, dass ρ4 und eine beliebige Spiegelung D4
erzeugen.
Beweis. Wir definieren die Relation ∼ auf G durch g ∼ g 0 genau dann, wenn
es h ∈ H gibt mit g 0 = gh. Diese Relation ist reflexiv (h = 1), symmetrisch
(g = g 0 h−1 ) und transitiv (ist auch g 00 = g 0 h0 , dann g 00 = g · hh0 und hh0 ∈ H),
also ist ∼ eine Äquivalenzrelation.
Für g ∈ G ist die Äquivalenzklasse [g] also gegeben durch [g] = {gh | h ∈ H}.
Ferner gilt gh = gh0 genau dann, wenn h = h0 ist. Daher ist H → [g], h 7→ gh
eine Bijektion, folglich |[g]| = |H|.
Also: G ist die disjunkte Vereinigung aller Äquivalenzklassen, und jede Äquivalenzklasse hat |H| Elemente. Daher gilt
|G| = (Anzahl der Äquivalenzklassen) · |H| .
Insbesondere ist |G| durch |H| teilbar.
14
Joseph–Louis Lagrange [1736–1813] verstarb vor der Axiomatisierung der Gruppentheorie.
48
Beispiel Sei H eine Untergruppe des S4 . Lagrange: Wegen |S4 | = 24 ist |H| ∈
{1, 2, 3, 4,*6, 8, 12, 24}. Man
kann nachweisen,
dass jede Ordnung vorkommt: so
!
!+
1 2 3 4
1 2 3 4
hat etwa
,
die Ordnung 8.
2 3 4 1
4 3 2 1
Beispiel Es ist |S5 | = 5! = 120. Natürlich ist 120 durch 15 teilbar, trotzdem
kann man zeigen, dass S5 keine Untergruppe der Ordnung 15 hat.
6.2.6
Die Ordnung eines Elements
Definition 6.18 Sei G eine Gruppe und g ∈ G. Die Ordnung ord(g) des Elements g ist die Ordnung der zyklischen Untergruppe hgi: ord(g) := |hgi|.
!
Beispiel
1 2 3
hat Ordnung 3, denn
2 3 1
*
!+
1 2 3
2 3 1
(
!
!)
1 2 3
1 2 3
= Id,
,
2 3 1
3 1 2
.
Lemma 6.19 Sei G eine endliche Gruppe.
a) Ist g ∈ G und ord(g) = n, dann n | |G| und hgi = {e, g, g 2 , . . . , g n−1 }.
b) G zyklisch ⇔ es gibt g ∈ G gibt mit ord(g) = |G|.
c) Ist p eine Primzahl, so ist jede Gruppe der Ordnung p zyklisch.
Beweis. a): Lagrange: n | |G|. Sei r ≥ 1 die kleinste Zahl derart, dass die
Liste e, g, g 2 , . . . , g r eine Wiederholung enthält. Dann g r = g s für ein 0 ≤ s < r,
also g r−s = e, daher wegen Minimalität ist s = 0, und g r = e ist die erste
Wiederholung. Nach Lemma 6.17 ist hgi = {e, g, . . . , g r−1 }, denn zu jedem m ∈ Z
gibt es i ∈ Z und j ∈ {0, . . . , r − 1} mit m = ir + j, also g m = g j . Daher r = n.
b): Definition von „zyklisch“.
c): Sei |G| = p und g ∈ G mit g 6= e. Nach a) ist ord(g) ∈ {1, p}, und
ord(g) 6= 1 wegen g 6= e. Also ord(g) = p und G = hgi.
6.2.7
Gruppenhomomorphismen
Definition 6.20 Seien G, H Gruppen. Eine Abbildung f : G → H heißt ein
Homomorphismus, falls f (x ∗ y) = f (x) ∗ f (y) gilt für alle x, y ∈ G.
Bemerkung Übungsserie: Dann auch f (eG ) = eH und f (x−1 ) = f (x)−1 .
Beispiele f : Z → Z, f (n) = 2n, ist ein Homomorphismus der additiven Gruppe (Z, +, 0): f (−n) = 2 · (−n) = −f (n) und f (m + n) = 2(m + n) = 2m + 2n =
f (m) + f (n). Später lernen wir das Vorzeichen einer Permutation kennen: ein
Homomorphimus ε : Sn → {+1, −1}.
49
Definition 6.21 Es sei G eine Gruppe. Eine Untergruppe H ≤ G heißt normale
Untergruppe bzw. Normalteiler, genau dann wenn ∀g ∈ G, ∀h ∈ H : g ∗ h ∗ g −1 ∈
H. In Zeichen: H E G.
Es ist stets {eG } E G und G E G. Wenn G außer diesen keine weiteren
Normalteiler besitzt, nennt man G eine einfache Gruppe.
Lemma 6.22 (und Definition) Sei f : G → H ein Gruppenhomomorphismus.
Wir definieren Kern(f ) := {g ∈ G | f (g) = eH }. Es ist Bild(f ) ≤ H und
Kern(f ) E G.
Beweis. Wegen f (g1 ) ∗ f (g2 ) = f (g1 ∗ g2 ), eH = f (eG ) und f (g)−1 = f (g −1 )
ist Bild(f ) ≤ H. Wegen f (eG ) = eH ist eG ∈ Kern(f ). Sind g, g 0 ∈ Kern(f ),
dann f (g ∗ g 0 ) = f (g) ∗ f (g 0 ) = eH ∗ eH = eH , also g ∗ g 0 ∈ Kern(f ); und
−1
f (g −1 ) = f (g)−1 = e−1
∈ Kern(f ), und Kern(f ) ≤ G. Es ist sogar
H = eH , also g
−1
Kern(g) E G, denn f (g ∗ k ∗ g ) = f (g) ∗ f (k) ∗ f (g −1 ) = f (g) ∗ eH ∗ f (g)−1 = eH .
Es gilt übrigens auch eine Umkehrung des obigen Lemmas: Wenn K E G eine
normale Untergruppe ist, dann gibt es eine Gruppe H und einen Gruppenhomomorphismus f : G → H mit Kern(f ) = K.
Definition 6.23 Ein bijektiver Homomorphismus heißt ein Isomorphismus. Gibt
es einen Isomorphismus f : G → H, so heißen G und H isomorph, Bezeichnung
G∼
= H.
Beispiel S3 und D3 sind isomorph: indem man bei einer Symmetrie des Dreiecks nur die Auswirkung auf den drei Ecken betrachtet, erhält man eine Abbildung D3 → S3 , die ein bijektiver Homomorphismus ist.
Lemma 6.24 Ist f : G → H ein Isomorphismus, dann ist auch f −1 : H → G
ein Isomorphismus.
Beweis. Seien h1 , h2 ∈ H. Da f bijektiv ist, gibt es g1 , g2 ∈ G mit f (gi ) = hi ,
also f −1 (hi ) = gi . Nun, f (g1 g2 ) = f (g1 )f (g2 ) = h1 h2 , also f −1 (h1 h2 ) = g1 g2 =
f −1 (h1 )f −1 (h2 ). Also ist f −1 ein Isomorphismus.
Bemerkung Zwei Gruppen sind isomorph, wenn Sie – abgesehen davon, dass
die Elemente anders heißen – gleich sind. Insbesondere haben isomorphe Gruppen
die gleiche Ordnung.
50
7
Ringe und Körper
Viele wichtige algebraische Strukturen — etwa Z, Q, R und viele aus der Schule
möglicherweise nicht bekannte Strukturen, wie die komplexen Zahlen C, Polynome und quadratische Matrizen — haben nicht nur eine einzelne innere Verknüpfung (wie eine Gruppe), sondern zwei, die durch das Distributivgesetz miteinander
verbunden sind. Derartige Strukturen sind der Gegenstand dieses Kapitels.
Definition 7.1 Ein Ring (R, +, ·, 0) (meist sagt man kurz: Ein Ring R) besteht
aus einer Menge R zusammen mit zwei inneren Verknüpfungen + und · auf R
und einem Element 0 ∈ R, so dass gilt:
(R1) (R, +, 0) ist eine abelsche Gruppe.
(R2) (R, ·) ist ein assoziatives Magma (d.h. eine Halbgruppe).
(R3) Distributivgesetze: Für alle x, y, z ∈ R gelten x · (y + z) = x · y + x · z und
(x + y) · z = x · z + y · z.
Wenn es ein 1 ∈ R gibt, so dass (R, ·, 1) ein Monoid ist, so heißt (R, +, ·, 0, 1)
(oder kurz R) ein unitärer Ring. Ist (R, ·) ein kommutatives Magma, so heißt der
Ring kommutativ.
Notation 7.2 Es sei R ein Ring und x ∈ R. Das Inverse von x bezüglich + (das
„additive Inverse“) notiert man als −x.
Definition 7.3 Ein unitärer Ring (R, +, ·, 0, 1) heißt Körper, falls (R \ {0}, ·, 1)
eine abelsche Gruppe ist.
Beispiel 7.4
a) Aus der Schule sind der unitären Ringe Z, Q und R bekannt.
b) Q und R sind Körper.
c) ({0}, +, ·, 0, 0) mit 0 + 0 = 0 und 0 · 0 = 0 ist ein unitärer Ring. Hier gilt
also 0 = 1. Man nennt diesen Ring den trivialen Ring oder Nullring.
Bemerkung 7.5 Wenn R ein Ring ist und (R \ {0}, ·, 1) lediglich eine Gruppe, aber nicht unbedingt kommutativ ist, heißt R Schiefkörper. Nach dem Satz
von Wedderburn15 von 1905 ist jeder endliche Schiefkörper ein Körper. Es gibt
allerdings unendliche Schiefkörper, die kein Körper sind, z.B. die „Quaternionen“.
15
Joseph Wedderburn [1882–1948]
51
Lemma 7.6 Es sei (R, +, ·, 0) ein Ring. Dann gilt für alle x, y ∈ R:
a) 0 · x = x · 0 = 0.
b) −(x · y) = (−x) · y = x · (−y).
Beweis.
a) Da (R, +, 0) eine Gruppe ist, gilt 0 + 0 = 0 und auch 0 · x + 0 = 0 · x. Also
ist 0 · x + 0 = 0 · x = (0 + 0) · x = 0 · x + 0 · x nach dem Distributivgesetz.
Gruppen sind aber nach Lemma 6.11.c (links-)kürzbar. Also folgt 0 · x = 0.
Entsprechend beweist man x · 0 = 0.
b) Wir finden
(x · y) + ((−x) · y) = (x + (−x)) · y (Distributivgesetz)
= 0 · y nach Definition des additiven Inversen
= 0 nach a).
Es ist also ((−x) · y) das additive Inverse von x · y. Analog zeigt man auch,
dass auch x · (−y) das additive Inverse von x · y ist.
Wie man es für ganze Zahlen aus der Schule kennt, definieren wir allgemeiner:
Definition 7.7 Es sei R ein kommutativer Ring und f, g ∈ R. Es teilt f g (in
Zeichen: f |g), genau dann wenn es ein h ∈ R gibt mit g = f · h.
Bemerkung 7.8 Es kommt sehr darauf an, welchen Ring wir betrachten. Es sei
etwa f = 5 und g = 3. Zwar teilt f nicht g in R = Z, aber f |g in R = Q, denn
mit h = 35 ∈ Q folgt f · h = g.
7.1
Die ganzen Zahlen
Auf N haben wir zwei innere Verknüpfungen + und ·, so dass (N, ·) und (N, +)
jeweils kommutative Halbgruppen sind und zudem das Distributivgesetz gilt.
Eine solche Struktur nennt man einen kommutativen Halbring. Darüber hinaus
ist (N, +, 0) ein kürzbares Monoid.
In der Schule kam man von N auf Z durch Hinzunahme von Differenzen: Für
m, n ∈ N ist m − n auch dann eine ganze Zahl, wenn m < n. Dabei ist allerdings
zu beachten, dass man die gleiche Differenz auch für andere Zahlen m̃, ñ ∈ N
erhalten kann: Es sollte m − n = m̃ − ñ sein, genau dann wenn m + ñ = m̃ + n.
Die Gleichheit von Differenzen lässt sich durch die folgende Äquivalenzrelation
auf beliebige kommutative kürzbare Monoide verallgemeinern.
52
Lemma 7.9 (und Definition) Es sei (H, +) ein assoziatives kommutatives kürzbares Magma. Auf H × H definieren wir eine Relation ∼ durch
(x1 , y1 ) ∼ (x2 , y2 ) ⇐⇒ x1 + y2 = x2 + y1
für alle (x1 , y1 ), (x2 , y2 ) ∈ H × H. Dann ist ∼ eine Äquivalenzrelation. Wir definieren R(H) = (H × H) / ∼.
Beweis.
Reflexivität ∀(x, y) ∈ H : x + y = x + y, also (x, y) ∼ (x, y).
Symmetrie Seien (x1 , y1 ), (x2 , y2 ) ∈ H × H und (x1 , y1 ) ∼ (x2 , y2 ). Dann ist
x1 + y2 = x2 + y1 , also auch x2 + y1 = xy + y2 , das heißt (x2 , y2 ) ∼ (x1 , y1 ).
Transitivität Seien (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) ∈ H × H, (x1 , y1 ) ∼ (x2 , y2 ) und
(x2 , y1 ) ∼ (x3 , y3 ). Also x1 + y2 = x2 + y1 und x2 + y3 = x3 + y2 . Durch
Addition der Gleichungen folgt mit Assoziativität, Kommutativität und
Kürzbarkeit von (H, +):
⇒
(x1 + y2 ) + (x2 + y3 ) = (x2 + y1 ) + (x3 + y2 )
(x2 + y2 ) + (x1 + y3 ) = (x2 + y2 ) + (x3 + y1 )
⇒
x1 + y3 = x3 + y1
und daher (x1 , y1 ) ∼ (x3 , y3 ).
Lemma 7.10 Es sei (H, +, 0) ein kommutatives kürzbares Monoid und ∼ und
R(H) wie in Lemma 7.9.16 Die Abbildung ι : H → R(H) gegeben durch ι(x) =
[(x, 0)] ist injektiv.
Beweis. Es seien x, y ∈ H mit ι(x) = ι(y), also [(x, 0)] = [(y, 0)]. Nach
Lemma 3.19 ist dies gleichbedeutend mit (x, 0) ∼ (y, 0), also x + 0 = y + 0. Da 0
neutrales Element für + ist, folgt x = y. Also ist ι injektiv.
Wie erwähnt entspricht [(x1 , y1 )] der Differenz x1 − y1 . Nach dem, was man
in der Schule gelernt hat, kann man Differenzen natürlicher Zahlen addieren
(x1 − y1 ) + (x2 − y2 ) = (x1 + x2 ) − (y1 + y2 )
und „Ausmultiplizieren“
(x1 − y1 ) · (x2 − y2 ) = (x1 · x2 + y1 · y2 ) − (x1 · y2 + x2 · y1 ) .
Nach folgendem Satz, den wir hier allerdings nicht vollständig beweisen, kann
man diese Rechenregeln verallgemeinern.
16
Das geht, denn (H, +) ist ja insbesondere ein assoziatives kommutatives kürzbares Magma.
53
Satz 7.11 (und Definition)
Es sei (H, +, 0) ein kommutatives kürzbares Monoid und (H, ·) ein assoziatives
Magma, so dass das Distributivgesetz gilt, also ∀x, y, z ∈ H : x · (y + z) = (x · y) +
(x · z) und ∀x, y, z ∈ H : (x + y) · z = (x · z) + (y · z). Dann sind auf R(H) zwei
innere Verknüpfungen + und · definiert durch
[(x1 , y1 )] + [(x2 , y2 )] = [(x1 + x2 , y1 + y2 )]
und
[(x1 , y1 )] · [(x2 , y2 )] = [(x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 )] ,
durch die (R(H), +, ·, [(0, 0)]) zu einem Ring wird. Dieser Ring ist kommutativ, wenn (H, ·) kommutativ ist. Wenn (H, ·, 1) zudem ein Monoid ist, dann ist
(R(H), +, ·, [(0, 0)] , [(1, 0)]) ein unitärer Ring.
Korollar 7.12 (und Definition) Z = R(N) mit Addition und Multiplikation
wie in Satz 7.11 ist ein kommutativer unitärer Ring, den man den Ring der
ganzen Zahlen nennt.
Hier einige Anmerkungen zum Beweis von Satz 7.11: Als erstes ist zu beweisen,
dass die Verknüpfungen + und · auf R(H) „wohldefiniert“ sind: Wenn (x1 , y1 ) ∼
(x̃1 , ỹ1 ) und (x2 , y2 ) ∼ (x̃2 , ỹ2 ), dann folgen
(x1 + x2 , y1 + y2 ) ∼ (x̃1 + x̃2 , ỹ1 + ỹ2 )
und
(x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 ) ∼ (x̃1 · x̃2 + ỹ1 · ỹ2 , x̃1 · ỹ2 + ỹ1 · x̃2 ) .
Wohldefiniertheit der Addition: Wenn x1 + ỹ1 = x̃1 +y1 und x2 + ỹ2 = x̃2 +y2 ,
dann folgt (x1 + x2 ) + (ỹ1 + ỹ2 ) = (x̃1 + x̃2 ) + (y1 + y2 ) (hier benutzen wir
Kommutativ- und Assoziativgesetz), also (x1 + x2 , y1 + y2 ) ∼ (x̃1 + x̃2 , ỹ1 + ỹ2 ).
Wohldefiniertheit der Multiplikation: Sei (x1 , y1 ) ∼ (x̃1 , ỹ1 ). Wir zeigen
(x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 ) ∼ (x̃1 · x2 + ỹ1 · y2 , x̃1 · y2 + ỹ1 · x2 ). Mit der
Assoziativität und Kommutativität von + und dem Distributivgesetz auf H folgt
x1 · x2 + y1 · y2 + x̃1 · y2 + ỹ1 · x2
= (x1 + ỹ1 ) · x2 + (x̃1 + y1 ) · y2
= (x̃1 + y1 ) · x2 + (x1 + ỹ1 ) · y2 , denn (x1 , y1 ) ∼ (x̃1 , ỹ1 )
= x̃1 · x2 + ỹ1 · y2 + x1 · y2 + y1 · x2
Analog folgt (x1 · x2 + y1 · y2 , x1 · y2 + y1 · x2 ) ∼ (x1 · x̃2 + y1 · ỹ2 , x1 · ỹ2 + y1 · x̃2 )
aus (x2 , y2 ) ∼ (x̃2 , ỹ2 ). Zusammen folgt die Wohldefiniertheit der Multiplikation.
Der Beweis, dass R(H) ein Ring ist, erfolgt durch direktes Nachrechnen, was
wir aus Zeitgründen weglassen.
54
7.2
Quotientenkörper und die rationalen Zahlen
Im vorigen Abschnitt zeigten wir, wie man unter gewissen zusätzlichen Voraussetzungen zu einem gegebenen Halbring H einen Ring konstruieren kann, der
den Halbring enthält. Dazu haben wir auf H × H eine Relation so definiert, dass
(m1 , n1 ) ∼ (m2 , n2 ) genau der aus der Schule bekannten Gleichheit von Differenzen m1 − n1 = m2 − n2 entspricht.
Bei der Konstruktion von Q geht man ganz ähnlich vor. Eine rationale Zahl
= q·a
ist ja ein Bruch pq mit p, q ∈ Z und q 6= 0. Es ist pq = ab genau dann, wenn p·b
q·b
q·b
ist, das heißt
p
a
=
⇐⇒ p · b = q · a .
q
b
Das ist offensichtlich völlig analog zu der im vorigen Abschnitt betrachteten Äquivalenzrelation — wir haben lediglich + durch · ersetzt.
Eine wichtige Voraussetzung im vorigen Abschnitt war, dass (H, +, 0) ein kommutatives kürzbares Monoid ist. Analog müssen wir hier voraussetzen, dass wir
einen unitären Ring (R, +, ·, 0, 1) haben, so dass (R \ {0}, ·, 1) ein kommutatives
kürzbares Monoid ist.
Definition 7.13 Es sei (R, +, ·, 0) ein Ring. Ein Element x ∈ R \ {0} heißt
Nullteiler, wenn es ein y ∈ R \ {0} gibt, so dass x · y = 0 oder y · x = 0. Der Ring
heißt nullteilerfrei, wenn er keine Nullteiler enthält.
Definition 7.14 Ein unitärer Ring (R, +, ·, 0, 1) heißt Integritätsbereich, genau
dann wenn der Ring kommutativ und nullteilerfrei und zudem 1 6= 0 ist.
Beispiel 7.15 Körper sind Integritätsbereiche, denn aus x·y = 0 und x 6= 0 folgt
0 = x−1 · x · y = y. Auch Z ist ein Integritätsbereich, nach Hausaufgabe 8.4 a).
Beweis der Hausaufgabe. Es seien m, n ∈ Z, m 6= 0 6= n. Wir müssen zeigen,
dass m · n 6= 0.
Wenn wir das Vorzeichen von m oder n ändern, so ändert sich nach den
Rechenregeln in Ringen (Lemma 7.6) nur das Vorzeichen von m · n. Wir können
also bis auf die Wahl des Vorzeichens voraussetzen, dass m, n ∈ N \ {0}. Dann
hat aber m einen Vorgänger m − 1 ∈ N und es gilt m · n = (m − 1) · n + n. Wäre
m · n = 0, so wären also nach Lemma 5.23 sowohl (m − 1) · n = 0 als auch n = 0.
Das steht aber im Widerspruch zur Voraussetung n ∈ N \ {0}. Also kann m · n
nicht Null sein.
Lemma 7.16 Ein unitärer Ring (R, +, ·, 0, 1) ist genau dann ein Integritätsbereich, wenn (R \ {0}, ·, 1) ein kommutatives kürzbares Monoid ist.
Beweis. Es sei (R, +, ·, 0, 1) ein Integritätsbereich. Dann ist (R, ·, 1) ein kommutatives Monoid. Weil es keine Nullteiler gibt, ist die Multiplikation eine innere
55
Verknüpfung auf R \ {0}, und wegen 1 6= 0 ist (R \ {0}, ·, 1) ein kommutatives
Monoid. Wäre (R \ {0}, ·, 1) nicht kürzbar17 , so gäbe es ein x, y, z ∈ R \ {0} mit
x 6= y, so dass x · z = y · z. Es folgte dann x · z − y · z = (x − y) · z = 0, und
wegen x 6= y ist x − y 6= 0. Also wäre z ein Nullteiler, aber das gibt es in einem
Integritätsbereich nicht. Also ist (R \ {0}, ·, 1) kürzbar.
Umgekehrt sei (R \ {0}, ·, 1) ein kommutatives Monoid18 . Es folgt zunächst
1 ∈ R \ {0}, also 1 6= 0. Für alle x ∈ R gilt stets 0 · x = x · 0 = 0, und für alle
y ∈ R \ {0} gilt nach Voraussetzung zudem x · y = y · x. Also ist (R, ·, 1) ein
kommutatives Monoid, der Ring ist also kommutativ.
Es bleibt zu zeigen, dass der Ring nullteilerfrei ist. Wäre der Ring nicht nullteilerfrei, so gäbe es x, y ∈ R \ {0} mit x · y = 0. Dann aber wäre (R \ {0}, ·, 1)
kein Monoid (· wäre keine innere Verknüpfung). Also ist der Ring ein Integritätsbereich.19
Wir erhalten:
Lemma 7.17 Es sei (R, +, ·, 0, 1) ein Integritätsbereich.
a) Auf R × (R \ {0}) ist eine Äquivalenzrelation ∼ definiert durch
(x1 , y1 ) ∼ (x2 , y2 ) ⇐⇒ x1 · y2 = x2 · y1
für alle (x1 , y1 ), (x2 , y2 ) ∈ R × (R \ {0}). Wir definieren
Quot(R) = (R × (R \ {0})) / ∼
b) Die Abbildung ι : R → Quot(R) gegeben durch ι(x) = [(x, 1)] ist injektiv.
Beweis. Wegen Lemma 7.16 ist (R \ {0}, ·, 1) ein kommutatives kürzbares
Monoid. Daher sind Lemmata 7.9 und 7.10 auf es anwendbar.
a) Wegen Lemma 7.9 ist die Einschränkung von ∼ auf (R \ {0}) × (R \ {0})
eine Äquivalenzrelation. Für alle x, y, z ∈ R mit y 6= 0 6= z gilt:
(x, y) ∼ (0, z) ⇐⇒ x · z = 0 · y = 0
⇐⇒ x = 0 wegen Nullteilerfreiheit.
Daher ist ∼ auf R×(R\{0}) eine Äquivalenzrelation, wobei {(0, x) : x ∈ R \ {0}}
eine Äquivalenzklasse ist und alle anderen Äquivalenzklassen auch Äquivalenzklassen auf (R \ {0}) × (R \ {0}) sind.
b) Folgt direkt aus Lemma 7.10 und der Tatsache, dass (0, 1) 6∼ (y, 1) für y 6= 0
(siehe oben).
17
Wegen der Kommutativität sind links- und rechtskürzbar gleichbedeutend.
Wir brauchen Kürzbarkeit nicht voraussetzen!
19
Wie schon gezeigt folgt daraus, dass (R \ {0}, ·, 1) kürzbar ist.
18
56
Nach den aus der Schule bekannten Bruchrechenregeln gilt
p a
pb + qa
+ =
q
b
qb
p a
pa
· =
q b
qb
für alle a, b, p, q ∈ Z, b, q 6= 0. Diese Rechenregeln lassen sich direkt auf Quot(R)
übertragen.
Satz 7.18 (und Definition) Es sei R ein Integritätsbereich. Mit den Operationen
[(p, q)] + [(a, b)] = [(pb + qa, qb)]
[(p, q)] · [(a, b)] = [(pa, qb)]
ist (Quot(R), +, ·, [(0, 1)], [(1, 1)]) ein Körper. Man nennt ihn den Quotientenkörper20 von R.
Da Z ein Integritätsbereich ist, können wir definieren:
Definition 7.19 Der Körper der rationalen Zahlen ist Q = Quot(Z) mit den im
vorigen Satz gegebenen Verknüpfungen.
Beweis von Satz 7.18. Wir schreiben ab jetzt statt [(a, b)] einfach ab . Im folgenden sind alle Brüche als Elemente von Quot(R) aufzufassen.
Zuerst müssen wir zeigen, dass Addition und Multiplikation wohldefiniert
0
0
0
0
sind. Das heißt, ist pq0 = pq und ab0 = ab , dann sollten auch pq0 + ab0 = pq + ab
und
p0
q0
·
a0
b0
=
p
q
·
a
b
gelten. Man beachte: es ist pq 0 = p0 q und ab0 = a0 b. Also
p 0 a0
p 0 b 0 + q 0 a0
p0 qbb0 + qq 0 a0 b
pq 0 bb0 + qq 0 ab0
pb + qa
p a
+
=
=
=
=
= + ,
0
0
0
0
0
0
0
0
q
b
qb
qq bb
qq bb
qb
q
b
0
0 0
0
0
0 0
0
pa
p qa b
pq ab
pa
p a
p a
· 0 = 0 0 = 0 0 = 0 0 =
= · .
0
q b
qb
qq bb
qq bb
qb
q b
Die Ringaxiome lassen sich jetzt nachweisen, zum Beispiel
p a c
p ad + bc
pad + pbc
pqad + pqbc
pa pc
p a p c
=
+
= ·
=
=
+
= · + · .
2
q b d
q
bd
qbd
q bd
qb qd
q b q d
Nullelement: pq + 10 =
p q
· = pq
= 11 , und pq ·
q p
pq
20
p·1+q·0
q·1
p
1
=
q
1
= pq . Einselement:
ist analog.
englisch: fraction field
57
p
q
·
1
1
=
p·1
q·1
= pq .
Inversen:
7.3
Restklassenringe
Wir haben schon verschiedentlich Division mit Rest thematisiert: Zu a, b ∈ N mit
a 6= 0 gibt es q, r ∈ N und r < a mit b = a · q + r. nach Bonusaufgabe 8.6* sind
q und r eindeutig durch a, b bestimmt.
Beweis der Bonusaufgabe. Es seien q1 , q2 , r1 , r2 ∈ N mit r1 , r2 < a und b =
a · q1 + r1 = a · q2 + r2 . Durch Umbenennen können wir erreichen, dass q1 ≤ q2 .
Es gibt also k ∈ N mit q2 = q1 + k. Es folgt also (unter Anwendung der üblichen
Rechenregeln) a · q2 + r2 = a · q1 + (a · k + r2 ) = a · q1 + r1 . Da (N, +) kürzbar ist,
folgt r1 = a · k + r2 . Wäre k > 0, so wäre r1 = a + (a · (k − 1) + r2 ) und damit
r1 ≥ a. Das stünde im Widerspruch zur Voraussetzung, also ist k = 0 und damit
q1 = q2 und r1 = a · 0 + r2 = r2 .
Wegen der Eindeutigkeit können wir quo(b, a) = q und rem(b, a) = r definieren. Für jedes a ∈ N \ {0} erhalten wir eine Relation ∼a auf N, gegeben durch
m ∼a n ⇐⇒ rem(m, a) = rem(n, a). Dies ist ziemlich offensichtlich eine Äquivalenzrelation, die bereits in Hausaufgaben vorkam. Die Äquivalenzklasse von
n ∈ N ist [n]a = {rem(n, a) + k · a : k ∈ N}. Statt m ∼a n schreibt man meist
m ≡ n (mod a) („m ist kongruent zu n modulo a“).
Im Rest dieses Abschnitts halten wir a ∈ N\{0} fest. Zur Abkürzung schreiben
wir qm = quo(m, a) und m = rem(m, a) für alle m ∈ N. Für alle m, n ∈ N gilt
m ≡ n (mod a) ⇐⇒ m = n und daher [m]a = [m]a .
Lemma 7.20 Für alle m, n ∈ N gilt m + n = m + n und m · n = m · n.
Beweis. Es ist m + n = qm+n · a + m + n und auch
m + n = (qm + qn ) · a + (m + n)
= (qm + qn + qm+n ) · a + m + n
Daraus folgt der erste Teil der Behauptung.
Es ist m · n = qm·n · a + m · n und auch
m · n = (qm · qn · a + qm · n + m · qn + qm·n ) · a + m · n
Daraus folgt der zweite Teil der Behauptung.
Satz 7.21 (und Definition) Es sei a ∈ N\{0}. Auf N/∼a definieren wir innere
Verknüpfungen [m]a + [n]a = [m + n]a und [m]a · [n]a = [m · n]a für alle m, n ∈ N.
Dadurch wird (N/∼a , +, ·, [0]a , [1]a ) zu einem kommutativen unitären Ring, den
man als Restklassenring bezeichnet und meist als N/aN, N/a, Z/aZ oder Z/a
notiert.21 Er hat genau a Elemente.
21
Man kann ∼a analog auf Z statt nur auf N definieren, daher die Notationen.
58
Beweis. Nach Lemma 7.20 sind + und · auf N/∼a wohldefiniert. Die Ringaxiome folgen ebenfalls wegen des Lemmas aus der Gültigkeit der entsprechenden
Axiome in N. Die Elemente des Restklassenrings sind [0]a , [1]a , ..., [a − 1]a : Diese
sind paarweise verschieden, und wegen [a]a = [0]a gibt es keine weiteren Elemente.
Bekanntlich ist eine Primzahl eine natürliche Zahl p > 1, die nur durch 1
und sich selbst teilbar ist. Ebenso sollte aus der Schule bekannt sein: Wenn eine
Primzahl p ein Produkt m · n teilt, dann teilt sie einen der Faktoren m, n.
Satz 7.22 Es sei p eine Primzahl. Dann ist N/pN ein Körper.
Beweis. Wir wissen bereits, dass N/pN ein kommutativer Ring ist. Wegen
p > q ist [0]p 6= [1]p .
Wir zeigen nun, dass N/pN Nullteilerfrei ist. Angenommen, es wären m, n ∈ N,
m, n < p, so dass [m]p ·[n]p = [m·n]p = [0]p . Das ist gleichbedeutend mit p | (m·n).
Da p prim ist, folgt p | m oder p | n. Also ist [m]p = [0]p oder [n]p = [0]p , der
Ring ist also nullteilerfrei.
Wegen Lemma 7.16 ist also (N/pN \ {[0]p }, ·, [1]p ) ein kürzbares endliches Monoid. Nach Hausaufgabe 9.5 ist es also eine Gruppe und daher N/pN ein Körper.
Bemerkung 7.23 Eliakim Hastings Moore [1862–1932] „klassifizierte“ alle endlichen Körper (d.h. er zeigte, wie man jeden endlichen Körper bis auf Isomorphie
konstruieren kann). Insbesondere ist die Ordnung jedes endlichen Körpers eine
Primzahlpotenz, und für jede Primzahlpotenz (d.h. pn für p prim und n ∈ N>0 )
gibt es einen endlichen Körper dieser Ordnung.
Vorsicht: N/pn N ist zwar ein kommutativer Ring und hat genau pn viele
Elemente, aber ist für n > 1 kein Körper (z.B. ist für n > 1 sowohl p 6≡ 0
(mod pn ) als auch pn−1 6≡ 0 (mod pn ), aber p · pn−1 = pn ≡ 0 (mod pn ).
7.3.1
Anwendungen
Rechnen „modulo n“ bietet sich besonders bei periodischen Vorgängen an, etwa
im Zusammenhang mit Kalendern. Außerdem ist a|b ⇐⇒ b ≡ 0 (mod a),
d.h. man kann damit Teilbarkeit untersuchen. Wir lösen zunächst einige alte
Übungsaufgaben, die Sie vermutlich umständlicher mit vollständiger Induktion
gelöst haben, und betrachten dann einige Teilbarkeitsregeln.
Hausaufgabe 6.1 c): 5n + 7 ist durch 4 teilbar, für alle n ∈ N.
Beweis. 5n + 7 ≡ 1n + 3 ≡ 4 ≡ 0 (mod 4).
59
Hausaufgabe 7.5: n3 − n ist durch 3 teilbar, für alle n ∈ N.
Beweis. Der Rest von n bei Division durch 3 ist entweder 0, 1 oder 2. Es ist
03 − 0 = 0
13 − 1 = 0
23 − 2 = 6 ≡ 0 (mod 3)
Bemerkung 7.24 Das Ergebnis von Hausaufgabe 7.5 ist kein Zufall. In einer
anderen Hausaufgabe sollen Sie zeigen: Wenn p eine Primzahl ist, dann ist np − n
durch p teilbar, für alle n ∈ N.
Teilbarkeitsregeln
Es sei n ∈ N eine Zahl mit Ziffern z0 , z1 , z2 , ..., zl im Dezimalsystem. Das heißt:
P
n = li=0 10i zi . Aus der Schule wissen Sie, wie man an den Ziffern relativ leicht
erkennt, ob n durch 2, 3, 4, 5, 9 oder 11 teilbar ist. Für einige dieser Teilbarkeitsregeln führen wir hier den Beweis, manche werden (ggf. verallgemeinert) in den
Hausaufgaben bewiesen, und außerdem stellen wir noch eine Teilbarkeitsregel für
7 vor.
Teilbarkeit durch 2 bzw. 5: 2 | n bzw. 5 | n genau dann wenn 2 | z0 bzw.
5 | z0 .
Beweis. Es ist 10 ≡ 0 (mod 2), also n = z0 + 10z1 + 100z2 + ... ≡ z0 + 0z1 +
0z2 + ... = z0 (mod 2). Ebenso modulo 5, da 10 ≡ 0 (mod 5).
Teilbarkeit durch 2k bzw. 5k für k ∈ N>0 : 2k | n bzw. 5k | n genau dann
P
i
i
k Pk−1
wenn 2k | k−1
i=0 10 zi bzw. 5 |
i=0 10 zi . Beweis: Übung.
Teilbarkeit durch 3 bzw. 9: 3 | n bzw. 9 | n genau dann wenn 3 | li=0 zi
P
P
bzw. 9 | li=0 zi . Beweis: Übung. Man nennt li=0 zi die Quersumme von n.
P
Teilbarkeit durch 11: 11 | n genau dann wenn 11 | z0 − z1 + z2 − z3 ±
P
P
... = li=0 (−1)i zi . Mann nennt li=0 (−1)i zi die alternierende Quersumme von n.
Beispiel: 123456 hat alternierende Quersumme 6 − 5 + 4 − 3 + 2 − 1 = +3, also
nicht durch 11 teilbar. Bei der alternierenden Quersumme fängt man rechts an.
Beweis. Es ist 10 ≡ −1 (mod 11). Also ist n ≡
60
Pl
i
i=0 (−1) zi
(mod 11).
Teilbarkeit durch 7: 7 | n genau dann wenn 7 | z0 + 3z1 + 2z2 − z3 − 3z4 −
2z5 + z6 + ...; man summiert also die Ziffern (beginnend mit der Einerziffer) mit
den Vorfaktoren 1, 3, 2, −1, −3,−2, ... (ab hier wiederholen sich die Vorfaktoren
periodisch). Man nennt dies eine gewichtete Quersumme.
Beweis. Es ist
100
101
102 ≡ 3 · 3
103 ≡ 3 · 2
104 ≡ 3 · (−1)
105 ≡ 3 · (−3)
106 ≡ 3 · (−2) = −6
=
≡
≡
≡
=
≡
≡
...
1
3 (mod 7)
2 (mod 7)
−1 (mod 7)
−3 (mod 7)
−2 (mod 7)
1 (mod 7)
Beispiel 7.25 422625 ist durch 3, durch 7 und durch 53 = 125 teilbar.
Teilbarkeit durch 3: 5 + 2 + 6 + 2 + 2 + 4 = 21 ist durch 3 teilbar.
Teilbarkeit durch 125: Die aus den letzten drei Ziffern gebildete Zahl (also 625)
ist durch 125 teilbar.
Teilbarkeit durch 7: 5 + 3 · 2 + 2 · 6 − 2 − 3 · 2 − 2 · 4 = 7.
7.4
Die reellen Zahlen
Eine ordentliche Konstruktion der reellen Zahlen R gehört zur Analysis und würde den Rahmen dieser Lehrveranstaltung sprengen. Wir setzen daher den Zahlenstrahl R als bekannt voraus: Reelle Zahlen bilden einen Körper und lassen
sich als Dezimalzahlen mit ggf. unendlich vielen Nachkommastellen darstellen.
Jede reelle Zahl lässt sich beliebig gut durch Brüche approximieren. So kann man
etwa π = 3, 14159265... approximieren durch 3/1, 31/10, 314/100, 3141/1000. Es
ist Q ⊆ R. Elemente
von R \ Q heißen irrational; wir hatten schon in Satz 1.9
√
gezeigt, dass 2 irrational ist. Außerdem gibt es auf R eine Totalordnung ≤, die
verträglich ist mit den Grundrechenarten: Für alle a, b, c ∈ R gilt
a ≤ b =⇒ a + c ≤ b + c
a ≤ b ∧ 0 ≤ c =⇒ a · c ≤ b · c
0
1
0 < a ≤ b =⇒ 1b ≤
<
a
Eng verknüpft mit der Approximationseigenschaft ist folgende Aussage:
Archimedisches Axiom Für jedes x ∈ R gibt es ein n ∈ N mit n > x.
61
Das Axiom ist nach Archimedes von Syrakus [ca. 287 v.Chr.–212 v. Chr.] benannt,
stammt aber vermutlich von Eudoxos von Knidos [4. Jhdt. v. Chr.].
Lemma 7.26
a) Zwischen zwei verschiedenen rationalen Zahlen findet man
immer mindestens eine irrationale Zahl.
b) Zwischen zwei verschiedenen reellen Zahlen findet man immer mindestens
eine rationale Zahl.
√
Beweis. Sei x < y und x, y ∈ Q. Wir definieren z = x + 22 (y − x). Es ist
√
√
. Das
1 < 2 < 2, also ist x < z < y. Nach der Definition von z gilt 2 = 2(z−x)
y−x
√
heißt: Wären x, y, z alle rational, so wäre auch 2 rational, Widerspruch. Da wir
x, y ∈ Q voraussetzen, muss folglich z irrational sein. Dies beweist Aussage a).
Nun seien x < y beliebige reelle Zahlen, also y − x > 0. Nach dem Archimedi1
, d.h. n1 < y − x. Ferner gibt es `, m ∈ N
schen Axiom gibt es n ∈ N mit n > y−x
mit ` ≥ −nx und m ≥ ny, also − n` ≤ x < y ≤ m
. Irgendwo also zwischen −`
n
1
>
x.
Wegen
< y − x ist r+1
aber
und +m gibt es ein r ∈ Z mit nr ≤ x und r+1
n
n
n
r+1
immer noch kleiner als y, also x < n < y. Das beweist Aussage b).
7.5
Polynome
In der Schule haben Sie unter Anderem auch das Rechnen mit „Unbekannten“
gelernt, etwa (X +1)·(X −1) = X 2 −1. Ausdrücke, die nur durch Anwendung von
+, − und · auf Zahlen und eine „Unbekannte“ X entstehen, heißen Polynome.
Definition 7.27 Ein Polynom ist eine Funktion f : R → R der Art
f (X) =
n
X
ai X i
mit a0 , a1 , . . . , an ∈ R.
i=0
Die a0 , ..., an heißen Koeffizienten von f . Ist an 6= 0, so hat f den Grad n = deg(f ).
Der Grad ist nicht definiert, falls alle Koeffizienten Null sind (Nullpolynom).22
Ist an = 1, so heißt f normiert. Der Koeffizient a0 = f (0) heißt konstanter Term
von f . Die Menge aller Polynome bezeichnet man mit R[X].
Beispiele 13X 3 − 4X 2 + 5X − 1 hat Grad 3. Das Polynom 0X 6 − X 5 + X 4 +
0X 3 + 0X 2 + 0X + 1 hat Grad 5, nicht 6, und man würde es normalerweise als
−X 5 + X 4 + 1 schreiben.
Streng genommen heißt das, was wir gerade definiert haben, „PolynomfunkP
tion“, während ein Polynom eine „formale Summe“ ni=0 ai X i mit Elementen
a1 , ..., an eines Ringes (nicht unbedingt R!) ist.
22
In manchen Büchern wird in diesem Fall deg(f ) = −∞ definiert.
62
Notation Oft schreibt man ein Polynom f in der Form f = i≥0 ai X i . Dabei
ist ai = 0 gemeint, falls i > deg(f ) ist oder f das Nullpolynom ist.
P
Bemerkung 7.28 In der Analysis zeigt man, das zwei (reelle) Polynome nur
dann gleich sind, wenn der Grad und alle Koeffizienten gleich sind. Insbesondere
ist ∀X ∈ R : f (X) = 0 genau dann, wenn alle Koeffizienten Null sind. Für Polynome mit Koeffizienten in endlichen Ringen gilt dies nicht! So ist X 7→ X 3 − X
Null als Funktion N/3N → N/3N. Grund: x3 − x ≡ 0 (mod 3) für alle x ∈ N.
Polynome kann man addieren und multiplizieren.
Beispiele Es ist
(X 3 − X + 17) + (−2X 3 + X 2 + 3X + 1)
= (1 − 2)X 3 + X 2 + (−1 + 3)X + (17 + 1) = −X 3 + X 2 + 2X + 18 ,
und
(X 3 − X + 17)(X 2 + 2X − 3) = (X 5 + 2X 4 − 3X 3 ) + (−X 3 − 2X 2 + 3X)
+ (17X 2 + 34X − 51)
= X 5 + 2X 4 − 4X 3 + 15X 2 + 37X − 51 .
Allgemein sind Addition und Multiplikation von Polynomen so definiert:
X
i≥0
ai X i +
X
bi X i =
i≥0



X
X

ai X i   b j X j 
i≥0
j≥0
(ai + bi )X i
X
i≥0


=
X
(ai · bj )X i+j =

n≥0
i,j≥0
X
X
(ai · bj ) X n .
i+j=n
So wird R[X] zu einem kommutativen unitären Ring: Das Nullelement ist die
konstante Funktion 0 und das Einselement die konstante Funktion 1.
Bemerkung 7.29 Polynome ähneln der Darstellung von Zahlen in einem Stellenwertsystem. Eine natürliche Zahl im Dezimalsystem darstellen, heißt ja, sie
P
in der Form i≥0 zi 10i mit Koeffizienten z0 , z1 , ... ∈ {0, 1, ..., 9} zu schreiben.
Die Grundrechenarten mit Polynomen sind sogar in gewissem Sinne „leichter“
als die Grundrechenarten für Dezimalzahlen: Beim Addieren und Multiplizieren
von Dezimalzahlen hat man bekanntlich den „Übertrag“ zu berücksichtigen; bei
Polynomen gibt es so etwas nicht.
Lemma 7.30 Für Polynome f, g ∈ R[X], die beide 6= 0 sind, gelten
deg(f · g) = deg(f ) + deg(g)
deg(f + g) ≤ max (deg(f ), deg(g)) oder f + g = 0.
63
Beispiel f = X 2 + X und g = −X 2 haben Grad 2, aber f + g = X hat
Grad 1.
Beweis. Sei f = ni=0 ai X i mit deg(f ) = n, also an 6= 0; und sei g =
Pm
j
j=0 bj X , mit deg(g) = m, also bm 6= 0. Dann
P
f ·g =
n
X

! m
X
ai X i  b j X j 
i=0
j=0
=
n X
m
X
ai bj X i+j .
i=0 j=0
Der größte Wert von i + j ist n + m. Dies kommt nur bei i = n, j = m vor. Also
f · g = an bm X n+m + (Terme von kleineren Grad) .
Daraus folgt deg(f · g) ≤ deg(f ) + deg(g). Weil R nullteilerfrei ist, gilt an bm 6= 0,
da an , bm beide 6= 0. Also deg(f g) = n + m = deg(f ) + deg(g).
P
Ferner ist f + g = i≥0 (ai + bi )X i . Wenn i > max (deg(f ), deg(g)), dann ist
ai = bi = 0, also auch ai +bi = 0. Daher ist deg(f +g) ≤ max (deg(f ), deg(g)).
In den natürlichen Zahlen (und entsprechend in den ganzen Zahlen) kann
man nach Satz/Definition 5.33 mit Rest dividieren. Nach dem folgenden Lemma
ist auch für Polynome Division mit Rest möglich (allgemein: Für Polynome mit
Koeffizienten in einem Körper). Zunächst aber ein kleines Beispiel: Wir berechnen
(x4 + x2 + 2) : (2 · x2 − x) mit Rest. Der Ablauf ist schrittweise und völlig analog
zur schriftlichen Division ganzer Zahlen aus der Schule.
(x4 + x3
− 2x
+2) : (2x2 − 1) = (1/2x2 + 1/2x + 1/4) Rest (−3/2x + 9/4)
2
4
−x
+1/2x
+x
3
+1/2x2
−x3
+1/2x
2
+1/2x − 3/2x
−1/2x2
+1/4
−3/2x
+9/4
Lemma 7.31 (Polynomdivision mit Rest) Es seine f, g ∈ R[X] zwei Polynome mit g 6= 0. Dann gibt es Polynome q, r ∈ R[X] mit
f =q·g+r
und
r = 0 ∨ deg(r) < deg(g) .
Beweis. Wenn f = 0, dann stimmt die Aussage, mit q = r = 0. Wir betrachten daher ab jetzt den Fall f 6= 0, so dass deg(f ) definiert ist.
Der Beweis erfolgt durch Induktion über deg(f ). Induktionsanfang: Ist deg(f ) <
deg(g), dann funktioniert q = 0 und r = f .
64
Induktionsschritt: Sei deg(f ) = n ≥ m = deg(g). Also f = nr=0 ar X r und
P
s
6 0. Da f und bamn X n−m g beide die Gestalt
g= m
s=0 bs X mit an , bm beide =
P
an X n + (Terme von kleinerem Grad)
haben, setzen wir f1 = f − bamn X n−m g. Hierfür brauchen wir, dass R ein Körper
und bm 6= 0 ist.
Wir erhalten deg(f1 ) < n. Nach Induktionsannahme gibt es Polynome q1 , r1
mit f1 = q1 · g + r1 und deg(r1 ) < deg(g). Also
f = f1 +
für q(X) =
an
X n−m
bm
an n−m
X
·g =q·g+r
bm
+ q1 (X) und r(X) = r1 (X).
Lemma 7.32 Sei f ∈ R[X] ein Polynom vom Grad n. Für λ ∈ R gilt:
f (λ) = 0 ⇐⇒ das Polynom X − λ ∈ R[X] teilt f .
Beweis.
⇐: Ist h ∈ R[X] mit f = (X − λ) · h, dann f (λ) = (λ − λ) · h(λ) = 0 · h(λ) = 0.
⇒: Wir nutzen Polynomdivision. Es gibt q, r ∈ R[X], so dass f = (X − λ)q + r,
mit deg(r) < deg(X − λ) = 1. Das heißt, r ist eine konstante Funktion: r(X) = µ
für ein µ ∈ R. Wir setzen X = λ ein: f (λ) = (λ − λ) · q(λ) + r(λ) = µ. Ist also
f (λ) = 0, dann ist auch µ = r = 0 und damit f = (X − λ)q, also (X − λ)|f .
7.5.1
Der größte gemeinsame Teiler
In der Schule — spätestens im Zusammenhang mit Bruchrechnung — lernt man
den Begriff des „größten gemeinsamen Teilers“ (ggT) zweier ganzer Zahlen. Vielleicht haben Sie ggT(99, 78) so bestimmt: 99 = 32 · 11 und 78 = 2 · 3 · 13, also
ggT(99, 78) = 3. Leider ist die Zerlegung von großen Zahlen in Primfaktoren
sehr schwer. Mit Hilfe der Division mit Rest kann man jedoch den ggT auch
ohne Primfaktorzerlegung berechnen — und zwar nicht nur in Z, sondern auch
in R[X] und allgemein in jedem Ring, in dem es Division mit Rest gibt. Im Rest
dieses Abschnitts sei R = Z oder R = R[X].
Definition 7.33 Sei a, b ∈ R \ {0}. Ein g ∈ R ist ein größter gemeinsamer
Teilervon a, b, falls g|a und g|b und zudem für alle h ∈ R mit h|a und h|b bereits
h|g folgt. Meist schreibt man dann g = ggT(a, b).
Bemerkung ggT(a, b) ist nicht eindeutig. So ist auch −3 ein größter gemeinsamer Teiler von 99 und 78. Für R = Z kann man aber stets ggT(a, b) > 0 wählen,
und für R = R[X] kann man ggT(a, b) als normiertes Polynom wählen. Dadurch
erreicht man Eindeutigkeit.
Lemma 7.34 Für a, b ∈ R \ {0} gilt:
65
a) Wenn rem(a, b) = 0, dann ist b ein ggT(a, b).
b) g ∈ R ist ein ggT(a, b) genau dann wenn es ein ggT(b, rem(a, b)) ist.
Beweis.
a) Klar, denn rem(a, b) = 0 heißt b|a.
b) Division mit Rest war ja definiert durch a = quo(a, b) · b + rem(a, b). Wenn
g|b und g| rem(a, b), dann teilt g auch deren Summe, also g|a. Wenn g|a und g|b,
dann teilt g auch quo(a, b) · b und damit auch rem(a, b) = a − quo(a, b) · b. Jeder
gemeinsame Teiler von b und rem(a, b) ist also gemeinsamer Teiler von a und b,
und umgekenrt. Daraus folgt die Behauptung.
Damit kann man ggT(99, 78) schrittweise berechnen:
99 = 1 · 78 + 21
78 = 3 · 21 + 15
21 = 1 · 15 + 6
15 = 2 · 6 + 3
6=2·3+0
Der ggT der beiden unterstrichenen Zahlen ist nach dem Lemma in jeder Zeile
gleich, also ggT(99, 78) = 3. Dies nennt man den euklidischen Algorithmus. Nach
endlich vielen Schritten endet das Verfahren (Rest 0 in der letzten Zeile), da ja
der Rest jedes Schrittes zum Divisor des nächsten Schrittes wird und der dann
berechnete Rest in jedem Fall kleiner als der Divisor ist. Die berechneten Reste
werden also in jedem Schritt echt kleiner als im vorigen Schritt.23
Man erhält sogar noch mehr: In der vorletzten Zeile sieht man, wie man den
ggT aus den beiden unterstrichenen Zahlen ausrechnen kann: 3 = 15 − 2 · 6. Man
kann jeweils die darüberstehende Gleichung einsetzen und erhält:
3 = 15 − 2 · 6
= 15 − 2 · (21 − 1 · 15) = 3 · 15 − 2 · 21
= 3 · (78 − 3 · 21) − 2 · 21 = 3 · 78 − 11 · 21
= 3 · 78 − 11 · (99 − 78) = 14 · 78 − 11 · 99
Dies nennt man den erweiterten euklidischen Algorithmus. Da er sich für alle
Zahlen — allgemeiner für alle a, b ∈ R \ {0} — anwenden lässt, ist er zugleich ein
Beweis des folgenden Lemmas.
Lemma 7.35 (Lemma von Bézout)
Für a, b ∈ R \ {0} existiert ggT(a, b) ∈ R (allerdings nur bis auf Normierung,
siehe oben), und es gibt s, t ∈ R mit ggT(a, b) = s · a + t · b.
23
Bei Polynomdivision: Der Grad des Restes wird in jedem Schritt echt kleiner als im vorigen
Schritt.
66
Korollar 7.36 Sei n ∈ N>0 und m ∈ Z. Dann ist [m]n ∈ Z/nZ invertierbar
(also eine Einheit) genau dann wenn ggT(m, n) = 1.
Beweis. [m]n ∈ Z/nZ invertierbar heißt: Es gibt s ∈ Z mit s·m ≡ 1 (mod n).
Nach Definition von ≡ heißt das: Es gibt t ∈ Z mit s·m+t·n = 1, also ggT(m, n) =
1. Nach dem Lemma von Bézout kann man auch umgekehrt schließen.
7.6
Die komplexen Zahlen
Vermutlich haben Sie in der Schule die Vorstellung verinnerlicht, dass das Wurzelziehen aus negativen Zahlen „nicht geht“. Die komplexen Zahlen bilden einen
Körper, der R enthält, und in dem man aus jeder Zahl Wurzeln ziehen kann.
Definition 7.37 Der Körper C der komplexen Zahlen besteht aus der Menge
R2 , zusammen mit der üblichen komponentenweise Addition
(a, b) + (c, d) := (a + c, b + d)
und mit der folgenden Multiplikationsregel:
(a, b) · (c, d) := (ac − bd, ad + bc) .
(*)
Notation 7.38 Ist z = (a, b) ∈ C, so nennt man a√bzw. b den reellen Teil <(z)
bzw. den imaginären Teil =(z) von z. Durch |z| := a2 + b2 ∈ R wird der Betrag
von z definiert. Beachte: |z| ist ≥ 0, und |z| = 0 ⇒ z = (0, 0).
Man schreibt i = (0, 1) ∈ C und identifiziert a ∈ R mit (a, 0) ∈ C. Für
b ∈ R folgt dann ib = (0, 1) · (b, 0) = (0, b), also gilt a + ib = (a, b). Mit dieser
Schreibweise lautet die Multiplikationsregel:
(a + ib) · (c + id) = (ac − bd) + i(ad + bc) .
(**)
Insbesondere gilt i2 = −1.
Lemma 7.39 C ist ein Körper.
Beweis. Offensichtlich ist (R2 , +) eine abelsche Gruppe. Multiplikation kommutativ mit Einselement 1 = 1 + 0i = (1, 0): folgt aus (**). Multiplikation
assoziativ:
(a + ib) ((c + id)(e + if )) = (a + ib) ((ce − df ) + i(cf + de))
= (ace − adf − bcf − bde) + i(acf + ade + bce − bdf )
((a + ib)(c + id)) (e + if ) = ((ac − bd) + i(ad + bc)) (e + if )
= (ace − bde − adf − bcf ) + i(acf − bdf + ade + bce) .
67
Die Distributivgesetze:
(a + ib) ((c + id) + (e + if )) = (a + ib) ((c + e) + i(d + f ))
= (a(c + e) − b(d + f )) + i (a(d + f ) + b(c + e))
= ((ac − bd) + i(ad + bc)) + ((ae − bf ) + i(af + be))
= (a + ib)(c + id) + (a + ib)(e + if )
Multiplikative Inverse: Für a+ib 6= 0 ist a2 +b2 6= 0. Wegen (a+ib)(a−ib) = a2 +b2
folgt
1
(a + ib)−1 = 2
(a − ib) .
a + b2
Somit ist C tatsächlich ein Körper.
Definition 7.40 Für z ∈ C ist die konjugierte komplexe Zahl z̄ gegeben durch
a + ib = a − ib ∈ C .
Lemma 7.41 Seien z, w ∈ C. Dann
a) z + w = z̄ + w̄.
b) zw = z̄ · w̄.
c) Es ist z ∈ R genau dann, wenn z = z̄.
d) z · z̄ = |z|2 . Für z 6= 0 gilt also z −1 =
z̄
.
|z|2
Beweis. Übung.
7.6.1
Die Gaußsche Zahlenebene
Definition 7.42 Stellt man die komplexe Zahl a + ib ∈ C als den Punkt (a, b)
der Ebene R2 dar, hat man C mit der Ebene identifiziert. Dies nennt man die
Gaußsche Zahlenebene 24 , oder auch das Arganddiagramm 25 , obwohl sie eigentlich
zuerst 1797 von Caspar Wessel [1745–1818] beschrieben wurde.
Einige Aspekte der komplexen Zahlen lassen so geometrische Deutungen zu:
• Addition von komplexen Zahlen ist die übliche Vektoraddition in R2 (Kräfteparallelogramm).
• Komplexe Konjugation a + ib = a − ib ist die Spiegelung in der x-Achse.
24
25
Carl Friedrich Gauß [1777–1855] beschrieb sie in einem Brief von 1811.
Jean–Robert Argand [1768–1822] beschrieb sie schon 1806
68
• Polarkoordinaten: Sei z = a + ib ∈ C. Seien (r, θ) die Polarkoordinaten (Bogenmaß) des Punkts (a, b) ∈ R2 , also r ≥ 0 und a = r cos(θ),
b = r sin(θ). Dann z = a + ib = r(cos(θ) + i sin(θ)). Daher ist a2 + b2 =
r2 cos2 (θ)+r2 sin2 (θ). Man kann zeigen cos2 (θ)+sin2 (θ) = 1, also r2 = a2 +b2
und damit r = |z|. Man nennt θ das Argument arg(z).
• Multiplikation: Ist eine zweite Zahl w = s(cos(φ) + i sin(φ)) ∈ C gegeben,
dann
zw = rs(cos(θ) + i sin(θ))(cos(φ) + i sin(φ))
= rs((cos(θ) cos(φ) − sin(θ) sin(φ)) + i(cos(θ) sin(φ) + sin(θ) cos(φ)))
= rs(cos(θ + φ) + i sin(θ + φ)) .
Also |zw| = |z| |w|, und arg(zw) = arg(z) + arg(w).
Lemma 7.43 C enthält alle Wurzeln: Für jedes 0 6= z ∈ C und für jedes n ≥ 1
hat die Gleichung wn = z genau n verschiedene Lösungen in C.
Beweis. Seien (r, θ) die Polarkoordinaten von z und√(s, φ) die Polarkoordinaten von w. Die Gleichung wn = z ist äquivalent zu s = n r und nφ ≡ θ (mod 2π).
Also φ ∈ { nθ , θ+2π
, θ+4π
, . . . , θ+2(n−1)π
}.
n
n
n
Beispiel Es sei z ∈ C und z 5 = 1. Es folgt |z 5 | = |z|5 = 1. Weil |z| eine
positive reelle Zahl ist, folgt |z| = 1. Ferner muss arg(z 5 ) = 5 arg(z) durch 2π
teilbar sein. Daher hat die Gleichung z 5 = 1 fünf verschiedene Lösungen z ∈ C:
, 4π
, 6π
, 8π
}.
z = cos(θ) + i sin(θ) für θ ∈ {0, 2π
5
5
5
5
7.6.2
Komplexe Zahlen und Polynome
Lemma 7.44 Sei p(X) ein Polynom mit reellen Koeffizienten. Ist z ∈ C eine
Nullstelle von p(X), dann ist auch z̄ eine Nullstelle. Somit treten die nichtreellen
Nullstellen von p(X) immer paarweise auf.
Beweis. Es ist p(X) =
Daher ist
Pn
0 = 0 = p(z) =
r=0
n
X
r=0
ar X r , und für jedes r ist ar ∈ R, d.h. ar = ar .
ar z r =
n
X
r=0
ar z r =
n
X
ar z̄ r = p(z̄) .
r=0
Beispiel Die Nullstellen von X 2 + 1 sind i und
ī = −i. Auch bei X 2 + X + 1
√
gibt es die nicht reellen Nullstellen ω = − 12 + i 23 und ω̄.
p 2 1 2
2
Beispiel
√ 2Für p, q ∈ C ist X +pX +q2 = (X + 2 ) − 4 (p −4q). Nach Lemma 7.43
existiert p − 4q ∈ C. Daher ist X + pX + q = 0 immer lösbar in C, mit
Lösungen
√
−p ± p2 − 4q
X=
.
2
69
Einen Beweis des folgenden wichtigen Satzes würde den Rahmen dieser Lehrveranstaltung sprengen.
Fundamentalsatz der Algebra Jedes Polynom vom Grad ≥ 1 mit Koeffizienten aus C hat mindestens eine Nullstelle in C.
Anders gesagt: Über C lässt sich jedes Polynom als Produkt von linearen Faktoren
schreiben.
70
8
Elementare Kombinatorik
Man kann die Kombinatorik als die „Kunst des Zählens“ betrachten: Man untersucht, wie viele Elemente eine mathematische Struktur besitzt. Eine erste Blüte
erlebte sie mit dem Entstehen der Wahrscheinlichkeitstheorie im 17. Jahrhundert
(z.B. Blaise Pascal [1623–1662]: Bei der Wahrscheinlichkeitsanalyse von Glücksspielen ist es nämlich wichtig, die Anzahl sämtlicher möglicher (gleich wahrscheinlicher) Spielergebnisse und die Anzahl der zum Sieg führenden Spielergebnisse zu
bestimmen. Allerdings gab es auch schon lange vorher Untersuchungen, die man
der Kombinatorik zurechnen kann.
Dabei kann man alles mögliche zählen: Teilmengen, Abbildungen, aber auch
geometrische Strukturen („Auf wie vielen verschiedenen Wegen kann man in einem Rechteckgitter von der linken unteren in die rechte obere Ecke gelangen,
ohne einen Gitterpunkt zweimal zu besuchen?“), Gruppenelemente („Wie viele
Elemente von Sn = Sym({1, 2, ..., n}) haben einen Zykel der Länge ≥ n2 ?“) oder
Gruppen („Wie viele Isomorphieklassen von Gruppen der Ordnung n ∈ N gibt
es?“). Anwendungen der Kombinatorik gibt es auch in der theoretischen Physik,
besonders der statistischen Mechanik.
8.1
Exponentialfunktion
Hier ist der Grund, warum die Potenzmenge Potenzmenge heißt:
Lemma 8.1 Es sei M eine endliche Menge. Dann gibt es genau 2|M | Teilmengen
von M . Mit anderen Worten: |P(M )| = 2|M | .
Beweis. Jede Teilmenge T ⊆ M ist dadurch bestimmt, welche Elemente von
M in T liegen und welche nicht. Wenn man nun für jedes Element von M separat
wählt, ob das Element in einer bestimmten Teilmenge liegt oder nicht, so gibt
es dafür insgesamt 2|M | viele Wahlmöglichkeiten. Durch jede Wahl entsteht eine
Teilmenge, und durch zwei unterschiedliche Wahlen entstehen auch unterschiedliche Teilmengen.
8.2
Fakultät
Lemma 8.2 Für n ∈ N sind die folgenden vier Zahlen gleich:
a) Die Anzahl der Wege, n verschiedene Objekte durchzunummerieren.
b) Die Anzahl der Bijektionen f : A → B, wobei die Mengen A und B jeweils
n Elemente haben.
c) Die Ordnung |Sn | der symmetrischen Gruppe Sn .
d) n!
71
Beweis. Wir zeigen b) = d) per Induktion über n. Zur Erinnerung: 0! = 1! = 1
und (n + 1)! = n! · (n + 1). Induktionsanfang: Die Aussage ist wahr für n = 0,
nach Definition von 0!. Induktionsschritt: Sei n ≥ 1. Wähle a ∈ A. Es gibt
n Möglichkeiten für den Wert von f (a) ∈ B. Hat man f (a) jetzt gewählt, dann
gibt es laut Induktionsannahme (n−1)! Bijektionen zwischen A\{a} und B \{b},
d.h. diese Wahl von f (a) führt zu (n − 1)! verschiedene Bijektionen zwischen A
und B. Also insgesamt (n − 1)! · n = n! Bijektionen.
Ist A eine Menge mit n Elementen, so ist eine Durchnummerierung von A
das gleiche wie eine Bijektion von {1, 2, . . . , n} nach A. Eine Permutation aus Sn
ist eine Bijektion von {1, 2, . . . , n} nach sich selbst. Daraus folgen die anderen
Aussagen des Lemmas.
8.3
Binomialkoeffizienten
!
n
Definition 8.3 Für n ∈ N0 und k ∈ {0, 1, 2, . . . , n} ist
∈ N0 die Anzahl der
k
k-elementigen Teilmengen einer n-elementigen Menge.
Lemma 8.4 Für n ∈ N0 und 0 ≤ k ≤ n gelten:
!
a)
n
n!
=
k
k!(n − k)!
b)
n
n
=
n−k
k
c)
n
n
=
= 1 und
0
n
!
!
!
!
!
n
= n.
1
!
d) Für k < n ist
!
!
n+1
n
n
=
+
.
k+1
k
k+1
e) Ist p eine Primzahl und 1 ≤ k ≤ p − 1, dann ist
p
k
!
durch p teilbar.
Beweis. d): Sei A eine Menge mit n + 1 Elementen, und sei a ∈ A. Eine
(k + 1)-elementige Teilmenge besteht entweder aus k + 1 Elementen aus A \ {a},
n
oder aus a zzgl. k Elemente aus A \ {a}. Es gibt k+1
Teilmengen der ersten
Sorte, und nk der zweiten.
c) folgt aus der Definition.
b): Man kann eine k-elementige Teilmenge auch dadurch beschreiben, dass
man sagt, welche n − k Elemente nicht drin liegen.
72
a): Induktion über n. Folgt aus c) falls k ∈ {0, 1, n}, daher wahr für n ≤ 2.
Nun sei n ≥ 3 und 0 < k < n. Nach d) und Induktionsannahme ist
!
!
!
n
n−1
n−1
(n − 1)!
(n − 1)!
=
+
=
+
k
k
k−1
k!(n − 1 − k)! (k − 1)!(n − k)!
(n − 1)!(n − k) + (n − 1)!k
n!
=
=
.
k!(n − k)!
k!(n − k)!
e): p teilt p! aber weder k! (denn k < p) noch (p − k)! (denn k > 0).
Binomischer Lehrsatz Sei!R ein kommutativer Ring und a, b ∈ R. Für alle
n
X
n r n−r
n ∈ N0 gilt (a + b)n =
ab .
r=0 r
Beweis. Induktion über n. Klar für n = 1, Definitionssache für n = 0. Nun
sei n ≥ 2. Dann
n
n−1
(a + b) = (a + b) · (a + b)
= (a + b)
n−1
X
!
n − 1 r n−1−r
ab
r
r=0
=
n−1
X
r=0
=
n
X
r=1
X n−1
n − 1 r+1 n−1−r n−1
a b
+
ar bn−r
r
r
r=0
!
X n−1
n − 1 r n−r n−1
ab
+
ar bn−r
r−1
r
r=0
!
= b n + an +
= b n + an +
n−1
X
r=1
n−1
X
r=1
8.3.1
!
!
"
!
!#
n−1
n−1
+
r−1
r
ar bn−r
n
n r n−r
n r n−r X
ab
.
ab
=
r
r=0 r
!
!
Der kleine Satz von Fermat
Satz 8.5 (Kleiner Satz von Fermat) Es sei p ∈ N eine Primzahl. Dann gilt
np ≡ n (mod p) für alle n ∈ N.
Diesen Satz kann man auf zwei Arten beweisen: Gruppentheoretisch und kombinatorisch. Für den gruppentheoretischen Beweis betrachten wir die Einheitengruppe von Z/pZ.
Definition 8.6 Es sei (R, +, ·, 0, 1) ein unitärer Ring. x ∈ R heißt invertierbar
oder eine Einheit, wenn es ein y ∈ R gibt mit x·y = y·x = 1. Die Einheitengruppe
von R ist (R× , ·, 1), wobei R× := {x ∈ R : x invertierbar}.
Es wurde in den Übungen gezeigt, dass die Einheitengruppe tatsächlich eine
Gruppe ist.
73
Beweis des kleinen Satzes von Fermat mit Hilfe des Satzes von Lagrange.
Offenbar ist 0p ≡ 0 (mod p), denn p > 1. Wir betrachten nun n 6= 0.
Da p prim ist, ist (Z/pZ, +, ·, 0, 1) nach Satz 7.22 ein Körper. Er enthält
genau p Elemente. Also ist die Einheitengruppe (Z/pZ)× = ((Z/pZ) \ {[0]}, ·, 1)
und hat die Ordnung p − 1. Nach dem Satz von Lagrange teilt die Ordnung jedes
Elementes [n] ∈ (Z/pZ)× die Ordnung der Gruppe. Also ist [n]p−1 = [1] und
nach Definition der „Kongruenz modulo p“ ist das gleichbedeutend mit np−1 ≡ 1
(mod p). Multiplikation mit n ergibt np ≡ n (mod p).
Beweis des kleinen Satzes von Fermat mit vollständiger Induktion über n.
Induktionsverankerung n = 0: Es ist 0p = 0, da ja Primzahlen nicht Null sind.
Für den Induktionsschritt haben wir die Induktionsannahme, dass np ≡ n
(mod p). Mit anderen Worten: np − n ist durch p teilbar. Es ist zu beweisen, dass
dann auch (n + 1)p − (n + 1) durch p teilbar ist. Nach Induktionsannahme ist
(n + 1)p − (n + 1) ≡ (n + 1)p − (np + 1) (mod p).
P
Nach dem binomischen Lehrsatz ist (n + 1)p = pk=0 kp nk · 1n−k . Für k = 0
p
hat man den Summanden 1, für
k = p hat man den Summanden
n , also ist
Pp−1 p k
p
p
p
n−k
(n + 1) − (n + 1) = k=1 k n · 1 . Nach Lemma 8.4 ist k in jedem der
verbliebenden Summanden durch p teilbar. Daher ist (n + 1)p − (np + 1) und
somit auch (n + 1)p − (n + 1) durch p teilbar.
8.4
Das Vorzeichen einer Permutation
Definition 8.7 Das Vorzeichen ε(σ) einer Permutation σ ∈ Sn ist
ε(σ) :=
σ(j) − σ(i)
.
j−i
1≤i<j≤n
Y
!
!
1 2 3
1 2 3
Beispiel ε
= +1 und ε
= −1.
2 3 1
3 2 1
Definition 8.8 Eine Permutation σ ∈ Sn nennt mant Transposition, wenn sie
lediglich zwei Elemente vertauscht, d.h. wenn es ein n0 ∈ {1, ..., n} gibt, so dass
σ(n0 ) 6= n0 , σ(σ(n0 )) = n0 und σ(k) = k für alle k ∈ {1, ..., n} mit n0 6= k 6=
σ(n0 ).
!
1 2 3
Beispiel
ist eine Transposition, aber
3 2 1
sind keine Transpositionen.
!
1 2 3
2 3 1
!
und
Lemma 8.9 Sei n ≥ 1 und σ ∈ Sn .
a) Es ist ε(σ) = (−1)N für
N = Anzahl der Paare i, j mit i < j und σ(i) > σ(j) .
74
1 2 3
1 2 3
b) Für σ, τ ∈ Sn ist ε(στ ) = ε(σ)ε(τ ): das Vorzeichen ist ein Gruppenhomomorphismus ε : Sn → {+1, −1}.
c) Ist σ ∈ Sn eine Transposition, so ist ε(σ) = −1.
Beweis.
a): Jedes Paar i < j kommt einmal als j − i im Nenner und einmal als ±(j − i)
im Zähler: + falls σ −1 (j) > σ −1 (i) und − sonst.
b): Wegen
σ(i) − σ(j)
σ(j) − σ(i)
=
j−i
i−j
hängt
σ(j)−σ(i)
j−i
nur vom ungeordneten Paar i, j ab. Nun,
ε(στ ) =
Y
i<j
στ (j) − στ (i) Y στ (j) − στ (i)
=
j−i
τ (j) − τ (i)
i<j
!


=
Y
i<j
τ (j) − τ (i)
j−i
!
στ (j) − στ (i) 
ε(τ ) ,
τ (j) − τ (i)
(i)
und i<j σττ (j)−στ
= ε(σ), denn für jedes ungeeordnete Paar a, b kommt σ(b)−σ(a)
(j)−τ (i)
b−a
genau einmal im Produkt vor.
c): Es gibt also i < j mit σ(i) = j, σ(j) = i und σ(`) = ` sonst. Die Anzahl
der Paare in Teil a) ist also ungerade: das Paar i, j, sowie die beiden Paare i, `
und `, j für jedes i < ` < j.
Q
Lemma 8.10 Sei n ∈ N.
a) Jedes σ ∈ Sn lässt sich als ein Produkt von Transpositionen schreiben.
b) Ist σ ∈ Sn ein Produkt von N Transpositionen, so ist ε(σ) = (−1)N .
Für gegebenes σ ist N daher entweder immer gerade (Vorzeichen +1) oder immer
ungerade (Vorzeichen −1).
Beweis.
a): Induktion über m0 = max{m | σ(m) 6= m}. Induktionsanfang: ist m0 < 2,
dann σ = Id.
Für den Induktionsschritt bemerken wir zunächst, dass σ(m0 ) < m0 : Wenn
nämlich m0 6= σ(m0 ), dann ist auch σ(m0 ) 6= σ (σ(m0 )), denn σ ist injektiv.
Sowohl m0 als auch σ(m0 ) werden also durch σ nicht auf sich selbst abgebildet.
Weil m0 maximal ist unter allen Elementen, die durch σ nicht auf sich selbst
abgebildet werden, ist σ(m0 ) < m0 .
Sei τ die Transposition, die m0 und σ(m0 ) vertauscht. Dann hat σ 0 := τ σ
einen kleineren Wert von m0 , und σ = τ σ 0 .
b): Folgt aus a) und Lemma 8.9 b) und c).
75
!
1 2 3
Beispiel
hat Vorzeichen −1 denn es ist eine Transposition.
3 2 1
!
!
!
!
1 2 3
1 2 3
1 2 3 1 2 3
hat Vorzeichen +1, denn
=
.
2 3 1
2 3 1
3 2 1 2 1 3
76
Index
0, 26
1, 30
Abbildung, 14
bijektiv, 15
eingeschränkte, 15
injektiv, 15
surjektiv, 15
Abstraktionsprinzip, 12
Addition (natürliche Zahlen), 30
Äquivalenzklasse, 20
Äquivalenzrelation, 20
antisymmetrisch, 21
Arganddiagramm, 68
assoziativ, 41
Aussage, 1
Aussageform, 11
Aussonderungsaxiom, 12
Auswahlaxiom, 17
Beweis
direkter, 4
durch Kontraposition, 4
durch Widerspruch, 4
Bijektion, 15
bijektiv, 15
Bild, 15
Binomialkoeffizient, 72
Binomischer Lehrsatz, 73
C, 67
Dedekind–unendlich, 24
Differenz, 39
Differenzmenge, 10
direkter Beweis, 4
direktes Produkt, 10
disjunkt, 10
Dividend, 40
Divisionsrest, 40
Divisor, 40
Einheit, 67, 73
Einheitengruppe, 73
Eins, 30
Element, 7
endlich, 24
Erzeugendensystem, 47
euklidischer Algorithmus, 66
erweiterter, 66
Extensionalitätsaxiom, 9
Fakultät, 29, 71
ganze Zahlen, 54
Ganzzahlquotient, 40
Gaußsche Zahlenebene, 68
ggT, 65
Gleichheit
von Mengen, 9
gleichmächtig, 23
größter gemeinsamer Teiler, 65
Gruppe, 43
abelsche, 44
symmetrische, 44
zyklische, 47
Halbgruppe, 41
Homomorphismus, 49
Induktion, 27
vollständige, 27
Induktionsanfang, 27
Induktionsannahme, 28
Induktionsschritt, 27
injektiv, 15
Integritätsbereich, 55
Inverses, 45, 67
additiv, 51
invertierbar, 43, 67, 73
irrationale Zahl, 4
isomorph, 50
Isomorphismus, 50
77
Kardinalität, 8
Kardinalzahl, 23
Kern (einer Abbildung), 50
Koeffizient
eines Polynoms, 62
Körper, 51
kommutativ, 41
komplexe Zahlen, 67
konjugierte komplexe Zahl, 68
Kontraposition, 4
kürzbar, 42
Mächtigkeit, 8, 24
Magma, 41
assoziatives, 41
kommutatives, 41
kürzbares, 42
Menge, 7
endliche, 8, 24
leere, 8
unendliche, 24
Minimum, 38
Monoid, 42
Multiplikation (natürlicher Zahlen), 34
N, 26
Nachfolger, 27
natürliche Zahl, 26
Normalteiler, 50
Null, 26
Nullring, 51
Nullteiler, 55
nullteilerfrei, 55
Ordinalzahl, 26
Ordnung (Gruppenelement), 49
Ordnung (Gruppe), 43
Ordnung (Relation), 21
lineare, 21
Teil-, 21
Peano–Axiome, 26
Permutation, 71
Polynom, 62
normiertes, 62
Potenzieren, 42
Potenzmenge, 10
Potenzmengenaxiom, 10
Prädikat, 11
prim, 59
Primzahl, 59
Produkt
direktes, 10
Q, 57
Quadratwurzel, 5
Quersumme, 60
alternierende, 60
gewichtete, 61
Quotientenkörper, 57
R, 61
reelle Zahlen, 61
Rekursion, 29
Relation, 19
Äquivalenz-, 20
antisymmetrisch, 21
linear, 21
reflexiv, 19
symmetrisch, 19
transitiv, 19
Restklassenring, 58
Ring, 51
kommutativ, 51
trivialer, 51
unitär, 51
Russel–Antinomie, 12
Schnitt, 9
surjektiv, 15
Symmetrie, 43
symmetrische Gruppe, 44, 71
Teilbarkeit, 52
Teiler
größter gemeinsamer, 65
Teilmenge, 9
echte, 23
78
Teilordnung, 21
Term
konstanter, 62
Totalordnung, 21
Umkehrabbildung, 16
unendlich, 24
Unendlichkeitsaxiom, 8
Untergruppe, 46
erzeugte, 46, 47
normale, 50
Urbildmenge, 15
Vereinigung, 9
Verknüpfung
innere, 41
von Abbildungen, 14
vollständige Induktion, 27
Vorgänger, 29
Widerspruchsbeweis, 4
Wohlordnung, 38
Z, 54
Zahlen
ganze, 54
gerade, 5
irrationale, 4
Kardinal-, 23
komplexe, 67
natürliche, 26
Ordinal-, 26
Prim-, 59
rationale, 57
reelle, 61
79