Grundlagen der Mathematik

Werbung
Grundlagen der Mathematik
Irene I. Bouw
Wintersemester 2013/2014
Inhaltsverzeichnis
1 Mengen und Funktionen
1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Logische Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2
5
10
2 Beweismethoden
13
2.1 Der direkte Beweis und Varianten . . . . . . . . . . . . . . . . . . 13
2.2 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Binomialkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . 21
3 Äquivalenzrelationen
25
3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Die ganze und rationale Zahlen . . . . . . . . . . . . . . . . . . . 27
3.3 Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4 Grenzwerte und die Definition der reellen Zahlen
4.1 Berechnung von Quadratwurzeln . . . . . . . . . .
4.2 Definition des Grenzwerts . . . . . . . . . . . . . .
4.3 Cauchy-Folgen . . . . . . . . . . . . . . . . . . . .
4.4 Definition der reellen Zahlen . . . . . . . . . . . . .
4.5 Die Vollständigkeit von R . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
30
30
33
35
37
39
5 Unendliche Mengen
42
5.1 Gleichmätigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2 Das Cantorsche Diagonalargument . . . . . . . . . . . . . . . . . 44
6 Die komplexe Zahlen
45
6.1 Definition der komplexen Zahlen . . . . . . . . . . . . . . . . . . 47
6.2 Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1
A Einige weitere Begriffe
A.1 Teilbarkeit . . . . . . . .
A.2 Ungleichungen . . . . .
A.3 Summen und Produkten
A.4 Körper . . . . . . . . . .
A.5 Polynome . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
B Das griechische Alphabet
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
53
54
55
57
58
59
Mengen und Funktionen
In diesem Kapitel führen wir einige in der Mathematik viel benutzte Objekte, wie Mengen und Funktionen, ein. Aus der Schule werden Sie ein intuitives Verständnis davon haben, was eine Menge oder eine Funktion ist. Wir
besprechen diese Konzepte in diesem Kapitel nochmals um ein gemeinsames
Verständnis dieser Objekte zu haben. Außerdem führen wir einheitliche Bezeichnungen ein.
Im nächsten Kapitel werden wir uns mit Beweistechniken befassen. Viele der
Beweise, die wir in Kapitel 2 studieren, zeigen Eigenschaften von Mengen, Zahlen und Funktionen. Diese Beweise bauen auf den Eigenschaften der in diesem
Kapitel eingeführten Objekte auf.
1.1 Mengen Mengen spielen in allen Teilbereichen der Mathematik eine
Rolle. Es ist erstaunlich, dass die Mengenlehre, also die Theorie der Mengen,
erst seit dem 19ten Jahrhundert systematisch studiert wird. Hier finden Sie eine
historische Übersicht der Geschichte der Mengenlehre:
www-history.mcs.st-andrews.ac.uk/HistTopics/Beginnings of set theory.html
Als Ausgangspunkt unserer Diskussion von Mengen, nehmen wir Cantors Mengenbegriff. Cantor definierte 1874 Mengen wie folgt:
Unter eine Menge verstehen wir jede Zusammenfassung M von bestimmten
wohlunterschiedenen Objekten (Elemente genannt) unserer Anschauung oder
unseres Denken zu einem Ganzen.
Cantors Mengendefinition ist keine Definition im mathematischen Sinne, da
der Begriff nicht auf schon definierte Begriffe zurückgeführt wird. Es ist möglich
den Begriff Menge durch Axiome zu charakterisieren. Dies ist alledings recht
kompliziert. Für uns reicht ein intuitives Verständnis des Begriffs, wie er durch
Cantors Definition beschrieben wird. Wenn man unendliche Menge betrachtet,
führt dieser naive Mengenbegriff alledings leicht zu Widersprüchen.
Cantors Mengenbegriff hört sich zunächst ziemlich abstrakt an. Wir möchten
hier einige Aspekte betonen, die für uns wichtig sind.
Bemerkung 1.1 (a) Eine Menge besteht aus Objekten. Die Elemente einer
Menge brauchen also keine Zahlen sein. Beispielsweise können wir auch die
2
Menge der Studierenden dieser Vorlesung oder die Menge der Buchstaben
des Alphabets betrachten.
(b) Die Elemente einer Menge müssen wohlunterschieden sein, d.h. man muss
sie von Einander unterscheiden können. Das gleiche Objekt kann also nicht
zweimal in einer Menge enthalten sein. Außerdem ist die Reihenfolge, in
der die Elemente aufgezählt wurden, unwichtig.
Wenn x und y das gleiche Element einer Menge M bezeichnen, schreiben wir x = y. Wenn x und y verschiedene Elemente sind, schreiben wir
x 6= y. Da die Elemente der Menge wohlunterschieden sind, können wir
entscheiden welcher der beide Fälle zutrifft.
(c) Die Objekte einer Menge müssen bestimmt sein, d.h. man muß entscheiden
können, ob einem Objekt m in der Menge M enthalten ist oder nicht.
In dieser Vorlesung bezeichnen wir Mengen immer mit Großbuchstaben und
Elemente einer Menge mit Kleinbuchstaben.
Es gibt verschiedene Möglichkeiten eine konkrete Menge zu definieren. Die
einfachste ist die Aufzählung. Hier werden die Objekten der Mengen zwischen
geschweiften Klammer aufgelistet:
M := {a, b, c},
N := {1, 2, 3, . . .}.
Hierbei deutet := an, dass hier ein Symbol definiert wird. Die Auslassungspunkte
(· · · ) deuten an, dass die Reihe nach dem offensichtlichen Muster fortgesetzt
wird. Dies ist manchmal sehr praktisch. Die Menge N der natürliche Zahlen
beispielsweise besitzt unendlich viele Elemente, die man nicht alle Aufzählen
kann.
Wichtige Beispiele von Mengen sind:
N = {1, 2, 3, . . .}
N0 = {0, 1, 2, 3, . . .}
Z = {0, ±1, ±2, . . .}
Q
R
R>0
natürliche Zahlen,
natürliche Zahlen mit Null,
ganze Zahlen,
rationale Zahlen,
reelle Zahlen,
positive reelle Zahlen.
In dieser Vorlesung werden die natürlichen Zahlen N als bekannt vorausgesetzt.
Die Mengen Z, Q und R werden wir in den Abschnitte 3.2 und 4.4 genau definieren. (Bis dahin werden wir diese Mengen trotzdem benutzen und uns auf Ihr
Verständnis aus der Schule verlassen.)
Sehr praktisch ist auch die Möglichkeit die Elemente einer Menge durch eine
Eigenschaft zu definieren. Diese Eigenschaft steht dann hinter einem vertikalen
Strich. Machmal wird hier auch ein Doppelpunkt benutzt. Ein Beispiel ist:
E := {x ∈ Z | x ist gerade } = {0, ±2, ±4, . . .},
P := {n ∈ N>1 | n ist eine Primzahl} = {2, 3, 5, 7, 11, . . . , 37, . . .}.
3
Wir beschreiben einige oft benutzte Bezeichnungen für Mengen.
• x ∈ S: Das Objekt x ist ein Element der Menge S.
• x 6∈ S: Das Objekt x ist kein Element der Menge S. Beispiel: 0 6∈ N.
• ∅: Die leere Menge. In der Schule wird diese Menge oft mit {
} bezeichnet.
• A ∩ B := {x | x ∈ A und x ∈ B}: Die Schnittmenge von A und B. Zwei
Mengen A, B mit A ∩ B = ∅ heißen disjunkt. Ist A eine beliebige Menge,
dann sind A und ∅ disjunkt, da A ∩ ∅ = ∅.
• A ∪ B := {x | x ∈ A oder x ∈ B}: Die Vereinigung von A und B. Die
Menge A ∪ B enthält also alle Objekte, die in A oder in B (oder in beide
Mengen) enthalten sind. Wenn x sowohl in A als auch in B ist, dann ist
x also auch in A ∪ B. Sind die beide Mengen A und B disjunkt, schreibt
man manchmal auch A ⊔ B für die Vereinigung und sagt dazu disjunkte
Vereinigung.
Beispielsweise gilt für jede Menge A, dass A ∪ ∅ = A.
• A ⊂ B: Die Menge A ist eine Teilmenge von B, d.h. alle Elemente von A
sind auch in B. Die Mengen A und B dürfen auch gleich sein. Manchmal
wird auch das Symbol A ⊆ B benutzt. Beispielsweise ist N ⊂ Z.
• A ( B: Die Menge A ist eine Teilmenge von B, aber die beide Mengen
sind nicht gleich. Es existiert also ein Element y ∈ B, das nicht in A ist.
Man sagt auch: A ist eine echte Teilmenge von B.
• A \ B := {x ∈ A | x 6∈ B}: Das Komplement von B in A, auch A ohne B
genannt. Ist B ⊂ A und A aus der Kontext klar, schreibt man manchmal
auch B c anstatt A \ B.
• |A| = #A: Die Mächtigkeit oder Kardinalität der Menge. Wir werden
dieses Symbol nur für Mengen mit endlich vielen Elementen (endliche
Mengen genannt) benutzen.
• A × B := {(a, b) | a ∈ A, b ∈ B}: Das kartesisches Produkt von A und B.
Die Elemente (a, b) sind geordnete Paaren: Die Reihenfolge ist hier wichtig.
Man kann dies auch mehrfach anwenden. Man schreibt An := A × · · · × A,
wobei die Menge A auf der rechten Seite n Mal vorkommt. Beispielsweise
ist R2 = {(x, y) | x, y ∈ R} die reelle Standardebene.
• P(A) := {B | B ⊂ A}: Die Potenzmenge, d.h. die Menge aller Teilmengen.
Wichtige Beispiele von Teilmengen der reelen Zahlen sind Intervalle. In dieser
Vorlesung benutzen wir folgende Bezeichnungen. Seien a, b reelle Zahlen mit
a < b. Dann gilt:
• [a, b] := {x ∈ R | a ≤ x ≤ b}.
4
• [a, b) := {x ∈ R | a ≤ x < b}.
• (a, b) := {x ∈ R | a < x < b}.
• [a, ∞) := {x ∈ R | x ≥ a}. Da ∞ keine reelle Zahl ist, kann dies auch kein
Element einer Teilmenge von R sein.
• (−∞, b) := {x ∈ R | x < b}.
Beispiel 1.2
(a) Die Menge
Q := [−1, 1] × [−1, 1] ⊂ R2
ist ein Quadrat mit Mittelpunkt (0, 0) und Seitenlänge 2.
(b) Sei S = {1, 2}. Dann ist die Potenzmenge
P (S) = {∅, {1}, {2}, {1, 2}}.
Insbesondere ist |P (S)| = 4.
Der folgende Satz gibt einige Eigenschaften der Mengenoperationen, die wir
oben eingeführt haben. Bitte beachten Sie den Klammern. Es ist hilfreich die
Aussagen mit Venn–Diagrammen zu veranschaulichen. Den Beweis diskutieren
wir im nächsten Kapitel (Lemma 2.1) und in den Übungsaufgaben.
Satz 1.3 Seien A, B, C Mengen. Es gilt:
(a) A ∪ B = B ∪ A und A ∩ B = B ∩ A (Kommutativgesetz),
(b) (A∪B)∪C = A∪(B ∪C) und (A∩B)∩C = A∩(B ∩C) (Assoziativgesetz),
(c) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) und (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)
(Distributivgesetz),
(d) (Ac )c = A,
(e) (A ∩ B)c = Ac ∪ B c und (A ∪ B)c = Ac ∩ B c (Regeln von De Morgan).
1.2 Logische Symbole Bevor wir uns im nächsten Kapitel mit mathematischen Beweisen befassen, diskutieren wir jetzt die Formulierung von mathematischen Aussagen. Logische Symbole liefern eine effiziente Art mathematische
Aussagen kompakt darzustellen. Kleine Änderungen in der Formulierung, wie
beispiesweise das Vertauschen zweier Symbole, ändert die Bedeutung oft radikal. Daher ist es wichtig sich mit der genauen Bedeutung der Symbole auseinanderzusetzen. Logische Symbole wie der Implikationspfeil “⇒” sollte man nie
benutzen um etwa einen Zeilenumbruch anzugeben.
Bei der Bearbeitung der Übungsaufgaben ist es oft ratsam die Aussagen
als vollständige Deutsche Sätze zu formulieren, da so die Bedeutung leichter
verständlich ist.
5
Eine Aussage ist eine Äußerung, die entweder wahr oder falsch ist. Alledings
muß man nicht wissen, welches zutrifft. Es reicht, zu wissen, dass genau eine
der Beiden zutrifft.
Beispiele von Aussagen sind:
• Es regnet.
√
• 2∈
/ Q.
• Heute fällt die Vorlesung Grundlagen der Mathematik aus.
• Es existieren unendlich viele Primzahlen.
Keine Aussagen sind:
• Guten Morgen liebe Studierenden.
• Welche Musik hören Sie gerne?
• 2 ⇒ gerade.
Wir führen zunächst die wichtigsten sogenannten Junktoren ein. Dies sind Symbole mit denen wir Aussagen zu neuen Verbinden können. Seien A, B Aussagen.
• A ⇒ B: Aussage A impliziert Aussage B. Dies bedeutet, dass B immer
wahr ist, wenn A wahr ist. Dies entspricht B ⊂ A in der Mengenlehre.
Beispiele sind:
∗ Wenn es regnet, ist die Straße naß.
∗ Wenn n ∈ N durch 4 teilbar ist, ist n auch durch 2 teilbar.
• A ⇐ B: Aussage B impliziert Aussage A. Dies ist gleichbedeutet mit
B ⇒ A.
• A ⇔ B: Die Aussagen A und B sind äquivalent, d.h. B ist genau dann
wahr, wenn A wahr ist. Dies entspricht A = B in der Mengenlehre. Die
Aussagen Es regnet und Die Straße ist naß sind nicht äquivalent. Die
Straße kann beispielsweise auch naß sein, weil ein Straßenputzfahrzeug
vorbei gefahren ist.
• ¬A: Die Aussage “nicht A”. Diese Aussage ist genau dann wahr, wenn die
Aussage A falsch ist. Dies entspricht Ac in der Mengenlehre.
• A ∧ B: Die Aussage “A und B”. Diese Aussage ist genau dann wahr, wenn
A und B beide wahr sind. Dies entspricht A ∩ B in der Mengenlehre.
• A∨B: Die Aussage “A oder B”. Diese Aussage ist genau dann wahr, wenn
mindestens eine der Aussagen A, B wahr ist. Es dürfen also auch beide
Aussagen wahr sein: Das mathematische “oder” ist nicht gleichbedeutend
mit “entweder oder”. Das Symbol A ∨ B entspricht also A ∪ B in der
Mengenlehre.
6
Die unterstehende Wahrheitstafel illustriert die Bedeutung der Aussagen aus
obiger Liste. Für alle Möglichkeiten, ob die Aussagen A und B wahr (“w”) oder
falsch (“f”) sind, finden Sie in der Tabelle ob die zusammengesetzte Aussage
wahr oder falsch ist.
A B
A⇒B
A⇔B
A∧B
A∨B
w
w
w
w
w
w
w
f
f
f
f
w
f
w
w
f
f
w
f
f
w
w
f
f
.
Besonders betonen möchten wir, dass die Aussage A ⇒ B genau dann wahr
ist, wenn entweder A und B beide wahr sind oder wenn A falsch ist. Ist A falsch,
sagt die Aussage A ⇒ B also nichts über die Wahrheit von B aus. Beispielsweise
sind folgende Aussage wahr.
• Wenn die Welt eine Scheibe ist, liegt Ulm auf dem Mond.
• Wenn 6 eine Primzahl ist, ist 6 gerade.
• Wenn der Hahn kräht auf dem Mist, dann ändert sich das Wetter oder es
bleibt wie es ist.
Die Aussage “Das Wetter ändert sich oder es bleibt wie es ist” ist eine Aussage
der Form A ∨ ¬A. Solche Aussagen sind immer wahr und werden Tautologien
genannt.
Das folgende Lemma liefert zwei äquivalente Umformulierungen der Aussage
“A ⇒ B”. Die Äquivalenz der ersten beiden Aussagen ist als Kontrapositionsgesetz bekannt. Die Name deutet schon an, dass dies eine wichtige Regel ist.
Lemma 1.4 (Kontrapositionsgesetz) Seien A und B Aussagen. Die folgende
drei Aussagen sind äquivalent:
A ⇒ B,
¬B ⇒ ¬A,
¬A ∨ B.
Beweis: Dies beweisen wir mit Hilfe einer Wahrheitstafel:
A
B
¬A
¬B
A⇒B
w
w
f
f
w
w
w
w
f
f
w
f
f
f
f
w
w
f
w
w
w
f
f
w
w
w
w
w
7
¬B ⇒ ¬A ¬A ∨ B
Wir sehen, dass alle drei Aussagen genau dann falsch sind, wenn A wahr und B
falsch ist. Alle drei Aussagen sind also äquivalent.
✷
Beispiel 1.5 Wir betrachten die Aussage Wenn heute Sonntag ist, gibt es keine
Vorlesung. Dies ist eine (wahre) Aussage der Form A ⇒ B, mit
A Heute ist Sontag.
B Es gibt keine Vorlesung.
Mit Hilfe des Kontrapositionsgesetzes können wir hieraus die folgende Aussage ableiten: Heute gibt es eine Vorlesung (“¬B”), also ist heute ist kein Sonntag
(“¬A”).
Folgende Aussage folgt NICHT: Es ist Montag, also gibt es heute eine Vorlesung. Die Aussage sagt nichts darüber aus, an welche Tagen Vorlesungen stattfinden.
Die Aussage ¬A ∨ B ist in unserem Beispiel die Aussage:
Heute ist nicht Sonntag oder es gibt keine Vorlesung.
Wir kommen nun zur zweiten Sorte logischer Symbolen: die Quantoren. Wir
betrachten eine Aussage A, die eine Variabele x enthält, die mehrere Werte annehmen kann. Um die Abhängigkeit von x anzudeuten, schreiben wir manchmal
auch A(x) anstatt A. Es macht keinen Sinn zu fragen, ob A(x) wahr ist. Man
kann aber fragen, für welche Werte von x die Aussage A(x) wahr ist. Quantoren
quantifizieren für welche x die Aussage A(x) wahr ist.
Die wichtigste Quantoren sind:
• ∃x A(x): es existiert (mindestens) einen Wert für x, sodass die Aussage
A(x) wahr ist.
• ∀x A(x): für jeden möglichen Wert von x ist die Aussage A(x) wahr.
Die folgenden Aussagen sind Beispiele warer Aussagen.
(a) ∀x ∈ Z
x2 ≥ 0.
(b) ∃x ∈ Q ∀y ∈ Q
y 2 6= x.
Die erste Aussage sagt, dass das Quadrat einer ganzen Zahl immer nicht-negativ
ist. Die zweite Aussage sagt, dass rationale Zahlen existieren, die keine Quadratzahl sind. Um zu zeigen, dass die Aussage wahr ist, müssen wir also eine
konkrete Zahl x mit der gewünschten Eigenschaft angeben. Beispielsweise gilt
dies für x = 2 (siehe Satz 2.6).
Es ist wichtig die Reihenfolge der Quantoren zu betrachten. Betrachte die folgenden zwei Aussagen:
(a) ∀x ∈ R ∃y ∈ R
x + y = 1.
8
(b) ∃y ∈ R ∀x ∈ R
x + y = 1.
Die Aussage (a) sagt, dass wir für alle reelle Zahlen x eine reelle Zahl y mit
x + y = 1 finden können. Die Zahl y darf also von x abhängen. Diese Aussage
ist wahr: wähle y = 1 − x.
Die Aussage (b) sagt, dass ein y ∈ R mit x + y = 1 für alle x existiert. Die
Zahl y hängt hier also nicht von x ab. Diese Aussage ist falsch.
Als nächstes betrachten wir die Negierung von Aussagen. Das folgende Lemma
gibt einige wichtige Regeln. Vergleichen Sie die Aussagen (b) und (c) mit den
Regeln von de Morgan (Satz 1.3.(e)).
Lemma 1.6 Seien A und B Aussagen. Es gilt:
(a) A ist äquivalent zu ¬¬A,
(b) ¬(A ∧ B) ist äquivalent zu (¬A) ∨ (¬B),
(c) ¬(A ∨ B) ist äquivalent zu (¬A) ∧ (¬B),
(d) ¬∃x A(x) ist äquivalent zu ∀x ¬A(x),
(e) ¬∀x A(x) ist äquivalent zu ∃x ¬A(x),
(f) ¬(A ⇒ B) ist äquivalent zu A ∧ ¬B.
Beweis: Die Aussagen (a), (b), (c) und (f) kann man mit Hilfe eines Wahrheitstafels beweisen. Wir überlassen dies der Leser/die Leserin als Übungsaufgabe.
Für (d) betrachten wir die Menge M aller x für die Aussage A(x) wahr ist.
Die Aussage ¬∃x A(x) sagt nun, dass kein x existiert, sodass A(x) wahr ist. Die
Menge M ist also leer. Dies ist aber äquivalent zu der Aussage, dass für alle x
die Aussage A(x) falsch, d.h. ¬A(x) wahr ist. Dies zeigt (d).
Aussage (e) beweist man ähnlich.
✷
Wir geben nun konkrete Beispiele zu den Aussagen von Lemma 1.6. Ein
komplizierteres Beispiel finden Sie in Beispiel 4.4.(b).
Beispiel 1.7 (a) Sei A die Aussage es regnet. Dann ist ¬A die Aussage es
regnet nicht und ¬¬A die Aussage es regnet nicht nicht. Das Letzte ist
offensichtlich das gleiche als die Aussage, dass es regnet.
(b) Wir betrachten nochmals die Aussage Wenn es heute Sonntag ist, gibt es
keine Vorlesung aus Beispiel 1.5. Die Negierung dieser Aussage ist: heute
ist Sonntag und es gibt eine Vorlesung.
(c) Betrachte die Aussage ¬∃x ∈ Q x2 = 2. Diese Aussage sagt, dass keine
rationale Zahl x mit x2 = 2 existiert. Anders gesagt: Alle rationale Zahlen
x erfüllen x2 6= 2. In logische Symbole ausgedrückt ist dies:
∀x ∈ Q
x2 6= 2.
In Satz 2.6 werden wir diese Aussage zeigen.
9
(e) Wir betrachten die Aussage:
¬∃y ∈ R ∀x ∈ R
x + y = 1.
Diese Aussage ist äquivalent zu
∀y ∈ R ∃x ∈ R
x + y 6= 1.
1.3 Funktionen Funktionen sind in der Mathematik mindestens genau so
wichtig wie Mengen. Eine Funktion kann man als eine Relation zwischen Mengen
auffassen. Wichtige Beispiele von Funktionen wie Sinus oder Exponentialfunktion kennen Sie schon aus der Schule.
Definition 1.8 Eine Funktion (oder: Abbildung) ist eine Zuordnungsvorschrift,
bei dem jedes Element des Definitionsbereichs X genau ein Element des Wertebereichs Y zugeordnet wird. Bezeichnung: f : X → Y, x 7→ f (x).
Das Bild einer Funktion f : X → Y ist die Teilmenge {f (x) | x ∈ X} von
Y . Für y ∈ Y heißt f −1 (y) := {x ∈ X | f (x) = y} das Urbild von y. Ähnlich
definieren wir für eine Teilmenge Y1 ⊂ Y das Urbild als
f −1 (Y1 ) := {x ∈ X | f (x) ∈ Y1 }.
Ein wichtiges, aber relativ triviales Beispiel einer Funktion ist die Identität:
IdM : M → M,
m 7→ m.
Diese Abbildung bildet jedes Element der Menge auf sich selbst ab.
Bemerkung 1.9 (a) Beachte, dass der Pfeil 7→ die Zuordnungsvorschrift und
der Pfeil → Definitions- und Wertebereich angibt.
(b) Eine Funktion ordnet jedes x ∈ X genau einem Element f (x) ∈ Y zu.
Das Element f (x) soll also eindeutig durch x bestimmt sein. Diese Eigenschaft einer Funktion nennt man auch Wohldefiniertheit. Beispielsweise ist
die Zuordnung
n 7→ die Primfaktoren vonn,
N≥2 → N≥2
keine Funktion, da n mehr als einen Primfaktor besitzen kann. Die Zuordnung
n 7→ { die Primfaktoren vonn},
N≥2 → P(N≥2 )
ist eine Funktion. Diesmal fassen wir die Menge der Primfaktoren von n
als Element der Potenzmenge auf.
Wir können Funktionen auch als Menge auffassen. Jede Funktion f : X → Y
bestimmt seinen Graph:
Γf := {(x, y) ∈ X × Y | y = f (x)}.
10
Umgekehrt definiert eine Teilmenge Z ⊂ X ×Y genau dann eine Funktion, wenn
die Eigenschaft
∀x ∈ X |Z ∩ {x} × Y | = 1
erfüllt ist. Diese Eigenschaft sagt, dass jedes x ein eindeutiges y = f (x) zugeordnet wird. Wäre |Z ∩ {x} × Y | = 0, würde dieses x nirgendwo hin abbilden.
Wäre |Z ∩ {x} × Y | > 1, würde dieses x auf mehr als ein y abgebildet. Beides
ist laut Definition 1.8 nicht erlaubt.
Definition 1.10 Seien f : A → B und g : B → C Funktionen. Die Funktion
g ◦ f : A → C,
x 7→ g(f (x))
heißt Verknüpfung (oder Komposition) von f mit g.
Streng genommen enthält Definition 1.10 auch die Aussage, dass g ◦ f wieder
eine Funktion ist. Hierzu muss man zeigen, dass die Zuordnung x 7→ g(f (x))
jedes x genau ein Element aus C zuordnet. Dies gilt, da f und g Funktionen
sind.
Sei nun h : C → D eine weitere Funktion. Es folgt aus der Definition,
dass die beide Verknüpfungen h ◦ (g ◦ f ) : A → D und (h ◦ g) ◦ f : A → D
gleich sind, beide bilden nämlich x auf h(g(f (x))) ab. Wichtig hierbei ist, dass
die Funktionen jeweils in der gleichen Reihenfolge auftauchen, wie das folgende
Beispiel erläutert.
Beispiel 1.11 Sei f : R → R, x 7→ x2 und g : R → R, x 7→ 2x − 1. Dann
ist
g ◦ f : x 7→ 2x2 − 1,
f ◦ g : x 7→ (2x − 1)2 .
Beachte, dass die beide Funktionen nicht gleich sind. Beispielsweise ist g ◦f (0) =
−1 und f ◦ g(0) = 1.
Definition 1.12 Sei f : A → B eine Funktion und C ⊂ A eine Teilmenge. Die
Einschränkung von f auf C ist definiert als
f |C : C → B,
x 7→ f (x).
Die Zuordnungsvorschrift einer Einschränkung ist also gleich der ursprungliche Zuordnungsforschrift, aber der Definitionsbereich wird durch eine kleinere
Menge ersetzt. Ein typisches Beispiel ist die Einschränkung der Sinus-Funktion
von R auf dem Intervall [0, 2π].
Definition 1.13 Sei f : X → Y eine Funktion.
(a) Die Funktion f heißt injektiv, wenn für alle x1 , x2 ∈ X gilt, dass f (x1 )
und f (x2 ) nur dann gleich sind, wenn x1 und x2 gleich sind.
(b) Die Funktion f heißt surjektiv, wenn für alle y ∈ Y ein x ∈ X mit der
Eigenschaft f (x) = y existiert.
11
(c) Die Funktion f heißt bijektiv, wenn f sowohl injektiv alsauch surjektiv
ist.
Bemerkung 1.14 Injektiv bedeutet, dass das Urbild f −1 (y) höchstens aus einem Element besteht. Zu jedes y ∈ Y bildet höchstens ein x ∈ X ab.
Surjektiv bedeutet, dass das Urbild f −1 (y) mindestens aus einem Element
besteht. Zu jedes y ∈ Y bildet mindestens ein x ∈ X ab. Eine Funktion f : X →
Y ist also genau dann surjektiv, wenn f (X) = Y ist.
Bijektiv bedeutet, dass das Urbild f −1 (y) genau aus einem Element besteht.
Wir können die Elemente von Y ein eindeutiges Urbild x ∈ X zuordnen.
Beispiel 1.15 (a) Die Funktion f : R → R, x 7→ x2 ist weder injektiv noch
surjektiv.
(b) Die Funktion f : R → [0, ∞), x 7→ x2 ist surjektiv, aber nicht injektiv.
(c) Die Funktion g : R → R, x 7→ x3 ist sowohl injektiv alsauch surjektiv, also
auch bijektiv.
Lemma 1.16 Sei f : X → Y eine injektive Funktion. Dann existiert eine
Funktion g : f (X) → X mit der Eigenschaft
(1)
f (x) = y
⇔
g(y) = x.
Die Funktion g aus Lemma 1.16 heißt die Umkehrfunktion von f . Die Umkehrfunktion von f wird auch mit f −1 bezeichnet und erfüllt die Eigenschaft:
f −1 ◦ f = IdX : X → X,
f ◦ f −1 Idf (X) : f (X) → f (X).
Beweis: Sei f : X → Y injektiv. Wir bemerken, dass die Funktion f : X →
f (X) auch surjektiv, also bijektiv, ist.
Wir definieren g : f (X) → X durch die Zuordnung y 7→ x, wobei x ein
Element aus X mit f (x) = y ist. Da y ∈ f (X) ist, existiert ein solches Element
x. Wir zeigen, dass diese Zuordnung eine Funktion definiert, also, dass g : x 7→ y
wohldefiniert ist.
Wir nehmen an, dass ein weiteres Element x′ ∈ X mit f (x′ ) = y existiert.
Nun gilt f (x) = f (x′ ) = y. Da f injektiv ist, gilt also x = x′ . Dies zeigt, dass g
wohldefiniert ist. Die Eigenschaft (1) ist offensichtlich erfüllt.
✷
Beispiel 1.17 (a) Das Caesar–Chiffre ist ein Verschlüsselungsverfahren, dass
schon von Julius Caesar für seinen persönlichen Korrespondenz benutzt
wurde. Um dem Nachricht zu verschlüsseln, wird jeder Buchstabe um drei
verschoben:
x
a b c d ··· z
f (x)
d e
12
f
g
···
c.
Die Nachricht hallo wird also zu kdoor verschlüsselt. Um die Nachricht
zu entschlüsseln wenden wir die Umkehrfunktion an:
f (x)
d
e
f
g
···
c
x
a
b
c
d ···
z.
Damit man eine verschlüsselte Nachricht eindeutig entschlüsseln kann, ist
es wichtig, das der Verschlüsselungsvorschrift bijektiv ist. Wenn wir beispielsweise die ite Buchstabe auf den 2ite Buchstabe abbilden, erhalten
wir folgende Verschlüsselungsvorschrift:
x
a
b
c
d
···
n
o
···
f (x)
b
d
f
h
···
b
f
··· .
Wenn der verschlüsselte Nachricht die Buchstabe b enhählt, wissen wir
nicht, ob dies ursprunglich eine a oder eine n war. Wir können die Nachricht also nicht eindeutig entschlüsseln.
Mehr zu Verschlüsseln erfahren Sie nächstes Semester in der Vorlesung
Elementare Zahlentheorie.
(b) Die Funktion f : R → R, x 7→ x3 ist bijektiv. Die Umkehrfunktion ist
g : R → R, y 7→ y 1/3 .
(c) Die Funktion cos : [0, π] → [−1, 1] ist bijektiv. Die Umkehrfunktion heißt
arccos : [−1, 1] → [0, π].
(d) Die Funktion exp : R → (0, ∞) ist bijektiv. Die Umkehrfunktion heißt
log : (0, ∞) → R. Beachte, dass wir mit log der Logarithmus zur Basis e
bezeichnen.)
2
Beweismethoden
2.1 Der direkte Beweis und Varianten In diesem Abschnitt beschreiben
wir die erste drei Beweismethoden, die Varianten des direkten Beweises sind.
Diese Methode beschreiben wir nun als erste.
Der direkte Beweis. Ziel ist es eine Ausage der Form A ⇒ B zu beweisen.
Der Beweis folgt folgende Schritten: Wir nehmen an, dass die Aussage A gilt.
Wir versuchen hier aus die Aussage B abzuleiten. Hierzu benutzt man schon
bekannte Sätze und Definitionen. Es gibt kein allgemeines Rezept, wie man dies
am Einfachsten macht. Hier hilft nur learning by doing.
Wir zeigen das Verfahren an Hand von einige Beispielbeweisen. Wir geben
hier nicht nur den Beweis, sondern versuchen auch zu beschreiben, wie man
hier vor geht. Dadurch ist der Beweis selbstverständlich viel ausführlicher als
beispielsweise im Skript der Vorlesung Lineare Algebra.
Als erste betrachten wir die erste Aussage von Satz 1.3.(c).
13
Lemma 2.1 Seien A, B, C Mengen. Dann gilt
(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C).
Beweis: Die Aussage ist zunächst nicht als Implikation formuliert. Wir benutzen, dass zwei Mengen M und N genau dann gleich sind, wenn M ⊂ N und
N ⊂ M (Bemerkung 1.1.(d)).
Wir müssen also folgende zwei Aussagen zeigen:
(I) (A ∪ B) ∩ C ⊂ (A ∩ C) ∪ (B ∩ C),
(II) (A ∪ B) ∩ C ⊃ (A ∩ C) ∪ (B ∩ C).
Wir zeigen zunächst (I). Diese Aussage kann man als Implikation auffassen,
in dem man (I) zu
x ∈ (A ∪ B) ∩ C ⇒ x ∈ (A ∩ C) ∪ (B ∩ C)
umformuliert. Jetzt legen wir los mit dem eigentlichen Beweis.
Sei x ∈ (A ∪ B) ∩ C ein beliebiges Element, also ist x ∈ A ∪ B und x ∈ C
(Dies folgt aus der Definition der Schnittmenge.) Die Definition der Vereinigung
impliziert, dass mindestens eine der folgende Aussagen gilt:
(i) x ∈ A und x ∈ C, d.h. x ∈ A ∩ C,
(ii) x ∈ B und x ∈ C, d.h. x ∈ B ∩ C.
Hieraus folgt, dass x ∈ (A ∩ C) ∪ (B ∩ C). Dies beweist (I).
Wir zeigen (II). Sei dazu x ∈ (A∩C)∪(B ∩C), d.h. x ∈ A∩C oder x ∈ B ∩C.
Wir nehmen an, dass x ∈ A ∩ C. Der andere Fall ist ähnlich. Es gilt x ∈ A
und x ∈ C. Die Menge A ist eine Teilmenge von A ∪ B, also ist x ∈ A ∪ B. Wir
schließen, dass x ∈ (A ∪ B) ∩ C ist. Dies zeigt (II) und daher die Aussage. ✷
Hier sind einige Bemerkungen zum Struktur des obigen Beweises.
Bemerkung 2.2 (a) Am Anfang ist es wichtig genau hinzuschreiben, was
man zeigen muss und was bekannt ist. Bei komplizierten Formeln ist es
wichtig genau hinzuschreiben, was die einzele Symbole und Begriffe bedeuten. Der obige Beweis ist fast trivial, wenn man alle Definitionen genau
hingeschrieben hat.
(b) In Teil (II) des obigen Beweises machen wir einen Fallunterscheidung. Hier
muss man aufpassen, dass die Fälle alle Möglichkeiten abdecken.
(c) Bitte beachten Sie, dass Ihre Übungsblätter von studentischen Hilfkräfte
korrigiert werden. Versuchen Sie möglichst klar zu formulieren. Wenn der
Korrektor nicht versteht was Sie schreiben, bekommen Sie keine Punkte!
Hier ist ein weiteres Beispiel eines direkten Beweises. Die Definition des
Urbilds f −1 (Y ) finden Sie in Definition 1.8.
14
Lemma 2.3 Sei f : A → B eine Funktion und seien X1 , X2 ⊂ A und Y1 , Y2 ⊂ B
Teilmengen. Dann gilt:
(a) f (X1 ) \ f (X2 ) ⊂ f (X1 \ X2 ),
(b) f −1 (Y1 \ Y2 ) = f −1 (Y1 ) \ f −1 (Y2 ).
Beweis: Wir beweisen zuerst (a). Hierbei gehen wir wie im Beweis von
Lemma 2.1.
Sei y ∈ f (X1 ) \ f (X2 ). Da y ∈ f (X1 ) ist, existiert ein x ∈ X1 mit f (x) = y.
Da y ∈
/ f (X2 ), existiert kein x2 ∈ X2 mit f (x2 ) = y. Insbesondere gilt x ∈
/ X2 .
Also ist x ∈ X1 \ X2 . Wir schließen, dass y ∈ f (X1 \ X2 ) ist.
Wir beweisen nun (b). Wir müssen folgende zwei Inklusionen zeigen:
(I) f −1 (Y1 \ Y2 ) ⊂ f −1 (Y1 ) \ f −1 (Y2 ),
(II) f −1 (Y1 \ Y2 ) ⊃ f −1 (Y1 ) \ f −1 (Y2 ).
Wir zeigen zuerst (I). Sei x ∈ f −1 (Y1 \Y2 ). Dies bedeutet, dass f (x) ∈ Y1 \Y2 .
Also gilt f (x) ∈ Y1 und f (x) ∈
/ Y2 . Dies bedeutet, dass x ∈ f −1 (Y1 ) \ f −1 (Y2 ).
Der Beweis von (II) ist ähnlich.
✷.
Eine Variante des direkten Beweises ist der indirekte Beweis oder Beweis
durch Kontroposition. Wir möchten wieder eine Aussage der Form A ⇒ B
beweisen. Mit Hilfe des Kontropositionsgesetzes (Lemma 1.4) können wir dies
zu ¬B ⇒ ¬A umformulieren. Wir nehmen an, dass B nicht gilt und versuchen
hieraus abzuleiten, dass A auch nicht gilt.
Beispiel 2.4 (a) Ein (nichtmathematisches) Beispiel eines indirekten Beweises
ist der sogenannte “Alibibeweis”. Frau Z. wird beschuldigt am 01.04.2013 um
23.05 Uhr einen Einbruch auf einem Juweliersgeschäft verübt zu haben. Frau
Z. behauptet unschuldig zu sein. Als Beweis führt Sie einen Blitzfoto für den
fraglichen Uhrzeit an.
Wir betrachten folgende Aussagen:
(I) Frau Z. hat am 01.04.2013 um 23.05 Uhr den Einbruch begangen.
(II) Frau Z. war am 01.04.2013 um 23.05 Uhr im Juweliersgeschäft.
Aussage (I) impliziert (II). Außerdem gilt ¬(II). Hieraus leiten wir ab, dass
auch ¬(I) gilt. Frau Z. wird also freigesprochen.
(b) Sei n ∈ N. Wir zeigen die Aussage: n2 gerade ⇒ n gerade.
Wir nehmen an, dass n ungerade ist, also existiert ein k ∈ N0 mit n = 2k +1.
Dann gilt n2 = (2k + 1)2 = 4k 2 + 4k + 1 = 2(2k 2 + 2k) + 1. Also ist auch n2
ungerade. Dies beweist die Aussage.
Beachte der Beweis mit dem direkten Beweis. Hier würde man annehmen,
dass n2 gerade ist. Dies bedeutet, dass n2 = 2k für ein k ∈ N. Jetzt muss
man ausnutzen, dass 2k eine Quadratzahl ist um hieraus abzuleiten, dass n
auch gerade ist. Dies ist etwas komplizierter als der entsprechenden indirekten
Beweis.
15
Eine dritte Variante ist der Widerspruchsbeweis auch reduktio ad absurdum genannt. Man möchte eine Aussage (I) zeigen. Man nimmt an, dass ¬ (I)
gilt und versucht einen Widerspruch abzuleiten. Ein Widerspruch kann z.B. eine
falsche Aussage wie 0 = 1 oder A ∧ ¬A sein. Ähnlich wie beim indirekten Beweis
folgt hieraus, dass die Annahme ¬ (I) nicht gestimmt haben kann, also ist (I)
wahr.
Als Beispiel eines Widerspruchsbeweises betrachten wir der Satz von Euklid. Der Beweis benutzt den Fundamentalsatz der Arithmetik, der sagt, dass
jede natürliche Zahl n ≥ 2 eine Primfaktorzerlegung besitzt, also als Produkt
von Primzahlen geschrieben werden kann. Diese Zerlegung ist eindeutig bis auf
Reihenfolge. Dieser Satz wird nächstes Semester in der Vorlesung Elementare
Zahlentheorie bewiesen ([1, Theorem 1.2.4], siehe auch Theorem 2.14).
Satz 2.5 (Euklid) Es existieren unendlich viele Primzahlen.
Beweis: Annahme: Es existieren nur endlich viele Primzahlen. Sei P =
{p1 , . . . , pr } die (endliche) Menge aller Primzahlen. Die Zahl 2 ist eine Primzahl,
also ist P nicht leer.
Sei N := 1 + p1 · p2 · · · pr . Dies ist eine natürliche Zahl größer gleich 2, also
besitzt N eine Primfaktorzerlegung. Die Zahlen p1 , . . . , pr sind laut Annahme
die einzige Primzahlen. Es existieren also Zahlen ai ∈ N0 , sodass
N = pa1 1 · · · par r .
Insbesondere teilt mindestens eine der pi die Zahl N . Wir nennen diese Aussage
(I).
Wir zeigen nun, dass keine der pi die Zahl N teilt. Dies ist die Aussage ¬
(I). Wenn pi | N , dann teilt pi auch N − p1 · p2 · · · pr = 1. Dies gilt aber nicht,
da pi ≥ 2 ist. Also ist pi kein Teiler von N .
Wir haben nun einen Widerspruch enthalten: Wir haben gezeigt, dass sowohl
(I) alsauch ¬ (I) gilt. Wir schließen, dass die Annahme falsch ist. Dies beweist
den Satz.
✷
Hier ist ein zweiter Widerspruchsbeweis.
Satz 2.6 Es existiert kein x ∈ Q mit x2 = 2.
Beweis: Annahme: Es existiert ein x ∈ Q mit x2 = 2. Wir dürfen annehmen, dass x ≥ 0 ist. Falls nämlich ein x ∈ Q mit x ≤ 0 und x2 = 2 existiert,
erfüllt y := −x auch y 2 = 2 und außerdem gilt y ≥ 0. Die Zahl y erfüllt also die
Anforderungen.
Wir nehmen also an, dass x ≥ 0 eine rationale Zahl mit x2 = 2 ist. Offensichtlich ist x 6= 0. Wir können also x = p/q mit p, q ∈ N und p und q teilerfremd
schreiben.
Es folgt, dass
p2
x2 = 2 = 2,
q
16
also p2 = 2q 2 . Wir schreiben p = 2i · p′ und q = 2j · q ′ mit p′ , q ′ ungerade.
(Hier benutzen wir wieder der Fundamentalsatz der Arithmetik.) Einsetzen in
p2 = 2q 2 liefert 2i = 2j + 1. Diese Zahl ist also sowohl gerade als auch ungerade.
Dies liefert einen Widerspruch. Die Annahme ist daher falsch und der Satz
gezeigt.
✷
Im obigen Beweis steht der Satz “Wir durfen annehmen, dass x ≥ 0 ist.”
Ein übliche Kurzform dieses Satzes ist “ oBdA ist x ≥ 0”, hierbei ist oBdA die
Abkürzung von “ohne Beschränkung der Allgemeinheit”. In unserem Beweis
bedeutet dies, dass wir keine Fallunterscheidung x ≥ 0 und x < 0 machen
müssen, sondern, dass es reicht der Fall x ≥ 0 zu betrachten. Im Beweis haben
wir begrundet wieso dies reicht.
Hier sind noch einige weitere Möglichkeiten einen Beweis zu gestalten.
Beweis durch Beweis einer starkeren Aussage. Manchmal ist es leichter
eine starkere Aussage zu zeigen, als die, die man eigentlich zeigen möchte. Seien
beispielsweise f, g : R → R zwei Funktionen von denen man zeigen möchte, dass
für alle x im Definitionsbereich f (x) + sin(x) ≤ g(x) gilt. Dann reicht es zu
zeigen, dass f (x) + 1 ≤ g(x), da sin(x) ≤ 1 ist. Die zweite Aussage ist meistens
einfacher zu zeigen.
Beweis einer Aussage der Form A ∧ B. Hier sollte man die beide Aussagen
A und B einzeln zeigen.
Beweis einer Aussage der Form A ∨ B. Hier sollte man annehmen, dass eine
der beiden Aussagen (beispielsweise A) nicht gilt und zeigen, dass der andere
(hier also B) gilt. Ein Beispiel ist der Beweis von Satz 3.7.
Beweis einer Aussage der Form A ⇔ B. Hier zeigt man die beide Aussagen:
(I) A ⇒ B,
(II) B ⇒ A.
Möchte man zeigen, dass drei Aussagen A, B, C äquivalent sind, reicht es
folgende drei Aussagen zu zeigen:
(I) A ⇒ B,
(II) B ⇒ C,
(III) C ⇒ A.
Hat man diese drei Aussagen gezeigt, folgen auch die andere Richtungen.
Beispielsweise folgt A ⇒ C aus der Verknüpfung von (I) und (II).
Ein grundlegendes Prinzip ist das Schubfachprinzip (Englisch: pigeonhole
principle). Es wurde erstmals von den deutschen Mathematiker Dirichlet (1805–
1859) formuliert. Dies ist folgende ziemlich offensichtliche Aussage.
Lemma 2.7 (Das Schubfachprinzip) Seien n, m ∈ N mit n > m. Verteilt
man n Objekte auf m Mengen, dann enthält mindestens eine der Mengen mehr
als ein Objekt.
17
Beweis: Wenn die m Mengen alle höchstens ein Element enthalten, gibt
es höchstens m Objekte. Dies widerspricht die Annahme m < n. Die Aussage
folgt.
✷
Die folgende Aussage ist eine Anwendung des Schubfachprinzips.
Lemma 2.8 Seien N und M endlichen Mengen und sei ϕ : M → N eine
Abbildung. Dann ist ϕ genau dann injektiv, wenn ϕ surjektiv ist.
Beweis: Übungsaufgabe
✷
2.2 Vollständige Induktion Vollständige Induktion ist eine Beweismethode, um Aussagen zu zeigen, die von einer natürlichen Zahl n abhängen. Beispiele
solcher Aussagen sind:
(I) f (n) := n2 − n + 41 ist eine Primzahl für alle n ∈ N0 .
(II) 1 + 2 + · · · n = n(n + 1)/2 für alle n ∈ N.
Um eine solche Aussage zu zeigen, muss man also für jedes n die Behauptung
zeigen. Man kann dies für kleines n einfach nachrechnen, aber nicht für alle n.
Wenn die Aussage für kleines n gilt, bedeutet dies nicht, dass die Aussage auch
wirklich stimmt: Die erste Aussage stimmt beispielsweise für n = 0, 1, 2, . . . , 40,
aber nicht mehr für n = 41, da f (41) = 412 keine Primzahl ist. Das kleinste
Gegenbeispiel kann also recht groß sein.
Vollständige Induktion beruht auf der folgenden Eigenschaft der natürlichen
Zahlen.
Das Prinzip des kleinsten Kriminellen Sei S ⊂ N eine nicht-leere Teilmenge. Dann besitzt S ein kleinsten Element.
Wir wenden dieses Prinzip an auf der obigen Aussagen (I) und definieren S :=
{n ∈ N | f (n) ist keine Primzahl} als die Menge der Zahlen n für die Aussage (I)
nicht gilt. Das Prinzip des kleinsten Kriminelen sagt, dass es eine kleinste Zahl
gibt für die die Aussage nicht gilt, diese Zahl ist also der “kleinste Kriminelle”
oder auch das kleinste Gegenbeispiel. In unserem Fall ist dies also n = 41.
Allgemein sagt dieses Prinzip also folgendes. Sei A(n) mit n ∈ N eine Folge
von Aussagen. Wenn Aussage A(n) nicht für alle n ∈ N gilt, dann gibt es eine
kleinste Zahl für die die Aussage nicht gilt. Hieraus leitet sich das Prinzip der
vollständigen Induktion ab. Bei vollständigen Induktion zeigt man, dass es keine
kleinste Zahl n für die eine Aussage A(n) falsch ist, gibt.
Vollständige Induktion. Sei (A(n))n∈N eine Familie von Aussagen. Wir nehmen an, dass folgendes gilt:
(IA) A(1) ist wahr. (Induktionsanfang)
18
(IS) Falls A(n) wahr ist, dann ist auch A(n + 1) wahr (Induktionsschritt).
Dann ist die Aussage A(n) für alle n wahr. (Induktionsschluss)
Wir überlegen uns, wieso das Prinzip der vollständige Induktion aus das des
kleinsten Kriminellen folgt. Sei dazu A(n) wie oben. Wir nehmen an, dass (IA)
und (IS) gelten. Sei S ⊂ N die Mengen der Zahlen für die A(n) nicht gilt. Wir
behaupten, dass S = ∅, also, dass A(n) für alle n wahr ist.
Wir nehmen an, dass S 6= ∅. Nach dem Prinzip des kleinsten Kriminellen
existiert ein kleinstes Element n ∈ S. Wegen (IA) ist n 6= 1. Also ist A(n) falsch
und A(n − 1) wahr. Dies widerspricht (IS). Dies zeigt, dass A(n) für alle n wahr
ist.
Wir betrachten zunächst ein Beispielbeweis.
Lemma 2.9 Für alle n ∈ N gilt 2n > n.
Beweis: Sei A(n) die Aussage 2n > n.
(IA): Die Aussage A(1) ist wahr, da 21 = 2 > 1.
(IS): Wir nehmen an, dass die Aussage A(n) für ein beliebiges n wahr ist, also,
dass 2n > n ist. Diese Annahme heißt Induktionshypothese (IH). Es gilt
2n+1 = 2n · 2. Die Induktionshypothese zeigt also, dass
I.H.
2n+1 = 2n · 2 > n · 2 = n + n ≥ n + 1.
Bei der letzten Abschätzung haben wir benutzt, dass n ≥ 1 ist. Es gilt also die
Aussage A(n + 1).
Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für
alle n ∈ N gilt.
✷
Bemerkung 2.10 (a) Strukturieren Sie bitte Beweise mit Induktion immer so
wie vorgegeben, vor allem am Anfang. Geben Sie insbesondere an, wo Sie die
Induktionshypothese benutzen. Wenn Sie im Induktionsschritt die Induktionshypothese nicht benutzt haben, haben Sie bestimmt einen Fehler gemacht.
(b) Es ist wichtig, dass wir in der Induktionshypothese nichts über n annehmen. Um die Schlußfolgerung zu ziehen müßen wirnämlich die Induktionsschritt
für alle n nacheinander anwenden.
Hier sind noch zwei weitere Beweisen mit Induktion. Lemma 2.11 geht auf
Gauß zurück, der die Aussage für n = 100 im Alter von 7 Jahren gefunden hat
(siehe http://www-history.mcs.st-and.ac.uk/Biographies/Gauss.html
Lemma 2.11 Für alle n ∈ N gilt
1 + 2 + · · · + n = n(n − 1)/2.
19
Beweis: Sei S(n) die Aussage 1 + 2 + · · · + n = n(n + 1)/2.
(I.A.): Die Aussage S(1) ist offensichtlich wahr.
(I.S.): Wir nehmen an, dass S(n) für ein beliebiges n gilt. Es gilt
I.H.
1 + 2 + · · · + n + (n + 1) = n(n + 1)/2 + (n + 1)
= (n + 1)[n/2 + 1] = (n + 1)(n + 2)/2.
Also gilt S(n + 1).
Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für
alle n ∈ N gilt.
✷
Der folgende Satz illustriert, dass die Aussage nicht immer für alle natürliche
Zahlen formuliert sein muss. Beachte, dass im unterstehenden Beweis im Induktionsanfang n = 5 genommen wird.
Satz 2.12 Für alle n ∈ N≥5 gilt:
2 n > n2 .
Wir bemerken, dass die Aussage für n = 1, 2, 3, 4 nicht stimmt. Die Aussage
ist also nicht für alle natürliche Zahlen wahr.
Vor wir den Beweis der Aussage für n ≥ 5 geben, überlegen wir uns auf
einem Schmierzettel zunächst wieso die Aussage stimmt. Der Anfang ist ähnlich
wie im Beweis von Lemma 2.9. Sei A(n) die Aussage aus dem Lemma. Wir
nehmen an, dass A(n) wahr ist. Es gilt:
I.H.
2n+1 = 2n · 2 > 2n2 .
Wir müssen zeigen, dass 2n2 > (n + 1)2 = n2 + 2n + 1. Wir ziehen an beiden
Seiten n2 ab und sehen, dass es reicht zu zeigen, dass n2 > 2n + 1 ist.
Wir beweisen zunächst diese Aussage mit Induktion. Einsetzen von kleinen
Werten zeigt, dass die Hilfsaussage auch für n = 3, 4 gilt.
Lemma 2.13 Für n ∈ N≥3 gilt, dass n2 ≥ 2n + 1.
Wir überlassen den Beweis von Lemma 2.13 als Übungsaufgabe und beweisen
nun Satz 2.12.
Beweis des Satzes: (I.A.) Für n = 5 gilt: 2n = 25 = 32 > 25 = n2 .
(I.S.) Wir nehmen an, dass die Aussage für ein beliebiges n ≥ 5 gilt. Dann
gilt:
I.H.
2n+1 = 2n · 2 > 2n2 = n2 + n2
Lem.
= n2 + 2n + 1 = (n + 1)2 .
Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für
alle n ∈ N≥5 gilt.
✷
20
Zum Abschluß dieses Abschnittes beschreiben wir eine alternative Form der
vollständigen Induktion. Hier sagt die Induktionshypothese nicht nur, dass die
Aussage für ein beliebiges n gilt, sondern, dass die Aussage für alle m kleiner
gleich n gilt.
Zweite Form der vollständigen Induktion Sei (A(n))n∈N eine Familie von
Aussagen. Wir nehmen an, dass folgendes gilt:
(IA) A(1) ist wahr.
(IS) Ist A(m) für alle m ≤ n wahr, ist auch A(n + 1) wahr.
Dann ist die Aussage A(n) für alle n wahr.
Als Anwendung zeigen wir die Existenz der Primfaktorzerlegung.
Theorem 2.14 (Schwache Form der Fundamentalsatz der Arithmetik)
Jeder Zahl n ∈ N≥2 lässt sich als ein Produkt von Primzahlen schreiben.
Beweis: Vorbemerkung: Für n eine Primzahl ist die Aussage trivial: Das
Produkt besteht nur aus einer Primzahl, nämlich die Zahl selber.
(I.A.): Die Aussage stimmt für n = 2, da 2 eine Primzahl ist.
(I.S.): Sei n ≥ 2 beliebig. Wir nehmen an, dass die Aussage für alle m ≤ n
stimmt. Wir zeigen die Aussage für n + 1. Wir unterscheiden zwei Fälle.
Fall I: Die Zahl n + 1 ist eine Primzahl. In diesem Fall folgt aus der Vorbemerkung, dass die Aussage stimmt.
Fall II: Die Zahl n + 1 ist keine Primzahl. In diesem Fall existieren Zahlen
1 < m1 , m2 < n + 1 mit n + 1 = m1 · m2 . Dies folgt aus der Definition des
Begriffs Primzahl (siehe Appendix A.1). Die Induktionshypothese impliziert,
dass m1 und m2 ein Produkt von Primzahlen sind. Also ist auch n + 1 ein
Produkt von Primzahlen.
Aus dem Prinzip der vollständigen Induktion folgt also, dass die Aussage für
alle n ∈ N gilt.
✷
Bemerke, dass die erste Version der Induktion hier nicht weiterhilft, da kein
Bezug zwischen der Primfaktorzerlegung von n und von n + 1 besteht.
2.3 Binomialkoeffizienten Als Anwendung der vollständigen Induktion
definieren wir in diesem Abschnitt die Binomialkoeffizienten. In den Beweisen
der Eigenschaften benutzen wir immer wieder das Prinzip der vollständigen Induktion.
Es gilt
(1 + x)0 = 1,
(2)
(1 + x)1 = 1 + x,
(1 + x)2 = 1 + 2x + x2 ,
(1 + x)3 = 1 + 3x + 3x2 + x3 .
21
Hierbei ist x eine Variabele. Die Koeffizienten in diesen Ausdrücke heißen Binomialkoeffizienten, da sie beim Ausmultiplizieren des Binoms (1 + x)n auftreten.
Definition 2.15 Seien
k, n ∈ N0 Zahlen mit k ≤ n. Wir definieren den Bino
mialkoeffizienten nk durch die Gleichung
n X
n k
n
n
n n
(1 + x) =
x =
+
x + ··· +
x .
k
0
1
n
n
k=0
Man nennt
n
k
üblicherweise “n über k”.
Einige Werte überlegt man sich relativ leicht. Beispielsweise gilt:
n
n
n
n
= 1,
=
= n.
(3)
=
n
1
n−1
0
Unser erstes Ziel ist es, eine Ausdruck für die Binomialkoeffizienten zu geben.
Dazu werden wir folgendes Lemma benutzen. Die Aussage des Lemmas hängt
von zwei Parameter k, n ab. Wir beweisen die Aussage mit Induktion nach n.
Die Aussage A(n) ist daher die Aussage (4) für festes n und erlaubte Werte für
k.
Lemma 2.16 Für n ∈ N und 0 < k ≤ n gilt:
n+1
n
n
(4)
=
+
.
k
k−1
k
Beweis:
(I.A.)
Sei n = 1. Der einzige erlaubte Wert für k ist k = 1. Aus (2) folgt,
dass 21 = 2 und 10 = 11 = 1. Die Aussage stimmt also für n = 1.
(I.S.) Wir nehmen an, dass die Aussage gilt für ein beliebiges n und alle
0 < k < n. Wir schreiben
(1 + x)n+1 = (1 + x)n (1 + x)
n
n
n n
I.H.
=
+
x + ···+
x (1 + x).
0
1
n
Der Koeffizient von xk in (1 + x)n+1 ist also
n+1
n
n
=
·1+
· 1.
k
k−1
k
Dies zeigt die Aussage für n + 1 und 0 < k < n.
Sei nun k = n. (Der Fall k = n müssen wir getrennt betrachten, da wir
hier die Induktionshypothese nicht anwenden können.) In diesem Fall folgt die
Aussage aus (3).
Die Aussage des Lemmas folgt mit Induktion.
✷
22
Die Aussage des Lemmas kann man mit Hilfe des Pascalsche Dreieck visualisieren:
1
1
1
1
1
1
2
3
4
1
3
6
..
.
.
1
4
1
Das Diagram ist wie folgt aufgebaut. An den Außenseiten stehen 1en. Jede
weitere Zahl bekommt man, indem man die zwei schräg darüber stehende Zahlen
uisammenzählt. Dies ist genau die Aussage von Lemma 2.16.
Das Dreieck wurde nach dem Französischen Mathematiker Blaise Pascal
(1623–1662) genannt, siehe http://www-history.mcs.st-andrews.ac.uk/Biographies/Pascal.html.
Das Pascalsche Dreieck war der chinesische Mathematiker Chia Hsien, der im
11. Jahrhundert lebte, bekannt. (Siehe
http://www-history.mcs.st-andrews.ac.uk/Biographies/Jia Xian.html).
Definition 2.17 Sei n ∈ N0 . Wir definieren n! (ausgesprochen n Fakultät)
induktiv durch
0! = 1,
(n + 1)! = (n + 1) · n!.
Die Definition 0! = 1 impliziert, dass folgende Aussage auch für k = 0, n gilt.
Satz 2.18 Für alle k, n ∈ N0 mit 0 ≤ k ≤ n gilt:
n!
n
.
=
k!(n − k)!
k
Beweis: Wir zeigen die Aussage mit Induktion nach n.
(I.A.) Sei n = 0. Der einzige mögliche Wert für k ist k = 0. Die Aussage gilt
offensichtlich. (Hier benutzen wir 0! = 1.)
(I.S.) Wir nehmen an, dass die Aussage für ein beliebeiger Zahl n und alle
0 ≤ k ≤ n gilt. Wir möchten nun Lemma 2.16 anwenden. Da dieses Lemma nur
für 0 < k < n + 1 gilt, betrachten wir zunächst die Fälle k = 0 und k = n + 1
getrennt.
Fall I: k = 0, n + 1. Dieser Fall folgt wieder aus (3).
Fall II: k 6= 0, n + 1. Sei nun 0 < k < n + 1. Lemma 2.16 zeigt, dass
n+1
n
n
=
+
.
k
k−1
k
23
Wir wenden die Induktionshypothese auf den beiden Binomialkoeffizienten
auf der rechten Seitenan. Wir schließen, dass
n+1
n!
n!
=
+
k
(k − 1)!(n − k + 1)! k!(n − k)!
1
1
n!
+
=
(k − 1)!(n − k)! n − k + 1 k
n!
(n + 1)!
k+n−k+1
=
=
.
(k − 1)!(n − k)! k(n − k + 1)
k!(n + 1 − k)!
Dies zeigt die Aussage für n + 1 und 0 < k ≤ n. Die Aussage des Satzes folgt
also mit Induktion.
✷
Korrolar 2.19 Seien k, n ∈ N0 mit 0 ≤ k ≤ n. Sei X eine Menge mit n
Elemente.
Dann ist die Anzahl der Teilmengen Y ⊂ X mit k Elemente gleich
n
.
Insbesondere
ist nk ∈ N.
k
Beweis: Wir beweisen die Aussage mit Induktion nach n.
(I.A.): Die Aussage ist offensichtlich richtig für n = 0.
(I.S.): Wir nehmen an, dass die Aussage für n1 stimmt. Wir zeigen die Aussage für n + 1. Wir bemerken zunächst, dass die Aussage auch offensichtlich
für k = 0 und k = n + 1 richtig ist. Wir durfen also o.B.d.A. annehmen, dass
0 < k < n + 1 ist.
Wir schreiben X = {x1 , x2 , . . . , xn+1 }. Wir betrachten alle Teilmengen Y ⊂
X mit k Elemente. Wir unterscheiden zwei Fälle:
(a) xn+1 ∈
/ Y,
(b) xn+1 ∈ Y .
In Fall (a) ist Y ⊂ X ′ := X \ {xn+1 } = {x1 , x2 , . . . , xn }. Da |X ′ | = n,
können
wir die Induktionshypothese anwenden. Wir schließen, dass X genau
n+1
Teilmengen Y mit |Y | = k und xn+1 ∈
/ Y besitzt.
k
In Fall (b) ist Y ′ := Y \ {xn+1 } ⊂ X ′ eine Teilmenge mit |Y ′ | = k − 1
n
und |X ′ | = n. Die Induktionshypothese impliziert also, dass X ′ genau k−1
n
solche Teilmengen besitzt. Wir schließen, dass X genau k−1 Teilmengen Y
mit |Y | = k und xn+1 ∈ Y besitzt.
Insgesamt besitzt X also
n+1
n
+
k
k−1
Teilmengen mit k Elemente. Die Aussage für n + 1 und 0 < k < n + 1 folgt also
aus Lemma 2.16. Das Korollar folgt mit Induktion.
✷
24
3
Äquivalenzrelationen
In diesem Kapitel besprechen wir Äquivalenzrelationen. Als Anwendung definieren wir Q und Z/mZ.
3.1 Definition In der Mathematik möchten wir oft Objekten, die nicht
gleich sind, doch als gleich betrachten. In der Deutschen Sprache entspricht
dies der Unterschied zwischen “dasselbe” und “ das Gleiche”. Wenn zwei Studierenden beide ein Kopie des Skriptes Lineare Algebra besitzen, dann besitzen
sie das gleiche Skript, aber nicht dasselbe Exemplar des Skriptes.
Ein weiteres Beispiel ist das Konzept von kongruenten Dreiecken. In manche
Beweisen der ebenen Geometrie betrachtet man kongruente Dreiecken als gleich,
auch wenn es verschiedene Dreiecken sind.
Vor wir definieren was eine Äquivalenzrelation ist, betrachten wir zunächst
Relationen.
Definition 3.1 Seien X und Y Mengen. Eine Teilmenge R ⊂ X × Y heißt
Relation.
Eine Relation stellt eine Beziehung zwischen Elemente von X und Y her. Ist
X = Y , nennen wir R eine Relation auf X ist.
Beispiel 3.2 (a) Sei f : X → Y eine Funktion. Der Graph Γf = {(x, y) ∈
X × Y | y = f (x)} von f definiert eine Relation.
(b) Das Symbol ≤ definiert eine Relation auf R, nämlich
R = {(x, y) ∈ R2 | x ≤ y}.
Definition 3.3 Eine Relation R ⊂ M × M heißt Äquivalenzrelation, wenn
folgende drei Bedingungen erfüllt sind:
Ä1 ∀x ∈ M
(x, x) ∈ R (Reflexivität),
Ä2 (x, y) ∈ R ⇒ (y, x) ∈ R (Symmetrie),
Ä3 (x, y), (y, z) ∈ R ⇒ (x, z) ∈ R (Transitivität).
Ist R eine Äquivalenzrelation, schreiben wir x ∼ y anstatt (x, y) ∈ R (ausgesprochen: x ist äquivalent zu y).
Beispiel 3.4 (a) Die Relation ≤ aus Beispiel 3.2.(b) ist keine Äquivalenzrelation:
Die Relation ist reflexiv und transitiv, aber nicht symmetrisch. Die Relation ≤ ist antisymmetrisch. Dies bedeutet, dass aus (x, y) ∈ R und
(y, x) ∈ R folgt, dass x = y ist.
Für die Relation ≤ gilt sogar folgende stärkere Eigenschaft: Ist x 6= y dann
gilt immer entweder x ≤ y oder y ≤ x.
25
(b) Sei f : X → Y eine Funktion. Wir definieren eine Äquivalenzrelation auf
X durch x ∼ x′ genau dann, wenn f (x) = f (x′ ). Überprüfen Sie, dass dies
in der Tat eine Äquivalenzrelation ist.
(c) Sei L ⊂ R2 eine Gerade durch dem Ursprung (0, 0). Dann ist L ein Untervektorraum von R2 .
Wir definieren eine Relation auf R2 durch v ∼ w genau dann, wenn v−w ∈
L. Wir zeigen, dass dies eine Äquivalenzrelation ist. Hierbei benutzen wir,
dass L ⊂ R2 ein Untervektorraum ist.
∗ v − v = (0, 0) ∈ L für alle v ∈ R2 , also ist ∼ reflexiv.
∗ Sei v ∼ w, also v − w ∈ L. Dann ist w − v = −(v − w) auch in L,
also w ∼ v. Dies zeigt, dass ∼ symmetrisch ist.
∗ Sei v ∼ w und w ∼ u, also v − w ∈ L und w − u ∈ L. Dann ist auch
v − u = (v − w) + (w − u) ∈ L, also v ∼ u. Dies zeigt, dass ∼ transitiv
ist.
Definition 3.5 Sei ∼ eine Äquivalenzrelation auf einer Menge M und sei a ∈
M . Die Äquivalenzklasse Ca von a ist die Menge alle Elemente b ∈ M mit b ∼ a.
Wir schreiben M/ ∼ für die Menge der Äquivalenzclasses.
Beispiel 3.6 (a) Wir betrachten die Äquivalenzrelation aus Beispiel 3.4.(b).
Sei x ∈ X und y = f (x). Die Äquivalenzklasse von x ist das Urbild f −1 (y)
von y. Die Menge R2 / ∼ der Äquivalenzklassen kann man mit dem Bild
f (X) identifizieren.
(b) Die Äquivalenzklassen der Äquivalenzrelation aus Beispiel 3.4.(c) sind die
Geraden in R2 parallel zu L.
Wir sehen, dass in beiden Fällen aus obigen Beispiel die Menge eine disjunkte
Vereinigung der Äquivalenzklassen ist. Der folgende Satz sagt, dass dies immer
der Fall ist.
Satz 3.7 Sei ∼ eine Äquivalenzrelation. Zwei Äquivalenzklassen sind entweder
gleich oder disjunkt.
Beweis: Seien Ca und Cb zwei Äquivalenzklassen. Wir nehmen an, dass Ca
und Cb nicht disjunkt sind. Wir müssen zeigen, dass Ca = Cb . (Vergleichen Sie
die Diskussion zu Beweis einer Aussage der Form A ∨ B in Abschnitt 2.1.)
Da Ca ∩ Cb 6= ∅, existiert ein Element c ∈ Ca ∩ Cb . Also gilt c ∼ a und c ∼ b.
Aus der Symmetrie der Äquivalenzrelation folgt auch a ∼ c.
Behauptung I: Ca ⊂ Cb . Sei d ∈ Ca , also d ∼ a. Aus der Transitivität und die
Tatsache a ∼ c folgt, dass auch d ∼ c. Mit c ∼ b folgt jetzt d ∼ b, also d ∈ Cb .
Dies zeigt die Behauptung.
26
Behauptung II: Cb ⊂ Ca . Diese Behauptung folgt ähnlich. (Vertausche a und
b im Beweis von Behauptung I.)
Behauptungen I+II zeigen, dass Ca = Cb und der Satz folgt.
✷
3.2 Die ganze und rationale Zahlen Wir konstruieren daraus die ganze
und die rationale Zahlen aus den natürlichen Zahlen N = {1, 2, 3, . . .}. Wir benutzen dabei die Ergebnisse von Abschnitt 3.1 und geben so weitere Beispiele
von Äquivalenzrelationen. Die Konstruktion erläutert wie man in der Mathematik aus bekannten Objekte neuen konstruieren kann. Obwohl diese Konstruktion
vieleicht etwas kompliziert aussieht, liefert dies die “gleiche” Zahlen wie aus der
Schule bekannt.
Konstruktion der ganzen Zahlen
Um die ganzen aus den natürlichen zahlen zu konstruieren, bemerken wir, dass
wir zwei natürliche Zahlen zwar immer addieren aber im Allgemeinen nicht
subtrahieren können. Wir möchten die natürliche Zahlen daher so erweitern,
dass die Subtraktion immer möglich ist. Dazu betrachten wir die Differenz zweier
natürlichen Zahlen.
Wir definieren eine Äquivalenzrelation ∼Z auf der Menge N × N durch
(a, b) ∼ (c, d)
⇔
a + d = b + c.
Man überprüft leicht, dass dies in der Tat eine Äquivalenzrelation ist.
Zwei Paaren (a, b) und (c, d) natürlicher Zahlen sind genau dann äquivalent,
wenn a − b = c − d. Insbesondere ist (a, b) zu alle Paaren (a + x, b + x) für x ∈ N
äquivalent. Die Äquivalenzklasse C(a,b) eines Paares (a, b) kann man also mit
dem Differenz a − b identifizieren.
Wir schreiben N2 / ∼Z für die Menge der Äquivalenzklassen. Wir identifizieren die Elemente dieser Menge mit den uns bekannten ganzen Zahlen durch die
Zuordnung
ψ : Z → N2 / ∼ Z ,
x 7→ C(x+y,y) .
Hierbei ist y = y eine natürliche Zahl, sodass x + y > 0 ist. Bemerke, dass die
Äquivalenzklasse C(x+y,y) nicht von der Wahl von y abhängt, da (x + y, y) ∼
(x + y ′ , y ′ ). Außerdem ist ψ offenichtlich eine Bijektion. (Die Umkehrabbildung
schickt C(a,b) auf der ganzen Zahl a − b.)
Die bekannte Strukturen +, −, ·, < auf Z kann man auch in Termen dieser
Definition einführen. Beispielsweise ist die Subtraktion zweier Äquivalenzklassen
definiert als
C(a,b) − C(c,d) = C(a−c,b−d) .
Da (a − b) − (c − d) = (a − c) − (b − d) entspricht dies die übliche Subtraktion auf
Z. Wir sehen, dass die Äquivalenzklasse von (a, b) also in der Tat die Differenz
der ganzen Zahlen a und b entspricht.
Wir verzichten hier auf der Diskussion der anderen Operationen.
Konstruktion der rationalen Zahlen
Wir konstruieren die rationalen Zahlen aus den ganzen Zahlen. Wir möchten
27
die ganzen Zahlen so erweitern, dass man durch jede ganze Zahl b 6= 0 teilen
kann.
Sei M = {(a, b) ∈ Z2 | b 6= 0}. Wir definieren eine Äquivalenzrelation
auf M , sodass die Äquivalenzklasse des Paares (a, b) die Zahl a/b entspricht.
Die Definition der Äquivalenzrelation ist motiviert durch die Beobachtung, dass
zwei Brüche a/b und c/d genau dann die gleiche rationale Zahl definieren, wenn
ad = bc. Dies sieht man am Einfachsten, wenn man die Differenz auf einem
Hauptnenner bringt:
a
c
ad − bc
− =
.
b
d
bd
Wir definieren eine Äquivalenzrelation ∼Q auf M durch
(a, b) ∼Q (c, d)
⇔
ad = bc.
Dies ist in der Tat eine Äquivalenzrelation. Die Reflexivität und Symmetrie
sind offensichtlich. Wir überprüfen die Transitivität. Dazu nehmen wir an, dass
(a, b) ∼Q (c, d) und (c, d) ∼Q (e, f ). Dies bedeutet, dass ad = bc und cf = de.
Hieraus folgt, dass adcf = bcde.
Ist cd 6= 0, dann folgt, dass af = be, also (a, b) ∼ (e, f ).
Betrachten wir also den Fall, dass cd = 0 ist. Da d 6= 0, folgt c = 0. Aus
ad = bc und b 6= 0 folgt, dass a = 0. Ebenso folgt aus cf = de und d 6= 0, dass
e = 0. In diesem Fall gilt also auch, dass af = be(= 0), also (a, b) ∼ (e, f ). Dies
zeigt die Transitivität.
Die rationale Zahl a/b ∈ Q entspricht nun also die Äquivalenzklasse des
Paares (a, b). Wir bemerken, dass jede Äquivalenzklasse x ∈ Q ein eindeutiger
Representant (a, b) mit a ∈ Z und b ∈ N und ggT(a, b) = 1 enthält.
3.3
Kongruenzen
Definition 3.8 Sei m ∈ N. Zwei Zahlen a, b ∈ Z heißen kongruent modulo m,
wenn m | (a − b). (Bezeichnung: a ≡ b (mod m).) Die Zahl m heißt Modul der
Kongrenz.
Die Bedingung m | (a − b) bedeutet, dass eine ganze Zahl k mit a = b + km
existiert. Dies ist äquivalent zu der Aussage, dass a und b den gleichen Rest
nach Division durch m haben. Beispielsweise ist 200 ≡ 11 (mod 9), da 200 =
11 + 9 · 21. Alternativ haben 200 und 11 beide den Rest 2 nach Division durch
9.
Lemma 3.9 Kongruenz modulo m ist eine Äquivalenzrelation.
Beweis: Übungsaufgabe.
✷
Definition 3.10 Wir bezeichnen mit Z/mZ die Mengen der Äquivalenzklassen
der Kongruenz modulo m. Diese Äquivalenzklassen nennen wir Kongruenzklassen. Wenn m aus der Kontext klar ist, schreiben wir oft ā für die Kongruenzklasse von a.
28
Jede Zahl a ∈ Z ist kongruent modulo m zu seiner Rest r nach Division
durch m. Die Rest erfüllt 0 ≤ r < m (Appendix A.1). Zwei verschiedene Zahlen
r1 , r2 aus der Menge {0, 1, . . . , m − 1} sind zu Einander nicht kongruent modulo
m. Dies zeigt, dass
Z/mZ = {0, 1, . . . , m − 1}.
Insbesondere ist die Kardinalität von Z/mZ genau m.
Eine Menge von Zahlen a0 , . . . , am−1 , sodass jede ganze Zahl kongruent (modulo m) zu genau einer dieser Zahlen ist, heißt vollständiges Restsystem (mod
m). Die Zahlen 0, 1, . . . , m − 1 bilden ein vollständiges Restsystem (mod m).
Beispiel 3.11 Sei m = 4. Es gilt
0 = {. . . , −8, −4, 0, 4, . . .},
1 = {. . . , −7, −3, 1, 5, . . .}
2 = {. . . , −6, −2, 2, 6, . . .}
3 = {. . . , −5, −1, 3, 7, . . .}.
Wir bemerken, dass −2, −1, 0, 1 auch ein vollständiges Restsystem (mod 4) ist.
Addition (bzw. Multiplikation) ganzer Zahlen definiert auch eine Addition
(bzw. Multiplikation) auf Z/mZ durch
¯ b,
ā + b̄ := a +
¯
ā · b̄ := ab.
Wir zeigen, dass die Addition und Multiplikation) wohldefiniert sind. Dies
bedeutet, dass die Addition und Multiplikation nicht von den gewählten Representanten der Kongruenzklassen abhängen.
Seien a ≡ a′ (mod m) und b ≡ b′ (mod m). Dann existieren Zahlen k, ℓ,
sodass
a′ = a + km,
b′ = b + ℓm.
Also ist
a′ + b′ = (a + b) + (k + ℓ)m ≡ a + b
(mod m),
a′ · b′ = (a + km)(b + ℓm) = ab + (aℓ + bk + kℓ)m ≡ ab (mod m).
Dies zeigt, dass a + b und a′ + b′ (bzw. ab und a′ b′ ) die gleiche Kongruenzklasse
(mod m) definieren.
Das folgende Lemma gibt eine Anwendung von Modulorechnen. Dazu betrachten wir die Darstellung einer natürlichen Zahl n im 10ersystem mit Ziffern
ai ∈ {0, 1, . . . , 9} als
n = (ak ak−1 · · · a2 a1 a0 )10
= ak · 10k + ak−1 · 10k−1 + · · · + a2 · 102 + a1 · 10 + a0 .
29
Lemma 3.12 (Dreierregel) Die Zahl n = (ak ak−1 · · · a2 a1 a0 )10 ist genau dann
durch 3 teilbar, wenn die Quersumme
Q(n) :=
k
X
i=0
ai ≡ 0
(mod 3)
ist.
Beweis: Wir bemerken, dass 10 ≡ 1 (mod 3). Daher ist
n = ak · 10k + ak−1 · 10k−1 + · · · + a2 · 102 + a1 · 10 + a0
≡ ak · 1k + ak−1 · 1k−1 + · · · + a2 · 12 + a1 · 1 + a0 = Q(n) (mod 3).
Dies impliziert, dass n genau dann durch 3 teilbar ist, wenn Q(n) durch drei
teilbar ist.
✷
4
Grenzwerte und die Definition der reellen Zahlen
In diesem Kapitel definieren wir die reellen Zahlen, ausgehend von den rationalen
Zahlen. Wir besprechen diese Definition relativ ausführlich um zu illustrieren
wie man die Konzepte der Mathematik systematisch aufbauen kann. Wir werden
sehen, dass dies ziemlich mühsam ist. Wenn wir im Studium die Grundlagen der
Mathematik systematisch würden, würden man nicht besonders weit kommen.
Außerdem wäre da Studium dann relativ langweilig, da man sich hauptsächlich
mit formalen Argumenten befassen würden. Ein beschränktes Thema, wie die
Definition der reellen Zahlen, kann tatsächlich systematisch aufgebaut worden.
In diesem Kapitel geben wir hiervon einen kleinen Ausschnitt.
√
In der Schule haben Sie gelernt mit nichtrationalen Zahlen wie 2 und π
zu rechnen. Historisch gesehen sind diese Zahlen weniger selbstverständlich, als
wir vieleicht denken.
√ In der klassischen griechischen Mathematik verursachte die
Entdeckung, dass 2 keine rationale Zahl ist (Satz 2.6), große Verwirrung. Hier
finden Sie mehr zur Geschichte der reellen Zahlen:
http://www-history.mcs.st-andrews.ac.uk/HistTopics/Real numbers 1.html.
Die moderne Definition der reellen Zahlen beruht auf dem Begriff der Grenzwert: Reelle Zahlen werden definiert als Grenzwerte von Folgen rationaler Zahlen. In diesem Kapitel befassen wir uns daher zunächst mit diesem Begrif. Im
ersten Abschnitt betrachten wir zunächst eine historische Definition des Grenzwertes.
√
4.1 Berechnung von Quadratwurzeln Wir haben gesehen, dass 2 eine
irrationale Zahl ist (Satz 2.6). Für konkreten Berechnungen ist es daher hilfreich
diese Zahl durch eine geeignete rationale Zahl anzunähern. In diesem Abschnitt
besprechen wir das Heron-Verfahren zur Berechnung von Näherungswerte von
30
Quadratwurzeln. Dieses Verfahren ist nach dem Mathematiker Heron (Alexandrien, Egypten, ∼ 10–75) benannt (Siehe
http://www-history.mcs.st-and.ac.uk/Biographies/Heron.html). Die Methode war
aber schon babylonischen Mathematiker etwa 2000 vor Chr. bekannt. Diese Methode ist im Wesentliche ein Spezialfall der Newton-Methode, die in der Vorlesung Numerik I besprochen wird. Die Methode wird heute immer noch benutzt,
obwohl sie schon 4000 Jahren alt ist!
Sei a ∈ Q>0 die Zahl wovon wir die Quadratswurzel annähern möchten. Wir
fangen an mit irgendeinem Näherungswert x0 6= 0 der gesuchten Quadratwurzel.
Heron betrachtete a ∈ N und wählte die kleinste Quadratzahl großer gleich a.
Die Methode funktioniert aber für beliebigen√Startwerte.
Wir definieren induktiv Näherungen für a durch der Forschrift
1
a
a + x2n
(5)
xn+1 =
xn +
=
.
2
xn
2xn
Wir scheiben (xn )n≥0 für die Folge der Näherungen.
Als
√ Beispiel wählen wir a = 2 und Startwert x0 = 1. Die erste Näherungen
für 2 sind
1
2
3
x1 =
1+
= ,
2
1
2
17
2
1 3
=
+
= 1, 4166 . . .
x2 =
2 2 3/2
12
1 17
577
2
x3 =
=
+
= 1, 4142156 . . .
2 12 17/12
408
√
Da 2 = 1, 41421356 . . . sehen wir, dass schon nach der zweiten Iteration
des Verfahrens die erste drei Stellen richtig sind. Nach der dritten Iteration
sind sogar die erste 6 Stellen richtig. In der Praxis funktioniert dieses Verfahren
immer sehr schnell. (Man kann hier eine genaue Aussage zeigen, aber darauf
verzichten wir in dieser Vorlesung.)
Wir erklären
√ die Idee hinter die Methode. Einfachheitshalber nehmen wir an,
dass 1 ≤ x0 < a =: b ist. Dann ist b2 = a die Flächeninhalt eines Quadrats Qa
mit Seitenlänge b. Der Rechteck R0 mit Seitenlängen x0 und a/x0 hat ebenfalls
Flächeninhalt a. Unsere Annahme impliziert, dass x0 < a/x0 . Dieses Rechteck
ist unsere erste Näherung des Quadrats Qa .
Um eine bessere Näherung zu bekommen, ersetzen wir x0 durch dem Mittelwert
a
1
x0 +
x1 =
2
x0
der Seitenlängen. Wir bemerken, dass
√
a
a
1 ≤ x0 <
< b = a < x1 <
.
x1
x0
Im konkreten Fall ist dies klar. Im allgemeinem Fall folgt dies aus der Annahme
1 ≤ x0 ≤ b.
31
a/x0
R0
a/x1
R1
x0
x1
Abbildung 1: Das Heron–Verfahren
Das Rechteck R1 mit Seitenlängen x1 und a/x1 ist eine bessere Näherung für
dem Quadrat Qa (siehe Abbildung 1). Ebenso ist x1 eine bessere Näherung für
dem Quadratwurzel b als x0 . Wiederholt man das Verfahren, wird die Näherung
immer besser.
Die obige Betrachtung erläutert die Idee hinter das Heron-Verfahren. So
ähnlich könnte Heron es sich auch überlegt haben. Die mathematische Aussage,
die man zeigen möchte ist “die Folge (xn )n∈N0 konvergiert zur Grenzwert b”.
Dies bedeutet nicht nur, dass unsere Näherungen immer besser werden, sondern
auch, dass mann jede erwünschte Genauigkeit erreicht, wenn man das Verfahren
oft genug wiederholt. Das ist nicht das gleiche, also zu sagen, dass die erhaltene
Näherung immer besser wird. Auch wenn die Näherung immer besser wird,
könnte es sein, dass der Zuwachs an Genauigkeit irgendwann so klein ist, dass
egal wie Lange man rechnet, nie wieder eine neue Nachkommastelle richtig wird.
Bei dem Heron–Verfahen ist dies nicht der Fall. Man kann zeigen, dass sich die
Anzahl der Stellen, die schon richtig sind, in jedem Schritt verdoppelt. In der
Numerik nennt man dies quadratische Konvergenz.
Wir zitieren nun die Beschreibung des Verfahren durch Heron
(zitiert nach de
√
Mactutor-Webseite). Heron berechnet eine Näherung für 720. Er identifiziert
diese Zahl mit dem Quadrat Q720 mit Flächeninhalt 720. Anstatt die Formel
(5) zu geben, beschreibt Heron die benötigte Rechenschritte. Variabele und das
Gleichheitszeichen waren in Herons Zeit noch nicht erfunden.
Heron macht zwar keine genaue Aussage darüber,
√ wie viel die Näherung in
jedem Schritt besser wird, aber er bemerkt, dass | a − xi | in jedem Schritt “viel
besser” wird. Er war sich dieser zentralen Punkt also sehr wohl bewußt.
Since 720 has not its side rational, we can obtain its side within a very small
difference as follows. Since the next succeeding square number is 729, which
has 27 for its side, divide 720 by 27. This gives 26 2/3. Add 27 to this, making
53 2/3, and take half this or 26 5/6. The side of 720 will therefore be very
nearly 26 5/6. In fact, if we multiply 26 5/6 by itself, the product is 720 1/36,
so the difference in the square is 1/36. If we desire to make the difference
32
smaller still than 1/36, we shall take 720 1/36 instead of 729 (or rather we
should take 26 5/6 instead of 27), and by proceeding in the same way we shall
find the resulting difference much less than 1/36.
Im nächsten Abschnitt geben wir eine genaue Definition der Folgenkonvergenz.
4.2
Definition des Grenzwerts
Definition 4.1 Eine (reelle) Folge ist eine Abbildung N → R, n 7→ xn . Bezeichnung: (xn )n∈N .
Beispiel 4.2 Wir betrachten die Folge definiert durch
n
1
(6)
an = 1 +
.
n
Beispielsweise ist
a1 = 2,
a2 = 2, 25,
a10 = 2, 5937·,
a100 = 2, 7048 · · · ,
a1000 = 2, 7169 · · · .
Man kann zeigen, dass diese Folge die eulersche Zahl e annähert. Diese Zahl
ist sogar als Grenzwert der Folge definiert. Obige Werte zeigen, dass die ai die
eulersche Zahl nur sehr langszam nähern.
Folgende Definition formalisiert die intuitive Idee, dass die Glieder xn einer
Folge sich den Grenzwert b immer besser annähern. Hier finden Sie ein Lied zur
Definition:
http://www.haverford.edu/astronomy/songs/lehrer/delta.htm
Definition 4.3 Eine Folge (xn )n∈N heißt konvergent mit Grenzwert b falls
(7)
∀ǫ > 0 ∃N ∈ N ∀n ≥ N
|xn − b| < ǫ.
Bezeichnung limn→∞ xn = b oder auch xn → b.
Die Menge Bǫ (b) := {x ∈ R | |x − b| < ǫ} = (b − ǫ, b + ǫ) ist ein Interval
um b. Dieses Interval ist nicht-leer, wenn ǫ wie in Definition 4.3 größer Null ist.
Falls ǫ sehr klein ist, bedeutet xn ∈ Bǫ (b) also, dass xn eine sehr gute Näherung
von b ist. Definition 4.3 sagt daher, dass für ǫ > 0, also insbesondere für sehr
kleine Werte, wir ein N finden, sodass alle xn mit n ≥ N sehr gute Näherungen
von b sind. Nicht nur ist xN eine gute Näherung, aber für alle größere n wird
der Näherung xn nicht mehr wesentlich schlechter. Diese Eigenschaft gilt für
33
beliebig kleine ǫ > 0. Dies bedeutet, dass die Folgeglieder den Wert b beliebig
gut annähern.
Es ist wichtig die Reihenfolge der Quantoren in der Definition zu beachten.
Der Wert N aus (7) wird in Abhängigkeit von ǫ gewählt. Manchmal schreiben wir daher auch N = N (ǫ) um die Abhängigkeit von ǫ zu betonen. Selbstverständlich muss man N um so größer wählen, um so kleiner ǫ ist. Die Aussage
∀ǫ > 0 ∃N ∈ N ∀n ≥ N
|xn − b| < ǫ
bedeutet, dass die Folge ab dem Wert N konstant ist, d.h. xn = b ∀n ≥ N . Dies
sieht man wie folgt.
Für n ≥ N gilt die Ungleichung |xn −b| < ǫ für alle ǫ > 0. Dies bedeutet aber,
dass xn in der Schnittmenge der Intervalle (b − ǫ, b + ǫ) liegt. Diese Schnittmenge
enthält nur b, also ist xb = b.
Beispiel 4.4 (a) Wir definieren eine Folge an = 1/n für n ∈ N. Diese Folge
konvergiert gegen a = 0. Wir zeigen dies mit Hilfe von Definition 4.3. Wir
müssen uns überlegen, wie wir N in Abhänhigkeit von ǫ wählen sollen. Dazu
betrachten wir zunächst folgende Hilfsrechnung:
1
− 0 = 1 < ǫ ⇔ n > 1 .
n
n
ǫ
Damit also |an − a| < ǫ ist, soll n größer als 1/ǫ sein. Wir wählen daher
1
+ 1.
N=
ǫ
Hierbei sind [·] die Gauß-Klammer, siehe Appendix A.2. Selbstverständlich könnte
man N auch noch größer wählen.
Jetzt schreiben wir den Beweis so auf, wie Sie dies auf dem Übungsblatt
machen sollten.
Sei ǫ > 0 beliebig. Wähle N = [ 1ǫ ] + 1. Dann gilt für alle n ≥ N , dass
1
− 0 = 1 ≤ 1 < ǫ.
n
n
N
Also konvergiert die Folge (an )n∈N mit Grenzwert 0.
(b) Wir betrachten nun die Folge definiert durch bn = (−1)n für alle n ∈ N.
Wir möchten mit Hilfe von Definition 4.3 zeigen, dass diese Folge nicht konvergiert, also divergiert. Wir möchten also zeigen, dass keine Zahl b existiert,
sodass die Folge konvergiert mit Grenzwert b. Überlegen Sie sich, dass wir folgende Aussage zeigen müssen (vergleich Lemma 1.6):
∀b ∈ R ∃ǫ > 0 ∀N ∈ N ∃n ≥ N
|an − b| > ǫ.
Sei b ∈ R beliebig. Wir nehmen zuerst an, dass b 6= 1. Dann ist |a2m − b| =
|1 − b| 6= 0. Wähle ǫ = |1 − b|/2. Für beliebiges N ∈ N existiert eine gerade
34
Index n = 2m > N . Für ein solches n gilt also |an − b| > ǫ. Der Beweis für b = 1
ist ähnlich, aber dieses Mal betrachten wir die Folgeglieder a2m+1 = −1.
(c) Wir betrachten die Folge cn = 1−10−n = 0, 9 · · · , 9. (Die Zahl cn enthält
n − 1 Nachkommastellen 9.) Wir zeigen, dass die Folge (cn )n≥2 konvergent mit
Grenzwert 1 ist.
Sei ǫ > 0 beliebig. Wähle N = [max(0, − log10 (ǫ))] + 1. Es gilt also, das N
eine natürliche Zahl mit N > − log10 (ǫ) ist. Für alle n ≥ N gilt daher, dass
|cn − 1| = 10−n ≤ 10−N < 10log10 (ǫ) = ǫ.
Hier haben wir benutzt, dass −N < log10 (ǫ) ist.
In der Vorlesung Analysis I werden Sie verschiedene Kriterien lernen, um
Konvergenz einer Folge zu überprüfen und Rechenregel um Grenzwerte von
konvergente Folgen zu bestimmen. Das folgende Lemma gibt eine erste solche
Rechenregel.
Lemma 4.5 Seien (an )n∈N und (bn )n∈N konvergente Folgen mit
lim = a,
lim bn = b.
n→∞
n→∞
Dann sind die Folgen (an ± bn )n und (an · bn )n auch konvergent mit Grenzwert
a ± b und a · b.
Beweis: Wir beweisen die Aussage für (an − bn ) und überlassen die andere
Teile als Übungsaufgabe.
Wir bemerken, dass
|(an − bn ) − (a − b)| = |(an − a) − (bn − b)| ≤ |an − a| + |bn − b|
wegen der Dreiecksungleichung (Appendix A.2).
Sei ǫ > 0 beliebig. Definition 4.3 impliziert, dass Zahlen N1 , N2 mit
|an − a| < ǫ/2
|bn − b| < ǫ/2
∀n ≥ N1 ,
∀n ≥ N2 .
Wir wählen N = max(N1 , N2 ). Dann gilt für n ≥ N , dass
|(an − bn ) − (a − b)| ≤ |an − a| + |bn − b| ≤
Also ist (an − bn )n konvergent mit Grenzwert a − b.
ǫ
ǫ
+ = ǫ.
2 2
✷
4.3 Cauchy-Folgen Um Definition 4.3 anwenden zu können, ist es notwendig den Grenzwert der Folge zu kennen. Dies ist nicht immer praktikabel.
Beispielsweise möchten wir die eulersche Zahl e als Grenzwert der Folge (6) definieren. Wir können e also nicht im Beweis der Konvergenz der Folge benutzen.
In diesem Abschnitt besprechen wir ein alternatives Kriterium zur Überprüfung
der Konvergenz einer Folge, dass der Grenzwert nicht benutzt.
35
Definition 4.6 Eine (reelle) Folge (an )n∈N heißt Cauchy–Folge, wenn
∀ǫ > 0 ∃N ∈ N ∀n ≥ N ∀p ∈ N
|an+p − an | < ǫ.
In Definition 4.6 vergleichen wir an mit allen folgenden Folgeglieder an+p
anstatt mit dem Grenzwert wie wir es in Definition 4.3 taten. In einer CauchyFolge nähern sich die Folgeglieder also beliebig gut an.
Der folgende Satz zeigt, dass jede konvergente Folge auch eine Cauchy–Folge
ist. Die Umkehrung gilt auch. Der Beweis der Umkehrung benutzt die Definition
der reellen Zahlen, die wir im Abschnitt 4.4 diskutieren (siehe Satz 4.19). Mehr
Details werden nächstes Semester in der Vorlesung Analysis I besprochen.
Satz 4.7 Sei (an )n∈N eine konvergente Folge. Dann ist (an )n∈N eine Cauchy–
Folge,
Wir besprechen zuerst ein Lemma, dass im Beweis von Satz 4.7 benutzt
wird.
Definition 4.8 Eine Folge (an )n∈N heißt beschränkt, wenn C ∈ R mit |an | ≤ C
existiert.
Die Bedingung aus Definition 4.8 bedeutet, dass die an im Interval [−C, C]
liegen und nicht daher beliebig groß oder beliebig klein werden, wenn n gegen
unendlich strebt. Die Zahl C (bzw. −C) heißt obere (bzw. untere) Schranke der
Folge.
Lemma 4.9 Jede konvergente Folge ist beschränkt.
Beweis: Sei (an )n∈N eine konvergente Folge mit Grenzwert a. Sei ǫ = 1. Die
Konvergenz der Folge impliziert die Existenz einer Zahl N mit |an − a| < ǫ = 1
für alle n ≥ N . Für n ≥ N gilt also −1 + a < an < 1 + a. Dies zeigt, dass
(8)
|an | ≤ max(|a − 1|, |a + 1|),
∀n ≥ N.
Die Menge M := {a1 , . . . , aN −1 } ist endlich und besitzt deswegen auch ein
größtes Element. Sei aj das Maximum von M . Insbesondere gilt
(9)
ai ≤ aj
für i = 1, . . . , N − 1.
Wir definieren C = max(|a − 1|, |a + 1|, aj ). Gleichungen (8) und (9) implizieren, dass
|an | ≤ C,
∀n ∈ N.
Also ist die Folge beschränkt.
✷
Lemma 4.9 zeigt, dass Beschränktheit eine notwendige Bedingung für die
Konvergenz ist. Beispielsweise ist die Folge (n)n∈N nicht beschränkt und also
auch nicht konvergent. (Der Grenzwert in Definition 4.3 ist eine reelle Zahl, ∞
ist hier als Grenzwert nicht erlaubt.)
36
Beschränktheit ist nicht hinreichend für Konvergenz. Beispielsweise ist die
Folge ((−1)n )n∈N beschränkt, aber nicht konvergent.
Wir zeigen nun Satz 4.7.
Beweis des Satzes: Sei (an )n eine konvergente Folge mit Grenzwert a und
sei ǫ > 0 beliebig. Da die Folge konvergent ist, existiert ein N > 0, sodass
|an − a| <
ǫ
,
2
∀n ∈ N.
(Man sollte den zu ǫ/2 gehörige Wert N = N (ǫ/2) wählen.)
Sei nun n ≥ N und p ∈ N. Es gilt n + p > n ≥ N , also
|an+p − an | = |an+p − a + a − an |.
Aus der Dreieckungleichung folgt
|an+p − an | ≤ |an+p − a| + |a − an | <
ǫ
ǫ
+ = ǫ.
2 2
Dies zeigt, dass (an )n eine Cauchy–Folge ist.
✷
4.4 Definition der reellen Zahlen In diesem Abschnitt geben wir eine
formale Definition der reellen Zahlen.
In Abschnitt 4.1 haben wir die Folge
2
1
xn−1 +
x0 = 1,
xn =
2
xn−1
definiert. Für jedes n ∈ N ist
√ die Näherung xn eine rationale Zahl. Der Grenzwert
der Folge (xn )n∈N ist aber 2 was keine rationale Zahl ist (Satz 2.6). Wir sagen,
dass Q unvollständig ist: Es existieren konvergente Folgen rationaler Zahlen, die
kein Grenzwert in Q besitzen.
Wir möchten die reelle Zahlen als Grenzwerte solcher Folgen konstruieren.
Da Definition 4.6 Bezug auf den reellen Zahlen nimmt, passen wir die Definition
etwas an. Die Ergebnisse aus Abschnitt 4.3 übertragen sich.
Definition 4.10 Eine Folge (an )n∈N mit an ∈ Q für alle n heißt rationale
Cauchy–Folge, wenn
∀ǫ ∈ Q>0 ∃N ∈ N ∀n ≥ N ∀p ∈ N
|an+p − an | < ǫ.
Wir schreiben CF für die Menge der rationalen Cauchy–Folgen.
Es existieren mehrere Cauchy–Folgen mit dem gleichen Grenzwert, diese
müssen wir mit Hilfe einer geeigneten Äquivalenzrelation auf CF identifizieren.
Definition 4.11 Eine (rationale) Nullfolge ist eine (rationale) Cauchy–Folge
mit Grenzwert 0.
37
Beispielsweise ist (1/n)n∈N eine Nullfolge.
Wir definieren eine Äquivalenzrelation auf die Menge CF durch
(an )n∈N ∼R (bn )n∈N
⇔
(an − bn )n∈N eine Nullfolge ist.
Sind (an )n und (bn )n konvergente Folgen mit Grenzwert a und b, dann sagt
Lemma 4.5, dass (an − bn )n eine konvergente Folge mit Grenzwert a − b ist. Die
konvergente Folgen (an )n und (bn )n sind also genau dann äquivalent, wenn sie
den gleichen Grenzwert haben.
Lemma 4.12 Die Relation ∼R ist eine Äquivalenzrelation.
Beweis: Seien (an )n und (bn )n rationale Cauchy–Folgen.
Reflexivität: Die Folge (an −an )n = (0)n ist eine Nullfolge, also ist (an )n ∼R
(an )n .
Symmetrie: Wir bemerken, dass |bn − an | = |an − bn |. Falls also (an − bn )n
eine Nullfolge ist, ist auch (bn − an ) eine Nullfolge.
Transitivität: Wir nehmen an, dass (an − bn )n und (bn − cn )n Nullfolgen
sind. Lemma 4.5 impliziert, dass die Folge (an − cn ) = (an − bn )n + (bn − cn )n
auch konvergent ist und den Grenzwert 0 + 0 = 0 besitzt.
✷
Definition 4.13 Wir definieren die Menge der reellen Zahlen als
R = CF / ∼R .
Ist (an )n ∈ CF eine rationale Cauchy–Folge, bezeichnet [(an )n ] ∈ R die von
der Folge definierte reelle Zahl.
Jeder Äquivalenzklasse rationaler Cauchy–Folgen “ist” also eine reelle Zahl.
Man sollte sich diese Zahl A vorstellen als der Grenzwert der Folge (an )n . Im
nächsten Abschnitt sehen wir, dass A auch wirklich die Grenzwert der Folge ist
(siehe der Beweis von Satz 4.19).
Jede rationale Zahl r ∈ Q definiert auch eine reelle Zahl, indem wir r mit
der Äquivalenzklasse der konstanten Folge an = r für alle n identifizieren. Wir
können also Q als Teilmenge von R auffassen.
Wir definieren die Adddition und Multiplikation auf R durch
[(an )n ] + [(bn )n ] = [(an + bn )n ],
[(an )n ] · [(bn )n ] = [(an · bn ]n .
Mit Hilfe von Lemma 4.5 zeigt man, dass die Addition und Multiplikation wohldefiniert ist, d.h. der Grenzwert von (an + bn )n hängt nur von der
Äquivalenzklassen [(an )n ] und [(bn )n ] und nicht von der gewählte Folge ab.
Beispiel 4.14 In der Schule werd eine reele Zahl üblicherweise als Dezimalbruchzerlegung betrachtet. Zahlen gegeben durch eine Dezimalbruchzerlegung
sind auch reelle Zahlen im Sinne von Definition 4.13.
38
Sei ξ = x0 , x1 x2 . . . mit x0 ∈ Z und xi ∈ {0, 1, . . . , 9} (i ∈ N). Wir definieren
eine Folge rationaler Zahlen (an )n durch
an = x0 , x1 x2 · · · xn .
Wir behaupten, dass (an ) eine rationale Cauchy–Folge ist.
Sei ǫ > 0 beliebig und wähle N = max(− log10 (ǫ), 1). Dann gilt für n ≥ N
und p ∈ N, dass
|an+p − an | = 0, 0 · · · 0xn+1 · · · xn+p < 10−n ≤ ǫ.
Wir schließen, dass (an )n eine Cauchy–Folge ist. Insbesondere definiert (an )n
eine reelle Zahl.
Umgekehrt kann man zeigen, dass jede reelle Zahl im Sinne von Definition
4.13 durch einer Dezimalbruchzerlegung gegeben werden kann. Sei x = [(an )n ] ∈
R eine reelle Zahl. Die rationale Zahlen an besitzen eine Dezimalbruchzerlegung.
Definition 4.6 zeigt, dass ein N existiert, sodass die erste m Nachkommastellen
der Dezimalbruchzerlegung von an gleich sind für alle n ≥ N . (Hierbei haben
wir ǫ = 10−m in Definition 4.6 gewählt.) Eine Dezimalbruchzerlegung von x
findet man also indem man m gegen unendlich laufen läßt.
4.5 Die Vollständigkeit von R In diesem Abschnitt betrachten wir eine
sehr wichtige Eigenschaft der reellen Zahlen: Die Vollständigkeit (Satz 4.19).
Satz 4.19 sagt sehr informel, dass die reelle Achse “keine Lücken” besitzt. Die
genaue Aussage ist, dass jede reelle Cauchy–Folge einen Grenzwert in R besitzt.
Man kann die Menge der reellen Zahlen also nicht noch weiter vergrößern, indem
man die Grenzwerte der reellen Cauchy–Folgen hinzunimmt.
Reelle Cauchy–Folgen wurden in Definition 4.6 definiert, also vor wir die reelle Zahlen eingeführt hatten. Damit dieser Definition für die von uns definierten
reellen Zahlen Sinn ergibt, müssen wir definieren was x < y für x, y ∈ R bedeutet. Definition 4.16 formuliert dies in Termen der rationalen Cauchy–Folgen, da
die reelle Zahlen Äquivalenzklassen von Cauchy–Folgen sind.
Definition 4.15 Eine rationale Cauchy–Folge (an )n∈N ∈ CF heißt positiv, wenn
ein k ∈ N existiert, sodass höchstens endlich viele n ∈ N mit an ≤ 1/k existieren.
Man kann die Bedingung aus Definition 4.15 auch als
∃k ∈ N ∃N ∈ N ∀n ≥ N
an ≥
1
k
schreiben.
Die Bedingung aus Definition 4.15 bedeutet, dass die Folgeglieder für n
genügend groß weit genug von Null wegbleiben, damit der Grenzwert der Folge
nicht Null sein kann. Dies überlegt man sich mit Hilfe von Definition 4.3.
Damit der Grenzwert einer Cauchy–Folge (an )n positiv ist, reicht es nicht,
dass die Folgeglieder positiv sind. Beispielsweise besitzt die Folge (1/n)n den
39
Grenzwert Null. Dies ist keine positive Folge, da für alle ǫ > 0 und alle genügend
große n die Ungleichung |1/n − 0| = 1/n < ǫ gilt.
Wir schreiben nun P ⊂ CF für die Menge der positive Cauchy–Folgen und
N ⊂ CF für die Menge der Nullfolgen.
Definition 4.16 Seien (an )n , (bn )n ∈ CF zwei rationale Cauchy–Folgen. Wir
definieren [(an )n ] > [(bn )n ] durch (an − bn )n ∈ P.
Wir haben nun zwei Definitionen für Cauchy–Folgen: Neben der reellen
Cauchy–Folgen (Definition 4.6) haben wir in Definition 4.10 die rationale Cauchy–
Folgen definiert. In Definition 4.10 ist ǫ eine beliebige positive rationale Zahl
statt eine reelle Zahl. Folgender Satz zeigt, dass dies kein Unterschied macht.
Insbesondere impliziert dieser Satz, dass rationale Cauchy–Folgen auch reelle
Cauchy–Folgen sind.
Satz 4.17 (Q liegt dicht in R) Seien x < y reelle Zahlen. Dann existiert eine
rationale Zahl q ∈ Q mit x < q < y.
Beweis: Wir wählen rationale Cauchy–Folgen (an )n , (bn )n korrespondierend
zu x und y. Die Bedingung x < y bedeutet, dass ein k > 0 und ein N existiert
mit
1
∀n ≥ N.
bn − an > ǫ :=
k
Da (an )n und (bn )n Cauchy–Folgen sind, existieren N1 , N2 ∈ N, sodass
ǫ
,
4
ǫ
|bn+p − bn | < ,
4
|an+p − an | <
∀n ≥ N1 ∀p ∈ N,
∀n ≥ N2 ∀p ∈ N.
Wir definieren M = max(N, N1 , N2 ) und q = aM + ǫ/2. Da aM und ǫ rationale
Zahlen sind, ist q auch eine rationale Zahl.
Für alle n ≥ M und p ∈ N gilt an − aM ≤ |an − aM | < ǫ/4. Dies impliziert,
dass an + ǫ/4 < aM + ǫ/2 = q. Definition 4.15 impliziert, daher, dass x < q ist.
Evenso gilt für n ≥ M und p ∈ N, dass bM − bn ≤ |bM − bn | < ǫ/4, also
bM − ǫ/4 < bn . Mit bM − aM > ǫ folgt also bn > 3ǫ/4 + xM > xM + ǫ/2 = q.
Hieraus folgt wieder y > q.
✷
Korrolar 4.18 Jede rationale Cauchy–Folge ist auch eine reelle Cauchy–Folge.
Satz 4.19 R ist vollständig, d.h. jede reelle Cauchy–Folge besitzt ein Grenzwert
in R.
Beweis: Sei (an )n∈N eine reelle Cauchy–Folge. Satz 4.17 impliziert, dass ein
αn ∈ Q mit an < αn < an + 1/n existiert.
Behauptung 1: Die Folge (αn )n∈N ist eine rationale Cauchy–Folge.
40
Wir beweisen Behauptung 1. Sei ǫ > 0 beliebig. Da (an )n eine Cauchy–Folge
ist, existiert ein N ∈ N mit
|an+p − an | <
ǫ
3
für alle n ≥ N und alle p ∈ N.
Definiere nun K = max([3/ǫ] + 1, N ). Insbesondere ist 1/K < ǫ/3. Für alle
n ≥ K und p ∈ N gilt
|αn+p − αn | = |(αn+p − an+p ) + (an+p − an ) + (an − αn )|
≤ |αn+p − an+p | + |(an+p − an | + |αn − an |.
Hier haben wir die Dreiecksungleichung benutzt.
Die Definition von K impliziert also, dass
|αn+p − αn | ≤
1
ǫ
1
+ + < ǫ,
n+p 3 n
da 1/(n + p) und 1/n kleiner gleich 1/K < ǫ/3 sind. Dies zeigt Behauptung 1.
Die rationale Cauchy–Folge (αn )n definiert eine reelle Zahl A := [(αn )n ].
Behauptung 2: Die Folge (αn )n ist konvergent mit Grenzwert A.
Um die Behauptung zu zeigen, überprüfen wir die Bedingung aus Definition
4.3.
Sei ǫ > 0 beliebig und sei N ∈ N mit |αn+p − αn | < ǫ für alle n ≥ N
und p ∈ N. Die Zahle N existiert, da (αn )n eine rationale Cauchy–Folge ist
(Definition 4.10). Definition 4.16 impliziert
|A − αn | < ǫ,
∀n ≥ N.
Hier haben wir die rationale Zahl αn als konstante Folge aufgefasst. Dies zeigt
die Behauptung.
Behauptung 3: Die Folge (an )n ist konvergent mit Grenzwert A.
Wir überprüfen wieder die Bedingung aus Definition 4.3.
Sei ǫ > 0 beliebig. Wähle L1 ∈ N, sodass |A − αn | < ǫ/2 für alle n ≥ L1 . (Die
Existenz von L1 folgt aus Behauptung 1.) Satz 4.17 impliziert, dass ein L2 ∈ N
mit 1/L2 < ǫ/2 existiert. Sei L = max(L1 , L2 ).
Es gilt
|A − an | = |A − αn + αn − an | ≤ |A − αn | + |αn − aN | <
Dies zeigt Behauptung 3 und den Satz.
41
1
ǫ
+ ≤ ǫ.
2 n
✷
5
Unendliche Mengen
Die zentrale Frage dieses Kapitel ist, ob Mengen wie beispielsweise N, N0 und Z
gleichmächtig sind, also gleich viele Elemente haben.
Sind N, M endliche Mengen mit N ( M , dann ist die Kardinalität von N
echt kleiner als der Kardinalität von M . Dies folgt aus dem Schubfachprinzip.
Übertragt man dies auf unendlichen Mengen, würde man erwarten, dass N als
echte Teilmenge von N0 kleinere Kardinalität als N0 besitzt. In Bemerkung
5.2 werden wir sehen, dass wir N0 auch in N einbetten können. Größere und
kleinere Kardinalität wäre also nicht wohldefiniert. ir brauchen also eine bessere
Definition.
5.1 Gleichmätigkeit Sei M eine endliche nicht leere Menge. Wir schreiben
n = |M |. Es existiert eine Bijektion ϕ : M → {1, 2, . . . , n} gegeben durch eine
Abzählung de Elemente von M . Zwei endliche Mengen N und M besitzen genau
dann die gleiche Mächtigkeit, wenn eine Bijektion zwischen N und M existiert.
Diesmal schicken wir das ite Element von N auf dem ite Element von M . Dies
motiviert folgende Definition.
Definition 5.1 (a) Seien N, M beliebige, nicht notwendigerweise endliche, Mengen. Die Mächtigkeit von N ist kleiner gleich die Mächtigkeit von M , wenn eine
injektive Abbildung ϕ : N → M existiert. (Bezeichnung: |N | ≤ |M |.)
(b) Zwei Mengen N und M sind gleich mächtig, wenn eine Bijektion ϕ :
N → M existiert. (Bezeichnung: |M | = |N |.)
(c) Eine (unendliche) Menge heißt abzählbar, wenn M die gleiche Mächtigkeit
wie N besitzt. Eine unendliche Menge, die nicht abzählbar ist, heißt überabzählbar.
Man zeigt leicht, dass Gleichmächtigkeit eine Äquivalenzrelation ist. Die
Mächtigkeit einer unendlichen Menge kann man durch eine Kardinalzahl angeben. Die Mächtigkeit von N ist ℵ0 . (Der Index 0 kommt daher, dass N die
kleinste unendliche Menge ist.) Die Buchstabe ℵ ist die erste Buchstabe des hebräischen Alphabet und heißt Aleph. Die weitere Kardinalzahlen sind ℵ1 , ℵ2 , . . ..
Bemerkung 5.2 (Das Hilbert–Hotel) Der folgende Satz sagt, dass die Mengen
N, N0 und Z gleichmätig sind. Bevor wir den eigentlichen Beweis geben, besprechen wir zuerst eine Veranschaulichung des ersten Teil des Beweises, siehe auch
folgendes Video:
http://www.youtube.com/watch?v=faQBrAQ87l4 Es gibt auch ein Kurzfilm zu diesem Satz. Hier sehen Sie einem Ausschnitt:
https://www.vismath.eu/de/filme/hotel-hilbert
Das Hilbert–Hotel ist ein Hotel mit abzählbar unendlich viele Zimmer, die
mit 1, 2, 3, . . . nummeriert sind (Abbildung 2). Alle Zimmer sind belegt als ein
neuer Gast eintrifft und nach einem Zimmer fragt. Im Hilbert–Hotel ist für den
neuen Gast trotzdem Platz. Der Manager sagt alle bereits eingecheckte Gäste,
dass sie im nächsten Zimmer umziehen sollten, also der Gast aus Zimmer 1 in
42
1
2
···
3
Abbildung 2: Das Hilbert–Hotel
Zimmer 2, der Gast aus Zimmer 2 in Zimmer 3 usw. Der neu angekommene
Gast kann nun im frei gewordenen Zimmer 1 ziehen.
In einem Zimmer mit nur endlich viele Zimmer funktioniert dies wegen das
Schubfachprinzip leider nicht.
Satz 5.3 Die Mengen N0 und Z sind abzählbar.
Beweis: Wir definieren eine Abbildung ϕ : N0 → N durch
ϕ : n 7→ n + 1.
Dies ist offensichtlich eine Bijektion: Die Umkehrabbildung ist
ϕ−1 : m 7→ m − 1.
Wir schließen, dass N abzählbar ist.
Wir definieren eine Abbildung ψ : Z → N0


falls
0
x 7→ 2x − 1 falls


−2x
falls
durch
x = 0,
x > 0, .
x < 0.
Die folgende Tabelle gibt einige Bilder der Abbildung ψ:
···
−3 −2 −1 0 1
6
4
2
0 1
2 3
···
3 5
Wir schließen, dass |Z| = |N0 |. Da N0 abzählbar ist, ist Z es auch. (Alternativ
definiert auch ϕ ◦ ψ eine Bijektion zwischen Z und N.)
✷
Satz 5.4 Die Menge Q ist abzählbar.
Beweis: Es reicht zu zeigen, dass die Menge Q>0 abzählbar ist. Ähnlich wie
im Beweis von Satz 5.3 leitet man hieraus ab, dass Q auch abzählbar ist.
Eine rationale Zahl x ∈ Q>0 kann man eindeutig als Bruch x = a/b mit
a, b ∈ N teilerfremd darstellen (Abschnitt 3.2). Wir identifizieren die Zahl x mit
dem Paar (a, b) ∈ R2 . Abbildung 3 beschreibt eine Aufzählung dieser Paaren,
oder äquivalent eine Abbildung ϕ : N → Q>0 . Bemerke, dass wir die Paare (a, b)
mit ggT(a, b) 6= 1 weglassen. Im Bild ist dies mit einem Kreuz gekennzeichnet.
Um die Aufzählung zu erhalten, folgt man die angegebene Schlangenlinie,
anfangend mit (1, 1). Man erhalt also folgende Aufzählung der positiven rationalen Zahlen: 1, 2 = 2/1, 1/2, 1/3, 2/3, 3/2, 3 = 3/1, 4 = 4/1, 4/3, 3/4, 1/4, 1/5, · · ·.
✷
Das Argument aus Satz 5.4 zeigt auch, dass Z × Z abzählbar ist.
43
5
4
t
×
t
×
3
t
t
×
t
2
t
×
t
×
1
t
t
t
t
1
2
3
4
Abbildung 3: Die Abzählbarkeit von Q>0
5.2 Das Cantorsche Diagonalargument In diesem Abschnitt zeigen wir,
dass R überabzählbar ist. Hierzu benutzen wir das Cantorsche Diagonalargument, das von Cantor (1845–1918) gefunden wurde. Cantor war zunächst selber
überrast von seiner Entdeckung. Nachdem er in 1877 gezeigt hat, dass das Interval [0, 1] die gleiche Mächtigkeit als Rn für beliebiges n ∈ N besitzt, schreib
er an Dedekind
je le vois, mais je le crois pas.
(Ich sehe es, aber ich glaube es nicht. Siehe
http://www-groups.dcs.st-and.ac.uk/history/Biographies/Cantor.html )
Satz 5.5 Die Menge R ist überabzählbar.
Beweis: Es reicht zu zeigen, dass die Menge [0, 1) ⊂ R überabzählbar ist.
Jede reelle Zahl x ∈ [0, 1) lässt sich als Dezimalzahl
(10)
x = 0, x1 x2 x3 · · ·
mit xi ∈ {0, 1, . . . , 9} darstellen (Beispiel 4.14). Diese Darstellung ist nicht eindeutig. Existiert ein Index N , sodass xN 6= 9 und xi = 9 für alle i > N , ist x
auch durch x = 0, x1 x2 · · · (xN + 1) gegeben. (Dies folgt wie in Beispiel 4.4.(c).)
Wir schließen daher die Dezimalbruchzerlegungen (10) für den einem N mit
xi = 9 für alle i > N aus. Mit dieser Einschränkung können wir jede reelle
Zahl x ∈ [0, 1] eindeutig in der Form (10) darstellen, da der Differenz zwei
verschiedene solcher Darstellungen positiv ist.
44
Wir nehmen an, dass [0, 1) abzählbar ist und schreiben ϕ : N → [0, 1) für
die zugehörige Bijektion. Wir schreiben xi = ϕ(i). Es gilt also
[0, 1) = {xi | i ∈ N}
als Teilmengen von R.
Wir konstruieren nun eine reelle Zahl y ∈ [0, 1), die nicht in {xi | i ∈ N}
enthalten ist und erhalten so einen Widerspruch.
Wir schreiben
xi = ϕ(i) = 0, xi1 xi2 xi3 · · · .
Die Zahl xij ∈ {0, 1, . . . , 9} ist also die jte Nachkommastelle von xi . Besitzt xi
eine endliche Dezimalbruchzerlegung, ergänzen wir mit 0.
Für alle i ∈ N wählen wir yi ∈ {0, 1, . . . , 9}, sodass yi 6= xii und kein Index N existiert, sodass yi = 9 für alle i > N . Dies ist offensichtlich möglich.
Beispielsweise können wir yi 6= 9, xii für alle i wählen. Wir betrachten die Zahl
y := 0, y1 y2 y3 · · · .
Offensichtlich ist y ∈ [0, 1). Unsere Annahme impliziert, dass ein Index j mit
y = xj existiert. Wegen der Eindeutigkeit der Dezimalbruchzerlegung impliziert
dies, dass beide Zahlen die gleiche Nachkommastellen besitzen, also yi = xji für
alle i. Dies widerspricht yi 6= xii . Wir schließen, dass [0, 1) überabzählbar ist. ✷
Satz 5.5 sagt, dass die Mächtigkeit von R echt größer ist als die von N. Die
Kardinalität von R ist also eine Kardinalzahl ℵi mit i > 0. Die Kontinuumshypothese, aufgestellt von Cantor, sagt, dass die Kardinalität von R gleich ℵ1 ist.
Anders gesagt: Es existiert keine Teilmenge M ⊂ R mit ℵ0 = |N| < |M | < |R|.
Es ist bekannt, dass man die Kontinuumshypothese nicht aus den Zermelo–
Fränkel-Axiomen der Mengenleere ableiten kann. (Es sei denn die Axiomen der
Mengenleere sind widerspruchlich. Ob dies der Fall ist, ist nicht bekannt.) Daher
heißt die Aussage eine Hypothese: Es ist nicht möglich die Aussage zu beweisen,
man kann sie aber als zusätzliches Axiom annehmen.
6
Die komplexe Zahlen
In diesem Abschnitt definieren wir die komplexe Zahlen C ausgehend von den
reellen Zahlen. Die wichtigste komplexe nicht-reele Zahl ist die imaginäre Einheit
i. Diese Zahl ist eine Lösung der Gleichung x2 + 1 = 0. Für reelle Zahlen x ∈ R
2
gilt x2 + 1 > 0, also besitzt die
√ Gleichung x + 1 = 0 keine Lösung in R. Man
schreibt manchmal auch i = −1.
Euler (1707–1783) rechnete schon mit der Zahl i. Von ihm stammt auch die
Formel
(11)
eiπ = −1,
45
die manchmal “die schönste Formel der Mathematik” genannt wird (siehe Abschnitt 6.2).
Richtig eingeführt wurden die komplexe Zahlen von Gauß. Er zeigte den
Fundamentalsatz der Algebra, der sagt, dass jede Gleichung
xn + an−1 xn−1 + · · · + a0 = 0
mit ai ∈ R eine Lösung in C besitzt.
Komplexe Zahlen waren aber schon früher in der Mathematik in Erscheinung getreten. Der italianische Mathematiker Cardano (1501–1576) publizierte
in 1545 in seinem Buch Ars Magna eine Methode zur Bestimmung der Nullstellen kubischer Gleichungen der Form x3 = 3px + 2q. (Man kann zeigen, dass
jede kubische Gleichung auf diese Form gebraucht werden kann.) In moderner
Bezeichnung geschrieben, sagt das Ergebnis, dass
q
q
p
p
3
3
2
3
(12)
q + q − p + q − q 2 − p3
eine Lösung der Gleichung x3 = 3px+2q ist. Dieser Formel ist also eine Verallgemeinerung der sogenannten Mitternachtsformel zur Bestimmung der Nullstellen
einer quadratischen Gleichung.
Cardano machte eine merkwürdige Entdeckung als er versuchte mit seiner
Formel die Gleichung x3 = 15x + 4 zu lösen. Die Funktion f (x) := x3 − 15x − 4
besitzt genau eine positive Lösung, nämlich x = 4 (Abbildung 4). Cardano
kannte keine negative Zahlen, daher betrachte er nur die positive Lösungen.
(Für eine Berechnung der negative Lösungen, siehe Beispiel A.13.)
100
50
K6
K4
K2
0
2
x
4
6
K50
K100
Abbildung 4: Graph der Funktion f (x) = x3 − 15x − 4
Einsetzen der Werte p = 5, q = 2 in (12) sollte daher die Lösung x = 4
2
3
2
3
2
ergeben. Cardano bemerkte,
p dass in diesem Fall q −p = 2 −5 = −11 ist. Dies
2
3
bedeutet, dass die Zahl q − p , die als Zwischenwert in seiner Berechnung
vorkam, keine reelle Zahl ist. Im Endergebnis kürzt sich dieses Zwischenergebnis
aber wieder raus, wenn man richtig rechnet, da das Endergebnis x = 4 sein
46
sollte. Cardano macht in seinem Buch ein Versuch dies zu nachzurechnen, aber
offensichtlich verstand er nicht was er machte. Er sagt dies sei
eben subtil wie nützlos.
(Zitiert nach
http://www-history.mcs.st-and.ac.uk/HistTopics/Quadratic etc equations.html)
Um Cardanos Berechnung richtig auszuführen, braucht man komplexe Zahlen. Dies zeigt, dass komplexe Zahlen nützlich sind, auch wenn man nur an einer
reellen Lösung einer reellen Gleichung interessiert ist.
Cardano war nicht der Entdecker der Formel (12). Er bekam die Formel
von Tartaglia unter der Versprechung, dass er die Formel nicht veröffentlichen
würde. Diese Versprechen hat er nicht gehalten. Hier finden Sie die spannende
Geschichte von Tartaglia und Cardano mit vielen Zitaten aus deren Korrespondenz:
http://www-history.mcs.st-and.ac.uk/HistTopics/Tartaglia v Cardan.html
6.1 Definition der komplexen Zahlen Wir definieren komplexe Zahlen
als Ausdrücke
a + bi,
a, b ∈ R.
Wir schreiben C = {a + bi | a, b ∈ R} für die Menge der komplexen Zahlen.
Wir fassen R = {z = a + bi ∈ C | b = 0} als Teilmenge von C auf. Für eine
komplexe Zahl z = a + bi ∈ C nennen wir a = ℜ(z) der Realteil und b = ℑ(z)
der Imaginärteil von z. Zwei komplexe Zahlen sind also genau dann gleich, wenn
Realteil und Imaginärteil gleich sind.
Zur Veranschaulichung identifizieren wir C durch a + bi 7→ (a, b) mit der
Ebene R2 und fassen komplexe Zahlen als Punkte der “komplexe Ebene” wie
in Abbildung 5 auf. Da diese Darstellung von Gauß stammt, nennt man diese
Ebene auch Gaußsche Zahlenebene. Die horizontale Achse nennen wir reelle
Achse und die vertikale imaginäre Achse.
z+w
2
1
z
w
1
2
Abbildung 5: Addition komplexer Zahlen
Die Addition auf C ist definiert durch
(a + bi) + (c + di) = (a + c) + (b + d)i.
47
Dies entspricht die Addition von Vektoren in R2 (Abbildung 5). Die Multiplikation ist definiert als
(a + bi) · (c + di) = (ab − cd) + (ad + bc)i.
Addition und Multiplikation komplexer Zahlen sind bestimmt durch die Operationen auf R und die Eigenschaft i2 = −1.
Definition 6.1 Die komplexe Konjugation ist definiert durch
¯ : C → C,
z = a + bi 7→ z̄ = a − bi.
√
√
Die Zahl |z| := z · z̄ = a2 + b2 heißt (komplexe) Betrag von z.
Der Betrag einer komplexen Zahl eine nicht-negative reelle Zahl ist, nämlich
die Länge von z aufgefasst als Vektor in der komplexen Ebene. Das folgende
Lemma formuliert einige Eigenschaften des Betrags, die wir hier nicht beweisen
möchten.
Lemma 6.2 Es gilt
(a) |z1 z2 | = |z1 | · |z2 |,
(b) (Dreiecksungleichung) |z1 + z2 | ≤ |z1 | + |z2 |,
(c) der Betrag von z ∈ C ist genau dann Null, wenn z = 0.
Mit Hilfe des Betrags können wir leicht die multiplikative Inverse z −1 einer
komplexen Zahl z = a + bi 6= 0 berechnen, indem wir benutzen, dass z · z̄ =
|z|2 ∈ R ist. Es gilt
a
−b
z̄
1
+ 2
i.
= 2 = 2
2
z
|z|
a +b
a + b2
Wichtig ist komplexe Zahlen immer in der Form a + bi darzustellen. Ansonsten
ist es schwer festzustellen, ob zwei komplexe Zahlen gleich sind oder nicht.
Beispiel 6.3 (a) Wir diskutieren wie man die Quadratwurzeln einer komplexen
Zahl ziehen kann. Sei z = a + bi 6= 0 eine komplexe Zahl. Wir suchen alle
Lösungen der Gleichung w2 = z. Wir werden zeigen, dass diese Gleichung immer
zwei komplexe Lösungen besitzt. Unser Beweis liefert gleichzeitig eine Methode
zur Berechnung der Quadratwurzeln einer konkreten Zahl.
Wir schreiben w = c + di mit c, d ∈ R. Da w2 = (c2 − d2 ) + 2cdi ist, liefert
dies das Gleichungssystem
(13)
(14)
c2 − d2 = a,
2cd = b.
48
Fall 1: Wir betrachten zuerst der Fall c = 0. Gleichung (14) impliziert, dass
b = 0. Also ist z = a ∈ R \ {0} und (13) sagt, dass −d2 = a. Insbesondere ist
a < 0 und d2 = −a = |a|. Die Lösungen des Gleichungssystem sind daher
p
w = ± |a|i.
Fall 2: Sei c 6= 0. Auflösen von (13) nach d liefert
(15)
d=
b
.
2c
Einsetzen in der ersten Gleichung und Multiplikation mit 4c2 liefert 4c4 − b2 =
4ac2 oder die äquivalente Gleichung:
4c4 − 4ac2 − b2 = 0.
Dies ist eine quadratische Gleichung in c2 . Mit Hilfe der Mitternachtsformel
finden wir
√
√
4a ± 16a2 + 16b2
a ± a2 + b 2
2
c =
=
.
8
2
√
√
Wir erinnern uns, dass c ∈ R\{0}, also c2 > 0 ist. Da a2 + b2 ≥ a2 = |a| ≥ a
ist, folgt, dass
√
a + a2 + b 2
2
.
(16)
c =
2
Wir haben angenommen, dass z = a + bi 6= 0 und daher a2 + b2 > 0. Dies
impliziert, dass (16) genau zwei Lösungen mit c, d ∈ R besitzt.
(b) Als Anwendung berechnen wir die Quadratwurzeln von z = 1 + i. Eine
alternative Methode wird in Beispiel 6.9.(b) vorgestellt. Einsetzen von a = b = 1
in (16) liefert
√
1+ 2
2
c =
.
2
Also
p
p
√
√
1+ 2
2+2 2
=±
c=± √
.
2
2
√
(Bei der letzten Gleichung haben wir Zähler und Nenner mit 2 ergänzt.)
Gleichung (15) liefert
1
1
= ±p
√
2c
2+2 2
p
√
Wir ergänzen Zähler und Nenner mit −2 + 2 2, um der Nenner möglichst
weit zu vereinfachen. Dies liefert
p
√
−2 + 2 2
d=±
.
2
d=
49
Die gesuchte Quadratwurzeln sind daher
q
q
√
√
1
±
2 + 2 2 + −2 + 2 2i .
2
Beachte, dass das Vorzeichen von d durch das von c bestimmt wird. Wir überlassen
es dem Leser/der Leserin zu überprüfen, dass dies in der Tat die gesuchte Quadratwurzeln sind.
6.2 Polarkoordinaten Polarkoordinaten sind eine weitere Möglichkeit komplexe Zahlen darzustellen. Die Grundlage dieser Darstellung bildet folgende Definition der komplexe Exponentialfunktion.
Definition 6.4 Für x ∈ R definieren wir
eix = cos(x) + i sin(x).
Insbesondere finden wir eiπ = cos(π)+i sin(π) = −i (Formel von Euler (11)).
Das folgende Lemma zeigt, dass die komplexe e-Funktion aus Definition 6.4
die übliche Rechenregel erfüllt. Die Aussage von Lemma 6.5.(a) kann man gut
nutzen, um sich die Additionstheoreme für den trigoneometrischen Funktionen
zu merken.
Lemma 6.5 Seien x, y ∈ R. Es gilt:
(a) ei(x+y) = eix · eiy ,
(b) der Betrag von eix ist 1.
Beweis: Es gilt ei(x+y) = cos(x + y) + i sin(x + y). Die Additionstheoreme
implizieren, dass
ei(x+y) = (cos(x) cos(y) − sin(x) sin(y)) + i (cos(x) sin(y) + cos(y) sin(x))
= (cos(x) + i sin(y)) (cos(y) + i sin(y)) = eix · eiy .
Dies impliziert (a). Teil (b) folgt aus der Relation cos2 (x) + sin2 (x) = 1.
✷
Lemma 6.5.(b) zeigt, dass die komplexe Zahlen der Form eiϕ auf dem komplexen Einheitskreis K := {z ∈ C | |z| = 1} liegen. Umgekehrt kann man jede
z ∈ K schreiben als
z = cos ϕ + i sin ϕ,
wobei ϕ die Winkel von z, aufgefasst als Vektor in der komplexen Ebene, mit
der positiven reellen Achse ist. Die folgende Definition verallgemeinert dies für
beliebige komplexe Zahlen. Das Argument von z = 0 nicht definiert ist.
Definition 6.6 Sei z = a + bi eine komplexe Zahl mit z 6= 0. Das Argument
ϕ ∈ (−π, π) von z ist definiert als der Winkel von z, aufgefasst als Vektor in der
komplexen Ebene, mit der positiven reellen Achse.
50
iR
r cos(ϕ)
z
r
ϕ
r sin(ϕ)
R
|z| = r
Abbildung 6: Polarkoordinaten
Der folgende Satz folgt unmittelbar aus obiger Beobachtung (siehe Abbildung 6).
Satz 6.7 Sei z ∈ C \ {0} eine komplexe Zahl mit Argument ϕ und Betrag
r = |z|. Es gilt
(a) z = |z|eiϕ = |z|(cos(ϕ) + i sin(ϕ)),
(b) ℜ(z) = |z| cos(ϕ),
ℑ(z) = |z| sin(ϕ).
Lemma 6.8 Seien z = reiϕ und w = seiψ zwei komplexe Zahlen mit z, w 6= 0
in Polarkoordinaten. Insbesondere gilt r, s ∈ R>0 und ϕ, ψ ∈ (−π, π]. Dann gilt
(a) |z · w| = |z| · |w|.
(b) Das Argument von z · w ist kongruent zu ϕ + ψ (mod 2π).
Beweis: Dies folgt aus Lemma 6.5.
Sei w = re
iϕ
✷
6= 0 eine komplexe Zahl. Wir betrachten die Abbildung
ρ : C → C,
z 7→ w · z
als Abbildung der komplexen Ebene. Lemma 6.8 impliziert, dass ρ eine Drehung
um der Winkel ϕ verknüpft mit einer Streckung um r ist.
Wir berechnen die Polarkoordinaten z = reiϕ von z = x+iy 6= 0. Falls x 6= 0
gilt
p
y
tan(ϕ) = .
r = |z| = x2 + y 2 ,
x
Man kann das Argument ϕ von z auch mit Hilfe der Arkustangens ausdrücken.
Hier braucht man alledings einen Fallunterscheidung, da der Tangens π-periodisch
51
ist. Daher besitzt die Gleichung tan(ϕ) = y/x für x 6= 0 zwei Lösungen mit
ϕ ∈ (−π, π].
Es gilt:

y

für x > 0,

arctan( x )

y


arctan( x ) + π für x < 0 und y ≥ 0,
ϕ = arctan( yx ) − π für x < 0 und y < 0,


π
für x = 0 und y > 0,

2


− π
für x = 0 und y < 0.
2
Anstatt diese Formeln anzuwenden, sollte man lieber geometrisch überlegen im
welchem Interval ϕ in einem konkreten Beispiel liegt.
Beispiel 6.9 (a) Wir schreiben die komplexe Zahl z = 1−i in Polarkoordinaten.
Wir berechnen
√
tan(ϕ) = −1.
|z| = 2,
Die Lösungen der Gleichung tan(ϕ) = −1 mit ϕ ∈ (−π, π] sind ϕ ∈ {3π/4, −π/4}.
Da z im 4tem Quadrant der komplexen Ebene liegt, ist ϕ = −π/4. Es gilt also
p
z = (2)e−πi/4 .
(b) In Beispiel 6.3.(b) haben wir die Quadratwurzel von z := 1 + i berechnet.
Wir lösen diese Aufgabe nochmals mit Hilfe√von Polarkoordinaten.
Wie in (a) berechnet man, dass 1 + i = 2eπi/4 . Sei w ∈ C mit w2 = z. Wir
schreiben w = reiϕ . Lemma 6.8 impliziert also w2 = r2 e2iϕ . Dies liefert
√
2ϕ ≡ π/4 (mod 2π),
r2 = 2,
also
r=
√
4
2,
ϕ ∈ {π/8, π/8 − π = −7π/8}.
In Beispiel 6.3.(b) haben wir berechnet, dass
q
q
√
√
1
w1 :=
2 + 2 2 + −2 + 2 2i .
2
einer der Quadratwurzeln ist. Da w in ersten Quadrant der komplexen Ebene
liegt, gilt ϕ = π/8. Die andere Winkel gehört zum zweiten Quadratwurzel −w
von z.
Wir schließen, dass
q
q
√
√
√
1
4
2 + 2 2 + −2 + 2 2i = 2eiπ/8 .
w=
2
Insbesondere impliziert dies, dass
p
√
2+2 2
√
,
cos(π/8) =
242
p
√
−2 + 2 2
√
sin(π/8) =
.
242
52
2
•ζ8 = i
ζ83•
•ζ8
ζ84 = −1•
0
•ζ8 = 1
•
ζ85
•6
ζ8 = −i
•7
ζ8
Abbildung 7: Die 8te Einheitswurzel
Die Lösungen in C der Gleichung
zn = 1
heißen nte Einheitswurzeln. Mit Hilfe der Polarkoordinaten können wir diese
Lösungen leicht berechnen. Wir schreiben
ζn = eiπ/n = cos(π/n) + i sin(π/n).
Lemma 6.10 Die nte Einheitswurzel sind
ζnj = ejiπ/n = cos(jπ/n) + i sin(jπ/n),
j = 0, 1, . . . , n − 1.
Insbesondere besitzt die Gleichung z n = 1 genau n Lösungen in C.
Beweis: Dies folgt aus Lemma 6.8.
✷
Abbildung 7 zeigt die 8te Einheitswurzeln.
A
Einige weitere Begriffe
A.1 Teilbarkeit Wir wiederholen einige wohl bekannte Begriffe über Teilbarkeit ganzer Zahlen. Diese Begrife werden in der Vorlesung Elementare Zahlentheorie ausführlicher besprochen.
Definition A.1 Seien a 6= 0 und b ganze Zahlen. Wir sagen das b durch a
teilbar ist, wenn eine ganze Zahl c mit b = a · c existiert. Wenn diese Bedingung
erfüllt ist, heißt a ein Teiler von b. Wir benutzen die Bezeichnung a | b für ‘a
teilt b’ und a ∤ b für ‘a teilt b nicht’.
53
Definition A.2 Eine Zahl n ∈ N≥2 heißt Primzahl, wenn 1 und n die einzige
positive Teiler von n sind. Eine natürliche Zahl n ≥ 2 heißt zusammengesetzt,
wenn n keine Primzahl ist.
Definition A.3 Seien a, b ∈ Z zwei ganze Zahlen, die nicht beide Null sind.
Der größte gemeinsame Teiler von a und b ist die größte natürliche Zahl, die
sowohl a als b teilt. (Bezeichnung: ggT(a, b).) Zwei Zahlen mit ggT(a, b) = 1
heißen teilerfremd.
Satz A.4 Seien a, b ganze Zahlen mit b > 0.
(a) Es existieren eindeutige ganze Zahlen q, r mit a = bq + r und 0 ≤ r < b.
Wir nennen q den Quotienten und r den Rest der Division.
(b) Die Zahl b ist genau dann ein Teiler von a, wenn r = 0.
Beweis: Ein Beweis des Satzes finden Sie in [1, Satz 1.1.5].
✷
A.2 Ungleichungen Die Menge R de reellen Zahlen besitzt eine Ordnung
≤ (Abschnitt 4.5). Für zwei reelle Zahlen a, b ∈ R ist also definiert ob a ≤ b gilt.
Anstatt a ≤ b kann man auch b ≥ a schreiben. Die Schreibweise a < b bedeutet,
dass a ≤ und a 6= b ist. Die Ordnung auf R ist eine Wohlordnung. Dies bedeutet,
dass folgende Eingeschafte erfüllt sind. Für mehr Details verweisen wir auf der
Vorlesung Analysis I.
Definition A.5 Eine Relation ≤ auf einer Menge K heißt Wohlordnung, wenn
für alle a, b, c ∈ K gilt:
(O1) a ≤ a (Reflexivität),
(O2) a ≤ b, b ≤ a ⇒ a = b, (Antisymmetrie),
(O3) a ≤ b, b ≤ c ⇒ a ≤ c, (Transitivität).
(O4) Es gibt a ≤ b oder b ≤ a.
Sei x ∈ R. Das Symbol
|x| =
(
−x
x
falls x < 0,
falls x ≥ 0
bezeichnet der absolut Betrag von x. Insbesondere ist
|x| ≥ 0,
x ≤ |x|
für alle x ∈ R.
Die Ungleichung |x| ≤ a ist äquivalent zu −a ≤ x ≤ a.
54
Beispiel A.6 (a) Wir bestimmen alle x ∈ R mit
(17)
|x − 2| ≥ 1.
Ist x − 2 ≥ 0, dann ist |x − 2| = x − 2. Die Ungleichung (17) ist daher in diesem
Fall äquivalent zu x − 2 ≥ 1, also zu x ≥ 3.
Ist x − 2 ≤ 0, dann ist |x − 2| = −(x − 2). Die Ungleichung (17) ist daher in
diesem Fall äquivalent zu −x + 2 ≥ 1, also zu x ≤ 1.
Die Lösungsmenge ist daher
(−∞, 1] ∪ [3, ∞).
(b) Wir zeigen, dass 2x2 − 2xy + y 2 − 2x + 2 > 0 ist für alle x, y ∈ R. Dazu
bemerken wir dass
2x2 − 2xy + y 2 − 2x + 2 = (x − y)2 + (x − 1)2 + 1.
Für alle z ∈ R gilt z 2 ≥ 0. Es folgt
2x2 − 2xy + y 2 − 2x + 2 ≥ 0 + 0 + 1 > 0.
Die sogenannte Dreiecksungleichung, der üblicherweise eine Aussage über
Längen von Vektoren ist, gilt auch für reelle Zahlen. Man zeigt das folgende Lemma beispielsweise indem man die verschiedene mögliche Vorzeichen für
a, b, a + b unterscheidet. Wir überlassen dies dem Leser/der Leserin.
Lemma A.7 (Dreiecksungleichung) Seien a, b ∈ R. Dann gilt
|a + b| ≤ |a| + |b|.
Man sollte den Absolutbetrag nicht mit dem sogenannten Gauß–Klammer
verwechseln. Sei a ∈ R. Dann bezeichnet der Gauß–Klammer [a] ∈ Z der größte
ganze Zahl mit [a] ≤ a. Manchmal
schreibt man auch ⌊a⌋ anstatt [a]. Beispiels√
weise ist [π] = 3 und [− 2] = −2. Eine Variante ist der obere Gauß–Klammer
definiert als der kleinsten ganzen Zahl größer gleich a. Bezeichnung: ⌈a⌉.
Wir bemerken, dass die Zahlen [a] und ⌈a⌉ genau dann gleich sind, wenn
a ∈ Z ist.
A.3 Summen und Produkten Sind xi verschiedene Ausdrücken, die möglicherweise vom Index i abhängen, schreiben wir
x1 + x2 + · · · + xn =
n
X
xi
i=1
als Abkürzung für die Summe der xi . Das Summenzeichen
Großbuchstabe Sigma.
55
P
ist die griechische
Am Einfachsten versteht man dies an Hand von einigen Beispiele:
n
X
i=1
n
X
i=1
n
X
i=1
i = 1 + 2 + 3 + · · · + n,
i 2 = 1 2 + 2 2 + 3 2 + · · · + n2 ,
mi = m1 + m2 + m3 · · · + mn .
(1) Hängt c nicht von der Index i ab, gilt
n
X
cxi = c
xi .
i=1
i=1
Insbesondere gilt
n
X
n
X
c = cn.
i=1
(2) Summen mit dem gleichen Laufindex kann man zusammenfassen:
n
X
i=1
xi +
n
X
yi =
i=1
n
X
(xi + yi ).
i=1
Selbstverständlich kann man diese Regel auch benutzen, um Summen aus
Einander zu ziehen.
Eine Doppelsumme ist eine Summe mit zwei (oder mehr) Laufindizes. Hier
ist es wichtig die Grenzen zu beachten.
Beispiel A.8 (a) Wir betrachten die Doppelsumme
n X
m
X
xi yj .
i=1 j=1
Hier werden alle Ausdrücke xi yj mit 1 ≤ i ≤ n und 0 ≤ j ≤ m aufsummiert.
Insgesamt besitzt der Ausdruck also n · m Terme. Für n = m = 2 finden wir
beispiesweise
n X
n
X
xi yj = x1 y1 + x1 y2 + x2 y1 + x2 y2 .
i=1 j=1
(b) Wir betrachten nun die Doppelsumme
n
n X
X
i=1 j=i
56
xi yj .
Beachte, dass die Grenzen der inneren Summe von i abhängen. Hier werden alle
Ausdrücke xi yj mit 1 ≤ i ≤ n und i ≤ j ≤ n aufsummiert. Für n = 2 finden
wir beispielsweise
n X
n
X
xi yj = x1 y1 + x1 y2 + x2 y2 .
i=1 j=1
Ähnlich benutzt man die griechische GroßBuchstabe Π um Produkte darzustellen:
n
Y
xi = x1 · x2 · x3 · · · xn .
i=1
A.4
Körper
Definition A.9 Eine Menge K zusammen mit 2 Verknüpfungen
+:K ×K →K
(a, b) 7→ a + b,
·:K ×K →K
(a, b) 7→ a · b,
heißt Körper, falls folgende Bedingungen erfüllt sind:
(K1) (K, +) ist eine kommutative Gruppe, d.h.
(a) die Addition ist assoziativ, d.h. a + (b + c) = (a + b) + c für alle
a, b, c ∈ K,
(b) es existiert ein neutrales Element 0, sodass 0 + a = a + 0 = a für alle
a ∈ K,
(c) für jedes a ∈ K existiert ein negatives Element −a mit a + (−a) =
(−a) + a = 0,
(d) die Addition ist kommutativ, d.h. a + b = b + a für alle a, b ∈ K,
(K2) (K \ {0}, ·) ist eine kommutative Gruppe, das heißt
(a) die Multiplikation ist assoziativ, das heißt a · (b · c) = (a · b) · c für alle
a, b, c ∈ K \ {0},
(b) es existiert ein Einheitselement 1 so, dass 1 · a = a · 1 = a für alle
a ∈ K \ {0},
(c) für jedes a ∈ K \ {0} existiert ein inverses Element a−1 mit a · a−1 =
a−1 · a = 1,
(d) die Multiplikation ist kommutativ, das heißt a · b = b · a für alle
a, b ∈ K \ {0},
(K3) es gelten die Distributivgesetze:
a · (b + c) = a · b + a · c,
für alle a, b, c, ∈ K.
57
(a + b) · c = a · c + b · c,
Beispiele von Körpern sind Q, R und C. Die Menge Z ist kein Körper, da
nur ±1 in Z ein multiplikatives Inverse besitzen.
Ist p eine Primzahl, kann man zeigen, dass Fp := Z/pZ mit Addition und
Multiplikation modulo p auch ein Körper ist. Hierbei ist F die Abkürzung des
englischen Begriffs für Körper: field.
A.5 Polynome In diesem Abschnitt fassen wir einige Definitionen und Eigenschaften von Polynomen zusammen. Für Beweisen und mehr Details verweisen wir auf dem Skript der Vorlesung Elemente der Algebra [2, Abschnitt
3].
Definition A.10 Sei K ein Körper.
Pn
(a) Ein Polynom mit Koeffizienten in K ist ein Ausdruck f = i=0 ai xi mit
Koeffizienten ai ∈ K. Wir schreiben K[x] für die Menge der Polynome
mit Koeffizienten in K.
(b) Das Nullpolynom f = 0 ist das Polynom, dessen Koeffizienten alle Null
sind.
(c) Ist f 6= 0 nicht das Nullpolynom ist, heißt die größte Zahl n so, dass an 6= 0
ist, der Grad von f (Bezeichnung: Grad(f ).) Den Grad des Nullpolynoms
definieren wir als −∞.
P
(d) Ist f = i ai xi ein Polynom von Grad n, dann heißt an xn führende Term
von f . Ein Polynom vom Grad n mit führendem Term xn heißt normiert.
(e) Seien f (x), g(x) ∈ R[x] mit g(x) 6= 0. Wir sagen, dass g(x) ein Teiler von
f (x) ist, falls ein Polynom h(x) ∈ R[x] mit f (x) = g(x)h(x) existiert.
Der folgende Satz ist ein Analogon der Division mit Rest in Z (Satz A.4).
Satz A.11 (Polynomdivision) Sei K ein Körper und seien f (x), g(x) ∈ K[x]
Polynome mit f g 6= 0. Es existieren eindeutige Polynome q(x) und r(x) ∈ K[x]
mit
f (x) = q(x)g(x) + r(x),
wobei Grad(r) < Grad(g) ist.
Korrolar A.12 Sei f (x) ∈ R[x] ein Polynom. Es gilt a ∈ R genau dann eine
Nullstelle von f ist, wenn ein Polynom q(x) ∈ R[x] mit
f (x) = q(x)(x − a)
existiert.
Beweis: Die Aussage folgt aus Satz A.11, siehe [2, Kor. 3.3.3].
58
✷
Beispiel A.13 Als Anwendung berechnen wir alle Lösungen der Gleichung
x3 − 15x − 4 = 0, den wir in der Einleitung von Kapitel 4.4 betrachtet haben. Wir haben schon gesehen, dass diese Gleichung die Lösung x = 4 besitzt.
Dies bedeutet, dass x3 − 15x − 4 durch x − 4 teilbar ist (Appendix A.5). Wir
führen die Division mit Hilfe von Polynomdivision durch und finden:
(18)
x3
− 15x − 4 : x − 4 = x2 + 4x + 1
− x3 + 4x2
4x2 − 15x
− 4x2 + 16x
x−4
−x+4
0
Die weitere Lösungen der Gleichung erfüllen also x2 + 4x + 1 = 0. Mit Hilfe
der Mitternachtsformel finden wir
√
√
−4 ± 16 − 4
= −2 ± 3.
x=
2
Die andere zwei Lösungen der Gleichung sind also in der Tat in R<0 , wie man
auch aus Abbildung 4 erkennen kann.
B
Das griechische Alphabet
α
A
Alpha
ν
N
Ny
β
B
Beta
ξ
Ξ
Xi
γ
Γ
Gamma
o
O
Omikron
δ
∆
Delta
π
Π
Pi
ǫ, ε
E
Epsilon
ρ
P
Rho
ζ
Z
Zeta
σ
Σ
Sigma
η
H
Eta
τ
T
Tau
θ, ϑ
Θ
Theta
υ
Υ
Ypsilon
ι
I
Jota
φ, ϕ
Φ
Phi
κ
K
Kappa
χ
X
Chi
λ
Λ
Lambda
ψ
Ψ
Psi
µ
M
My
ω
Ω
Omega
59
Literatur
[1] I.I. Bouw, Elementare Zahlentheorie. Vorlesungsskript, Sommersemester
2010.
[2] I.I. Bouw, Elemente der Algebra. Vorlesungsskript, Wintersemester
2012/13.
60
Herunterladen