Logische Grundlagen der Mathematik

Logische Grundlagen der Mathematik
Ralf Schindler
3. Dezember 2008
Inhaltsverzeichnis
1 Natürliche Zahlen
1.1 Endliche und unendliche Mengen . . . . . . . . . . . . . . . .
1.2 Die Theorie der natürlichen Zahlen . . . . . . . . . . . . . . .
3
3
11
2 Reelle Zahlen
19
2.1 Die Konstruktion der ganzen und rationalen Zahlen . . . . . 19
2.2 Die Konstruktion der reellen Zahlen . . . . . . . . . . . . . . 23
2.3 Die Theorie der reellen Zahlen . . . . . . . . . . . . . . . . . 34
3 Mengen
39
3.1 Mengen, Klassen und Grothendieck–Universen . . . . . . . . 39
3.2 Das Auswahlaxiom . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3 Die Topologie von R . . . . . . . . . . . . . . . . . . . . . . . 57
4 Modelle
63
4.1 Logik erster Stufe . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.2 Ultraprodukte und Kompaktheit . . . . . . . . . . . . . . . . 71
4.3 Nichtstandard-Modelle . . . . . . . . . . . . . . . . . . . . . . 75
1
2
INHALTSVERZEICHNIS
Kapitel 1
Natürliche Zahlen
Eines der Grundgerüste der Mathematik ist die Menge der natürlichen Zahlen 0, 1, 2, . . . sowohl als Untersuchungsobjekt (in der Zahlentheorie) als auch
als Hilfsmittel (in allen Bereichen der Mathematik). Dabei interessieren uns
die natürlichen Zahlen nicht so sehr als Menge einzelner Elemente ohne Beziehung untereinander, sondern viel mehr als Struktur, d.h. als Menge mit auf
ihr deﬁnierten Relationen (z.B. der Ordnungsrelation <) und Verknüpfungen
(z.B. + und ·). Wir wollen dennoch zunächst in Abschnitt 1.1 die natürlichen
Zahlen als Menge betrachten, um sie danach in Abschnitt 1.2 als Struktur
zu studieren.
Allerdings benötigen wir selbst zum Studium der bloßen Menge der
natürlichen Zahlen eine grundlegende strukturelle Einsicht, nämlich das Induktionsaxiom. Dieses werden wir im Abschnitt 1.2 genauer untersuchen; wir
benötigen es als Beweisprinzip aber bereits in Abschnitt 1.1. Die natürlichen
Zahlen sind durch < in natürlicher Weise geordnet. Das Induktionsaxiom
besagt, dass jede nichtleere Menge natürlicher Zahlen ein (im Sinne von <)
kleinstes Element besitzt.
1.1
Endliche und unendliche Mengen
Die Menge
N = {0, 1, 2, . . . }
der natürlichen Zahlen ist unendlich im Gegensatz etwa zur endlichen Menge
{0, 1, 2} der natürlichen Zahlen, die kleiner als 3 sind. Wie lassen sich unendliche Mengen charakterisieren? Zur Beantwortung dieser Frage benötigen
wir einige einfache mengentheoretische Begriﬀe und Tatsachen.
3
4
KAPITEL 1. NATÜRLICHE ZAHLEN
Deﬁnition 1.1.1 Seien A und B Mengen, und sei f : A → B eine Abbildung von A nach B. Dann heißt f injektiv gdw. für alle x, y ∈ A aus
f (x) = f (y) bereits x = y folgt. Die Abbildung f heißt surjektiv gdw. für
alle z ∈ B ein x ∈ A existiert, so dass f (x) = z. Schließlich heißt f bijektiv
gdw. f injektiv und surjektiv ist.
Lemma 1.1.2 Seien A und B Mengen. Wenn es eine Injektion f : A → B
gibt, dann existiert auch eine Surjektion f : B → A.
Beweis: Die Aussage ist trivial für A = ∅. Sei also A 6= ∅ und sei x0 ∈ A.
Wir deﬁnieren eine Abbildung g : B → A wie folgt. Sei z ∈ B. Wenn es
ein x ∈ A mit f (x) = z gibt, dann gibt es wegen der Injektivität von f
genau ein solches x, und wir deﬁnieren g(z) = x für das eindeutige x ∈ A
mit f (x) = z. Wenn es kein x ∈ A mit f (x) = z gibt, dann deﬁnieren
wir g(z) = x0 . Oﬀensichtlich ist g damit wohldeﬁniert. Die Abbildung g ist
surjektiv, da für jedes x ∈ A gilt, dass g(f (x)) = x.
Das folgende hierzu “duale” Lemma ist weniger trivial, da sein Beweis das
Auswahlaxiom benötigt.
Lemma 1.1.3 Seien A und B Mengen. Wenn es eine Surjektion f : A → B
gibt, dann existiert auch eine Injektion f : B → A.
Der Beweis dieses Lemmas wird im 3. Kapitel geliefert.
Wir zeigen hier Lemma 1.1.3 für den Fall, dass A eine Menge natürlicher
Zahlen ist.
Sei f : A → B surjektiv. Wir deﬁnieren dann eine Injektion g : B → A
wie folgt. Für x ∈ B sei g(x) das kleinste m ∈ A, so dass f (m) = x.
Da f surjektiv ist, ist g wohldeﬁniert. Oﬀensichtlich ist g injektiv, da für
g(x) = g(y) gilt, dass x = f (g(x)) = f (g(y)) = y.
Eine Menge A heißt Teilmenge der Menge B, A ⊂ B, gdw. jedes Element
von A auch Element von B ist. Insbesondere folgt A ⊂ B aus A = B, und
es gilt A = B gdw. A ⊂ B und B ⊂ A. Wir schreiben A $ B, falls A echte
Teilmenge von B ist, d.h. wenn A ⊂ B und A 6= B.
Sei f : A → B eine Abbildung. Wir schreiben dann f [A] für das Bild von
A unter f , d.h. f [A] = {f (x) : x ∈ A}. Dann ist f surjektiv gdw. B = f [A].
Wenn f : A → B injektiv ist, dann schreiben wir f −1 : f [A] → A für die
Umkehrabbildung von f , d.h. für dasjenige g : f [A] → A mit g(f (x)) = x.
Wenn A ⊂ B, dann gibt es oﬀensichtlich eine Injektion von A nach B,
nämlich die Identität auf A, die jedes x ∈ A auf sich selbst abbildet.
1.1. ENDLICHE UND UNENDLICHE MENGEN
5
Für f : A → B und D ⊂ A schreiben wir f ↾ D für die Einschränkung
von f auf D, d.h. für die Funktion g : D → B mit g(x) = f (x) für alle
x ∈ D.
Für beliebige Mengen A und B schreiben wir A \ B für die Menge aller
x, die zwar in A, jedoch nicht in B liegen. Es gilt A ⊂ B gdw. A \ B = ∅.
Der Beweis des nachfolgenden Satzes lässt sich wiederum ohne Auswahlaxiom vollziehen.
Satz 1.1.4 (Schröder–Bernstein) Seien A und B Mengen. Wenn es Injektionen f : A → B und g : B → A gibt, dann gibt es eine Bijektion
h : A → B.
Beweis: Wir deﬁnieren zunächst Teilmengen Xn von A und Yn von B wie
folgt. Sei Y0 = B \ f [A]. WennSYn deﬁniert ist, dann
S sei Xn = g[Yn ] und
Yn+1 = f [Xn ]. Wir setzen X = n∈N Xn und Y = n∈N Yn .
Da g[Yn ] = Xn für jedes n ∈ N, gilt g[Y ] = X. Da g injektiv ist, ist also
g−1 ↾ X eine Bijektion von X auf Y .
Es gilt aber auch f [A\X] = B \Y . Sei nämlich zunächst x ∈ A\X. Wäre
dann f (x) ∈ Y , etwa f (x) ∈ Yn , dann wäre n > 0 und somit x ∈ Xn−1 ⊂ X.
Widerspruch! Also gilt f [A \ X] ⊂ B \ Y . Sei nun y ∈ B \ Y ⊂ B \ Y0 . Dann
ist y ∈ f [A], etwa y = f (x). Wäre x ∈ X, etwa x ∈ Xn , dann hätten wir
y = f (x) ∈ f [Xn ] = Yn+1 ⊂ Y . Widerspruch! Damit ist also f ↾ (A \ X) eine
Bijektion von A \ X auf B \ Y .
Wir können nun sehr einfach eine Bijektion h : A → B wie folgt deﬁnieren. Sei h(x) = g−1 (x), falls x ∈ X, und sei h(x) = f (x), falls x ∈ A \ X. Betrachten wir nun Teilmengen A und B von N.
Deﬁnition 1.1.5 Eine Menge B ⊂ N heißt Anfangsstück von N gdw. es
entweder ein n ∈ N gibt mit B = {m ∈ N : m < n} oder wenn B = N.
Sei nun A ⊂ N. Wir wollen ein Anfangsstück BA von N und eine Bijektion fA : BA → A konstruieren. Hierbei soll fA einfach die “natürliche
Aufzählung” von A sein.
Betrachten wir zunächst einige einfache Beispiele. Für A = {2n : n ∈ N},
die Menge der geraden natürlichen Zahlen, ist BA = N und fA (n) = 2n.
Wenn A die Menge der Primzahlen ist, dann ist ebenfalls BA = N und
fA (n) ist die nte Primzahl in der natürlichen Aufzählung der Primzahlen.
Wenn A = {2n + 1 : n ∈ N, 2n + 1 < 1037 }, dann ist BA = 5 · 1036 und
fA (n) = 2n + 1.
6
KAPITEL 1. NATÜRLICHE ZAHLEN
Betrachten wir nun eine beliebige Teilmenge A von N.
Wenn A = ∅, dann sei BA = ∅ und fA die “leere Funktion”. Sei nun
A 6= ∅. Wir deﬁnieren dann fA (0) als das kleinste Element von A. Falls
A = {fA (0)} dann setzen wir BA = {0} und brechen unsere Konstruktion ab. Andernfalls deﬁnieren wir fA (1) als das kleinste Element von A,
das verschieden von fA (0) (und damit größer als fA (0)) ist. Falls A =
{fA (0), fA (1)}, dann setzen wir BA = {0, 1} und brechen unsere Konstruktion ab. Andernfalls fahren wir in gleicher Weise fort. Nehmen wir an, wir
haben fA (0), fA (1), . . . , fA (n) bereits deﬁniert. Falls
A = {fA (0), fA (1), . . . , fA (n)},
dann setzen wir BA = {0, 1, . . . , n} und brechen unsere Konstruktion ab.
Andernfalls deﬁnieren wir fA (n + 1) als das kleinste Element von A, das
verschieden von fA (0), fA (1), . . . , fA (n) (und damit größer als alle diese)
ist.
Wir bemerken, dass fA streng monoton wächst, d.h. fA (m) > fA (n) für
alle m und n mit m > n, für die sowohl fA (m) als auch fA (n) deﬁniert sind.
Daraus ergibt sich übrigens, dass fA (n) ≥ n für alle n, für die fA (n) deﬁniert
ist. Außerdem gilt nach Konstruktion oﬀensichtlich, dass für alle n, für die
fA (n) deﬁniert ist,
(*) {k ∈ A : k ≤ fA (n)} = {fA (0), fA (1), . . . , fA (n)}.
Es gibt nun die folgenden beiden Fälle.
Entweder es gibt ein n, so dass die Konstruktion nach n + 1 Schritten abbricht, d.h. A = {fA (0), fA (1), . . . , fA (n)} und BA = {0, 1, . . . , n}. Oder die
Konstruktion bricht nicht ab; in diesem Falle setzen wir BA = {0, 1, 2, . . . } =
N.
Es ist nun unschwer erkennbar, dass wir in beiden Fällen ein Anfangsstück
BA von N und eine Bijektion fA : BA → A deﬁniert haben: fA ist injektiv,
da fA streng monoton wächst, und fA ist surjektiv wegen (*).
Konstruktionen wie die Obige werden als “rekursiv” bezeichnet, da der
Funktionswert an der Stelle n in Abhängigkeit von den Funktionswerten an
den Stellen 0, 1, . . . , n − 1 deﬁniert wird. Im Beweis des Satzes 1.1.4 von
Schröder-Bernstein wurde ebenfalls eine Rekursion verwendet: die Mengen
Xn und Yn+1 wurden dort mit Hilfe der Menge Yn konstruiert.
Deﬁnition 1.1.6 Sei A ⊂ N, und seien BA und fA wie oben definiert.
Dann heißt A endlich gdw. es ein n ∈ N gibt mit BA = {m ∈ N : m < n},
andernfalls heißt A unendlich.
1.1. ENDLICHE UND UNENDLICHE MENGEN
7
So ist beispielsweise N selbst oder die Menge der geraden Zahlen oder die
Menge der Primzahlen unendlich, während die Menge der ungeraden Zahlen,
die kleiner als 1037 sind, endlich ist. Dahingegen weiß man im Moment nicht,
ob die Menge der Primzahlen p, für die auch p + 2 Primzahl ist, endlich oder
unendlich ist.
Oﬀensichtlich gilt:
Lemma 1.1.7 Sei A ⊂ N. Dann ist entweder A endlich oder es gibt eine
Bijektion f : N → A.
Lemma 1.1.8 Seien B, D ⊂ N Anfangsstücke von N, so dass eine Bijektion
f : B → D existiert. Dann gilt B = D.
Beweis: Wir zeigen diese Aussage durch Induktion. Angenommen, es gibt
Anfangsstücke B, D von N mit B $ D, so dass eine Bijektion f : B → D
existiert. Für derartige Anfangsstücke B, D existiert ein n ∈ N mit
B = {m ∈ N : m < n}.
Sei nun n0 die kleinste natürliche Zahl n, so dass Anfangsstücke B, D von
N existieren mit B $ D, B = {m ∈ N : m < n}, und es gibt eine Bijektion
f : B → D. Oﬀensichtlich gilt n0 > 0. Seien B, D Anfangsstücke von N,
B $ D, B = {m ∈ N : m < n0 }, und sei f : B → D bijektiv.
Sei zunächst angenommen, dass
D = {m ∈ N : m < k}
für ein k ∈ N, k > 1. Wir deﬁnieren dann B = {m ∈ N : m < n0 − 1}, D =
{m ∈ N : m < k − 1} und eine Bijektion h : B → D wie folgt. Sei s < n0
so, dass f (s) = k − 1. Dann sei für m < n0 − 1 der Wert h(m) deﬁniert als
f (m), falls m 6= s, und h(s) = f (n0 − 1), falls s < n0 − 1.
Die Existenz von B, D, h widerspricht aber dann der Wahl von n0 .
Sei nun angenommen, dass D = N. Wir deﬁnieren dann B = {m ∈ N :
m < n0 − 1} und eine Bijektion h : B → D wie folgt. Es sei h(m) = f (m),
falls f (m) < f (n0 − 1), und es sei h(m) = f (m) − 1, falls f (m) ≥ f (n0 − 1).
Abermals widerspricht die Existenz von B, D, h der Wahl von n0 .
Korollar 1.1.9 Sei A ⊂ N, und sei B Anfangsstück von N, so dass eine
Bijektion f : B → A existiert. Dann gilt B = BA .
8
KAPITEL 1. NATÜRLICHE ZAHLEN
Beweis: Die Abbildung g = fA−1 ◦ f : B → BA ist bijektiv.
Für jedes endliche A ⊂ N gibt es also genau ein n ∈ N, so dass eine Bijektion
f : {0, 1, . . . , n−1} → A existiert. (Im Falle n = 0 ist f die “leere Funktion”.)
Deﬁnition 1.1.10 Sei A ⊂ N. Wenn A endlich ist, dann heißt dasjenige
n ∈ N, so dass eine Bijektion f : {m ∈ N : m < n} → A existiert, die Größe
von A.
Für endliches A ist die Größe von A gleich n, wobei BA = {m ∈ N : m < n}.
Lemma 1.1.11 Seien D und A endliche Mengen, wobei D ⊂ A ⊂ N. Sei
die Größe von D dieselbe wie die Größe von A. Dann gilt D = A.
Beweis: Angenommen, D $ A. Sei n die gemeinsame Größe von D und
A und seien fD : BD = {m ∈ N : m < n} → D und fA : BA → A die
natürlichen Aufzählungen. Sei E = A \ D. Da D $ A gilt E 6= ∅. Sei
fE : BE → E die natürliche Aufzählung.
Sei zunächst E als endlich angenommen, und sei k > 0 die Größe von E.
Wir deﬁnieren dann
h : {m ∈ N : m < n + k} → A
durch h(m) = fD (m), falls m < n und h(n + m) = fE (m), falls m < k. Dann
ist h oﬀensichtlich bijektiv.
Damit gilt, dass
fA−1 ◦ h : {m ∈ N : m < n + k} → {m ∈ N : m < n}
bijektiv ist, wonach nach Lemma 1.1.8 gilt, dass n + k = n. Aber k > 0.
Widerspruch!
Sei nun E als unendlich angenommen. Wir deﬁnieren dann
h:N→A
durch h(m) = fD (m), falls m < n und h(n + m) = fE (m), falls m ∈ N.
Dann ist h oﬀensichtlich bijektiv.
Damit gilt, dass
fA−1 ◦ h : N → {m ∈ N : m < n}
bijektiv ist. Die Existenz einer solchen Bijektion wiederspricht aber Lemma
1.1.8. Widerspruch!
1.1. ENDLICHE UND UNENDLICHE MENGEN
9
Eine sehr nützliche Charakterisierung (un)endlicher Mengen ergibt sich aus
dem folgenden
Satz 1.1.12 Sei A ⊂ N. Dann ist A endlich gdw. es keine echte Teilmenge
D von A gibt, so dass
(a) eine Injektion f : A → D existiert, oder
(b) eine Surjektion g : D → A existiert, oder
(c) eine Bijektion h : A → D existiert.
Beweis: Auf Grund von Lemma 1.1.2 folgt aus (a), dass (b) gilt. Auf Grund
von Lemma 1.1.3, welches wir für diesen Fall bereits bewiesen haben, folgt
aus (b), dass (a) gilt. Aus der Existenz einer echten Teilmenge D von A mit
(a) folgt die Existenz einer echten Teilmenge D von A mit (c), da wir für
eine Injektion f : A → D die Menge D $ A durch die Menge D = f [A] $ A
ersetzen können; f : A → D ist dann bijektiv. Aus (c) folgt trivial (a).
Die Aussagen, wonach eine echte Teilmenge D von A mit (a), (b) oder (c)
existiert, sind also paarweise äquivalent.
Sei nun zunächst A unendlich. Wir betrachten fA : BA = N → A. Sei
D = {fA (n) : n > 0} $ A.
Wir können eine Surjektion g : D → A deﬁnieren, indem wir fA (n) für n > 0
nach fA (n − 1) senden. Diese Abbildung ist bijektiv.
Sei jetzt A endlich. Wir zeigen dann, dass es keine echte Teilmenge D
von A gibt, so dass eine Bijektion h : A → D existiert. Andernfalls sei n die
Größe von A und k die Größe von D. Sei f : {m ∈ N : m < n} → A bijektiv,
und sei g : {m ∈ N : m < k} → D ebenfalls bijektiv. Dann ist g−1 ◦ h ◦ f eine
Bijektion von {m ∈ N : m < n} auf {m ∈ N : m < k}, wonach mit Lemma
1.1.8 gilt, dass n = k. Da D ⊂ A, gilt dann aber D = A nach Lemma 1.1.11.
Widerspruch!
Korollar 1.1.13 Sei A ⊂ N endlich, und sei f : A → A. Dann sind die
folgenden Aussagen äquivalent.
(a) f ist injektiv.
(b) f ist surjektiv.
(c) f ist bijektiv.
10
KAPITEL 1. NATÜRLICHE ZAHLEN
Beweis: Sei f injektiv. Angenommen, f wäre nicht surjektiv. Sei A = f [A].
Dann gilt A $ A, und f : A → A ist bijektiv. Widerspruch!
Sei nun f surjektiv. Angenommen, f wäre nicht injektiv. Sei A die Menge
aller n ∈ A, so dass aus m ∈ A und f (n) = f (m) bereits m ≥ n folgt. Dann
gilt A $ A und f ↾ A : A → A ist bijektiv. Widerspruch!
Damit ist das Korollar bewiesen.
Die hier bewiesenen Aussagen übertragen sich sehr schnell auf beliebige Mengen.
Deﬁnition 1.1.14 Sei A eine Menge. Dann heißt A endlich gdw. es ein
n ∈ N und eine Bijektion
f : {m ∈ N : m < n} → A
gibt. In diesem Falle heißt n auch die Größe von A.
Mit Hilfe des (noch unbewiesenen) Lemmas 1.1.3 zeigt man dann in ansonsten gleicher Weise wie im Beweis von Korollar 1.1.13 die folgende Tatsache.
Satz 1.1.15 Sei A endlich, und sei f : A → A. Dann sind die folgenden
Aussagen äquivalent.
(a) f ist injektiv.
(b) f ist surjektiv.
(c) f ist bijektiv.
Eine Anwendung dieses Satzes ist z.B. die folgende Aussage. Jeder endliche
kommutative Ring ohne Nullteiler ist ein Körper. Sei nämlich R ein endlicher
kommutativer Ring ohne Nullteiler. Wir müssen zeigen, dass zu jedem r ∈
R \ {0} ein s ∈ R \ {0} mit r · s = 1 existiert. Sei r ∈ R \ {0} beliebig.
Wir betrachten die Abbildung fr : R \ {0} → R \ {0}, die s ∈ R \ {0} nach
r · s sendet. Da R nullteilerfrei ist, gilt fr [R \ {0}] ⊂ R \ {0}, und es folgt
aus r · s = r · s′ , d.h. r · (s − s′ ) = 0, dass s − s′ = 0, d.h. s = s′ . Damit
ist fr : R \ {0} → R \ {0} injektiv, wegen der Endlichkeit von R und Satz
1.1.15 also auch surjektiv. Insbesondere gibt es also ein s ∈ R \ {0} mit
r · s = fr (s) = 1.
Dies hat zur Folge, dass für jede Primzahl p gilt, dass Z/pZ ein Körper
ist.
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
11
Deﬁnition 1.1.16 Sei A eine Menge. Dann heißt A unendlich gdw. A nicht
endlich ist.
Das Auswahlaxiom wird zum Beweis der folgenden Aussage benötigt.
Satz 1.1.17 Sei A eine unendliche Menge. Dann existiert eine Injektion
f : N → A.
Der Beweis dieses Satzes wird ebenfalls im 3. Kapitel geliefert.
1.2
Die Theorie der natürlichen Zahlen
Wir hatten oben das Induktionsaxiom als die Aussage formuliert, wonach
jede nichtleere Menge natürlicher Zahlen ein (im Sinne der natürlichen Ordnung < auf N) kleinstes Element besitzt. In dieser Formulierung wird das
Induktionsaxiom manchmal auch als das Prinzip der kleinsten natürlichen
Zahl bezeichnet. Es führt sofort zu folgendem Beweisprinzip.
Sei A ⊂ N. Angenommen,
(a) 0 ∈ A, und
(b) für jedes n ∈ N gilt, dass aus n ∈ A auch n + 1 ∈ A folgt.
Dann gilt A = N.
Mit Hilfe des Prinzips der kleinsten natürlichen Zahl kann man nämlich
wie folgt argumentieren. Angenommen, A $ N. Die Menge
B = {n ∈ N : n ∈
/ A}
ist dann nichtleer, enthält also ein kleinstes Element, n0 . Da 0 ∈ A, wegen
(a), gilt n0 > 0, so dass n0 = m0 + 1 gilt für den Vorgänger m0 von n0 .
Wegen der Wahl von n0 folgt aus m0 < n0 , dass m0 ∈ A. Wegen (b) gilt
dann aber auch n0 = m0 + 1 ∈ A. Widerspruch!
Dieser “Beweis” verwendet oﬀensichtlich strukturelle Tatsachen hinsichtlich N bezüglich < und +, z.B., dass jedes n > 0 einen Vorgänger m besitzt
mit m + 1 = n und dass aus m + 1 = n folgt, dass m < n. Wenn man genau
analysiert, welche strukturellen Eigenschaften für einen Beweis durch Induktion benötigt werden, gelangt man zum Begriﬀ der fundierten Relation, der
im 3. Kapitel diskutiert wird.
Jedenfalls aber ist unser “Beweis” deshalb unbefriedigend, da die ihm
zugrundeliegenden strukturellen Eigenschaften von N nicht vorher explizit
12
KAPITEL 1. NATÜRLICHE ZAHLEN
gemacht wurden. Mit anderen Worten: Wir sollten zunächst die Theorie von
N axiomatisieren, um sodann im Rahmen eines solchen Axiomensystems
gültige Aussagen über N zu beweisen! Diese Maxime ist im Sinne des allgemeinen “axiomatischen” Prinzips, wonach die Methode der Mathematik
darin besteht, aus Axiomen (interessante) Aussagen logisch abzuleiten.
Welches ist also ein gutes Axiomensystem für die natürlichen Zahlen?
Zunächst sollte es einige grundlegende arithmetische Tatsachen mitteilen.
Die folgende Liste von Axiomen hat sich hier eingebürgert.
1. ∀n n + 1 6= 0.
2. ∀n∀m (n + 1 = m + 1 → n = m).
3. ∀n n + 0 = n.
4. ∀n∀m n + (m + 1) = (n + m) + 1.
5. ∀n n · 0 = 0.
6. ∀n∀m n · (m + 1) = (n · m) + n.
7. ∀n n0 = 1.
8. ∀n∀m nm+1 = nm · n.
9. ∀n∀m (n < m + 1 ↔ (n < m ∨ n = m)).
10. ∀n ¬n < 0.
11. ∀n∀m (n < m ∨ n = m ∨ m < n).
Wir bezeichnen im folgenden das Axiomensystem, das aus diesen 11 Aussagen besteht, als Q. Die Axiome selbst nennen wir (Q1), (Q2), ..., (Q11).
Das Axiomensystem Q ist in einer Sprache der Logik erster Stufe formuliert, die allgemein im Abschnitt 4.1 diskutiert werden wird. Die Sprache von
Q, d.h. die Sprache der elementaren Arithmetik, hat die folgenden Symbole:
0
1
+
·
als Konstante für die Null
als Konstante für die Eins
als zweistelliges Funktionssymbol für die Addition
als zweistelliges Funktionssymbol für die Multiplikation
die Exponentenschreibweise für die Exponentiation
< als zweistelliges Relationssymbol für die Kleiner-Relation
Hinzu kommen allgemeine logische Symbole, von denen nicht alle in der
obigen Liste von Axiomen verwendet wurden:
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
13
Klammern: ( und )
Junktoren:
¬ für “es ist nicht der Fall, dass”,
∧ für “und”,
∨ für “oder”,
→ für “wenn . . . , dann . . . ” und
↔ für “genau dann, wenn”
Quantoren:
der Allquantor ∀ für “für alle”,
der Existenzquantor ∃ für “es gibt”
Variablen: n, m, p . . . für natürliche Zahlen
Gleichheitszeichen: =
Die Leserin/der Leser sollte sich nun vor Augen führen, was die einzelnen
Axiome von Q besagen. Das erste Axiom besagt z.B., dass für alle natürlichen
Zahlen n gilt, dass n + 1 verschieden von 0 ist, d.h., dass 0 kein Nachfolger
ist.
Die ersten beiden Axiome von Q besagen, daß die 0 kein Nachfolger ist
und dass zwei Zahlen, deren Nachfolger gleich sind, selbst gleich sind. Es läßt
sich aber (z.B. mit Hilfe des Kompaktheitsatzes, siehe Kapitel 4) nicht in Q
beweisen, dass jede Zahl, die verschieden von der Null ist, ein Nachfolger ist.
Hierzu benötigen wir das Induktionsaxiom.
Das Induktionsaxiom besagt, dass N die einzige Menge natürlicher Zahlen
ist, die die Null enthält und mit jedem n auch n+1. Wenn wir versuchen, diese Aussage mit den sprachlichen Mitteln zu formulieren, die Q zur Verfügung
stellt, dann scheitert dies daran, dass diese Sprache zwar Variablen n, m,
p, . . . für natürliche Zahlen, nicht aber Variablen für Mengen natürlicher
Zahlen bereitstellt. Nun, dem ist leicht Abhilfe zu verschaﬀen. Wir wollen
die Sprache von Q zu einer Sprache erweitern, die zusätzlich Variablen X,
Y , Z, . . . für Mengen natürlicher Zahlen zur Verfügung stellt. Da wir im
Induktionsaxiom aber auch über Elemente von Mengen natürlicher Zahlen
sprechen, müssen wir die Sprache weiterhin um ein zweistelliges Symbol ∈
für “ist Element von” anreichern.
Dann können wir das Induktionsaxiom wie folgt formulieren.
∀X ((0 ∈ X ∧ ∀n (n ∈ X → n + 1 ∈ X)) → ∀n n ∈ X).
14
KAPITEL 1. NATÜRLICHE ZAHLEN
Mit diesem Axiom und mit Hilfe von Q können wir nun versuchen, die
Aussage
∀n (n 6= 0 → ∃m n = m + 1)
wie folgt zu beweisen.
Zu zeigen ist, dass die Menge
X = {n ∈ N : n = 0 ∨ ∃m n = m + 1}
gleich N ist. Es gilt sicherlich 0 ∈ X. Sei nun n ∈ N beliebig mit n ∈ X.
Dann gilt auch n + 1 ∈ X, bezeugt durch m = n. Also gilt
0 ∈ X ∧ ∀n(n ∈ X → n + 1 ∈ X).
Auf Grund des Induktionsaxioms gilt also
∀n n ∈ X,
und damit ∀n(n 6= 0 → ∃m n = m + 1), wie gewünscht.
Diese Argumentation ist nicht falsch, allerdings wird bei näherem Hinsehen klar, dass wir dabei etwas benutzen, das uns nicht durch das Induktionsaxiom plus Q geliefert wird, nämlich dass wir das Induktionsaxiom auf
die Menge X = {n ∈ N : n = 0 ∨ ∃m n = m + 1} anwenden können.
Mit anderen Worten, außer dem Induktionsaxiom und Q benötigen wir ein
Mengenexistenzaxiom nämlich
∃X∀n(n ∈ X ↔ n = 0 ∨ ∃m n = m + 1),
welches uns liefert, dass {n ∈ N : n = 0 ∨ ∃m n = m + 1} tatsächlich eine
Menge ist, so dass das Induktionsaxiom auf diese Menge spezialisiert werden
darf.
Aus allgemeiner Sicht würde man die Variablen n, m, p, . . . (nämlich die
Variablen für natürliche Zahlen) als Variablen erster Stufe bezeichnen und
die Variablen X, Y, Z, . . . (nämlich die Variablen für Mengen natürlicher Zahlen) als Variablen zweiter Stufe. Einer derartigen Situation werden wir bei
der Axiomatisierung von R wieder begegnen, wo man auch geneigt ist, Variablen erster Stufe (nämlich Variablen für reelle Zahlen) und Variablen zweiter
Stufe (nämlich Variablen für Mengen reeller Zahlen) einzuführen. Der Preis,
der für die Einführung von Variablen zweiter Stufe zu zahlen ist, ist allerdings, dass dann Mengenexistenzaxiome erforderlich sind, die nicht benötigt
werden, wenn in der Sprache nur Variablen erster Stufe (nämlich Variablen
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
15
für Elemente des Bereichs, über den man gerade spricht, nicht für Mengen
derartiger Elemente) verwendet werden. In der Zahlentheorie lassen sich Variablen zweiter Stufe plus Mengenexistenzaxiome dadurch vermeiden, dass
anstelle eines Induktionsaxioms eine unendliche Menge von Induktionsaxiomen (das “Induktionsschema”) angegeben wird.
Um etwa den obigen Beweis laufen zu lassen, genügt es , das Induktionsaxiom für den Fall
X = {n ∈ N : n = 0 ∨ ∃m n = m + 1}
als gültig vorauszusetzen. Wir können diesen Fall anders wie folgt niederschreiben.
Sei ϕ(n) die Formel n = 0 ∨ ∃m n = m + 1. Dann lautet die für das obige
Argument benötigte Aussage
(ϕ(0) ∧ ∀n(ϕ(n) → ϕ(n + 1))) → ∀nϕ(n).
Das Induktionsschema lautet nun einfach wie folgt. Für jede Formel
ϕ(n, m1 , . . . , mk ) der Sprache von Q, in der die Variablen n, m1 , . . . , mk
vorkommen, ist
(Ind)ϕ ∀m1 . . . ∀mk ((ϕ(0, m1 , . . . , mk )∧
∀n(ϕ(n, m1 , . . . , mk ) → ϕ(n + 1, m1 , . . . , mk )))
→ ∀nϕ(n, m1 , . . . , mk ))
das zu ϕ gehörige Induktionsaxiom. Das Induktionsschema ist die (unendliche) Menge aller (Ind)ϕ , wobei ϕ eine Formel der Sprache von Q ist.
Wir bezeichnen Q plus dem Induktionsschema als Peano–Arithmetik,
kurz: P A.
In P A können wir beispielsweise die Assoziativität von + wie folgt beweisen.
Satz 1.2.1 (PA) ∀n∀m∀q (m + q) + n = m + (q + n).
Beweis: Wir zeigen zunächst
(*) ∀m∀q (m + q) + 0 = m + (q + 0)
mit Hilfe von zweimaliger Anwendung von (Q3) wie folgt: (m + q) + 0 =
m + q = m + (q + 0). Sodann zeigen wir
(**) ∀n(∀m∀q (m + q) + n = m + (q + n) → ∀m∀q (m + q) + (n + 1) =
m + (q + (n + 1))
16
KAPITEL 1. NATÜRLICHE ZAHLEN
wie folgt: Seien n, m und q beliebig, und werde (m + q) + n = m + (q + n)
vorausgesetzt. Dann ist (m + q) + (n + 1) = ((m + q) + n) + 1 wegen (Q4),
welches nach Voraussetzung gleich (m + (q + n)) + 1, ist, welches nach (Q4)
wiederum gleich m + ((q + n) + 1) ist.
Aus (*) und (**) folgt aber nun mit Hilfe von (Ind)∀m∀q (m+q)+n=m+(q+n)
sofort die zu beweisende Aussage ∀n∀m∀q (m + q) + n = m + (q + n).
Die Kommutativität von + beweist sich in P A nun mit Hilfe von Satz 1.2.1
wie folgt.
Satz 1.2.2 (PA) ∀n∀m n + m = m + n.
Beweis: Wir zeigen zunächst
(*)’ ∀m 0 + m = m + 0.
Es gilt nämlich 0 + 0 = 0 + 0. Außerdem folgt aus 0 + m = m + 0 und mit
Hilfe von (Q4), dass 0 + (m + 1) = (0 + m) + 1 = (m + 0) + 1. (Ind)0+m=m+0
liefert dann (*)’.
Sodann zeigen wir
(**)’ ∀m 1 + m = m + 1.
Es gilt nämlich 1 + 0 = 0 + 1 wegen (*)’. Aus 1 + m = m + 1 folgt aber mit
Hilfe von (Q4), dass 1 + (m + 1) = (1 + m) + 1 = (m + 1) + 1. Aufgrund von
(Ind)1+m=m+1 ergibt sich dann (*)’.
Schliesslich zeigen wir
(***)’ ∀n(∀m n + m = m + n → ∀m (n + 1) + m = m + (n + 1)).
Sei n beliebig, und sei ∀m n + m = m + n vorausgesetzt. Dann gilt für
beliebiges m, dass (n + 1) + m = n + (1 + m) wegen Satz 1.2.1, welches wegen
(**)’ gleich n + (m + 1), also mit Hilfe von (Q4) gleich (n + m) + 1 und damit
nach Voraussetzung gleich (m + n) + 1 ist. Abermalige Anwendung von (Q4)
liefert schliesslich, dass (n + 1) + m gleich m + (n + 1) ist.
Aus (*)’ und (***)’ folgt aber mit Hilfe von (Ind)∀m(m+n=n+m) sofort
∀n∀m m + n = n + m.
Es stellt sich heraus, dass in P A alle üblichen Rechenregeln und Gesetze für
die natürlichen Zahlen bewiesen werden können ebenso wie viele Theoreme
der Zahlentheorie.
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
17
Gibt es überhaupt wahre Aussagen über die natürlichen Zahlen, die in
der Sprache von Q formuliert werden können und die in PA nicht beweisbar sind? Diese Frage führt zum Gödelschen Unvollständigkeitssatz, der in
einführenden Logik–Kursen behandelt wird. Eine Version des Unvollständigkeitssatzes kann aus dem Kompaktheitssatz abgeleitet werden, der im letzten
Kapitel bewiesen wird.
18
KAPITEL 1. NATÜRLICHE ZAHLEN
Kapitel 2
Reelle Zahlen
Die griechische Mathematik hatte die reellen Zahlen zwar eigentlich entdeckt,
es wurde aber nicht mit ihnen gerechnet bzw. ihre Theorie entwickelt. Dies
wurde erst in der Neuzeit vollzogen.
2.1
Die Konstruktion der ganzen und rationalen
Zahlen
Die reellen Zahlen lassen sich mit Hilfe einfacher mengentheoretischer Konstruktionen aus den natürlichen Zahlen gewinnen. Wir benötigen hierfür
lediglich geordnete Paare, Äquivalenzrelationen und Folgen. Wir gehen dabei in drei Schritten vor: wir konstruieren zuerst die Menge Z der ganzen
Zahlen, sodann die Menge Q der rationalen Zahlen und schließlich die Menge
R der reellen Zahlen.
Deﬁnition 2.1.1 Sei A eine beliebige Menge. Eine zweistellige Relation R
auf A ist eine Äquivalenzrelation gdw. gilt:
(Reflexivität) xRx für alle x ∈ A,
(Symmetrie) xRy =⇒ yRx für alle x, y ∈ A, und
(Transitivität) xRy ∧ yRz =⇒ xRz für alle x, y, z ∈ A.
Wenn R eine Äquivalenzrelation auf A ist, dann heißt für x ∈ A die
Menge [x]R = {y ∈ A : yRx} die (R–)Äquivalenzklasse von x.
In der Situation von Deﬁnition 2.1.1 gilt y ∈ [x]R gdw. yRx gdw. [x]R = [y]R
für alle x, y ∈ A.
Wir können Z als Menge von Äquivalenzklassen von Paaren natürlicher
Zahlen wie folgt konstruieren.
19
20
KAPITEL 2. REELLE ZAHLEN
Seien (n, m) und (r, s) geordnete Paare natürlicher Zahlen. Wir identiﬁzieren (n, m) mit (r, s) gdw. die Diﬀerenz von n und m gleich der Diﬀerenz
von r und s ist, d.h. wir deﬁnieren eine zweistellige Relation R durch
(n, m)R(r, s) ⇔ n + s = r + m.
Oﬀensichtlich ist R eine Äquivalenzrelation. Wir schreiben
[n, m] = {(r, s) : (r, s)R(n, m)}
für die R–Äquivalenzklasse von (n, m). Für n ≥ m ist (n, m) = (n − m, 0),
und für n ≤ m ist (n, m) = (0, m − n), wodurch die nach links und rechts
unendliche “Folge”
. . . , [0, 2], [0, 1], [0, 0], [1, 0], [2, 0], . . .
sämtliche R–Äquivalenzklassen durchläuft. Unsere Vorstellung ist, dass [n, 0]
für die ganze Zahl +n und [0, n] für die ganze Zahl −n steht. Die Menge aller
R–Äquivalenzklassen bezeichnen wir mit Z und nennen sie die Menge der
ganzen Zahlen.
Wir schreiben
[n, m] < [r, s] ⇔ n + s < r + m,
wodurch < eine strikte lineare Ordnung auf Z ist. Wir können mit unseren
ganzen Zahlen auch in gewohnter Weise rechnen. Hierzu deﬁnieren wir die
Addition auf Z durch
[n, m] + [r, s] = [n + r, m + s].
Man sieht leicht, dass + assoziativ und kommutativ auf Z ist. Darüberhinaus
gilt
[n, m] + [0, 0] = [n, m]
und
[n, m] + [m, n] = [0, 0].
Somit ist Z bezüglich + eine abelsche Gruppe. Bis auf Isomorphie ist Z die
unendliche zyklische Gruppe.
In der angegebenen Art lässt sich übrigens aus einer beliebigen Halbgruppe H eine Gruppe G mit H ⊂ G konstruieren.
2.1. DIE KONSTRUKTION DER GANZEN UND RATIONALEN ZAHLEN21
Wir deﬁnieren weiterhin die Multiplikation auf Z durch
[n, m] · [r, s] = [n · r + m · s, n · s + m · r].
Dann gilt
[n, m] · [1, 0] = [n, m],
aber [1, 0] und [0, 1] sind die einzigen ganzen Zahlen [n, m], für die [r, s] mit
[n, m] · [r, s] = [1, 0]
existiert.
Wir schreiben von nun an +n (oder einfach n) für die ganze Zahl [n, 0]
und −n für die ganze Zahl [0, n].
Wir konstruieren nun Q als Menge von Äquivalenzklassen von Paaren
gewisser ganzer Zahlen wie folgt.
Seien (n, m) und (r, s) geordnete Paare ganzer Zahlen, wobei m 6= 0 6= s.
Wir identiﬁzieren (n, m) mit (r, s) gdw. der Quotient aus n und m gleich
dem Quotienten aus r und s ist, d.h. wir deﬁnieren eine zweistellige Relation
S durch
(n, m)S(r, s) ⇔ n · s = r · m.
Oﬀensichtlich ist S eine Äquivalenzrelation auf der Menge aller Paare ganzer
Zahlen, deren zweite Komponente nicht 0 ist. (Würden wir als zweite Komponente die 0 zulassen, so wäre S nicht transitiv, da dann für alle (n, m)
gelten würde, dass (n, m)S(0, 0), aber z.B. gilt (1, 2)S(1, 3) nicht. Die Division durch 0 ist nicht möglich!)
Für n, m ∈ Z, m 6= 0, schreiben wir
hn, mi = {(r, s) : r, s ∈ Z, s 6= 0, (r, s)S(n, m)}
für die S–Äquivalenzklasse von (n, m). Unsere Vorstellung ist, dass hn, mi für
n
steht. Die Menge aller S–Äquivalenzklassen bezeichnen
die rationale Zahl m
wir mit Q und nennen sie die Menge der rationalen Zahlen.
Zu beliebigen r, s ∈ Z mit s 6= 0 existieren oﬀenbar r ′ , s′ ∈ Z mit s′ > 0
und (r, s)S(r ′ , s′ ). Für n, m, r, s ∈ Z mit m > 0 und s > 0 schreiben wir
hn, mi < hr, si ⇔ n · s < r · m,
wodurch < eine strikte lineare Ordnung auf Q ist. Wir können mit unseren
rationalen Zahlen wieder in gewohnter Weise rechnen.
22
KAPITEL 2. REELLE ZAHLEN
Wir deﬁnieren die Addition auf Q durch
hn, mi + hr, si = hn · s + r · m, m · si.
Wieder ist + assoziativ und kommutativ auf Q. Es gilt
hn, mi + h0, 1i = hn, mi
und
hn, mi + h−n, mi = h0, 1i.
Somit ist Q bezüglich + eine abelsche Gruppe. Wir deﬁnieren die Multiplikation auf Q durch
hn, mi · hr, si = hn · r, m · si.
Man sieht leicht, dass · assoziativ und kommutativ auf Q ist. Außerdem gilt
hn, mi · h0, 1i = h0, 1i.
und
hn, mi · h1, 1i = hn, mi.
für alle n, m ∈ Z mit m 6= 0, und es gilt
hn, mi · hm, ni = h1, 1i.
für alle n, m ∈ Z mit n 6= 0 6= m. Somit ist Q \ {h0, 1i} bezüglich · eine
abelsche Gruppe.
n
Wir schreiben von nun an m
für die rationale Zahl hn, mi, wobei n, m ∈
Z, m 6= 0.
n
n
| einer rationalen Zahl m
werde wie folgt deﬁniert. Es sei,
Der Betrag | m
n
n
für n, m ∈ Z mit m 6= 0, | m | derjenige der beiden Werte m
und −n
m , welcher
> 01 ist.
Es ist leicht zu veriﬁzieren, dass sowohl Z als auch Q abzählbare Mengen
sind. Im Falle von Z lässt sich eine Bijektion f : N → Z wie folgt angeben. Es
sei f (2n) = n und f (2n + 1) = −n. Im Falle von Q ist es etwas trickreicher,
eine Bijektion g : N → Q anzugeben, welches wir wie folgt leisten.
Sei, für m ∈ N, Pm die Menge aller n ∈ N, n ≥ 2, so dass pm (die mte
Primzahl) die kleinste Primzahl ist, die n teilt. (Z.B. ist P1 = {3, 9, 15, . . . }.)
Weiter sei für m ∈ N, m ≥ 1, Tm die Menge aller n ∈ N, n ≥ 1, so dass 1 der
größte gemeinsame Teiler von m und n ist. (Z.B. ist T3 = {1, 2, 4, 5, . . . }.)
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
23
Betrachten wir zunächst die Menge Q+ der positiven rationalen Zahlen.
n
darstelJedes Element von Q+ lässt sich eindeutig als “gekürzter Bruch” m
len, wobei m ≥ 1 und n ∈ Tm . Wir können nun eine Bijektion ϕ : Q+ → N
n
folgendermaßen angeben. Sei rs ∈ Q+ gegeben, und sei m
die eindeutige
n
r
r
gekürzte Darstellung von s , d.h. m = s , m ≥ 1 und n ∈ Tm . Wir setzen
dann
r
ϕ( ) = fPm−1 (fT−1
(n)) − 2.
m
s
Hierbei sind fTm : N → Tm und fPm+1 : N → Pm+1 die “natürlichen
Aufzählungen” von Tm und Pm+1 wie in Abschnitt 1.1. Wenn also n das kte
n
dem kten Element von Pm−1
Element von Tm ist, dann ordnen wir rs = m
zu. Dabei subtrahieren wir 2, um die Zahlen 0 und 1 ebenfalls in den Wertebereich von ϕ zu bekommen. Da N \ {0, 1} die disjunkte Vereinigung aller
Pm , m ≥ 2, ist, und da sowohl fTm : N → Tm als auch fPm : N → Pm bijektiv
sind, ist leicht zu veriﬁzieren, dass die so deﬁnierte Abbildung ϕ : Q+ → N
bijektiv ist.
Wir erhalten in derselben Weise eine bijektive Abbildung ψ : Q− → N
der Menge der negativen rationalen Zahlen auf N.
Schließlich können wir eine Bijektion g : N → Q deﬁnieren, indem wir
setzen: g(0) = 01 , g(2n + 1) = ϕ−1 (n) und g(2n + 2) = ψ −1 (n) für n ∈ N.
Die so deﬁnierte Bijektion g : N → Q respektiert natürlich in keinster
Weise die natürlichen Ordnungen auf N bzw. Q. Eine Bijektion, die diese
Ordnung respektieren würde, d.h. einen Ordnungsisomorphismus von N und
Q, kann es auch gar nicht geben. Im Unterschied zu N ist Q, zusammen mit
<, nämlich “dicht” im folgenden Sinne.
Sei < eine strikte lineare Ordnung auf einer Menge A. Dann heißt < dicht
gdw. für alle x, y ∈ A mit x < y ein z ∈ A existiert mit x < z und z < y.
r
Die natürliche Ordnung < auf Q ist dicht in diesem Sinne, dass für m
n, s ∈
m
r
m·s+r·n
m
r
Q mit n < s die rationale Zahl 2·n·s echt zwischen n und s liegt.
Man kann zeigen, dass Q zusammen mit < bis auf Isomorphie die einzige
dichte lineare Ordnung auf einer abzählbaren Menge ist, die keine “Endpunkte” besitzt (siehe Übungsaufgabe ?????).
2.2
Die Konstruktion der reellen Zahlen
Wir wenden uns nun der Konstruktion der reellen Zahlen zu. Diese können
wir als Äquivalenzklassen gewisser Folgen rationaler Zahlen gewinnen.
Eine rationale Folge ist eine (beliebige) Abbildung x : N → Q. Wir schreiben dabei auch xn anstelle von x(n) und (xn : n ∈ N) anstelle von x. Eine
24
KAPITEL 2. REELLE ZAHLEN
rationale Folge (xn : n ∈ N) heißt Cauchy–Folge gdw. für alle (rationalen)
ε > 0 ein n0 ∈ N existiert, so dass für alle n, m ≥ n0 gilt.
|xm − xn | < ε.
Eine rationale Folge (xn : n ∈ N) heißt Nullfolge gdw. für alle (rationalen)
ε > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 gilt: |xn | < ε. Beispielsweise
1
: n ∈ N) eine Nullfolge. Sei nämlich ε = rs > 0, wobei etwa
ist die Folge ( n+1
r, s ∈ N, r 6= 0 6= s. Setze n0 = s, dann gilt für alle n ≥ n0 : s < n0 + 1 ≤
1
n + 1 ≤ r · (n + 1), also n+1
< rs .
Jede Nullfolge ist eine Cauchy–Folge. Sei nämlich (xn : n ∈ N) Nullfolge.
Sei ε > 0, und sei n0 ∈ N so, dass für alle n ≥ n0 gilt: |xn | < 12 · ε. Dann gilt
für alle n, m ≥ n0
1
1
|xm − xn | ≤ |xm | + |xn | < ε + ε = ε.
2
2
(Die erste Ungleichung benutzt die “Dreiecksungleichung”.)
Eine Folge (xn : n ∈ N) heißt konstant gdw. ein y ∈ Q existiert, so dass
xn = y für alle n ∈ N gilt. Wir schreiben in diesem Falle auch (x : n ∈ N)
für (xn : n ∈ N). Die Differenz zweier Folgen (xn : n ∈ N) und (yn : n ∈ N)
wird als Folge der punktweisen Diﬀerenzen deﬁniert, d.h.
(xn : n ∈ N) − (yn : n ∈ N) = (xn − yn : n ∈ N).
Eine Folge (xn : n ∈ N) konvergiert gegen x ∈ Q gdw. die Diﬀerenz von
(xn : n ∈ N) und (x : n ∈ N) eine Nullfolge ist. In diesem Falle schreiben wir
x = lim xn .
n→∞
Wenn (xn : n ∈ N) gegen x ∈ Q konvergiert, dann ist (xn : n ∈ N) eine
Cauchy–Folge. Dies ergibt sich aus dem obigen Argument für Nullfolgen, da
immer
xn − xm = (xn − x) − (xm − x).
Wir wollen nun sehen, dass es Cauchy–Folgen gibt, für die keine rationale
Zahl existiert, gegen die diese Cauchy–Folge konvergiert.
Lemma 2.2.1 Es gibt kein x ∈ Q mit x2 = 2.
Beweis: Sei rs ∈ Q. Sei n die kleinste positive Zahl, für die ein (eindeutiges!)
r
m ∈ Z existiert mit m
n = s . Für diese Wahl von n und m gilt dann, dass
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
25
m oder n ungerade ist. Wären nämlich beide gerade, etwa m = 2m und
′
n = 2n′ , dann n′ < n und rs = m
n′ im Widerspruch zur Wahl von n.
m 2
2
2
Wir zeigen jetzt ( rs )2 = ( m
n ) 6= 2. Angenommen, ( n ) = 2, d.h. m =
2
′
2n . Dann ist m gerade, da andernfalls für m = 2m + 1 gelten müsste, dass
2n2 = m2 = 4(m′ 2 + m′ ) + 1 was ein Widerspruch ist, da die linke Seite
dieser Gleichung gerade und die rechte ungerade ist.
Wenn aber m gerade ist, etwa m = 2m′ , dann folgt aus m2 = 2n2 , dass
2n2 = m2 = 4m′ 2 , also n2 = 2m′ 2 . Eine Wiederholung des obigen Arguments
liefert dann, dass auch n gerade sein muss. Damit ist sowohl m als auch n
gerade. Widerspruch!
Derselbe Beweis zeigt, dass, falls n ∈ N keine Quadratzahl ist, kein x ∈ Q mit
x2 = n existiert. Wir deﬁnieren nun einen Cauchy–Folge (xn : n ∈ N), die,
würde sie gegen ein x ∈ Q konvergieren, gegen ein x mit x2 = 2 konvergieren
müsste.
Lemma 2.2.2 Es gibt eine Cauchy–Folge (xn : x ∈ N), zu der kein x ∈ Q
existiert, so dass (xn : n ∈ N) gegen x konvergiert.
Beweis: Wir konstruieren “rekursiv” zwei Cauchy–Folgen (xn : n ∈ N) und
(yn : n ∈ N) wie folgt.
Wir setzen x0 = 0 und y0 = 2. Oﬀensichtlich gilt 0 ≤ x0 < y0 und
x20 < 2 < y02 .
Nehmen wir nun an, die rationalen Zahlen xn und yn sind bereits konstruiert, so dass 0 ≤ xn < yn und x2n < 2 < yn2 . Sei dann z = 21 · (yn + xn ).
Falls z 2 < 2, dann setzen wir xn+1 = z und yn+1 = yn ; falls z 2 > 2, dann
setzen wir xn+1 = xn und yn+1 = z. (Da mit xn und yn auch z rational
ist, kann wegen Lemma 2.2.1 nicht z 2 = 2 gelten.) In jedem Falle gilt für
die rationalen Zahlen xn+1 und yn+1 dann wieder 0 ≤ xn+1 < yn+1 und
2 .
x2n+1 < 2 < yn+1
Damit sind (xn : n ∈ N) und (yn : n ∈ N) konstruiert. Durch Induktion
1
. Für n = 0 gilt nämlich
ergibt sich, dass für alle n ∈ N gilt: yn − xn = 2n−1
1
1
y0 − x0 = 2 = 2−1 , und wenn yn − xn = 2n−1 , dann gilt yn+1 − xn+1 =
1
1
1
1
1
2 · (yn − xn ) = 2 · 2n−1 = 2n = 2(n+1)−1 . Nach Konstruktion gilt oﬀensichtlich
auch 0 ≤ x0 ≤ x1 ≤ x2 ≤ . . . und 2 = y0 ≥ y1 ≥ y2 ≥ . . . . Sowohl
(xn : n ∈ N) als auch (yn : n ∈ N) sind dann Cauchy–Folgen. Sei nämlich
ε > 0. Sei n0 ∈ N so, dass 2n0 −1 > 1ε (ein derartiges n0 existiert, da für alle
n ∈ N gilt: 2n ≥ n). Dann gilt für alle n, m ≥ n0 : xn0 ≤ xn ≤ yn0 und
26
KAPITEL 2. REELLE ZAHLEN
xn0 ≤ xm ≤ yn0 und daher
|xm − xn | ≤ yn0 − xn0 =
1
< ε.
2n0 −1
Also ist (xn : n ∈ N) Cauchy–Folge. Dasselbe Argument zeigt, dass auch
(yn : n ∈ N) Cauchy–Folge ist.
Angenommen nun, (xn : n ∈ N) konvergiert gegen x ∈ Q. Da x0 ≤ x1 ≤
x2 ≤ . . . , gilt dann x ≥ xn für alle n ∈ N (wäre x < xn für ein n ∈ N,
dann hätten wir |xm − x| ≥ |xn − x| für alle m ≥ n). Weiterhin würde auch
(yn : n ∈ N) gegen x konvergieren. Sei nämlich ε > 0 und sei n0 so, dass
1
< ε. Dann gilt für n ≥ n0 :
2n0 −1
|yn − x| ≤ yn − xn ≤ yn0 − xn0 =
1
2n0 −1
< ε.
Außerdem folgt aus y0 ≥ y1 ≥ y2 ≥ . . . analog zu eben, dass x ≤ yn für
alle n ∈ N gilt. Wir haben nun 0 ≤ xn ≤ x ≤ yn für alle x ∈ N, also auch
x2n ≤ x2 ≤ yn2 für alle n ∈ N.
Sei ε > 0. Sei n0 so, dass für alle n ≥ n0 gilt: yn − xn < 14 · ε. Dann gilt
2 − x2n ≤ yn2 − x2n = (yn − xn )(yn + xn ) ≤ (yn − xn ) · 2yn < 41 · ε · 4 = ε, und
damit x2n ≥ 2 − ε. (Die Folge (x2n : n ∈ N) konvergiert damit gegen 2.) Also
gilt x2 ≥ 2 − ε für alle ε > 0, woraus x2 ≥ 2 folgt. Völlig analog zeigt man
x2 ≤ 2. Also gilt x2 = 2. Dies ist ein Widerspruch!
Lemma 2.2.2 besagt, dass Q nicht vollständig ist: es gibt in Q verlaufende Cauchy–Folgen, die nicht in Q konvergieren. Wir werden nun Q “vervollständigen”.
Wir deﬁnieren dazu zunächst eine Äquivalenzrelation auf der Menge der
(rationalen) Cauchy–Folgen. Seien (xn : n ∈ N), (yn : n ∈ N) rationale
Cauchy–Folgen. Wir schreiben dann
(xn : n ∈ N)E(yn : n ∈ N),
falls die Diﬀerenz von (xn : n ∈ N) und (yn : n ∈ N) eine Nullfolge ist.
Oﬀensichtlich ist E reﬂexiv und symmetrisch. Die Transitivität von E ergibt
sich folgendermaßen. Sei (xn : n ∈ N)E(yn : n ∈ N) und (yn : n ∈ N)E(zn :
n ∈ N). Sei ε > 0, und sei n0 ∈ N so, dass für alle n ≥ n0 gilt: |yn − xn | < 21 ε
und |zn − yn | < 12 ε. Dann gilt für alle n ≥ n0 :
1
1
|zn − xn | ≤ |zn − yn | + |yn − xn | < ε + ε = ε
2
2
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
27
mit Hilfe der Dreiecksungleichung. Also ist auch die Diﬀerenz von (xn : n ∈
N) und (zn : n ∈ N) eine Nullfolge.
Wenn (xn : n ∈ N) eine rationale Cauchy–Folge ist, dann schreiben wir
nun
[xn : n ∈ N] = {(yn : n ∈ N) : (yn : n ∈ N)E(xn : n ∈ N)}
für die E–Äquivalenzklasse von (xn : n ∈ N). Unsere Vorstellung ist, dass
[xn : n ∈ N] diejenige reelle Zahl ist, gegen die (xn : n ∈ N) konvergiert. Die
Menge aller E–Äquivalenzklassen bezeichnen wir mit R und nennen sie die
Menge der reellen Zahlen.
Die Menge Q der rationalen Zahlen ist in natürlicher Weise in der Menge
R der reellen Zahlen enthalten, indem wir x ∈ Q mit [x : n ∈ N] identiﬁzieren.
Für x ∈ Q schreiben wir im Folgenden auch x anstelle von [x : n ∈ N].
Lemma 2.2.3 Seien (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen.
Dann gilt genau eine der folgenden Aussagen:
(1) (xn : n ∈ N)E(yn : n ∈ N)
(2) es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn >
xn + ε
(3) es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : xn >
yn + ε.
Beweis: Oﬀensichtlich schließen sich (1), (2) und (3) gegenseitig aus. Wir
zeigen, dass (1) gilt, falls sowohl (2) als auch (3) falsch sind. Wenn (2) und
(3) falsch sind, dann gibt es für jedes n ∈ N und für jedes ε ∈ Q, ε > 0, ein
m ≥ n mit
ym ≤ xm + ε,
und für jedes n ∈ N und für jedes ε ∈ Q, ε > 0, gibt es ein m ≥ n mit
xm ≤ ym + ε.
Sei nun ε ∈ Q, ε > 0. Sei n0 ∈ N so, dass für alle n, m ≥ n0 :
|xm − xn | < 13 ε und
|ym − yn | < 31 ε.
Sei m ≥ n0 , so dass ym ≤ xm + 31 ε, d.h. ym − xm ≤ 31 ε. Dann gilt für alle
n ≥ n0 :
y n − xn = y n − y m + y m − xm + xm − xn
≤ |yn − ym | + ym − xm + |xm − xn |
< 13 ε + 31 ε + 13 ε = ε.
28
KAPITEL 2. REELLE ZAHLEN
Analog zeigt man, dass für alle n ≥ n0 : xn − yn < ε.
Damit haben wir ein n0 ∈ N gefunden, so dass für alle n ≥ n0 gilt:
|yn − xn | < ε. Damit ist die Diﬀerenz von (xn : n ∈ N) und (yn : n ∈ N) eine
Nullfolge und es gilt (1).
Deﬁnition 2.2.4 Seien (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen.
Wir schreiben dann
[xn : n ∈ N] < [yn : n ∈ N]
gdw. es ein n0 ∈ N und ein ε ∈ Q, ε > 0, gibt, so dass für alle n ≥ n0 : yn >
xn + ε.
Wir müssen zeigen, dass < wohldeﬁniert ist. Die deﬁnierende Tatsache (“es
gibt n0 ∈ N und ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn > xn + ε”) nimmt
Bezug auf einen Repräsentanten der Äquivalenzklasse [xn : n ∈ N] (nämlich
(yn : n ∈ N)). Wir müssen zeigen, dass der Wahrheitswert der deﬁnierenden
Tatsache nicht von der Wahl der Repräsentanten abhängt. Dies erfolgt im
Wesentlichen in gleicher Weise wie der Beweis zu Lemma 2.2.3
Lemma 2.2.5 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N) und (yn′ :
n ∈ N) rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und
(yn : n ∈ N)E(yn′ : n ∈ N). Dann sind die folgenden Aussagen äquivalent.
(1) Es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0 so, dass für alle n ≥ n0 : yn >
xn + ε.
(2) Es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0 so, dass für alle n ≥ n0 : yn′ >
x′n + ε.
Beweis: Aus Symmetriegründen genügt es zu zeigen, dass (2) aus (1) folgt.
Sei also (1) angenommen, und werde dies durch n0 ∈ N und ε ∈ Q, ε > 0,
bezeugt. Sei m0 ∈ N so, dass für alle n ≥ n0 gilt: |x′n − xn | < 3ε und
|yn′ − yn | < 3ε . Sei o.B.d.A. m0 ≥ n0 . Dann gilt für alle n ≥ m0 :
yn′ − x′n = (yn − xn ) − (yn − yn′ ) − (x′n − xn )
≥ (yn − xn ) − |yn − yn′ | − |x′n − xn |
> ε − 3ε − 3ε = 3ε .
Damit gilt (2), bezeugt durch m0 und 3ε .
Wir haben gezeigt, dass < eine strikte lineare Ordnung auf R ist. Die rationalen Zahlen sind im folgenden Sinne “dicht” in den reellen Zahlen enthalten:
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
29
Satz 2.2.6 Seien x, y ∈ R. Dann existiert ein z ∈ Q mit x < z und z < y.
Beweis: Sei x = [xn : n ∈ N] und y = [yn : n ∈ N], wobei (xn : n ∈
N), (yn : n ∈ N) rationale Cauchy–Folgen sind. Da x < y, gibt es n0 ∈ N
und ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn > xn + ε. Sei m0 ≥ n0
so, dass für alle n, m ≥ m0 gilt: |xm − xn | < 3ε und |ym − yn | < 3ε . Setze
z = 21 · (xm0 + ym0 ). Dann gilt für alle n ≥ m0 :
z − xn = z − xm0 + xm0 − xn
≥ z − xm0 − |xm0 − xn |
= 12 · (ym0 − xm0 ) − |xn0 − xn |
≥ 21 ε − 31 ε = 61 ε,
d.h. es gilt z ≥ xn + 16 ε für alle n ≥ m0 . Dies zeigt x = [xn : n ∈ N] < [z :
n ∈ N]. Analog zeigt man [z : n ∈ N] < [yn : n ∈ N] = y.
Korollar 2.2.7 R ist “archimedisch” im folgenden Sinne. Sei x ∈ R. Dann
existiert ein n ∈ N mit x < n.
Beweis: Der Fall x ≤ 0 ist trivial. Nehmen wir also an, es gelte x > 0. Sei
z ∈ Q, so dass z > 0 und z < x1 . Es gibt m, n ∈ N mit m > 0 und n > 0, so
m
1
dass z = m
n . Es gilt dann n < x , also m · x < n. Daraus folgt x < n.
Mit den reellen Zahlen lässt sich in gewohnter Weise rechnen.
Wir deﬁnieren die Addition auf R durch
[xn : n ∈ N] + [yn : n ∈ N] = [xn + yn : n ∈ N],
wobei (xn : n ∈ N) und (yn : n ∈ N) rationale Cauchy–Folgen sind.
Lemma 2.2.8 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N), (yn′ : n ∈ N)
rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und (yn : n ∈
N)E(yn′ : n ∈ N). Dann sind auch (xn + yn : n ∈ N), (x′n + yn′ : n ∈ N)
rationale Cauchy–Folgen und es gilt (xn + yn : n ∈ N)E(x′n + yn′ : n ∈ N).
Beweis: Siehe Übungsaufgabe ?????
Damit ist die Addition auf R wohldeﬁniert. Man sieht leicht, dass + assoziativ und kommutativ auf R ist. Außerdem gilt
[xn : n ∈ N] + [0 : n ∈ N] = [xn : n ∈ N]
30
KAPITEL 2. REELLE ZAHLEN
und
[xn : n ∈ N] + [−xn : n ∈ N] = [0 : n ∈ N]
für alle rationalen Cauchy–Folgen (xn : n ∈ N), wodurch R bezüglich + eine
abelsche Gruppe ist.
Wir deﬁnieren die Multiplikation auf R durch
[xn : n ∈ N] · [yn : n ∈ N] = [xn · yn : n ∈ N],
wobei (xn : n ∈ N) und (yn : n ∈ N) rationale Cauchy–Folgen sind.
Lemma 2.2.9 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N) und (yn′ :
n ∈ N) rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und
(yn : n ∈ N)E(yn′ : n ∈ N). Dann sind auch (xn · yn : n ∈ N), (x′n · yn′ : n ∈ N)
rationale Cauchy–Folgen und es gilt (xn · yn : n ∈ N)E(x′n · yn′ : n ∈ N)
Beweis: Siehe Übungsaufgabe ?????
Damit ist die Multiplikation auf R wohldeﬁniert. Man sieht leicht, dass ·
assoziativ und kommutativ auf R ist. Außerdem gilt
[xn : n ∈ N] · [1 : n ∈ N] = [xn : n ∈ N]
für alle rationalen Cauchy–Folgen (xn : n ∈ N). Sei weiterhin (xn : n ∈ N)
eine rationale Cauchy–Folge, [xn : n ∈ N] keine Nullfolge, d.h. es gibt ein
n0 ∈ N und ein ε ∈ Q, ε > 0, so dass |xn | > ε für alle n ≥ n0 . Sei dann
(yn : n ∈ N) deﬁniert durch yn = 1, falls n < n0 , und yn = x1n , falls n ≥ n0 .
Dann ist (yn : n ∈ N) eine rationale Cauchy–Folge. Sei nämlich ε ∈ Q, ε > 0.
Sei m0 ≥ n0 so, dass für alle m, n ≥ m0 gilt: |xm − xn | < ε3 ; dann gilt für
|xn −xm |
ε3
alle m, n ≥ m0 : |ym − yn | = | x1m − x1n | = |x
= ε. Außerdem sieht
< ε·ε
m |·|xn |
man leicht, dass
(xn · yn : n ∈ N)E(1 : n ∈ N) = 1.
Somit ist R \ {0} bezüglich · eine abelsche Gruppe.
Ebenso leicht lassen sich die Distributionsgesetze für + und · nachrechnen, wodurch R ein Körper ist.
Wir wollen nun die Vollständigkeit von R nachrechnen. Die Vollständigkeit von R besagt, dass jede Cauchy–Folge, die in R verläuft, einen Grenzwert
in R besitzt. Hierzu müssen wir zunächst die Begriﬀe “Cauchy–Folge” und
“Konvergenz” in natürlicher Weise auf R ausdehnen.
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
31
Deﬁnition 2.2.10 Sei (xn : n ∈ N) eine Folge reeller Zahlen. Dann heißt
(xn : n ∈ N) eine Cauchy–Folge gdw. für alle ε > 0 ein n0 ∈ N existiert, so
dass für alle n, m ≥ n0 gilt: |xm − xn | < ε.
Da wegen Satz 2.2.6 zu jedem ε ∈ R mit ε > 0 ein ε′ ∈ Q mit ε′ < ε und
ε′ > 0 existiert, spielt es keine Rolle, ob die Zahl ε in Deﬁnition 2.2.10 als
rational oder reell angenommen wird.
Deﬁnition 2.2.11 Sei (xn : n ∈ N) eine Folge reeller Zahlen und sei x eine
reelle Zahl. Dann konvergiert (xn : n ∈ N) gegen x, in Zeichen
lim xn = x,
n→∞
gdw. für alle ε > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 gilt:
|x − xn | < ε.
Sei (xn : n ∈ N) eine reelle Folge, und sei x ∈ R. Angenommen, es gilt
limn→∞ xn = x. Zu vorgelegtem ε > 0 sei n0 ∈ N so, dass |x − xn | < 2ε für
alle n ≥ n0 . Dann gilt für alle n, m ≥ n0 :
|xm − xn | = |x − xn + xm − x|
≤ |x − xn | + |xm − x| <
ε
2
+
ε
2
= ε.
Wenn also (xn : n ∈ N) gegen x konvergiert dann ist (xn : n ∈ N) eine
Cauchy–Folge.
Satz 2.2.12 Sei (xn : n ∈ N) eine reelle Cauchy–Folge. Dann gibt es eine
reelle Zahl x, so dass (xn : n ∈ N) gegen x konvergiert.
Beweis: Für jedes n ∈ N sei yn eine rationale Zahl mit xn < yn und yn <
1
. (Ein solches yn existiert wegen Satz 2.2.6).
xn + n+1
Wir zeigen zunächst, dass (yn : n ∈ N) eine Cauchy–Folge ist. Sei ε > 0
vorgelegt. Sein n0 ∈ N so, dass n01+1 < 3ε und für alle m, n ≥ n0 :
|ym − yn | = |ym − xm + xm − xn + xn − yn |
≤ |ym − xm | + |xm − xn | + |xn − yn |
1
1
< m+1
+ 3ε + n+1
ε
ε
ε
< 3 + 3 + 3 = ε.
Die Folge (yn : n ∈ N) ist also in der Tat eine rationale Cauchy–Folge.
32
KAPITEL 2. REELLE ZAHLEN
Wir zeigen nun, dass (xn : n ∈ N) gegen die reelle Zahl [yn : n ∈ N]
konvergiert. Wir schreiben y = [yn : n ∈ N]. Wir müssen zeigen, dass für
jedes ε > 0 ein n0 ∈ N existiert, so dass für alle m ≥ n0 gilt: |y − xm | < ε.
Sei also ε > 0 vorgelegt.
ε
2
Behauptung. Es gibt ein n0 ∈ N, so dass für alle m ≥ n0 gilt: |ym −y| <
1
und m+1
< 2ε .
Sei zunächst die Behauptung als richtig angenommen. Dann gilt für m ≥
n0 , mit Hilfe der Dreiecksungleichung:
|xm − y| = |xm − ym + ym − y| ≤
1
+ 2ε <
|xm − ym | + |ym − y| < m+1
ε
2
+
ε
2
= ε.
Es genügt also, die Behauptung zu beweisen.
Sei m0 so, dass für alle m, k ≥ m0 gilt: |ym − yk | < 4ε . Sei m ≥ m0 , und
sei δ = 4ε . Dann gilt für alle k ≥ m0 :
yk +
ε
> ym + δ
2
und
ε
> yk + δ.
2
Nach Deﬁnition 2.2.4 bedeutet dies:
ym +
ym = [ym : n ∈ N] < [yn +
und
y = [yn : n ∈ N] < [ym +
ε
ε
: n ∈ N] = y +
2
2
ε
ε
: n ∈ N] = ym + ,
2
2
d.h.
ε
|ym − y| < .
2
Aufgrund von Korollar 2.2.7 existiert ein k0 , so dass für alle m ≥ k0 gilt:
ε
1
m+1 < 2 . Wenn dann n0 das Maximum von m0 und k0 ist, dann leistet n0
das für die Behauptung Gewünschte.
Deﬁnition 2.2.13 Seien x, y ∈ R mit x < y. Wir schreiben dann
(x, y) = {z ∈ R : x < z ∧ z < y}
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
33
für das oﬀene Intervall zwischen x und y, und wir schreiben
[x, y] = {z ∈ R : x ≤ z ∧ z ≤ y}
für das abgeschlossene Intervall zwischen x und y.
Seien (xn : n ∈ N), (yn : n ∈ N) Folgen reeller Zahlen mit xn <Tyn , xn+1 ≥ xn
und yn+1 ≤ yn für alle n ∈ N. Dann gilt nicht notwendig, dass T n∈N (xn , yn ) 6=
1
für alle n ∈ N, dann
∅. (Wenn etwa xn = 0 und yn = n+1
T ist n∈N (xn , yn ) =
∅.) Andererseits gilt in dieser Situation immer, dass n∈N [xn , yn ] 6= ∅. Dies
ist die Aussage des Intervallschachtelungsprinzips.
Deﬁnition 2.2.14 Seien (xn : n ∈ N), (yn : n ∈ N) Folgen reeller Zahlen
mit xn < yn für alle n ∈ N. Dann heißt die Folge
([xn , yn ] : n ∈ N)
abgeschlossener Intervalle eine (abgeschlossene) Intervallschachtelung, falls
xn ≤ xn+1 und yn+1 ≤ yn für alle n ∈ N.
Satz 2.2.15 (Intervallschachtelungsprinzip) Sei ([xn , yn ] : n ∈ N) eine
Intervallschachtelung. Dann gilt
\
[xn , yn ] 6= ∅.
n∈N
Beweis: Zunächst ist leicht zu sehen, dass (xn : n ∈ N) eine Cauchy–Folge
ist. Andernfalls gäbe es nämlich ein ε > 0, so dass für alle n0 ∈ N natürliche
Zahlen n, m ≥ n0 mit |xm − xn | ≥ ε existieren, was sofort liefert, dass
(xn : n ∈ N) unbeschränkt ist. Ebenso sieht man, dass (yn : n ∈ N) eine
Cauchy–Folge ist.
Seien x = limn→∞ xn und y = limn→∞ yn . Es gilt x ≤ y, da ansonsten
ein n ∈ N mit yn < xn existieren müsste.
T
Damit gilt nun auch x ∈ [xn , yn ] für alle m ∈ N, d.h. n∈N [xn , yn ] 6= ∅.
Satz 2.2.16 (Supremumsprinzip) Sei A ⊂ R eine nichtleere beschränkte
Menge reeller Zahlen. Dann existiert ein x ∈ R mit:
(a) für alle y ∈ A gilt y ≤ x, und
(b) wenn z ∈ R so ist, dass y ≤ z für alle y ∈ A gilt, dann ist x ≤ z.
34
KAPITEL 2. REELLE ZAHLEN
Beweis: Wir deﬁnieren eine Intervallschachtelung ([xn , yn ] : n ∈ N) wie
folgt. Sei x0 ∈ A, und sei y0 so, dass y < y0 für alle y ∈ A gilt. Nehmen
wir an, xn und yn seien deﬁniert, wobei gilt: es gibt ein y ∈ A mit xn ≤ y
und y < yn für alle y ∈ A. Sei z = 21 · (xn + yn ). Wir setzen xn+1 = xn und
yn+1 = z falls y < z für alle y ∈ A, und wir setzen xn+1 = z und yn+1 = yn ,
falls es ein y ∈ A mit z ≤ y gibt.
Sei x = limn→∞ xn . Es lässt sich dann leicht nachrechnen, dass x wie
gewünscht ist.
Das Intervallschachtelungsprinzip kann in sehr einfacher Weise benutzt werden, um die Überabzählbarkeit von R zu zeigen.
Satz 2.2.17 (Cantor) Es gibt keine Surjektion
f : N → R.
Beweis: Sei f : N → R. Wir deﬁnieren eine Intervallschachtelung ([xn , yn ] :
n ∈ N) wie folgt. Sei x0 = 0 < 1 = y0 . Angenommen xn und yn seien bereits
konstruiert. Falls f (n) 6∈ [xn , yn ], dann setzen wir xn+1 = xn und yn+1 = yn .
Falls f (n) ∈ [xn , yn ], dann sei ε = 13 ·(yn −xn ). Mindestens eine der Intervalle
[xn , xn + ε], [xn + ε, xn + 2 · ε], [xn + 2 · ε, yn ] enthält dann f (n) nicht. Sei
k ∈ {0, 1, 2} minimal, so dass f (n) 6∈ [xn + k · ε, xn + (k + 1) · ε]. Wir setzen
dann xn+1 = xn + k · ε und yn+1 = xn + (k + 1) · ε.
Dies deﬁniert eine Intervallschachtelung ([xn , yn ] T
: n ∈ N) so, dass für
jedes n ∈ N gilt: f (n) 6∈ [xn+1 , yn+1 ]. Wenn also x ∈ n∈N [xn , yn ], dann ist
x 6∈ {f (n) : n ∈ N}, und f kann nicht surjektiv sein.
2.3
Die Theorie der reellen Zahlen
Wir wollen nun, ähnlich wie dies in Abschnitt 1.2 für die natürlichen Zahlen
geschehen ist, ein Axiomensystem für die reellen Zahlen angeben. Im Unterschied zur Peano–Arithmetik von Abschnitt 1.2 werden wir die Axiome
für R jedoch unter Zuhilfenahme einfacher mengentheoretischer Prinzipien
aus der Gültigkeit von PA für N beweisen können, da die reellen Zahlen mit
Hilfe einfacher mengentheoretischer Operationen aus den natürlichen Zahlen
konstruiert worden sind.
Zunächst sind die reellen Zahlen ein Körper, d.h. es gelten die nachfolgenden Axiome:
2.3. DIE THEORIE DER REELLEN ZAHLEN
35
(1) ∀x∀yx + y = y + x
(2) ∀x∀yx · y = y · x
(3) ∀x∀y∀z(x + y) + z = x + (y + z)
(4) ∀x∀y∀z(x · y) · z = x · (y · z)
(5) ∀x∀y∀zx · (y + z) = (x · y) + (x · z)
(6) ∀xx + 0 = x
(7) ∀xx · 1 = x
(8) ∀x∃yx + y = 0
(9) ∀x(x 6= 0 → ∃yx · y = 1)
Hierbei besagen die Axiome (1), (3), (6) und (8), dass R bezüglich + eine
abelsche Gruppe mit 0 als neutralem Element ist, und die Axiome (2), (4),
(7) und (9) besagen, dass R \ {0} bezüglich · eine abelsche Gruppe mit 1 als
neutralem Element ist. Die Axiome (1) und (2) sind die Kommutativ- und
die Axiome (3) und (4) die Assoziativgesetze. Axiom (5) ist das Distributivitätsgesetz. Darüber hinaus ist R sogar ein geordneter Körper, d.h. es gelten
weiterhin die nachfolgenden Axiome:
(10) ∀x∀y(x < y ∨ x = y ∨ y < x)
(11) ∀x∀y(x < y ∨ x = y → ¬y < x)
(12) ∀x∀y(x < y ∨ y < x → x 6= y)
(13) ∀x∀y(x = y ∨ y < x → ¬x < y)
(14) ∀x∀y∀z(x < y ∧ y < z → x < z)
(15) ∀x∀y∀z(x < y → x + z < y + z)
(16) ∀x∀y∀z(x < y ∧ 0 < z → x · z < y · z)
Die Axiome (10) – (13) drücken aus, dass für reelle Zahlen x, y genau eine
der drei Aussagen x < y, x = y, y < x zutriﬀt (Trichotomie). Axiom (14)
drückt die Transitivität von < aus, und die Axiome (15) und (16) sind die
Monotoniegesetze.
36
KAPITEL 2. REELLE ZAHLEN
Wir bezeichnen das Axiomensystem, das durch die obigen Axiome (1)
– (16) gegeben ist, mit GK (für “geordnete Körper”). Die Sprache, in der
GK formuliert ist, hat neben den allgemeinen logischen Symbolen (siehe Abschnitt 1.2) und Variablen x, y, z, . . . für reelle Zahlen die folgenden Symbole:
0 als Konstante für die Null
1 als Konstante für die Eins
+ als zweistelliges Funktionssymbol für die Addition
· als zweistelliges Funktionssymbol für die Multiplikation
< als zweistelliges Relationssymbol für die Kleiner-Relation
Man überzeugt sich leicht, dass es mehrere (zueinander nicht isomorphe)
Strukturen (d.h. geordnete Körper ) gibt, die die Axiome (1) – (16) erfüllen.
Beispielsweise ist neben R auch Q ein geordneter Körper.
√ Weiterhin ist jeder Zwischenkörper K mit Q ⊂ K ⊂ R (etwa K = Q[ 2]) ein geordneter
Körper. Um die reellen Zahlen genauer zu charakterisieren, benötigen wir
also (ein) weitere(s) Axiom(e). Wir müssen nämlich ausdrücken, dass die reellen Zahlen das Supremumsprinzip 2.2.16 erfüllen. Dabei geraten wir wieder
in dieselbe Situation wie anlässlich der Formulierung des Induktionsaxioms
in Abschnitt 1.2: entweder wir reichern die obige Sprache durch Hinzunahme
von Variablen für Mengen reeller Zahlen und des Symbols ∈ an und formulieren mit dieser Hilfe das Supremumsprinzip als ein Axiom, wobei wir dann
aber wieder zusätzliche Mengenexistenzaxiome benötigen, oder wir formulieren das Supremumsprinzip als Schema.
Im ersten Fall können wir wie folgt verfahren. Das Supremumsprinzip
wird als folgende Aussage genommen.
(17) ∀X(X 6= ∅ ∧ ∃x∀y(y ∈ X → y < x) →
∃x (∀y(y ∈ X → y < x)∧
∀z(∀y(y ∈ X → y < x) → z < x ∨ z = x))).
√
Beispielsweise benötigen wir, um die Existenz von 2 zu zeigen, das Supremumsprinzip (17) für
X = {y ∈ R : y · y < 2}.
Allgemeiner scheinen wir lediglich die folgenden Fälle des Supremumsprinzips zu benötigen.
2.3. DIE THEORIE DER REELLEN ZAHLEN
37
Sei ϕ(y, x1 , . . . , xn ) eine Formel der Sprache von GK, in der die Variablen
y, x1 , ..., xn vorkommen. Dann ist das zu ϕ(y, x1 , . . . , xn ) gehörige Supremumsprinzip die Aussage
(17)ϕ
∀x1 . . . ∀xn (∃yϕ(y, x1 , . . . , xn ) ∧ ∃x∀y(ϕ(y, x1 , . . . , xn ) → y < x) →
∃x
(∀y(ϕ(y, x1 , . . . , xn ) → y < x)∧
∀z(∀y(ϕ(y, x1 , . . . , xn ) → y < x) → z < x ∨ z = x))).
Wir bezeichnen das durch GK und alle (17)ϕ gegebene Axiomensystem mit
VGK (für “vollständige geordnete Körper”). Wir werden später diskutieren,
ob VGK die reellen Zahlen (“bis auf Isomorphie”) festlegen kann.
38
KAPITEL 2. REELLE ZAHLEN
Kapitel 3
Mengen
3.1
Mengen, Klassen und Grothendieck–Universen
Wir haben oben, insbesondere anlässlich der Konstruktion der reellen Zahlen
aus den natürlichen Zahlen, die Nützlichkeit mengentheoretischer Konstruktionen sehen können. Es stellt sich nun heraus, dass sämtliche Objekte bzw.
Strukturen der Mathematik mengentheoretisch konstruiert werden können.
Einigen Aspekten hiervon wollen wir in diesem Abschnitt nachgehen.
Einer der grundlegenden Begriﬀe der Mathematik ist der der Funktion.
Eine Funktion f von A nach B weist jedem Element a von A genau ein
Element f (a) von B zu. Wir können Funktionen als Mengen von geordneten Paaren mit bestimmten Eigenschaften ansehen. Wir müssen uns dann
zunächst mit dem Begriﬀ des geordneten Paares beschäftigen. Zu gegebenen
Objekten x und y wollen wir das “geordnete Paar” (x, y) so konstruieren,
dass für alle x, y, x′ , y ′ gilt:
(*) (x, y) = (x′ , y ′ ) ⇔ x = x′ und y = y ′ .
Wir könnten das geordnete Paar als vordeﬁnierten Grundbegriﬀ einführen,
von dem wir die Eigenschaft (*) verlangen (so verfährt etwa Bourbaki). Wir
können das geordnete Paar aber auch mengentheoretisch deﬁnieren. Hierzu
gibt es mehrere Möglichkeiten, von denen wir die folgende wählen.
Deﬁnition 3.1.1 Seien x, y beliebige Objekte. Das geordnete Paar von x
und y ist dann die Menge (x, y), die als {{x}, {x, y}} definiert ist.
Wir beweisen nun (*).
39
40
KAPITEL 3. MENGEN
Lemma 3.1.2 Seien x, y, x′ , y ′ beliebige Objekte. Dann gilt (x, y) = (x′ , y ′ ) ⇔
x = x′ ∧ y = y ′ .
Beweis: Die Gültigkeit von “⇐” ist trivial. Wir zeigen nun “⇒”. Sei also
(x, y) = (x′ , y ′ ) vorausgesetzt. Wir müssen zeigen, dass x = x′ und y = y ′ .
Zunächst bemerken wir Folgendes. Im Falle x = y gilt (x, y) = {{x}, {x, y}} =
{{x}}, (x, y) besitzt also ein Element, nämlich {x}. Im Falle x 6= y dagegen
besitzt (x, y) = {{x}, {x, y}} zwei verschiedene Elemente, nämlich {x} und
{x, y} (wäre {x} = {x, y} dann hätten wir y ∈ {x}, also y = x). Analoges
gilt natürlich auch für (x′ , y ′ ). Dies zeigt, dass aus (x, y) = (x′ , y ′ ) folgt, dass
entweder sowohl x = y als auch x′ = y ′ gilt oder dass sowohl x 6= y als auch
x′ 6= y ′ gilt.
1. Fall. x = y und x′ = y ′ .
Dann gilt {{x}} = (x, y) = (x′ , y ′ ) = {{x′ }}. Daraus folgt x = x′ , also
auch y ′ = x′ = x = y.
2. Fall. x 6= y und x′ 6= y ′ .
Dann besitzt (x, y) die zwei verschiedenen Elemente {x} und {x, y},
und (x′ , y ′ ) besitzt die zwei verschiedenen Elemente {x′ } und {x′ , y ′ }.
Da (x, y) = (x′ , y ′ ), gilt zunächst {x} ∈ (x′ , y ′ ) = {{x′ }, {x′ , y ′ }}, also {x} = {x′ } oder {x} = {x′ , y ′ }. Letzteres ist aber unmöglich, da
{x} einelementig und (wegen x′ 6= y ′ ) {x′ , y ′ } zweielementig ist. Also gilt {x} = {x′ }, woraus x = x′ folgt. Sodann gilt wegen (x, y) =
(x′ , y ′ ) auch {x, y} ∈ (x′ , y ′ ) = {{x′ }, {x′ , y ′ }}, also {x, y} = {x′ } oder
{x, y} = {x′ , y ′ }. Ersteres ist wieder unmöglich, da {x, y} (wegen x 6=
y) zweielementig und {x′ } einelementig ist. Also gilt {x, y} = {x′ , y ′ }.
Insbesondere gilt y = y ′ oder y = x′ . Letzteres ergibt aber wegen x = x′
(wie bereits gezeigt wurde), dass y = x, was x 6= y widerspricht. Also
gilt y = y ′ . Wir haben damit x = x′ und y = y ′ gezeigt.
Mit Hilfe des Begriﬀs des geordneten Paares können wir nun sehr leicht den
Begriﬀ der Funktion einführen.
Deﬁnition 3.1.3 Seien A, B beliebige Mengen. Das Kreuzprodukt, A × B,
von A und B ist dann die Menge aller geordneten Paare (a, b), wobei a ∈ A
und b ∈ B gilt. Jede Teilmenge R von A × B wird als Relation auf A, B bezeichnet. Eine Funktion von A nach B ist dann eine Relation R auf A, B, so
dass für jedes a ∈ A genau ein b ∈ B mit (a, b) ∈ R existiert. Üblicherweise
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
41
benutzen wir die Buchstaben f, g, . . . , F, . . . , ϕ, . . . für Funktionen. Wenn f
eine Funktion von A nach B ist, so heißt A der Urbildbereich von f und B
der Wertebereich von f und wir schreiben f : A → B.
Selbstverständlich haben wir oben bereits mit Funktionen gearbeitet, wir
wissen nun aber, wie wir diese als mengentheoretische Objekte konstruieren
können.
Mit Hilfe mengentheoretischer Operationen können wir leicht sehr große
Objekte konstruieren. Satz 2.2.17 hatte bereits gezeigt, dass es “mehr” reelle als natürliche Zahlen gibt. Ähnlich kann man zeigen, dass es zu jeder
beliebigen Menge A eine Menge B gibt, die “größer” ist als A.
Deﬁnition 3.1.4 Sei A eine beliebige Menge. Die Potenzmenge von A,
P(A), ist die Menge aller Teilmengen von A.
Satz 3.1.5 (Cantor). Es gibt keine Surjektion
f : A → P(A).
Beweis: Sei f : A → P(A) gegeben. Sei
X0 = {a ∈ A : a ∈
/ f (a)} ⊂ A.
Angenommen, es gibt ein a0 ∈ A mit f (a0 ) = X0 . Dann gilt a0 ∈ f (a0 ) = X0
gdw. a0 ∈
/ f (a0 ). Widerspruch!
Also existiert kein a ∈ A mit f (a) = X0 und f ist nicht surjektiv.
Es gibt also keine “größte” Menge, da es auf Grund dieses Satzes von Cantor
zu jeder Menge A eine “größere” Menge (nämlich P(A)) gibt. Insbesondere
gibt es keine Menge aller Mengen. Angenommen, es gäbe eine Menge V ,
in der jede Menge als Element enthalten ist. Dann gilt P(V ) ⊂ V , da jedes
Element von P(V ), d.h. jede Teilmenge von V , selbst Menge und damit in V
als Element enthalten ist. Damit existiert aber oﬀensichtlich eine Surjektion
f von V auf P(V ), indem wir etwa f (a) = a für a ⊂ V und f (a) = ∅ ⊂ V
für a 6⊂ V setzen. Dies widerspricht Satz 3.1.5.
Es gibt weitere Argumente, die zeigen, dass es keine Menge V aller Mengen gibt. Ein solches ist etwa die “Russellsche Antinomie”. Nehmen wir
nochmals an, es gäbe eine Menge V , in der jede Menge als Element enthalten ist. Dann gäbe es auch die Menge
R = {a ∈ V : a ∈
/ a}
42
KAPITEL 3. MENGEN
aller Mengen, die sich nicht selbst als Element enthalten. Wir haben dann
aber R ∈ R gdw. R ∈
/ R. Widerspruch!
Die mengentheoretischen Argumente, die wir in diesem und den letzten
Abschnitten vollzogen haben, waren durchweg “naiv”, d.h. sie wurden nicht
auf der Basis eines Axiomensystems vorgenommen. Auch die Mengenlehre
hat eine Axiomatisierung erfahren, und all unsere Argumente könnten auf
der Basis dieser Axiomatisierung nachvollzogen werden. Wir wollen uns hier
darauf beschränken, die Standardaxiomatisierung der Mengenlehre mit einigen erläuternden Kommentaren anzugeben. Wir werden diese Axiomatisierung jedoch nicht benutzen, sondern auch in Zukunft weiter mengentheoretisch naiv argumentieren. Allerdings wollen wir zeigen, dass das angegebene
Axiomensystem ein Modell besitzt, wenn daraus das Unendlichkeitsaxiom
entfernt wird.
Das Standard–Axiomensystem der Mengenlehre ist das Zermelo–Fraenkelsche System, ZFC. Die Sprache L∈ der Mengenlehre besitzt weder Konstanten noch Funktionssymbole und als einiges Relationssymbol das zweistellige
∈ für “ist Element von”. ZFC besitzt die folgenden Axiome.
Das erste Axiom, das Extensionalitätsaxiom, besagt, dass zwei Mengen
gleich sind gdw. sie dieselben Elemente besitzen.
(Ext) ∀x∀y(x = y ↔ ∀z(z ∈ x ↔ z ∈ y)).
Das nächste Axiom, das Fundierungsaxiom, besagt, dass jede nichtleere Menge ein ∈–minimales Element besitzt.
(F und) ∀x(∃y y ∈ x → ∃y(y ∈ x ∧ ¬∃z(z ∈ y ∧ z ∈ x))).
Mit Hilfe von Abkürzungen schreibt sich dies besser. Wir schreiben x = ∅
für ¬∃y y ∈ x, x 6= ∅ für ¬x = ∅, x ∩ y = ∅ für ¬∃z(z ∈ x ∧ z ∈ y). Dann liest
sich (F und) wie folgt:
(F und) ∀x(x 6= ∅ → ∃y ∈ x y ∩ x = ∅).
Wir schreiben x = {y, z} für
y ∈ x ∧ z ∈ x ∧ ∀u ∈ x(u = y ∨ u = z).
Das Paarmengenaxiom lautet
(P aar) ∀x∀y∃z z = {x, y}.
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
Wir schreiben x =
S
43
y für
∀z(z ∈ x ↔ ∃u ∈ y z ∈ u).
Das Vereinigungsaxiom lautet
S
(V er) ∀x∃y y = x.
Wir schreiben x ⊂ y für ∀z ∈ x z ∈ y und x = P(y) für ∀z(z ∈ x ↔ z ⊂ y).
Das Potenzmengenaxiom besagt
(P ot) ∀x∃y y = P(x).
Die Aussonderungsaxiome werden benötigt, um die Existenz deﬁnierbarer
Teilmengen von einer gegebenen Menge zu zeigen.
Sei ϕ eine L∈ –Formel, in der (o.B.d.A.) die Variablen x, v1 , . . . , vp vorkommen. Das zu ϕ gehörige Aussonderungsaxiom lautet:
(Ausϕ ) ∀v1 . . . ∀vp ∀a∃b∀x(x ∈ b ↔ x ∈ a ∧ ϕ).
Die (unendliche!) Menge aller Aussonderungsaxiome wird auch als Aussonderungsschema bezeichnet. Sei ϕ eine L∈ –Formel, in der (o.B.d.A.) die Variablen x, y, v1 , . . . , vp vorkommen. Das zu ϕ gehörige Ersetzungsaxiom lautet1
(Ersϕ ) ∀v1 . . . ∀vp (∀x ∈ a∃y ′ ∀y(y = y ′ ↔ ϕ) → ∃b∀y(y ∈ b ↔ ∃x ∈ a ϕ)).
Die (wiederum unendliche!) Menge aller Ersetzungsaxiome wird auch als
Ersetzungsschema bezeichnet.
Aus dem Aussonderungsschema folgt die Existenz der leeren Menge, indem ϕ als x 6= x gewählt wird. Mit Hilfe des Paarmengen– und des Vereinigungsmengenaxioms zeigt sich dann leicht die Existenz der Mengen
∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}},
usw. Das Auswahlaxiom lautet
(AC) ∀x(x 6= ∅ ∧ ∀y ∈ x∀y ′ ∈ x(y ∩ y ′ 6= ∅ ↔ y = y ′ ) → (∃z∀y ∈ x∃uz ∩ y =
{u}).
AC besagt also, dass jede nichtleere Menge, die aus paarweise disjunkten
Mengen besteht, eine “Auswahlmenge” besitzt. Wir bezeichnen die Menge
der Aussagen Ext, F und, P aar, V er, P ot, Ausϕ , Ersϕ (für beliebige ϕ)
1
o.B.d.A. komme y ′ in ϕ gar nicht vor.
44
KAPITEL 3. MENGEN
und AC als ZFC−∞ . Hierbei steht ZF für “Zermelo-Fraenkel”, C für “choice”
(Auswahl) und “−∞” für die Abwesenheit des Unendlichkeitsaxioms. Letzterem wollen wir uns nun zuwenden. S
Wir schreiben x = y ∪ z für x = {y, z}. Wir schreiben y = x + 1 für
y = x ∪ {x}.
Deﬁnition 3.1.6 Eine Menge A heißt induktiv gdw. ∅ ∈ A und für jedes
x ∈ A auch x ∪ {x} ∈ A gilt.
Das Unendlichkeitsaxiom besagt:
(∞) ∃x (x ist induktiv).
Das System ZF C (Zermelo–Fraenkel, mit Auswahlaxiom) entsteht aus ZF C −∞
durch Hinzunahme des Unendlichkeitsaxioms.
Wir wollen nun die natürlichen Zahlen benutzen, um ein “Modell” der
Mengenlehre, genauer: von ZF C −∞ , zu konstruieren. Wir fassen natürliche
Zahlen wie folgt als “Mengen” auf. Sei n ∈ N. Schreibe n in Dualdarstellung,
d.h. n = Σmi ·2i , wobei mi ∈ {0, 1} für alle i. Wir fassen dann n als die Menge
aller i auf, so dass mi = 1. Anders gesagt: wir deﬁnieren eine zweistellige
Relation E ⊂ N × N auf N wie folgt. Seien k, n ∈ N. Dann gelte kEn gdw.
mk = 1, wobei n = Σmi · 2i die Dualdarstellung von n ist.
Wenn M 6= ∅ und R ⊂ M × M , so ist (M ; R) ein Modell von L∈ , indem
wir für x, y ∈ M die Aussage x ∈ y für wahr im Modell (M ; R) erklären
gdw. xRy. Ein derartiges Modell von L∈ kann natürlich ein “Nichtstandard”Modell sein insofern die Wahrheit von x ∈ y in dem Modell nichts mit der
Wahrheit, ob tatsächlich x ein Element von y ist, zu tun haben muss.
Insbesondere ist jedenfalls nun (N; E) Modell von L∈ . Der folgende Satz
besagt, dass jede Aussage von ZFC−∞ wahr im Modell (N; E) ist. Für “atomare” Aussagen der Gestalt x ∈ y haben wir bereits erklärt, was es bedeutet,
dass diese wahr in einem Modell (M ; R) ist. Für kompliziertere Aussagen erklären wir dies rekursiv:
¬ ϕ ist wahr in (M ; R) gdw. ϕ nicht wahr in (M ; R) ist.
ϕ ∧ ψ ist wahr in (M ; R) gdw. sowohl ϕ als auch ψ wahr in (M ; R)
sind.
ϕ ∨ ψ ist wahr in (M ; R) gdw. ϕ oder ψ wahr in (M ; R) ist.
ϕ → ψ ist wahr in (M ; R) gdw. ϕ nicht wahr in (M ; R) ist oder wenn
ψ wahr in (M ; R) ist.
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
45
ϕ ↔ ψ ist wahr in (M ; R) gdw. gilt: ϕ ist wahr in (M ; R) gdw. ψ wahr
in (M ; R) ist.
∃vϕ(v) ist wahr in (M ; R) gdw. es ein x ∈ M gibt, so dass ϕ(x) wahr
in (M ; R) ist.
∀vϕ(v) ist wahr in (M ; R) gdw. für alle x ∈ M gilt, dass ϕ(x) wahr in
(M ; R) ist.
Satz 3.1.7 (N; E) ist Modell von ZFC−∞ .
Beweis: Oﬀensichtlich gilt (N; E) |= (Ext).
Seien k, n ∈ N. Dann folgt aus (N; E) |= k ∈ n, dass k < n : dies
folgt einfach daraus, dass 2k > k für alle k ∈ N. Sei also n ∈ N so, dass
(N; E) |= n 6= ∅ (d.h. n 6= 0!). Sei k < n das kleinste k′ mit (N; E) |= k′ ∈ n.
Dann gilt (N; E) |= k ∩ n = ∅. Wir haben (N; E) |= (F und) gezeigt.
(N; E) |= (P aar) zeigt sich wie folgt. Seien n, m ∈ N. Sei
q=
2n + 2m , falls n 6= m
2n
, falls n = m.
Dann gilt oﬀensichtlich (N; E) |= q = {n, m}.
Wir zeigen (N; E) |= (V er) folgendermaßen. Sei n ∈ N. Sei n = Σmi · 2i
die Dualdarstellung von n, und sei, für mi = 1, i = Σmik · 2k die Dualdarstellung von i. Wir setzen dann
m=
X
2k .
mik = 1
für ein i
mit mi = 1
S
Oﬀensichtlich gilt (N; E) |= m = n.
(N; E) |= (P ot) zeigt man mit Hilfe derselben Methode, die auch (N; E) |=
V er zeigte. Sei n ∈ N. Sei n = Σmi · 2i die Dualdarstellung von n. Für ein
m ∈ N mit Dualdarstellung Σm′i · 2i gilt oﬀenbar (N; E) |= m ⊂ n gdw. für
alle i, m′i = 1 ⇒ mi = 1. Sei also I die (endliche!) Menge aller i mit mi = 1
und sei P die Menge aller Teilmengen von I. Für I ∗ ∈ P sei
nI ∗ = Σi∈I ∗ 2i .
46
KAPITEL 3. MENGEN
(Oﬀensichtlich ist I ∗ 7→ nI ∗ injektiv.) Schließlich sei
m=
X
2nI ∗ .
I ∗ ⊂I
Es ist leicht zu sehen, dass (N; E) |= m = P(n).
Wir zeigen (N; E) |= (Ausϕ ) für ein beliebiges ϕ wie folgt. Seien n1 , . . . ,
np , a ∈ N, wobei
X
a=
mi · 2i .
Setze dann
X
b=
2i .
mi = 1
ϕ(i, n1 , . . . , np )ist wahr in (N; E)
Wir zeigen (N; E) |= (Ersϕ ) für ein beliebiges ϕ wie folgt. Sei ϕ wie
im zu ϕ gehörigen Ersetzungsaxiom gegeben. Seien n1 , . . . , np ∈ N und sei
a ∈ N. Wir setzen voraus, dass
(N; E) |= ∀x ∈ a∀y∀y ′ (ϕ(x, y, n1 , . . . , np ) ∧ ϕ(x, y ′ , n1 , . . . , np ) → y = y ′ ).
Sei (N; E) |= k ∈ a, d.h. für die Dualdarstellung a = Σmi · 2i von a gilt
mk = 1. Sei l(k) das eindeutige derartige l mit
(N; E) |= ϕ(k, l, n1 , . . . , np ).
Setze dann
b=
X
2l(k) .
(N; E) |= k ∈ a
Es ist leicht zu sehen, dass
(N; E) |= ∀y(y ∈ b ↔ ∃x ∈ aϕ).
Wir zeigen (N; E) |= (AC) wie folgt.
Sei n ∈ N. Sei (N; E) |= n 6= ∅, d.h. für die Dualdarstellung n = Σmi · 2i
von n gilt, dass ein i mit mi = 1 existiert. Für jedes i mit mi = 1 sei
i = Σmik · 2k die Dualdarstellung von i. Unter der Voraussetzung
(N; E) |= ∀y ∈ n∀y ′ ∈ n(y ∩ y ′ 6= ∅ ↔ y = y ′ )
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
47
gilt dann, dass aus i 6= j mit mi = 1 = mj folgt: mik 6= mjk für alle k.
Außerdem ist für alle i mit mi = 1 eines der mik gleich 1. Sei für mi = 1 k(i)
das kleinste k mit mik = 1. Es ist dann leicht zu sehen, dass
X
2k(i)
mi =1
bezeugt, dass im Sinne von (N; E) n das Auswahlaxiom erfüllt.
Sei (N; E) |= m = n + 1, d.h. (N; E) |= m = n ∪ {n}. Dann gilt insbesondere (N; E) |= n ∈ m, also ist n < 2n ≤ m. Damit kann (N; E) nicht das
Unendlichkeitsaxiom erfüllen.
Wir wollen nun umgekehrt nachvollziehen, dass auf der Basis von ZFC
Objekte geformt werden können, deren Gesamtheit beweisbar (in ZFC) ein
Modell von PA ist. Mit anderen Worten: So wie sich mit Hilfe mengentheoretischer Methoden aus den natürlichen Zahlen die ganzen, rationalen und
reellen Zahlen produzieren ließen, so können mit denselben mengentheoretischen Methoden auch die natürlichen Zahlen selbst in einer Weise produziert
werden, dass die grundlegenden Aussagen über sie beweisbar werden.
Die heute übliche Art und Weise, natürliche Zahlen als Mengen darzustellen, geht auf von Neumann zurück. Die grundlegende Idee ist sehr einfach.
Für jedes n ∈ N gibt es genau n natürliche Zahlen, die kleiner als n sind,
nämlich 0, 1, . . . , n−1. Die Idee ist nun, die natürliche Zahl n mit der Menge
{0, 1, . . . , n − 1} zu identiﬁzieren. Damit erhält man

0 = ∅,



1 = {∅},
(∗)
2 = {∅, {∅}},



3 = {∅, {∅}, {∅, {∅}}}, usw.
Mit dieser Idee gilt oﬀenbar m < n gdw. m ∈ n für beliebige m, n ∈ N.
Allgemein ausgedrückt wollen wir 0 mit ∅ und n+1 mit n∪{n} identiﬁzieren.
(Diese Identiﬁkationsvorschrift ist rekursiv: wenn wir n kennen, dann kennen
wir auch n + 1 = n ∪ {n}.)
Wir wollen nun eine Menge und auf ihr eine Ordnungsrelation und Operationen präzise so deﬁnieren, dass wir für dieses “Modell” die Gültigkeit
von PA beweisen können. Die Menge sollte aus genau den Mengen der Gestalt (*) bestehen. Hierzu ist es nützlich, den Begriﬀ der “induktiven Menge”
von Deﬁnition 3.1.6 zur Verfügung zu haben. Das Unendlichkeitsaxiom von
ZFC besagt, dass es eine induktive Menge gibt. Wir schreiben im Folgenden
48
KAPITEL 3. MENGEN
wieder x + 1 für x ∪ {x}, für beliebige Mengen x, und nennen x + 1 den
Nachfolger von x. Eine Menge A ist dann induktiv gdw. ∅ ∈ A und A unter
der Nachfolgeroperation x 7→ x + 1 abgeschlossen ist.
Deﬁnition 3.1.8 Die Menge ω der von–Neumann–Zahlen ist definiert als
der Durchschnitt aller induktiven Mengen, d.h.
x ∈ ω ⇔ ∀A(A induktiv ⇒ x ∈ A).
Lemma 3.1.9 ω ist induktiv.
Beweis: Da ∅ in jeder induktiven Menge als Element enthalten ist, liegt ∅
auch in ω. Sei nun x ∈ ω. Sei A eine induktive Menge. Dann gilt also x ∈ A,
und damit auch x + 1 ∈ A. Also ist x + 1 in jeder induktiven Menge und es
gilt x + 1 ∈ ω. Wir haben gezeigt, dass ω induktiv ist.
Eine direkte Folge von Deﬁnition 3.1.8 ist:
Lemma 3.1.10 Sei A ⊂ ω induktiv. Dann gilt A = ω.
Dies hat zur Konsequenz, dass für ω das (zweitstuﬁge) Induktionsaxiom
(und damit auch das erststuﬁge Induktionsschema) gilt. Die Menge ω wurde
gerade so deﬁniert, dass für sie dieses Axiom zutriﬀt!
Es bleibt zu zeigen, dass auch die übrigen Aussagen von PA für ω gelten.
Hierzu müssen wir natürlich jeweils zuerst erklären, wie wir <, +, · und die
Exponentiation interpretieren wollen.
(Q1) ist oﬀensichtlich: Für jedes x ist x+ 1 = x∪ {x} =
6 ∅, da x ∈ x∪ {x}.
Wir zeigen nun (Q2). Hierzu ist zu zeigen, dass für von–Neumann–Zahlen x
und y aus x + 1 = x ∪ {x} = y ∪ {y} = y + 1 folgt, dass x = y. Angenommen,
es gilt x ∪ {x} = y ∪ {y}, aber x 6= y. Dann gilt zunächst x ∈ y ∪ {y},
also sogar x ∈ y (da x ∈
/ {y}), und ebenso gilt y ∈ x ∪ {x}, also sogar
y ∈ x (da y ∈
/ {x}). Dies widerspricht aber dem Fundierungsaxiom F und.
Betrachten wir nämlich die Menge {x, y}, so gilt sowohl y ∈ x ∩ {x, y} als
auch x ∈ y ∩ {x, y}, so dass {x, y} kein ∈–minimales Element besitzt. Dieser
Widerspruch zeigt, dass aus x + 1 = y + 1 bereits x = y folgen muss.
Die Aussagen (Q3) – (Q8) sind einfach zu zeigen, wenn wir die Interpretation von +, · und der Exponentiation für von–Neumman–Zahlen so festlegen,
wie dies durch (Q3) – (Q8) verlangt wird.
Für von–Neumann–Zahlen x und y wollen wir x < y durch x ∈ y interpretieren (siehe oben).
Wir zeigen jetzt (Q9). Sei zunächst x < y + 1, d.h. x ∈ y ∪ {y}. Dann
gilt oﬀenbar x ∈ y, d.h. x < y, oder x ∈ {y}, d.h. x = y. Umgekehrt folgt
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
49
aus x < y oder x = y ebenso leicht x < y + 1. Die Gültigkeit von (Q10) ist
klar, da x ∈
/ ∅ für alle x.
Um schließlich (Q11) zu beweisen, müssen wir das folgende Lemma zeigen.
Lemma 3.1.11 Seien x, y von–Neumann–Zahlen. Dann gilt x ∈ y oder x =
y oder y ∈ x.
Beweis: Der Beweis erfolgt durch doppelte Induktion. Wir zeigen, dass
A = {x ∈ ω : ∀y ∈ ω(x ∈ y ∨ x = y ∨ y ∈ x)}
induktiv ist.
Behauptung 1: ∅ ∈ A.
Hierzu ist zu zeigen, dass
B = {y ∈ ω : ∅ ∈ y ∨ ∅ = y ∨ y ∈ ∅}
induktiv ist. Dies lässt sich aber sehr leicht nachrechnen.
Behauptung 2: Aus x ∈ A folgt x + 1 ∈ A.
Sei x ∈ A. Wir zeigen dann, dass
C = {y ∈ ω : x + 1 ∈ y ∨ x + 1 = y ∨ y ∈ x + 1}
induktiv ist.
Da B aus Behauptung 1 induktiv ist, gilt zunächst ∅ ∈ z + 1 für alle
z ∈ ω. Damit haben wir zunächst ∅ ∈ C.
Sei nun y ∈ C. Dann gilt
(1) x + 1 ∈ y oder x + 1 = y oder y ∈ x + 1.
Wegen x ∈ A gilt außerdem
(2) x ∈ y + 1 oder x = y + 1 oder y + 1 ∈ x.
Aus x + 1 ∈ y oder x + 1 = y folgt x + 1 ∈ y + 1 = y ∪ {y}, und ebenso
folgt aus x = y + 1 oder y + 1 ∈ x, dass y + 1 ∈ x + 1 = x ∪ {x}. Wenn
also weder x + 1 ∈ y + 1 noch y + 1 ∈ x + 1 gilt, dann haben wir wegen (1)
y ∈ x + 1 = x ∪ {x} und wegen (2) x ∈ y + 1 = y ∪ {y}. Falls dann zusätzlich
x + 1 6= y + 1 (d.h. x 6= y!) gilt, dann haben wir sogar y ∈ x und x ∈ y. Dies
widerspricht wie oben dem Fundierungsaxiom F und.
50
KAPITEL 3. MENGEN
Wir haben gezeigt, dass y + 1 ∈ C. Dies beweist die Behauptung 2 und
damit das Lemma.
Wir bezeichneten das Axiomensystem, das durch die obigen Axiome gegeben
ist, mit ZFC. Die Sprache, in der ZFC formuliert ist, hat neben den allgemeinen logischen Symbolen (siehe Abschnitt 1.2) und Variablen x, y, z, . . . für
Mengen ein zweistelliges Prädikatssymbol ∈ für “ist Element von”. Ähnlich
wie im Falle von PA oder VGK hätten wir auch ZFC so formulieren können,
dass neben Variablen für Mengen auch Variablen für beliebige Kollektionen
von Mengen, die üblicherweise Klassen genannt werden, zugelassen werden.
Dies hätte zu vereinfachten Formulierungen des Aussonderungsschemas und
des Ersetzungsschemas geführt. Allerdings wären dann wie im Falle von PA
und VGK Klassenexistenzaxiome erforderlich, damit die neuen Formulierungen von Aussonderung und Ersetzung zur Wirkung kommen.
Wir reden hier mit Bedacht von “Klassen” und nicht von “Mengen”.
Beliebige Gesamtheiten natürlicher Zahlen sind Mengen (so hatten wir diese auch in Abschnitt 1.2 angesprochen) und beliebige Gesamtheiten reeller
Zahlen sind ebenfalls Mengen (und so hatten wir diese in Abschnitt 2.3 angesprochen). Wir haben aber oben gesehen, dass nicht jede Gesamtheit von
Mengen wieder eine Menge sein kann, da z.B. die Gesamtheit aller Mengen keine Menge ist. Beliebige derartige Gesamtheiten (oder Kollektionen)
werden oben als “Klassen” bezeichnet. Es gibt Klassen, wie etwa die Klasse
aller Mengen, die selbst keine Mengen sind; derartige Klassen heißen echte
Klassen.
Ein anderes Beispiel für eine echte Klasse ist die Klasse aller Gruppen.
Wäre die Klasse aller Gruppen eine Menge, so gäbe es auch die Menge aller
Gruppen mit einem Element, und daraus könnte man dann sehr leicht die
Menge aller Mengen formen. (Wir verwenden hier, dass wir für eine beliebige
Menge x trivial {x} als Gruppe G auﬀassen können, indem wir x als das
neutrale und einzige Element von G auﬀassen.)
In vielen Überlegungen hätte man aber gerne etwa die “Menge” aller
Gruppen (oder aller Körper, aller Vektorräume, aller topologischen Räume,
. . . ) zur Verfügung. Derartige Mengen, die tatsächlich Mengen sind und
gleichzeitig Substitute für die Klasse aller Mengen eines bestimmten Typs,
erhält man, indem man die Existenz von Grothendieck–Universen fordert.
Ein Grothendieck–Universum ist eine Menge U , die unter den Operationen von ZFC (also Paarmengen–, Vereinigungsmengen–, Potenzmengenbildung und Aussonderung und Ersetzung) abgeschlossen ist und gleichzeitig
die Menge N der natürlichen Zahlen als Element enthält.
3.2. DAS AUSWAHLAXIOM
51
Deﬁnition 3.1.12 Sei U eine nichtleere Menge. Dann heißt U ein Grothendieck–Universum gdw. folgende Aussagen gelten.
(1) Aus x ∈ U folgt x ⊂ U ,
(2) aus x ∈ U folgt P(x) ∈ U ,
(3) aus x, y ∈ U folgt {x, y} ∈ U ,
S
(4) aus x ∈ U folgt x ∈ U ,
(5) aus I ∈ U und {xi : i ∈ I} ⊂ U folgt {xi : i ∈ I} ∈ U , und
(6) ω ∈ U .
Man kann beweisen, dass die Existenz eines Grothendieck–Universums nicht
in ZFC gezeigt werden kann. Aus einem gegebenen Grothendieck–Universum
U lässt sich aber z.B. die Menge aller Gruppen aus U aussondern, die für viele
Zwecke ein hilfreicher Ersatz für die (nichtexistente) Menge aller Gruppen
ist.
3.2
Das Auswahlaxiom
Sei M eine beliebige Menge. Eine Auswahlfunktion für M ist eine Funktion
f mit Urbildbereich M , so dass für alle x ∈ M gilt f (x) ∈ x. Wenn ∅ ∈ M ,
dann kann es oﬀenbar keine Auswahlfunktion f für M geben, da f (∅) ∈ ∅
gelten müsste.
Deﬁnition 3.2.1 Das Auswahlaxiom besagt, dass es zu jedem M 6= ∅ mit
∅∈
/ M ein f gibt, so dass f Auswahlfunktion für M ist.
Diese Formulierung unterscheidet sich von der in Abschnitt 3.1 gegebenen
Formulierung von AC. Lemma 3.2.2 besagt jedoch, dass diese beiden Formulierungen äquivalent sind.
Wir betrachten in diesem Abschnitt (weitere) Äquivalenzen zum und
Folgerungen aus dem Auswahlaxiom.
Lemma 3.2.2 Das Auswahlaxiom ist äquivalent zur folgenden Aussage.
(*) Sei N eine beliebige Menge mit N 6= ∅ und ∅ 6∈ N , so dass x ∩ y = ∅
für x, y ∈ N, x 6= y gilt (d.h. je zwei verschiedene Elemente von N sind
disjunkt zueinander). Dann gibt es eine Menge A, die aus Elementen von
Elementen von N besteht, so dass für jedes x ∈ N genau ein y ∈ A mit
y ∈ x existiert.
52
KAPITEL 3. MENGEN
Beweis: Sei zunächst M 6= ∅ mit ∅ ∈
/ M gegeben. Mit Hilfe von (*) konstruieren wir eine Auswahlfunktion für M . Hierzu deﬁnieren wir eine Menge
N wie folgt: N besteht aus allen Mengen der Gestalt
{(x, z) : z ∈ x},
wobei x ∈ M . Sei dann A wie in (*). Dann gibt es für jedes x ∈ M genau
ein z, so dass (x, z) ∈ A (und damit auch z ∈ x) ist. Mit anderen Worten:
A ist eine Funktion mit Urbildbereich M und A(x) ∈ x für alle x ∈ M .
Sei nun das Auswahlaxiom als gültig vorausgesetzt, und sei N wie in (*)
gegeben. Sei f eine Auswahlfunktion für N . Dann erkennt man unschwer,
dass der Wertebereich von f die Gültigkeit von (*) für N bezeugt.
Wir wollen nun den Satz von Zermelo zeigen, wonach das Auswahlaxiom den
Wohlordnungssatz impliziert. Wohlordnungen sind Verallgemeinerungen der
natürlichen Ordnung auf N.
Deﬁnition 3.2.3 Sei M eine Menge. Eine Wohlordnung auf M ist eine
strikte Ordnung < auf M , so dass jedes nichtleere A ⊂ M ein <–kleinstes
Element besitzt, d.h. es gibt ein z ∈ A, so dass für alle y ∈ A: wenn y 6= x
dann x < y.
Deﬁnition 3.2.4 Sei M eine Menge und sei < eine Wohlordnung auf M .
Dann heißt A ein Anfangsstück von M bzgl. < gdw. für jedes x ∈ A und
jedes y < x auch y ∈ A ist.
Lemma 3.2.5 Sei < eine Wohlordnung auf M und sei A ein Anfangsstück
von M (bzgl. <). Dann gilt entweder A = M oder es gibt ein x ∈ M , so dass
A = {y ∈ M : y < x}.
Beweis: Wenn A 6= M , dann sei x das <–kleinste Element von M \ A. Man
sieht dann leicht, dass dann A = {y ∈ M : y < x}.
Lemma 3.2.6 Sei < eine Wohlordnung auf M . Es gibt dann keine Folge
(xn : n ∈ N) von Elementen xn von M , so dass xn+1 < xn für alle x ∈ N.
Beweis: Angenommen, es gibt eine Folge (xn : n ∈ N) mit xn+1 < xn für
alle n ∈ N. Betrachte A = {xn : n ∈ N} ⊂ M . Da < eine Wohlordnung ist,
gibt es ein x ∈ A, so dass x < y für alle y ∈ A mit y 6= x. Es ist aber x = xn
für ein n ∈ N und xn+1 < xn , wobei xn+1 ∈ A. Widerspruch!
3.2. DAS AUSWAHLAXIOM
53
Mit Hilfe des Auswahlaxioms lässt sich zeigen, dass eine strikte Ordnung <
auf einer Menge M genau dann eine Wohlordnung ist, wenn es keine Folge
(xn : n ∈ N) von Elementen von M mit xn+1 < xn für alle n ∈ N gibt.
Lemma 3.2.7 Sei < eine Wohlordnung auf einer Menge M . Dann gibt es
kein Anfangsstück A 6= M von M , so dass ein Ordnungsisomorphismus
ϕ : (M, <) ∼
= (A, <↾ A)
existiert.
Beweis: Andernfalls gibt es ein x ∈ M mit A = {y ∈ M : y < x}, so dass
für alle y ≥ x gilt: ϕ(y) < y. Sei y0 <–minimal in {y ∈ M : ϕ(y) < y}. Dann
gilt, da ϕ ordnungstreu ist, auch
ϕ(ϕ(y0 )) < ϕ(y0 ).
Aber ϕ(y0 ) < y0 , und wir haben einen Widerspruch zur Wahl von y0 .
Lemma 3.2.8 Sei < eine Wohlordnung auf M , und sei <∗ eine Wohlordnung auf N . Dann gilt genau eine der folgenden drei Aussagen:
(1) Es gibt einen Ordnungsisomorphismus ϕ : (M, <) ∼
= (N, <∗ ).
(2) Es gibt ein Anfangsstück A $ M von M und einen Ordnungsisomorphismus ϕ : (A, <↾ A) ∼
= (N, <∗ ).
(3) Es gibt ein Anfangsstück B $ N von N und einen Ordnungsisomorphismus ϕ : (M, <) ∼
= (B, <∗↾ B).
Beweis: Wir zeigen zunächst die folgende
Behauptung: Seien A, A′ Anfangsstücke von M , seien B, B ′ Anfangsstücke
von N , und seien ϕ : (A, <↾ A) ∼
= (B, <∗↾ B), ϕ′ : (A′ , <↾ A′ ) ∼
= (B ′ , <∗↾ B ′ )
′
Ordnungsisomorphismen. Dann sind ϕ und ϕ “verträglich”, d.h. für jedes
x ∈ A ∩ A′ gilt ϕ(x) = ϕ′ (x).
Beweis der Behauptung: Angenommen, es gibt ein x ∈ A∩A′ mit ϕ(x) 6=
ϕ′ (x). Sei x0 <–minimal in A ∩ A′ mit ϕ(x0 ) 6= ϕ′ (x0 ). Da sowohl ϕ als
auch ϕ′ Ordnungsisomorphismen sind, muss aber ϕ(x0 ) das <∗ –minimale
Element von N \ {ϕ(y) : y < x0 } sein, und ϕ′ (x0 ) muss das <∗ –minimale
Element von N \ {ϕ′ (y) : y < x0 } sein. Auf Grund der Wahl von x0 gilt
54
KAPITEL 3. MENGEN
aber {ϕ(y) : y < x0 } = {ϕ′ (y) : y < x0 }, und damit gilt ϕ(x0 ) = ϕ′ (x0 ).
Widerspruch!
Wir beweisen nun Lemma 3.2.8. Wir betrachten hierzu die Vereinigung
aller ϕ, für die es Anfangsstücke A von M und B von N gibt, so dass
ϕ : (A, <↾ A) ∼
= (B, <∗↾ B) ein Ordnungsisomorphismus ist. Wegen obiger
Behauptung sind je zwei derartige ϕ verträglich, und man erkennt unschwer,
dass diese Vereinigung selbst wiederum eine Abbildung ϕ̃ ist, für die es Anfangsstücke Ã von M und B̃ von N gibt, so dass ϕ̃ : (Ã, <↾ Ã) ∼
= (B̃, <↾ B̃)
ein Ordnungsisomorphismus ist.
Es muss aber Ã = M oder B̃ = N gelten. Andernfalls sei nämlich x0 <–
minimal in M \ Ã und y0 <∗ –minimal in N \ B̃. Dann ist auch ϕ̃ ∪ {(x0 , y0 )}
ein Ordnungsisomorphismus von Ã ∪ {x0 } auf B̃ ∪ {y0 }, wobei Ã ∪ {x0 }
Anfangsstück von M und B̃∪{y0 } Anfangsstück von N ist. Dies widerspräche
aber der Deﬁnition von ϕ̃.
Satz 3.2.9 (Zermelo) Unter Voraussetzung des Auswahlaxioms gibt es für
jede Menge M eine Wohlordnung < auf M .
Beweis: Wir betrachten zunächst die Menge P der nichtleeren Teilmengen
von M , d.h.
P = {A ⊂ M : A 6= ∅}.
Mit Hilfe des Auswahlaxioms ﬁnden wir eine Auswahlfunktion für P , d.h.
eine Funktion f : P → M , so dass f (A) ∈ A für alle A ∈ P .
Sei nun A ⊂ M und < eine Wohlordnung auf A. Dann heißt (A, <)
verträglich mit f gdw. für alle x ∈ A gilt:
x = f (M \ {y ∈ A : y < x}).
Seien A, B ∈ P und seien (A, <), (B, <∗ ) verträglich mit f . Dann gibt
es nach Lemma 3.2.8 zunächst einen Ordnungsisomorphismus ϕ : (A, <↾
A) ∼
= (B, <∗ ), wobei A Anfangsstück von A ist, oder einen Ordnungsisomorphismus ϕ : (A, <) ∼
= (B, <∗ ↾ B), wobei B Anfangsstück von B ist.
Angenommen, ersteres ist der Fall. Wäre ϕ nicht die Identität, dann gibt es
ein (<↾ A)–kleinstes Element x0 von A mit ϕ(x0 ) 6= x0 . Es gilt dann aber
x0 = f (M \ {y ∈ A : y < x0 })
= f (M \ {y ∈ B : y <∗ ϕ(x0 )}) = ϕ(x0 ).
Widerspruch! Also ist A = B und <↾ A =<∗ . Genauso argumentiert man im
zweiten Fall und bekommt B = A und <∗↾ B =<.
3.2. DAS AUSWAHLAXIOM
55
Wir erhalten damit, dass die Vereinigung aller <, wobei < Wohlordnung
auf einem A ⊂ M ist und (A, <) verträglich mit f ist, selbst eine Wohlordnung auf einem A0 ⊂ M ist. Es ist aber klar, dass nun A0 = M gelten muss.
Umgekehrt ist folgende Aussage sehr einfach zu zeigen:
Satz 3.2.10 Angenommen, zu jeder Menge A existiert eine Wohlordnung
auf A. Dann gilt das Auswahlaxiom.
Beweis: Sei M 6= ∅ mit ∅ ∈
/ M gegeben. Wir betrachten
A=
[
M = {x : ∃y(y ∈ M ∧ x ∈ y)}.
Sei < eine Wohlordnung auf A. Wir können dann sehr leicht eine Auswahlfunktion f für M wie folgt deﬁnieren: Für x ∈ M sei f (x) das <–minimale
Element von x ⊂ A.
Es gibt eine ganze Reihe weiterer und wichtiger Äquivalenzen zum Auswahlaxiom. (An dieser Stelle sollte betont werden, dass sich diese Äquivalenzen in
einer Theorie zeigen lassen, die keine der als äquivalent auszuweisenden Aussagen impliziert.) Prominent ist etwa das Zornsche Lemma, das allerdings oft
(meistens?) in der Form des “Hausdorﬀschen Maximalitätsprinzips” benutzt
wird.
Deﬁnition 3.2.11 Das Haussdorfsche Maximalitätsprinzip ist die folgende
Aussage. Sei F eine beliebige Menge, und sei F eine Menge von Teilmengen
von F . Angenommen, es gilt Folgendes: für S
alle F ⊂ F, so dass X ⊂ Y
oder Y ⊂ X für beliebige X, Y ∈ F, ist auch F = {a ∈ F : a ∈ X für ein
X ∈ F} Element von F. Dann existiert ein Xmax ∈ F, so dass keine echte
Obermenge von Xmax ebenfalls ein Element von F ist.
Satz 3.2.12 Das Hausdorffsche Maximalitätsprinzip ist äquivalent zum Auswahlaxiom.
Beweis: Zunächst ergibt sich aus dem Hausdorﬀschen Maximalitätsprinzip sehr leicht das Auswahlaxiom. Sei M 6= ∅ mit ∅ ∈
/ M gegeben. Sei F
die Menge aller Auswahlfunktionen für Teilmengen von M . Es ist unschwer
erkennbar, dass F dann die Voraussetzung des Hausdorﬀschen Maximalitätsprinzips erfüllt. Jedes Xmax ∈ F, für das keine echte Obermenge von Xmax ,
56
KAPITEL 3. MENGEN
die ebenfalls Element von F ist, existiert, ist dann eine Auswahlfunktion für
M selbst.
Umgekehrt folgt aber aus dem Auswahlaxiom das Hausdorﬀschen Maximalitätsprinzip. Seien hierzu F und F wie im Hausdorﬀschen Maximalitätsprinzip gegeben.
Ein F ⊂ F, so dass X ⊂ Y oder Y ⊂ X für alle X, Y ∈ F, heißt Kette in
F. Sei < eine Wohlordnung von F. Eine Kette F ⊂ F heißt dann verträglich
mit < gdw. für alle X ∈ F Folgendes gilt: X ist das <–minimale Y , so dass
Z < Y für alle Z $ Y mit Z ∈ F gilt.
Seien F 0 und F 1 zwei Ketten, die beide verträglich mit < sind. Angenommen, es gibt ein X ∈ F 0 , das nicht in F 1 liegt, oder es gibt ein X ∈ F 1
das nicht in F 0 liegt. Sei X <–minimal mit dieser Eigenschaft. Sei etwa
X ∈ F 0 \ F 1 . Dann ist X das <–minimale Y , so dass Z < Y für alle Z $ Y
mit Z ∈ F 0 gilt. Es gilt
{Z : Z $ X ∧ Z ∈ F 0 } = {Z : Z $ X ∧ Z ∈ F 1 }.
Wenn also F 1 \{Z : Z $ X ∧Z ∈ F 1 } =
6 ∅, dann gilt, da F 1 mit < verträglich
ist, dass X ∈ F 1 im Widerspruch zur Wahl von X.
Dies zeigt, dass die Vereinigung aller Ketten, die mit < verträglich sind,
selbst wiederum eine Kette ist (die mit < verträglich ist). Diese Kette, nennen wir sie F max , muss dann aber oﬀensichtlich ein Xmax enthalten, so dass
keine echte Obermenge von Xmax ebenfalls Element von F max (und damit
von F) ist.
Mit Hilfe des Hausdorﬀschen Maximalitätsprinzips lässt sich sehr einfach
z.B. zeigen:
Satz 3.2.13 Jeder Vektorraum besitzt eine Basis.
Beweis: Sei V ein beliebiger Vektorraum. Sei F die Menge aller linear unabhängigen Teilmengen von V . F erfüllt die Voraussetzung des Hausdorﬀschen Maximalitätsprinzips. Sei Xmax ∈ F “maximal”. Wäre dann Xmax
keine Basis von V , dann existiert ein v ∈ V , so dass Xmax ∪ {v} linear unabhängig ist im Widerspruch zur Maximalität von Xmax .
Eine weitere äußerst nützliche Aussage, zu deren Beweis das Auswahlaxiom
benötigt wird, lautet:
Lemma 3.2.14 Sei B eine abzählbare
Menge, so dass jedes a ∈ B ebenfalls
S
abzählbar ist. Dann ist auch B = {x : x ∈ a für ein a ∈ B} abzählbar.
3.3. DIE TOPOLOGIE VON R
57
Beweis: Sei f : N → B eine Bijektion, und sei N die Menge aller
{(n, g) : g : N → f (n) ist bijektiv},
wobei n ∈ N. Sei A wie in (∗) von Lemma 3.2.2. Dann ist A eine Funktion
mit Urbildbereich N, die jedem nS∈ N eine Bijektion von N auf f (n) zuordnet. Dann ist aber G : N × N → B surjektiv, wobei wir für n, m ∈ N den
Wert G(n, m) als A(n)(m)
dann γ : N → N × N bijektiv
S deﬁnieren. Wenn S
ist, dann ist G◦γ : N → B surjektiv, so dass B in der Tat abzählbar ist.
3.3
Die Topologie von R
In der Topologie werden topologische Räume betrachtet.
Deﬁnition 3.3.1 Ein Paar (X, O) (oder auch einfach die Menge X) heißt
ein topologischer Raum gdw. X 6= ∅, O eine Menge von Teilmengen von S,
den so genannten offenen Mengen, ist, und wenn gilt: (0) X ∈ O, (1) Beliebige Vereinigungen offener Mengen sind wieder offen, und (2) der Durchschnitt zweier offener Mengen ist wieder offen.
Die Standardtopologie von R ergibt sich wie folgt. Eine Menge A ⊂ R reeller
Zahlen wird als offen bezeichnet gdw. A als Vereinigung oﬀener Intervalle
(d.h. von Mengen der Form (x, y) mit x < y) geschrieben werden kann.
(Dabei ist die “leere” Vereinigung zugelassen, so dass auch ∅ eine oﬀene
Menge ist.)
Da der Durchschnitt zweier oﬀener Intervalle entweder leer oder wieder
ein oﬀenes Intervall ist, sieht man leicht, dass damit in der Tat R zu einem
topologischen Raum wird.
Wenn (X, O) ein topologischer Raum ist, dann heißt B ⊂ O Basis gdw.
jedes Element von O (d.h. jede oﬀene Menge) als Vereinigung von Elementen
von B geschrieben werden kann.
Oﬀensichtlich ist damit die Menge aller oﬀenen Intervalle Basis des topologischen Raums R. Allerdings ist eine nützliche Beobachtung, dass R in
der Tat eine abzählbare Basis besitzt.
Lemma 3.3.2 Die Menge aller offenen Intervalle (x, y) mit x < y und
x, y ∈ Q ist eine Basis des topologischen Raums R.
58
KAPITEL 3. MENGEN
Beweis: Sei A ⊂ R eine oﬀene Menge. Dann
gibt es eine Menge D, bestehend
S
aus oﬀenen Intervallen, so dass A = D. Sei D ′ die Menge aller oﬀenen
Intervalle (x′ , y ′ ) mit x′ < y ′ und x′ , y ′ ∈ Q, so dass ein Intervall (x, y) ∈ D
existiert mit x ≤ x′ < y ′ ≤ y. Da Q dicht in R ist, gibt es zu jedem (x, y) ∈ D
′
′
und zu jedem z ∈ (x, y) (d.h. x <Sz < y)Srationale Zahlen
S x′ und y mit
′
′
′
x < x < z < y < y. Daraus folgt D = D, also A = D . Die Menge
aller oﬀenen Intervalle mit rationalen Endpunkten ist also tatsächlich eine
Basis des topologischen Raums R.
Sei (x, y) ein oﬀenes Intervall, wobei x < y. Dann lässt sich sehr leicht eine
Bijektion ϕx,y : (−1, 1) → (x, y) angeben: es sei etwa ϕx,y (z) = x+ z+1
2 (y −x)
für z ∈ (−1, 1). Darüber hinaus existiert eine Bijektion f : R → (−1, 1), etwa
1
1
für x > 0, f (x) = x−1
für x < 0, und f (0) = 0.
die folgende: es sei f (x) = x+1
(Diese Abbildung ist nicht stetig; ähnlich einfach lässt sich auch eine stetige
derartige Bijektion deﬁnieren.) Die Komposition
ϕx,y ◦ f : R → (x, y)
ist dann ebenfalls eine Bijektion.
Diese Überlegung zeigt folgende. Wenn A ⊂ R oﬀen ist mit A 6= ∅, dann
existiert eine Injektion g : R → A: Sei etwa (x, y) ⊂ A, dann kann man
einfach g = ϕx,y ◦ f wählen. Andererseits gibt es trivialerweise eine Injektion
h : A → R, nämlich z.B. die Identität. Somit gibt es aufgrund des Satzes
1.1.4 von Schröder-Bernstein für jedes nichtleere oﬀene A ⊂ R eine Bijektion
j : R → A. Diese Aussage ist falsch für kompliziertere Mengen reeller Zahlen.
Komplemente oﬀene Mengen in topologischen Räumen heißen abgeschlossen.
Lemma 3.3.3 Sei A ⊂ R. Dann sind folgende Aussagen äquivalent.
(1) A ist abgeschlossen.
(2) Sei (xn : n ∈ N) eine Cauchy–Folge, wobei xn ∈ A für jedes n ∈ N.
Dann gilt limn→∞ xn ∈ A.
Beweis: (1) ⇒ (2). Sei A abgeschlossen und sei (xn : n ∈ N) eine Cauchy–
Folge, so dass xn ∈ A für jedes n ∈ N. Da A abgeschlossen ist, ist R \A oﬀen.
Angenommen, x = limn→∞ xn 6∈ A, d.h. x ∈ R \ A. Da R \ A Vereinigung
oﬀener Intervalle ist, gibt es dann ein oﬀenes Intervall (y, z) mit x ∈ (y, z) ⊂
R \ A. Sei ε das Minimum von |x − y| und |z − x|. Da limn→∞ xn = x,
3.3. DIE TOPOLOGIE VON R
59
existiert ein n ∈ N mit |x − xn | < ε, also xn ∈ (x − ε, x + ε) ⊂ (y, z) ⊂ R \ A.
Widerspruch!
(2) ⇒ (1): Sei (2) angenommen. Wir zeigen, dass R \ A oﬀen ist. Hierzu
genügt es zu zeigen, dass es zu jedem x ∈ R \ A ein oﬀenes Intervall (y, z)
mit x ∈ (y, z) ⊂ R \ A gibt. Sei also x ∈ R \ A. Wir betrachten die oﬀenen
1
1
, x + n+1
) für n ∈ N. Wenn es kein n ∈ N mit
Intervalle In = (x − n+1
In ⊂ R \ A gibt, dann enthält jedes In ein Element von A, etwa xn ∈ In ∩ A.
Man erkennt unschwer, dass (xn : n ∈ N) dann eine Cauchy–Folge ist mit
x = limn→∞ xn . Wegen (2) wäre dann aber x ∈ A. Widerspruch!
Beispielsweise sind also alle endlichen Mengen abgeschlossen. Für jedes A ⊂
R wird die Menge Ā ⊃ A aller x ∈ R, für die eine Cauchy–Folge (xn : n ∈ N)
mit xn ∈ A für alle n ∈ N und limn→∞ xn = x existiert, als der Abschluss
von A bezeichnet. Es ist nicht schwer zu sehen, dass Ā immer abgeschlossen
ist. Eine Menge A ⊂ R ist abgeschlossen gdw. Ā ⊂ A (gdw. Ā = A).
Da Q dicht in R ist, ist der Abschluss von Q gleich R. Es gibt allerdings
abzählbare Mengen, deren Abschluss wieder abzählbar ist, z.B. N = N′ oder
1
1
: n ∈ N} mit B ′ = {0} ∪ { n+1
: n ∈ N}.
B = { n+1
Sei A ⊂ R. Eine reelle Zahl x heißt Häufungspunkt von A gdw. für jedes
ε > 0 die Menge
A ∩ (x − ε, x + ε)
mindestens ein Element besitzt, welches verschieden von x ist.
Wenn x Häufungspunkt von A ist, dann besitzt für jedes ε > 0 die Menge
A ∩ (x − ε, x + ε) sogar unendlich viele Elemente. Darüber hinaus gibt es
in diesem Falle eine Cauchy–Folge (xn : n ∈ N) mit xn ∈ A \ {x} für alle
n ∈ N und x = limn→∞ xn . Damit liegt jeder Häufungspunkt von A im
Abschluss Ā von A. Umgekehrt ist nicht notwendigerweise jedes x ∈ Ā ein
Häufungspunkt von A. Beispielsweise gilt für jedes x ∈ R, dass {x} = {x},
aber {x} besitzt keinen Häufungspunkt.
Eine abgeschlosse nichtleere Menge A ⊂ R heißt perfekt gdw. jedes x ∈ A
auch Häufungspunkt von A ist.
Satz 3.3.4 Sei A ⊂ R perfekt. Dann gibt eine Bijektion f : R → A.
Beweis: Sei E die Menge aller endlichen 0-1-Folgen. Für s ∈ E und h ∈
{0, 1} schreiben wir s⌢ h für die Folge, die aus s entsteht, indem hinten h
angehängt wird.
Wir konstruieren zunächst eine Abbildung Φ wie folgt. Dabei wird E der
Urbildbereich von Φ sein, und für jedes s ∈ E wird Φ(s) ein abgeschlossenes
60
KAPITEL 3. MENGEN
Intervall [as , bs ] sein mit der Eigenschaft, dass as < bs und [as , bs ] ∩ A 6= ∅.
Die Konstruktion von Φ ist rekursiv nach der Länge von s.
Seien a, b reelle Zahlen mit a < b, so dass [a, b]∩A nichtleer ist. Bezeichne
hi die “leere Folge”. Wir deﬁnieren dann ϕ(hi) = [a, b].
Sei nun s ∈ E, und sei ϕ(s) bereits deﬁniert. Sei etwa Φ(s) = [as , bs ],
wobei as < bs . Wir nehmen an, dass [as , bs ] ∩ A nichtleer ist.
Da A perfekt ist, ist jeder Punkt von A auch Häufungspunkt von A und
wir können leicht
as < as⌢ 0 < bs⌢ 0 < as⌢ 1 < bs⌢ 1 < bs
ﬁnden, so dass gilt:
[as⌢ 0 , bs⌢ 0 ] ∩ A 6= ∅, [as⌢ 1 , bs⌢ 1 ] ∩ A 6= ∅,
1
1
, und bs⌢ 1 − as⌢ 1 ≤
.
n+1
n+1
Wir setzen dann Φ(s⌢ h) = [as⌢ h , bs⌢ h ] für h = 0, 1.
Bezeichne nun E ∗ die Menge aller unendlichen 0-1-Folgen. Wir können
jetzt eine Injektion F : E ∗ → A wie folgt deﬁnieren. Sei f ∈ E ∗ . Dann gilt
\
[af↾{0,... ,n} , bf↾{0,... ,n} ] = {x}
bs⌢ 0 − as⌢ 0 ≤
n∈N
für ein x ∈ R. Wir setzen F (f ) = x. Es gilt F (f ) ∈ A, da F (f ) oﬀensichtlich
Häufungspunkt von A ist und A abgeschlossen ist. Nach Konstruktion ist F
sicherlich injektiv.
Nach Übungsaufgabe ????? gibt es nun eine Bijektion g : R → E ∗ . Damit
ist
F ◦ g: R → A
injektiv. Da die Identität auf A eine injektive Abbildung von A nach R ⊃ A
ist, existiert damit aufgrund des Satzes 1.1.4 von Schröder-Bernstein eine
Bijektion von R auf A.
Satz 3.3.5 (Cantor–Bendixson) Sei A ⊂ R abgeschlossen. Dann ist entweder A endlich oder abzählbar oder es gibt eine Bijektion f : R → A.
Beweis: Sei A ⊂ R abgeschlossen. Ein x ∈ R heißt Kondensationspunkt von
A gdw. für jedes ε > 0 die Menge
A ∩ (x − ε, x + ε)
3.3. DIE TOPOLOGIE VON R
61
überabzählbar ist. Wir bezeichnen mit P die Menge aller Kondensationspunkte von A. Da oﬀensichtlich jeder Kondensationspunkt von A auch Häufungspunkt von A ist und da A abgeschlossen ist, gilt P ⊂ Ā = A.
Wir betrachten nun zwei Fälle.
1. Fall: P = ∅.
Dann gibt es zu jedem y ∈ A ein ε > 0, so dass die Menge A∩(x−ε, x+ε)
höchstens abzählbar ist; es gibt dann aber auch rationale Zahlen y, z mit
x − ε < y < x < z < x + ε, so dass auch A ∩ (y, z) höchstens abzählbar
ist. Es gibt nun abzählbar viele Intervalle (y, z) mit y, z ∈ Q, und für jedes
x ∈ A existiert ein Intervall (y, z) mit y, z ∈ Q und x ∈ A ∩ (y, z), so
dass A ∩ (y, z) höchstens abzählbar ist. Damit lässt sich A als höchstens
abzählbare Vereinigung höchstens abzählbarer Mengen darstellen und ist
selbst höchstens abzählbar.
2. Fall: P 6= ∅.
In diesem Falle zeigen wir, dass P perfekt ist. Dann existiert nach Satz
3.3.4 eine Bijektion f : R → P , also mit Hilfe von Satz 1.1.4 auch eine
Bijektion von R auf A ⊃ P .
Zuerst gilt P 6= ∅ nach Fallannahme.
Wir zeigen zunächst, dass P abgeschlossen ist. Sei (xn : n ∈ N) eine
Cauchy-Folge, wobei jedes xn ein Kondensationspunkt von A ist. Sei x =
limn→∞ xn . Wir müssen zeigen, dass x Kondensationspunkt von A ist. Sei
x ∈ [y, z] mit y < z. Dann existiert ein n ∈ N mit xn ∈ [y, z]. Sei ε > 0
so, dass [xn − ε, xn + ε] ⊂ [y, z]. Da xn Kondensationspunkt von A ist, ist
[xn − ε, xn + ε] ∩ A überabzählbar. Also ist auch [y, z] ∩ A überabzählbar.
Wir zeigen schließlich, dass jeder Punkt von P Häufungspunkt von P
ist. Sei also x ∈ P . Angenommen, x wäre nicht Häufungspunkt von P . Dann
existiert ein ε > 0, so dass [x − ε, x + ε] ∩ P kein Element besitzt, das verschieden von x ist. Zu jedem y ∈ ([x − ε, x + ε] ∩ A) \ {x} existieren dann
rationale ay und by mit ay < y < by , so dass [ay , by ] ∩ A höchstens abzählbar
ist. Damit lässt sich [x − ε, x + ε] ∩ A als höchstens abzählbare Vereinigung
höchstens abzählbarer Mengen darstellen und ist selbst höchstens abzählbar.
Dies ist ein Widerspruch, da x Kondensationspunkt von A ist.
62
KAPITEL 3. MENGEN
Kapitel 4
Modelle
Ziel dieses Kapitels ist es, eine Methode zur Konstruktion von Modellen von
Theorien wie PA, VGK oder ZFC zu entwickeln; sie wird uns vor allem erlauben, Nichtstandard-Modelle zu erzeugen. Diese Methode ist sehr allgemein
und hat nichts mit PA, VGK oder ZFC im besonderen zu tun. Wir beginnen
daher mit einer allgemeinen Einführung der abstrakten Logik erster Stufe,
für die die Sprachen von PA etc. Beispiele geliefert hatten.
4.1
Logik erster Stufe
Die Logik erster Stufe ist die Logik, die wir in der Mathematik benutzen.
Allerdings ist es nicht ganz richtig, von der Logik erster Stufe im Singular zu sprechen, da wir mit verschiedenen Mengen von Prädikatsymbolen,
Konstanten und Funktionssymbolen arbeiten können.
Seien I, K, J (womöglich leere, womöglich unendlich große) paarweise
disjunkte Indexmengen, und sei n : I ∪ J → N; wir schreiben ni für n(i),
wobei i ∈ I ∪ J. Die zu I, K, J, n gehörige Sprache der Logik erster Stufe
besitzt die folgenden Symbole:
Klammern: ( und )
Junktoren: ¬ und ∧
Allquantor: ∀
Variablen: v0 , v1 , v2 , . . .
Gleichheitszeichen: =
Prädikatsymbole: für jedes i ∈ I ein ni –stelliges Prädikatsymbol Pi
Konstanten: für jedes k ∈ K eine Konstante ck
Funktionssymbole: für jedes j ∈ J einen nj –stelligen Funktor fj .
63
64
KAPITEL 4. MODELLE
In dieser Liste könnte man die Junktoren ∨, → und ↔ sowie den Existenzquantor ∃ vermissen. Wir werden diese später durch Schreibkonventionen
einführen.
Ein Beispiel für eine solche Sprache ist die Sprache der Gruppentheorie:
diese enthält ein zweistelliges Funktionssymbol für die Addition (bzw. Multiplikation) und eine Konstante für das neutrale Element. Die Sprache der
Körpertheorie enthält zwei zweistellige Funktionssymbole für die Addition
und die Multiplikation und zwei Konstanten für die 0 und die 1. Die Sprache
von PA enthält ein zweistelliges Prädikatsymbol <, zwei Konstanten 0 und
1 für die Null und die Eins, zwei zweistellige Funktionssymbole +,· für die
Addition und die Multiplikation und ein weiteres unsichtbares zweistelliges
Funktionssymbol für die Exponentiation. Die Sprache von ZFC schließlich
hat lediglich das zweistellige Prädikatsymbol ∈.
Sei L eine Sprache der Logik erster Stufe. Ein L–Ausdruck ist eine endliche Folge von Symbolen von L. Wir wollen nun die Begriﬀe “L–Term”
und “L–Formel” deﬁnieren. Dies geschieht rekursiv. Sei L durch I, K, J, n
gegeben.
Ein L–Term ist ein L–Ausdruck, der in jeder Menge M von L–Ausdrücken
liegt mit:
(a) jede Konstante und jede Variable liegt in M , und
(b) für j ∈ J und τ0 , . . . τnj −1 ∈ M ist auch fj τ0 . . . τnj −1 ∈ M .
Beispielsweise sind die folgenden Ausdrücke Terme von PA:
· + 10v3 , + · 1v17 0.
Wir werden natürlich weiterhin im praktischen Leben (1 + 0) · v3 für · + 10v3
und (1 · v17 ) + 0 für + · 1v17 0 schreiben.
Eine atomare L–Formel ist jeder Ausdruck der Form P τ0 . . . τn−1 , wobei
P ein n–stelliges Prädikatsymbol ist und τ0 , . . . , τn−1 L–Terme sind, oder
ein Ausdruck der Form τ0 = τ1 , wobei τ0 , τ1 L–Terme sind.
Schließlich ist eine L–Formel ein Ausdruck, der in jeder Menge M von
Ausdrücken liegt mit:
(1) jede atomare L–Formel ist in M ,
(2) wenn ϕ und ψ in M sind, dann auch ¬ϕ und (ϕ ∧ ψ),
(3) wenn ϕ in M ist und n ∈ N, dann ist auch ∀vn ϕ in M .
65
4.1. LOGIK ERSTER STUFE
Beispiele für Formeln der Sprache der Mengenlehre sind etwa ∈ v3 v0 oder
∀v3 ∈ v3 v0 . Wir werden natürlich v3 ∈ v0 anstelle von ∈ v3 v0 und entsprechend ∀v3 v3 ∈ v0 anstelle von ∀v3 ∈ v3 v0 schreiben. v3 ∈ v0 ist eine atomare
Formel der Sprache der Mengenlehre.
Wir vereinbaren einige Schreibkonventionen, um Formeln besser lesen zu
können. So schreiben wir:
(ϕ ∨ ψ)
(ϕ → ψ)
(ϕ ↔ ψ)
∃vn ϕ
τ = τ′
τ 6= τ ′
für
für
für
für
für
für
¬(¬ϕ ∧ ¬ψ),
(¬ϕ ∨ ψ),
((ϕ → ψ) ∧ (ψ → ϕ)),
¬∀vn ¬ϕ,
= τ τ ′ , und
¬τ = τ ′ ,
wobei ϕ, ψ Formeln und τ, τ ′ Terme sind. Diese abkürzenden Schreibweisen
sind, wie man sich leicht überlegt, inhaltlich sinnvoll.
Mit diesen Konventionen ist nun also auch ∀v0 ∃v1 v0 ∈ v1 eine Formel der
Sprache der Mengenlehre, bei der es sich in nicht abgekürzter Schreibweise
um die Formel
∀v0 ¬∀v1 ¬ ∈ v0 v1
handelt. Als weitere Schreibkonvention lassen wir von nun an die äußeren
Klammern weg, schreiben also z.B. ϕ → ψ anstelle von (ϕ → ψ).
Wir wollen nun deﬁnieren, wann eine Formelmenge Σ eine Formel ϕ impliziert. Wieder arbeiten wir mit Belegungen, diesmal aber von Variablen mit
Elementen eines Modells; dies entspricht der Einsetzung solcher Elemente für
freie Variablen in Formeln.
Wir ﬁxieren nun I, K, J, n, wodurch eine Sprache L gegeben ist. Anstelle
von L–Termen und (atomaren) L–Formeln sprechen wir nun auch einfach
von Termen und Formeln.
Wir deﬁnieren zunächst den Begriﬀ der “freien Variablen”.
Sei n ∈ N. Wir deﬁnieren “vn kommt frei in der Formel ϕ vor”. Wenn ϕ
atomar ist, dann kommt vn frei in ϕ vor gdw. vn überhaupt in ϕ vorkommt.
vn kommt frei in ¬ϕ vor gdw. vn frei in ϕ vorkommt. vn kommt frei in ϕ ∧ ψ
vor gdw. vn frei in ϕ oder frei in ψ vorkommt. Schließlich kommt vn frei in
∀vm ϕ vor gdw. m 6= n und vn frei in ϕ vorkommt.
Ein L–Satz ist eine L–Formel, in der keine freien Variablen vorkommen.
Beispielsweise ist ∀v1 ¬v1 ∈ v0 eine Formel der Sprache der Mengenlehre
(aber kein Satz) und ∃v0 ∀v1 ¬v1 ∈ v0 ein Satz der Sprache der Mengenlehre.
66
KAPITEL 4. MODELLE
Wir wollen jetzt den Sätzen der Sprache L Bedeutung verleihen. Oft hat
eine Sprache einen “intendierten Objektbereich” im Auge. Mit der Sprache
der elementaren Zahlentheorie wollen wir über die Struktur der natürlichen
Zahlen sprechen, mit der Sprache der Mengenlehre über die Struktur des
Universums aller Mengen.
Ebenso oft gibt es aber auch keinen intendierten Objektbereich: die Sprache der Gruppentheorie hat nicht eine feste Gruppe im Auge, sondern “beliebige Gruppen”.
Allgemein bekommen Sätze Bedeutung, indem wir ein Modell von L
betrachten. Der Begriﬀ des “Modells” war naiv bereits in 3.1 benutzt worden.
Ein Modell von L ist eine Struktur der Form
M = (M ; (Ri : i ∈ I), (ak : k ∈ K), (Fj : j ∈ J)),
wobei M eine nichtleere Menge ist (das Universum, oder die Trägermenge
von M), jedes Ri eine ni –stellige Relation auf M ist (d.h. Ri ⊂ M ni ), jedes
ak ein Element von M ist und jedes Fj eine nj –stellige Funktion auf M ist
(d.h. Fj : M nj → M ).
Ein solches Modell interpretiert L in oﬀensichtlicher Weise: das Prädikatsymbol Pi wird durch die Relation Ri interpretiert (in Zeichen: PiM = Ri ),
die Konstante ck wird durch ak interpretiert (in Zeichen: cM
k = ak ), und das
Funktionssymbol fj wird durch die Funktion Fj interpretiert (in Zeichen:
fjM = Fj ).
Wir wollen nun sagen, was es heißt, dass ein gegebener Satz im Modell
M gilt. Hierzu gehen wir einen kleinen (aber sehr eﬀektiven) Umweg und
deﬁnieren allgemeiner, was es heißt, dass eine gegebene Formel unter einer
gegebenen Belegung in M gilt.
Eine M–Belegung ist eine Funktion β : {v0 , v1 , . . . } → M , die allen
Variablen Elemente der Trägermenge von M zuordnet. Durch eine M–
Belegung ist eine Interpretation beliebiger Terme gegeben. Eine solche durch
β induzierte Terminterpretation ist eine Funktion β : T → M (wobei T die
Menge aller Terme ist), für die gilt:
(1) β(vn ) = β(vn ) für n ∈ N,
(2) β(ck ) = ak für k ∈ K, und
(3) β(fj τ0 . . . τnj −1 ) = Fj (β(τ0 ), . . . , β(τnj −1 )) für j ∈ J und Terme τ0 , . . . , τnj −1 .
Wir deﬁnieren nun “ϕ gilt in M unter der Belegung β”. Hierzu ist die folgende Schreibweise hilfreich.
4.1. LOGIK ERSTER STUFE
67
Sei n ∈ N, und sei a ∈ M . Dann bezeichnet β(vn |a) diejenige Belegung,
die mit β überall übereinstimmt, außer an der Stelle vn , wo der Wert a
angenommen wird, d.h.
β(vm ), falls m 6= n
β(vn |a)(vm ) =
a
, falls m = n.
Wir schreiben “ϕ gilt in M unter der Belegung β” oder “M ist Modell von
ϕ unter β” als
M |= ϕ[β]
und deﬁnieren diese Relation wie folgt. Hierbei sei β die durch β induzierte
Terminterpretation. Die folgende Deﬁnition ist rekursiv “nach der Formelkomplexität” und simultan für alle Belegungen.
(1) M |= τ0 = τ1 [β] gdw. β(τ0 ) = β(τ1 ) für Terme τ0 , τ1
(2) M |= Pi τ0 . . . τnj −1 [β] gdw. (β(τ0 ), . . . , β(τnj −1 )) ∈ Ri
(3) M |= ¬ϕ[β] gdw. M |= ϕ[β] nicht gilt
(4) M |= ϕ ∧ ψ[β] gdw. M |= ϕ[β] und M |= ψ[β] beide gelten
(5) M |= ∀vn ϕ[β] gdw. für alle a ∈ M , M |= ϕ[β(vn |a)].
Betrachten wir den Satz ∀v0 v0 = v0 . Es gilt M |= ∀v0 v0 = v0 [β] gdw. für
alle a ∈ M , M |= v0 = v0 [β(v0 |a)] gdw. für alle a ∈ M , β(v0 ) = β(v0 ) (d.h.
β(v0 ) = β(v0 )). ∀v0 v0 = v0 gilt also in jedem Modell unter jeder Belegung.
Deﬁnition 4.1.1 Sei Σ ∪ {ϕ} eine Menge von Formeln. Wir sagen, dass Σ
(logisch) ϕ impliziert, in Zeichen: Σ |= ϕ gdw. für jedes Modell M und für
jede Belegung β gilt: wenn M |= ψ[β] für alle ψ ∈ Σ, dann auch M |= ϕ[β].
Anstelle von ∅ |= ϕ schreiben wir auch |= ϕ und sagen in diesem Falle, dass
ϕ (logisch) gültig ist.
Für jede Menge Σ von Formeln schreiben wir M |= Σ[β] anstelle von:
für alle ϕ ∈ Σ, M |= ϕ[β]. Es gilt also Σ |= ϕ gdw. für jedes Modell M und
für jede Belegung β gilt: wenn M |= Σ[β], dann M |= ϕ[β].
Der oben betrachtete Satz ∀v0 v0 = v0 ist also gültig. Dasselbe gilt
übrigens auch für ∃v0 v0 = v0 , das abkürzend die Formel ¬∀v0 ¬v0 = v0
darstellt. Dies ist leicht nachzurechnen. Hingegen ist ∃v0 ∃v1 v0 6= v1 nicht
gültig, aber es gilt z.B.
{∃v0 ∃v1 ∃v2 (v0 6= v1 ∧ v1 6= v2 ∧ v0 6= v2 )} |= ∃v0 ∃v1 v0 6= v1 .
68
KAPITEL 4. MODELLE
Wir schreiben ϕ |= ψ anstelle von {ϕ} |= ψ. ϕ und ψ heißen (logisch)
äquivalent gdw. ϕ |= ψ und ψ |= ϕ gelten.
Satz 4.1.2 Sei ϕ eine L–Formel, und sei M ein Modell von L. Seien β 0
und β 1 M–Belegungen, so dass β 0 (vn ) = β 1 (vn ) für alle vn , die frei in ϕ
vorkommen. Dann gilt
M |= ϕ[β 0 ] gdw. M |= ϕ[β 1 ].
Beweis: Wir zeigen diesen Satz durch Induktion “nach der Formelkomplexität”. Die Aussage gilt zunächst für atomares ϕ, da dann vn frei in ϕ
vorkommt gdw. vn überhaupt in ϕ vorkommt. Sodann ergibt sich aus der
Tatsache, dass die Aussage für ψ0 und ψ1 gilt, sofort, dass die Aussage auch
für ϕ gleich ¬ψ0 und für ϕ gleich ψ0 ∧ ψ1 gilt.
Sei nun ϕ gleich ∀vm ψ. vn kommt frei in ϕ vor gdw. n 6= m und vn frei
in ψ vorkommt. Für ein beliebiges a gilt also
β 0 (vm |a)(vn ) = β 1 (vm |a)(vn )
für alle vn , die frei in ψ vorkommen.
Damit gilt aber mit Hilfe der Induktionsvoraussetzung: M |= ϕ[β 0 ] gdw.
für alle a ∈ M, M |= ψ[β 0 (vm |a)] gdw. für alle a ∈ M, M |= ψ[β 1 (vm |a)]
gdw. M |= ϕ[β 1 ].
Korollar 4.1.3 Sei ϕ ein L–Satz, und sei M ein Modell von L. Seien β 0
und β 1 beliebige M-Belegungen. Dann gilt
M |= ϕ[β 0 ] gdw. M |= ϕ[β 1 ].
Für Sätze ϕ schreiben wir im Folgenden M |= ϕ anstelle von M |= ϕ[β] und
sagen, dass ϕ in M gilt (oder, dass M Modell von ϕ ist).
Eine L–Formel ϕ heißt erfüllbar gdw. ¬ϕ nicht logisch gültig ist, d.h.
wenn es ein Modell M und eine M–Belegung β gibt, so dass M |= ϕ[β].
Eine beliebige Menge Γ von L–Formeln heißt erfüllbar gdw. wenn es ein
Modell M und eine M–Belegung β gibt, so dass M |= ϕ[β] für alle ϕ ∈ Γ
gilt. (Wenn Γ erfüllbar ist, dann ist jedes ϕ ∈ Γ erfüllbar; die Umkehrung
hiervon gilt jedoch nicht.) Eine beliebige Menge Γ von L–Formeln heißt endlich erfüllbar gdw. jede endliche Menge Γ̄ ⊂ Γ erfüllbar ist. Oﬀensichtlich
ist jedes erfüllbare Γ auch endlich erfüllbar. Die überraschende Aussage,
dass hiervon auch die Umkehrung gilt, dass nämlich jedes endlich erfüllbare
69
4.1. LOGIK ERSTER STUFE
Γ auch erfüllbar ist, ist der Kompaktheitssatz 4.2.7, der im nächsten Abschnitt bewiesen wird und der im letzten Abschnitt für die Konstruktion
von Nichtstandardmodellen verwandt werden wird.
Sei M ein Modell von L. Sei ϕ eine Formel, in der genau die Variablen
vi0 , . . . , vin−1 frei vorkommen. Sei ai0 , . . . , ain−1 ∈ M , der Trägermenge von
M. Wir schreiben dann kurz
M |= ϕ(ai0 , . . . , ain−1 )
anstelle von: M |= ϕ[β], wobei β(vij ) = aij für alle j < n.
Eine n–stellige Relation R ⊂ M n heißt über M definierbar gdw. es eine
Formel ϕ gibt, in der genau die Variablen v0 , . . . , vn−1 frei vorkommen, so
dass für alle a0 , . . . , an−1 ∈ M :
(a0 , . . . , an−1 ) ∈ R gdw. M |= ϕ(a0 , . . . , an−1 ).
Für M = (M ; (Ri : i ∈ I), (ck : k ∈ K), (Fj : j ∈ J)) sind trivialerweise alle
Relationen Ri über M deﬁnierbar; es gibt aber im Allgemeinen noch weitere
deﬁnierbare Relationen.
Betrachten wir die Struktur
N = (N; <, 0, 1, +, ·, E),
wobei < die Kleiner–Relation, 0 die Null, 1 die Eins, + die Addition, · die
Multiplikation und E die Exponentiation ist. Oﬀenbar ist N ein Modell der
Sprache der elementaren Zahlentheorie1 (das “Standardmodell”; wir werden
sehen, dass es noch weitere Modelle gibt). Es ist nicht wirklich nötig, < zu
N hinzuzunehmen: die Relation < ist über dem Modell
(N; 0, +)
mit Hilfe der Formel ∃v2 (v2 6= 0 ∧ v0 + v2 = v1 ) deﬁnierbar:
n < m gdw. (N; 0, +) |= ∃v2 (v2 6= 0 ∧ n + v2 = m).
Man kann zeigen, dass die Exponentiation über
(N; <, 0, 1, +, ·)
1
Damit bezeichnet < sowohl das Symbol für die Kleiner–Relation als auch die Relation
selbst, usw.
70
KAPITEL 4. MODELLE
deﬁnierbar ist, d.h. dass es eine Formel ϕ gibt, so dass
nm = q gdw. (N; <, 0, 1, +, ·) |= ϕ(n, m, q).
Auf der anderen Seite ist z.B. die Addition nicht über
(N; ·)
und die Multiplikation nicht über
(N; <, 0, 1, +)
deﬁnierbar. Ersteres lässt sich folgendermaßen zeigen.
Seien M und P zwei Modelle von L mit Trägermenge M bzw. P . Eine
Abbildung π : M → P heißt ein Homomorphismus von M nach P gdw.
(1) (a0 , ..., an−1 ) ∈ P M gdw. (π(a0 ), ..., π(an−1 )) ∈ P P ,
(2) π(f M (a0 , ..., an−1 )) = f P (π(a0 ), ..., π(an−1 )), und
(3) π(cM ) = cP
für alle Prädikatsymbole P , alle Funktionssymbole f , alle a0 , ..., an−1 ∈
M und für alle Konstanten c ist (hierbei ist n, abhängig von P bzw. f ,
jeweils die Stelligkeit von P bzw. f ). Eine Abbildung π : M → P heißt ein
Isomorphismus von M nach P gdw. π ein bijektiver Homomorphismus von
M nach P ist. Die folgende Aussage ist leicht zu zeigen.
Satz 4.1.4 Sei π : M → P ein Homomorphismus von M nach P. Sei β̄
eine M -Belegung, und sei β die durch β̄ induzierte Terminterpretation. Sei
die P -Belegung β̄ ′ definiert durch β̄ ′ (vi ) = π(β̄(vi )) für i ∈ N, und sei β ′ die
durch β̄ ′ induzierte Terminterpretation. Dann haben wir:
(a) Für alle Terme τ ist π(β(τ )) = β ′ (τ ).
(b) Wenn π ein Isomorphismus von M nach P ist, dann gilt für alle Formeln ϕ, dass M |= φ[β̄] gdw. P |= φ[β̄ ′ ].
Die Äquivalenz in (b) bedeutet, dass
M |= φ(ai0 , ..., ain−1 ) gdw. P |= φ(π(ai0 ), ..., π(ain−1 )),
wenn in der Formel ϕ die Variablen vi0 , ..., vin−1 frei vorkommen und β̄(vi0 ) =
ai0 , ..., β̄(vin−1 ) = ain−1 .
4.2. ULTRAPRODUKTE UND KOMPAKTHEIT
71
Angenommen nun, die Addition wäre über der Struktur (N; ·) deﬁnierbar.
Dann hätten wir für jeden Isomorphismus2 π : N → N von (N; ·) nach (N; ·),
dass π(n + m) = π(n) + π(m) für alle n, m ∈ N. Ein Isomorphismus π ist
aber wie folgt gegeben. Sei p0 = 2, p1 = 3, ... die natürliche Aufzählung aller
Primzahlen. Setze π(0) = 0, π(1) = 1, π(2) = 3, π(3) = 2 und π(pi ) = pi für
alle i ≥ 2. Für natürliche Zahlen n ≥ 2 mit Primfaktorzerlegung
Y
km−1
n=
pki00 · · · · · pim−1
ist
π(n) =
Y
π(pi0 )k0 · · · · · π(pim−1 )km−1 .
Es gilt aber dann π(1 + 1) = π(2) = 3 6= 2 = 1 + 1 = π(1) + π(1).
4.2
Ultraprodukte und Kompaktheit
Wir wollen nun die Methode der Ultraproduktbildung von Modellen kennenlernen.
Deﬁnition 4.2.1 Sei I 6= ∅ eine beliebige Menge. Eine Menge F von Teilmengen von I heißt ein Filter auf I gdw.
(a) wenn X ∈ F und Y ∈ F , dann ist auch X ∩ Y ∈ F ,
(b) wenn X ∈ F und Y ⊃ X, wobei Y ⊂ I, dann ist auch Y ∈ F ,
(c) I ∈ F , und
(d) ∅ 6∈ F .
Sei etwa u eine nichtleere Teilmenge von I. Dann ist
{X ⊂ I : u ⊂ X}
ein Filter auf I. Dieser heißt der von u erzeugte prinzipale Filter. Sei I
unendlich. Dann ist
{X ⊂ I : I\X ist endlich}
ein Filter auf I, der aus allen koendlichen Teilmengen von I besteht. Dieser
heißt der Frechét–Filter auf I.
2
d.h. Automorphismus
72
KAPITEL 4. MODELLE
Deﬁnition 4.2.2 Sei I 6= ∅, und sei F ein Filter auf I. Dann heißt F
Ultraﬁlter auf I gdw für jedes X ⊂ I gilt: X ∈ F oder I\X ∈ F .
Wenn F Ultraﬁlter auf I ist, dann gilt für jedes X ⊂ I genau eine der beiden
Aussagen X ∈ F, I\X ∈ F . Mit Hilfe des Hausdorﬀschen Maximalitätsprinzips (siehe Deﬁnition 3.2.11) zeigt man den folgenden
Satz 4.2.3 (Tarski) Sei I 6= ∅, und sei F ein Filter auf I. Dann existiert
ein Ultrafilter U auf I, der F fortsetzt, d.h. so dass U ⊃ F .
Sei nun L eine Sprache der Logik erster Stufe. Sei I 6= ∅, und sei für jedes
σ ∈ I ein L–Modell Mσ gegeben. Sei weiterhin U ein Ultraﬁlter auf I. Wir
wollen dann das Ultraprodukt der Modelle Mσ mittels U , in Zeichen
Y
Mσ /U,
σ∈I
deﬁnieren. Wir deﬁnieren zunächst die Trägermenge des Ultraproduktes. Mit
|Mσ | bezeichnen wir die Trägermenge des Modells Mσ . Es sei F ∗ die Menge
aller Funktionen f mit Deﬁnitionsbereich I, so dass f (σ) ∈ |Mσ | für alle
σ ∈ I. Für f, g ∈ F ∗ schreiben wir f ∼g gdw. {σ ∈ I : f (σ) = g(σ)} ∈ U .
Lemma 4.2.4 ∼ ist eine Äquivalenzrelation.
Beweis: Lediglich die Transitivität von ∼ ist nicht trivial. Aus f ∼g und
g∼h, d.h. {σ ∈ I : f (σ) = g(σ)} ∈ U und {σ ∈ I : g(σ) = h(σ)} ∈ U folgt
aber wegen {σ ∈ I : f (σ) = h(σ)} ⊃ {σ ∈ I : f (σ) = g(σ)} ∩ {σ ∈ I : g(σ) =
h(σ)}, dass {σ ∈ I : f (σ) = h(σ)} ∈ U , also f ∼h.
Wir schreiben [f ] für die Äquivalenzklasse von f ∈ F ∗ , d.h. [f ] = {g ∈ F ∗ :
g∼f }. Wir schreiben auch F für die Menge aller [f ] mit f ∈ F ∗ . F wird die
Trägermenge des Ultraproduktes sein, welches wir mit M bezeichnen wollen.
Um M zu deﬁnieren, müssen wir neben der Trägermenge die Interpretationen von ck , fj und Pi angeben. Dies geschieht wie folgt. Wir setzen, für
k ∈ K,
Mσ
für alle σ ∈ I.
cM
k = [f ], wobei f (σ) = ck
Wir setzen weiter, für j ∈ J,
fjM([f0 ], . . . , [fnj −1 ]) = [f ], wobei
f (σ) = fjMσ (f0 (σ), . . . , fnj −1 (σ)) für alle σ ∈ I
4.2. ULTRAPRODUKTE UND KOMPAKTHEIT
73
und schließlich, für i ∈ I,
([f0 ], . . . , [fni −1 ]) ∈ PiM ⇔ {σ ∈ I : (f0 (σ), . . . , fni −1 (σ)) ∈ PiMσ } ∈ U.
Dieses so konstruierte Modell
M = (F; (PiM : i ∈ I), (fjM : j ∈ J), (ck : k ∈ K))
bezeichnen wir als das Ultraprodukt der Modelle Mi mittels U .
Q
Lemma 4.2.5 Sei, für σ ∈ I, βσ eine Mσ –Belegung, und sei die σ∈I Mσ /U –
Belegung β wie folgt definiert: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle
σ ∈ I. Sei β̄ die durch β induzierte Termbelegung, und sei, für σ ∈ I, β̄σ die
durch βσ induzierte Termbelegung. Sei schließlich für einen beliebigen Term
τ die Funktion hτ mit Definitionsbereich I definiert durch hτ (σ) = β̄σ (τ ).
Dann gilt für jeden Term τ , dass
β̄(τ ) = [hτ ].
Die folgende Aussage ist von zentraler Bedeutung.
Q
Satz 4.2.6 (Loś) Sei, für σ ∈ I, βσ eine Mσ –Belegung, und sei die σ∈I Mσ /U –
Belegung β wie folgt definiert: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle
σ ∈ I. Dann gilt für alle Formeln ϕ
Y
Mσ /U |= ϕ[β] gdw. {σ ∈ I : Mσ |= ϕ[βσ ]} ∈ U.
σ∈I
Beweis
durch Induktion nach der Komplexität von ϕ. Wir schreiben M̃ für
Q
M/U
.
σ∈I
Sei zunächst ϕ atomar. Sei etwa ϕ ≡ vk = vl . Dann gilt M̃ |= vk = vl [β]
gdw. β(vk ) = β(vl ) gdw. [f ] = [g], wobei f (σ) = βσ (vk ) und g(σ) = βσ (vl )
für alle σ ∈ I, gdw. {σ ∈ I : βσ (vk ) = βσ (vl )} ∈ U gdw. {σ ∈ I : Mσ |= vk =
vl [βσ ]} ∈ U . Für die übrigen atomaren Fälle ist das Argument völlig analog.
Sei nun ϕ ≡ ¬ψ. Hier benutzt der Induktionsschritt die Tatsache, dass U
ein Ultraﬁlter (und nicht etwa nur ein Filter) auf I ist. Es gilt M |= ¬ψ[β]
gdw. M 6|= ψ[β] gdw. {σ ∈ I : Mσ |= ψ[βσ ]} 6∈ U nach Induktionsvoraussetzung, gdw. {σ ∈ I : Mσ 6|= ψ[βσ ]} ∈ U , da U ein Ultraﬁlter ist, gdw.
{σ ∈ I : Mσ |= ¬ψ[βσ ]} ∈ U .
Der Induktionsschritt für ϕ ≡ ψ ∧ ψ ′ ist sehr einfach.
Wir betrachten schließlich den Fall, dass ϕ ≡ ∀vk ψ.
74
KAPITEL 4. MODELLE
Setzen wir zunächst voraus, dass {σ ∈ I : Mσ |= ∀vk ψ[βσ ]} ∈ U . Sei
[f ] ∈ |M̃| = F beliebig. Dann gilt {σ ∈ I : Mσ |= ψ[βσ (vk |f (σ))]} ⊃
{σ ∈ I : Mσ |= ∀vk ψ[βσ ]}, also {σ ∈ I : Mσ |= ψ[βσ (vk |f (σ))]} ∈ U . Die
Induktionsvoraussetzung liefert dann M̃ |= ψ[β(vk |[f ])]. Da [f ] beliebig war,
haben wir also M |= ∀vk ψ[β] gezeigt.
Setzen wir nun voraus, dass {σ ∈ I : Mσ |= ∀vk ψ[βσ ]} ∈
/ U , d.h. {σ ∈
I : Mσ |= ∃vk ¬ψ[βσ ]} ∈ U . Wir wollen zeigen, dass M̃ 6|= ∀vk ψ[β], d.h.
M̃ |= ∃vk ¬ψ[β]. Mit Hilfe des Auswahlaxioms ﬁnden wir ein f ∈ F ∗ , so
dass Mσ |= ¬ψ[βσ (vk |f (σ))] für alle σ ∈ I, für die ein a ∈ |Mσ | mit Mσ |=
¬ψ[βσ (vk |a)] existiert. Dann gilt oﬀensichtlich
{σ ∈ I : Mσ |= ¬ψ[βσ (vk |f (σ))]} = {σ ∈ I : Mσ |= ∃vk ¬ψ[βσ ]} ∈ U,
und damit mit Hilfe der Induktionsvoraussetzung M |= ¬ψ[β(vk |[f ])], wie
gewünscht.
Mit Hilfe dieser Methode zeigt sich nun sehr leicht der Kompaktheitssatz
der Logik erster Stufe.
Satz 4.2.7 (Kompaktheitssatz) Sei Σ eine endlich erfüllbare Menge von
L–Formeln, d.h. für jedes endliche σ ⊂ Σ existiert ein L–Modell Mσ und
eine Mσ –Belegung βσ mit
Mσ |= σ[βσ ].
Dann existiert ein L–Modell M̃ und eine M̃–Belegung β mit M̃ |= Σ[β].
Beweis: Sei I die Menge aller endlichen Teilmengen von Σ. Für σ ∈ I sei
Xσ = {τ ∈ I : τ ⊃ σ}.
Die Mengen Xσ genieren einen Filter F auf I wie folgt: Wir setzen
X ∈ F gdw. ∃σ ∈ IX ⊃ Xσ .
Behauptung: F ist ein Filter auf I.
Beweis: (a): Seien X, Y ∈ F . Seien σ, τ ∈ I so, dass X ⊃ Xσ und Y ⊃ Xτ .
Dann gilt X ∩ Y ⊃ Xσ ∩ Xτ = Xσ∪τ , also auch X ∩ Y ∈ F . (b) ist trivial.
(c): Da ∅ ∈ I, gilt I ∈ F . (d): Da σ ∈ Xσ für alle σ ∈ I, gilt ∅ ∈
/ F.
Sei nun (mit Hilfe des Satzes 4.2.3 von Tarski) U ein Ultraﬁlter auf I, der
4.3. NICHTSTANDARD-MODELLE
75
Q
F fortsetzt. Wir setzen dann M̃ = σ∈I Mσ /U . Wir deﬁnieren eine M̃–
Belegung β durch: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle σ ∈ I. Es
genügt nun zu zeigen, dass M |= Σ[β]. Sei also ϕ ∈ Σ. Dann folgt aus ϕ ∈ σ
(d.h. {ϕ} ⊂ σ}, dass Mσ |= ϕ[βσ ], also {σ ∈ I : Mσ |= ϕ[βσ ]} ⊃ X{ϕ} ∈ U ,
und damit auch {σ ∈ I : Mσ |= ϕ[βσ ]} ∈ U . Auf Grund des Satzes von Loś
gilt dann M̃ |= ϕ[β] wie gewünscht.
Ein Spezialfall von Ultraprodukten ist die Ultrapotenz. Sei I 6= ∅, und sei
U ein Ultraﬁlter auf I. Sei M ein L–Modell, und sei Mi = M für alle i ∈ I.
Dann schreiben wir:
U lt(M; U )
Q
für i∈I Mi /U und nennen dies die Ultrapotenz von M mittels U .
Der Satz von Loś ergibt sofort das folgende
Korollar 4.2.8 Sei β̄ eine M–Belegung, und sei die U lt(M; U )–Belegung
β definiert durch β(vk ) = [cβ̄(vk ) ], wobei cβ̄(vk ) die konstante Funktion mit
Wert β̄(vk ) (und Definitionsbereich I) ist. Dann gilt
U lt(M; U ) |= ϕ[β] gdw. M |= ϕ[β̄]
für alle Formeln ϕ.
Es existiert auch eine natürliche “Einbettung” e von M nach U lt(M; U ). Für
a ∈ |M| setzen wir e(a) = [ca ], wobei ca die konstante Funktion mit Wert a
(und Deﬁnitionsbereich I) ist. Es gilt dann:
Korollar 4.2.9 Es gilt
U lt(M; U ) |= ϕ(e(a0 ), . . . , e(aj−1 )) gdw. M |= ϕ(a0 , . . . , aj−1 )
für alle Formeln ϕ und a0 , . . . , aj−1 ∈ |M|.
4.3
Nichtstandard-Modelle
Auf diese Art und Weise lassen sich sehr leicht “Nichtstandardmodelle” konstruieren. Sei etwa
N = (N; 0, 1, <, +, ·, E),
und sei U ein Ultraﬁlter auf N, der den Frechét–Filter auf N fortsetzt. Dann
ist U lt(N; U ) nicht isomorph zu N (d.h. die Einbettung e ist nicht surjektiv).
Sei
R = (R; 0, 1, <, +, ·, E),
76
KAPITEL 4. MODELLE
und sei wieder U ein Ultraﬁlter auf N, der den Frechét–Filter auf N fortsetzt.
Dann enthält U lt(R; U ) sowohl “inﬁnitesimale” Zahlen als auch “unendlich
große” Zahlen.