Logische Grundlagen der Mathematik

Werbung
Logische Grundlagen der Mathematik
Ralf Schindler
3. Dezember 2008
Inhaltsverzeichnis
1 Natürliche Zahlen
1.1 Endliche und unendliche Mengen . . . . . . . . . . . . . . . .
1.2 Die Theorie der natürlichen Zahlen . . . . . . . . . . . . . . .
3
3
11
2 Reelle Zahlen
19
2.1 Die Konstruktion der ganzen und rationalen Zahlen . . . . . 19
2.2 Die Konstruktion der reellen Zahlen . . . . . . . . . . . . . . 23
2.3 Die Theorie der reellen Zahlen . . . . . . . . . . . . . . . . . 34
3 Mengen
39
3.1 Mengen, Klassen und Grothendieck–Universen . . . . . . . . 39
3.2 Das Auswahlaxiom . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3 Die Topologie von R . . . . . . . . . . . . . . . . . . . . . . . 57
4 Modelle
63
4.1 Logik erster Stufe . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.2 Ultraprodukte und Kompaktheit . . . . . . . . . . . . . . . . 71
4.3 Nichtstandard-Modelle . . . . . . . . . . . . . . . . . . . . . . 75
1
2
INHALTSVERZEICHNIS
Kapitel 1
Natürliche Zahlen
Eines der Grundgerüste der Mathematik ist die Menge der natürlichen Zahlen 0, 1, 2, . . . sowohl als Untersuchungsobjekt (in der Zahlentheorie) als auch
als Hilfsmittel (in allen Bereichen der Mathematik). Dabei interessieren uns
die natürlichen Zahlen nicht so sehr als Menge einzelner Elemente ohne Beziehung untereinander, sondern viel mehr als Struktur, d.h. als Menge mit auf
ihr definierten Relationen (z.B. der Ordnungsrelation <) und Verknüpfungen
(z.B. + und ·). Wir wollen dennoch zunächst in Abschnitt 1.1 die natürlichen
Zahlen als Menge betrachten, um sie danach in Abschnitt 1.2 als Struktur
zu studieren.
Allerdings benötigen wir selbst zum Studium der bloßen Menge der
natürlichen Zahlen eine grundlegende strukturelle Einsicht, nämlich das Induktionsaxiom. Dieses werden wir im Abschnitt 1.2 genauer untersuchen; wir
benötigen es als Beweisprinzip aber bereits in Abschnitt 1.1. Die natürlichen
Zahlen sind durch < in natürlicher Weise geordnet. Das Induktionsaxiom
besagt, dass jede nichtleere Menge natürlicher Zahlen ein (im Sinne von <)
kleinstes Element besitzt.
1.1
Endliche und unendliche Mengen
Die Menge
N = {0, 1, 2, . . . }
der natürlichen Zahlen ist unendlich im Gegensatz etwa zur endlichen Menge
{0, 1, 2} der natürlichen Zahlen, die kleiner als 3 sind. Wie lassen sich unendliche Mengen charakterisieren? Zur Beantwortung dieser Frage benötigen
wir einige einfache mengentheoretische Begriffe und Tatsachen.
3
4
KAPITEL 1. NATÜRLICHE ZAHLEN
Definition 1.1.1 Seien A und B Mengen, und sei f : A → B eine Abbildung von A nach B. Dann heißt f injektiv gdw. für alle x, y ∈ A aus
f (x) = f (y) bereits x = y folgt. Die Abbildung f heißt surjektiv gdw. für
alle z ∈ B ein x ∈ A existiert, so dass f (x) = z. Schließlich heißt f bijektiv
gdw. f injektiv und surjektiv ist.
Lemma 1.1.2 Seien A und B Mengen. Wenn es eine Injektion f : A → B
gibt, dann existiert auch eine Surjektion f : B → A.
Beweis: Die Aussage ist trivial für A = ∅. Sei also A 6= ∅ und sei x0 ∈ A.
Wir definieren eine Abbildung g : B → A wie folgt. Sei z ∈ B. Wenn es
ein x ∈ A mit f (x) = z gibt, dann gibt es wegen der Injektivität von f
genau ein solches x, und wir definieren g(z) = x für das eindeutige x ∈ A
mit f (x) = z. Wenn es kein x ∈ A mit f (x) = z gibt, dann definieren
wir g(z) = x0 . Offensichtlich ist g damit wohldefiniert. Die Abbildung g ist
surjektiv, da für jedes x ∈ A gilt, dass g(f (x)) = x.
Das folgende hierzu “duale” Lemma ist weniger trivial, da sein Beweis das
Auswahlaxiom benötigt.
Lemma 1.1.3 Seien A und B Mengen. Wenn es eine Surjektion f : A → B
gibt, dann existiert auch eine Injektion f : B → A.
Der Beweis dieses Lemmas wird im 3. Kapitel geliefert.
Wir zeigen hier Lemma 1.1.3 für den Fall, dass A eine Menge natürlicher
Zahlen ist.
Sei f : A → B surjektiv. Wir definieren dann eine Injektion g : B → A
wie folgt. Für x ∈ B sei g(x) das kleinste m ∈ A, so dass f (m) = x.
Da f surjektiv ist, ist g wohldefiniert. Offensichtlich ist g injektiv, da für
g(x) = g(y) gilt, dass x = f (g(x)) = f (g(y)) = y.
Eine Menge A heißt Teilmenge der Menge B, A ⊂ B, gdw. jedes Element
von A auch Element von B ist. Insbesondere folgt A ⊂ B aus A = B, und
es gilt A = B gdw. A ⊂ B und B ⊂ A. Wir schreiben A $ B, falls A echte
Teilmenge von B ist, d.h. wenn A ⊂ B und A 6= B.
Sei f : A → B eine Abbildung. Wir schreiben dann f [A] für das Bild von
A unter f , d.h. f [A] = {f (x) : x ∈ A}. Dann ist f surjektiv gdw. B = f [A].
Wenn f : A → B injektiv ist, dann schreiben wir f −1 : f [A] → A für die
Umkehrabbildung von f , d.h. für dasjenige g : f [A] → A mit g(f (x)) = x.
Wenn A ⊂ B, dann gibt es offensichtlich eine Injektion von A nach B,
nämlich die Identität auf A, die jedes x ∈ A auf sich selbst abbildet.
1.1. ENDLICHE UND UNENDLICHE MENGEN
5
Für f : A → B und D ⊂ A schreiben wir f ↾ D für die Einschränkung
von f auf D, d.h. für die Funktion g : D → B mit g(x) = f (x) für alle
x ∈ D.
Für beliebige Mengen A und B schreiben wir A \ B für die Menge aller
x, die zwar in A, jedoch nicht in B liegen. Es gilt A ⊂ B gdw. A \ B = ∅.
Der Beweis des nachfolgenden Satzes lässt sich wiederum ohne Auswahlaxiom vollziehen.
Satz 1.1.4 (Schröder–Bernstein) Seien A und B Mengen. Wenn es Injektionen f : A → B und g : B → A gibt, dann gibt es eine Bijektion
h : A → B.
Beweis: Wir definieren zunächst Teilmengen Xn von A und Yn von B wie
folgt. Sei Y0 = B \ f [A]. WennSYn definiert ist, dann
S sei Xn = g[Yn ] und
Yn+1 = f [Xn ]. Wir setzen X = n∈N Xn und Y = n∈N Yn .
Da g[Yn ] = Xn für jedes n ∈ N, gilt g[Y ] = X. Da g injektiv ist, ist also
g−1 ↾ X eine Bijektion von X auf Y .
Es gilt aber auch f [A\X] = B \Y . Sei nämlich zunächst x ∈ A\X. Wäre
dann f (x) ∈ Y , etwa f (x) ∈ Yn , dann wäre n > 0 und somit x ∈ Xn−1 ⊂ X.
Widerspruch! Also gilt f [A \ X] ⊂ B \ Y . Sei nun y ∈ B \ Y ⊂ B \ Y0 . Dann
ist y ∈ f [A], etwa y = f (x). Wäre x ∈ X, etwa x ∈ Xn , dann hätten wir
y = f (x) ∈ f [Xn ] = Yn+1 ⊂ Y . Widerspruch! Damit ist also f ↾ (A \ X) eine
Bijektion von A \ X auf B \ Y .
Wir können nun sehr einfach eine Bijektion h : A → B wie folgt definieren. Sei h(x) = g−1 (x), falls x ∈ X, und sei h(x) = f (x), falls x ∈ A \ X. Betrachten wir nun Teilmengen A und B von N.
Definition 1.1.5 Eine Menge B ⊂ N heißt Anfangsstück von N gdw. es
entweder ein n ∈ N gibt mit B = {m ∈ N : m < n} oder wenn B = N.
Sei nun A ⊂ N. Wir wollen ein Anfangsstück BA von N und eine Bijektion fA : BA → A konstruieren. Hierbei soll fA einfach die “natürliche
Aufzählung” von A sein.
Betrachten wir zunächst einige einfache Beispiele. Für A = {2n : n ∈ N},
die Menge der geraden natürlichen Zahlen, ist BA = N und fA (n) = 2n.
Wenn A die Menge der Primzahlen ist, dann ist ebenfalls BA = N und
fA (n) ist die nte Primzahl in der natürlichen Aufzählung der Primzahlen.
Wenn A = {2n + 1 : n ∈ N, 2n + 1 < 1037 }, dann ist BA = 5 · 1036 und
fA (n) = 2n + 1.
6
KAPITEL 1. NATÜRLICHE ZAHLEN
Betrachten wir nun eine beliebige Teilmenge A von N.
Wenn A = ∅, dann sei BA = ∅ und fA die “leere Funktion”. Sei nun
A 6= ∅. Wir definieren dann fA (0) als das kleinste Element von A. Falls
A = {fA (0)} dann setzen wir BA = {0} und brechen unsere Konstruktion ab. Andernfalls definieren wir fA (1) als das kleinste Element von A,
das verschieden von fA (0) (und damit größer als fA (0)) ist. Falls A =
{fA (0), fA (1)}, dann setzen wir BA = {0, 1} und brechen unsere Konstruktion ab. Andernfalls fahren wir in gleicher Weise fort. Nehmen wir an, wir
haben fA (0), fA (1), . . . , fA (n) bereits definiert. Falls
A = {fA (0), fA (1), . . . , fA (n)},
dann setzen wir BA = {0, 1, . . . , n} und brechen unsere Konstruktion ab.
Andernfalls definieren wir fA (n + 1) als das kleinste Element von A, das
verschieden von fA (0), fA (1), . . . , fA (n) (und damit größer als alle diese)
ist.
Wir bemerken, dass fA streng monoton wächst, d.h. fA (m) > fA (n) für
alle m und n mit m > n, für die sowohl fA (m) als auch fA (n) definiert sind.
Daraus ergibt sich übrigens, dass fA (n) ≥ n für alle n, für die fA (n) definiert
ist. Außerdem gilt nach Konstruktion offensichtlich, dass für alle n, für die
fA (n) definiert ist,
(*) {k ∈ A : k ≤ fA (n)} = {fA (0), fA (1), . . . , fA (n)}.
Es gibt nun die folgenden beiden Fälle.
Entweder es gibt ein n, so dass die Konstruktion nach n + 1 Schritten abbricht, d.h. A = {fA (0), fA (1), . . . , fA (n)} und BA = {0, 1, . . . , n}. Oder die
Konstruktion bricht nicht ab; in diesem Falle setzen wir BA = {0, 1, 2, . . . } =
N.
Es ist nun unschwer erkennbar, dass wir in beiden Fällen ein Anfangsstück
BA von N und eine Bijektion fA : BA → A definiert haben: fA ist injektiv,
da fA streng monoton wächst, und fA ist surjektiv wegen (*).
Konstruktionen wie die Obige werden als “rekursiv” bezeichnet, da der
Funktionswert an der Stelle n in Abhängigkeit von den Funktionswerten an
den Stellen 0, 1, . . . , n − 1 definiert wird. Im Beweis des Satzes 1.1.4 von
Schröder-Bernstein wurde ebenfalls eine Rekursion verwendet: die Mengen
Xn und Yn+1 wurden dort mit Hilfe der Menge Yn konstruiert.
Definition 1.1.6 Sei A ⊂ N, und seien BA und fA wie oben definiert.
Dann heißt A endlich gdw. es ein n ∈ N gibt mit BA = {m ∈ N : m < n},
andernfalls heißt A unendlich.
1.1. ENDLICHE UND UNENDLICHE MENGEN
7
So ist beispielsweise N selbst oder die Menge der geraden Zahlen oder die
Menge der Primzahlen unendlich, während die Menge der ungeraden Zahlen,
die kleiner als 1037 sind, endlich ist. Dahingegen weiß man im Moment nicht,
ob die Menge der Primzahlen p, für die auch p + 2 Primzahl ist, endlich oder
unendlich ist.
Offensichtlich gilt:
Lemma 1.1.7 Sei A ⊂ N. Dann ist entweder A endlich oder es gibt eine
Bijektion f : N → A.
Lemma 1.1.8 Seien B, D ⊂ N Anfangsstücke von N, so dass eine Bijektion
f : B → D existiert. Dann gilt B = D.
Beweis: Wir zeigen diese Aussage durch Induktion. Angenommen, es gibt
Anfangsstücke B, D von N mit B $ D, so dass eine Bijektion f : B → D
existiert. Für derartige Anfangsstücke B, D existiert ein n ∈ N mit
B = {m ∈ N : m < n}.
Sei nun n0 die kleinste natürliche Zahl n, so dass Anfangsstücke B, D von
N existieren mit B $ D, B = {m ∈ N : m < n}, und es gibt eine Bijektion
f : B → D. Offensichtlich gilt n0 > 0. Seien B, D Anfangsstücke von N,
B $ D, B = {m ∈ N : m < n0 }, und sei f : B → D bijektiv.
Sei zunächst angenommen, dass
D = {m ∈ N : m < k}
für ein k ∈ N, k > 1. Wir definieren dann B = {m ∈ N : m < n0 − 1}, D =
{m ∈ N : m < k − 1} und eine Bijektion h : B → D wie folgt. Sei s < n0
so, dass f (s) = k − 1. Dann sei für m < n0 − 1 der Wert h(m) definiert als
f (m), falls m 6= s, und h(s) = f (n0 − 1), falls s < n0 − 1.
Die Existenz von B, D, h widerspricht aber dann der Wahl von n0 .
Sei nun angenommen, dass D = N. Wir definieren dann B = {m ∈ N :
m < n0 − 1} und eine Bijektion h : B → D wie folgt. Es sei h(m) = f (m),
falls f (m) < f (n0 − 1), und es sei h(m) = f (m) − 1, falls f (m) ≥ f (n0 − 1).
Abermals widerspricht die Existenz von B, D, h der Wahl von n0 .
Korollar 1.1.9 Sei A ⊂ N, und sei B Anfangsstück von N, so dass eine
Bijektion f : B → A existiert. Dann gilt B = BA .
8
KAPITEL 1. NATÜRLICHE ZAHLEN
Beweis: Die Abbildung g = fA−1 ◦ f : B → BA ist bijektiv.
Für jedes endliche A ⊂ N gibt es also genau ein n ∈ N, so dass eine Bijektion
f : {0, 1, . . . , n−1} → A existiert. (Im Falle n = 0 ist f die “leere Funktion”.)
Definition 1.1.10 Sei A ⊂ N. Wenn A endlich ist, dann heißt dasjenige
n ∈ N, so dass eine Bijektion f : {m ∈ N : m < n} → A existiert, die Größe
von A.
Für endliches A ist die Größe von A gleich n, wobei BA = {m ∈ N : m < n}.
Lemma 1.1.11 Seien D und A endliche Mengen, wobei D ⊂ A ⊂ N. Sei
die Größe von D dieselbe wie die Größe von A. Dann gilt D = A.
Beweis: Angenommen, D $ A. Sei n die gemeinsame Größe von D und
A und seien fD : BD = {m ∈ N : m < n} → D und fA : BA → A die
natürlichen Aufzählungen. Sei E = A \ D. Da D $ A gilt E 6= ∅. Sei
fE : BE → E die natürliche Aufzählung.
Sei zunächst E als endlich angenommen, und sei k > 0 die Größe von E.
Wir definieren dann
h : {m ∈ N : m < n + k} → A
durch h(m) = fD (m), falls m < n und h(n + m) = fE (m), falls m < k. Dann
ist h offensichtlich bijektiv.
Damit gilt, dass
fA−1 ◦ h : {m ∈ N : m < n + k} → {m ∈ N : m < n}
bijektiv ist, wonach nach Lemma 1.1.8 gilt, dass n + k = n. Aber k > 0.
Widerspruch!
Sei nun E als unendlich angenommen. Wir definieren dann
h:N→A
durch h(m) = fD (m), falls m < n und h(n + m) = fE (m), falls m ∈ N.
Dann ist h offensichtlich bijektiv.
Damit gilt, dass
fA−1 ◦ h : N → {m ∈ N : m < n}
bijektiv ist. Die Existenz einer solchen Bijektion wiederspricht aber Lemma
1.1.8. Widerspruch!
1.1. ENDLICHE UND UNENDLICHE MENGEN
9
Eine sehr nützliche Charakterisierung (un)endlicher Mengen ergibt sich aus
dem folgenden
Satz 1.1.12 Sei A ⊂ N. Dann ist A endlich gdw. es keine echte Teilmenge
D von A gibt, so dass
(a) eine Injektion f : A → D existiert, oder
(b) eine Surjektion g : D → A existiert, oder
(c) eine Bijektion h : A → D existiert.
Beweis: Auf Grund von Lemma 1.1.2 folgt aus (a), dass (b) gilt. Auf Grund
von Lemma 1.1.3, welches wir für diesen Fall bereits bewiesen haben, folgt
aus (b), dass (a) gilt. Aus der Existenz einer echten Teilmenge D von A mit
(a) folgt die Existenz einer echten Teilmenge D von A mit (c), da wir für
eine Injektion f : A → D die Menge D $ A durch die Menge D = f [A] $ A
ersetzen können; f : A → D ist dann bijektiv. Aus (c) folgt trivial (a).
Die Aussagen, wonach eine echte Teilmenge D von A mit (a), (b) oder (c)
existiert, sind also paarweise äquivalent.
Sei nun zunächst A unendlich. Wir betrachten fA : BA = N → A. Sei
D = {fA (n) : n > 0} $ A.
Wir können eine Surjektion g : D → A definieren, indem wir fA (n) für n > 0
nach fA (n − 1) senden. Diese Abbildung ist bijektiv.
Sei jetzt A endlich. Wir zeigen dann, dass es keine echte Teilmenge D
von A gibt, so dass eine Bijektion h : A → D existiert. Andernfalls sei n die
Größe von A und k die Größe von D. Sei f : {m ∈ N : m < n} → A bijektiv,
und sei g : {m ∈ N : m < k} → D ebenfalls bijektiv. Dann ist g−1 ◦ h ◦ f eine
Bijektion von {m ∈ N : m < n} auf {m ∈ N : m < k}, wonach mit Lemma
1.1.8 gilt, dass n = k. Da D ⊂ A, gilt dann aber D = A nach Lemma 1.1.11.
Widerspruch!
Korollar 1.1.13 Sei A ⊂ N endlich, und sei f : A → A. Dann sind die
folgenden Aussagen äquivalent.
(a) f ist injektiv.
(b) f ist surjektiv.
(c) f ist bijektiv.
10
KAPITEL 1. NATÜRLICHE ZAHLEN
Beweis: Sei f injektiv. Angenommen, f wäre nicht surjektiv. Sei A = f [A].
Dann gilt A $ A, und f : A → A ist bijektiv. Widerspruch!
Sei nun f surjektiv. Angenommen, f wäre nicht injektiv. Sei A die Menge
aller n ∈ A, so dass aus m ∈ A und f (n) = f (m) bereits m ≥ n folgt. Dann
gilt A $ A und f ↾ A : A → A ist bijektiv. Widerspruch!
Damit ist das Korollar bewiesen.
Die hier bewiesenen Aussagen übertragen sich sehr schnell auf beliebige Mengen.
Definition 1.1.14 Sei A eine Menge. Dann heißt A endlich gdw. es ein
n ∈ N und eine Bijektion
f : {m ∈ N : m < n} → A
gibt. In diesem Falle heißt n auch die Größe von A.
Mit Hilfe des (noch unbewiesenen) Lemmas 1.1.3 zeigt man dann in ansonsten gleicher Weise wie im Beweis von Korollar 1.1.13 die folgende Tatsache.
Satz 1.1.15 Sei A endlich, und sei f : A → A. Dann sind die folgenden
Aussagen äquivalent.
(a) f ist injektiv.
(b) f ist surjektiv.
(c) f ist bijektiv.
Eine Anwendung dieses Satzes ist z.B. die folgende Aussage. Jeder endliche
kommutative Ring ohne Nullteiler ist ein Körper. Sei nämlich R ein endlicher
kommutativer Ring ohne Nullteiler. Wir müssen zeigen, dass zu jedem r ∈
R \ {0} ein s ∈ R \ {0} mit r · s = 1 existiert. Sei r ∈ R \ {0} beliebig.
Wir betrachten die Abbildung fr : R \ {0} → R \ {0}, die s ∈ R \ {0} nach
r · s sendet. Da R nullteilerfrei ist, gilt fr [R \ {0}] ⊂ R \ {0}, und es folgt
aus r · s = r · s′ , d.h. r · (s − s′ ) = 0, dass s − s′ = 0, d.h. s = s′ . Damit
ist fr : R \ {0} → R \ {0} injektiv, wegen der Endlichkeit von R und Satz
1.1.15 also auch surjektiv. Insbesondere gibt es also ein s ∈ R \ {0} mit
r · s = fr (s) = 1.
Dies hat zur Folge, dass für jede Primzahl p gilt, dass Z/pZ ein Körper
ist.
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
11
Definition 1.1.16 Sei A eine Menge. Dann heißt A unendlich gdw. A nicht
endlich ist.
Das Auswahlaxiom wird zum Beweis der folgenden Aussage benötigt.
Satz 1.1.17 Sei A eine unendliche Menge. Dann existiert eine Injektion
f : N → A.
Der Beweis dieses Satzes wird ebenfalls im 3. Kapitel geliefert.
1.2
Die Theorie der natürlichen Zahlen
Wir hatten oben das Induktionsaxiom als die Aussage formuliert, wonach
jede nichtleere Menge natürlicher Zahlen ein (im Sinne der natürlichen Ordnung < auf N) kleinstes Element besitzt. In dieser Formulierung wird das
Induktionsaxiom manchmal auch als das Prinzip der kleinsten natürlichen
Zahl bezeichnet. Es führt sofort zu folgendem Beweisprinzip.
Sei A ⊂ N. Angenommen,
(a) 0 ∈ A, und
(b) für jedes n ∈ N gilt, dass aus n ∈ A auch n + 1 ∈ A folgt.
Dann gilt A = N.
Mit Hilfe des Prinzips der kleinsten natürlichen Zahl kann man nämlich
wie folgt argumentieren. Angenommen, A $ N. Die Menge
B = {n ∈ N : n ∈
/ A}
ist dann nichtleer, enthält also ein kleinstes Element, n0 . Da 0 ∈ A, wegen
(a), gilt n0 > 0, so dass n0 = m0 + 1 gilt für den Vorgänger m0 von n0 .
Wegen der Wahl von n0 folgt aus m0 < n0 , dass m0 ∈ A. Wegen (b) gilt
dann aber auch n0 = m0 + 1 ∈ A. Widerspruch!
Dieser “Beweis” verwendet offensichtlich strukturelle Tatsachen hinsichtlich N bezüglich < und +, z.B., dass jedes n > 0 einen Vorgänger m besitzt
mit m + 1 = n und dass aus m + 1 = n folgt, dass m < n. Wenn man genau
analysiert, welche strukturellen Eigenschaften für einen Beweis durch Induktion benötigt werden, gelangt man zum Begriff der fundierten Relation, der
im 3. Kapitel diskutiert wird.
Jedenfalls aber ist unser “Beweis” deshalb unbefriedigend, da die ihm
zugrundeliegenden strukturellen Eigenschaften von N nicht vorher explizit
12
KAPITEL 1. NATÜRLICHE ZAHLEN
gemacht wurden. Mit anderen Worten: Wir sollten zunächst die Theorie von
N axiomatisieren, um sodann im Rahmen eines solchen Axiomensystems
gültige Aussagen über N zu beweisen! Diese Maxime ist im Sinne des allgemeinen “axiomatischen” Prinzips, wonach die Methode der Mathematik
darin besteht, aus Axiomen (interessante) Aussagen logisch abzuleiten.
Welches ist also ein gutes Axiomensystem für die natürlichen Zahlen?
Zunächst sollte es einige grundlegende arithmetische Tatsachen mitteilen.
Die folgende Liste von Axiomen hat sich hier eingebürgert.
1. ∀n n + 1 6= 0.
2. ∀n∀m (n + 1 = m + 1 → n = m).
3. ∀n n + 0 = n.
4. ∀n∀m n + (m + 1) = (n + m) + 1.
5. ∀n n · 0 = 0.
6. ∀n∀m n · (m + 1) = (n · m) + n.
7. ∀n n0 = 1.
8. ∀n∀m nm+1 = nm · n.
9. ∀n∀m (n < m + 1 ↔ (n < m ∨ n = m)).
10. ∀n ¬n < 0.
11. ∀n∀m (n < m ∨ n = m ∨ m < n).
Wir bezeichnen im folgenden das Axiomensystem, das aus diesen 11 Aussagen besteht, als Q. Die Axiome selbst nennen wir (Q1), (Q2), ..., (Q11).
Das Axiomensystem Q ist in einer Sprache der Logik erster Stufe formuliert, die allgemein im Abschnitt 4.1 diskutiert werden wird. Die Sprache von
Q, d.h. die Sprache der elementaren Arithmetik, hat die folgenden Symbole:
0
1
+
·
als Konstante für die Null
als Konstante für die Eins
als zweistelliges Funktionssymbol für die Addition
als zweistelliges Funktionssymbol für die Multiplikation
die Exponentenschreibweise für die Exponentiation
< als zweistelliges Relationssymbol für die Kleiner-Relation
Hinzu kommen allgemeine logische Symbole, von denen nicht alle in der
obigen Liste von Axiomen verwendet wurden:
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
13
Klammern: ( und )
Junktoren:
¬ für “es ist nicht der Fall, dass”,
∧ für “und”,
∨ für “oder”,
→ für “wenn . . . , dann . . . ” und
↔ für “genau dann, wenn”
Quantoren:
der Allquantor ∀ für “für alle”,
der Existenzquantor ∃ für “es gibt”
Variablen: n, m, p . . . für natürliche Zahlen
Gleichheitszeichen: =
Die Leserin/der Leser sollte sich nun vor Augen führen, was die einzelnen
Axiome von Q besagen. Das erste Axiom besagt z.B., dass für alle natürlichen
Zahlen n gilt, dass n + 1 verschieden von 0 ist, d.h., dass 0 kein Nachfolger
ist.
Die ersten beiden Axiome von Q besagen, daß die 0 kein Nachfolger ist
und dass zwei Zahlen, deren Nachfolger gleich sind, selbst gleich sind. Es läßt
sich aber (z.B. mit Hilfe des Kompaktheitsatzes, siehe Kapitel 4) nicht in Q
beweisen, dass jede Zahl, die verschieden von der Null ist, ein Nachfolger ist.
Hierzu benötigen wir das Induktionsaxiom.
Das Induktionsaxiom besagt, dass N die einzige Menge natürlicher Zahlen
ist, die die Null enthält und mit jedem n auch n+1. Wenn wir versuchen, diese Aussage mit den sprachlichen Mitteln zu formulieren, die Q zur Verfügung
stellt, dann scheitert dies daran, dass diese Sprache zwar Variablen n, m,
p, . . . für natürliche Zahlen, nicht aber Variablen für Mengen natürlicher
Zahlen bereitstellt. Nun, dem ist leicht Abhilfe zu verschaffen. Wir wollen
die Sprache von Q zu einer Sprache erweitern, die zusätzlich Variablen X,
Y , Z, . . . für Mengen natürlicher Zahlen zur Verfügung stellt. Da wir im
Induktionsaxiom aber auch über Elemente von Mengen natürlicher Zahlen
sprechen, müssen wir die Sprache weiterhin um ein zweistelliges Symbol ∈
für “ist Element von” anreichern.
Dann können wir das Induktionsaxiom wie folgt formulieren.
∀X ((0 ∈ X ∧ ∀n (n ∈ X → n + 1 ∈ X)) → ∀n n ∈ X).
14
KAPITEL 1. NATÜRLICHE ZAHLEN
Mit diesem Axiom und mit Hilfe von Q können wir nun versuchen, die
Aussage
∀n (n 6= 0 → ∃m n = m + 1)
wie folgt zu beweisen.
Zu zeigen ist, dass die Menge
X = {n ∈ N : n = 0 ∨ ∃m n = m + 1}
gleich N ist. Es gilt sicherlich 0 ∈ X. Sei nun n ∈ N beliebig mit n ∈ X.
Dann gilt auch n + 1 ∈ X, bezeugt durch m = n. Also gilt
0 ∈ X ∧ ∀n(n ∈ X → n + 1 ∈ X).
Auf Grund des Induktionsaxioms gilt also
∀n n ∈ X,
und damit ∀n(n 6= 0 → ∃m n = m + 1), wie gewünscht.
Diese Argumentation ist nicht falsch, allerdings wird bei näherem Hinsehen klar, dass wir dabei etwas benutzen, das uns nicht durch das Induktionsaxiom plus Q geliefert wird, nämlich dass wir das Induktionsaxiom auf
die Menge X = {n ∈ N : n = 0 ∨ ∃m n = m + 1} anwenden können.
Mit anderen Worten, außer dem Induktionsaxiom und Q benötigen wir ein
Mengenexistenzaxiom nämlich
∃X∀n(n ∈ X ↔ n = 0 ∨ ∃m n = m + 1),
welches uns liefert, dass {n ∈ N : n = 0 ∨ ∃m n = m + 1} tatsächlich eine
Menge ist, so dass das Induktionsaxiom auf diese Menge spezialisiert werden
darf.
Aus allgemeiner Sicht würde man die Variablen n, m, p, . . . (nämlich die
Variablen für natürliche Zahlen) als Variablen erster Stufe bezeichnen und
die Variablen X, Y, Z, . . . (nämlich die Variablen für Mengen natürlicher Zahlen) als Variablen zweiter Stufe. Einer derartigen Situation werden wir bei
der Axiomatisierung von R wieder begegnen, wo man auch geneigt ist, Variablen erster Stufe (nämlich Variablen für reelle Zahlen) und Variablen zweiter
Stufe (nämlich Variablen für Mengen reeller Zahlen) einzuführen. Der Preis,
der für die Einführung von Variablen zweiter Stufe zu zahlen ist, ist allerdings, dass dann Mengenexistenzaxiome erforderlich sind, die nicht benötigt
werden, wenn in der Sprache nur Variablen erster Stufe (nämlich Variablen
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
15
für Elemente des Bereichs, über den man gerade spricht, nicht für Mengen
derartiger Elemente) verwendet werden. In der Zahlentheorie lassen sich Variablen zweiter Stufe plus Mengenexistenzaxiome dadurch vermeiden, dass
anstelle eines Induktionsaxioms eine unendliche Menge von Induktionsaxiomen (das “Induktionsschema”) angegeben wird.
Um etwa den obigen Beweis laufen zu lassen, genügt es , das Induktionsaxiom für den Fall
X = {n ∈ N : n = 0 ∨ ∃m n = m + 1}
als gültig vorauszusetzen. Wir können diesen Fall anders wie folgt niederschreiben.
Sei ϕ(n) die Formel n = 0 ∨ ∃m n = m + 1. Dann lautet die für das obige
Argument benötigte Aussage
(ϕ(0) ∧ ∀n(ϕ(n) → ϕ(n + 1))) → ∀nϕ(n).
Das Induktionsschema lautet nun einfach wie folgt. Für jede Formel
ϕ(n, m1 , . . . , mk ) der Sprache von Q, in der die Variablen n, m1 , . . . , mk
vorkommen, ist
(Ind)ϕ ∀m1 . . . ∀mk ((ϕ(0, m1 , . . . , mk )∧
∀n(ϕ(n, m1 , . . . , mk ) → ϕ(n + 1, m1 , . . . , mk )))
→ ∀nϕ(n, m1 , . . . , mk ))
das zu ϕ gehörige Induktionsaxiom. Das Induktionsschema ist die (unendliche) Menge aller (Ind)ϕ , wobei ϕ eine Formel der Sprache von Q ist.
Wir bezeichnen Q plus dem Induktionsschema als Peano–Arithmetik,
kurz: P A.
In P A können wir beispielsweise die Assoziativität von + wie folgt beweisen.
Satz 1.2.1 (PA) ∀n∀m∀q (m + q) + n = m + (q + n).
Beweis: Wir zeigen zunächst
(*) ∀m∀q (m + q) + 0 = m + (q + 0)
mit Hilfe von zweimaliger Anwendung von (Q3) wie folgt: (m + q) + 0 =
m + q = m + (q + 0). Sodann zeigen wir
(**) ∀n(∀m∀q (m + q) + n = m + (q + n) → ∀m∀q (m + q) + (n + 1) =
m + (q + (n + 1))
16
KAPITEL 1. NATÜRLICHE ZAHLEN
wie folgt: Seien n, m und q beliebig, und werde (m + q) + n = m + (q + n)
vorausgesetzt. Dann ist (m + q) + (n + 1) = ((m + q) + n) + 1 wegen (Q4),
welches nach Voraussetzung gleich (m + (q + n)) + 1, ist, welches nach (Q4)
wiederum gleich m + ((q + n) + 1) ist.
Aus (*) und (**) folgt aber nun mit Hilfe von (Ind)∀m∀q (m+q)+n=m+(q+n)
sofort die zu beweisende Aussage ∀n∀m∀q (m + q) + n = m + (q + n).
Die Kommutativität von + beweist sich in P A nun mit Hilfe von Satz 1.2.1
wie folgt.
Satz 1.2.2 (PA) ∀n∀m n + m = m + n.
Beweis: Wir zeigen zunächst
(*)’ ∀m 0 + m = m + 0.
Es gilt nämlich 0 + 0 = 0 + 0. Außerdem folgt aus 0 + m = m + 0 und mit
Hilfe von (Q4), dass 0 + (m + 1) = (0 + m) + 1 = (m + 0) + 1. (Ind)0+m=m+0
liefert dann (*)’.
Sodann zeigen wir
(**)’ ∀m 1 + m = m + 1.
Es gilt nämlich 1 + 0 = 0 + 1 wegen (*)’. Aus 1 + m = m + 1 folgt aber mit
Hilfe von (Q4), dass 1 + (m + 1) = (1 + m) + 1 = (m + 1) + 1. Aufgrund von
(Ind)1+m=m+1 ergibt sich dann (*)’.
Schliesslich zeigen wir
(***)’ ∀n(∀m n + m = m + n → ∀m (n + 1) + m = m + (n + 1)).
Sei n beliebig, und sei ∀m n + m = m + n vorausgesetzt. Dann gilt für
beliebiges m, dass (n + 1) + m = n + (1 + m) wegen Satz 1.2.1, welches wegen
(**)’ gleich n + (m + 1), also mit Hilfe von (Q4) gleich (n + m) + 1 und damit
nach Voraussetzung gleich (m + n) + 1 ist. Abermalige Anwendung von (Q4)
liefert schliesslich, dass (n + 1) + m gleich m + (n + 1) ist.
Aus (*)’ und (***)’ folgt aber mit Hilfe von (Ind)∀m(m+n=n+m) sofort
∀n∀m m + n = n + m.
Es stellt sich heraus, dass in P A alle üblichen Rechenregeln und Gesetze für
die natürlichen Zahlen bewiesen werden können ebenso wie viele Theoreme
der Zahlentheorie.
1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN
17
Gibt es überhaupt wahre Aussagen über die natürlichen Zahlen, die in
der Sprache von Q formuliert werden können und die in PA nicht beweisbar sind? Diese Frage führt zum Gödelschen Unvollständigkeitssatz, der in
einführenden Logik–Kursen behandelt wird. Eine Version des Unvollständigkeitssatzes kann aus dem Kompaktheitssatz abgeleitet werden, der im letzten
Kapitel bewiesen wird.
18
KAPITEL 1. NATÜRLICHE ZAHLEN
Kapitel 2
Reelle Zahlen
Die griechische Mathematik hatte die reellen Zahlen zwar eigentlich entdeckt,
es wurde aber nicht mit ihnen gerechnet bzw. ihre Theorie entwickelt. Dies
wurde erst in der Neuzeit vollzogen.
2.1
Die Konstruktion der ganzen und rationalen
Zahlen
Die reellen Zahlen lassen sich mit Hilfe einfacher mengentheoretischer Konstruktionen aus den natürlichen Zahlen gewinnen. Wir benötigen hierfür
lediglich geordnete Paare, Äquivalenzrelationen und Folgen. Wir gehen dabei in drei Schritten vor: wir konstruieren zuerst die Menge Z der ganzen
Zahlen, sodann die Menge Q der rationalen Zahlen und schließlich die Menge
R der reellen Zahlen.
Definition 2.1.1 Sei A eine beliebige Menge. Eine zweistellige Relation R
auf A ist eine Äquivalenzrelation gdw. gilt:
(Reflexivität) xRx für alle x ∈ A,
(Symmetrie) xRy =⇒ yRx für alle x, y ∈ A, und
(Transitivität) xRy ∧ yRz =⇒ xRz für alle x, y, z ∈ A.
Wenn R eine Äquivalenzrelation auf A ist, dann heißt für x ∈ A die
Menge [x]R = {y ∈ A : yRx} die (R–)Äquivalenzklasse von x.
In der Situation von Definition 2.1.1 gilt y ∈ [x]R gdw. yRx gdw. [x]R = [y]R
für alle x, y ∈ A.
Wir können Z als Menge von Äquivalenzklassen von Paaren natürlicher
Zahlen wie folgt konstruieren.
19
20
KAPITEL 2. REELLE ZAHLEN
Seien (n, m) und (r, s) geordnete Paare natürlicher Zahlen. Wir identifizieren (n, m) mit (r, s) gdw. die Differenz von n und m gleich der Differenz
von r und s ist, d.h. wir definieren eine zweistellige Relation R durch
(n, m)R(r, s) ⇔ n + s = r + m.
Offensichtlich ist R eine Äquivalenzrelation. Wir schreiben
[n, m] = {(r, s) : (r, s)R(n, m)}
für die R–Äquivalenzklasse von (n, m). Für n ≥ m ist (n, m) = (n − m, 0),
und für n ≤ m ist (n, m) = (0, m − n), wodurch die nach links und rechts
unendliche “Folge”
. . . , [0, 2], [0, 1], [0, 0], [1, 0], [2, 0], . . .
sämtliche R–Äquivalenzklassen durchläuft. Unsere Vorstellung ist, dass [n, 0]
für die ganze Zahl +n und [0, n] für die ganze Zahl −n steht. Die Menge aller
R–Äquivalenzklassen bezeichnen wir mit Z und nennen sie die Menge der
ganzen Zahlen.
Wir schreiben
[n, m] < [r, s] ⇔ n + s < r + m,
wodurch < eine strikte lineare Ordnung auf Z ist. Wir können mit unseren
ganzen Zahlen auch in gewohnter Weise rechnen. Hierzu definieren wir die
Addition auf Z durch
[n, m] + [r, s] = [n + r, m + s].
Man sieht leicht, dass + assoziativ und kommutativ auf Z ist. Darüberhinaus
gilt
[n, m] + [0, 0] = [n, m]
und
[n, m] + [m, n] = [0, 0].
Somit ist Z bezüglich + eine abelsche Gruppe. Bis auf Isomorphie ist Z die
unendliche zyklische Gruppe.
In der angegebenen Art lässt sich übrigens aus einer beliebigen Halbgruppe H eine Gruppe G mit H ⊂ G konstruieren.
2.1. DIE KONSTRUKTION DER GANZEN UND RATIONALEN ZAHLEN21
Wir definieren weiterhin die Multiplikation auf Z durch
[n, m] · [r, s] = [n · r + m · s, n · s + m · r].
Dann gilt
[n, m] · [1, 0] = [n, m],
aber [1, 0] und [0, 1] sind die einzigen ganzen Zahlen [n, m], für die [r, s] mit
[n, m] · [r, s] = [1, 0]
existiert.
Wir schreiben von nun an +n (oder einfach n) für die ganze Zahl [n, 0]
und −n für die ganze Zahl [0, n].
Wir konstruieren nun Q als Menge von Äquivalenzklassen von Paaren
gewisser ganzer Zahlen wie folgt.
Seien (n, m) und (r, s) geordnete Paare ganzer Zahlen, wobei m 6= 0 6= s.
Wir identifizieren (n, m) mit (r, s) gdw. der Quotient aus n und m gleich
dem Quotienten aus r und s ist, d.h. wir definieren eine zweistellige Relation
S durch
(n, m)S(r, s) ⇔ n · s = r · m.
Offensichtlich ist S eine Äquivalenzrelation auf der Menge aller Paare ganzer
Zahlen, deren zweite Komponente nicht 0 ist. (Würden wir als zweite Komponente die 0 zulassen, so wäre S nicht transitiv, da dann für alle (n, m)
gelten würde, dass (n, m)S(0, 0), aber z.B. gilt (1, 2)S(1, 3) nicht. Die Division durch 0 ist nicht möglich!)
Für n, m ∈ Z, m 6= 0, schreiben wir
hn, mi = {(r, s) : r, s ∈ Z, s 6= 0, (r, s)S(n, m)}
für die S–Äquivalenzklasse von (n, m). Unsere Vorstellung ist, dass hn, mi für
n
steht. Die Menge aller S–Äquivalenzklassen bezeichnen
die rationale Zahl m
wir mit Q und nennen sie die Menge der rationalen Zahlen.
Zu beliebigen r, s ∈ Z mit s 6= 0 existieren offenbar r ′ , s′ ∈ Z mit s′ > 0
und (r, s)S(r ′ , s′ ). Für n, m, r, s ∈ Z mit m > 0 und s > 0 schreiben wir
hn, mi < hr, si ⇔ n · s < r · m,
wodurch < eine strikte lineare Ordnung auf Q ist. Wir können mit unseren
rationalen Zahlen wieder in gewohnter Weise rechnen.
22
KAPITEL 2. REELLE ZAHLEN
Wir definieren die Addition auf Q durch
hn, mi + hr, si = hn · s + r · m, m · si.
Wieder ist + assoziativ und kommutativ auf Q. Es gilt
hn, mi + h0, 1i = hn, mi
und
hn, mi + h−n, mi = h0, 1i.
Somit ist Q bezüglich + eine abelsche Gruppe. Wir definieren die Multiplikation auf Q durch
hn, mi · hr, si = hn · r, m · si.
Man sieht leicht, dass · assoziativ und kommutativ auf Q ist. Außerdem gilt
hn, mi · h0, 1i = h0, 1i.
und
hn, mi · h1, 1i = hn, mi.
für alle n, m ∈ Z mit m 6= 0, und es gilt
hn, mi · hm, ni = h1, 1i.
für alle n, m ∈ Z mit n 6= 0 6= m. Somit ist Q \ {h0, 1i} bezüglich · eine
abelsche Gruppe.
n
Wir schreiben von nun an m
für die rationale Zahl hn, mi, wobei n, m ∈
Z, m 6= 0.
n
n
| einer rationalen Zahl m
werde wie folgt definiert. Es sei,
Der Betrag | m
n
n
für n, m ∈ Z mit m 6= 0, | m | derjenige der beiden Werte m
und −n
m , welcher
> 01 ist.
Es ist leicht zu verifizieren, dass sowohl Z als auch Q abzählbare Mengen
sind. Im Falle von Z lässt sich eine Bijektion f : N → Z wie folgt angeben. Es
sei f (2n) = n und f (2n + 1) = −n. Im Falle von Q ist es etwas trickreicher,
eine Bijektion g : N → Q anzugeben, welches wir wie folgt leisten.
Sei, für m ∈ N, Pm die Menge aller n ∈ N, n ≥ 2, so dass pm (die mte
Primzahl) die kleinste Primzahl ist, die n teilt. (Z.B. ist P1 = {3, 9, 15, . . . }.)
Weiter sei für m ∈ N, m ≥ 1, Tm die Menge aller n ∈ N, n ≥ 1, so dass 1 der
größte gemeinsame Teiler von m und n ist. (Z.B. ist T3 = {1, 2, 4, 5, . . . }.)
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
23
Betrachten wir zunächst die Menge Q+ der positiven rationalen Zahlen.
n
darstelJedes Element von Q+ lässt sich eindeutig als “gekürzter Bruch” m
len, wobei m ≥ 1 und n ∈ Tm . Wir können nun eine Bijektion ϕ : Q+ → N
n
folgendermaßen angeben. Sei rs ∈ Q+ gegeben, und sei m
die eindeutige
n
r
r
gekürzte Darstellung von s , d.h. m = s , m ≥ 1 und n ∈ Tm . Wir setzen
dann
r
ϕ( ) = fPm−1 (fT−1
(n)) − 2.
m
s
Hierbei sind fTm : N → Tm und fPm+1 : N → Pm+1 die “natürlichen
Aufzählungen” von Tm und Pm+1 wie in Abschnitt 1.1. Wenn also n das kte
n
dem kten Element von Pm−1
Element von Tm ist, dann ordnen wir rs = m
zu. Dabei subtrahieren wir 2, um die Zahlen 0 und 1 ebenfalls in den Wertebereich von ϕ zu bekommen. Da N \ {0, 1} die disjunkte Vereinigung aller
Pm , m ≥ 2, ist, und da sowohl fTm : N → Tm als auch fPm : N → Pm bijektiv
sind, ist leicht zu verifizieren, dass die so definierte Abbildung ϕ : Q+ → N
bijektiv ist.
Wir erhalten in derselben Weise eine bijektive Abbildung ψ : Q− → N
der Menge der negativen rationalen Zahlen auf N.
Schließlich können wir eine Bijektion g : N → Q definieren, indem wir
setzen: g(0) = 01 , g(2n + 1) = ϕ−1 (n) und g(2n + 2) = ψ −1 (n) für n ∈ N.
Die so definierte Bijektion g : N → Q respektiert natürlich in keinster
Weise die natürlichen Ordnungen auf N bzw. Q. Eine Bijektion, die diese
Ordnung respektieren würde, d.h. einen Ordnungsisomorphismus von N und
Q, kann es auch gar nicht geben. Im Unterschied zu N ist Q, zusammen mit
<, nämlich “dicht” im folgenden Sinne.
Sei < eine strikte lineare Ordnung auf einer Menge A. Dann heißt < dicht
gdw. für alle x, y ∈ A mit x < y ein z ∈ A existiert mit x < z und z < y.
r
Die natürliche Ordnung < auf Q ist dicht in diesem Sinne, dass für m
n, s ∈
m
r
m·s+r·n
m
r
Q mit n < s die rationale Zahl 2·n·s echt zwischen n und s liegt.
Man kann zeigen, dass Q zusammen mit < bis auf Isomorphie die einzige
dichte lineare Ordnung auf einer abzählbaren Menge ist, die keine “Endpunkte” besitzt (siehe Übungsaufgabe ?????).
2.2
Die Konstruktion der reellen Zahlen
Wir wenden uns nun der Konstruktion der reellen Zahlen zu. Diese können
wir als Äquivalenzklassen gewisser Folgen rationaler Zahlen gewinnen.
Eine rationale Folge ist eine (beliebige) Abbildung x : N → Q. Wir schreiben dabei auch xn anstelle von x(n) und (xn : n ∈ N) anstelle von x. Eine
24
KAPITEL 2. REELLE ZAHLEN
rationale Folge (xn : n ∈ N) heißt Cauchy–Folge gdw. für alle (rationalen)
ε > 0 ein n0 ∈ N existiert, so dass für alle n, m ≥ n0 gilt.
|xm − xn | < ε.
Eine rationale Folge (xn : n ∈ N) heißt Nullfolge gdw. für alle (rationalen)
ε > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 gilt: |xn | < ε. Beispielsweise
1
: n ∈ N) eine Nullfolge. Sei nämlich ε = rs > 0, wobei etwa
ist die Folge ( n+1
r, s ∈ N, r 6= 0 6= s. Setze n0 = s, dann gilt für alle n ≥ n0 : s < n0 + 1 ≤
1
n + 1 ≤ r · (n + 1), also n+1
< rs .
Jede Nullfolge ist eine Cauchy–Folge. Sei nämlich (xn : n ∈ N) Nullfolge.
Sei ε > 0, und sei n0 ∈ N so, dass für alle n ≥ n0 gilt: |xn | < 12 · ε. Dann gilt
für alle n, m ≥ n0
1
1
|xm − xn | ≤ |xm | + |xn | < ε + ε = ε.
2
2
(Die erste Ungleichung benutzt die “Dreiecksungleichung”.)
Eine Folge (xn : n ∈ N) heißt konstant gdw. ein y ∈ Q existiert, so dass
xn = y für alle n ∈ N gilt. Wir schreiben in diesem Falle auch (x : n ∈ N)
für (xn : n ∈ N). Die Differenz zweier Folgen (xn : n ∈ N) und (yn : n ∈ N)
wird als Folge der punktweisen Differenzen definiert, d.h.
(xn : n ∈ N) − (yn : n ∈ N) = (xn − yn : n ∈ N).
Eine Folge (xn : n ∈ N) konvergiert gegen x ∈ Q gdw. die Differenz von
(xn : n ∈ N) und (x : n ∈ N) eine Nullfolge ist. In diesem Falle schreiben wir
x = lim xn .
n→∞
Wenn (xn : n ∈ N) gegen x ∈ Q konvergiert, dann ist (xn : n ∈ N) eine
Cauchy–Folge. Dies ergibt sich aus dem obigen Argument für Nullfolgen, da
immer
xn − xm = (xn − x) − (xm − x).
Wir wollen nun sehen, dass es Cauchy–Folgen gibt, für die keine rationale
Zahl existiert, gegen die diese Cauchy–Folge konvergiert.
Lemma 2.2.1 Es gibt kein x ∈ Q mit x2 = 2.
Beweis: Sei rs ∈ Q. Sei n die kleinste positive Zahl, für die ein (eindeutiges!)
r
m ∈ Z existiert mit m
n = s . Für diese Wahl von n und m gilt dann, dass
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
25
m oder n ungerade ist. Wären nämlich beide gerade, etwa m = 2m und
′
n = 2n′ , dann n′ < n und rs = m
n′ im Widerspruch zur Wahl von n.
m 2
2
2
Wir zeigen jetzt ( rs )2 = ( m
n ) 6= 2. Angenommen, ( n ) = 2, d.h. m =
2
′
2n . Dann ist m gerade, da andernfalls für m = 2m + 1 gelten müsste, dass
2n2 = m2 = 4(m′ 2 + m′ ) + 1 was ein Widerspruch ist, da die linke Seite
dieser Gleichung gerade und die rechte ungerade ist.
Wenn aber m gerade ist, etwa m = 2m′ , dann folgt aus m2 = 2n2 , dass
2n2 = m2 = 4m′ 2 , also n2 = 2m′ 2 . Eine Wiederholung des obigen Arguments
liefert dann, dass auch n gerade sein muss. Damit ist sowohl m als auch n
gerade. Widerspruch!
Derselbe Beweis zeigt, dass, falls n ∈ N keine Quadratzahl ist, kein x ∈ Q mit
x2 = n existiert. Wir definieren nun einen Cauchy–Folge (xn : n ∈ N), die,
würde sie gegen ein x ∈ Q konvergieren, gegen ein x mit x2 = 2 konvergieren
müsste.
Lemma 2.2.2 Es gibt eine Cauchy–Folge (xn : x ∈ N), zu der kein x ∈ Q
existiert, so dass (xn : n ∈ N) gegen x konvergiert.
Beweis: Wir konstruieren “rekursiv” zwei Cauchy–Folgen (xn : n ∈ N) und
(yn : n ∈ N) wie folgt.
Wir setzen x0 = 0 und y0 = 2. Offensichtlich gilt 0 ≤ x0 < y0 und
x20 < 2 < y02 .
Nehmen wir nun an, die rationalen Zahlen xn und yn sind bereits konstruiert, so dass 0 ≤ xn < yn und x2n < 2 < yn2 . Sei dann z = 21 · (yn + xn ).
Falls z 2 < 2, dann setzen wir xn+1 = z und yn+1 = yn ; falls z 2 > 2, dann
setzen wir xn+1 = xn und yn+1 = z. (Da mit xn und yn auch z rational
ist, kann wegen Lemma 2.2.1 nicht z 2 = 2 gelten.) In jedem Falle gilt für
die rationalen Zahlen xn+1 und yn+1 dann wieder 0 ≤ xn+1 < yn+1 und
2 .
x2n+1 < 2 < yn+1
Damit sind (xn : n ∈ N) und (yn : n ∈ N) konstruiert. Durch Induktion
1
. Für n = 0 gilt nämlich
ergibt sich, dass für alle n ∈ N gilt: yn − xn = 2n−1
1
1
y0 − x0 = 2 = 2−1 , und wenn yn − xn = 2n−1 , dann gilt yn+1 − xn+1 =
1
1
1
1
1
2 · (yn − xn ) = 2 · 2n−1 = 2n = 2(n+1)−1 . Nach Konstruktion gilt offensichtlich
auch 0 ≤ x0 ≤ x1 ≤ x2 ≤ . . . und 2 = y0 ≥ y1 ≥ y2 ≥ . . . . Sowohl
(xn : n ∈ N) als auch (yn : n ∈ N) sind dann Cauchy–Folgen. Sei nämlich
ε > 0. Sei n0 ∈ N so, dass 2n0 −1 > 1ε (ein derartiges n0 existiert, da für alle
n ∈ N gilt: 2n ≥ n). Dann gilt für alle n, m ≥ n0 : xn0 ≤ xn ≤ yn0 und
26
KAPITEL 2. REELLE ZAHLEN
xn0 ≤ xm ≤ yn0 und daher
|xm − xn | ≤ yn0 − xn0 =
1
< ε.
2n0 −1
Also ist (xn : n ∈ N) Cauchy–Folge. Dasselbe Argument zeigt, dass auch
(yn : n ∈ N) Cauchy–Folge ist.
Angenommen nun, (xn : n ∈ N) konvergiert gegen x ∈ Q. Da x0 ≤ x1 ≤
x2 ≤ . . . , gilt dann x ≥ xn für alle n ∈ N (wäre x < xn für ein n ∈ N,
dann hätten wir |xm − x| ≥ |xn − x| für alle m ≥ n). Weiterhin würde auch
(yn : n ∈ N) gegen x konvergieren. Sei nämlich ε > 0 und sei n0 so, dass
1
< ε. Dann gilt für n ≥ n0 :
2n0 −1
|yn − x| ≤ yn − xn ≤ yn0 − xn0 =
1
2n0 −1
< ε.
Außerdem folgt aus y0 ≥ y1 ≥ y2 ≥ . . . analog zu eben, dass x ≤ yn für
alle n ∈ N gilt. Wir haben nun 0 ≤ xn ≤ x ≤ yn für alle x ∈ N, also auch
x2n ≤ x2 ≤ yn2 für alle n ∈ N.
Sei ε > 0. Sei n0 so, dass für alle n ≥ n0 gilt: yn − xn < 14 · ε. Dann gilt
2 − x2n ≤ yn2 − x2n = (yn − xn )(yn + xn ) ≤ (yn − xn ) · 2yn < 41 · ε · 4 = ε, und
damit x2n ≥ 2 − ε. (Die Folge (x2n : n ∈ N) konvergiert damit gegen 2.) Also
gilt x2 ≥ 2 − ε für alle ε > 0, woraus x2 ≥ 2 folgt. Völlig analog zeigt man
x2 ≤ 2. Also gilt x2 = 2. Dies ist ein Widerspruch!
Lemma 2.2.2 besagt, dass Q nicht vollständig ist: es gibt in Q verlaufende Cauchy–Folgen, die nicht in Q konvergieren. Wir werden nun Q “vervollständigen”.
Wir definieren dazu zunächst eine Äquivalenzrelation auf der Menge der
(rationalen) Cauchy–Folgen. Seien (xn : n ∈ N), (yn : n ∈ N) rationale
Cauchy–Folgen. Wir schreiben dann
(xn : n ∈ N)E(yn : n ∈ N),
falls die Differenz von (xn : n ∈ N) und (yn : n ∈ N) eine Nullfolge ist.
Offensichtlich ist E reflexiv und symmetrisch. Die Transitivität von E ergibt
sich folgendermaßen. Sei (xn : n ∈ N)E(yn : n ∈ N) und (yn : n ∈ N)E(zn :
n ∈ N). Sei ε > 0, und sei n0 ∈ N so, dass für alle n ≥ n0 gilt: |yn − xn | < 21 ε
und |zn − yn | < 12 ε. Dann gilt für alle n ≥ n0 :
1
1
|zn − xn | ≤ |zn − yn | + |yn − xn | < ε + ε = ε
2
2
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
27
mit Hilfe der Dreiecksungleichung. Also ist auch die Differenz von (xn : n ∈
N) und (zn : n ∈ N) eine Nullfolge.
Wenn (xn : n ∈ N) eine rationale Cauchy–Folge ist, dann schreiben wir
nun
[xn : n ∈ N] = {(yn : n ∈ N) : (yn : n ∈ N)E(xn : n ∈ N)}
für die E–Äquivalenzklasse von (xn : n ∈ N). Unsere Vorstellung ist, dass
[xn : n ∈ N] diejenige reelle Zahl ist, gegen die (xn : n ∈ N) konvergiert. Die
Menge aller E–Äquivalenzklassen bezeichnen wir mit R und nennen sie die
Menge der reellen Zahlen.
Die Menge Q der rationalen Zahlen ist in natürlicher Weise in der Menge
R der reellen Zahlen enthalten, indem wir x ∈ Q mit [x : n ∈ N] identifizieren.
Für x ∈ Q schreiben wir im Folgenden auch x anstelle von [x : n ∈ N].
Lemma 2.2.3 Seien (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen.
Dann gilt genau eine der folgenden Aussagen:
(1) (xn : n ∈ N)E(yn : n ∈ N)
(2) es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn >
xn + ε
(3) es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : xn >
yn + ε.
Beweis: Offensichtlich schließen sich (1), (2) und (3) gegenseitig aus. Wir
zeigen, dass (1) gilt, falls sowohl (2) als auch (3) falsch sind. Wenn (2) und
(3) falsch sind, dann gibt es für jedes n ∈ N und für jedes ε ∈ Q, ε > 0, ein
m ≥ n mit
ym ≤ xm + ε,
und für jedes n ∈ N und für jedes ε ∈ Q, ε > 0, gibt es ein m ≥ n mit
xm ≤ ym + ε.
Sei nun ε ∈ Q, ε > 0. Sei n0 ∈ N so, dass für alle n, m ≥ n0 :
|xm − xn | < 13 ε und
|ym − yn | < 31 ε.
Sei m ≥ n0 , so dass ym ≤ xm + 31 ε, d.h. ym − xm ≤ 31 ε. Dann gilt für alle
n ≥ n0 :
y n − xn = y n − y m + y m − xm + xm − xn
≤ |yn − ym | + ym − xm + |xm − xn |
< 13 ε + 31 ε + 13 ε = ε.
28
KAPITEL 2. REELLE ZAHLEN
Analog zeigt man, dass für alle n ≥ n0 : xn − yn < ε.
Damit haben wir ein n0 ∈ N gefunden, so dass für alle n ≥ n0 gilt:
|yn − xn | < ε. Damit ist die Differenz von (xn : n ∈ N) und (yn : n ∈ N) eine
Nullfolge und es gilt (1).
Definition 2.2.4 Seien (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen.
Wir schreiben dann
[xn : n ∈ N] < [yn : n ∈ N]
gdw. es ein n0 ∈ N und ein ε ∈ Q, ε > 0, gibt, so dass für alle n ≥ n0 : yn >
xn + ε.
Wir müssen zeigen, dass < wohldefiniert ist. Die definierende Tatsache (“es
gibt n0 ∈ N und ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn > xn + ε”) nimmt
Bezug auf einen Repräsentanten der Äquivalenzklasse [xn : n ∈ N] (nämlich
(yn : n ∈ N)). Wir müssen zeigen, dass der Wahrheitswert der definierenden
Tatsache nicht von der Wahl der Repräsentanten abhängt. Dies erfolgt im
Wesentlichen in gleicher Weise wie der Beweis zu Lemma 2.2.3
Lemma 2.2.5 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N) und (yn′ :
n ∈ N) rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und
(yn : n ∈ N)E(yn′ : n ∈ N). Dann sind die folgenden Aussagen äquivalent.
(1) Es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0 so, dass für alle n ≥ n0 : yn >
xn + ε.
(2) Es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0 so, dass für alle n ≥ n0 : yn′ >
x′n + ε.
Beweis: Aus Symmetriegründen genügt es zu zeigen, dass (2) aus (1) folgt.
Sei also (1) angenommen, und werde dies durch n0 ∈ N und ε ∈ Q, ε > 0,
bezeugt. Sei m0 ∈ N so, dass für alle n ≥ n0 gilt: |x′n − xn | < 3ε und
|yn′ − yn | < 3ε . Sei o.B.d.A. m0 ≥ n0 . Dann gilt für alle n ≥ m0 :
yn′ − x′n = (yn − xn ) − (yn − yn′ ) − (x′n − xn )
≥ (yn − xn ) − |yn − yn′ | − |x′n − xn |
> ε − 3ε − 3ε = 3ε .
Damit gilt (2), bezeugt durch m0 und 3ε .
Wir haben gezeigt, dass < eine strikte lineare Ordnung auf R ist. Die rationalen Zahlen sind im folgenden Sinne “dicht” in den reellen Zahlen enthalten:
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
29
Satz 2.2.6 Seien x, y ∈ R. Dann existiert ein z ∈ Q mit x < z und z < y.
Beweis: Sei x = [xn : n ∈ N] und y = [yn : n ∈ N], wobei (xn : n ∈
N), (yn : n ∈ N) rationale Cauchy–Folgen sind. Da x < y, gibt es n0 ∈ N
und ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn > xn + ε. Sei m0 ≥ n0
so, dass für alle n, m ≥ m0 gilt: |xm − xn | < 3ε und |ym − yn | < 3ε . Setze
z = 21 · (xm0 + ym0 ). Dann gilt für alle n ≥ m0 :
z − xn = z − xm0 + xm0 − xn
≥ z − xm0 − |xm0 − xn |
= 12 · (ym0 − xm0 ) − |xn0 − xn |
≥ 21 ε − 31 ε = 61 ε,
d.h. es gilt z ≥ xn + 16 ε für alle n ≥ m0 . Dies zeigt x = [xn : n ∈ N] < [z :
n ∈ N]. Analog zeigt man [z : n ∈ N] < [yn : n ∈ N] = y.
Korollar 2.2.7 R ist “archimedisch” im folgenden Sinne. Sei x ∈ R. Dann
existiert ein n ∈ N mit x < n.
Beweis: Der Fall x ≤ 0 ist trivial. Nehmen wir also an, es gelte x > 0. Sei
z ∈ Q, so dass z > 0 und z < x1 . Es gibt m, n ∈ N mit m > 0 und n > 0, so
m
1
dass z = m
n . Es gilt dann n < x , also m · x < n. Daraus folgt x < n.
Mit den reellen Zahlen lässt sich in gewohnter Weise rechnen.
Wir definieren die Addition auf R durch
[xn : n ∈ N] + [yn : n ∈ N] = [xn + yn : n ∈ N],
wobei (xn : n ∈ N) und (yn : n ∈ N) rationale Cauchy–Folgen sind.
Lemma 2.2.8 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N), (yn′ : n ∈ N)
rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und (yn : n ∈
N)E(yn′ : n ∈ N). Dann sind auch (xn + yn : n ∈ N), (x′n + yn′ : n ∈ N)
rationale Cauchy–Folgen und es gilt (xn + yn : n ∈ N)E(x′n + yn′ : n ∈ N).
Beweis: Siehe Übungsaufgabe ?????
Damit ist die Addition auf R wohldefiniert. Man sieht leicht, dass + assoziativ und kommutativ auf R ist. Außerdem gilt
[xn : n ∈ N] + [0 : n ∈ N] = [xn : n ∈ N]
30
KAPITEL 2. REELLE ZAHLEN
und
[xn : n ∈ N] + [−xn : n ∈ N] = [0 : n ∈ N]
für alle rationalen Cauchy–Folgen (xn : n ∈ N), wodurch R bezüglich + eine
abelsche Gruppe ist.
Wir definieren die Multiplikation auf R durch
[xn : n ∈ N] · [yn : n ∈ N] = [xn · yn : n ∈ N],
wobei (xn : n ∈ N) und (yn : n ∈ N) rationale Cauchy–Folgen sind.
Lemma 2.2.9 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N) und (yn′ :
n ∈ N) rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und
(yn : n ∈ N)E(yn′ : n ∈ N). Dann sind auch (xn · yn : n ∈ N), (x′n · yn′ : n ∈ N)
rationale Cauchy–Folgen und es gilt (xn · yn : n ∈ N)E(x′n · yn′ : n ∈ N)
Beweis: Siehe Übungsaufgabe ?????
Damit ist die Multiplikation auf R wohldefiniert. Man sieht leicht, dass ·
assoziativ und kommutativ auf R ist. Außerdem gilt
[xn : n ∈ N] · [1 : n ∈ N] = [xn : n ∈ N]
für alle rationalen Cauchy–Folgen (xn : n ∈ N). Sei weiterhin (xn : n ∈ N)
eine rationale Cauchy–Folge, [xn : n ∈ N] keine Nullfolge, d.h. es gibt ein
n0 ∈ N und ein ε ∈ Q, ε > 0, so dass |xn | > ε für alle n ≥ n0 . Sei dann
(yn : n ∈ N) definiert durch yn = 1, falls n < n0 , und yn = x1n , falls n ≥ n0 .
Dann ist (yn : n ∈ N) eine rationale Cauchy–Folge. Sei nämlich ε ∈ Q, ε > 0.
Sei m0 ≥ n0 so, dass für alle m, n ≥ m0 gilt: |xm − xn | < ε3 ; dann gilt für
|xn −xm |
ε3
alle m, n ≥ m0 : |ym − yn | = | x1m − x1n | = |x
= ε. Außerdem sieht
< ε·ε
m |·|xn |
man leicht, dass
(xn · yn : n ∈ N)E(1 : n ∈ N) = 1.
Somit ist R \ {0} bezüglich · eine abelsche Gruppe.
Ebenso leicht lassen sich die Distributionsgesetze für + und · nachrechnen, wodurch R ein Körper ist.
Wir wollen nun die Vollständigkeit von R nachrechnen. Die Vollständigkeit von R besagt, dass jede Cauchy–Folge, die in R verläuft, einen Grenzwert
in R besitzt. Hierzu müssen wir zunächst die Begriffe “Cauchy–Folge” und
“Konvergenz” in natürlicher Weise auf R ausdehnen.
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
31
Definition 2.2.10 Sei (xn : n ∈ N) eine Folge reeller Zahlen. Dann heißt
(xn : n ∈ N) eine Cauchy–Folge gdw. für alle ε > 0 ein n0 ∈ N existiert, so
dass für alle n, m ≥ n0 gilt: |xm − xn | < ε.
Da wegen Satz 2.2.6 zu jedem ε ∈ R mit ε > 0 ein ε′ ∈ Q mit ε′ < ε und
ε′ > 0 existiert, spielt es keine Rolle, ob die Zahl ε in Definition 2.2.10 als
rational oder reell angenommen wird.
Definition 2.2.11 Sei (xn : n ∈ N) eine Folge reeller Zahlen und sei x eine
reelle Zahl. Dann konvergiert (xn : n ∈ N) gegen x, in Zeichen
lim xn = x,
n→∞
gdw. für alle ε > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 gilt:
|x − xn | < ε.
Sei (xn : n ∈ N) eine reelle Folge, und sei x ∈ R. Angenommen, es gilt
limn→∞ xn = x. Zu vorgelegtem ε > 0 sei n0 ∈ N so, dass |x − xn | < 2ε für
alle n ≥ n0 . Dann gilt für alle n, m ≥ n0 :
|xm − xn | = |x − xn + xm − x|
≤ |x − xn | + |xm − x| <
ε
2
+
ε
2
= ε.
Wenn also (xn : n ∈ N) gegen x konvergiert dann ist (xn : n ∈ N) eine
Cauchy–Folge.
Satz 2.2.12 Sei (xn : n ∈ N) eine reelle Cauchy–Folge. Dann gibt es eine
reelle Zahl x, so dass (xn : n ∈ N) gegen x konvergiert.
Beweis: Für jedes n ∈ N sei yn eine rationale Zahl mit xn < yn und yn <
1
. (Ein solches yn existiert wegen Satz 2.2.6).
xn + n+1
Wir zeigen zunächst, dass (yn : n ∈ N) eine Cauchy–Folge ist. Sei ε > 0
vorgelegt. Sein n0 ∈ N so, dass n01+1 < 3ε und für alle m, n ≥ n0 :
|ym − yn | = |ym − xm + xm − xn + xn − yn |
≤ |ym − xm | + |xm − xn | + |xn − yn |
1
1
< m+1
+ 3ε + n+1
ε
ε
ε
< 3 + 3 + 3 = ε.
Die Folge (yn : n ∈ N) ist also in der Tat eine rationale Cauchy–Folge.
32
KAPITEL 2. REELLE ZAHLEN
Wir zeigen nun, dass (xn : n ∈ N) gegen die reelle Zahl [yn : n ∈ N]
konvergiert. Wir schreiben y = [yn : n ∈ N]. Wir müssen zeigen, dass für
jedes ε > 0 ein n0 ∈ N existiert, so dass für alle m ≥ n0 gilt: |y − xm | < ε.
Sei also ε > 0 vorgelegt.
ε
2
Behauptung. Es gibt ein n0 ∈ N, so dass für alle m ≥ n0 gilt: |ym −y| <
1
und m+1
< 2ε .
Sei zunächst die Behauptung als richtig angenommen. Dann gilt für m ≥
n0 , mit Hilfe der Dreiecksungleichung:
|xm − y| = |xm − ym + ym − y| ≤
1
+ 2ε <
|xm − ym | + |ym − y| < m+1
ε
2
+
ε
2
= ε.
Es genügt also, die Behauptung zu beweisen.
Sei m0 so, dass für alle m, k ≥ m0 gilt: |ym − yk | < 4ε . Sei m ≥ m0 , und
sei δ = 4ε . Dann gilt für alle k ≥ m0 :
yk +
ε
> ym + δ
2
und
ε
> yk + δ.
2
Nach Definition 2.2.4 bedeutet dies:
ym +
ym = [ym : n ∈ N] < [yn +
und
y = [yn : n ∈ N] < [ym +
ε
ε
: n ∈ N] = y +
2
2
ε
ε
: n ∈ N] = ym + ,
2
2
d.h.
ε
|ym − y| < .
2
Aufgrund von Korollar 2.2.7 existiert ein k0 , so dass für alle m ≥ k0 gilt:
ε
1
m+1 < 2 . Wenn dann n0 das Maximum von m0 und k0 ist, dann leistet n0
das für die Behauptung Gewünschte.
Definition 2.2.13 Seien x, y ∈ R mit x < y. Wir schreiben dann
(x, y) = {z ∈ R : x < z ∧ z < y}
2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN
33
für das offene Intervall zwischen x und y, und wir schreiben
[x, y] = {z ∈ R : x ≤ z ∧ z ≤ y}
für das abgeschlossene Intervall zwischen x und y.
Seien (xn : n ∈ N), (yn : n ∈ N) Folgen reeller Zahlen mit xn <Tyn , xn+1 ≥ xn
und yn+1 ≤ yn für alle n ∈ N. Dann gilt nicht notwendig, dass T n∈N (xn , yn ) 6=
1
für alle n ∈ N, dann
∅. (Wenn etwa xn = 0 und yn = n+1
T ist n∈N (xn , yn ) =
∅.) Andererseits gilt in dieser Situation immer, dass n∈N [xn , yn ] 6= ∅. Dies
ist die Aussage des Intervallschachtelungsprinzips.
Definition 2.2.14 Seien (xn : n ∈ N), (yn : n ∈ N) Folgen reeller Zahlen
mit xn < yn für alle n ∈ N. Dann heißt die Folge
([xn , yn ] : n ∈ N)
abgeschlossener Intervalle eine (abgeschlossene) Intervallschachtelung, falls
xn ≤ xn+1 und yn+1 ≤ yn für alle n ∈ N.
Satz 2.2.15 (Intervallschachtelungsprinzip) Sei ([xn , yn ] : n ∈ N) eine
Intervallschachtelung. Dann gilt
\
[xn , yn ] 6= ∅.
n∈N
Beweis: Zunächst ist leicht zu sehen, dass (xn : n ∈ N) eine Cauchy–Folge
ist. Andernfalls gäbe es nämlich ein ε > 0, so dass für alle n0 ∈ N natürliche
Zahlen n, m ≥ n0 mit |xm − xn | ≥ ε existieren, was sofort liefert, dass
(xn : n ∈ N) unbeschränkt ist. Ebenso sieht man, dass (yn : n ∈ N) eine
Cauchy–Folge ist.
Seien x = limn→∞ xn und y = limn→∞ yn . Es gilt x ≤ y, da ansonsten
ein n ∈ N mit yn < xn existieren müsste.
T
Damit gilt nun auch x ∈ [xn , yn ] für alle m ∈ N, d.h. n∈N [xn , yn ] 6= ∅.
Satz 2.2.16 (Supremumsprinzip) Sei A ⊂ R eine nichtleere beschränkte
Menge reeller Zahlen. Dann existiert ein x ∈ R mit:
(a) für alle y ∈ A gilt y ≤ x, und
(b) wenn z ∈ R so ist, dass y ≤ z für alle y ∈ A gilt, dann ist x ≤ z.
34
KAPITEL 2. REELLE ZAHLEN
Beweis: Wir definieren eine Intervallschachtelung ([xn , yn ] : n ∈ N) wie
folgt. Sei x0 ∈ A, und sei y0 so, dass y < y0 für alle y ∈ A gilt. Nehmen
wir an, xn und yn seien definiert, wobei gilt: es gibt ein y ∈ A mit xn ≤ y
und y < yn für alle y ∈ A. Sei z = 21 · (xn + yn ). Wir setzen xn+1 = xn und
yn+1 = z falls y < z für alle y ∈ A, und wir setzen xn+1 = z und yn+1 = yn ,
falls es ein y ∈ A mit z ≤ y gibt.
Sei x = limn→∞ xn . Es lässt sich dann leicht nachrechnen, dass x wie
gewünscht ist.
Das Intervallschachtelungsprinzip kann in sehr einfacher Weise benutzt werden, um die Überabzählbarkeit von R zu zeigen.
Satz 2.2.17 (Cantor) Es gibt keine Surjektion
f : N → R.
Beweis: Sei f : N → R. Wir definieren eine Intervallschachtelung ([xn , yn ] :
n ∈ N) wie folgt. Sei x0 = 0 < 1 = y0 . Angenommen xn und yn seien bereits
konstruiert. Falls f (n) 6∈ [xn , yn ], dann setzen wir xn+1 = xn und yn+1 = yn .
Falls f (n) ∈ [xn , yn ], dann sei ε = 13 ·(yn −xn ). Mindestens eine der Intervalle
[xn , xn + ε], [xn + ε, xn + 2 · ε], [xn + 2 · ε, yn ] enthält dann f (n) nicht. Sei
k ∈ {0, 1, 2} minimal, so dass f (n) 6∈ [xn + k · ε, xn + (k + 1) · ε]. Wir setzen
dann xn+1 = xn + k · ε und yn+1 = xn + (k + 1) · ε.
Dies definiert eine Intervallschachtelung ([xn , yn ] T
: n ∈ N) so, dass für
jedes n ∈ N gilt: f (n) 6∈ [xn+1 , yn+1 ]. Wenn also x ∈ n∈N [xn , yn ], dann ist
x 6∈ {f (n) : n ∈ N}, und f kann nicht surjektiv sein.
2.3
Die Theorie der reellen Zahlen
Wir wollen nun, ähnlich wie dies in Abschnitt 1.2 für die natürlichen Zahlen
geschehen ist, ein Axiomensystem für die reellen Zahlen angeben. Im Unterschied zur Peano–Arithmetik von Abschnitt 1.2 werden wir die Axiome
für R jedoch unter Zuhilfenahme einfacher mengentheoretischer Prinzipien
aus der Gültigkeit von PA für N beweisen können, da die reellen Zahlen mit
Hilfe einfacher mengentheoretischer Operationen aus den natürlichen Zahlen
konstruiert worden sind.
Zunächst sind die reellen Zahlen ein Körper, d.h. es gelten die nachfolgenden Axiome:
2.3. DIE THEORIE DER REELLEN ZAHLEN
35
(1) ∀x∀yx + y = y + x
(2) ∀x∀yx · y = y · x
(3) ∀x∀y∀z(x + y) + z = x + (y + z)
(4) ∀x∀y∀z(x · y) · z = x · (y · z)
(5) ∀x∀y∀zx · (y + z) = (x · y) + (x · z)
(6) ∀xx + 0 = x
(7) ∀xx · 1 = x
(8) ∀x∃yx + y = 0
(9) ∀x(x 6= 0 → ∃yx · y = 1)
Hierbei besagen die Axiome (1), (3), (6) und (8), dass R bezüglich + eine
abelsche Gruppe mit 0 als neutralem Element ist, und die Axiome (2), (4),
(7) und (9) besagen, dass R \ {0} bezüglich · eine abelsche Gruppe mit 1 als
neutralem Element ist. Die Axiome (1) und (2) sind die Kommutativ- und
die Axiome (3) und (4) die Assoziativgesetze. Axiom (5) ist das Distributivitätsgesetz. Darüber hinaus ist R sogar ein geordneter Körper, d.h. es gelten
weiterhin die nachfolgenden Axiome:
(10) ∀x∀y(x < y ∨ x = y ∨ y < x)
(11) ∀x∀y(x < y ∨ x = y → ¬y < x)
(12) ∀x∀y(x < y ∨ y < x → x 6= y)
(13) ∀x∀y(x = y ∨ y < x → ¬x < y)
(14) ∀x∀y∀z(x < y ∧ y < z → x < z)
(15) ∀x∀y∀z(x < y → x + z < y + z)
(16) ∀x∀y∀z(x < y ∧ 0 < z → x · z < y · z)
Die Axiome (10) – (13) drücken aus, dass für reelle Zahlen x, y genau eine
der drei Aussagen x < y, x = y, y < x zutrifft (Trichotomie). Axiom (14)
drückt die Transitivität von < aus, und die Axiome (15) und (16) sind die
Monotoniegesetze.
36
KAPITEL 2. REELLE ZAHLEN
Wir bezeichnen das Axiomensystem, das durch die obigen Axiome (1)
– (16) gegeben ist, mit GK (für “geordnete Körper”). Die Sprache, in der
GK formuliert ist, hat neben den allgemeinen logischen Symbolen (siehe Abschnitt 1.2) und Variablen x, y, z, . . . für reelle Zahlen die folgenden Symbole:
0 als Konstante für die Null
1 als Konstante für die Eins
+ als zweistelliges Funktionssymbol für die Addition
· als zweistelliges Funktionssymbol für die Multiplikation
< als zweistelliges Relationssymbol für die Kleiner-Relation
Man überzeugt sich leicht, dass es mehrere (zueinander nicht isomorphe)
Strukturen (d.h. geordnete Körper ) gibt, die die Axiome (1) – (16) erfüllen.
Beispielsweise ist neben R auch Q ein geordneter Körper.
√ Weiterhin ist jeder Zwischenkörper K mit Q ⊂ K ⊂ R (etwa K = Q[ 2]) ein geordneter
Körper. Um die reellen Zahlen genauer zu charakterisieren, benötigen wir
also (ein) weitere(s) Axiom(e). Wir müssen nämlich ausdrücken, dass die reellen Zahlen das Supremumsprinzip 2.2.16 erfüllen. Dabei geraten wir wieder
in dieselbe Situation wie anlässlich der Formulierung des Induktionsaxioms
in Abschnitt 1.2: entweder wir reichern die obige Sprache durch Hinzunahme
von Variablen für Mengen reeller Zahlen und des Symbols ∈ an und formulieren mit dieser Hilfe das Supremumsprinzip als ein Axiom, wobei wir dann
aber wieder zusätzliche Mengenexistenzaxiome benötigen, oder wir formulieren das Supremumsprinzip als Schema.
Im ersten Fall können wir wie folgt verfahren. Das Supremumsprinzip
wird als folgende Aussage genommen.
(17) ∀X(X 6= ∅ ∧ ∃x∀y(y ∈ X → y < x) →
∃x (∀y(y ∈ X → y < x)∧
∀z(∀y(y ∈ X → y < x) → z < x ∨ z = x))).
√
Beispielsweise benötigen wir, um die Existenz von 2 zu zeigen, das Supremumsprinzip (17) für
X = {y ∈ R : y · y < 2}.
Allgemeiner scheinen wir lediglich die folgenden Fälle des Supremumsprinzips zu benötigen.
2.3. DIE THEORIE DER REELLEN ZAHLEN
37
Sei ϕ(y, x1 , . . . , xn ) eine Formel der Sprache von GK, in der die Variablen
y, x1 , ..., xn vorkommen. Dann ist das zu ϕ(y, x1 , . . . , xn ) gehörige Supremumsprinzip die Aussage
(17)ϕ
∀x1 . . . ∀xn (∃yϕ(y, x1 , . . . , xn ) ∧ ∃x∀y(ϕ(y, x1 , . . . , xn ) → y < x) →
∃x
(∀y(ϕ(y, x1 , . . . , xn ) → y < x)∧
∀z(∀y(ϕ(y, x1 , . . . , xn ) → y < x) → z < x ∨ z = x))).
Wir bezeichnen das durch GK und alle (17)ϕ gegebene Axiomensystem mit
VGK (für “vollständige geordnete Körper”). Wir werden später diskutieren,
ob VGK die reellen Zahlen (“bis auf Isomorphie”) festlegen kann.
38
KAPITEL 2. REELLE ZAHLEN
Kapitel 3
Mengen
3.1
Mengen, Klassen und Grothendieck–Universen
Wir haben oben, insbesondere anlässlich der Konstruktion der reellen Zahlen
aus den natürlichen Zahlen, die Nützlichkeit mengentheoretischer Konstruktionen sehen können. Es stellt sich nun heraus, dass sämtliche Objekte bzw.
Strukturen der Mathematik mengentheoretisch konstruiert werden können.
Einigen Aspekten hiervon wollen wir in diesem Abschnitt nachgehen.
Einer der grundlegenden Begriffe der Mathematik ist der der Funktion.
Eine Funktion f von A nach B weist jedem Element a von A genau ein
Element f (a) von B zu. Wir können Funktionen als Mengen von geordneten Paaren mit bestimmten Eigenschaften ansehen. Wir müssen uns dann
zunächst mit dem Begriff des geordneten Paares beschäftigen. Zu gegebenen
Objekten x und y wollen wir das “geordnete Paar” (x, y) so konstruieren,
dass für alle x, y, x′ , y ′ gilt:
(*) (x, y) = (x′ , y ′ ) ⇔ x = x′ und y = y ′ .
Wir könnten das geordnete Paar als vordefinierten Grundbegriff einführen,
von dem wir die Eigenschaft (*) verlangen (so verfährt etwa Bourbaki). Wir
können das geordnete Paar aber auch mengentheoretisch definieren. Hierzu
gibt es mehrere Möglichkeiten, von denen wir die folgende wählen.
Definition 3.1.1 Seien x, y beliebige Objekte. Das geordnete Paar von x
und y ist dann die Menge (x, y), die als {{x}, {x, y}} definiert ist.
Wir beweisen nun (*).
39
40
KAPITEL 3. MENGEN
Lemma 3.1.2 Seien x, y, x′ , y ′ beliebige Objekte. Dann gilt (x, y) = (x′ , y ′ ) ⇔
x = x′ ∧ y = y ′ .
Beweis: Die Gültigkeit von “⇐” ist trivial. Wir zeigen nun “⇒”. Sei also
(x, y) = (x′ , y ′ ) vorausgesetzt. Wir müssen zeigen, dass x = x′ und y = y ′ .
Zunächst bemerken wir Folgendes. Im Falle x = y gilt (x, y) = {{x}, {x, y}} =
{{x}}, (x, y) besitzt also ein Element, nämlich {x}. Im Falle x 6= y dagegen
besitzt (x, y) = {{x}, {x, y}} zwei verschiedene Elemente, nämlich {x} und
{x, y} (wäre {x} = {x, y} dann hätten wir y ∈ {x}, also y = x). Analoges
gilt natürlich auch für (x′ , y ′ ). Dies zeigt, dass aus (x, y) = (x′ , y ′ ) folgt, dass
entweder sowohl x = y als auch x′ = y ′ gilt oder dass sowohl x 6= y als auch
x′ 6= y ′ gilt.
1. Fall. x = y und x′ = y ′ .
Dann gilt {{x}} = (x, y) = (x′ , y ′ ) = {{x′ }}. Daraus folgt x = x′ , also
auch y ′ = x′ = x = y.
2. Fall. x 6= y und x′ 6= y ′ .
Dann besitzt (x, y) die zwei verschiedenen Elemente {x} und {x, y},
und (x′ , y ′ ) besitzt die zwei verschiedenen Elemente {x′ } und {x′ , y ′ }.
Da (x, y) = (x′ , y ′ ), gilt zunächst {x} ∈ (x′ , y ′ ) = {{x′ }, {x′ , y ′ }}, also {x} = {x′ } oder {x} = {x′ , y ′ }. Letzteres ist aber unmöglich, da
{x} einelementig und (wegen x′ 6= y ′ ) {x′ , y ′ } zweielementig ist. Also gilt {x} = {x′ }, woraus x = x′ folgt. Sodann gilt wegen (x, y) =
(x′ , y ′ ) auch {x, y} ∈ (x′ , y ′ ) = {{x′ }, {x′ , y ′ }}, also {x, y} = {x′ } oder
{x, y} = {x′ , y ′ }. Ersteres ist wieder unmöglich, da {x, y} (wegen x 6=
y) zweielementig und {x′ } einelementig ist. Also gilt {x, y} = {x′ , y ′ }.
Insbesondere gilt y = y ′ oder y = x′ . Letzteres ergibt aber wegen x = x′
(wie bereits gezeigt wurde), dass y = x, was x 6= y widerspricht. Also
gilt y = y ′ . Wir haben damit x = x′ und y = y ′ gezeigt.
Mit Hilfe des Begriffs des geordneten Paares können wir nun sehr leicht den
Begriff der Funktion einführen.
Definition 3.1.3 Seien A, B beliebige Mengen. Das Kreuzprodukt, A × B,
von A und B ist dann die Menge aller geordneten Paare (a, b), wobei a ∈ A
und b ∈ B gilt. Jede Teilmenge R von A × B wird als Relation auf A, B bezeichnet. Eine Funktion von A nach B ist dann eine Relation R auf A, B, so
dass für jedes a ∈ A genau ein b ∈ B mit (a, b) ∈ R existiert. Üblicherweise
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
41
benutzen wir die Buchstaben f, g, . . . , F, . . . , ϕ, . . . für Funktionen. Wenn f
eine Funktion von A nach B ist, so heißt A der Urbildbereich von f und B
der Wertebereich von f und wir schreiben f : A → B.
Selbstverständlich haben wir oben bereits mit Funktionen gearbeitet, wir
wissen nun aber, wie wir diese als mengentheoretische Objekte konstruieren
können.
Mit Hilfe mengentheoretischer Operationen können wir leicht sehr große
Objekte konstruieren. Satz 2.2.17 hatte bereits gezeigt, dass es “mehr” reelle als natürliche Zahlen gibt. Ähnlich kann man zeigen, dass es zu jeder
beliebigen Menge A eine Menge B gibt, die “größer” ist als A.
Definition 3.1.4 Sei A eine beliebige Menge. Die Potenzmenge von A,
P(A), ist die Menge aller Teilmengen von A.
Satz 3.1.5 (Cantor). Es gibt keine Surjektion
f : A → P(A).
Beweis: Sei f : A → P(A) gegeben. Sei
X0 = {a ∈ A : a ∈
/ f (a)} ⊂ A.
Angenommen, es gibt ein a0 ∈ A mit f (a0 ) = X0 . Dann gilt a0 ∈ f (a0 ) = X0
gdw. a0 ∈
/ f (a0 ). Widerspruch!
Also existiert kein a ∈ A mit f (a) = X0 und f ist nicht surjektiv.
Es gibt also keine “größte” Menge, da es auf Grund dieses Satzes von Cantor
zu jeder Menge A eine “größere” Menge (nämlich P(A)) gibt. Insbesondere
gibt es keine Menge aller Mengen. Angenommen, es gäbe eine Menge V ,
in der jede Menge als Element enthalten ist. Dann gilt P(V ) ⊂ V , da jedes
Element von P(V ), d.h. jede Teilmenge von V , selbst Menge und damit in V
als Element enthalten ist. Damit existiert aber offensichtlich eine Surjektion
f von V auf P(V ), indem wir etwa f (a) = a für a ⊂ V und f (a) = ∅ ⊂ V
für a 6⊂ V setzen. Dies widerspricht Satz 3.1.5.
Es gibt weitere Argumente, die zeigen, dass es keine Menge V aller Mengen gibt. Ein solches ist etwa die “Russellsche Antinomie”. Nehmen wir
nochmals an, es gäbe eine Menge V , in der jede Menge als Element enthalten ist. Dann gäbe es auch die Menge
R = {a ∈ V : a ∈
/ a}
42
KAPITEL 3. MENGEN
aller Mengen, die sich nicht selbst als Element enthalten. Wir haben dann
aber R ∈ R gdw. R ∈
/ R. Widerspruch!
Die mengentheoretischen Argumente, die wir in diesem und den letzten
Abschnitten vollzogen haben, waren durchweg “naiv”, d.h. sie wurden nicht
auf der Basis eines Axiomensystems vorgenommen. Auch die Mengenlehre
hat eine Axiomatisierung erfahren, und all unsere Argumente könnten auf
der Basis dieser Axiomatisierung nachvollzogen werden. Wir wollen uns hier
darauf beschränken, die Standardaxiomatisierung der Mengenlehre mit einigen erläuternden Kommentaren anzugeben. Wir werden diese Axiomatisierung jedoch nicht benutzen, sondern auch in Zukunft weiter mengentheoretisch naiv argumentieren. Allerdings wollen wir zeigen, dass das angegebene
Axiomensystem ein Modell besitzt, wenn daraus das Unendlichkeitsaxiom
entfernt wird.
Das Standard–Axiomensystem der Mengenlehre ist das Zermelo–Fraenkelsche System, ZFC. Die Sprache L∈ der Mengenlehre besitzt weder Konstanten noch Funktionssymbole und als einiges Relationssymbol das zweistellige
∈ für “ist Element von”. ZFC besitzt die folgenden Axiome.
Das erste Axiom, das Extensionalitätsaxiom, besagt, dass zwei Mengen
gleich sind gdw. sie dieselben Elemente besitzen.
(Ext) ∀x∀y(x = y ↔ ∀z(z ∈ x ↔ z ∈ y)).
Das nächste Axiom, das Fundierungsaxiom, besagt, dass jede nichtleere Menge ein ∈–minimales Element besitzt.
(F und) ∀x(∃y y ∈ x → ∃y(y ∈ x ∧ ¬∃z(z ∈ y ∧ z ∈ x))).
Mit Hilfe von Abkürzungen schreibt sich dies besser. Wir schreiben x = ∅
für ¬∃y y ∈ x, x 6= ∅ für ¬x = ∅, x ∩ y = ∅ für ¬∃z(z ∈ x ∧ z ∈ y). Dann liest
sich (F und) wie folgt:
(F und) ∀x(x 6= ∅ → ∃y ∈ x y ∩ x = ∅).
Wir schreiben x = {y, z} für
y ∈ x ∧ z ∈ x ∧ ∀u ∈ x(u = y ∨ u = z).
Das Paarmengenaxiom lautet
(P aar) ∀x∀y∃z z = {x, y}.
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
Wir schreiben x =
S
43
y für
∀z(z ∈ x ↔ ∃u ∈ y z ∈ u).
Das Vereinigungsaxiom lautet
S
(V er) ∀x∃y y = x.
Wir schreiben x ⊂ y für ∀z ∈ x z ∈ y und x = P(y) für ∀z(z ∈ x ↔ z ⊂ y).
Das Potenzmengenaxiom besagt
(P ot) ∀x∃y y = P(x).
Die Aussonderungsaxiome werden benötigt, um die Existenz definierbarer
Teilmengen von einer gegebenen Menge zu zeigen.
Sei ϕ eine L∈ –Formel, in der (o.B.d.A.) die Variablen x, v1 , . . . , vp vorkommen. Das zu ϕ gehörige Aussonderungsaxiom lautet:
(Ausϕ ) ∀v1 . . . ∀vp ∀a∃b∀x(x ∈ b ↔ x ∈ a ∧ ϕ).
Die (unendliche!) Menge aller Aussonderungsaxiome wird auch als Aussonderungsschema bezeichnet. Sei ϕ eine L∈ –Formel, in der (o.B.d.A.) die Variablen x, y, v1 , . . . , vp vorkommen. Das zu ϕ gehörige Ersetzungsaxiom lautet1
(Ersϕ ) ∀v1 . . . ∀vp (∀x ∈ a∃y ′ ∀y(y = y ′ ↔ ϕ) → ∃b∀y(y ∈ b ↔ ∃x ∈ a ϕ)).
Die (wiederum unendliche!) Menge aller Ersetzungsaxiome wird auch als
Ersetzungsschema bezeichnet.
Aus dem Aussonderungsschema folgt die Existenz der leeren Menge, indem ϕ als x 6= x gewählt wird. Mit Hilfe des Paarmengen– und des Vereinigungsmengenaxioms zeigt sich dann leicht die Existenz der Mengen
∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}},
usw. Das Auswahlaxiom lautet
(AC) ∀x(x 6= ∅ ∧ ∀y ∈ x∀y ′ ∈ x(y ∩ y ′ 6= ∅ ↔ y = y ′ ) → (∃z∀y ∈ x∃uz ∩ y =
{u}).
AC besagt also, dass jede nichtleere Menge, die aus paarweise disjunkten
Mengen besteht, eine “Auswahlmenge” besitzt. Wir bezeichnen die Menge
der Aussagen Ext, F und, P aar, V er, P ot, Ausϕ , Ersϕ (für beliebige ϕ)
1
o.B.d.A. komme y ′ in ϕ gar nicht vor.
44
KAPITEL 3. MENGEN
und AC als ZFC−∞ . Hierbei steht ZF für “Zermelo-Fraenkel”, C für “choice”
(Auswahl) und “−∞” für die Abwesenheit des Unendlichkeitsaxioms. Letzterem wollen wir uns nun zuwenden. S
Wir schreiben x = y ∪ z für x = {y, z}. Wir schreiben y = x + 1 für
y = x ∪ {x}.
Definition 3.1.6 Eine Menge A heißt induktiv gdw. ∅ ∈ A und für jedes
x ∈ A auch x ∪ {x} ∈ A gilt.
Das Unendlichkeitsaxiom besagt:
(∞) ∃x (x ist induktiv).
Das System ZF C (Zermelo–Fraenkel, mit Auswahlaxiom) entsteht aus ZF C −∞
durch Hinzunahme des Unendlichkeitsaxioms.
Wir wollen nun die natürlichen Zahlen benutzen, um ein “Modell” der
Mengenlehre, genauer: von ZF C −∞ , zu konstruieren. Wir fassen natürliche
Zahlen wie folgt als “Mengen” auf. Sei n ∈ N. Schreibe n in Dualdarstellung,
d.h. n = Σmi ·2i , wobei mi ∈ {0, 1} für alle i. Wir fassen dann n als die Menge
aller i auf, so dass mi = 1. Anders gesagt: wir definieren eine zweistellige
Relation E ⊂ N × N auf N wie folgt. Seien k, n ∈ N. Dann gelte kEn gdw.
mk = 1, wobei n = Σmi · 2i die Dualdarstellung von n ist.
Wenn M 6= ∅ und R ⊂ M × M , so ist (M ; R) ein Modell von L∈ , indem
wir für x, y ∈ M die Aussage x ∈ y für wahr im Modell (M ; R) erklären
gdw. xRy. Ein derartiges Modell von L∈ kann natürlich ein “Nichtstandard”Modell sein insofern die Wahrheit von x ∈ y in dem Modell nichts mit der
Wahrheit, ob tatsächlich x ein Element von y ist, zu tun haben muss.
Insbesondere ist jedenfalls nun (N; E) Modell von L∈ . Der folgende Satz
besagt, dass jede Aussage von ZFC−∞ wahr im Modell (N; E) ist. Für “atomare” Aussagen der Gestalt x ∈ y haben wir bereits erklärt, was es bedeutet,
dass diese wahr in einem Modell (M ; R) ist. Für kompliziertere Aussagen erklären wir dies rekursiv:
¬ ϕ ist wahr in (M ; R) gdw. ϕ nicht wahr in (M ; R) ist.
ϕ ∧ ψ ist wahr in (M ; R) gdw. sowohl ϕ als auch ψ wahr in (M ; R)
sind.
ϕ ∨ ψ ist wahr in (M ; R) gdw. ϕ oder ψ wahr in (M ; R) ist.
ϕ → ψ ist wahr in (M ; R) gdw. ϕ nicht wahr in (M ; R) ist oder wenn
ψ wahr in (M ; R) ist.
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
45
ϕ ↔ ψ ist wahr in (M ; R) gdw. gilt: ϕ ist wahr in (M ; R) gdw. ψ wahr
in (M ; R) ist.
∃vϕ(v) ist wahr in (M ; R) gdw. es ein x ∈ M gibt, so dass ϕ(x) wahr
in (M ; R) ist.
∀vϕ(v) ist wahr in (M ; R) gdw. für alle x ∈ M gilt, dass ϕ(x) wahr in
(M ; R) ist.
Satz 3.1.7 (N; E) ist Modell von ZFC−∞ .
Beweis: Offensichtlich gilt (N; E) |= (Ext).
Seien k, n ∈ N. Dann folgt aus (N; E) |= k ∈ n, dass k < n : dies
folgt einfach daraus, dass 2k > k für alle k ∈ N. Sei also n ∈ N so, dass
(N; E) |= n 6= ∅ (d.h. n 6= 0!). Sei k < n das kleinste k′ mit (N; E) |= k′ ∈ n.
Dann gilt (N; E) |= k ∩ n = ∅. Wir haben (N; E) |= (F und) gezeigt.
(N; E) |= (P aar) zeigt sich wie folgt. Seien n, m ∈ N. Sei
q=
2n + 2m , falls n 6= m
2n
, falls n = m.
Dann gilt offensichtlich (N; E) |= q = {n, m}.
Wir zeigen (N; E) |= (V er) folgendermaßen. Sei n ∈ N. Sei n = Σmi · 2i
die Dualdarstellung von n, und sei, für mi = 1, i = Σmik · 2k die Dualdarstellung von i. Wir setzen dann
m=
X
2k .
mik = 1
für ein i
mit mi = 1
S
Offensichtlich gilt (N; E) |= m = n.
(N; E) |= (P ot) zeigt man mit Hilfe derselben Methode, die auch (N; E) |=
V er zeigte. Sei n ∈ N. Sei n = Σmi · 2i die Dualdarstellung von n. Für ein
m ∈ N mit Dualdarstellung Σm′i · 2i gilt offenbar (N; E) |= m ⊂ n gdw. für
alle i, m′i = 1 ⇒ mi = 1. Sei also I die (endliche!) Menge aller i mit mi = 1
und sei P die Menge aller Teilmengen von I. Für I ∗ ∈ P sei
nI ∗ = Σi∈I ∗ 2i .
46
KAPITEL 3. MENGEN
(Offensichtlich ist I ∗ 7→ nI ∗ injektiv.) Schließlich sei
m=
X
2nI ∗ .
I ∗ ⊂I
Es ist leicht zu sehen, dass (N; E) |= m = P(n).
Wir zeigen (N; E) |= (Ausϕ ) für ein beliebiges ϕ wie folgt. Seien n1 , . . . ,
np , a ∈ N, wobei
X
a=
mi · 2i .
Setze dann
X
b=
2i .
mi = 1
ϕ(i, n1 , . . . , np )ist wahr in (N; E)
Wir zeigen (N; E) |= (Ersϕ ) für ein beliebiges ϕ wie folgt. Sei ϕ wie
im zu ϕ gehörigen Ersetzungsaxiom gegeben. Seien n1 , . . . , np ∈ N und sei
a ∈ N. Wir setzen voraus, dass
(N; E) |= ∀x ∈ a∀y∀y ′ (ϕ(x, y, n1 , . . . , np ) ∧ ϕ(x, y ′ , n1 , . . . , np ) → y = y ′ ).
Sei (N; E) |= k ∈ a, d.h. für die Dualdarstellung a = Σmi · 2i von a gilt
mk = 1. Sei l(k) das eindeutige derartige l mit
(N; E) |= ϕ(k, l, n1 , . . . , np ).
Setze dann
b=
X
2l(k) .
(N; E) |= k ∈ a
Es ist leicht zu sehen, dass
(N; E) |= ∀y(y ∈ b ↔ ∃x ∈ aϕ).
Wir zeigen (N; E) |= (AC) wie folgt.
Sei n ∈ N. Sei (N; E) |= n 6= ∅, d.h. für die Dualdarstellung n = Σmi · 2i
von n gilt, dass ein i mit mi = 1 existiert. Für jedes i mit mi = 1 sei
i = Σmik · 2k die Dualdarstellung von i. Unter der Voraussetzung
(N; E) |= ∀y ∈ n∀y ′ ∈ n(y ∩ y ′ 6= ∅ ↔ y = y ′ )
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
47
gilt dann, dass aus i 6= j mit mi = 1 = mj folgt: mik 6= mjk für alle k.
Außerdem ist für alle i mit mi = 1 eines der mik gleich 1. Sei für mi = 1 k(i)
das kleinste k mit mik = 1. Es ist dann leicht zu sehen, dass
X
2k(i)
mi =1
bezeugt, dass im Sinne von (N; E) n das Auswahlaxiom erfüllt.
Sei (N; E) |= m = n + 1, d.h. (N; E) |= m = n ∪ {n}. Dann gilt insbesondere (N; E) |= n ∈ m, also ist n < 2n ≤ m. Damit kann (N; E) nicht das
Unendlichkeitsaxiom erfüllen.
Wir wollen nun umgekehrt nachvollziehen, dass auf der Basis von ZFC
Objekte geformt werden können, deren Gesamtheit beweisbar (in ZFC) ein
Modell von PA ist. Mit anderen Worten: So wie sich mit Hilfe mengentheoretischer Methoden aus den natürlichen Zahlen die ganzen, rationalen und
reellen Zahlen produzieren ließen, so können mit denselben mengentheoretischen Methoden auch die natürlichen Zahlen selbst in einer Weise produziert
werden, dass die grundlegenden Aussagen über sie beweisbar werden.
Die heute übliche Art und Weise, natürliche Zahlen als Mengen darzustellen, geht auf von Neumann zurück. Die grundlegende Idee ist sehr einfach.
Für jedes n ∈ N gibt es genau n natürliche Zahlen, die kleiner als n sind,
nämlich 0, 1, . . . , n−1. Die Idee ist nun, die natürliche Zahl n mit der Menge
{0, 1, . . . , n − 1} zu identifizieren. Damit erhält man

0 = ∅,



1 = {∅},
(∗)
2 = {∅, {∅}},



3 = {∅, {∅}, {∅, {∅}}}, usw.
Mit dieser Idee gilt offenbar m < n gdw. m ∈ n für beliebige m, n ∈ N.
Allgemein ausgedrückt wollen wir 0 mit ∅ und n+1 mit n∪{n} identifizieren.
(Diese Identifikationsvorschrift ist rekursiv: wenn wir n kennen, dann kennen
wir auch n + 1 = n ∪ {n}.)
Wir wollen nun eine Menge und auf ihr eine Ordnungsrelation und Operationen präzise so definieren, dass wir für dieses “Modell” die Gültigkeit
von PA beweisen können. Die Menge sollte aus genau den Mengen der Gestalt (*) bestehen. Hierzu ist es nützlich, den Begriff der “induktiven Menge”
von Definition 3.1.6 zur Verfügung zu haben. Das Unendlichkeitsaxiom von
ZFC besagt, dass es eine induktive Menge gibt. Wir schreiben im Folgenden
48
KAPITEL 3. MENGEN
wieder x + 1 für x ∪ {x}, für beliebige Mengen x, und nennen x + 1 den
Nachfolger von x. Eine Menge A ist dann induktiv gdw. ∅ ∈ A und A unter
der Nachfolgeroperation x 7→ x + 1 abgeschlossen ist.
Definition 3.1.8 Die Menge ω der von–Neumann–Zahlen ist definiert als
der Durchschnitt aller induktiven Mengen, d.h.
x ∈ ω ⇔ ∀A(A induktiv ⇒ x ∈ A).
Lemma 3.1.9 ω ist induktiv.
Beweis: Da ∅ in jeder induktiven Menge als Element enthalten ist, liegt ∅
auch in ω. Sei nun x ∈ ω. Sei A eine induktive Menge. Dann gilt also x ∈ A,
und damit auch x + 1 ∈ A. Also ist x + 1 in jeder induktiven Menge und es
gilt x + 1 ∈ ω. Wir haben gezeigt, dass ω induktiv ist.
Eine direkte Folge von Definition 3.1.8 ist:
Lemma 3.1.10 Sei A ⊂ ω induktiv. Dann gilt A = ω.
Dies hat zur Konsequenz, dass für ω das (zweitstufige) Induktionsaxiom
(und damit auch das erststufige Induktionsschema) gilt. Die Menge ω wurde
gerade so definiert, dass für sie dieses Axiom zutrifft!
Es bleibt zu zeigen, dass auch die übrigen Aussagen von PA für ω gelten.
Hierzu müssen wir natürlich jeweils zuerst erklären, wie wir <, +, · und die
Exponentiation interpretieren wollen.
(Q1) ist offensichtlich: Für jedes x ist x+ 1 = x∪ {x} =
6 ∅, da x ∈ x∪ {x}.
Wir zeigen nun (Q2). Hierzu ist zu zeigen, dass für von–Neumann–Zahlen x
und y aus x + 1 = x ∪ {x} = y ∪ {y} = y + 1 folgt, dass x = y. Angenommen,
es gilt x ∪ {x} = y ∪ {y}, aber x 6= y. Dann gilt zunächst x ∈ y ∪ {y},
also sogar x ∈ y (da x ∈
/ {y}), und ebenso gilt y ∈ x ∪ {x}, also sogar
y ∈ x (da y ∈
/ {x}). Dies widerspricht aber dem Fundierungsaxiom F und.
Betrachten wir nämlich die Menge {x, y}, so gilt sowohl y ∈ x ∩ {x, y} als
auch x ∈ y ∩ {x, y}, so dass {x, y} kein ∈–minimales Element besitzt. Dieser
Widerspruch zeigt, dass aus x + 1 = y + 1 bereits x = y folgen muss.
Die Aussagen (Q3) – (Q8) sind einfach zu zeigen, wenn wir die Interpretation von +, · und der Exponentiation für von–Neumman–Zahlen so festlegen,
wie dies durch (Q3) – (Q8) verlangt wird.
Für von–Neumann–Zahlen x und y wollen wir x < y durch x ∈ y interpretieren (siehe oben).
Wir zeigen jetzt (Q9). Sei zunächst x < y + 1, d.h. x ∈ y ∪ {y}. Dann
gilt offenbar x ∈ y, d.h. x < y, oder x ∈ {y}, d.h. x = y. Umgekehrt folgt
3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN
49
aus x < y oder x = y ebenso leicht x < y + 1. Die Gültigkeit von (Q10) ist
klar, da x ∈
/ ∅ für alle x.
Um schließlich (Q11) zu beweisen, müssen wir das folgende Lemma zeigen.
Lemma 3.1.11 Seien x, y von–Neumann–Zahlen. Dann gilt x ∈ y oder x =
y oder y ∈ x.
Beweis: Der Beweis erfolgt durch doppelte Induktion. Wir zeigen, dass
A = {x ∈ ω : ∀y ∈ ω(x ∈ y ∨ x = y ∨ y ∈ x)}
induktiv ist.
Behauptung 1: ∅ ∈ A.
Hierzu ist zu zeigen, dass
B = {y ∈ ω : ∅ ∈ y ∨ ∅ = y ∨ y ∈ ∅}
induktiv ist. Dies lässt sich aber sehr leicht nachrechnen.
Behauptung 2: Aus x ∈ A folgt x + 1 ∈ A.
Sei x ∈ A. Wir zeigen dann, dass
C = {y ∈ ω : x + 1 ∈ y ∨ x + 1 = y ∨ y ∈ x + 1}
induktiv ist.
Da B aus Behauptung 1 induktiv ist, gilt zunächst ∅ ∈ z + 1 für alle
z ∈ ω. Damit haben wir zunächst ∅ ∈ C.
Sei nun y ∈ C. Dann gilt
(1) x + 1 ∈ y oder x + 1 = y oder y ∈ x + 1.
Wegen x ∈ A gilt außerdem
(2) x ∈ y + 1 oder x = y + 1 oder y + 1 ∈ x.
Aus x + 1 ∈ y oder x + 1 = y folgt x + 1 ∈ y + 1 = y ∪ {y}, und ebenso
folgt aus x = y + 1 oder y + 1 ∈ x, dass y + 1 ∈ x + 1 = x ∪ {x}. Wenn
also weder x + 1 ∈ y + 1 noch y + 1 ∈ x + 1 gilt, dann haben wir wegen (1)
y ∈ x + 1 = x ∪ {x} und wegen (2) x ∈ y + 1 = y ∪ {y}. Falls dann zusätzlich
x + 1 6= y + 1 (d.h. x 6= y!) gilt, dann haben wir sogar y ∈ x und x ∈ y. Dies
widerspricht wie oben dem Fundierungsaxiom F und.
50
KAPITEL 3. MENGEN
Wir haben gezeigt, dass y + 1 ∈ C. Dies beweist die Behauptung 2 und
damit das Lemma.
Wir bezeichneten das Axiomensystem, das durch die obigen Axiome gegeben
ist, mit ZFC. Die Sprache, in der ZFC formuliert ist, hat neben den allgemeinen logischen Symbolen (siehe Abschnitt 1.2) und Variablen x, y, z, . . . für
Mengen ein zweistelliges Prädikatssymbol ∈ für “ist Element von”. Ähnlich
wie im Falle von PA oder VGK hätten wir auch ZFC so formulieren können,
dass neben Variablen für Mengen auch Variablen für beliebige Kollektionen
von Mengen, die üblicherweise Klassen genannt werden, zugelassen werden.
Dies hätte zu vereinfachten Formulierungen des Aussonderungsschemas und
des Ersetzungsschemas geführt. Allerdings wären dann wie im Falle von PA
und VGK Klassenexistenzaxiome erforderlich, damit die neuen Formulierungen von Aussonderung und Ersetzung zur Wirkung kommen.
Wir reden hier mit Bedacht von “Klassen” und nicht von “Mengen”.
Beliebige Gesamtheiten natürlicher Zahlen sind Mengen (so hatten wir diese auch in Abschnitt 1.2 angesprochen) und beliebige Gesamtheiten reeller
Zahlen sind ebenfalls Mengen (und so hatten wir diese in Abschnitt 2.3 angesprochen). Wir haben aber oben gesehen, dass nicht jede Gesamtheit von
Mengen wieder eine Menge sein kann, da z.B. die Gesamtheit aller Mengen keine Menge ist. Beliebige derartige Gesamtheiten (oder Kollektionen)
werden oben als “Klassen” bezeichnet. Es gibt Klassen, wie etwa die Klasse
aller Mengen, die selbst keine Mengen sind; derartige Klassen heißen echte
Klassen.
Ein anderes Beispiel für eine echte Klasse ist die Klasse aller Gruppen.
Wäre die Klasse aller Gruppen eine Menge, so gäbe es auch die Menge aller
Gruppen mit einem Element, und daraus könnte man dann sehr leicht die
Menge aller Mengen formen. (Wir verwenden hier, dass wir für eine beliebige
Menge x trivial {x} als Gruppe G auffassen können, indem wir x als das
neutrale und einzige Element von G auffassen.)
In vielen Überlegungen hätte man aber gerne etwa die “Menge” aller
Gruppen (oder aller Körper, aller Vektorräume, aller topologischen Räume,
. . . ) zur Verfügung. Derartige Mengen, die tatsächlich Mengen sind und
gleichzeitig Substitute für die Klasse aller Mengen eines bestimmten Typs,
erhält man, indem man die Existenz von Grothendieck–Universen fordert.
Ein Grothendieck–Universum ist eine Menge U , die unter den Operationen von ZFC (also Paarmengen–, Vereinigungsmengen–, Potenzmengenbildung und Aussonderung und Ersetzung) abgeschlossen ist und gleichzeitig
die Menge N der natürlichen Zahlen als Element enthält.
3.2. DAS AUSWAHLAXIOM
51
Definition 3.1.12 Sei U eine nichtleere Menge. Dann heißt U ein Grothendieck–Universum gdw. folgende Aussagen gelten.
(1) Aus x ∈ U folgt x ⊂ U ,
(2) aus x ∈ U folgt P(x) ∈ U ,
(3) aus x, y ∈ U folgt {x, y} ∈ U ,
S
(4) aus x ∈ U folgt x ∈ U ,
(5) aus I ∈ U und {xi : i ∈ I} ⊂ U folgt {xi : i ∈ I} ∈ U , und
(6) ω ∈ U .
Man kann beweisen, dass die Existenz eines Grothendieck–Universums nicht
in ZFC gezeigt werden kann. Aus einem gegebenen Grothendieck–Universum
U lässt sich aber z.B. die Menge aller Gruppen aus U aussondern, die für viele
Zwecke ein hilfreicher Ersatz für die (nichtexistente) Menge aller Gruppen
ist.
3.2
Das Auswahlaxiom
Sei M eine beliebige Menge. Eine Auswahlfunktion für M ist eine Funktion
f mit Urbildbereich M , so dass für alle x ∈ M gilt f (x) ∈ x. Wenn ∅ ∈ M ,
dann kann es offenbar keine Auswahlfunktion f für M geben, da f (∅) ∈ ∅
gelten müsste.
Definition 3.2.1 Das Auswahlaxiom besagt, dass es zu jedem M 6= ∅ mit
∅∈
/ M ein f gibt, so dass f Auswahlfunktion für M ist.
Diese Formulierung unterscheidet sich von der in Abschnitt 3.1 gegebenen
Formulierung von AC. Lemma 3.2.2 besagt jedoch, dass diese beiden Formulierungen äquivalent sind.
Wir betrachten in diesem Abschnitt (weitere) Äquivalenzen zum und
Folgerungen aus dem Auswahlaxiom.
Lemma 3.2.2 Das Auswahlaxiom ist äquivalent zur folgenden Aussage.
(*) Sei N eine beliebige Menge mit N 6= ∅ und ∅ 6∈ N , so dass x ∩ y = ∅
für x, y ∈ N, x 6= y gilt (d.h. je zwei verschiedene Elemente von N sind
disjunkt zueinander). Dann gibt es eine Menge A, die aus Elementen von
Elementen von N besteht, so dass für jedes x ∈ N genau ein y ∈ A mit
y ∈ x existiert.
52
KAPITEL 3. MENGEN
Beweis: Sei zunächst M 6= ∅ mit ∅ ∈
/ M gegeben. Mit Hilfe von (*) konstruieren wir eine Auswahlfunktion für M . Hierzu definieren wir eine Menge
N wie folgt: N besteht aus allen Mengen der Gestalt
{(x, z) : z ∈ x},
wobei x ∈ M . Sei dann A wie in (*). Dann gibt es für jedes x ∈ M genau
ein z, so dass (x, z) ∈ A (und damit auch z ∈ x) ist. Mit anderen Worten:
A ist eine Funktion mit Urbildbereich M und A(x) ∈ x für alle x ∈ M .
Sei nun das Auswahlaxiom als gültig vorausgesetzt, und sei N wie in (*)
gegeben. Sei f eine Auswahlfunktion für N . Dann erkennt man unschwer,
dass der Wertebereich von f die Gültigkeit von (*) für N bezeugt.
Wir wollen nun den Satz von Zermelo zeigen, wonach das Auswahlaxiom den
Wohlordnungssatz impliziert. Wohlordnungen sind Verallgemeinerungen der
natürlichen Ordnung auf N.
Definition 3.2.3 Sei M eine Menge. Eine Wohlordnung auf M ist eine
strikte Ordnung < auf M , so dass jedes nichtleere A ⊂ M ein <–kleinstes
Element besitzt, d.h. es gibt ein z ∈ A, so dass für alle y ∈ A: wenn y 6= x
dann x < y.
Definition 3.2.4 Sei M eine Menge und sei < eine Wohlordnung auf M .
Dann heißt A ein Anfangsstück von M bzgl. < gdw. für jedes x ∈ A und
jedes y < x auch y ∈ A ist.
Lemma 3.2.5 Sei < eine Wohlordnung auf M und sei A ein Anfangsstück
von M (bzgl. <). Dann gilt entweder A = M oder es gibt ein x ∈ M , so dass
A = {y ∈ M : y < x}.
Beweis: Wenn A 6= M , dann sei x das <–kleinste Element von M \ A. Man
sieht dann leicht, dass dann A = {y ∈ M : y < x}.
Lemma 3.2.6 Sei < eine Wohlordnung auf M . Es gibt dann keine Folge
(xn : n ∈ N) von Elementen xn von M , so dass xn+1 < xn für alle x ∈ N.
Beweis: Angenommen, es gibt eine Folge (xn : n ∈ N) mit xn+1 < xn für
alle n ∈ N. Betrachte A = {xn : n ∈ N} ⊂ M . Da < eine Wohlordnung ist,
gibt es ein x ∈ A, so dass x < y für alle y ∈ A mit y 6= x. Es ist aber x = xn
für ein n ∈ N und xn+1 < xn , wobei xn+1 ∈ A. Widerspruch!
3.2. DAS AUSWAHLAXIOM
53
Mit Hilfe des Auswahlaxioms lässt sich zeigen, dass eine strikte Ordnung <
auf einer Menge M genau dann eine Wohlordnung ist, wenn es keine Folge
(xn : n ∈ N) von Elementen von M mit xn+1 < xn für alle n ∈ N gibt.
Lemma 3.2.7 Sei < eine Wohlordnung auf einer Menge M . Dann gibt es
kein Anfangsstück A 6= M von M , so dass ein Ordnungsisomorphismus
ϕ : (M, <) ∼
= (A, <↾ A)
existiert.
Beweis: Andernfalls gibt es ein x ∈ M mit A = {y ∈ M : y < x}, so dass
für alle y ≥ x gilt: ϕ(y) < y. Sei y0 <–minimal in {y ∈ M : ϕ(y) < y}. Dann
gilt, da ϕ ordnungstreu ist, auch
ϕ(ϕ(y0 )) < ϕ(y0 ).
Aber ϕ(y0 ) < y0 , und wir haben einen Widerspruch zur Wahl von y0 .
Lemma 3.2.8 Sei < eine Wohlordnung auf M , und sei <∗ eine Wohlordnung auf N . Dann gilt genau eine der folgenden drei Aussagen:
(1) Es gibt einen Ordnungsisomorphismus ϕ : (M, <) ∼
= (N, <∗ ).
(2) Es gibt ein Anfangsstück A $ M von M und einen Ordnungsisomorphismus ϕ : (A, <↾ A) ∼
= (N, <∗ ).
(3) Es gibt ein Anfangsstück B $ N von N und einen Ordnungsisomorphismus ϕ : (M, <) ∼
= (B, <∗↾ B).
Beweis: Wir zeigen zunächst die folgende
Behauptung: Seien A, A′ Anfangsstücke von M , seien B, B ′ Anfangsstücke
von N , und seien ϕ : (A, <↾ A) ∼
= (B, <∗↾ B), ϕ′ : (A′ , <↾ A′ ) ∼
= (B ′ , <∗↾ B ′ )
′
Ordnungsisomorphismen. Dann sind ϕ und ϕ “verträglich”, d.h. für jedes
x ∈ A ∩ A′ gilt ϕ(x) = ϕ′ (x).
Beweis der Behauptung: Angenommen, es gibt ein x ∈ A∩A′ mit ϕ(x) 6=
ϕ′ (x). Sei x0 <–minimal in A ∩ A′ mit ϕ(x0 ) 6= ϕ′ (x0 ). Da sowohl ϕ als
auch ϕ′ Ordnungsisomorphismen sind, muss aber ϕ(x0 ) das <∗ –minimale
Element von N \ {ϕ(y) : y < x0 } sein, und ϕ′ (x0 ) muss das <∗ –minimale
Element von N \ {ϕ′ (y) : y < x0 } sein. Auf Grund der Wahl von x0 gilt
54
KAPITEL 3. MENGEN
aber {ϕ(y) : y < x0 } = {ϕ′ (y) : y < x0 }, und damit gilt ϕ(x0 ) = ϕ′ (x0 ).
Widerspruch!
Wir beweisen nun Lemma 3.2.8. Wir betrachten hierzu die Vereinigung
aller ϕ, für die es Anfangsstücke A von M und B von N gibt, so dass
ϕ : (A, <↾ A) ∼
= (B, <∗↾ B) ein Ordnungsisomorphismus ist. Wegen obiger
Behauptung sind je zwei derartige ϕ verträglich, und man erkennt unschwer,
dass diese Vereinigung selbst wiederum eine Abbildung ϕ̃ ist, für die es Anfangsstücke à von M und B̃ von N gibt, so dass ϕ̃ : (Ã, <↾ Ã) ∼
= (B̃, <↾ B̃)
ein Ordnungsisomorphismus ist.
Es muss aber à = M oder B̃ = N gelten. Andernfalls sei nämlich x0 <–
minimal in M \ Ã und y0 <∗ –minimal in N \ B̃. Dann ist auch ϕ̃ ∪ {(x0 , y0 )}
ein Ordnungsisomorphismus von à ∪ {x0 } auf B̃ ∪ {y0 }, wobei à ∪ {x0 }
Anfangsstück von M und B̃∪{y0 } Anfangsstück von N ist. Dies widerspräche
aber der Definition von ϕ̃.
Satz 3.2.9 (Zermelo) Unter Voraussetzung des Auswahlaxioms gibt es für
jede Menge M eine Wohlordnung < auf M .
Beweis: Wir betrachten zunächst die Menge P der nichtleeren Teilmengen
von M , d.h.
P = {A ⊂ M : A 6= ∅}.
Mit Hilfe des Auswahlaxioms finden wir eine Auswahlfunktion für P , d.h.
eine Funktion f : P → M , so dass f (A) ∈ A für alle A ∈ P .
Sei nun A ⊂ M und < eine Wohlordnung auf A. Dann heißt (A, <)
verträglich mit f gdw. für alle x ∈ A gilt:
x = f (M \ {y ∈ A : y < x}).
Seien A, B ∈ P und seien (A, <), (B, <∗ ) verträglich mit f . Dann gibt
es nach Lemma 3.2.8 zunächst einen Ordnungsisomorphismus ϕ : (A, <↾
A) ∼
= (B, <∗ ), wobei A Anfangsstück von A ist, oder einen Ordnungsisomorphismus ϕ : (A, <) ∼
= (B, <∗ ↾ B), wobei B Anfangsstück von B ist.
Angenommen, ersteres ist der Fall. Wäre ϕ nicht die Identität, dann gibt es
ein (<↾ A)–kleinstes Element x0 von A mit ϕ(x0 ) 6= x0 . Es gilt dann aber
x0 = f (M \ {y ∈ A : y < x0 })
= f (M \ {y ∈ B : y <∗ ϕ(x0 )}) = ϕ(x0 ).
Widerspruch! Also ist A = B und <↾ A =<∗ . Genauso argumentiert man im
zweiten Fall und bekommt B = A und <∗↾ B =<.
3.2. DAS AUSWAHLAXIOM
55
Wir erhalten damit, dass die Vereinigung aller <, wobei < Wohlordnung
auf einem A ⊂ M ist und (A, <) verträglich mit f ist, selbst eine Wohlordnung auf einem A0 ⊂ M ist. Es ist aber klar, dass nun A0 = M gelten muss.
Umgekehrt ist folgende Aussage sehr einfach zu zeigen:
Satz 3.2.10 Angenommen, zu jeder Menge A existiert eine Wohlordnung
auf A. Dann gilt das Auswahlaxiom.
Beweis: Sei M 6= ∅ mit ∅ ∈
/ M gegeben. Wir betrachten
A=
[
M = {x : ∃y(y ∈ M ∧ x ∈ y)}.
Sei < eine Wohlordnung auf A. Wir können dann sehr leicht eine Auswahlfunktion f für M wie folgt definieren: Für x ∈ M sei f (x) das <–minimale
Element von x ⊂ A.
Es gibt eine ganze Reihe weiterer und wichtiger Äquivalenzen zum Auswahlaxiom. (An dieser Stelle sollte betont werden, dass sich diese Äquivalenzen in
einer Theorie zeigen lassen, die keine der als äquivalent auszuweisenden Aussagen impliziert.) Prominent ist etwa das Zornsche Lemma, das allerdings oft
(meistens?) in der Form des “Hausdorffschen Maximalitätsprinzips” benutzt
wird.
Definition 3.2.11 Das Haussdorfsche Maximalitätsprinzip ist die folgende
Aussage. Sei F eine beliebige Menge, und sei F eine Menge von Teilmengen
von F . Angenommen, es gilt Folgendes: für S
alle F ⊂ F, so dass X ⊂ Y
oder Y ⊂ X für beliebige X, Y ∈ F, ist auch F = {a ∈ F : a ∈ X für ein
X ∈ F} Element von F. Dann existiert ein Xmax ∈ F, so dass keine echte
Obermenge von Xmax ebenfalls ein Element von F ist.
Satz 3.2.12 Das Hausdorffsche Maximalitätsprinzip ist äquivalent zum Auswahlaxiom.
Beweis: Zunächst ergibt sich aus dem Hausdorffschen Maximalitätsprinzip sehr leicht das Auswahlaxiom. Sei M 6= ∅ mit ∅ ∈
/ M gegeben. Sei F
die Menge aller Auswahlfunktionen für Teilmengen von M . Es ist unschwer
erkennbar, dass F dann die Voraussetzung des Hausdorffschen Maximalitätsprinzips erfüllt. Jedes Xmax ∈ F, für das keine echte Obermenge von Xmax ,
56
KAPITEL 3. MENGEN
die ebenfalls Element von F ist, existiert, ist dann eine Auswahlfunktion für
M selbst.
Umgekehrt folgt aber aus dem Auswahlaxiom das Hausdorffschen Maximalitätsprinzip. Seien hierzu F und F wie im Hausdorffschen Maximalitätsprinzip gegeben.
Ein F ⊂ F, so dass X ⊂ Y oder Y ⊂ X für alle X, Y ∈ F, heißt Kette in
F. Sei < eine Wohlordnung von F. Eine Kette F ⊂ F heißt dann verträglich
mit < gdw. für alle X ∈ F Folgendes gilt: X ist das <–minimale Y , so dass
Z < Y für alle Z $ Y mit Z ∈ F gilt.
Seien F 0 und F 1 zwei Ketten, die beide verträglich mit < sind. Angenommen, es gibt ein X ∈ F 0 , das nicht in F 1 liegt, oder es gibt ein X ∈ F 1
das nicht in F 0 liegt. Sei X <–minimal mit dieser Eigenschaft. Sei etwa
X ∈ F 0 \ F 1 . Dann ist X das <–minimale Y , so dass Z < Y für alle Z $ Y
mit Z ∈ F 0 gilt. Es gilt
{Z : Z $ X ∧ Z ∈ F 0 } = {Z : Z $ X ∧ Z ∈ F 1 }.
Wenn also F 1 \{Z : Z $ X ∧Z ∈ F 1 } =
6 ∅, dann gilt, da F 1 mit < verträglich
ist, dass X ∈ F 1 im Widerspruch zur Wahl von X.
Dies zeigt, dass die Vereinigung aller Ketten, die mit < verträglich sind,
selbst wiederum eine Kette ist (die mit < verträglich ist). Diese Kette, nennen wir sie F max , muss dann aber offensichtlich ein Xmax enthalten, so dass
keine echte Obermenge von Xmax ebenfalls Element von F max (und damit
von F) ist.
Mit Hilfe des Hausdorffschen Maximalitätsprinzips lässt sich sehr einfach
z.B. zeigen:
Satz 3.2.13 Jeder Vektorraum besitzt eine Basis.
Beweis: Sei V ein beliebiger Vektorraum. Sei F die Menge aller linear unabhängigen Teilmengen von V . F erfüllt die Voraussetzung des Hausdorffschen Maximalitätsprinzips. Sei Xmax ∈ F “maximal”. Wäre dann Xmax
keine Basis von V , dann existiert ein v ∈ V , so dass Xmax ∪ {v} linear unabhängig ist im Widerspruch zur Maximalität von Xmax .
Eine weitere äußerst nützliche Aussage, zu deren Beweis das Auswahlaxiom
benötigt wird, lautet:
Lemma 3.2.14 Sei B eine abzählbare
Menge, so dass jedes a ∈ B ebenfalls
S
abzählbar ist. Dann ist auch B = {x : x ∈ a für ein a ∈ B} abzählbar.
3.3. DIE TOPOLOGIE VON R
57
Beweis: Sei f : N → B eine Bijektion, und sei N die Menge aller
{(n, g) : g : N → f (n) ist bijektiv},
wobei n ∈ N. Sei A wie in (∗) von Lemma 3.2.2. Dann ist A eine Funktion
mit Urbildbereich N, die jedem nS∈ N eine Bijektion von N auf f (n) zuordnet. Dann ist aber G : N × N → B surjektiv, wobei wir für n, m ∈ N den
Wert G(n, m) als A(n)(m)
dann γ : N → N × N bijektiv
S definieren. Wenn S
ist, dann ist G◦γ : N → B surjektiv, so dass B in der Tat abzählbar ist.
3.3
Die Topologie von R
In der Topologie werden topologische Räume betrachtet.
Definition 3.3.1 Ein Paar (X, O) (oder auch einfach die Menge X) heißt
ein topologischer Raum gdw. X 6= ∅, O eine Menge von Teilmengen von S,
den so genannten offenen Mengen, ist, und wenn gilt: (0) X ∈ O, (1) Beliebige Vereinigungen offener Mengen sind wieder offen, und (2) der Durchschnitt zweier offener Mengen ist wieder offen.
Die Standardtopologie von R ergibt sich wie folgt. Eine Menge A ⊂ R reeller
Zahlen wird als offen bezeichnet gdw. A als Vereinigung offener Intervalle
(d.h. von Mengen der Form (x, y) mit x < y) geschrieben werden kann.
(Dabei ist die “leere” Vereinigung zugelassen, so dass auch ∅ eine offene
Menge ist.)
Da der Durchschnitt zweier offener Intervalle entweder leer oder wieder
ein offenes Intervall ist, sieht man leicht, dass damit in der Tat R zu einem
topologischen Raum wird.
Wenn (X, O) ein topologischer Raum ist, dann heißt B ⊂ O Basis gdw.
jedes Element von O (d.h. jede offene Menge) als Vereinigung von Elementen
von B geschrieben werden kann.
Offensichtlich ist damit die Menge aller offenen Intervalle Basis des topologischen Raums R. Allerdings ist eine nützliche Beobachtung, dass R in
der Tat eine abzählbare Basis besitzt.
Lemma 3.3.2 Die Menge aller offenen Intervalle (x, y) mit x < y und
x, y ∈ Q ist eine Basis des topologischen Raums R.
58
KAPITEL 3. MENGEN
Beweis: Sei A ⊂ R eine offene Menge. Dann
gibt es eine Menge D, bestehend
S
aus offenen Intervallen, so dass A = D. Sei D ′ die Menge aller offenen
Intervalle (x′ , y ′ ) mit x′ < y ′ und x′ , y ′ ∈ Q, so dass ein Intervall (x, y) ∈ D
existiert mit x ≤ x′ < y ′ ≤ y. Da Q dicht in R ist, gibt es zu jedem (x, y) ∈ D
′
′
und zu jedem z ∈ (x, y) (d.h. x <Sz < y)Srationale Zahlen
S x′ und y mit
′
′
′
x < x < z < y < y. Daraus folgt D = D, also A = D . Die Menge
aller offenen Intervalle mit rationalen Endpunkten ist also tatsächlich eine
Basis des topologischen Raums R.
Sei (x, y) ein offenes Intervall, wobei x < y. Dann lässt sich sehr leicht eine
Bijektion ϕx,y : (−1, 1) → (x, y) angeben: es sei etwa ϕx,y (z) = x+ z+1
2 (y −x)
für z ∈ (−1, 1). Darüber hinaus existiert eine Bijektion f : R → (−1, 1), etwa
1
1
für x > 0, f (x) = x−1
für x < 0, und f (0) = 0.
die folgende: es sei f (x) = x+1
(Diese Abbildung ist nicht stetig; ähnlich einfach lässt sich auch eine stetige
derartige Bijektion definieren.) Die Komposition
ϕx,y ◦ f : R → (x, y)
ist dann ebenfalls eine Bijektion.
Diese Überlegung zeigt folgende. Wenn A ⊂ R offen ist mit A 6= ∅, dann
existiert eine Injektion g : R → A: Sei etwa (x, y) ⊂ A, dann kann man
einfach g = ϕx,y ◦ f wählen. Andererseits gibt es trivialerweise eine Injektion
h : A → R, nämlich z.B. die Identität. Somit gibt es aufgrund des Satzes
1.1.4 von Schröder-Bernstein für jedes nichtleere offene A ⊂ R eine Bijektion
j : R → A. Diese Aussage ist falsch für kompliziertere Mengen reeller Zahlen.
Komplemente offene Mengen in topologischen Räumen heißen abgeschlossen.
Lemma 3.3.3 Sei A ⊂ R. Dann sind folgende Aussagen äquivalent.
(1) A ist abgeschlossen.
(2) Sei (xn : n ∈ N) eine Cauchy–Folge, wobei xn ∈ A für jedes n ∈ N.
Dann gilt limn→∞ xn ∈ A.
Beweis: (1) ⇒ (2). Sei A abgeschlossen und sei (xn : n ∈ N) eine Cauchy–
Folge, so dass xn ∈ A für jedes n ∈ N. Da A abgeschlossen ist, ist R \A offen.
Angenommen, x = limn→∞ xn 6∈ A, d.h. x ∈ R \ A. Da R \ A Vereinigung
offener Intervalle ist, gibt es dann ein offenes Intervall (y, z) mit x ∈ (y, z) ⊂
R \ A. Sei ε das Minimum von |x − y| und |z − x|. Da limn→∞ xn = x,
3.3. DIE TOPOLOGIE VON R
59
existiert ein n ∈ N mit |x − xn | < ε, also xn ∈ (x − ε, x + ε) ⊂ (y, z) ⊂ R \ A.
Widerspruch!
(2) ⇒ (1): Sei (2) angenommen. Wir zeigen, dass R \ A offen ist. Hierzu
genügt es zu zeigen, dass es zu jedem x ∈ R \ A ein offenes Intervall (y, z)
mit x ∈ (y, z) ⊂ R \ A gibt. Sei also x ∈ R \ A. Wir betrachten die offenen
1
1
, x + n+1
) für n ∈ N. Wenn es kein n ∈ N mit
Intervalle In = (x − n+1
In ⊂ R \ A gibt, dann enthält jedes In ein Element von A, etwa xn ∈ In ∩ A.
Man erkennt unschwer, dass (xn : n ∈ N) dann eine Cauchy–Folge ist mit
x = limn→∞ xn . Wegen (2) wäre dann aber x ∈ A. Widerspruch!
Beispielsweise sind also alle endlichen Mengen abgeschlossen. Für jedes A ⊂
R wird die Menge Ā ⊃ A aller x ∈ R, für die eine Cauchy–Folge (xn : n ∈ N)
mit xn ∈ A für alle n ∈ N und limn→∞ xn = x existiert, als der Abschluss
von A bezeichnet. Es ist nicht schwer zu sehen, dass Ā immer abgeschlossen
ist. Eine Menge A ⊂ R ist abgeschlossen gdw. Ā ⊂ A (gdw. Ā = A).
Da Q dicht in R ist, ist der Abschluss von Q gleich R. Es gibt allerdings
abzählbare Mengen, deren Abschluss wieder abzählbar ist, z.B. N = N′ oder
1
1
: n ∈ N} mit B ′ = {0} ∪ { n+1
: n ∈ N}.
B = { n+1
Sei A ⊂ R. Eine reelle Zahl x heißt Häufungspunkt von A gdw. für jedes
ε > 0 die Menge
A ∩ (x − ε, x + ε)
mindestens ein Element besitzt, welches verschieden von x ist.
Wenn x Häufungspunkt von A ist, dann besitzt für jedes ε > 0 die Menge
A ∩ (x − ε, x + ε) sogar unendlich viele Elemente. Darüber hinaus gibt es
in diesem Falle eine Cauchy–Folge (xn : n ∈ N) mit xn ∈ A \ {x} für alle
n ∈ N und x = limn→∞ xn . Damit liegt jeder Häufungspunkt von A im
Abschluss Ā von A. Umgekehrt ist nicht notwendigerweise jedes x ∈ Ā ein
Häufungspunkt von A. Beispielsweise gilt für jedes x ∈ R, dass {x} = {x},
aber {x} besitzt keinen Häufungspunkt.
Eine abgeschlosse nichtleere Menge A ⊂ R heißt perfekt gdw. jedes x ∈ A
auch Häufungspunkt von A ist.
Satz 3.3.4 Sei A ⊂ R perfekt. Dann gibt eine Bijektion f : R → A.
Beweis: Sei E die Menge aller endlichen 0-1-Folgen. Für s ∈ E und h ∈
{0, 1} schreiben wir s⌢ h für die Folge, die aus s entsteht, indem hinten h
angehängt wird.
Wir konstruieren zunächst eine Abbildung Φ wie folgt. Dabei wird E der
Urbildbereich von Φ sein, und für jedes s ∈ E wird Φ(s) ein abgeschlossenes
60
KAPITEL 3. MENGEN
Intervall [as , bs ] sein mit der Eigenschaft, dass as < bs und [as , bs ] ∩ A 6= ∅.
Die Konstruktion von Φ ist rekursiv nach der Länge von s.
Seien a, b reelle Zahlen mit a < b, so dass [a, b]∩A nichtleer ist. Bezeichne
hi die “leere Folge”. Wir definieren dann ϕ(hi) = [a, b].
Sei nun s ∈ E, und sei ϕ(s) bereits definiert. Sei etwa Φ(s) = [as , bs ],
wobei as < bs . Wir nehmen an, dass [as , bs ] ∩ A nichtleer ist.
Da A perfekt ist, ist jeder Punkt von A auch Häufungspunkt von A und
wir können leicht
as < as⌢ 0 < bs⌢ 0 < as⌢ 1 < bs⌢ 1 < bs
finden, so dass gilt:
[as⌢ 0 , bs⌢ 0 ] ∩ A 6= ∅, [as⌢ 1 , bs⌢ 1 ] ∩ A 6= ∅,
1
1
, und bs⌢ 1 − as⌢ 1 ≤
.
n+1
n+1
Wir setzen dann Φ(s⌢ h) = [as⌢ h , bs⌢ h ] für h = 0, 1.
Bezeichne nun E ∗ die Menge aller unendlichen 0-1-Folgen. Wir können
jetzt eine Injektion F : E ∗ → A wie folgt definieren. Sei f ∈ E ∗ . Dann gilt
\
[af↾{0,... ,n} , bf↾{0,... ,n} ] = {x}
bs⌢ 0 − as⌢ 0 ≤
n∈N
für ein x ∈ R. Wir setzen F (f ) = x. Es gilt F (f ) ∈ A, da F (f ) offensichtlich
Häufungspunkt von A ist und A abgeschlossen ist. Nach Konstruktion ist F
sicherlich injektiv.
Nach Übungsaufgabe ????? gibt es nun eine Bijektion g : R → E ∗ . Damit
ist
F ◦ g: R → A
injektiv. Da die Identität auf A eine injektive Abbildung von A nach R ⊃ A
ist, existiert damit aufgrund des Satzes 1.1.4 von Schröder-Bernstein eine
Bijektion von R auf A.
Satz 3.3.5 (Cantor–Bendixson) Sei A ⊂ R abgeschlossen. Dann ist entweder A endlich oder abzählbar oder es gibt eine Bijektion f : R → A.
Beweis: Sei A ⊂ R abgeschlossen. Ein x ∈ R heißt Kondensationspunkt von
A gdw. für jedes ε > 0 die Menge
A ∩ (x − ε, x + ε)
3.3. DIE TOPOLOGIE VON R
61
überabzählbar ist. Wir bezeichnen mit P die Menge aller Kondensationspunkte von A. Da offensichtlich jeder Kondensationspunkt von A auch Häufungspunkt von A ist und da A abgeschlossen ist, gilt P ⊂ Ā = A.
Wir betrachten nun zwei Fälle.
1. Fall: P = ∅.
Dann gibt es zu jedem y ∈ A ein ε > 0, so dass die Menge A∩(x−ε, x+ε)
höchstens abzählbar ist; es gibt dann aber auch rationale Zahlen y, z mit
x − ε < y < x < z < x + ε, so dass auch A ∩ (y, z) höchstens abzählbar
ist. Es gibt nun abzählbar viele Intervalle (y, z) mit y, z ∈ Q, und für jedes
x ∈ A existiert ein Intervall (y, z) mit y, z ∈ Q und x ∈ A ∩ (y, z), so
dass A ∩ (y, z) höchstens abzählbar ist. Damit lässt sich A als höchstens
abzählbare Vereinigung höchstens abzählbarer Mengen darstellen und ist
selbst höchstens abzählbar.
2. Fall: P 6= ∅.
In diesem Falle zeigen wir, dass P perfekt ist. Dann existiert nach Satz
3.3.4 eine Bijektion f : R → P , also mit Hilfe von Satz 1.1.4 auch eine
Bijektion von R auf A ⊃ P .
Zuerst gilt P 6= ∅ nach Fallannahme.
Wir zeigen zunächst, dass P abgeschlossen ist. Sei (xn : n ∈ N) eine
Cauchy-Folge, wobei jedes xn ein Kondensationspunkt von A ist. Sei x =
limn→∞ xn . Wir müssen zeigen, dass x Kondensationspunkt von A ist. Sei
x ∈ [y, z] mit y < z. Dann existiert ein n ∈ N mit xn ∈ [y, z]. Sei ε > 0
so, dass [xn − ε, xn + ε] ⊂ [y, z]. Da xn Kondensationspunkt von A ist, ist
[xn − ε, xn + ε] ∩ A überabzählbar. Also ist auch [y, z] ∩ A überabzählbar.
Wir zeigen schließlich, dass jeder Punkt von P Häufungspunkt von P
ist. Sei also x ∈ P . Angenommen, x wäre nicht Häufungspunkt von P . Dann
existiert ein ε > 0, so dass [x − ε, x + ε] ∩ P kein Element besitzt, das verschieden von x ist. Zu jedem y ∈ ([x − ε, x + ε] ∩ A) \ {x} existieren dann
rationale ay und by mit ay < y < by , so dass [ay , by ] ∩ A höchstens abzählbar
ist. Damit lässt sich [x − ε, x + ε] ∩ A als höchstens abzählbare Vereinigung
höchstens abzählbarer Mengen darstellen und ist selbst höchstens abzählbar.
Dies ist ein Widerspruch, da x Kondensationspunkt von A ist.
62
KAPITEL 3. MENGEN
Kapitel 4
Modelle
Ziel dieses Kapitels ist es, eine Methode zur Konstruktion von Modellen von
Theorien wie PA, VGK oder ZFC zu entwickeln; sie wird uns vor allem erlauben, Nichtstandard-Modelle zu erzeugen. Diese Methode ist sehr allgemein
und hat nichts mit PA, VGK oder ZFC im besonderen zu tun. Wir beginnen
daher mit einer allgemeinen Einführung der abstrakten Logik erster Stufe,
für die die Sprachen von PA etc. Beispiele geliefert hatten.
4.1
Logik erster Stufe
Die Logik erster Stufe ist die Logik, die wir in der Mathematik benutzen.
Allerdings ist es nicht ganz richtig, von der Logik erster Stufe im Singular zu sprechen, da wir mit verschiedenen Mengen von Prädikatsymbolen,
Konstanten und Funktionssymbolen arbeiten können.
Seien I, K, J (womöglich leere, womöglich unendlich große) paarweise
disjunkte Indexmengen, und sei n : I ∪ J → N; wir schreiben ni für n(i),
wobei i ∈ I ∪ J. Die zu I, K, J, n gehörige Sprache der Logik erster Stufe
besitzt die folgenden Symbole:
Klammern: ( und )
Junktoren: ¬ und ∧
Allquantor: ∀
Variablen: v0 , v1 , v2 , . . .
Gleichheitszeichen: =
Prädikatsymbole: für jedes i ∈ I ein ni –stelliges Prädikatsymbol Pi
Konstanten: für jedes k ∈ K eine Konstante ck
Funktionssymbole: für jedes j ∈ J einen nj –stelligen Funktor fj .
63
64
KAPITEL 4. MODELLE
In dieser Liste könnte man die Junktoren ∨, → und ↔ sowie den Existenzquantor ∃ vermissen. Wir werden diese später durch Schreibkonventionen
einführen.
Ein Beispiel für eine solche Sprache ist die Sprache der Gruppentheorie:
diese enthält ein zweistelliges Funktionssymbol für die Addition (bzw. Multiplikation) und eine Konstante für das neutrale Element. Die Sprache der
Körpertheorie enthält zwei zweistellige Funktionssymbole für die Addition
und die Multiplikation und zwei Konstanten für die 0 und die 1. Die Sprache
von PA enthält ein zweistelliges Prädikatsymbol <, zwei Konstanten 0 und
1 für die Null und die Eins, zwei zweistellige Funktionssymbole +,· für die
Addition und die Multiplikation und ein weiteres unsichtbares zweistelliges
Funktionssymbol für die Exponentiation. Die Sprache von ZFC schließlich
hat lediglich das zweistellige Prädikatsymbol ∈.
Sei L eine Sprache der Logik erster Stufe. Ein L–Ausdruck ist eine endliche Folge von Symbolen von L. Wir wollen nun die Begriffe “L–Term”
und “L–Formel” definieren. Dies geschieht rekursiv. Sei L durch I, K, J, n
gegeben.
Ein L–Term ist ein L–Ausdruck, der in jeder Menge M von L–Ausdrücken
liegt mit:
(a) jede Konstante und jede Variable liegt in M , und
(b) für j ∈ J und τ0 , . . . τnj −1 ∈ M ist auch fj τ0 . . . τnj −1 ∈ M .
Beispielsweise sind die folgenden Ausdrücke Terme von PA:
· + 10v3 , + · 1v17 0.
Wir werden natürlich weiterhin im praktischen Leben (1 + 0) · v3 für · + 10v3
und (1 · v17 ) + 0 für + · 1v17 0 schreiben.
Eine atomare L–Formel ist jeder Ausdruck der Form P τ0 . . . τn−1 , wobei
P ein n–stelliges Prädikatsymbol ist und τ0 , . . . , τn−1 L–Terme sind, oder
ein Ausdruck der Form τ0 = τ1 , wobei τ0 , τ1 L–Terme sind.
Schließlich ist eine L–Formel ein Ausdruck, der in jeder Menge M von
Ausdrücken liegt mit:
(1) jede atomare L–Formel ist in M ,
(2) wenn ϕ und ψ in M sind, dann auch ¬ϕ und (ϕ ∧ ψ),
(3) wenn ϕ in M ist und n ∈ N, dann ist auch ∀vn ϕ in M .
65
4.1. LOGIK ERSTER STUFE
Beispiele für Formeln der Sprache der Mengenlehre sind etwa ∈ v3 v0 oder
∀v3 ∈ v3 v0 . Wir werden natürlich v3 ∈ v0 anstelle von ∈ v3 v0 und entsprechend ∀v3 v3 ∈ v0 anstelle von ∀v3 ∈ v3 v0 schreiben. v3 ∈ v0 ist eine atomare
Formel der Sprache der Mengenlehre.
Wir vereinbaren einige Schreibkonventionen, um Formeln besser lesen zu
können. So schreiben wir:
(ϕ ∨ ψ)
(ϕ → ψ)
(ϕ ↔ ψ)
∃vn ϕ
τ = τ′
τ 6= τ ′
für
für
für
für
für
für
¬(¬ϕ ∧ ¬ψ),
(¬ϕ ∨ ψ),
((ϕ → ψ) ∧ (ψ → ϕ)),
¬∀vn ¬ϕ,
= τ τ ′ , und
¬τ = τ ′ ,
wobei ϕ, ψ Formeln und τ, τ ′ Terme sind. Diese abkürzenden Schreibweisen
sind, wie man sich leicht überlegt, inhaltlich sinnvoll.
Mit diesen Konventionen ist nun also auch ∀v0 ∃v1 v0 ∈ v1 eine Formel der
Sprache der Mengenlehre, bei der es sich in nicht abgekürzter Schreibweise
um die Formel
∀v0 ¬∀v1 ¬ ∈ v0 v1
handelt. Als weitere Schreibkonvention lassen wir von nun an die äußeren
Klammern weg, schreiben also z.B. ϕ → ψ anstelle von (ϕ → ψ).
Wir wollen nun definieren, wann eine Formelmenge Σ eine Formel ϕ impliziert. Wieder arbeiten wir mit Belegungen, diesmal aber von Variablen mit
Elementen eines Modells; dies entspricht der Einsetzung solcher Elemente für
freie Variablen in Formeln.
Wir fixieren nun I, K, J, n, wodurch eine Sprache L gegeben ist. Anstelle
von L–Termen und (atomaren) L–Formeln sprechen wir nun auch einfach
von Termen und Formeln.
Wir definieren zunächst den Begriff der “freien Variablen”.
Sei n ∈ N. Wir definieren “vn kommt frei in der Formel ϕ vor”. Wenn ϕ
atomar ist, dann kommt vn frei in ϕ vor gdw. vn überhaupt in ϕ vorkommt.
vn kommt frei in ¬ϕ vor gdw. vn frei in ϕ vorkommt. vn kommt frei in ϕ ∧ ψ
vor gdw. vn frei in ϕ oder frei in ψ vorkommt. Schließlich kommt vn frei in
∀vm ϕ vor gdw. m 6= n und vn frei in ϕ vorkommt.
Ein L–Satz ist eine L–Formel, in der keine freien Variablen vorkommen.
Beispielsweise ist ∀v1 ¬v1 ∈ v0 eine Formel der Sprache der Mengenlehre
(aber kein Satz) und ∃v0 ∀v1 ¬v1 ∈ v0 ein Satz der Sprache der Mengenlehre.
66
KAPITEL 4. MODELLE
Wir wollen jetzt den Sätzen der Sprache L Bedeutung verleihen. Oft hat
eine Sprache einen “intendierten Objektbereich” im Auge. Mit der Sprache
der elementaren Zahlentheorie wollen wir über die Struktur der natürlichen
Zahlen sprechen, mit der Sprache der Mengenlehre über die Struktur des
Universums aller Mengen.
Ebenso oft gibt es aber auch keinen intendierten Objektbereich: die Sprache der Gruppentheorie hat nicht eine feste Gruppe im Auge, sondern “beliebige Gruppen”.
Allgemein bekommen Sätze Bedeutung, indem wir ein Modell von L
betrachten. Der Begriff des “Modells” war naiv bereits in 3.1 benutzt worden.
Ein Modell von L ist eine Struktur der Form
M = (M ; (Ri : i ∈ I), (ak : k ∈ K), (Fj : j ∈ J)),
wobei M eine nichtleere Menge ist (das Universum, oder die Trägermenge
von M), jedes Ri eine ni –stellige Relation auf M ist (d.h. Ri ⊂ M ni ), jedes
ak ein Element von M ist und jedes Fj eine nj –stellige Funktion auf M ist
(d.h. Fj : M nj → M ).
Ein solches Modell interpretiert L in offensichtlicher Weise: das Prädikatsymbol Pi wird durch die Relation Ri interpretiert (in Zeichen: PiM = Ri ),
die Konstante ck wird durch ak interpretiert (in Zeichen: cM
k = ak ), und das
Funktionssymbol fj wird durch die Funktion Fj interpretiert (in Zeichen:
fjM = Fj ).
Wir wollen nun sagen, was es heißt, dass ein gegebener Satz im Modell
M gilt. Hierzu gehen wir einen kleinen (aber sehr effektiven) Umweg und
definieren allgemeiner, was es heißt, dass eine gegebene Formel unter einer
gegebenen Belegung in M gilt.
Eine M–Belegung ist eine Funktion β : {v0 , v1 , . . . } → M , die allen
Variablen Elemente der Trägermenge von M zuordnet. Durch eine M–
Belegung ist eine Interpretation beliebiger Terme gegeben. Eine solche durch
β induzierte Terminterpretation ist eine Funktion β : T → M (wobei T die
Menge aller Terme ist), für die gilt:
(1) β(vn ) = β(vn ) für n ∈ N,
(2) β(ck ) = ak für k ∈ K, und
(3) β(fj τ0 . . . τnj −1 ) = Fj (β(τ0 ), . . . , β(τnj −1 )) für j ∈ J und Terme τ0 , . . . , τnj −1 .
Wir definieren nun “ϕ gilt in M unter der Belegung β”. Hierzu ist die folgende Schreibweise hilfreich.
4.1. LOGIK ERSTER STUFE
67
Sei n ∈ N, und sei a ∈ M . Dann bezeichnet β(vn |a) diejenige Belegung,
die mit β überall übereinstimmt, außer an der Stelle vn , wo der Wert a
angenommen wird, d.h.
β(vm ), falls m 6= n
β(vn |a)(vm ) =
a
, falls m = n.
Wir schreiben “ϕ gilt in M unter der Belegung β” oder “M ist Modell von
ϕ unter β” als
M |= ϕ[β]
und definieren diese Relation wie folgt. Hierbei sei β die durch β induzierte
Terminterpretation. Die folgende Definition ist rekursiv “nach der Formelkomplexität” und simultan für alle Belegungen.
(1) M |= τ0 = τ1 [β] gdw. β(τ0 ) = β(τ1 ) für Terme τ0 , τ1
(2) M |= Pi τ0 . . . τnj −1 [β] gdw. (β(τ0 ), . . . , β(τnj −1 )) ∈ Ri
(3) M |= ¬ϕ[β] gdw. M |= ϕ[β] nicht gilt
(4) M |= ϕ ∧ ψ[β] gdw. M |= ϕ[β] und M |= ψ[β] beide gelten
(5) M |= ∀vn ϕ[β] gdw. für alle a ∈ M , M |= ϕ[β(vn |a)].
Betrachten wir den Satz ∀v0 v0 = v0 . Es gilt M |= ∀v0 v0 = v0 [β] gdw. für
alle a ∈ M , M |= v0 = v0 [β(v0 |a)] gdw. für alle a ∈ M , β(v0 ) = β(v0 ) (d.h.
β(v0 ) = β(v0 )). ∀v0 v0 = v0 gilt also in jedem Modell unter jeder Belegung.
Definition 4.1.1 Sei Σ ∪ {ϕ} eine Menge von Formeln. Wir sagen, dass Σ
(logisch) ϕ impliziert, in Zeichen: Σ |= ϕ gdw. für jedes Modell M und für
jede Belegung β gilt: wenn M |= ψ[β] für alle ψ ∈ Σ, dann auch M |= ϕ[β].
Anstelle von ∅ |= ϕ schreiben wir auch |= ϕ und sagen in diesem Falle, dass
ϕ (logisch) gültig ist.
Für jede Menge Σ von Formeln schreiben wir M |= Σ[β] anstelle von:
für alle ϕ ∈ Σ, M |= ϕ[β]. Es gilt also Σ |= ϕ gdw. für jedes Modell M und
für jede Belegung β gilt: wenn M |= Σ[β], dann M |= ϕ[β].
Der oben betrachtete Satz ∀v0 v0 = v0 ist also gültig. Dasselbe gilt
übrigens auch für ∃v0 v0 = v0 , das abkürzend die Formel ¬∀v0 ¬v0 = v0
darstellt. Dies ist leicht nachzurechnen. Hingegen ist ∃v0 ∃v1 v0 6= v1 nicht
gültig, aber es gilt z.B.
{∃v0 ∃v1 ∃v2 (v0 6= v1 ∧ v1 6= v2 ∧ v0 6= v2 )} |= ∃v0 ∃v1 v0 6= v1 .
68
KAPITEL 4. MODELLE
Wir schreiben ϕ |= ψ anstelle von {ϕ} |= ψ. ϕ und ψ heißen (logisch)
äquivalent gdw. ϕ |= ψ und ψ |= ϕ gelten.
Satz 4.1.2 Sei ϕ eine L–Formel, und sei M ein Modell von L. Seien β 0
und β 1 M–Belegungen, so dass β 0 (vn ) = β 1 (vn ) für alle vn , die frei in ϕ
vorkommen. Dann gilt
M |= ϕ[β 0 ] gdw. M |= ϕ[β 1 ].
Beweis: Wir zeigen diesen Satz durch Induktion “nach der Formelkomplexität”. Die Aussage gilt zunächst für atomares ϕ, da dann vn frei in ϕ
vorkommt gdw. vn überhaupt in ϕ vorkommt. Sodann ergibt sich aus der
Tatsache, dass die Aussage für ψ0 und ψ1 gilt, sofort, dass die Aussage auch
für ϕ gleich ¬ψ0 und für ϕ gleich ψ0 ∧ ψ1 gilt.
Sei nun ϕ gleich ∀vm ψ. vn kommt frei in ϕ vor gdw. n 6= m und vn frei
in ψ vorkommt. Für ein beliebiges a gilt also
β 0 (vm |a)(vn ) = β 1 (vm |a)(vn )
für alle vn , die frei in ψ vorkommen.
Damit gilt aber mit Hilfe der Induktionsvoraussetzung: M |= ϕ[β 0 ] gdw.
für alle a ∈ M, M |= ψ[β 0 (vm |a)] gdw. für alle a ∈ M, M |= ψ[β 1 (vm |a)]
gdw. M |= ϕ[β 1 ].
Korollar 4.1.3 Sei ϕ ein L–Satz, und sei M ein Modell von L. Seien β 0
und β 1 beliebige M-Belegungen. Dann gilt
M |= ϕ[β 0 ] gdw. M |= ϕ[β 1 ].
Für Sätze ϕ schreiben wir im Folgenden M |= ϕ anstelle von M |= ϕ[β] und
sagen, dass ϕ in M gilt (oder, dass M Modell von ϕ ist).
Eine L–Formel ϕ heißt erfüllbar gdw. ¬ϕ nicht logisch gültig ist, d.h.
wenn es ein Modell M und eine M–Belegung β gibt, so dass M |= ϕ[β].
Eine beliebige Menge Γ von L–Formeln heißt erfüllbar gdw. wenn es ein
Modell M und eine M–Belegung β gibt, so dass M |= ϕ[β] für alle ϕ ∈ Γ
gilt. (Wenn Γ erfüllbar ist, dann ist jedes ϕ ∈ Γ erfüllbar; die Umkehrung
hiervon gilt jedoch nicht.) Eine beliebige Menge Γ von L–Formeln heißt endlich erfüllbar gdw. jede endliche Menge Γ̄ ⊂ Γ erfüllbar ist. Offensichtlich
ist jedes erfüllbare Γ auch endlich erfüllbar. Die überraschende Aussage,
dass hiervon auch die Umkehrung gilt, dass nämlich jedes endlich erfüllbare
69
4.1. LOGIK ERSTER STUFE
Γ auch erfüllbar ist, ist der Kompaktheitssatz 4.2.7, der im nächsten Abschnitt bewiesen wird und der im letzten Abschnitt für die Konstruktion
von Nichtstandardmodellen verwandt werden wird.
Sei M ein Modell von L. Sei ϕ eine Formel, in der genau die Variablen
vi0 , . . . , vin−1 frei vorkommen. Sei ai0 , . . . , ain−1 ∈ M , der Trägermenge von
M. Wir schreiben dann kurz
M |= ϕ(ai0 , . . . , ain−1 )
anstelle von: M |= ϕ[β], wobei β(vij ) = aij für alle j < n.
Eine n–stellige Relation R ⊂ M n heißt über M definierbar gdw. es eine
Formel ϕ gibt, in der genau die Variablen v0 , . . . , vn−1 frei vorkommen, so
dass für alle a0 , . . . , an−1 ∈ M :
(a0 , . . . , an−1 ) ∈ R gdw. M |= ϕ(a0 , . . . , an−1 ).
Für M = (M ; (Ri : i ∈ I), (ck : k ∈ K), (Fj : j ∈ J)) sind trivialerweise alle
Relationen Ri über M definierbar; es gibt aber im Allgemeinen noch weitere
definierbare Relationen.
Betrachten wir die Struktur
N = (N; <, 0, 1, +, ·, E),
wobei < die Kleiner–Relation, 0 die Null, 1 die Eins, + die Addition, · die
Multiplikation und E die Exponentiation ist. Offenbar ist N ein Modell der
Sprache der elementaren Zahlentheorie1 (das “Standardmodell”; wir werden
sehen, dass es noch weitere Modelle gibt). Es ist nicht wirklich nötig, < zu
N hinzuzunehmen: die Relation < ist über dem Modell
(N; 0, +)
mit Hilfe der Formel ∃v2 (v2 6= 0 ∧ v0 + v2 = v1 ) definierbar:
n < m gdw. (N; 0, +) |= ∃v2 (v2 6= 0 ∧ n + v2 = m).
Man kann zeigen, dass die Exponentiation über
(N; <, 0, 1, +, ·)
1
Damit bezeichnet < sowohl das Symbol für die Kleiner–Relation als auch die Relation
selbst, usw.
70
KAPITEL 4. MODELLE
definierbar ist, d.h. dass es eine Formel ϕ gibt, so dass
nm = q gdw. (N; <, 0, 1, +, ·) |= ϕ(n, m, q).
Auf der anderen Seite ist z.B. die Addition nicht über
(N; ·)
und die Multiplikation nicht über
(N; <, 0, 1, +)
definierbar. Ersteres lässt sich folgendermaßen zeigen.
Seien M und P zwei Modelle von L mit Trägermenge M bzw. P . Eine
Abbildung π : M → P heißt ein Homomorphismus von M nach P gdw.
(1) (a0 , ..., an−1 ) ∈ P M gdw. (π(a0 ), ..., π(an−1 )) ∈ P P ,
(2) π(f M (a0 , ..., an−1 )) = f P (π(a0 ), ..., π(an−1 )), und
(3) π(cM ) = cP
für alle Prädikatsymbole P , alle Funktionssymbole f , alle a0 , ..., an−1 ∈
M und für alle Konstanten c ist (hierbei ist n, abhängig von P bzw. f ,
jeweils die Stelligkeit von P bzw. f ). Eine Abbildung π : M → P heißt ein
Isomorphismus von M nach P gdw. π ein bijektiver Homomorphismus von
M nach P ist. Die folgende Aussage ist leicht zu zeigen.
Satz 4.1.4 Sei π : M → P ein Homomorphismus von M nach P. Sei β̄
eine M -Belegung, und sei β die durch β̄ induzierte Terminterpretation. Sei
die P -Belegung β̄ ′ definiert durch β̄ ′ (vi ) = π(β̄(vi )) für i ∈ N, und sei β ′ die
durch β̄ ′ induzierte Terminterpretation. Dann haben wir:
(a) Für alle Terme τ ist π(β(τ )) = β ′ (τ ).
(b) Wenn π ein Isomorphismus von M nach P ist, dann gilt für alle Formeln ϕ, dass M |= φ[β̄] gdw. P |= φ[β̄ ′ ].
Die Äquivalenz in (b) bedeutet, dass
M |= φ(ai0 , ..., ain−1 ) gdw. P |= φ(π(ai0 ), ..., π(ain−1 )),
wenn in der Formel ϕ die Variablen vi0 , ..., vin−1 frei vorkommen und β̄(vi0 ) =
ai0 , ..., β̄(vin−1 ) = ain−1 .
4.2. ULTRAPRODUKTE UND KOMPAKTHEIT
71
Angenommen nun, die Addition wäre über der Struktur (N; ·) definierbar.
Dann hätten wir für jeden Isomorphismus2 π : N → N von (N; ·) nach (N; ·),
dass π(n + m) = π(n) + π(m) für alle n, m ∈ N. Ein Isomorphismus π ist
aber wie folgt gegeben. Sei p0 = 2, p1 = 3, ... die natürliche Aufzählung aller
Primzahlen. Setze π(0) = 0, π(1) = 1, π(2) = 3, π(3) = 2 und π(pi ) = pi für
alle i ≥ 2. Für natürliche Zahlen n ≥ 2 mit Primfaktorzerlegung
Y
km−1
n=
pki00 · · · · · pim−1
ist
π(n) =
Y
π(pi0 )k0 · · · · · π(pim−1 )km−1 .
Es gilt aber dann π(1 + 1) = π(2) = 3 6= 2 = 1 + 1 = π(1) + π(1).
4.2
Ultraprodukte und Kompaktheit
Wir wollen nun die Methode der Ultraproduktbildung von Modellen kennenlernen.
Definition 4.2.1 Sei I 6= ∅ eine beliebige Menge. Eine Menge F von Teilmengen von I heißt ein Filter auf I gdw.
(a) wenn X ∈ F und Y ∈ F , dann ist auch X ∩ Y ∈ F ,
(b) wenn X ∈ F und Y ⊃ X, wobei Y ⊂ I, dann ist auch Y ∈ F ,
(c) I ∈ F , und
(d) ∅ 6∈ F .
Sei etwa u eine nichtleere Teilmenge von I. Dann ist
{X ⊂ I : u ⊂ X}
ein Filter auf I. Dieser heißt der von u erzeugte prinzipale Filter. Sei I
unendlich. Dann ist
{X ⊂ I : I\X ist endlich}
ein Filter auf I, der aus allen koendlichen Teilmengen von I besteht. Dieser
heißt der Frechét–Filter auf I.
2
d.h. Automorphismus
72
KAPITEL 4. MODELLE
Definition 4.2.2 Sei I 6= ∅, und sei F ein Filter auf I. Dann heißt F
Ultrafilter auf I gdw für jedes X ⊂ I gilt: X ∈ F oder I\X ∈ F .
Wenn F Ultrafilter auf I ist, dann gilt für jedes X ⊂ I genau eine der beiden
Aussagen X ∈ F, I\X ∈ F . Mit Hilfe des Hausdorffschen Maximalitätsprinzips (siehe Definition 3.2.11) zeigt man den folgenden
Satz 4.2.3 (Tarski) Sei I 6= ∅, und sei F ein Filter auf I. Dann existiert
ein Ultrafilter U auf I, der F fortsetzt, d.h. so dass U ⊃ F .
Sei nun L eine Sprache der Logik erster Stufe. Sei I 6= ∅, und sei für jedes
σ ∈ I ein L–Modell Mσ gegeben. Sei weiterhin U ein Ultrafilter auf I. Wir
wollen dann das Ultraprodukt der Modelle Mσ mittels U , in Zeichen
Y
Mσ /U,
σ∈I
definieren. Wir definieren zunächst die Trägermenge des Ultraproduktes. Mit
|Mσ | bezeichnen wir die Trägermenge des Modells Mσ . Es sei F ∗ die Menge
aller Funktionen f mit Definitionsbereich I, so dass f (σ) ∈ |Mσ | für alle
σ ∈ I. Für f, g ∈ F ∗ schreiben wir f ∼g gdw. {σ ∈ I : f (σ) = g(σ)} ∈ U .
Lemma 4.2.4 ∼ ist eine Äquivalenzrelation.
Beweis: Lediglich die Transitivität von ∼ ist nicht trivial. Aus f ∼g und
g∼h, d.h. {σ ∈ I : f (σ) = g(σ)} ∈ U und {σ ∈ I : g(σ) = h(σ)} ∈ U folgt
aber wegen {σ ∈ I : f (σ) = h(σ)} ⊃ {σ ∈ I : f (σ) = g(σ)} ∩ {σ ∈ I : g(σ) =
h(σ)}, dass {σ ∈ I : f (σ) = h(σ)} ∈ U , also f ∼h.
Wir schreiben [f ] für die Äquivalenzklasse von f ∈ F ∗ , d.h. [f ] = {g ∈ F ∗ :
g∼f }. Wir schreiben auch F für die Menge aller [f ] mit f ∈ F ∗ . F wird die
Trägermenge des Ultraproduktes sein, welches wir mit M bezeichnen wollen.
Um M zu definieren, müssen wir neben der Trägermenge die Interpretationen von ck , fj und Pi angeben. Dies geschieht wie folgt. Wir setzen, für
k ∈ K,
Mσ
für alle σ ∈ I.
cM
k = [f ], wobei f (σ) = ck
Wir setzen weiter, für j ∈ J,
fjM([f0 ], . . . , [fnj −1 ]) = [f ], wobei
f (σ) = fjMσ (f0 (σ), . . . , fnj −1 (σ)) für alle σ ∈ I
4.2. ULTRAPRODUKTE UND KOMPAKTHEIT
73
und schließlich, für i ∈ I,
([f0 ], . . . , [fni −1 ]) ∈ PiM ⇔ {σ ∈ I : (f0 (σ), . . . , fni −1 (σ)) ∈ PiMσ } ∈ U.
Dieses so konstruierte Modell
M = (F; (PiM : i ∈ I), (fjM : j ∈ J), (ck : k ∈ K))
bezeichnen wir als das Ultraprodukt der Modelle Mi mittels U .
Q
Lemma 4.2.5 Sei, für σ ∈ I, βσ eine Mσ –Belegung, und sei die σ∈I Mσ /U –
Belegung β wie folgt definiert: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle
σ ∈ I. Sei β̄ die durch β induzierte Termbelegung, und sei, für σ ∈ I, β̄σ die
durch βσ induzierte Termbelegung. Sei schließlich für einen beliebigen Term
τ die Funktion hτ mit Definitionsbereich I definiert durch hτ (σ) = β̄σ (τ ).
Dann gilt für jeden Term τ , dass
β̄(τ ) = [hτ ].
Die folgende Aussage ist von zentraler Bedeutung.
Q
Satz 4.2.6 (Loś) Sei, für σ ∈ I, βσ eine Mσ –Belegung, und sei die σ∈I Mσ /U –
Belegung β wie folgt definiert: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle
σ ∈ I. Dann gilt für alle Formeln ϕ
Y
Mσ /U |= ϕ[β] gdw. {σ ∈ I : Mσ |= ϕ[βσ ]} ∈ U.
σ∈I
Beweis
durch Induktion nach der Komplexität von ϕ. Wir schreiben M̃ für
Q
M/U
.
σ∈I
Sei zunächst ϕ atomar. Sei etwa ϕ ≡ vk = vl . Dann gilt M̃ |= vk = vl [β]
gdw. β(vk ) = β(vl ) gdw. [f ] = [g], wobei f (σ) = βσ (vk ) und g(σ) = βσ (vl )
für alle σ ∈ I, gdw. {σ ∈ I : βσ (vk ) = βσ (vl )} ∈ U gdw. {σ ∈ I : Mσ |= vk =
vl [βσ ]} ∈ U . Für die übrigen atomaren Fälle ist das Argument völlig analog.
Sei nun ϕ ≡ ¬ψ. Hier benutzt der Induktionsschritt die Tatsache, dass U
ein Ultrafilter (und nicht etwa nur ein Filter) auf I ist. Es gilt M |= ¬ψ[β]
gdw. M 6|= ψ[β] gdw. {σ ∈ I : Mσ |= ψ[βσ ]} 6∈ U nach Induktionsvoraussetzung, gdw. {σ ∈ I : Mσ 6|= ψ[βσ ]} ∈ U , da U ein Ultrafilter ist, gdw.
{σ ∈ I : Mσ |= ¬ψ[βσ ]} ∈ U .
Der Induktionsschritt für ϕ ≡ ψ ∧ ψ ′ ist sehr einfach.
Wir betrachten schließlich den Fall, dass ϕ ≡ ∀vk ψ.
74
KAPITEL 4. MODELLE
Setzen wir zunächst voraus, dass {σ ∈ I : Mσ |= ∀vk ψ[βσ ]} ∈ U . Sei
[f ] ∈ |M̃| = F beliebig. Dann gilt {σ ∈ I : Mσ |= ψ[βσ (vk |f (σ))]} ⊃
{σ ∈ I : Mσ |= ∀vk ψ[βσ ]}, also {σ ∈ I : Mσ |= ψ[βσ (vk |f (σ))]} ∈ U . Die
Induktionsvoraussetzung liefert dann M̃ |= ψ[β(vk |[f ])]. Da [f ] beliebig war,
haben wir also M |= ∀vk ψ[β] gezeigt.
Setzen wir nun voraus, dass {σ ∈ I : Mσ |= ∀vk ψ[βσ ]} ∈
/ U , d.h. {σ ∈
I : Mσ |= ∃vk ¬ψ[βσ ]} ∈ U . Wir wollen zeigen, dass M̃ 6|= ∀vk ψ[β], d.h.
M̃ |= ∃vk ¬ψ[β]. Mit Hilfe des Auswahlaxioms finden wir ein f ∈ F ∗ , so
dass Mσ |= ¬ψ[βσ (vk |f (σ))] für alle σ ∈ I, für die ein a ∈ |Mσ | mit Mσ |=
¬ψ[βσ (vk |a)] existiert. Dann gilt offensichtlich
{σ ∈ I : Mσ |= ¬ψ[βσ (vk |f (σ))]} = {σ ∈ I : Mσ |= ∃vk ¬ψ[βσ ]} ∈ U,
und damit mit Hilfe der Induktionsvoraussetzung M |= ¬ψ[β(vk |[f ])], wie
gewünscht.
Mit Hilfe dieser Methode zeigt sich nun sehr leicht der Kompaktheitssatz
der Logik erster Stufe.
Satz 4.2.7 (Kompaktheitssatz) Sei Σ eine endlich erfüllbare Menge von
L–Formeln, d.h. für jedes endliche σ ⊂ Σ existiert ein L–Modell Mσ und
eine Mσ –Belegung βσ mit
Mσ |= σ[βσ ].
Dann existiert ein L–Modell M̃ und eine M̃–Belegung β mit M̃ |= Σ[β].
Beweis: Sei I die Menge aller endlichen Teilmengen von Σ. Für σ ∈ I sei
Xσ = {τ ∈ I : τ ⊃ σ}.
Die Mengen Xσ genieren einen Filter F auf I wie folgt: Wir setzen
X ∈ F gdw. ∃σ ∈ IX ⊃ Xσ .
Behauptung: F ist ein Filter auf I.
Beweis: (a): Seien X, Y ∈ F . Seien σ, τ ∈ I so, dass X ⊃ Xσ und Y ⊃ Xτ .
Dann gilt X ∩ Y ⊃ Xσ ∩ Xτ = Xσ∪τ , also auch X ∩ Y ∈ F . (b) ist trivial.
(c): Da ∅ ∈ I, gilt I ∈ F . (d): Da σ ∈ Xσ für alle σ ∈ I, gilt ∅ ∈
/ F.
Sei nun (mit Hilfe des Satzes 4.2.3 von Tarski) U ein Ultrafilter auf I, der
4.3. NICHTSTANDARD-MODELLE
75
Q
F fortsetzt. Wir setzen dann M̃ = σ∈I Mσ /U . Wir definieren eine M̃–
Belegung β durch: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle σ ∈ I. Es
genügt nun zu zeigen, dass M |= Σ[β]. Sei also ϕ ∈ Σ. Dann folgt aus ϕ ∈ σ
(d.h. {ϕ} ⊂ σ}, dass Mσ |= ϕ[βσ ], also {σ ∈ I : Mσ |= ϕ[βσ ]} ⊃ X{ϕ} ∈ U ,
und damit auch {σ ∈ I : Mσ |= ϕ[βσ ]} ∈ U . Auf Grund des Satzes von Loś
gilt dann M̃ |= ϕ[β] wie gewünscht.
Ein Spezialfall von Ultraprodukten ist die Ultrapotenz. Sei I 6= ∅, und sei
U ein Ultrafilter auf I. Sei M ein L–Modell, und sei Mi = M für alle i ∈ I.
Dann schreiben wir:
U lt(M; U )
Q
für i∈I Mi /U und nennen dies die Ultrapotenz von M mittels U .
Der Satz von Loś ergibt sofort das folgende
Korollar 4.2.8 Sei β̄ eine M–Belegung, und sei die U lt(M; U )–Belegung
β definiert durch β(vk ) = [cβ̄(vk ) ], wobei cβ̄(vk ) die konstante Funktion mit
Wert β̄(vk ) (und Definitionsbereich I) ist. Dann gilt
U lt(M; U ) |= ϕ[β] gdw. M |= ϕ[β̄]
für alle Formeln ϕ.
Es existiert auch eine natürliche “Einbettung” e von M nach U lt(M; U ). Für
a ∈ |M| setzen wir e(a) = [ca ], wobei ca die konstante Funktion mit Wert a
(und Definitionsbereich I) ist. Es gilt dann:
Korollar 4.2.9 Es gilt
U lt(M; U ) |= ϕ(e(a0 ), . . . , e(aj−1 )) gdw. M |= ϕ(a0 , . . . , aj−1 )
für alle Formeln ϕ und a0 , . . . , aj−1 ∈ |M|.
4.3
Nichtstandard-Modelle
Auf diese Art und Weise lassen sich sehr leicht “Nichtstandardmodelle” konstruieren. Sei etwa
N = (N; 0, 1, <, +, ·, E),
und sei U ein Ultrafilter auf N, der den Frechét–Filter auf N fortsetzt. Dann
ist U lt(N; U ) nicht isomorph zu N (d.h. die Einbettung e ist nicht surjektiv).
Sei
R = (R; 0, 1, <, +, ·, E),
76
KAPITEL 4. MODELLE
und sei wieder U ein Ultrafilter auf N, der den Frechét–Filter auf N fortsetzt.
Dann enthält U lt(R; U ) sowohl “infinitesimale” Zahlen als auch “unendlich
große” Zahlen.
Herunterladen