Logische Grundlagen der Mathematik Ralf Schindler 3. Dezember 2008 Inhaltsverzeichnis 1 Natürliche Zahlen 1.1 Endliche und unendliche Mengen . . . . . . . . . . . . . . . . 1.2 Die Theorie der natürlichen Zahlen . . . . . . . . . . . . . . . 3 3 11 2 Reelle Zahlen 19 2.1 Die Konstruktion der ganzen und rationalen Zahlen . . . . . 19 2.2 Die Konstruktion der reellen Zahlen . . . . . . . . . . . . . . 23 2.3 Die Theorie der reellen Zahlen . . . . . . . . . . . . . . . . . 34 3 Mengen 39 3.1 Mengen, Klassen und Grothendieck–Universen . . . . . . . . 39 3.2 Das Auswahlaxiom . . . . . . . . . . . . . . . . . . . . . . . . 51 3.3 Die Topologie von R . . . . . . . . . . . . . . . . . . . . . . . 57 4 Modelle 63 4.1 Logik erster Stufe . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.2 Ultraprodukte und Kompaktheit . . . . . . . . . . . . . . . . 71 4.3 Nichtstandard-Modelle . . . . . . . . . . . . . . . . . . . . . . 75 1 2 INHALTSVERZEICHNIS Kapitel 1 Natürliche Zahlen Eines der Grundgerüste der Mathematik ist die Menge der natürlichen Zahlen 0, 1, 2, . . . sowohl als Untersuchungsobjekt (in der Zahlentheorie) als auch als Hilfsmittel (in allen Bereichen der Mathematik). Dabei interessieren uns die natürlichen Zahlen nicht so sehr als Menge einzelner Elemente ohne Beziehung untereinander, sondern viel mehr als Struktur, d.h. als Menge mit auf ihr definierten Relationen (z.B. der Ordnungsrelation <) und Verknüpfungen (z.B. + und ·). Wir wollen dennoch zunächst in Abschnitt 1.1 die natürlichen Zahlen als Menge betrachten, um sie danach in Abschnitt 1.2 als Struktur zu studieren. Allerdings benötigen wir selbst zum Studium der bloßen Menge der natürlichen Zahlen eine grundlegende strukturelle Einsicht, nämlich das Induktionsaxiom. Dieses werden wir im Abschnitt 1.2 genauer untersuchen; wir benötigen es als Beweisprinzip aber bereits in Abschnitt 1.1. Die natürlichen Zahlen sind durch < in natürlicher Weise geordnet. Das Induktionsaxiom besagt, dass jede nichtleere Menge natürlicher Zahlen ein (im Sinne von <) kleinstes Element besitzt. 1.1 Endliche und unendliche Mengen Die Menge N = {0, 1, 2, . . . } der natürlichen Zahlen ist unendlich im Gegensatz etwa zur endlichen Menge {0, 1, 2} der natürlichen Zahlen, die kleiner als 3 sind. Wie lassen sich unendliche Mengen charakterisieren? Zur Beantwortung dieser Frage benötigen wir einige einfache mengentheoretische Begriffe und Tatsachen. 3 4 KAPITEL 1. NATÜRLICHE ZAHLEN Definition 1.1.1 Seien A und B Mengen, und sei f : A → B eine Abbildung von A nach B. Dann heißt f injektiv gdw. für alle x, y ∈ A aus f (x) = f (y) bereits x = y folgt. Die Abbildung f heißt surjektiv gdw. für alle z ∈ B ein x ∈ A existiert, so dass f (x) = z. Schließlich heißt f bijektiv gdw. f injektiv und surjektiv ist. Lemma 1.1.2 Seien A und B Mengen. Wenn es eine Injektion f : A → B gibt, dann existiert auch eine Surjektion f : B → A. Beweis: Die Aussage ist trivial für A = ∅. Sei also A 6= ∅ und sei x0 ∈ A. Wir definieren eine Abbildung g : B → A wie folgt. Sei z ∈ B. Wenn es ein x ∈ A mit f (x) = z gibt, dann gibt es wegen der Injektivität von f genau ein solches x, und wir definieren g(z) = x für das eindeutige x ∈ A mit f (x) = z. Wenn es kein x ∈ A mit f (x) = z gibt, dann definieren wir g(z) = x0 . Offensichtlich ist g damit wohldefiniert. Die Abbildung g ist surjektiv, da für jedes x ∈ A gilt, dass g(f (x)) = x. Das folgende hierzu “duale” Lemma ist weniger trivial, da sein Beweis das Auswahlaxiom benötigt. Lemma 1.1.3 Seien A und B Mengen. Wenn es eine Surjektion f : A → B gibt, dann existiert auch eine Injektion f : B → A. Der Beweis dieses Lemmas wird im 3. Kapitel geliefert. Wir zeigen hier Lemma 1.1.3 für den Fall, dass A eine Menge natürlicher Zahlen ist. Sei f : A → B surjektiv. Wir definieren dann eine Injektion g : B → A wie folgt. Für x ∈ B sei g(x) das kleinste m ∈ A, so dass f (m) = x. Da f surjektiv ist, ist g wohldefiniert. Offensichtlich ist g injektiv, da für g(x) = g(y) gilt, dass x = f (g(x)) = f (g(y)) = y. Eine Menge A heißt Teilmenge der Menge B, A ⊂ B, gdw. jedes Element von A auch Element von B ist. Insbesondere folgt A ⊂ B aus A = B, und es gilt A = B gdw. A ⊂ B und B ⊂ A. Wir schreiben A $ B, falls A echte Teilmenge von B ist, d.h. wenn A ⊂ B und A 6= B. Sei f : A → B eine Abbildung. Wir schreiben dann f [A] für das Bild von A unter f , d.h. f [A] = {f (x) : x ∈ A}. Dann ist f surjektiv gdw. B = f [A]. Wenn f : A → B injektiv ist, dann schreiben wir f −1 : f [A] → A für die Umkehrabbildung von f , d.h. für dasjenige g : f [A] → A mit g(f (x)) = x. Wenn A ⊂ B, dann gibt es offensichtlich eine Injektion von A nach B, nämlich die Identität auf A, die jedes x ∈ A auf sich selbst abbildet. 1.1. ENDLICHE UND UNENDLICHE MENGEN 5 Für f : A → B und D ⊂ A schreiben wir f ↾ D für die Einschränkung von f auf D, d.h. für die Funktion g : D → B mit g(x) = f (x) für alle x ∈ D. Für beliebige Mengen A und B schreiben wir A \ B für die Menge aller x, die zwar in A, jedoch nicht in B liegen. Es gilt A ⊂ B gdw. A \ B = ∅. Der Beweis des nachfolgenden Satzes lässt sich wiederum ohne Auswahlaxiom vollziehen. Satz 1.1.4 (Schröder–Bernstein) Seien A und B Mengen. Wenn es Injektionen f : A → B und g : B → A gibt, dann gibt es eine Bijektion h : A → B. Beweis: Wir definieren zunächst Teilmengen Xn von A und Yn von B wie folgt. Sei Y0 = B \ f [A]. WennSYn definiert ist, dann S sei Xn = g[Yn ] und Yn+1 = f [Xn ]. Wir setzen X = n∈N Xn und Y = n∈N Yn . Da g[Yn ] = Xn für jedes n ∈ N, gilt g[Y ] = X. Da g injektiv ist, ist also g−1 ↾ X eine Bijektion von X auf Y . Es gilt aber auch f [A\X] = B \Y . Sei nämlich zunächst x ∈ A\X. Wäre dann f (x) ∈ Y , etwa f (x) ∈ Yn , dann wäre n > 0 und somit x ∈ Xn−1 ⊂ X. Widerspruch! Also gilt f [A \ X] ⊂ B \ Y . Sei nun y ∈ B \ Y ⊂ B \ Y0 . Dann ist y ∈ f [A], etwa y = f (x). Wäre x ∈ X, etwa x ∈ Xn , dann hätten wir y = f (x) ∈ f [Xn ] = Yn+1 ⊂ Y . Widerspruch! Damit ist also f ↾ (A \ X) eine Bijektion von A \ X auf B \ Y . Wir können nun sehr einfach eine Bijektion h : A → B wie folgt definieren. Sei h(x) = g−1 (x), falls x ∈ X, und sei h(x) = f (x), falls x ∈ A \ X. Betrachten wir nun Teilmengen A und B von N. Definition 1.1.5 Eine Menge B ⊂ N heißt Anfangsstück von N gdw. es entweder ein n ∈ N gibt mit B = {m ∈ N : m < n} oder wenn B = N. Sei nun A ⊂ N. Wir wollen ein Anfangsstück BA von N und eine Bijektion fA : BA → A konstruieren. Hierbei soll fA einfach die “natürliche Aufzählung” von A sein. Betrachten wir zunächst einige einfache Beispiele. Für A = {2n : n ∈ N}, die Menge der geraden natürlichen Zahlen, ist BA = N und fA (n) = 2n. Wenn A die Menge der Primzahlen ist, dann ist ebenfalls BA = N und fA (n) ist die nte Primzahl in der natürlichen Aufzählung der Primzahlen. Wenn A = {2n + 1 : n ∈ N, 2n + 1 < 1037 }, dann ist BA = 5 · 1036 und fA (n) = 2n + 1. 6 KAPITEL 1. NATÜRLICHE ZAHLEN Betrachten wir nun eine beliebige Teilmenge A von N. Wenn A = ∅, dann sei BA = ∅ und fA die “leere Funktion”. Sei nun A 6= ∅. Wir definieren dann fA (0) als das kleinste Element von A. Falls A = {fA (0)} dann setzen wir BA = {0} und brechen unsere Konstruktion ab. Andernfalls definieren wir fA (1) als das kleinste Element von A, das verschieden von fA (0) (und damit größer als fA (0)) ist. Falls A = {fA (0), fA (1)}, dann setzen wir BA = {0, 1} und brechen unsere Konstruktion ab. Andernfalls fahren wir in gleicher Weise fort. Nehmen wir an, wir haben fA (0), fA (1), . . . , fA (n) bereits definiert. Falls A = {fA (0), fA (1), . . . , fA (n)}, dann setzen wir BA = {0, 1, . . . , n} und brechen unsere Konstruktion ab. Andernfalls definieren wir fA (n + 1) als das kleinste Element von A, das verschieden von fA (0), fA (1), . . . , fA (n) (und damit größer als alle diese) ist. Wir bemerken, dass fA streng monoton wächst, d.h. fA (m) > fA (n) für alle m und n mit m > n, für die sowohl fA (m) als auch fA (n) definiert sind. Daraus ergibt sich übrigens, dass fA (n) ≥ n für alle n, für die fA (n) definiert ist. Außerdem gilt nach Konstruktion offensichtlich, dass für alle n, für die fA (n) definiert ist, (*) {k ∈ A : k ≤ fA (n)} = {fA (0), fA (1), . . . , fA (n)}. Es gibt nun die folgenden beiden Fälle. Entweder es gibt ein n, so dass die Konstruktion nach n + 1 Schritten abbricht, d.h. A = {fA (0), fA (1), . . . , fA (n)} und BA = {0, 1, . . . , n}. Oder die Konstruktion bricht nicht ab; in diesem Falle setzen wir BA = {0, 1, 2, . . . } = N. Es ist nun unschwer erkennbar, dass wir in beiden Fällen ein Anfangsstück BA von N und eine Bijektion fA : BA → A definiert haben: fA ist injektiv, da fA streng monoton wächst, und fA ist surjektiv wegen (*). Konstruktionen wie die Obige werden als “rekursiv” bezeichnet, da der Funktionswert an der Stelle n in Abhängigkeit von den Funktionswerten an den Stellen 0, 1, . . . , n − 1 definiert wird. Im Beweis des Satzes 1.1.4 von Schröder-Bernstein wurde ebenfalls eine Rekursion verwendet: die Mengen Xn und Yn+1 wurden dort mit Hilfe der Menge Yn konstruiert. Definition 1.1.6 Sei A ⊂ N, und seien BA und fA wie oben definiert. Dann heißt A endlich gdw. es ein n ∈ N gibt mit BA = {m ∈ N : m < n}, andernfalls heißt A unendlich. 1.1. ENDLICHE UND UNENDLICHE MENGEN 7 So ist beispielsweise N selbst oder die Menge der geraden Zahlen oder die Menge der Primzahlen unendlich, während die Menge der ungeraden Zahlen, die kleiner als 1037 sind, endlich ist. Dahingegen weiß man im Moment nicht, ob die Menge der Primzahlen p, für die auch p + 2 Primzahl ist, endlich oder unendlich ist. Offensichtlich gilt: Lemma 1.1.7 Sei A ⊂ N. Dann ist entweder A endlich oder es gibt eine Bijektion f : N → A. Lemma 1.1.8 Seien B, D ⊂ N Anfangsstücke von N, so dass eine Bijektion f : B → D existiert. Dann gilt B = D. Beweis: Wir zeigen diese Aussage durch Induktion. Angenommen, es gibt Anfangsstücke B, D von N mit B $ D, so dass eine Bijektion f : B → D existiert. Für derartige Anfangsstücke B, D existiert ein n ∈ N mit B = {m ∈ N : m < n}. Sei nun n0 die kleinste natürliche Zahl n, so dass Anfangsstücke B, D von N existieren mit B $ D, B = {m ∈ N : m < n}, und es gibt eine Bijektion f : B → D. Offensichtlich gilt n0 > 0. Seien B, D Anfangsstücke von N, B $ D, B = {m ∈ N : m < n0 }, und sei f : B → D bijektiv. Sei zunächst angenommen, dass D = {m ∈ N : m < k} für ein k ∈ N, k > 1. Wir definieren dann B = {m ∈ N : m < n0 − 1}, D = {m ∈ N : m < k − 1} und eine Bijektion h : B → D wie folgt. Sei s < n0 so, dass f (s) = k − 1. Dann sei für m < n0 − 1 der Wert h(m) definiert als f (m), falls m 6= s, und h(s) = f (n0 − 1), falls s < n0 − 1. Die Existenz von B, D, h widerspricht aber dann der Wahl von n0 . Sei nun angenommen, dass D = N. Wir definieren dann B = {m ∈ N : m < n0 − 1} und eine Bijektion h : B → D wie folgt. Es sei h(m) = f (m), falls f (m) < f (n0 − 1), und es sei h(m) = f (m) − 1, falls f (m) ≥ f (n0 − 1). Abermals widerspricht die Existenz von B, D, h der Wahl von n0 . Korollar 1.1.9 Sei A ⊂ N, und sei B Anfangsstück von N, so dass eine Bijektion f : B → A existiert. Dann gilt B = BA . 8 KAPITEL 1. NATÜRLICHE ZAHLEN Beweis: Die Abbildung g = fA−1 ◦ f : B → BA ist bijektiv. Für jedes endliche A ⊂ N gibt es also genau ein n ∈ N, so dass eine Bijektion f : {0, 1, . . . , n−1} → A existiert. (Im Falle n = 0 ist f die “leere Funktion”.) Definition 1.1.10 Sei A ⊂ N. Wenn A endlich ist, dann heißt dasjenige n ∈ N, so dass eine Bijektion f : {m ∈ N : m < n} → A existiert, die Größe von A. Für endliches A ist die Größe von A gleich n, wobei BA = {m ∈ N : m < n}. Lemma 1.1.11 Seien D und A endliche Mengen, wobei D ⊂ A ⊂ N. Sei die Größe von D dieselbe wie die Größe von A. Dann gilt D = A. Beweis: Angenommen, D $ A. Sei n die gemeinsame Größe von D und A und seien fD : BD = {m ∈ N : m < n} → D und fA : BA → A die natürlichen Aufzählungen. Sei E = A \ D. Da D $ A gilt E 6= ∅. Sei fE : BE → E die natürliche Aufzählung. Sei zunächst E als endlich angenommen, und sei k > 0 die Größe von E. Wir definieren dann h : {m ∈ N : m < n + k} → A durch h(m) = fD (m), falls m < n und h(n + m) = fE (m), falls m < k. Dann ist h offensichtlich bijektiv. Damit gilt, dass fA−1 ◦ h : {m ∈ N : m < n + k} → {m ∈ N : m < n} bijektiv ist, wonach nach Lemma 1.1.8 gilt, dass n + k = n. Aber k > 0. Widerspruch! Sei nun E als unendlich angenommen. Wir definieren dann h:N→A durch h(m) = fD (m), falls m < n und h(n + m) = fE (m), falls m ∈ N. Dann ist h offensichtlich bijektiv. Damit gilt, dass fA−1 ◦ h : N → {m ∈ N : m < n} bijektiv ist. Die Existenz einer solchen Bijektion wiederspricht aber Lemma 1.1.8. Widerspruch! 1.1. ENDLICHE UND UNENDLICHE MENGEN 9 Eine sehr nützliche Charakterisierung (un)endlicher Mengen ergibt sich aus dem folgenden Satz 1.1.12 Sei A ⊂ N. Dann ist A endlich gdw. es keine echte Teilmenge D von A gibt, so dass (a) eine Injektion f : A → D existiert, oder (b) eine Surjektion g : D → A existiert, oder (c) eine Bijektion h : A → D existiert. Beweis: Auf Grund von Lemma 1.1.2 folgt aus (a), dass (b) gilt. Auf Grund von Lemma 1.1.3, welches wir für diesen Fall bereits bewiesen haben, folgt aus (b), dass (a) gilt. Aus der Existenz einer echten Teilmenge D von A mit (a) folgt die Existenz einer echten Teilmenge D von A mit (c), da wir für eine Injektion f : A → D die Menge D $ A durch die Menge D = f [A] $ A ersetzen können; f : A → D ist dann bijektiv. Aus (c) folgt trivial (a). Die Aussagen, wonach eine echte Teilmenge D von A mit (a), (b) oder (c) existiert, sind also paarweise äquivalent. Sei nun zunächst A unendlich. Wir betrachten fA : BA = N → A. Sei D = {fA (n) : n > 0} $ A. Wir können eine Surjektion g : D → A definieren, indem wir fA (n) für n > 0 nach fA (n − 1) senden. Diese Abbildung ist bijektiv. Sei jetzt A endlich. Wir zeigen dann, dass es keine echte Teilmenge D von A gibt, so dass eine Bijektion h : A → D existiert. Andernfalls sei n die Größe von A und k die Größe von D. Sei f : {m ∈ N : m < n} → A bijektiv, und sei g : {m ∈ N : m < k} → D ebenfalls bijektiv. Dann ist g−1 ◦ h ◦ f eine Bijektion von {m ∈ N : m < n} auf {m ∈ N : m < k}, wonach mit Lemma 1.1.8 gilt, dass n = k. Da D ⊂ A, gilt dann aber D = A nach Lemma 1.1.11. Widerspruch! Korollar 1.1.13 Sei A ⊂ N endlich, und sei f : A → A. Dann sind die folgenden Aussagen äquivalent. (a) f ist injektiv. (b) f ist surjektiv. (c) f ist bijektiv. 10 KAPITEL 1. NATÜRLICHE ZAHLEN Beweis: Sei f injektiv. Angenommen, f wäre nicht surjektiv. Sei A = f [A]. Dann gilt A $ A, und f : A → A ist bijektiv. Widerspruch! Sei nun f surjektiv. Angenommen, f wäre nicht injektiv. Sei A die Menge aller n ∈ A, so dass aus m ∈ A und f (n) = f (m) bereits m ≥ n folgt. Dann gilt A $ A und f ↾ A : A → A ist bijektiv. Widerspruch! Damit ist das Korollar bewiesen. Die hier bewiesenen Aussagen übertragen sich sehr schnell auf beliebige Mengen. Definition 1.1.14 Sei A eine Menge. Dann heißt A endlich gdw. es ein n ∈ N und eine Bijektion f : {m ∈ N : m < n} → A gibt. In diesem Falle heißt n auch die Größe von A. Mit Hilfe des (noch unbewiesenen) Lemmas 1.1.3 zeigt man dann in ansonsten gleicher Weise wie im Beweis von Korollar 1.1.13 die folgende Tatsache. Satz 1.1.15 Sei A endlich, und sei f : A → A. Dann sind die folgenden Aussagen äquivalent. (a) f ist injektiv. (b) f ist surjektiv. (c) f ist bijektiv. Eine Anwendung dieses Satzes ist z.B. die folgende Aussage. Jeder endliche kommutative Ring ohne Nullteiler ist ein Körper. Sei nämlich R ein endlicher kommutativer Ring ohne Nullteiler. Wir müssen zeigen, dass zu jedem r ∈ R \ {0} ein s ∈ R \ {0} mit r · s = 1 existiert. Sei r ∈ R \ {0} beliebig. Wir betrachten die Abbildung fr : R \ {0} → R \ {0}, die s ∈ R \ {0} nach r · s sendet. Da R nullteilerfrei ist, gilt fr [R \ {0}] ⊂ R \ {0}, und es folgt aus r · s = r · s′ , d.h. r · (s − s′ ) = 0, dass s − s′ = 0, d.h. s = s′ . Damit ist fr : R \ {0} → R \ {0} injektiv, wegen der Endlichkeit von R und Satz 1.1.15 also auch surjektiv. Insbesondere gibt es also ein s ∈ R \ {0} mit r · s = fr (s) = 1. Dies hat zur Folge, dass für jede Primzahl p gilt, dass Z/pZ ein Körper ist. 1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN 11 Definition 1.1.16 Sei A eine Menge. Dann heißt A unendlich gdw. A nicht endlich ist. Das Auswahlaxiom wird zum Beweis der folgenden Aussage benötigt. Satz 1.1.17 Sei A eine unendliche Menge. Dann existiert eine Injektion f : N → A. Der Beweis dieses Satzes wird ebenfalls im 3. Kapitel geliefert. 1.2 Die Theorie der natürlichen Zahlen Wir hatten oben das Induktionsaxiom als die Aussage formuliert, wonach jede nichtleere Menge natürlicher Zahlen ein (im Sinne der natürlichen Ordnung < auf N) kleinstes Element besitzt. In dieser Formulierung wird das Induktionsaxiom manchmal auch als das Prinzip der kleinsten natürlichen Zahl bezeichnet. Es führt sofort zu folgendem Beweisprinzip. Sei A ⊂ N. Angenommen, (a) 0 ∈ A, und (b) für jedes n ∈ N gilt, dass aus n ∈ A auch n + 1 ∈ A folgt. Dann gilt A = N. Mit Hilfe des Prinzips der kleinsten natürlichen Zahl kann man nämlich wie folgt argumentieren. Angenommen, A $ N. Die Menge B = {n ∈ N : n ∈ / A} ist dann nichtleer, enthält also ein kleinstes Element, n0 . Da 0 ∈ A, wegen (a), gilt n0 > 0, so dass n0 = m0 + 1 gilt für den Vorgänger m0 von n0 . Wegen der Wahl von n0 folgt aus m0 < n0 , dass m0 ∈ A. Wegen (b) gilt dann aber auch n0 = m0 + 1 ∈ A. Widerspruch! Dieser “Beweis” verwendet offensichtlich strukturelle Tatsachen hinsichtlich N bezüglich < und +, z.B., dass jedes n > 0 einen Vorgänger m besitzt mit m + 1 = n und dass aus m + 1 = n folgt, dass m < n. Wenn man genau analysiert, welche strukturellen Eigenschaften für einen Beweis durch Induktion benötigt werden, gelangt man zum Begriff der fundierten Relation, der im 3. Kapitel diskutiert wird. Jedenfalls aber ist unser “Beweis” deshalb unbefriedigend, da die ihm zugrundeliegenden strukturellen Eigenschaften von N nicht vorher explizit 12 KAPITEL 1. NATÜRLICHE ZAHLEN gemacht wurden. Mit anderen Worten: Wir sollten zunächst die Theorie von N axiomatisieren, um sodann im Rahmen eines solchen Axiomensystems gültige Aussagen über N zu beweisen! Diese Maxime ist im Sinne des allgemeinen “axiomatischen” Prinzips, wonach die Methode der Mathematik darin besteht, aus Axiomen (interessante) Aussagen logisch abzuleiten. Welches ist also ein gutes Axiomensystem für die natürlichen Zahlen? Zunächst sollte es einige grundlegende arithmetische Tatsachen mitteilen. Die folgende Liste von Axiomen hat sich hier eingebürgert. 1. ∀n n + 1 6= 0. 2. ∀n∀m (n + 1 = m + 1 → n = m). 3. ∀n n + 0 = n. 4. ∀n∀m n + (m + 1) = (n + m) + 1. 5. ∀n n · 0 = 0. 6. ∀n∀m n · (m + 1) = (n · m) + n. 7. ∀n n0 = 1. 8. ∀n∀m nm+1 = nm · n. 9. ∀n∀m (n < m + 1 ↔ (n < m ∨ n = m)). 10. ∀n ¬n < 0. 11. ∀n∀m (n < m ∨ n = m ∨ m < n). Wir bezeichnen im folgenden das Axiomensystem, das aus diesen 11 Aussagen besteht, als Q. Die Axiome selbst nennen wir (Q1), (Q2), ..., (Q11). Das Axiomensystem Q ist in einer Sprache der Logik erster Stufe formuliert, die allgemein im Abschnitt 4.1 diskutiert werden wird. Die Sprache von Q, d.h. die Sprache der elementaren Arithmetik, hat die folgenden Symbole: 0 1 + · als Konstante für die Null als Konstante für die Eins als zweistelliges Funktionssymbol für die Addition als zweistelliges Funktionssymbol für die Multiplikation die Exponentenschreibweise für die Exponentiation < als zweistelliges Relationssymbol für die Kleiner-Relation Hinzu kommen allgemeine logische Symbole, von denen nicht alle in der obigen Liste von Axiomen verwendet wurden: 1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN 13 Klammern: ( und ) Junktoren: ¬ für “es ist nicht der Fall, dass”, ∧ für “und”, ∨ für “oder”, → für “wenn . . . , dann . . . ” und ↔ für “genau dann, wenn” Quantoren: der Allquantor ∀ für “für alle”, der Existenzquantor ∃ für “es gibt” Variablen: n, m, p . . . für natürliche Zahlen Gleichheitszeichen: = Die Leserin/der Leser sollte sich nun vor Augen führen, was die einzelnen Axiome von Q besagen. Das erste Axiom besagt z.B., dass für alle natürlichen Zahlen n gilt, dass n + 1 verschieden von 0 ist, d.h., dass 0 kein Nachfolger ist. Die ersten beiden Axiome von Q besagen, daß die 0 kein Nachfolger ist und dass zwei Zahlen, deren Nachfolger gleich sind, selbst gleich sind. Es läßt sich aber (z.B. mit Hilfe des Kompaktheitsatzes, siehe Kapitel 4) nicht in Q beweisen, dass jede Zahl, die verschieden von der Null ist, ein Nachfolger ist. Hierzu benötigen wir das Induktionsaxiom. Das Induktionsaxiom besagt, dass N die einzige Menge natürlicher Zahlen ist, die die Null enthält und mit jedem n auch n+1. Wenn wir versuchen, diese Aussage mit den sprachlichen Mitteln zu formulieren, die Q zur Verfügung stellt, dann scheitert dies daran, dass diese Sprache zwar Variablen n, m, p, . . . für natürliche Zahlen, nicht aber Variablen für Mengen natürlicher Zahlen bereitstellt. Nun, dem ist leicht Abhilfe zu verschaffen. Wir wollen die Sprache von Q zu einer Sprache erweitern, die zusätzlich Variablen X, Y , Z, . . . für Mengen natürlicher Zahlen zur Verfügung stellt. Da wir im Induktionsaxiom aber auch über Elemente von Mengen natürlicher Zahlen sprechen, müssen wir die Sprache weiterhin um ein zweistelliges Symbol ∈ für “ist Element von” anreichern. Dann können wir das Induktionsaxiom wie folgt formulieren. ∀X ((0 ∈ X ∧ ∀n (n ∈ X → n + 1 ∈ X)) → ∀n n ∈ X). 14 KAPITEL 1. NATÜRLICHE ZAHLEN Mit diesem Axiom und mit Hilfe von Q können wir nun versuchen, die Aussage ∀n (n 6= 0 → ∃m n = m + 1) wie folgt zu beweisen. Zu zeigen ist, dass die Menge X = {n ∈ N : n = 0 ∨ ∃m n = m + 1} gleich N ist. Es gilt sicherlich 0 ∈ X. Sei nun n ∈ N beliebig mit n ∈ X. Dann gilt auch n + 1 ∈ X, bezeugt durch m = n. Also gilt 0 ∈ X ∧ ∀n(n ∈ X → n + 1 ∈ X). Auf Grund des Induktionsaxioms gilt also ∀n n ∈ X, und damit ∀n(n 6= 0 → ∃m n = m + 1), wie gewünscht. Diese Argumentation ist nicht falsch, allerdings wird bei näherem Hinsehen klar, dass wir dabei etwas benutzen, das uns nicht durch das Induktionsaxiom plus Q geliefert wird, nämlich dass wir das Induktionsaxiom auf die Menge X = {n ∈ N : n = 0 ∨ ∃m n = m + 1} anwenden können. Mit anderen Worten, außer dem Induktionsaxiom und Q benötigen wir ein Mengenexistenzaxiom nämlich ∃X∀n(n ∈ X ↔ n = 0 ∨ ∃m n = m + 1), welches uns liefert, dass {n ∈ N : n = 0 ∨ ∃m n = m + 1} tatsächlich eine Menge ist, so dass das Induktionsaxiom auf diese Menge spezialisiert werden darf. Aus allgemeiner Sicht würde man die Variablen n, m, p, . . . (nämlich die Variablen für natürliche Zahlen) als Variablen erster Stufe bezeichnen und die Variablen X, Y, Z, . . . (nämlich die Variablen für Mengen natürlicher Zahlen) als Variablen zweiter Stufe. Einer derartigen Situation werden wir bei der Axiomatisierung von R wieder begegnen, wo man auch geneigt ist, Variablen erster Stufe (nämlich Variablen für reelle Zahlen) und Variablen zweiter Stufe (nämlich Variablen für Mengen reeller Zahlen) einzuführen. Der Preis, der für die Einführung von Variablen zweiter Stufe zu zahlen ist, ist allerdings, dass dann Mengenexistenzaxiome erforderlich sind, die nicht benötigt werden, wenn in der Sprache nur Variablen erster Stufe (nämlich Variablen 1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN 15 für Elemente des Bereichs, über den man gerade spricht, nicht für Mengen derartiger Elemente) verwendet werden. In der Zahlentheorie lassen sich Variablen zweiter Stufe plus Mengenexistenzaxiome dadurch vermeiden, dass anstelle eines Induktionsaxioms eine unendliche Menge von Induktionsaxiomen (das “Induktionsschema”) angegeben wird. Um etwa den obigen Beweis laufen zu lassen, genügt es , das Induktionsaxiom für den Fall X = {n ∈ N : n = 0 ∨ ∃m n = m + 1} als gültig vorauszusetzen. Wir können diesen Fall anders wie folgt niederschreiben. Sei ϕ(n) die Formel n = 0 ∨ ∃m n = m + 1. Dann lautet die für das obige Argument benötigte Aussage (ϕ(0) ∧ ∀n(ϕ(n) → ϕ(n + 1))) → ∀nϕ(n). Das Induktionsschema lautet nun einfach wie folgt. Für jede Formel ϕ(n, m1 , . . . , mk ) der Sprache von Q, in der die Variablen n, m1 , . . . , mk vorkommen, ist (Ind)ϕ ∀m1 . . . ∀mk ((ϕ(0, m1 , . . . , mk )∧ ∀n(ϕ(n, m1 , . . . , mk ) → ϕ(n + 1, m1 , . . . , mk ))) → ∀nϕ(n, m1 , . . . , mk )) das zu ϕ gehörige Induktionsaxiom. Das Induktionsschema ist die (unendliche) Menge aller (Ind)ϕ , wobei ϕ eine Formel der Sprache von Q ist. Wir bezeichnen Q plus dem Induktionsschema als Peano–Arithmetik, kurz: P A. In P A können wir beispielsweise die Assoziativität von + wie folgt beweisen. Satz 1.2.1 (PA) ∀n∀m∀q (m + q) + n = m + (q + n). Beweis: Wir zeigen zunächst (*) ∀m∀q (m + q) + 0 = m + (q + 0) mit Hilfe von zweimaliger Anwendung von (Q3) wie folgt: (m + q) + 0 = m + q = m + (q + 0). Sodann zeigen wir (**) ∀n(∀m∀q (m + q) + n = m + (q + n) → ∀m∀q (m + q) + (n + 1) = m + (q + (n + 1)) 16 KAPITEL 1. NATÜRLICHE ZAHLEN wie folgt: Seien n, m und q beliebig, und werde (m + q) + n = m + (q + n) vorausgesetzt. Dann ist (m + q) + (n + 1) = ((m + q) + n) + 1 wegen (Q4), welches nach Voraussetzung gleich (m + (q + n)) + 1, ist, welches nach (Q4) wiederum gleich m + ((q + n) + 1) ist. Aus (*) und (**) folgt aber nun mit Hilfe von (Ind)∀m∀q (m+q)+n=m+(q+n) sofort die zu beweisende Aussage ∀n∀m∀q (m + q) + n = m + (q + n). Die Kommutativität von + beweist sich in P A nun mit Hilfe von Satz 1.2.1 wie folgt. Satz 1.2.2 (PA) ∀n∀m n + m = m + n. Beweis: Wir zeigen zunächst (*)’ ∀m 0 + m = m + 0. Es gilt nämlich 0 + 0 = 0 + 0. Außerdem folgt aus 0 + m = m + 0 und mit Hilfe von (Q4), dass 0 + (m + 1) = (0 + m) + 1 = (m + 0) + 1. (Ind)0+m=m+0 liefert dann (*)’. Sodann zeigen wir (**)’ ∀m 1 + m = m + 1. Es gilt nämlich 1 + 0 = 0 + 1 wegen (*)’. Aus 1 + m = m + 1 folgt aber mit Hilfe von (Q4), dass 1 + (m + 1) = (1 + m) + 1 = (m + 1) + 1. Aufgrund von (Ind)1+m=m+1 ergibt sich dann (*)’. Schliesslich zeigen wir (***)’ ∀n(∀m n + m = m + n → ∀m (n + 1) + m = m + (n + 1)). Sei n beliebig, und sei ∀m n + m = m + n vorausgesetzt. Dann gilt für beliebiges m, dass (n + 1) + m = n + (1 + m) wegen Satz 1.2.1, welches wegen (**)’ gleich n + (m + 1), also mit Hilfe von (Q4) gleich (n + m) + 1 und damit nach Voraussetzung gleich (m + n) + 1 ist. Abermalige Anwendung von (Q4) liefert schliesslich, dass (n + 1) + m gleich m + (n + 1) ist. Aus (*)’ und (***)’ folgt aber mit Hilfe von (Ind)∀m(m+n=n+m) sofort ∀n∀m m + n = n + m. Es stellt sich heraus, dass in P A alle üblichen Rechenregeln und Gesetze für die natürlichen Zahlen bewiesen werden können ebenso wie viele Theoreme der Zahlentheorie. 1.2. DIE THEORIE DER NATÜRLICHEN ZAHLEN 17 Gibt es überhaupt wahre Aussagen über die natürlichen Zahlen, die in der Sprache von Q formuliert werden können und die in PA nicht beweisbar sind? Diese Frage führt zum Gödelschen Unvollständigkeitssatz, der in einführenden Logik–Kursen behandelt wird. Eine Version des Unvollständigkeitssatzes kann aus dem Kompaktheitssatz abgeleitet werden, der im letzten Kapitel bewiesen wird. 18 KAPITEL 1. NATÜRLICHE ZAHLEN Kapitel 2 Reelle Zahlen Die griechische Mathematik hatte die reellen Zahlen zwar eigentlich entdeckt, es wurde aber nicht mit ihnen gerechnet bzw. ihre Theorie entwickelt. Dies wurde erst in der Neuzeit vollzogen. 2.1 Die Konstruktion der ganzen und rationalen Zahlen Die reellen Zahlen lassen sich mit Hilfe einfacher mengentheoretischer Konstruktionen aus den natürlichen Zahlen gewinnen. Wir benötigen hierfür lediglich geordnete Paare, Äquivalenzrelationen und Folgen. Wir gehen dabei in drei Schritten vor: wir konstruieren zuerst die Menge Z der ganzen Zahlen, sodann die Menge Q der rationalen Zahlen und schließlich die Menge R der reellen Zahlen. Definition 2.1.1 Sei A eine beliebige Menge. Eine zweistellige Relation R auf A ist eine Äquivalenzrelation gdw. gilt: (Reflexivität) xRx für alle x ∈ A, (Symmetrie) xRy =⇒ yRx für alle x, y ∈ A, und (Transitivität) xRy ∧ yRz =⇒ xRz für alle x, y, z ∈ A. Wenn R eine Äquivalenzrelation auf A ist, dann heißt für x ∈ A die Menge [x]R = {y ∈ A : yRx} die (R–)Äquivalenzklasse von x. In der Situation von Definition 2.1.1 gilt y ∈ [x]R gdw. yRx gdw. [x]R = [y]R für alle x, y ∈ A. Wir können Z als Menge von Äquivalenzklassen von Paaren natürlicher Zahlen wie folgt konstruieren. 19 20 KAPITEL 2. REELLE ZAHLEN Seien (n, m) und (r, s) geordnete Paare natürlicher Zahlen. Wir identifizieren (n, m) mit (r, s) gdw. die Differenz von n und m gleich der Differenz von r und s ist, d.h. wir definieren eine zweistellige Relation R durch (n, m)R(r, s) ⇔ n + s = r + m. Offensichtlich ist R eine Äquivalenzrelation. Wir schreiben [n, m] = {(r, s) : (r, s)R(n, m)} für die R–Äquivalenzklasse von (n, m). Für n ≥ m ist (n, m) = (n − m, 0), und für n ≤ m ist (n, m) = (0, m − n), wodurch die nach links und rechts unendliche “Folge” . . . , [0, 2], [0, 1], [0, 0], [1, 0], [2, 0], . . . sämtliche R–Äquivalenzklassen durchläuft. Unsere Vorstellung ist, dass [n, 0] für die ganze Zahl +n und [0, n] für die ganze Zahl −n steht. Die Menge aller R–Äquivalenzklassen bezeichnen wir mit Z und nennen sie die Menge der ganzen Zahlen. Wir schreiben [n, m] < [r, s] ⇔ n + s < r + m, wodurch < eine strikte lineare Ordnung auf Z ist. Wir können mit unseren ganzen Zahlen auch in gewohnter Weise rechnen. Hierzu definieren wir die Addition auf Z durch [n, m] + [r, s] = [n + r, m + s]. Man sieht leicht, dass + assoziativ und kommutativ auf Z ist. Darüberhinaus gilt [n, m] + [0, 0] = [n, m] und [n, m] + [m, n] = [0, 0]. Somit ist Z bezüglich + eine abelsche Gruppe. Bis auf Isomorphie ist Z die unendliche zyklische Gruppe. In der angegebenen Art lässt sich übrigens aus einer beliebigen Halbgruppe H eine Gruppe G mit H ⊂ G konstruieren. 2.1. DIE KONSTRUKTION DER GANZEN UND RATIONALEN ZAHLEN21 Wir definieren weiterhin die Multiplikation auf Z durch [n, m] · [r, s] = [n · r + m · s, n · s + m · r]. Dann gilt [n, m] · [1, 0] = [n, m], aber [1, 0] und [0, 1] sind die einzigen ganzen Zahlen [n, m], für die [r, s] mit [n, m] · [r, s] = [1, 0] existiert. Wir schreiben von nun an +n (oder einfach n) für die ganze Zahl [n, 0] und −n für die ganze Zahl [0, n]. Wir konstruieren nun Q als Menge von Äquivalenzklassen von Paaren gewisser ganzer Zahlen wie folgt. Seien (n, m) und (r, s) geordnete Paare ganzer Zahlen, wobei m 6= 0 6= s. Wir identifizieren (n, m) mit (r, s) gdw. der Quotient aus n und m gleich dem Quotienten aus r und s ist, d.h. wir definieren eine zweistellige Relation S durch (n, m)S(r, s) ⇔ n · s = r · m. Offensichtlich ist S eine Äquivalenzrelation auf der Menge aller Paare ganzer Zahlen, deren zweite Komponente nicht 0 ist. (Würden wir als zweite Komponente die 0 zulassen, so wäre S nicht transitiv, da dann für alle (n, m) gelten würde, dass (n, m)S(0, 0), aber z.B. gilt (1, 2)S(1, 3) nicht. Die Division durch 0 ist nicht möglich!) Für n, m ∈ Z, m 6= 0, schreiben wir hn, mi = {(r, s) : r, s ∈ Z, s 6= 0, (r, s)S(n, m)} für die S–Äquivalenzklasse von (n, m). Unsere Vorstellung ist, dass hn, mi für n steht. Die Menge aller S–Äquivalenzklassen bezeichnen die rationale Zahl m wir mit Q und nennen sie die Menge der rationalen Zahlen. Zu beliebigen r, s ∈ Z mit s 6= 0 existieren offenbar r ′ , s′ ∈ Z mit s′ > 0 und (r, s)S(r ′ , s′ ). Für n, m, r, s ∈ Z mit m > 0 und s > 0 schreiben wir hn, mi < hr, si ⇔ n · s < r · m, wodurch < eine strikte lineare Ordnung auf Q ist. Wir können mit unseren rationalen Zahlen wieder in gewohnter Weise rechnen. 22 KAPITEL 2. REELLE ZAHLEN Wir definieren die Addition auf Q durch hn, mi + hr, si = hn · s + r · m, m · si. Wieder ist + assoziativ und kommutativ auf Q. Es gilt hn, mi + h0, 1i = hn, mi und hn, mi + h−n, mi = h0, 1i. Somit ist Q bezüglich + eine abelsche Gruppe. Wir definieren die Multiplikation auf Q durch hn, mi · hr, si = hn · r, m · si. Man sieht leicht, dass · assoziativ und kommutativ auf Q ist. Außerdem gilt hn, mi · h0, 1i = h0, 1i. und hn, mi · h1, 1i = hn, mi. für alle n, m ∈ Z mit m 6= 0, und es gilt hn, mi · hm, ni = h1, 1i. für alle n, m ∈ Z mit n 6= 0 6= m. Somit ist Q \ {h0, 1i} bezüglich · eine abelsche Gruppe. n Wir schreiben von nun an m für die rationale Zahl hn, mi, wobei n, m ∈ Z, m 6= 0. n n | einer rationalen Zahl m werde wie folgt definiert. Es sei, Der Betrag | m n n für n, m ∈ Z mit m 6= 0, | m | derjenige der beiden Werte m und −n m , welcher > 01 ist. Es ist leicht zu verifizieren, dass sowohl Z als auch Q abzählbare Mengen sind. Im Falle von Z lässt sich eine Bijektion f : N → Z wie folgt angeben. Es sei f (2n) = n und f (2n + 1) = −n. Im Falle von Q ist es etwas trickreicher, eine Bijektion g : N → Q anzugeben, welches wir wie folgt leisten. Sei, für m ∈ N, Pm die Menge aller n ∈ N, n ≥ 2, so dass pm (die mte Primzahl) die kleinste Primzahl ist, die n teilt. (Z.B. ist P1 = {3, 9, 15, . . . }.) Weiter sei für m ∈ N, m ≥ 1, Tm die Menge aller n ∈ N, n ≥ 1, so dass 1 der größte gemeinsame Teiler von m und n ist. (Z.B. ist T3 = {1, 2, 4, 5, . . . }.) 2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN 23 Betrachten wir zunächst die Menge Q+ der positiven rationalen Zahlen. n darstelJedes Element von Q+ lässt sich eindeutig als “gekürzter Bruch” m len, wobei m ≥ 1 und n ∈ Tm . Wir können nun eine Bijektion ϕ : Q+ → N n folgendermaßen angeben. Sei rs ∈ Q+ gegeben, und sei m die eindeutige n r r gekürzte Darstellung von s , d.h. m = s , m ≥ 1 und n ∈ Tm . Wir setzen dann r ϕ( ) = fPm−1 (fT−1 (n)) − 2. m s Hierbei sind fTm : N → Tm und fPm+1 : N → Pm+1 die “natürlichen Aufzählungen” von Tm und Pm+1 wie in Abschnitt 1.1. Wenn also n das kte n dem kten Element von Pm−1 Element von Tm ist, dann ordnen wir rs = m zu. Dabei subtrahieren wir 2, um die Zahlen 0 und 1 ebenfalls in den Wertebereich von ϕ zu bekommen. Da N \ {0, 1} die disjunkte Vereinigung aller Pm , m ≥ 2, ist, und da sowohl fTm : N → Tm als auch fPm : N → Pm bijektiv sind, ist leicht zu verifizieren, dass die so definierte Abbildung ϕ : Q+ → N bijektiv ist. Wir erhalten in derselben Weise eine bijektive Abbildung ψ : Q− → N der Menge der negativen rationalen Zahlen auf N. Schließlich können wir eine Bijektion g : N → Q definieren, indem wir setzen: g(0) = 01 , g(2n + 1) = ϕ−1 (n) und g(2n + 2) = ψ −1 (n) für n ∈ N. Die so definierte Bijektion g : N → Q respektiert natürlich in keinster Weise die natürlichen Ordnungen auf N bzw. Q. Eine Bijektion, die diese Ordnung respektieren würde, d.h. einen Ordnungsisomorphismus von N und Q, kann es auch gar nicht geben. Im Unterschied zu N ist Q, zusammen mit <, nämlich “dicht” im folgenden Sinne. Sei < eine strikte lineare Ordnung auf einer Menge A. Dann heißt < dicht gdw. für alle x, y ∈ A mit x < y ein z ∈ A existiert mit x < z und z < y. r Die natürliche Ordnung < auf Q ist dicht in diesem Sinne, dass für m n, s ∈ m r m·s+r·n m r Q mit n < s die rationale Zahl 2·n·s echt zwischen n und s liegt. Man kann zeigen, dass Q zusammen mit < bis auf Isomorphie die einzige dichte lineare Ordnung auf einer abzählbaren Menge ist, die keine “Endpunkte” besitzt (siehe Übungsaufgabe ?????). 2.2 Die Konstruktion der reellen Zahlen Wir wenden uns nun der Konstruktion der reellen Zahlen zu. Diese können wir als Äquivalenzklassen gewisser Folgen rationaler Zahlen gewinnen. Eine rationale Folge ist eine (beliebige) Abbildung x : N → Q. Wir schreiben dabei auch xn anstelle von x(n) und (xn : n ∈ N) anstelle von x. Eine 24 KAPITEL 2. REELLE ZAHLEN rationale Folge (xn : n ∈ N) heißt Cauchy–Folge gdw. für alle (rationalen) ε > 0 ein n0 ∈ N existiert, so dass für alle n, m ≥ n0 gilt. |xm − xn | < ε. Eine rationale Folge (xn : n ∈ N) heißt Nullfolge gdw. für alle (rationalen) ε > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 gilt: |xn | < ε. Beispielsweise 1 : n ∈ N) eine Nullfolge. Sei nämlich ε = rs > 0, wobei etwa ist die Folge ( n+1 r, s ∈ N, r 6= 0 6= s. Setze n0 = s, dann gilt für alle n ≥ n0 : s < n0 + 1 ≤ 1 n + 1 ≤ r · (n + 1), also n+1 < rs . Jede Nullfolge ist eine Cauchy–Folge. Sei nämlich (xn : n ∈ N) Nullfolge. Sei ε > 0, und sei n0 ∈ N so, dass für alle n ≥ n0 gilt: |xn | < 12 · ε. Dann gilt für alle n, m ≥ n0 1 1 |xm − xn | ≤ |xm | + |xn | < ε + ε = ε. 2 2 (Die erste Ungleichung benutzt die “Dreiecksungleichung”.) Eine Folge (xn : n ∈ N) heißt konstant gdw. ein y ∈ Q existiert, so dass xn = y für alle n ∈ N gilt. Wir schreiben in diesem Falle auch (x : n ∈ N) für (xn : n ∈ N). Die Differenz zweier Folgen (xn : n ∈ N) und (yn : n ∈ N) wird als Folge der punktweisen Differenzen definiert, d.h. (xn : n ∈ N) − (yn : n ∈ N) = (xn − yn : n ∈ N). Eine Folge (xn : n ∈ N) konvergiert gegen x ∈ Q gdw. die Differenz von (xn : n ∈ N) und (x : n ∈ N) eine Nullfolge ist. In diesem Falle schreiben wir x = lim xn . n→∞ Wenn (xn : n ∈ N) gegen x ∈ Q konvergiert, dann ist (xn : n ∈ N) eine Cauchy–Folge. Dies ergibt sich aus dem obigen Argument für Nullfolgen, da immer xn − xm = (xn − x) − (xm − x). Wir wollen nun sehen, dass es Cauchy–Folgen gibt, für die keine rationale Zahl existiert, gegen die diese Cauchy–Folge konvergiert. Lemma 2.2.1 Es gibt kein x ∈ Q mit x2 = 2. Beweis: Sei rs ∈ Q. Sei n die kleinste positive Zahl, für die ein (eindeutiges!) r m ∈ Z existiert mit m n = s . Für diese Wahl von n und m gilt dann, dass 2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN 25 m oder n ungerade ist. Wären nämlich beide gerade, etwa m = 2m und ′ n = 2n′ , dann n′ < n und rs = m n′ im Widerspruch zur Wahl von n. m 2 2 2 Wir zeigen jetzt ( rs )2 = ( m n ) 6= 2. Angenommen, ( n ) = 2, d.h. m = 2 ′ 2n . Dann ist m gerade, da andernfalls für m = 2m + 1 gelten müsste, dass 2n2 = m2 = 4(m′ 2 + m′ ) + 1 was ein Widerspruch ist, da die linke Seite dieser Gleichung gerade und die rechte ungerade ist. Wenn aber m gerade ist, etwa m = 2m′ , dann folgt aus m2 = 2n2 , dass 2n2 = m2 = 4m′ 2 , also n2 = 2m′ 2 . Eine Wiederholung des obigen Arguments liefert dann, dass auch n gerade sein muss. Damit ist sowohl m als auch n gerade. Widerspruch! Derselbe Beweis zeigt, dass, falls n ∈ N keine Quadratzahl ist, kein x ∈ Q mit x2 = n existiert. Wir definieren nun einen Cauchy–Folge (xn : n ∈ N), die, würde sie gegen ein x ∈ Q konvergieren, gegen ein x mit x2 = 2 konvergieren müsste. Lemma 2.2.2 Es gibt eine Cauchy–Folge (xn : x ∈ N), zu der kein x ∈ Q existiert, so dass (xn : n ∈ N) gegen x konvergiert. Beweis: Wir konstruieren “rekursiv” zwei Cauchy–Folgen (xn : n ∈ N) und (yn : n ∈ N) wie folgt. Wir setzen x0 = 0 und y0 = 2. Offensichtlich gilt 0 ≤ x0 < y0 und x20 < 2 < y02 . Nehmen wir nun an, die rationalen Zahlen xn und yn sind bereits konstruiert, so dass 0 ≤ xn < yn und x2n < 2 < yn2 . Sei dann z = 21 · (yn + xn ). Falls z 2 < 2, dann setzen wir xn+1 = z und yn+1 = yn ; falls z 2 > 2, dann setzen wir xn+1 = xn und yn+1 = z. (Da mit xn und yn auch z rational ist, kann wegen Lemma 2.2.1 nicht z 2 = 2 gelten.) In jedem Falle gilt für die rationalen Zahlen xn+1 und yn+1 dann wieder 0 ≤ xn+1 < yn+1 und 2 . x2n+1 < 2 < yn+1 Damit sind (xn : n ∈ N) und (yn : n ∈ N) konstruiert. Durch Induktion 1 . Für n = 0 gilt nämlich ergibt sich, dass für alle n ∈ N gilt: yn − xn = 2n−1 1 1 y0 − x0 = 2 = 2−1 , und wenn yn − xn = 2n−1 , dann gilt yn+1 − xn+1 = 1 1 1 1 1 2 · (yn − xn ) = 2 · 2n−1 = 2n = 2(n+1)−1 . Nach Konstruktion gilt offensichtlich auch 0 ≤ x0 ≤ x1 ≤ x2 ≤ . . . und 2 = y0 ≥ y1 ≥ y2 ≥ . . . . Sowohl (xn : n ∈ N) als auch (yn : n ∈ N) sind dann Cauchy–Folgen. Sei nämlich ε > 0. Sei n0 ∈ N so, dass 2n0 −1 > 1ε (ein derartiges n0 existiert, da für alle n ∈ N gilt: 2n ≥ n). Dann gilt für alle n, m ≥ n0 : xn0 ≤ xn ≤ yn0 und 26 KAPITEL 2. REELLE ZAHLEN xn0 ≤ xm ≤ yn0 und daher |xm − xn | ≤ yn0 − xn0 = 1 < ε. 2n0 −1 Also ist (xn : n ∈ N) Cauchy–Folge. Dasselbe Argument zeigt, dass auch (yn : n ∈ N) Cauchy–Folge ist. Angenommen nun, (xn : n ∈ N) konvergiert gegen x ∈ Q. Da x0 ≤ x1 ≤ x2 ≤ . . . , gilt dann x ≥ xn für alle n ∈ N (wäre x < xn für ein n ∈ N, dann hätten wir |xm − x| ≥ |xn − x| für alle m ≥ n). Weiterhin würde auch (yn : n ∈ N) gegen x konvergieren. Sei nämlich ε > 0 und sei n0 so, dass 1 < ε. Dann gilt für n ≥ n0 : 2n0 −1 |yn − x| ≤ yn − xn ≤ yn0 − xn0 = 1 2n0 −1 < ε. Außerdem folgt aus y0 ≥ y1 ≥ y2 ≥ . . . analog zu eben, dass x ≤ yn für alle n ∈ N gilt. Wir haben nun 0 ≤ xn ≤ x ≤ yn für alle x ∈ N, also auch x2n ≤ x2 ≤ yn2 für alle n ∈ N. Sei ε > 0. Sei n0 so, dass für alle n ≥ n0 gilt: yn − xn < 14 · ε. Dann gilt 2 − x2n ≤ yn2 − x2n = (yn − xn )(yn + xn ) ≤ (yn − xn ) · 2yn < 41 · ε · 4 = ε, und damit x2n ≥ 2 − ε. (Die Folge (x2n : n ∈ N) konvergiert damit gegen 2.) Also gilt x2 ≥ 2 − ε für alle ε > 0, woraus x2 ≥ 2 folgt. Völlig analog zeigt man x2 ≤ 2. Also gilt x2 = 2. Dies ist ein Widerspruch! Lemma 2.2.2 besagt, dass Q nicht vollständig ist: es gibt in Q verlaufende Cauchy–Folgen, die nicht in Q konvergieren. Wir werden nun Q “vervollständigen”. Wir definieren dazu zunächst eine Äquivalenzrelation auf der Menge der (rationalen) Cauchy–Folgen. Seien (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen. Wir schreiben dann (xn : n ∈ N)E(yn : n ∈ N), falls die Differenz von (xn : n ∈ N) und (yn : n ∈ N) eine Nullfolge ist. Offensichtlich ist E reflexiv und symmetrisch. Die Transitivität von E ergibt sich folgendermaßen. Sei (xn : n ∈ N)E(yn : n ∈ N) und (yn : n ∈ N)E(zn : n ∈ N). Sei ε > 0, und sei n0 ∈ N so, dass für alle n ≥ n0 gilt: |yn − xn | < 21 ε und |zn − yn | < 12 ε. Dann gilt für alle n ≥ n0 : 1 1 |zn − xn | ≤ |zn − yn | + |yn − xn | < ε + ε = ε 2 2 2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN 27 mit Hilfe der Dreiecksungleichung. Also ist auch die Differenz von (xn : n ∈ N) und (zn : n ∈ N) eine Nullfolge. Wenn (xn : n ∈ N) eine rationale Cauchy–Folge ist, dann schreiben wir nun [xn : n ∈ N] = {(yn : n ∈ N) : (yn : n ∈ N)E(xn : n ∈ N)} für die E–Äquivalenzklasse von (xn : n ∈ N). Unsere Vorstellung ist, dass [xn : n ∈ N] diejenige reelle Zahl ist, gegen die (xn : n ∈ N) konvergiert. Die Menge aller E–Äquivalenzklassen bezeichnen wir mit R und nennen sie die Menge der reellen Zahlen. Die Menge Q der rationalen Zahlen ist in natürlicher Weise in der Menge R der reellen Zahlen enthalten, indem wir x ∈ Q mit [x : n ∈ N] identifizieren. Für x ∈ Q schreiben wir im Folgenden auch x anstelle von [x : n ∈ N]. Lemma 2.2.3 Seien (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen. Dann gilt genau eine der folgenden Aussagen: (1) (xn : n ∈ N)E(yn : n ∈ N) (2) es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn > xn + ε (3) es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : xn > yn + ε. Beweis: Offensichtlich schließen sich (1), (2) und (3) gegenseitig aus. Wir zeigen, dass (1) gilt, falls sowohl (2) als auch (3) falsch sind. Wenn (2) und (3) falsch sind, dann gibt es für jedes n ∈ N und für jedes ε ∈ Q, ε > 0, ein m ≥ n mit ym ≤ xm + ε, und für jedes n ∈ N und für jedes ε ∈ Q, ε > 0, gibt es ein m ≥ n mit xm ≤ ym + ε. Sei nun ε ∈ Q, ε > 0. Sei n0 ∈ N so, dass für alle n, m ≥ n0 : |xm − xn | < 13 ε und |ym − yn | < 31 ε. Sei m ≥ n0 , so dass ym ≤ xm + 31 ε, d.h. ym − xm ≤ 31 ε. Dann gilt für alle n ≥ n0 : y n − xn = y n − y m + y m − xm + xm − xn ≤ |yn − ym | + ym − xm + |xm − xn | < 13 ε + 31 ε + 13 ε = ε. 28 KAPITEL 2. REELLE ZAHLEN Analog zeigt man, dass für alle n ≥ n0 : xn − yn < ε. Damit haben wir ein n0 ∈ N gefunden, so dass für alle n ≥ n0 gilt: |yn − xn | < ε. Damit ist die Differenz von (xn : n ∈ N) und (yn : n ∈ N) eine Nullfolge und es gilt (1). Definition 2.2.4 Seien (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen. Wir schreiben dann [xn : n ∈ N] < [yn : n ∈ N] gdw. es ein n0 ∈ N und ein ε ∈ Q, ε > 0, gibt, so dass für alle n ≥ n0 : yn > xn + ε. Wir müssen zeigen, dass < wohldefiniert ist. Die definierende Tatsache (“es gibt n0 ∈ N und ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn > xn + ε”) nimmt Bezug auf einen Repräsentanten der Äquivalenzklasse [xn : n ∈ N] (nämlich (yn : n ∈ N)). Wir müssen zeigen, dass der Wahrheitswert der definierenden Tatsache nicht von der Wahl der Repräsentanten abhängt. Dies erfolgt im Wesentlichen in gleicher Weise wie der Beweis zu Lemma 2.2.3 Lemma 2.2.5 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N) und (yn′ : n ∈ N) rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und (yn : n ∈ N)E(yn′ : n ∈ N). Dann sind die folgenden Aussagen äquivalent. (1) Es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0 so, dass für alle n ≥ n0 : yn > xn + ε. (2) Es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0 so, dass für alle n ≥ n0 : yn′ > x′n + ε. Beweis: Aus Symmetriegründen genügt es zu zeigen, dass (2) aus (1) folgt. Sei also (1) angenommen, und werde dies durch n0 ∈ N und ε ∈ Q, ε > 0, bezeugt. Sei m0 ∈ N so, dass für alle n ≥ n0 gilt: |x′n − xn | < 3ε und |yn′ − yn | < 3ε . Sei o.B.d.A. m0 ≥ n0 . Dann gilt für alle n ≥ m0 : yn′ − x′n = (yn − xn ) − (yn − yn′ ) − (x′n − xn ) ≥ (yn − xn ) − |yn − yn′ | − |x′n − xn | > ε − 3ε − 3ε = 3ε . Damit gilt (2), bezeugt durch m0 und 3ε . Wir haben gezeigt, dass < eine strikte lineare Ordnung auf R ist. Die rationalen Zahlen sind im folgenden Sinne “dicht” in den reellen Zahlen enthalten: 2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN 29 Satz 2.2.6 Seien x, y ∈ R. Dann existiert ein z ∈ Q mit x < z und z < y. Beweis: Sei x = [xn : n ∈ N] und y = [yn : n ∈ N], wobei (xn : n ∈ N), (yn : n ∈ N) rationale Cauchy–Folgen sind. Da x < y, gibt es n0 ∈ N und ε ∈ Q, ε > 0, so dass für alle n ≥ n0 : yn > xn + ε. Sei m0 ≥ n0 so, dass für alle n, m ≥ m0 gilt: |xm − xn | < 3ε und |ym − yn | < 3ε . Setze z = 21 · (xm0 + ym0 ). Dann gilt für alle n ≥ m0 : z − xn = z − xm0 + xm0 − xn ≥ z − xm0 − |xm0 − xn | = 12 · (ym0 − xm0 ) − |xn0 − xn | ≥ 21 ε − 31 ε = 61 ε, d.h. es gilt z ≥ xn + 16 ε für alle n ≥ m0 . Dies zeigt x = [xn : n ∈ N] < [z : n ∈ N]. Analog zeigt man [z : n ∈ N] < [yn : n ∈ N] = y. Korollar 2.2.7 R ist “archimedisch” im folgenden Sinne. Sei x ∈ R. Dann existiert ein n ∈ N mit x < n. Beweis: Der Fall x ≤ 0 ist trivial. Nehmen wir also an, es gelte x > 0. Sei z ∈ Q, so dass z > 0 und z < x1 . Es gibt m, n ∈ N mit m > 0 und n > 0, so m 1 dass z = m n . Es gilt dann n < x , also m · x < n. Daraus folgt x < n. Mit den reellen Zahlen lässt sich in gewohnter Weise rechnen. Wir definieren die Addition auf R durch [xn : n ∈ N] + [yn : n ∈ N] = [xn + yn : n ∈ N], wobei (xn : n ∈ N) und (yn : n ∈ N) rationale Cauchy–Folgen sind. Lemma 2.2.8 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N), (yn′ : n ∈ N) rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und (yn : n ∈ N)E(yn′ : n ∈ N). Dann sind auch (xn + yn : n ∈ N), (x′n + yn′ : n ∈ N) rationale Cauchy–Folgen und es gilt (xn + yn : n ∈ N)E(x′n + yn′ : n ∈ N). Beweis: Siehe Übungsaufgabe ????? Damit ist die Addition auf R wohldefiniert. Man sieht leicht, dass + assoziativ und kommutativ auf R ist. Außerdem gilt [xn : n ∈ N] + [0 : n ∈ N] = [xn : n ∈ N] 30 KAPITEL 2. REELLE ZAHLEN und [xn : n ∈ N] + [−xn : n ∈ N] = [0 : n ∈ N] für alle rationalen Cauchy–Folgen (xn : n ∈ N), wodurch R bezüglich + eine abelsche Gruppe ist. Wir definieren die Multiplikation auf R durch [xn : n ∈ N] · [yn : n ∈ N] = [xn · yn : n ∈ N], wobei (xn : n ∈ N) und (yn : n ∈ N) rationale Cauchy–Folgen sind. Lemma 2.2.9 Seien (xn : n ∈ N), (x′n : n ∈ N), (yn : n ∈ N) und (yn′ : n ∈ N) rationale Cauchy–Folgen mit (xn : n ∈ N)E(x′n : n ∈ N) und (yn : n ∈ N)E(yn′ : n ∈ N). Dann sind auch (xn · yn : n ∈ N), (x′n · yn′ : n ∈ N) rationale Cauchy–Folgen und es gilt (xn · yn : n ∈ N)E(x′n · yn′ : n ∈ N) Beweis: Siehe Übungsaufgabe ????? Damit ist die Multiplikation auf R wohldefiniert. Man sieht leicht, dass · assoziativ und kommutativ auf R ist. Außerdem gilt [xn : n ∈ N] · [1 : n ∈ N] = [xn : n ∈ N] für alle rationalen Cauchy–Folgen (xn : n ∈ N). Sei weiterhin (xn : n ∈ N) eine rationale Cauchy–Folge, [xn : n ∈ N] keine Nullfolge, d.h. es gibt ein n0 ∈ N und ein ε ∈ Q, ε > 0, so dass |xn | > ε für alle n ≥ n0 . Sei dann (yn : n ∈ N) definiert durch yn = 1, falls n < n0 , und yn = x1n , falls n ≥ n0 . Dann ist (yn : n ∈ N) eine rationale Cauchy–Folge. Sei nämlich ε ∈ Q, ε > 0. Sei m0 ≥ n0 so, dass für alle m, n ≥ m0 gilt: |xm − xn | < ε3 ; dann gilt für |xn −xm | ε3 alle m, n ≥ m0 : |ym − yn | = | x1m − x1n | = |x = ε. Außerdem sieht < ε·ε m |·|xn | man leicht, dass (xn · yn : n ∈ N)E(1 : n ∈ N) = 1. Somit ist R \ {0} bezüglich · eine abelsche Gruppe. Ebenso leicht lassen sich die Distributionsgesetze für + und · nachrechnen, wodurch R ein Körper ist. Wir wollen nun die Vollständigkeit von R nachrechnen. Die Vollständigkeit von R besagt, dass jede Cauchy–Folge, die in R verläuft, einen Grenzwert in R besitzt. Hierzu müssen wir zunächst die Begriffe “Cauchy–Folge” und “Konvergenz” in natürlicher Weise auf R ausdehnen. 2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN 31 Definition 2.2.10 Sei (xn : n ∈ N) eine Folge reeller Zahlen. Dann heißt (xn : n ∈ N) eine Cauchy–Folge gdw. für alle ε > 0 ein n0 ∈ N existiert, so dass für alle n, m ≥ n0 gilt: |xm − xn | < ε. Da wegen Satz 2.2.6 zu jedem ε ∈ R mit ε > 0 ein ε′ ∈ Q mit ε′ < ε und ε′ > 0 existiert, spielt es keine Rolle, ob die Zahl ε in Definition 2.2.10 als rational oder reell angenommen wird. Definition 2.2.11 Sei (xn : n ∈ N) eine Folge reeller Zahlen und sei x eine reelle Zahl. Dann konvergiert (xn : n ∈ N) gegen x, in Zeichen lim xn = x, n→∞ gdw. für alle ε > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 gilt: |x − xn | < ε. Sei (xn : n ∈ N) eine reelle Folge, und sei x ∈ R. Angenommen, es gilt limn→∞ xn = x. Zu vorgelegtem ε > 0 sei n0 ∈ N so, dass |x − xn | < 2ε für alle n ≥ n0 . Dann gilt für alle n, m ≥ n0 : |xm − xn | = |x − xn + xm − x| ≤ |x − xn | + |xm − x| < ε 2 + ε 2 = ε. Wenn also (xn : n ∈ N) gegen x konvergiert dann ist (xn : n ∈ N) eine Cauchy–Folge. Satz 2.2.12 Sei (xn : n ∈ N) eine reelle Cauchy–Folge. Dann gibt es eine reelle Zahl x, so dass (xn : n ∈ N) gegen x konvergiert. Beweis: Für jedes n ∈ N sei yn eine rationale Zahl mit xn < yn und yn < 1 . (Ein solches yn existiert wegen Satz 2.2.6). xn + n+1 Wir zeigen zunächst, dass (yn : n ∈ N) eine Cauchy–Folge ist. Sei ε > 0 vorgelegt. Sein n0 ∈ N so, dass n01+1 < 3ε und für alle m, n ≥ n0 : |ym − yn | = |ym − xm + xm − xn + xn − yn | ≤ |ym − xm | + |xm − xn | + |xn − yn | 1 1 < m+1 + 3ε + n+1 ε ε ε < 3 + 3 + 3 = ε. Die Folge (yn : n ∈ N) ist also in der Tat eine rationale Cauchy–Folge. 32 KAPITEL 2. REELLE ZAHLEN Wir zeigen nun, dass (xn : n ∈ N) gegen die reelle Zahl [yn : n ∈ N] konvergiert. Wir schreiben y = [yn : n ∈ N]. Wir müssen zeigen, dass für jedes ε > 0 ein n0 ∈ N existiert, so dass für alle m ≥ n0 gilt: |y − xm | < ε. Sei also ε > 0 vorgelegt. ε 2 Behauptung. Es gibt ein n0 ∈ N, so dass für alle m ≥ n0 gilt: |ym −y| < 1 und m+1 < 2ε . Sei zunächst die Behauptung als richtig angenommen. Dann gilt für m ≥ n0 , mit Hilfe der Dreiecksungleichung: |xm − y| = |xm − ym + ym − y| ≤ 1 + 2ε < |xm − ym | + |ym − y| < m+1 ε 2 + ε 2 = ε. Es genügt also, die Behauptung zu beweisen. Sei m0 so, dass für alle m, k ≥ m0 gilt: |ym − yk | < 4ε . Sei m ≥ m0 , und sei δ = 4ε . Dann gilt für alle k ≥ m0 : yk + ε > ym + δ 2 und ε > yk + δ. 2 Nach Definition 2.2.4 bedeutet dies: ym + ym = [ym : n ∈ N] < [yn + und y = [yn : n ∈ N] < [ym + ε ε : n ∈ N] = y + 2 2 ε ε : n ∈ N] = ym + , 2 2 d.h. ε |ym − y| < . 2 Aufgrund von Korollar 2.2.7 existiert ein k0 , so dass für alle m ≥ k0 gilt: ε 1 m+1 < 2 . Wenn dann n0 das Maximum von m0 und k0 ist, dann leistet n0 das für die Behauptung Gewünschte. Definition 2.2.13 Seien x, y ∈ R mit x < y. Wir schreiben dann (x, y) = {z ∈ R : x < z ∧ z < y} 2.2. DIE KONSTRUKTION DER REELLEN ZAHLEN 33 für das offene Intervall zwischen x und y, und wir schreiben [x, y] = {z ∈ R : x ≤ z ∧ z ≤ y} für das abgeschlossene Intervall zwischen x und y. Seien (xn : n ∈ N), (yn : n ∈ N) Folgen reeller Zahlen mit xn <Tyn , xn+1 ≥ xn und yn+1 ≤ yn für alle n ∈ N. Dann gilt nicht notwendig, dass T n∈N (xn , yn ) 6= 1 für alle n ∈ N, dann ∅. (Wenn etwa xn = 0 und yn = n+1 T ist n∈N (xn , yn ) = ∅.) Andererseits gilt in dieser Situation immer, dass n∈N [xn , yn ] 6= ∅. Dies ist die Aussage des Intervallschachtelungsprinzips. Definition 2.2.14 Seien (xn : n ∈ N), (yn : n ∈ N) Folgen reeller Zahlen mit xn < yn für alle n ∈ N. Dann heißt die Folge ([xn , yn ] : n ∈ N) abgeschlossener Intervalle eine (abgeschlossene) Intervallschachtelung, falls xn ≤ xn+1 und yn+1 ≤ yn für alle n ∈ N. Satz 2.2.15 (Intervallschachtelungsprinzip) Sei ([xn , yn ] : n ∈ N) eine Intervallschachtelung. Dann gilt \ [xn , yn ] 6= ∅. n∈N Beweis: Zunächst ist leicht zu sehen, dass (xn : n ∈ N) eine Cauchy–Folge ist. Andernfalls gäbe es nämlich ein ε > 0, so dass für alle n0 ∈ N natürliche Zahlen n, m ≥ n0 mit |xm − xn | ≥ ε existieren, was sofort liefert, dass (xn : n ∈ N) unbeschränkt ist. Ebenso sieht man, dass (yn : n ∈ N) eine Cauchy–Folge ist. Seien x = limn→∞ xn und y = limn→∞ yn . Es gilt x ≤ y, da ansonsten ein n ∈ N mit yn < xn existieren müsste. T Damit gilt nun auch x ∈ [xn , yn ] für alle m ∈ N, d.h. n∈N [xn , yn ] 6= ∅. Satz 2.2.16 (Supremumsprinzip) Sei A ⊂ R eine nichtleere beschränkte Menge reeller Zahlen. Dann existiert ein x ∈ R mit: (a) für alle y ∈ A gilt y ≤ x, und (b) wenn z ∈ R so ist, dass y ≤ z für alle y ∈ A gilt, dann ist x ≤ z. 34 KAPITEL 2. REELLE ZAHLEN Beweis: Wir definieren eine Intervallschachtelung ([xn , yn ] : n ∈ N) wie folgt. Sei x0 ∈ A, und sei y0 so, dass y < y0 für alle y ∈ A gilt. Nehmen wir an, xn und yn seien definiert, wobei gilt: es gibt ein y ∈ A mit xn ≤ y und y < yn für alle y ∈ A. Sei z = 21 · (xn + yn ). Wir setzen xn+1 = xn und yn+1 = z falls y < z für alle y ∈ A, und wir setzen xn+1 = z und yn+1 = yn , falls es ein y ∈ A mit z ≤ y gibt. Sei x = limn→∞ xn . Es lässt sich dann leicht nachrechnen, dass x wie gewünscht ist. Das Intervallschachtelungsprinzip kann in sehr einfacher Weise benutzt werden, um die Überabzählbarkeit von R zu zeigen. Satz 2.2.17 (Cantor) Es gibt keine Surjektion f : N → R. Beweis: Sei f : N → R. Wir definieren eine Intervallschachtelung ([xn , yn ] : n ∈ N) wie folgt. Sei x0 = 0 < 1 = y0 . Angenommen xn und yn seien bereits konstruiert. Falls f (n) 6∈ [xn , yn ], dann setzen wir xn+1 = xn und yn+1 = yn . Falls f (n) ∈ [xn , yn ], dann sei ε = 13 ·(yn −xn ). Mindestens eine der Intervalle [xn , xn + ε], [xn + ε, xn + 2 · ε], [xn + 2 · ε, yn ] enthält dann f (n) nicht. Sei k ∈ {0, 1, 2} minimal, so dass f (n) 6∈ [xn + k · ε, xn + (k + 1) · ε]. Wir setzen dann xn+1 = xn + k · ε und yn+1 = xn + (k + 1) · ε. Dies definiert eine Intervallschachtelung ([xn , yn ] T : n ∈ N) so, dass für jedes n ∈ N gilt: f (n) 6∈ [xn+1 , yn+1 ]. Wenn also x ∈ n∈N [xn , yn ], dann ist x 6∈ {f (n) : n ∈ N}, und f kann nicht surjektiv sein. 2.3 Die Theorie der reellen Zahlen Wir wollen nun, ähnlich wie dies in Abschnitt 1.2 für die natürlichen Zahlen geschehen ist, ein Axiomensystem für die reellen Zahlen angeben. Im Unterschied zur Peano–Arithmetik von Abschnitt 1.2 werden wir die Axiome für R jedoch unter Zuhilfenahme einfacher mengentheoretischer Prinzipien aus der Gültigkeit von PA für N beweisen können, da die reellen Zahlen mit Hilfe einfacher mengentheoretischer Operationen aus den natürlichen Zahlen konstruiert worden sind. Zunächst sind die reellen Zahlen ein Körper, d.h. es gelten die nachfolgenden Axiome: 2.3. DIE THEORIE DER REELLEN ZAHLEN 35 (1) ∀x∀yx + y = y + x (2) ∀x∀yx · y = y · x (3) ∀x∀y∀z(x + y) + z = x + (y + z) (4) ∀x∀y∀z(x · y) · z = x · (y · z) (5) ∀x∀y∀zx · (y + z) = (x · y) + (x · z) (6) ∀xx + 0 = x (7) ∀xx · 1 = x (8) ∀x∃yx + y = 0 (9) ∀x(x 6= 0 → ∃yx · y = 1) Hierbei besagen die Axiome (1), (3), (6) und (8), dass R bezüglich + eine abelsche Gruppe mit 0 als neutralem Element ist, und die Axiome (2), (4), (7) und (9) besagen, dass R \ {0} bezüglich · eine abelsche Gruppe mit 1 als neutralem Element ist. Die Axiome (1) und (2) sind die Kommutativ- und die Axiome (3) und (4) die Assoziativgesetze. Axiom (5) ist das Distributivitätsgesetz. Darüber hinaus ist R sogar ein geordneter Körper, d.h. es gelten weiterhin die nachfolgenden Axiome: (10) ∀x∀y(x < y ∨ x = y ∨ y < x) (11) ∀x∀y(x < y ∨ x = y → ¬y < x) (12) ∀x∀y(x < y ∨ y < x → x 6= y) (13) ∀x∀y(x = y ∨ y < x → ¬x < y) (14) ∀x∀y∀z(x < y ∧ y < z → x < z) (15) ∀x∀y∀z(x < y → x + z < y + z) (16) ∀x∀y∀z(x < y ∧ 0 < z → x · z < y · z) Die Axiome (10) – (13) drücken aus, dass für reelle Zahlen x, y genau eine der drei Aussagen x < y, x = y, y < x zutrifft (Trichotomie). Axiom (14) drückt die Transitivität von < aus, und die Axiome (15) und (16) sind die Monotoniegesetze. 36 KAPITEL 2. REELLE ZAHLEN Wir bezeichnen das Axiomensystem, das durch die obigen Axiome (1) – (16) gegeben ist, mit GK (für “geordnete Körper”). Die Sprache, in der GK formuliert ist, hat neben den allgemeinen logischen Symbolen (siehe Abschnitt 1.2) und Variablen x, y, z, . . . für reelle Zahlen die folgenden Symbole: 0 als Konstante für die Null 1 als Konstante für die Eins + als zweistelliges Funktionssymbol für die Addition · als zweistelliges Funktionssymbol für die Multiplikation < als zweistelliges Relationssymbol für die Kleiner-Relation Man überzeugt sich leicht, dass es mehrere (zueinander nicht isomorphe) Strukturen (d.h. geordnete Körper ) gibt, die die Axiome (1) – (16) erfüllen. Beispielsweise ist neben R auch Q ein geordneter Körper. √ Weiterhin ist jeder Zwischenkörper K mit Q ⊂ K ⊂ R (etwa K = Q[ 2]) ein geordneter Körper. Um die reellen Zahlen genauer zu charakterisieren, benötigen wir also (ein) weitere(s) Axiom(e). Wir müssen nämlich ausdrücken, dass die reellen Zahlen das Supremumsprinzip 2.2.16 erfüllen. Dabei geraten wir wieder in dieselbe Situation wie anlässlich der Formulierung des Induktionsaxioms in Abschnitt 1.2: entweder wir reichern die obige Sprache durch Hinzunahme von Variablen für Mengen reeller Zahlen und des Symbols ∈ an und formulieren mit dieser Hilfe das Supremumsprinzip als ein Axiom, wobei wir dann aber wieder zusätzliche Mengenexistenzaxiome benötigen, oder wir formulieren das Supremumsprinzip als Schema. Im ersten Fall können wir wie folgt verfahren. Das Supremumsprinzip wird als folgende Aussage genommen. (17) ∀X(X 6= ∅ ∧ ∃x∀y(y ∈ X → y < x) → ∃x (∀y(y ∈ X → y < x)∧ ∀z(∀y(y ∈ X → y < x) → z < x ∨ z = x))). √ Beispielsweise benötigen wir, um die Existenz von 2 zu zeigen, das Supremumsprinzip (17) für X = {y ∈ R : y · y < 2}. Allgemeiner scheinen wir lediglich die folgenden Fälle des Supremumsprinzips zu benötigen. 2.3. DIE THEORIE DER REELLEN ZAHLEN 37 Sei ϕ(y, x1 , . . . , xn ) eine Formel der Sprache von GK, in der die Variablen y, x1 , ..., xn vorkommen. Dann ist das zu ϕ(y, x1 , . . . , xn ) gehörige Supremumsprinzip die Aussage (17)ϕ ∀x1 . . . ∀xn (∃yϕ(y, x1 , . . . , xn ) ∧ ∃x∀y(ϕ(y, x1 , . . . , xn ) → y < x) → ∃x (∀y(ϕ(y, x1 , . . . , xn ) → y < x)∧ ∀z(∀y(ϕ(y, x1 , . . . , xn ) → y < x) → z < x ∨ z = x))). Wir bezeichnen das durch GK und alle (17)ϕ gegebene Axiomensystem mit VGK (für “vollständige geordnete Körper”). Wir werden später diskutieren, ob VGK die reellen Zahlen (“bis auf Isomorphie”) festlegen kann. 38 KAPITEL 2. REELLE ZAHLEN Kapitel 3 Mengen 3.1 Mengen, Klassen und Grothendieck–Universen Wir haben oben, insbesondere anlässlich der Konstruktion der reellen Zahlen aus den natürlichen Zahlen, die Nützlichkeit mengentheoretischer Konstruktionen sehen können. Es stellt sich nun heraus, dass sämtliche Objekte bzw. Strukturen der Mathematik mengentheoretisch konstruiert werden können. Einigen Aspekten hiervon wollen wir in diesem Abschnitt nachgehen. Einer der grundlegenden Begriffe der Mathematik ist der der Funktion. Eine Funktion f von A nach B weist jedem Element a von A genau ein Element f (a) von B zu. Wir können Funktionen als Mengen von geordneten Paaren mit bestimmten Eigenschaften ansehen. Wir müssen uns dann zunächst mit dem Begriff des geordneten Paares beschäftigen. Zu gegebenen Objekten x und y wollen wir das “geordnete Paar” (x, y) so konstruieren, dass für alle x, y, x′ , y ′ gilt: (*) (x, y) = (x′ , y ′ ) ⇔ x = x′ und y = y ′ . Wir könnten das geordnete Paar als vordefinierten Grundbegriff einführen, von dem wir die Eigenschaft (*) verlangen (so verfährt etwa Bourbaki). Wir können das geordnete Paar aber auch mengentheoretisch definieren. Hierzu gibt es mehrere Möglichkeiten, von denen wir die folgende wählen. Definition 3.1.1 Seien x, y beliebige Objekte. Das geordnete Paar von x und y ist dann die Menge (x, y), die als {{x}, {x, y}} definiert ist. Wir beweisen nun (*). 39 40 KAPITEL 3. MENGEN Lemma 3.1.2 Seien x, y, x′ , y ′ beliebige Objekte. Dann gilt (x, y) = (x′ , y ′ ) ⇔ x = x′ ∧ y = y ′ . Beweis: Die Gültigkeit von “⇐” ist trivial. Wir zeigen nun “⇒”. Sei also (x, y) = (x′ , y ′ ) vorausgesetzt. Wir müssen zeigen, dass x = x′ und y = y ′ . Zunächst bemerken wir Folgendes. Im Falle x = y gilt (x, y) = {{x}, {x, y}} = {{x}}, (x, y) besitzt also ein Element, nämlich {x}. Im Falle x 6= y dagegen besitzt (x, y) = {{x}, {x, y}} zwei verschiedene Elemente, nämlich {x} und {x, y} (wäre {x} = {x, y} dann hätten wir y ∈ {x}, also y = x). Analoges gilt natürlich auch für (x′ , y ′ ). Dies zeigt, dass aus (x, y) = (x′ , y ′ ) folgt, dass entweder sowohl x = y als auch x′ = y ′ gilt oder dass sowohl x 6= y als auch x′ 6= y ′ gilt. 1. Fall. x = y und x′ = y ′ . Dann gilt {{x}} = (x, y) = (x′ , y ′ ) = {{x′ }}. Daraus folgt x = x′ , also auch y ′ = x′ = x = y. 2. Fall. x 6= y und x′ 6= y ′ . Dann besitzt (x, y) die zwei verschiedenen Elemente {x} und {x, y}, und (x′ , y ′ ) besitzt die zwei verschiedenen Elemente {x′ } und {x′ , y ′ }. Da (x, y) = (x′ , y ′ ), gilt zunächst {x} ∈ (x′ , y ′ ) = {{x′ }, {x′ , y ′ }}, also {x} = {x′ } oder {x} = {x′ , y ′ }. Letzteres ist aber unmöglich, da {x} einelementig und (wegen x′ 6= y ′ ) {x′ , y ′ } zweielementig ist. Also gilt {x} = {x′ }, woraus x = x′ folgt. Sodann gilt wegen (x, y) = (x′ , y ′ ) auch {x, y} ∈ (x′ , y ′ ) = {{x′ }, {x′ , y ′ }}, also {x, y} = {x′ } oder {x, y} = {x′ , y ′ }. Ersteres ist wieder unmöglich, da {x, y} (wegen x 6= y) zweielementig und {x′ } einelementig ist. Also gilt {x, y} = {x′ , y ′ }. Insbesondere gilt y = y ′ oder y = x′ . Letzteres ergibt aber wegen x = x′ (wie bereits gezeigt wurde), dass y = x, was x 6= y widerspricht. Also gilt y = y ′ . Wir haben damit x = x′ und y = y ′ gezeigt. Mit Hilfe des Begriffs des geordneten Paares können wir nun sehr leicht den Begriff der Funktion einführen. Definition 3.1.3 Seien A, B beliebige Mengen. Das Kreuzprodukt, A × B, von A und B ist dann die Menge aller geordneten Paare (a, b), wobei a ∈ A und b ∈ B gilt. Jede Teilmenge R von A × B wird als Relation auf A, B bezeichnet. Eine Funktion von A nach B ist dann eine Relation R auf A, B, so dass für jedes a ∈ A genau ein b ∈ B mit (a, b) ∈ R existiert. Üblicherweise 3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN 41 benutzen wir die Buchstaben f, g, . . . , F, . . . , ϕ, . . . für Funktionen. Wenn f eine Funktion von A nach B ist, so heißt A der Urbildbereich von f und B der Wertebereich von f und wir schreiben f : A → B. Selbstverständlich haben wir oben bereits mit Funktionen gearbeitet, wir wissen nun aber, wie wir diese als mengentheoretische Objekte konstruieren können. Mit Hilfe mengentheoretischer Operationen können wir leicht sehr große Objekte konstruieren. Satz 2.2.17 hatte bereits gezeigt, dass es “mehr” reelle als natürliche Zahlen gibt. Ähnlich kann man zeigen, dass es zu jeder beliebigen Menge A eine Menge B gibt, die “größer” ist als A. Definition 3.1.4 Sei A eine beliebige Menge. Die Potenzmenge von A, P(A), ist die Menge aller Teilmengen von A. Satz 3.1.5 (Cantor). Es gibt keine Surjektion f : A → P(A). Beweis: Sei f : A → P(A) gegeben. Sei X0 = {a ∈ A : a ∈ / f (a)} ⊂ A. Angenommen, es gibt ein a0 ∈ A mit f (a0 ) = X0 . Dann gilt a0 ∈ f (a0 ) = X0 gdw. a0 ∈ / f (a0 ). Widerspruch! Also existiert kein a ∈ A mit f (a) = X0 und f ist nicht surjektiv. Es gibt also keine “größte” Menge, da es auf Grund dieses Satzes von Cantor zu jeder Menge A eine “größere” Menge (nämlich P(A)) gibt. Insbesondere gibt es keine Menge aller Mengen. Angenommen, es gäbe eine Menge V , in der jede Menge als Element enthalten ist. Dann gilt P(V ) ⊂ V , da jedes Element von P(V ), d.h. jede Teilmenge von V , selbst Menge und damit in V als Element enthalten ist. Damit existiert aber offensichtlich eine Surjektion f von V auf P(V ), indem wir etwa f (a) = a für a ⊂ V und f (a) = ∅ ⊂ V für a 6⊂ V setzen. Dies widerspricht Satz 3.1.5. Es gibt weitere Argumente, die zeigen, dass es keine Menge V aller Mengen gibt. Ein solches ist etwa die “Russellsche Antinomie”. Nehmen wir nochmals an, es gäbe eine Menge V , in der jede Menge als Element enthalten ist. Dann gäbe es auch die Menge R = {a ∈ V : a ∈ / a} 42 KAPITEL 3. MENGEN aller Mengen, die sich nicht selbst als Element enthalten. Wir haben dann aber R ∈ R gdw. R ∈ / R. Widerspruch! Die mengentheoretischen Argumente, die wir in diesem und den letzten Abschnitten vollzogen haben, waren durchweg “naiv”, d.h. sie wurden nicht auf der Basis eines Axiomensystems vorgenommen. Auch die Mengenlehre hat eine Axiomatisierung erfahren, und all unsere Argumente könnten auf der Basis dieser Axiomatisierung nachvollzogen werden. Wir wollen uns hier darauf beschränken, die Standardaxiomatisierung der Mengenlehre mit einigen erläuternden Kommentaren anzugeben. Wir werden diese Axiomatisierung jedoch nicht benutzen, sondern auch in Zukunft weiter mengentheoretisch naiv argumentieren. Allerdings wollen wir zeigen, dass das angegebene Axiomensystem ein Modell besitzt, wenn daraus das Unendlichkeitsaxiom entfernt wird. Das Standard–Axiomensystem der Mengenlehre ist das Zermelo–Fraenkelsche System, ZFC. Die Sprache L∈ der Mengenlehre besitzt weder Konstanten noch Funktionssymbole und als einiges Relationssymbol das zweistellige ∈ für “ist Element von”. ZFC besitzt die folgenden Axiome. Das erste Axiom, das Extensionalitätsaxiom, besagt, dass zwei Mengen gleich sind gdw. sie dieselben Elemente besitzen. (Ext) ∀x∀y(x = y ↔ ∀z(z ∈ x ↔ z ∈ y)). Das nächste Axiom, das Fundierungsaxiom, besagt, dass jede nichtleere Menge ein ∈–minimales Element besitzt. (F und) ∀x(∃y y ∈ x → ∃y(y ∈ x ∧ ¬∃z(z ∈ y ∧ z ∈ x))). Mit Hilfe von Abkürzungen schreibt sich dies besser. Wir schreiben x = ∅ für ¬∃y y ∈ x, x 6= ∅ für ¬x = ∅, x ∩ y = ∅ für ¬∃z(z ∈ x ∧ z ∈ y). Dann liest sich (F und) wie folgt: (F und) ∀x(x 6= ∅ → ∃y ∈ x y ∩ x = ∅). Wir schreiben x = {y, z} für y ∈ x ∧ z ∈ x ∧ ∀u ∈ x(u = y ∨ u = z). Das Paarmengenaxiom lautet (P aar) ∀x∀y∃z z = {x, y}. 3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN Wir schreiben x = S 43 y für ∀z(z ∈ x ↔ ∃u ∈ y z ∈ u). Das Vereinigungsaxiom lautet S (V er) ∀x∃y y = x. Wir schreiben x ⊂ y für ∀z ∈ x z ∈ y und x = P(y) für ∀z(z ∈ x ↔ z ⊂ y). Das Potenzmengenaxiom besagt (P ot) ∀x∃y y = P(x). Die Aussonderungsaxiome werden benötigt, um die Existenz definierbarer Teilmengen von einer gegebenen Menge zu zeigen. Sei ϕ eine L∈ –Formel, in der (o.B.d.A.) die Variablen x, v1 , . . . , vp vorkommen. Das zu ϕ gehörige Aussonderungsaxiom lautet: (Ausϕ ) ∀v1 . . . ∀vp ∀a∃b∀x(x ∈ b ↔ x ∈ a ∧ ϕ). Die (unendliche!) Menge aller Aussonderungsaxiome wird auch als Aussonderungsschema bezeichnet. Sei ϕ eine L∈ –Formel, in der (o.B.d.A.) die Variablen x, y, v1 , . . . , vp vorkommen. Das zu ϕ gehörige Ersetzungsaxiom lautet1 (Ersϕ ) ∀v1 . . . ∀vp (∀x ∈ a∃y ′ ∀y(y = y ′ ↔ ϕ) → ∃b∀y(y ∈ b ↔ ∃x ∈ a ϕ)). Die (wiederum unendliche!) Menge aller Ersetzungsaxiome wird auch als Ersetzungsschema bezeichnet. Aus dem Aussonderungsschema folgt die Existenz der leeren Menge, indem ϕ als x 6= x gewählt wird. Mit Hilfe des Paarmengen– und des Vereinigungsmengenaxioms zeigt sich dann leicht die Existenz der Mengen ∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, usw. Das Auswahlaxiom lautet (AC) ∀x(x 6= ∅ ∧ ∀y ∈ x∀y ′ ∈ x(y ∩ y ′ 6= ∅ ↔ y = y ′ ) → (∃z∀y ∈ x∃uz ∩ y = {u}). AC besagt also, dass jede nichtleere Menge, die aus paarweise disjunkten Mengen besteht, eine “Auswahlmenge” besitzt. Wir bezeichnen die Menge der Aussagen Ext, F und, P aar, V er, P ot, Ausϕ , Ersϕ (für beliebige ϕ) 1 o.B.d.A. komme y ′ in ϕ gar nicht vor. 44 KAPITEL 3. MENGEN und AC als ZFC−∞ . Hierbei steht ZF für “Zermelo-Fraenkel”, C für “choice” (Auswahl) und “−∞” für die Abwesenheit des Unendlichkeitsaxioms. Letzterem wollen wir uns nun zuwenden. S Wir schreiben x = y ∪ z für x = {y, z}. Wir schreiben y = x + 1 für y = x ∪ {x}. Definition 3.1.6 Eine Menge A heißt induktiv gdw. ∅ ∈ A und für jedes x ∈ A auch x ∪ {x} ∈ A gilt. Das Unendlichkeitsaxiom besagt: (∞) ∃x (x ist induktiv). Das System ZF C (Zermelo–Fraenkel, mit Auswahlaxiom) entsteht aus ZF C −∞ durch Hinzunahme des Unendlichkeitsaxioms. Wir wollen nun die natürlichen Zahlen benutzen, um ein “Modell” der Mengenlehre, genauer: von ZF C −∞ , zu konstruieren. Wir fassen natürliche Zahlen wie folgt als “Mengen” auf. Sei n ∈ N. Schreibe n in Dualdarstellung, d.h. n = Σmi ·2i , wobei mi ∈ {0, 1} für alle i. Wir fassen dann n als die Menge aller i auf, so dass mi = 1. Anders gesagt: wir definieren eine zweistellige Relation E ⊂ N × N auf N wie folgt. Seien k, n ∈ N. Dann gelte kEn gdw. mk = 1, wobei n = Σmi · 2i die Dualdarstellung von n ist. Wenn M 6= ∅ und R ⊂ M × M , so ist (M ; R) ein Modell von L∈ , indem wir für x, y ∈ M die Aussage x ∈ y für wahr im Modell (M ; R) erklären gdw. xRy. Ein derartiges Modell von L∈ kann natürlich ein “Nichtstandard”Modell sein insofern die Wahrheit von x ∈ y in dem Modell nichts mit der Wahrheit, ob tatsächlich x ein Element von y ist, zu tun haben muss. Insbesondere ist jedenfalls nun (N; E) Modell von L∈ . Der folgende Satz besagt, dass jede Aussage von ZFC−∞ wahr im Modell (N; E) ist. Für “atomare” Aussagen der Gestalt x ∈ y haben wir bereits erklärt, was es bedeutet, dass diese wahr in einem Modell (M ; R) ist. Für kompliziertere Aussagen erklären wir dies rekursiv: ¬ ϕ ist wahr in (M ; R) gdw. ϕ nicht wahr in (M ; R) ist. ϕ ∧ ψ ist wahr in (M ; R) gdw. sowohl ϕ als auch ψ wahr in (M ; R) sind. ϕ ∨ ψ ist wahr in (M ; R) gdw. ϕ oder ψ wahr in (M ; R) ist. ϕ → ψ ist wahr in (M ; R) gdw. ϕ nicht wahr in (M ; R) ist oder wenn ψ wahr in (M ; R) ist. 3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN 45 ϕ ↔ ψ ist wahr in (M ; R) gdw. gilt: ϕ ist wahr in (M ; R) gdw. ψ wahr in (M ; R) ist. ∃vϕ(v) ist wahr in (M ; R) gdw. es ein x ∈ M gibt, so dass ϕ(x) wahr in (M ; R) ist. ∀vϕ(v) ist wahr in (M ; R) gdw. für alle x ∈ M gilt, dass ϕ(x) wahr in (M ; R) ist. Satz 3.1.7 (N; E) ist Modell von ZFC−∞ . Beweis: Offensichtlich gilt (N; E) |= (Ext). Seien k, n ∈ N. Dann folgt aus (N; E) |= k ∈ n, dass k < n : dies folgt einfach daraus, dass 2k > k für alle k ∈ N. Sei also n ∈ N so, dass (N; E) |= n 6= ∅ (d.h. n 6= 0!). Sei k < n das kleinste k′ mit (N; E) |= k′ ∈ n. Dann gilt (N; E) |= k ∩ n = ∅. Wir haben (N; E) |= (F und) gezeigt. (N; E) |= (P aar) zeigt sich wie folgt. Seien n, m ∈ N. Sei q= 2n + 2m , falls n 6= m 2n , falls n = m. Dann gilt offensichtlich (N; E) |= q = {n, m}. Wir zeigen (N; E) |= (V er) folgendermaßen. Sei n ∈ N. Sei n = Σmi · 2i die Dualdarstellung von n, und sei, für mi = 1, i = Σmik · 2k die Dualdarstellung von i. Wir setzen dann m= X 2k . mik = 1 für ein i mit mi = 1 S Offensichtlich gilt (N; E) |= m = n. (N; E) |= (P ot) zeigt man mit Hilfe derselben Methode, die auch (N; E) |= V er zeigte. Sei n ∈ N. Sei n = Σmi · 2i die Dualdarstellung von n. Für ein m ∈ N mit Dualdarstellung Σm′i · 2i gilt offenbar (N; E) |= m ⊂ n gdw. für alle i, m′i = 1 ⇒ mi = 1. Sei also I die (endliche!) Menge aller i mit mi = 1 und sei P die Menge aller Teilmengen von I. Für I ∗ ∈ P sei nI ∗ = Σi∈I ∗ 2i . 46 KAPITEL 3. MENGEN (Offensichtlich ist I ∗ 7→ nI ∗ injektiv.) Schließlich sei m= X 2nI ∗ . I ∗ ⊂I Es ist leicht zu sehen, dass (N; E) |= m = P(n). Wir zeigen (N; E) |= (Ausϕ ) für ein beliebiges ϕ wie folgt. Seien n1 , . . . , np , a ∈ N, wobei X a= mi · 2i . Setze dann X b= 2i . mi = 1 ϕ(i, n1 , . . . , np )ist wahr in (N; E) Wir zeigen (N; E) |= (Ersϕ ) für ein beliebiges ϕ wie folgt. Sei ϕ wie im zu ϕ gehörigen Ersetzungsaxiom gegeben. Seien n1 , . . . , np ∈ N und sei a ∈ N. Wir setzen voraus, dass (N; E) |= ∀x ∈ a∀y∀y ′ (ϕ(x, y, n1 , . . . , np ) ∧ ϕ(x, y ′ , n1 , . . . , np ) → y = y ′ ). Sei (N; E) |= k ∈ a, d.h. für die Dualdarstellung a = Σmi · 2i von a gilt mk = 1. Sei l(k) das eindeutige derartige l mit (N; E) |= ϕ(k, l, n1 , . . . , np ). Setze dann b= X 2l(k) . (N; E) |= k ∈ a Es ist leicht zu sehen, dass (N; E) |= ∀y(y ∈ b ↔ ∃x ∈ aϕ). Wir zeigen (N; E) |= (AC) wie folgt. Sei n ∈ N. Sei (N; E) |= n 6= ∅, d.h. für die Dualdarstellung n = Σmi · 2i von n gilt, dass ein i mit mi = 1 existiert. Für jedes i mit mi = 1 sei i = Σmik · 2k die Dualdarstellung von i. Unter der Voraussetzung (N; E) |= ∀y ∈ n∀y ′ ∈ n(y ∩ y ′ 6= ∅ ↔ y = y ′ ) 3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN 47 gilt dann, dass aus i 6= j mit mi = 1 = mj folgt: mik 6= mjk für alle k. Außerdem ist für alle i mit mi = 1 eines der mik gleich 1. Sei für mi = 1 k(i) das kleinste k mit mik = 1. Es ist dann leicht zu sehen, dass X 2k(i) mi =1 bezeugt, dass im Sinne von (N; E) n das Auswahlaxiom erfüllt. Sei (N; E) |= m = n + 1, d.h. (N; E) |= m = n ∪ {n}. Dann gilt insbesondere (N; E) |= n ∈ m, also ist n < 2n ≤ m. Damit kann (N; E) nicht das Unendlichkeitsaxiom erfüllen. Wir wollen nun umgekehrt nachvollziehen, dass auf der Basis von ZFC Objekte geformt werden können, deren Gesamtheit beweisbar (in ZFC) ein Modell von PA ist. Mit anderen Worten: So wie sich mit Hilfe mengentheoretischer Methoden aus den natürlichen Zahlen die ganzen, rationalen und reellen Zahlen produzieren ließen, so können mit denselben mengentheoretischen Methoden auch die natürlichen Zahlen selbst in einer Weise produziert werden, dass die grundlegenden Aussagen über sie beweisbar werden. Die heute übliche Art und Weise, natürliche Zahlen als Mengen darzustellen, geht auf von Neumann zurück. Die grundlegende Idee ist sehr einfach. Für jedes n ∈ N gibt es genau n natürliche Zahlen, die kleiner als n sind, nämlich 0, 1, . . . , n−1. Die Idee ist nun, die natürliche Zahl n mit der Menge {0, 1, . . . , n − 1} zu identifizieren. Damit erhält man 0 = ∅, 1 = {∅}, (∗) 2 = {∅, {∅}}, 3 = {∅, {∅}, {∅, {∅}}}, usw. Mit dieser Idee gilt offenbar m < n gdw. m ∈ n für beliebige m, n ∈ N. Allgemein ausgedrückt wollen wir 0 mit ∅ und n+1 mit n∪{n} identifizieren. (Diese Identifikationsvorschrift ist rekursiv: wenn wir n kennen, dann kennen wir auch n + 1 = n ∪ {n}.) Wir wollen nun eine Menge und auf ihr eine Ordnungsrelation und Operationen präzise so definieren, dass wir für dieses “Modell” die Gültigkeit von PA beweisen können. Die Menge sollte aus genau den Mengen der Gestalt (*) bestehen. Hierzu ist es nützlich, den Begriff der “induktiven Menge” von Definition 3.1.6 zur Verfügung zu haben. Das Unendlichkeitsaxiom von ZFC besagt, dass es eine induktive Menge gibt. Wir schreiben im Folgenden 48 KAPITEL 3. MENGEN wieder x + 1 für x ∪ {x}, für beliebige Mengen x, und nennen x + 1 den Nachfolger von x. Eine Menge A ist dann induktiv gdw. ∅ ∈ A und A unter der Nachfolgeroperation x 7→ x + 1 abgeschlossen ist. Definition 3.1.8 Die Menge ω der von–Neumann–Zahlen ist definiert als der Durchschnitt aller induktiven Mengen, d.h. x ∈ ω ⇔ ∀A(A induktiv ⇒ x ∈ A). Lemma 3.1.9 ω ist induktiv. Beweis: Da ∅ in jeder induktiven Menge als Element enthalten ist, liegt ∅ auch in ω. Sei nun x ∈ ω. Sei A eine induktive Menge. Dann gilt also x ∈ A, und damit auch x + 1 ∈ A. Also ist x + 1 in jeder induktiven Menge und es gilt x + 1 ∈ ω. Wir haben gezeigt, dass ω induktiv ist. Eine direkte Folge von Definition 3.1.8 ist: Lemma 3.1.10 Sei A ⊂ ω induktiv. Dann gilt A = ω. Dies hat zur Konsequenz, dass für ω das (zweitstufige) Induktionsaxiom (und damit auch das erststufige Induktionsschema) gilt. Die Menge ω wurde gerade so definiert, dass für sie dieses Axiom zutrifft! Es bleibt zu zeigen, dass auch die übrigen Aussagen von PA für ω gelten. Hierzu müssen wir natürlich jeweils zuerst erklären, wie wir <, +, · und die Exponentiation interpretieren wollen. (Q1) ist offensichtlich: Für jedes x ist x+ 1 = x∪ {x} = 6 ∅, da x ∈ x∪ {x}. Wir zeigen nun (Q2). Hierzu ist zu zeigen, dass für von–Neumann–Zahlen x und y aus x + 1 = x ∪ {x} = y ∪ {y} = y + 1 folgt, dass x = y. Angenommen, es gilt x ∪ {x} = y ∪ {y}, aber x 6= y. Dann gilt zunächst x ∈ y ∪ {y}, also sogar x ∈ y (da x ∈ / {y}), und ebenso gilt y ∈ x ∪ {x}, also sogar y ∈ x (da y ∈ / {x}). Dies widerspricht aber dem Fundierungsaxiom F und. Betrachten wir nämlich die Menge {x, y}, so gilt sowohl y ∈ x ∩ {x, y} als auch x ∈ y ∩ {x, y}, so dass {x, y} kein ∈–minimales Element besitzt. Dieser Widerspruch zeigt, dass aus x + 1 = y + 1 bereits x = y folgen muss. Die Aussagen (Q3) – (Q8) sind einfach zu zeigen, wenn wir die Interpretation von +, · und der Exponentiation für von–Neumman–Zahlen so festlegen, wie dies durch (Q3) – (Q8) verlangt wird. Für von–Neumann–Zahlen x und y wollen wir x < y durch x ∈ y interpretieren (siehe oben). Wir zeigen jetzt (Q9). Sei zunächst x < y + 1, d.h. x ∈ y ∪ {y}. Dann gilt offenbar x ∈ y, d.h. x < y, oder x ∈ {y}, d.h. x = y. Umgekehrt folgt 3.1. MENGEN, KLASSEN UND GROTHENDIECK–UNIVERSEN 49 aus x < y oder x = y ebenso leicht x < y + 1. Die Gültigkeit von (Q10) ist klar, da x ∈ / ∅ für alle x. Um schließlich (Q11) zu beweisen, müssen wir das folgende Lemma zeigen. Lemma 3.1.11 Seien x, y von–Neumann–Zahlen. Dann gilt x ∈ y oder x = y oder y ∈ x. Beweis: Der Beweis erfolgt durch doppelte Induktion. Wir zeigen, dass A = {x ∈ ω : ∀y ∈ ω(x ∈ y ∨ x = y ∨ y ∈ x)} induktiv ist. Behauptung 1: ∅ ∈ A. Hierzu ist zu zeigen, dass B = {y ∈ ω : ∅ ∈ y ∨ ∅ = y ∨ y ∈ ∅} induktiv ist. Dies lässt sich aber sehr leicht nachrechnen. Behauptung 2: Aus x ∈ A folgt x + 1 ∈ A. Sei x ∈ A. Wir zeigen dann, dass C = {y ∈ ω : x + 1 ∈ y ∨ x + 1 = y ∨ y ∈ x + 1} induktiv ist. Da B aus Behauptung 1 induktiv ist, gilt zunächst ∅ ∈ z + 1 für alle z ∈ ω. Damit haben wir zunächst ∅ ∈ C. Sei nun y ∈ C. Dann gilt (1) x + 1 ∈ y oder x + 1 = y oder y ∈ x + 1. Wegen x ∈ A gilt außerdem (2) x ∈ y + 1 oder x = y + 1 oder y + 1 ∈ x. Aus x + 1 ∈ y oder x + 1 = y folgt x + 1 ∈ y + 1 = y ∪ {y}, und ebenso folgt aus x = y + 1 oder y + 1 ∈ x, dass y + 1 ∈ x + 1 = x ∪ {x}. Wenn also weder x + 1 ∈ y + 1 noch y + 1 ∈ x + 1 gilt, dann haben wir wegen (1) y ∈ x + 1 = x ∪ {x} und wegen (2) x ∈ y + 1 = y ∪ {y}. Falls dann zusätzlich x + 1 6= y + 1 (d.h. x 6= y!) gilt, dann haben wir sogar y ∈ x und x ∈ y. Dies widerspricht wie oben dem Fundierungsaxiom F und. 50 KAPITEL 3. MENGEN Wir haben gezeigt, dass y + 1 ∈ C. Dies beweist die Behauptung 2 und damit das Lemma. Wir bezeichneten das Axiomensystem, das durch die obigen Axiome gegeben ist, mit ZFC. Die Sprache, in der ZFC formuliert ist, hat neben den allgemeinen logischen Symbolen (siehe Abschnitt 1.2) und Variablen x, y, z, . . . für Mengen ein zweistelliges Prädikatssymbol ∈ für “ist Element von”. Ähnlich wie im Falle von PA oder VGK hätten wir auch ZFC so formulieren können, dass neben Variablen für Mengen auch Variablen für beliebige Kollektionen von Mengen, die üblicherweise Klassen genannt werden, zugelassen werden. Dies hätte zu vereinfachten Formulierungen des Aussonderungsschemas und des Ersetzungsschemas geführt. Allerdings wären dann wie im Falle von PA und VGK Klassenexistenzaxiome erforderlich, damit die neuen Formulierungen von Aussonderung und Ersetzung zur Wirkung kommen. Wir reden hier mit Bedacht von “Klassen” und nicht von “Mengen”. Beliebige Gesamtheiten natürlicher Zahlen sind Mengen (so hatten wir diese auch in Abschnitt 1.2 angesprochen) und beliebige Gesamtheiten reeller Zahlen sind ebenfalls Mengen (und so hatten wir diese in Abschnitt 2.3 angesprochen). Wir haben aber oben gesehen, dass nicht jede Gesamtheit von Mengen wieder eine Menge sein kann, da z.B. die Gesamtheit aller Mengen keine Menge ist. Beliebige derartige Gesamtheiten (oder Kollektionen) werden oben als “Klassen” bezeichnet. Es gibt Klassen, wie etwa die Klasse aller Mengen, die selbst keine Mengen sind; derartige Klassen heißen echte Klassen. Ein anderes Beispiel für eine echte Klasse ist die Klasse aller Gruppen. Wäre die Klasse aller Gruppen eine Menge, so gäbe es auch die Menge aller Gruppen mit einem Element, und daraus könnte man dann sehr leicht die Menge aller Mengen formen. (Wir verwenden hier, dass wir für eine beliebige Menge x trivial {x} als Gruppe G auffassen können, indem wir x als das neutrale und einzige Element von G auffassen.) In vielen Überlegungen hätte man aber gerne etwa die “Menge” aller Gruppen (oder aller Körper, aller Vektorräume, aller topologischen Räume, . . . ) zur Verfügung. Derartige Mengen, die tatsächlich Mengen sind und gleichzeitig Substitute für die Klasse aller Mengen eines bestimmten Typs, erhält man, indem man die Existenz von Grothendieck–Universen fordert. Ein Grothendieck–Universum ist eine Menge U , die unter den Operationen von ZFC (also Paarmengen–, Vereinigungsmengen–, Potenzmengenbildung und Aussonderung und Ersetzung) abgeschlossen ist und gleichzeitig die Menge N der natürlichen Zahlen als Element enthält. 3.2. DAS AUSWAHLAXIOM 51 Definition 3.1.12 Sei U eine nichtleere Menge. Dann heißt U ein Grothendieck–Universum gdw. folgende Aussagen gelten. (1) Aus x ∈ U folgt x ⊂ U , (2) aus x ∈ U folgt P(x) ∈ U , (3) aus x, y ∈ U folgt {x, y} ∈ U , S (4) aus x ∈ U folgt x ∈ U , (5) aus I ∈ U und {xi : i ∈ I} ⊂ U folgt {xi : i ∈ I} ∈ U , und (6) ω ∈ U . Man kann beweisen, dass die Existenz eines Grothendieck–Universums nicht in ZFC gezeigt werden kann. Aus einem gegebenen Grothendieck–Universum U lässt sich aber z.B. die Menge aller Gruppen aus U aussondern, die für viele Zwecke ein hilfreicher Ersatz für die (nichtexistente) Menge aller Gruppen ist. 3.2 Das Auswahlaxiom Sei M eine beliebige Menge. Eine Auswahlfunktion für M ist eine Funktion f mit Urbildbereich M , so dass für alle x ∈ M gilt f (x) ∈ x. Wenn ∅ ∈ M , dann kann es offenbar keine Auswahlfunktion f für M geben, da f (∅) ∈ ∅ gelten müsste. Definition 3.2.1 Das Auswahlaxiom besagt, dass es zu jedem M 6= ∅ mit ∅∈ / M ein f gibt, so dass f Auswahlfunktion für M ist. Diese Formulierung unterscheidet sich von der in Abschnitt 3.1 gegebenen Formulierung von AC. Lemma 3.2.2 besagt jedoch, dass diese beiden Formulierungen äquivalent sind. Wir betrachten in diesem Abschnitt (weitere) Äquivalenzen zum und Folgerungen aus dem Auswahlaxiom. Lemma 3.2.2 Das Auswahlaxiom ist äquivalent zur folgenden Aussage. (*) Sei N eine beliebige Menge mit N 6= ∅ und ∅ 6∈ N , so dass x ∩ y = ∅ für x, y ∈ N, x 6= y gilt (d.h. je zwei verschiedene Elemente von N sind disjunkt zueinander). Dann gibt es eine Menge A, die aus Elementen von Elementen von N besteht, so dass für jedes x ∈ N genau ein y ∈ A mit y ∈ x existiert. 52 KAPITEL 3. MENGEN Beweis: Sei zunächst M 6= ∅ mit ∅ ∈ / M gegeben. Mit Hilfe von (*) konstruieren wir eine Auswahlfunktion für M . Hierzu definieren wir eine Menge N wie folgt: N besteht aus allen Mengen der Gestalt {(x, z) : z ∈ x}, wobei x ∈ M . Sei dann A wie in (*). Dann gibt es für jedes x ∈ M genau ein z, so dass (x, z) ∈ A (und damit auch z ∈ x) ist. Mit anderen Worten: A ist eine Funktion mit Urbildbereich M und A(x) ∈ x für alle x ∈ M . Sei nun das Auswahlaxiom als gültig vorausgesetzt, und sei N wie in (*) gegeben. Sei f eine Auswahlfunktion für N . Dann erkennt man unschwer, dass der Wertebereich von f die Gültigkeit von (*) für N bezeugt. Wir wollen nun den Satz von Zermelo zeigen, wonach das Auswahlaxiom den Wohlordnungssatz impliziert. Wohlordnungen sind Verallgemeinerungen der natürlichen Ordnung auf N. Definition 3.2.3 Sei M eine Menge. Eine Wohlordnung auf M ist eine strikte Ordnung < auf M , so dass jedes nichtleere A ⊂ M ein <–kleinstes Element besitzt, d.h. es gibt ein z ∈ A, so dass für alle y ∈ A: wenn y 6= x dann x < y. Definition 3.2.4 Sei M eine Menge und sei < eine Wohlordnung auf M . Dann heißt A ein Anfangsstück von M bzgl. < gdw. für jedes x ∈ A und jedes y < x auch y ∈ A ist. Lemma 3.2.5 Sei < eine Wohlordnung auf M und sei A ein Anfangsstück von M (bzgl. <). Dann gilt entweder A = M oder es gibt ein x ∈ M , so dass A = {y ∈ M : y < x}. Beweis: Wenn A 6= M , dann sei x das <–kleinste Element von M \ A. Man sieht dann leicht, dass dann A = {y ∈ M : y < x}. Lemma 3.2.6 Sei < eine Wohlordnung auf M . Es gibt dann keine Folge (xn : n ∈ N) von Elementen xn von M , so dass xn+1 < xn für alle x ∈ N. Beweis: Angenommen, es gibt eine Folge (xn : n ∈ N) mit xn+1 < xn für alle n ∈ N. Betrachte A = {xn : n ∈ N} ⊂ M . Da < eine Wohlordnung ist, gibt es ein x ∈ A, so dass x < y für alle y ∈ A mit y 6= x. Es ist aber x = xn für ein n ∈ N und xn+1 < xn , wobei xn+1 ∈ A. Widerspruch! 3.2. DAS AUSWAHLAXIOM 53 Mit Hilfe des Auswahlaxioms lässt sich zeigen, dass eine strikte Ordnung < auf einer Menge M genau dann eine Wohlordnung ist, wenn es keine Folge (xn : n ∈ N) von Elementen von M mit xn+1 < xn für alle n ∈ N gibt. Lemma 3.2.7 Sei < eine Wohlordnung auf einer Menge M . Dann gibt es kein Anfangsstück A 6= M von M , so dass ein Ordnungsisomorphismus ϕ : (M, <) ∼ = (A, <↾ A) existiert. Beweis: Andernfalls gibt es ein x ∈ M mit A = {y ∈ M : y < x}, so dass für alle y ≥ x gilt: ϕ(y) < y. Sei y0 <–minimal in {y ∈ M : ϕ(y) < y}. Dann gilt, da ϕ ordnungstreu ist, auch ϕ(ϕ(y0 )) < ϕ(y0 ). Aber ϕ(y0 ) < y0 , und wir haben einen Widerspruch zur Wahl von y0 . Lemma 3.2.8 Sei < eine Wohlordnung auf M , und sei <∗ eine Wohlordnung auf N . Dann gilt genau eine der folgenden drei Aussagen: (1) Es gibt einen Ordnungsisomorphismus ϕ : (M, <) ∼ = (N, <∗ ). (2) Es gibt ein Anfangsstück A $ M von M und einen Ordnungsisomorphismus ϕ : (A, <↾ A) ∼ = (N, <∗ ). (3) Es gibt ein Anfangsstück B $ N von N und einen Ordnungsisomorphismus ϕ : (M, <) ∼ = (B, <∗↾ B). Beweis: Wir zeigen zunächst die folgende Behauptung: Seien A, A′ Anfangsstücke von M , seien B, B ′ Anfangsstücke von N , und seien ϕ : (A, <↾ A) ∼ = (B, <∗↾ B), ϕ′ : (A′ , <↾ A′ ) ∼ = (B ′ , <∗↾ B ′ ) ′ Ordnungsisomorphismen. Dann sind ϕ und ϕ “verträglich”, d.h. für jedes x ∈ A ∩ A′ gilt ϕ(x) = ϕ′ (x). Beweis der Behauptung: Angenommen, es gibt ein x ∈ A∩A′ mit ϕ(x) 6= ϕ′ (x). Sei x0 <–minimal in A ∩ A′ mit ϕ(x0 ) 6= ϕ′ (x0 ). Da sowohl ϕ als auch ϕ′ Ordnungsisomorphismen sind, muss aber ϕ(x0 ) das <∗ –minimale Element von N \ {ϕ(y) : y < x0 } sein, und ϕ′ (x0 ) muss das <∗ –minimale Element von N \ {ϕ′ (y) : y < x0 } sein. Auf Grund der Wahl von x0 gilt 54 KAPITEL 3. MENGEN aber {ϕ(y) : y < x0 } = {ϕ′ (y) : y < x0 }, und damit gilt ϕ(x0 ) = ϕ′ (x0 ). Widerspruch! Wir beweisen nun Lemma 3.2.8. Wir betrachten hierzu die Vereinigung aller ϕ, für die es Anfangsstücke A von M und B von N gibt, so dass ϕ : (A, <↾ A) ∼ = (B, <∗↾ B) ein Ordnungsisomorphismus ist. Wegen obiger Behauptung sind je zwei derartige ϕ verträglich, und man erkennt unschwer, dass diese Vereinigung selbst wiederum eine Abbildung ϕ̃ ist, für die es Anfangsstücke à von M und B̃ von N gibt, so dass ϕ̃ : (Ã, <↾ Ã) ∼ = (B̃, <↾ B̃) ein Ordnungsisomorphismus ist. Es muss aber à = M oder B̃ = N gelten. Andernfalls sei nämlich x0 <– minimal in M \ à und y0 <∗ –minimal in N \ B̃. Dann ist auch ϕ̃ ∪ {(x0 , y0 )} ein Ordnungsisomorphismus von à ∪ {x0 } auf B̃ ∪ {y0 }, wobei à ∪ {x0 } Anfangsstück von M und B̃∪{y0 } Anfangsstück von N ist. Dies widerspräche aber der Definition von ϕ̃. Satz 3.2.9 (Zermelo) Unter Voraussetzung des Auswahlaxioms gibt es für jede Menge M eine Wohlordnung < auf M . Beweis: Wir betrachten zunächst die Menge P der nichtleeren Teilmengen von M , d.h. P = {A ⊂ M : A 6= ∅}. Mit Hilfe des Auswahlaxioms finden wir eine Auswahlfunktion für P , d.h. eine Funktion f : P → M , so dass f (A) ∈ A für alle A ∈ P . Sei nun A ⊂ M und < eine Wohlordnung auf A. Dann heißt (A, <) verträglich mit f gdw. für alle x ∈ A gilt: x = f (M \ {y ∈ A : y < x}). Seien A, B ∈ P und seien (A, <), (B, <∗ ) verträglich mit f . Dann gibt es nach Lemma 3.2.8 zunächst einen Ordnungsisomorphismus ϕ : (A, <↾ A) ∼ = (B, <∗ ), wobei A Anfangsstück von A ist, oder einen Ordnungsisomorphismus ϕ : (A, <) ∼ = (B, <∗ ↾ B), wobei B Anfangsstück von B ist. Angenommen, ersteres ist der Fall. Wäre ϕ nicht die Identität, dann gibt es ein (<↾ A)–kleinstes Element x0 von A mit ϕ(x0 ) 6= x0 . Es gilt dann aber x0 = f (M \ {y ∈ A : y < x0 }) = f (M \ {y ∈ B : y <∗ ϕ(x0 )}) = ϕ(x0 ). Widerspruch! Also ist A = B und <↾ A =<∗ . Genauso argumentiert man im zweiten Fall und bekommt B = A und <∗↾ B =<. 3.2. DAS AUSWAHLAXIOM 55 Wir erhalten damit, dass die Vereinigung aller <, wobei < Wohlordnung auf einem A ⊂ M ist und (A, <) verträglich mit f ist, selbst eine Wohlordnung auf einem A0 ⊂ M ist. Es ist aber klar, dass nun A0 = M gelten muss. Umgekehrt ist folgende Aussage sehr einfach zu zeigen: Satz 3.2.10 Angenommen, zu jeder Menge A existiert eine Wohlordnung auf A. Dann gilt das Auswahlaxiom. Beweis: Sei M 6= ∅ mit ∅ ∈ / M gegeben. Wir betrachten A= [ M = {x : ∃y(y ∈ M ∧ x ∈ y)}. Sei < eine Wohlordnung auf A. Wir können dann sehr leicht eine Auswahlfunktion f für M wie folgt definieren: Für x ∈ M sei f (x) das <–minimale Element von x ⊂ A. Es gibt eine ganze Reihe weiterer und wichtiger Äquivalenzen zum Auswahlaxiom. (An dieser Stelle sollte betont werden, dass sich diese Äquivalenzen in einer Theorie zeigen lassen, die keine der als äquivalent auszuweisenden Aussagen impliziert.) Prominent ist etwa das Zornsche Lemma, das allerdings oft (meistens?) in der Form des “Hausdorffschen Maximalitätsprinzips” benutzt wird. Definition 3.2.11 Das Haussdorfsche Maximalitätsprinzip ist die folgende Aussage. Sei F eine beliebige Menge, und sei F eine Menge von Teilmengen von F . Angenommen, es gilt Folgendes: für S alle F ⊂ F, so dass X ⊂ Y oder Y ⊂ X für beliebige X, Y ∈ F, ist auch F = {a ∈ F : a ∈ X für ein X ∈ F} Element von F. Dann existiert ein Xmax ∈ F, so dass keine echte Obermenge von Xmax ebenfalls ein Element von F ist. Satz 3.2.12 Das Hausdorffsche Maximalitätsprinzip ist äquivalent zum Auswahlaxiom. Beweis: Zunächst ergibt sich aus dem Hausdorffschen Maximalitätsprinzip sehr leicht das Auswahlaxiom. Sei M 6= ∅ mit ∅ ∈ / M gegeben. Sei F die Menge aller Auswahlfunktionen für Teilmengen von M . Es ist unschwer erkennbar, dass F dann die Voraussetzung des Hausdorffschen Maximalitätsprinzips erfüllt. Jedes Xmax ∈ F, für das keine echte Obermenge von Xmax , 56 KAPITEL 3. MENGEN die ebenfalls Element von F ist, existiert, ist dann eine Auswahlfunktion für M selbst. Umgekehrt folgt aber aus dem Auswahlaxiom das Hausdorffschen Maximalitätsprinzip. Seien hierzu F und F wie im Hausdorffschen Maximalitätsprinzip gegeben. Ein F ⊂ F, so dass X ⊂ Y oder Y ⊂ X für alle X, Y ∈ F, heißt Kette in F. Sei < eine Wohlordnung von F. Eine Kette F ⊂ F heißt dann verträglich mit < gdw. für alle X ∈ F Folgendes gilt: X ist das <–minimale Y , so dass Z < Y für alle Z $ Y mit Z ∈ F gilt. Seien F 0 und F 1 zwei Ketten, die beide verträglich mit < sind. Angenommen, es gibt ein X ∈ F 0 , das nicht in F 1 liegt, oder es gibt ein X ∈ F 1 das nicht in F 0 liegt. Sei X <–minimal mit dieser Eigenschaft. Sei etwa X ∈ F 0 \ F 1 . Dann ist X das <–minimale Y , so dass Z < Y für alle Z $ Y mit Z ∈ F 0 gilt. Es gilt {Z : Z $ X ∧ Z ∈ F 0 } = {Z : Z $ X ∧ Z ∈ F 1 }. Wenn also F 1 \{Z : Z $ X ∧Z ∈ F 1 } = 6 ∅, dann gilt, da F 1 mit < verträglich ist, dass X ∈ F 1 im Widerspruch zur Wahl von X. Dies zeigt, dass die Vereinigung aller Ketten, die mit < verträglich sind, selbst wiederum eine Kette ist (die mit < verträglich ist). Diese Kette, nennen wir sie F max , muss dann aber offensichtlich ein Xmax enthalten, so dass keine echte Obermenge von Xmax ebenfalls Element von F max (und damit von F) ist. Mit Hilfe des Hausdorffschen Maximalitätsprinzips lässt sich sehr einfach z.B. zeigen: Satz 3.2.13 Jeder Vektorraum besitzt eine Basis. Beweis: Sei V ein beliebiger Vektorraum. Sei F die Menge aller linear unabhängigen Teilmengen von V . F erfüllt die Voraussetzung des Hausdorffschen Maximalitätsprinzips. Sei Xmax ∈ F “maximal”. Wäre dann Xmax keine Basis von V , dann existiert ein v ∈ V , so dass Xmax ∪ {v} linear unabhängig ist im Widerspruch zur Maximalität von Xmax . Eine weitere äußerst nützliche Aussage, zu deren Beweis das Auswahlaxiom benötigt wird, lautet: Lemma 3.2.14 Sei B eine abzählbare Menge, so dass jedes a ∈ B ebenfalls S abzählbar ist. Dann ist auch B = {x : x ∈ a für ein a ∈ B} abzählbar. 3.3. DIE TOPOLOGIE VON R 57 Beweis: Sei f : N → B eine Bijektion, und sei N die Menge aller {(n, g) : g : N → f (n) ist bijektiv}, wobei n ∈ N. Sei A wie in (∗) von Lemma 3.2.2. Dann ist A eine Funktion mit Urbildbereich N, die jedem nS∈ N eine Bijektion von N auf f (n) zuordnet. Dann ist aber G : N × N → B surjektiv, wobei wir für n, m ∈ N den Wert G(n, m) als A(n)(m) dann γ : N → N × N bijektiv S definieren. Wenn S ist, dann ist G◦γ : N → B surjektiv, so dass B in der Tat abzählbar ist. 3.3 Die Topologie von R In der Topologie werden topologische Räume betrachtet. Definition 3.3.1 Ein Paar (X, O) (oder auch einfach die Menge X) heißt ein topologischer Raum gdw. X 6= ∅, O eine Menge von Teilmengen von S, den so genannten offenen Mengen, ist, und wenn gilt: (0) X ∈ O, (1) Beliebige Vereinigungen offener Mengen sind wieder offen, und (2) der Durchschnitt zweier offener Mengen ist wieder offen. Die Standardtopologie von R ergibt sich wie folgt. Eine Menge A ⊂ R reeller Zahlen wird als offen bezeichnet gdw. A als Vereinigung offener Intervalle (d.h. von Mengen der Form (x, y) mit x < y) geschrieben werden kann. (Dabei ist die “leere” Vereinigung zugelassen, so dass auch ∅ eine offene Menge ist.) Da der Durchschnitt zweier offener Intervalle entweder leer oder wieder ein offenes Intervall ist, sieht man leicht, dass damit in der Tat R zu einem topologischen Raum wird. Wenn (X, O) ein topologischer Raum ist, dann heißt B ⊂ O Basis gdw. jedes Element von O (d.h. jede offene Menge) als Vereinigung von Elementen von B geschrieben werden kann. Offensichtlich ist damit die Menge aller offenen Intervalle Basis des topologischen Raums R. Allerdings ist eine nützliche Beobachtung, dass R in der Tat eine abzählbare Basis besitzt. Lemma 3.3.2 Die Menge aller offenen Intervalle (x, y) mit x < y und x, y ∈ Q ist eine Basis des topologischen Raums R. 58 KAPITEL 3. MENGEN Beweis: Sei A ⊂ R eine offene Menge. Dann gibt es eine Menge D, bestehend S aus offenen Intervallen, so dass A = D. Sei D ′ die Menge aller offenen Intervalle (x′ , y ′ ) mit x′ < y ′ und x′ , y ′ ∈ Q, so dass ein Intervall (x, y) ∈ D existiert mit x ≤ x′ < y ′ ≤ y. Da Q dicht in R ist, gibt es zu jedem (x, y) ∈ D ′ ′ und zu jedem z ∈ (x, y) (d.h. x <Sz < y)Srationale Zahlen S x′ und y mit ′ ′ ′ x < x < z < y < y. Daraus folgt D = D, also A = D . Die Menge aller offenen Intervalle mit rationalen Endpunkten ist also tatsächlich eine Basis des topologischen Raums R. Sei (x, y) ein offenes Intervall, wobei x < y. Dann lässt sich sehr leicht eine Bijektion ϕx,y : (−1, 1) → (x, y) angeben: es sei etwa ϕx,y (z) = x+ z+1 2 (y −x) für z ∈ (−1, 1). Darüber hinaus existiert eine Bijektion f : R → (−1, 1), etwa 1 1 für x > 0, f (x) = x−1 für x < 0, und f (0) = 0. die folgende: es sei f (x) = x+1 (Diese Abbildung ist nicht stetig; ähnlich einfach lässt sich auch eine stetige derartige Bijektion definieren.) Die Komposition ϕx,y ◦ f : R → (x, y) ist dann ebenfalls eine Bijektion. Diese Überlegung zeigt folgende. Wenn A ⊂ R offen ist mit A 6= ∅, dann existiert eine Injektion g : R → A: Sei etwa (x, y) ⊂ A, dann kann man einfach g = ϕx,y ◦ f wählen. Andererseits gibt es trivialerweise eine Injektion h : A → R, nämlich z.B. die Identität. Somit gibt es aufgrund des Satzes 1.1.4 von Schröder-Bernstein für jedes nichtleere offene A ⊂ R eine Bijektion j : R → A. Diese Aussage ist falsch für kompliziertere Mengen reeller Zahlen. Komplemente offene Mengen in topologischen Räumen heißen abgeschlossen. Lemma 3.3.3 Sei A ⊂ R. Dann sind folgende Aussagen äquivalent. (1) A ist abgeschlossen. (2) Sei (xn : n ∈ N) eine Cauchy–Folge, wobei xn ∈ A für jedes n ∈ N. Dann gilt limn→∞ xn ∈ A. Beweis: (1) ⇒ (2). Sei A abgeschlossen und sei (xn : n ∈ N) eine Cauchy– Folge, so dass xn ∈ A für jedes n ∈ N. Da A abgeschlossen ist, ist R \A offen. Angenommen, x = limn→∞ xn 6∈ A, d.h. x ∈ R \ A. Da R \ A Vereinigung offener Intervalle ist, gibt es dann ein offenes Intervall (y, z) mit x ∈ (y, z) ⊂ R \ A. Sei ε das Minimum von |x − y| und |z − x|. Da limn→∞ xn = x, 3.3. DIE TOPOLOGIE VON R 59 existiert ein n ∈ N mit |x − xn | < ε, also xn ∈ (x − ε, x + ε) ⊂ (y, z) ⊂ R \ A. Widerspruch! (2) ⇒ (1): Sei (2) angenommen. Wir zeigen, dass R \ A offen ist. Hierzu genügt es zu zeigen, dass es zu jedem x ∈ R \ A ein offenes Intervall (y, z) mit x ∈ (y, z) ⊂ R \ A gibt. Sei also x ∈ R \ A. Wir betrachten die offenen 1 1 , x + n+1 ) für n ∈ N. Wenn es kein n ∈ N mit Intervalle In = (x − n+1 In ⊂ R \ A gibt, dann enthält jedes In ein Element von A, etwa xn ∈ In ∩ A. Man erkennt unschwer, dass (xn : n ∈ N) dann eine Cauchy–Folge ist mit x = limn→∞ xn . Wegen (2) wäre dann aber x ∈ A. Widerspruch! Beispielsweise sind also alle endlichen Mengen abgeschlossen. Für jedes A ⊂ R wird die Menge Ā ⊃ A aller x ∈ R, für die eine Cauchy–Folge (xn : n ∈ N) mit xn ∈ A für alle n ∈ N und limn→∞ xn = x existiert, als der Abschluss von A bezeichnet. Es ist nicht schwer zu sehen, dass Ā immer abgeschlossen ist. Eine Menge A ⊂ R ist abgeschlossen gdw. Ā ⊂ A (gdw. Ā = A). Da Q dicht in R ist, ist der Abschluss von Q gleich R. Es gibt allerdings abzählbare Mengen, deren Abschluss wieder abzählbar ist, z.B. N = N′ oder 1 1 : n ∈ N} mit B ′ = {0} ∪ { n+1 : n ∈ N}. B = { n+1 Sei A ⊂ R. Eine reelle Zahl x heißt Häufungspunkt von A gdw. für jedes ε > 0 die Menge A ∩ (x − ε, x + ε) mindestens ein Element besitzt, welches verschieden von x ist. Wenn x Häufungspunkt von A ist, dann besitzt für jedes ε > 0 die Menge A ∩ (x − ε, x + ε) sogar unendlich viele Elemente. Darüber hinaus gibt es in diesem Falle eine Cauchy–Folge (xn : n ∈ N) mit xn ∈ A \ {x} für alle n ∈ N und x = limn→∞ xn . Damit liegt jeder Häufungspunkt von A im Abschluss Ā von A. Umgekehrt ist nicht notwendigerweise jedes x ∈ Ā ein Häufungspunkt von A. Beispielsweise gilt für jedes x ∈ R, dass {x} = {x}, aber {x} besitzt keinen Häufungspunkt. Eine abgeschlosse nichtleere Menge A ⊂ R heißt perfekt gdw. jedes x ∈ A auch Häufungspunkt von A ist. Satz 3.3.4 Sei A ⊂ R perfekt. Dann gibt eine Bijektion f : R → A. Beweis: Sei E die Menge aller endlichen 0-1-Folgen. Für s ∈ E und h ∈ {0, 1} schreiben wir s⌢ h für die Folge, die aus s entsteht, indem hinten h angehängt wird. Wir konstruieren zunächst eine Abbildung Φ wie folgt. Dabei wird E der Urbildbereich von Φ sein, und für jedes s ∈ E wird Φ(s) ein abgeschlossenes 60 KAPITEL 3. MENGEN Intervall [as , bs ] sein mit der Eigenschaft, dass as < bs und [as , bs ] ∩ A 6= ∅. Die Konstruktion von Φ ist rekursiv nach der Länge von s. Seien a, b reelle Zahlen mit a < b, so dass [a, b]∩A nichtleer ist. Bezeichne hi die “leere Folge”. Wir definieren dann ϕ(hi) = [a, b]. Sei nun s ∈ E, und sei ϕ(s) bereits definiert. Sei etwa Φ(s) = [as , bs ], wobei as < bs . Wir nehmen an, dass [as , bs ] ∩ A nichtleer ist. Da A perfekt ist, ist jeder Punkt von A auch Häufungspunkt von A und wir können leicht as < as⌢ 0 < bs⌢ 0 < as⌢ 1 < bs⌢ 1 < bs finden, so dass gilt: [as⌢ 0 , bs⌢ 0 ] ∩ A 6= ∅, [as⌢ 1 , bs⌢ 1 ] ∩ A 6= ∅, 1 1 , und bs⌢ 1 − as⌢ 1 ≤ . n+1 n+1 Wir setzen dann Φ(s⌢ h) = [as⌢ h , bs⌢ h ] für h = 0, 1. Bezeichne nun E ∗ die Menge aller unendlichen 0-1-Folgen. Wir können jetzt eine Injektion F : E ∗ → A wie folgt definieren. Sei f ∈ E ∗ . Dann gilt \ [af↾{0,... ,n} , bf↾{0,... ,n} ] = {x} bs⌢ 0 − as⌢ 0 ≤ n∈N für ein x ∈ R. Wir setzen F (f ) = x. Es gilt F (f ) ∈ A, da F (f ) offensichtlich Häufungspunkt von A ist und A abgeschlossen ist. Nach Konstruktion ist F sicherlich injektiv. Nach Übungsaufgabe ????? gibt es nun eine Bijektion g : R → E ∗ . Damit ist F ◦ g: R → A injektiv. Da die Identität auf A eine injektive Abbildung von A nach R ⊃ A ist, existiert damit aufgrund des Satzes 1.1.4 von Schröder-Bernstein eine Bijektion von R auf A. Satz 3.3.5 (Cantor–Bendixson) Sei A ⊂ R abgeschlossen. Dann ist entweder A endlich oder abzählbar oder es gibt eine Bijektion f : R → A. Beweis: Sei A ⊂ R abgeschlossen. Ein x ∈ R heißt Kondensationspunkt von A gdw. für jedes ε > 0 die Menge A ∩ (x − ε, x + ε) 3.3. DIE TOPOLOGIE VON R 61 überabzählbar ist. Wir bezeichnen mit P die Menge aller Kondensationspunkte von A. Da offensichtlich jeder Kondensationspunkt von A auch Häufungspunkt von A ist und da A abgeschlossen ist, gilt P ⊂ Ā = A. Wir betrachten nun zwei Fälle. 1. Fall: P = ∅. Dann gibt es zu jedem y ∈ A ein ε > 0, so dass die Menge A∩(x−ε, x+ε) höchstens abzählbar ist; es gibt dann aber auch rationale Zahlen y, z mit x − ε < y < x < z < x + ε, so dass auch A ∩ (y, z) höchstens abzählbar ist. Es gibt nun abzählbar viele Intervalle (y, z) mit y, z ∈ Q, und für jedes x ∈ A existiert ein Intervall (y, z) mit y, z ∈ Q und x ∈ A ∩ (y, z), so dass A ∩ (y, z) höchstens abzählbar ist. Damit lässt sich A als höchstens abzählbare Vereinigung höchstens abzählbarer Mengen darstellen und ist selbst höchstens abzählbar. 2. Fall: P 6= ∅. In diesem Falle zeigen wir, dass P perfekt ist. Dann existiert nach Satz 3.3.4 eine Bijektion f : R → P , also mit Hilfe von Satz 1.1.4 auch eine Bijektion von R auf A ⊃ P . Zuerst gilt P 6= ∅ nach Fallannahme. Wir zeigen zunächst, dass P abgeschlossen ist. Sei (xn : n ∈ N) eine Cauchy-Folge, wobei jedes xn ein Kondensationspunkt von A ist. Sei x = limn→∞ xn . Wir müssen zeigen, dass x Kondensationspunkt von A ist. Sei x ∈ [y, z] mit y < z. Dann existiert ein n ∈ N mit xn ∈ [y, z]. Sei ε > 0 so, dass [xn − ε, xn + ε] ⊂ [y, z]. Da xn Kondensationspunkt von A ist, ist [xn − ε, xn + ε] ∩ A überabzählbar. Also ist auch [y, z] ∩ A überabzählbar. Wir zeigen schließlich, dass jeder Punkt von P Häufungspunkt von P ist. Sei also x ∈ P . Angenommen, x wäre nicht Häufungspunkt von P . Dann existiert ein ε > 0, so dass [x − ε, x + ε] ∩ P kein Element besitzt, das verschieden von x ist. Zu jedem y ∈ ([x − ε, x + ε] ∩ A) \ {x} existieren dann rationale ay und by mit ay < y < by , so dass [ay , by ] ∩ A höchstens abzählbar ist. Damit lässt sich [x − ε, x + ε] ∩ A als höchstens abzählbare Vereinigung höchstens abzählbarer Mengen darstellen und ist selbst höchstens abzählbar. Dies ist ein Widerspruch, da x Kondensationspunkt von A ist. 62 KAPITEL 3. MENGEN Kapitel 4 Modelle Ziel dieses Kapitels ist es, eine Methode zur Konstruktion von Modellen von Theorien wie PA, VGK oder ZFC zu entwickeln; sie wird uns vor allem erlauben, Nichtstandard-Modelle zu erzeugen. Diese Methode ist sehr allgemein und hat nichts mit PA, VGK oder ZFC im besonderen zu tun. Wir beginnen daher mit einer allgemeinen Einführung der abstrakten Logik erster Stufe, für die die Sprachen von PA etc. Beispiele geliefert hatten. 4.1 Logik erster Stufe Die Logik erster Stufe ist die Logik, die wir in der Mathematik benutzen. Allerdings ist es nicht ganz richtig, von der Logik erster Stufe im Singular zu sprechen, da wir mit verschiedenen Mengen von Prädikatsymbolen, Konstanten und Funktionssymbolen arbeiten können. Seien I, K, J (womöglich leere, womöglich unendlich große) paarweise disjunkte Indexmengen, und sei n : I ∪ J → N; wir schreiben ni für n(i), wobei i ∈ I ∪ J. Die zu I, K, J, n gehörige Sprache der Logik erster Stufe besitzt die folgenden Symbole: Klammern: ( und ) Junktoren: ¬ und ∧ Allquantor: ∀ Variablen: v0 , v1 , v2 , . . . Gleichheitszeichen: = Prädikatsymbole: für jedes i ∈ I ein ni –stelliges Prädikatsymbol Pi Konstanten: für jedes k ∈ K eine Konstante ck Funktionssymbole: für jedes j ∈ J einen nj –stelligen Funktor fj . 63 64 KAPITEL 4. MODELLE In dieser Liste könnte man die Junktoren ∨, → und ↔ sowie den Existenzquantor ∃ vermissen. Wir werden diese später durch Schreibkonventionen einführen. Ein Beispiel für eine solche Sprache ist die Sprache der Gruppentheorie: diese enthält ein zweistelliges Funktionssymbol für die Addition (bzw. Multiplikation) und eine Konstante für das neutrale Element. Die Sprache der Körpertheorie enthält zwei zweistellige Funktionssymbole für die Addition und die Multiplikation und zwei Konstanten für die 0 und die 1. Die Sprache von PA enthält ein zweistelliges Prädikatsymbol <, zwei Konstanten 0 und 1 für die Null und die Eins, zwei zweistellige Funktionssymbole +,· für die Addition und die Multiplikation und ein weiteres unsichtbares zweistelliges Funktionssymbol für die Exponentiation. Die Sprache von ZFC schließlich hat lediglich das zweistellige Prädikatsymbol ∈. Sei L eine Sprache der Logik erster Stufe. Ein L–Ausdruck ist eine endliche Folge von Symbolen von L. Wir wollen nun die Begriffe “L–Term” und “L–Formel” definieren. Dies geschieht rekursiv. Sei L durch I, K, J, n gegeben. Ein L–Term ist ein L–Ausdruck, der in jeder Menge M von L–Ausdrücken liegt mit: (a) jede Konstante und jede Variable liegt in M , und (b) für j ∈ J und τ0 , . . . τnj −1 ∈ M ist auch fj τ0 . . . τnj −1 ∈ M . Beispielsweise sind die folgenden Ausdrücke Terme von PA: · + 10v3 , + · 1v17 0. Wir werden natürlich weiterhin im praktischen Leben (1 + 0) · v3 für · + 10v3 und (1 · v17 ) + 0 für + · 1v17 0 schreiben. Eine atomare L–Formel ist jeder Ausdruck der Form P τ0 . . . τn−1 , wobei P ein n–stelliges Prädikatsymbol ist und τ0 , . . . , τn−1 L–Terme sind, oder ein Ausdruck der Form τ0 = τ1 , wobei τ0 , τ1 L–Terme sind. Schließlich ist eine L–Formel ein Ausdruck, der in jeder Menge M von Ausdrücken liegt mit: (1) jede atomare L–Formel ist in M , (2) wenn ϕ und ψ in M sind, dann auch ¬ϕ und (ϕ ∧ ψ), (3) wenn ϕ in M ist und n ∈ N, dann ist auch ∀vn ϕ in M . 65 4.1. LOGIK ERSTER STUFE Beispiele für Formeln der Sprache der Mengenlehre sind etwa ∈ v3 v0 oder ∀v3 ∈ v3 v0 . Wir werden natürlich v3 ∈ v0 anstelle von ∈ v3 v0 und entsprechend ∀v3 v3 ∈ v0 anstelle von ∀v3 ∈ v3 v0 schreiben. v3 ∈ v0 ist eine atomare Formel der Sprache der Mengenlehre. Wir vereinbaren einige Schreibkonventionen, um Formeln besser lesen zu können. So schreiben wir: (ϕ ∨ ψ) (ϕ → ψ) (ϕ ↔ ψ) ∃vn ϕ τ = τ′ τ 6= τ ′ für für für für für für ¬(¬ϕ ∧ ¬ψ), (¬ϕ ∨ ψ), ((ϕ → ψ) ∧ (ψ → ϕ)), ¬∀vn ¬ϕ, = τ τ ′ , und ¬τ = τ ′ , wobei ϕ, ψ Formeln und τ, τ ′ Terme sind. Diese abkürzenden Schreibweisen sind, wie man sich leicht überlegt, inhaltlich sinnvoll. Mit diesen Konventionen ist nun also auch ∀v0 ∃v1 v0 ∈ v1 eine Formel der Sprache der Mengenlehre, bei der es sich in nicht abgekürzter Schreibweise um die Formel ∀v0 ¬∀v1 ¬ ∈ v0 v1 handelt. Als weitere Schreibkonvention lassen wir von nun an die äußeren Klammern weg, schreiben also z.B. ϕ → ψ anstelle von (ϕ → ψ). Wir wollen nun definieren, wann eine Formelmenge Σ eine Formel ϕ impliziert. Wieder arbeiten wir mit Belegungen, diesmal aber von Variablen mit Elementen eines Modells; dies entspricht der Einsetzung solcher Elemente für freie Variablen in Formeln. Wir fixieren nun I, K, J, n, wodurch eine Sprache L gegeben ist. Anstelle von L–Termen und (atomaren) L–Formeln sprechen wir nun auch einfach von Termen und Formeln. Wir definieren zunächst den Begriff der “freien Variablen”. Sei n ∈ N. Wir definieren “vn kommt frei in der Formel ϕ vor”. Wenn ϕ atomar ist, dann kommt vn frei in ϕ vor gdw. vn überhaupt in ϕ vorkommt. vn kommt frei in ¬ϕ vor gdw. vn frei in ϕ vorkommt. vn kommt frei in ϕ ∧ ψ vor gdw. vn frei in ϕ oder frei in ψ vorkommt. Schließlich kommt vn frei in ∀vm ϕ vor gdw. m 6= n und vn frei in ϕ vorkommt. Ein L–Satz ist eine L–Formel, in der keine freien Variablen vorkommen. Beispielsweise ist ∀v1 ¬v1 ∈ v0 eine Formel der Sprache der Mengenlehre (aber kein Satz) und ∃v0 ∀v1 ¬v1 ∈ v0 ein Satz der Sprache der Mengenlehre. 66 KAPITEL 4. MODELLE Wir wollen jetzt den Sätzen der Sprache L Bedeutung verleihen. Oft hat eine Sprache einen “intendierten Objektbereich” im Auge. Mit der Sprache der elementaren Zahlentheorie wollen wir über die Struktur der natürlichen Zahlen sprechen, mit der Sprache der Mengenlehre über die Struktur des Universums aller Mengen. Ebenso oft gibt es aber auch keinen intendierten Objektbereich: die Sprache der Gruppentheorie hat nicht eine feste Gruppe im Auge, sondern “beliebige Gruppen”. Allgemein bekommen Sätze Bedeutung, indem wir ein Modell von L betrachten. Der Begriff des “Modells” war naiv bereits in 3.1 benutzt worden. Ein Modell von L ist eine Struktur der Form M = (M ; (Ri : i ∈ I), (ak : k ∈ K), (Fj : j ∈ J)), wobei M eine nichtleere Menge ist (das Universum, oder die Trägermenge von M), jedes Ri eine ni –stellige Relation auf M ist (d.h. Ri ⊂ M ni ), jedes ak ein Element von M ist und jedes Fj eine nj –stellige Funktion auf M ist (d.h. Fj : M nj → M ). Ein solches Modell interpretiert L in offensichtlicher Weise: das Prädikatsymbol Pi wird durch die Relation Ri interpretiert (in Zeichen: PiM = Ri ), die Konstante ck wird durch ak interpretiert (in Zeichen: cM k = ak ), und das Funktionssymbol fj wird durch die Funktion Fj interpretiert (in Zeichen: fjM = Fj ). Wir wollen nun sagen, was es heißt, dass ein gegebener Satz im Modell M gilt. Hierzu gehen wir einen kleinen (aber sehr effektiven) Umweg und definieren allgemeiner, was es heißt, dass eine gegebene Formel unter einer gegebenen Belegung in M gilt. Eine M–Belegung ist eine Funktion β : {v0 , v1 , . . . } → M , die allen Variablen Elemente der Trägermenge von M zuordnet. Durch eine M– Belegung ist eine Interpretation beliebiger Terme gegeben. Eine solche durch β induzierte Terminterpretation ist eine Funktion β : T → M (wobei T die Menge aller Terme ist), für die gilt: (1) β(vn ) = β(vn ) für n ∈ N, (2) β(ck ) = ak für k ∈ K, und (3) β(fj τ0 . . . τnj −1 ) = Fj (β(τ0 ), . . . , β(τnj −1 )) für j ∈ J und Terme τ0 , . . . , τnj −1 . Wir definieren nun “ϕ gilt in M unter der Belegung β”. Hierzu ist die folgende Schreibweise hilfreich. 4.1. LOGIK ERSTER STUFE 67 Sei n ∈ N, und sei a ∈ M . Dann bezeichnet β(vn |a) diejenige Belegung, die mit β überall übereinstimmt, außer an der Stelle vn , wo der Wert a angenommen wird, d.h. β(vm ), falls m 6= n β(vn |a)(vm ) = a , falls m = n. Wir schreiben “ϕ gilt in M unter der Belegung β” oder “M ist Modell von ϕ unter β” als M |= ϕ[β] und definieren diese Relation wie folgt. Hierbei sei β die durch β induzierte Terminterpretation. Die folgende Definition ist rekursiv “nach der Formelkomplexität” und simultan für alle Belegungen. (1) M |= τ0 = τ1 [β] gdw. β(τ0 ) = β(τ1 ) für Terme τ0 , τ1 (2) M |= Pi τ0 . . . τnj −1 [β] gdw. (β(τ0 ), . . . , β(τnj −1 )) ∈ Ri (3) M |= ¬ϕ[β] gdw. M |= ϕ[β] nicht gilt (4) M |= ϕ ∧ ψ[β] gdw. M |= ϕ[β] und M |= ψ[β] beide gelten (5) M |= ∀vn ϕ[β] gdw. für alle a ∈ M , M |= ϕ[β(vn |a)]. Betrachten wir den Satz ∀v0 v0 = v0 . Es gilt M |= ∀v0 v0 = v0 [β] gdw. für alle a ∈ M , M |= v0 = v0 [β(v0 |a)] gdw. für alle a ∈ M , β(v0 ) = β(v0 ) (d.h. β(v0 ) = β(v0 )). ∀v0 v0 = v0 gilt also in jedem Modell unter jeder Belegung. Definition 4.1.1 Sei Σ ∪ {ϕ} eine Menge von Formeln. Wir sagen, dass Σ (logisch) ϕ impliziert, in Zeichen: Σ |= ϕ gdw. für jedes Modell M und für jede Belegung β gilt: wenn M |= ψ[β] für alle ψ ∈ Σ, dann auch M |= ϕ[β]. Anstelle von ∅ |= ϕ schreiben wir auch |= ϕ und sagen in diesem Falle, dass ϕ (logisch) gültig ist. Für jede Menge Σ von Formeln schreiben wir M |= Σ[β] anstelle von: für alle ϕ ∈ Σ, M |= ϕ[β]. Es gilt also Σ |= ϕ gdw. für jedes Modell M und für jede Belegung β gilt: wenn M |= Σ[β], dann M |= ϕ[β]. Der oben betrachtete Satz ∀v0 v0 = v0 ist also gültig. Dasselbe gilt übrigens auch für ∃v0 v0 = v0 , das abkürzend die Formel ¬∀v0 ¬v0 = v0 darstellt. Dies ist leicht nachzurechnen. Hingegen ist ∃v0 ∃v1 v0 6= v1 nicht gültig, aber es gilt z.B. {∃v0 ∃v1 ∃v2 (v0 6= v1 ∧ v1 6= v2 ∧ v0 6= v2 )} |= ∃v0 ∃v1 v0 6= v1 . 68 KAPITEL 4. MODELLE Wir schreiben ϕ |= ψ anstelle von {ϕ} |= ψ. ϕ und ψ heißen (logisch) äquivalent gdw. ϕ |= ψ und ψ |= ϕ gelten. Satz 4.1.2 Sei ϕ eine L–Formel, und sei M ein Modell von L. Seien β 0 und β 1 M–Belegungen, so dass β 0 (vn ) = β 1 (vn ) für alle vn , die frei in ϕ vorkommen. Dann gilt M |= ϕ[β 0 ] gdw. M |= ϕ[β 1 ]. Beweis: Wir zeigen diesen Satz durch Induktion “nach der Formelkomplexität”. Die Aussage gilt zunächst für atomares ϕ, da dann vn frei in ϕ vorkommt gdw. vn überhaupt in ϕ vorkommt. Sodann ergibt sich aus der Tatsache, dass die Aussage für ψ0 und ψ1 gilt, sofort, dass die Aussage auch für ϕ gleich ¬ψ0 und für ϕ gleich ψ0 ∧ ψ1 gilt. Sei nun ϕ gleich ∀vm ψ. vn kommt frei in ϕ vor gdw. n 6= m und vn frei in ψ vorkommt. Für ein beliebiges a gilt also β 0 (vm |a)(vn ) = β 1 (vm |a)(vn ) für alle vn , die frei in ψ vorkommen. Damit gilt aber mit Hilfe der Induktionsvoraussetzung: M |= ϕ[β 0 ] gdw. für alle a ∈ M, M |= ψ[β 0 (vm |a)] gdw. für alle a ∈ M, M |= ψ[β 1 (vm |a)] gdw. M |= ϕ[β 1 ]. Korollar 4.1.3 Sei ϕ ein L–Satz, und sei M ein Modell von L. Seien β 0 und β 1 beliebige M-Belegungen. Dann gilt M |= ϕ[β 0 ] gdw. M |= ϕ[β 1 ]. Für Sätze ϕ schreiben wir im Folgenden M |= ϕ anstelle von M |= ϕ[β] und sagen, dass ϕ in M gilt (oder, dass M Modell von ϕ ist). Eine L–Formel ϕ heißt erfüllbar gdw. ¬ϕ nicht logisch gültig ist, d.h. wenn es ein Modell M und eine M–Belegung β gibt, so dass M |= ϕ[β]. Eine beliebige Menge Γ von L–Formeln heißt erfüllbar gdw. wenn es ein Modell M und eine M–Belegung β gibt, so dass M |= ϕ[β] für alle ϕ ∈ Γ gilt. (Wenn Γ erfüllbar ist, dann ist jedes ϕ ∈ Γ erfüllbar; die Umkehrung hiervon gilt jedoch nicht.) Eine beliebige Menge Γ von L–Formeln heißt endlich erfüllbar gdw. jede endliche Menge Γ̄ ⊂ Γ erfüllbar ist. Offensichtlich ist jedes erfüllbare Γ auch endlich erfüllbar. Die überraschende Aussage, dass hiervon auch die Umkehrung gilt, dass nämlich jedes endlich erfüllbare 69 4.1. LOGIK ERSTER STUFE Γ auch erfüllbar ist, ist der Kompaktheitssatz 4.2.7, der im nächsten Abschnitt bewiesen wird und der im letzten Abschnitt für die Konstruktion von Nichtstandardmodellen verwandt werden wird. Sei M ein Modell von L. Sei ϕ eine Formel, in der genau die Variablen vi0 , . . . , vin−1 frei vorkommen. Sei ai0 , . . . , ain−1 ∈ M , der Trägermenge von M. Wir schreiben dann kurz M |= ϕ(ai0 , . . . , ain−1 ) anstelle von: M |= ϕ[β], wobei β(vij ) = aij für alle j < n. Eine n–stellige Relation R ⊂ M n heißt über M definierbar gdw. es eine Formel ϕ gibt, in der genau die Variablen v0 , . . . , vn−1 frei vorkommen, so dass für alle a0 , . . . , an−1 ∈ M : (a0 , . . . , an−1 ) ∈ R gdw. M |= ϕ(a0 , . . . , an−1 ). Für M = (M ; (Ri : i ∈ I), (ck : k ∈ K), (Fj : j ∈ J)) sind trivialerweise alle Relationen Ri über M definierbar; es gibt aber im Allgemeinen noch weitere definierbare Relationen. Betrachten wir die Struktur N = (N; <, 0, 1, +, ·, E), wobei < die Kleiner–Relation, 0 die Null, 1 die Eins, + die Addition, · die Multiplikation und E die Exponentiation ist. Offenbar ist N ein Modell der Sprache der elementaren Zahlentheorie1 (das “Standardmodell”; wir werden sehen, dass es noch weitere Modelle gibt). Es ist nicht wirklich nötig, < zu N hinzuzunehmen: die Relation < ist über dem Modell (N; 0, +) mit Hilfe der Formel ∃v2 (v2 6= 0 ∧ v0 + v2 = v1 ) definierbar: n < m gdw. (N; 0, +) |= ∃v2 (v2 6= 0 ∧ n + v2 = m). Man kann zeigen, dass die Exponentiation über (N; <, 0, 1, +, ·) 1 Damit bezeichnet < sowohl das Symbol für die Kleiner–Relation als auch die Relation selbst, usw. 70 KAPITEL 4. MODELLE definierbar ist, d.h. dass es eine Formel ϕ gibt, so dass nm = q gdw. (N; <, 0, 1, +, ·) |= ϕ(n, m, q). Auf der anderen Seite ist z.B. die Addition nicht über (N; ·) und die Multiplikation nicht über (N; <, 0, 1, +) definierbar. Ersteres lässt sich folgendermaßen zeigen. Seien M und P zwei Modelle von L mit Trägermenge M bzw. P . Eine Abbildung π : M → P heißt ein Homomorphismus von M nach P gdw. (1) (a0 , ..., an−1 ) ∈ P M gdw. (π(a0 ), ..., π(an−1 )) ∈ P P , (2) π(f M (a0 , ..., an−1 )) = f P (π(a0 ), ..., π(an−1 )), und (3) π(cM ) = cP für alle Prädikatsymbole P , alle Funktionssymbole f , alle a0 , ..., an−1 ∈ M und für alle Konstanten c ist (hierbei ist n, abhängig von P bzw. f , jeweils die Stelligkeit von P bzw. f ). Eine Abbildung π : M → P heißt ein Isomorphismus von M nach P gdw. π ein bijektiver Homomorphismus von M nach P ist. Die folgende Aussage ist leicht zu zeigen. Satz 4.1.4 Sei π : M → P ein Homomorphismus von M nach P. Sei β̄ eine M -Belegung, und sei β die durch β̄ induzierte Terminterpretation. Sei die P -Belegung β̄ ′ definiert durch β̄ ′ (vi ) = π(β̄(vi )) für i ∈ N, und sei β ′ die durch β̄ ′ induzierte Terminterpretation. Dann haben wir: (a) Für alle Terme τ ist π(β(τ )) = β ′ (τ ). (b) Wenn π ein Isomorphismus von M nach P ist, dann gilt für alle Formeln ϕ, dass M |= φ[β̄] gdw. P |= φ[β̄ ′ ]. Die Äquivalenz in (b) bedeutet, dass M |= φ(ai0 , ..., ain−1 ) gdw. P |= φ(π(ai0 ), ..., π(ain−1 )), wenn in der Formel ϕ die Variablen vi0 , ..., vin−1 frei vorkommen und β̄(vi0 ) = ai0 , ..., β̄(vin−1 ) = ain−1 . 4.2. ULTRAPRODUKTE UND KOMPAKTHEIT 71 Angenommen nun, die Addition wäre über der Struktur (N; ·) definierbar. Dann hätten wir für jeden Isomorphismus2 π : N → N von (N; ·) nach (N; ·), dass π(n + m) = π(n) + π(m) für alle n, m ∈ N. Ein Isomorphismus π ist aber wie folgt gegeben. Sei p0 = 2, p1 = 3, ... die natürliche Aufzählung aller Primzahlen. Setze π(0) = 0, π(1) = 1, π(2) = 3, π(3) = 2 und π(pi ) = pi für alle i ≥ 2. Für natürliche Zahlen n ≥ 2 mit Primfaktorzerlegung Y km−1 n= pki00 · · · · · pim−1 ist π(n) = Y π(pi0 )k0 · · · · · π(pim−1 )km−1 . Es gilt aber dann π(1 + 1) = π(2) = 3 6= 2 = 1 + 1 = π(1) + π(1). 4.2 Ultraprodukte und Kompaktheit Wir wollen nun die Methode der Ultraproduktbildung von Modellen kennenlernen. Definition 4.2.1 Sei I 6= ∅ eine beliebige Menge. Eine Menge F von Teilmengen von I heißt ein Filter auf I gdw. (a) wenn X ∈ F und Y ∈ F , dann ist auch X ∩ Y ∈ F , (b) wenn X ∈ F und Y ⊃ X, wobei Y ⊂ I, dann ist auch Y ∈ F , (c) I ∈ F , und (d) ∅ 6∈ F . Sei etwa u eine nichtleere Teilmenge von I. Dann ist {X ⊂ I : u ⊂ X} ein Filter auf I. Dieser heißt der von u erzeugte prinzipale Filter. Sei I unendlich. Dann ist {X ⊂ I : I\X ist endlich} ein Filter auf I, der aus allen koendlichen Teilmengen von I besteht. Dieser heißt der Frechét–Filter auf I. 2 d.h. Automorphismus 72 KAPITEL 4. MODELLE Definition 4.2.2 Sei I 6= ∅, und sei F ein Filter auf I. Dann heißt F Ultrafilter auf I gdw für jedes X ⊂ I gilt: X ∈ F oder I\X ∈ F . Wenn F Ultrafilter auf I ist, dann gilt für jedes X ⊂ I genau eine der beiden Aussagen X ∈ F, I\X ∈ F . Mit Hilfe des Hausdorffschen Maximalitätsprinzips (siehe Definition 3.2.11) zeigt man den folgenden Satz 4.2.3 (Tarski) Sei I 6= ∅, und sei F ein Filter auf I. Dann existiert ein Ultrafilter U auf I, der F fortsetzt, d.h. so dass U ⊃ F . Sei nun L eine Sprache der Logik erster Stufe. Sei I 6= ∅, und sei für jedes σ ∈ I ein L–Modell Mσ gegeben. Sei weiterhin U ein Ultrafilter auf I. Wir wollen dann das Ultraprodukt der Modelle Mσ mittels U , in Zeichen Y Mσ /U, σ∈I definieren. Wir definieren zunächst die Trägermenge des Ultraproduktes. Mit |Mσ | bezeichnen wir die Trägermenge des Modells Mσ . Es sei F ∗ die Menge aller Funktionen f mit Definitionsbereich I, so dass f (σ) ∈ |Mσ | für alle σ ∈ I. Für f, g ∈ F ∗ schreiben wir f ∼g gdw. {σ ∈ I : f (σ) = g(σ)} ∈ U . Lemma 4.2.4 ∼ ist eine Äquivalenzrelation. Beweis: Lediglich die Transitivität von ∼ ist nicht trivial. Aus f ∼g und g∼h, d.h. {σ ∈ I : f (σ) = g(σ)} ∈ U und {σ ∈ I : g(σ) = h(σ)} ∈ U folgt aber wegen {σ ∈ I : f (σ) = h(σ)} ⊃ {σ ∈ I : f (σ) = g(σ)} ∩ {σ ∈ I : g(σ) = h(σ)}, dass {σ ∈ I : f (σ) = h(σ)} ∈ U , also f ∼h. Wir schreiben [f ] für die Äquivalenzklasse von f ∈ F ∗ , d.h. [f ] = {g ∈ F ∗ : g∼f }. Wir schreiben auch F für die Menge aller [f ] mit f ∈ F ∗ . F wird die Trägermenge des Ultraproduktes sein, welches wir mit M bezeichnen wollen. Um M zu definieren, müssen wir neben der Trägermenge die Interpretationen von ck , fj und Pi angeben. Dies geschieht wie folgt. Wir setzen, für k ∈ K, Mσ für alle σ ∈ I. cM k = [f ], wobei f (σ) = ck Wir setzen weiter, für j ∈ J, fjM([f0 ], . . . , [fnj −1 ]) = [f ], wobei f (σ) = fjMσ (f0 (σ), . . . , fnj −1 (σ)) für alle σ ∈ I 4.2. ULTRAPRODUKTE UND KOMPAKTHEIT 73 und schließlich, für i ∈ I, ([f0 ], . . . , [fni −1 ]) ∈ PiM ⇔ {σ ∈ I : (f0 (σ), . . . , fni −1 (σ)) ∈ PiMσ } ∈ U. Dieses so konstruierte Modell M = (F; (PiM : i ∈ I), (fjM : j ∈ J), (ck : k ∈ K)) bezeichnen wir als das Ultraprodukt der Modelle Mi mittels U . Q Lemma 4.2.5 Sei, für σ ∈ I, βσ eine Mσ –Belegung, und sei die σ∈I Mσ /U – Belegung β wie folgt definiert: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle σ ∈ I. Sei β̄ die durch β induzierte Termbelegung, und sei, für σ ∈ I, β̄σ die durch βσ induzierte Termbelegung. Sei schließlich für einen beliebigen Term τ die Funktion hτ mit Definitionsbereich I definiert durch hτ (σ) = β̄σ (τ ). Dann gilt für jeden Term τ , dass β̄(τ ) = [hτ ]. Die folgende Aussage ist von zentraler Bedeutung. Q Satz 4.2.6 (Loś) Sei, für σ ∈ I, βσ eine Mσ –Belegung, und sei die σ∈I Mσ /U – Belegung β wie folgt definiert: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle σ ∈ I. Dann gilt für alle Formeln ϕ Y Mσ /U |= ϕ[β] gdw. {σ ∈ I : Mσ |= ϕ[βσ ]} ∈ U. σ∈I Beweis durch Induktion nach der Komplexität von ϕ. Wir schreiben M̃ für Q M/U . σ∈I Sei zunächst ϕ atomar. Sei etwa ϕ ≡ vk = vl . Dann gilt M̃ |= vk = vl [β] gdw. β(vk ) = β(vl ) gdw. [f ] = [g], wobei f (σ) = βσ (vk ) und g(σ) = βσ (vl ) für alle σ ∈ I, gdw. {σ ∈ I : βσ (vk ) = βσ (vl )} ∈ U gdw. {σ ∈ I : Mσ |= vk = vl [βσ ]} ∈ U . Für die übrigen atomaren Fälle ist das Argument völlig analog. Sei nun ϕ ≡ ¬ψ. Hier benutzt der Induktionsschritt die Tatsache, dass U ein Ultrafilter (und nicht etwa nur ein Filter) auf I ist. Es gilt M |= ¬ψ[β] gdw. M 6|= ψ[β] gdw. {σ ∈ I : Mσ |= ψ[βσ ]} 6∈ U nach Induktionsvoraussetzung, gdw. {σ ∈ I : Mσ 6|= ψ[βσ ]} ∈ U , da U ein Ultrafilter ist, gdw. {σ ∈ I : Mσ |= ¬ψ[βσ ]} ∈ U . Der Induktionsschritt für ϕ ≡ ψ ∧ ψ ′ ist sehr einfach. Wir betrachten schließlich den Fall, dass ϕ ≡ ∀vk ψ. 74 KAPITEL 4. MODELLE Setzen wir zunächst voraus, dass {σ ∈ I : Mσ |= ∀vk ψ[βσ ]} ∈ U . Sei [f ] ∈ |M̃| = F beliebig. Dann gilt {σ ∈ I : Mσ |= ψ[βσ (vk |f (σ))]} ⊃ {σ ∈ I : Mσ |= ∀vk ψ[βσ ]}, also {σ ∈ I : Mσ |= ψ[βσ (vk |f (σ))]} ∈ U . Die Induktionsvoraussetzung liefert dann M̃ |= ψ[β(vk |[f ])]. Da [f ] beliebig war, haben wir also M |= ∀vk ψ[β] gezeigt. Setzen wir nun voraus, dass {σ ∈ I : Mσ |= ∀vk ψ[βσ ]} ∈ / U , d.h. {σ ∈ I : Mσ |= ∃vk ¬ψ[βσ ]} ∈ U . Wir wollen zeigen, dass M̃ 6|= ∀vk ψ[β], d.h. M̃ |= ∃vk ¬ψ[β]. Mit Hilfe des Auswahlaxioms finden wir ein f ∈ F ∗ , so dass Mσ |= ¬ψ[βσ (vk |f (σ))] für alle σ ∈ I, für die ein a ∈ |Mσ | mit Mσ |= ¬ψ[βσ (vk |a)] existiert. Dann gilt offensichtlich {σ ∈ I : Mσ |= ¬ψ[βσ (vk |f (σ))]} = {σ ∈ I : Mσ |= ∃vk ¬ψ[βσ ]} ∈ U, und damit mit Hilfe der Induktionsvoraussetzung M |= ¬ψ[β(vk |[f ])], wie gewünscht. Mit Hilfe dieser Methode zeigt sich nun sehr leicht der Kompaktheitssatz der Logik erster Stufe. Satz 4.2.7 (Kompaktheitssatz) Sei Σ eine endlich erfüllbare Menge von L–Formeln, d.h. für jedes endliche σ ⊂ Σ existiert ein L–Modell Mσ und eine Mσ –Belegung βσ mit Mσ |= σ[βσ ]. Dann existiert ein L–Modell M̃ und eine M̃–Belegung β mit M̃ |= Σ[β]. Beweis: Sei I die Menge aller endlichen Teilmengen von Σ. Für σ ∈ I sei Xσ = {τ ∈ I : τ ⊃ σ}. Die Mengen Xσ genieren einen Filter F auf I wie folgt: Wir setzen X ∈ F gdw. ∃σ ∈ IX ⊃ Xσ . Behauptung: F ist ein Filter auf I. Beweis: (a): Seien X, Y ∈ F . Seien σ, τ ∈ I so, dass X ⊃ Xσ und Y ⊃ Xτ . Dann gilt X ∩ Y ⊃ Xσ ∩ Xτ = Xσ∪τ , also auch X ∩ Y ∈ F . (b) ist trivial. (c): Da ∅ ∈ I, gilt I ∈ F . (d): Da σ ∈ Xσ für alle σ ∈ I, gilt ∅ ∈ / F. Sei nun (mit Hilfe des Satzes 4.2.3 von Tarski) U ein Ultrafilter auf I, der 4.3. NICHTSTANDARD-MODELLE 75 Q F fortsetzt. Wir setzen dann M̃ = σ∈I Mσ /U . Wir definieren eine M̃– Belegung β durch: β(vk ) = [f ], wobei f (σ) = βσ (vk ) für alle σ ∈ I. Es genügt nun zu zeigen, dass M |= Σ[β]. Sei also ϕ ∈ Σ. Dann folgt aus ϕ ∈ σ (d.h. {ϕ} ⊂ σ}, dass Mσ |= ϕ[βσ ], also {σ ∈ I : Mσ |= ϕ[βσ ]} ⊃ X{ϕ} ∈ U , und damit auch {σ ∈ I : Mσ |= ϕ[βσ ]} ∈ U . Auf Grund des Satzes von Loś gilt dann M̃ |= ϕ[β] wie gewünscht. Ein Spezialfall von Ultraprodukten ist die Ultrapotenz. Sei I 6= ∅, und sei U ein Ultrafilter auf I. Sei M ein L–Modell, und sei Mi = M für alle i ∈ I. Dann schreiben wir: U lt(M; U ) Q für i∈I Mi /U und nennen dies die Ultrapotenz von M mittels U . Der Satz von Loś ergibt sofort das folgende Korollar 4.2.8 Sei β̄ eine M–Belegung, und sei die U lt(M; U )–Belegung β definiert durch β(vk ) = [cβ̄(vk ) ], wobei cβ̄(vk ) die konstante Funktion mit Wert β̄(vk ) (und Definitionsbereich I) ist. Dann gilt U lt(M; U ) |= ϕ[β] gdw. M |= ϕ[β̄] für alle Formeln ϕ. Es existiert auch eine natürliche “Einbettung” e von M nach U lt(M; U ). Für a ∈ |M| setzen wir e(a) = [ca ], wobei ca die konstante Funktion mit Wert a (und Definitionsbereich I) ist. Es gilt dann: Korollar 4.2.9 Es gilt U lt(M; U ) |= ϕ(e(a0 ), . . . , e(aj−1 )) gdw. M |= ϕ(a0 , . . . , aj−1 ) für alle Formeln ϕ und a0 , . . . , aj−1 ∈ |M|. 4.3 Nichtstandard-Modelle Auf diese Art und Weise lassen sich sehr leicht “Nichtstandardmodelle” konstruieren. Sei etwa N = (N; 0, 1, <, +, ·, E), und sei U ein Ultrafilter auf N, der den Frechét–Filter auf N fortsetzt. Dann ist U lt(N; U ) nicht isomorph zu N (d.h. die Einbettung e ist nicht surjektiv). Sei R = (R; 0, 1, <, +, ·, E), 76 KAPITEL 4. MODELLE und sei wieder U ein Ultrafilter auf N, der den Frechét–Filter auf N fortsetzt. Dann enthält U lt(R; U ) sowohl “infinitesimale” Zahlen als auch “unendlich große” Zahlen.