Skriptum zur Vorlesung Mathematische Logik

Werbung
Skriptum zur Vorlesung
Mathematische Logik
Klaus Gloede
Mathematisches Institut der Universität Heidelberg
Wintersemester 2006/07
INHALTSVERZEICHNIS
i
Inhaltsverzeichnis
I
Collegium Logicum
1
Die Aussagenlogik
1.1 Syntax der Aussagenlogik . . . . . . . . . . . . . . . . . . .
1.1.1 Definition der aussagenlogischen Formeln . . . . . . .
1.1.2 Induktion und Rekursion . . . . . . . . . . . . . . . .
1.1.3 Beweis durch Induktion über den Formelaufbau . . . .
1.1.4 Definition durch Rekursion über den Formelaufbau . .
1.2 Semantik der Aussagenlogik . . . . . . . . . . . . . . . . . .
1.2.1 Wahrheitsfunktionen . . . . . . . . . . . . . . . . . .
1.2.2 Interpretation von aussagenlogischen Formeln . . . . .
1.2.3 Definition der wichtigsten semantischen Begriffe . . .
1.2.4 Einige wichtige allgemeingültige Formeln . . . . . . .
1.2.5 Einige wichtige Äquivalenzen . . . . . . . . . . . . .
1.2.6 Boolesche Gesetze . . . . . . . . . . . . . . . . . . .
1.2.7 Einsetzungsregel . . . . . . . . . . . . . . . . . . . .
1.2.8 Ersetzungsregel . . . . . . . . . . . . . . . . . . . . .
1.3 Normalformen . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Entscheidungsverfahren für Boolesche Normalformen
1.3.2 Boolescher Repräsentationssatz . . . . . . . . . . . .
1.3.3 Das Dualitätsprinzip . . . . . . . . . . . . . . . . . .
1.4 Der semantische Folgerungsbegriff: Erfüllbarkeit . . . . . . .
1.4.1 Zusammenhang zwischen Folgerung und Erfüllbarkeit
1.5 Der syntaktische Folgerungsbegriff: Beweisbarkeit . . . . . .
1.5.1 Axiomensysteme und Beweise . . . . . . . . . . . . .
1.5.2 Korrektheit und Vollständigkeit . . . . . . . . . . . .
1.5.3 Einige Axiomensysteme der Aussagenlogik . . . . . .
1.6 Vollständigkeit und Kompaktheit . . . . . . . . . . . . . . . .
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
5
5
6
8
9
10
10
11
12
14
14
15
15
16
17
19
20
21
23
24
25
25
26
27
29
INHALTSVERZEICHNIS
1.6.1
1.6.2
1.6.3
1.6.4
1.6.5
1.6.6
1.6.7
1.6.8
1.6.9
2
3
ii
Verallgemeinerte Expansion . . . . . . . . . . . . . .
Lemma über die Negation . . . . . . . . . . . . . . .
Tautologiesatz . . . . . . . . . . . . . . . . . . . . .
Deduktionstheorem . . . . . . . . . . . . . . . . . . .
Widerspruchsfreiheit und Vollständigkeit von Theorien
Lemma über Beweisbarkeit und Konsistenz . . . . . .
Vervollständigung . . . . . . . . . . . . . . . . . . .
Verallgemeinerter Vollständigkeitssatz . . . . . . . . .
Kompaktheitssatz der Aussagenlogik . . . . . . . . .
Strukturen und formale Sprachen
2.1 Strukturen . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Beispiele . . . . . . . . . . . . . . . . . . . .
2.1.2 Mehrsortige Strukturen . . . . . . . . . . . . .
2.1.3 Symbole für formale Sprachen . . . . . . . . .
2.2 Unterstrukturen und Morphismen . . . . . . . . . . . .
2.2.1 Beispiele . . . . . . . . . . . . . . . . . . . .
2.2.2 Satz über Unterstrukturen . . . . . . . . . . .
2.2.3 Homomorphes Bild, Identifizierung . . . . . .
2.3 Terme einer Sprache . . . . . . . . . . . . . . . . . .
2.3.1 Interpretation von Termen . . . . . . . . . . .
2.3.2 Spracherweiterung durch Namen . . . . . . . .
2.3.3 Erzeugte Unterstrukturen . . . . . . . . . . . .
2.4 Formeln einer Sprache . . . . . . . . . . . . . . . . .
2.4.1 Beweis durch Induktion über den Formelaufbau
2.4.2 Freie und gebundene Variable . . . . . . . . .
2.4.3 Substitution . . . . . . . . . . . . . . . . . . .
Modelle und Theorien
3.1 Das Wahrheitsprädikat: Modelle . . . . . . . . . .
3.1.1 Satz über neue Konstanten . . . . . . . . .
3.2 Axiome und Theorien . . . . . . . . . . . . . . . .
3.3 Der Kompaktheitssatz und einige Folgerungen . . .
3.3.1 Kompaktheitssatz . . . . . . . . . . . . . .
3.3.2 Satz über die Existenz unendlicher Modelle
3.4 Diagramme . . . . . . . . . . . . . . . . . . . . .
3.4.1 Diagrammlemma . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31
32
32
33
33
34
35
35
36
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
38
38
39
40
41
43
44
44
45
45
46
47
48
49
50
51
.
.
.
.
.
.
.
.
53
53
55
56
57
57
58
59
59
INHALTSVERZEICHNIS
3.5
4
3.4.2 Universelle Theorien . . . . . . . . . . .
3.4.3 Modellerweiterungssatz von Keisler . . .
3.4.4 Erhaltungssatz für universelle Formeln .
3.4.5 Satz von Łoś-Tarski . . . . . . . . . . .
Einige mathematische Theorien . . . . . . . . .
3.5.1 Ordnungen . . . . . . . . . . . . . . . .
3.5.2 Gruppen- und Körpertheorie . . . . . . .
3.5.3 Axiomatisierbarkeit: Elementare Klassen
3.5.4 Zahlentheorie . . . . . . . . . . . . . . .
3.5.5 Mengenlehre . . . . . . . . . . . . . . .
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Gesetze der Prädikatenlogik
4.1 Ein Axiomensystem für die Prädikatenlogik . . . . . . . . . .
4.1.1 Axiomensystem von Shoenfield . . . . . . . . . . . .
4.1.2 Definition eines Beweises . . . . . . . . . . . . . . .
4.2 Der Tautologiesatz . . . . . . . . . . . . . . . . . . . . . . .
4.3 Substitution und universeller Abschluß . . . . . . . . . . . . .
4.3.1 Hintere Generalisierung . . . . . . . . . . . . . . . .
4.3.2 Satz über die Generalisierung . . . . . . . . . . . . .
4.3.3 Substitutionsregel . . . . . . . . . . . . . . . . . . . .
4.3.4 Substitutionssatz . . . . . . . . . . . . . . . . . . . .
4.3.5 Abschlußsatz . . . . . . . . . . . . . . . . . . . . . .
4.4 Ersetzung und Umbenennung, Gleichheit . . . . . . . . . . .
4.4.1 Ersetzungstheorem . . . . . . . . . . . . . . . . . . .
4.4.2 Eigenschaften des Gleichheitsprädikates . . . . . . . .
4.5 Pränexe Normalformen . . . . . . . . . . . . . . . . . . . . .
4.5.1 Umformungen mit der Negation . . . . . . . . . . . .
4.5.2 Umformungen mit Konjunktion und Disjunktion . . .
4.5.3 Umformungen mit der Implikation . . . . . . . . . . .
4.5.4 Das Dualitätsprinzip für die Prädikatenlogik . . . . . .
4.6 Das Deduktionstheorem . . . . . . . . . . . . . . . . . . . . .
4.7 Erweiterungen von Theorien, Widerspruchsfreiheit . . . . . .
4.7.1 Erweiterungen und Expansionen . . . . . . . . . . . .
4.7.2 Satz über rein sprachliche Erweiterungen von Theorien
4.7.3 Widerspruchsfrei/widerspruchsvoll . . . . . . . . . .
4.7.4 Beweisbarkeit und Widerspruchsfreiheit . . . . . . . .
4.8 Termmodelle . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
60
61
62
62
63
63
64
65
66
69
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
70
70
71
72
73
75
76
76
77
77
79
79
79
80
82
82
82
83
85
87
89
89
91
93
94
95
INHALTSVERZEICHNIS
iv
4.8.1 Kanonische Struktur einer Theorie, Termstruktur . . . . .
4.8.2 Satz über Termmodelle . . . . . . . . . . . . . . . . . . .
4.9 Vervollständigung von Theorien . . . . . . . . . . . . . . . . . .
4.9.1 Satz von Lindenbaum . . . . . . . . . . . . . . . . . . .
4.10 Henkin-Theorien . . . . . . . . . . . . . . . . . . . . . . . . . .
4.11 Der Gödelsche Vollständigkeitssatz . . . . . . . . . . . . . . . . .
4.11.1 Vollständigkeit der Prädikatenlogik / Modellexistenz-Satz
4.11.2 Satz von Löwenheim . . . . . . . . . . . . . . . . . . . .
4.11.3 Kompaktheitssatz . . . . . . . . . . . . . . . . . . . . . .
95
96
97
98
99
102
102
104
105
II Mengenlehre
106
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
107
107
108
111
112
112
114
115
116
117
120
122
124
127
127
130
133
.
.
.
.
.
.
135
135
135
136
137
138
138
6
Grundlagen der Mengenlehre
5.1 Ordinalzahlen . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Ordnungen . . . . . . . . . . . . . . . . . . . . . .
5.1.2 Definition der Ordinalzahlen . . . . . . . . . . . . .
5.1.3 Satz: Charakterisierung von Ordinalzahlen . . . . .
5.1.4 Die Ordnung der Ordinalzahlen . . . . . . . . . . .
5.2 Mengen und Klassen . . . . . . . . . . . . . . . . . . . . .
5.2.1 Komprehensionsaxiom . . . . . . . . . . . . . . . .
5.2.2 Auswege aus den Antinomien . . . . . . . . . . . .
5.2.3 Die mengentheoretische Sprache mit Klassentermen
5.2.4 Überblick über verschiedene Axiomensysteme . . .
5.3 Extensionalität und Aussonderung . . . . . . . . . . . . . .
5.4 Relationen und Funktionen . . . . . . . . . . . . . . . . . .
5.5 Vereinigung und Produkt . . . . . . . . . . . . . . . . . . .
5.5.1 Vereinigung . . . . . . . . . . . . . . . . . . . . . .
5.5.2 Potenzmenge und allgemeines Produkt . . . . . . .
5.6 Überblick über die ZF-Axiome . . . . . . . . . . . . . . . .
Mengen von Mengen von . . .
6.1 Induktion und Rekursion . . . . . . . . . . .
6.1.1 Ordnungen auf Klassen . . . . . . . .
6.1.2 Minimumsprinzip . . . . . . . . . . .
6.1.3 Induktionsprinzip für Wohlordnungen
6.1.4 Segmente . . . . . . . . . . . . . . .
6.1.5 Rekursionssatz für Wohlordnungen .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
6.2
6.3
7
8
III
9
v
6.1.6 Repräsentationssatz für Wohlordnungen . .
6.1.7 Transfinite Rekursion . . . . . . . . . . . .
Die von-Neumannsche Hierarchie . . . . . . . . .
Die Rolle des Unendlichkeitsaxioms . . . . . . . .
6.3.1 PA in mengentheoretischer Sprache . . . .
6.3.2 Die Theorie der endlichen Mengen . . . . .
6.3.3 Anwendungen der numerischen Rekursion
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Das Auswahlaxiom
7.1 Zermelos Axiom . . . . . . . . . . . . . . . . . . . . .
7.1.1 Mengentheoretisch äquivalente Formen . . . . .
7.1.2 Der Zermelosche Wohlordnungssatz . . . . . . .
7.1.3 Maximumsprinzipien von Zorn und Hausdorff .
7.2 Anwendungen des Auswahlaxioms . . . . . . . . . . . .
7.2.1 Jeder Vektorraum besitzt eine Basis. . . . . . . .
7.2.2 Der Satz von Hahn-Banach . . . . . . . . . . . .
7.2.3 Nicht-meßbare Mengen . . . . . . . . . . . . .
7.2.4 Äquivalenz verschiedener Stetigkeitsdefinitionen
7.2.5 Satz von Tychonoff . . . . . . . . . . . . . . . .
7.2.6 Boolesches Primidealtheorem . . . . . . . . . .
Mächtigkeiten und Kardinalzahlen
8.1 Endliche und abzählbare Mengen . . . . . .
8.2 Abzählbare Mengen . . . . . . . . . . . . .
8.3 Überabzählbare Mengen . . . . . . . . . .
8.4 Mächtigkeiten . . . . . . . . . . . . . . . .
8.4.1 Satz von Cantor-Schröder-Bernstein
8.4.2 Vergleichbarkeitssatz von Hartogs .
8.4.3 Satz von Cantor . . . . . . . . . . .
8.5 Kardinalzahlen . . . . . . . . . . . . . . .
8.5.1 Operationen auf den Kardinalzahlen
8.5.2 Satz von Hessenberg . . . . . . . .
8.5.3 Satz von Bernstein . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Grundlagen der Modelltheorie
Hin und her: Vollständigkeit und elementare Äquivalenz
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
141
143
144
145
146
148
148
.
.
.
.
.
.
.
.
.
.
.
151
151
151
152
153
156
156
156
156
158
158
158
.
.
.
.
.
.
.
.
.
.
.
161
161
163
165
165
166
167
167
168
169
170
171
172
173
INHALTSVERZEICHNIS
9.1
9.2
9.3
vi
Elementare Äquivalenz . . . . . . . . . . . . . . . . . . . . . . . 173
Die Theorie der dichten linearen Ordnung . . . . . . . . . . . . . 175
Kategorizität . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
10 Auf und ab: Elementare Substrukturen
10.1 Elementare Substrukturen . . . . . . . . . . . .
10.2 Diagrammlemma (Fortsetzung) . . . . . . . . .
10.3 Kriterium von Tarski . . . . . . . . . . . . . .
10.4 Satz von Löwenheim-Skolem-Tarski (abwärts) .
10.5 Satz von Löwenheim-Skolem-Tarski (aufwärts)
10.6 Test von Vaught . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
180
180
181
181
182
183
184
11 Vereinigungen, Durchschnitte und Ketten
185
11.1 Satz über Ketten von Strukturen . . . . . . . . . . . . . . . . . . 186
11.2 Satz von Chang- Łoś-Szusko . . . . . . . . . . . . . . . . . . . . 188
12 Produkte und Ultraprodukte
12.1 Direktes Produkt . . . . . . . . . . . . . . .
12.2 Filter und Ultrafilter . . . . . . . . . . . . . .
12.3 Ultrafiltersatz, Boolesches Primidealtheorem
12.4 Reduziertes Produkt . . . . . . . . . . . . . .
12.5 Satz von Łoś . . . . . . . . . . . . . . . . .
12.6 Kompaktheitssatz . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
189
190
191
192
192
193
196
13 Modellvollständigkeit
198
13.1 Robinsonscher Test . . . . . . . . . . . . . . . . . . . . . . . . . 200
IV
Unvollständigkeit und Unentscheidbarkeit
14 Berechenbare Funktionen
14.1 Turing-Maschinen . . . . . . . . . . . . . .
14.2 URM-berechenbare Funktionen . . . . . .
14.3 Churchsche These . . . . . . . . . . . . . .
14.4 Aufzählbarkeitssätze . . . . . . . . . . . .
14.5 Primitiv-rekursive Funktionen . . . . . . .
14.6 Rekursive und partiell-rekursive Funktionen
14.7 Partielle Entscheidbarkeit . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
202
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
205
205
207
208
209
209
212
214
INHALTSVERZEICHNIS
vii
15 Definierbarkeit berechenbarer Funktionen
15.1 Eine endlich-axiomatisierbare Teiltheorie von PA
15.2 Arithmetische Formeln . . . . . . . . . . . . . .
15.3 Enderweiterungen . . . . . . . . . . . . . . . . .
15.4 Erhaltungseigenschaften unter Enderweiterungen
15.5 Lemma . . . . . . . . . . . . . . . . . . . . . .
15.6 Gödels Lemma . . . . . . . . . . . . . . . . . .
15.7 Definierbarkeitssatz für rekursive Funktionen . .
15.8 Repräsentierbarkeit . . . . . . . . . . . . . . . .
16 Die Gödelschen Sätze
16.1 Gödel-Nummern . . . . . . . . . . . . . .
16.2 Diagonalisierungslemma . . . . . . . . . .
16.3 Satz von Gödel-Rosser . . . . . . . . . . .
16.4 Erster Gödelscher Unvollständigkeitssatz .
16.5 Kombinatorische Prinzipien . . . . . . . .
16.6 Zweiter Gödelscher Unvollständigkeitssatz
16.7 Wahrheit ist nicht arithmetisch definierbar .
16.8 Unentscheidbarkeit . . . . . . . . . . . . .
17 Literatur
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
215
215
217
218
220
220
222
223
224
.
.
.
.
.
.
.
.
227
227
228
229
230
231
233
234
235
238
1
Teil I
Collegium Logicum
2
Mein teurer Freund, ich rat´ Euch drum
Zuerst Collegium Logicum.
Da wird der Geist Euch wohl dressiert
In spanische Stiefeln eingeschnürt,
Daß er bedächtiger so fortan
Hinschleiche die Gedankenbahn.
J. W. v. Goethe: Faust I
Alle Menschen sind sterblich, Sokrates ist ein Mensch,
also ist Sokrates sterblich.
So lautet ein bekanntes Beispiel eines logischen Schlusses. Dabei sagt die Logik nichts aus über die Gültigkeit der Einzelaussagen, insbesondere behauptet sie
nicht die Sterblichkeit von Sokrates, sondern die Wahrheit dieser Aussage unter
Annahme, daß die beiden vorangehenden Aussagen (die Prämissen) wahr sind.
Nach dem gleichen Muster könnte man auch folgern:
Alle Tappel haben einen Deppel, Knobbel ist ein Tappel,
also hat Knobbel einen Deppel.
Bereits A RISTOTELES (384 - 322 v. Chr.) hat in seiner Syllogistik damit begonnen, derartige Schlußweisen zu formalisieren und alle möglichen Schlüsse systematisch auf ihre Gültigkeit zu untersuchen1 . Auch erste Ansätze einer Aussagenlogik finden sich bei A RISTOTELES ; sie wird vor allem in der Stoa und in der
Scholastik weiterentwickelt. Den obigen Schluß können wir in moderner Symbolik in der Form
∀X(M(X) → T (X)), M(S)
also: T (S)
1 I.
Susan Russinoff hat 1999 darauf hingewiesen, daß die endgültige Klassifizierung der Syllogismen erst 1883 von einer Schülerin des amerikanischen Logikers C.S. Peirce dargestellt wurde:
Christine Ladd-Franklin. Bereits 1882 hatte sie alle Voraussetzungen für eine Promotion an der
John Hopkins University erfüllt; da sie aber damals als Frau nicht zugelassen wurde, erhielt sie
ihren Ph.D.-Grad erst 1926, und ihre Arbeit blieb über hundert Jahre unbeachtet.
3
schreiben. Daraus wird deutlich, daß der Schluß ganz allgemein und allein aufgrund seiner Form gilt - die Untersuchung derartiger Schlußweisen ist Gegenstand der Mathematischen Logik (auch Formale Logik, Symbolische Logik oder
Metamathematik, von Philosophen auch Moderne Logik oder Logistik genannt).
Die Mathematische Logik ist
(i) eine Logik für die Mathematik; sie untersucht Ausdrucksmöglichkeiten in
formalen Sprachen und Schlußweisen, wie sie in der Mathematik insbesondere für axiomatische Theorien gebräuchlich sind. Das bedeutet - thematisch
- natürlich eine starke Einschränkung gegenüber der allgemeinen (philosophischen) Logik, aber - methodisch - ermöglicht diese Beschränkung es andererseits, sie selbst als
(ii) eine formale mathematischen Theorie zu entwickeln. Dadurch kann die Mathematische Logik (als Metatheorie) über die Mathematische Logik selbst
(und zwar nun als formale mathematische Theorie) Aussagen machen. Diese sind möglicherweise rückbezüglich und damit häufig widerspruchsvoll
(z. B.: Antinomie des Lügners); in diesem Fall jedoch kann man sie nach K.
G ÖDEL benutzen, um die Grenzen ihrer eigenen Methode aufzeigen (etwa
in Form der G ÖDELschen Unvollständigkeitssätze).
4
Kapitel 1
Die Aussagenlogik
Die Aussagenlogik untersucht die Verknüpfungen “nicht”, “und”, “oder”, “wenn
. . . dann” und “genau dann, wenn”. Diese Operationen kommen auch in der Umgangssprache vor, allerdings möglicherweise mit zusätzlichen Aspekten, die über
den Gebrauch in der Mathematik hinausgehen und hier natürlich unberücksichtigt bleiben sollen. Aufgrund dieser Einschränkung wird die Aussagenlogik (AL)
zu einem einfachen Kalkül (dem Aussagenkalkül) der beiden Wahrheitswerte W
und F; mathematisch gesehen handelt es sich um eine sehr einfache Theorie die Algebra der zwei Werte 0 und 1. Wir wollen sie hier trotzdem ausführlicher
behandeln, denn
• die AL ist Grundlage der Computerlogik mit zahlreichen Anwendungen (etwa auf die Untersuchung von Schaltungen) und
• sie ist Bestandteil fast jeder weiteren Logik, insbesondere der später einzuführenden Prädikatenlogik (PL).
• Grundlegende Begriffsbildungen, die besonders für die PL wichtig werden,
können hier in einer einfachen Situation vorbereitet werden.
Beginnen werden wir mit dem Aufbau einer formalen Sprache: Aus einer vorgegebenen Liste von Zeichen oder
• Symbolen (entsprechend dem Alphabet einer natürlichen Sprache) werden
nach bestimmten formalen Gesetzen Zeichenreihen gebildet und als
• Formeln (entsprechend den Wörtern einer natürlichen Sprache) ausgezeichnet; die Bedeutung der Formeln wird dann durch
• Interpretationen (Modelle) festgelegt.
1.1. S YNTAX DER AUSSAGENLOGIK
5
1.1 Syntax der Aussagenlogik
Mit Hilfe der Symbole
¬ (nicht), ∧ (und), ∨ (oder), → (wenn . . . dann), ↔ (genau dann . . . wenn)
und den Aussagenvariablen (für aussagenlogisch nicht weiter zerlegbare Grundaussagen) definieren wir den Begriff einer aussagenlogischen Formel, abgekürzt
a. F., wie folgt:
1.1.1 Definition der aussagenlogischen Formeln
(F1) A0 , A1 , A2 , . . . sind a. F., und zwar Aussagenvariable.
(F2) Ist ϕ eine a. F., so auch ¬ ϕ.
(F3) Sind ϕ und ψ a. F., so auch (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ) und (ϕ ↔ ψ).
(F4) Das sind alle a. F.
Aussagenlogische Formeln werden wir wie oben mit kleinen griechischen Buchstaben ϕ, ψ, χ, . . . bezeichnen, Aussagenvariable auch mit A, B,C, . . .
Achtung: Formeln sind formale endliche Zeichenreihen; ihre Bedeutung haben
wir zwar oben bereits in Klammern angegeben, aber davon werden (und dürfen)
wir zunächst keinen Gebrauch machen!
Beispiele für aussagenlogische Formeln sind:
A, ¬A, ¬¬¬B, (((¬¬A ∨ B) ∧ ¬A) → (A ∧ ¬C)),
während A¬, B∨), A ∧ ¬C keine aussagenlogischen Formeln sind!
Klammerregeln
Klammern dienen der eindeutigen Darstellbarkeit von Formeln, können zur besseren Lesbarkeit jedoch in einigen Fällen eingespart werden:
• Äußere Klammern können fortgelassen werden: Schreibe
A ∧ ¬C statt (A ∧ ¬C).
1.1. S YNTAX DER AUSSAGENLOGIK
6
• ∧ und ∨ “binden stärker” als → und ↔: schreibe
B ∧ ¬A → A ∨ ¬C statt ((B ∧ ¬A) → (A ∨ ¬C)).
Dagegen werden wir ∧ und ∨ gleichberechtigt behandeln, d. h. bei
(¬¬A ∨ B) ∧ ¬A sowie (A ∨ B) ∧C bzw. A ∨ (B ∧C).
kann man keine weiteren Klammern einsparen.
• Für ∧ und ∨ benutzen wir die assoziative Schreibweise:
A ∨ B ∨C steht für (A ∨ (B ∨C)) und A ∧ B ∧C für (A ∧ (B ∧C)).
Die andere mögliche Klammerung führt formal zu einer anderen, inhaltlich
jedoch äquivalenten Formel. Rechtsklammerung werden wir später auch
wählen bei
•
A→B→C
für
A → (B → C),
welches jedoch nicht äquivalent zu (A → B) → C ist! Gelegentlich findet man
weitere Vereinbarungen über das Fortlassen von Klammern; gänzlich entbehrlich
sind sie bei der polnischen Notation: Hier schreibt man etwa
Nϕ für ¬ϕ, Aϕψ für ϕ ∨ ψ, Kϕψ für ϕ ∧ ψ,
so daß ¬(p ∨ q) ∧ (p ∧ ¬¬q) in polnischer Notation KNApqK pNNq geschrieben wird.
1.1.2 Induktion und Rekursion
Eine explizite Definition des Begriffs “a. F.” würde diesen auf bereits bekannte
zurückführen und von der Form sein
ϕ ist a. F. :⇐⇒ . . .,
wobei rechts eine Eigenschaft von ϕ steht (das Definiens), in welcher das Definiendum, nämlich a. F., selbst nicht vorkommt. Dagegen ist die Definition 1.1.1
rekursiv, indem zwar auf der rechten Seite auch das zu Definierende vorkommt,
aber zurückgeführt auf kürzere Ausdrücke.
Eine rekursive Definition hat den Vorzug, daß sie in der Regel zugleich ein
Verfahren enthält, in endlich vielen Schritten “effektiv” nachzuprüfen, ob der vorgelegte Ausdruck der Definitionsanforderung genügt oder nicht. Man sagt in diesem Fall auch: Das Prädikat
7
1.1. S YNTAX DER AUSSAGENLOGIK
z1 . . . zn ist eine aussagenlogische Formel
ist entscheidbar, d. h. es gibt ein “mechanisches” Verfahren, das - angewandt auf
eine vorgegebene endliche Zeichenreihe z1 . . . zn - nach endlich-vielen Schritten
feststellt, ob z1 . . . zn eine aussagenlogische Formel ist oder nicht. Eine Präzisierung der Begriffe “entscheidbar”, “effektives” Verfahren werden wir später vornehmen. Ein weiterer Vorteil einer rekursiven Definition liegt darin, daß man eine
Aussage über den neuen Begriff beweisen kann, indem man sie
(1) zunächst für den Anfangsfall und dann
(2) für die aufbauenden Fälle nachweist,
also vom einfachen Fall zum komplizierten übergeht - man spricht dann von einem
Beweisverfahren durch Induktion. Dieses Prinzip ist bekannt aus der Theorie der
natürlichen Zahlen:
Induktionsprinzip für die natürlichen Zahlen
Es sei E eine Eigenschaft mit
(i) E(0),
(ii) falls E(n), so auch E(n0 ).
Induktionsanfang
Induktionsschluß
Dann gilt E(n) für alle natürlichen Zahlen n.
Dabei besteht der Induktionsschluß aus der Induktionsvoraussetzung E(n) und
der Induktionsbehauptung E(n0 ).
Wenn man die gewöhnliche Ordnung auf den natürlichen Zahlen benutzt, kann
man das Induktionsprinzip auch in der folgenden Form anwenden:
(Starkes) Induktionsprinzip für die natürlichen Zahlen
Es sei E eine Eigenschaft mit
(ii’) falls E(m) für alle m < n, so auch E(n).
Induktionsschluß
Dann gilt E(n) für alle natürlichen Zahlen n.
Diese beiden Induktionsprinzipien sind untereinander und mit dem Minimumsprinzip äquivalent:
8
1.1. S YNTAX DER AUSSAGENLOGIK
Minimumsprinzip für die natürlichen Zahlen
Falls es eine natürliche Zahl m mit der Eigenschaft E(m) gibt,
so gibt es eine kleinste derartige Zahl.
Aussagen über alle Formeln kann man durch Induktion beweisen, indem man
ein Komplexitätsmaß einführt, d. h. eine Funktion k, die allen Formeln eine natürliche Zahl zuordnet, so daß
k(ϕ) < k(¬ϕ),
z. B.:
k(ϕ), k(ψ) < k(ϕ ∗ ψ),
lz(ϕ) = Anzahl der logischen Verknüpfungen ¬, ∧, ∨, →, ↔ in ϕ,
l(ϕ) = Anzahl aller Zeichen in ϕ (Länge von ϕ).
Besonders nützlich ist dafür die Rangfunktion, rekursiv definiert durch
ρ(Ai ) = 0,
ρ(¬ϕ) = ρ(ϕ) + 1,
ρ(ϕ ∗ ψ) = max(ρ(ϕ), ρ(ψ)) + 1, wobei ∗ = ∧, ∨, →, ↔ .
1.1.3 Beweis durch Induktion über den Formelaufbau
Es sei E eine Eigenschaft mit
(i) E(A) gilt für alle Ausagenvariablen A,
(ii) gilt E(ϕ), so auch E(¬ϕ), und
(iii) gelten E(ϕ) und E(ψ), so auch E(ϕ ∗ ψ) für ∗ = ∧, ∨, → und ↔ .
Dann gilt E(ϕ) für alle a. F. ϕ.
Legt man ein Komplexitätsmaß k zugrunde, so kann man die drei Bedingungen
(i) - (iii) ersetzen durch eine einzige:
(ii’) Gilt E(ψ) für alle ψ mit k(ψ) < k(ϕ), so auch E(ϕ).
Die Rangfunktion haben wir oben durch Rekursion definiert; damit dies zulässig ist, benötigen wir die
1.1. S YNTAX DER AUSSAGENLOGIK
9
Eindeutige Lesbarkeit von Formeln
Es sei ϕ eine a. F. Dann ist ϕ entweder eine Aussagenvariable oder läßt sich auf
genau eine Weise in der Form
¬ψ, (ψ ∧ χ), (ψ ∨ χ), (ψ → χ) oder (ψ ↔ χ)
schreiben.
Zum Beweis benutze man das folgende (technische) Lemma:
Lemma
Es sei ϕ eine a. F., w eine endliche Zeichenreihe. Dann gilt:
Falls die Zeichenreihe ϕw eine a. F. ist, so ist w leer, also ϕw = ϕ.
Dieses Lemma - zugleich ein gutes Beispiel für eine syntaktische Aussage!
- beweist man am besten durch Induktion über die Anzahl l(ϕw) der Zeichen in
ϕw.
Neben der rekursiven Definition eines Prädikats (wie im Falle des Formelbegriffs) haben wir im Falle der Rangfunktion eine rekursive Definition einer Funktion. Auch derartige Funktionen haben ihr Vorbild in der Zahlentheorie, wo man
etwa die Funktion n! rekursiv definiert durch
0! = 1, (n + 1)! = n!(n + 1).
Diese Definition liefert nur deshalb eine Funktion, weil für eine Zahl n 6= 0 der
Vorgänger m von n (mit m0 = n) eindeutig bestimmt ist. Die entsprechende Voraussetzung für den Formelbegriff haben wir gerade mit der eindeutigen Lesbarkeit
der Formeln bewiesen.
1.1.4 Definition durch Rekursion über den Formelaufbau
Zu gegebenen Funktionen g0 , . . . , g5 (geeigneter Stellenzahl) läßt sich eine Funktion g auf der Menge der a. F. definieren durch:
g(A) = g0 (A)
g(¬ϕ) = g1 (g(ϕ))
g(ϕ ∧ ψ) = g2 (g(ϕ), g(ψ))
g(ϕ ∨ ψ) = g3 (g(ϕ), g(ψ))
g(ϕ → ψ) = g4 (g(ϕ), g(ψ))
g(ϕ ↔ ψ) = g5 (g(ϕ), g(ψ))
10
1.2. S EMANTIK DER AUSSAGENLOGIK
1.2 Semantik der Aussagenlogik
Die Bedeutung der aussagenlogischen Verknüpfungen wird üblicherweise durch
die Wahrheitstafeln festgelegt - die aussagenlogischen Verknüpfungen werden dadurch zu Funktionen auf den Wahrheitswerten
• W (“wahr”), manchmal auch mit 1 oder V bezeichnet, und
• F (“falsch”), manchmal auch mit 0 oder Λ bezeichnet.
(Wir behandeln hier die 2-wertige Logik, nehmen also an, daß es genau zwei
Wahrheitswerte gibt, nämlich W und F.)
1.2.1 Wahrheitsfunktionen
1-stellige Wahrheitsfunktionen
id
¬
F
W W
W F
F
W
F
F
W
W
F
Unter den vier 1-stelligen gibt es nur eine nicht-triviale Wahrheitsfunktion,
2
die die Wahrheitswerte vertauscht und der Negation entspricht. Es gibt 22 = 16
2-stellige Wahrheitsfunktionen; lassen wir die trivialen weg, so erhalten wir:
2-stellige (nichttriviale) Wahrheitsfunktionen
W
W
F
F
W
F
W
F
∧
∨
→
←
∇
↔
a
`
↓
↑
W
F
F
F
W
W
W
F
W
F
W
W
W
W
F
W
F
W
W
F
W
F
F
W
F
W
F
F
F
F
W
F
F
F
F
W
F
W
W
W
Neben den bereits eingeführten tritt hier noch das entweder-oder ∇ auf, das
weder-noch ↓ (“nor”, P EIRCE) sowie ↑ (“nand”, S HEFFER´s stroke).
3
Weiterhin gibt es bereits 22 = 256 3-stellige Wahrheitsfunktionen, allgemein
n
22 n-stellige Wahrheitsfunktionen, auf die wir später noch zurückkommen werden.
1.2. S EMANTIK DER AUSSAGENLOGIK
11
Wir wollen nun jeder aussagenlogischen Formel ϕ(A1 , . . . , An ) in den Aussagenvariablen A1 , . . . , An den Wahrheitswert zuordnen, der sich durch Auswertung
gemäß den Wahrheitstafeln ergibt. Dieser Wert hängt ab
(1) von den Wahrheitswerten, die die Aussagenvariablen erhalten, sowie davon,
(2) wie ϕ aus den Aussagenvariablen mit Hilfe der aussagenlogischen Verknüpfungen zusammengesetzt ist:
1.2.2 Interpretation von aussagenlogischen Formeln
ϕ sei eine aussagenlogische Formel, V sei eine beliebige (u. U. unendliche) Menge
von Aussagenvariablen. Man bezeichnet mit
f: V → {W,F}
B(V) := { f | f : V −→ {W,F}}
V (ϕ)
F(V) := {ϕ|V (ϕ) ⊆ V }
Belegung von V (mit Wahrheitswerten),
Menge der Belegungen von V.
Menge der Aussagenvariablen in ϕ
Menge der Formeln mit Variablen in V.
Es sei nun ϕ eine aussagenlogische Formel mit Variablen in V, f : V −→ {W, F}
eine Belegung mit V (ϕ) ⊆ V . Dann definieren wir
f(ϕ) als Wahrheitswert (oder: Interpretation) von ϕ unter der Belegung f
durch Rekursion über den Aufbau von ϕ wie folgt:
f (ϕ) = f (A),
f alls ϕ = A eine Aussagenvariable ist,
f (¬ϕ) = ¬ f (ϕ),
f (ϕ ∗ ψ) = f (ϕ) ∗ f (ψ).
Dabei steht * für die 2-stelligen Operationen. Zu beachten ist, daß auf der linken Seite innerhalb der Klammern die Symbole für die aussagenlogischen Verknüpfungen, auf der rechten Seite aber die zugeordneten Operationen stehen, die
man aus den Wahrheitstafeln entnimmt (und die wir dort der Einfachheit halber
auch mit den entsprechenden Symbolen bezeichnet haben).
Beispiel
Es sei ϕ = ¬(A ↔ C) ∧ ¬D, also V (ϕ) = {A,C, D}. Ferner sei V = {A, B,C, D},
und f : V −→ {W, F} sei definiert durch
12
1.2. S EMANTIK DER AUSSAGENLOGIK
f (A) = W, f (B) = W, f (C) = F, f (D) = W.
Dann erhält man durch sukzessive Berechnung (entsprechend der rekursiven Definition):
f
A
B
C
D
A↔C
¬(A ↔ C)
D
¬D
ϕ
W
W
F
W
F
W
W
F
F
f (ϕ) hängt hier natürlich nicht von f (B) ab, da B nicht in ϕ vorkommt. Allgemein
gilt:
Satz
f (ϕ) hängt nur von f V (ϕ) (und natürlich von ϕ) ab, d. h. sind f und g zwei
Belegungen, die (mindestens) auf V (ϕ) definiert sind und dort übereinstimmen, so
ist f (ϕ) = g(ϕ).
Beweis: durch Induktion über den Formelaufbau von ϕ.
1.2.3 Definition der wichtigsten semantischen Begriffe
Es seien ϕ, ψ ∈ F(V ).
ag[ϕ]
kd[ϕ]
er f b[ϕ]
ϕ äq ψ
ϕ impl ψ
: ⇐⇒
: ⇐⇒
: ⇐⇒
: ⇐⇒
: ⇐⇒
⇐⇒
f ür alle f ∈ B(V )
f ür alle f ∈ B(V )
es gibt ein f ∈ B(V )
f ür alle f ∈ B(V )
f ür alle f ∈ B(V )
ag[ϕ → ψ]
gilt:
gilt:
mit:
gilt:
gilt:
f (ϕ) = W
ϕ ist allgemeingültig
f (ϕ) = F
ϕ ist kontradiktorisch
f (ϕ) = W
ϕ ist erfüllbar
f (ϕ) = f (ψ) ϕ ist äquivalent zu ψ
f (ϕ) = W ⇒ f (ψ) = W
ϕ impliziert ψ
Einfache Beispiele
ag[A ∨ ¬A], kd[A ∧ ¬A], er f b[A], er f b[¬A], aber A (und auch ¬A) sind weder
allgemeingültig noch kontradiktorisch.
13
1.2. S EMANTIK DER AUSSAGENLOGIK
Es gilt offenbar:
ag[ϕ]
⇐⇒
kd[¬ϕ]
er f b[ϕ]
⇐⇒
nicht kd[ϕ]
ag[¬ϕ]
=⇒
nicht ag[ϕ] (aber die Umkehrung gilt i. a. nicht)
ag[ϕ ∧ ψ]
⇐⇒
ag[ϕ] und ag[ψ]
er f b[ϕ ∨ ψ]
⇐⇒
er f b[ϕ] oder er f b[ψ]
ag[ϕ] oder ag[ψ]
=⇒
ag[ϕ ∨ ψ]
er f b[ϕ ∧ ψ]
=⇒
er f b[ϕ] und er f b[ψ] (i. a. ohne Umkehrung!)
(i. a. ohne Umkehrung!)
Bemerkung
Die hier eingeführten Prädikate sind entscheidbar. Ein Entscheidungsverfahren
liefert (unmittelbar nach Definition) die Wahrheitstafelmethode; dieses Verfahren
besitzt jedoch exponentielle Komplexität: Hat ϕ n Variable, so hat B(V (ϕ)) bereits
2n Elemente! Für jedes einzelne f ∈ B(V (ϕ)) muß man f (ϕ) berechnen, wobei
die Komplexität dieser Berechnung abhängig ist von der Anzahl der logischen
Symbole in ϕ.
Damit läßt sich die Aussagenlogik kalkülmäßig behandeln - man spricht daher auch vom Aussagenkalkül. Dagegen wird sich später zeigen, daß die Allgemeingültigkeit einer prädikatenlogischen Aussage sich i. a. nicht mehr entscheiden läßt; trotzdem spricht man (aus Gründen, die später im Rahmen einer Axiomatisierung deutlicher werden) auch vom Prädikatenkalkül.
14
1.2. S EMANTIK DER AUSSAGENLOGIK
1.2.4 Einige wichtige allgemeingültige Formeln
A ∨ ¬A
A→A
¬(A ∧ ¬A)
¬(A ↔ ¬A)
¬A → (A → B)
A ∧ (A → B) → B
¬B ∧ (A → B) → ¬A
A → A∨B
A∧B → A
(A → B) ∧ (B → C) → (A → C)
(A ∨ B) ∧ (A → C) ∧ (B → C) → C
((A → B) → A) → A
tertium non datur
Selbstimplikation
Gesetz vom Widerspruch
Gesetz vom Widerspruch
regula falsi
modus ponens (als Gesetz)
modus tollens (als Gesetz)
(hintere) Abschwächung
(vordere) Abschwächung
Kettenschluß
Gesetz der Fallunterscheidung
Formel von Peirce
Einige dieser allgemeingültigen Formeln ergeben gültige Implikationen, wie
z. B.
A impl A ,
A impl B und B impl C =⇒ A impl C ,
A impl B und B impl A =⇒ A äq B .
1.2.5 Einige wichtige Äquivalenzen
¬ ¬ A äq A
A → B äq ¬B → ¬A
¬(A → B) äq (A ∧ ¬B)
¬(A ∨ B) äq (¬A ∧ ¬B)
¬(A ∧ B) äq (¬A ∨ ¬B)
A → (B → C) äq A ∧ B → C
A → B ∨C äq (A → B) ∨ (A → C)
A → B ∧C äq (A → B) ∧ (A → C)
A ∨ B → C äq (A → C) ∧ (B → C)
A ∧ B → C äq (A → C) ∨ (B → C)
Gesetz der doppelten Verneinung
Kontraposition
de M ORGANsches Gesetz
de M ORGANsches Gesetz
Importation / Exportation
Distrib. der Implikation “von rechts”
Distrib. der Implikation “von rechts”
Zu beachten ist der Wechsel von ∨ zu ∧ (und umgekehrt) in den beiden letzten
Formeln!
15
1.2. S EMANTIK DER AUSSAGENLOGIK
1.2.6 Boolesche Gesetze
A∩B = B∩A
A∪B = B∪A
A ∩ (B ∩C) = (A ∩ B) ∩C
A ∪ (B ∪C) = (A ∪ B) ∪C
A∩A = A
A∪A = A
A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C)
A ∪ (B ∩C) = (A ∪ B) ∩ (A ∪C)
A ∩ (B ∪ A) = A
A ∪ (B ∩ A) = A
A ∪ −A = V, A ∩ −A = 0/
− −A = A
− 0/ = V, −V = 0/
− (A ∩ B) = − A ∪ − B
− (A ∪ B) = − A ∩ − B
Kommutativgesetze
Assoziativgesetze
Idempotenzgesetze
Distributivgesetze
Absorptionsgesetze
Komplementgesetze
de M ORGANsche Gesetze
Dieses sind die Gesetze einer B OOLEschen Algebra, und zwar in mengentheoretischer Form ausgedrückt. Die entsprechenden aussagenlogischen Gesetze
erhält man, wenn man folgende Ersetzungen vornimmt:
mengentheoretisch
=
−
∩
∪
0/
V
aussagenlogisch
äq
¬
∧
∨
A ∧ ¬A
A ∨ ¬A
Die obigen Gesetze haben wir für Aussagenvariable aufgeschrieben; sie gelten
aber allgemeiner für a. F. anstelle der Aussagenvariablen. Diese Tatsache ergibt
sich aus der
1.2.7 Einsetzungsregel
ϕ(A)
ϕ[ψ/A]
1.2. S EMANTIK DER AUSSAGENLOGIK
16
Damit ist gemeint: Wenn der obere Teil allgemeingültig ist, so auch der untere.
Dabei schreiben wir auch ϕ(A), um anzudeuten, daß die Aussagenvariable A in
ϕ(A) vorkommt, und mit
ϕ[ψ/A]
bezeichnen wir die Formel, die aus ϕ wie folgt hervorgeht: Setze in ϕ an allen
Stellen, an denen die Aussagenvariable A vorkommt, die Formel ψ ein.
Beispiel
Es ist ag[A ∨ ¬A] und damit auch ag[ϕ ∨ ¬ϕ] für jede Formel ϕ.
1.2.8 Ersetzungsregel
ϕ ↔ψ
χ ↔ χ(ψ/ϕ)
Dabei bezeichnet
χ(ψ/ϕ)
die Formel, die aus der Formel χ wie folgt hervorgeht: Ersetze in χ an einigen
(möglicherweise allen) Stellen die Formel ϕ durch die Formel ψ.
Beispiel
Es ist ag[¬ ¬ A ↔ A], nach der Einsetzungsregel also auch ag[¬ ¬ ϕ ↔ ϕ],
und somit erhält man aus einer Formel χ eine äquivalente Formel, indem man an
einigen (oder allen Stellen) ¬ ¬ ϕ durch ϕ ersetzt.
Beweis der Einsetzungsregel:
Es sei ϕ ∗ := ϕ[ψ/A] mit V (ϕ) = {A, A1 , . . . , An } und V (ψ) = {B1 , . . . , Bm },
somit: V (ϕ ∗ ) = {A1 , . . . , An , B1 , . . . , Bm }.
Für eine beliebige Belegung g : V (ϕ ∗ ) −→ {W, F} ist zu zeigen: g(ϕ ∗ ) = W .
Dazu definiere man eine Belegung f : V (ϕ) −→ {W, F} durch
f (A) = g(ψ), f (Ai ) = g(Ai )
und zeige: g(ϕ ∗ ) = f (ϕ), also = W , da ag[ϕ].
Beweis der Ersetzungsregel:
Es sei χ ∗ := χ(ψ/ϕ) und f : V (χ) ∪V (χ ∗ ) −→ {W, F} eine beliebige Belegung. Zeige: f (χ) = f (χ ∗ ) durch Induktion über den Formelaufbau von χ.
17
1.3. N ORMALFORMEN
1.3 Normalformen
In diesem Abschnitt werden wir uns mit aussagenlogischen Formeln beschäftigen, die nur die Operationen ¬, ∨, ∧ enthalten und B OOLEsche Formeln genannt
werden.
Boolesche Umformung
Zu jeder aussagenlogischen Formel ϕ gibt es eine äquivalente B OOLEsche Formel
ϕ b , die dieselben Aussagenvariablen wie ϕ enthält:
ϕ äq ϕ b , wobei V (ϕ) = V (ϕ b ).
Beweis: Eliminiere die Symbole → und ↔ durch Umformungen zu äquivalenten Formeln; d. h. ersetze in ϕ jede Teilformel der Form
ψ → χ durch die äquivalente Formel ¬ψ ∨ χ,
ψ ↔ χ durch die äquivalente Formel (¬ψ ∨ χ) ∧ (¬χ ∨ ψ).
Bemerkung
Indem man die entsprechenden Äquivalenzen benutzt, kann man auch noch ∨
durch ¬ und ∧ (bzw. ∧ durch ¬ und ∨) ausdrücken und erreichen, daß ϕ b nur
noch ¬ und ∧ (bzw. ¬ und ∨) enthält, was im Hinblick auf manche Anwendungen (z. B. Dualitätssatz) aber nicht immer erwünscht ist. Tatsächlich kann man
eine aussagenlogische Formel in eine äquivalente umformen, die nur noch eine
aussagenlogische Operation (nämlich ↓ bzw. ↑) enthält.
Endliche Konjunktionen und Disjunktionen
ϕ1 ∧ ϕ2 ∧ ϕ3 := ϕ1 ∧ (ϕ2 ∧ ϕ3 ),
V
ϕi = ϕ1
Vi=1,...,n
V
i=1,...,n ϕi = ϕ1 ∧ i=2,...,n ϕi
allgemein:
für n = 1,
für n > 1,
und analog definiert man die endlichen Disjunktionen
W
i=1,...,n ϕi .
Eine Formel ist in konjunktiver Normalform (KNF) gdw sie eine Konjunktion
von Disjunktionen ist, wobei die einzelnen Disjunktionsglieder kein ∧ und kein ∨
mehr enthalten, d. h. wenn sie von der folgenden speziellen Form ist
V
i=1,...,n
W
j=1,...,mi ϕi j ,
18
1.3. N ORMALFORMEN
wobei jedes ϕi j eine Aussagenvariable oder eine negierte Aussagenvariable ist,
in disjunktiver Normalform (DNF) gdw sie von der Form
W
i=1,...,n
V
j=1,...,mi ϕi j
ist, wobei wiederum jedes ϕi j eine Aussagenvariable oder eine negierte Aussagenvariable ist. (Insbesondere sind A ∨ ¬B sowie A ∧ ¬B in konjunktiver und zugleich
in disjunktiver Normalform.)
Satz (Boolesche Normalform)
Zu jeder aussagenlogischen Formel ϕ gibt es äquivalente Formeln ϕ k bzw. ϕ d in
konjunktiver bzw. disjunktiver Normalform, die dieselben Aussagenvariablen wie
ϕ enthalten:
ϕ äq ϕ k äq ϕ d , wobei
V (ϕ) = V (ϕ k ) = V (ϕ d ), ϕ k in KNF, ϕ d in DNF.
Beweis: Eine disjunktive NF läßt sich aus ϕ mittels folgender Umformungen
konstruieren:
(1) ϕ äq ϕ b
für eine B OOLEsche Formel ϕ b .
(2) ϕ b äq ϕ n für eine Formel ϕ n , wobei in ϕ n ein Negationszeichen höchstens
vor Aussagenvariablen vorkommt; dazu benutze man folgende Äquivalenzen:
¬¬ψ äq ψ , ¬(ψ ∨ χ) äq ¬ψ ∧ ¬χ, ¬(ψ ∧ χ) äq ¬ψ ∨ ¬χ (De Morgan).
(3) eliminiere in ϕ n ∧ “vor” ∨ mittels der Distributivgesetze:
ψ ∧ (χ ∨ δ ) äq (ψ ∧ χ) ∨ (ψ ∧ δ )
(ψ ∨ χ) ∧ δ äq (ψ ∧ δ ) ∨ (χ ∧ δ )
Als Ergebnis erhält man eine disjunktive NF ϕ d , welche zu ϕ äquivalent ist.
Die im 2. Schritt erhaltene Formel ϕ n , in welcher das Negationszeichen höchstens
vor Aussagenvariablen vorkommt, nennt man auch eine Negationsnormalform
von ϕ. Um eine konjunktive NF zu erhalten, bilde man zuerst wieder eine Negationsnormalform und wende im 3. Schritt die dualen Distributivgesetze an (vertausche ∧ mit ∨). (Der Beweis liefert ein effektives Verfahren, um ϕ zu einer
äquivalenten konjunktiven bzw. disjunktiven Normalform umzuformen.)
19
1.3. N ORMALFORMEN
1.3.1 Entscheidungsverfahren für Boolesche Normalformen
(i) ϕ sei in KNF. Dann gilt:
ag[ϕ ] ⇔ in jedem Konjunktionsglied von ϕ kommt mindestens eine Aussagenvariable zusammen mit ihrer Negation vor.
(ii) ϕ sei in DNF. Dann gilt:
kd[ϕ ] ⇔ in jedem Disjunktionsglied von ϕ kommt mindestens eine Aussagenvariable zusammen mit ihrer Negation vor.
Beispiel
(A ∨ D ∨ ¬A) ∧ (¬B ∨ A ∨ A ∨ B) ∧ (¬A ∨ B ∨ ¬B ∨ A ∨C)
ist allgemeingültig, nicht aber (¬A ∨ B ∨ A) ∧ (¬B ∨ A ∨ A ∨ D).
Beweis von (i): Es ist
ag[
V
i=1,...,n
W
j ϕi j ]
⇐⇒ für alle i = 1, ..., n : ag[
W
j ϕi j ].
Gibt es zu jedem i ein j und ein k, so daß ϕi j = A und ϕik = ¬A für eine
W
Aussagenvariable A ist, so ist für jedes i
ϕi j allgemeingültig, also gilt “⇐”.
Vj
W
Zum Beweis der Umkehrung sei ϕ = i=1,...,n j ϕi j in KNF, aber in (mindeW
stens) einem Konjunktionsglied, etwa ϕi = j ϕi j , komme keine Aussagenvariable
mit ihrer Negation vor. Dann können wir eine Belegung f : V (ϕ) −→ {W, F} definieren mit


falls A in ϕi negiert vorkommt,

W,
f (A) = F,
falls A in ϕi unnegiert vorkommt,


beliebig, etwa W , falls A in ϕ nicht vorkommt.
i
Dann wird f (ϕi ) = F und damit auch f (ϕ) = F, also ist ϕ nicht allgemeingültig.
Hiermit erhält man ein weiteres Verfahren, die Allgemeingültigkeit einer aussagenlogischen Formel ϕ zu testen: Forme ϕ in eine KNF um und prüfe nach,
ob die Bedingung von 1.3.1 (i) erfüllt ist. Auch dieses Entscheidungsverfahren ist
von exponentieller Komplexität wegen der Notwendigkeit, bei der Umformung
in eine KNF das Distributivgesetz anzuwenden. Dabei werden aus Konjunktionen
von Disjunktionen wesentlich längere Disjunktionen von Konjunktionen (und umgekehrt): Das allgemeine Distributivgesetz lautet:
20
1.3. N ORMALFORMEN
V
i=1,...,n
W
j=1,...,mi ϕi j
äq
W
f ∈P
V
i=1,...,n ϕi f (i) ,
wobei P = { f | f : {1, . . . , n} −→ N mit 1 ≤ f (i) ≤ mi f ür alle i = 1, . . . , n}. Falls
alle mi = 2 sind, so hat P die Anzahl 2n .
Der folgende Satz besagt, daß sich jede n-stellige Wahrheitsfunktion mittels
der B OOLEschen Operationen ¬, ∨, ∧ darstellen läßt, und aus dem Beweis ergibt
sich zugleich eine Darstellung in disjunktiver bzw. konjunktiver Normalform:
1.3.2 Boolescher Repräsentationssatz
Es sei G eine beliebige n-stellige Wahrheitsfunktion, also G : B(V ) −→ {W, F},
wobei V die Menge der Aussagenvariablen {A1 , . . . , An } ist.
Dann existiert eine B OOLEsche Formel ϕ in diesen Ausagenvariablen, d. h.
mit V (ϕ) = V , deren Auswertung nach den Wahrheitstafeln gerade die Funktion
G ergibt:
G(g) = g(ϕ) für alle g ∈ B(V ).
Beweis: Wir definieren zunächst für jedes f ∈ B(V ) eine Formel ϕ f , die genau
bei der Belegung f wahr wird (was wir unten mit (*) zeigen werden):
f (A1 )
ϕ f = A1
f (An )
∧ . . . ∧ An
F
, wobei AW
i = Ai , Ai = ¬Ai .
Es sei M := { f ∈ B(V ) | G( f ) = W }. Dann ist
ϕ :=
W
f ∈M ϕ f
eine B OOLEsche Formel (in disjunktiver NF), die die Behauptung erfüllt, weil sie
gerade für alle f ∈ M wahr und sonst falsch wird:
g(ϕ) = W
(*)
⇐⇒
⇐⇒
⇐⇒
⇐⇒
g(ϕ f ) = W
f =g
g∈M
G(g) = W.
für ein f ∈ M
für ein f ∈ M
Zum Beweis von (*) beachte, daß für alle i = 1, . . . , n:
f (A )
g(ϕ f ) = W =⇒ g(Ai i ) = W
=⇒ [ f (Ai ) = W =⇒ g(Ai ) = W ] und
=⇒ [ f (Ai ) = F =⇒ g(Ai ) = F], also f = g,
21
1.3. N ORMALFORMEN
und offenbar gilt auch umgekehrt f (ϕ f ) = W .
Was passiert, wenn die Funktion G überall den Wert F annimmt? Dann ist
die Menge M leer und die zugehörige Formel ϕ eine Disjunktion über eine leere
Indexmenge, und eine solche Disjunktion erklärt man als “falsch”. Da wir hierfür
keine Konstante in der aussagenlogischen Sprache haben, benutzen wir dafür (wie
auch im Satz von B OOLE) die Formel A0 ∧ ¬A0 , ähnlich erklärt man die Konjunktion über eine leere Indexmenge für stets “wahr” (und kann sie mit A0 ∨ ¬A0
gleichsetzen).
Ein alternativer Beweis (welcher zugleich eine konjunktive NF liefert) geht
aus von der Menge N := { f ∈ B(V ) | G( f ) = F}.
Folgerungen
aus dem obigen Satz (bzw. aus dem Beweis) ergeben sich für
• die Schaltalgebra ,
• den Übergang von einer DNF zu einer äquivalenten KNF,
• die Existenz nur endlich-vieler Formeln ϕ mit Variablen A1 , . . . , An , die
nicht miteinander äquivalent sind (dagegen gibt es stets unendlich viele zueinander äquivalente Formeln).
1.3.3 Das Dualitätsprinzip
Im folgenden betrachten wir nur B OOLEsche Formeln! Wir definieren drei syntaktische Operationen für B OOLEsche Formeln:
D(ϕ) :
vertausche ∨ mit ∧ in ϕ : duale Formel zu ϕ,
N(ϕ) :
setze vor jede Aussagenvariable in ϕ ein ¬-Zeichen,
∗
N (ϕ) :
setze vor jede Aussagenvariable in ϕ ein ¬-Zeichen, falls dort
keines steht, sonst streiche es!
Beispiele
D(¬(¬A ∨ B) ∧ ¬C)
N(¬(¬A ∨ B) ∧ ¬C)
N ∗ (¬(¬A ∨ B) ∧ ¬C)
DN ∗ (¬(¬A ∨ B) ∧ ¬C)
=
=
=
=
¬(¬A ∧ B) ∨ ¬C
¬(¬¬A ∨ ¬B) ∧ ¬¬C
¬(A ∨ ¬B) ∧C
¬(A ∧ ¬B) ∨C
22
1.3. N ORMALFORMEN
DN ∗ (A)
=
∗
DN (A ∧ B) =
DN ∗ (A ∨ B) =
¬A
¬A ∨ ¬B äq ¬(A ∧ B)
¬A ∧ ¬B äq ¬(A ∨ B)
Offensichtlich sind N(ϕ) und N ∗ (ϕ) miteinander äquivalent, und die letzten
drei Formeln kann man verallgemeinern zum Teil a) von
Satz
a) ¬ϕ äq D(N ∗ (ϕ))
b) ϕ äq ψ ⇐⇒ Dϕ äq Dψ
Bildung der Negation
Dualitätssatz
und b) leicht aus a) folgern, was wir hier nicht ausführen. Natürlich kann man
eine Aussage negieren, indem man einfach das Negationszeichen davorschreibt;
Teil a) des obigen Satzes gibt eine sinnvollere Darstellung, in welcher das Negationszeichen “nach innen” verschoben wird (obwohl man in praktischen Fällen
es nicht gleich bis vor die atomaren Teilformeln verschieben wird). Der Dualitätssatz erklärt u. a., weshalb die B OOLEschen Gesetze stets in jeweils doppelter Form
auftreten.
1.4. D ER SEMANTISCHE F OLGERUNGSBEGRIFF : E RF ÜLLBARKEIT
23
1.4 Der semantische Folgerungsbegriff: Erfüllbarkeit
Eine Formel ist allgemeingültig, wenn sie uneingeschränkt den Wert W erhält.
Diesen Begriff werden wir jetzt relativieren zum Folgerungsbegriff:
Aussagenlogische Folgerungen
ϕ sei eine Formel, T eine (möglicherweise unendliche) Menge von Formeln, V
eine Menge von Aussagenvariablen mit T ⊆ F(V ), ϕ ∈ F(V ), und schließlich sei
f : V −→ {W, F} eine Belegung der Variablen in V .
f |= ϕ
f |= T
erfb[ϕ]
erfb[T]
T |= ϕ
:
:
:
:
:
⇐⇒
⇐⇒
⇐⇒
⇐⇒
⇐⇒
f (ϕ) = W
für alle ψ ∈ T : f |= ψ
es gibt ein f mit f |= ϕ
es gibt ein f mit f |= T
für alle f : falls f |= T, so f |= ϕ
f erfüllt ϕ
f erfüllt T
ϕ ist erfüllbar
T ist erfüllbar
ϕ folgt aus T
T |= ϕ besagt also: alle Belegungen f , die T erfüllen, erfüllen auch ϕ,
oder vereinfacht:
ϕ ist immer dann wahr, wenn alle Formeln in T wahr sind.
Falls T endlich ist, schreiben wir auch
ϕ1 , . . . , ϕn |= ϕ für {ϕ1 , . . . , ϕn } |= ϕ,
und aus 0/ |= ϕ wird natürlich |= ϕ, so daß
|= ϕ ⇐⇒ ag[ϕ] .
Beispiele
(a) ϕ |= ϕ, (b) ϕ |= ϕ ∨ ψ, (c) ϕ, ψ |= ϕ ∧ ψ, (d) ϕ → ψ ∧ δ , δ → ¬ψ |= ¬ϕ,
aber: A 6|= A ∧ B.
Im Falle der Ersetzungsregel gilt: ϕ ↔ ψ |= χ ↔ χ(ϕ/ψ);
im Falle der Einsetzungsregel gilt jedoch i. a. nicht: ϕ(A) |= ϕ[ψ/A]!
1.4. D ER SEMANTISCHE F OLGERUNGSBEGRIFF : E RF ÜLLBARKEIT
24
Satz
ϕ1 , . . . , ϕn |= ϕ ⇐⇒ |= ϕ1 ∧ . . . ∧ ϕn → ϕ
Der Folgerungsbegriff für endliche Formelmengen läßt sich somit zurückführen auf den Begriff der Allgemeingültigkeit, der allgemeine Folgerungsbegriff
aber auch auf den Erfüllbarkeitsbegriff: Als Verallgemeinerung von
ag[ϕ] ⇐⇒ nicht erfb[¬ϕ]
erhalten wir den
1.4.1 Zusammenhang zwischen Folgerung und Erfüllbarkeit
T |= ϕ ⇐⇒ nicht erfb[T ∪ {¬ϕ}]
T 6|= ϕ ⇐⇒ erfb[T ∪ {¬ϕ}]
Lemma
erfb[T] ⇐⇒ es existiert kein ϕ mit T |= ϕ und T |= ¬ϕ
⇐⇒ es existiert ein ϕ mit T 6|= ϕ
Bemerkungen
1. Ist T endlich, so ist entscheidbar, ob T |= ϕ oder T 6|= ϕ. Es ist aber möglich,
daß weder T |= ϕ noch T |= ¬ϕ gilt (wenn T nämlich zu wenig Information
über die Variablen in ϕ enthält, z. B. A 6|= B und A 6|= ¬B für zwei verschiedene Variable A und B)! Denn es gilt zwar
T |= ¬ϕ =⇒ T 6|= ϕ (für erfüllbares T), aber nicht umgekehrt!
2. Ist T endlich, so gibt es eine effektive Aufzählung der Folgerungsmenge
{ϕ | T |= ϕ}.
3. Allgemeiner: Gibt es eine effektive Aufzählung von T, so gibt es auch eine
effektive Aufzählung der Folgerungsmenge {ϕ | T |= ϕ}.
1.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
25
1.5 Der syntaktische Folgerungsbegriff: Beweisbarkeit
1.5.1 Axiomensysteme und Beweise
Ein (formales) Axiomensystem A wird bestimmt durch
1. die Sprache von A, gegeben durch eine (i. a. abzählbare) Menge von Symbolen, dem Alphabet der Sprache von A,
z. B. A0 , A1 , . . . , ¬, ∨, ∧, →, ↔, (, ) im Falle der Aussagenlogik,
2. eine Menge von Formeln als bestimmte endliche Folgen von Symbolen,
z. B. den aussagenlogischen Formeln,
3. eine Menge von Axiomen, wobei jedes Axiom eine Formel ist,
z. B. ϕ ∨ ¬ϕ, ϕ → ¬¬ϕ,
ϕ, ψ
ϕ
oder
,
ψ
δ
ϕ, ϕ → ψ
ϕ
, modus ponens:
.
z. B.
¬¬ϕ
ψ
4. eine Menge von Regeln der Form
Es sei nun A ein Axiomensystem, ϕ eine Formel, T eine Menge von Formeln (der Sprache von A). Ein (A-)Beweis von ϕ aus T ist eine endliche Folge
(ϕ1 , . . . , ϕn ) von Formeln, so daß
(B1) ϕn = ϕ,
(B2) für jedes m ≤ n gilt:
(1) ϕm ist Axiom von A oder
(2) ϕm ist Formel aus T oder
(3) es gibt ein i < m, so daß ϕm aus ϕi hervorgeht durch Anwendung einer
Regel von A oder
(4) es gibt i, j < m, so daß ϕm aus ϕi und ϕ j hervorgeht durch Anwendung
einer Regel von A mit 2 Prämissen.
Wir schreiben (analog zum semantischen Folgerungsbegriff):
T `A ϕ : ⇐⇒ es gibt einen A-Beweis von ϕ aus T
`A ϕ : ⇐⇒ 0/ ` ϕ
ϕ ist aus T beweisbar,
ϕ ist (in A ) beweisbar.
1.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
26
Statt T `A ϕ werden wir auch kurz T ` ϕ schreiben, wenn das Axiomensystem
aus dem Zusammenhang bekannt (oder unwesentlich) ist, statt “ϕ ist aus T beweisbar” auch “ϕ folgt aus T” oder “ϕ ist aus T ableitbar” sagen.
1.5.2 Korrektheit und Vollständigkeit
A korrekt
: ⇐⇒ für alle ϕ:
`A ϕ ⇒ |= ϕ,
A korrekt bzgl. Folgerungen
: ⇐⇒ für alle ϕ, T: T `A ϕ ⇒ T |= ϕ,
A (syntaktisch) widerspruchsfrei : ⇐⇒ es gibt ein ϕ mit 6`A ϕ,
A (semantisch) vollständig
: ⇐⇒ für alle ϕ:
|= ϕ ⇒ `A ϕ.
A vollständig bzgl. Folgerungen : ⇐⇒ für alle ϕ, T:
T |= ϕ ⇒ T `A ϕ.
In einem korrekten Axiomensystem sind alle beweisbaren Aussagen allgemeingültig, für ein vollständiges Axiomensystem gilt die Umkehrung. Vollständigkeit und Korrektheit zusammen besagen also, daß genau die allgemeingültigen
Aussagen beweisbar sind.
• Ein korrektes Axiomensystem ist widerspruchsfrei: die Aussagenvariable A
ist nicht allgemeingültig, kann dann also auch nicht beweisbar sein.
• In einem widerspruchsvollen (d. h. nicht widerspruchsfreien) Axiomensystem ist alles beweisbar;
• ein widerspruchsfreies Axiomensystem (mit modus ponens als Regel) enthält keinen Widerspruch in dem Sinne, daß keine Formel und zugleich auch
ihre Negation beweisbar ist:
Bemerkung
Enthält A den modus ponens als Regel und gilt
`A ϕ → (¬ϕ → ψ) oder `A ¬ϕ → (ϕ → ψ), so:
A widerspruchsfrei ⇐⇒ es gibt keine Formel ϕ mit `A ϕ und `A ¬ϕ.
1.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
27
Satz
T und S seien Formelmengen, ϕ eine Formel.
1. Ist ϕ ∈ T oder ϕ Axiom von A, so gilt T `A ϕ.
2. (Endlichkeitssatz für `)
Falls T `A ϕ, so existiert ein endliches T0 ⊆ T mit T0 `A ϕ.
3. (Transitivität von `) Falls T `A ϕ und S `A ψ für jedes ψ ∈ T, so S `A ϕ.
4. A enthalte den modus ponens als Regel. Dann gilt:
T `A ϕ und T `A ϕ → ψ =⇒ T `A ψ. .
1.5.3 Einige Axiomensysteme der Aussagenlogik
Es gibt zahlreiche Beispielen für Axiomensysteme der Aussagenlogik mit unterschiedlichen Vorzügen und Nachteilen, wir erwähnen nur die folgenden:
(a) Hilbert-Bernays
• Sprache: A, B,C, . . . , ¬, ∨, ∧, →, ↔, (, )
• Axiome:
1. A → (B → A)
(A → (A → B)) → (A → B)
(A → B) → ((B → C) → (A → C))
2. A ∧ B → A
A∧B → B
(A → B) → ((A → C) → (A → B ∧C))
3. A → A ∨ B
B → A∨B
(A → C) → ((B → C) → (A ∨ B → C))
4. (A ↔ B) → (A → B)
(A ↔ B) → (B → A)
(A → B) → ((B → A) → (A ↔ B))
5. (A → B) → (¬B → ¬A)
A → ¬¬A
¬¬A → A
(bis hier: Positive Logik)
(bis hier: Minimalkalkül)
(bis hier: Intuitionistische Logik)
(klassische Logik)
1.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
28
• Regeln:
Einsetzungsregel:
ϕ(A)
ϕ, ϕ → ψ
und modus ponens:
ϕ[ψ/A]
ψ
Interessant ist hier die Gruppierung der Axiome nach den einzelnen aussagenlogischen Operationen, zudem ist die Anordnung der letzten Axiome so gewählt,
daß man durch Weglassen verschiedene Teilsysteme der Aussagenlogik erhält, die
sich durch ihre jeweiligen Anforderungen an die Negation unterscheiden.
(b) Shoenfield
• Sprache: A, B,C, . . . , ¬, ∨, (, )
Die übrigen aussagenlogischen Operationen werden wie üblich definiert,
endliche Folgen von Disjunktionen und Implikationen werden durch Klammerung von rechts definiert:
ϕ1 → ϕ2 . . . → ϕn : ↔ ϕ1 → (ϕ2 → (. . . ϕn )),
ϕ1 ∨ ϕ2 . . . ∨ ϕn : ↔ ϕ1 ∨ (ϕ2 ∨ (. . . ϕn )).
• Axiome: ¬ϕ ∨ ϕ
(tertium non datur)
• Regeln:
Expansion:
Kürzung:
ψ
ϕ ∨ψ
ϕ ∨ϕ
ϕ
Assoziativität:
Schnitt:
ϕ ∨ (ψ ∨ δ )
(ϕ ∨ ψ) ∨ δ
ϕ ∨ ψ, ¬ϕ ∨ δ
ψ ∨δ
Die Axiome sind hier als Formelschemata aufgeschrieben, so daß keine Einsetzungsregel erforderlich ist.
(c) Nicod
Dieses Axiomensystem kommt allein mit einer aussagenlogischen Verknüpfung
aus, nämlich mit ↑ (wobei A ↑ B bedeutet: nicht A oder nicht B), außerdem wird
auch nur nur ein Axiomenschema und nur eine Regel benötigt:
(α ↑ (β ↑ γ)) ↑ {[δ ↑ (δ ↑ δ )] ↑ [(ε ↑ β ) ↑ ((α ↑ ε) ↑ (α ↑ ε))]}
α, α ↑ (β ↑ γ)
γ
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
29
Das ist wohl das allerkürzeste (wenn auch nicht besonders intuitive) Axiomensystem. Hat ein Axiomensystem wenig Grundsymbole und/oder wenig Axiome und Regeln, so läßt sich seine Korrektheit i. a. sehr schnell zeigen, dagegen
werden Beweise in einem solchen System sehr lang und umständlich, und die
Vollständigkeit ist dann entsprechend mühsam zu zeigen.
Alle diese Axiomensysteme sind korrekt, widerspruchsfrei und vollständig, jedoch nicht bezüglich Folgerungen, wenn sie die Einsetzungsregel enthalten. Um
diese Regel zu vermeiden, muß man die Axiome (wie in den letzten beiden Axiomensystemen) als Formelschemata schreiben!
Die Korrektheit beweist man in allen Fällen durch Induktion über die Länge
eines Beweises, d. h. man zeigt
• die Axiome sind allgemeingültig und
• sind die Prämissen einer Regel allgemeingültig, so auch die Konklusion.
Gilt außerdem:
• aus der (den) Prämisse(n) einer Regel folgt die Konklusion,
so sind die Axiomensysteme auch korrekt bzgl. Folgerungen; modus ponens und
die übrigen betrachteten Regeln - außer der Einsetzungsregel! - erfüllen diese Bedingung. So kann man leicht nachweisen, daß das Axiomensystem von S HOEN FIELD korrekt bezüglich Folgerungen ist.
1.6 Vollständigkeit und Kompaktheit
Die Vollständigkeit eines Axiomensystems ist i. a. schwieriger als seine Korrektheit zu beweisen, und wie es auch kein irgendwie “kanonisches” Axiomensystem
für die Aussagenlogik gibt, so gibt es auch keine Standardmethode zum Nachweis der Vollständigkeit, vielmehr muß man die Beweismethode dem Charakter
des jeweiligen Axiomensystems anpassen. Hier wollen wir als Beispiel das Axiomensystem von S HOENFIELD behandeln. Der Beweisbegriff ` bezieht sich also
auf dieses System; die Ergebnisse gelten jedoch (mit möglicherweise anderen Beweisen) auch für andere vollständige Axiomensysteme der Aussagenlogik!
Kommutativität
ϕ ∨ψ ` ψ ∨ϕ
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
30
Beweis: Aus der Voraussetzung ϕ ∨ ψ und dem Axiom ¬ϕ ∨ ϕ erhält man mittels
der Schnittregel: ψ ∨ ϕ.
Das bedeutet also, daß man
ϕ ∨ψ
ψ ∨ϕ
als Regel hinzunehmen kann (man sagt auch, daß diese Regel ableitbar sei).
Modus Ponens
ϕ, ϕ → ψ ` ψ
d. h. auch der modus ponens
ϕ, ϕ → ψ
ψ
ist eine ableitbare Regel.
Beweis: Aus
ϕ
(Voraussetzung)
ψ ∨ϕ
(Expansion) erhalten wir mit Komm. und der Vor. ¬ϕ ∨ ψ
ϕ ∨ ψ, ¬ϕ ∨ ψ
(Schnitt)
ψ ∨ψ
ψ (Kürzung)
Die Kommutativregel, Expansionsregel und die Assoziativregel lassen sich
verallgemeinern, wobei wir mit einem Spezialfall beginnen:
Lemma
Für 1 ≤ i < j ≤ n gilt:
ϕi ∨ ϕ j ` ϕ1 ∨ . . . ∨ ϕn .
Beweis durch Induktion über n, wobei man n > 2 annehmen kann: Setze ϕ :=
ϕ3 ∨ . . . ∨ ϕn . Dann ist zu zeigen: ϕi ∨ ϕ j ` ϕ1 ∨ (ϕ2 ∨ ϕ).
Fall 1: i ≥ 2. Dann gilt ϕi ∨ ϕ j ` ϕ2 ∨ ϕ nach Induktionsvoraussetzung (da ϕ1 weggelassen wurde, handelt es sich nur noch um n − 1 Formeln). Also gilt nach
der Expansionsregel: ϕi ∨ ϕ j ` ϕ1 ∨ (ϕ2 ∨ ϕ).
Fall 2: i = 1, j ≥ 3. Dann ist aus der Voraussetzung ϕi ∨ ϕ j beweisbar:
31
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
ϕ1 ∨ ϕ
ϕ ∨ ϕ1
ϕ2 ∨ (ϕ ∨ ϕ1 )
(ϕ2 ∨ ϕ) ∨ ϕ1
ϕ1 ∨ (ϕ2 ∨ ϕ)
nach Ind.vor. für die n − 1 Formeln ohne ϕ2
nach Komm.
mit der Expansionsregel
mit der Assoziativregel
nach Komm.
Fall 3: i = 1, j = 2. Dann ist aus der Voraussetzung ϕi ∨ ϕ j , d. h. ϕ1 ∨ ϕ2 beweisbar:
ϕ ∨ (ϕ1 ∨ ϕ2 )
(ϕ ∨ ϕ1 ) ∨ ϕ2
ϕ2 ∨ (ϕ ∨ ϕ1 )
(ϕ2 ∨ ϕ) ∨ ϕ1
ϕ1 ∨ (ϕ2 ∨ ϕ)
mit der Expansionsregel
mit der Assoziativregel
nach Komm.
mit der Assoziativregel
nach Komm.
Mit ähnlichen kombinatorischen Überlegungen zeigt man:
1.6.1 Verallgemeinerte Expansion
Für n, m ≥ 1, i1 , . . . im ∈ {1, . . . , n} gilt:
ϕi1 ∨ . . . ∨ ϕim ` ϕ1 ∨ . . . ∨ ϕn .
Beweis durch Induktion über m:
Fall 1: m = 1, i1 = i. Dann gilt ϕi nach Induktionsvoraussetzung, also:
(ϕi+1 ∨ . . . ∨ ϕn ) ∨ ϕi
ϕi ∨ ϕi+1 ∨ . . . ∨ ϕn
ϕ1 ∨ . . . ∨ ϕn
mit der Expansionsregel
nach Komm.
mit der Expansionsregel (i − 1)-mal.
Fall 2: m = 2. Dieser Fall ergibt sich aus dem vorigen Lemma zusammen mit
Komm.
Fall 3: m ≥ 3. Setze ϕ := ϕ1 ∨ . . . ∨ ϕn . Aus der Voraussetzung
ϕi1 ∨ . . . ∨ ϕim
(ϕi1 ∨ ϕi2 ) ∨ . . . ∨ ϕim
(ϕi1 ∨ ϕi2 ) ∨ ϕ
(ϕ ∨ ϕi1 ) ∨ ϕi2
(ϕ ∨ ϕi1 ) ∨ ϕ
folgt
mit der Assoziativregel
nach Ind.vor. für m − 1 Formeln
mit Komm.- und Assoziativregel
nach Ind.vor. für 2 Formeln (m = 2)
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
(ϕ ∨ ϕ) ∨ ϕi1
(ϕ ∨ ϕ) ∨ ϕ
ϕ
32
mit der Komm.- und Assoziativregel
nach Induktionsvor. für 2 Formeln (m = 2)
nach Assoziativregel und Fall 1.
Dabei zählt bei der Induktionsvoraussetzung für m − 1 Formeln die Formel (ϕi1 ∨
ϕi2 ) als eine Formel!
Mit der Kommutativregel erhalten wir hieraus auch die Umkehrung der Assoziativregel:
(ϕ ∨ ψ) ∨ δ
ϕ ∨ (ψ ∨ δ )
1.6.2 Lemma über die Negation
(i) ϕ ∨ ψ ` ¬¬ϕ ∨ ψ
(ii) ¬¬ϕ ∨ ψ ` ϕ ∨ ψ
(iii) ¬ϕ ∨ δ , ¬ψ ∨ δ ` ¬(ϕ ∨ ψ) ∨ δ
Den Beweis überlassen wir als Übungsaufgabe.
Nunmehr können wir den (schwachen) Vollständigkeitssatz beweisen als
1.6.3 Tautologiesatz
(i) |= ϕ =⇒ ` ϕ
(ii) ϕ1 , . . . , ϕn |= ϕ =⇒ ϕ1 , . . . , ϕn ` ϕ
Beweis: Zunächst zeigen wir, daß (ii) bereits aus (i) folgt: Sei ϕ1 , . . . , ϕn |= ϕ.
Dann gilt |= ϕ1 → . . . → ϕn → ϕ, also nach (i):
` ϕ1 → . . . → ϕn → ϕ
ϕ1 ` ϕ1 → . . . → ϕn → ϕ,
ϕ1 ` ϕ2 → . . . → ϕn → ϕ,
ϕ1 , ϕ2 ` ϕ3 → . . . → ϕn → ϕ,
ϕ1 , . . . , ϕn ` ϕ.
und also auch
woraus mit modus ponens folgt
ebenso:
usw. bis
Der Beweis von (i) erfolgt durch eine raffiniert angesetzte Induktion: Wir zeigen
|= ϕ1 ∨ . . . ∨ ϕn =⇒ ` ϕ1 ∨ . . . ∨ ϕn
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
33
durch Induktion über Σi=1,...,n lz(ϕi ), wobei lz(ϕ) = Anzahl der logischen Zeichen
in ϕ ist:
1. Fall: Jedes ϕi ist eine Aussagenvariable oder eine negierte Aussagenvariable. Falls |= ϕ1 ∨ . . . ∨ ϕn , so muß ein ϕi = ¬ϕ j für ein j sein. Es ist dann aber
ϕi ∨ ϕ j ein Axiom, also beweisbar, und damit nach 1.6.1 auch ` ϕ1 , . . . , ϕn .
Falls der 1. Fall nicht vorliegt, so ist mindestens ein ϕi keine Aussagenvariable und auch keine negierte Aussagenvariable; durch Vertauschen können wir
annehmen, daß diese Voraussetzung auf ϕ1 zutrifft.
2. Fall: ϕ1 = ψ ∨ δ für ein ψ bzw. δ . Dann folgt aus der Annahme:
|= ψ ∨ (δ ∨ . . . ∨ ϕn ), also gilt nach Induktionsvoraussetzung (hier liegt der Trick
des Beweises!) auch ` ψ ∨ (δ ∨ . . . ∨ ϕn ) und nach der Assoziativregel dann auch
` ϕ1 ∨ . . . ∨ ϕn .
3. Fall: ϕ1 = ¬¬ψ für ein ψ. Dann folgt aus der Annahme |= ψ ∨ ϕ2 ∨ . . . ∨ ϕn ,
also nach Induktionsvoraussetzung auch ` ψ ∨ ϕ2 ∨ . . . ∨ ϕn , und nach Lemma
1.6.2 (i) gilt dann ` ϕ1 ∨ . . . ∨ ϕn .
4. Fall: ϕ1 = ¬(ψ ∨ δ ) für ein ψ bzw. δ . Dann ist unter der Annahme
|= ¬(ψ ∨ δ ) ∨ ϕ2 ∨ . . . ∨ ϕn ,
auch
|= ¬ψ ∨ ϕ2 ∨ . . . ∨ ϕn und |= ¬δ ∨ ϕ2 ∨ . . . ∨ ϕn , und somit
` ¬ψ ∨ ϕ2 ∨ . . . ∨ ϕn und ` ¬δ ∨ ϕ2 ∨ . . . ∨ ϕn
nach Ind.vor., woraus
` ϕ1 ∨ . . . ∨ ϕn
mit Lemma 1.6.2 (iii) folgt.
Mit Hilfe des Tautologiesatzes kann man nun beweisen:
1.6.4 Deduktionstheorem
T ` ϕ → ψ ⇐⇒ T ∪ {ϕ} ` ψ
Wir werden dieses rein syntaktische Ergebnis später im Rahmen der Prädikatenlogik auch rein syntaktisch beweisen.
1.6.5 Widerspruchsfreiheit und Vollständigkeit von Theorien
Widerspruchsfreiheit (Konsistenz) und Vollständigkeit haben wir als syntaktische
Begriffe in 1.5.2 für Axiomensysteme definiert; der erste Begriff wird entsprechend auf Formelmengen (später: Theorien) übertragen. Aufpassen muß man dagegen bei dem Begriff der Vollständigkeit: Dieser wird im Falle von Formelmengen eine andere Bedeutung haben als für Axiomensysteme.
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
T konsistent:
T vollständig:
34
⇐⇒ es gibt ein ϕ mit T 6` ϕ
⇐⇒ es gibt kein ϕ mit T ` ϕ und T ` ¬ϕ
⇐⇒ für alle ϕ gilt: T ` ϕ oder T ` ¬ϕ.
Somit ist eine Formelmenge
T vollständig und konsistent ⇐⇒ für alle ϕ gilt: entweder T ` ϕ oder T ` ¬ϕ.
Gleichbedeutend damit ist die Aussage, daß die Menge der Folgerungen aus T
C(T) := {σ | T ` σ }
maximal konsistent ist, d. h. C(T) ist konsistent, besitzt aber keine echte konsistente Erweiterung.
Eine Theorie ist inkonsistent (oder widerspruchsvoll) gdw. sie nicht konsistent ist; ähnlich wie im Fall der semantischen Analoga (1.4.1) hängen Beweisbarkeit und (In-)konsistenz miteinander zusammen:
1.6.6 Lemma über Beweisbarkeit und Konsistenz
(i) T 6` ϕ
⇐⇒ T ∪ {¬ϕ} konsistent,
(ii) T ` ϕ
⇐⇒ T ∪ {¬ϕ} inkonsistent.
Beweis: Gilt T ` ϕ, so erst recht T ∪ {¬ϕ} ` ϕ und natürlich auch T ∪ {¬ϕ} `
¬ϕ, also ist T ∪ {¬ϕ} inkonsistent.
Ist umgekehrt T∪{¬ϕ} inkonsistent, so ist alles beweisbar, insbesondere auch
T ∪ {¬ϕ} ` ϕ und nach dem Deduktionstheorem T ` ¬ϕ → ϕ, woraus T ` ϕ
folgt. Damit haben wir (ii) gezeigt (und damit auch (i)).
Den verallgemeinerten Vollständigkeitssatz werden wir nun in der Form
jede konsistente Theorie ist erfüllbar
beweisen. Dazu werden wir in zwei Schritten zeigen:
• jede konsistente Menge T läßt sich zu einer vollständigen Menge erweitern,
• eine vollständige Menge ist (in kanonischer) Weise erfüllbar.
35
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
1.6.7 Vervollständigung
Zu jeder konsistenten Formelmenge T gibt es eine vollständige Erweiterung TV ⊇
T.
Beweis: Es sei ϕ0 , . . . , ϕn , . . . eine Aufzählung aller Formeln. Durch Induktion
erweitern wir T, indem wir T0 = T setzen und
(
Tn
falls Tn ` ϕn ,
Tn+1 =
Tn ∪ {¬ϕn } sonst.
Nach obigem Lemma 1.6.6 (i) bleibt Tn+1 auch im “sonst”-Fall konsistent, so
daß alle Tn konsistent sind und damit auch die Vereinigung
TV :=
[
Tn
n∈N
(nach dem Endlichkeitssatz für die Beweisbarkeit, s. 1.5.2). Da die Formel ϕn oder
ihre Negation spätestens im (n + 1)-ten Schritt zu T hinzugefügt werden, ist TV
auch vollständig.
1.6.8 Verallgemeinerter Vollständigkeitssatz
T |= ϕ
=⇒
T ` ϕ,
T |= ϕ
⇐⇒
T ` ϕ.
(ii) T konsistent
=⇒
T hat ein Modell,
T konsistent
⇐⇒
T hat ein Modell.
(i)
also
also
Beweis von (i) mittels (ii):
T 6` ϕ
=⇒ T ∪ {¬ϕ} konsistent
=⇒ T ∪ {¬ϕ} erfüllbar
=⇒ T 6|= ϕ.
nach 1.6.6 (i)
nach (ii)
(Umgekehrt kann man aus (i) auch leicht (ii) erhalten!)
Beweis von (ii): Es sei T konsistent, TV eine vollständige Erweiterung von T.
Wir definieren dann eine Belegung f von allen Aussagenvariablen durch
f (A) = W ⇐⇒ TV ` A.
Dann gilt allgemeiner für alle Formeln ϕ:
(∗)
f |= ϕ ⇐⇒ TV ` ϕ.
Diese Behauptung beweist man leicht durch Induktion über ρ(ϕ):
36
1.6. VOLLST ÄNDIGKEIT UND KOMPAKTHEIT
1. Ist ϕ eine Aussagenvariable, so gilt (*) nach Definition von f .
2. Ist ϕ = ¬ψ, so
f |= ϕ ⇐⇒
f 6|= ψ
⇐⇒
TV 6` ψ
⇐⇒
⇐⇒
nach Ind.vor. für ψ
TV ` ¬ψ da TV vollständig
TV ` ϕ
3. Ist ϕ = ψ ∨ δ , so
f |= ϕ ⇐⇒
⇐⇒
⇐⇒
f |= ψ oder f |= δ
TV ` ψ oder TV ` δ nach Ind.vor. für ψ, δ
TV ` ϕ,
wobei sich die letzte Äquivalenz wie folgt ergibt:
Gilt TV ` ψ oder TV ` δ , so auch TV ` ϕ nach der (verallgemeinerten) Expansionsregel.
Sei umgekehrt TV ` ϕ vorausgesetzt. Falls weder TV ` ψ noch TV ` δ , so gilt
wegen der Vollständigkeit von TV : TV ` ¬ψ und TV ` ¬δ , also nach 1.6.2 (iii):
TV ` ¬(ψ ∨ δ ), d. h. TV ` ¬ϕ, und TV wäre damit inkonsistent, Widerspruch! Mit Hilfe des Endlichkeitssatzes (aus 1.5.2) erhalten wir als Korollar den
1.6.9 Kompaktheitssatz der Aussagenlogik
T ist erfüllbar ⇐⇒ jedes endliche T0 ⊆ T ist erfüllbar.
37
Kapitel 2
Strukturen und formale Sprachen
Im Mittelpunkt der modernen Mathematik steht der Begriff einer Struktur. Diese
kommen vor als
• relationale Strukturen:
Ordnungen, Graphen, Bäume . . .
• algebraische Strukturen:
Gruppen, Ringe, Körper, Vektorräume . . .
• gemischte Strukturen:
topologische Gruppen, angeordnete Körper, geometrische Räume . . .
Verschiedene Strukturen können sich in bestimmten Eigenschaften gleichen oder
auch unterscheiden, präzisieren werden wir den Eigenschaftsbegriff mit Hilfe formaler Sprachen.
Beliebige Eigenschaften kann man zusammenfassen als Axiome einer (möglicherweise widerspruchsvollen) Theorie T . Erfüllt eine Struktur M die Axiome
einer Theorie T , sind also alle Axiome wahr in der Struktur, so nennt man M ein
Modell dieser Theorie. Schließlich legen wir fest: Eine Aussage ist (logisch) wahr
genau dann, wenn sie in allen Strukturen wahr ist.
Formale Sprachen haben wir bereits in der Aussagenlogik kennengelernt; wir
werden sie jetzt durch zusätzliche Symbole erweitern zu den Sprachen der Prädikatenlogik, die dadurch wesentlich ausdrucksstärker werden. Dabei könnten wir
ähnlich wie beim Aufbau der Aussagenlogik vorgehen, wollen hier aber zur Abwechslung mit einem semantischen Grundbegriff beginnen. Dafür müssen wir nun
allerdings die Kenntnis einiger einfacher Begriffe und Notationen aus der Mengenlehre voraussetzen, die später genauer begründet werden sollen.
38
2.1. S TRUKTUREN
2.1 Strukturen
Eine Struktur A ist ein 4-Tupel
A
A
(A, (RA
i |i ∈ I), ( f j | j ∈ J), (ck |k ∈ K)),
wobei für jedes i ∈ I, j ∈ J, k ∈ K :
1. A 6= 0/ eine nicht-leere Menge ist, der Individuenbereich (Grundbereich,
Träger) der Struktur A,
(RA
i ist eine ni -stellige Relation auf A),
ni
2. RA
i ⊆A
3. f jA : Am j −→ A
4. cA
k ∈A
( f jA ist eine m j -stellige Funktion auf A),
(cA
k ist ein Element (eine Konstante) von A).
Die Anzahl der Relationen, Funktionen und Konstanten sowie ihre jeweiligen
Stellenzahlen (die ≥ 1 sein sollen) werden im Tripel
((ni |i ∈ I), (m j | j ∈ J), K)
festgelegt, genannt Signatur oder Typ der Struktur. Die Indexmengen I, J, K werden meistens endlich sein, so daß man die einzelnen Relationen, Funktionen und
Konstanten auch einfacher hintereinander schreibt (s. folgendes Beispiel). Den
Grundbereich einer Struktur A bezeichnet man auch mit A = |A|, ebenso werden
wir den Grundbereich der Struktur B mit B bezeichnen, usw.
2.1.1 Beispiele
1. Die geordneten Gruppen (Z, <, +, 0) und (Q\{0}, <, ·, 1) haben eine 2stellige Relation, eine 2-stellige Funktion und eine Konstante, sind also
Strukturen vom Typ ((2),(2),{0}), aber nicht alle Strukturen dieses Typs
müssen geordnete Gruppen sein; man erhält auch eine Struktur (A, R, f , c)
dieses Typs durch die Festlegung
A := N,
R := {(n, m) | n, m ∈ N, n teilt m + 3},
f := {(n, m, k) | n, m, k ∈ N, k = m · n3 + 1001},
c := 17,
denn die Gültigkeit von Axiomen haben wir (noch) nicht verlangt!
2.1. S TRUKTUREN
39
2. Vektorräume V über einem Körper K fallen unter den obigen Strukturbegriff, wenn man als Grundbereich die Menge V der Vektoren wählt, auf
welcher die Vektoraddition als 2-stellige Operation definiert ist. Der Nullvektor als neutrales Element ist eine Konstante von V, und die skalare Multiplikation wird wiedergegeben durch 1-stellige Funktionen fα : V → V mit
fα (v) = αv für alle α ∈ K. Im Falle K = R oder C ist dann die Indexmenge
J überabzählbar (und zwar von der Mächtigkeit des Kontinuums)!
2.1.2 Mehrsortige Strukturen
Die Euklidische Ebene ist ein typisches Beispiel einer mehrsortigen Struktur:
In diesem Fall gibt es zusätzlich eine Menge S von Sorten, und statt eines Grundbereiches A gibt es nun für jede Sorte s ∈ S einen Grundbereich As , Relationen
zwischen Elementen möglicherweise verschiedener Sorten, Funktionen, die auf
einzelnen Grundbereichen definiert sind und möglicherweise in andere Grundbereiche abbilden und schließlich Konstanten aus den einzelnen Grundbereichen. So
gibt es im Falle der Euklidischen Ebene zwei Sorten (Menge der Punkte P bzw.
der Geraden G) und die Inzidenzbeziehung I zwischen Punkten und Geraden (p
liegt auf g).
Alle Ergebnisse, die hier für einsortige Strukturen dargestellt werden, lassen
sich (mutatis mutandis) auf mehrsortige Strukturen übertragen; die mehrsortigen
Strukturen zu behandeln, erfordert allerdings einen erheblichen formalen Aufwand wegen der zusätzlichen Sortenindizes. Andererseits lassen sich prinzipiell
alle mehrsortigen Strukturen auf einsortige zurückführen, indem man die einzelnen Grundbereiche As zu einer disjunkten Vereinigung A zusammenfaßt, für die
Aufteilung in die einzelnen Grundbereiche zusätzliche 1-stellige Prädikate Ps auf
A einführt und die früheren Relationen und Funktionen in trivialer Weise auf den
Grundbereich A fortsetzt. So würde z. B. aus der 2-sortigen Euklidischen Ebene
die 1-sortige Struktur
E = (P ∪ G, P, G, I) mit I = {(p, g) | p ∈ P, g ∈ G und p liegt auf g}
Ein Vektorraum V = (V, K, +, ·, 0) über einem Körper K (mit Vektoraddition,
Nullvektor und der skalaren Multiplikation · als Abbildung K ×V → V ) ist ebenfalls eigentlich eine 2-sortige Struktur (mit Vektoren und Skalaren als den beiden
Sorten). Wie wir später sehen werden, ist es aber vorteilhaft, den Vektorraum wie
im Beispiel (2) von 2.1.1 als gewöhnliche 1-sortige Struktur aufzufassen, auch
wenn damit die Signatur so groß wie der Körper wird.
40
2.1. S TRUKTUREN
2.1.3 Symbole für formale Sprachen
Die Strukturen (Z, <, +, 0) und (Q\{0}, <, ·, 1) haben verschiedene Grundbereiche sowie unterschiedliche Operationen, erfüllen aber beide die Gesetze einer angeordneten Gruppe. Gibt es auch Eigenschaften, in denen sie sich unterscheiden?
Um Strukturen desselben Typs hinsichtlich ihrer Eigenschaften untersuchen und
vergleichen zu können, müssen wir die Eigenschaften in einer einheitlichen Sprache ausdrücken. So besagt zum Beispiel die Aussage
∀x(e < x → ∃y(e < y ∧ y ◦ y < x))
daß es für jedes Element x, welches größer als das neutrale Element ist, ein Element y gibt, welches ebenfalls größer als das neutralen Element ist, so daß das
Produkt von y mit y noch kleiner als x ist. Diese Aussage ist offensichtlich in
einigen, aber nicht allen Strukturen wahr (das hängt von der Interpretation der
Symbole ab).
Definition
Gegeben sei eine Signatur σ = ((ni |i ∈ I), (m j | j ∈ J), K). Eine (formale) Sprache
L zur Signatur σ besitzt als Alphabet folgende
1. logische Zeichen:
• Variable v0 , v1 , v2 , . . . (wir schreiben auch x, x0 , x1 , x2 , y, z, . . .)
• aussagenlogische Verknüpfungen ¬, ∨
• den Existenz-Quantor ∃
• das Gleichheitszeichen = (als 2-stelliges Relationszeichen)
und dazu - festgelegt durch die Signatur -:
2. nicht-logische Zeichen:
• ni - stellige Relationszeichen Rni i (ni ≥ 1, i ∈ I),
m
• m j - stellige Funktionszeichen f j j (m j ≥ 1, j ∈ J),
• Individuenkonstanten ck (k ∈ K).
Sprachen und Strukturen sind somit über die Signatur verbunden; haben die
Struktur A und die Sprache L dieselbe Signatur, so sagen wir auch, daß A eine
L-Struktur ist, bzw. daß L die Sprache der Struktur A ist.
2.2. U NTERSTRUKTUREN UND M ORPHISMEN
41
Als Symbole für die Gruppenoperation bzw. das neutrale Element wählt man
üblicherweise ◦ bzw. e; in konkreten Gruppen, wie
A = (Z, +, 0) und
B = (Q\{0}, ·, 1),
stehen dann die entsprechenden Interpretationen, also in unserer Bezeichnungsweise:
A = (Z, ◦A , eA ) und B = (Q\{0}, ◦B , eB ).
Syntax und Semantik
Die formalen Zeichen (Symbole) einer Sprache, ihr Aufbau zu endlichen Zeichenreihen (als Terme und Formeln) und die Untersuchung ihrer Eigenschaften, die
allein auf ihrer formalen Gestalt beruhen, gehören zur Syntax. Dagegen handelt es sich beim Begriff der Struktur, sowie allgemeiner den Interpretationen
der formalen Symbole, um Gegenstände der Semantik. Zwischen beiden zu unterscheiden ist besonders wichtig für Grenzbereiche der Mathematischen Logik
(G ÖDELsche Unvollständigkeitssätze), sollte aber trotzdem schon frühzeitig beachtet werden. Manchmal kann allerdings eine konsequente Wahl der Bezeichnung zu schwerfälligen Ausdrucksweisen führen, so daß wir Vereinfachungen
treffen werden. (Z. B. kann das Zeichen + wie oben die Addition auf den ganzen Zahlen bezeichnen, gelegentlich aber auch die Addition auf den natürlichen
bzw. reellen Zahlen, möglicherweise aber auch ein formales Symbol für eine 2stellige Relation - die korrekte Bedeutung wird sich dann aber meistens aus dem
Zusammenhang ergeben.)
2.2 Unterstrukturen und Morphismen
A und B seien Strukturen derselben Sprache L mit Grundbereich A bzw. B. Dann
heißt A Unterstruktur (oder Substruktur) von B, geschrieben: A ⊆ B , genau
dann, wenn
U1 A ⊆ B,
U2 RA = RB ∩ An für jedes n-stellige Relationszeichen R von L,
U3 f A = f B Am für jedes m-stellige Funktionszeichen f von L, und
U4 cA = cB für jede Individuenkonstante c von L.
2.2. U NTERSTRUKTUREN UND M ORPHISMEN
42
Eine Abbildung h heißt Homomorphismus von A nach B, h : A −→ B , genau dann, wenn
H1 h : A −→ B,
H2 RA (a1 , . . . , an ) =⇒ RB (h(a1 ), . . . , h(an )) für alle a1 , . . . , an ∈ A und für jedes n-stellige Relationszeichen R von L,
H3 h( f A (a1 , . . . , am )) = f B (h(a1 ), . . . , h(am )) für alle a1 , . . . , am ∈ A und für
jedes m-stellige Funktionszeichen f von L, und
H4 h(cA ) = cB für jede Individuenkonstante c von L.
Ein Homomorphismus h : A −→ B heißt eine Einbettung gdw h injektiv ist
und in (H2) auch die Umkehrung gilt:
H2’ RA (a1 , . . . , an ) ⇐⇒ RB (h(a1 ), . . . , h(an )) für alle a1 , . . . , an ∈ A und für
jedes n-stellige Relationszeichen R von L.
(Die Injektivität von h besagt gerade, daß (H2’) auch für die Gleichheitsrelation
gilt.) Ein
• surjektiver Homomorphismus ist ein Epimorphismus,
• ein injektiver Homomorphismus ist ein Monomorphismus,
und schließlich ist
• ein Isomorphismus eine surjektive Einbettung, also eine bijektive Abbildung h : A ←→ B, welche die Bedingungen (H1), (H2’), (H3) und (H4)
erfüllt.
A ist isomorph zu B, A ∼
= B , gdw es einen Isomorphismus h : A ←→ B
gibt.
Somit ist A ⊆ B gdw die identische Abbildung iA : A → B (mit i(a) = a für
alle a ∈ A) eine Einbettung iA : A −→ B ist.
43
2.2. U NTERSTRUKTUREN UND M ORPHISMEN
2.2.1 Beispiele
1. Es sei
• Z = (Z, +, 0) die additive Gruppe der ganzen Zahlen,
• N = (N, +, 0) die Struktur der natürlichen Zahlen, und
• G = ({2n | n ∈ Z}, +, 0) die Struktur der geraden Zahlen.
Dann sind N, G ⊆ Z, aber (N, ·, 1) 6⊆ Z. Im übrigen ist N keine Gruppe:
Unterstrukturen von Gruppen brauchen also keine Untergruppen zu sein,
da diese auch unter der Inversenbildung abgeschlossen sein müssen. Fügen
wir aber zur Sprache ein entsprechendes 1-stelliges Funktionszeichen für
das Inverse hinzu, so sind Unterstrukturen zugleich Untergruppen. Ferner
ist die Abbildung h : Z −→ G mit h(n) = 2n ein Isomorphismus von Z auf
G.
2. Es sei
• A = ({a, b, c, d}, <A ) die teilweise geordnete Struktur mit:
a <A b, b <A d, a <A c, c <A d,
• B = ({1, 2, 3, 4}, <B ) die geordnete Struktur mit 1 <B 2 <B 3 <B 4 :
c 4
6
d
c
I
@
@
@
A
b c
@
I
@
@
@c c
@
@
@c
a
c 3
6
B
c 2
6
c 1
Dann ist die Abbildung h mit
• h(a) = 1, h(b) = 2, h(c) = 3, h(d) = 4
ein Homomorphismus h : A −→ B. Da aber h(b) = 2 <B h(c) = 3, während
b 6<A c, ist h keine Einbettung, also trotz Bijektivität kein Isomorphismus!
2.2. U NTERSTRUKTUREN UND M ORPHISMEN
44
3. Unterstrukturen von Vektorräumen sind Unterräume (lineare Teilräume),
wenn man die Sprache der Vektorräume über einem Körper K wie in 2.1.1
mit Hilfe von einstelligen Funktionszeichen fα für jedes α ∈ K formuliert,
wobei fα für die skalare Operation mit α steht.
Ist B Universum einer L-Struktur B und enthält die Sprache L nur Relationszeichen, so führt jede nicht-leere Teilmenge A ⊆ B wieder zu einer Unterstruktur
von B: Man schränke einfach die Relationen auf den Teilbereich A ein. Falls die
Sprache jedoch auch Funktionszeichen enthält, muß A unter den entsprechenden
Funktionen von B abgeschlossen sein:
2.2.2 Satz über Unterstrukturen
B sei eine L-Struktur, 0/ 6= A ⊆ B. Dann ist A das Universum einer Unterstruktur
A ⊆ B genau dann, wenn
(i) a1 , . . . , am ∈ A =⇒ f B (a1 , . . . , am ) ∈ A
für alle m-stelligen Funktionszeichen f von L und
(ii) cB ∈ A für jede Individuenkonstante c von L.
Sind die obigen Bedingungen erfüllt, so ist die Unterstruktur A durch die Menge
A (und natürlich die Struktur B) eindeutig bestimmt.
Ist B eine L-Struktur, 0/ 6= A ⊆ B, so gibt es eine kleinste (bzgl. ⊆) Menge A,
die A enthält und Grundbereich einer Unterstruktur von B ist: die von A erzeugte
Unterstruktur. Auf eine Beschreibung von A kommen wir nach Einführung des
Termbegriffes zurück.
2.2.3 Homomorphes Bild, Identifizierung
Ist h : A −→ B ein Homomorphismus, so erfüllt die Menge der Bilder von h
h[A] := {h(a) | a ∈ A}
die Bedingungen von Satz 2.2.2, ist also Universum einer Unterstruktur h[A] von
B, das homomorphe Bild von A.
Ist h sogar eine Einbettung, so ist h ein Isomorphismus von A auf h[A]. Häufig
identifiziert man in dieser Situation A mit dem isomorphen Bild h[A], d. h. man
ersetzt in B die Elemente h(a) durch ihre Urbilder a für a ∈ A, um somit A ⊆ B
zu erhalten (während eigentlich statt A nur eine isomorphe Kopie hiervon Unterstruktur von B ist).
45
2.3. T ERME EINER S PRACHE
2.3 Terme einer Sprache
(T1) Jede Variable und jede Individuenkonstante von L ist ein Term von L.
(T2) Ist f ein m-stelliges Funktionszeichen von L und sind t1 , . . . ,tm Terme von
L, so ist auch f (t1 , . . . ,tm ) ein Term von L.
(T3) Das sind alle Terme von L.
Wie üblich werden wir im Falle 2-stelliger Funktionszeichen (wie + ) statt
f (t, s) auch t f s schreiben.
Beispiele
• Enthält die Sprache L keine Funktionszeichen und keine Individuenkonstanten, so sind die Variablen die einzigen L-Terme.
• Im allgemeinen Fall entstehen Terme aus Variablen und Konstanten durch
wiederholte Anwendung von Funktionszeichen, z. B.
1
sin(x2 + z) + eiπ z ,
was eigentlich schon die Interpretation eines Termes ist, denn hier müßten
statt der Funktionen natürlich die entsprechenden Funktionszeichen stehen.
Die Interpretation eines Terms in einer Struktur A wird ein Element von A
sein, abhängig davon, wie wir die Variablen im Term belegen (der Wert von x + y
hängt von der Operation + sowie von den Werten von x und y ab).
Mit t(x1 , . . . , xn ) bezeichnen wir einen Term t, der (höchstens) die Variablen
x1 , . . . , xn enthält (möglicherweise weniger - diese Festlegung ist zweckmäßig, da
beim Übergang von einem Term zu seinen Teiltermen Variablen verschwinden
können). Ein konstanter Term ist ein Term ohne Variable.
2.3.1 Interpretation von Termen
A sei eine L-Struktur, A = |A|, t = t(x1 , . . . , xn ) ein Term der Sprache L. Ferner
seien a1 , . . . , an Elemente von A. Dann ist
t A [a1 , . . . , an ] (die Interpretation von t in A unter der Belegung a1 , . . . , an )
46
2.3. T ERME EINER S PRACHE
wie folgt definiert:
t A [a1 , . . . , an ] = ai
für t = xi ,
t A [a1 , . . . , an ] = cA
k
für t = ck ,
t A [a1 , . . . , an ] = f A (t1A [a1 , . . . , an ], . . . ,tmA [a1 , . . . , an ]) für t = f (t1 , . . . ,tm ),
wobei f ein m-stelliges Funktionszeichen der Sprache L sei.
Man erhält also t A [a1 , . . . , an ], indem man im Term t die Variable xi durch das
Element ai sowie die Individuenkonstanten und Funktionszeichen in t durch ihre
jeweilige Interpretation in A ersetzt und das Ergebnis in der Struktur A “auswertet”.
In einem Term selbst kann man für die Variablen keine Objekte direkt einsetzen, da Terme lediglich formale Zeichenreihen sind. Die in der Interpretation vorkommende Belegung ist auch nur eine Zuordnung (daher die Bezeichnung oben
mit eckigen Klammern). Wollen wir aber diese Zuordnung in der Sprache selbst
ausdrücken, so ist das nur möglich mit Hilfe von Symbolen, welche Namen für die
jeweiligen Objekte darstellen, wovon man in der Modelltheorie häufig Gebrauch
macht:
2.3.2 Spracherweiterung durch Namen
Die Sprache L wird zur Sprache LA erweitert durch Hinzufügen von neuen Individuenkonstanten a für jedes Element von a ∈ A; das Symbol a wird als Name
von a bezeichnet.
Variante für die Interpretation eines Termes
t sei konstanter Term von LA (d. h. t enthalte keine Variablen, u. U. aber Namen
für Elemente von A). Wir definieren
t A (die Interpretation von t in A)
durch Induktion über den Aufbau eines Termes wie folgt:
aA = a,
cA
= cA
k
k ,
f (t1 , . . . ,tm )A = f A (t1A , . . . ,tmA ),
wobei f ein m-stelliges Funktionszeichen f der Sprache L ist.
2.3. T ERME EINER S PRACHE
47
Zwischen beiden Arten der Definition besteht offenbar folgender Zusammenhang:
t A [a1 , . . . , an ] = (t[a1 /x1 , . . . , an /xn ])A .
Dabei ist mit t[a1 /x1 , . . . , an /xn ] auf der rechten Seite der Term gemeint, der aus t
entsteht, indem man für i = 1, . . . , n in t den Term ai für die Variable xi einsetzt.
Ist B eine L-Struktur mit A ⊆ B, so bezeichnen wir mit BA die Expansion
zu einer LA -Struktur, die alle Symbole von L wie in B interpretiert, jedoch die
zusätzlichen neuen Konstanten a mit a. Statt AA schreiben wir häufig kurz A.
Beachte den Unterschied zwischen einer Erweiterung und einer Expansion:
• B Erweiterung von A (B ⊇ A) : A wird erweitert zu B, die Sprache bleibt
unverändert,
• B Expansion von A: die Grundbereiche bleiben gleich (A = B), die Sprache
wird erweitert (das gilt auch für den allgemeinen Begriff einer Expansion).
Wir können nun den Begriff der erzeugten Unterstruktur neu fassen:
2.3.3 Erzeugte Unterstrukturen
B sei eine L-Struktur, A ⊆ B. Ferner sei A 6= 0/ oder die Sprache enthalte wenigstens eine Individuenkonstante. Dann gibt es eine kleinste (bzgl. ⊆) Menge A,
die A enthält und Universum einer Unterstruktur von B ist: die von A erzeugte
Unterstruktur.
Man erhält A, indem man zu A die cB für jede Individuenkonstante c von
L hinzunimmt und unter den Funktionen f B abschließt. Alternativ gilt folgende
Darstellung:
A = {t B [a1 , . . . , am ] | t(v1 , . . . , vm ) L-Term, a1 , . . . , am ∈ A}
= {t BA | t konstanter L-Term von LA }.
Man kann leicht sehen, daß für Sprachen mit abzählbar-vielen Symbolen und
für unendliches A die Erweiterung zu A die Mächtigkeit nicht ändert (genauere
Aussagen werden wird später der Kardinalzahlbegriffs der Mengenlehre ermöglichen, s. 8.5).
2.4. F ORMELN EINER S PRACHE
48
Beispiele
1. (Z, ≤) wird als geordnete Struktur nur von Z erzeugt, dagegen wird
2. (Z, +, −, ·, 0, 1) als Ring bereits von der leeren Menge erzeugt, während
3. (Q, +, −, ·, 0, 1) von keiner endlichen Menge erzeugt wird.
4. In Vektorräumen (als einsortige Strukturen wie in 2.1.1) sind die erzeugenden Mengen genau die Mengen von Vektoren, deren endliche Linearkombinationen alle Vektoren ergeben (wie im Sinne der Linearen Algebra).
2.4 Formeln einer Sprache
Terme bezeichnen Objekte einer Struktur, Formeln Eigenschaften. Ähnlich wie
der Begriff eines Terms werden Formeln einer Sprache L (L-Formeln) durch
Rekursion definiert:
(F1) Die einfachsten L-Formeln (auch atomare oder Prim-Formeln genannt)
sind:
• s = t für beliebige Terme s,t und
• R(t1 , . . . ,tn ) für jedes n-stellige Relationszeichen von L und beliebige
L-Terme t1 , . . . ,tn .
(F2) Ist ϕ eine L-Formel, so auch ¬ϕ.
(F3) Sind ϕ und ψ L-Formeln, so auch (ϕ ∨ ψ).
(F4) Ist ϕ eine L-Formel und x eine Variable, so ist auch ∃x ϕ eine L-Formel.
(F5) Das sind alle L-Formeln.
Wiederum werden wir im Falle 2-stelliger Relationszeichen (wie = oder < )
statt R(t, s) auch tRs schreiben; während wir jedoch im ersten Fall (wo die Relationszeichen stets vor den Argumenten stehen) auf Klammern verzichten können,
müssen wir im zweiten Fall jedoch möglicherweise Klammern setzen, um eindeutige Lesbarkeit zu sichern.
Die aussagenlogischen Zeichen ∧, → und ↔ sowie den Allquantor ∀ definieren wir:
49
2.4. F ORMELN EINER S PRACHE
ϕ ∧ψ
: ⇐⇒
¬(¬ϕ ∨ ¬ψ),
ϕ →ψ
: ⇐⇒
¬ϕ ∨ ψ,
ϕ ↔ψ
: ⇐⇒
(ϕ → ψ) ∧ (ψ → ϕ),
∀xϕ
: ⇐⇒
¬∃x¬ϕ.
Somit stellt jede (prädikatenlogische) Sprache L eine Erweiterung der aussagenlogischen Sprache dar, indem die Aussagenvariable der Aussagenlogik durch
atomare Formeln ersetzt werden und zusätzlich als logische Symbole die Gleichheit und die Quantoren auftreten. Formel- und Termbegriff sind wieder rekursiv
definiert, so daß man Aussagen über alle Formeln (bzw. Terme) wiederum durch
Induktion durchzuführen kann:
2.4.1 Beweis durch Induktion über den Formelaufbau
Es sei E eine Eigenschaft mit
(i) E(ϕ) gilt für alle atomaren Formeln ϕ,
(ii) gilt E(ϕ), so auch E(¬ϕ),
(iii) gelten E(ϕ) und E(ψ), so auch E(ϕ ∨ ψ), und
(iv) gilt E(ϕ), so auch E(∃x ϕ).
Dann gilt E(ϕ) für alle Formeln ϕ.
Um eine Eigenschaft für alle Formeln nachzuweisen, muß man sie also
(1) für alle atomaren Formeln nachweisen und dann
(2) unter der Annahme, daß die Eigenschaft bereits für die Formel ϕ (bzw. die
Formeln ϕ und ψ) gilt, für die Formeln ¬ϕ, (ϕ ∨ ψ) und ∃x ϕ nachweisen.
(1) nennt man wieder den Induktionsanfang, (2) den Induktionsschluß, welcher
aus einer Induktionsannahme und einer Induktionsbehauptung besteht. (Ähnliches gilt für die Beweismethode der Induktion über den Termaufbau und auch
das Induktionsverfahren für ein geeignetes Komplexitätsmaß, s. 1.1.3.)
50
2.4. F ORMELN EINER S PRACHE
2.4.2 Freie und gebundene Variable
Bildet man eine Formel ∃x ϕ nach (F4), so heißt die in ϕ vorkommende Variable gebunden (durch den Quantor ∃); ähnlich natürlich im Falle der Formel ∀x ϕ.
Die übrigen Variablen heißen freie Variable, weil sie frei für Einsetzungen sind.
Während es nicht sinnvoll ist, in gebundene Variable Einsetzungen vorzunehmen,
kann man sie aber in eine andere geeignete Variable umbenennen, ohne die Bedeutung (die wir noch erklären werden) zu ändern.
Bei obiger Definition treten nun aber folgende Probleme auf:
• Bildet man aus zwei Formeln ϕ, ψ nach (F3) die neue Formel (ϕ ∨ ψ), so
kann es vorkommen, dass dieselbe Variable y in der einen Formel frei, in
der anderen jedoch gebunden vorkommt:
(*)
¬x = y → ∃y(x < y ∧ 1 < x ◦ y)
• In (F4) ist nicht ausgeschlossen, daß die Variable x in ϕ bereits (in einer
Teilformel) gebunden vorkommt.
Prinzipiell bereiten beide Probleme keine Schwierigkeiten; statt zwischen freien und gebundenen Variablen zu unterscheiden, spricht man vom freien bzw. gebundenen Vorkommen einer Variable in einer Formel, so daß dieselbe Variable in
einer Formel an einigen Stellen frei, an anderen jedoch auch gebunden vorkommen kann. Lästig ist diese Freiheit der Formelbildung jedoch bei Einsetzungen,
welche besondere Vorkehrungen erfordern: Will man in obiger Formel (*) einen
Term für eine Variable einsetzen, so muß man sich auf Stellen beschränken, an
denen die Variable frei vorkommt. Wichtiger ist jedoch zu beachten, daß Einsetzungen so erfolgen, daß die Formel
ϕ(t) über den Term t dasselbe aussagt
wie ϕ(x) über die Variable x,
und dazu muß man zusätzlich darauf achten, daß beim Einsetzen eines Terms
t(y . . .) in eine frei vorkommende Variable x nicht durch den Term t eine Variable
y in den Bindungsbereich eines Quantors gerät, z. B. wenn man (y + 1) für x in
die Formel (*) einsetzt, in welcher x überall frei vorkommt!
Diese Probleme kann man durch die Wahl von unterschiedlichen Variablen für
freie bzw. gebundene Variable umgehen (wie in der älteren H ILBERT-Schule). Wir
wollen jedoch bei dem heute allgemein üblichen Gebrauch einer einzigen Sorte
2.4. F ORMELN EINER S PRACHE
51
von Variablen bleiben, andererseits aber Einsetzungen leichter handhaben und daher folgende Vereinbarungen treffen (die man intuitiv zwecks besserer Lesbarkeit
ohnehin wohl beachten würde):
• Bei der Bildung einer Formel ϕ sind gebundene Variablen so zu wählen,
daß sie nicht zugleich auch frei vorkommen.
Unter dieser Voraussetzung kann man dann wieder einfach von freien bzw. gebundenen Variablen sprechen (anstatt von freien bzw. gebundenen Vorkommen).
Terme enthalten auf jeden Fall nur freie Variable, während in Formeln sowohl
freie wie auch gebundene Variable vorkommen können. Da für die Interpretation von Termen bzw. Formeln in einer Struktur Belegungen der freien Variablen
angegeben werden müssen, schreiben wir oft
t(x1 , . . . , xn ) bzw. ϕ(x1 , . . . , xn )
um anzuzeigen, daß alle im Term t vorkommenden Variable bzw. in der Formel ϕ
vorkommenden freien Variable unter den x1 , . . . , xn vorkommen.
2.4.3 Substitution
ϕ sei eine Formel, s,t Terme, x eine freie Variable. Dann entstehe
• s[t/x] aus s, indem überall t für x eingesetzt wird, ebenso
• ϕ[t/x] aus ϕ, indem überall t für x eingesetzt wird.
Dabei soll im zweiten Fall t substituierbar in ϕ sein, d. h. t soll keine Variable
enthalten, die in ϕ gebunden vorkommt.
Ähnlich erklären wir die mehrfache Substitution
s[t1 /x1 , ...,tn /xn ] und ϕ[t1 /x1 , ...,tn /xn ]
durch mehrfache (simultane) Ausführung der jeweiligen Substitution.
Wenn man aus dem Zusammenhang weiß, für welche Variable eine Substitution erfolgt (oder wenn man einfach bequemer sein will), schreibt man kürzer auch
s(t) für s[t/x] und ϕ(t) für ϕ[t/x], und ähnlich im Falle mehrfacher Substitution.
Natürlich kann man auch hintereinander substituieren: erst t1 für x1 , dann t2 für x2 ,
usw.; wenn dann aber mit t1 auch die Variable x2 hineinkommt, so wird auch hier
(anders als bei der simultanen Substitution) anschließend der Term t2 eingesetzt!
52
2.4. F ORMELN EINER S PRACHE
Definition
t konstanter Term :
⇐⇒ t Term ohne Variable,
ϕ Satz (Aussage) :
⇐⇒ ϕ Formel ohne freie Variable.
Der Begriff Satz im Sinne der obigen Definition ist rein syntaktisch und natürlich nicht mit dem Begriff des Satzes im Sinne eines Theorems zu verwechseln!
Im Englischen unterscheidet man oft zwischen sentence und theorem; gelegentlich nennt man Sätze im Sinne der obigen Definition auch Aussagen oder abgeschlossene Formeln, um eine Verwechslung mit der Bedeutung als Theorem zu
vermeiden.
53
Kapitel 3
Modelle und Theorien
3.1 Das Wahrheitsprädikat: Modelle
Nachdem wir die Interpretation von Termen in einer Struktur definiert haben, werden wir in ähnlicher Weise die Bedeutung einer Formel in einer Struktur erklären.
Gegeben sei
• eine L-Struktur A mit Grundbereich A = |A|,
• eine L-Formel ϕ = ϕ(x1 , . . . , xn ), deren freie Variable unter x1 , . . . , xn vorkommen,
• eine Belegung f = (a1 , . . . , an ) der Variablen x1 , . . . , xn .
Dann definieren wir induktiv:1
A |= ϕ[ f ]
ϕ ist wahr in A unter der Belegung f
wie folgt:
A |= (t = s)[ f ]
A |= R(t1 , . . . ,tn )[ f ]
A |= ¬ϕ[ f ]
A |= (ϕ ∨ ψ)[ f ]
A |= ∃xi ϕ[ f ]
⇐⇒
⇐⇒
⇐⇒
⇐⇒
⇐⇒
t A [ f ] = sA [ f ]
(t1A [ f ], . . . ,tnA [ f ]) ∈ RA
A 6|= ϕ[ f ]
A |= ϕ[ f ] oder A |= ψ[ f ]
es gibt ein a ∈ A mit A |= ϕ[ f (a/xi )],
wobei f (a/xi ) die Belegung f ist, allerdings mit a als Belegung von xi .
1 A.
Tarski: Der Wahrheitsbegriff in den formalisierten Sprachen, Studia Phil. 1 (1936)
3.1. DAS WAHRHEITSPR ÄDIKAT: M ODELLE
54
Auch hier läßt sich eine alternative Definition angeben, die formal etwas einfacher ausfällt:
Definition des Wahrheitsprädikats: Variante in erweiterter Sprache LA
A sei eine L-Struktur, A = |A|, σ sei ein LA -Satz. Wir definieren induktiv
A |= σ
(genauer: AA |= σ )
wie folgt:
A |= (t = s)
⇐⇒
t A = sA
A |= R(t1 , . . . ,tn )
⇐⇒
(t1A , . . . ,tnA ) ∈ RA
A |= ¬σ
⇐⇒
A 6|= σ
A |= (σ ∨ τ)
⇐⇒
A |= σ oder A |= τ
A |= ∃xϕ
⇐⇒
es gibt ein a ∈ A mit A |= ϕ[a/x]
Wiederum haben wir hier eine einfache Beziehung zwischen diesen beiden
Definitionen:
A |= ϕ[a1 , . . . , an ] ⇐⇒ A |= ϕ[a1 /x1 , . . . , an /xn ].
Dabei steht auf der linken Seite eine L-Formel ϕ mit höchstens x1 , . . . , xn als
frei vorkommenden Variablen, die mit a1 , . . . , an belegt werden, auf der rechten
Seite (bezogen auf die alternative Definition) ein LA -Satz ϕ, welcher an Stelle
der x1 , . . . , xn Namen für die a1 , . . . , an enthält. (Wenn nicht ausdrücklich darauf
hingewiesen wird, welche der beiden Definitionen gebraucht wird, muß dies aus
dem Zusammenhang erschlossen werden.)
Für eine L-Formel ϕ = ϕ(x1 , . . . , xn ) sei ϕ ∀ := ∀x1 . . . ∀xn ϕ der universelle
Abschluß von ϕ. Wir definieren dann
ϕ ist wahr in A (oder: A ist Modell von ϕ)
durch
A |= ϕ : ⇐⇒ A |= ∀x1 . . . ∀xn ϕ
Diese Festlegung entspricht dem üblichen Gebrauch in der Mathematik:
3.1. DAS WAHRHEITSPR ÄDIKAT: M ODELLE
55
Die Axiome einer algebraischen Theorie schreibt man oft als Formeln auf,
z. B. a + b = b + a im Falle des Kommutativgesetzes der Gruppentheorie, meint
damit aber, daß es in einer Gruppe für alle Elemente gelten soll, d. h. in der Form
∀x∀y(x + y = y + x).
Die Wahrheit (oder Allgemeingültigkeit) einer L-Formel ϕ = ϕ(x1 , . . . , xn )
wird definiert durch
|= ϕ : ⇐⇒ für alle L-Strukturen A gilt: A |= ϕ
Das bedeutet also für eine Formel ϕ, daß sie bei allen möglichen Interpretationen der nicht-logischen Zeichen und für alle Einsetzungen in die frei vorkommenden Variablen wahr sein muß. Ebenso definieren wir im Falle einer Menge Σ
von Formeln: A ist Modell von Σ gdw A ist Modell von allen ϕ ∈ Σ:
A |= Σ : ⇐⇒ für alle ϕ ∈ Σ : A |= ϕ .
Schließlich erklären wir den semantischen Begriff der Folgerung: Eine Formel ϕ folgt aus der Formelmenge Σ gdw sie in allen Modellen von Σ gilt:
Σ |= ϕ : ⇐⇒ für alle A |= Σ gilt: A |= ϕ
Endliche Folgen von Variablen x0 , . . . , xn bezeichnen wir auch mit ~x (ähnlich
in anderen Fällen). Die Bedeutung der Einführung neuer Konstanten zeigt sich in
dem folgenden
3.1.1 Satz über neue Konstanten
Es sei Γ eine Menge von Sätzen der Sprache L, ϕ(~x) eine L-Formel und ~c eine
Folge von Individuenkonstanten (derselben Länge wie ~x), die in der Sprache L
nicht vorkommen. Dann gilt:
Γ |= ϕ(~c) =⇒ Γ |= ∀~x ϕ(~x).
Beweis: Sei Γ |= ϕ(~c), A |= Γ und ~a seien n beliebige Elemente von A. Wir
müssen zeigen, daß A |= ϕ[~a]. Dazu sei L0 die Sprache L, erweitert um die neuen
Individuenkonstanten ~c. Wir expandieren A zu einer L0 -Struktur A0 , indem wir
0
0
cA
i = ai setzen. Dann ist auch A |= Γ (da die neuen Konstanten in der Menge Γ
56
3.2. A XIOME UND T HEORIEN
nicht vorkommen!), also gilt nach Voraussetzung A0 |= ϕ(~c), d. h. A |= ϕ[~a], weil
0
wir ciA = ai festgelegt haben.
Dieser Satz bedeutet also, daß eine Aussage der Form ∀~x ϕ(~x) aus einer Menge
von Sätzen Γ folgt, wenn sie für “feste, aber beliebige” Elemente folgt. Meistens
wird man Γ als die Menge von Axiomen einer Theorie auffassen:
3.2 Axiome und Theorien
Eine Theorie T ist bestimmt durch
1. eine formale Sprache L, die Sprache von T, sowie
2. eine Menge Σ von Formeln der Sprache L als Axiome der Theorie.
Da man die Sprache einer Theorie meistens aus den Axiomen ablesen kann, werden wir in der Regel eine Theorie mit der Menge Σ ihrer Axiome gleichsetzen.
Somit erklären wir für eine Theorie T mit der Axiomenmenge Σ und eine
Formel ϕ:
A |= T : ⇐⇒
T |= ϕ : ⇐⇒
T+ϕ
A |= Σ
A ist Modell von T,
für alle A |= T : A |= ϕ
ϕ folgt aus T.
bezeichnet die Theorie T mit ϕ als zusätzlichem Axiom.
Jeder Theorie T (oder Menge von Sätzen) kann man die Klasse ihrer Modelle
zuordnen:
Mod(T) := {A | A |= T}
die Modellklasse von T,
und umgekehrt jeder L-Struktur A eine Menge von Sätzen, ihre Theorie:
Th(A) := {σ | σ L-Satz, A |= σ }
die (elementare) Theorie von A.
Häufig verlangt man von Theorien, daß sie deduktiv abgeschlossen sind, zählt
also auch alle Folgerungen zur Theorie. Stattdessen werden wir Theorien als
gleich ansehen, wenn sie dieselben Folgerungen haben (also sich höchstens durch
die Wahl ihrer Axiome unterscheiden), und diese Aussage bedeutet wiederum,
daß sie dieselben Modelle haben:
T = T0 :
⇐⇒ für alle Sätze σ : T |= σ ⇐⇒ T0 |= σ
⇐⇒ Mod(T) = Mod(T0 ).
3.3. D ER KOMPAKTHEITSSATZ UND EINIGE F OLGERUNGEN
57
Der oben eingeführte semantische Folgerungsbegriff hat im konkreten Fall
meistens einen schwerwiegenden Nachteil: Denn semantisch folgt etwa eine Aussage σ aus der Gruppentheorie, wenn sie in allen Gruppen gilt. Das kann man
nun aber nicht nachweisen, indem man die Gültigkeit der Aussage in allen einzelnen Gruppen nachprüft, schon die Wahrheit einer Formel in einer (unendlichen)
Struktur ist i. a. schwierig zu überprüfen.
Der syntaktische Folgerungsbegriff: Beweise
Folgerungen aus einer mathematischen Theorie wird man versuchen, mit logischen Argumenten zu begründen, indem man nach einem Beweis einer Formel
ϕ aus den Axiomen der Theorie sucht. Wir werden im nächsten Kapitel einen
formalen Begriff eines Beweises einführen, der sich auf ein Axiomensystem der
Prädikatenlogik bezieht. Wenn T ` ϕ besagt, daß es einen Beweis von ϕ aus den
Axiomen von T mit Hilfe logischer Axiome und Regeln gibt, so wird für geeignete Axiomensysteme der Logik der Vollständigkeitssatz in der folgenden Form
gelten:
T |= ϕ ⇐⇒ T ` ϕ.
3.3 Der Kompaktheitssatz und einige Folgerungen
Da Beweise endlich sein müssen, kann ein Beweis einer Aussage aus den Axiomen einer Theorie auch nur von endlich-vielen Axiomen Gebrauch machen. Zusammen mit dem oben erwähnten Vollständigkeitssatz folgt daraus sofort der für
die Modelltheorie zentrale
3.3.1 Kompaktheitssatz
Für jede Theorie T und jeden Satz σ der Sprache von T gilt:
(i) T |= σ =⇒ es gibt ein endliches T0 ⊆ T mit T0 |= σ ,
(ii) jedes endliche T0 ⊆ T hat ein Modell =⇒ T hat ein Modell.
(Trivialerweise gelten natürlich auch die jeweiligen Umkehrungen.)
Der Kompaktheitssatz ist aber ein rein modelltheoretischer Satz und soll später
auch mit modelltheoretischen Methoden bewiesen werden. Hier sei schon auf einige Anwendungen hingewiesen:
3.3. D ER KOMPAKTHEITSSATZ UND EINIGE F OLGERUNGEN
58
• Man kann zeigen, daß viele Theorien Modelle besitzen, an die man bei
der Axiomatisierung “eigentlich nicht gedacht” hat: Nicht-Standardmodelle
der P EANO-Arithmetik, die unendlich-große Zahlen besitzen, oder NichtArchimedisch angeordnete Körper.
• Einige Klassen von Modellen lassen sich (in der Sprache der Prädikatenlogik erster Stufe) nicht axiomatisch erfassen.
Um hierfür ein Beispiele zu erhalten, benutzen wir
Anzahlformeln
In der Sprache der Prädikatenlogik lassen sich allein mit Hilfe der Gleichheit Sätze
formulieren, die Aussagen über die Anzahl der Elemente einer Struktur machen
(explizite Angabe als Übungsaufgabe):
A |= ∃≥n
⇐⇒
A hat mindestens n Elemente,
A |= ∃≤n
⇐⇒
A hat höchstens n Elemente,
A |= ∃
⇐⇒
A hat genau n Elemente.
n
Die Menge der Sätze
Σ∞ := {∃≥n |n ∈ N}
hat also nur unendliche Modelle; dagegen kann man i. a. durch keine Menge von
Sätzen die Endlichkeit eines Modells erzwingen:
3.3.2 Satz über die Existenz unendlicher Modelle
T sei eine Theorie, die beliebig große endliche Modelle hat (d.h. für jede natürliche Zahl n hat T ein Modell mit mindestens n Elementen). Dann hat T auch ein
unendliches Modell.
Beweis: Nimm zur Theorie T die oben definierte Satzmenge Σ∞ hinzu und nenne
die erweiterte Theorie T0 . Dann gilt nach Voraussetzung über T:
jede endliche Teilmenge von T0 hat ein Modell,
also hat nach dem Kompaktheitssatz T0 selbst ein Modell, das dann Modell von T
ist und nicht endlich sein kann.
3.4. D IAGRAMME
59
3.4 Diagramme
Die Eigenschaften einer L-Struktur A werden durch ihre Theorie Th(A) beschrieben. Um auch die Eigenschaften anzugeben, die einzelne Elemente von A
besitzen, gehen wir wieder zur erweiterten Sprache LA über. A. ROBINSON hat
die (für die Modelltheorie wichtige) Methode der Diagramme eingeführt: Für eine
Menge H von L-Formeln ist das H-Diagramm von A die Menge der Sätze
• DH (A) := {ϕ(a1 , . . . , an ) | ϕ ∈ H, A |= ϕ[a1 , . . . , an ]}, speziell
• D+ (A) := DAt (A) das positive Diagramm von A
für H = At = Menge der atomaren L-Formeln,
• D(A) := DBa (A) das quantorenfreie (oder ROBINSON-)Diagramm von A,
für H = Ba = Menge der L-Formeln, welche atomar oder Negation einer
atomaren Formel sind (Basis-Formeln oder Literale),
• DL (A) = Th(AA ) das elementare Diagramm von A.
Das positive Diagramm kann man sich als eine Verallgemeinerung der Gruppentafel vorstellen; im Falle von (N, ·) enthält es das kleine und große Einmaleins:
0 · 0 = 0, 0 · 1 = 0, . . . , 1 · 1 = 1, · · · , 2 · 3 = 6, aber auch 2 · (5 · 3) = 30, (1 · 2) · 6 =
3 · 4, usw. (genauer immer mit n statt n geschrieben), das ROBINSON-Diagramm
enthält zusätzlich auch die Ungleichungen 1 · 4 6= 2, 3 · 2 6= 5, . . . Dagegen ist
Th(AA ), das elementare Diagramm von A, die umfangreichste Beschreibung der
Eigenschaften aller Elemente von A, die in der Struktur A gelten.
Offensichtlich ist AA ein Modell von D(A) und sogar von Th(AA ). Es ist leicht
zu sehen, daß für A ⊆ B auch die Struktur BA ein Modell von D(A) ist; allgemein
wird ein Modell von D(A) eine LA -Struktur der Form (B, (h(a))a∈A ) sein, wobei
h(a) = aB durchaus von a verschieden sein kann. Jedoch kann man in diesem Fall
A mit einer Substruktur von B identifizieren:
3.4.1 Diagrammlemma
Es sei A eine L-Struktur, (B, (aB )a∈A ) eine LA -Struktur und h : A −→ B definiert
durch h(a) = aB . Dann gilt:
(i) (B, (h(a))a∈A ) |= D(A) ⇐⇒ h : A −→ B ist eine Einbettung,
(ii) BA |= D(A) ⇐⇒ A ⊆ B, falls A ⊆ B.
60
3.4. D IAGRAMME
Beweis von (i): Wir schreiben kurz Bh für (B, (h(a))a∈A ) und nehmen an, daß
Bh |= D(A). Dann gilt für beliebige a, b ∈ A:
a 6= b ⇐⇒ a 6= b ∈ D(A)
Bh |= a 6= b nach Vor.
=⇒
⇐⇒ h(a) 6= h(b),
also ist h injektiv. Ähnlich im Falle der Relationszeichen:
RA (a1 , . . . , an ) ⇐⇒ R(a1 , . . . , an ) ∈ D(A)
Bh |= R(a1 , . . . , an ) nach Vor.
=⇒
⇐⇒ RB (h(a1 ), . . . , h(an )).
Das gleiche Argument für die Formel ¬R liefert die Umkehrung, also
RA (a1 , . . . , an ) ⇐⇒ RB (h(a1 ), . . . , h(an )),
und schließlich gilt auch für die Funktionszeichen:
f A (a1 , . . . , am ) = a ⇐⇒ f (a1 , . . . , an ) = a ∈ D(A)
=⇒
Bh |= f (a1 , . . . , an ) = a nach Vor.
B
⇐⇒ f (h(a1 ), . . . , h(an ) = h(a).
Mit denselben Argumenten zeigt man auch die umgekehrte Richtung von (i). 3.4.2 Universelle Theorien
ψ ist eine ∀-Formel (oder universell): ⇐⇒ ψ = ∀x1 . . . ∀xn ϕ
für eine quantorenfreie Formel ϕ,
ψ ist eine ∃-Formel (oder existentiell): ⇐⇒ ψ = ∃x1 . . . ∃xn ϕ
für eine quantorenfreie Formel ϕ.
Für eine Theorie T sei
T∀ := {σ | T |= σ , σ ein ∀-Satz}
der universelle Teil von T.
Eine Theorie T heiße Substruktur-abgeschlossen gdw
A ⊆ B |= T =⇒ A |= T.
61
3.4. D IAGRAMME
Allgemeiner nennt man eine Formel ϕ(x1 , . . . , xn ) Substruktur-persistent in T
(oder einfach T-persistent) gdw
für alle A, B |= T mit A ⊆ B und für alle a1 , . . . , an ∈ A gilt:
B |= ϕ[a1 , . . . , an ] =⇒ A |= ϕ[a1 , . . . , an ].
∀-Formeln bleiben offensichtlich gültig, wenn man den Grundbereich einschränkt (und entsprechend bleiben existentielle Formeln wahr unter Erweiterungen), sie sind also persistent. Es gilt aber auch die Umkehrung:
3.4.3 Modellerweiterungssatz von Keisler
Folgende Aussagen sind äquivalent für eine L-Theorie T:
(i) Es existiert ein Struktur B mit A ⊆ B und B |= T,
(ii) A |= T∀ .
Beweis von (i) ⇒ (ii):
Sei B mit A ⊆ B und B |= T. Dann ist auch B |= T∀ , und weil ∀-Sätze beim
Übergang zu Substrukturen erhalten bleiben, ist A |= T∀ .
(ii) ⇒ (i): Sei A |= T∀ . Wir behaupten, daß
T ∪ D(A)
ein Modell hat: Anderenfalls gäbe es nach dem Kompaktheitssatz eine endliche
Teilmenge ∆ ⊆ D(A), so daß T ∪ ∆ kein Modell hat. Es sei δ (a1 , . . . , an ) die Konjunktion der endlich-vielen Sätze in ∆, die dann in keinem Modell von T wahr
sein können, d. h. es gilt
T |= ¬δ (a1 , . . . , an ),
und da die Konstanten ai in der Sprache von T nicht vorkommen, nach dem Satz
über neue Konstanten 3.1.1 auch
T |= ∀x1 , . . . , xn ¬δ (x1 , . . . , xn ),
also ∀x1 , . . . , xn ¬δ (x1 , . . . , xn ) ∈ T∀ . Da nach Voraussetzung A |= T∀ , so:
A |= ∀x1 , . . . , xn ¬δ (x1 , . . . , xn ), insbesondere
A |= ¬δ [a1 , . . . , an ]
im Widerspruch zu ∆ ⊆ D(A)! Somit hat also D(A) ∪ T ein Modell, welches nach
dem Diagrammlemma 3.4.1 als Oberstruktur von A gewählt werden kann.
Als Korollare erhalten wir:
62
3.4. D IAGRAMME
3.4.4 Erhaltungssatz für universelle Formeln
Die folgenden Aussagen sind für einen Formel ϕ äquivalent:
(i) ϕ = ϕ(x1 , . . . , xn ) ist T-persistent,
(ii) es gibt eine universelle Formel ψ(x1 , . . . , xn ), die T-äquivalent zu ϕ ist, d. h.
T |= ϕ ↔ ψ.
Beweis von (i) ⇒ (ii): Wir nehmen zunächst an, daß ϕ ein Satz σ ist, welcher
T-persistent ist. Setze
Σ := {ϕ | ϕ universell, T + σ |= ϕ} = (T + σ )∀ .
Dann gilt
(∗) T ∪ Σ |= σ ,
denn ist A |= T ∪ Σ, so existiert nach dem Modellerweiterungssatz 3.4.3 ein B mit
A ⊆ B |= T + σ , also auch A |= σ nach (i).
Wegen (*) gibt es nach dem Kompaktheitssatz endlich-viele Sätze σ1 , . . . , σk ∈
Σ mit
T + σ1 ∧ . . . ∧ σk |= σ ,
und da auch umgekehrt T + σ |= σi für alle i = 1, . . . , k, so gilt
T |= σ ↔ σ1 ∧ . . . ∧ σk .
Die Konjunktion endlich-vieler universeller Sätze ist aber äquivalent zu einem
universellen Satz (s. im nächsten Kapitel den Abschnitt 4.5). Den allgemeinen
Fall einer Formel kann man auf den obigen Fall eines Satzes durch die Einführung
neuer Konstanten und den Übergang zum Satz ϕ(c1 , . . . , cn ) zurückführen.
3.4.5 Satz von Łoś-Tarski
T Substruktur-abgeschlossen ⇐⇒ Mod(T) = Mod(T∀ )
⇐⇒ T hat ein Axiomensystem aus T∀ -Sätzen.
63
3.5. E INIGE MATHEMATISCHE T HEORIEN
3.5 Einige mathematische Theorien
3.5.1 Ordnungen
Die Theorie LO der partiellen Ordnungen (Halbordnungen) wird in einer Sprache
mit einem 2-stelligen Relationszeichen < formuliert und hat folgende Axiome:
(L1) ∀x x 6< x
(L2) ∀x∀y∀z (x < y ∧ y < z → x < z)
irreflexiv
transitiv
Jede Menge A läßt sich partiell ordnen durch {x, y | x, y ∈ A∧x 6= y}, wobei alle
Elemente miteinander unvergleichbar sind. Dagegen erfüllen linearen Ordnungen
zusätzlich das Axiom
(L3) ∀x∀y (x < y ∨ x = y ∨ y < x)
connex
so daß alle Elemente miteinander vergleichbar sind. Da sich jede partielle Ordnung auf einer endlichen Menge zu einer linearen Ordnung erweitern läßt, folgt
mit Hilfe des Kompaktheitssatzes:
• Jede partielle Ordnung auf einer Menge läßt sich zu einer linearen Ordnung erweitern, insbesondere:
• jede Menge besitzt eine lineare Ordnung.
Dieses Ergebnis ist keineswegs trivial, so kann man z. B. für die Menge der
reellen Funktionen zwar eine partielle Ordnung leicht angeben, nicht aber eine
lineare Ordnung (zumindest nicht ohne besondere Zusatzaxiome). Der Kompaktheitssatz (und damit die Existenz linearer Ordnungen) folgt aus dem mengentheoretischen Auswahlaxiom (siehe 7.2), welches sogar die Existenz von Wohlordnungen auf beliebigen Mengen nach sich zieht: Eine Wohlordnung auf einer Menge A
ist eine lineare Ordnung, in welcher jede nicht-leere Teilmenge ein kleinstes Element besitzt (siehe 6.1.1). Diese Forderung ist nun nicht mehr als Eigenschaft 1.
Stufe (wobei also nur über die Elemente einer Menge quantifiziert wird) ausdrückbar, was sich leicht mit Hilfe des Kompaktheitssatzes zeigen läßt. Dagegen lassen
sich dichte Ordnungen axiomatisieren; die entsprechenden Theorien werden wir
gesondert in 9.2 behandeln.
3.5. E INIGE MATHEMATISCHE T HEORIEN
64
3.5.2 Gruppen- und Körpertheorie
1. Die Theorie der (A BELschen) Gruppen in der Sprache LG mit einem 2-stelligen
Funktionssymbol ◦, einem 1-stelligen Funktionssymbol −1 und der Individuenkonstanten e besitzt universelle Axiome und ist somit Substruktur-abgeschlossen.
Ist dagegen TAG die Theorie der A BELschen Gruppen in der Sprache mit nur einem 2-stelligen Funktionssymbol ◦, dann ist T∀ die Theorie der kommutativen
regulären Halbgruppen mit den Axiomen:
• ∀x∀y∀z x ◦ (y ◦ z) = (x ◦ y) ◦ z
(assoziativ)
• ∀x∀y x ◦ y = y ◦ x
(kommutativ)
• ∀x∀y∀z(x ◦ y = x ◦ z → y = z)
(Kürzungsregel)
In ähnlicher Weise ist für die Theorie TF der Körper (in der Sprache mit
+, ·, −, 0, 1) der universelle Teil (TF )∀ die Theorie der Integritätsbereiche.
2. Die Klasse der unendlichen Gruppen, Körper, . . . läßt sich mit Hilfe der (unendlichen) Satzmenge Σ∞ axiomatisieren, nicht aber die Klasse der endlichen Gruppen, der endlichen Körper, . . . (denn es gibt jeweils beliebig große endliche Gruppen und Körper, und eine Theorie dieser Modelle muß dann nach dem Satz 3.3.2
über die Existenz unendlicher Modelle notwendig ein unendliches Modell einschließen). Ähnliches gilt für die Theorie der Körper der Charakteristik 0 bzw.
endlicher Charakteristik:
Satz
L sei die Sprache der Theorie der Körper, σ ein Satz dieser Sprache.
Gilt σ in allen Körpern der Charakteristik 0 (bzw. in allen unendlichen Körpern),
so gibt es ein p, so daß σ in allen Körpern der Charakteristik ≥ p (bzw. in allen
Körpern mit mindestens p Elementen) gilt.
Beweis: Es sei TF die Theorie der Körper (F für englisch: field). Nimmt man den
Satz
χ p := |1 + 1 +
{z. . . + 1} = 0
p−mal
hinzu, welcher ausdrückt, daß die Charakteristik = p ist, so erhält man die Theorie
der Körper der Charakteristik p. Um die Theorie TF,0 der Körper der Charakteristik 0 zu erhalten, muß man TF ergänzen um die unendlich-vielen Aussagen
{¬χ p | p Primzahl}.
65
3.5. E INIGE MATHEMATISCHE T HEORIEN
Gilt nun σ in allen Körpern der Charakteristik 0, so TF,0 |= σ , also gibt es nach
dem Kompaktheitssatz ein endliches T0 ⊆ TF,0 mit T0 |= σ . T0 kann aber nur endlich viele der Aussagen ¬χ p enthalten, und daraus erhalten wir die Behauptung.
(Ähnlich im anderen Fall mit Anzahl- statt Charakteristik-Formeln.)
Mit modelltheoretischen Methoden lassen sich noch weitere Ergebnisse über
verschiedene algebraische Theorien erzielen, insbesondere die Entscheidbarkeit
der Theorie von (R, <, +, −, ·, 0, 1) (= Theorie der reell-abgeschlossenen Körper)
und der Theorie von (C, +, −, ·, 0, 1) (= Theorie der algebraisch-abgeschlossenen
Körper).
3.5.3 Axiomatisierbarkeit: Elementare Klassen
Ist K eine Klasse von L-Strukturen, so heißt
K elementar (EC-Klasse) :
⇐⇒
K = Mod(σ ) für einen Satz σ ,
K ∆-elementar (EC∆ -Klasse) :
⇐⇒
K = Mod(Γ) für eine Satzmenge Γ.
Eine EC-Klasse ist also eine Klasse von Strukturen, die sich durch einen einzelnen Satz (oder durch endlich-viele Sätze) axiomatisieren läßt, eine EC∆ -Klasse
ist Durchschnitt von EC-Klassen und läßt sich mittels einer Menge von Sätzen
axiomatisieren.
Beispiele
1. elementare Klassen sind:
• {G | G ist Gruppe} = Mod(σG ),
σG = Konjunktion der endlich-vielen Gruppenaxiome,
• {G | G ist kommutative Gruppe},
• {R | R ist Ring (kommutativ, mit 1)},
• {K | K ist Körper},
• {K | K ist Körper der Charakteristik p} (p fest; p Primzahl),
• {≤ | ≤ ist (partielle, lineare) Ordnung}.
2. ∆-elementare Klassen, aber keine elementaren Klassen sind:
• {G | G ist unendliche Gruppe} = Mod({σG } ∪ Σ∞ ),
3.5. E INIGE MATHEMATISCHE T HEORIEN
66
• {K | K ist unendlicher Körper},
• {K | K ist Körper der Charakteristik 0}.
3. nicht einmal ∆-elementare Klassen sind:
• {G | G ist endliche Gruppe},
• {G | G ist Torsions-Gruppe (alle Elemente haben endliche Ordnung)},
• {K | K ist endlicher Körper},
• {≤ | ≤ ist Wohlordnung}.
Die negativen Beispiele beruhen auf dem Kompaktheitssatz und dieser wiederum wesentlich auf der Eigenschaft von Beweisen, endlich zu sein. Geht man
zu erweiterten Logiken über, die etwa auch unendliche Konjunktionen und Disjunktionen zulassen, so kann man zwar wesentlich mehr ausdrücken, aber Beweise sind nun nicht mehr notwendig endlich, die erweiterte Logik ist nicht mehr
vollständig (bzw. nur in einem abgeschwächten Sinn), auch gelten die klassische
Sätze der Modelltheorie dann höchstens noch mit Einschränkungen.
3.5.4 Zahlentheorie
Während die algebraischen Theorien der Gruppen, Ringe, Körper, . . . sehr viele
Modelle besitzen, untersucht die Zahlentheorie Eigenschaften eines Modells, das
man das Standardmodell der Zahlentheorie nennt:
N = (N, +, ·,0 , 0).
LPA sei die zugehörige Sprache, für die wir auch +, ·, 0 als (nicht-logische) Symbole wählen, aber S für die 1-stellige Nachfolgeroperation. Die Theorie des Standardmodells, Th(N), ist die Menge der LPA -Sätze, die in diesem Modell gelten
- was sich zwar einfach definieren läßt, aber doch immer noch viele offene Fragen bereithält. Die wichtigsten Eigenschaften des Standardmodells werden zusammengefaßt als
Peano-Axiome:
P1 Sx 6= 0
P2 Sx = Sy → x = y
P3 x + 0 = x
3.5. E INIGE MATHEMATISCHE T HEORIEN
67
P4 x + Sy = S(x + y)
P5 x · 0 = 0
P6 x · Sy = x · y + x
sowie die unendlich-vielen Induktionsaxiome:
Ind ϕ(0) ∧ ∀x(ϕ(x) → ϕ(Sx)) → ∀x ϕ(x)
Die Theorie mit diesen Axiomen nennt man PA, die Peano-Arithmetik. Aus
dem Kompaktheitssatz folgt nun, daß diese Theorie Nicht-Standardmodelle besitzt, d. h. Modelle, die nicht isomorph zum Standardmodell sind, weil sie “unendlich-große” Zahlen besitzen:
Satz
Es gibt ein (abzählbares) Modell N∗ von PA, welches nicht-isomorph zu N ist.
(Tatsächlich gibt es - wie wir später zeigen werden - sogar in jeder unendlichen
Kardinalzahl ein Nicht-Standardmodell.)
Beweis: Erweitere die Sprache von PA um eine neue Konstante c für ein “unendlich-großes” Element und bilde die erweiterte Theorie
PA∗ := PA ∪ {c 6= 0, c 6= S0, c 6= SS0, . . .}.
Da es unendlich-viele natürliche Zahlen gibt, kann man endlich-viele der zusätzlichen Aussagen im Standardmodell erfüllen, indem man c als genügend große
Zahl wählt. Somit hat jede endliche Teiltheorie von PA∗ ein Modell, also gibt es
nach dem Kompaktheitssatz auch ein Modell N∗ |= PA∗ . Da N∗ die Axiome (P1)
und (P2) erfüllt, ist die Abbildung der Terme {0, S0, SS0, . . .} auf ihre Interpretationen in N∗ injektiv, so daß wir sie mit den “gewöhnlichen” natürlichen Zahlen
∗
identifizieren können. Dann hat aber N∗ noch das Element cN , welches von allen
“gewöhnlichen” natürlichen Zahlen verschieden sein muß (da nämlich N∗ auch
die neuen Axiome von PA∗ über c erfüllt).
Dasselbe Ergebnis erhalten wir auch, wenn wir die Theorie PA durch die Theorie des Standardmodells ersetzen; wieder gibt es ein nicht-isomorphes (abzählbares) Modell N∗ , welches aber alle Sätze erfüllt, die auch im Standardmodell
gelten. Ein solches Modell kann man nach A. ROBINSON benutzen, um eine
Nonstandard-Analyis aufzubauen, d. h. eine Theorie, in welcher alle Aussagen
3.5. E INIGE MATHEMATISCHE T HEORIEN
68
der “gewöhnlichen” reellen Zahlen gelten, in denen es aber noch zusätzlich “infinitesimal kleine” Zahlen gibt.
Mittels Aussagen in der Sprache LPA kann man daher das Standardmodell
nicht charakterisieren, offenbar ist also die Sprache der Prädikatenlogik nicht ausdrucksstark genug. Es liegt daher nahe, das Induktionsschema zu verstärken, indem man den Eigenschaftsbegriff erweitert, und zwar geht man über zu einer
Sprache 2. Stufe, in welcher man zusätzlich die Möglichkeit hat, mittels Quantoren 2. Stufe ∃P, ∀P über alle Teilmengen (statt nur über die Elemente) des jeweiligen Grundbereiches zu quantifizieren:
Peano-Axiome 2. Stufe
Die Theorie PA(2) (P EANO-Axiome 2. Stufe) besitzt folgende Axiome:
P1
∀x Sx 6= 0
P2
∀x∀y(Sx = Sy → x = y)
IND
∀P[P(0) ∧ ∀x(P(x) → P(Sx)) → ∀x P(x)]
Allerdings taucht nun ein neues Problem auf: Im Gegensatz zur gewöhnlichen
Logik der ersten Stufe gibt es für die Logik 2. Stufe kein vollständiges Axiomensystem (zumindest solange nicht, wie man verlangt, daß der Begriff eines Axioms
entscheidbar ist) und auch die meisten anderen Ergebnisse lassen sich nicht auf
die erweiterte Sprache übertragen (tatsächlich ist es ja gerade der Kompaktheitssatz, der zu Nichtstandardmodellen führt). Nun gibt es aber einen Ausweg: Wir
können die obigen Axiome mengentheoretisch deuten und werden zeigen (6.3.1),
daß im Rahmen der Mengenlehre das obige Axiomensystem genau ein Modell hat
bis auf Isomorphie, die Theorie also kategorisch ist in folgendem Sinn:
Jedes Modell von PA(2) ist isomorph zum Standardmodell (N,0 , 0).
Die Mengenlehre ihrerseits werden wir in der Sprache der Logik erster Stufe
axiomatisieren, so daß diese Theorie ihrerseits nicht kategorisch ist, also nichtisomorphe Modelle besitzt.
3.5. E INIGE MATHEMATISCHE T HEORIEN
69
3.5.5 Mengenlehre
Die Mengenlehre spielt (ähnlich wie die Zahlentheorie) in der Mathematischen
Logik eine besondere Rolle:
1. Als Grundlagentheorie stellt sie sämtliche Objekte, die in den einzelnen
mathematischen Disziplinen untersucht werden:
Zahlen, Funktionen, Operatoren, Relationen, Punkte, Räume . . .
unter dem einheitlichen Begriff der Menge dar, insbesondere haben wir
mengentheoretische Begriffsbildungen bei der Einführung des Strukturbegriffes (inhaltlich) bereits benutzt. Während syntaktische Begriffe auf zahlentheoretischer Grundlage eingeführt werden können2 , benötigt die Semantik der Prädikatenlogik bereits den allgemeinen Mengenbegriff; eine
geeignete Fassung der Mengenlehre gehört somit zur Metamathematik der
Prädikatenlogik.
2. Außerdem ist die Mengenlehre selbst eine formale mathematische Theorie
des Unendlichen (insbesondere der transfiniten Ordinal- und Kardinalzahlen). (Eine ausführlichere Darstellung folgt im Teil II.)
Beide Aspekte lassen sich nicht völlig voneinander trennen; insbesondere das
Auswahlaxiom (mit seinen vielen äquivalenten Fassungen) hat zahlreiche Anwendungen in fast allen mathematischen Gebieten (einschließlich der Mathematischen Logik), ist aber auch wichtig für die Entwicklung der Theorie der transfiniten Kardinalzahlen.
2 Darauf
werden wir bei der Behandlung der G ÖDELschen Unvollständigkeitssätze im Teil IV
genauer eingehen.
70
Kapitel 4
Gesetze der Prädikatenlogik
4.1 Ein Axiomensystem für die Prädikatenlogik
Wir haben gesehen, daß es für den aussagenlogischen Wahrheitsbegriff, ag[ϕ],
verschiedene Entscheidungsverfahren gibt und für endliche Formelmengen T der
aussagenlogische Folgerungsbegriff, T |= ϕ, entscheidbar ist, da man nur endlichviele Belegungen der Aussagenvariablen nachzuprüfen hat. Dagegen erfordert der
Wahrheitsbegriff |= ϕ (und ebenso der semantische Folgerungsbegriff T |= ϕ) der
Prädikatenlogik den Nachweis der Gültigkeit von ϕ in allen Strukturen der zugehörigen Sprache bzw. in allen Modellen von T, und hierzu hat man nicht nur
sehr viele Strukturen, sondern unter diesen i. a. auch noch unendliche Strukturen zu untersuchen, so daß wir in diesem Falle keine Entscheidbarkeit erwarten
können. Daher ist es von Bedeutung, daß es auch einen syntaktischen Beweisbegriff, T ` ϕ, gibt, welcher mit dem semantischen übereinstimmt (verallgemeinerter Vollständigkeits- und Korrektheitssatz). Damit erhalten wir zwar kein Entscheidungsverfahren, aber immerhin die Möglichkeit, alle Folgerungen aus einer
Theorie in standardisierter Weise aufzuzählen. Außerdem zeigt ein vollständiges
Axiomensystem mit seinen Axiomen und Regeln an, auf welche grundlegende
Prinzipien der Folgerungsbegriff zurückzuführen ist.
Beim Übergang von der Aussagenlogik zur Prädikatenlogik kommen zu den
aussagenlogischen Symbolen hinzu:
• atomare Formeln (anstelle der Aussagenvariablen),
• die Quantoren (wobei wir den ∀-Quantor mittels ∃ definieren) sowie
• die Gleichheit = (als 2-stelliges logisches Relationszeichen).
4.1. E IN A XIOMENSYSTEM F ÜR DIE P R ÄDIKATENLOGIK
71
Entsprechend werden die aussagenlogischen Axiome und Regeln ergänzt um zusätzliche Axiome und Regeln für die neuen logischen Symbole.
4.1.1 Axiomensystem von Shoenfield
Wie im Falle der Aussagenlogik gibt es verschiedene vollständige und korrekte Axiomensysteme für die Prädikatenlogik; wir wollen hier wieder ein spezielles Axiomensystem nach S HOENFIELD behandeln, dessen aussagenlogischen Teil
wir bereits in 1.5.3 (b) angegeben haben:
Axiome:
(1) aussagenlogische Axiome:
¬ϕ ∨ ϕ
(2) Substitutionsaxiome: ϕ[t/x] → ∃xϕ, falls t in ϕ substituierbar ist.
(3) Gleichheitsaxiome:
1. x = x
2. x1 = y1 ∧ . . . ∧ xm = ym → Fx1 . . . xm = Fy1 . . . ym
für jedes m-stellige Funktionszeichen F
3. x1 = y1 ∧ . . . ∧ xn = yn ∧ Rx1 . . . xn → Ry1 . . . yn
für jedes n-stellige Relationszeichen R
Das letzte Gleichheitsaxiom wird insbesondere auch für die 2-stellige Gleichheitsrelation gefordert!
Das Substitutionsaxiom besagt, daß man eine Existenzaussage nachweisen
kann, indem man ein Beispiel angibt.
Regeln:
Zu den uns bereits bekannten aussagenlogischen Regeln
Expansion:
Kürzung:
ψ
ϕ ∨ψ
ϕ ∨ϕ
ϕ
Assoziativität:
Schnitt:
ϕ ∨ (ψ ∨ δ )
(ϕ ∨ ψ) ∨ δ
ϕ ∨ ψ, ¬ϕ ∨ δ
ψ ∨δ
kommt eine Quantorenregel hinzu:
ϕ →ψ
∃-Einführung:
, falls x in ψ nicht frei vorkommt.
∃xϕ → ψ
4.1. E IN A XIOMENSYSTEM F ÜR DIE P R ÄDIKATENLOGIK
72
Bemerkungen
1. Die Regel der ∃-Einführung heißt auch Vordere Partikularisierung. Die angefügte Variablenbedingung ist notwendig, sonst würde man aus der beweisbaren Formel x = y → x = y durch ∃-Einführung die Formel ∃x(x = y) → x = y
und mit der beweisbaren Formel ∃x(x = y) auch die Formel x = y als beweisbar
erhalten, welche aber nicht wahr ist, da sie nur in 1-elementigen Strukturen gilt.
(Inhaltlich kann man auch so argumentieren: Es gilt x = 3 → x ist Primzahl, aber
nicht ∃x(x = 3) → x ist Primzahl!)
2. Wo benutzt man die ∃-Einführung? Nehmen wir an, daß wir in einem Beweis
zu der Aussage ϕ(x) → ψ gelangt sind. Um hieraus die Aussage ψ zu erhalten,
brauchen wir - wenn ψ von der Wahl eines x nicht abhängt (formal: wenn x in ψ
nicht frei vorkommt) - nur zu versuchen, die Voraussetzung ϕ(x) für (mindestens)
ein x nachzuweisen (formal: die Aussage ∃xϕ(x) zu beweisen). Dann können wir
nämlich mittels ∃-Einführung und modus ponens tatsächlich die gewünschte Aussage ψ erhalten.
Den Beweisbegriff für ein Axiomensystem der Prädikatenlogik (wie das oben
angegebene System von S HOENFIELD) können wir wörtlich vom Aussagenkalkül
übernehmen:
4.1.2 Definition eines Beweises
Ein Beweis von ϕ aus T ist eine endliche Folge (ϕ1 , . . . , ϕn ) von Formeln, so daß
(B1) ϕn = ϕ,
(B2) für jedes m ≤ n gilt:
(1) ϕm ist Axiom oder
(2) ϕm ist Formel aus T oder
(3) es gibt ein i < m, so daß ϕm aus ϕi hervorgeht durch Anwendung einer
Regel oder
(4) es gibt i, j < m, so daß ϕm aus ϕi und ϕ j hervorgeht durch Anwendung
einer Regel mit 2 Prämissen.
Wir schreiben wieder:
T ` ϕ : ⇐⇒ es gibt einen Beweis von ϕ aus T
` ϕ : ⇐⇒ 0/ ` ϕ
ϕ ist aus T beweisbar,
ϕ ist beweisbar.
73
4.2. D ER TAUTOLOGIESATZ
Bemerkung
Die Beweisbarkeit läßt sich auch rekursiv wie folgt charakterisieren:
(S1) Jedes logische Axiom und jedes Axiom von T sind aus T beweisbar.
(S2) Ist die Prämisse (bzw. sind die Prämissen) einer Regel aus T beweisbar, so
auch ihre Konklusion.
Satz über die Verallgemeinerte Korrektheit
T ` ϕ =⇒ T |= ϕ
Beweisskizze: Es sei A |= T. Zeige
(∗) T ` ϕ =⇒ A |= ϕ
durch Induktion gemäß der induktiven Definition (S1), (S2):
1. ϕ ist logisches Axiom. Zeige, daß dann A |= ϕ.
2. ϕ ist Axiom von T. Dann gilt die Beh. (*) offenbar wegen A |= T.
3. ϕ ist Konklusion einer Regel, deren Prämisse(n) aus T beweisbar ist (sind).
Gehe die einzelnen Regeln durch und zeige, daß sich Gültigkeit in A von den
Prämissen auf die Konklusion vererbt.
4.2 Der Tautologiesatz
Hier wollen wir erläutern, in welcher Weise das Axiomensystem von S HOEN FIELD die Aussagenlogik enthält und “aussagenlogisch vollständig” ist (Tautologiesatz):
Den Grundbestandteilen der aussagenlogischen Sprache, also den Aussagenvariablen, entsprechen in der prädikatenlogischen Sprache die atomaren Formeln
(Primformeln), während die aussagenlogischen Operationen hier selbst wieder
vorkommen. Andererseits gibt es prädikatenlogische Formeln, die nicht atomar,
aber auch aussagenlogisch nicht weiter zerlegbar sind; diese werden zusammen
mit den atomaren Formeln elementar genannt:
74
4.2. D ER TAUTOLOGIESATZ
Definition einer Tautologie
ϕ elementar : ⇐⇒ ϕ atomar oder beginnt mit dem Quantor ∃.
B Bewertung von L : ⇐⇒ B : {ϕ | ϕ elementare L-Formel} −→ {W, F}.
Die Bewertungen der elementaren Formeln treten an die Stelle der Belegungen f der Aussagenvariable in der Aussagenlogik; ebenso wie sich diese (mittels
der Wahrheitstafeln) fortsetzen lassen zum Wahrheitswert f (ϕ) einer aussagenlogischen Formel ϕ, können wir jede Bewertung B fortsetzen zu einer Abbildung
B : {ϕ | ϕ L-Formel} −→ {W, F}
durch die Festlegungen
B(¬ϕ) = W
⇐⇒
B(ϕ) = F,
B(ϕ ∨ ψ) = W
⇐⇒
B(ϕ) = W oder B(ψ) = W.
An die Stelle der entsprechenden semantischen Begriffe der Aussagenlogik
treten nun die folgenden:
|=AL ϕ: ⇐⇒ (B(ϕ) = W für alle Bewertungen B)
ϕ ist Tautologie,
T |=AL ϕ: ⇐⇒ (B(ϕ) = W für alle Bew. B, für die B(ψ) = W für alle ψ ∈ T)
ϕ ist tautologische Folgerung aus T.
Beispiele
Tautologien sind: ϕ ∨ ¬ϕ, ϕ ∨ ψ ↔ ψ ∨ ϕ, nicht aber (obwohl wahre Aussagen):
x = x, x = y → y = x, ∃x(x = x); tatsächlich sind die letzten Formeln nicht aussagenlogisch, sondern erst prädikatenlogisch wahr (als elementare Formeln könnten
sie einfach mit F belegt werden).
Tautologiesatz
(i) Falls T ` ϕ1 , . . . , ϕn und ϕ1 , . . . , ϕn |=AL ϕ, so T ` ϕ,
(ii) falls T endlich und T |=AL ϕ, so T ` ϕ,
(iii) falls |=AL ϕ, so ` ϕ, und somit T ` ϕ für jede Tautologie ϕ.
Beweis: Offensichtlich folgt (i) aus (ii) , und (ii) folgt aus (iii): Sei
4.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
T = {ϕ1 , . . . , ϕn } und T |=AL ϕ,
ϕ1 , . . . , ϕn |=AL ϕ.
|=AL ϕ1 → . . . → ϕn → ϕ,
` ϕ1 → . . . → ϕn → ϕ
ϕ1 , . . . , ϕn ` ϕ.
75
also
Dann gilt auch
also nach (iii)
und daraus mit modus ponens auch
Somit bleibt nur (iii), d.h. die einfache Vollständigkeit des aussagenlogischen
Teils, zu beweisen. Dazu geht man wie beim Beweis des Vollständigkeitssatzes
für die Aussagenlogik vor und erhält
|=AL ϕ =⇒|= Aϕ ,
wobei Aϕ die aussagenlogische Formel ist, die aus ϕ entsteht, indem man die
elementaren Formeln ϕ1 , . . . , ϕn durch Aussagenvariable A1 , . . . , An ersetzt. Der
Vollständigkeitssatz für die Aussagenlogik ergibt nun ` Aϕ , und aus einem aussagenlogischen Beweis von Aϕ erhält man einen (prädikatenlogischen) Beweis von
ϕ, indem man in diesem Beweis nun umgekehrt die Aussagenvariable A1 , . . . , An
durch die elementaren Formeln ϕ1 , . . . , ϕn ersetzt.
Aufgrund der Aussage (i) des Tautologiesatzes können wir somit aussagenlogische Argumente (präziser: tautologische Folgerungen) in prädikatenlogische
Folgerungen übernehmen, wovon wir im folgenden häufig stillschweigend Gebrauch machen werden.
4.3 Substitution und universeller Abschluß
Den ∀-Quantor haben wir definiert durch
∀xϕ ↔ ¬∃x¬ϕ, somit gilt auch
∃xϕ
↔ ¬∀x¬ϕ
und
¬∀xϕ
↔ ∃x¬ϕ
und
¬∃xϕ
↔ ∀x¬ϕ.
Die folgenden Sätze bezeichnen ableitbare Regeln bzw. beweisbare Formeln,
die somit bei Beweisen verwendet werden können:
76
4.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
4.3.1 Hintere Generalisierung
ϕ → ψ ` ϕ → ∀xψ,
falls x in ϕ nicht frei vorkommt (Variablen-Bedingung).
Beweis:
(1)
ϕ →ψ
(2)
¬ψ → ¬ϕ
Voraussetzung
tautologisch aus (1)
(3) ∃x¬ψ → ¬ϕ
mit ∃-Einführung (die Var.bedingung ist erfüllt!)
(4) ϕ → ¬∃x¬ψ
tautologisch aus (3)
ϕ → ∀xψ
nach Definition des ∀-Quantors
Diese Regel läßt sich in folgendem Fall anwenden:
Zu beweisen sei die Aussage ϕ → ∀xψ.
Dazu setzen wir ϕ voraus und zeigen die Behauptung ∀xψ wie folgt:
Sei “x beliebig” (das heißt inhaltlich: wir dürfen kein x wählen, für das
ϕ bereits eine besondere Eigenschaft festlegt - wie z. B. “x ist Primzahl”
oder “x ist das größte Element”, formal haben wir die Bedingung, daß x
nicht frei in ϕ vorkommt). Können wir damit ψ(x) beweisen, so haben
wir nach der obigen Regel die Aussage ϕ → ∀xψ gezeigt.
4.3.2 Satz über die Generalisierung
ϕ ` ∀xϕ
Beweis :
(1)
ϕ
(2)
¬∀xϕ → ϕ
(3) ¬∀xϕ → ∀xϕ
(4)
∀xϕ
Voraussetzung
tautologisch: Abschwächung von (1)
mit ∀-Einführung (die Var.bedingumg ist erfüllt!)
tautologisch aus (3)
Das bedeutet also:
Um ∀xϕ(x) aus T zu beweisen, genügt es ϕ(x) (für ein “beliebiges x”)
aus T herzuleiten.
4.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
77
4.3.3 Substitutionsregel
ϕ(x1 , . . . , xn ) ` ϕ(t1 , . . . ,tn )
Beweis durch Induktion nach n:
n = 1:
(1)
ϕ
Voraussetzung
∀x1 ϕ d.h. ¬∃x1 ¬ϕ
Generalisierung
(2) ¬ϕ[t1 /x1 ] → ∃x1 ¬ϕ
Substitutionsaxiom
(3) ¬∃x1 ¬ϕ → ϕ[t1 /x1 ]
tautologisch aus (2)
ϕ[t1 /x1 ]
aus (1) und (3) mit modus ponens
n ≥ 1: Setze ϕ 0 = ϕ[t1 /x1 , . . . ,tn /xn ] und wähle n neue Variable y1 , . . . , yn , die
weder in ϕ noch in ϕ 0 vorkommen. (Dadurch erreichen wir, daß für die neuen
Variablen die hintereinander ausgeführte Substitution mit der simultanen Substitution übereinstimmt.)
Wenden wir nun den Fall n = 1 sukzessive an, so erhalten wir aus ϕ:
ϕ[y1 /x1 ], ϕ[y1 /x1 , y2 /x2 ], . . . , ϕ[y1 /x1 , . . . , yn /xn ]
und ebenso aus dem Fall n = 1:
ϕ[y1 /x1 , . . . , yn /xn ][t1 /y1 ] = ϕ[t1 /x1 , . . . , yn /xn ],
ϕ[t1 /x1 ,t2 /x2 , . . . , yn /xn ], . . . , ϕ[t1 /x1 ,t2 /x2 . . . ,tn /xn ].
Die Bedeutung ist klar: Unter der Annahme ϕ(x1 , . . . , xn ) gilt diese Aussage
generell (Generalisierung), also insbesondere für beliebige (substituierbare) Terme (wobei diese wiederum neue Variable einführen können). - Als Verallgemeinerung des Substitutionsaxioms erhalten wir (zusammen mit seiner dualen Fassung
(ii)):
4.3.4 Substitutionssatz
(i) ϕ[t1 /x1 , . . . ,tn /xn ] → ∃x1 . . . ∃xn ϕ
(ii) ∀x1 . . . ∀xn ϕ → ϕ[t1 /x1 , . . . ,tn /xn ]
4.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
78
(In beiden Fällen sei vorausgesetzt, daß t1 , . . . ,tn für x1 , . . . , xn in ϕ substituierbar
sind.)
Beweis von (i): Aus den Substitutionsaxiomen folgt durch mehrfache Anwendung:
ϕ → ∃xn ϕ
∃xi−1 . . . ∃xn → ∃xi ∃xi−1 . . . ∃xn ϕ
ϕ → ∃x1 . . . ∃xn ϕ
und daraus folgt die Behauptung mit der Substitutionsregel.
(ii) beweist man analog (oder durch Kontraposition aus (i)).
Beachte, daß die Umkehrungen von (i) und (ii), ϕ(t1 , . . . ,tn ) → ∀x1 . . . ∀xn ϕ,
nicht wahr sind! (Was für bestimmte Objekte gilt, gilt nicht für beliebige: quod
licet iovi...!)
Distributionsregel
ϕ → ψ ` ∃xϕ → ∃xψ
ϕ → ψ ` ∀xϕ → ∀xψ
Beweis:
(1)
ϕ →ψ
(2) ψ → ∃xψ
ϕ → ∃xψ
Voraussetzung
Substitutionssatz
tautologisch aus (1), (2)
∃xϕ → ∃xψ mit ∃-Einführung (die Variablenbedingung ist erfüllt!)
Den zweiten Teil beweist man analog (“dual”).
Bereits früher hatten wir für eine Formel ϕ = ϕ(x1 , . . . , xn ) mit x1 , . . . , xn als
frei vorkommenden Variablen definiert:
∀x1 . . . ∀xn ϕ
der (universelle) Abschluß von ϕ.
Dieser ist immer ein Satz (d. h. eine Formel ohne frei vorkommende Variable).
4.4. E RSETZUNG UND U MBENENNUNG , G LEICHHEIT
79
4.3.5 Abschlußsatz
Ist ϕ ∀ der universelle Abschluß von ϕ, so sind beide deduktionsgleich:
T ` ϕ ⇐⇒ T ` ϕ ∀ .
Beweis: Benutze die Generalisierungsregel bzw. den Substitutionssatz.
Somit ist es gleichbedeutend, aus einer Theorie T eine Formel ϕ(x, y, . . .) oder
ihren universellen Abschluß ∀x∀y ϕ(x, y, . . .) zu beweisen:
∀x∀y ϕ(x, y, . . .) folgt aus T gdw ϕ(x, y, . . .) für “beliebige” x, y aus T folgt.
4.4 Ersetzung und Umbenennung, Gleichheit
Wie in der Aussagenlogik gilt auch hier, daß der Wahrheitswert einer Formel sich
nicht ändert, wenn man innerhalb der Formel eine Teilformel durch eine andere
mit gleichem Wahrheitswert ersetzt. Hier zeigen wir das syntaktische Gegenstück:
Ersetzt man innerhalb einer Formel ϕ eine Teilformel durch eine äquivalente,
so erhält man wiederum eine zu ϕ äquivalente Formel. (Dabei braucht man die
erwähnte Teilformel natürlich nicht überall zu ersetzen.)
4.4.1 Ersetzungstheorem
Es gelte T ` ψi ↔ ψi0 für i = 1, . . . n, und die Formel ϕ 0 entstehe aus ϕ, indem in
ϕ einige (oder alle) Teilformeln der Form ψi durch ψi0 ersetzt werden. Dann gilt
auch T ` ϕ ↔ ϕ 0 .
Beweis durch Induktion über den logischen Aufbau von ϕ.
Satz (Umbenennung von gebundenen Variablen)
Falls die Variable y in ψ nicht vorkommt:
` ∃xψ ↔ ∃yψ[y/x]
4.4. E RSETZUNG UND U MBENENNUNG , G LEICHHEIT
80
Beweis:
(1)
ψ[y/x] → ∃xψ
(2) ∃yψ[y/x] → ∃xψ
(3)
ψ → ∃yψ[y/x]
(4) ∃xψ → ∃yψ[y/x]
Substitutionsaxiom
∃-Einführung in (1). Außerdem
Substitutionsaxiom
∃-Einführung in (3)
Dabei liegt in (3) eine Anwendung des Substitutionsaxioms auf die Formel ψ[y/x]
vor, wobei ψ[y/x][x/y] wieder die Formel ψ ergibt, da x nicht in ψ vorkommt.
Dagegen wird in (2) nur benötigt, daß x nicht frei in ψ vorkommt.
Beispiel für die Notwendigkeit der Variablenbedingung:
Es sei ψ = ∃y(y 6= x). Dann ist nicht allgemeingültig (und damit auch nicht beweisbar):
∃x∃y(y 6= x) ↔ ∃y∃y(y 6= y).
Tatsächlich ist hier ψ[y/x][x/y] = ∃y(y 6= y) 6= ψ.
Wir werden jetzt häufig der Einfachheit halber, soweit kein Mißverständnis zu
befürchten ist, ϕ(t1 , . . . ,tn ) statt ϕ[t1 /x1 , . . . ,tn /xn ] schreiben.
Definition
Die Formel ϕ ∗ entsteht aus der Formel ϕ durch Umbenennung von gebundenen
Variablen gdw in ϕ Teilformeln der Form ∃xψ(x) durch ∃yψ(y) ersetzt werden
(wobei y natürlich eine neue Variable ist, die in ∃xψ(x) nicht vorkommt).
Satz (Gebundene Umbenennung)
Falls ϕ ∗ aus der Formel ϕ durch Umbenennung von gebundenen Variablen entsteht, so erhält man eine äquivalente Formel:
` ϕ ↔ ϕ∗
4.4.2 Eigenschaften des Gleichheitsprädikates
Zum Schluß behandeln wir noch Aussagen über die Gleichheit: In den Axiomen
kommt an erster Stelle zwar nur die Reflexivität der Gleichheit vor, die übrigen
4.4. E RSETZUNG UND U MBENENNUNG , G LEICHHEIT
81
Eigenschaften sind aber in dem dritten Schema enthalten, in welchem die Relation
R auch das Gleichheitszeichen sein darf, so daß sich hier auch die Transitivität
der Gleichheit versteckt. Es fehlt für eine Äquivalenzrelation somit nur noch die
Symmetrie:
Lemma
`s=t ↔t =s
Beweis:
(1)
x=x
Gleichheitsaxiom
(2) x = y ∧ x = x ∧ x = x → y = x
Gleichheitsaxiom mit Rx1 x2 als x1 = x2
(3)
x=y→y=x
tautologisch aus (1), (2)
(4)
s=t →t =s
Substitutionsregel aus (3), ebenso
(5)
t =s→s=t
Prinzip der Nichtunterscheidbarkeit
(i) s0 entstehe aus s durch Ersetzung einiger (oder aller) Teilterme ti durch ti0 .
Dann gilt:
` t1 = t10 ∧ . . . ∧ tn = tn0 → s = s0 .
(ii) ti und ti0 seien Terme, die in ϕ substituierbar seien. Dann gilt:
` t1 = t10 ∧ . . . ∧ tn = tn0 → (ϕ(t1 , . . . ,tn ) ↔ ϕ(t10 , . . . ,tn0 )).
Beweis: Wegen der Substitutionsregel brauchen wir (i) und (ii) nur für Variable
xi , yi statt der Terme ti ,ti0 zu beweisen. (i) beweist man durch Induktion über den
Aufbau von s (mit Hilfe der Gleichheitsaxiome), (ii) ähnlich durch Induktion über
den Formelaufbau von ϕ.
Das ist das wichtigste Ergebnis über die Gleichheit (in einfachster Form bereits in den Gleichheitsaxiomen enthalten): Im mathematischen Gebrauch (und
nicht nur hier) ist die Gleichheitsbeziehung fast niemals die reine Identität (etwa
im Sinne der syntaktischen Gleichheit), sondern stets nur eine Äquivalenzrelation
und zusätzlich eine Kongruenzrelation bezüglich der Grundbegriffe der jeweiligen
Theorie.
82
4.5. P R ÄNEXE N ORMALFORMEN
4.5 Pränexe Normalformen
Wir setzen unsere Untersuchungen fort mit weiteren Gesetzen über Quantoren,
die u. a. dazu führen, pränexe Nomalformen zu erhalten, in welchen alle Quantoren am Anfang der Formel (als Präfix) stehen. In der Aussagenlogik konnten wir
konjunktive und disjunktive Normalformen z. B. für Entscheidungsfragen benutzen; eine entsprechende Anwendung fehlt in der Prädikatenlogik, da diese unentscheidbar ist. Man kann aber pränexe Normalformen zur Klassifikation der Kompliziertheit benutzen (so wie man ein Polynom nach seinem Grad klassifizieren
kann) und z. B. zeigen,
1. daß Formeln mit einem bestimmten Präfix noch entscheidbar, ab einem bestimmten Grad der Komplexität aber unentscheidbar sind,
2. Formeln aufgrund ihres Präfixes bestimmte modelltheoretische Eigenschaften haben.
3. Die Bedeutung der Quantorenreihenfolge am Anfang tritt außerdem offen
zutage, wenn man etwa Eigenschaften der Stetigkeit mit derjenigen der
gleichmäßigen Stetigkeit vergleicht, oder die Existenz eines größten Elementes: ∃x∀y(y < x) mit der Aussage, daß zu jedem Element ein größeres
existiert: ∀y∃x(y < x).
Aus der Definition des ∀-Quantors mittels des ∃-Quantors ergibt sich:
4.5.1 Umformungen mit der Negation
(i)
` ¬∀xϕ ↔ ∃x¬ϕ
(ii)
` ¬∃xϕ ↔ ∀x¬ϕ
4.5.2 Umformungen mit Konjunktion und Disjunktion
Falls x in ψ nicht frei vorkommt und Q den ∃- oder ∀-Quantor bezeichnet:
(i)
` Qxϕ ∨ ψ ↔ Qx(ϕ ∨ ψ)
(ii)
` ψ ∨ Qxϕ ↔ Qx(ψ ∨ ϕ)
Ähnliche Aussagen gelten, wenn auf beiden Seiten ∨ durch ∧ ersetzt wird.
83
4.5. P R ÄNEXE N ORMALFORMEN
Beweis: Wir zeigen nur (i):
(1)
ψ → ϕ ∨ψ
(2)
ϕ ∨ ψ → ∃x(ϕ ∨ ψ)
(3)
ψ → ∃x(ϕ ∨ ψ)
(4)
ϕ → ϕ ∨ψ
(5)
∃xϕ → ∃x(ϕ ∨ ψ)
Tautologie
Substitutionsaxiom
tautologisch aus (1), (2) , ebenso
Tautologie
Distributionsregel, angewandt auf (4)
(6) ∃xϕ ∨ ψ → ∃x(ϕ ∨ ψ). tautologisch aus (3), (5). Für die Umkehrung:
(7)
ϕ → ∃xϕ
Substitutionsaxiom, daraus
(8)
ϕ ∨ ψ → ∃xϕ ∨ ψ
als tautologische Folgerung
(9) ∃x(ϕ ∨ ψ) → ∃xϕ ∨ ψ
mit ∃-Einführung (x nicht frei in ϕ)
4.5.3 Umformungen mit der Implikation
Falls x in ψ nicht frei vorkommt:
(i)
` (∀xϕ → ψ) ↔ ∃x(ϕ → ψ)
(ii)
` (ψ → ∀xϕ) ↔ ∀x(ψ → ϕ)
(iii)
` (∃xϕ → ψ) ↔ ∀x(ϕ → ψ)
(iv)
` (ψ → ∃xϕ) ↔ ∃x(ψ → ϕ)
Diese Ergebnisse kann man auf die früheren zurückführen, indem man die
Äquivalenz (ϕ → ψ) ↔ (¬ϕ ∨ ψ) benutzt. Dadurch wird zugleich auch deutlich,
warum in (i) und (iii) die Quantoren wechseln: die linke Seite des → erhält bei
der Umformung ein ¬-Zeichen! Die folgenden Äquivalenzen kann man sich als eine Art Assoziativgesetz merken, wenn man den ∃-Quantor als verallgemeinertes ∨, den ∀-Quantor als verallgemeinertes ∧ auffaßt:
Lemma
(i)
` ∃x(ϕ ∨ ψ) ↔ ∃xϕ ∨ ∃xψ
(ii)
` ∀xϕ ∧ ∀xψ ↔ ∀x(ϕ ∧ ψ)
Die folgenden Ergebnisse gelten auch ohne Variablenbedingung, dafür i. a.
aber nur in jeweils einer Richtung:
84
4.5. P R ÄNEXE N ORMALFORMEN
Lemma
` ∀xϕ → ∃xϕ
` ∃x(ϕ ∧ ψ) → ∃xϕ ∧ ∃xψ
` (∀xϕ ∨ ∀xψ) → ∀x(ϕ ∨ ψ)
` (∃xϕ → ∃xψ) → ∃x(ϕ → ψ)
` ∀x(ϕ → ψ) → (∀xϕ → ∀xψ)
Definition (pränex)
ϕ heißt offen gdw ϕ keine Quantoren enthält, ϕ heißt pränex gdw ϕ offen ist
oder von der Form
Q1 x1 . . . Qn xn ψ
mit ψ offen, Qi ein Quantor (∃ oder ∀). Dabei heißt der Quantorenblock
Q1 x1 . . . Qn xn das Präfix von ϕ, ψ die Matrix von ϕ.
Satz über die pränexe Normalform
Zu jeder Formel ϕ (ausgedrückt mit ¬, ∨, ∧, →, ↔, ∃, ∀) existiert eine pränexe
Formel ϕ p mit
` ϕ ↔ ϕ p.
ϕ p heißt (eine) pränexe Normalform von ϕ.
Den Beweis führt man durch Induktion über den Aufbau der Formel ϕ. Wir
wollen stattdessen skizzieren, wie man eine pränexe Normalform konkret erhält:
Gegeben sei eine Formel ϕ, von der wir annehmen können, daß sie außer den
Quantoren nur die B OOLEschen Operationen ¬, ∨, ∧ enthält.
(1) Mit Hilfe von 4.5.1 und den entsprechenden aussagenlogischen Umformungen bringe man in ϕ das ¬-Zeichen so weit nach innen, bis es höchstens
vor atomaren Formeln steht; das Ergebnis ist eine äquivalente Formel ϕ n
(Negations-Normalform).
(2) Bringe den in ϕ n am weitesten links stehenden Quantor (u. U. nach geeigneter Umbenennung) an den Anfang der Formel und erstrecke seinen
85
4.5. P R ÄNEXE N ORMALFORMEN
Wirkungsbereich auf die ganze Formel; benutze dazu die folgenden Äquivalenzen (aus den vorhergehenden Lemmata):
∀vϕ(v) ∧ θ
∀vϕ(v) ∨ θ
↔ ∀v(ϕ(v) ∧ θ )
falls v nicht in θ
↔ ∀v(ϕ(v) ∧ θ 0 (v))
falls θ = ∀vθ 0 (v)
↔ ∀v(ϕ(v) ∨ θ )
falls v nicht in θ
↔ ∀z(ϕ(z) ∨ θ )
mit geeignetem z
Die Umbenennung der Variablen v in eine geeignete neue Variable z kann man
natürlich immer vornehmen; die vorhergehenden Umformungen sind - soweit
möglich - jedoch vorzuziehen, um die neue Formel nicht unnötig kompliziert zu
machen.
Auf ähnliche Weise verfahre man im Falle eines ∃-Quantors. Damit erhalten
wir eine zu ϕ n äquivalente Formel ϕ 0 der Form Qvδ . Bringt man dann in gleicher
Weise die in δ vorkommenden Quantoren “an den Anfang”, so erhält man als
Endergebnis eine pränexe Formel ϕ p , die zu ϕ äquivalent ist.
Bemerkung:
Wie im Falle der konjunktiven bzw. disjunktiven Normalform ist eine pränexe
Normalform niemals eindeutig bestimmt (trotzdem spricht man häufig von der
pränexen Normalform, da zumindest alle untereinander äquivalent sind).
4.5.4 Das Dualitätsprinzip für die Prädikatenlogik
Wir setzen hier voraus, daß die Formeln (außer den Quantoren) wieder nur die
B OOLEschen Operationen ¬, ∨, ∧ enthalten. Dann definiert man in Verallgemeinerung des aussagenlogischen Falles:
D(ϕ) :
vertausche in ϕ ∨ mit ∧ und ∃ mit ∀ : duale Formel zu ϕ,
N(ϕ) :
setze vor jede atomare Formel in ϕ ein ¬-Zeichen,
∗
N (ϕ) :
setze vor jede atomare Formel in ϕ ein ¬-Zeichen, falls dort
keines steht, sonst streiche es!
Beispiel:
Es sei
ϕ = ∀x(P(x) → ∃yR(y, x)), d. h. nach Elimination von →:
ϕ ↔ ∀x(¬P(x) ∨ ∃yR(y, x)).
86
4.5. P R ÄNEXE N ORMALFORMEN
Dann ist
D(ϕ) = ∃x(¬P(x) ∧ ∀yR(y, x))
N(ϕ) = ∀x(¬¬P(x) ∨ ∃y¬R(y, x))
N ∗ (ϕ) = ∀x(P(x) ∨ ∃y¬R(y, x))
DN ∗ (ϕ) = ∃x(P(x) ∧ ∀y¬R(y, x))
Ähnlich wie in der Aussagenlogik erhält man (hier in syntaktischer Form):
Satz
a) ` ¬ϕ ↔ D(N ∗ (ϕ))
b) ` (ϕ ↔ ψ) ⇐⇒ ` (Dϕ ↔ Dψ)
Bildung der Negation
Dualitätssatz
Beschränkte Quantoren
Man kann diese Ergebnisse auch auf beschränkte Quantoren erweitern: Ist
ϕ
= ∀x(P(x) → ψ(x)), d. h.
↔ ∀x(¬P(x) ∨ ψ(x)), so ist
¬ϕ ↔ ∃x(P(x) ∧ ¬ψ(x)).
d. h. die beschränkten Quantoren
∀x(P(x) → . . .) und
∃x(P(x) ∧ . . .)
sind dual zueinander.
Besonders häufig kommt ein derartiger Quantor in der Analysis vor als
∀ε > 0 ψ :↔ ∀ε (ε > 0 → ψ)
Mit Hilfe des obigen Satzes lassen sich also Aussagen der folgenden Form
leicht negieren:
¬∀x ∀ε > 0 ∃δ > 0 ψ ↔ ∃x ∃ε > 0 ∀δ > 0 ¬ψ.
4.6. DAS D EDUKTIONSTHEOREM
87
4.6 Das Deduktionstheorem
Beim Beweisen steht man oft vor der folgenden Aufgabe: In einer Theorie T soll
eine Implikation der Form ϕ → ψ gezeigt werden. Dazu benutzt man das folgende
Argument:
“Vorausgesetzt sei ϕ. Dann . . . (hier folgt der Beweis mit den zusätzlichen
Annahmen aus T) . . . : ψ. Also haben wir T ` ϕ → ψ gezeigt.”
Das Deduktionstheorem rechtfertigt dieses Argument, falls eine wichtige Einschränkung beachtet wird:
Deduktionstheorem
T[σ ] sei die Theorie T mit σ als zusätzlichem Axiom und σ ein Satz. Dann gilt:
T ` σ → ψ ⇐⇒ T[σ ] ` ψ
Der Beweis von “⇒” ist trivial und macht nur vom modus ponens Gebrauch:
Es gelte T ` σ → ψ, dann offensichtlich also auch T[σ ] ` σ → ψ. Da ferner
T[σ ] ` σ , so mit modus ponens T[σ ] ` ψ.
Der Teil “⇐” ist interessanter und auch weniger trivial: Beim Beweis von ψ
aus T[σ ] könnte das Zusatzaxiom σ an mehreren Stellen benutzt worden sein!
Wir werden zeigen, daß man aus einem Beweis von ψ aus T[σ ] (mit leichten
Modifikationen) einen Beweis von σ → ψ aus T erhält, indem man im ersten
Beweis jede Beweiszeile δ durch σ → δ ersetzt, wobei das Zusatzaxiom σ in die
beweisbare Formel σ → σ übergeht und damit entbehrlich wird. Aufpassen muß
man allerdings im Falle der ∃-Einführungsregel, daß die Variablenbedingung nicht
verletzt wird; die Voraussetzung, daß σ ein Satz ist, wird hier benötigt (könnte hier
aber auch entsprechend abgeschwächt werden).
Beweis von “⇐”: Wir zeigen
T[σ ] ` ψ =⇒ T ` σ → ψ
durch Induktion über die Länge eines Beweises (d. h. Anzahl der Formeln im Beweis) von ψ:
a) ψ ist Axiom von T[σ ]: dann ist entweder
(i) ψ Axiom von T und damit T ` ψ, also auch T ` σ → ψ, oder
(ii) ψ = σ und damit wegen T ` σ → σ auch T ` σ → ψ.
88
4.6. DAS D EDUKTIONSTHEOREM
b) ψ ist logisches Axiom. Dann gilt T ` ψ, also auch (als tautologische Folgerung) T ` σ → ψ.
Damit haben wir den Induktionsanfang behandelt. Der Induktionsschluß (ψ ist
Folgerung mittels einer Regel) läßt sich auch in 2 Fälle aufgliedern:
c) Es gibt Formeln ψ1 bzw. ψ1 und ψ2 , so daß ψ aus diesen mittels einer
aussagenlogischen Regel folgt (und damit tautologisch folgt), wobei T[σ ] `
ψ1 und T[σ ] ` ψ2 . Nach Induktionsvoraussetzung gilt ferner T ` σ → ψi
für i = 1, 2 und damit als tautologische Folgerung auch T ` σ → ψ.
d) ψ ist Folgerung aus ψ1 mittels der Regel der ∃-Einführung, also
ψ1 = δ1 → δ2 und ψ = ∃xδ1 → δ2 für Formeln δ1 , δ2 , wobei x in δ2 nicht
frei vorkommt. Dann:
(1)
T ` σ → (δ1 → δ2 )
nach Induktionsvoraussetzung
(2)
T ` δ1 → (σ → δ2 )
tautologisch (aus (1)
(3) T ` ∃xδ1 → (σ → δ2 )
mit ∃-Einführung
(4) T ` σ → (∃xδ1 → δ2 )
tautologisch aus (3), also
(5)
T`σ →ψ
Dabei war die ∃-Einführung in (3) erlaubt, denn x kommt nach Voraussetzung in
δ2 nicht frei vor, aber auch nicht frei in σ (da nach Annahme σ ein Satz ist), also
kommt x in σ → δ2 nicht frei vor.
Korollar
T sei eine Theorie der Sprache L, γ1 , . . . , γn seien L -Sätze und ψ eine L-Formel.
Dann gilt:
T ` γ1 ∧ . . . ∧ γn → ψ ⇐⇒ T[γ1 , . . . , γn ] ` ψ
Bemerkungen
1. Daß das Deduktionstheorem nicht für beliebige Formeln gilt, zeigt das Beispiel ϕ = (x = y), wobei A |= ∀x∀y ϕ ⇐⇒ |A| hat genau ein Element:
Es ist T[x = y] ` ∀x∀y(x = y), aber T 6` x = y → ∀x∀y(x = y), wenn T ein
Modell mit mindestens zwei Elementen hat.
4.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
89
2. Aus dem Beweis ergibt sich, daß σ auch eine Formel sein kann, vorausgesetzt, daß beim Beweis von ψ aus T[σ ] die ∃-Einführungsregel nicht für
eine Variable benutzt wurde, die in σ frei vorkommt. Ansonsten läßt sich
das Deduktionstheorem für eine Formel ϕ auch in der Form
T ` ϕ ∀ → ψ ⇐⇒ T[ϕ] ` ψ
umformulieren, wobei ϕ ∀ der universelle Abschluß von ϕ ist.
3. Falls T ` ψ, so existieren nach dem Endlichkeitssatz für die Beweisbarkeit
endlich viele ϕ1 , . . . , ϕn in T mit ϕ1 , . . . , ϕn ` ψ; sind die Axiome ϕ1 , . . . , ϕn
Sätze (man kann sie anderenfalls wegen des Abschlußsatzes durch ihre universellen Abschlüsse ersetzen), so gilt also ` ϕ1 ∧ . . . ∧ ϕn → ψ.
Damit läßt sich die Beweisbarkeit in einer Theorie (prinzipiell) auf logische Beweisbarkeit zurückführen; ist ein konkreter Beweis von ψ aus T gegeben, so lassen sich aus diesem Beweis die Sätze ϕ1 , . . . , ϕn in T mit ϕ1 ∧ . . . ∧ ϕn ` ψ auch
konkret angeben, nicht notwendig aber, wenn man nur von der Beweisbarkeit ausgeht!
4.7 Erweiterungen von Theorien, Widerspruchsfreiheit
Theorien erweitert man oft durch Hinzunahme neuer Axiome (z. B. des Kommutativgesetzes zu den Gruppenaxiomen oder der Negation des Parallelenaxioms zur
“Absoluten” Geometrie), manchmal wird dabei auch noch die Sprache erweitert
(Gruppentheorie → Körpertheorie → Theorie der angeordneten Körper).
4.7.1 Erweiterungen und Expansionen
a) Eine Sprache L0 heißt Erweiterung der Sprache L (L ⊆ L0 ) gdw. jedes
(nicht-logische) Symbol von L auch Symbol von L0 ist (also jede L-Formel
auch eine L0 -Formel ist).
b) Eine Theorie T0 der Sprache L0 heißt Erweiterung der Theorie T der Sprache L (T ⊆ T0 ) gdw
(i) L0 Erweiterung der Sprache L ist und
(ii) für alle Formeln ϕ der Sprache L: T ` ϕ ⇒ T0 ` ϕ.
90
4.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
c) Gilt in (ii) sogar die Äquivalenz, also (zusätzlich zu (i))
(iii) für alle Formeln ϕ der Sprache L: T ` ϕ ⇐⇒ T0 ` ϕ,
so heißt T0 konservative Erweiterung von T.
Häufig erweitert man eine Theorie T durch Definitionen: Führt man für eine
Formel ϕ(~x) ein neues Relationszeichen R ein, so bedeutet dies, daß man T zu
einer Theorie T0 erweitert, die als neues Axiom erhält:
R(~x) ↔ ϕ(~x).
Ebenso bei der Einführung neuer Funktionszeichen: Hier muß man zunächst nachweisen, daß
T ` ∀~x ∃!y ϕ(~x, y),
worauf man durch
f (~x) = y ↔ ϕ(~x, y)
die Theorie T um das neue Funktionszeichen f mit obigem Axiom erweitert. In
beiden Fällen ist die neue Theorie eine konservative Erweiterung der alten Theorie
T.
d) Falls T ⊆ T0 und T0 ⊆ T , so heißt T äquivalent zu T0 (und dann wird
oft T mit T0 identifiziert, da sie sich in diesem Fall (möglicherweise) nur
durch ihre Axiomatisierung, nicht aber in ihren Konsequenzen voneinander
unterscheiden).
Insbesondere unterscheiden wir nicht zwischen einer Theorie T und ihrer Folgerungsmenge C(T) := {σ | T ` σ }. Mit Hilfe des Vollständigkeitssatzes werden
wir später zeigen, daß Theorien genau dann äquivalent sind, wenn sie dieselben
Modelle haben.
Beachte, daß äquivalente Theorien in derselben Sprache formuliert sind und
daß eine konservative Erweiterung T0 von T zwar nur dieselben Aussagen der
(kleineren) Sprache von T abzuleiten gestattet, darüber hinaus jedoch möglicherweise weitere Aussagen über die erweiterte Sprache zuläßt.
e) Ist L ⊆ L0 , A eine L-Struktur und A0 eine L0 -Struktur, so heißt
A0 Expansion von A : ⇐⇒ |A| = |A0 | und sA = sA
logischen Symbole s von L.
0
für alle nicht-
Man schreibt dann auch A = A0 L und nennt umgekehrt A auch die Einschränkung oder das Redukt von A0 auf die Sprache L.
4.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
91
So ist z. B. ein Körper (K, +, ·, 0, 1) eine Expansion der additiven Gruppe
(K, +, 0) des Körpers.
Eine Erweiterung einer Theorie T der Sprache L zu einer Theorie T0 der Sprache L0 kann dadurch erfolgen, daß nur die Sprache erweitert wird, aber keine
weiteren nicht-logischen Axiome hinzukommen (T0 heißt dann rein sprachliche
Erweiterung von T) oder es können (wie beim Übergang von der Gruppen- zur
Körpertheorie) noch weitere nicht-logische Axiome hinzukommen. Wir behandeln zunächst den ersten Fall:
4.7.2 Satz über rein sprachliche Erweiterungen von Theorien
T und T0 seien Theorien der Sprache L bzw. L0 , wobei L ⊆ L0 . Haben T und T0
dieselben Axiome, so ist T0 konservative Erweiterung von T:
für alle Formeln ϕ von L gilt: T ` ϕ ⇐⇒ T0 ` ϕ.
Vorbemerkung: Der Teil der Behauptung von links nach rechts ist trivial (da jedes
Axiom von T auch Axiom von T0 ist, ist jeder Beweis von ϕ aus T auch ein
Beweis von ϕ aus T0 ), aber die Umkehrung ist keineswegs trivial, da ein Beweis
von ϕ aus T0 logische Axiome (bzw. Regeln) für Formeln der erweiterten Sprache
benutzen kann (auch wenn die zusätzlichen Symbole der Sprache L0 in ϕ selbst
nicht mehr vorkommen). Ein semantischer Beweis (mit |= statt ` ) ist jedoch
einfach: ist A0 |= T0 , so ist die Einschränkung A = A0 L ein Modell von T.
Beweis des Satzes: In einer Formel ψ der (größeren) Sprache L0 streichen wir
die nicht zu L gehörigen Symbole und ersetzen sie in harmloser Weise mittels
einer Variablen y : Es sei ψy die Formel der Sprache L , die aus ψ entsteht,
indem in ψ
Rt1 . . .tn (falls R nicht in L) durch y = y,
Ft1 . . .tm (falls F nicht in L) durch y,
c
(falls c nicht in L) durch y ersetzt wird.
Wir zeigen nun für alle Formeln ψ der Sprache L0 :
(*) für alle Variablen y bis auf endlich-viele Ausnahmen gilt T0 ` ψ ⇒ T ` ψy .
Da für Formeln ψ in L offenbar ψy = ψ ist, so folgt hieraus dann die Behauptung.
Die Aussage (*) beweisen wir durch Induktion über die Länge eines Beweises von
T0 ` ψ:
4.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
92
1. ψ ist nicht-logisches Axiom von T0 . Dann ist ψ auch (nicht-logisches) Axiom von T, also T ` ψ und dann auch T ` ψy für alle Variablen y (da hier
ψy = ψ).
2. ψ ist logisches Axiom von T0 .
2.1 ψ = ¬θ ∨ θ .
Dann ist ψy = ¬θy ∨ θy für jedes y und T ` ψy für alle Variablen y.
2.2 ψ = θ [t/x] → ∃xθ .
Dann ist ψy = θy [t0 /x] → ∃xθy für alle y, die in θ nicht vorkommen
und für einen Term t0 von L. Somit T ` ψy für alle Variablen y bis
auf endlich-viele.
2.3 ψ = (x = x). Dann ist ψy = (x = x).
2.4 ψ ist eines der Gleichheitsaxiome.
Dann ist ψy = ψ oder von der Form θ → y = y, jedenfalls T ` ψy für
alle Variablen y.
3. (Induktionsschritt):
ψ ist Konklusion einer Regel mit den Prämissen ψ1 . . . ψn (n = 1, 2), wobei
nach Induktionsvoraussetzung T ` (ψi )y für i ≤ n und alle Variablen y bis
auf endlich-viele gilt.
3.1 Im Falle einer aussagenlogischen Regel ist ψ tautologische Folgerung aus ψ1 , . . . , ψn , dann ist aber auch ψy tautologische Folgerung
aus (ψ1 )y , . . . , (ψn )y und somit T ` ψy .
3.2 Im Falle der vorderen Partikularisierung ist n = 1 und ψ = ∃xϕ → θ
und ψ1 = ∃xϕ → θ mit x nicht frei in θ .
Dann ist ψy = ∃xϕy → θy und (ψ1 )y = ϕy → θy mit x nicht frei in θy
für y 6= x. Also T ` ψy für jedes y 6= x mit T ` (ψ1 )y und damit T ` ψy
für alle y bis auf endlich-viele.
Das folgende Korollar haben wir einfacher schon in der modelltheoretischen
Fassung (3.1.1) erhalten:
Korollar
T sei eine Theorie der Sprache L, c eine neue Konstante, die in L nicht vorkommt.
Dann gilt:
4.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
T ` ϕ[c/x] ⇐⇒ T ` ∀xϕ.
93
Hier haben wir erneut ein bekanntes Beweisprinzip (vgl. Satz über die Generalisierung) erhalten:
Um aus den Axiomen einer Theorie T eine Aussage ∀xϕ(x) zu bewiesen, genügt es, die Aussage ϕ(c) für eine geeignete Konstante c (ein
“beliebiges, aber festes” c) herzuleiten.
Im Rahmen der Aussagenlogik hatten wir bereits früher die Widerspruchsfreiheit einer Aussagenmenge formuliert, entsprechend definieren wir im Falle der
Prädikatenlogik:
4.7.3 Widerspruchsfrei/widerspruchsvoll
T konsistent :
⇐⇒
es gibt einen Satz σ der Sprache von T mit: T 6` σ ,
T inkonsistent :
⇐⇒
für alle Sätze σ der Sprache von T gilt: T ` σ .
Diese Definition (statt konsistent sagt man auch widerspruchsfrei, statt inkonsistent auch widerspruchsvoll) hat den Vorzug, daß sie auch für Sprachen ohne
das ¬-Zeichen sinnvoll ist; hier ergibt sich für unsere Sprachen die Äquivalenz
mit der erwarteten Charakterisierung:
Lemma
T konsistent ⇐⇒ es gibt keinen Satz σ mit T ` σ und T ` ¬σ .
Beweis von “⇒”: Falls T ` σ und T ` ¬σ für einen Satz σ , so nach dem Tautologiesatz T ` σ ∧ ¬σ und somit T ` ψ für alle Sätze ψ.
“⇐”: Wähle für σ den Satz ∀x(x = x); dann gilt T ` σ , also nach Vor. T 6` ¬σ ,
und damit ist mindestens ein Satz aus T nicht beweisbar.
Bemerkungen
1. Ist T0 Erweiterung von T und ist T0 konsistent, so auch T.
2. Ist T0 konservative Erweiterung von T, so gilt:
T konsistent gdw T0 konsistent.
4.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
94
Nimmt man zu einer Theorie T eine Menge Γ Formeln (als zusätzliche Axiome) hinzu, so ist die entstehende Erweiterung T[Γ] widerspruchsvoll, wenn endlich-viele der neuen Axiome einen Widerspruch zur Theorie T ergeben. Da man
hier endlich-viele Axiome durch ihre Konjunktion ersetzen kann, genügt der folgende Satz:
4.7.4 Beweisbarkeit und Widerspruchsfreiheit
Ist ϕ ∗ der universelle Abschluß von ϕ , so gilt:
T ` ϕ ⇐⇒ T[¬ϕ ∗ ] widerspruchsvoll,
T 0 ϕ ⇐⇒ T[¬ϕ ∗ ] widerspruchsfrei.
Beweis von “⇒”: Falls T ` ϕ, so auch T ` ϕ ∗ und damit erst recht T[¬ϕ ∗ ] ` ϕ ∗ .
Andererseits gilt aber natürlich auch T[¬ϕ ∗ ] ` ¬ϕ ∗ . Somit ist T[¬ϕ ∗ ] widerspruchsvoll.
“⇐”: Es sei T[¬ϕ ∗ ] widerspruchsvoll. Dann ist alles beweisbar, insbesondere
T[¬ϕ ∗ ] ` ϕ ∗ . Nach dem Deduktionstheorem: T ` ¬ϕ ∗ → ϕ ∗ , also T ` ϕ ∗ und
damit auch T ` ϕ.
Damit kann die Beweisbarkeit eines Satzes auf die Widerspruchsfreiheit einer
geeignet erweiterten Theorie zurückgeführt werden:
T 0 σ ⇐⇒ T[¬σ ] ist widerspruchsfrei
Schon im Rahmen der Aussagenlogik haben wir bemerkt, daß der Begriff
der Folgerung sich auf den entsprechenden Begriff der Erfüllbarkeit zurückführen
läßt:
T 6|= σ ⇐⇒ T[¬σ ] ist erfüllbar
Wie im Falle der Aussagenlogik können wir den Vollständigkeitssatzes damit
auf den Modellexistenz-Satz zurückführen:
Jede widerspruchsfreie Theorie T ist erfüllbar.
Tatsächlich ist diese Aussage äquivalent zum Vollständigkeitssatz; beide stellen einen Zusammenhang zwischen einem syntaktischen Begriff (beweisbar, widerspruchsfrei) und einem semantischen Begriff (folgt aus, erfüllbar) her. Der Modellexistenzsatz erscheint hier nur in seiner einfachsten Form; in der Modelltheorie werden allgemeinere Fassungen dieses Satzes behandelt, in denen aus syntaktischen Eigenschaften einer formalen Theorie Aussagen über semantische Eigenschaften möglicher Modelle gemacht werden.
95
4.8. T ERMMODELLE
4.8 Termmodelle
T sei eine Theorie der Sprache L. Um ein Modell A von T zu finden, muß man wenigstens den Individuenkonstanten der Sprache Werte zuordnen; unter günstigen
Voraussetzungen erhält man dann durch geeignete Festlegungen der Interpretation der Relations- und Funktionssymbole bereits ein Modell. So findet man z. B.
im Falle der Gruppentheorie (und ähnlich im Falle der Theorie der Körper) das
einfachste Modell:
Wähle ein Element e als (Interpretation des) neutrales Element(es)
und setze e ◦ e = e, e−1 = e : G = ({e}, ◦,−1 , e) ist eine Gruppe!
Diesen Ansatz wollen wir weiterverfolgen:
4.8.1 Kanonische Struktur einer Theorie, Termstruktur
Die Elemente von eines Modell A einer Theorie T müssen mindestens Interpretationen der konstanten Terme als Elemente enthalten. Daher definieren wir:
K := {t | t konstanter (d. h. variablenfreier) L-Term}.
Zusätzlich ist zu beachten ist, daß aus den Axiomen der Theorie T folgen kann,
daß verschiedene Terme gleichgesetzt werden sollen (z. B. 0 + 1 = 1 + (0 · 1) in
der Körpertheorie). Daher werden wir Terme identifizieren, wenn die Theorie es
verlangt:
s ∼ t : ⇐⇒ T ` s = t
für s,t ∈ K.
Diese Relation ist (wegen der Gleichheitsaxiome!) eine Äquivalenzrelation
auf K,
s := {t ∈ K | s ∼ t} zugehörige Äquivalenzklasse.
A := {s | s ∈ K}
Menge der Äquivalenzklassen
wird der Individuenbereich der gesuchten Struktur sein, in dem t A = t für alle
t ∈ K gelten wird. Dazu legen wir die Interpretation der weiteren nicht-logischen
Zeichen wie folgt fest:
cA
=
c
F A (t1 , . . . ,tm )
=
F(t1 , . . . ,tm )
RA (t1 , . . . ,tn )
⇐⇒
T ` R(t1 , . . . ,tn )
96
4.8. T ERMMODELLE
Daß diese Definitionen “wohldefiniert” sind (d. h. nicht von der Wahl der Repräsentanten der jeweiligen Äquivalenzklassen abhängen), folgt wiederum aus
den Gleichheitsaxiomen (Prinzip der Nichtunterscheidbarkeit, s. 4.4.2). Damit ist
(für K 6= 0/ ) nun eine L-Struktur
A = AT = (A, RA , . . . F A , . . . cA , . . .) definiert,
die kanonische Struktur der Theorie T.
Eine Struktur bzw. ein Modell, dessen Elemente Interpretationen von konstanten
Termen sind (wie die obige kanonische Struktur) nennt man auch eine Termstruktur bzw. ein Termmodell.
4.8.2 Satz über Termmodelle
Für alle atomaren Sätze σ gilt:
(∗) AT |= σ ⇐⇒ T ` σ .
Beweis: Zeige zunächst durch Induktion über den Termaufbau:
(1) t A = t für alle t ∈ K.
(*) beweist man dann durch Induktion über die Formellänge:
(2) Ist σ = R(t1 , . . . ,tn ), so
AT |= σ ⇐⇒
RA (t1A , . . . ,tnA )
nach Def. von |=
⇐⇒
RA (t1 , . . . ,tn )
nach(1)
⇐⇒
T ` R(t1 , . . . ,tn ) nach Def. von RA
(3) Ist σ der Satz s = t, so
AT |= σ ⇐⇒
⇐⇒
⇐⇒
sA = t A
s=t
nach Def. von |=
nach (1)
T ` s = t nach Def. von t
Könnten wir die Aussage (*) für alle Sätze zeigen, so wäre die Struktur AT ein
Modell von T. Im allgemeinen gilt dies aber nicht, T kann zwar widerspruchsfrei
sein, aber möglicherweise zu wenig Information enthalten: Um den Induktionsbeweis weiterführen zu können, müßte gelten:
97
4.9. V ERVOLLST ÄNDIGUNG VON T HEORIEN
(a) analog zu
AT |= ¬σ
⇐⇒
AT 6|= σ :
T ` ¬σ
⇐⇒
T 6` σ ,
(b) analog zu
AT |= ∃xϕ
⇐⇒
es ex. ein t ∈ K mit AT |= ϕ[t/x] :
T ` ∃xϕ
⇐⇒
es ex. ein t ∈ K mit T ` ϕ(t).
Die Eigenschaft (a) charakterisiert gerade die konsistenten und (syntaktisch)
vollständigen Theorien, dagegen erfüllen Henkin-Theorien die Eigenschaft (b).
Wir werden zeigen, dass man beide Eigenschaften durch eine geeignete Erweiterung von T erhalten kann.
4.9 Vervollständigung von Theorien
Wie im Falle der Aussagenlogik nennen wir eine Theorie T der Sprache L (syntaktisch) vollständig gdw
für jeden L-Satz σ gilt: T ` σ oder T ` ¬σ .
Da T konsistent ist gdw nicht zugleich T ` σ und T ` ¬σ gelten, so ist T konsistent und (syntaktisch) vollständig gdw
für jeden L-Satz σ gilt: entweder T ` σ oder T ` ¬σ .
Der Vollständigkeitsbegriff im semantischen Sinne (für jeden L-Satz σ gilt:
T |= σ oder T |= ¬σ ) wird mit obigem übereinstimmen, sobald wir den Vollständigkeitssatz bewiesen haben. Solange soll vollständig hier im syntaktischen
Sinne gemeint sein (und besser durch den äquivalenten Begriff maximal konsistent ersetzt werden). Daneben haben wir noch den Begriff des vollständigen
Axiomensystems; dieser ist von den Begriffen der vollständigen Theorie streng zu
unterscheiden. Daher beachte man:
Der Vollständigkeitssatz für die Prädikatenlogik besagt nicht,
daß jede Theorie vollständig ist!
4.9. V ERVOLLST ÄNDIGUNG VON T HEORIEN
98
Die Vollständigkeit eines Axiomensystems für die Logik bedeutet, daß es genügend Axiome und Regeln enthält, um alle wahren Sätze zu beweisen; bezüglich
der Folgerungsbeziehung besagt der Vollständigkeitssatz, daß alle Sätze, die in
allen Modellen einer Theorie T gelten, aus T mit den Axiomen und Regeln des
Axiomensystems beweisbar sind. Daraus folgt keineswegs, daß alle Theorien vollständig sind, häufig sollen sie sogar unvollständig sein, um möglichst viele Modelle mit sehr unterschiedlichen Eigenschaften zuzulassen (wie die algebraische
Theorien der Gruppen, Ringe oder Körper). Für den Beweis des Vollständigkeitssatzes der Prädikatenlogik benötigen wir allerdings den Begriff der vollständigen
Theorie und die Möglichkeit, eine beliebige konsistente Theorie zu einer maximal
konsistenten Theorie zu erweitern.
4.9.1 Satz von Lindenbaum
T sei eine konsistente Theorie der abzählbaren Sprache L. Dann existiert eine
maximal konsistente Erweiterung TV von T in derselben Sprache L.
Beweis: Da die Sprache L abzählbar ist, existiert eine Aufzählung (σn |n ∈ N)
aller L-Sätze. Setze (rekursiv)
(
Tn ,
falls Tn ` σn ,
T0 = T und Tn+1 =
Tn [¬σn ] sonst.
Schließlich sei
TV :=
S
n∈N Tn .
Da nach Konstruktion von Tn+1 gilt:
Tn ` σn oder Tn+1 ` ¬σn , so auch
TV ` σn oder TV ` ¬σn ,
und damit ist TV eine vollständige Theorie.
Zum Beweis der Konsistenz von TV zeigt man durch Induktion, daß alle Tn
konsistent sind: Ist Tn widerspruchsfrei, so auch Tn+1 , wobei man im “sonst”-Fall
4.7.4 benutzt). Die Widerspruchsfreiheit von TV folgt dann aus dem Endlichkeitssatz für die Beweisbarkeit.
Bemerkungen
• Der Beweis des Satzes von L INDENBAUM zeigt, daß die Existenz einer Vervollständigung von der Wahl der Aufzählung der Sätze der Sprache abhängt;
99
4.10. H ENKIN -T HEORIEN
i. a. hat eine (konsistente aber selbst nicht vollständige) Theorie sehr viele
Vervollständigungen!
• T ist konsistent und vollständig gdw C(T) := {σ | T ` σ } (die Menge aller
Folgerungen aus T) eine maximale konsistente Theorie ist.
• Um den Satz von L INDENBAUM für beliebige Sprachen zu beweisen, muß
man also zeigen, daß sich jede konsistente Theorie zu einer maximalen konsistenten Theorie erweitern läßt. Dazu benötigt man (zumindest im Fall
überabzählbarer Sprachen) das Auswahlaxiom, etwa in Form des Z ORNschen Lemmas (s. 7.2).
4.10 Henkin-Theorien
Wir behandeln jetzt Theorien, in denen der Existenzquantor in Sätzen eliminiert
werden kann, und zwar durch eine Konstante als Beispiel:
Definition einer Henkin-Theorie
Eine Theorie T der Sprache L heißt Henkin-Theorie gdw für jeden L-Satz der
Form σ = ∃xϕ gilt: Es gibt einen konstanten Term t der Sprache L mit
T ` ∃xϕ → ϕ(t) und somit
T ` ∃xϕ ↔ ϕ(t).
A sei L-Struktur mit Individuenbereich A. Bereits früher haben wir die Sprache
LA eingeführt, die zusätzliche Namen a für jedes Element a ∈ A enthält. In der
Struktur AA wird a durch a selbst interpretiert, und mit
DL (A) = Th(AA ) = {σ | AA |= σ , σ LA -Satz}
haben wir das elementare Diagramm von A bezeichnet.
Beispiele
(i) Th(A) und DL (A) sind stets konsistente und vollständige Theorien, letztere
ist offenbar eine H ENKIN-Theorie. Als Folgerung aus dem Vollständigkeitssatz wird sich ergeben, daß umgekehrt jede konsistente und vollständige
Theorie von der Form Th(A) ist für ein A.
100
4.10. H ENKIN -T HEORIEN
(ii) Konkrete Beispiele sind
• die Theorie der dichten linearen Ordnung ohne Endpunkte:
konsistent und vollständig (s. 9.2), aber (in der Sprache allein mit <Zeichen) keine H ENKIN-Theorie,
• die Gruppentheorie ist konsistent, aber unvollständig: Das Kommutativgesetz ∀x∀y(x ◦ y = y ◦ x) ist weder beweisbar noch widerlegbar,
aber auch die Theorie der A BELschen Gruppen ist offenbar noch unvollständig.
• Die P EANO-Arithmetik PA ist unvollständig (G ÖDELscher Unvollständigkeitssatz).
• Dagegen ist die Theorie des Standardmodells von PA, Th(N,0 , 0), eine
vollständige H ENKIN-Theorie.
Eine H ENKIN-Theorie muß zu jedem Existenzsatz einen konstanten Term als
Beispiel besitzen, i. a. besitzen natürlich vorgegebene Theorien nicht genügend
derartige Beispiele. Man kann jedoch durch Hinzunahme genügend vieler Konstanten eine Theorie zu einer H ENKIN-Theorie erweitern:
Henkin-Erweiterungen
Es sei T eine Theorie der Sprache L. Wähle für jeden L-Satz der Form σ = ∃xψ
eine neue (d. h. in der Sprache L bisher nicht vorkommende) Konstante cσ und
bilde die erweiterte Sprache
L∗ := L ∪ {cσ | σ L-Satz der Form ∃xψ},
T∗ := T[Γ] mit den HENKIN-Axiomen in der Sprache L∗ :
Γ := {∃xψ(x) → ψ(cσ ) | σ L-Satz der Form ∃xψ}.
T∗ braucht aber noch keine H ENKIN-Theorie zu sein, da man mit Hilfe der
neuen Konstanten möglicherweise neue Existenzsätze finden kann, für die keine Beispiele in der Sprache L∗ vorhanden sind. Man muß daher diesen Prozeß
unendlich oft iterieren: Setze
L0 = L ,
Ln+1 = L∗n ,
Schließlich sei
S
LH = n∈N Ln ,
T0 = T
Theorie der Sprache L
Tn+1 = T∗n Theorie der Sprache Ln+1 .
TH =
S
n∈N Tn
die Henkin-Erweiterung der Theorie T.
101
4.10. H ENKIN -T HEORIEN
Satz über Henkin-Erweiterungen
(i) TH ist eine H ENKIN-Theorie,
(ii) TH ist eine konservative Erweiterung von T,
(iii) ist die Sprache L abzählbar, so auch die Sprache LH .
Beweis: (i) und (iii) sind klar (Abzählbarkeit einer Sprache bedeutet, daß die Menge der Symbole der Sprache abzählbar ist). Zum Beweis von (ii) sei T0 die Theorie
der Sprache LH mit denselben nicht-logischen Axiomen wie T. Dann ist T0 eine
rein sprachliche Erweiterung von T und somit konservative Erweiterung von T.
Wir zeigen nun die Behauptung, indem wir nachweisen:
(+) ist ϕ Formel der Sprache L und gilt TH ` ϕ, so auch T0 ` ϕ.
Sei also ϕ L-Formel mit TH ` ϕ. Dann gibt es endlich viele Sätze der Form
σi = ∃xψi (x) → ψi (ci ) mit ci = c∃xψi (i = 1, . . . , n), so daß
T0 ` σ1 ∧ . . . ∧ σn → ϕ.
Wir zeigen T0 ` ϕ durch Induktion nach n:
Jeder Satz σi ist ein Satz der Sprache Lmi für ein mi , wobei wir annehmen
können, daß m1 ≥ m2 , . . . , mn . Das bedeutet dann insbesondere, daß die Konstante
c1 in den Sätzen σ2 , . . . , σn und damit auch in den Formeln ψ1 , . . . , ψn , ϕ nicht
vorkommt. Also existiert eine Variable y, die nicht in diesen Formeln vorkommt,
mit (s. Beweis von 4.7.2)
T0 ` (∃xψ1 (x) → ψ1 (y)) ∧ σ2 ∧ . . . ∧ σn → ϕ.
T0 ` (∃xψ1 (x) → ψ1 (y)) → (σ2 ∧ . . . ∧ σn → ϕ)
T0 ` ∃y(∃xψ1 (x) → ψ1 (y)) → (σ2 ∧ . . . ∧ σn → ϕ).
` ∃y(∃xψ1 (x) → ψ1 (y)),
0
T ` σ2 ∧ . . . ∧ σn → ϕ.
Dann:
und mit ∃-Einführung
Nun gilt aber
und somit haben wir
Ähnlich (bzw. nach Ind.vor.) kann man die übrigen Prämissen eliminieren und
erhält schließlich T0 ` ϕ.
4.11. D ER G ÖDELSCHE VOLLST ÄNDIGKEITSSATZ
102
4.11 Der Gödelsche Vollständigkeitssatz
Dieser Satz wurde zuerst von Kurt G ÖDEL für abzählbare Sprachen bewiesen:
Gödel, Kurt Die Vollständigkeit der Axiome des logischen Funktionenkalküls.
Monatshefte Math. Phys. 37 (1930), 349-360.
und für beliebige Sprachen 1936 von I. M ALCEV. Unsere Beweismethode geht
zurück auf
Henkin, Leon The completeness of the first-order functional calculus. Journal of
Symbolic Logic 14 (1949), 159 - 166, s.a.:
Henkin, Leon The discovery of my completeness proof. Bull. Journal of Symbolic Logic 2,2 (1996), 127 - 158,
Leblanc-Roeper-Than-Weaver Henkin´s completeness proof: Forty years later.
Notre Dame Journal of Formal Logic 32 (1991), 212 - 232.
Die H ENKINsche Methode hat den Vorzug, daß man sie vielfältig abwandeln
kann, um - in Abhängigkeit von speziellen Eigenschaften einer Theorie T - Modelle von T mit besonderen Eigenschaften zu erhalten. Wie schon erwähnt, läßt
sich der Vollständigkeitssatz in zwei äquivalenten Fassungen angeben:
4.11.1 Vollständigkeit der Prädikatenlogik / Modellexistenz-Satz
(1)
T |= σ =⇒ T ` σ ,
(2) T konsistent =⇒ T erfüllbar.
Beweis: Wie im Falle der Aussagenlogik (siehe auch 4.7.4) folgt (1) aus (2) (die
Umkehrung ist noch einfacher zu zeigen), so daß wir nur (2) zu beweisen brauchen.
Sei also T eine konsistente Theorie der Sprache L. Wir erweitern T zunächst
zu einer H ENKIN-Theorie TH in der Sprache L0 := LH und bilden dann eine Vervollständigung dieser Theorie:
T ⊆ TH ⊆ (TH )V = T0
103
4.11. D ER G ÖDELSCHE VOLLST ÄNDIGKEITSSATZ
Da beim zweiten Schritt die Sprache nicht mehr erweitert wird, ist T0 nicht nur
vollständig und konsistent, sondern auch eine H ENKIN-Theorie geblieben. Nun
wählen wir das Termmodell A0 von T0 und zeigen, daß für alle Sätze σ der Sprache
L0 gilt:
(∗) A0 |= σ ⇐⇒ T0 ` σ .
Insbesondere ist dann A0 ein Modell von T und damit A := A0 L, die Einschränkung auf die Sprache L, ein Modell von T. Die Behauptung (*) zeigen
wir durch Induktion über den Aufbau von σ :
1. Fall: σ ist atomar. Dieser Anfangsfall ist gerade Inhalt des Satzes 4.8.2 über
Termmodelle.
2. Fall: σ = ¬ψ. Dann gilt nach Definition von |=:
A0 |= ¬ψ ⇐⇒ A0 6|= ψ und entsprechend
T0 ` ¬ψ ⇐⇒ T0 6` ψ,
wegen der Vollständigkeit und Konsistenz von T0 . Somit folgt die Behauptung aus
der Induktionsvoraussetzung.
3. Fall: σ = ψ ∨ θ . Dann gilt wieder nach der Definition von |=:
A0 |= ψ ∨ θ ⇐⇒ A0 |= ψ oder A0 |= θ und entsprechend
(∗∗) T0 ` ψ ∨ θ ⇐⇒ T0 ` ψ oder T0 ` θ ,
denn in (**) gilt “⇒” mittels aussagenlogischer Abschwächung. Für den Beweis
von “⇐” nehmen wir an, daß
T0 ` ψ
oder T0 ` θ
nicht gilt, also
T0 6` ψ
und T0 6` θ
und somit
0
T ` ¬ψ
und T0 ` ¬θ
wegen der Vollständigkeit von T0 . Dann gilt aber als tautologische Folgerung:
T0 ` ¬(ψ ∨ θ ), und das heißt T0 6` ψ ∨ θ wegen der Konsistenz von T0 .
4. Fall: σ = ∃xψ. Dann gilt wieder nach der Definition von |=:
A0 |= ∃xψ ⇐⇒ es ex. ein a ∈ |A0 | mit A0 |= ψ[a].
Da A0 ein Termmodell ist, so ist jedes a ∈ |A0 | von der Form a = t = t A für einen
konstanten Term t, also:
0
4.11. D ER G ÖDELSCHE VOLLST ÄNDIGKEITSSATZ
104
A0 |= ∃xψ ⇐⇒ es ex. ein t ∈ K mit A0 |= ψ[t/x].
Entsprechend gilt, da T0 H ENKIN-Theorie ist:
T0 ` ∃xψ ⇐⇒ es ex. ein t ∈ K mit T0 ` ψ(t).
Somit folgt die Behauptung auch in diesem Fall aus der Induktionsvoraussetzung.
Im Falle einer abzählbaren Sprache läßt sich der Satz von L INDENBAUM und
damit auch der Vollständigkeitssatz ohne Voraussetzung des Auswahlaxioms beweisen. Auf diesen Fall bezieht sich als Korollar auch der
4.11.2 Satz von Löwenheim
Ist T eine konsistente Theorie in einer abzählbaren Sprache,
so besitzt T ein abzählbares Modell.
Das Ergebnis von L ÖWENHEIM findet sich in der Form
Hat eine Theorie T in einer abzählbaren Sprache L ein Modell,
so auch ein abzählbares Modell.
bereits in der Arbeit
Löwenheim, Leopold Über Möglichkeiten im Relativkalkül. Math. Ann. 76,
(1915), 447 - 470.
Verallgemeinerungen werden wir später mit modelltheoretischen Methoden nach
S KOLEM -TARSKI behandeln (10.4 und 10.5).
Aus dem Vollständigkeitssatz folgt auch das
Korollar
(i) Sind T und T0 Theorien in derselben Sprache L, so gilt:
T ⊆ T0 ⇐⇒ Mod(T) ⊇ Mod(T0 ),
T = T0 ⇐⇒ Mod(T) = Mod(T0 ).
(ii) Eine Theorie T ist konsistent und vollständig gdw es eine Struktur A gibt
mit T = Th(A).
Dabei meinen wir hier mit T = T0 : T äquivalent zu T0 , d. h. C(T) = C(T0 ).
Als weitere wichtige Folgerung aus dem Vollständigkeitssatz (und dem Endlichkeitssatz für die Beweisbarkeit) erhalten wir erneut den
4.11. D ER G ÖDELSCHE VOLLST ÄNDIGKEITSSATZ
105
4.11.3 Kompaktheitssatz
Σ sei eine Menge von Sätzen, σ ein Satz. Dann gilt:
(1) T |= σ ⇒ es existiert ein endliches T0 ⊆ T mit T0 |= σ ,
(2) hat jedes endliche Σ0 ⊆ Σ ein Modell, so hat auch Σ ein Modell.
(Natürlich gelten auch die jeweiligen Umkehrungen.)
Bemerkung
Folgende Ergebnisse sind äquivalent:
(i) Der Vollständigkeitssatz (für beliebige Sprachen),
(ii) der Satz von L INDENBAUM (für beliebige Sprachen),
(iii) der Kompaktheitssatz (für beliebige Sprachen),
(iv) das B OOLEsche Primidealtheorem:
Jedes echte Ideal einer B OOLEschen Algebra läßt sich zu einem Primideal
erweitern (bzw. jeder echte Filter zu einem Ultrafilter).
Alle diese Aussagen folgen aus dem Auswahlaxiom, sind aber schwächer als
dieses.
106
Teil II
Mengenlehre
107
Kapitel 5
Grundlagen der Mengenlehre
Quod enim dicimus aliquid esse infinitum,
non aliquid in re significamus,
sed impotentiam in animo nostro;
tanquam si diceremus, nescire nos, an et ubi
terminetur.
Th. Hobbes, De cive XV 14
. . . l´homme qui n´est produit que pour l´infinité.
Blaise Pascal: Préface sur le Traité du vide
5.1 Ordinalzahlen
In seinen Untersuchungen über die Konvergenz von Fourierreihen führte C ANTOR
den Begriff der Ableitung A0 einer Menge A von reellen Zahlen ein: A0 besteht aus
den Elementen von A, welche Häufungspunkte von Elementen von A sind. Man
kann nun nach der Menge der Häufungspunkte dieser neuen Menge fragen und
damit eine Menge A00 bilden, die Menge der Häufungspunkte der Häufungspunkte
von A. Iteriert man diese Operation, so erhält man eine eine unendlich-absteigende
Folge
A ⊇ A0 ⊇ A00 ⊇ A000 . . .
deren “Limes” A∞ , d. h. in diesem Fall der Durchschnitt, möglicherweise wieder
isolierte Punkte enthält, so daß man wieder die Menge ihrer Häufungspunkte bil-
108
5.1. O RDINALZAHLEN
den kann. Auf diese Weise fortgesetzt, führt der Zählprozeß über die natürlichen
Zahlen hinaus ins Transfinite:
0, 1, 2, 3, . . . ∞, ∞ + 1, ∞ + 2, ∞ + 3, . . .
∞ + ∞, ∞ + ∞ + 1, ∞ + ∞ + 2, . . . ∞ + ∞ + ∞ . . .
Einen derartigen Zählprozeß erhalten wir auch, wenn wir die natürlichen Zahlen umordnen und neu aufzählen, etwa erst die Potenzen von 2, dann Potenzen
von 3, dann die Potenzen von 5 . . . :
1, 2, 4, 8, . . . 3, 9, 27, . . . 5, 25, 125, . . .
aber wo bleiben etwa die Zahlen 0, 6, 10, . . . ? Offenbar gibt es verschiedene
Möglichkeiten, ins Unendliche aufzuzählen, wie unterscheiden sich diese Möglichkeiten? Führen unterschiedliche Aufzählungen vielleicht zu Widersprüchen?
Lassen sich überhaupt alle Mengen in irgendeiner Weise aufzählen? Tatsächlich
ergeben sich Widersprüche, wenn man allzu naiv versucht, Eigenschaften von
endlichen auf unendliche Mengen zu übertragen; trotzdem kann man aber die
Theorie der Wohlordnungen und der Ordinalzahlen einheitlich für endliche und
unendliche Mengen begründen. Hier setzen wir zunächst einen intuitiven Mengenbegriff voraus (eine formale Begründung werden wir später nachliefern) und
erinnern an die in der Mathematik üblichen Ordnungsbegriffe:
5.1.1 Ordnungen
1. Eine (irreflexive) teilweise Ordnung auf einer Menge a ist eine 2-stellige
Relation < auf a, für die gilt:
(a) ∀x ∈ a x 6< x
(b) ∀x, y, z ∈ a (x < y ∧ y < z → x < z)
irreflexiv,
transitiv.
2. Eine (irreflexive) lineare Ordnung auf a ist eine teilweise Ordnung auf a
mit
(c) ∀x, y ∈ a (x < y ∨ x = y ∨ y < x)
vergleichbar.
Eine teilweise Ordnung nennt man manchmal auch eine partielle (oder Halb-)
Ordnung, eine lineare Ordnung manchmal auch einfach Ordnung. Die zugehörigen reflexiven Ordnungen erhält man durch die Festlegung
a ≤ b ↔ a < b ∨ a = b,
109
5.1. O RDINALZAHLEN
und umgekehrt kann man die obigen Begriffe auch erst axiomatisch für die reflexiven Varianten charakterisieren und die zugehörigen irreflexiven durch
a < b ↔ a ≤ b ∧ a 6= b
definieren.
Die gewöhnlichen Ordnungen auf den natürlichen, den ganzen, den rationalen
und den reellen Zahlen sind offenbar lineare Ordnungen; die Relation
f < g :↔ ∀x ∈ R
f (x) < g(x)
auf den reellen Funktionen ist dagegen nur eine teilweise Ordnung.
Die natürlichen Zahlen lassen sich der Größe nach aufzählen, aber für die anderen Zahlbereiche ist dies nicht möglich; selbst wenn man noch −∞ als “kleinste
Zahl” hinzunimmt, gibt es keine nächstgrößere (und bei dichten Ordnungen wie
den rationalen Zahlen gibt es zu überhaupt keiner Zahl eine nächstgrößere). Um
diese Bereiche in der Form {a0 , a1 , . . . an , an+1 . . .} aufzuzählen, müssen wir sie
neu ordnen, so daß man mit
(i) einem kleinsten Element beginnen kann,
und wenn man in der Aufzählung zu einem Element gekommen ist,
(ii) weiß, mit welchem Element man fortfahren kann, und schließlich
(iii) auch den Aufzählungsprozeß fortsetzen kann, wenn man bereits eine unendliche Teilfolge von Elementen aufgezählt hat (aber noch nicht alles aufgezählt ist).
Diese Anforderungen kann man präzisieren und zugleich vereinheitlichen, indem man verlangt, daß jede nicht-leere Teilmenge (nämlich der Rest der noch
nicht aufgezählten Elemente) ein kleinstes Element enthält (welches als “nächstes” aufzuzählen ist):
3. Eine Wohlordnung auf einer Menge a ist eine lineare Ordnung auf a, welche zusätzlich die Minimalitätsbedingung
(Min) ∀z(0/ 6= z ⊆ a → ∃x ∈ z ∀y ∈ z y 6< x)
erfüllt, welche wegen der Vergleichbarkeit (c) äquivalent ist zur Existenz
eines kleinsten Elementes:
(Kl) ∀z(0/ 6= z ⊆ a → ∃x ∈ z ∀y ∈ z x ≤ y),
wobei wie üblich x ≤ y :↔ x < y ∨ x = y.
110
5.1. O RDINALZAHLEN
Beispiele
Jede lineare Wohlordnung auf einer endlichen Menge ist eine Wohlordnung, ebenso die gewöhnliche Ordnung auf den natürlichen Zahlen. Dagegen sind die ganzen
Zahlen erst wohlgeordnet, wenn wir sie (etwa) in folgende Ordnung bringen:
0, 1, 2, 3, 4, . . . , −1, −2, −3, −4, . . . oder kürzer:
0, 1, −1, 2, −2, 3, −3, . . .
Im ersten Fall werden wir von einer Ordnung vom Typ ω + ω , sprechen, im
zweiten Fall vom Typ ω (und viele andere Möglichkeiten noch kennenlernen).
Dabei ist das frühere Symbol ∞ durch ω ersetzt worden, zugleich das einfachste (unendliche) Beispiel der jetzt einzuführenden Ordinalzahlen. Diese wurden
von C ANTOR als Repräsentanten (isomorpher) Wohlordnungen eingeführt; heute
definiert man sie nach VON N EUMANN als Mengen, die durch die ∈-Beziehung
wohlgeordnet sind und außerdem transitiv sind:
Definition
trans(a) :↔ ∀x ∈ a ∀y ∈ x y ∈ a
↔
transitiv
∀x ∈ a x ⊆ a
Achtung: trans(a) bedeutet nicht, daß die ∈-Beziehung auf a transitiv ist!
Beispiele
{{0}}
/ ist nicht transitiv, aber 0,
/ {0},
/ {0,
/ {0}},
/ . . . sind transitiv und werden als
Definition der natürlichen Zahlen 0, 1, 2, . . . gewählt:
0 := 0,
/
0
a := a + 1 := a ∪ {a}
Nachfolger von a.
Beginnt man also mit 0 := 0/ und wendet wiederholt die Nachfolgeroperation
an, so erhält man
1 := {0},
/ 2 := {0,
/ {0}}
/ = {0, 1}, 3 := {0,
/ {0},
/ {0,
/ {0}}}
/
= {0, 1, 2}. . .
0
allgemein: n = n ∪ {n} = {0, 1, 2, . . . , n}
111
5.1. O RDINALZAHLEN
für jede natürliche Zahl n (was wir aber erst noch definieren müssen). Diese Definition hat den Vorteil hat, daß
• die <-Beziehung auf den natürlichen Zahlen mengentheoretisch besonders
einfach ist, nämlich die ∈-Relation, und
• jede natürliche Zahl n genau n-viele Elemente enthält (nämlich die kleineren, beginnend mit 0 und endend mit n − 1).
5.1.2 Definition der Ordinalzahlen
con(a) : ↔
∀x, y ∈ a(x ∈ y ∨ x = y ∨ y ∈ x)
connex,
fund(a) :↔ ∀x ⊆ a(x 6= 0/ → ∃y ∈ x y ∩ x = 0)
/ fundiert,
Ord(a) : ↔
∈a : =
trans(a) ∧ con(a) ∧ fund(a)
Ordinalzahl,
{x, y | x, y ∈ a ∧ x ∈ y}
Elementbeziehung auf a.
Vereinbarung zur Fundierung
Wir werden der Einfachheit halber voraussetzen, daß alle Mengen fundiert sind.
Dann gilt also insbesondere:
b 6= 0/ → ∃y ∈ b y ∩ b = 0,
/ d. h.
b 6= 0/ → ∃y ∈ b ∀z ∈ b z 6∈ y,
was besagt, daß jede nicht-leere Menge b ein (bezüglich der ∈-Relation) minimales Element besitzt (vgl. die Bedingung (Min) in der Definition einer Wohlordnung). Damit werden einige ungewöhnliche Mengen ausgeschlossen, insbesondere Mengen a, die sich selbst als Element enthalten oder mit anderen Mengen
einen endlichen ∈-Zyklus bilden. Es gilt somit:
(F∗ ) (a 6∈ a), ¬(b ∈ c ∧ c ∈ b), ¬(d ∈ b ∧ b ∈ c ∧ c ∈ d), . . .
Damit läßt sich die Definition der Ordinalzahlen vereinfachen (siehe (i) in folgendem Satz). Später weren wir ohnehin das Fundierungsaxiom (in der Form:
alle Mengen sind fundiert) voraussetzen; alle folgenden Aussagen über Ordinalzahlen lassen sich jedoch ohne das Fundierungsaxiom beweisen, wenn man die
ursprüngliche Definition zugrunde legt.
112
5.1. O RDINALZAHLEN
5.1.3 Satz: Charakterisierung von Ordinalzahlen
(i) Ord(a) ↔ trans(a) ∧ con(a).
(ii) Ordinalzahlen sind transitive Mengen, die durch die ∈-Relation wohlgeordnet sind:
Ord(a) :↔ trans(a)∧ ∈a ist Wohlordnung auf a.
(iii) Elemente von Ordinalzahlen sind wieder Ordinalzahlen:
Ord(a) ∧ b ∈ a → Ord(b).
Beweis: (i) gilt wegen unserer Vereinbarung. Für (ii) ist nur zu zeigen:
Ord(a) → trans(∈a ).
Sei also Ord(a), sowie b, c, d ∈ a mit b ∈ c ∧ c ∈ d.
Es gilt:
Falls
falls
b ∈ d ∨d = b∨d ∈ b
d = b, so hätten wir b ∈ c ∧ c ∈ b
d ∈ b, so d ∈ b ∧ b ∈ c ∧ c ∈ d
Beh.: b ∈ d.
wegen con(a).
im Widerspruch zu (F*)
im Widerspruch zu (F*).
Somit bleibt nur die Möglichkeit b ∈ d.
Um (iii) zu zeigen, sei Ord(a) ∧ b ∈ a. Dann ist wegen trans(a) : b ⊆ a und
mit ∈a auch ∈b eine Wohlordnung. Somit brauchen wir wegen (ii) nur noch zu
zeigen, daß auch b transitiv ist:
Sei x ∈ y ∈ b. Beh.: x ∈ b. Dazu argumentieren wir wie oben: Es sind x, b ∈ a (ersteres wegen trans(a)), also sind beide wegen con(a) miteinander vergleichbar:
x ∈ b ∨ x = b ∨ b ∈ x, wobei die letzten beiden Möglichkeiten zu einem Widerspruch zur Fundierung (F*) führen.
5.1.4 Die Ordnung der Ordinalzahlen
Ordinalzahlen werden üblicherweise mit kleinen griechischen Buchstaben bezeichnet:
α, β , γ, . . . , ξ , η, ζ , . . .
∀ξ . . . ∃ζ , . . .
Ferner schreiben wir
α <β
α ≤β
stehen für Ordinalzahlen, ebenso die Quantoren
für ∀x(Ord(x) → . . .), ∃y(Ord(y) ∧ . . .), . . .
für
für
α ∈ β,
α ∈ β ∨α = β.
Wir werden gleich zeigen, daß die Ordinalzahlen durch die ∈-Relation nicht nur
geordnet, sondern sogar wohlgeordnet ist, so daß diese Bezeichnungsweise gerechtfertigt ist. Der obige Satz 5.1.3 besagt also im Teil (iii) : α = {ξ | ξ < α}.
113
5.1. O RDINALZAHLEN
Satz
trans(b) ∧ b ⊆ α → Ord(b) ∧ (b ∈ α ∨ b = α), insbesondere
β ≤ α ↔ β ∈ α ∨ β = α ↔ β ⊆ α.
Beweis: Sei trans(b) ∧ b ⊆ α. Dann ist auch ∈b eine Wohlordnung, also Ord(b)
nach Satz 5.1.3 (ii).
Falls b 6= α, so b ⊂ α, d. h. α − b 6= 0,
/ und wir können wegen der Fundiertheit
ein minimales γ ∈ α − b wählen, von dem wir zeigen werden, daß b = γ und damit
b ∈ α wie erwünscht:
Sei also γ ∈ α − b ∈-minimal, so daß insbesondere ∀x ∈ γ x ∈ b, d. h. γ ⊆ b.
Es gilt dann aber auch b ⊆ γ :
Sei x ∈ b. Dann x ∈ α (nach Voraussetzung) und x ∈ γ ∨ x = γ ∨ γ ∈ x wegen
con(α). Aber die letzten beiden Fälle können nicht eintreten: x = γ → γ ∈ b und
γ ∈ x → γ ∈ b (wegen trans(b)), es ist aber nach Wahl von γ : γ ∈ α − b.
Somit haben wir mengentheoretisch nicht nur eine einfache <-Beziehung auf
den Ordinalzahlen (nämlich die ∈-Beziehung), sondern auch eine einfache ≤Beziehung (nämlich die ⊆-Beziehung). Insbesondere gilt somit:
α ∪ β = max{α, β } und
α ∩ β = min{α, β }.
Es ist nun leicht zu sehen, daß 0 die kleinste Ordinalzahl ist und daß mit einer
Ordinalzahl α auch α 0 wieder eine Ordinalzahl ist (und zwar die nächst größere), so daß alle natürlichen Zahlen insbesondere Ordinalzahlen sind. Es gibt aber
tatsächlich unmäßig viele Ordinalzahlen:
Satz
(i) Die ∈-Beziehung ist eine Wohlordnung auf allen Ordinalzahlen.
(ii) Es gibt keine Menge aller Ordinalzahlen.
(Antinomie von Burali-Forti)
Beweis von (i):
α 6∈ α
α ∈β ∈γ →α ∈γ
α ∈ β ∨α = β ∨β ∈ α
nach dem Fundierungsaxiom (oder wegen f und(α))
wegen trans(γ)
kann man wie folgt zeigen:
5.2. M ENGEN UND K LASSEN
114
Sei δ := α ∩ β das Minimum der beiden Ordinalzahlen. Dann ist trans(δ ) und
δ ⊆ α, β , also nach nach dem vorangegegangen Satz: δ = α ∨ δ ∈ α und ebenso
δ = β ∨ δ ∈ β , aber im Fall δ ∈ α ∧ δ ∈ β erhielten wir den Widerspruch δ ∈ δ !
Somit ist die ∈-Beziehung auf den Ordinalzahlen eine lineare Ordnung. Sie
ist ferner eine Wohlordnung, da für Mengen a von Ordinalzahlen die Minimalitätsbedingung 0/ 6= a → ∃α ∈ a α ∩ a = 0/ nach unserer Vereinbarung (also dem
Fundierungsaxiom) erfüllt ist.
(ii) Angenommen, es gäbe eine Menge a aller Ordinalzahlen. Nach Satz 5.1.3
(iii) ist a transitiv und nach der gerade bewiesenen Aussage (i) ist die ∈-Beziehung
eine Wohlordnung auf a, also ist a selbst eine Ordinalzahl, somit a ∈ a nach Definition von a als Menge aller Ordinalzahlen, aber anderseits gilt a 6∈ a für alle
Ordinalzahlen a, Widerspruch! (Man könnte auch so argumentieren: die Menge a
aller Ordinalzahlen wäre als Ordinalzahl die größte Ordinalzahl, dann kann aber
nicht a ∈ a sein!)
Die Antinomie von B URALI -F ORTI (1897) war C ANTOR übrigens bereits
schon 1895 bekannt. Welche Bedeutung hat sie? Sie besagt, daß es keine größte
Ordinalzahl gibt, und wir können sie als Aussage verstehen, daß die Gesamtheit
aller Ordinalzahlen so “groß” ist, daß sie sich nicht zu einer Menge zusammenfassen läßt. Das wäre an sich harmlos, wenn man nun nicht befürchten müßte,
daß vielleicht an einer anderen Stelle der Theorie ein (womöglich bisher noch gar
nicht entdeckter) Widerspruch versteckt ist, der sich nicht so einfach hinweginterpretieren läßt. Wir wollen daher erst einmal innehalten, um uns den Grundlagen
der Mengenlehre zuzuwenden.
5.2 Mengen und Klassen
In seinem Hauptwerk1 gab C ANTOR seine berühmte Beschreibung einer Menge:
Unter einer “Menge” verstehen wir jede Zusammenfassung M von
bestimmten wohlunterschiedenen Objekten unserer Anschauung oder
unseres Denkens (welche die “Elemente” von M genannt werden) zu
einem Ganzen.
Man kann diese “Definition” in folgendem Sinne zu präzisieren versuchen:
1 C ANTOR ,
G EORG Beiträge zu Begründung der transfiniten Mengenlehre.
Math. Ann. 46, (1895), 481 - 512, Math. Ann. 49, (1897), 207 - 246
115
5.2. M ENGEN UND K LASSEN
Zu jeder Eigenschaft E(x) existiert die Menge M aller Objekte x
mit der Eigenschaft E(x): M = {x : E(x)}.
Z ERMELOs Erklärung des Begriffes Eigenschaft als definite Eigenschaft wurde
von F RAENKEL und S KOLEM dahingehend präzisiert, daß Eigenschaften als Ausdrücke einer bestimmten formalen Sprache festzulegen sind. Für diese Sprache,
LZF , reicht es aus, die prädikatenlogische Sprache mit ∈ als 2-stelligem Symbol für die Element-Beziehung zu wählen. Die Formeln von LZF werden in diesem Teil mengentheoretische Formeln (oder einfach: Formeln) genannt und wie
früher mit ϕ, ψ, . . . bezeichnet. Die C ANTORsche Definition kann nun als Forderung präzisiert werden:
5.2.1 Komprehensionsaxiom
∃y∀x(x ∈ y ↔ ϕ(x))
wobei ϕ(x) eine beliebige Formel ist, in welcher y nicht vorkommt.
Dieses Axiom (eigentlich ein Axiomenschema, da es aus unendlich vielen Axiomen besteht) ist nun aber widerspruchsvoll: Wie wir gerade mittels der Antinomie von B URALI -F ORTI gesehen haben, führt es für die Eigenschaft Ord(x) zu
Widerspruch, da es keine Menge aller Ordinalzahlen geben kann. B. RUSSELL
entdeckte einen Widerspruch, der viel elementarer zu erhalten ist:
RUSSELLsche Antinomie (1903)
Wählt man für ϕ(x) die Formel x 6∈ x, so liefert das Komprehensionsaxiom die
Existenz einer Menge r mit
∀x(x ∈ r ↔ x 6∈ x) insbesondere gilt für x = r :
r ∈ r ↔ r 6∈ r
Widerspruch!
Ähnliche Widersprüche hatte man zwar schon früher erhalten (Antinomie der
“Menge aller Mengen” von C ANTOR, Antinomie der “Menge aller Ordinalzahlen” von C ANTOR und B URALI -F ORTI). Diese frühen Antinomien waren jedoch
weniger beunruhigend, eher konnten sie positiv bewertet werden als Ausdruck der
Reichhaltigkeit des Mengen- und Ordinalzahlbegriffes sowie als Ausweis einer
Grenze, über die man nicht hinausgehen konnte. Dagegen war die Antinomie von
RUSSELL (die um die gleiche Zeit auch bereits Z ERMELO bekannt war) besonders elementar und ließ sich auch umschreiben in einen Widerspruch innerhalb
116
5.2. M ENGEN UND K LASSEN
der Prädikatenlogik, wie sie F REGE in seiner Begriffsschrift (1879) zu präzisieren versucht hatte. Als 1903 der 2. Band seiner Grundgesetze der Arithmetik im
Druck war, teilte RUSSELL ihm seine Antinomie brieflich mit, und Frege erklärte
daraufhin eine der Grundlagen seiner Theorie als erschüttert.
5.2.2 Auswege aus den Antinomien
a) RUSSELLsche Typentheorie
Im Komprehensionsaxiom darf zur Vermeidung eines circulus vitiosus bei
der Definition der Menge y durch die Eigenschaft ϕ(x) nicht auf einen Bereich Bezug genommen werden, dem dieses y selbst angehört. Man nimmt
eine Stufeneinteilung vor: x0 , x1 , . . . und vereinbart, daß xn ∈ xm nur erlaubt
ist, wenn m = n + 1. Das Komprehensionsaxiom hat dann die Form
∃yn+1 ∀xn (xn ∈ yn+1 ↔ ϕ(xn )).
Da die Bildung von rn 6∈ rn nicht mehr erlaubt ist, ist die RUSSELLsche Antinomie nicht mehr formulierbar. Dieses prädikative Komprehensionsaxiom schränkt die Mengenbildung jedoch stark ein; die Idee eines stufenweisen Aufbaus der Mengenlehre läßt sich jedoch auch in der ZF-Mengenlehre
wieder finden.
b) von N EUMANN , G ÖDEL , B ERNAYS: Unterscheidung zwischen Mengen
und Klassen
Man läßt eine (mehr oder weniger beschränkte) Komprehension von Mengen zu, das Ergebnis ist dann aber nicht notwendig wieder eine Menge,
sondern zunächst eine Klasse {x | ϕ(x)}. So kann man bilden:
die RUSSELLsche Klasse
R = {x | x 6∈ x},
die Klasse aller Mengen
V = {x | x = x},
die Klasse aller Ordinalzahlen, Kardinalzahlen, usw.
Das Auftreten von Antinomien wird nun dadurch vermieden, daß Klassen
nicht notwendig wieder Mengen sind; z. B. kann R in die Eigenschaft, welche R definiert, nur dann eingesetzt werden, wenn R eine Menge x ist, und da
diese Annahme zum Widerspruch führt, kann R keine Menge sein, sondern
nur eine Klasse (echte Klasse oder Unmenge). Welche Klassen zugleich
auch Mengen sind, versucht man durch Axiome festzulegen, wobei man
117
5.2. M ENGEN UND K LASSEN
• einerseits möglichst viele Klassen als Mengen (und damit wieder als
Elemente von Mengen und Klassen) erlauben möchte,
• andererseits aber nicht so viele, daß es zu einem Widerspruch kommt.
c) Z ERMELOsches Aussonderungsaxiom
Das Komprehensionsaxiom wird eingeschränkt auf die Bildung von Teilmengen einer bereits gegebenen Menge a:
Aussonderungsaxiom: ∃y∀x(x ∈ y ↔ x ∈ a ∧ ϕ(x))
Versucht man erneut, die RUSSELLsche Antinomie abzuleiten, so erhält
man die Existenz einer Menge r mit
r ∈ r ← r ∈ a ∧ r 6∈ r, also
• es gibt keine “Menge aller Mengen” (für a eingesetzt, erhielte man
den RUSSELLschen Widerspruch),
• es gibt eine “leere” Menge (setze für ϕ(x) ein: x 6= x und für a irgendeine Menge).
Das Aussonderungsaxiom ist nachweisbar widerspruchsfrei - es ist bereits wahr in
einem Modell, welches nur die leere Menge enthält. Um es darüber hinaus anwenden zu können, müssen wir die Menge a, aus welcher mittels der Eigenschaft ϕ(x)
eine Teilmenge ausgesondert wird, bereits haben - weitere Axiome sind erforderlich! Im folgenden werden wir - wie jetzt allgemein üblich - der Entwicklung der
Mengenlehre nach Z ERMELO folgen, dabei aber auch den Klassenbegriff benutzen, weil sich damit die Axiome von ZF leicht in der Form
bestimmte Klassen (und zwar “nicht zu große”) sind Mengen
bequem ausdrücken lassen.
5.2.3 Die mengentheoretische Sprache mit Klassentermen
Wie schon angedeutet, benötigen wir für die ZF-Sprache nur die ∈-Beziehung
als einziges nicht-logisches Prädikat. Zur Abwechslung wollen wir hier syntaktisch zwischen freien und gebundenen Variablen unterscheiden: Als Variable für
Mengen benutzen wir Kleinbuchstaben, und zwar meistens
• a, b, c, . . . für freie Variable und
118
5.2. M ENGEN UND K LASSEN
• x, y, z, . . . (u. U. mit Indizes) für gebundene Variable.
Die damit gebildete Sprache LZF werden wir erweitern um die Hinzunahme von
definierbaren Klassen (auch Klassenterme genannt)
{x | ϕ(x)},
welche in Formeln jedoch nur in der Kombination a ∈ {x | ϕ(x)} benötigt werden,
so daß Formeln wie folgt gebildet werden:
(F1) Sind a, b Mengenvariable, so sind a = b und a ∈ b Formeln (Primformeln,
atomare Formeln).
(F2) Ist ϕ eine Formel, so auch ¬ ϕ.
(F3) Sind ϕ und ψ Formeln, so auch (ϕ ∨ ψ).
(F4) Ist ϕ(a) eine Formel, in welcher die Variable x nicht vorkommt, so auch
∃xϕ(x).
(F5) Ist ϕ(a) eine Formel, in welcher die Variable x nicht vorkommt, so ist auch
a ∈ {x | ϕ(x)} eine Formel.
(F6) Das sind alle Formeln.
Von Formeln der ZF-Sprache im engeren Sinne sprechen wir, wenn bei der
Bildung dieser Formeln die Bedingung (F5) nicht benutzt wurde, ansonsten von
Formeln der erweiterten ZF-Sprache.
Die logischen Symbole ∧, →, ↔ sowie der ∀-Quantor werden wie früher definiert. Außerdem benutzen wir beschränkte Quantoren ∀x ∈ a, ∃x ∈ a als Abkürzungen:
∀x ∈ a ϕ steht für ∀x(x ∈ a → ϕ),
∃x ∈ a ϕ steht für ∃x(x ∈ a ∧ ϕ).
Für viele Untersuchungen spielen Fragen der Komplexität von Eigenschaften eine wichtige Rolle; dabei gelten beschränkte Quantoren als “einfacher” als unbeschränkte Quantoren. Wir werden daher im folgenden - soweit möglich - beschränkte Quantoren verwenden.
119
5.2. M ENGEN UND K LASSEN
Elimination von Klassentermen
Unser erstes Axiom (für die erweiterte ZF-Sprache) ist das folgende
CHURCHsche Schema (CS):
a ∈ {x | ϕ(x)} ↔ ϕ(a).
Es erlaubt, Klassenterme wieder zu eliminieren.
Die erweiterte ZF-Sprache ist somit eigentlich nicht ausdrucksstärker, aber
es wird sich zeigen, daß sie für mengentheoretische Überlegungen bequemer zu
benutzen ist, vor allem weil man für jede Eigenschaft ϕ(x, . . .) die Klasse {x |
ϕ(x, . . .)} bilden kann, während man zur Bildung einer entsprechenden Menge
erst nachprüfen muß, ob die Axiome dies zulassen bzw. ob man einen Widerspruch erhält, was sehr schwierig (oder sogar unmöglich) sein kann!
Variable für Klassen
Schließlich noch ein weiterer Schritt: Um nicht immer über die Klassenterme
{x | ϕ(x, . . .)} durch Angabe von Formeln sprechen zu müssen, werden neue Variable A, B, . . . für Klassenterme benutzt. Damit nähern wir uns einer Sprache 2.
Stufe, in welcher neben den Variablen für Mengen (Kleinbuchstaben) auch Variable für Klassen (Großbuchstaben) auftreten (vgl. die entsprechende Situation
in der P EANO-Arithmetik 3.5.4). Streng genommen werden hier keine formalen
Klassenvariable eingeführt, sondern Metavariable für Klassenterme. Das bedeutet, daß eine Aussage der Form
es gibt ein A mit . . . A . . . B. . .
als Behauptung zu lesen ist, für einen vorgegebenen Klassenterm B einen Klassenterm A konkret (d. h. durch eine Formel) anzugeben, der die gewünschte Eigenschaft besitzt; ebenso bedeutet eine universelle Aussage der Form
für alle A . . . A . . .
daß sie für alle (konkret definierbaren) Klassenterme A gilt.
Es gibt nun allerdings Axiomensysteme der Mengenlehre mit freien und möglicherweise auch gebundenen Klassenvariable (also in einer Sprache 2. Stufe mit
formalen Variablen wie den Mengenvariablen), in denen Klassen eine stärkere
Rolle spielen:
5.2. M ENGEN UND K LASSEN
120
5.2.4 Überblick über verschiedene Axiomensysteme
Die Axiomensysteme der Mengenlehre unterscheiden sich weniger in dem jeweils zugelassenen Bereich von Mengen als in dem Status, den sie den Klassen
einräumen:
• ohne Klassen:
das Axiomensystem ZF von Z ERMELO -F RAENKEL in der (engeren) ZFSprache
• mit eliminierbaren Klassen (“virtuelle Klassen” (Q UINE)):
das Axiomensystem ZF von Z ERMELO -F RAENKEL in der erweiterten ZFSprache (welches wir hier zugrunde legen werden)
• mit freien Klassenvariablen:
das Axiomensystem von B ERNAYS 1958
• mit freien und gebundenen Klassenvariablen, aber nur prädikativen Klassen:
das Axiomensystem NBG (von N EUMANN-G ÖDEL-B ERNAYS)) mit dem
Komprehensionsaxiom in der Form
∃Y ∀x(x ∈ Y ↔ ϕ(x, . . . , A, . . .)).
Hier stehen A, B, . . . , X,Y, . . . für Klassen, x, y, . . . weiterhin für Mengen, und
ϕ(x, . . .) ist eine Eigenschaft von Mengen (möglicherweise mit Klassen als
Parametern), in welcher aber nur über Mengen quantifiziert werden darf prädikative Form).
• Klassen, ernst genommen (imprädikativ):
das Axiomensystem QM von Q UINE -M ORSE mit dem Komprehensionsaxiom wie oben, aber jetzt werden auch Formeln zugelassen, die Quantifikationen über Klassen enthalten; in diesem System lassen sich mehr Aussagen
über Mengen beweisen als in NBG!
Neben der Entscheidung, welchen existentiellen Wert man den Klassen einräumen soll, bleibt als Hauptproblem die Frage: welche Mengen existieren - bzw.:
(i) welche Eigenschaften definieren Mengen - oder
(ii) (wenn wir ein allgemeines Komprehensionsprinzip für Klassen zugrunde
legen): welche Klassen führen zu Mengen?
5.2. M ENGEN UND K LASSEN
121
Grundlegend werden folgende Vorstellungen sein:
• Es gibt Mengen und Klassen; ihre Gleichheit wird durch das Extensionalitätsprinzip bestimmt: Mengen bzw. Klassen sind identisch, wenn sie vom
selben Umfang sind, d. h. dieselben Elemente enthalten.
• Elemente von Klassen und Mengen sind wieder Mengen; echte Klassen
(wie die RUSSELLsche Klasse) sind dagegen niemals Elemente - weder von
Mengen noch von anderen Klassen.
• Komprehensionsprinzip: Jeder Eigenschaft E(x) von Mengen x entspricht
die Klasse {x | E(x)} aller Mengen x mit der Eigenschaft E(x),
• insbesondere ist jede Menge a eine Klasse (nämlich: a = {x | x ∈ a}),
• umgekehrt ist aber nicht jede Klasse eine Menge, sondern nur diejenigen
Klassen, die nicht “zu groß” sind, sind Mengen (limitation of size).
Klassen sind somit nach dem Komprehensionsprinzip (nahezu) unbeschränkt bildbar, Mengen existieren (als spezielle Klassen) nur nach Maßgabe einzelner Axiome.
Literatur zu diesem Kapitel
B ERNAYS, P. Axiomatic Set Theory. Amsterdam 1958
F ELGNER, U. (Herausgeber) Mengenlehre. Darmstadt 1979
F RAENKEL , A.- BAR H ILLEL , Y. - L ÉVY, A. Foundations of Set Theory.
Amsterdam 1973
F RAENKEL , A.A. Zu den Grundlagen der Cantor-Zermeloschen Mengenlehre.
Math Ann 86 (1922), 230 - 237, auch in: F ELGNER [1979]
S KOLEM , T. Einige Bemerkungen zur axiomatischen Begründung der Mengenlehre. Kongreß Helsingfors 1922 (auch in F ELGNER [1979])
5.3. E XTENSIONALIT ÄT UND AUSSONDERUNG
122
5.3 Extensionalität und Aussonderung
Wie bereits erwähnt, sind Mengen bestimmt allein durch ihre Elemente (wobei
die Elemente ihrerseits natürlich wieder Mengen sind). Diese Vorstellung wird
ausgedrückt durch das
Extensionalitätsaxiom (Ext)
∀x(x ∈ a ↔ x ∈ b) → a = b.
Aufgrund der logischen Axiome über die Gleichheit gilt auch die Umkehrung,
also:
a = b ↔ ∀x(x ∈ a ↔ x ∈ b).
Somit könnte man im Prinzip auf die Gleichheit als logisches Grundsymbol verzichten und sie mittels der Elementbeziehung definieren. - Denkbar wäre auch
eine Definition durch
intensionale (Leibniz-)Gleichheit:
∀x(a ∈ x ↔ b ∈ x) ↔ a = b.
Diese Äquivalenz wird später einfach beweisbar sein (mit Existenz der EinerMenge).
Mengen ohne Elemente bezeichnet man auch als Urelemente; aus dem Extensionalitätsaxiom folgt, daß es höchstens eine solche Menge gibt, die leere Menge.
Es besteht durchaus die Möglichkeit, weitere derartige Mengen als Urelemente
zuzulassen, für den mengentheoretischen Aufbau der Mathematik werden sie jedoch nicht benötigt.
Die Gleichheit von Klassen bzw. Klassen und Mengen wird als Umfangsgleichheit definiert:
A = B : ↔ ∀x(x ∈ A ↔ x ∈ B),
A = b : ↔ ∀x(x ∈ A ↔ x ∈ b),
a = B : ↔ ∀x(x ∈ a ↔ x ∈ B),
und in ähnlicher Weise (da Elemente stets Mengen sein sollen):
A ∈ B : ↔ ∃y(y = A ∧ y ∈ B),
A ∈ b : ↔ ∃y(y = A ∧ y ∈ b).
Somit sind nun die Grundprädikate = und ∈ für sowohl Mengen wie auch Klassen
definiert.
Wenn eine Klasse dieselben Elemente wie eine Menge enthält, so sind nach
unserer Definition beide gleich, und genau in diesem Fall werden wir eine Klasse
eine Menge nennen:
123
5.3. E XTENSIONALIT ÄT UND AUSSONDERUNG
Mg(A) :↔ ∃x(x = A)
Mg(A) ↔ A ∈ V,
V := {x | x = x}
A ist eine Menge, somit gilt also
wobei
Klasse aller Mengen, Allklasse, Universum.
(Klassen, die keine Mengen sind, nennt man auch echte Klassen.)
Von der Element-Beziehung zu unterscheiden ist die Teilmengen-Beziehung
(Inklusion) (auch wenn man in beiden Fällen vom “Enthalten” spricht):
A ⊆ B : ↔ ∀x(x ∈ A → x ∈ B)
A ⊂ B : ↔ A ⊆ B ∧ A 6= B
Somit kann man die Gleichheit zweier Mengen nachweisen, indem man zeigt,
daß sie wechselweise ineinander enthalten sind:
A = B ↔ A ⊆ B ∧ B ⊆ A.
Die Booleschen Operationen
können wir allein mit Hilfe der Klassenschreibweise einführen:
A∩B
A∪B
A−B
−B
: = {x | x ∈ A ∧ x ∈ B}
: = {x | x ∈ A ∨ x ∈ B}
: = {x | x ∈ A ∧ x 6∈ B}
: = {x | x 6∈ B}
Durchschnitt
Vereinigung
relatives Komplement
Komplement
Damit erhalten wir nun die Gesetze einer B OOLEschen Algebra, wie wir sie
bereits von der Aussagenlogik her kennen (s. 1.2.6). Sie gelten statt für Klassen
natürlich auch für Mengen, allerdings führen nicht alle Operationen von Mengen
zu Mengen (aber von Klassen zu Klassen), denn in den üblichen mengentheoretischen Axiomensystemen ist V (und das Komplement einer Menge) keine Menge.
Bereits erwähnt haben wir das
ZERMELOsche Aussonderungsschema (AusS)
∃y∀x(x ∈ y ↔ x ∈ a ∧ ϕ(x, . . .))
Unter Benutzung von Klassenvariablen und einfachen Definitionen erhalten
wir den
124
5.4. R ELATIONEN UND F UNKTIONEN
Satz
Das Aussonderungsschema ist äquivalent zu den folgenden Aussagen:
(i) ∃y∀x(x ∈ y ↔ x ∈ a ∧ x ∈ A)
Aussonderungsaxiom
(ii) ∃y(y = a ∩ A)
(iii) a ∩ A ∈ V , d. h. Mg(a ∩ A)
(iv) A ⊆ a → Mg(A)
Abschätzungssatz
Somit erhalten wir die Existenz folgender Mengen:
0,
/ a ∩ b, a − b,
wobei b auch eine Klasse B sein darf. Dagegen kann die Allklasse V keine Menge
sein.
5.4 Relationen und Funktionen
Um Relationen und Funktionen als spezielle Klassen einzuführen, benutzen wir
geordnete Paare: Zunächst können wir folgende Klassen bilden:
{a, b} := {x | x = a ∨ x = b}
{a} := {x | x = a} = {a, a}
ungeordnetes Paar
Einerklasse von a.
Dieses sind offensichtlich sehr kleine Klassen, wir können also das
Paarmengenaxiom (Paar)
∃y∀x(x ∈ y ↔ x = a ∨ x = b), d. h. Mg({a, b})
annehmen und damit die folgenden Mengen erhalten:
{a, b}, {a}, {a, {a, b}}, {{a, c}, {e, {a, e}}}, {{a, {a, b}},
{{a, c}, {e, {a, e}}}, . . . usw.
5.4. R ELATIONEN UND F UNKTIONEN
125
Geordnetes Paar (Wiener 1914, Kuratowski 1921)
(a, b) := {{a}, {a, b}}
geordnetes Paar
Mittels geordneter Paare lassen sich auch Tripel (a, b, c) := (a, (b, c)) und allgemeiner n-Tupel definieren. Die genaue Definition des geordneten Paares und
des n-Tupels ist hier nicht wichtig, wir benötigen nur ihre charakteristischen Eigenschaften:
(a, b) = (c, d) ↔ a = c ∧ b = d, und allgemein:
(a1 , . . . , an ) = (b1 , . . . , bn ) ↔ ai = bi für alle i = 1, . . . , n.
Damit können wir damit 2-stellige Relationen (und ähnlich mittels n-Tupeln nstellige Relationen) auf Klassen zurückführen:
(a, b) ∈ A ↔ ϕ(a, b),
entsprechend unserer früheren Einführung von Klassen als Extensionen 1-stelliger
Prädikate:
a ∈ A ↔ ϕ(a).
Die Klasse der Paare (x, y) mit der Eigenschaft ϕ(x, y) ist
{x, y | ϕ(x, y)} := {z | ∃x∃y(z = (x, y) ∧ ϕ(x, y))}
oder auch geschrieben {(x, y) | ϕ(x, y)}.
Sonderfälle sind
A×B
An
:= {(x, y) | x ∈ A ∧ y ∈ B},
cartesisches Produkt,
:= {(x1 , . . . , xn ) | x1 , . . . , xn ∈ A}. n-faches Produkt von A.
n-stellige Relationen identifizieren wir mit den n-Tupeln, die diese Relationen
erfüllen:
R ist n-stellige Relation auf A : ↔ R ⊆ An
Im Falle einer 2-stelligen Relation schreiben wir dann auch wie üblich:
aRb :↔ (a, b) ∈ R.
Funktionen sind 2-stellige Relationen von Paaren (x, y), in denen y durch x
eindeutig bestimmt ist:
Fkt(F) :↔ F ⊆ V ×V ∧ ∀x, y, z ((x, y) ∈ F ∧ (x, z) ∈ F → y = z).
Somit werden Funktionen wir mit ihren Graphen identifiziert:
126
5.4. R ELATIONEN UND F UNKTIONEN
F : A −→ B : ↔ F ⊆ A × B ∧ ∀x ∈ A ∃!y ∈ B (x, y) ∈ F
Hierfür sagen wir auch: F ist Funktion von A nach B. Für x ∈ A bezeichnet
F(x) das eindeutig bestimmte y mit (x, y) ∈ F
den Funktionswert von F an der Stelle x, und für D ⊆ A ist
{F(x) | x ∈ D} := F[D] := {y | ∃x(x ∈ D ∧ y = F(x))} das F-Bild von D
F D
:= {(x, F(x)) | x ∈ D} die Funktion F, eingeschränkt auf D.
Im Falle von Strukturen werden wir Funktionen F mit F : An → A betrachten;
wir sagen dann auch, daß F eine n-stellige Funktion auf der Menge A ist.
Häufig definiert man eine Funktion durch Angabe ihres Wertes F(x) für x ∈ A:
F : A −→ B,
x 7→ F(x).
Unter den Funktionsbegriff fällt auch der Begriff der Familie: Für eine Indexmenge I ist
(xi )i∈I die Funktion f mit Definitionsbereich I und f (i) = xi für alle i ∈ I.
Im Falle I = N spricht man auch von einer Folge, für I = {0, . . . , n − 1} entspricht
die endliche Folge einem n-Tupel.
Injektive, surjektive und bijektive Funktionen
Ist F : A −→ B, also F eine Abbildung von A nach B, so nennen wir
• A Definitionsbereich von F,
• B Bildbereich von F, und
• W (F) := {F(x) | x ∈ A} Wertebereich von F.
(Bild- und Wertebereich werden oft gerade in umgekehrter Weise bezeichnet!)
Der Bildbereich B ist durch F nicht eindeutig bestimmt; er braucht nämlich
den Wertebereich W (F) nur zu enthalten. Ist jedoch Bildbereich = Wertebereich,
so heißt F surjektiv (oder: auf B):
F : A B :↔ F : A −→ B ∧ B = {F(x) | x ∈ A}.
127
5.5. V EREINIGUNG UND P RODUKT
In diesem Fall gibt es also zu jedem b ∈ B mindestens ein a ∈ A mit F(a) = b.
Die Angabe des Bildbereiches B ist in diesem Fall wichtig, da jede Funktion eine
Abbildung auf ihren Wertebereich ist!
Eine Funktion F : A −→ B heißt injektiv oder eineindeutig gdw es zu jedem
b ∈ W (F) genau ein a ∈ A mit F(a) = b gibt, welches mit a = F −1 (b) als Urbild
von b bezeichnet wird:
F : A B :↔ F : A −→ B ∧ ∀x, y ∈ A (F(x) = F(y) → x = y).
Für eine injektive F Funktion gibt es also eine inverse Funktion F −1 , und zwar ist
F −1 : W (F) −→ A
für injektives F : A −→ B.
Eine Funktion F : A −→ B heißt bijektiv gdw F injektiv und surjektiv ist:
F : A ←→ B :↔ F : A B ∧ F : A B.
Für eine bijektive Funktion F : A ←→ B ist dann die inverse Funktion (oder
Umkehrfunktion) eine (ebenfalls bijektive) Abbildung
F −1 : B ←→ A mit
F −1 (F(a)) = a, F(F −1 (b)) = b für alle a ∈ A, b ∈ B.
5.5 Vereinigung und Produkt
5.5.1 Vereinigung
Eine einfache mengentheoretische Operation führt von zwei Mengen zu ihrer Vereinigung; wir werden gleich eine allgemeinere Mengenbildung einführen, nämlich
die Vereinigung der Elemente einer Klasse (und dual der entsprechende Durchschnitt):
S
S
A := x∈A x := {z | ∃x ∈ A z ∈ x}
T
T
A :=
x∈A x
:= {z | ∀x ∈ A z ∈ x}
Vereinigung (Summe)
Durchschnitt
Die Vereinigung der Elemente einer Menge (welches stets Mengen sind) sollte
wieder eine Menge ergeben:
S
Summenaxiom (Zermelo) (Sum)
Mg( a),
ausgeschrieben also:
∃y∀z(z ∈ y ↔ ∃x ∈ a z ∈ x).
128
5.5. V EREINIGUNG UND P RODUKT
Lemma
{a} = a,
S
{a} = a,
T
(i)
S
(ii)
T
{a, b} = a ∪ b
{a, b} = a ∩ b
(iii)
a ist das Supremum der Elemente von a bzgl. ⊆:
S
S
∀x ∈ a x ⊆ a, ∀x ∈ a x ⊆ c → a ⊆ c.
(iv)
a ist das Infimum der Elemente von a bzgl. ⊆:
S
S
∀x ∈ a a ⊆ x, ∀x ∈ a c ⊆ x → c ⊆ a.
(v)
S
0/ = 0,
/
T
S
T
0/ = V,
S
V = V,
T
V = 0/ .
Bemerkungen
1. Aus dem Summen- und Paarmengenaxiom folgt also, daß für je zwei Mengen a und b die Vereinigung a ∪ b wieder eine Menge ist, damit ist dann
aber das absolute Komplement einer Menge −a stets eine echte Klasse!
2. Dagegen ist a ∩ b eine Menge nach dem Aussonderungsaxiom, allgemeiner
gilt nach (AusS):
\
A 6= 0/ → Mg(
A),
wegen
\
A 6= 0/ ↔ Mg(
\
0/ = V also
A).
Statt der obigen Summen und Durchschnitte kommen in der Mathematik häufiger Vereinigungen und Durchschnitte von Familien von Mengen vor. Zur Angleichung an den dort üblichen Gebrauch bezeichnen wir den Indexbereich mit I (der
zunächst eine Klasse sein kann) und schreiben auch Fi für F(i):
S
S
i∈I Fi := {Fi | i ∈ I} = {z | ∃i ∈ I z ∈ Fi }
T
T
i∈I Fi
:= {Fi | i ∈ I} = {z | ∀i ∈ I z ∈ Fi }
Vereinigung
Durchschnitt
In Verallgemeinerung des Z ERMELOschen Axioms besagt das Summenaxiom von B ERNAYS, daß die Vereinigung von Mengen-vielen Mengen wieder eine
Menge ist:
BERNAYSsches Summenaxiom (BSum)
S
Mg(
x∈a F(x))
129
5.5. V EREINIGUNG UND P RODUKT
Der Indexbereich I ist hier eine Menge a, jedem i ∈ a ist eine Menge F(i) zugeordnet, die Zuordnung kann allerdings durch eine Klasse F gegeben sein! Wenn
man dies beachtet, kann man die B ERNAYSsche Summe auch in der vertrauten
S
Form i∈I ai und das B ERNAYSsche Summenaxiom in der Form
S
Mg(
i∈I ai )
für jede Indexmenge I
schreiben. Als Axiom wählen statt dessen das
Ersetzungsaxiom (Ers)
Mg({F(x) | x ∈ a})
von A. F RAENKEL. Es besagt, daß das Bild einer Menge a unter einer Funktion F
(welche eine Klasse sein kann) wieder eine Menge ist, bzw. daß man wieder eine
Menge erhält, wenn man die Elemente x einer Menge a durch ihre Funktionswerte
F(x) ersetzt. Wir können es auch in der folgenden Form schreiben:
Fkt(F) → Mg(F[a])
bzw.
Fkt(F) ∧ Mg(D(F)) → Mg(W (F)).
Satz
Auf der Basis der bisherigen Axiome (Ext, Null, Paar) gilt:
B ERNAYSsches Summenaxiom = Summenaxiom + Ersetzungsaxiom.
Beweis: Aus (BSum) folgt (Sum), indem man für F die Identität (also F(x) =
S
x) setzt, und das (Ers) ergibt sich wegen {F(x) | x ∈ a} = {{F(x)} | x ∈ a}.
Umgekehrt gilt:
[
F(x) =
[
{F(x) | x ∈ a} =
[
F[a].
x∈a
Satz
(i) Fkt(F) ∧ D(F) ∈ V → W (F), F ∈ V ,
d. h. ist der Definitionsbereich einer Funktion eine Menge, so ist nicht nur
ihr Bild, sondern die Funktion selber eine Menge.
(ii) F : A B ∧ Mg(A) → Mg(B)
(iii) F : A B ∧ Mg(B) → Mg(A)
130
5.5. V EREINIGUNG UND P RODUKT
Beweis von (i): Zu gegebener Funktion F definiere eine Funktion G durch
D(G) = D(F) und G(x) = (x, F(x)) für x ∈ D(F).
Dann ist W (G) = {G(x) | x ∈ D(F)} = {(x, F(x)) | x ∈ D(F)} = F, also auch F
Menge nach dem Ersetzungsaxiom (angewandt auf G). Die Beweise von (ii) und
(iii) sind leichte Übungsaufgaben.
Die Aussagen (ii) und (iii) werden verständlich, wenn man “Mg(A)” inhaltlich deutet als “A ist nicht zu groß” und beachtet, daß das Bild einer Funktion eher
“kleiner” als der Definitionsbereich ist (da die Funktion möglicherweise verschiedene Mengen auf dasselbe Objekt abbildet. (Genaueres hierzu bei der Einführung
des Begriffes der Kardinalzahl!)
Satz über das cartesische Produkt
Das Produkt zweier Mengen ist wieder eine Menge: Mg(a × b)
Beweis: Offensichtlich kann man die Menge b auf {c} × b abbilden, dieses
ist also eine Menge nach dem Ersetzungsaxiom. Somit kann man eine Funktion
F : a −→ V definieren durch F(x) = {x} × b.
S
S
Hiermit gilt nun a × b = x∈a ({x} × b) = x∈a F(x).
5.5.2 Potenzmenge und allgemeines Produkt
P(A) := {x | x ⊆ A}
b A := { f | f : b −→ A}
Potenzmengenaxiom (Pot)
Potenzklasse von A
Belegungsklasse von b nach A
Mg(P(a))
Bemerkungen
• Da Elemente von Klassen stets Mengen sind, ist P(A) nur als Klasse aller
Teilmengen von A definierbar, ebenso ist b A nur für Mengen b definierbar.
• Es ist stets 0,
/ a ∈ P(a).
• Aufgrund der spezifischen Definition des geordneten Paares gilt:
a × b ⊆ P(P(a ∪ b)).
131
5.5. V EREINIGUNG UND P RODUKT
Also kann man auch mit Hilfe des Potenzmengenaxioms (und des Aussonderungsaxioms) zeigen, daß das Produkt von zwei Mengen wieder eine
Menge ist.
• Indem man jeder Menge x ⊆ a ihre charakteristische Funktion cx zuordnet,
erhält man eine Bijektion der Potenzklasse P(A) auf die Belegungsklasse
b 2 mit 2 := {0, 1} = {0,
/ {0}}.
/
Falls a eine endliche Menge mit n Elementen ist, so hat also die Potenzmenge von a 2n Elemente (was auch für
unendliche Mengen gilt und die Bezeichnung “Potenzmenge” erklärt).
Wie im Falle der Vereinigung gibt es für eine Menge ein einfaches und für eine
Familie von Mengen ein allgemeines Produkt; in diesem Fall läßt es sich aber nur
für Indexmengen definieren:
Allgemeines Produkt
∏ F(x) := { f | Fkt( f ) ∧ D( f ) = a ∧ ∀x ∈ a f (x) ∈ F(x)}
x ∈a
Weniger gebräuchlich ist der Sonderfall
∏ a = ∏ x := { f | Fkt( f ) ∧ D( f ) = a ∧ ∀x ∈ a f (x) ∈ x}.
x ∈a
Bemerkung
Es gibt einfache Bijektionen (für a 6= b)
∏
F(x) ←→ F(a),
x∈{a}
∏
F(x) ←→ F(a) × F(b)
x∈{a,b}
usw., so daß man das allgemeine Produkt als Verallgemeinerung des endlichen
Produktes auffassen kann. Benutzen wir wieder I als Indexmenge und Familien
statt Funktionen, so können wir das allgemeine Produkt auch in der folgenden
Form schreiben:
für Mengen I :
∏ Fi
i ∈I
bzw.
∏ ai = {(xi)i ∈I | ∀i ∈ I xi ∈ ai}
i ∈I
wobei wir statt F jetzt auch eine Mengenvariable a einsetzen können, da nach
dem Ersetzungsaxiom eine Funktion, die auf einer Menge definiert ist, selbst eine
Menge ist.
132
5.5. V EREINIGUNG UND P RODUKT
Satz
(i) ∏x ∈a F(x) ⊆ P(a ×
S
x∈a F(x))
(ii) a b = ∏x ∈a F(x) mit F(x) = b konstant für alle x ∈ a,
(iii) a b
und
∏x ∈a F(x) sind Mengen.
Somit können wir die folgenden Mengen bilden:
0,
/ {a}, {a, b}, a ∪ b, a ∩ B, a − b,
[
a,
[
F(x), F[a], { f | f : a −→ b}, a × b,
∏ F(x), P(a).
x∈a
x∈a
Damit erhalten wir die in der Mathematik gebräuchlichen Operationen, die
Mengen ergeben, soweit sie auf Mengen angewandt werden - das gilt zwar nicht
für das Komplement, aber dieses wird ohnehin in Anwendungen nur relativ zu
einer vorgegebenen Grundmenge gebraucht. Es fehlt aber noch die Existenz einer
unendlichen Menge (und damit der Zahlbereiche N, Z, R, . . .), und hierzu benötigen wir das
Unendlichkeitsaxiom (Un)
∃x(0/ ∈ x ∧ ∀y(y ∈ x → y ∪ {y} ∈ x))
Die kleinste derartige Menge, d. h. der Durchschnitt
N :=
\
{x | 0/ ∈ x ∧ ∀y(y ∈ x → y ∪ {y} ∈ x)}
kann als Menge der natürlichen Zahlen gewählt werden. Im Sinne der Ordinalzahltheorie ist es eine Ordinalzahl, und zwar die kleinste unendliche Ordinalzahl,
bezeichnet mit ω.
Die bisherigen Axiome legen die Gleichheit von Mengen fest Ext) oder fordern die Existenz von Mengen, die eindeutig beschrieben werden (Paar, Summe,
Potenz, Bildmenge, natürliche Zahlen). Von anderer Art ist das
Fundierungsaxiom (Fund)
a 6= 0/ → ∃x ∈ a x ∩ a = 0.
/
Dieses schränkt den Mengenbereich ein, indem es “unbequeme” Mengen ausschließt, die man beim gewöhnlichen Aufbau der Mengenlehre nicht benötigt. Wir
haben es bei der Entwicklung der Ordinalzahltheorie bereits benutzt und werden
eine weitere Anwendung später darstellen.
5.6. Ü BERBLICK ÜBER DIE ZF-A XIOME
133
5.6 Überblick über die ZF-Axiome
Extensionalitätsaxiom
Nullmengenaxiom
Paarmengenaxiom
Summenaxiom
Ersetzungsschema
Potenzmengenaxiom
Unendlichkeitsaxiom
Fundierungsaxiom
∀x(x ∈ a ↔ x ∈ b) → a = b
∃y∀x(x 6∈ y)
∃y∀x(x ∈ y ↔ x = a ∨ x = b)
∃y∀z(z ∈ y ↔ ∃x ∈ a z ∈ x)
∀x∀y∀z(ϕ(x, y) ∧ ϕ(x, z) → y = z)
→ ∃u∀y(y ∈ u ↔ ∃x ∈ aϕ(x, y))
(Pot) ∃y∀z(z ∈ y ↔ z ⊆ a)
(Un) ∃x(0/ ∈ x ∧ ∀y(y ∈ x → y ∪ {y} ∈ x))
(Fund) a 6= 0/ → ∃x ∈ a ∀y ∈ x y 6∈ a.
(Ext)
(Null)
(Paar)
(Sum)
(ErsS)
Unter Benutzung von Klassentermen, also Ausdrücken der Form {x | ϕ(x)},
bezeichnet mit Großbuchstaben A, B, . . . und der Definition
Mg(A) :↔ ∃x(x = A) A ist Menge
lassen sich die obigen Axiome auch wie folgt kürzer und prägnanter ausdrücken
(mit den üblichen Definitionen von Funktionen als Klassen geordneter Paare):
Extensionalitätsaxiom
Nullmengenaxiom
Paarmengenaxiom
Summenaxiom
Ersetzungsaxiom
Potenzmengenaxiom
Unendlichkeitsaxiom
Fundierungsaxiom
(Ext) ∀x(x ∈ a ↔ x ∈ b) → a = b
(Null) Mg(0)
/
(Paar) Mg({a, b})
S
(Sum) Mg( a)
(Ers) Fkt(F) → Mg(F[a])
(Pot) Mg(P(a))
(Un) Mg(N)
(Fund)) a 6= 0/ → ∃x ∈ a x ∩ a = 0.
/
Das Aussonderungsaxiom ist übrigens als Folge des Ersetzungsaxioms überflüssig (wobei man - je nach Art der Formalisierung - noch das Nullmengenaxiom
gebraucht):
Metatheorem
(i) Aus den Axiomen (Ext), (Null), (Paar), (Ers) folgt (Aus),
(ii) aus (Ers) folgt (AusS).
Beweis von (i): zu zeigen ist: a ∩ A ∈ V .
134
5.6. Ü BERBLICK ÜBER DIE ZF-A XIOME
1. Fall: a ∩ A = 0/ : Dann gilt die Beh. wegen des Nullmengenaxioms.
2. Fall: a ∩ A 6= 0:
/ Wähle ein b ∈ a ∩ A und definiere eine Funktion
F : a a ∩ A durch
(
x, falls x ∈ a ∩ A,
F(x) =
b, sonst
und wende das Ersetzungsaxiom an.
Dasselbe Argument liefert einen Beweis von (ii), benötigt aber weder das Nullmengenaxiom noch das Paarmengenaxiom:
Zu zeigen ist: ∃y∀x(x ∈ y ↔ x ∈ a ϕ(x)).
Definiere dazu eine Formel
ψ(x, y) :↔ (ϕ(x) ∧ x = y).
Es gilt dann:
ψ(x, y) ∧ ψ(x, z) → y = z,
also existiert nach (ErsS) ein b mit
∀y(y ∈ b ↔ ∃x ∈ a ψ(x, y)),
∀y(y ∈ b ↔ ∃x ∈ a (ϕ(x) ∧ x = y)),
∀y(y ∈ b ↔ y ∈ a ∧ ϕ(y))
d. h.
also
135
Kapitel 6
Mengen von Mengen von . . .
Wenn man eine Aussage über alle natürlichen Zahlen beweisen will, so kann man
sie nicht für jede Zahl einzeln nachprüfen, da dies unendlich-viele Schritte erfordern würde. Stattdessen kann man auf das Induktionsprinzip für die natürlichen
Zahlen zurückgreifen, allgemeiner im Falle unendlicher Mengen auf eine Wohlordnung dieser Menge. Damit werden die Elemente der Menge in einer Weise
geordnet, daß man sie von den kleineren zu den größeren “durchlaufen” kann,
was dann genauer im (transfiniten) Induktionsprinzip ausgedrückt wird. Wir wiederholen zunächst den Begriff der Wohlordnung und erweitern ihn zugleich auf
den Fall von Klassen:
6.1 Induktion und Rekursion
6.1.1 Ordnungen auf Klassen
1. Eine (irreflexive) teilweise Ordnung auf einer Klasse A ist eine 2-stellige
Relation < ⊆ A × A, für die gilt:
(a) ∀x ∈ A x 6< x
(b) ∀x, y, z ∈ A (x < y ∧ y < z → x < z)
irreflexiv,
transitiv.
2. Eine (irreflexive) lineare Ordnung auf A ist eine teilweise Ordnung < auf
A mit
(c) ∀x, y ∈ A (x < y ∨ x = y ∨ y < x)
vergleichbar.
136
6.1. I NDUKTION UND R EKURSION
3. Eine Wohlordnung auf einer Klasse A ist eine lineare Ordnung < auf A,
welche zusätzlich die folgenden Bedingungen erfüllt:
(F1) ∀z(0/ 6= z ⊆ A → ∃x ∈ z ∀y ∈ z y 6< x)
(F2) ∀y ∈ A Mg({x | x < y})
4. S(a, <) := [< a] := {x | x < a}
Minimalitätsbedingung
Mengenbedingung
<-Segment von a, Menge
der <-Vorgänger von a
Bemerkungen
• Die Mengenbedingung (F2) ist nur wichtig für echte Klassen; ist A (und
damit auch die Relation < auf A) eine Menge, so ist (F2) stets erfüllt, da
{x | x < a} ⊆ A.
• Eine Relation, die nur die Bedingungen (F1) und (F2) erfüllt (also ohne
notwendig eine lineare Ordnung zu sein), heißt fundiert.
• Im Falle der ∈-Beziehung ist {x | x < a} = {x | x ∈ a} = a und somit (F2)
erfüllt. Ist ∈A die ∈-Beziehung auf einer Klasse A, so gilt: ∈A ist fundiert,
denn ∈A erfüllt auch die Bedingungen (F1) aufgrund des Fundierungsaxioms. Damit ist ∈A zwar auch irreflexiv, aber i. a. keine Wohlordnung (da
weder (b) noch (c) gelten). Trotzdem kann man die wichtigsten Ergebnisse
über Wohlordnungen auf fundierte Relationen (wie ∈A ) übertragen.
• Ist < Wohlordnung auf A, so läßt sich die Minimalitätsbedingung (F1) auf
Klassen verallgemeinern - als formale Bedingung mit einem Allquantor
über alle Klassen B können wir sie nicht aufschreiben, sondern nur als Aussagenschema für alle Klassenterme B:
6.1.2 Minimumsprinzip
< sei Wohlordnung auf A. Dann hat jede nicht-leere Teilklasse von A ein <minimales (bzw. <-kleinstes) Element:
(i) 0/ 6= B ⊆ A → ∃x ∈ B ∀y ∈ B y 6< x ,
(ii) 0/ 6= B ⊆ A → ∃x ∈ B ∀y ∈ B x ≤ y.
d. h. (da < lineare Ordnung ist):
137
6.1. I NDUKTION UND R EKURSION
Beweis: Sei b ∈ B. Falls b nicht bereits <-minimal ist, so
∃y ∈ B y < b, d. h. [< b] ∩ B 6= 0.
/
Nach der Mengenbedingung (F2) ist [< b] ∩ B eine Menge und hat damit nach
(F1) ein <-minimales c:
(+)
c ∈ [< b] ∩ B ∧ ∀y ∈ [< b] ∩ B y 6< c.
Dann gilt aber auch c ∈ B ∧ ∀y ∈ B y 6< c,
denn gäbe es ein y ∈ B mit y < c, so wäre y ∈ [< b] ∩ B (wegen c < b) im Widerspruch zur Bedingung (+).
Im folgenden schreiben wir R für die Wohlordnung < (denn wir benötigen nur
die Fundiertheit von R):
6.1.3 Induktionsprinzip für Wohlordnungen
R sei Wohlordnung auf A. Dann gilt:
(i) ∀x ∈ A [∀y(yRx → ϕ(y)) → ϕ(x)] → ∀x ∈ Aϕ(x), bzw. mit B = {x | ϕ(x)}:
(ii) ∀x ∈ A [S(x, R) ⊆ B → x ∈ B] → A ⊆ B.
Dieses Prinzip bedeutet, daß man eine Aussage ϕ(x) für alle Elemente von
x ∈ A nachweisen kann, wenn man für ein beliebiges a ∈ A zeigen kann:
Falls
so gilt
∀y(yRa → ϕ(y))
ϕ(a)
(Induktionsannahme),
(Induktionsschluß).
Dieses Beweisverfahren nennt man auch Beweis durch R-Induktion
Beweis von (ii): Annahme: ∀x ∈ A [S(x, R) ⊆ B → x ∈ B], aber A 6⊆ B.
Dann ist A − B nicht leer und besitzt nach obigem Satz ein R-minimales Element a:
a ∈ A − B, aber ∀y ∈ A − B ¬yRa, d. h. ∀y(yRa → y ∈ B),
also S(a, R) ⊆ B und damit nach der Voraussetzung der R-Induktion: a ∈ B, Widerspruch!
(Tatsächlich ist die Aussage (i) von 6.1.2 logisch äquivalent zur Aussage (ii) dieses Satzes: benutze Kontraposition, logische Umformungen und gehe von B zur
Komplementklasse über!)
6.1. I NDUKTION UND R EKURSION
138
6.1.4 Segmente
Für eine Relation R definieren wir:
R-Segment(B) :↔ ∀x∀y(xRy ∧ y ∈ B → x ∈ B)
Im Falle der ∈-Beziehung E gilt:
R-Segment
E-Segment(B) ↔ trans(B).
Für Ordnungen < sind wegen der Transitivität die Mengen S(a, <) = {x | x < a}
offenbar Segmente (genannt Anfangssegmente), für Wohlordnungen sind es die
einzigen echten Segmente:
Lemma
(i) R sei lineare Ordnung auf A, und S, T ⊆ A seien Segmente.
Dann gilt: S ⊆ T ∨ T ⊆ S.
(ii) Ist R Wohlordnung auf A, S ⊆ A ein echtes Segment, so S = S(a, R) für ein
a ∈ A.
Beweis von (i): Sei S ⊆ T falsch. Dann gibt es ein a ∈ S − T , und dieses kann kein
R-größeres b ∈ T besitzen (sonst wäre auch a ∈ T , da T ein Segment ist). Also
gilt für alle b ∈ T : bRa, insbesondere T ⊆ S.
Für den Beweis von (ii) wähle man das R-kleinste Element a ∈ A − S.
6.1.5 Rekursionssatz für Wohlordnungen
Es sei R eine Wohlordnung auf A, G : V ×V −→ V eine Funktion. Dann existiert
genau eine Funktion
F : A −→ V , die durch die folgenden rekursiven Eigenschaften bestimmt ist:
F(a) = G(a, F S(a, R)).
Eine einfache Variante dieses Satzes liefert eine Funktion F mit
F(a) = G(a, {F(x) | xRa}).
Ferner können G und F weitere Stellen als Parameter enthalten, z. B.
F(a, u, v) = G(a, u, v, {F(x, u, v) | xRa}).
Beweis:
a) Die Eindeutigkeit von F zeigt man durch R-Induktion,
b) für den Nachweis der Existenz definiert man:
6.1. I NDUKTION UND R EKURSION
139
(i) h brav: ↔ ∃s (s ist Segment ∧ h : s → V ∧ ∀x ∈ s h(x) = G(x, h S(x, R))),
(ii) h verträglich mit g :↔ ∀x ∈ D(h) ∩ D(g) h(x) = g(x)
Durch R-Induktion zeigt man, daß je zwei brave Funktionen miteinander
verträglich sind:
(iii) h, g brav → ∀x ∈ D(h) ∩ D(g) h(x) = g(x).
(Mit Hilfe von (i) des vorigen Lemmas kann man sogar zeigen, daß für je
zwei brave h, g gilt g ⊆ h ∨ h ⊆ g.)
Die gesuchte Funktion können wir jetzt explizit definieren durch:
(iv) F := {h | h brav }.
S
F ist wegen (iii) eine Funktion, D(F) ist ein Segment, und F erfüllt die Rekursionsbedingungen (da Vereinigung braver Funktionen). Es bleibt zu zeigen, daß F
auf ganz A definiert ist:
Wäre B := D(F) echtes Segment von A, so B = S(a, R) für ein a ∈ A nach
obigem Lemma (ii), insbesondere B und damit F eine Menge, etwa F = f mit
bravem f . Dieses f könnte man dann fortsetzen zu einem braven
h := f ∪ {(a, G(a, f S(a, R)))}
mit a ∈ D(h) = S(a, R) ∪ {a} ein Segment, also müßte auch a ∈ D(F) = B =
S(a, R) sein und somit aRa, Widerspruch!
Damit haben wir eine explizite mengentheoretische Definition einer Funktion
erhalten, die durch eine rekursive Bedingung charakterisiert ist, und zwar erhält
man die Funktion als Vereinigung von “partiellen” Lösungen der Rekursionsgleichungen. Insbesondere kann man damit die Elemente einer wohlgeordneten Klasse der Größe nach aufzählen - dabei hängt nämlich die Aufzählung eines Elementes b ∈ A ab von der Aufzählung der Vorgänger von b:
Kontraktionslemma
R sei eine Wohlordnung auf A. Dann existiert genau eine Abbildung F und eine
transitive Klasse B, so daß:
F ein Isomorphismus: (A, R) ∼
= (B, ∈) ist, d. h.
F : A ←→ B mit
aRb ↔ F(a) ∈ F(b) für alle a, b ∈ A.
140
6.1. I NDUKTION UND R EKURSION
Dabei sei das geordnete Paar von Klassen etwa definiert durch:
(A, B) := (A × {0}) ∪ (B × {1}),
und wir schreiben einfach
(B, ∈) für die Struktur (B, EB ) mit EB := {x, y | x, y ∈ B ∧ x ∈ y}.
Beweis: a) Eindeutigkeit:
Sei F : A ←→ B mit aRb ↔ F(a) ∈ F(b), B transitiv. Dann gilt für alle b ∈ A:
(*)
F(b) ∈ B → F(b) ⊆ B
a ∈ F(b) → ∃x(a = F(x) ∈ F(b))
a ∈ F(b) ↔ ∃x(a = F(x) ∧ xRb),
F(b) = {F(x) | xRb}.
wegen trans(B)
nach Voraussetzung
somit
Dadurch ist aber F eindeutig festgelegt, und B ist eindeutig als Wertebereich von
F bestimmt.
b) Existenz: Nach dem Rekursionssatz existiert (genau) ein F mit
D(F) = A und für alle b ∈ A: F(b) = {F(x) | xRb},
d. h. es existiert ein
F : A B mit der Eigenschaft (*), wobei wir B := W (F) gesetzt haben.
F ist injektiv: Sei F(y) = F(z), aber y 6= z. Da R eine Ordnung ist, so gilt
yRz und damit F(y) ∈ F(z) oder
zRy und damit F(z) ∈ F(y),
in beiden Fällen ein Widerspruch zu F(y) = F(z) (und dem Fundierungsaxiom)!
F ist Isomorphismus: Nach Def. von F gilt: aRb → F(a) ∈ F(b).
Sei umgekehrt F(a) ∈ F(b). Dann ist F(a) = F(c) für ein cRb, aber a = c (wegen
der Injektivität), und somit auch aRb.
B ist transitiv: Sei c ∈ B = W (F). Dann ist c = F(b) für ein b ∈ A, andererseits
nach Def. von F (d.h. nach (*)): c = F(b) = {F(x) | xRb} ⊆ B, also c ⊆ B.
Da transitive Mengen, die durch die ∈-Beziehung wohlgeordnet sind, gerade
die Ordinalzahlen sind, erhalten wir mit
On := {x | Ord(x)}
als Klasse aller Ordinalzahlen:
141
6.1. I NDUKTION UND R EKURSION
6.1.6 Repräsentationssatz für Wohlordnungen
< sei eine Wohlordnung auf A.
(i) Ist A = a eine Menge, so gibt es genau eine Abbildung f und genau eine
Ordinalzahl α mit
f : (a, <) ∼
= (α, ∈).
(ii) Ist A eine echte Klasse, so gibt es genau eine Abbildung F mit
F : (A, <) ∼
= (On, ∈).
Somit sind die Ordinalzahlen Repräsentanten von Wohlordnungen. Das eindeutig bestimmte α mit (a, <) ∼
= (a, ∈) nennt man den Wohlordnungstyp von
(a, <). Man erhält ihn, wenn man die Elemente der Menge a gemäß der Wohlordnung < aufzählt: Ist
a = {aξ | ξ < α} mit a0 < a1 < . . . < aξ < aη . . . für ξ < η < α,
so ist α der Wohlordnungstyp von a bezüglich der Wohlordnung < auf a.
Im Falle einer echten Klasse gibt es nur einen Wohlordnungstyp (nämlich On),
und zwar liegt das an der Mengenbedingung (F1) in der Definition 6.1.1.3.
Anwendung auf die Ordinalzahlen
Die kleinste Ordinalzahl ist 0, und für jede Ordinalzahl α ist α + 1 ebenfalls eine
Ordinalzahl, und zwar eine Nachfolgerzahl. Die restlichen Typen von Ordinalzahlen sind Limeszahlen:
0 := 0/
N f (α) : ↔ ∃ξ α = ξ + 1
Lim(λ ) : ↔ λ 6= 0 ∧ ¬N f (λ ))
↔ λ 6= 0 ∧ ∀ξ < λ (ξ + 1 < λ )
Null
Nachfolgerzahl
Limeszahl
Lemma
(i) α = 0 ∨ N f (α) ∨ Lim(α) (und es gilt genau einer der drei Fälle),
(ii) trans(A) ∧ A ⊆ On → A ∈ On ∨ A = On,
6.1. I NDUKTION UND R EKURSION
142
(iii) A ⊆ On → ∪A ∈ On ∨ ∪A = On.
(iv) Lim(λ ) ↔ λ > 0 ∧ λ = ∪λ .
Beweis von (ii): Ist A transitiv, so ein E-Segment von On und nach Lemma (ii) aus
6.1.4 somit = On oder als echtes Segment von der Form A = {x | x < α} = α für
ein α.
Zum Beweis von (iii) beachte man, daß für A ⊆ On gilt: ∪A ist transitiv (allgemeiner ist die Vereinigung transitiver Mengen wieder transitiv), so daß man (ii)
anwenden kann.
Offenbar ist (ii) eine Verallgemeinerung des Satzes aus 5.1.4. (iii) besagt, daß
das Supremum einer Klasse von Ordinalzahlen wieder eine Ordinalzahl ist oder
= On ist, und zwar gilt in (ii) und (iii) jeweils der 1. Fall, wenn A beschränkt ist
(d. h. ∃α A ⊆ α), der 2. Fall, falls A unbeschränkt ist (also ∀α∃ξ ≥ α ξ ∈ A).
Die Existenz von Limeszahlen folgt erst aus dem Unendlichkeitsaxiom, und
damit werden wir uns im folgenden Abschnitt beschäftigen. Hier können wir die
Existenzfrage erst einmal offen lassen; falls es keine Limeszahl gibt, sind die Ordinalzahlen gerade die natürlichen Zahlen, anderenfalls gehen sie darüber hinaus:
Mit einer Limeszahl λ gibt es auch wieder die Nachfolgerzahlen λ + 1, λ + 2, . . .
(die aber keine natürlichen Zahlen mehr sind) und dann wieder deren Limes,
Nachfolger, Nachfolger, . . . , Limes, . . . , usw. Somit führen die Ordinalzahlen über
die natürlichen Zahlen hinaus, indem zu jeder Menge von Ordinalzahlen auch das
Supremum wieder eine Ordinalzahl ist: Es gilt
(∗) 0 = 0/ ∈ On ∧ ∀α(α ∈ On → α + 1 ∈ On) ∧ ∀x(x ⊆ On → ∪x ∈ On),
tatsächlich ist On die kleinste Klasse mit dieser Abgeschlossenheitsbedingung.
Da die Ordinalzahlen durch die ∈ -Beziehung wohlgeordnet sind, gelten die
Induktions- und Rekursionstheoreme des vorigen Abschnitts; zusätzlich kann man
ihnen aber wegen (*) auch eine zweite Fassung geben, die zeigt, wie diese Prinzipien die entsprechenden Sätze über die natürlichen Zahlen verallgemeinern:
Prinzip der transfiniten Induktion/Minumumsprinzip
(i) ∀α(α ⊆ A → α ∈ A) → On ⊆ A
(ii) ϕ(0) ∧ ∀α((ϕ(α) → ϕ(α + 1)) ∧
∧ ∀λ (Lim(λ ) ∧ ∀ξ < λ ϕ(ξ ) → ϕ(λ )) → ∀αϕ(α)
(iii) ∃αϕ(α) → ∃α(ϕ(α) ∧ ∀ξ < α¬ϕ(ξ ))
6.1. I NDUKTION UND R EKURSION
143
Dabei haben wir in (i) die Klassen-, in (ii) die Schema-Schreibweise benutzt. (iii)
ist das hierzu äquivalente Minimumsprinzip. Im folgenden Satz beschränken wir
uns auf den Fall, welcher der Induktion der Form (ii) entspricht:
6.1.7 Transfinite Rekursion
Sind G, H : On ×V −→ V Funktionen, a eine Menge, so existiert genau eine Funktion F : On −→ V mit
F(0) = a
F(α + 1) = G(α, F(α))
F(λ ) = H(λ , {F(ξ ) | ξ < λ }) für Lim(λ ).
(Analog für mehrstellige Funktionen mit Parametern.)
Der Rekursionssatz erlaubt es, die arithmetischen Operationen auf den Ordinalzahlen so einzuführen, daß sie die entsprechenden Operationen auf den natürlichen Zahlen verallgemeinern (nach JACOBSTHAL 1909):
Addition, Multiplikation, Potenz
α +0 = α
α ·0 = 0
α + (β + 1) = (α + β ) + 1
α · (β + 1) = α · β + α
S
S
α · λ = ξ <λ α · ξ , falls Lim(λ )
α + λ = ξ <λ α + ξ , falls Lim(λ )
α0 = 1
α (β +1) = α β · α
S
α λ = 0<ξ <λ α ξ , falls Lim(λ )
Die von den natürlichen Zahlen bekannten Rechengesetze gelten zum Teil
auch für die unendlichen Ordinalzahlen (+ und · sind assoziativ mit 0 bzw. 1
als neutralen Elementen, alle Operationen sind schwach monoton), Addition und
Multiplikation sind jedoch nicht kommutativ und verhalten sich nur hinsichtlich
ihres 2. Argumentes wie gewohnt. Soweit die üblichen Rechengesetze jedoch
nicht gelten, sind sie bereits im kleinst-möglichen Fall verletzt, z.B.:
nicht-kommutativ: 1 + ω = ω 6= ω + 1, 2 · ω = ω 6= ω · 2 = ω + ω
nicht-links-distributiv: (1 + 1) · ω = ω 6= 1 · ω + 1 · ω = ω + ω
nicht-monoton im 1. Argument: 1 + ω = 2 + ω, 1 · ω = 2 · ω, 2ω = 3ω
144
6.2. D IE VON -N EUMANNSCHE H IERARCHIE
6.2 Die von-Neumannsche Hierarchie
Durch transfinite Rekursion definieren wir eine Folge von Mengen (Vα |α ∈ On),
indem wir ausgehend von der leeren Menge die Potenzmengenoperation iterieren:
V0 = 0,
/ Vα+1 = P(Vα ), Vλ =
[
Vξ
für Limeszahlen λ .
ξ <λ
Die Mengen Vα nennt man auch VON N EUMANNsche Stufen. Das Fundierungsaxiom ist äquivalent damit, daß jede Menge als Element einer Stufe vorkommt, d. h. mit der Aussage
V=
[
Vα .
α∈On
Damit erhält man eine Einteilung der Klasse V aller Mengen in eine Hierarchie von Stufen, die gewisse “Ähnlichkeiten” mit V aufweisen. Genauer läßt sich
dieser Zusammenhang in der Form eines
Reflexionsprinzip (Refl)
∃α[a ∈ Vα ∧ ∀x1 . . . xn ∈ Vα (ϕ Vα (x1 . . . xn ) ↔ ϕ(x1 . . . xn ))]
ausdrücken, wobei die Formel ϕ a (die Relativierung von ϕ nach a) aus ϕ hervorgeht, indem dort jeder Quantor Qx durch den relativierten Quantor Qx ∈ a
ersetzt wird. Somit besagt das Reflexionsprinzip, daß zu jeder Formel ϕ ein beliebig großes Vα existiert, das bezüglich der Eigenschaft ϕ sich wie die Allklasse
V verhält. Man kann Reflexionsprinzipien benutzen als alternative (und weniger
pragmatische) Möglichkeit, die Theorie ZF zu axiomatisieren - bei geeigneter Formulierung machen sie alle Mengenexistenz-Axiome (bis auf das Aussonderungsaxiom) überflüssig und sind natürlich modelltheoretisch von besonderem Interesse.
Die Stufen Vα sind transitive Mengen mit interessanten Abschlußeigenschaften:
• (Vω , ∈) ist Modell aller Axiome von ZF, bis auf das Unendlichkeitsaxiom,
das hierin falsch ist (da alle Mengen in Vω endlich sind, s. unten 6.3.2).
• (Vλ , ∈) ist für Limeszahlen λ > ω Modell aller Axiome von ZF, bis auf das
Ersetzungsaxiom.
• Die Frage nach der Existenz von Ordinalzahlen α, für die (Vα , ∈) ein Modell von ZF ist, führt zu den “großen Kardinalzahlen”, deren Existenz in ZF
nicht beweisbar ist (“unerreichbare” Zahlen).
145
6.3. D IE ROLLE DES U NENDLICHKEITSAXIOMS
6.3 Die Rolle des Unendlichkeitsaxioms
Wenn man möglichst schnell und einfach das Induktionsprinzip für die natürlichen Zahlen erhalten will, so definiert man sie als Durchschnitt aller induktiven
Mengen (und damit als kleinste induktive Menge):
N :=
\
{x | Ind(x)},
wobei
Induktiv(a) :↔ 0/ ∈ a ∧ ∀y(y ∈ a → y ∪ {y} ∈ a)).
Da der Durchschnitt über die leere Menge jedoch keine Menge (sondern die echte
Klasse aller Mengen) ist, muß man für diesen Weg das Unendlichkeitsaxiom voraussetzen (welches gerade besagt, daß es eine induktive Menge gibt). Wir wollen
jedoch - soweit möglich - dieses Axiom vermeiden und wählen daher den Begriff
der natürlichen Zahl als “endliche” Ordinalzahl, d. h. als Ordinalzahl unter der
ersten Limeszahl:
Nz(n) : ↔ Ord(n) ∧ (n = 0 ∨ N f (n)) ∧ ∀x ∈ n (x = 0 ∨ N f (x))
↔ Ord(n) ∧ ∀λ (Lim(λ ) → n < λ ) natürliche Zahl
Da das Unendlichkeitsaxiom (Un) auch damit gleichbedeutend ist, daß eine
Limeszahl existiert, bedeutet diese Definition:
a) Gilt (Un), so ist die kleinste Limeszahl ω = Menge der natürlichen Zahlen.
b) Gilt ¬(Un), existiert also keine unendliche Menge, so sind alle Mengen endlich und die natürlichen Zahlen bilden eine echte Klasse, die mit der Klasse
On aller Ordinalzahlen zusammenfällt.
Da somit die natürlichen Zahlen spezielle Ordinalzahlen sind, ergeben sich aus
den jeweiligen Prinzipien für die Ordinalzahlen entsprechende Aussagen über die
natürlichen Zahlen (dabei benutzen wir wie üblich Variable n,m,k für natürliche
Zahlen):
Induktionsprinzip ∀n(∀m < n m ∈ A → n ∈ A) → ∀n n ∈ A
Induktionsschema ϕ(0) ∧ ∀n((ϕ(n) → ϕ(n + 1)) → ∀n ϕ(n)
Minimumsprinzip ∃n ϕ(n) → ∃n(ϕ(n) ∧ ∀m < n¬ϕ(m))
6.3. D IE ROLLE DES U NENDLICHKEITSAXIOMS
146
Rekursion Sind G, H : N ×V −→ V Funktionen, a eine Menge, so existiert genau
eine Funktion F : N −→ V mit
F(0) = a
F(n + 1) = G(n, F(n).
6.3.1 PA in mengentheoretischer Sprache
Die Theorie PA der Zahlentheorie von P EANO haben wir bereits im Rahmen der
Logik (3.5.4) erwähnt und festgestellt, daß diese Theorie neben dem Standardmodell weitere Nichtstandardmodelle besitzt (als Folgerung aus dem Kompaktheitssatz). Der Versuch der Erweiterung von PA zur Theorie PA(2) in der Sprache
der 2. Stufe trifft auf die Schwierigkeit, daß die Logik 2. Stufe kein vollständiges Axiomensystem besitzt (zumindest solange man verlangt, daß die Menge der
Axiome entscheidbar ist). Gehen wir nun jedoch von der Mengenlehre aus, so erhalten wir zunächst die Möglichkeit, das Standardmodell zu definieren als Menge
der natürlichen Zahlen ω mit a0 = a ∪ {a} , 0 = 0/ und mit den mengentheoretisch
(durch Rekursion auf den natürlichen Zahlen) definierten Operationen +, · (der
Einfachheit halber benutzen wir hierfür dieselben Zeichen wie für die Symbole
der Sprache von PA):
Standardmodell
N = (ω,0 , +, ·, 0).
Damit dieses eine Menge ist, müssen wir natürlich das Unendlichkeitsaxiom voraussetzen; dann aber gilt das Induktionsschema im Standardmodell nicht nur für
Aussagen der Sprache von PA, sondern für beliebige mengentheoretische Formeln, und es läßt sich in ZF beweisen, daß das Standardmodell bis auf Isomorphie
das einzige dieser (mengentheoretisch erweiterten) Axiome ist (wobei man P3-P6
nicht einmal benötigt):
Kategorizität der mengentheoretischen Peano-Axiome
Die Theorie PA(2) (P EANO-Axiome 2. Stufe) besitzt folgende Axiome:
P1
∀x e 6= x
P2
∀x∀y(x0 = y0 → x = y)
Ind(2)
∀X(0 ∈ X ∧ ∀x(x ∈ X → x0 ∈ X) → ∀x x ∈ X)
6.3. D IE ROLLE DES U NENDLICHKEITSAXIOMS
147
Die Kategorizität dieser Theorie besagt, daß es (bis auf Isomorphie) genau ein
Modell gibt, d. h.:
Jedes Modell von PA(2) ist isomorph zum Standardmodell (ω,0 , 0).
Beweis: Ind(2) ist ein Axiom, in welchem ∀X ein Quantor 2. Stufe ist, welcher
in einem Modell (w, ∗, e) ausdrückt: für alle Teilmengen von w . . . , d. h. dieses
Axiom entspricht dem mengentheoretische Induktionsprinzip.
Es sei nun also (w,∗ , e) ein Modell von PA(2) , d.h.
(1) e 6= x∗
für alle x ∈ w,
(2) x∗ = y∗ → x = y
für alle x, y ∈ w,
(3) e ∈ v ∧ ∀x(x ∈ v → x∗ ∈ v) → w ⊆ v
für alle Mengen v ⊆ w.
Der gesuchte Isomorphismus ist eine Abbildung f : ω ←→ w mit
f (0) = e ∧ ∀n ∈ ω f (n0 ) = f (n)∗ .
Der Rekursionssatz für die natürlichen Zahlen liefert ein (sogar eindeutig bestimmtes) f mit dieser Eigenschaft; zu zeigen bleibt also nur noch die Bijektivität:
f ist surjektiv: Sei v := W ( f ) = { f (n) | n ∈ ω}. Dann folgt aus den rekursiven
Bedingungen für f :
e ∈ v ∧ ∀x(x ∈ v → x∗ ∈ v),
also nach (3): w ⊆ v und damit w = v, d.ḣ. f ist surjektiv.
f ist injektiv, d.ḣ.
(i) m 6= n → f (m) 6= f (n).
Zunächst zeige man durch Induktion über m:
(ii) m 6= 0 → ∃n(m = n0 )
und dann (i) durch Induktion über n:
1. Sei n = 0 und n 6= m. Dann ist m 6= 0, also nach (i) m = k0 für ein k und
damit f (0) = e 6= f (m) = f (k)∗ nach (2).
6.3. D IE ROLLE DES U NENDLICHKEITSAXIOMS
148
2. Sei (i) bewiesen für n (und alle m), m 6= n0 . Falls m = 0, schließen wir wie
oben auf f (m) 6= f (n0 ). Falls m 6= 0, so wieder m = k0 für ein k. Aus m =
k0 6= n0 folgt wegen (P2) k 6= n und damit nach Induktionsvoraussetzung
f (k) 6= f (n).
Hier zeigt sich besonders deutlich, daß die zahlentheoretische Sprache (1. Stufe) erheblich ausdrucksschwächer ist als die mengentheoretische Sprache.
6.3.2 Die Theorie der endlichen Mengen
Bezeichnet ZF f in die Theorie ZF, in welcher das Unendlichkeitsaxiom durch seine
Negation ersetzt ist, so kann man sie als Theorie der endlichen Mengen auffassen;
(Vω , ∈) ist “das Standardmodell” dieser Theorie. Diese ist ebenso “stark” wie die
P EANO-Arithmetik PA, d. h. sie lassen sich wechselweise ineinander interpretieren, und damit ist insbesondere ZF ohne das Unendlichkeitsaxiom genau dann
widerspruchsfrei, wenn die P EANO-Arithmetik widerspruchsfrei ist:
• Wie oben bemerkt, kann man in ZF ohne Unendlichkeitsaxiom die natürlichen Zahlen (als Klasse) definieren und die arithmetischen Operationen der
Addition und Multiplikation auf den natürlichen Zahlen (mittels des Rekursionssatzes) definieren, so daß hierfür die P EANO-Axiome gelten,
• umgekehrt kann man in PA (nach ACKERMANN) endliche Mengen durch
Zahlen kodieren und eine entsprechende ∈-Beziehung so definieren, daß
hierfür die Axiome von ZF f in gelten.
• In ZF ohne Unendlichkeitsaxiom (oder einer geeigneten Erweiterung von
PA zur Theorie 2. Stufe) kann man auch eine eingeschränkte Analysis betreiben; um aber etwa die Gesamtheit der reellen Zahlen zur Verfügung zu
haben, benötigt man das Unendlichkeitsaxiom.
6.3.3 Anwendungen der numerischen Rekursion
Als Spezialfall des Rekursionstheorems für die natürlichen Zahlen erhalten wir
die Möglichkeit, Funktionen zu iterieren und damit Mengen zu erhalten, die unter
vorgegebenen Funktionen abgeschlossen sind:
149
6.3. D IE ROLLE DES U NENDLICHKEITSAXIOMS
Satz über die Iteration und den Abschluß
(i) Zu jeder Funktion F und jeder Menge a gibt es eine Funktion
H : N ×V −→ V mit H(0, a) = a, H(n + 1, a) = F(H(n, a)).
Wir nennen H auch die Iteration von G mit dem Anfangswert a und
schreiben auch F n (a) für H(n, a).
(ii) Zu jeder Funktion F und jeder Menge a gibt es eine Obermenge b von a, die
unter F abgeschlossen ist:
∃y(a ⊆ y ∧ ∀x ∈ y F(x) ∈ y)
Beweis von (ii): Zu gegebenem F und der Ausgangsmenge a definiere durch Rekursion eine Funktion G mit den Eigenschaften
G(0) = a,
G(n0 ) = {F(x) | x ∈ G(n)} und setze
b :=
[
G(n).
n∈ω
Dann ist offensichtlich a ⊆ b ∧ ∀x ∈ b F(x) ∈ b), und zwar ist b die kleinste derartige Menge, die Hülle oder der Abschluß von a unter der Abbildung F.
Für viele Anwendungen gut zu benutzen ist das
Hüllenaxiom (HS)
∃y(a ⊆ y ∧ ∀x ∈ y F(x) ∈ y).
Satz
Unter der Voraussetzung der übrigen Axiome von ZF (einschließlich des Aussonderungsschemas) ist das
Ersetzungsaxiom + Unendlichkeitsaxiom äquivalent zum Hüllenaxiom.
Beweis: (HS) haben wir in obigem Satz in ZF gezeigt. Umgekehrt folgt aus (HS)
das Unendlichkeitsaxiom (mit a = 0/ und F(x) = x0 ) und ähnlich das Ersetzungsaxiom, indem es für eine Funktion F und eine Menge a zunächst eine Obermenge
b ⊇ a mit {F(x)|x ∈ b} ⊆ b liefert, für die dann aber {F(x) | x ∈ a} als Teilklasse
von b eine Menge nach dem Aussonderungsaxiom ist.
150
6.3. D IE ROLLE DES U NENDLICHKEITSAXIOMS
Anwendungen des Hüllenaxioms
1. Ähnlich wie wir ω als (kleinste) Ordinalzahl erhalten können, die > 0 ist und
unter 0 abgeschlossen ist, erhalten wir zu jeder Ordinahlzahl α eine (nächstgrößere) Limeszahl λ > α, aber auch Ordinalzahlen > α, die unter arithmetischen Operationen abgeschlossen sind:
∀ξ , η < γ ξ + η < γ bzw. die ε-Zahlen: ∀ξ < ε 2ξ < ε, usw.
2. Zu jeder Menge a existiert eine kleinste Obermenge b ⊇ a mit trans(b), die
transitive Hülle TC(a) von a:
[
TC(a) :=
U n (a),
wobei U die Iteration der
n∈ω
Vereinigungsmenge ist: U o (a) = a, U n+1 (a) = ∪U n (a),
also
TC(a) = a ∪
[
a∪
[[
a...
3. Eine Menge ist endlich gdw sie sich auf die Zahlen {0, . . . , n} für eine natürliche Zahl n abbilden läßt,
HF := {x | TC(x) endlich}
ist die Klasse der erblich-endlichen Mengen.
Sie läßt sich auch beschreiben durch HF = Vω und ist somit eine Menge (wobei
man wesentlich das Unendlichkeitsaxiom benutzt - dagegen ist die Klasse aller
endlichen Mengen stets eine echte Klasse).
4. Mit Hilfe der VON N EUMANNschen Stufenhierarchie kann man die folgenden
Verstärkungen des Hüllenaxioms erhalten
∀x∃y ϕ(x, y, . . .) → ∃α∀x ∈ Vα ∃y ∈ Vα ϕ Vα (x, y, . . .), bzw.
∀x ∈ a∃y ϕ(x, y, . . .) → ∃u(a ⊆ u ∧ ∀x ∈ a∃y ∈ u ϕ u (x, y, . . .)),
welche sich auch zur Axiomatisierung von ZF verwenden lassen (vgl. die in 6.2
erwähnten Reflexionsprinzipien).
151
Kapitel 7
Das Auswahlaxiom
7.1 Zermelos Axiom
In seiner einfachsten Form (RUSSELL 1906 bzw. Z ERMELO 1904/1908) besagt
das Auswahlaxiom, daß das Produkt einer Menge nicht-leerer Mengen wiederum
nicht leer ist (multiplicative axiom):
/
Auswahlaxiom:
(AC) ∀x ∈ a x 6= 0/ → ∏x∈a x 6= 0,
d. h. ∀x ∈ a x 6= 0/ → ∃ f (Fkt( f ) ∧ D( f ) = a ∧ ∀x ∈ a f (x) ∈ x),
(ein solches f heißt Auswahlfunktion für die Menge a).
Das AC ist unabhängig von den übrigen ZF-Axiomen:
Ist ZF0 (= ZF ohne Fundierungsaxiom) widerspruchsfrei, so auch
ZF0 + ¬ AC (F RAENKEL 1922),
ZF+ AC
(G ÖDEL 1938),
ZF + ¬ AC (C OHEN 1963)
(zur Geschichte und Problematik des Auswahlaxioms s. das Buch von
G. M OORE : Zermelo´s axiom of choice. Springer 1982).
Das Auswahlaxiom hat zahlreiche Anwendungen in fast allen Gebieten der
Mathematik, besitzt aber auch verschiedene
7.1.1 Mengentheoretisch äquivalente Formen
AC2 ∀x ∈ a F(x) 6= 0/ → ∏x∈a F(x) 6= 0/
AC2´ ∀x ∈ a ∃y ϕ(x, y) → ∃ f (Fkt( f ) ∧ D( f ) = a ∧ ∀x ∈ a ϕ(x, f (x))
152
7.1. Z ERMELOS A XIOM
AC3 ∀x ∈ a x 6= 0/ ∧ ∀x, y ∈ a(x 6= y → x ∩ y = 0)
/ → ∃z∀x ∈ a∃!u u ∈ z ∩ x
(ein solches z heißt Auswahlmenge für die nicht-leeren, disjunkten Mengen
in a; ∃!u . . . = es existiert genau ein u. . . )
AC3´ r Äquivalenzrelation auf a → ∃z ∀x ∈ a∃!u ∈ z (x, u) ∈ r
(jede Äquivalenzrelation besitzt ein Repräsentantensystem)
AC4 Fkt( f ) → ∃g(Fkt(g) ∧ g : W ( f ) D( f ) ∧ g ⊆ f −1 )
(jede Funktion besitzt eine Umkehrfunktion)
AC5 Rel(r) → ∃ f (Fkt( f ) ∧ D( f ) = D(r) ∧ f ⊆ r)
Der Beweis dieser Aussagen aus dem Auswahlaxiom beruht darauf, dass man
in allen diesen Fällen eine Auswahl in Abhängigkeit von den Elementen einer
Menge treffen muss (dabei benötigt man für AC2´ das Fundierungsaxiom, um
den Bereich der möglichen y auf eine genügend große Menge Vα einschränken
zu können). Umgekehrt sind die obigen Auswahlprinzipien allgemein genug, um
hieraus das ursprüngliche AC zu folgern.
7.1.2 Der Zermelosche Wohlordnungssatz
Das Auswahlaxiom, AC, ist äquivalent zum Wohlordnungssatz:
WO1 ∀x ∃r(r ist Wohlordnung auf x), bzw.
WO2 ∀x ∃ f ∃α( f : α ←→ x) , d. h. jede Menge a läßt sich aufzählen:
a = {aξ | ξ < α} für ein α und eine Folge (aξ | ξ < α)
Beweis: Ist r Wohlordnung auf a, so isomorph zu ∈ auf einer Ordinalzahl α (nach
6.1.6 (i)), somit WO1 ⇒ WO2. Ist umgekehrt f : a ←→ α für eine Ordinalzahl α,
so kann man auf a eine Wohlordnung r definieren durch
xry ⇐⇒ f (x) < f (y).
Also gilt auch WO2 ⇒ WO1.
WO1 ⇒AC: (Ist eine Menge wohlgeordnet, so kann man aus ihren Elementen
eine Auswahl treffen, indem man das kleinste Element (bezüglich der Wohlordnung) auswählt.) Sei ∀x ∈ a x 6= 0.
/ Nach WO1 gibt es eine Wohlordnung < auf
S
a. Damit kann man eine Auswahlfunktion f definieren durch
f (x) = das kleinste (bzgl. <) y ∈ x für x ∈ a.
7.1. Z ERMELOS A XIOM
153
AC ⇒ WO2: Sei a 6= 0.
/ Nach dem Auswahlaxiom existiert eine Funktion
f : P(a) − {0}
/ −→ V mit ∀x ⊆ a(x 6= 0/ → f (x) ∈ x).
Damit können wir rekursiv eine Aufzählung G von a definieren:
(
f (a − {G(ξ ) | ξ < α}), falls a − {G(ξ ) | ξ < α} 6= 0/
G(α) =
a,
sonst.
(i) a 6∈ {G(ξ ) | ξ < α} → G α ist injektiv:
Für γ < α ist G(γ) = f (a−{G(ξ ) | ξ < γ}) ∈ a−{G(ξ ) | ξ < γ}, also G(γ) 6=
G(ξ ) für alle ξ < γ.
(ii) a ∈ W (G), denn anderenfalls wäre G : On −→ a nach (i) eine injektive
Funktion, und damit a keine Menge!
Sei α := µξ (G(ξ ) = a)1 . Dann ist G α : α −→ a injektiv. Es bleibt zu zeigen:
(iii) G α : α −→ a ist surjektiv. Wäre jedoch W (G α) ⊂ a, so G(a) =
f (a − {G(ξ ) | ξ < α}) ∈ a im Widerspruch zur Definition von α!
7.1.3 Maximumsprinzipien von Zorn und Hausdorff
Diese Prinzipien formulieren wir am besten für reflexive Ordnungen:
Eine (reflexive) teilweise Ordnung auf A ist eine 2-stellige Relation R auf A,
für die gilt:
∀x ∈ a xRx
reflexiv,
∀x, y, z ∈ a (xRy ∧ yRz → xRz)
transitiv,
∀x, y ∈ a (xRy ∧ yRx → x = y)
antisymmetrisch.
K ⊆ A heißt R-Kette: ↔ ∀x, y ∈ K (xRy ∨ yRx),
d.h. je zwei Elemente aus K sind bzgl. R vergleichbar;
(e) a ∈ A heißt R-obere Schranke von B ⊆ A :↔ ∀x ∈ B xRa,
a ∈ A heißt R-maximal: ↔ ∀x ∈ A (aRx → a = x).
(a)
(b)
(c)
(d)
Ein maximales Element besitzt also kein echt größeres, braucht aber nicht das
größte Element zu sein (zumindest nicht in einer teilweisen Ordnung).
Zornsches Lemma (ZL)
r sei teilweise Ordnung auf der Menge a mit der Eigenschaft
(*) jede r-Kette besitzt eine r-obere Schranke.
Dann hat a ein maximales Element (bzgl. r).
1 Mit
µξ ϕ(ξ ) bezeichnet man das kleinste ξ mit der Eigenschaft ϕ(ξ ).
154
7.1. Z ERMELOS A XIOM
Hausdorffsches Maximumsprinzip (H)
r sei teilweise Ordnung auf der Menge a.
Dann gibt es eine (bzgl. ⊆) maximale r-Kette k, d. h. ein k ⊆ a mit:
k ist r-Kette ∧ ∀y ( y r-Kette ∧ k ⊆ y → k = y).
Diese beiden Aussagen sind äquivalent zum Auswahlaxiom:
Beweis von WO ⇒ H:
r sei partielle Ordnung auf a, a = {aξ | ξ < α} sei wohlgeordnet. Wir definieren
eine Teilmenge {bξ | ξ < α} von a durch Rekursion wie folgt:
(
aβ falls {bξ | ξ < β } ∪ {aβ } r-Kette,
bβ =
a0 sonst.
{bξ | ξ < α} ist dann eine maximale r-Kette (mit b0 = a0 ).
H ⇒ ZL:
Sei r partielle Ordnung auf a, die (*) erfüllt. Nach H existiert eine maximale rKette k ⊆ a. Eine obere Schranke von k ist dann ein maximales Element (sonst
könnte man k echt erweitern).
ZL ⇒ AC:
Sei a 6= 0/ und ∀x ∈ a x 6= 0.
/ Setze
B := { f | ∃y ⊆ a( f : y →
[
a ∧ ∀x ∈ y f (x) ∈ x)}.
Jedes Element von B ist eine partielle Auswahlfunktion und Teilmenge von a ×
S
S
a, damit ist auch B als Menge b ⊆ P(a × a) abschätzbar. Als teilweise OrdS
nung auf B = b wählen wir r =⊆ -Beziehung. Für jede r-Kette k ist dann k eine
obere Schranke, und ein nach dem Z ORNschen Lemma maximales Element in B
ist dann eine Auswahlfunktion für a .
Bemerkungen
• Aus obigem Beweis lässt sich ablesen, daß H sogar allgemeiner gilt: jede
partielle Ordnung r auf a besitzt für jedes b ∈ a eine r-Kette k mit b ∈ k.
• Das Z ORNsche Lemma ist offenbar trivial, wenn r eine lineare Ordnung auf
a ist, weil dann a selbst schon eine Kette ist. Daher kann man Anwendungen
von ZL nur für teilweise Ordnungen erwarten. Wie in obigem Beweis ist
häufig diese Ordnung die ⊆ -Beziehung, und häufig kann man in diesem
Fall (*) nachweisen, indem man zeigt, daß
155
7.1. Z ERMELOS A XIOM
für jede ⊆-Kette k ist
(Dann ist
S
S
k ∈ a.
k nämlich eine obere Schranke.)
• Für Anwendungen benötigt man gelegentlich nur abgeschwächte Formen
des Auswahlaxioms:
Auswahlaxiom für abzählbare Mengen: (ACω )
a abzählbar ∧ ∀x ∈ a x 6= 0/ → ∃ f (D( f ) = a ∧ ∀x ∈ a f (x) ∈ x),
Axiom der abhängigen Auswahl: (DC, dependent choice)
Rel(R) ∧ a0 ∈ a ∧ ∀x ∈ a ∃y ∈ a xRy
→ ∃ f [ f : ω −→ a ∧ f (0) = a0 ∧ ∀n < ω f (n)R f (n + 1)]
Es gilt:
AC → DC, DC → ACω (aber die Umkehrungen sind nicht beweisbar).
Das ACω wird vielfach in der Analysis benutzt (s.u.), insbesondere auch für
die Aussage, daß die Vereinigung abzählbar-vieler abzählbarer Mengen wiederum abzählbar ist. DC benötigt man z. B. für die Äquivalenz verschiedener Endlichkeitsdefinitionen sowie zum Beweis, daß die Minimalitätsbedingung der Fundiertheit (s. (F1) von 6.1.1.3)
(F1) ∀z(0/ 6= z ⊆ A → ∃x ∈ z ∀y ∈ z y 6< x)
äquivalent ist zur Aussage, daß es für < keine unendlich-absteigenden Ketten gibt:
(F11) ¬∃ f ( f : ω −→ V ∧ ∀n < ω f (n + 1) < f (n))
(dabei benötigt man gerade das DC, um (F11) → (F1) zu zeigen, während die
umgekehrte Richtung auch ohne DC beweisbar ist).
7.2. A NWENDUNGEN DES AUSWAHLAXIOMS
156
7.2 Anwendungen des Auswahlaxioms
7.2.1 Jeder Vektorraum besitzt eine Basis.
K sei ein Körper, V ein Vektorraum über dem Körper K, V und K seien Mengen (hier also V nicht die Klasse aller Mengen!). Wir wenden zum Beweis das
Z ORNsche Lemma an und wählen
P := {b | b Menge von linear unabhängigen Vektoren ⊆ V }, ≤= ⊆ auf P.
Dann ist ≤ eine partielle Ordnung auf der Menge P, und für jede Kette k ⊆ P
S
ist k eine obere Schranke von k in P. Nach dem Z ORNschen Lemma existiert
also ein maximales Element in P; eine maximale linear unabhängige Menge von
Vektoren ist aber eine Basis.
Bemerkungen
1. A. Blass: Existence of bases implies AC, Contempory Math., Axiomatic Set
Theory, AMS 31 (1983)) hat gezeigt, daß auch die Umkehrung gilt:
Hat jeder Vektorraum eine Basis besitzt, so gilt das Auswahlaxiom.
2. Den Vektorraum R der reellen Zahlen kann man auch als (unendlich-dimensionalen) Vektorraum über den rationalen Zahlen Q auffassen, er besitzt
dann also eine Basis, die man H AMEL-Basis nennt. Aus der Existenz einer
solchen Basis folgt nun aber insbesondere die Existenz einer Funktion
f : R −→ R mit f (x + y) = f (x) + f (y) für alle reellen x, y.
Ein solches f ist zwar Q-linear, aber nicht R-linear. Tatsächlich kann f
unstetig sein, und es ist sogar möglich, daß W ( f ) ⊆ Q!
7.2.2 Der Satz von Hahn-Banach
(Formulierung und Beweis etwa bei Friedrichsdorf-Prestel, Kap. 10, pp.66ff)
7.2.3 Nicht-meßbare Mengen
Es existiert eine Menge reeller Zahlen, die nicht Lebesgue-meßbar ist. (V ITALI
1905)
157
7.2. A NWENDUNGEN DES AUSWAHLAXIOMS
Die Lebesgue-meßbaren Mengen bilden eine Teilmenge L ⊆ P(R), auf welcher das Lebesgue-Maß definiert ist als Abbildung
m : L −→ {x | x ∈ R ∧ x ≥ 0} ∪ {∞},
so daß gilt:
(L1) L ist ein Mengenring, d. h. A, B ∈ L → A ∪ B, A ∩ B, A − B ∈ L,
und L enthält die offenen und abgeschlossenen Intervalle:
(a, b), [a, b] ∈ L für alle reellen Zahlen a < b.
Ferner ist m([a, b]) = b − a.
(L2) m(A ∪ B) = m(A) + m(B), falls A ∩ B = 0/
Additivität
(L3) A ⊆ B → m(A) ≤ m(B)
Monotonie
(L4) Ist (Ai |i < ω) eine abzählbare Folge von Mengen ∈ L, so ist auch
S
/ für i 6= j, so ist
i<ω Ai ∈ L, und falls Ai ∩ A j = 0
S
m(
i<ω Ai ) = ∑i<ω m(Ai ).
σ -Additivität
(L5) A ∈ L ∧ r ∈ R → A + r = {a + r | a ∈ A} ∈ L
und m(A) = m(A + r)
Translationsinvarianz
Auf den reellen Zahlen definieren wir eine Äquivalenzrelation durch
x ∼ y :↔ x, y ∈ [0, 1] ∧ x − y ∈ Q.
Nach dem Auswahlaxiom in der Form AC3´ existiert hierzu ein Repräsentantensystem S, d. h.
S ⊆ [0, 1] ∧ ∀x ∈ [0, 1] ∃!y ∈ S (x ∼ y).
Setzen wir Sr := {x + r | x ∈ S} = S + r, so ist R =
Sr ∩ St = 0/
S
s∈Q Sr ,
und es ist
für r,t ∈ Q, r 6= t.
Wäre S Lebesgue-meßbar, also S ∈ L, so erhielte man im Falle m(S) = 0 :
m(R) = 0, und im Falle m(S) > 0 : 2 = m([0, 2]) = ∞, Widerspruch! Somit ist die
Menge S nicht Lebesgue-meßbar.
158
7.2. A NWENDUNGEN DES AUSWAHLAXIOMS
7.2.4 Äquivalenz verschiedener Stetigkeitsdefinitionen
Auf den reellen Zahlen definiert man die übliche Topologie mit Hilfe der εUmgebungen von x:
U(ε, x) := (x − ε, x + ε) = {y ∈ R | x − ε < y < x + ε},
sowie
(1) für A ⊆ R die abgeschlossene Hülle von A durch
x ∈ A : ↔ ∀ε > 0 U(ε, x) ∩ A 6= 0/
↔ x = limn<∞ xn
bzw.
für eine Folge(xn )n<ω mit ∀n < ω xn ∈ A.
(2) Es sei f : R −→ R, x ∈ R. Dann definiert man
f stetig in x:
↔ ∀ε > 0 ∃δ > 0 ∀y ∈ R (|x − y| < δ → | f (x) − f (y)| < ε) bzw.
↔ f (x) = limn<∞ f (xn ) für alle Folgen (xn )n<ω mit x = limn<∞ xn .
Um die Äquivalenz der jeweiligen Definitionen zu zeigen, benötigt man (in
jeweils einer Richtung) das Auswahlaxiom - tatsächlich genügt hier das ACω .
7.2.5 Satz von Tychonoff
Das Produkt quasi-kompakter Räume ist quasi-kompakt. (Diese Aussage ist äquivalent zum Auswahlaxiom.)
7.2.6 Boolesches Primidealtheorem
Eine Boolesche Algebra ist ein Modell (B, ∧, ∨, −, 0, 1) der B OOLEschen Gesetze, die wir für die Aussagenlogik in 1.2.6 formuliert haben. Um den trivialen Fall
auszuschließen, fügen wir noch 0/ 6= V als Axiom hinzu, so daß stets 0 6= 1 gilt und
die kleinste B OOLEschen Algebra aus zwei Elementen besteht.
Beispiele und Bemerkungen
1. Für eine nicht-leere Menge M ist (P(M), ∩, ∪, −, 0,
/ M) eine B OOLEsche Algebra, die Potenzmengenalgebra von M. Eine Unteralgebra davon, definiert
also auf einer Teilmenge B ⊆ P(M), die 0/ und M enthält und abgeschlossen
ist unter den Mengenoperationen ∩, ∪, −, heißt Mengenalgebra.
7.2. A NWENDUNGEN DES AUSWAHLAXIOMS
159
2. Jede endliche B OOLEschen Algebra ist isomorph zu einer Potenzmengenalgebra und hat damit 2n Elemente für eine natürliche Zahl n. Die Menge
{x ⊆ N | x endlich oder N − x endlich} mit den üblichen mengentheoretischen Operationen ist eine abzählbare B OOLEsche Algebra, die aber nicht
zu einer Potenzmengenalgebra isomorph sein kann.
3. Es gibt zahlreiche Beispiele B OOLEscher Algebren, die keine Mengenalgebren sind. Diese lassen sich am besten mit topologischen Hilfsmitteln
beschreiben; aber es gibt auch natürliche Beispiele aus der Logik:
Die Lindenbaum-Algebra einer Theorie T
Für eine Theorie T der Sprache L definieren wir auf der Menge der Sätze von L
eine Äqivalenzrelation durch
ϕ ∼T ψ : ⇐⇒ T ` ϕ ↔ ψ,
L(T) := {[σ ]T | σ L-Satz}
sei die Menge der zugehörigen Äquivalenzklassen. Den aussagenlogischen Operationen entsprechen dann Operationen auf L(T):
[ϕ]T ∧ [ψ]T := [ϕ ∧ ψ]T
und ähnlich für die übrigen Operationen. Damit wird L(T) zu einer B OOLEschen
Algebra mit
0 = {ϕ | T ` ¬ϕ} und 1 = {ϕ | T ` ϕ}.
Eine Theorie T ist somit vollständig und konsistent gdw L(T) isomorph zur 2elementigen B OOLEschen Algebra ist.
Ein Filter einer B OOLEsche Algebra (B, ∧, ∨, −, 0, 1) ist eine nichtleere Teilmenge F ⊆ B mit folgenden Eigenschaften:
(U1) x, y ∈ F ⇒ x ∧ y ∈ F,
(U2) x ∈ F, y ∈ B ⇒ x ∨ y ∈ F.
Ein Filter F heißt echt gdw F 6= B. Ein Primfilter ( Ultrafilter) ist ein echter
Filter F mit der zusätzlichen Eigenschaft
(U) x ∈ F oder B − x ∈ F.
160
7.2. A NWENDUNGEN DES AUSWAHLAXIOMS
Ultrafilter kann man auch als maximale echte Filter charakterisieren; sie haben
außerdem folgende Eigenschaften:
x 6∈ U
⇐⇒
B−x ∈U
x ∈ U und y ∈ U
⇐⇒
x∧y ∈U
x ∈ U oder y ∈ U
⇐⇒
x∨y ∈ F
und stehen damit in enger Verbindung mit dem Wahrheitsprädikat:
Das Boolesche Primidealtheorem (BPI) besagt:
Jeder echte Filter in einer B OOLEschen Algebra läßt sich zu einem Ultrafilter
erweitern, (bzw.: Jedes echte Ideal läßt sich zu einem Primideal erweitern.)
(Die Begriffe Ideal und Primideal sind die zu Filter und Ultrafilter dualen
Begriffe: vertausche ∨ mit ∧.)
Das BPI folgt offensichtlich aus dem Auswahlaxiom (mittels des Z ORNschen
Lemmas), ist aber echt schwächer.
Satz
Das BPI ist äquivalent mit folgenden Aussagen:
(i) Jede B OOLEsche Algebra besitzt einen Ultrafilter.
(ii) S TONEscher Repräsentationssatz:
Jede B OOLEsche Algebra ist isomorph zu einer Mengenalgebra.
(iii) Satz von T YCHONOFF für T2 -Räume
(iv) Vollständigkeitssatz für formale Sprachen erster Stufe
(v) Kompaktheitssatz für formale Sprachen erster Stufe
Weitere Abschwächungen des Auswahlaxioms sind:
Ordnungserweiterungsprinzip (OE): Jede partielle Ordnung läßt sich zu einer
linearen Ordnung erweitern.
Ordnungsprinzip (OP): Jede Menge besitzt eine lineare Ordnung.
Es gilt: AC ⇒ BPI ⇒ OE ⇒OP (ohne Umkehrungen).
Weitere Ergebnisse und eine Übersicht findet man in dem Buch
G.H. M OORE : Zermelo´s Axiom of Choice. Springer 1982.
161
Kapitel 8
Mächtigkeiten und Kardinalzahlen
8.1 Endliche und abzählbare Mengen
Der Grundbegriff der Theorie der Kardinalzahlen ist die Mächtigkeit einer Menge.
Zunächst definieren wir, wann zwei Mengen gleichmächtig sind:
a ∼ b :↔ ∃ f ( f : a ←→ b)
gleichmächtig
Es gibt verschiedene Möglichkeiten, den Begriff des Endlichen zu erfassen;
da man hierbei auch das Unendliche definiert, ist der Begriff keineswegs trivial,
was sich auch darin zeigt, dass die verschiedenen Definitionen oft erst mit Hilfe des Auswahlaxioms als äquivalent nachgewiesen werden können (s. (iv) des
folgenden Satzes).
1. Der übliche Begriff der endlichen Menge greift auf die natürlichen Zahlen
zurück:
Eine Menge a ist endlich gdw sie mit Hilfe von natürlichen Zahlen bis zu einer
Zahl n abgezählt werden kann. Da nach unserer Festlegung n = {0, 1, . . . , n − 1}
ist, so haben wir eine besonders einfache Definition:
a
a
endlich : ↔ ∃n < ω (a ∼ n),
unendlich : ↔ ¬ a endlich.
Ist a endlich, so ist die natürliche Zahl n mit a ∼ n (die man durch Abzählen
bestimmt) eindeutig festgelegt und gibt die Anzahl der Elemente von a an - für
unendliche Mengen braucht dies aber nicht mehr zu gelten (siehe (i) des folgenden
Satzes)!
8.1. E NDLICHE UND ABZ ÄHLBARE M ENGEN
162
2. Von W HITEHEAD -RUSSELL stammt die folgende Definition, die den Zahlbegriff vermeidet:
Eine Menge u ⊆ P(a) heißt induktive Familie von Teilmengen von a gdw
0/ ∈ u ∧ ∀x ∈ u ∀y ∈ a x ∪ {y} ∈ u,
d.h. u enthält die leere Menge und mit jeder Menge x auch die um ein Element
aus a erweiterte Menge. Definiere:
a endlich :↔ ∀u ⊆ P(a)(u induktive Familie von Teilmengen von a → a ∈ u).
Dieser Begriff ist äquivalent zu obiger Definition.
3. Die natürlichen Zahlen sind gleichmächtig mit einer echten Teilmenge (z. B.
den geraden Zahlen). Diese paradoxe Eigenschaft wählt D EDEKIND gerade zur
Charakterisierung unendlicher Mengen:
a D-unendlich :↔ ∃x ⊂ a (a ∼ x)
Satz
(i) n ∼ m ∧ n, m ∈ ω → n = m, allgemeiner:
α ∼ m ∧ m ∈ ω → α = m, (jedoch: ω ∼ ω + 1 ∼ ω + ω)
(ii) α endlich ↔ α ∈ ω, insbesondere:
∀n ∈ ω (n endlich) ∧ ω unendlich
∀n ∈ ω ¬(n D-unendlich) ∧ ω D-unendlich
(iii) a D-unendlich ↔ ∃x ⊆ a(x ∼ ω)
(iv) a D-unendlich → a unendlich,
a D-unendlich ↔ a unendlich (mit DC !)
Beweis von (iii) (D EDEKIND 1888): Sei a D-unendlich, also
f : a ←→ b ⊂ a für ein f und ein b. Wähle a0 ∈ a − b und setze an+1 = f (an )
(rekursive Definition!).
Es ist dann an 6= am für n 6= m und somit {an | n < ω} eine abzählbar-unendliche
Teilmenge von a.
Ist umgekehrt {an | n < ω} eine abzählbar-unendliche Teilmenge von a, wobei
an 6= am für n 6= m, so definieren wir eine Funktion g : a −→ a durch
163
8.2. A BZ ÄHLBARE M ENGEN
g(x) =
(
an+1 , falls x = an
x,
sonst
Es ist dann g : a ←→ a − {a0 } ⊂ a.
Eine D-unendliche Menge besitzt also eine abzählbar-unendliche Teilmenge;
falls man das Auswahlaxiom (bzw. das Axiom DC) nicht voraussetzt, kann es
unendliche Mengen geben, die keine abzählbar-unendliche Teilmenge enthalten!
Eigenschaften endlicher Mengen
(i) 0/ und {a} sind endlich.
(ii) Sind a und b endlich, so auch a ∪ b, a ∩ b, a − b, a × b, P(a), F[a], a b.
(iii) a endlich ∧ ∀x ∈ a (x endlich) →
S
a endlich,
(iv) a endlich ∧ b ⊆ a → b endlich.
(v) Induktionsprinzip für endliche Mengen:
ϕ(0)
/ ∧ ∀x[x endlich ∧ ϕ(x) → ∀y(ϕ(x ∪ {y}))] → ∀x(x endlich → ϕ(x)).
Diese Eigenschaften beweist man am einfachsten mit Hilfe des Endlichkeitsbegriffes von W HITEHEAD -RUSSELL, zeigt dann, dass unter diesem Begriff alle
natürlichen Zahlen endlich sind und somit beide Endlichkeitsdefinitionen zusammenfallen.
8.2 Abzählbare Mengen
Abzählbare Mengen lassen sich mit Hilfe der natürlichen Zahlen abzählen:
a abzählbar: ←→ a = 0/ ∨ a = {an | n < ω} für eine Folge (an | n < ω).
Damit sind dann auch die endlichen Mengen einbegriffen, da in der Abzählung
Elemente mehrfach aufgezählt werden können. Wir unterscheiden:
1. f : ω a heißt Aufzählung von a (es ist dann a = { f (n) | n < ω}),
2. f : ω ↔ a heißt Aufzählung von a ohne Wiederholungen.
164
8.2. A BZ ÄHLBARE M ENGEN
Eine Aufzählung ohne Wiederholungen (also eine bijektive Abbildung auf die
natürlichen Zahlen) liefert eine abzählbar-unendliche Menge:
a abzählbar-unendlich: ←→ a ∼ ω.
Eigenschaften abzählbarer Mengen
(i) a abzählbar ↔ a endlich ∨ a abzählbar-unendlich ↔ ∃α ≤ ω (a ∼ α),
(ii) Sind a und b abzählbar, so auch
a ∪ b, a ∩ b, a − b, a × b, F[a],
P<ω (a) := {x | x ⊆ a ∧ x endlich},
a<ω := { f | ∃n < ω f : n −→ a}.
(iii) Unter der Voraussetzung des Auswahlaxioms (ACω genügt):
S
a abzählbar ∧ ∀x ∈ a (x abzählbar) → a abzählbar,
(iv) a abzählbar ∧ b ⊆ a → b abzählbar.
Beweis von (i): Sei zunächst a abzählbar, also f : ω a für ein f , wobei wir a
als unendlich voraussetzen können. Zu zeigen ist: a ∼ ω, d. h. a ist auch ohne
Wiederholungen aufzählbar:
Setze a0 = f (0) und definiere (durch Rekursion) an+1 = f (k), wobei k minimal ist
mit f (k) 6= ai für alle i < n + 1. (Da a unendlich ist, muß ein solches k existieren.)
Es ist dann n 7→ an eine Bijektion von ω auf a.
Umgekehrt sind offenbar endliche wie auch abzählbar-unendliche Mengen
abzählbar.
Wir zeigen wir nun (iii), wobei wir annehmen können, daß die betrachteten
Mengen nicht-leer sind: Dazu geben wir zunächst eine Paarfunktion an:
f : ω × ω ←→ ω,
f (n, m) = 2n · (2m + 1) − 1.
Sei nun a = {an | n < ω} abzählbar und ∀n ∈ ω (an abzählbar), also
∀n ∈ ω ∃g(g : ω an ).
Nach ACω existiert eine Folge (gn )n∈ω mit ∀n ∈ ω an = {gn (m) |∈ ω}, und somit
[
a=
[
an = {gn (m) | m, n ∈ ω} = {g(n, m) | m, n ∈ ω},
n∈ω
wobei g : ω × ω S
n∈ω an
definiert ist durch g(n, m) = gn (m).
165
8.3. Ü BERABZ ÄHLBARE M ENGEN
S
Die gewünschte Abbildung h : ω n∈ω an erhält man nun aus g durch Vorschalten der Inversen f −1 der oben definierten Paarfunktion f .
(ii) beweist man ähnlich, wobei man sich leicht überzeugt, daß man in diesem
Fall das abzählbare Auswahlaxiom nicht benötigt.
8.3 Überabzählbare Mengen
Während die Potenzmenge einer endlichen Menge auch wieder endlich ist, ist die
Potenzmenge einer abzählbar-unendlichenen Menge nicht mehr abzählbar, also
überabzählbar: Wäre
P(ω) = {an | n ∈ ω},
so wäre auch
a := {m ∈ ω | m 6∈ am } = an für ein n, dann aber
n ∈ an ↔ n 6∈ an
Widerspruch!
Wir erhalten also einen Widerspruch wie im Falle der RUSSELLschen Antinomie! In ähnlicher Weise kann man zeigen, daß die Menge aller zahlentheoretischen Funktionen und auch die Menge aller reellen Zahlen R überabzählbar sind.
8.4 Mächtigkeiten
Obwohl wir die Mächtigkeit einer Menge noch nicht erklärt haben, konnten wir
Mengen als gleichmächtig definieren, wenn sie sich eineindeutig aufeinander abbilden lassen. Ebenso lassen sich Mengen hinsichtlich ihrer Größe vergleichen,
ohne sie vorher aufzählen zu müssen:
a ∼ b: ↔ ∃ f ( f : a ←→ b)
a 4 b: ↔ ∃ f ( f : a b)
↔ ∃x ⊆ b (a ∼ x)
a ≺ b: ↔ a 4 b ∧ a 6∼ b
a ist gleichmächtig mit b
a ist kleiner oder gleichmächtig mit b
(a ist schmächtiger als b)
a ist kleiner als b
(Genauer sollte man für a 4 b sagen: a ist von Mächtigkeit kleiner oder gleich b.)
So ist z.B.
n 4 ω, n ≺ ω, ω 4 ω + 1, ω + 1 4 ω, ω ≺ P(ω), aber ω + 1 6≺ ω, ω 6≺ ω + 1.
166
8.4. M ÄCHTIGKEITEN
Lemma
(i)
a4a
reflexiv
(ii) a 4 b ∧ b 4 c → a 4 c
(iii)
transitiv
a⊆b→a4b
aber i. a. nicht umgekehrt!
(iv) a ∼ c ∧ a 4 b → c 4 b
ebenso für ≺
(v) b ∼ d ∧ a 4 b → a 4 d
ebenso für ≺
Somit ist die Gleichmächtigkeit (Äquivalenz) von Mengen eine Äquivalenzrelation und eine Kongruenzrelation bezüglich 4 und ≺; die Relation 4 ist reflexiv
und transitiv. Der folgende Satz besagt, daß 4 antisymmetrisch (bis auf ∼) ist, was
trivial ist, wenn man das Auswahlaxiom benutzt. Als eines der wenigen Ergebnisse der Theorie der Mächtigkeiten läßt er sich aber auch ohne diese Voraussetzung
beweisen:
8.4.1 Satz von Cantor-Schröder-Bernstein
a4b ∧ b4a →a∼b
Beweis: Wir führen die Behauptung zunächst auf den einfacheren Fall
(∗) a 4 b ∧ b ⊆ a → a ∼ b
zurück: Nach Voraussetzung existieren Abbildungen
h : a ←→ a0 ⊆ b, g : b ←→ b0 ⊆ a, also
f := g ◦ h : a ←→ a1 ⊆ b0
mit
a1 ⊆ b0 ⊆ a ∧ a1 ∼ a ∧ b ∼ b0 ,
somit
a1 := g[a0 ] ∼ a0 ∼ a, d. h.
a 4 b0 ∧ b0 ⊆ a ∧ b0 ∼ b.
Nach (*) gilt dann a ∼ b0 , also auch a ∼ b, wie zu zeigen war.
Zum Beweis von (*) gehen wir von einer injektiven Abbildung
f :ab⊆a
aus und konstruieren daraus eine Abbildung
g:a↔b
167
8.4. M ÄCHTIGKEITEN
wie folgt:
(
g(x) =
f (x), falls x ∈
x
S
n∈ω
f n [a − b]
sonst.
Dabei ist f 0 (y) = y, f n+1 (y) = f ( f n (y)) (numerische Rekursion). Es gilt nun:
(i) g ist surjektiv, d. h. W (g) = b:
S
Sei d ∈ b. Falls d ∈ n∈ω f n [a − b], so ist d ∈ f n [a − b] für ein n, und zwar
n > 0 wegen d ∈ b. Dann ist aber d = f ( f n−1 (y)) für ein y und damit d ∈ W (g).
Im anderen Fall ist aber d = g(d) und damit auch d ∈ W (g).
(ii) g ist injektiv:
S
Da f injektiv ist, so auch g auf n∈ω f n [a − b], und als identische Abbildung
S
ist sie auch auf dem Komplement injektiv. Ist aber einerseits x ∈ n∈ω f n [a − b]
S
und andererseits y ∈ a − n∈ω f n [a − b], so muß auch g(x) 6= g(y) sein, da g(x) ∈
S
n
n∈ω f [a − b], während g(y) = y im Komplement liegt. Somit ist g eine Bijektion
von a auf b.
Der folgende Satz benötigt zum Beweis notwendig das Auswahlaxiom, da er
hierzu äquivalent ist:
8.4.2 Vergleichbarkeitssatz von Hartogs
a4b ∨b4a
Beweis: Nach dem Wohlordnungssatz gibt es Ordinalzahlen α, β mit a ∼ α und
b ∼ β . Da Ordinalzahlen vergleichbar sind (und zwar α ⊆ β ∨ β ⊆ α), überträgt
sich diese Beziehung in der Form a 4 b ∨ b 4 a auf die entsprechenden Mengen.
Folgerung
Jede unendliche Menge enthält eine abzählbar-unendliche Teilmenge (und ist damit D-unendlich).
Daß es zu jeder Menge eine mit größerer Mächtigkeit gibt, zeigt der
8.4.3 Satz von Cantor
a ≺ P(a)
168
8.5. K ARDINALZAHLEN
Beweis: Da durch x 7→ {x} eine injektive Funktion definiert wird, ist a 4 P(a). Die
Annahme a ∼ P(a) widerlegt man wie im Fall a = ω durch ein Diagonalargument:
Falls f : a P(a), so setze man d := {x ∈ a | x 6∈ f (x)}. Dann erhält man wegen
der Surjektivität von f ein b ∈ a mit d = f (b), was aber mit
b ∈ f (b) = d ↔ b 6∈ b zum Widerspruch führt!
Alternative zum Größenvergleich
Da bei einer Abbildung Mengen möglicherweise auf dasselbe Element abgebildet
werden können, wird man das Bild einer Menge a als höchstens so groß wie a
selbst ansehen. Man findet daher auch folgende Definition:
a 4∗ b :↔ a = 0/ ∨ ∃ f ( f : b a).
Für die Definition der Abzählbarkeit haben wir z. B.:
a abzählbar ↔ a 4∗ ω ↔ a 4 ω,
und der obige Satz von C ANTOR besagt gerade: a 64∗ P(a). Da eine injektive
Funktion eine Umkehrfunktion besitzt, so gilt stets
a 4 b → a 4∗ b,
aber für die Umkehrung benötigt man das Auswahlaxiom (oder zumindest eine
Wohlordnung von b)! Ebenso gilt zwar stets F[a] 4∗ a, aber F[a] 4 a allgemein
nur, wenn das Auswahlaxiom vorausgesetzt ist.
8.5 Kardinalzahlen
Für die Mächtigkeit einer Menge a, bezeichnet mit a, soll gelten:
a ∼ b ↔ a = b.
Diese Eigenschaft kann man natürlich leicht erfüllen, indem man (nach F REGE RUSSELL ) a als zugehörige Äquivalenzklasse {x | x ∼ a} definiert, allerdings ist
diese dann stets eine echte Klasse (außer für a = 0).
/ Die Anzahl einer endlichen
Menge kann man aber auch dadurch bestimmen, daß man sie abzählt: Ist
a = {a0 , . . . , an−1 } mit ai 6= a j für i 6= j,
so ist n die Anzahl der Elemente von a.
Ist jedoch a eine unendliche Menge, so können folgende Probleme auftauchen:
169
8.5. K ARDINALZAHLEN
1. a besitzt keine Aufzählung,
2. a besitzt Aufzählungen verschiedener Länge.
Das erste Problem läßt sich vermeiden, indem man das Auswahlaxiom voraussetzt: Dann läßt sich jede Menge wohlordnen:
a = {aξ | ξ < α} für ein α,
aber das zweite Problem bleibt bestehen: Selbst bei injektiven Aufzählungen ist
die ”Länge” α nicht eindeutig bestimmt. Als Kardinalzahl von a wählt man daher
das kleinstmögliche derartige α:
|a| := a := µα(a ∼ α)
Kardinalzahl von a
Bemerkung
Auch ohne Voraussetzung des Auswahlaxioms kann man (etwa mit Hilfe der
VON -N EUMANNschen Hierarchie) Mächtigkeiten definieren, die Mengen sind.
In diesem Fall nennt man Kardinalzahlen die Mächtigkeiten von wohlgeordneten
Mengen. Allerdings läßt sich (wie wir schon bei obigen Sätzen gesehen haben)
ohne Auswahlaxiom keine befriedigende Theorie der Mächtigkeiten aufbauen.
Daher werden wir im folgenden das Auswahlaxiom stets voraussetzen und nicht
zwischen Kardinalzahlen und Mächtigkeiten unterscheiden.
Beispiele
|n| = n
für jede natürliche Zahl n,
|N| = |ω| = |ω + 1| = |ω + 2| = . . . = |ω + ω| = ω.
Tatsächlich ist jede unendliche Kardinalzahl eine Limeszahl (aber nicht umgekehrt), die Kardinalzahlen bilden somit eine echte Teilklasse Cn der Ordinalzahlen. Cn ist trotzdem immer noch sehr groß: Das Supremum einer Menge von Kardinalzahlen ist wieder eine Kardinalzahl, und nach dem Satz von C ANTOR gibt es
keine größte Kardinalzahl.
8.5.1 Operationen auf den Kardinalzahlen
Die arithmetischen Operationen auf den Kardinalzahlen definiert man analog zum
endlichen Fall, wobei im Falle der Addition zu beachten ist, daß man als Sum-
170
8.5. K ARDINALZAHLEN
me zweier Kardinalzahlen die Vereinigung disjunkter Mengen der entsprechenden
Kardinalzahl wählt:
κ ⊕ λ = |(κ × {0}) ∪ (λ × {1})|
κ λ = |κ × λ |
κ λ = |λ κ| = |{ f | f : λ → κ}|
Endliche Ordinal- und Kardinalzahlen stimmen überein (es sind gerade die
natürlichen Zahlen), und für diese Fälle stimmen diese Operationen mit den entsprechenden Operationen auf den Ordinalzahlen ebenfalls überein. Für unendliche Kardinalzahlen ergeben sich aber wesentliche Unterschiede. So sind die Operationen der Addition und Multiplikation auf den Kardinalzahlen (wie im Falle
der natürlichen Zahlen, aber im Gegensatz zu den ordinalen Operationen) kommutativ, assoziativ und distributiv - wenngleich diese Gesetze trivial sind; es gilt
nämlich der
8.5.2 Satz von Hessenberg
Es seien κ, λ unendliche Kardinalzahlen. Dann gilt:
κ ⊕ λ = κ λ = max{κ, λ }.
(Tatsächlich braucht nur eine der beiden Zahlen unendlich zu sein, im Falle der
Multiplikation darf aber natürlich keine = 0 sein.) Dieses Ergebnis läßt sich (mit
einfachen Monotoniegesetzen) zurückführen auf
Satz
Für unendliche Kardinalzahlen gilt:
κ κ = κ.
Damit vereinfacht sich die Bestimmung der Kardinalzahl unendlicher Mengen
in vielen Fällen, insbesondere für die Mengen:
a<ω : = { f | ∃n < ω f : n → a}
P<ω (a) : = {x ⊆ a | x endlich}
171
8.5. K ARDINALZAHLEN
Satz
Für 0/ 6= b 4 a, a unendlich, gilt:
(i) |a ∪ b| = |a × b| = |a|,
(ii) |a<ω | = |P<ω (a)| = |a|.
Zur Aufzählung der unendlichen Kardinalzahlen benutzt man seit C ANTOR
den hebräischen Buchstaben ℵ (aleph):
ω = ℵ0 < ℵ1 < . . . ℵω < . . .
ℵ0 ist also die Kardinalzahl abzählbar-unendlicher Mengen, ℵ1 die erste überabzählbare Kardinalzahl. Während Addition und Multiplikation unendlicher Kardinalzahlen trivial sind, ist schon der Wert der einfachsten Potenz unbekannt:
Die Mächtigkeit der Menge R der reellen Zahlen ist 2ℵ0 (kardinale Potenz!),
und da R überabzählbar ist, so gilt ℵ1 ≤ 2ℵ0 . Die
Cantorsche Kontinuumshypthese CH
ℵ1 = 2ℵ0
ist aus den Axiomen von ZF + AC weder beweisbar (C OHEN 1963) noch widerlegbar (G ÖDEL 1938). Trotzdem gibt es einige einfache Abschätzungen:
8.5.3 Satz von Bernstein
α
2 ≤ κ ≤ ℵα → 2ℵα = κ ℵα = ℵℵ
α
ℵα
α
β ≤ α → ℵα < 2ℵα = ℵℵ
β = ℵα
Wir definieren eingeschränkte Potenzmengenoperationen:
P<λ (a) : = {x | x ⊆ a ∧ |x| < λ },
P≤λ (a) : = {x | x ⊆ a ∧ |x| ≤ λ },
Pλ (a) : = {x | x ⊆ a ∧ |x| = λ }.
Korollar
Für unendliches a, κ, λ :
(i) |P<ω (a)| = |a|,
(ii) |{ f | Fkt( f ) ∧ D( f ) ⊆ κ ∧ D( f ) endlich ∧W ( f ) ⊆ λ }| = max(κ, λ ).
(iii) |Pλ (κ)| = |P≤λ (κ)| = κ λ für λ ≤ κ , insbesondere:
(iv) |Pκ (κ)| = |P(κ)| = κ κ = 2κ .
172
Teil III
Grundlagen der Modelltheorie
173
Kapitel 9
Hin und her: Vollständigkeit und
elementare Äquivalenz
Mathematische Theorien lassen sich grob in zwei Klassen unterteilen:
1. Theorien, die Eigenschaften eines bestimmten Modells beschreiben wollen (z. B. die Theorie der natürlichen (reellen, komplexen) Zahlen oder die
Theorie der Euklidischen Ebene) sowie andererseits
2. Theorien, welche gemeinsame Eigenschaften vieler Modelle zusammenfassen, wobei sie aber durchaus zulassen, daß Modelle sich bezüglich anderer Eigenschaften unterscheiden (wie die meisten algebraischen Theorien:
Gruppen, Ringe, Körper, Vektorräume, . . . , aber auch die Theorie topologischer Räume, Graphen und Ordnungen).
9.1 Elementare Äquivalenz
Die Theorie Th(A) einer Struktur A unterscheidet sich von allgemeinen Theorien
wie folgt:
• Th(A) |= σ ⇐⇒ A |= σ ,
• T |= σ ⇐⇒
für alle A |= T : A |= σ ,
174
9.1. E LEMENTARE Ä QUIVALENZ
die Gültigkeit eines Satzes σ in Th(A) hängt also nur von der Gültigkeit in dem
einen Modell A ab, sonst von der Gültigkeit in allen Modellen der Theorie. Somit
ist Th(A) semantisch vollständig in folgendem Sinne:
T (semantisch) vollständig : ⇐⇒ für alle L-Sätze σ : T |= σ oder T |= ¬σ .
Achtung: Für Formeln ϕ gilt i. a. nicht: A |= ϕ oder A |= ¬ϕ, denn sonst müßte
der universelle Abschluß von ϕ oder der universelle Abschluß von ¬ϕ in A gelten
(aber in einer nicht-kommutativen Gruppe G gilt weder ∀x∀y (x + y = y + x) noch
∀x∀y (x + y 6= y + x)). Dagegen gilt nach der Wahrheitsdefinition für Sätze σ stets
A |= σ
oder A |= ¬σ .
Dagegen gilt i. a. auch nicht: T |= σ oder T |= ¬σ , denn der Satz σ könnte in
einem Modell von T gelten, in einem anderen aber nicht (wie das Kommutativgesetz im Falle der Gruppentheorie). Dagegen gilt die letzte Alternative, wenn sich
je zwei Modelle von T in ihren elementaren Eigenschaften (ausgedrückt durch
Sätze der zugehörigen Sprache) nicht unterscheiden:
Sind A und B Strukturen derselben Sprache L, so heißen sie elementar-äquivalent genau dann, wenn sie dieselben Sätze erfüllen:
A ≡ B :⇐⇒ für alle L-Sätze σ : A |= σ ⇐⇒ B |= σ .
Beispiele und Bemerkungen
1. (N, <) ≡ (N\{0}, <), aber (N, <, 1) 6≡ (N\{0}, <, 1).
2. (Q, +, ·, 0, 1) 6≡ (R, +, ·, 0, 1) als Körper (2 ist in Q kein Quadrat), betrachten
wir sie jedoch als geordnete Strukturen, so gilt:
(Q, <) ≡ (R, <) (wird später bewiesen), dagegen (Z, <) 6≡ (Q, <).
3. A ≡ B ⇐⇒ Th(A) = Th(B).
4. Eine Theorie ist vollständig gdw je zwei ihrer Modelle elementar-äquivalent sind.
5. Hat T überhaupt ein Modell, so ist T vollständig gdw T = Th(A) für ein
(oder: alle) Modelle A von T.
9.2. D IE T HEORIE DER DICHTEN LINEAREN O RDNUNG
175
6. Für einen Isomorphismus h : A ∼
= B gilt:
A |= ϕ[a1 , . . . an ] ⇐⇒ B |= ϕ[h(a1 ), . . . h(an )],
d. h. ein Isomorphismus ist eine elementare Einbettung (s.u.), und somit
sind isomorphe Strukturen äquivalent. Das obige Beispiel in (2) zeigt, daß
die Umkehrung aber nicht zu gelten braucht: elementar-äquivalente Strukturen können sogar verschiedene Mächtigkeiten haben und lassen sich daher
nicht einmal als Mengen bijektiv aufeinander abbilden.
7. Ist A endlich, so ist im Falle A ≡ B auch B endlich, und zwar von derselben
Anzahl (da beide dieselben Anzahlformeln erfüllen). Tatsächlich kann man
zeigen, daß A und B in diesem Fall sogar isomorph sind!
Die obigen Beispiele zeigen zudem, daß elementare Äquivalenz in starkem
Maße von der Sprache abhängt, die man zugrunde legt. Die Relation der elementaren Äquivalenz ist ein wichtiger Grundbegriff der Modelltheorie, läßt sich aber
i. a. schwer nachweisen, da man über Sätze einer Sprache keine Induktion führen
kann. (Meistens weist man diese Relation nach über die stärkere Isomorphiebeziehung oder zeigt, daß beide Strukturen Modelle einer vollständigen Theorie sind.)
9.2 Die Theorie der dichten linearen Ordnung
Wir wollen hier ein Musterbeispiel einer vollständigen Theorie behandeln. Dazu
werden wir zeigen, daß je zwei abzählbare Modelle isomorph sind; aus dem später
folgenden Kriterium 10.6 von VAUGHT wird sich dann ergeben, daß diese Theorie
vollständig ist.
Die Theorie LO der linearen Ordnung wird in einer Sprache mit einem 2stelligen Relationszeichen < formuliert und hat folgende Axiome:
(L1) ∀x x 6< x
(L2) ∀x∀y∀z (x < y ∧ y < z → x < z)
(L3) ∀x∀y (x < y ∨ x = y ∨ y < x)
irreflexiv
transitiv
connex
Für dichte Ordnungen gilt zusätzlich
(D)
∀x∀y∃z (x < y → x < z ∧ z < y)
dicht
9.2. D IE T HEORIE DER DICHTEN LINEAREN O RDNUNG
176
Diese Theorie ist noch nicht vollständig; sie wird es aber, wenn man Aussagen
über die Endpunkte hinzunimmt, etwa
(OE) ∀x∃y (x < y) ∧ ∀x∃y (y < x)
ohne Endpunkte
DLO sei die Theorie der dichten linearen Ordnungen (Axiome: L1−L3, D);
Beispiele von Modellen von DLO + OE sind (Q, <) und (R, <), ersteres ist bis
auf Isomorphie das einzige abzählbare Modell:
Isomorphiesatz von Cantor
Je zwei abzählbare dichte lineare Ordnungen ohne Endpunkte sind isomorph.
Beweis: Es seien (A, <), (B, <0 ) abzählbare dichte Ordnungen ohne Endpunkte,
A = {a0 , a1 , . . .}, B = {b0 , b1 , . . .}. Wir konstruieren einen Isomorphismus
h : (A, <) ∼
= (B, <0 ) mit a0n 7→ b0n wie folgt:
hin: a0 7→ b0 , wir setzen also a00 := a0 , b00 := b0 .
..
.
her: In der Aufzählung B = {b0 , b1 , . . .} kommt nach b0 als nächstes Element
b1 =: b01 an die Reihe: wir suchen in der Aufzählung A = {a0 , a1 , . . .} ein
entsprechendes a01 , welches in der Ordnung < zu a00 = a0 so liegt, wie b01 zu
b00 (da die Ordnungen keine Endpunkte haben, ist dies möglich).
hin: Es sei n = 2i − 1 ungerade und die Zuordnung a00 7→ b00 , . . . , a0n 7→ b0n bereits gefunden. Wir wählen a0n+1 als das erste a in der Aufzählung A =
{a0 , a1 , . . .}, welches wir noch nicht nach B abgebildet haben (welches also
unter den a00 , . . . a0n noch nicht vorgekommen ist) und ordnen diesem ein entsprechendes b0n+1 in B zu, welches unter den bisherigen Bildern b00 , . . . , b0n
nicht vorkommt, so daß es zu diesen in der Ordnung <0 so liegt, wie a zu
den a00 , . . . a0n , mithin
({a00 , . . . , a0n+1 }, <) ∼
= ({b00 , . . . , b0n+1 }, <),
was möglich ist, da die Ordnung <0 auf B dicht und ohne Endpunkte ist.
her: Es sei n = 2i gerade und die die Zuordnungen a00 7→ b00 , . . . , a0n 7→ b0n bereits gefunden. Wir wählen jetzt umgekehrt ein b0n+1 als das erste b in der
Aufzählung B = {b0 , b1 , . . .}, für welches wir noch kein Urbild in A gefunden haben (welches also unter den b00 , . . . b0n noch nicht vorgekommen
9.2. D IE T HEORIE DER DICHTEN LINEAREN O RDNUNG
177
ist) und ordnen diesem ein entsprechendes a0n+1 in A zu, welches unter den
bisherigen Urbildern a00 , . . . , a0n nicht vorkommt, so daß es zu diesen in der
Ordnung < so liegt, wie b zu den b00 , . . . , b0n , mithin
({a00 , . . . , a0n+1 }, <) ∼
= ({b00 , . . . , b0n+1 }, <),
was möglich ist, da die Ordnung < auf A dicht und ohne Endpunkte ist.
Damit erhalten wir eine ordnungstreue bijektive Abbildung h : A ←→ B, die wegen
der ”hin”-Fälle schließlich alle Elemente von A abbildet und wegen der ”her”Fälle auch alle Elemente von B als Bilder annimmt.
Bemerkungen
1. Auf ähnliche Weise kann man zeigen, daß auch zwei abzählbare dichte lineare Ordnungen mit erstem und letztem Element isomorph sind (indem
man diese zuerst aufeinander abbildet und dann mit dem Hin- und Herverfahren fortfährt), ähnlich bei anderen Festlegungen über die Endelemente.
Die (zunächst unvollständige) Theorie der dichten linearen Ordnungen hat
also 4 verschiedene Vervollständigungen: ohne Endelemente, mit beiden
Endpunkten, mit nur kleinstem und ohne größtes sowie mit größtem, aber
ohne kleinstes Element.
2. Die Methode des “Hin und Her” stammt von H UNTINGTON 1904; C ANTOR
hat nur den “Hin”-Teil benutzt, welcher übrigens zeigt, daß man (Q, <) in
jede dichte lineare Ordnung einbetten kann. (Diese Methode läßt sich in der
Modelltheorie sehr gut verallgemeinern.)
3. Überabzählbare dichte lineare Ordnungen derselben Mächtigkeit brauchen
jedoch nicht isomorph zu sein: Ist etwa (R, <) eine solche Ordnung, so ist
die Ordnung, die man erhält, wenn man eine Kopie der abzählbaren Struktur (Q, <) anfügt, von derselben Mächtigkeit, aber nicht isomorph. Es gilt
sogar: Nimmt man aus den rationalen Zahlen einen Punkt heraus, so ist die
verbleibende Struktur immer noch eine abzählbare lineare Ordnung ohne
Endpunkte (ähnlich, wenn man endlich-viele Punkte herausnimmt), anders
jedoch im Falle von (R, <):
(Q\{0}, <) ∼
= (Q, <),
aber (R\{0}, <) ∼
6 (R, <).
=
9.3. K ATEGORIZIT ÄT
178
Die Unterschiede beruhen darauf, daß (Q, <) sehr viele “Lücken” hat, die
erst durch Hinzunahme der irrationalen Zahlen geschlossen werden; dagegen ist (R, <) so dicht (ein Kontinuum), daß dort jede monoton aufsteigende
beschränkte Folge einen Limes hat.
9.3 Kategorizität
Definiert man eine Theorie T als kategorisch genau dann, wenn je zwei Modelle
von T isomorph sind, so sind zwar vollständige Theorien mit einem endlichen
Modell kategorisch, aber - wie wir im nächsten Kapitel sehen werden - keine
Theorie mit einem unendlichen Modell. Man kann dann höchstens noch danach
fragen, ob Modelle derselben Mächtigkeit isomorph sind:
T κ-kategorisch : ⇐⇒ je zwei Modelle von T der Kardinalität κ sind isomorph.
Nach dem Isomorphiesatz von C ANTOR ist die Theorie DLO der dichten linearen Ordnung ohne Endpunkte ℵ0 -kategorisch, woraus leicht folgt, daß sie auch
vollständig ist. Diese Folgerung werden wir im nächsten Kapitel verallgemeinern:
der Test von VAUGHT 10.6 liefert mittels der Kategorizität ein Kriterium für die
Vollständigkeit einer Theorie.
Es gibt Theorien, die
• für keine unendliche Kardinalzahl κ κ-kategorisch sind (z. B. die Theorie
der reell-abgeschlossenen Körper),
• für κ = ℵ0 , aber für keine überabzählbare Kardinalzahl κ κ-kategorisch
sind (z. B. die Theorie der dichten linearen Ordnung ohne Endpunkte),
• nur für überabzählbare Kardinalzahl κ κ-kategorisch sind (z. B. die Theorie
der algebraisch-abgeschlossenen Körper),
• für alle unendlichen Kardinalzahlen κ κ-kategorisch sind (z.B. die Theorie der unendlichen Mengen in der Sprache mit = und den Konstanten cn ;
einzige Axiome sind die Sätze cn 6= cm für n 6= m).
Mehr Unterscheidungen gibt es nicht: Nach einem Satz von M ORLEY (1965)
gilt:
9.3. K ATEGORIZIT ÄT
179
Ist eine Theorie T (in einer abzählbaren Sprache) κ-kategorisch für ein überabzählbares κ, so ist T κ-kategorisch für alle überabzählbaren κ.
(Entsprechend verallgemeinert gilt nach S HELAH dieses Ergebnis auch für
Theorien in einer überabzählbaren Sprache.) Interessant ist außerdem das Ergebnis von VAUGHT, daß eine vollständige Theorie niemals genau zwei abzählbare
nicht-isomorphe Modelle besitzen kann. Eine Reihe neuerer Arbeiten (insbesondere von S HELAH) beschäftigt sich mit der Frage
• wieviele nicht-isomorphe Modelle der Mächtigkeit κ kann eine Theorie T
besitzen und
• wie kann man diese Modelle klassifizieren?
180
Kapitel 10
Auf und ab: Elementare
Substrukturen
10.1 Elementare Substrukturen
A und B seien Strukturen derselben Sprache L, A ⊆ B. Dann heißt A elementare
Substruktur von B gdw beide bezüglich der Elemente der kleineren Struktur
dieselben Eigenschaften erfüllen:
A 4 B : ⇐⇒ für alle L-Formeln ϕ(v1 , . . . vn ) und für alle a1 , . . . an ∈ A :
A |= ϕ[a1 , . . . an ]
⇐⇒
B |= ϕ[a1 , . . . an ],
A4B
⇐⇒
AA ≡ BA .
d. h.
Ein Homomorphismus h : A −→ B heißt eine elementare Einbettung gdw für
alle L-Formeln ϕ(v1 , . . . vn ) und für alle a1 , . . . an ∈ A gilt:
A |= ϕ[a1 , . . . an ] ⇐⇒ B |= ϕ[h(a1 ), . . . h(an )].
Indem man für ϕ die Formeln v1 = v2 bzw. R(v1 , . . . vn ) wählt, sieht man, daß
in diesem Fall h tatsächlich eine Einbettung sein muß. Die obige Bedingung besagt also gerade, daß das Bild h[A] eine elementare Substruktur von B ist; durch
Identifizieren kann man dann also A 4 B erreichen.
Diese Begriffe kann man auch mit Hilfe des Diagramms charakterisieren; der
Beweis des früheren Diagrammlemmas 3.4.1 läßt sich nämlich leicht erweitern:
10.2. D IAGRAMMLEMMA (F ORTSETZUNG )
181
10.2 Diagrammlemma (Fortsetzung)
Es sei A eine L-Struktur, (B, (aB )a∈A ) eine LA -Struktur und h : A −→ B definiert
durch h(a) = aB . Dann gilt:
(i) (B, (h(a))a∈A ) |= D(A) ⇐⇒ h : A −→ B ist eine Einbettung,
(ii) (B, (h(a))a∈A ) |= DL (A) ⇐⇒ h : A −→ B ist eine elementare Einbettung.
Insbesondere gilt für A ⊆ B:
(iii) BA |= D(A) ⇐⇒ A ⊆ B,
(iv) BA |= DL (A) ⇐⇒ A 4 B,
(v) AA ≡ BA ⇐⇒ A 4 B.
10.3 Kriterium von Tarski
Es seien A, B L-Strukturen, A ⊆ B. Dann sind äquivalent:
(i) A 4 B
(ii) für alle L-Formeln ϕ(v0 , . . . , vn ) und beliebige a1 , . . . an ∈ A gilt:
B |= ∃v0 ϕ[a1 , . . . an ] =⇒ es gibt ein a0 ∈ A mit B |= ϕ[a0 , a1 , . . . an ].
Der Beweis ist sehr einfach: (i) ⇒ (ii) folgt unmittelbar aus der Definition einer
elementaren Substruktur, während man die Umkehrung durch Induktion über den
Formelaufbau beweist. Dabei sind alle Fälle trivial bis auf den Fall einer Formel
der Gestalt ∃vo ϕ, und hier liefert das Kriterium den entscheidenden Schritt von
der Existenz in der Struktur B zur Existenz in der Unterstruktur A.
Dieses Kriterium ist besonders nützlich, weil in (ii) nur die Gültigkeit in der
Struktur B vorkommt. Für Anwendungen kann man auch oft den folgenden Satz
benutzen:
Satz
Es sei A ⊆ B und für beliebige a1 , . . . an ∈ A, b ∈ B existiere ein Automorphismus
j : B −→ B mit j(ai ) = ai und j(b) ∈ A,
welcher also die ai festläßt und b nach A abbildet. Dann ist A 4 B.
10.4. S ATZ VON L ÖWENHEIM -S KOLEM -TARSKI ( ABW ÄRTS )
182
Beispiele
1. (Q, <) 4 (R, <) (wende obigen Satz an!) und somit auch (Q, <) ≡ (R, <).
2. A 4 B =⇒ A = B, falls A oder B endlich sind. (Denn nach Voraussetzung
gelten in A dieselben Anzahlformeln wie in B.)
Endliche Strukturen haben somit weder echte elementare Substrukturen noch
echte elementare Erweiterungen, anders dagegen im Falle unendlicher Strukturen:
Diese haben in jeder kleineren Mächtigkeit κ (solange noch κ ≥ card(L)) eine
elementare Substruktur:
10.4 Satz von Löwenheim-Skolem-Tarski (abwärts)
A sei eine L-Struktur, κ eine Kardinalzahl mit card(L) ≤ κ ≤ card(A). Dann
existiert eine Struktur B mit
B 4 A und card(B) = κ.
Zusatz: Ist A0 ⊆ A beliebig mit card(A0 ) ≤ κ, so kann man zusätzlich A0 ⊆ B
verlangen.
Beweis: Es sei A0 ⊆ A gegeben mit card(A0 ) ≤ κ ≤ card(A). Indem wir A0 nötigenfalls vergrößern, können wir annehmen, daß card(A0 ) = κ ist. Falls für Elemente a1 , . . . , an ∈ A0
(∗) A |= ∃v0 ϕ[a1 , . . . , an ]
gilt, so müssen wir ein (von ϕ und den a1 , . . . , an abhängiges) b∃v0 ϕ (a1 , . . . , an ) zu
A0 hinzunehmen; A1 sei die Menge, die aus A0 entsteht, indem solche Beispiele
(und zwar für alle möglichen Existenzformeln und alle möglichen Belegungen mit
Elementen aus A0 ) hinzugenommen werden. Nach unseren früheren Ergebnissen
über unendliche Kardinalzahlenbleibt card(A1 ) = card(A0 ) = κ.
Nun kann aber (*) möglicherweise für eine Formel ϕ und neue Elemente
a1 , . . . , an ∈ A1 gelten, die nicht in A0 enthalten sind; wir müssen also das Verfahren wiederholen:
Ist Ai definiert, so ergänze man es um geeignete Elemente von A, so daß gilt:
Falls für a1 , . . . , an ∈ Ai : A |= ∃v0 ϕ[a1 , . . . , an ],
so existiert ein a ∈ Ai+1 mit A |= ϕ[a, a1 , . . . , an ].
10.5. S ATZ VON L ÖWENHEIM -S KOLEM -TARSKI ( AUFW ÄRTS )
183
Wie im ersten Schritt läßt sich Ai+1 aus Ai gewinnen, ohne daß die Kardinalität
sich ändert. Schließlich setzen wir
B :=
[
Ai
i∈N
und erhalten eine Menge B mit A0 ⊆ B ⊆ A und card(B) = κ. Beim ersten Schritt
müssen wir die Konstanten von A bereits aufgenommen haben (mit (*) für die
Formel ∃v0 (v0 = c)) und in allen weiteren Schritten unter den Funktionen von
A abgeschlossen haben (entsprechend der Formel ∃v0 (v0 = F(v1 , . . . , vn )), so daß
B das Universum einer Unterstruktur B von A ist. Schließlich gilt B 4 A, weil
unsere Konstruktion gerade so eingerichtet ist, daß das Kriterium von TARSKI VAUGHT anwendbar ist.
Einfacher mit Hilfe des Kompaktheitssatzes erhalten wir den
10.5 Satz von Löwenheim-Skolem-Tarski (aufwärts)
A sei eine unendliche L-Struktur, κ eine Kardinalzahl mit card(A), card(L) ≤ κ.
Dann existiert eine Struktur B mit
A 4 B , card(B) = κ.
Beweis: Wir wählen zunächst eine Menge C mit A ⊆ C und card(C) = κ und
erweitern die Theorie von A (mit Hilfe neuer Konstanten) um Sätze, so daß jedes
Modell mindestens so viele Elemente wie C hat:
T0 = Th(A) ∪ {c 6= d|c, d ∈ C, c 6= d}.
Nach dem Kompaktheitssatz hat T0 ein Modell, etwa B, in welchem die neuen
Konstanten c durch Elemente von B interpretiert werden, und zwar verschiedene
Konstanten durch verschiedene Elemente von B. Indem wir zu einer isomorphen
Struktur übergehen, können wir annehmen, daß cB = c ist und somit C ⊆ B, also
card(B) ≥ κ. Die Sprache von T0 hat wegen κ ≥ card(L) die Mächtigkeit κ, also
kann man auch annehmen, daß card(B) = κ ist (indem man den Abwärts-Satz
benutzt).
Schließlich gilt wegen B |= Th(A) : A ≡ B. Die stärkere Aussage A 4 B
erhält man, indem man dasselbe Argument benutzt, jedoch statt Th(A) das elementare Diagramm Th(AA ) wählt, das aus allen in A wahren LA -Sätzen besteht.
10.6. T EST VON VAUGHT
184
Folgerungen
1. Ist A eine L-Struktur und κ ≥ card(L) eine Kardinalzahl, so gibt es eine
Struktur B mit card(B) = κ und
• B4A
im Falle κ ≤ card(A),
• A4B
im Falle card(A) ≤ κ.
2. Insbesondere hat jede Theorie T, die ein unendliches Modell besitzt, für
jede Kardinalzahl κ ≥ card(L) ein Modell der Kardinalzahl κ.
3. Noch spezieller: Eine Theorie T in einer abzählbaren Sprache L, die überhaupt ein Modell hat, hat ein abzählbares Modell. Dieser Satz von L ÖWEN HEIM (1915) ist eines der frühesten Ergebnisse der mathematischen Logik.
Zusammenfassung
Mit früheren Ergebnissen erhalten wir:
1. Hat eine vollständige Theorie ein endliches Modell, so sind also alle Modelle dieser Theorie isomorph (zu diesem einen Modell).
2. Hat eine Theorie beliebig große endliche Modelle, so nach 3.3.2 auch ein
unendliches Modell.
3. Für eine Theorie T mit einem unendlichen Modell gibt es Modelle in jeder
Mächtigkeit κ ≥ card(L), wobei L die Sprache der Theorie T ist.
10.6 Test von Vaught
Ist eine Theorie T κ -kategorisch für ein κ ≥ card(L) und besitzt T nur unendliche
Modelle, so ist T vollständig.
Beweis: Gegeben seien zwei Modelle A, B von T, von denen wir zeigen müssen,
daß sie elementar-äquivalent sind. Da sie unendlich sind, kann man nach den
Sätzen von L ÖWENHEIM -S KOLEM -TARSKI zu elementaren Erweiterungen (bzw.
Substrukturen) A0 , B0 dieser Strukturen übergehen, die dann dieselbe Mächtigkeit
κ haben, also nach Voraussetzung isomorph, insbesondere elementar-äquivalent
sind. Damit sind dann aber auch A, B elementar-äquivalent.
185
Kapitel 11
Vereinigungen, Durchschnitte und
Ketten
Bekanntlich ist der Durchschnitt von (affinen) Unterräumen eines Vektorraumes
wieder ein Unterraum (oder die leere Menge), während die Vereinigungsmenge
lediglich einen Unterraum aufspannt. Ähnlich ist es im allgemeinen Fall von Substrukturen einer Struktur A:
Durchschnitt
Es sei (Ai )i∈I eine Familie von Substrukturen einer Struktur A. Dann ist der
T
Durchschnitt i∈I |Ai | entweder 0/ oder Grundbereich einer Substruktur von A,
T
die mit i∈I Ai bezeichnet wird.
Denn sind die Bedingungen (i) und (ii) von Satz 2.2.2 für alle |Ai | erfüllt, so
auch für deren Durchschnitt. - Wichtiger als der Durchschnitt ist die
Vereinigung
Es sei wieder (Ai )i∈I eine Familie von Substrukturen einer Struktur A. Dann erS
S
zeugt die Vereinigungsmenge i∈I |Ai | eine Substruktur von A, die mit i∈I Ai
S
bezeichnet wird, ihr Grundbereich ist i∈I |Ai |.
Interessanter ist der Fall, daß für eine vorgegebene Familie von Strukturen eine gemeinsame Oberstruktur nicht vorhanden ist, sondern erst gebildet werden
soll. Dazu müssen aber die Strukturen bestimmte Verträglichkeitsbedingungen
erfüllen.
11.1. S ATZ ÜBER K ETTEN VON S TRUKTUREN
186
Ketten von Strukturen
Eine Familie (Ai )i∈I von L-Strukturen bildet eine Kette, wenn je zwei Strukturen
miteinander vergleichbar sind in dem Sinne, daß von zwei Strukturen jeweils eine
Struktur eine Substruktur der anderen ist:
(K) (Ai )i∈I ist eine Kette : ⇐⇒ ∀i, j ∈ I : Ai ⊆ A j oder A j ⊆ Ai .
Damit sind auch je endlich-viele Strukturen der Kette vergleichbar; insbesondere:
wenn Ai1 . . . Ain Strukturen der Kette sind, so sind alle ⊆ Aik für ein k.
Später benötigen wir einen stärkeren Begriff:
(Ai )i∈I ist eine elementare Kette : ⇐⇒ ∀i, j ∈ I : Ai 4 A j oderA j 4 Ai .
Die Vereinigung
i∈I Ai
S
einer Kette können wir wie folgt definieren:
(V1) |A| :=
S
i∈I |Ai |,
(V2) RA :=
S
Ai
für jedes Relationszeichen R der Sprache L,
(V3) f A :=
S
f Ai
für jedes Funktionszeichen f der Sprache L,
i∈I R
i∈I
(V4) cA := cAi
für jede Individuenkonstante c der Sprache L.
Das bedeutet also für ein Relationszeichen R und Elemente a1 , . . . , an ∈ A:
RA (a1 , . . . , an ) ⇐⇒ RAi (a1 , . . . , an ) für ein i ∈ I mit a1 , . . . , an ∈ Ai ,
wobei es wegen (K) auf die Auswahl des gewählten i nicht ankommt, ähnlich im
Falle der Funktionszeichen. Die Individuenkonstanten werden wegen (K) in allen
Ai durch dasselbe Element interpretiert (und damit auch in der Vereinigung).
11.1 Satz über Ketten von Strukturen
Ist A =
i∈I Ai
S
die Vereinigung der Kette (Ai )i∈I , so gilt:
(i) A ist eine L-Struktur mit Ai ⊆ A für jedes i ∈ I,
(ii) A ist die kleinste derartige L-Struktur.
11.1. S ATZ ÜBER K ETTEN VON S TRUKTUREN
187
(iii) Ist (Ai )i∈I eine elementare Kette, so gilt Ai 4 A für jedes i ∈ I.
(Kettenlemma von Tarski)
In den meisten Fällen (wie auch in den folgenden Beispielen) kann man sich
auf aufsteigende ω-Ketten von Strukturen beschränken; in diesen Fällen ist die
Indexmenge I = ω = N und es gilt:
∀n < m
An ⊆ Am .
Beispiele
1. Es sei An := [1/2n , 1] das abgeschlossene Intervall der reellen Zahlen, An =
(An , ≤) mit der gewöhnlichen ≤-Beziehung auf den reellen Zahlen. Dann
ist die Vereinigung dieser Strukturen das halb-offene Intervall (A, ≤) mit
A = (0, 1].
2. Es sei An := {x ∈ Z| − n ≤ x ≤ n}, An = (An , ≤) mit der gewöhnlichen ≤Beziehung auf den ganzen Zahlen. Dann ist die Vereinigung dieser Strukturen (Z, ≤).
In beiden Fällen ist die Vereinigung von (dichten) linearen Ordnungen wieder eine
(dichte) lineare Ordnung, aber die Existenz von Endpunkten bleibt nicht erhalten!
Im ersten Fall haben wir isomorphe, insbesondere elementar-äquivalente Strukturen, aber die Vereinigung hat neue Eigenschaften. Man kann nun aber genau
angeben, welche Eigenschaften erhalten bleiben:
σ ist ein ∀∃-Satz: ⇐⇒ σ = ∀x1 . . . ∀xn ∃y1 . . . ∃ym ϕ
für eine quantorenfreie Formel ϕ
Beispiele
1. ∀x∃y (x ≤ y ∧ x 6= y) (Unbeschränktheit nach oben) ist ein ∀∃-Satz, nicht
aber ∃x∀y x ≤ y (Existenz eines kleinsten) bzw. ∃x∀y y ≤ x (Existenz eines
größten Elementes).
2. Wichtige Sätze der Algebra sind ebenfalls ∀∃-Sätze: ∀x∃y (x ◦ y = e) (Existenz eines inversen Elementes) sowie
∀x0 . . . xn ∃y (yn+1 + xn yn + . . . + x0 = 0)
(Existenz von Nullstellen für normierte Polynome vom Grad n + 1).
∀∃-Sätze bleiben bei der Vereinigung von Ketten erhalten:
188
11.2. S ATZ VON C HANG - Ł O Ś -S ZUSKO
Erhaltungssatz für Ketten
Ist A =
i∈I Ai
S
die Vereinigung der Kette (Ai )i∈I , so gilt für jeden ∀∃-Satz σ :
Ai |= σ für alle i ∈ I =⇒ A |= σ .
Beweis: Es sei σ = ∀x1 . . . ∀xn ∃y1 . . . ∃ym ϕ für eine quantorenfreie Formel ϕ
und σ gelte in allen Ai . Um die Gültigkeit in A nachzuweisen, seien beliebige a1 , . . . , an ∈ A gegeben. Nach Definition der Vereinigungsmenge einer Kette
können wir ein i ∈ I finden, so daß alle a1 , . . . , an ∈ Ai sind. Weil σ in Ai gilt, gibt
es b1 , . . . , bm ∈ Ai mit
Ai |= ϕ[a1 , . . . , an , b1 , . . . , bm ].
Da ϕ quantorenfrei ist, sich also aussagenlogisch aus atomaren Formeln zusammensetzt, und da Ai ⊆ A, so gilt die Formel ϕ mit derselben Belegung auch in A.
Die b1 , . . . , bm sind aber auch in A, so daß dort der Existenzsatz gilt:
A |= ∃y1 . . . ∃ym ϕ[a1 , . . . , an , b1 , . . . , bm ].
Das obige Ergebnis ist optimal: Eine Theorie heiße induktiv gdw sie abgeschlossen ist unter Vereinigungen von Ketten, d. h. ist (Ai )i∈I eine Kette von MoS
dellen von T, so ist auch die Vereinigung i∈I Ai ein Modell von T.
11.2 Satz von Chang- Łoś-Szusko
Eine Theorie T ist induktiv gdw sie ein Axiomensystem aus ∀∃-Sätzen besitzt.
Beim Beweis (den wir hier nicht ausführen können) wird für die Induktivität
von T nur die Abgeschlossenheit unter aufsteigenden ω-Ketten benötigt, hieraus
folgt dann also schon die Abgeschlossenheit unter beliebigen Ketten!
Zahlreiche algebraische Theorien sind induktiv: die Theorie der (A BELschen)
Gruppen, der Ringe, der (reell- bzw. algebraisch-abgeschlossenen) Körper, der
Vektorräume, etc.
189
Kapitel 12
Produkte und Ultraprodukte
Während sich die Vereinigung einer Familie von Strukturen nur unter geeigneten Verträglichkeitsbedingungen sinnvoll definieren läßt, kann man das (direkte)
Produkt stets bilden. Dazu erinnern wir an den Begriff der Familie von Mengen:
(ai )i∈I ist die auf der Indexmenge I definierte
Funktion f mit f (i) = ai für alle i ∈ I.
Das mengentheoretische Produkt einer Familie (Ai )i∈I ist eine Verallgemeinerung des endlichen Cartesischen Produktes:
∏ Ai := {(ai)i∈I | ∀i ∈ I ai ∈ Ai}
Produkt der Mengen (Ai )i∈I
i ∈I
Das Auswahlaxiom (s. 7.2) besagt gerade, daß die Produktmenge nicht-leerer
Mengen wiederum nicht-leer ist.
Bezeichnungen: Um endliche Folgen von Elementen aus der Produktmenge
zu bezeichnen, werden wir Querstriche und obere Indizes verwenden:
• a1 = (a1i )i∈I , . . . , an = (ani )i∈I
seien n Elemente der Produktmenge A = ∏i ∈I Ai ,
• a = (a1 , . . . , an ) bezeichnet das entsprechende n-Tupel aus An ,
• ai = (a1i , . . . , ani ) die i-te Projektion des n-Tupels a = (a1 , . . . , an ).
12.1. D IREKTES P RODUKT
190
12.1 Direktes Produkt
(Ai )i∈I sei eine Familie von L-Strukturen, I 6= 0.
/ Das direkte Produkt der (Ai )i∈I
ist die L-Struktur A = ∏i ∈I Ai , die wie folgt erklärt ist:
(P1) A := ∏i ∈I Ai ist der Grundbereich von A,
(P2) RA (a) : ⇐⇒ ∀i ∈ I RAi (ai ) für jedes Relationszeichen R von L,
(P3) f A (a) := ( f Ai (ai ))i∈I für jedes Funktionszeichen f von L,
(P4) cA := (cAi )i∈I für jede Individuenkonstante c von L.
Für eine endliche Indexmenge I = {1, . . . , m} schreibt man auch A1 × . . . ×
Am , und sind alle Strukturen dieselbe Struktur A, so bezeichnet man das direkte
Produkt auch mit AI und nennt es direkte Potenz von A.
Beispiele
1. Ist R der gewöhnliche Vektorraum über den reellen Zahlen, so ist Rn das nfache direkte Produkt (die n-te Potenz) von R, denn die Operationen werden
nach P3 komponentenweise erklärt. Allgemeiner ist das direkte Produkt von
Gruppen wieder eine Gruppe.
2. Das direkte Produkt A × A der linearen Ordnungen A = (R, <) ist jedoch
nur eine partielle Ordnung, denn nach P2 werden die Relationen im Produkt ebenfalls komponentenweise erklärt, was in diesem Fall aber bedeutet, daß etwa die Paare (0, 1) und (1, 0) in der Ordnungsrelation des Produktes unvergleichbar sind. Ebenso ist das direkte Produkt des Körpers der
reellen Zahlen mit sich kein Körper, da im Produkt Nullteiler auftauchen:
(0, 1) · (1, 0) = (0, 0) bei komponentenweiser Multiplikation!
Da sich nicht alle Eigenschaften von allen Strukturen auf das direkte Produkt
übertragen lassen, wird man versuchen, die Eigenschaften von sehr vielen Strukturen zu erhalten. Der Begriff von “sehr vielen” Elementen von I (oder von einer
“sehr großen” Teilmenge von I) wird durch den Begriff des Filters umschrieben:
12.2. F ILTER UND U LTRAFILTER
191
12.2 Filter und Ultrafilter
Es sei I 6= 0/ eine Menge und P(I) := {X | X ⊆ I} ihre Potenzmenge. Eine Menge
F ⊆ P(I) heißt (echter) Filter auf I gdw
(F1) 0/ 6∈ F und I ∈ F,
(F2) A ∈ F und A ⊆ B ⊆ I =⇒ B ∈ F,
(F3) A, B ∈ F =⇒ A ∩ B ∈ F.
Für einen Ultrafilter auf I gilt zusätzlich für alle A ⊆ I:
(F4) (entweder) A ∈ F oder I\A = {x ∈ I | x 6∈ A} ∈ F.
Ultrafilter haben besonders schöne Eigenschaften, die sie für die Logik interessant machen: Ist U Ultrafilter auf I, so gilt für alle A, B ⊆ I:
(U1) A 6∈ U ⇐⇒ I\A ∈ U,
(U2) A ∈ U ∧ B ∈ U ⇐⇒ A ∩ B ∈ U,
(U2) A ∈ U ∨ B ∈ U ⇐⇒ A ∪ B ∈ U.
Beispiele und Bemerkungen
1. Für jedes 0/ 6= A ⊆ I ist F(A) := {X ⊆ I | A ⊆ X} ein Filter, der von A
erzeugte Hauptfilter. Dieser ist ein Ultrafilter genau dann, wenn A nur ein
Element besitzt. Interessanter sind Ultrafilter, die keine Hauptfilter sind, sie
werden auch freie Ultrafilter genannt (während die Hauptultrafilter durch
ein Element fixiert sind).
2. Hat I = {a, b} zwei Elemente a 6= b, so gibt es auf I die Filter {I}, {{a}, I}
und {{b}, I}; die letzten beiden sind Hauptultrafilter, {I} ist zwar Hauptfilter, aber kein Ultrafilter. Allgemeiner ist auf einer endlichen Menge I jeder
Filter ein Hauptfilter (erzeugt vom Durchschnitt der endlich-vielen Elemente des Filters).
3. Auf einer unendlichen Menge M ist die Menge
{X ⊆ M | X co-endlich (d. h. M \ Xendlich)}
192
12.3. U LTRAFILTERSATZ , B OOLESCHES P RIMIDEALTHEOREM
ein Filter auf M, der kein Hauptfilter (und auch kein Ultrafilter) ist und
welcher im Falle M = N F R ÉCHET-Filter genannt wird. Ultrafilter, die den
obigen Filter erweitern, können keine endlichen Mengen als Elemente enthalten und sind somit freie Ultrafilter.
Die Existenz von freien Ultrafiltern auf unendlichen Mengen ist nicht trivial;
allgemeiner gilt für Mengen E mit der finite intersection property (endlicheDurchschnitts-Eigenschaft)
(fip) Jeder Durchschnitt von endlich-vielen Elementen aus E ist 6= 0:
/
12.3 Ultrafiltersatz, Boolesches Primidealtheorem
(i) Ist E ⊆ P(I) eine Menge mit der Eigenschaft (fip), so existiert ein Ultrafilter
U auf I mit E ⊆ U. Insbesondere:
(ii) Jeder Filter F läßt sich erweitern zu einem Ultrafilter U ⊇ F.
(Dieses Ergebnis ist äquivalent zum Kompaktheitssatz; am einfachsten beweist
man es jedoch mit Hilfe des (stärkeren) Z ORNschen Lemmas.)
Ist U ein Ultrafilter auf einer Indexmenge I, so können wir die Elemente von
U auffassen als Teilmengen von I, die “fast alle” Elemente von I enthalten, und
die Eigenschaften, die in “fast allen” Strukturen Ai gelten, werden sich wegen
der besonderen “logischen” Eigenschaften von Ultrafiltern auf das entsprechende
Ultraprodukt übertragen. Zunächst erklären wir Produkte modulo einem Filter:
12.4 Reduziertes Produkt
Es sei F ein Filter auf der Menge I und (Ai )i∈I eine Familie von L-Strukturen.
Für a, b ∈ A = ∏i ∈I Ai setzen wir
a ∼F b : ⇐⇒ {i ∈ I | ai = bi } ∈ F
(wir können es lesen als “a ist - bezüglich F - fast überall gleich b”) und erhalten
eine Äquivalenzrelation auf A; mit aF oder a/F bezeichnen wir die zugehörige
Äquivalenzklasse, und für endliche Folgen a = (a0 , . . . , an ) schreiben wir auch
kurz a/F = (a0 /F, . . . , an /F).
Das reduzierte Produkt A/F = ∏i ∈I Ai /F wird nun wie folgt definiert:
193
12.5. S ATZ VON Ł O Ś
(R1) A/F := {aF | a ∈ A}
ist die Menge der Äquivalenzklassen als Grundbereich,
(R2) RAF (aF ) : ⇐⇒ {i ∈ I | RAi (ai )} ∈ F
für jedes Relationszeichen R von L,
(R3) f AF (aF ) := ( f Ai (ai ))i∈I /F = f A (a)/F
für jedes Funktionszeichen f von L,
(R4) cA/F := (cAi )i∈I /F = cA /F für jede Individuenkonstante c von L.
Das bedeutet also, daß im Falle einer 2-stelligen Relation R im reduzierten
Produkt
aF R bF gilt gdw für die Komponenten ai R bi in “fast allen” Strukturen Ai gilt
(wie speziell oben im Falle der Gleichheitsrelation =). (Natürlich muß man nachprüfen, daß die obige Definition korrekt ist, d. h. daß sie nur von den Äquivalenzklassen (und nicht von deren Repräsentanten) abhängig ist.) Sind alle Strukturen
Ai = A, so spricht man von einer reduzierten Potenz A, ist der Filter F ein Ultrafilter, von einem Ultraprodukt bzw. einer Ultrapotenz.
Wir kommen nun zum fundamentalen Satz über Ultraprodukte:
12.5 Satz von Łoś
I sei eine nichtleere Menge und U ein Ultrafilter auf I. Ferner sei (Ai )i∈I eine
Familie von L-Strukturen und A = ∏i ∈I Ai das Produkt.
Dann gilt für alle L-Formeln ϕ und alle Belegungen a:
A/U |= ϕ[aU ] ⇐⇒ {i ∈ I | Ai |= ϕ[ai ]} ∈ U,
d. h. eine Formel gilt im Ultraprodukt gdw sie (für die entsprechenden Komponenten) in fast allen Faktoren gilt.
Zum Beweis des Satzes von Łoś führen wir folgende Bezeichnung ein: Für
eine L-Formel ϕ(v0 , . . . , vn−1 ) und ein n-Tupel a von Elementen aus A heißt
kϕ(a)k := {i ∈ I | Ai |= ϕ[ai ]}
die Boolesche Ausdehnung von ϕ(a).
194
12.5. S ATZ VON Ł O Ś
Lemma
(i) k¬ϕ(a)k = I\kϕ(a)k,
(ii) k(ϕ ∧ ψ)(a)k = kϕ(a)k ∩ kψ(a)k,
(iii) k(ϕ ∨ ψ)(a)k = kϕ(a)k ∪ kψ(a)k,
(iv) Für alle (n-1)-Tupel a von Elementen aus A und für alle b ∈ A gilt:
kϕ(a, b)k ⊆ k(∃vn ϕ)(a)k,
und es gibt stets ein b ∈ A mit
kϕ(a, b)k = k(∃vn ϕ)(a)k.
Beweis: (i) - (iii) und der erste Teil von (iv) folgen direkt aus der Definition der
Booleschen Ausdehnung (und des Wahrheitsprädikates). Um den letzten Teil zu
beweisen, beachten wir, daß es zu jedem
i ∈ k(∃vn ϕ)(a)k ein bi ∈ Ai gibt mit Ai |= ϕ[ai , bi ];
für jedes andere j ∈ I\k(∃vn ϕ)(a)k wählen wir irgendein b j ∈ A j aus und erhalten
damit eine Folge b = (bi )i∈I mit b ∈ A, für die auch
k(∃vn ϕ)(a)k ⊆ kϕ(a, b)k
gelten muß. Zusammen mit dem ersten Teil ergibt sich also hier die Gleichheit. Dieses Lemma zusammen mit den Eigenschaften (U1)-(U3) eines Ultrafilters
ergeben nun leicht einen Beweis des Satzes von Łoś:
Zunächst zeigt man, daß sich (R3) und (R4) der Definition des reduzierten Produktes auf beliebige Terme übertragen lassen:
t A/U (a/U) = (t Ai (ai ))i∈I /U = t A (a)/U,
also gilt (R2) und damit die Behauptung des Satzes - auch für atomare Formeln
(also der Form R(t1 , . . . ,tm )). Nun benutzen wir Induktion über den Formelaufbau,
um sie für beliebige Formeln nachzuweisen.
Sei etwa ϕ = ¬ψ und die Behauptung des Satzes für die Formel ψ bewiesen,
d. h. in der neuen Bezeichnungsweise:
195
12.5. S ATZ VON Ł O Ś
A/U |= ψ[aU ] ⇐⇒
kψ(a)k ∈ U,
also auch
A/U 6|= ψ[aU ] ⇐⇒
kψ(a)k 6∈ U,
daraus
A/U |= ¬ψ[aU ] ⇐⇒
kψ(a)k 6∈ U
nach der Wahrheitsdefinition,
A/U |= ¬ψ[aU ] ⇐⇒
I\kψ(a)k ∈ U, da U Ultrafilter und
A/U |= ¬ψ[aU ] ⇐⇒
k¬ψ(a)k ∈ U
nach obigem Lemma.
Somit haben wir die Behauptung auch für ϕ = ¬ψ bewiesen. Ähnlich argumentiert man im Falle der aussagelogischen Zeichen ∧ und ∨. Sei nun schließlich
ϕ = ∃vn ψ. Dann gilt
A/U |= ∃vn ψ[aU ] ⇐⇒
⇐⇒
⇐⇒
⇐⇒
A/U |= ψ[aU , b]
A/U |= ψ[aU , bU ]
kψ(a, b)k ∈ U
k∃vn ψ(a)k ∈ U
für ein b ∈ A/U
für ein b ∈ A
für ein b ∈ A nach Ind.vor.
nach obigem Lemma (iv).
Damit ist der Satz von Łoś bewiesen.
Korollar
I sei eine nichtleere Menge, U ein Ultrafilter auf I und A sei eine L-Struktur. Dann
gibt es eine kanonische Einbettung
j : A −→ AI /U,
definiert durch j(a) = (a)i∈I
(welche also jedem Element aus A die konstante Folge (a,a,. . . ) zuordnet), und es
gilt:
(i) j : A −→ AI /U ist eine elementare Einbettung, insbesondere
(ii) A ≡ AI /U.
Beispiele
1. Für einen Hauptultrafilter sind die obigen Ergebnisse trivial: Wird U durch
{ j} erzeugt, so ist das Ultraprodukt A = ∏i ∈I Ai isomorph zu A j , die kanonische Einbettung des Korollars ein Isomorphismus.
196
12.6. KOMPAKTHEITSSATZ
2. Ist A = N das Standardmodell der natürlichen Zahlen, U ein Ultrafilter auf
I = N, so ist die Ultrapotenz NI /U elementar-äquivalent zum Standardmodell N, insbesondere auch ein Modell der P EANO-Axiome. Ist U ein freier
Ultrafilter, so ist die kanonische Einbettung nicht surjektiv, die Ultrapotenz
mithin ein (überabzählbares) Nicht-Standardmodell von PA.
3. Für eine Primzahl p sei F p der Primkörper der Charakteristik p, U ein freier Ultrafilter auf der Menge P der Primzahlen. Dann ist das Ultraprodukt
∏ p ∈P F p /U ein Körper der Charakteristik 0, denn für die Aussage χ p , welche ausdrückt, daß ein Körper die Charakteristik p hat, gilt:
{i ∈ P | Fi |= χ p } = {p} 6∈ U.
Wir tragen jetzt den modelltheoretischen Beweis des Kompaktheitssatzes nach
(D. S COTT 1955):
12.6 Kompaktheitssatz
Für jede Theorie T und jeden Satz σ der Sprache von T gilt:
(i) T |= σ =⇒ es gibt ein endliches T0 ⊆ T mit T |= σ ,
(ii) jedes endliche T0 ⊆ T hat ein Modell =⇒ T hat ein Modell.
Beweis von (ii): Σ sei die Menge der Axiome von T, wobei wir annehmen können,
daß alle Formeln in Σ Sätze sind (sonst ersetze man sie jeweils durch ihren universellen Abschluß). Nach Voraussetzung gibt es für jedes endliche ∆ ⊆ Σ ein Modell
A∆ |= ∆; wir wählen also als Indexmenge
I := {∆ | ∆ ⊆ Σ, ∆ endlich}
und werden ein Modell von Σ als ein Ultraprodukt finden für einen geeigneten
Ultrafilter auf I. Dazu definieren wir für jeden Satz σ ∈ Σ die Menge
σ̂ := {∆ ∈ I | σ ∈ ∆} ⊆ I
und setzen
E := {σ̂ | σ ∈ Σ} ⊆ P(I).
E hat die Eigenschaft (fip) des Ultrafiltersatzes 12.3, da
σ̂1 , . . . , σ̂n ∈ E =⇒ {σ1 , . . . , σn } ∈ σ̂1 ∩ . . . ∩ σ̂n ,
197
12.6. KOMPAKTHEITSSATZ
also existiert ein Ultrafilter U auf I mit E ⊆ U. Wir behaupten nun, daß
A = ∏ A∆ /U |= Σ :
∆∈I
Sei σ ∈ Σ. Dann gilt für alle ∆ ∈ I:
∆ ∈ σ̂ =⇒ σ ∈ ∆ =⇒ A∆ |= σ .
Somit
σ̂ ⊆ {∆ ∈ I | A∆ |= σ }, und wegen
σ̂ ∈ U
ist auch die Obermenge
{∆ ∈ I | A∆ |= σ } ∈ U.
Letzteres besagt aber nach dem Satz von Łoś: A |= σ .
(i) folgt aus (ii), indem man die Tatsache benutzt, daß für jeden Satz σ gilt:
T |= σ ⇐⇒ T ∪ {¬σ } hat ein Modell.
Weitere Folgerungen aus dem Kompaktheitssatz:
1. Ist K eine endlich-axiomatisierbare Klasse von L-Strukturen (also eine ECKlasse), so gibt es zu jedem Axiomensystem Σ für K eine endliche Teilmenge von Σ, welche K axiomatisiert.
2. K ist eine EC-Klasse genau dann, wenn K und das Komplement von K
EC∆ -Klassen sind.
3. Eine Klasse K von L-Strukturen ist eine EC∆ -Klasse gdw K abgeschlossen
ist unter Ultraprodukten und elementarer Äquivalenz.
198
Kapitel 13
Modellvollständigkeit
Definition
(1) Eine Theorie T heißt modellvollständig gdw
T ∪ D(A) ist vollständig (bzgl. der Sprache LA ) für jedes A |= T.
Mit Hilfe des Diagrammlemmas 10.2 ergibt sich, daß eine Theorie T modellvollständig ist gdw
für alle A, B |= T gilt: A ⊆ B =⇒ A 4 B.
Insbesondere folgt aus dem Kettenlemma 11.1 und dem Satz 11.2 von C HANG Ł O Ś -S ZUSKO, daß jede modellvollständige Theorie induktiv ist, also ein Axiomensystem aus ∀∃-Sätzen besitzt.
(2) Ein Modell P |= T einer Theorie T heißt Primmodell von T gdw es sich in
jedes Modell von T einbetten läßt.
Beispiele und Bemerkungen
1. AA ist (wegen des Diagrammlemmas 10.2) stets ein Primmodell von D(A).
2. Ist die Theorie T modellvollständig und besitzt T ein Primmodell, so ist T
vollständig.
3. In der Algebra wird der Begriff des Primkörpers eingeführt: dieser ist ein
Primmodell in obigem Sinne, und zwar ist der Körper Q der rationalen Zahlen ein Primmodell der Theorie der Körper der Charakteristik 0, während
199
Z/p, der Restklassenkörper modulo p, das Primmodell der Theorie der
Körper der Charakteristik p ist (p eine Primzahl). Die Theorie der Körper
TF allein besitzt offenbar keinen Primkörper, sie ist weder vollständig noch
modellvollständig.
4. Der Körper der reellen algebraischen Zahlen ist Primkörper der Theorie
TRCF der reell-abgeschlossenen Körper, diese Theorie ist modellvollständig
und somit vollständig.
5. Der Körper der algebraischen Zahlen ist Primkörper der Theorie der algebraisch-abgeschlossenen Körper der Charakteristik 0. Die Theorie TACF der
algebraisch-abgeschlossenen Körper (ohne Festlegung der Charakteristik)
ist zwar modellvollständig, aber nicht vollständig.
Die obige Charakterisierung der modellvollständigen Theorien deutet darauf
hin, daß man in solchen Theorien Eigenschaften (fast) quantorenfrei ausdrücken
kann:
Definition
T sei eine Theorie der Sprache L, A eine L-Struktur.
1. T läßt (schwache) Quantorenelimination zu gdw zu jeder L-Formel ϕ eine
quantorenfreie (bzw. ∃-) Formel ψ existiert mit
T |= ϕ ↔ ψ.
2. A 41 B : ⇐⇒ A ⊆ B und für alle ∃-Formeln ψ(v1 , . . . , vn ) und alle
a1 , . . . an ∈ A gilt:
A |= ϕ[a1 , . . . an ] ⇐⇒ B |= ϕ[a1 , . . . an ].
3. A heißt T- e.c. (T-existentiell-abgeschlossen) gdw für alle L-Strukturen B
gilt:
A ⊆ B |= T =⇒ A 41 B.
4. ET := {A | A T- e.c.}.
13.1. ROBINSONSCHER T EST
200
13.1 Robinsonscher Test
Für eine Theorie T sind folgende Aussagen äquivalent:
(i) T ist modellvollständig,
(ii) T läßt schwache Quantorenelimination zu,
(iii) jede ∃-Formel ϕ ist in T äquivalent zu einer ∀-Formel δ ,
(iv) für alle A, B |= T gilt: A ⊆ B =⇒ A 41 B,
(v) für alle A, B |= T gilt: Ist f : A → B eine Einbettung, so ist f eine elementare Einbettung.
(vi) Mod(T) = ET .
Hierin ist (iv) das eigentliche Test-Kriterium, das insbesondere für Anwendungen auf algebraische Theorien noch etwas abgeschwächt werden kann.1
Um ein Kriterium für die vollständige Elimination von Quantoren zu erhalten,
muß man die Eigenschaft der Modellvollständigkeit verstärken:
Definition
Eine Theorie T heißt substrukturvollständig gdw
T ∪ D(A) ist vollständig für jedes A |= T∀ ,
d. h. T ∪ D(A) ist vollständig für jede Substruktur A eines Modells A ⊆ B |= T.
Satz
Für eine Theorie T sind folgende Aussagen äquivalent:
(i) T ist substrukturvollständig,
(ii) T läßt Quantorenelimination zu.
Insbesondere gilt für eine ∀-Theorie T:
T läßt Quantorenelimination zu gdw T modellvollständig ist.
1 S.
etwa das Buch von R AUTENBERG , W.: Einführung in die mathematische Logik, vieweg
2002, Kap. 5.5
13.1. ROBINSONSCHER T EST
201
Beispiele
1. Die Theorie TACF der algebraisch-abgeschlossenen Körper ist modellvollständig, legt man auch die Charakteristik fest, so ist sie vollständig.
2. Die Theorie TRCF der reell-abgeschlossenen Körper ist modellvollständig
und vollständig. Sie stimmt überein mit der Theorie des angeordneten Körpers der reellen Zahlen.
3. Die Theorie der Vektorräume über den rationalen Zahlen ist modellvollständig (eine ∃-Aussage über eine Konjunktion von Basisformeln besagt in diesem Falle die Lösbarkeit eines Systems von linearen Gleichungen und Ungleichungen).
4. Die Theorie der Gleichheit (also ohne nicht-logischen Axiome!) ist weder
vollständig noch modellvollständig. Sie erlaubt auch keine Quantorenelimination, allerdings ist in dieser Theorie jede Formel äquivalent zu einer
aussagenlogisch aus Anzahlformeln und den Formeln vi = v j zusammengesetzten Formel.
5. Die Theorie DLO + OE der dichten linearen Ordnungen ohne Endpunkte ist
vollständig, modellvollständig und erlaubt Quantorenelimination.
6. Die Theorie Th(N, <) ist vollständig, aber nicht modellvollständig.
Theorien mit Quantorenelimination sind meistens entscheidbar, d. h. es gibt
ein effektives Verfahren (dieser Ausdruck wird später präzisiert werden), welches
für jeden Satz der Sprache von T angibt, ob dieser Satz in T gilt oder nicht. So
sind die Theorien
• DLO + OE,
• die Theorie des (angeordneten) Körpers der reellen Zahlen (= Theorie der
reell-abgeschlossenen Körper) und
• die Theorie des Körpers der komplexen Zahlen (= Theorie der algebraischabgeschlossenen Körper der Charakteristik 0)
vollständig und entscheidbar. Dagegen ist dagegen die Theorie der natürlichen
Zahlen Th(N, +, ·, 0, 1) unentscheidbar. Näher gehen wir hierauf in den abschließenden Kapiteln ein.
202
Teil IV
Unvollständigkeit und
Unentscheidbarkeit
203
Hans Magnus Enzensberger: Hommage à Gödel
Münchhausens Theorem, Pferd, Sumpf und Schopf,
ist bezaubernd, aber vergiß nicht:
Münchhausen war ein Lügner.
Gödels Theorem wirkt auf den ersten Blick
etwas unscheinbar, doch bedenk:
Gödel hat recht.
In jedem genügend reichhaltigen System // lassen sich Sätze formulieren,
die innerhalb des Systems // weder beweis- noch widerlegbar sind,
es sei denn das System // wäre selber inkonsistent.
Du kannst deine eigene Sprache // in deiner eigenen Sprache beschreiben:
aber nicht ganz.
Du kannst dein eignes Gehirn // mit deinem eignen Gehirn erforschen:
aber nicht ganz.
Usw.
Um sich zu rechtfertigen // muß jedes denkbare System
sich transzendieren, // d.h. zerstören.
Genügend reichhaltig oder nicht:
Widerspruchsfreiheit
ist eine Mangelerscheinung
oder ein Widerspruch.
(Gewißheit = Inkonsistenz.)
Jeder denkbare Reiter, // also auch Münchhausen,
also auch du bist ein Subsystem // eines genügend reichhaltigen Sumpfes.
Und ein Subsystem dieses Subsystems // ist der eigene Schopf,
dieses Hebezeug // für Reformisten und Lügner.
In jedem genügend reichhaltigen System,
also auch in diesem Sumpf hier,
lassen sich Sätze formulieren,
die innerhalb des Systems
weder beweis- noch widerlegbar sind.
Diese Sätze nimm in die Hand
und zieh!
(Zitiert nach: Hans Magnus Enzensberger: Die Elixiere der Wissenschaft.
Frankfurt a.M.: Suhrkamp 2002)
204
In diesem Teil gehen wir aus von den natürlichen Zahlen als algebraische
Struktur mit den Operationen der Addition und Multiplikation und zusätzlicher
Ordnung. Als Axiomensystem für die elementaren Eigenschaften dieser Struktur
haben wir bereits das Axiomensystem von G. P EANO erwähnt und gesehen, daß
es nicht ausdrucksstark genug ist, um die Struktur der natürlichen Zahlen bis auf
Isomorphie festzulegen. Tatsächlich ist es sogar nach einem berühmten Satz von
K. G ÖDEL unvollständig, und wir werden sehen, daß dieses Problem sich auch
durch die Hinzunahme weiterer Axiome nicht beseitigen läßt.
Dazu werden wir mit den Methoden der mathematischen Logik Prädikate und
Funktionen natürlicher Zahlen nach ihrer Komplexität klassifizieren, insbesondere
den Begriff der Berechenbarkeit und der Entscheidbarkeit präzisieren, um damit
Möglichkeiten und Grenzen der Beweisbarkeit für mathematischer Theorien, vor
allem für die Zahlentheorie und auch die Logik selbst aufzuzeigen.
Eine ausführlichere Darstellung der Theorie der Berechenbarkeit findet man
im Skriptum
K. Ambos-Spies: Theoretische Informatik
(http://www.math.uni-heidelberg.de/logic/skripten.html).
205
Kapitel 14
Berechenbare Funktionen
14.1 Turing-Maschinen
Eine TURING-Maschine M besitzt als Speicher ein nach beiden Seiten unbeschränktes Band, das in unendlich viele Felder eingeteilt ist. Jedes Feld kann
einen Buchstaben aus dem endlichen Alphabet s1 , . . . , sn der Maschine M aufnehmen. Dabei sind zu jedem Zeitpunkt nur endlich viele Felder belegt, wobei
wir vereinbaren können, daß die leeren Feldern durch ein zusätzliches Symbol s0
gekennzeichnet sind. Der Zugriff auf das Speicherband erfolgt durch einen kombinierten Lese- und Schreibkopf von der Größe eines Feldes. Das Feld, auf das der
Kopf zeigt, heißt das Arbeitsfeld. Dieses Feld kann eingelesen und neu beschriftet
werden. Weiterhin kann sich der Kopf um ein Feld nach links oder rechts bewegen. Durch Wiederholung dieser elementaren Operationen kann also jede Stelle
des Bandes besucht, die dort stehende Information gelesen und gegebenenfalls
ersetzt oder ergänzt werden. Außerdem ist M zu jedem gegebenen Zeitpunkt in
einem von endlich-vielen Zuständen q1 , . . . , qr , die Einfluß auf das Verhalten von
M haben.
Es gibt somit 3 Typen von Operationen, genannt Anweisungen, die M ausführen kann, wenn M im Zustand qi über einem Feld steht, in dem das Zeichen s j
eingetragen ist, und die wie folgt bezeichnet werden:
(a) qi s j sk ql :
lösche s j und schreibe dafür sk ,
(b) qi s j R ql :
bewege den Kopf ein Feld weiter nach rechts,
(c) qi s j L ql :
bewege den Kopf ein Feld weiter nach links.
206
14.1. T URING -M ASCHINEN
Anschließend gehe M in allen Fällen in den Zustand ql über.
Ein Programm für M ist eine endliche Liste von Anweisungen der obigen
Formen (a) - (c), welches konsistent ist, d. h. zu einem gegebenen Paar qi , s j (für
die Ausgangssituation) gibt es in der Liste höchstens eine Anweisung, die hiermit
beginnt.
Beispiel:
Das Alphabet von M bestehe aus den Symbolen 0, 1 (und x für ein leeres Feld),
mögliche Zustände seien q1 , q2 . Das Programm P bestehe aus den folgenden 4
Anweisungen:
q1 0 R q1
q1 1 0 q2
q2 0 R q2
q2 1 R q1
Anfangs stehe M im Zustand q1 über dem ersten Feld des Bandes, das von hier
ab weitere n aufeinander folgende Felder mit dem Symbol 1 enthält, während die
übrigen Felder leer sind:
...
x
x
x
↓
1 1
1
1
1
1
x
x
x
...
Folgt M den obigen Anweisungen, so kann es diese ausführen, bis der folgende
Endzustand erreicht ist:
↓
... x x x 0 1 0 1 0 1 x x x ...
Wir wollen nun erklären, wie eine T-Maschine mit vorgegebenen Programm
eine Funktion berechnet. Da es vorkommen kann, daß Rechnungsprogramme bei
Anwendungen auf bestimmte Anfangswerte möglicherweise nicht stoppen (weil
sie z. B. in eine Schleife geraten), werden wir jetzt statt totaler Funktionen f :
Nk → N auch partielle Funktionen zulassen:
Definition
f ist eine partielle k-stellige Funktion auf den natürlichen Zahlen gdw
f : D → N für eine Teilmenge D ⊆ Nk .
14.2. URM- BERECHENBARE F UNKTIONEN
207
In diesem Falle bedeute
f (~x) ↓:
⇐⇒
f ist an der Stelle ~x definiert
f (~x) ↑:
⇐⇒
f ist an der Stelle ~x nicht definiert
f (~x) ' g(~x) :
⇐⇒
( f (~x) ↓ ⇐⇒ g(~x) ↓) und ( f (~x) ↓=⇒ f (~x) = g(~x)).
TURING-berechenbare Funktionen
Zur Darstellung von Zahlen, von denen eine Rechnung ausgeht, wählen wir s1 = 1
und benutzen es als Marke, indem n + 1 aufeinander folgende Felder mit Inhalt 1
(umgeben von Leerfeldern am Anfang und am Ende) die Zahl n darstellen. Eine
partielle Funktion f : D → N wird von M berechnet, wenn M, beginnend im Anfangszustand q1 über dem ersten Feld, welches die Zahl n darstellt, genau dann
über dem Band in einem Endzustand stoppt, wenn n ∈ D ist, und in diesem Fall
das Symbol 1 genau f (n)-mal auf dem Band im Endzustand eingetragen ist (in
obigem Beispiel ist f (5) = 3). Eine ähnliche Definition legt man im Falle mehrstelliger Funktionen fest.
Eine partielle Funktion f heißt TURING-berechenbar genau dann, wenn es
eine T-Maschine M gibt mit einem Programm, welches f berechnet.
14.2 URM-berechenbare Funktionen
S HEPERDSON -S TURGIS haben 1963 eine Variante eines Maschinenmodells vorgeschlagen: Eine unbeschränkte Register-Maschine (URM) besitzt eine unendliche Anzahl von Registern R1 , . . . , Rl , die jeweils eine Zahl enthalten; rn sei die
Zahl im Register Rn . Diese Zahlen werden von einer URM gemäß folgenden Typen von Anweisungen abgeändert:
O(n):
S(n):
T (m, n):
J(m, n, q):
0 → Rn
rn + 1 → Rn
rm → Rn
falls rn = rm ,
bzw. rn := 0
ersetze rn durch 0
bzw. rn := rn + 1
addiere 1 zu rn
bzw. rn := rm
ersetze rn durch rm
so gehe zur q-ten Anweisung über, sonst zur nächsten.
Ein Programm ist nun wieder eine nummerierte endliche Folge derartiger Anweisungen. Soll eine URM mit einem Programm P = (I1 , . . . , Ik ) eine Berechnung durchführen, so muß ein Anfangszustand der Registerinhalte gegeben sein,
in welchem die URM mit der ersten Anweisung beginnt und worauf sie dann den
weiteren Anweisungen der Liste folgt.
208
14.3. C HURCHSCHE T HESE
Beispiel:
I1 :
J(1, 2, 6)
I2 :
S(2)
I3 :
S(3)
I4 :
J(1, 2, 6)
I5 :
J(1, 1, 2)
I6 :
T (3, 1)
Beginnt die URM mit den Zahlen 9 im 1. und 5 im 2. Register (und 0 in allen
anderen), so erzeugt sie nach einigen Schritten die Zahl 4 im 3. Register und
landet dann bei der Anweisung I6 , welche die Zahl 4 in das 1. Register überträgt;
da keine weitere Anweisung folgt, stoppt hier das Programm.
Es sei nun f eine partielle n-stellige Funktion auf den natürlichen Zahlen, P
ein Programm und a1 , . . . , an , b seien vorgegebene Zahlen. Dann konvergiert das
mit a1 , . . . , an beginnende Programm gegen die Zahl b, formal: P(a1 , . . . , an ) ↓ b,
gdw es nach endlich-vielen Schritten stoppt und die Zahl b im 1. Register steht.
P berechnet f gdw für alle a1 , . . . , an , b gilt:
P(a1 , . . . , an ) ↓ b gdw f (a1 , . . . , an ) ist definiert und = b.
f ist URM-berechenbar gdw es ein Programm P gibt, welches f berechnet.
14.3 Churchsche These
Es gibt weitere Ansätze, den Begriff der berechenbaren Funktion zu präzisieren:
• G ÖDEL -H ERBRAND -K LEENE (1936): mittels eines Gleichungskalküls definierte allgemein-rekursive Funktionen
• C HURCH (1936): λ -definierbare Funktionen
• G ÖDEL -K LEENE (1936): µ-rekursive Funktionen (s.u.)
• P OST (1943): berechenbare Funktionen mittels kanonischer Deduktionssysteme
• M ARKOV (1951): berechenbare Funktionen mittels Algorithmen über endlichen Alphabeten
14.4. AUFZ ÄHLBARKEITSS ÄTZE
209
Alle diese Definitionen haben sich als formal äquivalent herausgestellt, außerdem ist bisher jede einzelne der (im intuitiven Sinne) berechenbaren Funktionen
auch berechenbar in dem obigen formalen Sinne, was Anlaß zu folgender Annahme gegeben hat:
Churchsche These: Die (intuitiv) berechenbaren Funktionen sind genau die (in
einem der obigen Sinne) formal berechenbaren Funktionen.
Ohne ausführliche Beweise ergänzen wir einige wichtige
14.4 Aufzählbarkeitssätze
• Da sich alle Programme effektiv aufzählen lassen, gibt es eine effektive
Aufzählung ϕ0 , ϕ1 , . . . , ϕn , . . . aller einstelligen berechenbaren (partiellen)
Funktionen. Mit einem Diagonalargument erhält man hieraus:
• es gibt eine totale Funktion f : N → N, die nicht berechenbar ist:
(
ϕn (n) + 1 falls ϕn (n) definiert ist,
f (n) =
0
sonst.
• Somit gibt es zwar eine Abzählung aller totalen berechenbaren Funktionen,
aber diese Abzählung kann selbst nicht berechenbar sein.
• Auch die folgenden Prädikate sind nicht entscheidbar (d. h. ihre charakteristischen Funktionen sind nicht berechenbar):
ϕn (n) ist definiert, ϕn ist totale Funktion, ϕn ist die konstante Funktion 0,
ϕn = ϕm , das n-te Programm mit Eingabe n (allgemeiner mit Eingabe m)
stoppt nach endlich-vielen Schritten (das Halteproblem).
• Existenz universaler Funktionen (bzw. Programme): Zu jeder berechenbaren 2-stelligen Funktion f gibt es eine totale berechenbare Funktion k mit
f (n, m) = ϕk(n) (m); die 2-stellige Funktion ϕ(n, m) = ϕn (m) ist berechenbar.
14.5 Primitiv-rekursive Funktionen
Zu den intuitiv berechenbaren Funktionen gehören sicher die folgenden
14.5. P RIMITIV- REKURSIVE F UNKTIONEN
210
Anfangsfunktionen
R1 0(x) = 0
R2 S(x) = x + 1
R3 Pin (x1 , . . . , xn ) = xi
Nullfunktion
Nachfolgerfunktion
i-te Projektion
Durch Einsetzen von Funktionen in bereits vorgegebene Funktionen erhalten
wir eine neue Funktion durch
Substitution
R4 f (~x) ' h(g1 (~x), . . . , gk (~x))
Wichtig ist nun das folgende Prinzip - nach diesem Muster werden nämlich
die arithmetischen Operationen Addition, Multiplikation und Potenz gebildet:
Primitive Rekursion
R5 f (~x, 0) ' g(~x)
f (~x, y + 1) ' h(~x, y, f (~x, y))
Die Klasse PRIM aller primitiv-rekursiven (abgekürzt: p.r.) Funktionen ist
die kleinste Klasse von Funktionen, die die Anfangsfunktionen enthält und abgeschlossen ist unter Substitution und primitiver Rekursion. Diese Funktionen sind
insbesondere totale Funktionen.
Beispiele primitiv-rekursiver Funktionen
Die folgenden Funktionen sind primitiv-rekursiv:
x+y
x·y
xy
max(x, y)
min(x, y)
|x − y|
x−̇y =
(
x−y
0
falls x ≥ y,
sonst
Summe
Produkt
Potenz
Maximum
Minimum
absolute Differenz
Differenz auf N
211
14.5. P RIMITIV- REKURSIVE F UNKTIONEN
sg(x) =
sg(x) =
(
0
falls x = 0,
1
falls x > 0
(
1
falls x = 0,
0
falls x > 0
Signum, Vorzeichen
Antisignum, negiertes Vorzeichen
Beweis: Addition, Multiplikation und die Potenz sind offenbar primitiv-rekursiv.
Für die übrigen Fälle benötigt zeigt man zuerst, daß die Vorgängerfunktion x−̇1
primitiv-rekursiv ist, und zwar wegen
0−̇1
= 0
(x + 1)−̇1 = x
und definiert dann −̇ durch primitive Rekursion
x−̇0
= x
x−̇(y + 1) = (x−̇y)−̇1
Die übrigen Funktionen kann man direkt mittels + und −̇ definieren:
|x − y|
max(x, y)
min(x, y)
sg(x)
sg(x)
=
=
=
=
=
(x−̇y) + (y−̇x)
x + (y−̇x)
max(x, y)−̇|x − y|
1−̇x
1−̇sg(x)
Abschlußeigenschaften
Primitiv-rekursive Funktionen sind abgeschlossen unter
(i) Fallunterscheidung:
Sind g, f0 , f1 , . . . , fk primitiv-rekursiv, so auch f mit


 f0 (~x) f alls g(~x) = 0,



 f ~x)
f alls g(~x) = 1,
1
f (~x) = .
.
..
..





 f (~x) f alls g(~x) ≥ k.
k
14.6. R EKURSIVE UND PARTIELL - REKURSIVE F UNKTIONEN
212
(ii) beschränktem µ-Operator:
Ist g primitiv-rekursiv, so auch f mit
f (~x, z) = µy < z (g(~x, y) = 0),
wobei
µy < z R(~x, y) =
(
das kleinste y < z mit R(~x, y) falls ein solches existiert
z
sonst.
14.6 Rekursive und partiell-rekursive Funktionen
Ein Beispiel einer berechenbaren, aber nicht p.r. Funktion ist die
Die Ackermannsche Funktion:
Diese ist eine 2-stellige Funktion, die durch die folgenden Gleichungen rekursiv
bestimmt ist:
A(0, y) = y + 1
A(x + 1, 0) = A(x, 1)
A(x + 1, y + 1) = A(x, A(x + 1, y))
Es handelt sich hier um eine doppelte Rekursion, trotzdem kann man leicht
nachprüfen, daß sich jeder Wert A(x, y) von endlich-vielen “früheren” Werten
A(u, v) mit u < x oder u = x ∧ v < y bestimmen läßt. Schreiben wir Fn (m) für
A(n, m), so erhalten wir:
F0 (m) = m + 1
F1 (m) = m + 2
F2 (m) ≈ 2m
F3 (m) ≈ 2m
2
..
F4 (m) ≈ 2
2.
(m − mal)
Das bedeutet also, daß die ACKERMANNsche Funktion die Grundrechenarten
iteriert und insbesondere in der ersten Stelle (die die Anzahl der Iterationen angibt)
14.6. R EKURSIVE UND PARTIELL - REKURSIVE F UNKTIONEN
213
sehr schnell wächst. Tatsächlich majorisiert sie jede p.r. Funktion: Ist f eine kstellige p.r. Funktion, so gibt es eine Zahl n mit
f (x1 , . . . , xk ) ≤ Fn (max(x1 , . . . , xk ))
für alle x1 , . . . , xk . Somit kann die 2-stellige Funktion A nicht p.r. sein (obwohl
andererseits alle Fn p.r. sind!). Daß die ACKERMANNsche Funktion trotzdem berechenbar ist, ersieht man daraus, daß sie aus einer p.r. Funktion erhalten werden
kann mittels
Minimalisierung
R6 f (~x) ' µy (g(~x, y) ' 0),
d. h.


das kleinste y so daß




(i) g(~x, z) definiert ist für alle z ≤ y und
f (~x) =

(ii) g(~x, y) = 0,
falls ein derartiges y existiert,




undefiniert
sonst.
Dieses Prinzip kann von totalen zu partiellen Funktionen führen (z. B. für
g(x, y) = |x − y2 |). Die Klasse R (oder C) aller rekursiven Funktionen ist die
kleinste Klasse von Funktionen, die die Anfangsfunktionen enthält und abgeschlossen ist unter Substitution, primitiver Rekursion und Minimalisierung. Man
spricht mitunter auch von allgemein-rekursiven, µ-rekursiven Funktionen oder
(auf Grund der C HURCHschen These) von den berechenbaren Funktionen (C =
computable functions). Von rekursiven Funktionen werden wir vorwiegend im
Falle totaler berechenbarer Funktionen sprechen.
Jede p.r. Funktion ist also auch eine rekursive Funktion (während die ACKER MANN sche Funktion ein Beispiel für eine rekursive, aber nicht p.r. Funktion ist),
und die Abschlußeigenschaften der p.r. Funktionen gelten (geeignet modifiziert
für partielle Funktionen) auch für rekursive Funktionen.
Definition
Eine zahlentheoretische Relation R ⊆ Nk heißt primitiv-rekursiv bzw. rekursiv (oder auch: entscheidbar) gdw ihre charakteristische Funktion cR primitivrekursiv bzw. rekursiv ist, wobei
(
1 falls R(~x),
cR (~x) =
0 sonst.
14.7. PARTIELLE E NTSCHEIDBARKEIT
214
Somit sind z. B. die Prädikate x = y, x 6= y, x ≤ y, x < y primitiv-rekursiv.
14.7 Partielle Entscheidbarkeit
Eine Relation R ⊆ Nk heißt partiell- (oder positiv-) entscheidbar bzw. r.e. gdw.
sie Definitionsbereich einer berechenbaren Funktion ist:
R r.e. : ⇐⇒ R = {~x | f (~x) ↓} für eine berechenbare Funktion f .
In diesem Fall kann man für f auch die partielle charakteristische Funktion von
R wählen:
R r.e. ⇐⇒ pcR ist rekursiv,
(
1
falls ~x ∈ R,
wobei
pcR (~x) =
undefiniert sonst.
Während es also für eine entscheidbare Relation R ein effektives Verfahren
gibt, welches die Frage beantwortet, ob R zutrifft oder nicht, kann man für eine
partiell-entscheidbare Relation somit nur den Fall bestätigen, daß die Relation
zutrifft. Die Bezeichnung r.e. = recursively enumerable = rekursiv-aufzählbar,
in der neueren Literatur auch c.e. = computably enumerable, erklärt sich aus der
folgenden Charakterisierung:
Eine nicht-leere Teilmenge A ⊆ N ist partiell entscheidbar gdw sie Wertebereich einer rekursiven Funktion ist, also von einer rekursiven Funktion aufgezählt
wird:
A r.e. ⇐⇒ A = 0/ ∨ A = { f (x) | x ∈ N} für eine rekursive Funktion f : N → N.
Jede rekursive Relation ist auch r.e.; die Umkehrung gilt, wenn auch das Komplement r.e. ist:
A ⊆ Nk ist entscheidbar gdw A und Nk − A sind r.e.
Ist wieder ϕn die n-te berechenbare Funktion (in einer geeigneten effektiven
Aufzählung), so sind die Mengen
{n | ϕn (n) ↓}
r.e., aber nicht rekursiv, während
{n | ϕn (n) ↑}
nicht einmal r.e. ist.
Von besonderer Bedeutung wird später sein, daß für Theorien T mit einer rekursiven Menge von Axiomen die Folgerungsmenge C(T) = {σ | T ` σ } r.e. ist. Insbesondere ist also eine rekursiv-axiomatisierbare vollständige Theorie entscheidbar!
215
Kapitel 15
Definierbarkeit berechenbarer
Funktionen
15.1 Eine endlich-axiomatisierbare Teiltheorie von PA
Die Theorie PA enthält mit dem Induktionsschema unendlich-viele Axiome, und
es läßt sich nachweisen, daß diese nicht durch endlich-viele ersetzbar sind. Trotzdem genügt es, für manche Überlegungen eine geeignete Teiltheorie zugrundezulegen, die nur endlich-viele Axiome benötigt, etwa die folgende Theorie PA− :
Diese Theorie faßt die wichtigsten algebraischen Eigenschaften der Zahlentheorie in einer Sprache L mit den Symbolen 0, 1, <, +, · zusammen: Die ersten
Axiome besagen, daß Addition und Multiplikation assoziativ und kommutativ
sind sowie das Distributivgesetz erfüllen, ferner daß 0 und 1 neutrale Elemente
für die jeweiligen Operationen und 0 ein Nullteiler ist:
A1
A2
A3
A4
A5
(x + y) + z = x + (y + z)
(x · y) · z = x · (y · z)
x+y = y+x
x·y = y·x
x · (y + z) = x · y + x · z
A6 x + 0 = x ∧ x · 0 = 0
A7
x·1 = 1
Dabei benutzen wir die in der Algebra üblichen Klammeregeln (· bindet stärker
als +). Für die <-Beziehung gelten die Gesetze einer linearen Ordnung, welche
mit Addition und Multiplikation verträglich ist:
A8
A9
¬x<x
x < y∧y < z → x < z
15.1. E INE ENDLICH - AXIOMATISIERBARE T EILTHEORIE VON PA
216
A10 x < y ∨ x = y ∨ y < x
A11 x < y → x + z < y + z
A12 0 < z ∧ x < y → x · z < y · z
Eine Zahl kann von einen größeren subtrahiert werden:
A13 x < y → ∃z (x + z = y)
und schließlich ist 1 ist der Nachfolger von 0 und 0 das kleinste Element (wobei
wie üblich x ≤ y : ⇐⇒ x = y ∨ x < y):
A14 0 < 1 ∧ ∀x (0 < x → 1 ≤ x)
A15
∀x (0 ≤ x)
Aus den letzten Axiomen folgt, daß allgemeiner x + 1 der Nachfolger von x ist
und damit die Ordnung diskret ist:
x < x + 1 ∧ ∀y (x < y → x + 1 ≤ y).
Einige Modelle von PA−
1. In der P EANO-Arithmetik PA kann man die <-Beziehung definieren durch
x < y ↔ ∃z (x + z + 1 = y) und damit alle Axiome von PA− erhalten. Insbesondere ist das Standardmodell N mit der gewöhnlichen <-Beziehung, den
üblichen Operationen und den natürlichen Zahlen 0,1 ein Modell von PA− .
2. Die Menge Z[X] der Polynome in einer Unbestimmten X und mit ganzzahligen Koeffizienten ist mit den üblichen Operationen ein kommutativer Ring. Man kann diesen Ring ordnen, indem man für ein Polynom p =
an X n + . . . a1 X + a0 mit höchstem Koeffizienten an 6= 0 setzt:
an X n + . . . a1 X + a0 > 0 : ⇐⇒ an > 0
und damit Polynome p, q ∈ Z[X] ordnet durch p < q : ⇐⇒ q − p > 0.
Die Teilmenge Z[X]+ der Polynome p ∈ Z[X] mit p ≥ 0 wird damit zu einem Modell von PA− , in welchem das Polynom X größer als alle konstanten
Polynome und damit “unendlich groß” ist.
In einem Ring liegt bezüglich der Addition eine Gruppe vor, während A13 nur
eine eingeschränkte Inversenbildung zuläßt. Ersetzt man in PA− die Axiome A13
und A15 durch das Axiom
217
15.2. A RITHMETISCHE F ORMELN
A16 ∀x ∃z (x + z = 0)
so erhält man die algebraische Theorie DOR der diskret geordneten Ringe, deren
Modelle z. B. die Ringe Z und Z[X] sind. Jedes Modell M von PA− kann man
zu einem Modell R der Theorie DOR erweitern (nach demselben Muster, wie
man die natürlichen Zahlen zum Ring der ganzen Zahlen erweitert), so daß die
nicht-negativen Elemente von R mit dem ursprünglichen Modell übereinstimmen.
Umgekehrt ist auch für jedes Modell R der Theorie DOR die Einschränkung auf
die nicht-negativen Elemente ein Modell von PA− , so daß man PA− als Theorie
(des nicht-negativen Teils) diskret geordneter Ringe bezeichnen kann.
15.2 Arithmetische Formeln
Für Terme t und Formeln ϕ der Sprache L schreiben wir
∃x < t ϕ für ∃x(x < t ∧ ϕ)
∀x < t ϕ für ∀x(x < t → ϕ)
und nennen ∃x < t und ∀x < t beschränkte Quantoren. Endliche Folgen von Variablen kürzen wir durch ~x,~y, . . . ab.
Definition
ϕ ist ∆0 -Formel: ⇐⇒ ϕ enthält höchstens beschränkte Quantoren,
ϕ ist Σ1 -Formel: ⇐⇒ ϕ = ∃~x ψ für eine ∆0 -Formel ψ,
ϕ ist Π1 -Formel: ⇐⇒ ϕ = ∀~x ψ für eine ∆0 -Formel ψ,
Dieses ist der Anfang der Hierarchie der arithmetischen Formeln; setzt man
Σ0 = Π0 = ∆0 ,
so kann man fortsetzen:
ϕ ist Σn+1 -Formel ⇐⇒ ϕ = ∃~x ψ für eine Πn -Formel ψ,
ϕ ist Πn+1 -Formel ⇐⇒ ϕ = ∀~x ψ für eine Σn -Formel ψ.
Eine Σ3 -Formel ist also von der Form ∃~x ∀~y ∃~z ψ, wobei ψ höchstens beschränkte Quantoren enthält. Das bedeutet also, daß man beschränkte Quantoren
218
15.3. E NDERWEITERUNGEN
nicht mitzählt, mit Σ bzw. Π anzeigt, daß die Formel mit einer (endlichen) Folge
von ∃-Quantoren bzw. ∀-Quantoren beginnt und der Index die Quantorenblöcke
zählt. Es kommt also weniger auf die Anzahl der Quantoren an als die Anzahl der
Quantorenwechsel.
Bei dieser Klassifizierung unterscheidet man nicht zwischen logisch äquivalenten Formeln, so daß etwa jede Πn -Formel für n < m auch eine Σm - und Πm Formel ist (indem man der Formel einfach zusätzliche Quantoren über nicht vorkommende Variablen voranstellt). Somit kann man dann auch die Formelmengen
∆n = Σn ∩ Πn
definieren. Es ergibt sich daraus folgendes Bild der arithmetischen Hierarchie:
Σ1
∆0
Σ2
@
@
@
∆1
@
@
@
@
∆2
@
@ Π1
......
∆3
@
@
@ Π2
@
@
@
Viele nützliche Eigenschaften natürlicher Zahlen lassen sich mittels ∆0 -Formeln ausdrücken, z. B.:
x ist irreduzibel ↔ 1 < x ∧ ∀u < x ∀v < x ¬(u · v = x).
Von besonderer Bedeutung ist, daß ∆0 -Formeln in einer Struktur dasselbe bedeuten wie in allen Enderweiterungen:
15.3 Enderweiterungen
Bereits bei der Behandlung von Nonstandard-Modellen von PA hatten wir bemerkt, daß sich das Standardmodell in jedes andere Modell von PA einbetten läßt.
Diese Eigenschaft gilt auch für die Modelle von PA− :
219
15.3. E NDERWEITERUNGEN
Definition
L sei eine Sprache, welche ein 2-stelliges Symbol < enthalte, M und N seien LStrukturen mit M ⊆ N. Dann heißt N Enderweiterung von M (und entsprechend
M Anfangssegment von M) genau dann, wenn die größere Menge N unterhalb
eines Elementes von M kein weiteres hinzufügt:
M ⊆end N : ⇐⇒ für alle x ∈ M, y ∈ N : (y <N x ⇒ y ∈ M).
Jede natürliche Zahl n wird im Standardmodell, das wir hier auch einfach mit
N bezeichnen, durch den konstanten Term
n = 1+...+1
(n-mal)
dargestellt, wobei 0 die Konstante 0 ist.
Satz
Es sei M |= PA− . Dann wird durch die Abbildung n 7→ nM eine Einbettung des
Standardmodells N auf ein Anfangssegment von M definiert.
Insbesondere ist (mittels Identifizierung) jedes Modell von PA− isomorph zu
einer Enderweiterung des Standardmodells N.
Beweis: Durch einfache Induktion zeige man für alle natürlichen Zahlen n, k, l:
n = k + l =⇒ PA− ` n = k + l
n = k · l =⇒ PA− ` n = k · l
n < k =⇒ PA− ` n < k
PA− ` ∀x ( x ≤ k
→
x = 0 ∨ . . . ∨ x = k)
Die ersten 3 Aussagen werden wir später für alle rekursiven Funktionen bzw. Relationen verallgemeinern; aus ihnen folgt, daß die Abbildung n 7→ nM ein Homomorphismus und wegen der letzten Aussage eine Einbettung auf ein Anfangssegment von M ist.
15.4. E RHALTUNGSEIGENSCHAFTEN UNTER E NDERWEITERUNGEN
220
15.4 Erhaltungseigenschaften unter Enderweiterungen
N, M seien Strukturen der Sprache L von PA− , N ⊆end M,~a ∈ N. Dann gilt:
(i) jede ∆0 -Formel ϕ(~v) ist absolut:
N |= ϕ[~a] ⇐⇒ M |= ϕ[~a],
(ii) jede Σ1 -Formel ϕ(~v) ist aufwärts-persistent:
N |= ϕ[~a] =⇒ M |= ϕ[~a],
(iii) jede Π1 -Formel ϕ(~v) ist abwärts-persistent:
M |= ϕ[~a] =⇒ N |= ϕ[~a],
(iv) jede ∆1 -Formel ϕ(~v) ist absolut:
N |= ϕ[~a] ⇐⇒ M |= ϕ[~a].
Beweis von (i) durch Induktion über den Formelaufbau von ϕ(~v), wobei nur der
Fall eines beschränkten Quantors von Interesse ist. Da aber M Enderweiterung
von N ist, werden von M unterhalb eines Elementes von N keine neuen Elemente
eingefügt, so daß ein beschränkter Quantor in beiden Strukturen dasselbe besagt.
Wir wollen nun zeigen, daß die rekursiven Relationen mit den Mengen übereinstimmen, die sich durch eine ∆1 -Formeln in den natürlichen Zahlen definieren
lassen, und daß der Graph einer rekursiven Funktion durch eine Σ1 -Formeln in
den natürlichen Zahlen definiert werden kann. Mit N bezeichnen wir im folgenden auch das Standardmodell (N, +, ·,0 , 0, 1).
15.5 Lemma
Für jede ∆0 -Formel θ (~v) ist die Relation
R(~a) ⇐⇒ N |= θ (~a)
primitiv-rekursiv.
221
15.5. L EMMA
Beweis: Wir zeigen durch Induktion über lz(θ ), daß die zugehörige charakteristische Funktion
(
1 falls N |= θ (~x)
cθ (~x) =
0 sonst
primitiv-rekursiv ist: Zunächst sind die Funktionen x + 1, x + y, x · y p.r. und damit
definiert jeder Term in N eine primitiv-rekursive Funktion. Da auch die Funktionen eq(x, y) = sg(|x−y|) und sg(y−̇x) primitiv-rekursiv sind (und die p.r. Funktionen abgeschlossen sind unter Substitution), gilt die Behauptung für die atomaren
Formeln t = s,t < s. Für den Fall der aussagenlogischen Operationen benutze man
c¬θ (~x) = 1−̇cθ (~x), cθ ∧ψ (~x) = min(cθ (~x), cψ (~x)), cθ ∨ψ (~x) = max(cθ (~x), cψ (~x)).
Ist schließlich θ eine ∆0 -Formel, t ein Term und ψ(~x) = ∀y < t(~x) θ (~x, y), so folgt
die Behauptung aus
cψ (~x) = eq(t(~x), (µy < t(~x)(cθ (~x, y) = 0)).
Ähnlich argumentiert man im Falle der Formel ∃y < t(~x) θ (~x, y) (oder führt diesen
Fall mittels der Negation auf den früheren zurück).
Die Umkehrung des obigen Lemmas gilt nicht: es gibt primitiv-rekursive Mengen, die durch keine ∆0 -Formel in den natürlichen Zahlen definierbar sind. - Dagegen kann man die folgenden Prädikate und Funktionen als p.r. nachweisen:
x|y:
P(x):
pn
↔ ∃z ≤ y (x · z = y)
x teilt y
↔ ∀u ≤ x (u|x → u = x ∨ u = 1) x ist Primzahl
= (n + 1)te Primzahl : p0 = 2, p1 = 3, p3 = 5, p4 = 7, p5 = 11 . . .
Damit können wir endliche Mengen natürlicher Zahlen durch Zahlen codieren,
z. B.
(n0 , n1 , . . . , nk ) durch pn00 +1 · pn11 +1 · . . . · pnk k +1 .
Definieren wir für x, y ∈ N
(x + y)(x + y + 1)
+ y,
2
so erhalten wir eine Paarfunktion N2 ↔ N, die man durch Iteration erweitern
kann, indem man
hx1 , x2 , . . . xk i = hx1 , hx2 , . . . xk ii
hx, yi :=
setzt. Tatsächlich benötigen wir aber zusätzlich eine Funktion, die uniform jede
endliche Menge natürlicher Zahlen durch eine einzelne Zahl codiert:
222
15.6. G ÖDELS L EMMA
15.6 Gödels Lemma
Es gibt es eine primitiv-rekursive Funktion β , so daß für jedes k und für jede
endliche Folge x0 , x1 , . . . xk−1 ∈ N gilt: es gibt eine natürliche Zahl c mit
für alle i < k : β (c, i) = xi .
Tatsächlich gibt es eine ∆0 -Formel θ (x, y, z), so daß
N |= ∀x, y ∃!z θ (x, y, z),
und die Formel θ (x, y, z) über den natürlichen Zahlen die Funktion β definiert.
Beweis: Es sei x0 , x1 , . . . xk−1 eine Folge natürlicher Zahlen.
Setze m := b! mit b := max(k, x0 , x1 , . . . xk−1 ). Dann ist die Folge der Zahlen
m + 1, 2m + 1, . . . k · m + 1
paarweise teilerfremd. Nach dem Satz über simultane Kongruenzen (Chinesischer
Restsatz) gibt es eine natürliche Zahl a mit
a ≡ xi
mod((i + 1)m + 1) für alle i < k.
Nun kann man ha, mi als Code der Folge x0 , x1 , . . . xk−1 wählen, denn hieraus
erhält man für jedes i < k die xi zurück als Rest der Division von a durch die
Zahl (i + 1)m + 1. Bezeichnet rest(x : y) = z den Rest bei der Division von x durch
y (falls y 6= 0 und rest(x : 0) = 0), so ist dieses eine p.r. Funktion mit einer ∆0 Definition. Eine weitere p.r. Funktion erhalten wir durch
α(a, m, i) = rest(a : (1 + i)m + 1).
Bezeichnen p1 , p2 die Umkehrfunktionen der obigen Paarfunktion hx, yi, für die
also gilt
hp1 (x), p2 (x)i = x, wobei p1 (x), p2 (x) ≤ x,
so sind auch diese p.r., und wir erhalten schließlich die Gödelsche β -Funktion
als
β (c, i) = α(p1 (c), p2 (c), i).
Für eine partielle Funktion f bezeichne Γ f den Graphen von f , also die Relation
Γ f (~x, y) : ⇐⇒ f (~x) = y.
15.7. D EFINIERBARKEITSSATZ F ÜR REKURSIVE F UNKTIONEN
223
15.7 Definierbarkeitssatz für rekursive Funktionen
Eine partielle Funktion f ist berechenbar genau dann, wenn ihr Graph Γ f über
den natürlichen Zahlen durch eine Σ1 -Formel definierbar ist, d. h. wenn es eine
Σ1 -Formel θ gibt, so daß für alle ~x, y ∈ N gilt:
Γ f (~x, y) ⇐⇒ N |= θ [~x, y].
Beweis: Wir zeigen zunächst den einfacheren Teil (⇐): Sei θ = ∃~z ψ eine Σ1 Formel, welche den Graphen Γ f einer partiellen Funktion f definiere, ψ(~x,~z, y) also eine ∆0 -Formel. Dann erhalten wir nach Lemma 15.5 eine berechenbare Funktion g durch
g(~x) = µz(N |= ∃y,~z ≤ z (hy,~zi = z ∧ ψ(~x,~z, y))).
Es ist dann p1 (g(~x)) das kleinste y mit N |= θ [~x, y], falls ein solches y existiert,
und undefiniert sonst, denn für jedes~x ∈ N gibt es höchstens ein y mit N |= θ [~x, y].
Somit ist p1 (g(~x)) ∼
= f (~x), und damit ist f berechenbar.
Zum Beweis von (⇒) nennen wir partielle Funktionen f , deren Graph sich
durch eine Σ1 -Formel über den natürlichen Zahlen definieren lassen, Funktionen
mit einem Σ1 -Graphen und zeigen, daß die Menge dieser Funktionen die Anfangsfunktionen enthält und unter Substitution, primitiver Rekursion und unter dem µOperator abgeschlossen ist. Dabei beschränken wir uns auf den einzigen Schritt,
der etwas schwieriger ist und die G ÖDELsche β -Funktion benutzt: Die Funktion
f entstehe aus Funktionen g, h durch primitive Rekursion:
f (~x, 0) ∼
= g(~x)
f (~x, y + 1) ∼
= h(~x, y, f (~x, y))
Dabei können wir annehmen, daß die Graphen von g und h durch Σ1 -Formeln
definierbar sind. Um damit den Graphen von f zu beschreiben, beachten wir, daß
sich der Wert von f (~x, y) berechnet durch die vorangegangenen Werte
u0 = f (~x, 0), u1 = f (~x, 1), . . . , uy = f (~x, y),
die wir mittels der β -Funktion durch eine einzige Zahl u codieren können. Wir
müssen nun aber in dieser Folge die Funktion f eliminieren, um eine explizite
Definition zu erhalten. Der erste Wert u0 ist durch den Graphen von g festgelegt ist
und die weiteren ui+1 bestimmen sich aus ui gemäß den Rekursionsbedingungen
mittels des Graphen von h:
15.8. R EPR ÄSENTIERBARKEIT
224
∀i < y ∃r, s ∈ N [β (u, i) = r ∧ β (u, i + 1) = s ∧ Γh (~x, i, r, s)]
Diese Formel läßt sich (indem man ein genügend großes w wählt) umformen zu
∃w ∈ N ∀i < y ∃r, s < w [β (u, i) = r ∧ β (u, i + 1) = s ∧ Γh (~x, i, r, s)].
Der letzte Wert der obigen Folge, die durch die Zahl u codiert wird, ist der
Funktionswert von f an der Stelle (~x, y). Damit erhalten wir als Beschreibung des
Graphen von f :
Γ f (~x, y, z) ⇐⇒ ∃u, v, w ∈ N (Γg (~x, v) ∧ β (u, 0) = v ∧ β (u, y) = z ∧
∀i < y ∃r, s < w [β (u, i) = r ∧ β (u, i + 1) = s ∧ Γh (~x, i, r, s)]),
⇐⇒ N |= Θ[~x, y, z]
für eine Σ1 -Formel Θ.
Nennt man eine Menge A ⊆ Nk , die durch eine Formel in Γ über den natürlichen Zahlen definierbar ist, ein Γ-Menge, so erhalten wir eine neue Charakterisierung der ersten Stufen der arithmetischen Hierarchie:
Korollar
(i) Die Σ1 -Mengen sind die r.e. Relationen R ⊆ Nk ,
(ii) Die Π1 -Mengen sind die Komplemente von r.e. Relationen,
(iii) die ∆1 -Mengen sind die die rekursiven Relationen R ⊆ Nk .
Eine Variante der Definierbarkeitsergebnisse, die sich auf die Beweisbarkeit
in formalen Theorien bezieht, ist etwas schwieriger zu behandeln, ermöglicht es
aber, Grenzen der Beweisbarkeit aufzuzeigen:
15.8 Repräsentierbarkeit
T sei eine Theorie der zahlentheoretischen Sprache L. Eine (totale) Funktion f :
Nk → N ist in T repräsentierbar gdw es eine L-Formel θ (x1 , . . . , xk , y) gibt, so
daß für alle n1 , . . . , nk , m ∈ N
15.8. R EPR ÄSENTIERBARKEIT
(a)
(b)
225
T ` ∃!yθ (n1 , . . . , nk , y)
und
f (n1 , . . . , nk ) = m =⇒ T ` θ (n1 , . . . , nk , m).
Ebenso ist eine Menge S ⊆ Nk in der Theorie T repräsentierbar gdw es eine
L-Formel θ (x1 , . . . , xk ) gibt, so daß für alle n1 , . . . , nk ∈ N
(c)
(d)
(n1 , . . . , nk ) ∈ S ⇒ T ` θ (n1 , . . . , nk )
und
(n1 , . . . , nk ) 6∈ S ⇒ T ` ¬θ (n1 , . . . , nk ).
Ist die Funktion f (oder die Menge S) durch eine Σ1 -Formel repräsentierbar, so
heißt f (bzw. S) Σ1 -repräsentierbar. Die Definition der Repäsentierbarkeit ist so
gewählt, daß diese Eigenschaft erhalten bleibt, wenn man die Theorie T erweitert.
Satz
(i) Jede rekursive Funktion f : Nk → N ist in PA− Σ1 -repräsentierbar.
(ii) Jede rekursive Menge S ⊆ Nk ist in PA− Σ1 -repräsentierbar.
Beweis von (i): f : Nk → N sei eine rekursive Funktion, ihr Graph Γ f ist also über
den natürlichen Zahlen durch eine Σ1 -Formel ∃~z ϕ(~x, y,~z) definierbar, wobei ϕ nur
beschränkte Quantoren enthält. Da jede Formel der Form ∃~z ϕ in PA− äquivalent
ist zu ∃u ∃~z (~z < u ∧ ϕ), können wir annehmen, daß~z nur eine einzelne Variable z
ist. Wir bilden nun die ∆0 -Formel ψ(~x, y, z)
ϕ(~x, y, z) ∧ ∀u, v ≤ y + z (u + v < y + z → ¬ϕ(~x, u, v))
und weisen nach, daß die Σ1 -Formel ∃z ψ(~x, y, z) die Funktion f in T repräsentiert:
Zunächst zeigen wir (b) und nehmen dazu an, daß f (n1 , . . . , nk ) = m gilt, also
N |= ∃z ϕ(n1 , . . . , nk , m, z). Die Zahl m ist dabei als Funktionswert eindeutig bestimmt. Wähle l als die kleinste Zahl, so daß N |= ϕ(n1 , . . . , nk , m, l). Dann gilt
offenbar auch N |= ψ(n1 , . . . , nk , m, l), also auch N |= ∃zψ(n1 , . . . , nk , m, z). Als
Σ1 -Satz bleibt dieser Satz bei allen Enderweiterungen des Standardmodells zu einem Modell von PA− erhalten, gilt also in allen Modellen von PA− , und somit
gilt PA− ` ∃zψ(n1 , . . . , nk , m, z) nach dem Vollständigkeitssatz.
Der Nachweis von (a) benutzt ein ähnliches Argument: Es sei f (n1 , . . . , nk ) =
m und l wieder die kleinste Zahl, so daß N |= ψ(n1 , . . . , nk , m, l) gilt. Sei M |= PA.
Dann ist zu zeigen, daß m das einzige Element von M ist, welches die Formel
ψ(n1 , . . . , nk , x, l) in M erfüllt. Daß es überhaupt in M die Formel erfüllt, liegt
an der Absolutheit von ∆0 -Formeln. Sind a, b ∈ M zwei Elemente, so daß M |=
15.8. R EPR ÄSENTIERBARKEIT
226
ψ(n1 , . . . , nk , a, b), so müssen (nach der Definition von ψ) a, b ≤ k + l und damit
in N sein. Damit gilt dann wieder wegen der Absolutheit von ∆0 -Formeln auch
N |= ψ(n1 , . . . , nk , a, b), woraus N |= ∃z ψ(n1 , . . . , nk , a, z) und damit a = m folgt.
Der Teil (ii) folgt nun hieraus: Ist S rekursiv, so ist die charakteristische Funktion cS berechenbar, also nach (i) durch eine Σ1 -Formel θ (~x, y) in PA− repräsentiert.
Dann wird S repräsentiert durch die Formel θ (~x, 1), denn es gilt
PA− ` ¬θ (~x, 1) ⇐⇒ PA− ` θ (~x, 0).
227
Kapitel 16
Die Gödelschen Sätze
Die beiden G ÖDELschen Unvollständigkeitssätze beruhen auf
1. einer Codierung der Formeln der Sprache durch Zahlen (Gödel-Nummern),
wodurch syntaktische Eigenschaften von Formeln als zahlentheoretische
Aussagen in der Sprache der P EANO-Arithmetik selbst ausgedrückt werden
können und
2. einem Diagonalverfahren.
16.1 Gödel-Nummern
Zunächst ordnen wir jedem Term t der Sprache L von PA− eine Zahl, die G ÖDELNummer ptq, durch primitive Rekursion wie folgt zu:
p0q = 1
p1q = 3
pvi q = 32 · 5i
ps + tq = 33 · 5psq · 7ptq
ps · tq = 34 · 5psq · 7ptq
2
3
So ist z. B. pv3 + 1q = 33 · 53 ·5 · 73 . Ähnlich kann man nun den Formeln ihre
jeweilige G ÖDEL-Nummer zuordnen:
16.2. D IAGONALISIERUNGSLEMMA
228
ps = tq = 2 · 5psq · 7ptq
ps < tq = 2 · 3 · 5psq · 7ptq
p¬ϕq = 2 · 32 · 5pϕq
pϕ ∨ ψq = 2 · 33 · 5pϕq · 7pψq
p∃vi ϕq = 2 · 34 · 5i · 7pϕq
Natürlich gibt es auch viele andere Möglichkeiten einer Codierung; wichtig ist
hier nur, daß es sich um eine berechenbare injektive Abbildung aller L-Formeln1
auf eine berechenbare Teilmenge Fml ⊆ N handelt und daß die die Umkehrabbildung (definiert auf der Menge Fml) ist ebenfalls berechenbar ist (so daß wir aus
der G ÖDEL-Nummer pϕq die Formel ϕ wieder ausrechnen können).
Im folgenden benötigen wir die Diagonal-Funktion d, definiert durch
(
p∀y (y = n → σ (y))q, falls n = pσ (v0 )q für eine L-Formel σ (v0 )
d(n) =
0
sonst.
16.2 Diagonalisierungslemma
T sei eine L-Theorie, θ (v0 ) eine L-Formel mit der einen freien Variablen v0 . Falls
die Diagonalfunktion d in T repräsentierbar ist, so gibt es einen L-Satz G mit der
Eigenschaft
T ` G ↔ θ (pGq).
Ist d durch eine Σ1 -Formel in T repräsentierbar und θ (v0 ) eine Π1 -Formel, so
kann G als Π1 -Satz gewählt werden.
Beweis: Ist d in T durch die Formel δ (x, y) repräsentiert, so definiere
ψ(v0 ) := ∀y (δ (v0 , y) → θ (y)),
1 Berechenbare
Funktionen haben wir hier nur als zahlentheoretische Funktionen eingeführt,
es ist jedoch nahe liegend, diesen Begriff auch auf andere Bereiche (wie endliche Folgen von
Symbolen) auszudehnen.
229
16.3. S ATZ VON G ÖDEL -ROSSER
und setze n := pψ(v0 )q. (Achtung: n ist tatsächlich eine Zahl, in welcher natürlich
die Variable v0 nicht vorkommt; dagegen geht die G ÖDEL-Nummer von v0 in die
Berechnung von n ein!) Für G wählt man nun den Satz
G := ∀y (y = n → ψ(y)).
Dann hat also G die G ÖDEL-Nummer d(pψ(v0 )q). Ist δ (x, y) eine Σ1 -Formel und
θ (v) eine Π1 -Formel, so sind ψ und G (äquivalent zu) Π1 -Formeln. Somit bleibt
zu zeigen, daß T ` G ↔ θ (pGq): Es gilt offenbar
(1)
T ` G ↔ ψ(n),
T ` G ↔ ∀y(δ (n, y) → θ (y)).
d. h. nach Def. von ψ
Daß d in T durch δ (x, y) repräsentiert wird, besagt aber
d(n) = pGq ⇒ T ` δ (n, pGq)
und
T ` ∃!y δ (n, y).
Somit gilt insbesondere
(2)
T ` ∀y (δ (n, y) ↔ y = pGq)
T ` G ↔ ∀y (y = pGq) → θ (y)),
T ` G ↔ θ (pGq).
und zusammen mit (1) folgt daraus
also
16.3 Satz von Gödel-Rosser
T sei eine rekursive Menge von (Gödel-Nummern von) L-Sätzen, so daß gilt:
(i) T enthält keinen Widerspruch, d. h. es gibt keinen L-Satz σ mit pσ q ∈ T
und zugleich p¬σ q ∈ T,
(ii) T enthält alle Σ1 und Π1 -Sätze, die in PA− gelten:
{pσ q | σ ∈ Σ1 ∪ Π1 , σ Satz , PA− ` σ } ⊆ T.
Dann ist T Π1 -unvollständig in folgendem Sinne: es gibt einen Π1 -Satz τ
mit
pτq 6∈ T und p¬τq 6∈ T.
16.4. E RSTER G ÖDELSCHER U NVOLLST ÄNDIGKEITSSATZ
230
Beweis: Da T rekursiv ist, gibt es eine Σ1 -Formel θ (v), so daß für alle n ∈ N
n ∈ T =⇒ PA− ` θ (n),
n 6∈ T =⇒ PA− ` ¬θ (n).
Nach dem Diagonalisierungslemma 16.2 gibt es einen Π1 -Satz τ mit
PA− ` τ ↔ ¬θ (pτq).
Mit (ii) folgt daraus
pτq ∈ T ⇒ PA− ` θ (pτq) ⇒ PA− ` ¬τ ⇒ p¬τq ∈ T
und ebenso mit (i)
p¬τq ∈ T ⇒ pτq 6∈ T ⇒ PA− ` ¬θ (pτq) ⇒ PA− ` τ ⇒ pτq ∈ T,
so daß weder pτq noch p¬τq in T sein können.
Eine Theorie T heißt rekursiv-axiomatisierbar gdw sie ein Axiomensystem
Σ besitzt, für welches die Menge der G ÖDELnummern {pσ q | σ ∈ Σ} rekursiv ist.
16.4 Erster Gödelscher Unvollständigkeitssatz
T sei eine konsistente2 und rekursiv-axiomatisierbare Theorie der Sprache L, welche die Theorie PA− erweitert. Dann ist T Π1 -unvollständig, d. h. es gibt einen
Π1 -Satz τ mit
T 6` τ und T 6` ¬τ.
Beweis: Wir nehmen an, daß T sowohl konsistent und rekursiv-axiomatisierbar
als auch Π1 -vollständig ist und leiten daraus einen Widerspruch ab: Setze
S := {pσ q | σ ∈ Σ1 ∪ Π1 , σ Satz , T ` σ }.
Dann ist S rekursiv (denn um nachzuprüfen, ob ein Σ1 oder Π1 -Satz σ in S ist,
braucht man nur die rekursive Aufzählung der in T beweisbaren Sätze der Form
2 Die
ursprüngliche Fassung des G ÖDELschen Satzes hatte die stärkere Voraussetzung der ωKonsistenz von T (d. h. für alle L-Formeln θ (v) mit T ` θ (n) für alle n ∈ N ist T[∀v θ (v)] konsistent). ROSSER hat 1936 die obige stärkere Version bewiesen.
16.5. KOMBINATORISCHE P RINZIPIEN
231
σ bzw. ¬σ zu durchlaufen, wegen der Π1 -Vollständigkeit muß einer der beiden
nach endlich-vielen Schritten auftauchen). Somit läßt sich der Satz von G ÖDEL ROSSER anwenden, wonach S Π1 -unvollständig ist, ein Widerspruch!
Jede konsistente Erweiterung T von PA− hat nach dem Satz von L INDEN BAUM 4.9.1 eine vollständige und konsistente Erweiterung, von denen also keine
rekursiv (d. h. entscheidbar) sein kann. Aus dem obigen Satz kann man übrigens
folgern, daß jede rekursive konsistente Erweiterung von PA− sogar 2ℵ0 -viele Erweiterungen und ebenso viele abzählbare Modelle besitzt, die nicht elementaräquivalent sind (s. R. K AYE : Models of Peano Arithmetic, pp. 39ff).
Mathematisch interessantere Sätze, die in der P EANO-Arithmetik unabhängig
sind, erhält man durch
16.5 Kombinatorische Prinzipien
In seiner einfachsten Form besagt das
Schubfachprinzip:
(1) Verteilt man n Elemente in m < n-viele Schubladen, so muß eine der Schubladen mindestens 2 Elemente enthalten.
Die Verallgemeinerung auf unendliche Mengen lautet:
(2) Ist eine unendliche Menge zerlegt in endlich-viele Mengen, so muß wenigstens eine dieser Mengen unendlich sein:
˙ ...∪
˙ Ak unendlich → ∃i ≤ k (Ai unendlich) .
A = A0 ∪
Zur weiteren Verallgemeinerung setzen wir
[A]n := {x ⊆ A | |x| = n} Menge der n-elementigen Teilmengen von A.
Eine Zerlegung der n-elementigen Teilmengen von A in k Teilmengen kann
man auch durch eine Funktion
f : [A]n → k
wiedergeben (Ai = {x ∈ A | f (x) = i} sind dann die Zerlegungsmengen), und ein
solches f nennt man etwas anschaulicher auch eine Färbung (von [A]n ) mit k
Farben. Eine Teilmenge X ⊆ A mit [X]n ⊆ Ai für ein i < k (deren n-Tupel also
einfarbig sind) heißt homogen für die Zerlegung f . Der
232
16.5. KOMBINATORISCHE P RINZIPIEN
Satz von Ramsey3
f : [N]n → k → ∃X ⊆ N (X unendlich ∧ ∀u, v ∈ [X]n f (u) = f (v)).
besagt also, daß jede Färbung der n-elementigen Teilmengen von natürlichen Zahlen mit endlich-vielen Farben eine unendliche homogene Teilmenge besitzt. Dieser Satz ist in der Mengenlehre mit einer schwachen Form des Auswahlaxioms
beweisbar (s. etwa D. M ARKER : Model Theory: An Introduction, § 5.1).
In diesem Zusammenhang benutzt man folgende Notationen:
Definition
Eine (endliche) Menge H von Ordinalzahlen heißt
relativ groß ↔ card(H) ≥ min(H).
Sind n, k ∈ N, α, γ ∈ On, so bedeute
γ −→ (α)nk
min
bzw. γ −→ (α)nk
daß es für jede Färbung f der n-elementigen Teilmengen von γ mit k Farben eine
(relativ große) Teilmenge H ⊆ γ vom Ordnungstyp α gibt, die homogen für f ist.
Der obige Satz von R AMSEY besagt also: ∀n, k ω −→ (ω)nk . Hieraus folgert
man den finitären Satz von R AMSEY:
∀m, n, k ∃r r −→ (m)nk .
Dieser Satz über natürliche Zahlen läßt sich in der Sprache der P EANO-Arithmetik ausdrücken und auch beweisen; eine (anscheinend) leichte Verstärkung aber
nicht mehr: PARIS -H ARRINGTON4 haben gezeigt:
Satz
Die Aussage
min
∀m, n, k ∃r r −→ (m)nk
ist in der Mengenlehre beweisbar, nicht aber in PA (falls PA konsistent ist). Die
Existenz dieser Zahlen r kann man in PA nicht mehr allgemein zeigen, tatsächlich
führen sie zu sehr großen Zahlen: Ist
min
σ (n) = das kleinste r mit r −→ (n + 1)nn ,
3 F.
P. R AMSEY: On a problem of formal logic. Proc. London Math. Soc. (2) 30 (1929), 264-286
mathematical Incompleteness in Peano Arithmetic. In: Handbook of Mathematical Logic,
ed. Barwise, Elsevier 1982
4A
16.6. Z WEITER G ÖDELSCHER U NVOLLST ÄNDIGKEITSSATZ
233
so übertrifft die Funktion σ schließlich jede rekursive Funktion f (d. h. es zu jeder
rekursiven Funktion f gibt es ein p mit f (n) < σ (n) für alle n ≥ p).5
16.6 Zweiter Gödelscher Unvollständigkeitssatz
Mit Hilfe einer G ÖDEL-Nummerierung kann man syntaktische Eigenschaften von
Formeln in zahlentheoretische Eigenschaften übersetzen. Da auch Beweise endliche Folgen von Formeln sind, kann man auch diese durch natürliche Zahlen
codieren und L-Formeln BewT , bewbT finden, so daß
(i) BewT (n, m) ausdrückt: “n ist die Nummer eines Beweises einer Formel ϕ
mit der G ÖDELnummer m” und
(ii) bewbT (m) :↔ ∃n BewT (n, m) ausdrückt: “m ist die G ÖDELnummer einer
Formel ϕ, welche in T beweisbar ist.”
Ist die Theorie T rekursiv-axiomatisierbar, so ist das Beweisprädikat rekursiv
und das Beweisbarkeitsprädikat r.e. Ferner kann man dann für eine geeignete Σ1 Formel θ = bewbT die folgenden Ableitbarkeits-Bedingungen nachweisen:
T ` σ =⇒ T ` θ (pσ q)
T ` θ (pσ → τq)
→
(θ (pσ q) → θ (pτq))
T ` θ (pσ q)
→
θ (p(θ (pσ q)q)
(Dabei sind σ , τ beliebige Sätze der Sprache L, und die G ÖDEL-Nummern n sollten in diesen Formeln jeweils durch die entsprechenden Terme n ersetzt sein. Zum
Nachweis benötigt man allerdings eine stärkere Theorie als PA− , etwa PA.) Unter
Benutzung eines derartigen Beweisbegriffes kann man auch die Konsistenz einer
Theorie formalisieren, etwa
ConT :↔ ¬θ (p0 = 1q).
Damit kann man dann zeigen:
5 J.
K ETONEN - R. S OLOVAY: Rapidly growing Ramsey functions. Annals of mathematics (2)
113 (1981), 267-314. Einen guten Überblick über dieses Thema findet man auch bei
C. S MORYNSKI : Some rapidly growing functions. The Mathematical Intelligencer 2,3 (1979),
149-154
16.7. WAHRHEIT IST NICHT ARITHMETISCH DEFINIERBAR
234
2. Gödelscher Unvollständigkeitssatz
T sei eine Theorie der Sprache L, für welche ein formales Beweisprädikat θ = θT
mit den obigen Bedingungen existiere (z. B. T = PA). Dann gilt:
T ist konsistent =⇒ T 6` ConT .
Beweis: (Skizze) Nach dem Diagonalisierungslemma existiert ein Satz τ, so daß:
(∗)
T ` τ ↔ ¬θ (pτq).
Falls T ` τ, so folgt aus der 1. Ableitbarkeitsbedingung: T ` θ (pτq), also nach
(*) T ` ¬τ, d. h. T ist inkonsistent. Damit haben wir:
(∗∗)
T konsistent =⇒ T 6` τ.
Man zeige, daß sich dieser Beweis formalisieren und mit Hilfe des durch θ in T
formalisierten Beweisprädikates darstellen läßt, also
T ` ConT → ¬θT (pτq).
Sei nun T konsistent, also nach (**) T 6` τ. Dann ist wegen (*) auch T 6` ¬θ (pτq)
und somit auch T 6` ConT .
Dieser Satz besagt also, daß man selbst mit den Mitteln der P EANO-Arithmetik keinen Beweis der Konsistenz dieser Theorie finden kann (ein Beweis der
Konsistenz einer Theorie T würde überdies nur überzeugend sein, wenn er unter schwächeren Voraussetzungen möglich wäre, als sie Theorie T zur Verfügung
stellt), und diese Aussage gilt auch für alle weiteren formalen Theorien, in welcher
sich die P EANO-Arithmetik interpretieren läßt (wie z. B. die übliche axiomatische
Mengenlehre).
16.7 Wahrheit ist nicht arithmetisch definierbar
Während sich die üblichen syntaktischen Begriffe, die zu einer formalen Sprache
L gebildet werden, in der Sprache der Zahlentheorie definieren lassen und ihre
wesentlichen Eigenschaften zumindest in der Theorie PA beweisen lassen, ist dies
für den semantischen Wahrheitsbegriff nicht möglich:
235
16.8. U NENTSCHEIDBARKEIT
Satz von Tarski
Es sei M |= PA− . Dann gibt es keine L-Formel θ (v), so daß für alle natürlichen
Zahlen n
M |= θ (n) ⇐⇒ n = pσ q für einen L-Satz σ mit M |= σ .
Beweis: Wenn es eine solche Wahrheitsdefinition θ gäbe, so könnte man nach
dem Diagonalisierungslemma 16.2 einen Satz G finden, so daß
PA− ` G
↔
M |= G
⇐⇒
¬θ (G),
insbesondere
M |= ¬θ (pGq).
Andererseits müßte für die Wahrheitsdefinition gelten:
M |= G ⇐⇒ M |= θ (pGq),
was aber zum Widerspruch führt!
16.8 Unentscheidbarkeit
Wie im vorigen Abschnitt werden wir gelegentlich eine formale Theorie T mit
pTq = {pσ q | σ Satz mit T ` σ },
der Menge der G ÖDEL-Nummern der in T beweisbaren Sätze identifizieren. So
heißt eine Theorie T entscheidbar gdw pTq entscheidbar (d. h. rekursiv) ist; ist
T nicht entscheidbar, so heißt T unentscheidbar. Für eine entscheidbare Theorie T gibt es also ein effektives Verfahren, welches nach endlich-vielen Schritten
feststellt, ob ein vorgegebener Satz (in der Sprache der Theorie) in T beweisbar
ist oder nicht.
Indem man die Diagonalfunktion d benutzt, kann man nach der Methode des
Satzes von G ÖDEL -ROSSER 16.3 zeigen:
Satz
Ist T eine konsistente Theorie der Sprache L, so sind nicht die Diagonalfunktion
d und zugleich die Menge pTq in T repräsentierbar.
16.8. U NENTSCHEIDBARKEIT
236
Beweis: Wir nehmen an, daß sowohl d durch eine Formel δ (x, y) wie auch die
Menge pTq durch eine Formel ϕT (v0 ) in T repräsentiert werden und wählen θ =
¬ϕT . Aus dem Diagonalisierungslemma 16.2 erhalten wir dann die Existenz einer
Formel G mit
(∗)
T ` G ↔ ¬ϕT (pGq).
1. Fall: T ` G, also pGq ∈ pTq. Dann gilt wegen der Repräsentierbarkeit:
T ` ϕT (pGq) und mit (*) auch T ` ¬G, d. h. T wäre widerspruchsvoll.
2. Fall: T 6` G, also pGq 6∈ pTq. Dann gilt wiederum wegen der Repräsentierbarkeit: T ` ¬ϕT (pGq), mit (*) also T ` G, Widerspruch!
Folgerungen und Bemerkungen
(i) Ist T eine konsistente Theorie der Sprache L, welche PA− erweitert, so ist
T unentscheidbar.
(Denn dann ist jede rekursive Funktion, also auch d, in T repräsentierbar.)
Da dieses für die endlich-axiomatisierbare Theorie PA− gilt, so erhalten
wir:
(ii) Die Prädikatenlogik, d. h. {pσ q | σ Satz mit ` σ }, ist unentscheidbar.
(C HURCH 1936) Tatsächlich gilt bereits:
(iii) Die Prädikatenlogik mit einem 2-stelligen Relationszeichen ist unentscheidbar (ebenso die PL mit mindestens zwei 1-stelligen oder mindestens einem
2-stelligen Funktionszeichen). (T RACHTENBROT 1953)
Denn es gibt eine endlich-axiomatisierbare Teiltheorie der Mengenlehre (in
der Sprache mit der ∈-Relation), in welcher sich alle rekursiven Funktionen
repräsentieren lassen. Dagegen ist
(iv) die monadische Prädikatenlogik (mit nur 1-stelligen Relationszeichen außer der Gleichheit) entscheidbar. (B EHMANN 1922)
(v) Die Theorie der Gruppen ist unentscheidbar (M ALCEV 1961), die Theorie
der A BELschen Gruppen dagegen ist entscheidbar (W. S MIELEW 1949).
Ein Beispiel eines Entscheidungsverfahrens für eine algebraische Theorie
behandeln wir im nächsten Teil.
237
16.8. U NENTSCHEIDBARKEIT
Das Entscheidungsproblem für die Prädikatenlogik
Ohne Beweis (s. hierzu etwa B ÖRGER -G R ÄDEL -G UREVICH 1997) führen wir
die folgenden Ergebnisse an:
• entscheidbar (bezüglich Allgemeingültigkeit) sind Formeln der Prädikatenlogik mit folgenden Präfixtypen:
∀...∀∃...∃
∀...∀∃∀...∀
∀ . . . ∀ ∃∃ ∀ . . . ∀
(ohne =-Zeichen!)
• unentscheidbar (bezüglich Allgemeingültigkeit) sind bereits Formeln der
Prädikatenlogik mit folgendem Präfix (selbst ohne =-Zeichen):
∃∀∃
• Reduktionstypen (d. h. Allgemeingültigkeit ist auf Formeln dieses Typs
zurückzuführen) sind die folgenden Formelklassen:
∃∃∃ ∀ . . . ∀
∃∃ ∀ . . . ∀∃
∃∃ ∀ ∃ . . . ∃
∀∃∀∃...∃
238
Kapitel 17
Literatur
Geschichte
B OCHENSKI , J.M.: Formale Logik. Alber, Freiburg 1966
D UMMETT, M.: Frege. Harvard Univ. Press 1991
D RUCKER , T H . (ed.): Perspectives on the history of mathematical logic.
Birkhäuser 1991
K UTSCHERA , F. V.: Gottlob Frege. Eine Einführung in sein Werk.
de Gruyter 1989
H ASENJAEGER , G.: Grundbegriffe und Probleme der math. Logik.
Alber, Freiburg 1962
K NEALE , W. und M.: The development of logic. Oxford Univ. Press 1962
S CHOLZ , H.: Abriß der Logik. Alber, Freiburg 1996
Mathematische Logik
A SSER , G.: Einführung in die mathematische Logik I-III. Teubner 1981
E BBINGHAUS -F LUM -T HOMAS: Einführung in die mathematische Logik.
Spectrum Akademischer Verlag 1996
H ILBERT-B ERNAYS: Grundlagen der Mathematik I,II.
Springer 1934/39, Neuauflage: 1968/70
H ILBERT-ACKERMANN: Grundzüge der mathematischen Logik.
Springer (mehrere Auflagen)
M ATES , B.: Elementare Logik. Vandenhoeck & Ruprecht 1978
M ENDELSON , E.: Introduction to Math. Logic. Chapman & Hall 1997
239
N OVIKOV, P.S.: Grundzüge der Mathematischen Logik. vieweg 1973
P RESTEL , A.: Einführung in die Mathematische Logik und Modelltheorie.
vieweg 1986
R AUTENBERG , W.: Einführung in die Mathematische Logik. vieweg 2002
R ASIOWA -S IKORSKI: The Mathematics of Metamathematics.
Polish Scientific Publ. 1968
S HOENFIELD , J.R.: Mathematical Logic. Addison-Wesley 1967 T OURLAKIS ,
G.: Lectures in Logic and Set Theory. Cambridge 2003
T USCHIK -W OLTER: Mathematische Logik - kurzgefaßt.
Spectrum Akademischer Verlag 2002
Mengenlehre
C ANTOR , G.: Gesammelte Abhandlungen. Springer 1980
D EISER , O.: Einführung in die Mengenlehre. Springer 2004
E BBINGHAUS , D.: Einführung in die Mengenlehre.
Spectrum Akademischer Verlag 2003
F ELGNER, U. (Herausgeber): Mengenlehre. Wiss. Buchgesellschaft 1979
F RAENKEL , A.- BAR H ILLEL , Y. - L ÉVY, A.: Foundations of Set Theory.
Amsterdam 1973
F RIEDRICHSDORF, U.-P RESTEL , A.: Mengenlehre für den Mathematiker.
vieweg 1985
J ECH , T H .: Set Theory. Springer 2003
K ANAMORI , A.: The mathematical development of set theory from Cantor
to Cohen Bull. Symb. Logic 2,1, 1-71 (1996)
L ÉVY, A.: Basic Set Theory. Springer 1979
Modelltheorie
C HANG -K EISLER: Model Theory. Elsevier 1990
H ODGES , W.: Model Theory. Cambridge Univ. Press 1993
K AY, R.: Models of Peano Arithmetic. Oxford University Press 1991
M ARCJA -T OFFALORI: A Guide to Classical and Modern Model Theory.
Kluwer 2003
M ARKER , D.: Model Theory. An Introduction Springer 2002
240
Berechenbarkeit, Unentscheidbarkeit, Unvollständigkeit
B ÖRGER , E.: Berechenbarkeit, Komplexität, Logik. vieweg 1992
B ÖGER -G R ÄDEL -G UREVICH: The classical decision problem. Springer 1997
C UTLAND , N.: Computability Cambridge University Press 1980
K AYE , R.: Models of Peano Arithmetic Clarendon Press 1991
Informatik, autom. Beweisen, Varia
BARWISE , J. (ed.): Handbook of Mathematical Logic. Elsevier 1982
G ABBAY-G UENTHNER (ed.): Handbook of Philosophical Logic. Kluwer 2003
F ITTING , M.: First-order logic and automated theorem proving. Springer 1990
H EINEMANN -W EIHRAUCH: Logik für Informatiker Teubner 1991
H OFSTADTER , D.R.: Gödel, Escher, Bach.
Basic Book 1979, deutsch bei Klett-Cotta und dtv
S CH ÖNING , U.: Logik für Informatiker B.I. Verlag 1987
Bibliographie
G.H. M ÜLLER und V. L ENSKI (ed.): Ω-Bibliography of Mathematical Logic.
Vol. I-VI. Springer 1987, fortgesetzt im internet unter:
http://www-logic.uni-kl.de/BIBL/index.html
Weitere links auch über http://www.math.uni-heidelberg.de/logic/wwwlinks.html
Skripten im Internet über die links
http://www.math.uni-heidelberg.de/logic/skripten.html
http://www.uni-bonn.de/logic/world.html
Biographien: http://www-groups.dcs.st-and.ac.uk/ history/BiogIndex.html
Zeitschriften über Mathematische Logik
Annals of Pure and Applied Logic
Archive of Mathematical Logic
Fundamenta Mathematicae
Journal of Symbolic Logic, Bulletin of Symbolic Logic
Mathematical Logic Quarterly (früher: Zeitschrift f. math. Logik und Grundl. der
Math.)
Notre Dame Journal of Formal Logic
Herunterladen