Universität Würzburg Bachelorarbeit Unvollständigkeit und Unentscheidbarkeit Vorgelegt von: Jan Maly Betreuer: Prof. Dr. Jörn Steuding im Studiengang Mathematik (Universität Würzburg Lehrstuhl für Funktionentheorie) 3. Oktober 2013 Inhaltsverzeichnis Einleitung 3 1 5 2 Prädikatenlogik 1. Stufe 1.1 Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Beweisbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 11 15 Der Vollständigkeitssatz 23 2.1 2.2 2.3 2.4 3 4 Eigenschaften des Kalküls . Henkin-Theorien . . . . . . Spracherweiterungen . . . Konstruktion eines Modells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 28 29 31 Berechenbarkeit 33 3.1 Primitiv rekursive Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Rekursive Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Rekursive Funktionen und Berechenbarkeit . . . . . . . . . . . . . . . . . . . . 33 35 39 Vollständigkeit und Entscheidbarkeit 41 4.1 Definitionen . . . . . . . . . 4.1.1 Entscheidbarkeit . . 4.1.2 Vollständigkeit . . . 4.2 Unentscheidbare Theorien 4.3 Axiomatisierbare Theorien 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Unvollständigkeit und Unentscheidbarkeit der Arithmetik Schluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 43 44 47 57 64 2 Einleitung Die meisten Mathematiker haben wohl schon einmal von dem ’Gödelschen Unvollständigkeitssatz’ gehört. Kein Wunder, wenn man bedenkt, dass die Orginalveröffentlichung wohl der „am öftesten zitierte Artikel der mathematischen Logik des 20. Jahrhunderts“ (Friedman, 2006) ist. Einigen ist wahrscheinlich auch ein unbeweisbarer Satz in ihrem Fachgebiet, wie zum Beispiel die Kontinuumshyphothese in der klassischen axiomatischen Mengenlehre (Woodin, 2001), oder ein Problem, dessen Beantwortung algorithmisch nicht möglich ist, bekannt, wie die Lösbarkeit einer diophantischen Gleichung in der Zahlentheorie (Shlapenthokh, 2007, S. 1). Aber auch außerhalb der mathematischen Kreise ist Kurt Gödel kein Unbekannter. Die Philosophie und auch die Theologie haben sich vielfach mit dem Unvollständigkeitssatz auseinander gesetzt, die Informatik erst recht und sogar in der Kunst hat der Satz seine Spuren hinterlassen, wie in Hans Magnus Enzensbergers Gedicht „Hommage an Gödel“, in dem er zitiert wird. Aber nicht nur der ’Gödelsche Unvollständigkeitssatz’ allein verdient Beachtung. Eine Vielzahl von Entwicklungen und Ergebnissen der mathematischen Logik, die in etwa zur selben Zeit wie der Unvollständigkeitssatz stattfanden, teils auch durch diesen motiviert, haben das Verständnis der Mathematik nachhaltig verändert und als Vorläufer der modernen Computertheorie auch weit über die wissenschaftliche Welt hinaus ihre Wirkung entfaltet (Sigmund u. a., 2006; Dawson, 1999, S.10 und S. 231). Mehr als genug Grund also, sich mit diesen Arbeiten und Ergebnissen einmal intensiver auseinanderzusetzen. Um diese Ergebnisse aber überhaupt in einer mathematisch korrekten Form verstehen zu können, muss man sich zuerst die Grundbegriffe der mathematischen Logik vertraut machen. Zu diesem Zweck wird im ersten Kapitel dieser Arbeit die Prädikatenlogik erster Stufe eingeführt und ihre Syntax und Semantik besprochen. Diese Begriffe erinnern nicht zufällig an die Linguistik. Die Prädikatenlogik „ist keine Theorie“ (Carnap, 1954, S. 1) sondern eine Sprache. Diese Sprache bietet den Vorzug, dass sie eine „die sonst auftretenden Vagheiten und Mehrdeutigkeiten der Umgangssprache vermeidbare [sic] Präzision“(Stegmüller, 1957, S. 41) bietet. Dabei wird die mathematische Logik selber zumeist nicht in dieser Sprache betrieben, genauso wenig wie die übrige Mathematik. Um aber Aussagen über die Möglichkeiten und Grenzen der Mathematik zu machen, übersetzt man diese in die Prädikatenlogik, um sie dann mit mathematischen Methoden und mathematischer Strenge untersuchen zu können. Dabei reicht die Prädikatenlogik erster Stufe nicht aus, um die meisten Felder der Mathematik direkt darzustellen, allerdings kann sie die Mengenlehre darstellen, in die sich wiederum die meiste, wenn nicht alle, Mathematik übersetzten lässt. Damit hat man die Möglichkeit, die meisten mathematischen Aussagen in einer formalen Sprache darzustellen. In einem nächsten Schritt geht es dann darum, das wichtigste Werkzeug eines jeden Mathematikers zu formalisieren, den Beweis. Dazu wird ein so genanntes logisches Kalkül eingeführt. Mit Hilfe dieses Kalküls ist es dann möglich, das erste bedeuten- 3 Einleitung de logische Ergebnis dieser Arbeit einzuführen, den ’Gödelschen Vollständigkeitssatz’, der besagt, dass jede wahre Aussage auch beweisbar ist. Dieses bedeutende, positive Ergebnis hat Kurt Gödel zwei Jahre vor seinem Unvollständigkeitssatz bewiesen. Bevor dann der Hauptteil der Arbeit folgt, sind noch einige Vorarbeiten aus einer anderen Richtung notwendig. Es müssen noch die Grundbegriffe der Rekursionstheorie eingeführt werden, was in Kapitel drei geschieht. Dabei wird versucht, eine mathematisch präzise Definition einer berechenbaren Funktion zu geben. Mit diesem Vorwissen ausgestattet, werden dann im vierten Kapitel die Begriffe der Unvollständigen und der Unentscheidbaren Theorie eingeführt und eine Reihe wichtiger Sätze über die Möglichkeiten und vor allem die Grenzen der Mathematik bewiesen. Schlussendlich werden im fünften Kapitel diese Sätze dann auf die Arithmetik, oder genauer, die üblichste axiomatische Version der Arithmetik, die Peano-Arithmetik angewendet, um die Grenzen dieser Theorie aufzuzeigen. Wie bei einer Grundlagenuntersuchung der Mathematik nicht anders zu erwarten, werden nicht viele Ergebnisse aus anderen Bereichen der Mathematik benötigt. Über den Umgang mit den Grundrechenarten und etwas naive Mengenlehre hinaus, werden vor allem zwei fundamentale Ergebnisse der Zahlentheorie gebraucht: Dass es unendlich viele Primzahlen gibt und dass jede Zahl eine, bis auf die Reihenfolge eindeutige Primfaktorzerlegung hat. Für die erste Aussage bietet Aigner und Ziegler (2010, S. 3ff) eine ganze Reihe besonders eleganter Beweise, die zweite Aussage wird beispielsweise in Bundschuh (2008, S. 7) bewiesen. Beide findet man aber mit sehr hoher Wahrscheinlichkeit in jedem andren Lehrbuch der Zahlentheorie. Da in der mathematischen Logik aber mit mathematischen Methoden gearbeitet wird, ist zum Verständnis dieser Arbeit eine gewisse Vertrautheit mit diesen Methoden höchst wahrscheinlich unentbehrlich. Aus diesem Grund werden Begriffe, die als mathematisches Grundwissen betrachtet werden können, wie zum Beispiel Äquivalenzrelationen, auch ohne weitere Erklärung verwendet. 4 Kapitel 1 Prädikatenlogik 1. Stufe Die klassische Prädikatenlogik geht auf vor allem auf Gottlob Frege und Charles Sanders Peirec zurück, wobei es Bertrand Russell war, der die Werke der beiden zusammenführte (Dawson, 1999, S. 35f). Die namensgebenden Prädikate sind dabei in ihrer einfachsten Form Aussagen von der Form ’x hat die Eigenschaft P’. Üblicherweise schreibt man für eine solche Aussage in der Prädikatenlogik P x. Prädikate können sich dabei entweder auf ein festgelegtes Objekt oder einen Platzhalter, eine Variable, beziehen. Für Zweiteres verwendet man oft x, y, z oder v k mit einer natürlichen Zahl k, für Ersteres meistens einen anderen Kleinbuchstaben. Setzt man beispielsweise Sx als ’x ist sterblich’ und s für Sokrates, so steht Ss für ’Sokrates ist sterblich’. Prädikate können aber auch mehrstellig auftreten, so dass sich Sätze wie ’Sokrates war Platons Lehrer’ und ’Platon schrieb einen Dialog zwischen Georgias und Sokrates nieder’ in der Form Lsp beziehungsweise D psg schreiben lassen. Neben den Prädikaten werden in der Prädikatenlogik noch zwei Sorten von logischen Operatoren verwendet. Erstens werden logische Verknüpfungen, wie ’und’, ’oder’ und ’folgt aus’ verwendet, die jeweils ein eigenes Symbol haben. Für die eben genannten Verknüpfungen wären das , und . Zweitens gibt es die so genannten Quantoren ’ ’ und ’ ’, die für ’es existiert etwas, dass’ und ’für alle gilt’ stehen. So lässt sich der Satz ’alle Menschen sind sterblich’ schreiben als x(Sx), wobei vorher festgelegt werden muss, dass x nur für Menschen stehen kann. Im folgenden soll die Prädikatenlogik in einer für die Mathematik besonders geeigneten Form mathematisch streng definiert werden. D @ ^_ Ñ @ 1.1 Syntax Als erstes soll die Syntax der Prädikatenlogik geklärt werden. Was macht also eine „wohl geformte“ (Enderton, 2001) prädikatenlogische Aussage aus? Das zu klären ist das Ziel dieses Abschnitts. Zuerst werden dazu die Symbole definiert, die überhaupt verwendet werden dürfen. Definition 1.1. Eine Sprache der Prädikatenlogik erster Stufe mit Gleichheit, oder im Weiteren kurz eine Sprache der ersten Stufe, besteht aus den logischen Symbolen ’ ’, ’ ’, ’=’ und ’ ’, Variablen ’v 1 ’,’v 2 ’, ’v 3 ’,. . . und einer abzählbaren1 Menge von nichtlogischen Symbolen ’P 1n ’, ’P 2n ’, ’P 3n ’,. . . für n-stellige Prädikate mit n N {0}und ’ f 1n ’, ’ f 2n ’, ’ f 3n ’,. . . für n-stellige Funktionen D 1 ^ P z Abzählbar soll in dieser Arbeit immer endlich oder abzählbar unendlich bedeuten. 5 Kapitel 1 Prädikatenlogik 1. Stufe P n N, wobei nullstellige Funktionen auch Konstanten heißen.2 Es ist erwähnenswert, dass nicht alle von den üblichen logischen Symbolen definiert wurden. Das hat rein technische Gründe, da so einige Beweise deutlich kürzer werden. Um zu zeigen, dass dadurch nichts an Aussagekraft verloren geht, kann man die anderen Symbole als Abkürzungen für längere Ausdrücke definieren. Dazu muss aber erst geklärt werden, wie ein Ausdruck in dieser Sprache auszusehen hat und wann er als korrekt formuliert anzusehen ist. Bisher hat diese Sprache genau genommen nur ein Alphabet, nun kommen die Hauptwörter dazu. Definition 1.2. Ein Ausdruck (einer Sprache) ist eine beliebige Aneinanderreihung von Symbolen (dieser Sprache). Ein Teilstück eines Ausdrucks ist eine Zeichenkette, die in dem Ausdruck in dieser Reihenfolge vorkommt. Ein echtes Teilstück ist ein Teilstück, das nicht der ganze Ausdruck ist. Ein Term ist ein Ausdruck, der entweder nur aus einer Konstanten oder Variablen besteht oder von der Form f kn t 1 t 2 . . . t n ist, wobei f eine n-stellige Funktion ist und t 1 , t 2 , . . . t n Terme. Die Menge aller Ausdrücke ist nicht weiter interessant, da sie auch völlig sinnlose Aneinanderreihungen von Symbolen umfasst, aber mit den Termen ist hier schon die erste interessante Teilmenge der Ausdrücke definiert. In gewisser Weise kann man die Regeln zur Erstellung von Termen als Grammatik der Prädikatenlogik verstehen, die noch um zwei wichtige Formen erweitert werden wird. Im folgenden wird ein Beispiel für eine wichtige Sprache erster Ordnung gegeben, die im weiteren Verlauf der Arbeit eine zentrale Rolle spielen wird. Beispiel 1.1. Die „Sprache der Arithmetik“ (Boolos u. a., 2002, S. 118) ist die Sprache der ersten Stufe mit den nichtlogischen Symbolen ’<’ als zweistelligem Prädikat, ’0’ und ’1’ als nullstelligen Funktionen und ’+’, ’ ’ als zweistelligen Funktionen. Etwas ungewöhnlich ist, dass nach dieser Definition v 1 + v 2 kein Term ist, sondern die richtige Schreibweise +v 1 v 2 lautet. Diese Notation nennt man polnische Notation3 . Da diese Schreibweise schnell etwas unübersichtlich werden kann, wird im weiteren bei Bedarf mit Klammern und Kommata gearbeitet, also +( (a, a), (b, b)) statt + aa bb geschrieben. Dies dient aber nur der Lesbarkeit, Klammern und Kommata sind keine Symbole der Sprache. Ist diese Definition eines Terms sinnvoll? Das Problem, das ausgeschlossen werden muss, wenn die Definition für die mathematische Logik brauchbar sein soll, ist die Mehrdeutigkeit eines Terms. Kann ein Term nur auf eine Weise konstruiert worden sein? Kann also, grob gesagt, + aa bb nur (a a) + (b b) bedeuten und nicht beispielsweise auch a (a + b b)? Damit beschäftigt sich der nächste Satz. 2 Wenn nicht anders angegeben sind alle Definitionen in diesem und dem folgenden Abschnitt, mit gewissen Freiheiten, aus Enderton (2001) übernommen. Die deutschen Übersetzungen der Fachbegriffe sind, wo sie keine Eigenleistung des Autors sind, aus dem Skript zur Vorlesung ’Grundbegriffe der mathematischen Logik’ übernommen, die von Herrn Adler im Sommersemester 2012 in Wien gehalten wurde (Adler, 2012). 3 Sie geht zurück auf Jan Łukasiewicz und ist die wichtigste klammernfreie Notation in der Logik (Church, 1956, S. 38). 6 Kapitel 1 Prädikatenlogik 1. Stufe Satz 1.1. Ein Teilstück eines Terms t = f kn t 1 , t 2 , . . . t n , das selbst ein Term ist, ist entweder gleich t oder es ist ein Teilstück eins der Terme t 1 , t 2 , . . . t n . Diese Formulierung der Eindeutigkeit ist an die Formulierung aus Boolos u. a. (2002, S. 111) angelehnt, der nachfolgende Beweis aber wieder etwas freier an (Enderton, 2001, S. 105). Der Satz in dieser Formulierung schließt recht anschaulich die eben beschriebene Doppeldeutigkeit aus. Ohne Klammern in der klassischen Schreibweise geschrieben, hat der Term t 1 + t 2 mit t 1 = a a und t 2 = b b das Teilstück a + b b, das weder der ganze Term ist, noch ein Teilstück von t 1 oder t 2 . Zu zeigen ist also, dass die Formulierung + aa bb hier eindeutiger ist. Zuerst ein hilfreiches Lemma. Lemma 1.2. Kein echtes Anfangsstück eines Terms ist selbst ein Term und jedes Endstück eines Terms besteht aus einem oder mehreren Termen. Beweis. Die zweite Aussage ist klar für Terme, die nur aus Konstanten und Variablen bestehen. Für Terme der Form f kn t 1 t 2 . . . t n ist ein Endstück entweder der ganze Term, oder von der Form t k1 t k+1 . . . t n , wobei t k1 ein Endstück von t k ist. Induktiv folgt also, dass jedes Endstück eines Terms aus einem oder mehreren Termen besteht. Um die erste Aussage zu zeigen, definiert man die Abbildung K(s) von der Menge S der Symbole nach N wie folgt: K (v k ) = 1 K ( f kn ) = 1 n K (s 1 s 2 . . . s i ) = K (s 1 ) + K (s 2 ) + für eine Variable v k , für eine n-stellige Funktion f kn , K (si ) für Symbole s 1 , s 2 , . . . s i . Für Terme t , die nur aus einer Variablen oder einer Konstanten bestehen gilt offensichtlich K (t ) = 1. (Zur Erinnerung, Konstanten sind Funktionen mit n = 0). Ist andererseits für Terme t 1 , t 2 , . . . t n für alle i {1, 2, . . . n} stets K (t i ) = 1 , so folgt daraus, dass für den Term f kn t 1 t 2 . . . t n mit einer beliebigen n-stelligen Funktion f kn auch K ( f kn t 1 t 2 . . . t n ) = K ( f kn )+n 1 = 1 n+n = 1 ist. Induktiv folgt also, dass für alle Terme t gilt, dass K (t ) = 1 ist. Sei nun t 11 das Anfangsstück eines Terms, dann gibt es ein t 21 , so dass t 11 t 21 ein Term ist. Also ist t 21 das Endstück eines Terms, also einer oder mehrere Terme. Da für jeden Term t wie gerade gezeigt K (t ) = 1 ist, folgt daraus, dass K (t 21 ) > 1 ist. Da K (t 11 t 21 ) = K (t 11 ) + K (t 21 ) = 1 ist, gilt K (t 11 ) = 1 K (t 21 ) < 1, was nach (i) bedeutet, dass t 11 kein Term ist. P Damit kann nun Satz 1.1 bewiesen werden. Beweis. Für Teilstücke, die nur aus einer Konstanten oder einer Variablen bestehen, ist die Aussage klar. Sei t nun ein Term, der weder eine Variable noch eine Konstante ist. Angenommen t ist ein echtes Teilstück von f kn t 1 t 2 . . . t n , aber kein Teilstück eines der Terme t 1 , t 2 , . . . t n . Nach Lemma 1.2 kann t kein Anfangsstück von f kn t 1 t 2 . . . t n sein. Es gibt also einen Term t k , in dem das erste Symbol von t liegt. Dann kann das letzte Symbol von t nicht in t k liegen, weil sonst t ein Teilstück von t k wäre. Ein echtes Anfangsstück t 1 von t ist also ein Endstück von t k . Nach Lemma 1.2 ist dann aber ein Anfangsstück von t 1 ein Term; nach 7 Kapitel 1 Prädikatenlogik 1. Stufe Lemma 1.2 ist aber eben kein Anfangsstück eines Terms selbst ein Term. Es kann also keinen Term mit den angenommenen Eigenschaften geben. Nun sollen ganze ’Sätze’ formuliert werden. Da Sätze später noch in Anlehnung an die mathematischen Sätze definiert werden sollen, wird hier von Formeln gesprochen. Zuerst müssen die kleinsten möglichen Bestandteile einer Formel eingeführt werden, sozusagen die ’Atome’ der Sprache. Definition 1.3. Eine atomare Formel ist ein Ausdruck von der Form P kn t 1 t 2 . . . t n für ein n-stelliges Prädikat P kn oder = t 1 t 2 , wobei t 1 , t 2 , . . . t n Terme sind. Aus diesen ’Atomen’ lassen sich nun längere Formeln konstruieren. Dabei ist zu beachten, dass die Symbole im Moment noch überhaupt keine Bedeutung haben. Es geht rein um die Syntax, also um die Frage, in welcher Reihenfolge Symbole stehen müssen, damit sie formal einen Satz bilden. Die Bedeutung des Satzes ist eine Frage der später noch zu behandelnden Semantik. Das Symbol hat hier also noch nichts mit dem Wort ’und’ zu tun. ^ Definition 1.4. Eine Formel ist ein Ausdruck, der entweder eine atomare Formel ist, oder von einer der folgenden Formen: A für eine Formel A, ^ AB Dv k A für Formeln A und B, für eine Formel A. Im Unterschied zu Enderton (2001) werden hier auch die Formeln in polnischer Notation definiert. Auf diese Weise können einige Beweise einfacher und kürzer geführt werden. Da diese Schreibweise in Einführungen aber kaum verwendet wird4 , wird im Weiteren für Beispiele und Bemerkungen die klassische Notation verwendet, das heißt A B statt AB und (A = B ), statt = AB . Das bedeutet, dass der Leser zwischen den Sätzen, Definitionen und Beweisen und den Beispielen umdenken muss. Da aber erstere kaum längere Formeln enthalten werden, sollte das kein Problem darstellen. Wo doch einmal längere Formeln in Beweisen Auftauchen, werden diese in Fußnoten ’übersetzt’ oder erklärt. Die polnische Notation für Terme wird, unter den oben benannten Vereinfachungen der Lesbarkeit, beibehalten, da sie, unter Verwendung von Klammern, die für Funktionen übliche Notation ist. In den Fällen ’+’ und ’ ’ betont sie so deren Definition als Funktionen. Um dieses Vorgehen aber zu rechtfertigen, muss erst noch die Eindeutigkeit der polnischen Notation für Formeln bewiesen werden. Dass die klassische Schreibweise bei richtiger Verwendung von Klammern ebenfalls eindeutig ist, lässt sich beispielsweise in Enderton (2001, S. 107ff) nachlesen. Allerdings hat sich durchgesetzt, im Einzelfall auf unnötige Klammern zu verzichten, weshalb kaum ein Autor tatsächlich eine Sprache verwendet, deren Eindeutigkeit er formal streng bewiesen hat5 . Der Beweis der Eindeutigkeit für Formeln ist im Wesentlichen eine Übertragung des Beweises der Eindeutigkeit für Terme auf Formeln. ^ 4 5 Kein bedeutendes Einführungsbuch benutzt sie konsequent. vgl Enderton (2001, S. 68f ), Boolos u. a. (2002, S. 107f) oder Rautenberger (2008, S. 5). 8 ^ Kapitel 1 Prädikatenlogik 1. Stufe Satz 1.3. Für jede Formel A gilt: (a) Ist A eine atomare Formel, so hat sie keine echten Teilformeln. (b) Ist A eine Formel der Form B , so sind alle echten Teilformeln von A Teilformeln von B . D Ist A eine Formel der Form ^BC , so sind alle echten Teilformeln von A Teilformeln von B (c) Ist A eine Formel der Form v k B , so sind alle echten Teilformeln von A Teilformeln von B . (d) oder C . Beweis. Zuerst wird die Funktion K aus dem Beweis zu Lemma 1.1 auf alle Symbole wie folgt erweitert: K (P kn ) = 1 n für ein Prädikat P kn , 1, K (^) = 1, K (=) = K ( ) = 0, D 1. K( )= (i) Für jede Formel A gilt K (A) = 1. Aus Lemma 1.2 weiß man, dass für jeden Term t gilt, K (t ) = 1. Wenn A eine atomare Formel ist, gilt also K (A) = K (P kn ) + n 1 = 1 n + n = 1 oder K (A) = K (=) + 2 1 = 1. Sei die Aussage nun für die Formeln B und C gezeigt, dann gilt, falls A von der Form B ist, K (A) = K ( B ) = 0 + 1 = 1. Falls A von der Form BC ist, gilt K (A) = K ( BC ) = 1 + 2 = 1. Falls A schließlich von der Form v k B ist, gilt K (A) = K ( v k B ) = 1 + 2 = 1. Die Aussage (i) ist also induktiv gezeigt. D ^ D ^ (ii) Ein Endstück einer Formel ist entweder ein Term oder eine Formel oder mehrere Formeln und Terme. Ein echtes Endstück einer Formel hat ein der folgenden Formen: es kann die Form t k1 t k+1 . . . t n mit einem Endstück eines Terms t k1 und Termen t k+1 , t k+2 , . . . t n für eine atomare Formel haben, dann folgt die Aussage aus dem Lemma 1.2. Hat es die Form A 1 , oder A 1 B , wobei A 1 das Endstück einer Formel ist und B eine Formel, dann folgt die Aussage induktiv. Hat es schließlich die Form v k A mit einer Variablen v k und einer Formel A, dann ist nichts zu zeigen, da v k ein Term ist. (iii) Damit folgt nun analog zum Beweis des Lemmas 1.2, dass kein echtes Anfangsstück einer Formel selber eine Formel ist. (iv) Daraus folgen die Aussagen (a) und (b) direkt, da alle Teilstücke von A, die keine Anfangsstücke von A sind, im Fall (a) keine Formeln sein können, da sie nur Funktionen und Variable enthalten und im Fall (b) Teilstücke von B sind. Aussage (c) folgt analog, wenn man zusätzlich in Betracht zieht, dass keine Formel mit einer Variablen beginnt. 9 Kapitel 1 Prädikatenlogik 1. Stufe (v) Für Aussage (d) schließlich muss man noch zeigen, dass BC keine Teilformeln hat, die keine Teilformeln von B oder C sind. Angenommen es gäbe eine solche Formel D, dann müsste ihr erstes Symbol in B liegen, sie dürfte aber nicht in B enden. Das heißt aber, ein echtes Anfangsstück von D ist ein Endstück von B , das nicht mit einem Term beginnt. Also hat D nach (ii) ein Anfangsstück, das eine Formel ist. Ein Widerspruch zu (iii). Nun können auch die anderen logischen Symbole als Abkürzungen für längere Formeln eingeführt werden6 . Symbol (A B ) (A B ) (A B ) ( v k )A @ _ Ñ Ø Abkürzung für (( A) ( B )) (A ( B )) ((A B ) (B A)) ( vk ) A ^ ^ Ñ ^ Ñ D Wie sehen Formeln in der Sprache der Arithmetik aus Beispiel 1.1 aus? Dazu zwei Beispiele, die noch öfters Erwähnung finden werden: Beispiel 1.2. (i) Eine atomare Formel der Arithmetik ist (+( (v 1 , v 1 ), (v 2 , v 2 )) = (v 3 , v 3 )). (ii) Möchte man ausdrücken, dass es Werte für v 1 , v 2 und v 3 gibt, so dass diese Formel gilt, erhält man die folgende nicht atomare Formel: ( v 1 )( v 2 )( v 3 )(+( (v 1 , v 1 ), (v 2 , v 2 )) = (v 3 , v 3 )). D D D Noch wurde der Begriff der Wahrheit nicht definiert, trotzdem scheint es bei genauerer Betrachtung so, dass Aussage (ii) wahr oder falsch sein kann7 , die Aussage (i) aber nicht. Aber wo liegt der Unterschied? Das ’Problem’ bei (i) ist, dass man nicht weiß, was man mit den Variablen tun soll. Offensichtlich können Variablen auf unterschiedliche Weise in Formeln auftauchen. Das motiviert die nächste Definition. Definition 1.5. Die Menge der freien Variablen einer Formel A ist: (i) Die Menge aller Variablen in A, wenn A eine atomare Formel ist. (ii) Die Menge aller freien Variablen von B , wenn A von der Form 6 B ist. Die Möglichkeit, alle logischen Symbole aus nur wenigen abzuleiten, oder sogar nur aus einem, das dann Sheffer Funktion heißt, ist ein eigenes Forschungsfeld der Logik. Einen Einstieg in das Thema bietet Goodstein (1971). 7 Es handelt sich bei natürlichen Zahlen, die diese Aussage erfüllen, um sogenannte Pythagoräische Tripel, von den eine ganze Reihe bekannt ist. Die Aussage ist also für die natürlichen Zahlen wahr (Stillwell, 2003, S. 109f). 10 Kapitel 1 Prädikatenlogik 1. Stufe (iii) Die Vereinigung der Mengen der freien Variablen von B und C , wenn A von der Form BC ist. ^ D (iv) Die Menge aller freien Variablen von B ohne v k , wenn A von der Form v k B ist.8 Die Formeln ohne freie Variablen spielen eine besonders wichtige Rolle, sie sind die ’Sätze’ im mathematischen Sinne. Definition 1.6. Eine Formel deren Menge an freien Variablen die leere Menge ist, heißt Satz. Im Beispiel 1.2 ist die Formel aus (ii) ein Satz, die Formel aus (i) nicht. Da sie eine atomare Formel ist, sind sogar alle Variablen frei, die in ihr vorkommen. Was bedeutet es aber, dass ein Satz wahr ist? Können Formeln mit freien Variablen nicht wahr oder falsch sein? Hängt die Frage nach der Wahrheit nicht auch von den Zahlen ab, für die die Variablen stehen können? So ist Aussage (ii) für die natürlichen Zahlen wahr, aber sie wird falsch, wenn die Variablen nur Werte zwischen 1 und 4 annehmen dürfen. Mit diesen Fragen beschäftigt sich die Semantik, um die es im nächsten Abschnitt gehen soll. 1.2 Semantik Bisher wurden nur Symbole behandelt. Die Frage ist, welche Bedeutung die Symbole haben. Noch dazu sind diese Bedeutungen bei den nicht-logischen Symbolen nicht fest. In der Sprache der Arithmetik, wie sie in Beispiel 1.1 definiert wurde, kann man auch über ganze, rationale oder reele Zahlen reden und das beeinflusst durchaus den Wahrheitsgehalt eines Satzes. So ist der Satz ( v 1 )( (v 1 , v 1 ) = +(1, 1)) für reele Zahlen wahr, für natürliche Zahlen aber nicht. Tatsächlich ist es auch möglich, in der Sprache der Arithmetik über Ringe und Körper zu sprechen, wodurch sich die Bedeutung der Funktionen und Prädikate stark verändern kann, so dass der Satz +(1, 1) = 0 wahr wird. Um diese Art von Bedeutung zu erfassen, gibt es die Strukturen, die wie folgt definiert sind: D Definition 1.7. Eine Struktur (einer Sprache) A besteht aus einer nicht-leeren Menge |A|, dem Universum von A, die alle möglichen Werte enthält, die die Variablen annehmen können, einer Menge |P Kn | von |A|-n-Tupeln für jedes n-stellige Prädikat P kn und einer durch eine Menge | f kn | von |A|-n+1-Tupeln dargestellte Funktion fnk für jede n-stellige Funktion f kn . Das bedeutet, dass jeder Konstanten c genau ein Element c A von |A| zugeordnet wird. Eine Struktur, für die man alle Mengen tatsächlich angeben kann, ist beispielsweise eine Struktur zur Sprache der Arithmetik, die nur die Zahlen 0 und 1 enthält. Dann gilt |A| = {0, 1}, |+| = {(0, 0, 1), (1, 0, 1), (0, 1, 1), (1, 1, 0)}, | | = {(0, 0, 0), (1, 0, 0), (0, 1, 0), (1, 1, 1)} und | < | = {(0, 1)}. Unter dieser Struktur ’bedeuten’ die Symbole der Sprache der Arithmetik das, was sie in der Algebra im Körper F 2 bedeuten. Möchte man eine Struktur konstruieren, in der die Symbole genau das bedeuten, was sie im Bezug auf die natürlichen Zahlen bedeuten, kann man die 8 Definitionen dieser Art werden in dieser Arbeit immer wieder vorkommen. Man nennt sie rekursiv (Enderton, 2001, S. 84). Dass diese Art der Definition zulässig ist, ist eine Folge der Eindeutigkeit der Notation für Formeln und Terme. 11 Kapitel 1 Prädikatenlogik 1. Stufe Mengen nicht mehr explizit angeben, da sie unendlich sind. Man muss mit Definitionen arbeiten, wie | < | = {(i , j )|i < j }. Dabei setzt man die Kenntnis der Relation <9 auf den natürlichen Zahlen voraus. Man kann in der Logik die Mathematik also nicht definieren, ohne eine zumindest eine simple Form der Arithmetik als gegeben vorauszusetzen.10 Die Prädikatenlogik ist eben, wie in der Einleitung schon beschrieben, eine Sprache und keine mathematische Theorie an sich.11 Beispiel 1.3. Die Struktur N besteht aus dem Universum |N| = N und den Mengen | + | = {(i , j , s)|i + j = s}, | | = {(i , j , p)|i j = p} und | < | = {(i , j )|i < j }, sowie |0| = {0}, |1| = {1}, wobei hier formal zwischen den Symbolen 0, 1 der Sprache und den Elementen des Universums, also den natürlichen Zahlen, 0 und 1 zu unterscheiden wäre 12 . Als nächstes soll es um die Bedeutung der Variablen gehen. Die Idee, die dazu formalisiert werden soll, ist die folgende: Über eine Formel wie v 1 = 1 kann man sagen, diese Aussage ist wahr, wenn v 1 für 1A steht, sonst nicht. Die Wahrheit einer Aussage mit Variablen hängt also davon ab, wofür die Variablen stehen. Um dem gerecht zu werden, werden die so genannten Belegungen definiert. Definition 1.8. Eine Funktion s von der Menge der Variablen nach |A| heißt Belegung der Variablen. Eine Belegung weist jeder Variablen ein Element des Universums zu. Diese Definition wird nun auf natürliche Weise auf Terme erweitert. Definition 1.9. Die Funktion s ist die Erweiterung einer Belegung s zu einer Funktion, die die Menge aller Terme auf |A| abbildet und wie folgt definiert ist: s(v k ) = s(v k ) für eine Variable v k , s(c) = c A für eine Konstante c, s( f kn t 1 t 2 . . . t n ) = fnk (s(t 1 ), s(t 2 ), . . . s(t n )) für einen Term f kn t 1 t 2 . . . t n . Nachdem ’v 1 steht für 1A ’ nun formal definiert ist, kann der interessantere Teil der obigen Aussage ’ist wahr, wenn’ formalisiert werden, zuerst für atomare Formeln: 9 Man könnte für das Symbol < der formalen Sprache und die Relation < auf den natürlichen Zahlen unterschiedliche Symbole verwenden, um sie zu deutlicher zu unterscheiden. Der Lesbarkeit der Formel hilft das allerdings eher nicht und da in dieser Arbeit polnische Notation verwendet wird, lassen sich die beiden Zeichen wenigstens anhand ihrer Stellung im Term unterscheiden. 10 Alternativ kann man auch die Mengenlehre als zugrunde liegend betrachten. 11 Was nicht bedeuten soll, dass die Sprache, in der jemand etwas formuliert, keinen Einfluss auf dessen Aussage hat. So ist die Frage, ob Existenz ein Prädikat sein sollte oder ein Quantor, in der Scholastik schwer umstritten gewesen und ist entscheidend für die Gültigkeit des berühmten ontologischen Gottesbeweises (Kant, 1900, S. 598). 12 Eine ähnliche Formulierung findet sich in Enderton (2001, S. 81). 12 Kapitel 1 Prädikatenlogik 1. Stufe Definition 1.10. Eine atomare Formel heißt wahr unter einer Belegung s, wenn s(t i ) = s(t j ) (s(t 1 ), s(t 2 ), . . . s(t n )) P für eine atomare Formel von der Form = t i t j und |P kn | für eine atomare Formel der Form P kn t 1 t 2 . . . t n ist. Die Formel ’v 1 = 1’ ist also unter allen Belegungen s mit s(v 1 ) = 1A wahr. Die Erweiterung der Definitionen auf Formeln ohne das Symbol ist recht naheliegend. D Definition 1.11. Eine Formel A heißt wahr unter einer Belegung s, wenn für Formeln B und C gilt: A= A= B und B ist unter der Belegung s nicht wahr, oder ^BC und B und C sind wahr unter s. Wie passt diese Definition zu Beispiel 1.2? Für Teil (i) des Beispiels, in dem alle Variablen frei vorkommen, scheint die Definition von Wahrheit unter einer Belegung eine gute Lösung, aber für Sätze wie Teil (ii) erwartet man eigentlich, dass ihr Wahrheitsgehalt nicht von einer Belegung abhängt. Deshalb sollte die Wahrheit von Formeln mit dem Symbol so definiert werden, dass die gebundene Variable nicht mehr von der Belegung abhängt. Das motiviert die folgende Definition: D Definition 1.12. Die Belegung s[v k |d ], mit einer Variablen v k und einem d hängigkeit von einer Belegung s wie folgt definiert ( s(v l ) falls k l s[v k |d ](v l ) = d falls k = l P |A| ist in Ab- D Eine Formel von der Form v k A, wobei A eine Formel ist, heißt wahr unter einer Belegung s, wenn es ein d gibt, so dass A unter der Belegung s[v k |d ] wahr ist. Dass die Wahrheit einer Formel tatsächlich nur von der Belegung ihren freien Variablen abhängt und Sätze somit unabhängig von der Belegung wahr oder falsch sind, zeigt der nächste Satz. Satz 1.4. Seien s 1 und s 2 Belegungen, die auf den freien Variablen der Formel A übereinstimmen, dann ist A genau dann unter s 1 wahr, wenn es unter s 2 wahr ist.13 Beweis. (i) Für einen Term t gilt, s 1 (t ) = s 2 (t ), wenn s 1 und s 2 in allen Variablen, die in t vorkommen, übereinstimmen. Wenn t eine Variable oder eine Konstante ist, ist die Aussage klar. Für einen Term von der Form f kn t 1 t 2 . . . t n nimmt man induktiv an, dass die Aussage für die Terme t 1 , t 2 , . . . t n gezeigt ist, dann gilt s 1 (t ) = fnk (s 1 (t 1 ), s 1 (t 2 ), . . . s 1 (t n )) = fnk (s 2 (t 1 ), s 2 (t 2 ), . . . s 2 (t n )) = s 2 (t ). 13 Der Satz und der Beweis sind aus Enderton (2001, S. 86), wobei der Beweis hier etwas detaillierter geführt wird. 13 Kapitel 1 Prädikatenlogik 1. Stufe (ii) Angenommen A ist eine atomare Formel. Für atomare Formeln sind alle Variablen freie Variable, also stimmen s 1 und s 2 auf allen Variablen in Termen von A überein, also nach (i) auch s 1 und s 2 auf allen Termen, also ist A unter s 1 genau dann wahr, wenn es auch unter s 2 wahr ist. (iii) Sei die Aussage nun für die Formel B beziehungsweise die Formeln B und C bewiesen, dann ist für A = B und A = BC nichts zu zeigen, da die Menge der freien Variablen sowie die Wahrheit von A nur von B , beziehungsweise nur von B und C abhängt. ^ D (iv) Sei die Aussage nun für B bewiesen und sei A = v k B . Die Funktionen s 1 [v k |d ] und s 2 [v k |d ] stimmen dann nach Voraussetzung auf der Menge der freien Variablen von B ohne v k überein. Da aber s 1 [v k |d ](v k ) = d = s 2 [v k |d ](v k ) ist, stimmen sie auf allen freien Variablen von B überein. Nach Induktionsvoraussetzung ist dann also die Formel B für ein d unter s 1 [v k |d ] wahr, wenn sie auch unter s 2 [v k |d ] wahr ist. Also ist A genau dann unter s 1 wahr, wenn es unter s 2 wahr ist. Im folgenden ein paar Sprachregelungen im Umgang mit der Wahrheit von Sätzen. Definition 1.13. Satz 1.4 bedeutet insbesondere, dass ein Satz, der unter einer Belegung wahr ist, unter allen Belegungen wahr ist. Entsprechend lässt man bei Sätzen den Zusatz ’unter der Belegung s’ weg und sagt einfach, ein Satz A ist wahr, wenn er unter einer Belegung wahr ist. Wovon die Wahrheit eines Satzes aber durchaus abhängt, ist die Struktur, unter der man ihn betrachtet. Eine Struktur für die ein Satz wahr ist, nennt man ein Modell eines Satzes und man schreibt | A A. Ein Satz A heißt erfüllbar, wenn er ein Modell hat und allgemeingültig, wenn jede Struktur ein Modell für den Satz ist. Dann schreibt man auch | A. Eine Struktur M heißt schließlich ein Modell einer Satzmenge Γ, wenn es ein Modell jeder Formel aus Γ ist. ù ù Als Letztes soll die Vorstellung formalisiert werden, dass ein Satz in Abhängigkeit von anderen Sätzen wahr ist. Also dass, zum Beispiel, A wahr ist, wenn A wahr ist, oder B wahr ist, wenn A und A B wahr sind. Ñ Definition 1.14. Eine Formel A wird von einer Menge Γ von Formeln impliziert, wenn es keine Struktur A und keine Belegung s gibt, so dass in der Struktur A alle Formeln in Γ unter s wahr sind, aber A nicht unter s wahr. Man schreibt dann Γ | A. ù Diese Art, Wahrheit zu definieren mag einleuchtend sein und in Beispielen die Ergebnisse liefern, die man erwartet. Sie hat jedoch einen großen Nachteil. Es ist für nicht endliche Strukturen nur in Ausnahmefällen möglich zu beurteilen, ob ein Satz wahr ist(Goodstein, 1971, S. 37f). Außerdem beschreibt sie kaum die Methode, mit der ein Mathematiker versuchen wird, den Wahrheitsgehalt einer Aussage zu bestimmen. Viel mehr scheint es in der Mathematik um Beweise zu gehen. Aber was ist ein Beweis? Darum soll es im nächsten Abschnitt gehen. 14 Kapitel 1 Prädikatenlogik 1. Stufe 1.3 Beweisbarkeit „A proof is an argument that you give to someone else and that completely convinces that person of the correctness of your assertion“ (Enderton, 2001, S. 109)14 Wie lässt sich ein solches Argument formalisieren? Der Versuch, das logische Schließen zu formalisieren, ist sehr viel älter als die Prädikatenlogik. Den ersten bekannten Versuch unternahm schon Aristoteles mit seiner Syllogistik (Scholz, 1959, S. 3), die lange Zeit fast ein Synonym für die Logik überhaupt war15 , aber heute kaum noch eine Rolle spielt. Die heute gängige Methode zur Formalisierung des logischen Schließens besteht darin, auf der rein syntaktischen Ebene der logischen Formeln ein formales Kalkül zu definieren, mit dem Formeln aus Formeln abgeleitet werden können. Dazu werden traditionell einige Formeln als Axiome gesetzt und dann Schlussregeln definiert, mit denen man aus diesen Axiomen weitere Formeln schließen kann. Die ersten Kalküle, die große Bekanntheit erlangten, waren das System der Principa Mathematica, das aus fünf Axiomen und einer Schlussregel besteht (Russell und Whitehead, 1910, S. 95ff) und das noch frühere System von Frege, das aus sieben Axiomen und drei Schlussformen besteht(Frege, 1893, S. 61). Wie Gerhard Gentzen aber bereits 1935 bemerkte: „Die Formalisierung des logischen Schließens, wie sie insbesondere durch Frege, Russell und Hilbert entwickelt werden ist, entfernt sich ziemlich weit von der Art des Schließens, wie sie in Wirklichkeit bei mathematischen Beweisen geübt wird.“ (Gentzen, 1935, S. 176). Dem gegenüber entwarf er in dem eben zitierten Artikel sein „Kalkül des natürlichen Schließens“ (Gentzen, 1935, S. 176), das mathematische Beweise, wie sie in ’Wirklichkeit’ geübt werden, besser formalisiert. Eine der großen Besonderheiten dieses Kalküls ist die Tatsache, dass es keine Axiome enthält, sondern nur Schlussregeln. Eine Besonderheit, die daher rührt, dass man im Alltag selten mit logischen Axiomen argumentiert und das Mathematikstudium auch nicht mit einer Festlegung logischer Axiome16 beginnt. Oder um es mit Gentzens Worten auszudrücken, „das natürliche Schließen geht jedoch im allgemeinen nicht von logischen Grundsätzen aus“ (Gentzen, 1935, S. 184). Die in dieser Arbeit präsentierte Form des Kalküls des natürlichen Schließens ist eine leicht abgewandelte Form des Kalküls, wie es in Rautenberger (2008) präsentiert wird. Im Kern handelt es sich aber um das selbe System, wie das von Gentzen 1935 vorgestellte. Um es formulieren zu können, muss noch eine syntaktische Operation eingeführt werden. Definition 1.15. Als Substitution t vk A bezeichnet man die Operation, die jedes freie Vorkom- men der Variablen v k in einer Formel A durch den Term t ersetzt. Induktiv kann man 14 t vk wie Übersetzung des Autors: Ein Beweis ist ein Argument, das man einer anderen Person vorträgt und das diese Person vollständig von der Richtigkeit der eigenen Behauptung überzeugt. 15 So lehrte Kant in seinen Vorlesungen „Uebrigens hat die Logik von Aristoteles Zeit her an Inhalt nicht viel gewonnen, und das kann sie ihrer Natur nach auch nicht“ (Jänsche, 1869, S. 22) 16 Wohl gemerkt, hier ist nur von logischen Axiomen die Rede, also Axiome, die sich auf ganz allgemeine Aussagen beziehen. Mathematische Axiome mögen im Einzelfall durchaus im Mathematikstudium auch außerhalb einer Logikvorlesung vorkommen. 15 Kapitel 1 Prädikatenlogik 1. Stufe folgt definieren17 : Für Terme gilt mit t k1 := t tk : vk t v k := t , vk t c := c für eine Konstante c, vk Seien A und B Formeln, dann gilt: t (= t 1 t 2 ) := = t 11 t 21 , vk t t t AB := A B, vk vk vk t v k A := v k A, vk ^ ^ D D Analog definiert man die Substitution ten c durch den Term t ersetzt. t c t v j := v j für j k, vk t n f t 1 t 2 . . . t n := f kn t 11 t 21 . . . t n1 . vk k t n P t 1 t 2 . . . t n := P kn t 11 t 21 . . . t n1 , vk k t t A := A, vk vk t t v j A := v j A für j k. vk vk D D als die Operation, die jedes Vorkommen der Konstan- Nun können die Schlussregeln eingeführt werden. Diese sollten es erlauben, für eine Formelmenge Γ und eine Formel A zu beweisen, dass Γ | A gilt. Um auszudrücken, dass man dies bewiesen hat, sagt man A folgt aus Γ oder Γ beweist A und schreibt dafür Γ A. Eine Schlussregel besteht nun aus einer (möglicherweise leeren) Menge von Aussagen der Form Γ A, die Obersätze oder Prämissen genannt werden sowie einer Aussage dieser Form, die man Konklusion nennt. Sind alle Obersätze bewiesen, besagt die Schlussregel, dass damit auch die Konklusion bewiesen ist. Formal definiert man das Zeichen ’ ’ durch: ù $ $ $ $ Definition 1.16. Man sagt Γn beweist A n und schreibt Γn A n , wenn es eine endliche Folge von Tupeln (Γ1 , A 1 ), (Γ2 , A 2 ) . . . (Γn , A n ) gibt, so dass jedes Tupel (Γk , A k ) die Konklusion einer Schlussregel ist, deren Prämissen alle noch vor (Γk , A k ) in der Folge vorkommen. Obersätze Im folgenden werden Schlussregeln in der Form Konklusion notiert. Damit das Kalkül auch ’funktioniert’ und tatsächlich nur wahre Implikationen bewiesen werden können, muss man für jede Schlussweise sicher stellen, dass sie ’korrekt’ ist. Dazu muss ausgeschlossen werden, dass die Obersätze wahr sein können ohne dass die Konklusion wahr ist. P Schlussweise 1 (AR18 ). Sei Γ eine Menge von Formeln und A Γ, dann gilt H Γ$ A Also gilt insbesondere 17 H A$A Diese Definition und die weiteren Definitionen in diesem Abschnitt sind, wenn nicht anders angegeben, frei nach Rautenberger (2008) 18 AR steht für Anfangsregel. 16 Kapitel 1 Prädikatenlogik 1. Stufe (AR) ist korrekt, da für eine Struktur für das, unter einer Belegung s, alle Sätze aus Γ wahr sind, trivialerweise auch A unter s wahr ist, da A ein Satz aus Γ ist. Die Konklusion ist also immer richtig. Schlussweise 2 (MR19 ). Seien Γ und Γ1 Mengen von Formeln, so dass Γ beliebige Formel, dann gilt Γ A Γ1 A Γ1 ist und A eine $ $ Wenn für eine Struktur, unter einer Belegung s, alle Formeln von Γ1 wahr sind, sind insbesondere auch alle Formeln von Γ wahr. Das bedeutet aber, dass die Konklusion nicht falsch sein kann, ohne das der Obersatz auch falsch wird. (MR) ist also korrekt. Schlussweise 3 (=1). Für alle Terme t gilt für alle Mengen von Formeln Γ H Γ $= t t also insbesondere H H $= t t Da die Formel = t t nach Definition immer wahr ist und jede Formelmenge einen allgemeingültigen Satz impliziert, ist (=1) auch korrekt. Schlussweise 4 (=2). Sei Γ eine Menge von Formeln, A eine Formel, v k eine freie Variable von A und t und t 1 seien Terme, dann gilt {Γ $= t t 1, Γ $ vt Γ $ vt A k A} 1 k Angenommen die Konklusion ist falsch, dann existiert eine Struktur, so dass, mit einer 1 1 Belegung s, alle Formeln aus Γ wahr sind, aber vt A nicht. Damit aber vt A einen anderen Wahrheitswert als vt A hat, darf unter der Belegung s der Wert von t 1 nicht gleich dem Wert k von t sein. Dann ist aber der erste Obersatz falsch. Also ist (=2) korrekt. k ^ k Schlussweise 5 ( 1). Sei Γ eine Menge von Formeln, A und B Formeln, dann gilt {Γ ^ $ A, Γ $ B } Γ $ ^ AB Schlussweise 6 ( 2). Sei Γ eine Menge von Formeln, A und B Formeln, dann gilt Γ und 19 Γ $ ^ AB Γ$ A $ ^ AB Γ$B MR steht für Monotonieregel 17 Kapitel 1 Prädikatenlogik 1. Stufe ^ Da nach Definition AB genau dann wahr ist, wenn A und B wahr sind, sind hier in beiden Fällen Obersatz und Konklusion jeweils entweder beide richtig, oder beide falsch. ( 1) und ( 2) sind also korrekt. ^ ^ Schlussweise 7 ( 1). Für eine Formelmenge Γ und Formeln A und B gilt, {Γ $ B, Γ $ Γ$ A B} Da für jede Struktur und jede Belegung entweder B oder B wahr ist, aber nie beide, können für keine Struktur unter keiner Belegung alle Formeln von Γ wahr sein, damit die Obersätze beide richtig sein können. Dann impliziert Γ aber jeden Satz. Somit ist ( 1) korrekt. Schlussweise 8 ( 2). Für eine Formelmenge Γ und Formeln A und B gilt {Γ Y {B } $ A, Γ Y { Γ$ A B} $ A} Angenommen die Konklusion ist falsch, dann gibt es eine Struktur, so dass für eine Belegung s, alle Formeln aus Γ wahr sind, aber A nicht. Da aber nach Definition entweder B oder B wahr sind, sind dann auch entweder alle Sätze aus {Γ, B } oder aus {Γ, B } unter s wahr. Also muss einer der Obersätze falsch sein. Das bedeutet, dass ( 2) korrekt ist. D Schlussweise 9 ( 1). Sei Γ eine Menge von Formeln, A eine Formel, v k eine freie Variable von A und t ein Term, dann gilt Γ vt A $ Γ $ Dv k A k Falls der Obersatz richtig ist, muss für eine Struktur A, für die Γ unter einer Belegung wahr ist, auch ein Wert aus |A| existieren, so dass A unter s wahr ist, nämlich der Wert von t . Also muss für A auch v k A unter s wahr sein. ( 1) ist also korrekt. D D Schlussweise 10 (D2). Sei Γ eine Menge von Formeln, A eine Formel, v k eine freie Variable von A und v j eine Variable, die in A nicht vorkommt und in keiner der Formeln aus Γ frei vorkommt, dann gilt vj Γ v A $ Γ $ Dv k A k Bei dieser letzten Schlussregel ist die Korrektheit am wenigsten offensichtlich. Deshalb zuerst ein Beispiel in der Sprache der Arithmetik, um die ( 2) ein wenig anschaulicher zu machen. Als Γ wählt man dazu die Menge {( v 1 )( v 2 )((v 1 < v 2 ) ( v 3 )(+(v 1 , v 3 ) = v 2 )), 20 ( v 1 )( ( v 2 )((+(v 1 , v 2 ) = 0)) ( (v 2 = 0))} , die für die Variable v 77 die Formel (v 77 < 0) impliziert. Da man aber keine Eigenschaften der Variablen v 77 für diesen Schluss verwendet hat, kann man das Ergebnis verallgemeinern zu ( v 1 (v 1 < 0)). @ D ^ @ @ D ÑD D 20 Der erste Satz besagt, dass aus v 1 < v 2 folgt, dass ein v 3 existiert, so dass v 1 + v 3 = v 2 ist. Der zweite Satz besagt, dass keine zwei Zahlen ungleich null existieren, die addiert Null ergeben. 18 Kapitel 1 Prädikatenlogik 1. Stufe Natürlich muss die Korrektheit noch formal bewiesen werden. Angenommen also für eine Struktur ist der Obersatz richtig, dann muss es entweder keine Belegung geben, für die alle vj Sätze von Γ wahr sind, oder v A ist wahr für alle möglichen Werte von s(v j ), da der Wert k von s(v j ) keinen Einfluss auf die Wahrheit der Sätze in Γ hat. Die Konklusion kann dann aber nicht falsch sein, da entweder Γ für eine Struktur unter keiner Belegung wahr ist, oder für alle Elemente des Universums einer Struktur, die man für v k einsetzt, A falsch ist, also v k A für alle Belegungen wahr ist. Es kann also keine Struktur und keine Belegung geben, für die alle Formeln aus Γ wahr sind, aber v k A nicht. Also ist gezeigt, dass ( 2) korrekt ist. D D H Γ$ A D Γ Γ1 P für A Γ (AR) H Γ $= t t (=1) {Γ $ A für Γ Γ1 $A $= t t 1, Γ $ vt Γ $ vt A k 1 (MR) A} für v k frei in A (=2) k {Γ {Γ $ A, Γ $ B } (^1) Γ $ ^ AB $ B, Γ $ Γ$ A B} ( 1) $ vt A v k frei in A (D1) Γ $ Dv k A Γ k Γ {Γ $ ^ AB und Γ $ ^ AB (^2) Γ$ A Γ$B Y {B } $ A, Γ Y { Γ$ A B} $ A} ( 2) $ vv A v k , v j passend (D2) Γ $ Dv k A Γ j k Tabelle 1.1: Das Kalkül des natürlichen Schließens Das Kalkül des natürlichen Schließens ist damit komplett, in der Tabelle 1.1 sind noch einmal alle Schlussregeln auf einen Blick aufgeführt. Nebenbei wurde auch noch der Korrektheitssatz bewiesen, der wie folgt lautet: Satz 1.5 (Korrektheitssatz). Für eine Menge von Formeln Γ und eine Formel A gilt stets: Aus Γ A folgt Γ | A. $ ù Die wahrscheinlich bekannteste Schlussweise in der Geschichte der Logik, der Modus 19 Kapitel 1 Prädikatenlogik 1. Stufe Ponens21 , kommt in diesem Kalkül nicht vor22 . Er besagt: Ist B wahr und A folgt aus B , dann ist auch A wahr. Diese Schlussfolgerung ist so offensichtlich richtig, dass ein Kalkül, in dem sie nicht beweisbar ist, eindeutig nicht tauglich wäre, das logische Schließen zu formalisieren. In dem hier eingeführten Kalkül ist der Modus Ponens entsprechend beweisbar: Satz 1.6 (Modus Ponens). Für eine Formelmenge Γ und Formeln A und B gilt die Schlussregel (MP): {Γ B A 23 , Γ B } . Γ A $ ^ $ $ Beweis. Der folgende Beweis zeigt, wie man die Idee des klassischen Widerspruchsbeweises in dem formalen Kalkül umsetzen kann. Als Annahme, die zum Widerspruch geführt werden soll, setzt man die Aussagen Γ { A} B A und Γ { A} B . Nun geht es darum formal einen Widerspruch zu konstruieren. Mit (AR) kann man folgern, dass auch Γ { A} A gilt, aus ( 1) folgt dann Γ { A} B A. Damit hat man den gewünschten Widerspruch. Formal beendet man den Beweis jetzt, indem man mit ( 1) aus Γ { A} B A und Γ { A} B A schließt, dass auch Γ { A} A gilt. Da nach (AR) auch Γ {A} A gilt, kann man mit ( 2) folgern, dass Γ A gilt. Y $ ^ Y $ ^ Y $ ^ Y Y $ Y $^ $^ $ Y Y $ $ Ein weiterer wichtiger Satz, der mit dem Kalkül bewiesen werden kann, ist der folgende: Satz 1.7 (Endlichkeitssatz). Wenn für eine Formelmenge Γ und eine Formel A gilt Γ dann gibt es auch eine endliche Teilmenge Γ1 von Γ, so dass Γ1 A gilt. $ $ A, Beweis. Der Beweis soll mit einem Verfahren geführt werden, das man auch Regelinduktion nennt (Rautenberger, 2008, S. 73). Dabei nutzt man aus, dass Γ A genau dann gilt, wenn es sich mit einer endlichen Anzahl von Schlüssen beweisen lässt. Wenn man nun zeigt, dass sich eine Eigenschaft vom Obersatz an die Konklusion vererbt , muss sie auch für Γ A gelten. Man beginnt damit, die Aussage für (AR) und (=1) zu zeigen, die beide keiner Obersätze bedürfen. Hier muss man also zeigen, dass die Konklusion immer den Endlichkeitssatz erfüllt. Sei also Γ A mit (AR) bewiesen, da dann {A} Γ ist und A A gilt, ist der Endlichkeitsssatz erfüllt. Ist Γ A nun durch (=1) bewiesen worden, dann hat A die Form = t t für einen Term t . Aus (=1) folgt aber auch = t t und da trivialerweise Γ ist, ist auch hier der Endlichkeitssatz erfüllt. Das Vorgehen für die restlichen Schlussregeln sei nun nur am Beispiel von ( 1) gezeigt, da die anderen Schlussregeln analog verlaufen. Angenommen Γ A wurde mit ( 1) bewiesen, dann hat A die Form BC und die Aussagen Γ B und Γ C sind wahr. Nach Induktionsannahme gilt der Endlichkeitssatz für diese beiden Aussagen, das heißt, es gibt endliche $ $ $ $ $ H$ H ^ $ 21 $ $ ^ ^ Zum ersten mal findet sich eine Formalisierung dieser Schlussweise, die der modernen Form schon sehr nahe kommt bei den Stoikern, deren Logik am prominentesten von Chrysippus (circa 281- 208 vor Chr.) vertreten wird (Bocheński, 1956, S.38 und S. 123). 22 Der tiefere Grund dafür ist, dass in dieser Arbeit das Symbol ’Ñ’ nur als Abkürzung und nicht als eigenes Symbol eingeführt wurde. Für eine Sprache, in der ’Ñ’ ein eigenes Symbol ist, enthält das Kalkül des natürlichen Schließens traditionell den Modus Ponens als eigene Schlussweise (Gentzen, 1935). 23 Abgekürzt läse sich diese Formel B Ñ A. 20 Kapitel 1 Prädikatenlogik 1. Stufe Formelmengen Γ1 Γ und Γ2 Γ so dass Γ1 B und Γ2 C gelten. Nach (MR) gilt dann auch Γ1 Γ2 B und Γ1 Γ2 C und somit Γ1 Γ2 A nach ( 1). Da Γ1 Γ2 endlich und eine Teilmenge von Γ ist, gilt damit der Endlichkeitssatz auch für ( 1). Y $ Y $ $ Y $ $ ^ Y ^ Bis auf (=1) erlaubt es keine Regel, Formeln unabhängig von einer Menge Γ zu folgern. Insofern scheint das Kalkül sehr gut geeignet Implikationen zu beweisen, aber was ist mit wahren Sätzen? Kann man auch | A zeigen, wenn A eine andere Form als t = t hat? Diese Frage wird durch das nächste Beispiel positiv beantwortet. ù H$ ^ ^ $ (A A) gilt, wobei A eine beliebige Formel Beispiel 1.4. Es soll gezeigt werden, dass ist. Mit (AR) darf man ohne Voraussetzungen annehmen, dass (A A) (A A) gilt. Mit ( 2) folgt dann (A A) A und (A A) A. Daraus folgt mit ( 1), dass aus (A A) jede beliebige Formel folgt, also auch (A A) (A A). Da aber mit (AR) auch (A A) (A A) gilt, kann man mit ( 2) folgern, (A A). ^ ^ ^ ^ $ $ ^ ^ ^ $ ^ H$ $ ^ ^ Im nächsten Kapitel wird sogar gezeigt werden, dass jede allgemeingültige Formel in dem Kalkül beweisbar ist. In den meisten Fällen spielt aber die Implikation tatsächlich eine wichtigere Rolle in der mathematischen Logik. Denn die Mathematik lässt sich axiomatisch aufbauen, in dem man sie aus der axiomatischen Mengenlehre aufbaut (Kunen, 1980, S. 1f). Im Alltag werden sich die wenigsten Mathematiker für die Axiome der Mengenlehre interessieren, aber für die Frage nach den Möglichkeiten und Grenzen der Mathematik, reicht es aus, dass eine solche Axiomatisierung möglich ist. Man braucht aber noch einen präzisen Begriff davon, was da axiomatisiert wird und was diese Axiome sind. $ Definition 1.17. Als Theorie T bezeichnet man eine Menge von Sätzen, für die aus T A stets A T folgt. Als axiomatisierte Theorie T (∆) bezeichnet man die Menge, die genau die Sätze enthält, die man aus der Formelmenge ∆, den Axiomen, folgern kann. Eine Theorie T heißt axiomatisierbar, wenn es eine axiomatisierte Theorie T (∆) gibt, mit T = T (∆).24 P Dass eine axiomatisierte Theorie tatsächlich eine Theorie ist, folgt relativ direkt aus der folgenden wichtigen Eigenschaft des hier gegebenen Kalküls. Satz 1.8. Für Mengen von Formeln Γ und Σ und eine Formel B folgt aus Γ und Σ B , dass auch Γ B gilt. $ $ H $ A für alle A P Σ Beweis. Zuerst zeigt man, dass für Mengen von Formeln Γ und Σ für die mit einer 1 Formel B gilt, Γ Σ B und Γ A für alle A Σ auch Γ (Σ {A }) für ein beliebiges A 1 Σ gilt. Im folgenden sei Σ1 = Σ {A 1 }. Dann gilt mit (AR) Γ Σ1 { A 1 } A 1 , aber nach (MR) auch 1 1 1 1 Γ Σ { A } A , da ja Γ A nach Definition gilt. Also gilt nach ( 1) Γ Σ1 { A 1 } B , aber nach Konstruktion gilt auch Γ Σ1 {A 1 } B , also nach ( 2) Γ Σ1 B . Da aber nun Γ Σ1 B gezeigt ist und nach Konstruktion auch Γ A für alle A Σ1 gilt, lässt sich entweder die eben gezeigte Aussage auf Σ1 anwenden, oder Σ1 = . Daraus folgt aber Γ B. Y $ Y Y $ z $ Y $ $ P Y Y Y Y $ YH $ 24 Y z $ P Y Y $ Y $ $ P H Die Definition einer axiomatisierten Theorie ist in der Literatur so nicht üblich. In den meisten Lehrbüchern wird ’Axiomatisiertheit’ als Eigenschaft einer Theorie eingeführt. Satz 1.9 zeigt aber ohne großen Aufwand, dass diese Definition äquivalent ist. Die hier verwendete Definition wurde auf Grund ihrer Anschaulichkeit und Direktheit gewählt. 21 Kapitel 1 Prädikatenlogik 1. Stufe Satz 1.9. Eine axiomatisierte Theorie T (∆) ist eine Theorie. $ Beweis. Sei B ein Satz, so dass T (∆) B gilt. Dann folgt mit Satz 1.8 ∆ on ∆ A für alle Sätze mit A Γ gilt. Also ist B T (∆). $ P P $ B , da nach Definiti- Natürlich kann man jede Theorie zur axiomatisierten Theorie machen, indem man ∆ = T wählt. Eine Frage, die im Laufe dieser Arbeit noch zu beantworten sein wird, ist aber, ob man jede Theorie mit einem ∆ axiomatisieren kann, so dass die Axiome auf endlichem Raum beschreibbar sind. Nun soll noch eine Mindestanforderung an eine sinnvolle Theorie definiert werden. Definition 1.18. Eine Theorie T heißt widerspruchsfrei, wenn es keinen Satz gibt A gibt, so dass A T und A T gilt. Eine Menge von Formeln ∆ heißt konsistent, wenn T (∆) widerspruchsfrei ist. P P P Bemerkenswert ist, dass in einer nicht widerspruchsfreien Theorie T sogar A T und A T für jeden Satz A gilt, da man in einer widersprüchlichen Theorie mit ( 1) jeden Satz beweisen kann. Die Frage die sich nun stellt, ist, ob jede richtige Implikation auch beweisbar ist. Darum geht es im nächsten Kapitel. P 22 Kapitel 2 Der Vollständigkeitssatz Das Ziel dieses Kapitels ist es, den berühmten Vollständigkeitssatz zu beweisen, der von Kurt Gödel in Gödel (1930) vorgestellt wurde. Dabei sollte man beachten, dass der Begriff Vollständigkeit in der mathematischen Logik eine Doppelbedeutung hat.25 Als Eigenschaft einer Theorie ist der Begriff für diese Arbeit titelgebend. Der Vollständigkeitssatz beschäftigt sich aber mit der Vollständigkeit eines Kalküls, die eine Art Umkehrung des Korrektheitssatzes ist: Vollständigkeitssatz. Für eine Menge von Formeln Γ und eine Formel A ist Γ zu Γ | A. ù $ A äquivalent Ein Kalkül, für das der Vollständigkeitssatz gilt, nennt man auch vollständig. Der heute übliche Beweis geht auf Leon Henkin zurück und wurde das erste Mal in Henkin (1949) veröffentlicht. Dabei wird eigentlich der folgende Satz bewiesen: Satz 2.1. Eine widerspruchsfreie Theorie ist erfüllbar. ù $ ù $ A impliziert. Aus diesem Satz folgt aber, dass Γ | A stets Γ A impliziert, wie gleich gezeigt werden wird. Da die andere Richtung des Vollständigkeitssatzes der bereits bewiesene Korrektheitssatz ist, reicht es also Satz 2.1 zu zeigen, um den Vollständigkeitssatz zu beweisen. Lemma 2.2. Aus Satz 2.1 folgt, dass Γ | A stets Γ Beweis. Angenommen, aus Widerspruchsfreiheit würde Erfüllbarkeit folgen, aber es gäbe eine Menge von Formeln Γ und eine Formel A so, dass Γ | A gilt, aber nicht Γ A. Dann ist die Theorie T (Γ { A}) widerspruchsfrei, da aus Γ { A} kein Widerspruch folgen kann, da sonst mit ( 1) auch Γ { A} A gelten würde. Mit ( 2) würde dann aber, da Γ {A} A nach (AR) gilt, auch Γ A gelten. Ein Widerspruch zur Annahme. Da also die Theorie T (Γ { A}) widerspruchsfrei ist, muss sie nach Annahme auch erfüllbar sein. Das heißt, es gibt eine Struktur M , für die alle Sätze aus T (Γ { A}) wahr sind. Sei nun B T (Γ { A}) ein Satz, dann gilt Γ { A} B und somit nach dem Korrektheitssatz Γ { A} | B . Da B für M wahr ist, müssen auch alle Formeln aus Γ { A} wahr sein. Das bedeutet aber, es gibt eine Struktur, für die Γ und A wahr sind, was aber Γ | A widerspricht. Y Y $ Y Y 25 ù Y $ Y Y $ Y $ Y P ù $ Y ù Beide Begriffe haben sich aus den selben mathematisch unklaren Begriff entwickelt.(Haaparanta, 2009) 23 Kapitel 2 Der Vollständigkeitssatz Der Beweis des Vollständigkeitssatz mit der Henkin-Methode wird in wahrscheinlich jedem Lehrbuch der mathematischen Logik ein wenig anders präsentiert, auch wenn der Beweis im Kern immer der selbe bleibt. Die hier präsentierte Version ist angelehnt an die Version aus Rautenberger (2008), wobei sich allerdings die Reihenfolgen der Beweisschritte teilweise sehr deutlich unterscheiden und das Vorgehen in zwei Schritten anderen Büchern entnommen ist. Auf die wichtigsten Unterschiede wird an den betreffenden Stellen auch hingewiesen werden und die Entscheidung für das hier gewählte Vorgehen wird begründet. Zur besseren Übersicht wird der Beweis in vier Teile geteilt. Im ersten Teil werden einige Eigenschaften des Kalküls aus dem vorherigen Abschnitt bewiesen. Als zweites wird gezeigt werden, dass bestimmte widerspruchsfreie Theorien, die Henkin-Theorien, erfüllbar sind, also ein Modell haben. Im dritten Teil wird gezeigt werden, dass sich jede widerspruchsfreie Theorie zu einer Henkin-Theorie erweitern lässt und im vierten Teil werden die Ergebnisse von Teil zwei und drei kombiniert, um Satz 2.1 zu beweisen. 2.1 Eigenschaften des Kalküls Im folgenden sollen alle Eigenschaften des Kalküls bewiesen werden, die im Beweis des Vollständigkeitssatzes benutzt werden. Diese Eigenschaften gesammelt in einem Kapitel zu beweisen und nicht im Verlauf des Beweises, dann, wenn sie gebraucht werden, hat den großen Nachteil, dass sicher nicht bei allen Sätzen im folgenden Abschnitt sofort ersichtlich ist, wofür sie gebraucht werden. Da einige dieser Sätze sicherlich an sich nicht sehr interessant sind, kann es deshalb sein, dass der folgende Abschnitt recht technisch wirkt. Zwei große Vorteile stehen dem aber entgegen. Erstens ist der Beweis des Vollständigkeitssatzes auf Grund seiner Komplexität zwangsläufig etwas technisch. Dadurch, dass ein Großteil der notwendigen, aber an sich nicht interessanten Zwischenschritte in diesem Abschnitt gebündelt werden, wird der eigentliche Beweis in den nächsten drei Abschnitten kompakter, anschaulicher und verständlicher. Zweitens macht dieses Vorgehen deutlich, wie wenig der Vollständigkeitssatz von der genauen Gestalt des logischen Kalküls abhängt. Solange ein Kalkül mächtig genug ist, die folgenden Eigenschaften zu beweisen, ist es vollständig. Ist die Vollständigkeit des Kalküls des natürlichen Schließens bewiesen folgt sogar, dass diese Eigenschaften auch notwendig sind, denn was für ein vollständiges Kalkül beweisbar ist, gilt auch für Implikationen im Sinne der Wahrheit und damit auch für jedes andere vollständige Kalkül. Abschließend lohnt sich im folgenden Abschnitt ein Blick auf die Frage, ob alle zehn Schlussregeln zumindest einmal eingesetzt werden. Wäre das für eine Schlussregel nicht der Fall, wäre sie schlicht überflüssig und ließe sich aus den anderen Regeln folgern, wobei die einmalige Verwendung einer Regel natürlich noch kein Beweis für ihre Notwendigkeit ist. Von den bereits bewiesenen Sätzen über das Kalkül werden Satz 1.6 (Modus Ponens) und der Endlichkeitssatz (Satz 1.7) für den Beweis des Vollständigkeitssatzes gebraucht. Zum Beweis dieser beiden Sätze wurden (MR) für den Endlichkeitssatz und (AR), ( 1), ( 1) und ( 2) für den Modus Ponens verwendet. Die nächsten drei Lemmata beschäftigen sich mit den beweisbaren Eigenschaften des =Symbols. Dabei wird eigentlich nur die selbe Beweisidee auf verschiedene Fälle angewendet, weshalb sich die Beweise extrem ähnlich lesen. ^ 24 Kapitel 2 Der Vollständigkeitssatz Lemma 2.3. Für jede Menge von Formeln Γ gilt für Terme r ,s und t , dass aus Γ Γ = t s folgt und aus Γ = st und Γ = t r stets Γ = sr . $ $ $ $ $ $ $ $= st stets $ Beweis. Es gelte Γ = st , nach (=1) gilt auch Γ = ss, was das selbe ist wie Γ vs1 = v 1 s. Da v 1 frei in = v 1 s ist, folgt mit (=2) daraus direkt Γ = t s. Es gelte nun Γ = st und Γ = t r , was das selbe ist wie Γ = st und Γ vt1 = v 1 r . Da v 1 frei in = v 1 r ist, folgt mit (=2), dass Γ = sr gilt. $ $ $ $ $ Lemma 2.4. Für jeden Term t gilt: H $ Dv 1 = v 1 t . Beweis. Man betrachte eine Formel A von der Form = v 1 t für einen Term t . Dann ist v 1 eine t t freie Variable dieser Formel. Außerdem gilt nach (=1) v 1 A, da v 1 A gleich = t t ist. Mit ( 1) folgt daraus direkt v1 = v1t . D H$ H$D Lemma 2.5. Sei Γ eine Menge von Formeln, und t 1 , t 2 , . . . t n und s 1 , s 2 , . . . s n Terme, für die Γ = t k s k für alle k {1, 2, . . . n} gilt. Für alle Funktionen f kn gilt dann Γ = f kn t 1 t 2 . . . t n f kn s 1 s 2 . . . s n und für ein Prädikat P kn folgt aus Γ P kn t 1 t 2 . . . t n stets auch Γ P kn s 1 s 2 . . . s n . $ P $ $ $ $ Beweis. Nach (=1) gilt Γ = f kn t 1 t 2 . . . t n f kn t 1 t 2 . . . t n , was sich auch in der äquivalenten Form Γ vt11 = f kn t 1 t 2 . . . t n f kn v 1 t 2 . . . t n schreiben lässt. Da auch Γ = t 1 s 1 gilt und v 1 frei ist, folgt mit (=2) Γ = f kn t 1 t 2 . . . t n f kn s 1 t 2 . . . t n . Für die anderen k 1 Terme geht man analog vor. Genauso lässt sich Γ P kn t 1 t 2 . . . t n auch als Γ vt11 P kn v 1 t 2 . . . t n schreiben, woraus mit = t 1 s 1 und (=2) Γ P kn s 1 t 2 . . . t n folgt, da v 1 in P kn v 1 t 2 . . . t n frei ist. Für die anderen k 1 Terme geht man analog vor. $ $ $ $ $ $ D Damit wurden auch (=1), (=2) und ( 1) verwendet. Die folgende Eigenschaft ist eng mit der Idee des Widerspruchsbeweises verwandt und wäre entsprechend in einer intuitionalistischen26 Logik nicht beweisbar. Daraus folgt nach dem oben Gesagten natürlich auch, dass eine solche Logik im Bezug auf die hier dargestellte Definition von Wahrheit nicht vollständig sein kann. Entsprechend wurde dieser Wahrheitsbegriff von Intuitionalisten immer wieder kritisiert, wenn er nicht gleich ganz ignoriert wurde, wie beispielsweise in Stegmüller (1957) zu sehen ist. Lemma 2.6. Sei T eine Theorie und A ein Satz, so dass T A T. P Y Y A inkonsistent ist, dann gilt stets Y $ $ Y $ Beweis. Da T A inkonsistent ist, gibt es einen Satz B mit T A B und T A B. Daraus folgt mit ( 1) T A A, da aber nach (AR) auch T A A gilt, kann man mit ( 2) folgern, dass T A gilt. Da aber T eine Theorie ist, muss dann A T gelten. $ Y $ Y P Die folgende Definition wird im weiteren Verlauf des Beweises eine zentrale Rolle spielen. 26 Der Intuitionalismus ist eine mathematisch-philosophische Lehre, die vor allem auf L. E. J. Brouwers zurück geht und unter anderem dadurch gekennzeichnet ist, dass sie den Satz des ausgeschlossenen Dritten, der sich zum Beispiel als A $ A formulieren lässt, ablehnt (Becker, 1954, S. 329ff) 25 Kapitel 2 Der Vollständigkeitssatz Definition 2.1. Man nennt eine Sprache S 2 eine Spracherweiterung von S 1 , wenn die Menge der Symbole von S 1 eine Teilmenge der Symbole von S 2 ist. Man schreibt auch etwas unsauber S1 S2. Eine wichtige Eigenschaft von Spracherweiterungen ist, dass durch sie eine Folgerung nicht falsch werden kann. $ Lemma 2.7. Wenn Γ A für eine Formel A und eine Menge von Formeln Γ in einer Sprache S gilt, gilt in allen Spracherweiterungen S 1 von S auch Γ A. $ $ Beweis. Da Γ A in S gilt, gibt es eine Herleitung, die ausschließlich Symbole aus S verwendet. Da diese Symbole aber nach Definition in S 1 ebenfalls vorkommen, lässt sich diese Herleitung in S 1 genauso formulieren, weshalb Γ A auch in S 1 gilt. $ Die folgende Methode, mit der man eine Theorie in einer Spracherweiterung konstruieren kann, wird im Beweis des Vollständigkeitssatzes noch eine wichtige Rolle spielen, um aus einer normalen Theorie eine Henkin-Theorie zu machen. Lemma 2.8. Sei S 1 S 2 . . . S k . . . eine Kette von Spracherweiterungen, T1 T2 . . . Tk . . . eine Kette von Theorien. Ist Tk für alle k N widerspruchsfrei in S k , so ist T = k PN Tk eine widerspruchsfreie Theorie in S = k PN S k .27 P $ P P P Beweis. Sei A ein Satz, so, dass T A gilt, dann gibt es nach 1.7 auch eine endliche Menge T 1 T , so dass T 1 A gilt. Dann gibt es aber ein n N, so dass T 1 k P{1,2,...n} Tk und somit nach Konstruktion auch T 1 Tn und A in k P{1,2,...n} S k formulierbar ist und also nach Konstruktion auch in S n . Da Tn eine Theorie ist, folgt A Tn und damit A T . T ist also eine Theorie. Angenommen T wäre widersprüchlich in S, dann gäbe es einen Satz B mit B T und B T . Nach Konstruktion muss es dann aber eine Theorie Tm geben, so dass B Tm und B Tm ist, dann wäre aber Tm widersprüchlich, was nach Konstruktion nicht sein kann. $ P P P P Das Verfahren der Konstantenelimination ist für den Beweis des Vollständigkeitssatzes an sich von keinem Interesse, aber mit ihr lassen sich zwei Sätze beweisen, die benötigt werden, um aus dem Modell der Henkin-Theorie ein Modell für die ursprüngliche Theorie zu gewinnen. Lemma 2.9 (Konstantenelimination). Sei S c die Spracherweiterung von S, die sich von S nur durch die zusätzliche Konstante c unterscheidet. Kann dann in S c für eine Formelmenge v vk Γ und eine Formel A geschlossen werden, dass Γ A gilt, dann kann in S auch ck Γ c A geschlossen werden, wobei v k weder in Γ noch in A vorkommt und genauso wenig in dem Beweis von Γ A. $ $ $ Beweis. Der Beweis soll mit der, bereits zum Beweis des Endlichkeitssatzes verwendeten, v vk Regelinduktion geführt werden. Wurde Γ A mit (AR) geschlossen, ist klar dass ck Γ c A vk vk gilt, da aus A Γ auch c A c Γ folgt. Wurde (=1) verwendet, hat A die Form = t t . Da 27 P P $ $ k PN S k bezeichnet die Sprache, die man erhält wenn man die Mengen aller Symbole der Sprachen S k vereinigt. 26 Kapitel 2 Der Vollständigkeitssatz v v v v aber ck = t t nach Definition gleich = ck t ck t ist, kann man auf ck A ebenfalls einfach (=1) v anwenden. Für die meisten anderen Schlussregeln geht man analog vor, in dem man ck an v dem logischen Symbol vorbei zieht, was genau der Definition von ck entspricht, um dann vk vk mit der Schlussregel, die für Γ A verwendet wurde, c Γ A zu schließen. c Ein etwas differenzierteres Vorgehen verlangen die Regeln (=2), ( 1) und ( 2), wobei die ersten beiden wieder mit selbe Idee erfordern, weshalb nur ( 1) vorgeführt werden soll. Sei nun Γ A mit ( 1) geschlossen, das heißt, A hat die Form v l B für eine Formel B , wobei v l frei in B ist, und wurde aus Γ vt B geschlossen. Nach Induktionsannahme gilt dann $ $ D $ $ $ D D D D l vk t v auch ck Γ v l und c v l B . Da v l in A vorkommt und v k nach Konstruktion nicht, ist v k 1 v v v mit t = ck t kann man auch ck Γ vt ck B schreiben. Daraus kann man aber nun mit ( 1) l v v v vk v vk schließen, dass ck Γ v l ck B , was das selbe ist wie ck Γ v l B , also ck Γ A. Wurde A c c schließlich mit ( 2) geschlossen, so hat es die Form v j B mit einer Formel B , der Obersatz vl hat die Form Γ v B . Um hier den Beweis analog anzuwenden muss man ausnutzen, dass j v v v v nach Konstruktion v j v k v l ist und deshalb ck v l B = v l ck B . j j 1 D $ $ $D D $ D $ D Damit lässt sich nun eine Art Umkehrung von Lemma 2.7 für bestimmte Spracherweiterungen beweisen. Lemma 2.10. Sei Γ eine Formelmenge und A eine Formel aus einer Sprache S. Lässt sich nun in einer Spracherweiterung S 1 , die sich von S nur in der Menge der Konstanten unterscheidet, beweisen, dass Γ A gilt, dann lässt sich Γ A auch in S beweisen. $ $ Beweis. Aus dem Endlichkeitssatz und der Tatsache, dass ein Beweis nur eine endliche Anzahl von Schritten haben darf, folgt, dass im Beweis von Γ A nur endlich viele Konstanten vorkommen. Γ A ist also schon in einer Spracherweiterung S k bewiesen, die sich von S nur durch die Hinzunahme von k Konstanten unterscheidet, wobei k natürlich endlich ist. Sei nun c eine der k Konstanten, S k 1 die Sprache, die man erhält, wenn man c aus S k v vk entfernt. Aus Lemma 2.9 folgt dann aber, dass für eine Variable v k in S k 1 ck Γ c A gilt. Eine passende Variable v k findet man, da in Γ, A und dem Beweis zu Γ A nur endlich viele Variablen vorkommen. Da aber weder in Γ noch in A die Konstante c vorkommt, da beide in S formulierbar sind, ist Γ A in S k 1 beweisbar. Dieses Vorgehen wiederholt man nun k mal und zeigt so, dass Γ A in S 0 = S beweisbar ist. $ $ $ $ $ $ Dieses Lemma wird implizit immer dann verwendet, wenn man im folgenden zwischen der Beweisbarkeit in einer Sprache und ihrer Erweiterung unterscheiden müsste. Da alle Erweiterungen, die noch eine Rolle im Beweis des Vollständigkeitssatzes spielen werden, nur Erweiterungen um Konstanten sind, wird diese Unterscheidung im weiteren einfach ’übersehen’. Nun zum Abschluss dieses Abschnitts noch eine zweite Folgerung aus Lemma 2.9. Lemma 2.11. Sei ∆ eine Formelmenge. Ist für eine Konstante c, die weder in ∆ noch in der Formel A vorkommt, eine Formel der Form v k A vc A, wobei v k eine freie Variable von A k ist, ein Element von T (∆), dann ist ∆ nicht konsistent. ^D 27 Kapitel 2 Der Vollständigkeitssatz Beweis. Angenommen ∆ $ ^Dv k A vl c ∆ c vk $ ^ A, dann gilt nach ( 2) ∆ vl c c vk $ Dv k A und ∆ $ c vk A. Nach Lemma 2.9 gilt dann auch A, mit einer Variablen, die in ∆ und A nicht vorkommt. Da c weder in ∆ noch in A vorkommt, vereinfacht sich dieser Ausdruck zu vl ∆ A. Mit ( 2) folgt dann aber ∆ v k A. Also ist T (∆) nicht widerspruchsfrei, was vk bedeutet, dass ∆ nicht konsistent ist. $ D $ D D ^ In diesem Beweis wurden nun auch ( 2) und ( 2) verwendet. Zumindest in dieser Arbeit wird also jede Schlussregel auch zum Beweis des Vollständigkeitssatzes heran gezogen. Da nun alle Aussagen über das Kalkül des natürlichen Schließens bewiesen sind, die für den Vollständigkeitssatz von Bedeutung sind, kann der ’eigentliche’ Beweis nun beginnen. Als erstes werden die so genannten Henkin-Theorien eingeführt und dann gezeigt, dass diese immer ein Modell haben. 2.2 Henkin-Theorien Definition 2.2. Als Henkin-Theorie bezeichnet man eine Theorie H , die die zwei folgenden Bedingungen erfüllt: (H1) Für jeden Satz A gilt genau dann A H , wenn A ∉ H gilt. (H2) Aus v k A H für eine Formel A, mit der einen freien Variablen v k folgt vc A H für eine k Konstante c. D P P P (H1) bedeutet insbesondere auch, dass jede Henkin-Theorie widerspruchsfrei ist. Die Eigenschaften (H1) und (H2) bedeuten zusammen, dass jede mögliche Existenzaussage in der Sprache in der man arbeitet in der Theorie H entweder falsch ist oder durch eine Konstante ’bezeugt’ wird. Damit lässt sich schon erahnen, warum es möglich ist für HenkinTheorien Modelle zu konstruieren, da im Prinzip alle nötigen Elemente des Universums bereits durch Konstanten bezeichnet werden. Mit dieser Idee kann dann auch der nun folgende Satz bewiesen werden. Satz 2.12. Jede Henkin-Theorie hat ein Modell. Beweis. Sei H eine Henkin-Theorie, in einer Sprache, die im folgenden als S bezeichnet werden soll. Das erste Ziel ist, ein Universum für das Modell zu konstruieren. Wie bereits angedeutet, werden die Elemente des Universums durch die Konstanten bestimmt. Allerdings kann es sein, dass S ’zu viele’ Konstanten besitzt. Deshalb definiert man |A| als Menge von Äquivalenzklassen. Die Äquivalenzrelation wird wie folgt definiert: c1 c2 falls = c1c2 P H . Das es sich dabei tatsächlich um eine Äquivalenzrelation handelt, folgt aus Lemma 2.3. Die Menge der Äquivalenzklassen C dieser Relation hängt natürlich von der Theorie H und der Sprache S ab. Man setzt nun |A| = C . Als nächstes ordnet man den Termen einen Wert zu. Dazu nutzt man aus, dass für jeden Term t , der keine Variablen enthält, eine Konstante c existiert, so dass = t c H gilt, was aus Lemma 2.4 und (H2) folgt, indem man t die Äquivalenzklasse c von c zuordnet. Für ’t hat den Wert c’ wird im weiteren auch t c P 28 Kapitel 2 Der Vollständigkeitssatz geschrieben. Auf diese Weise kann man auch allen Funktionen einen Wert zuweisen, da f kn t 1 t 2 . . . t n ein Term ist. Man definiert einfach fnk (c 1 , c 2 , . . . c n ) = c, wobei c f kn t 1 t 2 . . . t n ist, für Terme t 1 , t 2 , . . . t n so, dass t 1 c 1 , t 2 c 2 , . . . t n c n gilt. Dass diese Zuordnung wohldefiniert ist, folgt aus Lemma 2.5. Für Prädikate geht man ähnlich vor, in dem man die Menge |P kn | durch (c 1 , c 2 , . . . c n ) |P kn | P kn t 1 t 2 . . . t n H für Terme t 1 , t 2 , . . . t n so, dass t 1 c 1 , t 2 c 2 , . . . t n c n gilt, definiert. Auch diese Zuordnung ist wohldefiniert, wie wieder aus Lemma 2.5 folgt. Damit ist die Struktur A definiert. Nun ist zu zeigen, dass es sich dabei auch um ein Modell für H handelt. Für atomare Sätze in H gilt, = st H t c s | A = st . P ðñ P P ðñ ðñ ù und P kn t 1 t 2 . . . t n P H ðñ (c 1, c 2, . . . c n ) P Pnk für t1 c1, t2 c2, . . . tn cn ðñ|ùA Pkn t1 t2 . . . tn . Für nicht atomare Sätze geht man wie üblich induktiv vor. Sei also die Aussage für die Formeln A und B gezeigt, dann gilt A (H 1) I nd .An. P H ðñ A ∉ H ðñ | ùA A ðñ|ùA A. und (^2) I nd .An. ^ AB P H ðñ A, B P H ðñ |ùA A, B ðñ|ùA ^ AB. Für Sätze von der Form Dv k A gilt schließlich c (H 2) c I nd .An. Dv k A P H ðñ A P H ðñ |ùA A ðñ|ùA Dv k A. v v k k Damit ist gezeigt, dass A ein Modell von H ist. 2.3 Spracherweiterungen Man weiß nun, dass jede Henkin-Theorie ein Modell hat. Das eigentliche Ziel ist aber zu beweisen, dass jede widerspruchsfreie Theorie ein Modell hat. Im folgenden Abschnitt wird es nun darum gehen, eine beliebige widerspruchsfreie Theorie zu einer Henkin-Theorie zu erweitern. Das ist allerdings nicht möglich, ohne die Sprache in der die Theorie formuliert ist ebenfalls zu erweitern (Rautenberger, 2008, S.77), weshalb die Definition einer Spracherweiterung (Definition 2.1) aus dem ersten Teil des Beweises eine wichtige Rolle spielen wird. Lemma 2.13. Jede widerspruchsfreie Theorie T lässt sich zu einer Theorie erweitern, die (H1) erfüllt. Eine Theorie, die (H1) erfüllt muss widerspruchsfrei sein und aus A ∉ T muss für jeden Satz A folgen, dass A T gilt. Die Idee besteht nun darin für jeden Satz zu überprüfen, ob ein P 29 Kapitel 2 Der Vollständigkeitssatz Widerspruch entsteht, wenn man den Satz zur Theorie hinzufügt und wenn nicht erweitert man T um diesen Satz. Dabei verwendet man allerdings stark die Abzählbarkeit der Menge der Sätze. In dieser Arbeit wurden Sprachen abzählbar definiert, weshalb dieses Vorgehen möglich ist. Es ist möglich diese Voraussetzung fallen zu lassen, ohne dass die Aussage des Lemmas falsch wird, allerdings verliert der Beweis dadurch an Anschaulichkeit.28 Diese Version des Beweises lässt sich zum Beispiel in Rautenberger (2008) nachlesen. Der hier präsentierte Beweis für den abzählbaren Fall ist aus Ebbinghaus u. a. (2007) entnommen. Beweis. Sei A 1 , A 2 , . . . A k , . . . eine Abzählung aller Sätze der Sprache S. Es ist möglich eine solche Abzählung zu finden, da S nach Definition nur abzählbar viele Symbole enthält und entsprechend die Menge aller Ausdrücke in S als Menge aller endlichen Folgen von Symbolen aus S ebenfalls abzählbar ist. Dann seien die Theorien V1 ,V2 , . . .Vk , . . . induktiv wie folgt definiert: V1 = T und Sei nun V = Vk+1 = ( T (Vk Y An ) Vk falls Vk Y An konsistent ist, sonst. k PN Vk . Nun muss man zeigen, dass V eine widerspruchsfreie Theorie ist, die (H1) erfüllt. Da die einzelnen Theorien Vk nach Konstruktion widerspruchsfrei sind, folgt aus Lemma 2.8, dass V eine widerspruchsfreie Theorie ist. Sei nun A k ein Satz, dann gilt entweder A k Vk und damit A V oder aus Vk A k lässt sich ein Widerspruch folgern, was aber bedeutet, dass sich aus V A k ebenfalls ein Widerspruch folgern lässt, woraus aber nach Lemma 2.6 folgt, dass A V ist. V erfüllt also (H1). P P Y Y P Nun wendet man sich (H2) zu. Es geht also darum für jede Existenzaussage in der Theorie ein Beispiel zu finden. Dazu erweitert man die Sprache in der die Theorie formuliert ist zuerst um neue Konstanten, die als Beispiele dienen sollen. Danach erweitert man die Theorie um Sätze, die, grob ausgedrückt, die Konstanten so interpretieren, dass sie als Beispiele dienen können. Lemma 2.14. Jede widerspruchsfreie Theorie T in einer Sprache S lässt sich zu einer widerspruchsfreien Theorie erweitern, die (H2) in einer Spracherweiterung SC , die sich von S nur in der Menge der Konstanten unterscheidet, erfüllt. Hier wird ebenfalls ein Beweis gegeben, der auf der Abzählbarkeit der Sprache beruht und in etwa dem Vorgehen in Enderton (2001) entspricht. Der überabzählbare Fall wird wieder in Rautenberger (2008) behandelt. Beweis. Sei 〈A 1 , v 1 〉 , 〈A 2 , v 2 〉 , . . . eine Aufzählung aller Paare von Formeln A k mit genau einer freien Variablen und v k die passende freie Variable. Es ist möglich eine solche Abzählung zu finden, da S nach Definition nur abzählbar viele Symbole enthält und entsprechend die 28 Dabei kann man entweder die Wohlordnung der Sprache als Voraussetzung setzten, oder man verwendet das Lemma von Zorn, um den Beweis für ganz allgemein Sprache zu führen. 30 Kapitel 2 Der Vollständigkeitssatz Menge aller Ausdrücke in S als Menge aller endlichen Folgen von Symbolen aus S ebenfalls abzählbar ist. Sei außerdem SC definiert als Sprache, die dadurch entsteht, dass man die Menge der Konstanten von S um die abgezählten Konstanten c 1 , c 2 , . . . erweitert. Sei dann der Satz A ck wie folgt definiert: A ck = ^Dv k Ak ck A k 29 . vk Als nächstes konstruiert man die neue Theorie T 1 = T (T {A c1 , A c2 , . . .}). Diese Theorie erfüllt (H2), da man mit dem Modus Ponens (Lemma 1.6) aus v k A k und A ck schließen kann, dass ck v k A gilt. Mit diesem Argument kann man sogar schließen, dass jede widerspruchsfreie Erweiterung von T 1 (H2) erfüllt. Es bleibt noch zu zeigen, dass T 1 widerspruchsfrei ist. Angenommen also, T 1 wäre nicht widerspruchsfrei. Da T 1 = k PN T (T {A c1 , A c2 , . . . A ck }) ist muss es nach Lemma 2.8 ein k geben, so dass bereits die Theorie T (T {A c1 , A c2 , . . . A ck }) nicht widerspruchsfrei ist. Sei k nun minimal gewählt. Aus Lemma 2.6 folgt dann A ck T (T {A c1 , A c2 , . . . A ck 1 }). Da c k nach Konstruktion weder in T {A c1 , A c2 , . . . A ck 1 } vorkommt, noch in A k , wäre aber nach Lemma 2.11 schon A ck T (T {A c1 , A c2 , . . . A ck 1 }) widersprüchlich, was aber der Minimalität von k widerspricht. Y D Y P Y Y Y Y P Wenn man die beiden Sätze kombiniert, erhält man das folgende Korollar, das das eigentliche Ziel dieses Abschnitts ist. Korollar 2.15. Jede widerspruchsfreie Theorie T in einer Sprache S lässt sich, in einer Spracherweiterung von SC von S, zu einer Henkin-Theorie H erweitern. Beweis. Zuerst wendet man Lemma 2.14 auf T an und erhält eine Theorie T H 2 in eine Spracherweiterung SC , die (H2) erfüllt. In dem Beweis zu Lemma 2.14 wird festgestellt, dass sogar jede widerspruchsfreie Erweiterung von T H 2 in SC (H2) erfüllt. Wendet man also Lemma 2.13 auf T H 2 an erhält man eine Theorie H , die sowohl (H1) als auch (H2) erfüllt, also eine Henkin-Theorie ist. 2.4 Konstruktion eines Modells Mit Korollar 2.15 kann nun Satz 2.1 bewiesen werden: Satz 2.1. Eine widerspruchsfreie Theorie ist erfüllbar. Beweis. Beginnt man mit einer widerspruchsfreien Theorie T in einer Sprache S, kann man nach Lemma 2.15 diese Theorie zu einer Henkin-Theorie H in einer Sprache SC erweitern. Nach Lemma 2.12 hat H ein Modell M in SC . Da T H in SC ist, ist M auch ein Modell von T in SC . Aus M kann man nun eine Struktur M S für S konstruieren, da alle Symbole von S in SC vorkommen. Man ordnet also den Symbolen von S einfach das Element von M zu, das man ihnen auch in SC zu ordnet und ’vergisst’ die anderen Konstanten von SC . Da aber in T 29 In klassischer Schreibweise wäre dies ((Dv k )A k Ñ ck vk ((Dv k )A k ^ ( A k ). 31 ck vk A k )) oder mit den vereinbarten Abkürzungen Kapitel 2 Der Vollständigkeitssatz nur Symbole aus S vorkommen ändert sich durch den Übergang von M zu M S und von SC zu S nichts an den Wahrheitswerten der Formeln in T . Da aber M ein Modell von T war, also alle Sätze von T in der Struktur M wahr sind, ist M S auch ein Modell von T in der Sprache S. Da von Satz 2.1 schon gezeigt wurde, dass aus ihm zusammen mit dem Korrektheitssatz der Vollständigkeitssatz folgt, ist dieser hiermit bewiesen. 32 Kapitel 3 Berechenbarkeit Die Grundlagen für die Definition der Vollständigkeit einer Theorie sind damit eingeführt, der Begriff der Entscheidbarkeit erfordert aber noch ein paar Vorarbeiten. In diesem Kapitel soll es um den mit der Entscheidbarkeit eng verwanden Begriff der Berechenbarkeit gehen, den man versucht durch den Begriff der Rekursivität zu fassen. Bevor diese zum Thema wird, soll eine Vorstufe eingeführt werden, die primitive Rekursivität. 3.1 Primitiv rekursive Funktionen Im Folgenden soll es um Funktionen auf den natürlichen Zahlen gehen. Aber wie lassen sich Funktionen genauer fassen? In Büchern über die Analysis werden Funktionen häufig ohne weitere Präzisierung als Abbildungsvorschriften bezeichnet (Appell, 2009, S. 429) oder als Menge von Tupeln definiert. Beide Definitionen umfassen aber erheblich mehr Funktionen als tatsächlich konstruktiv berechnet werden können. Um diese Menge zu beschreiben, muss man sich ansehen, wie neue Funktionen im mathematischen Alltag eingeführt werden. Soll dort eine neue Funktion definiert werden, versucht man normalerweise, sie auf bereits bekannte Funktionen zurück zu führen. So kann man auf den natürlichen Zahlen die Funktion ’ ’ durch ’+’ wie folgt erklären30 : Beispiel 3.1. Um x y zu definieren, genügen die folgenden zwei Rechenregeln: x 0 = 0 und x (y + 1) = (x y) + x. Mit diesen Regeln ist es möglich, jede Multiplikation auf eine Addition zurück zu führen. So ist 2 2 = (2 1) + 2 = (2 0) + 2 + 2) = 0 + 2 + 2 = 4. Mit einer ganz ähnlichen Definition ist es möglich ’+’ auf die Nachfolgerfunktion S zu reduzieren, die als S(x) := x + 1 definiert ist. Dazu setzt man x + 0 = x und x + S(y) = S(x + y). Versucht man allerdings die Funktion ’S’ mit dem selben Verfahren herzuleiten, kommt man nur zu dem wenig befriedigenden Ergebnis S(x) = S(x). Damit hat man nun ein einheitliches Verfahren, mit dem die beiden grundlegenden Funktionen ’+’ und ’ ’ auf eine nicht weiter ableitbare Funktion ’S’ zurückgeführt werden konnten. Dieses Verfahren, primitive Rekursion genannt, lässt sich verallgemeinern: Ñ Definition 3.1. Eine Funktion f : Nn N heißt durch primitive Rekursion von den Funktion 1 n+1 nen g : N N und h : N N abgeleitet, wenn für f gilt: Ñ Ñ f (x 1 , x 2 , . . . x n 1 , 0) = g (x 1 , x 2 , . . . x n 1 ) 30 Das Vorgehen in diesem Kapitel richtet sich grob nach Goodstein (1971). 33 Kapitel 3 Berechenbarkeit und f (x 1 , x 2 , . . . x n 1 , S(y)) = h(x 1 , x 2 , . . . x n 1 , y, f (x 1 , x 2 , . . . x n 1 , y)). Betrachtet man nun Beispiel 3.1 noch einmal genauer, sieht man, dass in der Definition von ’ ’ in x 0 = 0 als g noch eine Funktion Z auftritt, die immer Null ergibt. Bei ’+’ tritt außerdem in x+0 = x die Funktion I , mit I (x) = x, als g auf. Mit diesem Wissen lässt sich jetzt eine Klasse von Funktionen beschreiben, die mindestens ’+’ und ’ ’ enthält, die Klasse der primitiv rekursiven Funktionen. Sie enthält alle Funktionen, die sich aus I , S und Z durch primitive Rekursion und Komposition, die schon zur Definition der Rekursion notwendig war, gewinnen lassen. Da die primitiv rekursiven Funktionen von Nn nach N abbilden sollen, muss man allerdings I ein wenig geschickter definieren. Die formale Definition lautet: Definition 3.2. Die primitiv rekursiven Funktionen sind alle Funktionen, die man aus der von Nn nach N abbildenden Funktion I kn (x 1 , x 2 , . . . x n ) := x k , der von Nk nach N abbildenden Funktion Z (x 1 , x 2 , . . . x k ) := 0, und der von N nach N abbildenden Funktion, S(x) := x + 1 durch primitive Rekursion und Komposition konstruieren kann. Man sieht leicht, dass auch die Potenzfunktion f (x, y) := x y primitiv rekursiv ist, weil man sie per primitiver Rekursion aus ’ ’ ableiten kann. Da außerdem die Komposition von Funktionen erlaubt ist, enthält diese Klasse unter anderem alle Polynome. Auch sonst lassen sich alle der üblichen arithmetischen Operationen dieser Klasse zu ordnen. Andererseits lassen sich diese Funktionen in einer endlichen Anzahl von Schritten berechnen, indem man sie auf die drei eindeutig berechenbaren Grundfunktionen zurück führt. Es handelt sich also zumindest um eine sehr umfangreiche einseitige Näherung an die Klasse der Funktionen, die von Menschen theoretisch berechnet werden können. Da diese Klasse aber alles andere als mathematisch klar definiert ist, ist es sehr schwierig zu beweisen, dass es sich tatsächlich um alle berechenbare Funktionen handelt. Das Gegenteil lässt sich dagegen leicht an einem Beispiel einer Funktion zeigen, deren Werte berechnet werden können, die aber nicht primitiv rekursiv ist. Ein solche Funktion lässt sich mit Hilfe eines Diagonalarguments relativ leicht konstruieren31 . Satz 3.1. Es gibt berechenbare Funktionen, die nicht primitiv rekursiv sind. Beweis. Jede primitiv rekursive Funktion lässt sich aus einer endlichen Anzahl an Funktionen in endlich vielen Schritten konstruieren. Das heißt auch, dass sich jede primitiv 31 Diese Darstellung des Diagonalarguments lehnt sich an Soare (1987, S. 10) an. 34 Kapitel 3 Berechenbarkeit rekursive Funktion als endliche Folge von Symbolen aus einer endlichen Menge von Symbolen darstellen lässt. Daraus folgt, dass es nur abzählbare viele primitiv rekursive Funktionen gibt. Sei nun f 1 , f 2 , . . . f k . . . eine Abzählung aller primitiv rekursiver Funktionen. Die Funktion g (k) := f k (k) + 1 ist offensichtlich für jedes k berechenbar, da f k (k) berechenbar ist. Allerdings ist g nicht primitiv rekursiv, da g f n für alle n gilt, denn es ist ja g (n) f n (n). Ein weiteres Beispiel ist die so genannte Ackermannfunktion, die in Beispiel 3.2 kurz skizziert werden wird. Diese ist vielleicht etwas anschaulicher und interessanter als die eben konstruierte Funktion. Auf den Nachweis, dass diese Funktion tatsächlich nicht primitiv rekursiv ist, wird in dieser Arbeit aber verzichtet, nachlesen kann man ihn beispielsweise in Oberschelp (1993, S. 97ff). Hier sei nur noch die Beweisidee angedeutet. Diese besteht darin, dass die Ackermannfunktion schneller wächst als das einer primitiv rekursiven Funktion möglich sein dürfte. Beispiel 3.2. Wenn man die Methode, mit der man aus ’S’ mit primitiver Rekursion ’+’, aus ’+’ dann ’ ’ und daraus das Potenzieren gewonnen hat immer weiter treibt, erhält man die sogenannten Hyperoperatoren. Diese werden in der Form x n y notiert, wobei ’ 0 ’ gleich ’ ’ ist. Einen beliebigen Hyperoperator ’ n+1 ’ mit n 0 erhält man aus ’ n durch eine primitive Rekursion der Form x n+1 0 = S(0) und x n+1 S(y) = x n (x n+1 y). Man nimmt ’ ’ als Anfangspunkt und nicht ’+’ oder ’S’, da sich so x n+1 0 für alle n gleich definieren lässt. Offensichtlich sind alle Hyperoperatoren primitiv rekursiv. Betrachtet man x n y aber nicht als zweistellige Funktion von x und y, sondern als dreistellige Funktion von x, y und n erhält man die nicht primitiv rekursive Ackermannfunktion A(x, n, y), die sich aber immer noch theoretisch mit Stift und Papier berechnen lässt, auch wenn der Rechenaufwand mit wachsendem n extrem schnell praktisch undurchführbar wird. So ist A(2, 2, 2) = 4 noch überschaubar aber schon A(3, 3, 3) = 7625597484987 ist recht groß.32 Ò Ò Ò Ò ¥ Ò Ò Ò Ò Ò Ò Das weitere Ziel dieses Kapitels ist es, eine Klasse von Funktionen zu finden, die tatsächlich alle berechenbaren Funktionen enthält. Um dieses Ziel zu erreichen wird nun ein kleiner Umweg eingeschlagen, der auch einen Zusammenhang zwischen der primitiven Rekursion und den vorangegangen Kapiteln herstellt. 3.2 Rekursive Mengen Der Begriff der Rekursivität soll nun auf Teilmengen von N ausgedehnt werden, in dem man Funktionen betrachtet, die eine Menge beschreiben. Es gibt dazu zwei Ansätze, die beide zu unterschiedlichen Ergebnissen führen. Der erste ist recht naheliegend. Definition 3.3. Man bezeichnet eine Teilmenge M von N als primitiv rekursive Menge, wenn es eine primitiv rekursive Funktion f gibt, so dass f (x) = 0 genau dann gilt, wenn x M ist. P 32 Diese sehr ursprüngliche Form die Ackermannfunktion zu definieren findet sich zum Beispiel in Boolos u. a. (2002, S. 84). In Oberschelp (1993) findet sich eine vereinfachte Version, die es erleichtert zu beweisen, dass die Ackermannfunktion nicht primitiv rekursiv ist. Die Konstruktionsidee der Ackermannfunktion lässt sich an der hier präsentierten Version besser erkennen. 35 Kapitel 3 Berechenbarkeit Äquivalent zu dieser Definition ist die Forderung, dass die charakteristische Funktion χM einer Menge primitiv rekursiv ist, wie der folgende Satz zeigt. Satz 3.2. Eine Teilmenge M der natürlichen Zahlen ist genau dann primitiv rekursiv, wenn ihre charakteristische Funktion χM primitiv rekursiv ist, wobei χM wie folgt definiert ist: χM (x) = ( 1 falls x ∉ M , 0 falls x P M. Beweis. Aus der Definition von χM folgt sofort, dass falls, χM primitiv rekursiv ist, M auch primitiv rekursiv ist. Für die Rückrichtung des Beweises führt man zwei Funktionen ein, die wie folgt definiert sind: ( x 1 falls x > 1, 1 S (x) = 0 falls x 1. und ¤ y falls x > y, y = 0x falls x ¤ y. ( x Beide Funktionen sind primitiv rekursiv. Die erste erhält man aus der Nachfolgerfunktion S durch primitive Rekursion, in dem man S 1 (0) = 0 setzt33 und S 1 (S(x)) = x. Die zweite Funktion, die auch Monus-Funktion heißt, erhält man aus der ersten per primitiver Rekursion durch x 0 = x und x S(y) = S 1 (x y). Damit lässt sich nun die Rückrichtung beweisen. Sei also M eine primitiv rekursive Menge, dann gibt es eine Funktion f , die für alle Elemente von M gleich null ist und sonst nicht. Da Kompositionen primitiv rekursiver Funktionen wieder primitiv rekursiv ist, ist also auch die Funktion g (x) := 1 (1 f (x)) primitiv rekursiv. Für diese Funktion gilt aber: g (x) = (1 f (x)) = 1 0 = 1 falls x ∉ M , 1 (1 f (x)) = 1 1 = 0 falls x P M . ( 1 g ist also die charakteristische Funktion von M . Da g primitiv rekursiv ist, ist damit alles gezeigt. Ganz ähnlich lassen sich auch Prädikate in einer Struktur A als primitiv rekursiv beschreiben, in dem man die Definition einer primitiv rekursiven Menge auf natürliche Weise auf Mengen von Tupeln ausweitet. Definition 3.4. Man nennt eine Menge M von Tupeln aus Elementen von N eine primitiv rekursive Menge, wenn es eine primitiv rekursive Funktion f gibt, so dass f (x 1 , x 2 , . . . x n ) = 0 ist, genau dann wenn (x 1 , x 2 , . . . x n ) M gilt. Entsprechend heißt ein Prädikat P kn in einer Struktur A ein primitiv rekursives Prädikat, wenn die Menge |P kn | aus A primitiv rekursiv ist. P 33 Um formal ganz präzise zu sein, dürfte man hier nicht = 0 schreiben, sondern müsste = Z (x) schreiben. Da dies der Lesbarkeit nicht sehr entgegen kommt, wird im Weitern in solchen Fällen etwas ’schlampig’ vorgegangen. 36 Kapitel 3 Berechenbarkeit Bevor es weiter geht, ein Beispiel für ein primitiv rekursives Prädikat, das im weiteren noch eine Rolle spielen wird. Beispiel 3.3. Man kann in einer Struktur mit dem Universum N ein Prädikat |x y definieren, das genau dann wahr ist, wenn y ein Teiler von x ist. Dieses Prädikat ist primitiv rekursiv. Um x c das zu zeigen führt man eine neue Funktion ein, nämlich frac(y, x) die im folgenden als b y+1 notiert werden wird und die man mit der folgenden primitiven Rekursion erhält: frac(y, 0) = 0 und frac(y, S(x)) = frac(y, x) + (1 (x (S(y) frac(y, x))). Wie man nachrechnen kann ergibt x diese Funktion genau b y+1 c also x geteilt durch y + 1 und dann abgerundet. Mit ihr lässt sich die zweistellige Funktion x + (y 1) x |(x, y) = b c b c y y konstruieren, die genau dann gleich null ist, wenn y ein Teiler von x ist und sonst gleich eins. Diese Funktion ist also die charakteristische Funktion von |x y. Aus diesem Ergebnis folgt sofort, dass GE R x für: ’x ist gerade’ auch primitiv rekursiv ist, da GE R(x) = |(x, 2) ist. Für den zweiten Ansatz soll nun die Tatsache ausgenutzt werden, dass alle Teilmengen von N abzählbar sind. Dass eine Menge abzählbar ist bedeutet aber, es gibt eine Funktion, die die natürlichen Zahlen auf diese Menge abbilden. Das motiviert die folgende Definition: Definition 3.5. Eine Teilmenge M der natürlichen Zahlen heißt primitiv rekursiv abzählbar, wenn sie leer ist, oder wenn es eine primitiv rekursive Funktion f gibt, so dass für jedes m M mindestens ein n N existiert, für das f (n) = m ist und f (n) M für alle n gilt. Diese Funktion heißt Abzählung von M . P P P Diese Eigenschaft ist schwächer als die erste und tatsächlich gibt es primitiv rekursiv abzählbare Mengen, die nicht primitiv rekursiv sind. Ein Beispiel zu konstruieren würde zu sehr vom Thema dieser Arbeit weg führen und einen tieferen Einstieg in die Rekursionstheorie erfordern34 , allerdings kann man sich auch so leicht klar machen, warum primitiv rekursive Abzählbarkeit eine deutlich schwächere Eigenschaft ist. Möchte man heraus finden, ob eine Zahl zu einer primitiv rekursiven Menge gehört, muss man diese Zahl nur in eine primitiv rekursive Funktion einsetzen und das Ergebnis ausrechnen und erhält so sicher eine positive oder negative Antwort. Möchte man hingegen herausfinden, ob eine Zahl zu einer primitiv rekursiv abzählbaren Menge gehört, muss man solange natürliche Zahlen in eine primitiv rekursive Funktion einsetzen, bis man die gesuchte Zahl erhält. Im Allgemeinen kann man dabei nicht sagen, wie viele Zahlen man einsetzten muss, bis man eine Antwort erhält. Schlimmer noch, ist die gesuchte Zahl nicht in der Menge, erhält man nie eine Antwort. Man hat keine Möglichkeit festzustellen ob man schlicht noch nicht weit genug gesucht hat, oder ob die Zahl tatsächlich kein Element der Menge ist. Besser ist die Situation, wenn man neben einer Menge auch deren Komplement primitiv rekursiv abzählen kann, was allerdings nicht für jede primitiv rekursiv abzählbare Menge der Fall ist (Oberschelp, 1993, S. 164). Für eine solche Menge kann man für jede Zahl bestimmen, ob sie in der Menge liegt. Zur Konstruktion eines solchen Entscheidungsverfahrens spielt der µ-Operator eine entscheidende Rolle, der wie folgt definiert ist. 34 Ein Beweis findet sich beispielsweise in Soare (1987). 37 Kapitel 3 Berechenbarkeit Definition 3.6. Sei f eine Funktion, die eine Teilmenge von Nn+1 nach N abbildet, dann ist µ f definiert als µ f (x 1 , x 2 , . . . x n ) = y falls f (x 1 , x 2 , . . . x n , y) = 0 und f (x 1 , x 2 , . . . x n , t ) > 0 für alle t < y, undefiniert falls kein solches y existiert Dabei ist zu beachten, dass f (x 1 , x 2 , . . . x n , t ) > 0 auch bedeutet, dass f an dieser Stelle überhaupt definiert ist. Ein paar Bemerkungen zu dieser Definition. Die Aufgabe des µ-Operators ist es, unter den ’Nebenbedingungen’ x 1 , x 2 , . . . x n die kleinste Nullstelle einer Funktion zu finden. Mit den Definitionen aus diesem Abschnitt kann man darunter auch verstehen, dass er die kleinste Zahl y sucht, so dass das Tupel (x 1 , x 2 , . . . x n , y) in einer Menge liegt, oder das kleinste y, so dass P x 1 x 2 . . . x n y wahr wird. Außerdem ist der µ-Operator so definiert, dass er auch auf partielle Funktionen anwendbar ist, also Funktionen, die nicht auf allen natürlichen Zahlen definiert sind. Anderseits kann er auch, wenn auf nicht partielle Funktionen angewendet wird, partielle Funktionen produzieren. Wie wichtig diese Eigenschaft ist, wird sich im nächsten Abschnitt zeigen. Vorher zur Anwendung des µ-Operators bei den primitiv rekursiv abzählbaren Mengen mit einem eben solchem Komplement noch ein paar Worte: Sei f eine primitiv rekursive Abzählung der Grundmenge M und g eine Abzählung von M := N M , dann kann man eine Funktion h definieren, die ’im Zick Zack’ zwischen den beiden Abzählungen hin und her springt. ( f ( x2 ) falls x gerade ist, h(x) = x 1 g ( 2 ) falls x ungerade ist. z Um zu klären ob eine Zahl m in M liegt, muss man nun nur solange aufsteigende Werte in h einsetzen, bis zum ersten mal m erscheint, was irgendwann passieren muss, da M M = N ist. Dann überprüft man, ob das eingesetzte x gerade oder ungerade war. Mathematisch ausgedrückt heißt das: χM (x) = GE R(µ(h x) ), Y wobei GE R die charakteristische Funktion des Prädikats für gerade aus Beispiel 3.3 ist. Da alle an der Konstruktion beteiligten Funktionen, bis auf die einmalige Anwendung des µOperators, berechenbar sind, kann man diese Funktion für jedes x theoretisch mit Stift und Papier berechnen, allerdings ohne dass man im Vorhinein eine Obergrenze für die Anzahl der Rechenschritte geben könnte. Da dies für primitiv rekursive Funktionen stets möglich ist, wenn man die Konstruktion einer Funktion kennt, wäre es überraschend, wenn χM im Allgemeinen primitiv rekursiv wäre. Das motiviert das nächste Kapitel, in dem mit dem µ-Operator eine Funktionenklasse definiert werden soll, die größer ist als die der primitiv rekursiven Funktionen, aber trotzdem noch von Menschen berechenbar. 38 Kapitel 3 Berechenbarkeit 3.3 Rekursive Funktionen und Berechenbarkeit Definition 3.7. Als rekursive Funktionen bezeichnet man alle partiellen Funktionen, die man aus S, I kn und Z per Komposition, primitiver Rekursion und der Anwendung des µ-Operators erhält. Die Menge aller rekursiven Funktionen ist tatsächlich größer als die Menge aller primitiv rekursiven Funktionen, da sie auch partielle Funktionen enthält. Dadurch ist die Konstruktion einer Diagonalfunktion wie in Satz 3.1 nicht möglich, da f n (n) nicht zwangsläufig definiert ist. Damit kommt diese Klasse für die Menge aller berechenbaren Funktionen in Frage und tatsächlich ist auch die Ackermannfunktion rekursiv35 . Zunächst aber eine Reihe von Anmerkungen zu den rekursiven Funktionen: • Rekursive Mengen und Prädikate definiert man analog zu primitiv rekursiven Mengen und Prädikaten: Definition 3.8. Man nennt eine Menge M von Tupeln aus Elementen von N eine rekursive Menge, wenn es eine totale rekursive Funktion f gibt, so dass f (x 1 , x 2 , . . . x n ) = 0 ist, genau dann wenn (x 1 , x 2 , . . . x n ) M gilt. Entsprechend heißt ein Prädikat P kn in einer Struktur A ein rekursives Prädikat, wenn die Menge |P kn | aus A rekursiv ist. P • Rekursive Abzählbarkeit braucht man hingegen nicht extra einführen, da Barkley Rosser bereits in Rosser (1936) gezeigt hat, dass jede Menge, die rekursiv abgezählt werden kann auch primitiv rekursiv abzählbar ist. Entsprechend wird im Weiteren, wenn von primitiv rekursiv abzählbaren Mengen die Rede ist, das primitiv weggelassen, ohne dass sich die Definition ändert. Es gibt allerdings Mengen, die sich mit einer rekursiven Funktion injektiv abzählen lassen, mit einer primitiv rekursiven Funktion allerdings nicht. Ein Beispiel dafür wäre die Ackermannmenge A M = {x|A(n, n, n) = x für ein n N}. Gäbe es nämlich eine primitiv rekursive Funktion die diese Menge injektiv abzählt, wäre A(n, n, n) primitiv rekursiv. P • Tatsächlich liefert die im vorherigen Abschnitt gegebene Konstruktion einer rekursiven Menge aus einer (primitiv) rekursiv abzählbaren Menge mit (primitiv) rekursiv abzählbarem Komplement alle rekursiven Mengen. Anders ausgedrückt, eine Menge ist genau dann rekursiv, wenn sie rekursiv abzählbar ist und ihr Komplement auch (Oberschelp, 1993, S. 164). Nun zu der Frage, ob man mit den rekursiven Funktionen das Ziel erreicht hat, eine Funktionenklasse zu finden, die alle im intuitiven Sinne berechenbaren Funktionen enthält. Wie schon angedeutet wurde, ist dies kaum zu beweisen, da die informelle Vorstellung einer berechenbaren Funktion nicht mathematisch genug ist36 . Allerdings gibt es eine ganze Reihe Hinweise darauf, dass die sogenannte Churchsche These wahr ist, die besagt: 35 36 Der Beweis dazu findet sich zum Beispiel in Oberschelp (1993, S. 104ff). In Enderton (2001, S. 207f) wird diese Aussage mit der Aussage verglichen, alle mit Funktionen, die man zeichnen kann ohne abzusetzen sind stetig, die man wohl ebenfalls kaum beweisen kann. 39 Kapitel 3 Berechenbarkeit Churchsche These. Jede berechenbare Funktion ist rekursiv. Ein erstes, recht simples Argument für die Wahrheit dieser These ist die Tatsache, dass bis heute keine Funktion gefunden wurde, die berechenbar ist, aber nicht rekursiv. Da die Churchsche These mindestens seit 1943 bekannt ist,37 spricht das eindeutig für ihre Richtigkeit. Ein deutlich stärkeres Argument ist die Tatsache, dass ein sehr bedeutender anderer Versuch, alle berechenbaren Funktionen zu charakterisieren, sich als äquivalent herausgestellt hat, nämlich die Turingmaschine. Dabei handelt es sich um das theoretische Modell einer Rechenmaschine, die durch algorithmisches Vorgehen Funktionen berechnen kann. Dieses Modell wurde bereits 1936 von Alan Turing entwickelt (Turing, 1937) und gilt als der theoretische Vorläufer des heutigen Computers (Moret, 1997, S. 93f und S. 99). Bereits in den vierziger Jahren konnte nachgewiesen werden, dass eine Funktion genau dann rekursiv ist, wenn sie von einer Turingmaschine berechnet werden kann(Haaparanta, 2009, S. 489f). Heute weiß man, dass Turingmaschinen und rekursive Funktionen beide äquivalent zu Registermaschinen sind (Boolos u. a., 2002, S. 61), die ein Modell für den heutigen Computer bilden (Moret, 1997, S. 105). Anders ausgedrückt, eine Funktion ist genau dann rekursiv, wenn sie von einem Computer berechnet werden kann.38 Das eigentlich Ziel diese Kapitels war es, die Voraussetzungen für die Definition von Entscheidbarkeit zu liefern. Die rekursiven Funktionen operieren aber nur auf den natürlichen Zahlen. Der Trick, mit dem es trotzdem möglich wird mit Hilfe der rekursiven Funktionen Aussagen über Theorien zu machen besteht darin, Aussagen durch natürliche Zahlen darzustellen. Dieses Verfahren nennt man Gödelisierung und es geht, wie der Name schon sagt, auf Kurt Gödel zurück. Damit kann man nun also sowohl Entscheidbarkeit als auch Vollständigkeit definieren. 37 38 In Kleene (1943) wurde die These bereits unter dem Namen ’Churchsche These’ erwähnt. Zumindest auf alle heute bekannten Computer trifft das zu, einschließlich aller heute bekannten Modelle eines ’Quantencomputers’(Nielsen und L., 2000, S. 202). 40 Kapitel 4 Vollständigkeit und Entscheidbarkeit 4.1 Denitionen 4.1.1 Entscheidbarkeit Um den Begriff der Entscheidbarkeit mathematisch sinnvoll zu definieren, werden in diesem Kapitel alle Ausdrücke mit so genannten Gödelnummern versehen. Es gibt dazu ganz verschiedene Methoden39 . Da aber die genaue Methode der Zuordnung im Weiteren keine Rolle spielt, werden Gödelnummern hier in ihrer maximalen Allgemeinheit eingeführt und dann in Beispielen konkretisiert. Definition 4.1. Eine Sprache S heißt gödelisierbar, wenn es eine Abbildung d e gibt, die jedem Ausdruck s 1 s 2 . . . s n aus Symbolen s 1 , s 2 , . . . s n aus S eine eindeutige Zahl n = ds 1 s 2 . . . s n e aus N zuordnet und es gleichzeitig eine rekursive Funktion G von N2 nach N gibt, so dass stets G(ds k1 s k2 . . . s ki e, ds l 1 s l 2 . . . s l j e) = ds k1 s k2 . . . s ki s l 1 s l 2 . . . s l j e gilt. Diese Zahl bezeichnet man als Gödelnummer von s 1 s 2 . . . s n . Dies ist keine sonderlich exklusive Eigenschaft. Da Sprachen in dieser Arbeit abzählbar definiert sind, ist sogar jede Sprache gödelisierbar. Für überabzählbare Sprachen gilt das allerdings nicht mehr. Satz 4.1. Jede Sprache S ist gödelisierbar. Beweis. Um diesen Satz zu beweisen, wird einfach eine Methode angegeben, mit der man eine beliebige Sprache gödelisieren kann. Diese Methode ist allerdings alles andere als effektiv und die Gödelnummern schon einfacher Ausdrücke werden schnell sehr groß. Da aber nur die Existenz einer passenden Funktion von Interesse ist, ist das kein Problem. Sei M die Teilmenge von N, die alle Zahlen enthält, in denen die Ziffer Null nicht vorkommt und sei f eine surjektive Abbildung von M in die Menge aller Symbole von S. Eine solche Abbildung existiert, da S eine abzählbare Sprache ist. Für alle Symbole s setzt man dann dse gleich k, wobei k die kleinste Zahl ist, so dass f (k) = s gilt. Für Ausdrücke s 1 s 2 . . . s k ist ds 1 s 2 . . . s k e gleich der Zahl, die man erhält, wenn man die Gödelnummern der Symbole 39 So verwenden beispielsweise die vier Bücher Boolos u. a. (2002), Enderton (2001), Goodstein (1971) und Rautenberger (2008) alle sich zum Teil recht deutlich unterscheidende Verfahren der Gödelisierung. 41 Kapitel 4 Vollständigkeit und Entscheidbarkeit s 1 , s 2 , . . . s k mit jeweils einer Null dazwischen hintereinander schreibt und das ganze dann als eine Zahl liest (vergleiche auch Beispiel 4.1), also ds 1 s 2 . . . s k e = ds 1 e0ds 2 e0 . . . ds k e. Offensichtlich ist diese Zuordnung eindeutig. Um die Funktion G zu konstruieren, betrachtet man zuerst die Funktion f (x, y) = x 10 y . Diese Funktion ist dann Null, wenn y größer als die Zahl der Stellen von x ist (außer x ist von der Form 10k , dann muss y nur größer oder gleich sein). Die Funktion g (x) = µ f (x) liefert also die Zahl der Stellen von x plus eins (außer eben x = 10k ). Damit lässt sich G nun als G(x, y) = y + x 10g (y)+1 schreiben. Aus der Konstruktion sieht man auch sofort, dass G rekursiv ist, außerdem kann der Fall y = 10k nicht auftreten, da die den Symbolen zugeordneten Zahlen die Ziffer Null nicht enthalten.40 Als wichtiges Beispiel soll noch eine Gödelisierung der Sprache der Arithmetik betrachtet werden. Beispiel 4.1. Es soll die Methode aus dem Beweis zu Satz 4.1 verwendet werden. Dazu sei f wie folgt definiert: f (1) f (2) f (3) f (4) f (5) f (6) f (7) f (8) f (9) f (11) . . . = 0 1 + v1 v2 ... Dann ist zum Beispiel d e = 1 und d= 00e = 20505. Hier sieht man auch schon, wie schnell die Gödelnummern mit zunehmender Komplexität der Ausdrücke wachsen. ^ D ^ Damit lässt sich nun Entscheidbarkeit definieren. Definition 4.2. Eine Menge von Ausdrücken heißt entscheidbar, wenn die Menge der Gödelnummern der Ausdrücke rekursiv ist. Da eine Theorie eine spezielle Menge von Ausdrücken ist, sind damit auch entscheidbare Theorien definiert. Eine verwandte Menge von Theorien ist die Menge der effektiv axiomatisierbaren41 Theorien: Definition 4.3. Eine Theorie T heißt effektiv axiomatisierbar, wenn es eine entscheidbare Menge von Sätzen ∆ gibt, so dass T (∆) = T ist. Offensichtlich ist jede entscheidbare Theorie auch effektiv axiomatisierbar, da natürlich T (T ) = T ist. Ein einfaches Kriterium für Entscheidbarkeit ist Endlichkeit. Satz 4.2. Jede endliche Menge von Ausdrücken ist entscheidbar. Beweis. Es lässt sich einfach zeigen, dass jede endliche Teilmenge von N rekursiv, eigentlich sogar primitiv rekursiv, ist. Sei M = {e 1 , e 2 , . . . e k } eine endliche Teilmenge von N, dann ist e 1) + (e 1 x)) ((x e 2) + (e 2 x)) . . . ((x e k ) + (e k x)) genau dann null, wenn x in M liegt, da jeder der Terme (x e i ) + (e i x) genau dann f (x) := ((x null ist, wenn x = e i ist. Außerdem ist f primitiv rekursiv, da sie eine Komposition der primitiv rekursiven Funktionen ’ ’ und ’ ’ ist. Da die Menge der Gödelnummern einer endlichen Menge von Ausdrücken offensichtlich endlich ist, ist sie also rekursiv, die Menge der Ausdrücke also entscheidbar. 40 41 Eine ganz ähnliche Methode der Gödelisierung wird auch in Boolos u. a. (2002, S. 188) verwendet. Diese Bezeichnung für derartige Theorien stammt aus Enderton (2001). 42 Kapitel 4 Vollständigkeit und Entscheidbarkeit Bevor der Begriff der Entscheidbarkeit genauer betrachtet wird, soll der Begriff der Vollständigkeit einer Theorie eingeführt werden. 4.1.2 Vollständigkeit Die Definition der Vollständigkeit ist erheblich einfacher. Sie kam in dieser Arbeit sogar schon vor, ohne dass der Name Vollständigkeit dafür gefallen wäre. Es handelt sich um die Eigenschaft (H1) einer Henkin-Theorie, also: Definition 4.4. Eine Theorie T heißt vollständig, wenn für jeden Satz A genau dann A gilt, wenn A ∉ H gilt. PH Damit ist auch gleich der erste Satz über vollständige Theorien gegeben: Satz 4.3. Jede widerspruchsfreie Theorie lässt sich zu einer vollständigen Theorie erweitern. Beweis. Der Satz entspricht 2.13. Zunächst ist dieser Satz sehr erfreulich. Es ist theoretisch möglich, jede konsistente Menge von Sätzen in eine vollständige Theorie einzubetten. Entwickelt man also eine mathematische Theorie in einer abzählbaren Sprache der Prädikatenlogik erster Stufe, sollte es möglich sein, diese Theorie so lange um Sätze zu erweitern, bis sie vollständig ist, das heißt jeder, in dieser Sprache formulierbare Satz ist entweder in der Theorie oder widerspricht ihr. Allerdings ist dabei zu beachten, dass der Begriff der Theorie, wie er hier verwendet wird, extrem schwach ist, da nicht zwangsläufig eine Methode gegeben werden kann, mit der zu entscheiden ist, ob eine Formel zu einer Theorie gehört oder nicht, eine Theorie muss also der Definition nach nicht entscheidbar sein. Lässt sich dieses Problem lösen? Lässt sich also zu jeder Theorie oder wenigstens zur Arithmetik ein Entscheidungsverfahren finden? Diese Frage nennt man auch das ’Entscheidungsproblem’. Dieser Begriff erscheint das erste Mal 1921 in einem Vortrag von Heinrich Behmann in Göttingen, die Fragestellung geht aber eigentlich auf David Hilbert zurück42 und entwickelte sich aus seiner Überzeugung, dass es in der Mathematik keine unbeantwortbaren Fragen geben darf (Haaparanta, 2009, S. 380 und S. 382), die er auf dem Mathematiker-Kongress 1900 in Paris mit den folgenden Worten ausdrückte: „Diese Überzeugung von der Lösbarkeit eines jeden mathematischen Problems ist uns ein kräftiger Ansporn während der Arbeit; wir haben in uns den steten Zuruf: Da ist das Problem, suche die Lösung. Du kannst sie durch reines Denken finden; denn in der Mathematik gibt es kein Ignorabimus43 .“ (Hilbert, 1900, S. 262) 42 Die Suche nach einer allgemeinen Entscheidungsmethode für Sätze in einer formalen und symbolischen Sprache lässt sich eigentlich sogar bis zu Leibniz zurück verfolgen, allerdings war die Logik zu seiner Zeit noch nicht weit genug fortgeschritten um das Problem ernsthaft zu bearbeiten und Leibniz Einlassungen zu dem dem Thema sind „keineswegs immer klar“(Hermes, 1969, S. 96). (Börger u. a., 1997, S. 4) 43 Kapitel 4 Vollständigkeit und Entscheidbarkeit Um 1920 konnten einige Erfolge in Richtung einer positiven Lösung des Entscheidungsproblems erzielt werden. So konnte Behmann 1922 nachweisen, dass die Prädikatenlogik ohne Funktionssymbole und mit nur einstelligen Prädikaten entscheidbar ist. In dieser Zeit wurde das Entscheidungsproblem von vielen bedeutenden Logikern, wie Hilbert, Ackermann und Ramsey, als die zentrale Frage der mathematischen Logik eingestuft (Börger u. a., 1997, S.3). 1930 konnte dann aber Kurt Gödel zeigen, dass es unentscheidbare Sätze in der Arithmetik gibt und 1936 konnte Alonzo Church und 1937 unabhängig davon Alan Turing nachweisen, dass die Prädikatenlogik unentscheidbar ist. (Haaparanta, 2009, S. 401f). Um diese negative Antwort auf das Entscheidungsproblem geht es im nächsten Abschnitt. 4.2 Unentscheidbare Theorien „Es hat einer von ihnen gesagt, ihr eigener Prophet: Die Kreter sind immer Lügner, böse Tiere und faule Bäuche“ (Apostel Paulus)44 Die Methode zur Konstruktion unentscheidbarer Theorien, die hier verwendet werden soll, geht auf Alfred Tarskis Monographie Undecidable Theories (Tarski u. a., 1953) zurück, die die Idee des berühmten Gödelschen Unvollständigkeitssatzes verallgemeinert (Tarski u. a., 1953, S. 48). Die Darstellung der Methode richtet sich im Folgenden vor allem nach Tarski u. a. (1953) und Boolos u. a. (2002). Zuerst muss dazu die Definition einer (rekursiven) Funktion der Sprache der Logik zugänglich gemacht werden. Bisher wurden mit einer alltagssprachlichen Definition von Funktionen Aussagen über die Prädikatenlogik getroffen, nun sollen Funktionen in der Prädikatenlogik dargestellt werden. Als Vorbereitung soll es um die Darstellbarkeit von Teilmengen von N gehen. Definition 4.5. Sei T eine Theorie und {t 0 , t 1 , . . . t k , . . .} eine abzählbare Menge von paarweise verschiedenen Termen in der Sprache dieser Theorie, die keine Variablen enthalten und zu denen es eine rekursive Funktion t gibt, so dass t (n) stets die Gödelnummer des Terms t n ist. Eine Teilmenge U von N heißt definierbar in T , wenn es eine Formel A mit nur einer freien t t Variablen v k gibt, so dass vk A T ist, falls k U gilt und vk A T ist, falls k ∉ U gilt. k P P k P Die Idee, die natürlichen Zahlen durch Terme ohne Variablen darzustellen, ist eine Verallgemeinerung der Standarddarstellung über die Funktion S und die Konstante 0 in der Sprache der Arithmetik mit Nachfolgerfunktion. Also der Darstellung 0 = 0, 1 = S0, 2 = SS0 und so weiter. Betrachtet man in dieser Sprache eine Theorie, für die die natürlichen Zahlen ein Modell sind, kann man die Standarddarstellung wie oben wählen, also t 0 = 0, t 1 = S0 und so weiter. Dann lässt sich zum Beispiel die Menge {0, 1, 2} definieren durch < (v 1 , SSS0). An dem Beispiel sieht man auch, dass eine hinreichende Bedingung für die Existenz solcher Terme in einer Sprache S eine Konstante und eine einstellige Funktion sind. Kennt 43 Der Ausdruck Ignorabimus bezieht sich auf eine Rede von Emil Heinrich Du Bois-Reymond über die Grenzen der Naturerkenntnis und ist lateinisch für „wir werden nicht wissen“. Diese Rede von 1872 löste eine extrem kontroverse Debatte darüber aus, ob es prinzipiell unlösbare Fragen in den Naturwissenschaften gibt. (Bayertz u. a., 2012, S. VII) 44 Zitiert nach Sainsbury (2001, S. 168), als Anspielung auf das berühmte Lügnerparadoxon, dem eine ähnliche Idee zu Grunde liegt wie dem Hauptbeweis des folgenden Abschnitts. 44 Kapitel 4 Vollständigkeit und Entscheidbarkeit man die Göddelnummer dieser beiden Symbole, kann ohne Probleme eine Funktion t mit den gewünschten Eigenschaften konstruiert werden. Diese Definition lässt sich auch auf Funktionen erweitern, wird dabei allerdings durch die Mehrstelligkeit etwas weniger anschaulich. Definition 4.6. Sei T eine Theorie und {t 0 , t 1 , . . . t k , . . .} eine abzählbare Menge von Termen wie oben. Eine Funktion f von Nn nach N heißt dann definierbar in T , wenn es eine Formel A T tk tk t tl mit n + 1 freien Variablen v 1 , v 2 , . . . v n+1 gibt, so dass v 11 v 22 . . . vknn v n+1 A ein Element von T ist, P t k1 t k2 v1 v2 wenn f (k 1 , k 2 , . . . k n ) = l ist, l ist. ... t kn t l v n v n+1 A ein Element von T ist, wenn f (k 1 , k 2 , . . . k n ) Wählt man eine Theorie in der Sprache der Arithmetik mit Nachfolgerfunktion wie oben, ist eine mögliche Formel zur Definition von ’+’ mit der Standartdarstellung +(v 1 , v 2 ) = v 3 . Als nächstes soll die so genannte Diagonalfunktion eingeführt werden, die im Zentrum dieses Abschnitts stehen wird. Definition 4.7. Als Diagonalfunktion D einer Sprache S mit Termen t 0 , t 1 , . . . t k , . . . wie oben bezeichnet man eine Funktion von N nach N, die für eine Gödelisierung von S die folgende Bedingung erfüllt: D ^ = v 1 tn Ae falls ein A existiert, so dass dAe = n ist. D(n) = d v 1 Die Werte für Zahlen, die keine Gödelnummern sind, spielen keine Rolle. Zwar ist die Diagonalfunktion für alle Formeln A definiert, am interessantesten ist sie aber für den Fall, dass v 1 in A frei vorkommt. Dann ’sagt’ die Formel v 1 = v 1 t n A nämlich, dass die Formel A für den Repräsentanten ihrer eigenen Gödelnummer wahr ist. Diese Aussage ließe sich auch kürzer schreiben als vtn1 A, was aber beweistechnische Nachteile hätte45 . Es D ^ D ^ lässt sich aber festhalten, dass v 1 = v 1 t n A genau dann wahr ist, wenn auch vtn1 A wahr ist. Des Weiteren kann eine Diagonalfunktion, für alle n, die Gödelnummern sind, natürlich berechnet werden, nach der Churchschen These müssten sie also zumindest partiell rekursiv sein. Dem ist auch so: Satz 4.4. Es gibt in jeder gödelisierten Sprache rekursive Diagonalfunktionen. Beweis. Man erhält die Funktion einfach durch das mehrmalige Ausführen der Funktion G. Dazu definiert man D als: D ^ D(n) := G(d e,G(dv 1 e,G(d e,G(d=e,G(dv 1 e,G(t (n), n)))))). So erhält man eine Funktion, die nur von n abhängt und offensichtlich eine Diagonalfunktion ist. Zu beachten ist, dass G und t so definiert sind, dass D(n) für jedes n ein Ergebnis liefert, auch wenn nur bestimmte n ’interessante’ Ergebnisse liefern. 45 Tatsächlich ließt man auch häufig vtn1 A als Definition der Diagonalfunktion. Welche Form vorteilhafter ist hängt davon ab, wie man bis zu dieser Definition den Stoff aufgebaut hat. 45 Kapitel 4 Vollständigkeit und Entscheidbarkeit Da die Diagonalfunktionen auf allen n, die Gödelnummern sind, übereinstimmen, sind alle Diagonalfunktionen auf dieser Menge rekursiv berechenbar. Satz 4.5. Sei T eine widerspruchsfreie Theorie in einer gödelisierten Sprache S; dT e die Menge der Gödelnummern aller Sätze aus T und eine Diagonalfunktion D bezüglich der Gödelisierung von S. Dann sind dT e und D nicht beide in T definierbar. Die Kernidee des Beweises ist es, unter der Annahme, dass beide definierbar sind, in der Theorie einen Satz zu konstruieren, die besagt, dass D(n) für ein gewisses n nicht in dT e liegt. Der Satz besagt also: Ersetzt man in der Formel mit der Gödelnummer n, falls sie v 1 als freie Variable hat, diese durch den Term t n , ist die Formel, die man erhält nicht in T . Die Formel, die man dazu konstruiert hat, hat selber genau eine freie Variable. Setzt man für diese Variable die Gödelnummer der Formel ein, erhält man einen Satz in einer Theorie, der über sich selbst sagt, dass er nicht in der Theorie ist. So kann man die Annahme, dass D und dT e in einer Theorie definierbar sind, auf einen Widerspruch führen. Beweis. Angenommen dT e und D wären definierbar, dann gäbe es nach Definition Formeln A und B , so dass die folgenden Aussagen wahr wären: 1. A hat v 1 und v 2 als einzige freie Variablen und definiert D. Also gilt 2. A P T für D(n) ist. B ist ein Element von T , falls n P dT e ist, wobei v 3 die einzige freie Variable von B alle n und tn v3 tn tm v1 v2 P t n t D(n) v1 v2 A T , falls m ist. 3. tn v3 B ist ein Element von T , falls n ∉ dT e ist, wobei v 3 die einzige freie Variable von B ist. Man betrachte nun die Formel C := Dv 2 ^ A vv 2 B. 3 Diese Formel besagt, dass es keinen Wert für v 2 gibt, so dass A und vv 23 B gleichzeitig wahr sind. Anders gesagt, der ’Ausgabewert’ der Diagonalfunktion ist nicht in dT e. Die durch die Diagonalfunktion beschriebene Formel ist also nie in T . Sei nun m = dC e, dann lässt sich der Satz tm tm v 2 C= v2 A B (4.) v1 v1 v3 D ^ konstruieren. Angenommen, dieser Satz ist ein Element von T . Dann darf D D ^ T liegen, da sonst mit ( 1) auch v 2 tm v1 A vv 23 B t tm v2 v1 ^ A vv 2 3 B (5.) für kein t in in T wäre, was einen Widerspruch erzeugen würde. Ist t t D(m) , so ist vt2 tvm1 A in T , was (5.) widerspricht. Ist aber t = t D(m) , so ist t t tm A T , also darf nicht auch vt3 B T gelten. Nach (2.) und (3.) ist dann also D(m) B T. v2 v1 v3 tm tm Sei nun anderseits v 1 C kein Element von T . Äquivalent dazu ist, dass d v 1 C e nicht in dT e P P P ist. Nach den obigen Ausführungen über D(n) ist aber, da dC e = m ist, D(m) genau dann 46 Kapitel 4 Vollständigkeit und Entscheidbarkeit in dT e, wenn auch d tvm1 C e in dT e ist. Das heißt D(m) ist nicht in dT e, was nach (3.) bedeutet, dass t D(m) B v3 t D(m) B v3 ein Element von T ist. Also ist tm v1 C in jedem Fall ein Element von T . Das bedeutet, dass auf jeden Fall in T ist, denn für v 2 t D(m) ist tvm1 A nicht wahr und für v 2 = t D(m) ist nach dem oben Gesagtem vv 23 B nicht wahr. Es existiert also kein v 2 , so dass beide Formeln wahr sind, was genau die Aussage von D(m) genau dann in dT e, wenn auch d tvm1 C e tm v1 C ist. Da aber wie gesagt t D(m) v3 B P P t D(m) T . Aus v3 B t D(m) und v3 B T in dT e ist, ist dann nach (2.) P T der Annahme, dT e und D seien in T definierbar, folgt also, dass sind, T also nicht widerspruchsfrei ist. Da T aber als widerspruchsfrei angenommen wurde, können nicht gleichzeitig dT e und D in T definierbar sein. Was bedeutet dieser Satz? Auf den ersten Blick scheint der Satz nicht sehr bedeutend, aber zusammen mit Satz 4.4 folgt fast sofort die folgende sehr starke Aussage: Korollar 4.6. Sind in einer Theorie T alle rekursiven Funktionen definierbar, ist T unentscheidbar. Beweis. Nach Satz 4.4 gibt es eine rekursive Diagonalfunktion D, die dann also in T definierbar ist. Angenommen T wäre entscheidbar, dann wäre die charakteristische Funktion χdT e rekursiv, also auch in T definierbar. Ist dann A die Formel mit den freien Variablen v 1 und v 2 , die χdT e definiert, so definiert vt02 A die Menge dT e. Das widerspricht aber Satz 4.5, also ist T unentscheidbar. Damit ist das Entscheidungsproblem für allgemeine Theorien negativ beantwortet. Das ’schlimme’ an diesem Satz ist, dass die hier gegebene Bedingung für Unentscheidbarkeit alles andere als obskur ist. Rekursive Funktionen sind berechenbar, also kann es keine entscheidbare Theorie geben, die es erlaubt, über alle berechenbaren Funktionen auf den natürlichen Zahlen zu sprechen. Das bedeutet auch, dass eine Theorie der Arithmetik, die entscheidbar ist, nicht alle berechenbare Funktionen definieren kann. Für eine vollständige Formalisierung der Arithmetik, wie sie sich Hilbert erträumt hat, ist das eine nicht hinzunehmende Einschränkung. Anders ausgedrückt, eine vollständige Formalisierung der Arithmetik ist unentscheidbar. Hilberts Programm ist also nicht durchführbar. Dem gegenüber steht aber das positive Resultat von Satz 4.3, dass sich jede widerspruchsfreie Theorie zu einer vollständigen Theorie erweitern lässt. Im nächsten Abschnitt wird nun gezeigt, dass schon geringe Zusatzanforderungen an die Theorie diese Erweiterung unmöglich machen. Dazu wird der enge Zusammenhang zwischen den beiden titelgebenden Begriffen dieser Arbeit aufgezeigt, der bei effektiv axiomatisierbaren Theorien besteht. 4.3 Axiomatisierbare Theorien Das Ziel dieses Kapitels ist es, die enge Verknüpfung zwischen der Entscheidbarkeit einer Menge von Axiomen und der Entscheidbarkeit einer Theorie mit diesen Axiomen zu zeigen. Dazu sind vier Vorarbeiten zu leisten: Erstens wird ein vollständiges logisches Kalkül eingeführt, das nur eine Schlussregel hat, um den weiteren Beweis zu erleichtern. Zweitens werden Methoden aufgezeigt, aus der Struktur eines Prädikats auf dessen Rekursivität 47 Kapitel 4 Vollständigkeit und Entscheidbarkeit zu schließen, drittens werden endliche Folgen von Formeln gödelisiert und viertens wird gezeigt, dass die Menge der Formeln und die Menge der Sätze entscheidbar sind. Für den ersten Schritt reicht die abstrakte Existenz eines vollständigen Kalküls mit einer entscheidbaren Axiomenmenge und der Schlussregel Modus Ponens. Der Beweis für die Existenz eines solchen Kalküls wird hier nur angedeutet, da ein ausführlicher Beweis sehr umfangreich wäre, ohne neue, an sich interessante Ergebnisse zu liefern, da ein vollständiges Kalkül ja bereits in den Abschnitten 1.3 und 2 ausführlich besprochen wurden.46 Satz 4.7. Es gibt ein vollständiges Kalkül mit einer entscheidbarer Axiomenmenge Λ, das nur die Schlussregel Modus Ponens (MP) verwendet. Tatsächlich gibt es eine ganze Reihe solcher Kalküle. Eine ausführliche Diskussion eines solchen Kalküls findet sich zum Beispiel in Enderton (2001, S 107ff). Für den Beweis dieses Satzes kann nun ausgenutzt werden, dass die Eigenschaften eines Kalküls, die für einen Beweis des Vollständigkeitssatzes hinreichend sind, in dieser Arbeit in einem eigenen Abschnitt gesammelt wurden. Beweis. Es sei noch einmal an das Kapitel 2 erinnert und den Abschnitt „Eigenschaften des Kalküls“. Wie dort dargelegt wurde, reicht es für ein Kalkül, die Sätze dieses Abschnitts, so wie den Endlichkeitssatz und den Modus Ponens, zu beweisen, um vollständig zu sein. Im folgenden wird nun ein Kalkül K skizziert, das diese Sätze erfüllt und die geforderten Eigenschaften hat. K hat nur (MP) als Schlussregel und ’beweist’ damit sofort den Modus Ponens. Da (MP) bei jeder Anwendung nur zwei Formeln als Voraussetzung braucht und ein Beweis nur endlich viele Schritte haben darf, gilt auch sofort der Endlichkeitssatz für K . Damit die Lemmata 2.3 - 2.5, die Aussagen über das ’=’ Symbol machen, für K gelten, muss man einige Axiomen zu Λ hinzufügen. So sagt Lemma 2.3 unter anderem, dass ’=’ symmetrisch ist, was beispielsweise durch das Axiom = v 1 v 2 = v 2 v 1 garantiert47 werden kann. Analog geht man für die restlichen Aussagen der Lemmata 2.3 - 2.4 vor. Bei Lemma 2.5 ist zu beachten, dass man unendlich viele Axiome braucht, da man für jede Funktion und jedes Prädikat eine eigene Formel braucht. Für die einstellige Funktion f k1 fügt man beispielsweise die Formel = v 1 v 2 = f k1 v 1 f k1 v 2 zu Λ hinzu. Die Formeln zu den übrigen Funktionen haben die selbe Form, werden aber für mehrstellige Funktionen deutlich länger und unübersichtlicher. Für die Prädikate geht man analog vor. Dass Λ nach dem Hinzufügen dieser Formeln immer noch entscheidbar ist, soll hier nicht bewiesen werden. Da man aber offensichtlich ohne Probleme durch Ansehen einer Formel bestimmen kann, ob sie eines dieser Axiome ist, wäre es ein Widerspruch zur Churchschen These, wenn Λ durch die Hinzunahme dieser Formeln unentscheidbar werden würde.48 Das nächste Lemma, Lemma 2.6, besagt, dass für eine widerspruchsfreie Theorie T und einen Satz A stets T A gilt, wenn T A nicht konsistent ist. Damit dieses Lemma auch für K gilt, kann man zum Beispiel alle Formeln der Form A A mit einer Formel A zu ^ ^ $ Y ^ 46 Der folgende Abschnitt richtet sich vor allem nach Boolos u. a. (2002) und Rautenberger (2008). Diese Formel besagt, dass es nicht möglich ist, dass = v 1 v 2 gilt, aber nicht = v 2 v 1 . Das entspricht offensichtlich der Symmetrie von ’=’ 48 Ein solches Argument bezeichnet man auch als Beweis per Churchscher These. Dieses Vorgehen ist in der Literatur nicht unüblich (Oberschelp, 1993, S. 144). 47 48 Kapitel 4 Vollständigkeit und Entscheidbarkeit ^ ^ ^ Λ hinzufügen, außerdem alle Formeln der Form49 A B A B für Formeln A 50 A B A C A BC für Formeln A, B und C . Bei allen diesen und B und Formeln handelt es sich um Tautologien. Mit diesen Formeln lässt sich Lemma 2.6 nun recht schnell für K beweisen: Das T A nicht konsistent ist, bedeutet gerade, dass es einen Satz B gibt, so dass T AB und T A B gilt. Für dieses B ist dann nach Konstruktion auch A B AB A B B ein Satz in Λ. Einmaliges Anwenden von (MP) liefert dann AB A B B und nochmaliges Anwenden A B B . Da der Satz A B B B B A nach Konstruktion ebenfalls in Λ ist, kann man per (MP) auch B B A beweisen. Zum Abschluss verwendet man den Satz B B aus Λ um mit einer letzten Anwendung von (MP) A zu beweisen. Die folgenden beiden Lemmata 2.7 und 2.8 hängen nicht von dem Kalkül ab, für diese muss also nichts gezeigt werden. Lemma 2.9, das Verfahren der Konstantenelimination, gilt offensichtlich für den Modus Ponens, wie man schnell sieht, wenn man sich den Beweis in Abschnitt 2 noch einmal anschaut. Lemma 2.10 folgt unabhängig von dem gewählten Kalkül aus Lemma 2.9. Damit bleibt nur Lemma 2.11. Dieses besagt, dass eine Menge von Sätzen ∆ nicht konsistent ist, wenn sich aus ihr der Satz v k A vc A schließen lässt, wobei c weder in ∆ noch k in A vorkommt und v k frei in A ist. Dieser Satz gilt offensichtlich, wenn man alle Formeln v der Form v k A v l A als Axiome setzt. Da man mit Lemma 2.9 aus v k A vc A direkt ^ ^ ^ ^ ^ ^ Y $ ^ $ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^D ^Dv k A vl vk ^D ^D k k A mit einer passenden Variablen v l schließen kann, hat man so direkt einen Widerspruch. Es bleibt zu zeigen, dass K korrekt ist. Der Modus Ponens ist korrekt, da er sich in dem korrekten Kalkül des natürlichen Schließens ableiten lässt. Damit das ganze Kalkül korrekt ist, müssen auch alle Axiome allgemeingültig seien, was der Fall ist, wie sich leicht nachweisen lässt, beispielsweise in dem man die Axiome mit dem Kalkül des natürlichen Schließens beweist. Für den zweiten Schritt ist noch eine naheliegende Definition notwendig, nämlich die einer rekursiven Formel. Diese ist ganz analog zu der Definition eines rekursiven Prädikats. P Definition 4.8. Eine Formel A mit den k N freien Variablen v 1 , v 2 , . . . v k heißt rekursiv in einer Struktur A, wenn |A| N ist und es eine rekursive Funktion f A gibt, so dass genau dann f A (n 1 , n 2 , . . . n k ) = 0 für n 1 , n 2 , . . . n k N ist, wenn A für jede Belegung wahr ist, für die s(v i ) = n i ist und primitiv rekursiv, wenn f A sogar primitiv rekursiv ist. Man nennt f A auch die darstellende Funktion von A. P Diese Definition liefert sofort eine Reihe von Kriterien, um zu bestimmen, ob eine Formel (primitiv)51 rekursiv ist. 49 In klassischer Schreibweise (A Ñ B ) Ñ ( B Ñ A). Diese Formel erlaubt es also, die bekannte Umkehrung der Implikation per Modus Ponens zu schließen. 50 In klassischer Schreibweise (A Ñ B ) Ñ ((A Ñ C ) Ñ (A Ñ (B ^ C ))). Folgen aus einer Formel A die Formeln B und C kann man mit dem Modus Ponens und dieser sehr unübersichtlichen Formel schließen, dass aus A auch die Formel B ^ C folgt. 51 Die folgenden Ausführungen sind alle für primitiv rekursive und für rekursive Formeln richtig. Damit man nicht jeden Satz zweimal formulieren muss, wird diese Schreibweise verwendet. 49 Kapitel 4 Vollständigkeit und Entscheidbarkeit Satz 4.8. Sei P ein (primitiv) rekursives Prädikat und A und B (primitiv) rekursive Formeln in einer Struktur A, dann sind die Formeln P , A und AB in A ebenfalls (primitiv)rekursiv. ^ Beweis. Dass P (primitiv) rekursiv ist, bedeutet dass die Menge |P | in der Struktur A diese Eigenschaft hat, was bedeutet, dass die charakteristische Funktion von |P | (primitiv) rekursiv ist. Da P genau dann wahr ist, wenn s(v i ) |P | für alle Variablen von P gilt und offensichtlich alle Variablen von P frei sind, ist die charakteristische Funktion von |P | die darstellende Funktion von P . Also ist P eine (primitiv) rekursive Formel. Seien f A und f B die (primitiv) rekursiven Funktionen zu den Formeln A und B . Die zusammengesetzten Funktionen f A (n 1 , n 2 , . . . n k ) := 1 f A (n 1 , n 2 , . . . n k ) und f ^ AB (n 1 , n 2 , . . . n k ) := f A (n 1 , n 2 , . . . n k ) + f B (n 1 , n 2 , . . . n k ) sind dann auch (primitiv) rekursiv. Da f A offensichtlich genau dann null ist, wenn A nicht wahr ist, also A wahr ist, bedeutet das, dass A (primitiv) rekursiv ist. Das selbe gilt für f ^ AB und AB . P ^ Damit sind alle Formeln (primitiv) rekursiv, die sich aus (primitiv) rekursiven Prädikaten und den Symbolen und zusammensetzen. Was ist aber mit dem Existenzquantor ? Hier gilt diese Aussage nicht uneingeschränkt, sondern nur, wenn man die Reichweite des Quantors einschränkt. ^ D Satz 4.9. Ist A eine (primitiv) rekursive Formel in Struktur A mit dem zweistelligen Prädikat < mit seiner normalen Interpretation in den natürlichen Zahlen, dann ist die Formel v k < v k t A mit einem Term t , in dem nur Funktionen vorkommen, deren Interpretation in A (primitiv) rekursiv ist, (primitiv) rekursiv. D ^ D ^ Beweis. Um eine primitiv rekursive Funktion zu konstruieren, die v k < v k t A darstellt, kann man die Summenfunktion Σni=0 f (n 1 , n 2 , . . . , n k , i ) benutzen. Diese ist primitiv rekursiv, falls f primitiv rekursiv ist. In diesem Fall lässt sich Σni=0 f (n 1 , n 2 , . . . , n k , i ) nämlich als Funktion Sum f (n 1 , n 2 , . . . , n k , n) mittels primitiver Rekursion definieren, indem man Sum f (n 1 , n 2 , . . . , n k , 0) = 0 setzt, sowie Sum f (n 1 , n 2 , . . . , n k , S(n)) = Sum f (n 1 , n 2 , . . . , n k , n) + f (n 1 , n 2 , . . . , n k , S(n)). Sei nun f A (n 1 , n 2 , . . . , n k , y) die darstellende Funktion von A, wobei y durch v k dargestellt wird und außerdem h(n l 1 , n l 2 , . . . n l i ) die (primitiv) rekursive Funktion, die für jede Belegung s den Wert von t bestimmt, dann wird v k < v k t A durch die Funktion g := Sum 1 f A (n 1 , n 2 , . . . , n k , h(n l 1 , n l 2 , . . . n l i )) dargestellt, ist also primitiv rekursiv. D ^ Nun zu dem dritten Schritt, in dem es darum geht, Folgen von Formeln zu gödelisieren. Dabei soll es aber möglich sein, auf primitiv rekursive Weise festzustellen, welche Formel an der k-ten Position der Folge steht. Definition 4.9. Eine Gödelisierung von Folgen ist eine Abbildung, die jeder endlichen Folge von Zahlen n 1 , n 2 , . . . n k eine eindeutige Zahl dn 1 n 2 . . . n k e auf eine Weise zuordnet, dass es primitiv rekursive Funktionen l und p i mit den folgenden Eigenschaften gibt: l (dn 1 n 2 . . . n k e) = k und p( j , dn 1 n 2 . . . n k e) = ( ni für alle Folgen n 1 , n 2 , . . . n k . 50 0 falls j ¤ k ist falls j > k ist Kapitel 4 Vollständigkeit und Entscheidbarkeit Ist es möglich eine solche Abbildung zu finden? Dass dies der Fall ist, beweist man einfach dadurch, dass man ein Beispiel angibt. Genau das wird dann auch im Beweis des nächsten Satzes getan. Satz 4.10. Es gibt Gödelisierungen für Folgen. Beweis. Sei p 1 , p 2 , . . . p k , . . . die Folge aller Primzahlen in aufsteigender Reihenfolge geordnet. n n Eine mögliche Methode der Gödelisierung ist, jeder Folge n 1 , n 2 , . . . n k die Zahl p 1k p 2 1 p 3 2 nk . . . p k+1 zuzuordnen52 . Diese Abbildung ist offensichtlich eindeutig, da bekanntermaßen jede Primfaktorzerlegung eindeutig ist. Da die Funktion |(2k , n) primitiv rekursiv ist, wie bereits in Beispiel 3.3 gezeigt wurde, ist die Funktion l (n) := Σni=0 (1 |(2i , n)) nach den Ausführungen aus dem Beweis zu Satz 4.9 auch primitiv rekursiv. Da |(2i , n) genau dann null ist, wenn 2i ein Teiler von n ist, ist 1 |(2i , n) genau in diesem Fall eins, sonst null. Außerdem ist 2n > n, also kein Teiler von n. Die Funktion l gibt also das größte k an, sodass 2k ein Teiler von n ist. Nach der Definition der Gödelisierung ist das aber genau die Länge der abgebildeten Folge, l erfüllt also die geforderte Eigenschaft. Um die Funktion p zu konstruieren braucht man zuerst ein paar Hilfsfunktionen. Da man aus Beispiel 3.3 weiß, dass das Prädikat | primitiv rekursiv ist, folgt aus den Sätzen 4.8 und 4.9, dass auch die Formel P r i m := v 1 < +(v 1 , 2)v 2 | + (v 1 , 2)v 2 in N primitiv rekursiv ist, die genau dann wahr ist, wenn v 2 eine Primzahl ist. Mit der selben Begründung ist auch die Formel P r i m k := < v 3 v 2 P r i m in N primitiv rekursiv, die genau dann wahr ist, wenn v 2 eine Primzahl größer v 3 ist, und auch v4 < v 4 v 2 vv 42 P r i m k P r i m k die genau dann wahr ist, wenn v 2 die kleinste Primzahl größer als v 3 ist. Es gibt also eine primitiv rekursive Funktion f P (k, n), die genau dann null ist, wenn n die kleinste Primzahl größer als k ist. Mit dieser Funktion lässt sich leicht eine primitiv rekursive Funktion P R(k) konstruieren, die k auf die k-te Primzahl abbildet, in dem man P R durch P R(0) := 0 und P R(k + 1) = f P (P R(k)) definiert. Wiederholt man nun die Konstruktion von l , nur dass man überall statt 2 die Funktion p( j + 1) setzt, erhält man eine primitiv rekursive Funktion p( j , n), die angibt, wie oft p j +1 die Zahl n teilt. Das entspricht aber für n = dn 1 n 2 . . . n k egenau dem j -ten Eintrag der Folge n 1 , n 2 , . . . n k . Damit hat p die geforderten Eigenschaften. D ^ ^ D ^^ Mit einer ganz ähnlichen Methode kann man nun auch die wichtige Aussage zeigen, dass die Mengen der Terme, der Formeln und der Sätze einer Sprache entscheidbar sind. Satz 4.11. Es gibt zu jeder Sprache eine Gödelisierung, so dass es eine einstellige rekursive Funktion Tr (n) gibt, die genau dann null ist, wenn n die Gödelnummer eines Terms ist, eine einstellige rekursive Funktion F r (n), die genau dann null ist, wenn n die Gödelnummer einer Formel ist und eine einstellige rekursive Funktion Sa(n), die genau dann null ist, wenn n die Gödelnummer eines Satzes ist. Beweis. Man definiert zuerst eine recht mächtige Gödelisierung53 , die wie folgt aussieht: 52 53 Eine ganz ähnliche Gödelisierung wird in Boolos u. a. (2002, S. 193) gegeben. Die Gödelisierung ist aus Boolos u. a. (2002, S. 193), der Rest des Beweises ist motiviert durch den Beweis des Satzes aus Adler (2012, S. 25f), der mit Loop-Programmen arbeitet. Da sich aber alle Loop-Programme durch primitiv rekursive Funkionen darstellen lassen (Adler, 2012, S. 9f), ist eine Version dieses Beweises auch hier möglich. 51 Kapitel 4 Vollständigkeit und Entscheidbarkeit 2 5i 22 3n 5k+1 23 32 5 23 3n 5k vi f kn = P kn Damit ordnet man jedem Symbol eine eindeutige Zahl zu. Betrachtet man eine Aussage als endliche Folge von Symbolen, kann man mit dieser Zuordnung jede Aussage also als endliche Folge natürlicher Zahlen betrachten. Diese Folge gödelisiert man nun mit einer Gödelisierung für Folgen, wie sie nach Satz 4.10 existiert. Als erstes zeigt man, dass die Menge der ’Primterme’ T R p entscheidbar ist, die alle Variablen und alle Konstanten enthält. Da nach Konstruktion diese Menge genau den Gödelzahlen entspricht, die durch 2 teilbar sind, aber nicht durch 23 und 3, wird diese Menge in einer Sprache mit dem zweistelligen Prädikat | und den Konstanten 2, 3 und 8 offensichtlich durch |2v 1 |3v 1 |8v 1 dargestellt. Interpretiert man alle Symbole naheliegend, so ist diese Formel offensichtlich primitiv rekursiv. Nun sollen daraus Terme zusammengesetzt werden. Um zu überprüfen, ob die Terme richtig gebildet wurden, geht man ähnlich vor wie Kapitel 1 in Satz 1.1. Die Idee, die umgesetzt werden soll, ist die, dass ein Ausdruck genau dann ein Term ist, wenn er nur aus Variablen und Funktionen besteht, und jede Funktion genau so viele Eingaben bekommt wie sie Stellen hat. Dazu konstruiert man eine Funktion, die von hinten durch den Ausdruck geht und für jede Variable einen Zähler um eins erhöht und für jede Funktion den Zähler um deren Stelligkeit weniger eins erniedrigt. Ist ein Symbol keine Variable oder Funktion, fällt der Zähler auf null, oder ist er am Ende nicht eins, so ist der Ausdruck kein Term. Man konstruiert drei Hilfsfunktionen. Die erste ist die darstellende Funktion f V F (n) von |2v 1 |8v 1 , die genau dann null ist, wenn n eine Variable oder eine Funktion ist. Als zweites konstruiert man analog zum Beweis des vorherigen Satzes eine Funktion f ST (n), die angibt, wie oft 3 die Zahl n teilt und also die Stelligkeit einer Funktion berechnet. Zu guter Letzt braucht man eine Funktion f Z , die den Wert des Zählers an der Stelle k (von hinten gezählt) berechnet, die wie folgt aussieht: 1 3 ^ D 5 ^^ ^ ķ f Z (k) := (1 (1 |(3, p(l (n) i , n)))) ( f ST (p(i , n)) 1). i =0 Mit diesen drei Funktionen kann man nun leicht Tr (n) definieren: Tr (n) := f Z (l (n) 1) 1 + ¸ l (n) 1 (1 f Z ( j )) fV F (p( j , n)). j =0 Diese Funktion ist offensichtlich primitiv rekursiv und außerdem ist sie genau dann null, wenn n für einen Term steht. Nun zu den atomaren Formeln. Ein Ausdruck ist genau dann eine atomare Formel, wenn er mit einem Prädikat oder dem =-Symbol beginnt und dann eine entsprechende Anzahl an Termen folgt. Man nutzt nun aus, dass die oben gegebene Funktion Tr (n), wenn man sie leicht abwandelt, eine Funktion ergibt, die ausrechnet, wie viele Terme hintereinander ein Ausdruck darstellt. Um diese Anzahl zu erhalten, muss man nur den Zähler auf dem ersten Symbol (von vorne gezählt) ablesen und überprüfen, dass der Zähler vorher nie null geworden ist und nur Variablen und Funktionen ’gelesen’ wurden. Da man das erste Symbol nicht lesen will, definiert man: 52 Kapitel 4 Vollständigkeit und Entscheidbarkeit Tr Z (n) := f Z (l (n) 2) (1 ¸ l (n) 2 (1 f Z ( j )) fV F (p( j , n))). j =0 Damit folgt sofort, dass n für eine atomare Formel steht, wenn aF r (n) := |(8, p(1, n)) ( f ST (p(1, n)) Tr Z (n)) (Tr Z (n) f ST (p(1, n))) gleich null ist. Für Formeln geht man etwas anders vor. Man definiert zuerst eine Funktion F r A , die ähnlich wie Tr (n) vorgeht, nur dass sie für Prädikatsymbole und das =-Symbol den Zähler um eins erhöht, für das - und das - Symbol den Zähler um eins verringert und für das -Symbol den Zähler um zwei verringert. Für Funktionssymbole und Variablen ändert sich der Zähler nicht. Außerdem soll die Funktion (wie Tr ) bei jedem Schritt prüfen, dass der Zähler nicht null wird und dass er am Ende auf eins steht. Die Funktion soll hier nicht explizit konstruiert werden, da die Konstruktion beinahe exakt wie die von Tr abläuft. Damit kann man überprüfen, ob ein Ausdruck zumindest prinzipiell den richtigen Aufbau für eine Formel hat. Damit es sich tatsächlich um eine Formel handelt, muss nach jedem Prädikatsymbol eine passende Menge an Termen kommen, nach jedem -Symbol eine Variable und ansonsten dürfen keine Funktionssymbole und Variablen vorkommen. Um ersteres zu prüfen, ersetzt man in der Definition von aF r jedes Vorkommen von 1 durch p(i , n), jedes Vorkommen von 2 durch p(S(i ), n) und jedes Vorkommen von l (n) durch j . Damit erhält man eine dreistellige Funktion aF r T , die genau dann gleich null ist, wenn der Teilausdruck von n, der von Symbol i bis Symbol j geht, eine atomare Formel ist. Mit dieser Funktion lässt sich nun die erste Bedingung mit folgender Formel fassen, in der v für die Gödelnummer des Ausdrucks steht: D ^ D Dv 1^ < v 1 v ^|(8, p(v 1, v)) Dv 2^^ < v 2l (v) = 0aF r T (v 1, v 2, v) ^ = 0 fV F (S(v 2)) = v 2 l (v). Diese Formel besagt, dass für alle v 1 , für die der v 1 -Eintrag der Folge v ein Prädikat oder das =-Zeichen ist, ein v 2 existiert, so dass die Zeichenfolge von v 1 bis v 2 eine atomare Formel ist und außerdem der v 2 + 1-Eintrag keine Variable oder Funktionssymbol ist, oder v 2 das letzte Symbol der Folge ist. Dass nach jedem eine Variable steht, kann man ebenfalls schnell in eine Formel überführen, indem man schreibt v1 < v1v = 3p(v 1 , v) |2p(S(v 1 ), v) |4p(S(v 1 ), v). Auch die Bedingung, dass keine Funktionen und Variablen ’wild’ auftauchen, kann man durch eine Formel darstellen. Da diese in Symbolen extrem unübersichtlich ist, wird hier nur beschrieben, was sie leisten muss, in einer Form, dass jeder Leser sie bei Interesse konstruieren können sollte. Die Formel muss besagen, dass es kein v 1 gibt, dass kleiner ist, als die Länge der Folge v und eine Variable oder ein Funktionssymbol darstellt, und gleichzeitig das Symbol vor v 1 das -Symbol ist oder das nächste früher in der Folge auftretende Zeichen, das keine Variable und Funktionssymbol ist, ein Prädikatsymbol ist. Damit hat man drei Formeln, die für die naheliegende Interpretation ihrer Symbole primitiv rekursiv sind und genau dann wahr, wenn v für ein n steht, das in der obigen Gödelisierung eine Formel darstellt. Verbindet man diese drei Formeln mit , so ist ihre darstellende Funktion also gerade F r . Die Funktion Sa erhält man nun schnell als darstellende Funktion einer Formel, die aussagt, dass n eine Formel darstellt und keine Variable v k existiert, zu der nicht vorher v k D D ^ ^ ^ D ^ D 53 Kapitel 4 Vollständigkeit und Entscheidbarkeit in der Folge steht. Den zweiten Teil kann man zum Beispiel schreiben als Dv 1^ < v 1l (v) ^^|2p(v 1, v) |4p(v 1 , v) Dv 2^ < v 2 v 1^ = p(v 2, v)3 = p(S(v 2), v)p(v 1, v). Eigentlich sind nur die Gödelnummern von Folgen interessant, deren Folgenglieder alle Formeln sind. Die Menge dieser Folgen ist aber praktischerweise entscheidbar, wie aus dem gerade bewiesenen Satz folgt. Korollar 4.12. Es gibt eine Gödelisierung so, dass eine einstellige rekursive Funktion F l (n) existiert, die genau dann null ist, wenn n die Gödelnummer einer Folge von Formeln ist. Beweis. Wählt man die Gödelisierung wie in Satz 4.11, so erhält man F l als darstellende Formel von v 1 < v 1 l (v) = 0F r (p(v 1 , v). D ^ Damit kann man nun zeigen, dass es eine rekursive Funktion gibt, die für eine Zahl n entscheiden kann, ob sie für einen korrekten Beweis steht. Zu beachten ist dabei, dass die Frage, ob n ein Beweis ist, davon abhängt, welche nicht-logischen Axiome man gewählt hat. Für die Existenz der angesprochenen Funktion ist dabei fundamental, dass die Menge der Axiome entscheidbar ist. Satz 4.13. Sei ∆ eine entscheidbare Menge von Formeln in einer Sprache S, die gödelsiert ist, sowie über eine Gödelisierung für Folgen verfügt, für die die Sätze 4.11 und 4.12 gelten. Sei außerdem K eine vollständiges logisches Kalkül, das eine entscheidbare Axiomenmenge hat und nur die Schlussregel M P enthält. Dann existiert eine rekursive Funktion f bew , so dass f bew (n) genau dann null ist, wenn n die Gödelisierung eines Beweises im System K ist. Beweis. Eine Folge von Formeln ist genau dann ein Beweis für eine Implikation von ∆ im System K , wenn jede Formel A i der Folge A 1 , A 2 , . . . A k entweder im Axiomensystem Λ von K oder in ∆ liegt oder es eine Formel A k = A l A i in der Folge gibt und i > k, l gilt. In einer Sprache mit dem Symbol, einer einstelligen Funktion l und einer zweistelligen Funktion p kann man die erste Möglichkeit mit Hilfe von A Axi o := p(v 2 , v 1 )∆ p(v 2 , v 1 )Λ durch v 2 < v 2 l (v 1 )A Axi o formalisieren. Da Λ und ∆ entscheidbar sind, ist diese Formel rekursiv in einer Struktur, die klassisch interpretiert und l und p gemäß Definition 4.9. Die zweite Eigenschaft lässt sich in einer Sprache, die das einstellige Funktionssymbole l und die zweistelligen Funktionssymbole p und G enthält, auf die gleiche Weise mit Hilfe von A Mod u := v 3 < v 3 v 2 v 4 < v 4 v 2 = p(v 4 , v 1 )G(t n ,G(t w ,G(p(v 3 , v 1 ),G(t n , p(v 2 , v 1 ))))) formalisieren54 , wenn man eine Struktur wählt, die p und l gemäß Definition 4.9 und die Funktion G gemäß Definition 4.1 interpretiert und außerdem t n ein Term ist, der in der Struktur als Gödelnummer des -Symbols interpretiert wird und t w analog für das -Symbol steht. Da p, l und G primitiv rekursiv sind, ist diese Formel primitiv rekursiv. Nimmt man beide Formel zusammen, erhält man eine darstellende Formel für bew in ^ P D ^ ^ P P P D ^ D ^ ^ 54 Diese Formel besagt, dass ein v 3 und ein v 4 existieren, die kleiner als v 2 sind, so dass das Folgenglied v 4 der Folge v 1 die Gödelnummer einer Formel ist, die besagt, dass das Folgenglied v 2 durch das Folgenglied v 3 impliziert wird. 54 Kapitel 4 Vollständigkeit und Entscheidbarkeit einer Sprache die noch die einstellige Funktion F l und die Konstante 0 enthält durch = F l (v 1 )0 v 2 < v 2 l (v 1 ) A Mod u A Axi o , wobei man eine Struktur wählt, die 0 als natürliche Zahl 0 interpretiert, F l gemäß Lemma 4.12 und die anderen Symbole wie oben. ^ D ^ ^ Daraus folgt sofort die folgende Aussage: Korollar 4.14. Ist ∆ entscheidbar, so ist T (∆) rekursiv abzählbar. Die Idee des Beweises besteht darin, mit der Funktion f bew alle n zu finden, die für Beweise stehen und dann mit der Funktion p(l (n), n) zu ermitteln, welche Formel mit dem Beweis n bewiesen wird. In einem dritten Schritt, wird dann geprüft, ob das, was bewiesen wurde ein Satz ist. Auf diese Weise findet man alle Sätze A, für die ∆ A gilt, was genau die Definition von T (∆) ist. $ Beweis. Man normiert die Funktion f bew zuerst so, dass sie überall, wo sie nicht null ist, den Wert eins hat, wie in Satz 3.2 gezeigt. Diese normierte Funktion heißt f nor m Die Funktion f wird dann per primitiver Rekursion definiert durch f (0) = d A Ae für einen Satz A und f (S(n)) = f (n) f nor m (S(n)) Sa(p(l (n), n)) + (p(l (n), n) (1 f nor m (S(n)) Sa(p(l (n), n)))). Dann zählt f die Menge T (∆) ab, da A A als allgemeingültige Aussage sicher in T (∆) liegt und f (n) gleich dem bewiesenen Satz ist, falls n ein Beweis ist, der einen Satz beweist. Andernfalls ändert sich der Funktionswert nicht, die Funktion gibt also den letzten Satz aus, für den sie einen Beweis ’gefunden’ hat. ^ ^ Dass T (∆) sogar rekursiv ist, kann man im Allgemeinen kaum erwarten, da man dann eine effektive Möglichkeit haben müsste, zu zeigen, dass ein Satz nicht in T (∆) ist, also zu zeigen, dass die Formel nicht beweisbar ist. Eine solche Methode gibt es allerdings, wenn T (∆) vollständig ist, da man in diesem Fall immer die Negation eines Satzes beweisen kann, um zu zeigen, dass der Satz nicht in T (∆) liegt. Satz 4.15. Eine effektiv axiomatisierbare, vollständige Theorie ist entscheidbar. Die Idee des Beweises kam in fast identischer Form schon einmal am Ende von Abschnitt 3.2 vor. Beweis. Sei T eine effektiv axiomatisierbare, vollständige Theorie, dann lässt sich T schreiben als T (∆) mit einer entscheidbaren Menge ∆. Nach Korollar 4.14 gibt es dann eine rekursive Funktion f , die T abzählt. Mit der rekursiven Funktion h, die als h(a, n) = a) + (a f ( n2 )) 1 ( f ( n 2 ) G(d e, a)) + (G(d ( ( f ( n2 ) e, a) f ( n 2 1 )) falls n gerade ist, falls n ungerade ist.55 definiert ist, lässt sich dann mit dem µ-Operator die Funktion χT definieren. Dazu setzt man χT (a) := GE R(µh (a)). 55 Diese Fallunterscheidung lässt sich primitiv rekursiv umsetzten, in dem man 1. Fall (1 GE R(n) berechnet. 55 GE R(n)) + 2. Fall Kapitel 4 Vollständigkeit und Entscheidbarkeit Aus diesem Satz folgt, dass eine axiomatische Theorie, in der alle rekursiven Funktionen definierbar sind, unvollständig ist, da eine solche Theorie nach Satz 4.6 unentscheidbar ist. Wäre sie aber vollständig, müsste sie nach Satz 4.15 entscheidbar sein. Was bedeuten diese Ergebnisse für den Versuch, die Mathematik streng zu formalisieren? Das soll im nächsten Abschnitt kurz am Beispiel der Arithmetik veranschaulicht werde. 56 Kapitel 5 Unvollständigkeit und Unentscheidbarkeit der Arithmetik Die wohl bekannteste Methode, die Arithmetik zu axiomatisieren ist die Peano-Arithmetik, die nach dem italienischen Mathematiker Giuseppe Peano benannt ist. Der eigentliche ’Erfinder’ dieses Axiomensystems ist allerdings Richard Dedekind, der die natürlichen Zahlen 1888 über diese Axiome definierte . Die ursprünglichen Axiome waren unter Verwendung der Begriffe Zahl, Nachfolger und null (Wang, 1964)56 die Folgenden: 1. 0 ist eine Zahl. 2. Der Nachfolger einer Zahl ist eine Zahl. 3. Keine zwei Zahlen haben den selben Nachfolger. 4. 0 ist der Nachfolger keiner Zahl. 5. Jede Eigenschaft, die für 0 und den Nachfolger jeder Zahl mit dieser Eigenschaft gilt, gilt für alle Zahlen. Moderne Varianten der Peano-Arithmetik sind meistens in einer Sprache der ersten Stufe mit den Symbolen +, , <, 0 und S formuliert. Da die Sprache die Symbole +, < und enthält, muss man Axiome mit in das System aufnehmen, die das ’Verhalten’ dieser Symbole beschreiben. Dafür kann man auf die ersten beiden Axiome verzichten, wenn man sich einigt, dass man statt über Zahlen über die Terme 0, S0, SS0, . . . spricht. Außerdem lässt sich das fünfte Axiom in einer Sprache der ersten Ordnung nicht adäquat ausdrücken,57 so dass man es durch ein Axiomenschema ersetzen muss, das heißt eine rekursive aber unendliche Menge von Axiomen. Definition 5.1. Als Peano-Arithmetik oder P A bezeichnet man die Theorie in der Sprache der ersten Stufe mit den Symbolen +, , 0, S und < mit den folgenden Axiomen: (P1) Dv 1 = 0Sv 1 . 56 Eigentlich sollte bei Dedekind und Peano eins die kleinste natürliche Zahl sein, aber an ihren Axiomen ändert sich dadurch nichts. 57 Sprachen zweiter Ordnung unterscheiden sich von denen erster Ordnung dadurch, dass sie Aussagen der Form ’Es existiert ein Prädikat. . . ’ oder ’Für alle Prädikate gilt. . . ’ formalisieren können. Axiom fünf ist offensichtlich von dieser Gestalt. 57 Kapitel 5 Unvollständigkeit und Unentscheidbarkeit der Arithmetik Dv 1Dv 2 ^ = Sv 1Sv 2 = v 1 v 2. (P3) Dv 1 + v 1 0 = v 1 . (P4) Dv 1 Dv 2 = +(v 1 , Sv 2 )S(+(v 1 , v 2 )). (P5) Dv 1 = (v 1 , 0)0. (P6) Dv 1 Dv 2 = (v 1 , Sv 2 ) + ((v 1 , v 2 ), v 2 ). (P7) Dv 1 < v 1 0. (P8) Dv 1 Dv 2 ^^ < v 1 v 2 < v 2 v 1 = v 1 v 2 .58 (P9) Dv 1 Dv 2 ^ ^ < v 1 Sv 2 ^ = v 1 v 2 < v 1 v 2 ^ < v 1 Sv 2 ^ = v 1 v 2 < v 1 v 2 .59 Sv Außerdem sind alle Sätze der Form60 ^^ v0 A Dv k ^ A v A Dv k A, mit einer Formel A (P2) k k k und einer freien Variablen v k von A, Axiome der Peano-Arithmetik. Man spricht hier von dem Axiomenschema (P10).61 Die Axiome (P1) und (P2) entsprechen dabei den Axiomen drei und vier der ursprünglichen Peano-Arithmetik. Die Axiome (P3), (P4) und (P5), (P6) sind primitiv rekursive Definitionen der Funktionen + und und die Axiome (P7), (P8) und (P9) definieren <. Das Axiomenschema (P10) entspricht schließlich dem Axiom fünf der ursprünglichen PeanoArithmetik. Es soll nun gezeigt werden, dass die Peano-Arithmetik sowohl unentscheidbar als auch unvollständig ist. Um das zu beweisen, zeigt man, dass alle rekursiven Funktionen in ihr definiert werden können. Interessanterweise kann man dabei auf das Axiomenschema (P10) verzichten. Das bedeutet, dass bereits die sogenannte minimal Arithmetik Q (Boolos u. a., 2002, S. 207f), die nur aus den Axiomen (P1)-(P9) besteht, unentscheidbar ist, wie Alfred Tarski bereits in Tarski u. a. (1953) bewiesen hat. Der Übersichtlichkeit halber wird das Ergebnis schrittweise bewiesen.62 Satz 5.1. Die Grundfunktionen der rekursiven Funktionen Z , S und I kn sind in der PeanoArithmetik definierbar. Beweis. Wählt man die Terme t 0 , t 1 , . . . t k , . . . klassisch als 0, S0, SS0, . . ., so definiert der Term = v 2 Sv 1 die Funktion S, da aus i = S( j ) folgt, dass = t i St j gleich = t i t i ist und also nach (=1) gilt, dass = t i St j in der Peano-Arithmetik beweisbar ist. Ist anderseits i S( j ), so ist nach 58 Dieses Axiom garantiert, dass ’<’ trichotomisch ist, also dass zwei Zahlen entweder gleich sind, oder eine größer als die andere.(Kunen, 1980, S. 14) 59 Dieses Axiom besagt, dass der Nachfolger von y genau dann größer als x ist, wenn y größer oder gleich x ist. 60 Diese Formel besagt, dass es nicht gleichzeitig der Fall sein kann, dass die Formel A für 0 wahr ist und kein Wert existiert, für den A wahr ist, aber für dessen Nachfolger nicht und trotzdem ein Wert existiert, für den A falsch ist. Die Formel beschreibt also Induktion am Spezialfall der Formel A. 61 Dieses Axiomensystem entspricht dem in Enderton (2001, S. 203). 62 Der Beweis folgt recht grob Boolos u. a. (2002, S. 201ff). 58 Kapitel 5 Unvollständigkeit und Unentscheidbarkeit der Arithmetik Definition t i nicht der selbe Term wie St j . Beide Terme sind aber von der Form SS . . . S0, unterscheiden sich also nur in der Anzahl der S. Wie man leicht sieht, implizieren aber (P1) und (P2) dann = t i St j . Mit den selben Termen definiert = v 1 v 1 = v 2 0 die Funktion Z , da nach (=1) in der PeanoArithmetik = v 1 v 1 und = 00 immer beweisbar sind, (P1) aber t i 0 für Terme der Form SS . . . S0 impliziert, falls i 0 ist. Mit einem analogen Argument definiert dann = v 1 v 1 = v 2 v 2 . . . = v n v n = v k v n+1 die Funktionen I kn . ^ ^ ^ ^ ^ Weiter geht es mit der Komposition. Satz 5.2. Sind die Funktionen f von Nk nach N und g von Nl nach N in der Peano-Arithmetik definierbar, so ist auch die Funktion g (x 1 , x 2 , . . . x i 1 , f (y 1 , y 2 , . . . y k ), x i +1 , . . . x l ) in der PeanoArithmetik definierbar. Beweis. Man wähle die Terme t 0 , t 1 , . . . t k , . . . klassisch als 0, S0, SS0, . . .. Sei dann A f die Formel, die f definiert und A g die Formel, die g definiert, wobei v 1 , v 2 , . . . v k+1 die freien Variablen von A f sind und w 1 , w 2 , . . . w l +1 die freien Variablen von A g . Die Formel A K := A f A g = v k+1 w i definiert dann g (x 1 , x 2 , . . . x i 1 , f (y 1 , y 2 , . . . y k ), x i +1 , . . . x l ). Denn ^^ t nach (^1) gilt P A $ v t y2 v2 ty tx . . . v k+1 w11 . . . wt z A K , wenn die drei Teilformeln mit der selben 1 k+1 l +1 Substitution beweisbar sind. Für A f und A g bedeutet das, dass g (x 1 , x 2 , . . . x l ) = z und f (y 1 , y 2 , . . . y k ) = y k+1 gilt. Weiter ist = v k+1 w i aus (=1) beweisbar, wenn y k+1 = x i ist. Das entspricht offensichtlich g (x 1 , x 2 , . . . x i 1 , f (y 1 , y 2 , . . . y k ), x i +1 , . . . x l ) = z. In jedem anderen Fall beweist die Peano-Arithmetik offensichtlich die Negation einer dieser drei Formeln, y1 ^ woraus dann mit ( 1), ( 2) und ( 2) folgt, dass P A $ tv y1 1 t y2 v2 ... t y k+1 t x1 v k+1 w 1 . . . wt z l +1 A K gilt. Auch die µ-Rekursion ist recht einfach zu definieren. Satz 5.3. Ist die Funktion f von Nk nach N in der Peano-Arithmetik definierbar, dann auch µ f (x 1 , x 2 , . . . x k 1 ). Beweis. Man wähle die Terme t 0 , t 1 , . . . t k , . . . klassisch als 0, S0, SS0, . . .. Sei dann A f die Formel, die f definiert, wobei v 1 , v 2 , . . . v k+1 die freien Variablen von A f sind. Dann definiert v A µ := v 0 A f v k+2 < v k+2 v k v k+2 v 0 A f die Funktion µ f (x 1 , x 2 , . . . x k 1 ), da äquivalent k+1 k+1 k+1 zu µ f (x 1 , x 2 , . . . x k 1 ) = y ist, dass f (x 1 , x 2 , . . . x k 1 , y) = 0 ist und f (x 1 , x 2 , . . . x k 1 , x k ) 0 für ^ D ^ tx tx tx x k < y gilt. Ist ersteres der Fall, ist nach Definition v 11 v 22 . . . v k v 0 A f in der Peano-Arithmetik k k+1 t xk 0 t x1 t x2 beweisbar und ist ersteres nicht der Fall, so ist v 1 v 2 . . . v v A f beweisbar. Ist zweiteres k k+1 t xk t x1 t x2 v nicht der Fall, so ist mit ( 1) in der Peano-Arithmetik v 1 v 2 . . . v v k+2 < v k+2 v k vk+2 v 0 A f k k k+1 t xk t x1 t x2 v k+2 0 beweisbar, ist es der Fall, so ist mit ( 2) die Formel v 1 v 2 . . . v v k+2 < v k+2 v k v v A f k k k+1 t x1 t x2 ty beweisbar. Also ist v 1 v 2 . . . v A µ mit ( 1) beweisbar, wenn µ f (x 1 , x 2 , . . . x k 1 ) = y ist und k tx tx ty mit ( 1), ( 2) und ( 2) ist v 11 v 22 . . . v A µ beweisbar, wenn µ f (x 1 , x 2 , . . . x k 1 ) y ist k D ^ D D D ^ ^ ^ Die primitive Rekursion ist deutlich schwieriger, da sich jeder Funktionswert aus dem vorherigen ergibt. Eine Formel, die eine Funktion definiert, die durch primitive Rekursion gewonnen wurde, muss also quasi auf eine ganze Folge von Zahlen zugreifen können. Um 59 Kapitel 5 Unvollständigkeit und Unentscheidbarkeit der Arithmetik dieses Problem zu lösen kodiert man die Folge mit einem Paar und definiert eine dreistellige Funktion F ent in der Peano-Arithmetik, die den i -ten Eintrag der Folge ausgibt. Um eine solche Kodierung und eine solche Funktion zu definieren, braucht man einen bekannten Satz der Zahlentheorie, den Chinesischen Restsatz, den man in jeder Einführung in die Zahlentheorie findet, zum Beispiel in Wolfart (2011, S. 19). Chinesischer Restsatz. Seien m 1 , m 2 , . . . m n Teilerfremde natürliche Zahlen und a 1 , a 2 , . . . a n beliebige natürliche Zahlen, dann existiert ein x mit x a i mod m i für alle i {1, 2, . . . n}. P Es gibt eine Reihe verschiedener Beweise für diesen Satz. Eine Auswahl, mit Beschreibung der Vor- und Nachteile jedes Beweises, findet sich in Schwarzweller (2009). Für diese Arbeit wurde ein Beweis gewählt, der im Gegensatz zu den meisten anderen Beweisen des Satzes nicht konstruktiv ist. Dafür ist dieser Beweis recht kurz und elegant, wie Schwarzweller findet, und für die Zwecke dieser Arbeit völlig ausreichend. Beweis. Es kann nur ein x < m 1 m 2 m n =: m geben, so dass für alle i stets x a i mod m i gilt, denn angenommen ein y hätte ebenfalls diese Eigenschaften, dann würde m i |y x für alle i {1, 2, . . . n} gelten. Da die Zahlen m 1 , m 2 , . . . m n teilerfremd sind, folgt daraus m|y x, woraus mit y x < m folgt, dass y x = 0 ist. Daraus folgt, dass für alle x, y < m mit x y stets (x mod m 1 , x mod m 2 , . . . x mod m n ) (y mod m 1 , y mod m 2 , . . . y mod m n ) ist.Weil es aber nur m verschiedene Tupel der Form (a 1 mod m 1 , a 2 mod m 2 , . . . a n mod m n ) geben kann, gibt es auch zu jedem dieser Tupel ein x mit (x mod m 1 , x mod m 2 , . . . x mod m n ) = (a 1 mod m 1 , a 2 mod m 2 , . . . a n mod m n ). P Damit lässt sich nun eine Kodierung finden, die jeder endlichen Folge a 1 , a 2 , . . . a k ein Paar (s, t ) zuordnet und dazu eine dekodierende Funktion β. Satz 5.4. Zu jeder natürlichen Zahl k und jeder Folge natürlicher Zahlen a 1 , a 2 , . . . a k existieren natürliche Zahlen s und t , so dass für alle 0 < i k gilt β(s, t , i ) := s mod t (i + 1) + 1 = a i . ¤ P Beweis. Als erstes zeigt man, dass aus t = n! für ein n N folgt, dass t (i +1)+1 und t ( j +1)+1 teilerfremd sind, falls i j und i n + 1 j gilt. Sei dazu q ein Primfaktor von t (i + 1) + 1, dann teilt q offensichtlich nicht t , also ist q > n. Angenommen q teilt auch t ( j + 1) + 1, dann teilt q auch |t (i + 1) + 1 (t ( j + 1) + 1)| = |i j |t . Da q aber t nicht teilt, teilt es |i j |. Allerdings ist |i j | n < q, was ein Widerspruch ist, da aus i j folgt, dass |i j | nicht null ist. Wählt man nun n = max{k, a 1 , a 2 , . . . a k } und setzt t = n!, gibt es nach dem Chinesischen Restsatz ein s, so dass für alle i < k stets a i s mod t (i + 1) + 1 ist. Nach Konstruktion ist außerdem a i < t (i + 1) + 1. ¤ ¤ ¥ Damit kann man nun zeigen, dass eine F ent Funktion in der Peano-Arithmetik definierbar ist, die zu einer durch s und t codierten Folge den i -ten Eintrag liefert. Satz 5.5. In der Peano-Arithmetik ist eine Funktion F ent definierbar, so dass zu jeder Folge a 1 , a 2 , . . . a k aus natürlichen Zahlen ein s und ein t existiert, für die für alle i < k gilt, dass F ent (s, t , i ) = a i ist. 60 Kapitel 5 Unvollständigkeit und Unentscheidbarkeit der Arithmetik Beweis. Man wähle die Terme t 0 , t 1 , t 2 , . . . klassisch als 0, S0, SS0, . . .. Zuerst zeigt man, dass die Funktion f r est (x 1 , x 2 ) := x 1 mod (x 2 + 1) in der Peano-Arithmetik definierbar ist. Dazu betrachtet man die Formel < v 3 v 2 v 4 < v 4 v 1 = +( (Sv 2 , v 4 ), v 3 )v 1 . Ist f r est (x 1 , x 2 ) = y, dann gibt es nach Definition ein c < x 1 , so dass c (x 2 + 1) + y = x 1 ist und es ist y < x 2 . In der Peano-Arithmetik ist < t a t b beweisbar, wenn a < b ist und sonst < t a t b , denn = t a t a und = t b t b sind beweisbar und (P9) impliziert dann < t a SS . . . St a und < t b SS . . . St b für beliebig viele S vor den Termen. Ist a < b lässt sich t b als SS . . . St a darstellen, also gilt P A < t a t b . Ist anderseits b = a oder b < a lässt sich = t a t b oder mit obigen Argument < t b t a beweisen, woraus mit (P8) dann < t a t b folgt. Da die Axiome (P3) bis (P6) einer primitiv rekursiven Definition von + und entsprechen, die die beiden Funktionen auf eine sukzessive Anwendung der S-Funktion reduziert, sieht man sofort, dass = +( (t a , t b ), t c )t d in der Peano-Arithmetik beweisbar ist, wenn (a b) + c = d ist und sonst = +( (t a , t b ), t c )t d beweisbar ist. Das alles zusammengenommen bedeutet, die betrachtete Formel definiert f r est . Damit ist sofort die β-Funktion in der Peano-Arithmetik definierbar, da es sich bei dieser um eine Komposition von f r est , + und handelt. Nach Satz 5.4 hat aber die β-Funktion die gewünschten Eigenschaften. ^ D ^ $ Damit kann man nun auch die primitive Rekursion in der Peano-Arithmetik definieren. Satz 5.6. Sind die Funktionen f von Nn 1 nach N und g von Nn+1 nach N in der PeanoArithmetik definierbar, so ist auch die Funktion h, die aus den beiden per primitiver Rekursion gewonnen wird, in der Peano-Arithmetik definierbar. Beweis. Der Beweis wird der Übersichtlichkeit der Formeln halber für den Fall n = 2 geführt. Der Beweis für größere n läuft komplett analog. Um eine Formel zu konstruieren, die h definiert, muss man sich klar machen, was h(x 1 , x 2 ) = y für eine Funktion bedeutet, die aus f und g per primitiver Rekursion gewonnen wurde. Eine mögliche Formulierung ist, dass eine (endliche) Folge (a n )n existiert, so dass a 0 = h(x 1 , 0) = f (x 1 ) ist, für alle i < x 2 gilt, dass a i +1 = h(x 1 , i + 1) = g (x 1 , i , h(x 1 , i )) ist und a x2 = y. Ist A ent eine Formel, die die Funktion f ent aus Satz 5.5 definiert und die freien Variablen v 1 , v 2 , v 3 und v 4 hat und A f eine Formel mit den freien Variabeln w 1 und w 2 , dann lässt sich die erste Eigenschaft als Formeln t x1 t0 durch v 4 w 2 v 3 A ent w 1 A f = v 4 w 2 beschreiben. Ist die Eigenschaft erfüllt, existieren D D ^^ t a t f (x ^^ tx t0 1 nach Konstruktion ein s und ein t , so dass vt s1 vt t2 v 40 w 21 A A = v 4 w 2 in der Peanov 3 ent w 1 f Arithmetik beweisbar ist, während für jede andere Substitution für v 4 und w 2 die Negation der Formel beweisbar ist. Ist A komp eine Formel mit den freien Variablen v 1 , v 2 , v 3 , w 1 und u 1 , die die Funktion f komp (s, t , i , x 1 ) := g (x 1 , i , β(s, t , i )) definiert, wie sie nach Satz 5.2 und 5.5 existiert , so kann ) D ^ D D ^^ tx S(v 3 ) 1 man die zweite Eigenschaft der Formel v 3 < v 3 v v 4 u1 v 3 A ent w 1 A komp = v 4 u 1 umsetzen. Dabei ist die v die Variable, die für x 2 steht. Die dritte Eigenschaft setzt man schließlich mit der Formel vv3 vu4 A ent um. Verknüpft man diese drei Formeln mit dem -Symbol, und setzt v 1 v 2 davor, erhält man eine Formel mit den freien Variablen w 1 , v und u, die h definiert. ^ D D 61 Kapitel 5 Unvollständigkeit und Unentscheidbarkeit der Arithmetik Fasst man diese Ergebnisse zusammen, erhält man alle rekursiven Funktionen in der Peano-Arithmetik. Mit den Ergebnissen aus dem vierten Kapitel erhält man damit direkt die Unvollständigkeit und Unentscheidbarkeit der Peano-Arithmetik. Korollar 5.7. In der Peano-Arithmetik sind alle rekursiven Funktionen definierbar. Beweis. Die Aussage folgt direkt aus Satz 5.1, 5.2, 5.3 und 5.6. Mit dem Wissen aus Abschnitt 4.2 folgt damit sofort die Unentscheidbarkeit der PeanoArithmetik, zumindest für den Fall, dass sie Widerspruchsfrei ist63 . Korollar 5.8. Die Peano-Arithmetik ist entweder widersprüchlich oder unentscheidbar. Beweis. Die Aussage folgt sofort aus Satz 4.6 und Korollar 5.7. Mit dem Wissen aus Abschnitt 4.3 folgt nun direkt der erste Gödelsche Unvollständigkeitssatz in seiner Anwendung auf die Peano-Arithmetik. Erster Gödelscher Unvollständigkeitssatz. Die Peano-Arithmetik ist entweder widersprüchlich oder unvollständig. Beweis. Die Peano-Arithmetik ist offensichtlich effektiv axiomatisierbar. Angenommen, sie wäre auch vollständig, dann würde aus Satz 4.15 folgen, dass sie auch entscheidbar ist. Aus Korollar 5.8 folgt dann aber, dass die Peano-Arithmetik widersprüchlich ist. Was kann man tun, wenn man man sich mit diesen negativen Resultaten nicht abfinden möchte? Man kann andere Axiomensysteme suchen, die vollständig und entscheidbar sind. In Enderton (2001, S. 187ff) findet man beispielsweise ein Axiomensystem, das ausschließlich Aussagen über die Symbole 0 und S enthält. Betrachtet man dieses in einer Sprache, die auch nur 0 und S als nicht logische Symbole enthält, ist die zugehörige Theorie sowohl entscheidbar als auch vollständig. Tatsächlich lassen sich Theorien finden, die nur + oder nur enthalten und in einer entsprechenden Sprache vollständig und entscheidbar sind (Boolos u. a., 2002, S. 295ff). Da man aber wohl weder auf + noch auf wirklich verzichten möchte, muss man nach einem Axiomensystem in der vollen Sprache der Arithmetik suchen. Eine der zentralen Erkenntnisse aus Tarski u. a. (1953) ist allerdings, dass jede Theorie, die die Axiome (P1) - (P9) als Sätze enthält, unentscheidbar ist. Man sagt auch, dass die Theorie Q, die durch diese Axiome erzeugt wird, streng unentscheidbar ist. Betrachtet man noch einmal diese Axiome, so erkennt man, dass eine Theorie, die eines dieser Axiome nicht beweisen kann, kaum als Formalisierung der Arithmetik, wie man sie kennt, in Frage kommt. Entscheidbarkeit ist also nicht ohne für die meisten Mathematiker inakzeptable Einschränkungen erreichbar. Nach Satz 4.3 kann man die Peano-Arithmetik aber zu einer vollständigen Theorie erweitern, zumindest falls die Peano-Arithmetik widerspruchsfrei ist. Da die Struktur N der natürlichen Zahlen mit den Standardinterpretationen der Symbole ein Modell der Peano-Arithmetik ist, ist die so genannte ’true arithmetic’, die Menge aller Sätze, die für diese Struktur wahr sind, eine solche Erweiterung. Diese Theorie ist nach Konstruktion vollständig, aber als Erweiterung der Peano-Arithmetik unentscheidbar. Aus Satz 63 Warum die Widerspruchsfreiheit der Peano-Arithmetik nicht bewiesen wurde, wird im Schluss erläutert. 62 Kapitel 5 Unvollständigkeit und Unentscheidbarkeit der Arithmetik 4.3 folgt dann sofort, dass diese Theorie nicht effektiv axiomatisierbar ist. Die Suche nach einem Axiomensystem, aus dem man alle Sätze, die in der Arithmetik wahr sind, ableiten kann, ist also ebenfalls aussichtslos. Anders gesagt bedeutet das, jede axiomatische Theorie der Arithmetik ist sowohl unvollständig als auch unentscheidbar. 63 Schluss Im Laufe dieser Arbeit wurden zwei wesentliche Grenzen der Mathematik aufgezeigt, nämlich die Unentscheidbarkeit und Unvollständigkeit hinreichend komplexer Theorien. Eine weitere Grenze musste allerdings in dieser Arbeit ausgelassen werden. Nachdem Kurt Gödel seinen ersten Unvollständigkeitssatz bewiesen hatte und noch bevor dieser veröffentlicht war, fand er ein Beispiel für einen Satz, den die Peano-Arithmetik nicht beweisen kann, der gleichzeitig aber an sich von großem Interesse war (Haaparanta, 2009, S. 401). Diese Entdeckung war der wahrscheinlich härteste Schlag für Hilberts Programm, das, vielleicht noch vor dem Entscheidungsproblem, von der Aufgabe getrieben war, zu zeigen, dass die Arithmetik die Widerspruchsfreiheit höherer mathematischer Theorien, beispielsweise der Mengenlehre, beweisen kann (Haaparanta, 2009, S. 401). Der zweite Gödelsche Unvollständigkeitssatz sagt aber aus, dass die Peano-Arithmetik nicht einmal ihre eigene Widerspruchsfreiheit beweisen kann (genauso wenig wie jede andere hinreichend starke Formalisierung der Arithmetik) (Friedman, 2006, S. 2). Da aber die Widerspruchsfreiheit der Peano-Arithmetik aus der Widerspruchsfreiheit der Mengenlehre abgeleitet werden kann, ist auch dieser Teil des Hilbertschen Programms unmöglich zu erfüllen. Der Beweis dieses Satzes ist noch deutlich tieferliegend als der des ersten Unvollständigkeitssatzes, weshalb im Rahmen dieser Arbeit auf ihn verzichtet werden musste. Trotzdem ist dieser Satz äußerst interessant, da er der ’höheren’ Mathematik ein Stück weit den Nimbus der ’sicheren’ Wissenschaft nimmt, wie ihn die Arithmetik für sich beanspruchen kann. Damit war der erste wichtige Satz gezeigt, der in der Peano-Arithmetik nicht beweisbar ist. Eine Fragestellung, die die mathematische Logik in den nächsten Jahren beschäftigte, war, welche genuin arithmetischen Sätze in der Peano-Arithmetik nicht beweisbar sein könnten. Ein erstes Beispiel ließ einige Zeit auf sich warten, aber 1977 wurde ein solcher Satz, der Satz von Paris–Harrington, in der Ramseytheorie gefunden (Barwise, 1978, S. 1133). Heute ist sogar noch eine Reihe weiterer, teilweise deutlich einfacherer, natürlicher Sätze bekannt, die in der Peano-Arithmetik nicht bewiesen werden können (Kirby und Paris, 1982, S. 285). Doch auch diese Menge an negativen Resultaten, hat den wissenschaftlichen Fortschritt in der Mathematik nicht aufhalten können (Friedman, 2003, S. 3). In gewisser Weise kann man sagen, die Mathematiker haben gelernt, mit ihren Grenzen zu leben. Dass die ’höhere’ Mathematik widerspruchsfrei ist, glaubt man einfach, so wie man auch ohne Beweis bis zum Anfang des 20. Jahrhunderts an die Widerspruchsfreiheit der Mathematik glaubte und auch unbeweisbare Sätze haben nicht mehr den Schrecken, den sie noch in der IgnorabimusDebatte hatten. In der heutigen Zeit, die daran gewöhnt ist, dass es kein sicheres Wissen gibt und die nicht den Optimismus der frühen Moderne teilt, erscheint es fast selbstverständlich, dass es auch in der Mathematik Unwissen gibt. Und doch waren die Untersuchungen dieser Zeit einflussreich, indem sie den Grund- 64 Schluss stein für die mathematische Logik gelegt haben, die noch heute ein lebendiger Teil der Mathematik ist. So sind mit der Rekursionstheorie, mit dem Vollständigkeitssatz als Teil der Modelltheorie und dem Unvollständigkeitssatz als Teil der Beweistheorie bereits in dieser Arbeit, bis auf die Mengenlehre, alle heute wichtigen Teilgebiete der mathematischen Logik vertreten. Man könnte sagen, die in dieser Arbeit dargestellten Ergebnisse haben der Mathematik zwar Grenzen aufgezeigt, ihr aber gleichzeitig auch ein neues und fruchtbares Forschungsfeld eröffnet. 65 Literaturverzeichnis [Adler 2012] A D L E R , Hans: Skript zu Vorlesung ’Grundlagen der mathematische Logik’ an der Universität Wien. http://www.logic.univie.ac.at/~adler/docs/gml.pdf. 2012 (Zitiert auf S. 6, 51) [Aigner und Ziegler 2010] A I G N E R , Martin ; Z I E G L E R , Günter M.: Das BUCH der Beweise. Springer Verlag, 2010 (Zitiert auf S. 4) [Appell 2009] A P P E L L , Jürgen: Analysis in Beispielen und Gegenbeispielen. Springer Verlag, 2009 (Zitiert auf S. 33) [Barwise 1978] B A R W I S E , Jon (Hrsg.): Handbook of mathematical logic. North-Holland Publishing Company, 1978 (Zitiert auf S. 64) [Bayertz u. a. 2012] B A Y E R T Z , Kirt (Hrsg.) ; G E R H A R D , Myriam (Hrsg.) ; J A E S C H K E , Walter (Hrsg.): Der Ignorabimus-Streit. Felix Meiner Verlag, 2012 (Zitiert auf S. 44) [Becker 1954] B E C K E R , Oskar: Grundlagend der Mathematik. Verlag Karl Alber Freiburg/München, 1954 (Zitiert auf S. 25) [Bocheński 1956] B O C H E Ń S K I , I. M.: Formale Logik. Verlag Karl Alber Freiburg/München, 1956 (Zitiert auf S. 20) [Boolos u. a. 2002] B O O L O S , George S. ; J E F F R E Y , Richard C. ; B U R G E S S , John P.: Computability and Logic. 4. Edition. New York : Cambrige University Press, 2002 (Zitiert auf S. 6, 7, 8, 35, 40, 41, 42, 44, 48, 51, 58, 62) [Börger u. a. 1997] B Ö R G E R , Egon ; G R Ä D E L , Erich ; G U R E V I C H , Yuri: The Classical Decision Problem. Springer Verlag, 1997 (Zitiert auf S. 43, 44) [Bundschuh 2008] B U N D S C H U H , Peter: Einführung in die Zahlentheorie. Springer Verlag, 2008 (Zitiert auf S. 4) [Carnap 1954] auf S. 3) C A R N A P , Rudolf: Symbolische Logik. Wien : Springer Verlag, 1954 (Zitiert [Church 1956] C H U R C H , Alonzo: Introduction to mathematical Logic Volume 1. Princton University Press, 1956 (Zitiert auf S. 6) [Dawson 1999] D A W S O N , John W. j.: Kurt Gödel: Leben und Werk. Springer Verlag, 1999 (Zitiert auf S. 3, 5) 66 Literaturverzeichnis [Ebbinghaus u. a. 2007] E B B I N G H A U S , Heinz-Dieter ; F L U M , Jörg ; T H O M A S , Wolfgang: Einführung in die mathematische Logik. 5. Auflage. Spektrum Akademischer Verlag, 2007 (Zitiert auf S. 30) [Enderton 2001] E N D E R T O N , Herbert B.: A Mathematical Introduction to Logic. Second Edition. Harcourt/Academic Press, 2001 (Zitiert auf S. 5, 6, 7, 8, 11, 12, 13, 15, 30, 39, 41, 42, 48, 58, 62) [Frege 1893] F R E G E , Gottlob: Grundgesetze der Arithmetik. Jena : Georg Olms, 1893 (Zitiert auf S. 15) [Friedman 2003] F R I E D M A N , Sy D.: Gödel’s Achievements and their Significance for Modern Mathematics (English version). http://www.logic.univie.ac.at/~sdf/papers/ goedel.pdf. Dezember 2003. – Lecture at the Austrian Academy of Sciences (Zitiert auf S. 64) [Friedman 2006] F R I E D M A N , Sy D.: Kommentar zu Gödels 1931 Montashefte Artikel über die Unvollständigkeit. In: Monatshefte für Mathematik 149 (2006), Nr. 1, S. 1–3 (Zitiert auf S. 3, 64) [Gödel 1930] G Ö D E L , Kurt: Die Vollständigkeit der Axiome des logischen Funktionenkalküls. In: Monatshefte für Mathematik und Physik 37 (1930), S. 349–360 (Zitiert auf S. 23) [Gentzen 1935] G E N T Z E N , Gerhard: Untersuchungen des logischen Schließens 1. In: Mathematische Zeitschrift 39 (1935), S. 176–210 (Zitiert auf S. 15, 20) [Goodstein 1971] G O O D S T E I N , R. L.: Development of mathematical Logic. Springer Verlag, 1971 (Zitiert auf S. 10, 14, 33, 41) [Haaparanta 2009] H A A P A R A N T A , Leila (Hrsg.): The Development of Modern Logic. Oxford University Press, 2009 (Zitiert auf S. 23, 40, 43, 44, 64) [Henkin 1949] H E N K I N , Leon: The completness of first-order functional calculus. In: Journal of Symbolic Logic 14 (1949), S. 159–166 (Zitiert auf S. 23) [Hermes 1969] H E R M E S , Hans: Idee von Leibniz zur Grundlagenforschung: Die ars inveniendi und die ars iudicandi. In: Studia Leibnitiana Supplementa Volumen 3 (1969), S. 93 – 102 (Zitiert auf S. 43) [Hilbert 1900] H I L B E R T , David: Mathematische Probleme. In: Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-Physikalische Klasse Band 3 (1900), S. 253–297 (Zitiert auf S. 43) [Jänsche 1869] J Ä N S C H E , Gottlob B. (Hrsg.): Immanuel Kant’s Logik. Verlag von L. Heimann, 1869 (Zitiert auf S. 15) 67 Literaturverzeichnis [Kant 1900] K A N T , Immanuel: Kritik der reinen Vernunft. Berlin : Druck und Verlag von Georg Reimer, 1900 (Zitiert auf S. 12) [Kirby und Paris 1982] K I R B Y , Laurie ; P A R I S , Jeff: Accessible independence results for Peano arithmetic. In: Bulletin of the London Mathematical Society 14 (1982), S. 285–293 (Zitiert auf S. 64) [Kleene 1943] K L E E N E , Stephen C.: Recursive Predicates and Quantifiers. In: Transactions of the American Mathematical Society Volume 53 (1943), S. 41–73 (Zitiert auf S. 40) [Kunen 1980] K U N E N , Kenneth: Set Theory. North-Holland Publishing Company, 1980 (Zitiert auf S. 21, 58) [Moret 1997] M O R E T , Bernard M.: The Theory of Computation. Addison-Wesley, 1997 (Zitiert auf S. 40) [Nielsen und L. 2000] N I E L S E N , Michael A. ; L ., Chuang I.: Quantum Computation and Quantum Information. Cambrige University Press, 2000 (Zitiert auf S. 40) [Oberschelp 1993] O B E R S C H E L P , Arnold: Rekursionstheorie. B. I. Wissenschaftsverlag, 1993 (Zitiert auf S. 35, 37, 39, 48) [Rautenberger 2008] R A U T E N B E R G E R , Wolfgang: Einführung in die Mathematische Logik. 3. Auflage. Vieweg+Teubner, 2008 (Zitiert auf S. 8, 15, 16, 20, 24, 29, 30, 41, 48) [Rosser 1936] R O S S E R , Barkley: Extensions of Some Theorems of Gödel and Church. In: Journal of Symbolic Logic Volume 1 (1936), S. 87–91 (Zitiert auf S. 39) [Russell und Whitehead 1910] R U S S E L L , Bertrand ; W H I T E H E A D , Alfred N.: Principa Mathematica. Bd. Volume 1. Cambrige University Press, 1910 (Zitiert auf S. 15) [Sainsbury 2001] S A I N S B U R Y , R. M.: Paradoxien. Reclam, 2001 (Zitiert auf S. 44) [Scholz 1959] S C H O L Z , Heinrich: Abriß der Geschichte der Logik. Verlag Karl Alber Freiburg/München, 1959 (Zitiert auf S. 15) [Schwarzweller 2009] S C H W A R Z W E L L E R , Christoph: The Chinese Remainder Theorem, its Proofs and its Generalizations in Mathematical Repositories. In: Studies in Logic, Grammar and Rhetoric 18 (2009), S. 35–50 (Zitiert auf S. 60) [Shlapenthokh 2007] S H L A P E N T H O K H , Alexandra: Hilbert’s Tenth Problem. Cambrige University Press, 2007 (Zitiert auf S. 3) [Sigmund u. a. 2006] S I G M U N D , Karl ; D A W S O N , John ; M Ü H L B E R G E R , Kurt: Kurt Gödel - Das Album. Friedr. Vieweg & Sohn Verlag, 2006 (Zitiert auf S. 3) [Soare 1987] S O A R E , Robert I.: Rekursively Enumerable Sets and Degrees. Springer Verlag, 1987 (Zitiert auf S. 34, 37) 68 Literaturverzeichnis [Stegmüller 1957] S T E G M Ü L L E R , Wolfgang: Das Wahrheitsproblem und die Idee der Semantik. Wien : Springer Verlag, 1957 (Zitiert auf S. 3, 25) [Stillwell 2003] S T I L LW E L L , John: Elements of number theory. New York : Springer, 2003 (Zitiert auf S. 10) [Tarski u. a. 1953] T A R S K I , Alfred ; M O S T O W S K I , Andrzej ; R O B I N S O N , Raphael M. ; L . E . J . B R O U W E R , A. H. (Hrsg.): Undecidable Theories. North-Holland Publishing Company, 1953 (Zitiert auf S. 44, 58, 62) [Turing 1937] T U R I N G , Alan: On Computable Numbers, with an Application to the Entscheidungsproblem. In: Proceedings of the London Mathematical Society Volume 42 (1937), S. 230–265 (Zitiert auf S. 40) [Wang 1964] W A N G , Hao: A survey of mathematical logic. Sience Press - Peking and North - Holland Publishing Company -Amsterdam, 1964 (Zitiert auf S. 57) [Wolfart 2011] W O L F A R T , Jürgen: Einführung in die Zahlentheorie und Algebra. Vieweg+Teubner, 2011 (Zitiert auf S. 60) [Woodin 2001] W O O D I N , Hugh W.: The Continuum Hypothesis. Part I. In: Notices of the American Mathematical Society 48 (2001), Nr. 6, S. 567–576 (Zitiert auf S. 3) 69 Erklärung Ich versichere, die vorliegende Bachelorarbeit selbstständig und unter ausschließlicher Verwendung der angegebenen Quellen angefertigt zu haben. Würzburg, 3.9.2013 (Jan Maly)