Skript

Werbung
Logik für Studierende der Informatik
Markus Junker (Mathematisches Institut, Universität Freiburg)
Wintersemester 2016/17 – Version von 13. Februar 2017
Inhaltsverzeichnis
1 Einleitung
2
2 Aussagenlogik
3
2.1
Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2
Semantik der klassischen zweiwertigen Aussagenlogik . . . . . . . . . . . . . . . .
6
2.3
Gesetze der klassischen zweiwertigen Aussagenlogik . . . . . . . . . . . . . . . . .
8
2.4
Boole’sche Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5
Erfüllbarkeit und Resolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6
Semantik der intuitionistischen Aussagenlogik . . . . . . . . . . . . . . . . . . . . 19
3 Prädikatenlogik (erster Stufe)
23
3.1
Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2
L-Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3
Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4
Allgemeingültige Formeln und logische Gesetze . . . . . . . . . . . . . . . . . . . 30
3.5
Der Vollständigkeitssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.6
Der Satz von Herbrand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4 Berechenbarkeit
4.1
Turing-Maschinen
4.1.1
36
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
NP-Vollständigkeit und der Satz von Cook . . . . . . . . . . . . . . . . . 36
4.2
Halteproblem und Unentscheidbarkeit der Prädikatenlogik . . . . . . . . . . . . . 36
4.3
Rekursive Funktionen und Arithmetik . . . . . . . . . . . . . . . . . . . . . . . . 40
1
MJ, Skript Info-Logik
1
Fassung von 13. Februar 2017
Einleitung
Logik wird häufig als die Lehre vom korrekten Schließen“ bezeichnet. Untersuchungsobjekte
”
der Logik sind Argumente, die typischerweise die Form
Prämisse 1
..
.
Prämisse n
Schlussfolgerung
annehmen. Untersucht wird, ob sich die Schlussfolgerung logisch korrekt“ aus den Prämissen
”
ergibt. Dabei bezieht sich logische Korrektheit üblicherweise nur auf die Form der Sätze unter
Abstraktion von ihrem konkreten Inhalt. Logische Schlüsse lassen sich daher in einer formalen
Sprache wiedergeben, weshalb Logik auch eine Theorie formaler Sprachen begründet. Logik ist
daher aus mehreren Gründen für die Informatik interessant:
• Logik ist Grundlage aller Wissenschaft, insofern wissenschaftliche Argumentation logischen
Standards genügen muss ( Logik als Propädeutik“).
”
• Der Logik als eigener Disziplin lag auch immer schon der Gedanke der Berechenbarkeit
logischer Schlüsse nahe, weshalb aus der Logik zu Beginn des 20. Jahrhunderts mit einer
Theorie der Berechenbarkeit die theoretische Informatik entstanden ist, deutlich vor der
Konstruktion der ersten Computer ( Logik als historische Grundlage“).
”
• Die Sprache der Logik ist dazu geeignet, die Arbeitsweise von Programmen zu beschreiben,
da eine Berechnung aus Eingaben einer Schlussfolgerung aus Prämissen entspricht.
• Die formalen Sprachen und die Methoden der Logik können helfen, Probleme aus der Informatik zu beschreiben oder zu lösen.
Die folgenden Namen aus der Geschichte der Logik sollten einem vielleicht vertraut sein:
• Aristoteles (384–322): Begründer der formalen Logik ( Syllogistik“)
”
• Ramon Llull (1232–1316): erste Idee einer logischen Maschine“
”
• Gottfried Wilhelm Leibniz (1646–1716): Binärsystem, binäre Rechenmaschine, Idee einer
universellen Maschine“
”
• George Boole (1815–1864), Charles Sanders Peirce (1839–1914), Gottlob Frege (1848–1925):
moderne symbolische/formalisierte Logik
• Emil Post (1897–1954), Alonzo Church (1903–1995), Stephen Kleene (1909–1994), Alan
Turing (1912–1954): Begründer der Berechenbarkeitstheorie/theoretischen Informatik
• Kurt Gödel (1906–1978): bedeutende Ergebnisse mit dem Vollständigkeitssatz und den
Unvollständigkeitssätzen
Hinweise
Wichtige Begriffe sind unterstrichen. In kursiver Schrift (oder in gerader Schrift innerhalb von
kursivem Text) sind Sprechweisen, nur vorübergehend gebrauchte oder weniger wichtige Begriffe
oder Betonungen markiert.
2
MJ, Skript Info-Logik
2
Fassung von 13. Februar 2017
Aussagenlogik
2.1
Syntax
Aussagenlogische Formeln sind alle Zeichenfolgen (Zeichenketten), die nach den unten erläuterten Regeln aus den unten aufgeführten Zeichen (Symbolen) gebildet werden können. Der
besseren Kenntlichkeit halber werde ich Zeichen blau schreiben (wie z. B. →), wenn Sie in ihrer
Funktion als einzelne Zeichen, aus denen Zeichenketten zusammengesetzt sind, angesprochen
sind, und ebenso Zeichenketten, die keine aussagenlogischen Formeln sind. Aussagenlogische
Formeln werde ich dagegen rot schreiben, wie z. B. (A0 → A1 ). Dabei kann es sein, dass die in
Rot abgedruckte Zeichenfolge bereits die aussagenlogische Formel ist, aber auch, dass sie eine
Abkürzung oder eine Variable für eine aussagenlogische Formel ist. 1
Zeichen:
Aussagenvariablen
Junktoren
A0
A1
A2
..
.
nullstellig:
einstellig:
zweistellig:
Klammern
> und ⊥
¬
∧ , ∨ , → und ↔
(
)
Es gibt also unendliche viele Aussagenvariablen. Jede soll dabei als ein einziges Zeiches gelten,
also z. B. A398652 als ein Symbol. Ein Ausdruck wie Ai wird als Variable für Aussagenvariablen
verwendet, ohne selbst eine Aussagenvariable zu sein. Solche Variablen für Symbole schreibe
ich ebenfalls blau, so wie Variablen für Formeln rot geschrieben werden.
Die Junktoren heißen der Reihe nach: Verum, Falsum, Negations-, Konjunktions-, Disjunktions-, Implikations- und Äquivalenzjunktor. In einer Formel werden die letzten fünf Junktoren
oft gelesen als: nicht – und – oder – wenn . . . dann – genau dann, wenn.
Gleichzeitig mit den aussagenlogischen Formeln F wird ihre Länge lg(F ) definiert und ihre
Schachtelungstiefe tf(F ), kurz Tiefe genannt. Die Länge ist dabei die Länge als Zeichenfolge.
Regeln:
• Jede Aussagenvariable bildet eine aussagenlogische Formel der Länge 1 und der Tiefe 0.
• > und ⊥ sind aussagenlogische Formeln der Länge 1 und der Tiefe 1.
• Wenn F1 und F2 aussagenlogische Formeln sind, dann sind auch aussagenlogische Formeln: 2
¬F1
mit Länge lg(F1 ) + 1 und Tiefe tf(F1 ) + 1

(F1 ∧ F2 ) 


(F1 ∨ F2 )  mit Länge lg(F1 ) + lg(F2 ) + 3
(F1 → F2 ) 
und Tiefe max{tf(F1 ), tf(F2 )} + 1



(F1 ↔ F2 )
1 In
meiner Farbverwendung überschreibt in der Regel eine komplexere Definition die einfachere: Wenn z. B.
in der Definition einer Formel ein Symbol vorkommt, wird dieses nicht blau, sondern die ganze Formel rot sein.
2 Mit ¬F ist die Zeichenkette gemeint, die man erhält, indem man das Zeichen ¬ vor die mit F bezeichnete
1
1
Zeichenkette setzt, etc. Nicht gemeint ist die Zeichenkette, die aus den Symbolen ¬ und F1 besteht!
Variablen für aussagenlogische Formeln stehen stets für die Zeichenkette, welche die Formel bildet.
3
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Die Menge der aussagenlogischen Formeln wird auch aussagenlogische Sprache genannt. Im
Folgenden schreibe ich im oft kurz Formel für aussagenlogische Formel“.
”
Die Notation F (Ai1 , . . . , Aik ) für eine aussagenlogische Formel F soll bedeuten, dass Ai1 ,. . . ,Aik
paarweise verschieden sind und dass sich die in der Zeichenkette F vorkommenden Aussagenvariablen darunter befinden (aber nicht alle müssen vorkommen).
Beispiele: A398652 und ⊥ sind aussagenlogische Formeln der Länge 1;
(A398652 → ⊥) ist eine aussagenlogische Formel der Länge 5 und der Tiefe 2;
¬(A398652 → ⊥) ist eine Formel der Länge 6 und der Tiefe 3.
(¬A398652 → ⊥) ist eine andere Formel der Länge 6, aber der Tiefe 2.
(¬(A398652 → ⊥) ∨ (¬A398652 → ⊥)) ist eine Formel der Länge 15 und der Tiefe 4.
Die Zeichenkette A398652 → ⊥ ist keine aussagenlogische Formel, ebensowenig ((A398652 → ⊥)).
Aussagenlogische Formeln sind induktiv über ihre Tiefe (oder Länge) definiert. Formeln der
Länge 1 heißen auch atomare Formeln, alle anderen zusammengesetzte Formeln. Per Induktion
über den Aufbau der Formeln (also über Tiefe oder Länge) kann man Eigenschaften von Formeln
definieren oder beweisen. Dies soll an zwei Beispielen geschehen.
(A) Eine Teilformel einer aussagenlogischen Formel F ist eine aussagenlogische Formel, die im
Aufbauprozess von F auftritt. Genauer:
Definition 2.1.1 Die Menge Tf(F ) der Teilformeln von F und die Menge eTf(F ) der echten
Teilformeln von F sind per Induktion über den Aufbau von Formeln definiert durch:
Tf(F ) := eTf(F ) ∪ {F }
eTf(Ai ) = eTf(>) = eTf(⊥) := ∅
eTf(¬F ) := Tf(F )
eTf((F1 ◦ F2 )) := Tf(F1 ) ∪ Tf(F2 ) für jedes ◦ ∈ {∧, ∨, →, ↔}
(B) Aussagenlogische Formeln sind eindeutig lesbar, d. h. der Aufbauprozess einer Formel ist
eindeutig aus ihr ablesbar. Dies wird durch Lemma 2.1.3 beschrieben. Wir brauchen zunächst
eine Vorbereitung: Eine Klammerung sei hier eine Zeichenkette aus den Symbolen ( und ), die
induktiv nach den folgenden Regeln gebildet werden kann:
• Die leere Zeichenfolge ist eine Klammerung.
• Wenn κ1 und κ2 Klammerungen sind, dann auch die Zeichenfolge (κ1 κ2 ).
Ist κ = z1 . . . zn mit zi ∈ {(, )} eine Klammerung, dann ist n = lg(κ) die Länge von κ als
Zeichenkette, und die Klammerungstiefe Kt(κ, i) von κ an der Stelle i ∈ {0, . . . , n} sei die
Anzahl der öffnenden minus die Anzahl der schließenden Klammern in z1 , . . . , zi .
Beispiel:
Klammerung κ :
i= 0
Kt(κ, i) = 0
(
(
1
1
(
2
2
)
3
3
)
4
2
(
5
1
)
6
2
)
7
1
8
0
Klammerungen sind so definiert, dass man aus einer aussagenlogischen Formel F eine Klammerung κ(F ) erhält, wenn man alle Klammern in F entfernt.
Lemma 2.1.2 Für Klammerungen κ der Länge n gilt Kt(κ, i) > 0 für alle i = 0, . . . , n und
Kt(κ, i) = 0 ⇐⇒ i ∈ {0, n}.
Für n > 0 und κ = (κ1 κ2 ) gilt Kt(κ, i) = 1 ⇐⇒ i ∈ {1, lg(κ1 ) + 1, n − 1}.
4
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Beweis: Für die leere Klammerung und die Klammerung ( ) der Länge 2 sind die Eigenschaften
offensichtlich. Sei also κ = (κ1 κ2 ) mit Klammerungen κ1 , κ2 der Länge l bzw. n − 2 − l. Dann
ist Kt(κ, i) = 1 + Kt(κ1 , i − 1) für 0 < i 6 l + 1 und Kt(κ, i) = 1 + Kt(κ2 , i − (l + 1)) für
l + 1 6 i < n. Per Induktion über die Länge der Klammerung folgt nun alles leicht.
Lemma 2.1.3 (Eindeutige Lesbarkeit aussagenlogischer Formeln)
Eine zusammengesetzte Formel F ist entweder von der Form ¬F1 oder von der Form (F1 ◦ F2 ).
Dabei ist die Zerlegung jeweils eindeutig, d. h. falls ¬F1 = ¬F10 , dann ist F1 = F10 und falls
(F1 ◦ F2 ) = (F10 ∗ F20 ) mit ◦, ∗ ∈ {∧, ∨, →, ↔}, dann ist ◦ = ∗, F1 = F10 und F2 = F20 .
Beweis: Da F nach den Zusammensetzungsregeln aussagenlogischer Formeln entweder mit ¬
oder mit ( beginnen muss und da man ¬F1 im ersten Fall durch Weglassen des Negationsjunktors
erhält, ist alles bis auf den letzten Teil offensichtlich. Sei also (F1 ◦ F2 ) = (F10 ∗ F20 ) wie oben.
Nun betrachtet man die zugrundeliegende Klammerung κ = κ((F1 ◦ F2 )) = κ((F10 ∗ F20 )). Klar
ist wiederum: F1 beginnt mit ( genau dann, wenn F10 mit ( beginnt, und F20 endet mit ) genau
dann, wenn F20 mit ) endet. Wenn beides der Fall ist, zerlegt sich κ nach Lemma 2.1.2 in (κ1 κ2 )
mit κ1 6= ∅ =
6 κ2 , und die eindeutige Trennstelle von κ1 und κ2 gibt die Position von ◦ und von ∗
an. Ansonsten ist κ = (κ0 ) und die Klammerung κ0 ist entweder die leere Klammerung – nämlich
genau dann, wenn F1 und F2 atomar sind – oder κ0 = κ(F1 ) = κ(F10 ) – nämlich genau dann,
wenn F1 und F10 mit ( beginnen und F2 und F20 nicht mit ) enden – oder κ0 = κ(F2 ) = κ(F20 )
im umgekehrten Fall. In jedem Fall stehen ◦ und ∗ an der gleichen Position und sind daher
insbesondere auch gleich.
In ähnlicher Art kann man die beiden folgenden Lemmata beweisen:
Lemma 2.1.4 Kein echtes Anfangsstück einer aussagenlogischen Formel ist selbst eine aussagenlogische Formel.
Lemma 2.1.5 (Substitution von Teilformeln)
Sind F 0 und F aussagenlogische Formeln und hat F die Gestalt K F 0 K 0 für Zeichenketten K
und K 0 dann ist F 0 eine Teilformel von F . 3
Ist G0 eine beliebige aussagenlogische Formel, dann ist auch K G0 K 0 eine Formel.
Bemerkung: (a) Die hier präsentierte Syntax der Aussagenlogik ist eine mögliche Variante
einer aussagenlogische Sprache. In der Literatur findet man andere Varianten, die sich
• in den Symbolen für die Aussagenvariablen und Junktoren,
• in der Auswahl der Junktoren
• oder in der Klammerungsweise
unterscheiden. Hier folgt die Schreibweise von Formeln mit zweistelligen Junktoren der Konvention z. B. bei einer Addition wie 3 + 2 das Pluszeichen zwischen die Argumente zu setzen.
Eine grundsätzlich andere Möglichkeit orientiert sich an der Schreibweise f (x, y) abstrakter
Funktionen. Statt z. B. (¬A398652 → ⊥) schreibt man dann → (¬(A398652 ), ⊥) bzw. klammerund kommafrei → ¬A398652 ⊥ (polnische Notation), oder A398652 ¬⊥ → (umgekehrte polnische
Notation). Die polnische Notation erreicht die eindeutige Lesbarkeit ohne Klammern und erlaubt eine einheitliche Darstellung aller Junktoren, weshalb ich sie ab und zu in Beweisen
verwendet werde. Sie hat aber den Nachteil einer für Menschen schlechteren Lesbarkeit.
Konkatenation K K 0 bezeichnet die Zeichenkette, die durch Hintereinanderhängen von K und K 0
entsteht.
3 Die
5
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
(b) Eine aussagenlogische Formel ist eigentlich ein orientierter binärer Baum, dessen Blätter mit
Aussagenvariablen, Verum und Falsum und dessen innere Knoten mit höherstelligen Junktoren
etikettiert sind. Zum Beispiel entspricht die Formel (¬(A0 → ⊥) ∨ (A2 ↔ A0 )) dem Baum:
∨
@
@
¬
A0
→
A2
@
@
⊥
↔
@
@
A0
Die Anzahl der Knoten ist die Länge der Formel in polnischer Notation (also ohne Klammern);
die Höhe des Baums ist im Wesentlichen die Tiefe der Formel (evtl. −1, falls die längsten Pfade
alle mit > oder ⊥ enden). Die eindeutige Lesbarkeit von Formeln bedeutet, dass man eine
sequentielle Darstellung des zweidimensionalen Baumes gefunden hat, aus der sich der Baum
rekonstruieren lässt.
2.2
Semantik der klassischen zweiwertigen Aussagenlogik
Die Menge der Wahrheitswerte sei {0, 1} als angeordnete Menge mit 0 < 1. Der Wahrheitswert 0
heißt auch falsch, der Wahrheitswert 1 wahr. Bei Bedarf wird die Menge der Wahrheitswerte mit
dem Körper F2 identifiziert, so dass die arithmetischen Operationen +, − und · benutzt werden
können. Eine Belegung der Aussagenvariablen mit Wahrheitswerten, kurz: Belegung, ist eine
Abbildung β : {Ai | i ∈ N} → {0, 1}.
Jede Belegung β wird mittels der nächsten Festlegung induktiv zu einer Funktion fortgesetzt,
die jeder aussagenlogischen Formel F einen Wahrheitswert β(F ) zuordnet. ( Auswertungen“
”
von Zeichen und Formeln schreibe ich grün.) Dazu wird zunächst jedem n-stelligen Junktor ∗
folgendermaßen eine n-stellige Funktion ∗ : {0, 1}n → {0, 1} zugeordnet: 4
> := 1
⊥ := 0
¬ (w) := 1 − w
∧ (v, w) := min{v, w}
→ (v, w) :=
∨ (v, w) := max{v, w}
↔ (v, w) :=
1 falls v 6 w
0 falls v > w
1 falls v = w
0 falls v 6= w
Wenn nun eine aussagenlogische Formel F mithilfe eines n-stelligen Junktors ∗ aus Formeln
F1 ,. . . ,Fn zusammengesetzt ist, so setzt man
β(F ) := ∗ β(F1 ), . . . , β(Fn ) .
In polnischer Notation hätte man also β(∗F1 . . . Fn ) = ∗ β(F1 ), . . . , β(Fn ) .
Das Prinzip, dass sich der Wahrheitswert einer zusammengesetzten Formel F unabhängig von
der konkreten Gestalt der Teilformeln nur aus dem führenden Junktor und den Wahrheitswerten
der Teilformeln berechnet, heißt Kompositionalitätsprinzip. Es beinhaltet auch die Kontextfreiheit, die bedeutet, dass die Berechnung unabhängig davon ist, in welcher umfassenderen Formel
F als Teilformel vorkommen mag.
4 Man
kann analoge Definitionen für eine Boolesche Algebra (siehe Abschnitt 2.4) von Wahrheitswerten geben.
6
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Lemma 2.2.1 Wenn β1 , β2 zwei Belegungen sind, die auf allen in einer Formel F vorkommenden Aussagenvariablen übereinstimmen, dann gilt β1 (F ) = β2 (F ).
Beweis: Offensichtlich. Formaler Beweis über den Aufbau der Formel.
Die Funktion (β(Ai ))i∈I 7→ β(F ) nennt man auch den Wahrheitswertverlauf von F . Aus
dem Lemma folgt, dass für eine Formel F (Ai1 , . . . , Ain ) bereits eine partielle Belegung β 0 :
{Ai1 , . . . , Ain } → {0, 1} der in F vorkommenden Aussagenvariablen einen eindeutigen Wahrheitswert β 0 (F ) bestimmt. Der Wahrheitswertverlauf von F ist daher bei n vorkommenden
Aussagenvariablen durch 2n partielle Belegungen bestimmt und kann übersichtlich in einer
Wahrheitstafel dargestellt werden. Beispielsweise für F = ((¬A0 → A1 ) ∨ ⊥) :
A0
0
0
1
1
A1
0
1
0
1
¬A0
1
1
0
0
(¬A0 → A1 ) ⊥ ((¬A0 → A1 ) ∨ ⊥)
0
0
0
1
0
1
1
0
1
1
0
1
Definition 2.2.2 (a) Eine aussagenlogische Formel F heißt Tautologie oder allgemeingültig,
in Zeichen: ` F , falls β(F ) = 1 für alle Belegungen β.
F heißt erfüllbar oder konsistent, falls es eine Belegung β gibt mit β(F ) = 1.
(b) Zwei aussagenlogische Formeln F1 , F2 heißen (logisch) äquivalent zueinander, in Zeichen:
F1 ∼ F2 , falls β(F1 ) = β(F2 ) für alle Belegungen β.
(c) Eine aussagenlogische Formel F wird von einer Menge von Formeln {Fi | i ∈ I} impliziert
(oder folgt (logisch) aus dieser Menge), in Zeichen: {Fi | i ∈ I} ` F , falls β(F ) = 1 für jede
Belegung β, die für alle i ∈ I die Bedingung β(Fi ) = 1 erfüllt.
(d) Eine Menge von Formeln {Fi | i ∈ I} heißt widerspruchsfrei oder erfüllbar, falls es eine
Belegung β gibt mit β(Fi ) = 1 für alle i ∈ I, und andernsfalls widersprüchlich.
Für {F1 , . . . , Fn } ` F schreibt man auch kurz F1 , . . . , Fn ` F .
Man beachte, dass sich aus der Definition das ex-falso-quodlibet-Prinzip ergibt: Jede beliebige
Formel F folgt aus einer widersprüchlichen Formelmenge! Insbesondere gilt ⊥ ` F .
Lemma 2.2.3 (Zusammenhänge)
(a) ` F ⇐⇒ ∅ ` F ⇐⇒ > ` F ⇐⇒ F ∼ > ⇐⇒ ¬F ist nicht erfüllbar.
(b) F1 ∼ F2 ⇐⇒ ` (F1 ↔ F2 ) ⇐⇒ (F1 ` F2 und F2 ` F1 )
(c) F1 , . . . , Fn ` F ⇐⇒ ((·(F1 ∧ F2 ) ∧ . . . ) ∧ Fn ) ` F
⇐⇒ ` (((·(F1 ∧ F2 ) ∧ . . . ) ∧ Fn ) → F )
(d) {F1 , . . . , Fn } ist erfüllbar
⇐⇒ ((·(F1 ∧ F2 ) ∧ . . . ) ∧ Fn ) ist erfüllbar
{F1 , . . . , Fn } ist nicht erfüllbar ⇐⇒ ((·(F1 ∧ F2 ) ∧ . . . ) ∧ Fn ) ∼ ⊥
⇐⇒ F1 , . . . , Fn ` ⊥
Beweis: Übung (folgt unmittelbar aus den Definitionen).
7
MJ, Skript Info-Logik
2.3
Fassung von 13. Februar 2017
Gesetze der klassischen zweiwertigen Aussagenlogik
Aus Lemma 2.2.3 folgt, dass alles, was sich über endliche viele Formeln mit den in Definition 2.2.2 definierten Begriffen aussagen lässt, in Form einer logischen Äquivalenz ausdrücken
lässt. Da es unendlich viele Formeln in n fest gewählten Aussagenvariablen gibt, dafür aber
nur 2n mögliche Wahrheitswertverläufe, gibt es viele Äquvalenzen zwischen Formeln. Solch eine
Äquivalenz kann man als eine Umformungsregel“ auffassen. Alle Äquvalenzen lassen sich auf
”
eine Reihe von elementaren Umformungen zurückführen.
Erinnerung: Wenn F 0 eine Teilformel von F = K F 0 K 0 ist und G0 eine weitere Formel, dann
ist auch G = K G0 K 0 eine Formel (Lemma 2.1.5). Folglich ist auch die Zeichenkette, die aus
F entsteht, indem jedes Vorkommen einer festen Aussagenvariable Ai in F gleichzeitig durch
eine Formel H ersetzt wird, wieder eine Formel. Diese wird mit F AHi bezeichnet.
Lemma 2.3.1 (Aussagenlogisches Substitutionsprinzipien)
Sei F ∼ G. Dann ist F AHi ∼ G AHi ( uniforme Substitution ) und K F K 0 ∼ K G K 0 , sofern
dies Formeln sind ( äquivalente Substitution ).
Beweis: Beide Prinzipien folgen sofort aus der Kompositionalität, da es nur auf die Wahrheitswerte von Ai bzw. F /G ankommt.
Beispiel: Aus (A0 ∨ ¬A0 ) ∼ > folgt mit A0 ∼ ¬¬A0 und äquivalenter Substitution etwa
(A0 ∨ ¬¬¬A0 ) ∼ > und mit uniformer Substitution z. B. ((A1 → A2 ) ∨ ¬(A1 → A2 )) ∼ >.
Lemma 2.3.2 Es gelten folgende elementaren Regeln, deren Gültigkeit man leicht anhand von
Wahrheitstafeln nachprüft. Dabei stehen A, B, C als Variable für Aussagenvariablen (bzw.
wegen des Prinzips der äquivalenten Substitution auch für Formeln).
>-/⊥-Regeln:
¬> ∼ ⊥
(A ∧ >) ∼ A
(A ∨ >) ∼ >
¬⊥ ∼ >
(A ∧ ⊥) ∼ ⊥
(A ∨ ⊥) ∼ A
¬ -Regeln:
¬¬A ∼ A
(A ∨ ¬A) ∼ >
(A ∧ ¬A) ∼ ⊥
Doppelnegationsregel
Prinzip des ausgeschlossenen Dritten
Prinzip des ausgeschlossenen Widerspruchs
∧-/∨-Regeln:
(A ∧ A) ∼ A
(A ∧ B) ∼ (B ∧ A)
((A ∧ B) ∧ C) ∼ (A ∧ (B ∧ C))
((A ∧ B) ∨ C) ∼ ((A ∨ C) ∧ (B ∨ C))
(A ∨ A) ∼ A
(A ∨ B) ∼ (B ∨ A)
((A ∨ B) ∨ C) ∼ (A ∨ (B ∨ C))
((A ∨ B) ∧ C) ∼ ((A ∧ C) ∨ (B ∧ C))
Regeln von de Morgan:
¬(A ∧ B) ∼ (¬A ∨ ¬B)
¬(A ∨ B) ∼ (¬A ∧ ¬B)
Definition von → bzw. ↔:
(A → B) ∼ (¬A ∨ B)
(A ↔ B) ∼ ((A → B) ∧ (B → A))
Idemp.
Komm.
Ass.
Distr.
Die ∧-/∨-Regeln heißen der Reihe nach: Idempotenz, Kommutativität und Assoziativität von ∧
bzw. ∨ sowie Distributivität von ∨ über ∧ bzw. umgekehrt.
8
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Weitere Regeln Nützlich zu kennen sind außerdem folgende Gesetze:
Absorption
((A ∧ B) ∨ A) ∼ A
((A ∨ B) ∧ A) ∼ A
Kontraposition
(A → B) ∼ (¬B → ¬B)
(A ↔ B) ∼ (¬B ↔ ¬B)
Currying“
”
Transitivität von →
((A ∧ B) → C) ∼ (A → (B → C))
Rechts-Distributivität
von → über ∧ bzw. ∨
(A → (B ∧ C)) ∼ ((A → B) ∧ (A → C))
(A → (B ∨ C)) ∼ ((A → B) ∨ (A → C))
Links-Antidistributivität
von → über ∧ bzw. ∨
((A ∧ B) → C) ∼ ((A → C) ∨ (B → C))
((A ∨ B) → C) ∼ ((A → C) ∧ (B → C))
(A → B), (B → C) ` (A → C)
Abkürzungen Im weiteren Verlauf werden folgende abkürzende Schreibweisen verwendet:
(F1 ∧ F2 ∧ · · · ∧ Fn )
(F1 ∨ F2 ∨ · · · ∨ Fn )
oder
oder
n
^
i=1
n
_
Fi
für die Formel ((·(F1 ∧ F2 ) ∧ . . . ) ∧ Fn )
Fi
für die Formel ((·(F1 ∨ F2 ) ∨ . . . ) ∨ Fn )
i=1
Für n = 1 sei dabei
1
V
i=1
Fi = F1 und
1
W
Fi = F1 ; für n = 0 sei
i=1
V
Fi = > und
i∈∅
W
Fi = ⊥.
i∈∅
Häufig werden aussagenlogische Formeln nur bis auf logische Äquivalenz betrachtet. Dann spielt
die Reihenfolge und die Klammerungsreihenfolge innerhalb einer Konjunktion bzw. Disjunktion
keine Rolle, da sich bei anderer Reihenfolge logisch äquivalente Formeln ergeben. In diesem Sinn
V
kann man auch Mengennotationen wie {Fi | i ∈ I} etc. einführen.
Definition 2.3.3 Ein Literal ist eine aussgenlogische Formel, die entweder eine Aussagenvariable Ai oder eine negierte Aussagenvariable ¬Ai ist.
Eine Formel ist in disjunktiver Normalform (DNF), wenn sie eine Disjunktion sogenannter
Konjunktionsterme ist, d. h. mit Literalen Lij und k, n1 , . . . , nk ∈ N von der Form
((L11 ∧ · · · ∧ L1n1 ) ∨ · · · ∨ (Lk1 ∧ · · · ∧ Lknk )).
Eine Formel ist in konjunktiver Normalform (KNF), wenn sie eine Konjunktion sogenannter
Disjunktionsterme oder Klauseln ist, d. h. (mit Lij etc. wie oben) von der Form
((L11 ∨ · · · ∨ L1n1 ) ∧ · · · ∧ (Lk1 ∨ · · · ∨ Lknk )).
Insbesondere sind also > und ⊥ in DNF und in KNF (Fall k = 0 bzw. k = 1 und n1 = 0).
Lemma 2.3.4 Jede Formel ist logisch äquivalent zu einer Formel in disjunktiver Normalform
und logisch äquivalent zu einer Formel in konjunktiver Normalform.
Erster Beweis durch Kodieren der Wahrheitstafel (am Beispiel der DNF): Ohne Einschränkung kommen in F genau die Aussagenvariablen A0 ,. . . ,An vor. Für Belegungen β definiert
man das Symbol
Ai falls β(Ai ) = 1
(¬)β Ai :=
¬Ai falls β(Ai ) = 0
9
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Für jede Belegung β 0 gilt dann
β0
n
^
(¬)β Ai = 1 ⇐⇒ β 0 und β stimmen auf A0 ,. . . ,An überein.
i=0
Also ist:
F ∼
_
n
^
(¬)β Ai
β(F )=1 i=0
Dual“ dazu kann man eine KNF konstruieren. 5 Alternativ kann man ¬F in DNF D bringen.
”
¬D ist dann logisch äquivalent zu F und kann durch Anwenden der Regeln von de Morgan
sofort in KNF umgeformt werden.
Bemerkung: Die im diesem Beweis konstruierte disjunktive Normalform hat die Eigenschaft,
dass in jedem Konjunktionsterm jede der in F vorkommenden Aussagenvariablen genau einmal
vorkommt. Sie ist bis auf Reihenfolge der Konjunktionsterme, Reihenfolge der Literale innerhalb
der Konjunktionsterme und Klammerungsreihenfolge eindeutig. Durch Konventionen für die
Reihenfolgen (z. B. Linksklammerung, Aussagenvariable innerhalb der Konjunktionsterme nach
Indizes aufsteigend geordnet und Belegungen lexikographisch) erhält man eine eindeutige DNF,
die kanonische disjunktive Normalform. (Analog für die KNF.)
Skizze des zweiten Beweises: Durch die elementaren Regeln aus Lemma 2.3.2 kann man
eine Formel F mit folgendem Verfahren sukzessive in kanonische DNF umformen:
1. Ersetze alle Junktoren ↔ und dann alle Junktoren → durch ihre Definition.
2. Vereinfache alle Vorkommen von > und ⊥ mit Hilfe der >-/⊥-Regeln, bis nur noch eine
Formel > oder ⊥ übrig bleibt oder kein > oder ⊥ mehr vorkommt.
3. Ziehe mit den de Morgan’schen Regeln alle Negationen nach innen“ bis unmittelbar vor
”
die Aussagenvariablen.
4. Wende solange das Distributivgesetz (von ∧ über ∨) an, bis die Formel DNF hat.
5. Durch Kommutativität und Assoziativität können Konjunktionsterme beliebig sortiert
werden, durch Idempotenz doppelte Vorkommen von Literalen in einem Konjunktionsterm eliminiert werden.
6. Ersetze gleichzeitiges Vorkommen von Ai und ¬Ai in einem Konjunktionsterm durch
⊥ (Prinzip des ausgeschlossenen Widerspruchs) und führe wieder den 2. Schritt durch.
Dabei bleibt die Formel in DNF.
7. Ersetz ggf. einen Konjuntionsterm K durch (K ∧ >) ∼ (K ∧ (Ai ∨ ¬Ai )) und verwende
erneut das Distributivgesetz, um wieder DNF zu erreichen, bis in allen Konjunktionstermen alle Aussagenvariablen von F vorkommen.
Man muss sich nun noch davon überzeugen, dass das Verfahren stoppt und das gewünschte
Ergebnis liefert. (Ein analoges Verfahren funktioniert für die KNF.)
Beispiel: (A1 → A0 ) ist logisch äquivalent zu (¬A1 ∨ A0 ), was bereits eine Formel in DNF ist.
Die kanonische DNF ist allerdings ((A0 ∧ A1 ) ∨ (A0 ∧ ¬A1 ) ∨ (¬A0 ∧ ¬A1 )).
5 Näheres
zum Konzept der Dualität siehe Abschnitt 2.4.
10
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Folgerung 2.3.5 (a) Alle logischen Äquivalenzen folgen aus den elementaren Regeln aus Lemma 2.3.2 und den Substitutionsprinzipien aus Lemma 2.3.1.
(b) Zu jedem n und jeder Funktion f : {0, 1}n → {0, 1} gibt es eine aussagenlogische Formel
F (A0 , . . . , An−1 ) mit f als Wahrheitswertverlauf“, d. h. für alle Belegungen β gilt β(F ) =
”
f β(A0 ), . . . , β(An−1 ) .
Definition 2.3.6 Eine Menge von Junktoren J heißt vollständiges Junktorensystem, falls es
zu jedem n und jeder n-stelligen Funktion f : {0, 1}n → {0, 1} eine aussagenlogische Formel mit
diesem Wahrheitswertverlauf gibt (in dem in 2.3.5 (b) präzisierten Sinn), in der nur Junktoren
aus J vorkommen.
Insbesondere ist jede aussagenlogische Formel logisch äquivalent zu einer Formel, in der alle
vorkommenden Junktoren aus dem vollständigem Junktorensystem J stammen.
Satz 2.3.7 {¬, ∧} und {¬, ∨} bilden vollständige Junktorensysteme.
Beweis: Aus dem ersten Beweis für die Existenz der DNF folgt sofort, dass {¬, ∨, ∧, ⊥, >}
ein vollständiges Junktorensystem ist. Aus ⊥ ∼ ¬>, > ∼ (A0 ∨ ¬A0 ) und den substitutierten
Regeln von de Morgan, also z. B. (A0 ∧ A1 ) ∼ ¬(¬A0 ∨ ¬A1 ), folgt dann der Satz.
Man kann die Anforderung an ein vollständiges Junktorensystem J dahingehend verstärken,
dass jede aussagenlogische Formel F zu einer Formel äquivalent sein soll, in der nur Junktoren
aus J vorkommen und keine weiteren Aussagenvariablen als die in F vorkommenden. Dann
braucht man zusätzlich zu {¬, ∧} bzw. {¬, ∨} noch jeweils > oder ⊥.
{→, ⊥} ist ein anderes Beispiel eines vollständigen Junktorensystems im stärkeren Sinne. Man
kann das Konzept auch auf neue“ Junktoren ausdehnen und erhält mit NOR (A0 ↓ A1 ) :∼
”
¬(A0 ∨ A1 ) und NAND (A0 ↑ A1 ) :∼ ¬(A0 ∧ A1 ) vollständige Junktorensysteme {↓} und {↑}
im Sinne der ursprünglichen Definition. 6
2.4
Boole’sche Algebren
Logische Äquivalenz ist eine Äquivalenzrelation auf der Menge der aussagenlogischen Formeln.
Die Äquivalenzklasse einer Formel F bezeichne ich mit F /∼ . (Ein Repräsentantensystem der
Äquivalenzklassen ist z. B. durch die Formeln in kanonischer disjunktiver Normalformen mit
jeweils minimaler Anzahl an vorkommenden Aussagenvariablen gegeben.)
Aus den Substitutionsregeln folgt, dass man die Junktoren als Verknüpfungen auf den Äquivalenzklassen definieren kann; z. B. ist (F /∼ ) ∧ (G/∼ ) := (F ∧ G)/∼ wohldefiniert und ∧ wird
somit zu einer kommutativen und assoziativen zweistelligen Verknüpfung auf den Äquivalenzklassen, analog ∨. Die Menge der F∞ der Äquivalenzklassen aussagenlogischer Formeln zusammen mit den Operationen ∧ und ∨ ist eine Struktur, die Tarski-Lindenbaum-Algebra heißt
und ein Beispiel einer Boole’schen Algebra ist. Üblicherweise nimmt man noch die aus der
Negation definierte einstellige Verknüpfung ¬ (F /∼ ) := ¬F /∼ und die Äquivalenzklassen von
> und ⊥ als Konstanten hinzu. Schränkt man die Grundmenge ein auf die Äquivalenzklassen von Formeln, in denen nur die Aussagenvariablen A0 ,. . . ,An−1 vorkommen, erhält man die
Tarski-Lindenbaum-Algebra Fn .
6 NAND
wird auch | geschrieben und Sheffer-Strich genannt; NOR heißt auch Peirce-Funtion oder -Operator.
11
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Definition 2.4.1 Eine Boole’sche Algebra B = (B; u, t, c , 1, 0) ist eine Struktur mit zwei zweistelligen Verknüpfungen u und t, einer einstelligen Verknüpfung c und zwei Konstanten 1 und
0, für die gelten:
[]
[Distributivgesetze]
[Absorptionsgesetze]
[de Morgan’sche Regeln]
[Doppelnegation]
[Extremalgesetze]
[Komplementgesetze]
u und t sind idempotent, kommutativ und assoziativ
(a t (b u c)) = (a t b) u (a t c) (a u (b t c)) = (a u b) t (a u c)
a t (a u b) = a
a u (a t b) = a
(a u b)c = ac t bc
(a t b)c = ac u bc
acc = a
au1=at0=a
a u 0 = 0, a t 1 = 1
a u ac = 0, insbesondere 1c = 0 a t ac = 1, insbesondere 0c = 1
Dies ist eine traditionelle, aber nicht unabhängige Liste von Axiomen. Zum Beispiel kann man
die de Morgan’schen Regeln und die Absorptionsgesetze aus den restlichen Axiomen herleiten.
Eine Struktur mit zwei idempotenten, kommutativen und assoziativen Verknüpfungen u und
t, die die Absorptionsgesetze erfüllen, heißt Verband. Verbände kann man durch sogenannte
Hasse-Diagramme darstellen (wie z. B. auf Seite 14 ). Gelten die Distributivgesetze, heißt der
Verband distributiver Verband; gibt es Elemente 0 und 1, die die Extremalgesetze erfüllen,
spricht man von einem beschränkten Verband.
In einem Verband wird durch
a v b : ⇐⇒ a t b = b ⇐⇒ a u b = a
eine partielle Ordnung definiert. Darin ist a u b das Infimum zweier Elemente a und b (also das
größte Element x, das x v a und x v b erfüllt), und a t b das Supremum. Ist der Verband
beschränkt, dann ist 0 das kleinste und 1 das größte elemente der Ordnung. Umgekehrt ist
jede partielle Ordnung mit diesen Eigenschaften ein beschränkter Verband. Ist der Verband
auch distributiv und existieren Komplemente (d. h. zu jedem a ein Element ac , so dass die
Komplementgesetze gelten) dann ist die partielle Ordnung eine Boole’esche Algebra.
F∞ und Fn sind mit den Verkmüpfungen ∧, ∨, ¬ und den Konstanten >/∼ und ⊥/∼ Boole’sche Algebren. Die partielle Ordnung wird durch die logische Folgerung bzw. den Junktor →
beschrieben, d. h.
F /∼ v G/∼ ⇐⇒ F ` G ⇐⇒ ` (F → G).
Andere Beispiele Boole’scher Algebren sind die Potenzmengenalgebren. Zu einer Menge M sei
P(M ) die Potenzmenge von M , und für X ⊆ M sei X c := M \ X das mengentheoretische
Komplement in M . Dann ist (P(M ); ∩, ∪, c , M, ∅). eine Boole’sche Algebra.
Eine Unteralgebra einer Boole’schen Algebra ist eine Teilmenge U , die 0 und 1 enthält und unter
den Operationen u, t und c abgeschlossen ist. U ist dann mit den eingeschränkten Operationen
selbst eine Boole’sche Algebra. Ein Homomorphismus zwischen Boole’schen Algebren B1 und
B2 ist eine Abbildung h : B1 → B2 , die mit allen Konstanten und Operationen verträglich ist,
für die also gilt: 7
h(a uB1 b) = h(a) uB2 h(b)
cB1
h(a
) = h(a)
cB2
,
und
h(a tB1 b) = h(a) tB2 h(b)
h(0B1 ) = 0B2
und
h(1B1 ) = 1B2
Ein Isomorphismus zwischen Boole’schen Algebren ist ein bijektiver Homomorphismus.
7 Der
Index an den Operationen zeigt jeweils an, in welcher Struktur sie berechnet wird.
12
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Die Menge der Wahrheitswerte {0, 1} mit 0 < 1 ist eine Boole’sche Algebra (die isomorph zu
P(∅) und zu F0 ist). Die Auswertung von Formeln ist gerade so definiert, dass eine Belegung
β einen Homomorphismus Boole’scher Algebren β : F∞ → {0, 1}, F /∼ 7→ β(F ) ergibt. Da eine
Formel bis auf logische Äquivalenz durch ihren Wahrheitwertverlauf bestimmt ist, kann man
sie mit der Menge der Belegungen, die sie wahr macht, identifizieren. Dies funktioniert sehr viel
allgemeiner:
Satz 2.4.2 (Darstellungssatz von Stone)
Jede Boole’sche Algebra ist isomorph zu einer Unteralgebra einer Potenzmengenalgbra.
Beweisskizze: Sei B eine beliebige Boole’sche Algebra. Man betrachtet
M := h : B → {0, 1} h ist Homomorphismus Boole’scher Algebren .
Ein Element von B wird nun mit der Menge der Homomorphismen identifiziert, die das Element
auf 1 abbilden:
S : B → P(M ), S(b) := h : B → {0, 1} h(b) = 1
Die so definierte Abbildung S ist ein injektiver Homomorphismus: Die Homomorphie-Eigenschaften sind einfach nachzuweisen; z. B. sieht man sofort S(0) = ∅ und S(1) = M . Die Injektivität erfordert für den allgemeinen Fall etwas Mathematik; für die Tarski-Lindenbaum-Algebren
folgt sie dagegen sofort aus der Definition der logischen Äquivalenz, da sich zwei nicht äquivalente Formeln in mindestens einer Belegung unterscheiden müssen.
Aus dem Stone’schen Satz ergibt sich die Möglichkeit, die Gültigkeit logischer Gesetze durch
Mengen-Diagramme (z. B. Venn-Diagramme) nachzuweisen.
Dualität
Definition 2.4.3 Zu einer Boole’schen Algebra B = (B; u, t, c , 1, 0) ist die duale Algebra definiert als B ∗ = (B; t, u, c , 0, 1). In der Betrachtungsweise als partielle Ordnung ist B ∗ = (B; w)
die umgedrehte Ordnung zu B = (B; v), also x vB∗ y ⇐⇒ y vB x.
Satz 2.4.4 B und B ∗ sind isomorph zueinander via b 7→ bc .
Beweis: Aus der Doppelnegationsregel bcc = b folgt, dass b 7→ bc eine Bijektion ist. Zusammen
mit den de Morgan’schen Regeln, 0c = 1 und 1c = 0 sieht man die Homomorphie.
Die Axiome der Boole’schen Algebren bestehen bis auf die Doppelnegationsregel aus Paaren
zueinander dualen Axiomen.
Definition 2.4.5 Sei F eine Formel, in der die Junktoren → und ↔ nicht vorkommen. Die
duale Formel F ∗ entsteht aus F , indem simultan alle Vorkommen von ∧ durch ∨ ersetzt werden
und umgekehrt und alle Vorkommen von > durch ⊥ ersetzt werden und umgekehrt.
Folgerung 2.4.6 F ` G ⇐⇒ G∗ ` F ∗ und F ∼ G ⇐⇒ F ∗ ∼ G∗ .
Beweis: Falls F ` G, so folgt mit der Kontrapositionsregel (oder nach Satz 2.4.4) ¬G ` ¬F .
Kommen → und ↔ nicht vor, kann man mit Hilfe der de Morgan’schen Regeln die Negation
13
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
nach innen ziehen; dabei wird F zu F ∗ , wobei allerdings zusätzlich vor jeder Aussagenvariable
ein Negationsjunktor steht. Also hat man
G∗
¬An
¬A0
¬An
¬A0
...
` F∗
...
A0
An
A0
An
(wobei die Verallgemeinerung der Notation aus Lemma 2.3.1 eine simultane uniforme Substitution aller in F und G auftretenden Aussagenvariablen durch ihre Negationen bedeuten soll).
Durch uniforme (Re-)Substitution (Ai wird erneut durch ¬Ai substitutiert und die Doppelnegationsregel angewandt) erhält man schließlich G∗ ` F ∗ . Die Aussage über äquivalente Formeln
F ∼ G folgt daraus.
Zur Illustration sei das Hasse-Diagramm der Tarski-Lindenbaum-Algebra F2 angegeben (mit
ausgewählten Repräsentanten). Die Dualität sieht man als Punktsymmetrie:
s>
Q
A Q
A Q
A QQ
A
Q
Q
A (A ∨ ¬B)
QQ(A
(¬A ∨ ¬B) (¬A
∨
B)
As
s
sH
s ∨ B)
H
@
HH
HH
H
H
HH
@
HH HH
H
H
H
H
HH
HH@@
HH
HH
HH
HH@
H
H
H
@
s
s
s
s
s
H
H
Hs
¬A H
(A ↔ B) H
¬(A ↔ B)
B
A
HH
HH ¬B H
HH
@
H
@ H
H
HH
HH @ HHH
H
H
HH HH @
HH
@
H
H
H
HH
HHs
HHs
@s
s (¬A ∧ ¬B) QQ(¬A ∧ B) A
(A
∧
¬B)
(A ∧ B)
A
Q
Q
A
Q
Q A
Q A Q
Q
A
s
⊥
2.5
Erfüllbarkeit und Resolution
Typische Fragen zu aussagenlogischen Formeln lassen sich als Erfüllbarkeitsprobleme umformulieren: Zum Beispiel sind F und G genau dann äquivalent, wenn ¬(F ↔ G) nicht erfüllbar ist.
Es gibt zwei Erfüllbarkeitsprobleme:
• Das Entscheidungsproblem: Ist eine gegebene Formel erfüllbar?
• Das Such- oder Konstruktionsproblem: Finde für eine gegebene (erfüllbare) Formel eine
erfüllende Belegung.
Beide Probleme sind lösbar durch das Aufstellen von Wahrheitstafeln. Allerdings muss man bei
n Aussagenvariablen im schlimmsten Fall 2n Belegungen ausrechnen, hat also ein exponentielles
Wachstum, was bereits bei etwa 100 Aussagenvariablen praktisch nicht mehr durchführbar ist.
Es stellt sich daher die Frage, ob es bessere Algorithmen gibt als Wahrheitstafeln auszurechnen.
Der Satz von Cook (siehe Satz ??) besagt, dass dies in einer sehr prinzipiellen Weise nicht möglich ist. Allerdings gibt es gute Algorithmen für Formeln in besonderer Gestalt (z. B. Formeln
in DNF, Horn-Formeln), und es gibt Algorithmen, die häufig besser als Wahrheitstafeln sind
(Baum- oder Tableauverfahren, Resolution).
14
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Baumkalküle
In Wahrheitstafeln wird der Wahrheitswertverlauf einer Formel von unten“ ausgerechnet, d. h.
”
entlang des induktiven Aufbaus der Formel von den Aussagenvariablen ausgehend zu immer
komplexeren Teilformeln. Alternativ kann man ihn von oben“ bestimmen, d. h. unter Betrach”
tung des zuletzt hinzugekommenen Junktors untersuchen, unter welchen Bedingungen die Gesamtformel einen bestimmten Wahrheitswert bekommen kann. Es gibt verschiedene Varianten
in der Darstellung dieser Methode, die als Baumkalküle oder Tableau-Methoden bekannt sind.
Am Beispiel der Konjunktion sei die Grundidee aufgezeigt: (A ∧ B) ist genau dann wahr, wenn
A und B wahr sind. Der Fall, dass (A ∧ B) wahr ist, also den Wahrheitswert 1 bekommt – kurz
(A ∧ B): 1 geschrieben –, löst sich daher in A: 1 und B: 1 auf. Der Fall, dass (A ∧ B) falsch ist,
entspricht drei Belegungen, die aber durch folgende zwei nicht-ausschließende Fälle abgedeckt
sind: A: 0 oder B: 0. Schematisch stellt man dies dar durch:
(A ∧ B): 1
A: 1
B: 1
(A ∧ B): 0
.
&
A: 0
B: 0
Man kann sich nun leicht überzeugen, dass man jeden Junktor analog auflösen lassen kann in
entweder einen oder zwei Fälle. Dadurch bekommt man einen Baum. Man sagt, dass ein Pfad
in diesem Baum schließt, wenn er die widersprüchlichen Informationen Ai : 1 und Ai : 0 für eine
Aussagenvariable Ai enthält. Die nicht-schließenden Pfade liefern dann genau die Belegungen,
welche die Ausgangsbedingung F : 1 oder F : 0 erfüllen. Beim Entscheidungsproblem der Erfüllbarkeit startet man also mit F : 1 und kann abbrechen, sobald man einen nicht-schließenden
Pfad gefunden hat.
Beispiel:
(¬(¬A0 → (A2 ∨ A1 )) ↔ ((A0 ∧ A1 ) → ¬¬A2 )): 1
.
&
¬(¬A0 → (A2 ∨ A1 )): 0
¬(¬A0 → (A2 ∨ A1 )): 1
((A0 ∧ A1 ) → ¬¬A2 ): 0
((A0 ∧ A1 ) → ¬¬A2 ): 1
..
(¬A0 → (A2 ∨ A1 )): 1
.
(A0 ∧ A1 ): 1
etc.
¬¬A2 : 0
¬A2 : 1
A2 : 0
A0 : 1
A1 : 1
.
&
¬A0 : 0
(A2 ∨ A1 )): 1
A0 : 1
.
&
schließt
A2 : 1
A1 : 1
schließt
erfüllbar
DNF und KNF
W
Einfach sind die Erfüllbarkeitsprobleme für Formeln F in disjunktiver Normalform: F = i Ki
ist genau dann erfüllbar, wenn F = > oder wenn ein Konjunktionsterm Ki = (L1 ∧ · · · ∧ Lm )
15
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
nicht ⊥ ist und zu keinem Literal Lj = Ak auch das Literal ¬Ak enthält. Eine erfüllende
Belegung erhält man z. B. durch β(Ai ) = 0, falls ¬Ai eines der Literale in Ki ist, und β(Ai ) = 1
sonst. Allerdings ist die Umwandlung einer Formel in DNF im allgemeinen zeitaufwendig, da
die DNF exponentiell größere Länge als die Ausgangsformel haben kann. Dies gilt auch für die
Umwandlung einer Formel in KNF, allerdings gibt es hier folgenden Trick durch zusätzliche
Aussagenvariable:
Satz 2.5.1 Zu jeder aussagenlogischen Formel F gibt es ein F + mit den Eigenschaften:
• F ist genau dann erfüllbar, wenn F + erfüllbar ist ( F und F + sind Erfüllbarkeits-äquivalent“);
”
• F + ist in KNF (mit maximal drei Literalen pro Klausel);
• es gibt eine Konstante c ∈ N mit lg(F + ) 6 c · lg(F ).
Beweis: Für jede Teilformel F 0 wähle eine Aussagenvariable AF 0 , und zwar AF 0 = Ai , wenn
F 0 = Ai , und andernfalls eine jeweils neue“ Aussagenvariable, also ein Ai , das in F nicht
”
vorkommt und verschieden ist von allen AF 00 für F 0 6= F 00 .
Angenommen F 0 = ∗F1 . . . Fn für einen n-stelligen Junktor ∗ (mit n ∈ {0, 1, 2}) – hier ausnahmsweise der einheitlichen Behandlung halber in polnischer Notation geschrieben. Setze dann
EF 0 := (AF 0 ↔ ∗AF1 . . . AFn ).
Für F 0 = (G ∧ H) ist zum Beispiel EF 0 = (AF 0 ↔ (AG ∧ AH )), für F 0 = ¬G ist EF 0 =
(AF 0 ↔ ¬AG ) und für F 0 = ⊥ ist EF 0 = (AF 0 ↔ ⊥).
Eine partielle Belegung β der in F vorkommenden Aussagenvariablen setzt sich nun durch
β 0 (AF 0 ) := β(F 0 ) auf eindeutige Weise zu einer Belegung der neuen Aussagenvariablen fort, die
alle Äquivalenzen EF 0 wahr macht. Insbesondere ist β genau dann eine F erfüllende Belegung,
wenn β 0 (AF ) = 1. Also ist F genau dann erfüllbar, wenn es die Menge {AF } ∪ {EF 0 | F 0 ∈
Tf(F )} ist (bzw. deren Konjunktion).
Jede Formel EF 0 lässt sich nun in KNF schreiben, wobei maximal drei Literale pro Klausel
vorkommen können, da jede der Formeln maximal drei Aussagenvariablen enthält. F + ist nun
die Konjunktion von AF und aller in KNF gebrachten Formel EF 0 . Die Anzahl der Teilformeln
von F ist beschränkt durch die Anzahl der Vorkommen von Junktoren, die wiederum durch die
Länge lg(F ) beschränkt ist. Die Länge aller KNF’s von Formeln mit drei Aussagenvariablen
ist ebenfalls beschränkt. Damit ergibt sich insgesamt, dass F + gegenüber F maximal um einen
konstanten Faktor in der Länge zunimmt.
Zur Illustration noch ein Beispiel, wie die Formel EF 0 für F 0 = (G → H) in KNF umgeformt
wird:
EF 0 = (AF 0 ↔ (AG → AH )) ∼ ((AF 0 → (AG → AH )) ∧ ((AG → AH ) → AF 0 ))
∼ ((¬AF 0 ∨ ¬AG ∨ AH ) ∧ (¬(¬AG ∨ AH ) ∨ AF 0 ))
∼ ((¬AF 0 ∨ ¬AG ∨ AH ) ∧ (AF 0 ∨ AG ) ∧ (AF 0 ∨ ¬AH ))
Resolutionsmethode
Für Formeln in KNF gibt es nun die Resolutionsmethode zum Testen von Erfüllbarkeit:
Definition 2.5.2 Eine Klausel ist eine Disjunktion von Literalen.
16
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Aus Gründen notationeller Einfachheit wird nun eine Klausel (L1 ∨ · · · ∨ Lk ) mit der Menge
der Literale {L1 , . . . , Lk } identifiziert. 8 Eine solche Klausel ist erfüllbar und wird durch eine
Belegung β erfüllt, wenn β die Disjunktion der Literale wahrmacht. Da dies der bisherigen
Definition von Erfüllbarkeit von Formelmengen widerspricht, schreibe ich zur Kenntlichmachung
Klauseln als }L1 , . . . , Lk {. Für eine Menge von Klauseln {C1 , . . . , Cn } hingegen soll Erfüllbarkeit
durch β wie früher bedeuten, dass β jede der Klauseln erfüllt. Eine Klauselmenge steht also für
eine Formel in KNF.
Definition 2.5.3 Sind C1 = }L1 , . . . , Lk , Ai { und C2 = }L01 , . . . , L0l , ¬Ai { Klauseln, so ist die
Klausel R = }L1 , . . . , Lk , L01 , . . . , L0l { eine Resolvente von C1 und C2 und man sagt, dass R
durch Resolution aus C1 und C2 entsteht.
Die leere Klausel ∅ (oder }{ nach der gerade eingeführten Notation) enthält kein Literal, entspricht also der Formel ⊥ und ist daher nicht erfüllbar. Eine endliche Klauselmenge enthält nur
endlich viele Aussagenvariablen, aus denen sich nur endlich viele verschiedene Klauseln ergeben
können. Daher kann man eine Klauselmenge in endlich vielen Schritten unter Resolution abschließen, bis man die kleinste Ober-Klauselmenge erhält, aus der sich keine neuen Resolventen
mehr ergeben.
Satz 2.5.4 (Resolutionsmethode) Eine endliche Klauselmenge ist genau dann nicht erfüllbar, wenn sich durch sukzessive Resolution die leere Klausel ergibt.
Aus dem Kompaktheitssatz 2.5.5 folgt, dass der Satz ebenso für unendliche Klauselmengen giilt.
Beweis: ⇐“: Wenn β die Klauseln C1 = }L1 , . . . , Lk , Ai { und C2 = }L01 , . . . , L0l , ¬Ai { erfüllt,
”
dann auch die Resolvente R = }L1 , . . . , Lk , L01 , . . . , L0l {. Denn entweder β(Ai ) = 1 und β muss
eines der Literale L01 ,. . . ,L0l wahr machen, um C2 zu erfüllen, oder β(Ai ) = 0 und β muss eines
der Literale L1 ,. . . ,Lk wahr machen, um C1 zu erfüllen. In jedem Fall ist R ebenfalls erfüllt.
Daraus folgt, dass eine erfüllbare Klauselmenge einen erfüllbaren Abschluss unter Resolution
hat, der somit nicht die leere Klausel enthalten kann.
⇒“: Angenommen C ist eine unter Resolution abgeschlossene Klauselmenge, die nicht die leere
”
Klausel enthält. Ohne Einschränkung seien A0 ,. . . ,An−1 die in C vorkommenden Aussagenvariablen. Per Induktion über n wird gezeigt, dass C erfüllbar ist.
Für n = 0 gibt es nur die leere Klauselmenge C = {}, die nicht die leere Klausel enthält. C wird
durch alle Belegungen erfüllt.
Im Induktionsschritt n → n+ 1 betrachtet man die Aussagenvariable An . Es können nicht beide
Klauseln }An { und }¬An { in C vorkommen (sonst bekäme man die leere Klausel als Resolvente).
Angenommen also }¬An { ∈
/ C (der andere Fall ist analog). Modifiziere C folgendermaßen zu einer
Klauselmenge C 0 in den Aussagenvariablen A0 ,. . . ,An−1 :
• Wenn die Klausel C ∈ C das Literal An enthält, entfällt C.
• Wenn die Klausel C ∈ C das Literal ¬An enthält, wird dieses aus C entfernt und C 0 :=
C \ {¬An } zu einer Klausel in C 0 .
• Alle anderen Klauseln werden unverändert von C nach C 0 übernommen.
Man vergewissert sich unschwer, dass C 0 eine unter Resolution abgeschlossene Klauselmenge ist,
die nicht die leere Klausel enthält, da }¬An { ∈
/ C. Per Induktion ist C 0 durch ein β 0 erfüllbar.
8 Allerdings
kann man daraus die Klausel nur bis auf logische Äquivalenz zurückgewinnen, da doppelte Vorkommen von Literalen, ihre Reihenfolge und Klammerungsreihenfolge verloren gehen.
17
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Belegungen β mit β(An ) = 1, die auf A0 ,. . . ,An−1 mit β 0 übereinstimmen, erfüllen dann C (denn
durch β(An ) = 1 werden alle weggelassenen Klauseln erfüllt; die Erfüllung der modifizierten
Klauseln durch β 0 ändert sich nicht durch Hinzunahme von ¬An ).
Der Beweis zeigt auch, wie man aus dem Resolutionsverfahren eine erfüllende Belegung gewinnen kann. Das Resolutionsverfahren wird in der Praxis benutzt und liefert häufig gute Ergebnisse; der Abschluss unter Resolution kann aber auch zu exponentiell vielen Resolventen
führen.
Es gibt viele Varianten und Verfeinerungen der Resolutionsmethode. Einen Spezialfall stellen Horn-Formeln da: Eine Horn-Formel ist eine Formel in KNF in der jede Klausel eine
Horn-Klausel ist, d. h. maximal ein positives Literal enthält. Für Horn-Formeln gibt es einen
schnellen (polynomiellen) Algorithmus zum Testen von Erfüllbarkeit und zur Konstruktion von
erfüllenden Belegungen, z. B. Varianten der Resolutionsmethode oder den Markierungsalgorithmus.
Satz 2.5.5 (Kompaktheits- oder Endlichkeitssatz) Sei T eine unendliche Formelmenge. 9
T ist genau dann erfüllbar, wenn T endlich erfüllbar ist, d. h. wenn jede endliche Teilmenge von
T erfüllbar ist.
Beweis: Es ist offensichtlich, dass aus Erfüllbarkeit endliche Erfüllbarkeit folgt. Sei also T
endlich erfüllbar. Per Induktion konstruieren wir endlich erfüllbare Formelmengen T0 ⊆ · · · ⊆
Tn ⊆ Tn+1 ⊆ . . . , die sukzessive Literale zu allen Aussagenvariablen enthalten:

T ∪ {A }, falls endlich erfüllbar,
n
n
T0 := T und Tn+1 :=
Tn ∪ {¬An } sonst.
Behauptung: Tn+1 ist auch im zweiten Fall endlich erfüllbar. Sei dazu S eine endliche Teilmenge
von Tn ; zu zeigen ist, dass S ∪ {¬An } erfüllbar ist. Da wir im zweiten Fall sind, ist S0 ∪ {An }
nicht erfüllbar für ein endliches S0 ⊆ Tn , d. h. S0 ` ¬An . Dann gilt auch S ∪ S0 ` ¬An .
Da S ∪ S0 als endliche Teilmenge von Tn nach Induktionsannahme erfüllbar ist, ist durch die
gleichen Belegungen auch S ∪ S0 ∪ {¬An } erfüllt und somit auch S ∪ {¬An }.
S
Es folgt, dass auch T∞ := n∈N Tn endlich erfüllbar ist, da jede endliche Teilmenge von T∞
bereits in einem Tn liegt.

1 falls A ∈ T , und dann L := A ,
i
∞
i
i
Definiere nun β(Ai ) :=
0 falls ¬Ai ∈ T∞ , und dann Li := ¬Ai .
Behauptung: β erfüllt T∞ . Denn sei F ∈ T∞ und m so, dass die in F vorkommenden Aussagenvariablen unter A0 ,. . . ,Am sind. {F , L0 , . . . , Lm } ist als endliche Teilmenge von T∞ erfüllbar.
Erfüllende Belegungen β 0 sind aber auf A0 ,. . . ,Am festgelegt (nämlich β 0 (Ai ) = 1 ⇐⇒ Ai = Li )
und stimmen darauf mit β überein, d. h. β erfüllt F .
9 In der Definition der aussagenlogischen Sprache wurden nur abzählbar unendlich viele Aussagenvariablen
zugelassen; daher können Formelmengen bestenfalls abzählbar unendlich werden. Man kann die Aussagenlogik
problemlos mit einer größeren Anzahl an Aussagenvariablen gestalten. Der Kompaktheitssatz gilt dann auch für
überabzählbare Mengen – im Wesentlichen mit dem gleichen Beweis: Man braucht dazu ein wenig Handwerkszeug
zum tranfiniten Aufzählen überabzählbarer Mengen.
18
MJ, Skript Info-Logik
2.6
Fassung von 13. Februar 2017
Semantik der intuitionistischen Aussagenlogik
Die intuitionistische Aussagenlogik ist eine Logik, die die gleiche Syntax wie die klassische zweiwertige Aussagenlogik benutzt, aber eine andere Semantik. Entwickelt wurde sie von L. E. J.
Brouwer zu Beginn des 19. Jahrhunderts als eine mathematik-philosophische Position im sogenannten Grundlagenstreit der Mathematik; formalisiert wurde sie von seinem Schüler Arend
Heyting.
Grob gesprochen werden in der Semantik die Wahrheitswerte wahr“ und falsch“ durch explizite
”
”
Beweisbarkeit bzw. Widerlegbarkeit ersetzt. Dadurch entfällt das Prinzip des ausgeschlossenen
Dritten, da es Aussagen geben kann, die weder beweisbar noch widerlegbar sind. Der Intuitionismus ist in dem Sinne eine schwächere Logik als die klassische Logik, dass in ihm weniger
Äquivalenzen gelten. Alle intuitionistischen Äquivalenzen sind dagegen auch klassisch gültig.
Für die Informatik ist die intuitionistische Logik insofern von Bedeutung, als sie in einem
gewissen Sinn das Berechenbarkeitsverhalten beschreibt: Beweisbarkeit in inutitionistischer Logik entspricht Berechenbarkeit, Widerlegbarkeit dem Nachweis, dass etwas nicht berechenbar
ist. Präzise gemacht wird dies durch die Curry-Howard-Korrespondenz (auch Curry-HowardIsomorphismus), die eine Übersetzung zwischen Beweisen und Programmen angibt.
Ich beschränkt mich in der kurzen Darstellung der intuitionistischen Logik hier auf das Junktorensystem {⊥, →, ∧, ∨}, da auch intuitionistisch die folgenden Äquivalenzen gelten, die daher
als Definitionen für die fehlenden Junkotren ↔, ¬ und > genommen werden können:
(A0 ↔ A1 ) ∼ ((A0 → A1 ) ∧ (A1 → A0 ))
¬A0 ∼ (A0 → ⊥)
> ∼ ¬⊥ ∼ (⊥ → ⊥)
Von diesen vier Junktoren kann allerdings kein weiterer mehr weggelassen werden. Die Regeln
zur Formelbildung sind ansonsten die gleichen wie in der klassischen Aussagenlogik.
Definition 2.6.1 Ein Modell für die intuitionistische Logik (in diesem Abschnitt auch kurz:
Modell) ist eine partiell geordnete Menge (W, 6). 10
Die Elemente von W nennt man Zustände“ oder (aus der Modallogik kommend) mögliche
”
”
Welten“, die Relation 6 heißt meistens Zugangsrelation“. Für w1 6 w2 sagt man: w2 kommt
”
”
nach w1“ oder w2 ist später als w1“bzw. w1 sieht w2“.
”
”
Definition 2.6.2 Eine Belegung in einem Modell für die intuitionistische Logik ist eine Abbildung β : W × {Ai | i ∈ N} → {0, 1}, die monoton bezüglich 6 ist, d. h. für w1 6 w2 muss
β(w1 , Ai ) 6 β(w2 , Ai ) gelten.
Konkret heißt dies, dass ein Wert 1 in allen späteren Zuständen erhalten bleibt, während sich
ein Wert 0 in einem späteren Zustand zu 1 ändern kann. Vorstellen kann man sich ein w ∈ W
mit β(w, Ai ) = 1 als einen Zeitpunkt, zu dem man einen Beweis (bzw. eine Berechnung) für
Ai hat – der in späteren Zuständen nicht verloren geht – während β(w, Ai ) = 0 bedeutet, dass
man (noch) keinen Beweis (bzw. keine Berechung) für Ai hat. Im Gegensatz zur klassischen
Logik bedeutet die Zuweisung des Werts 0 zu Ai hier also nicht, dass Ai nicht gilt oder falsch
ist, sondern nur, dass nicht bekannt ist, ob Ai gilt.
10 d. h-.
6 ist eine reflexive, antisymmetrische und transitive binäre Relation
19
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Wie in der klassischen Logik wird die Belegung nun zu einer Funktion fortgesetzt, die in jedem
Zustand w ∈ W allen aussagenlogischen Formeln F einen Wert β(w, F ) ∈ {0, 1} zuordnet.
β(w, ⊥)
β(w, (F ∧ G))
:= 0
:= max{β(w, F ), β(w, G}
β(w, (F ∨ G))
:= min{β(w, F ), β(w, G}
1 β(w0 , F ) 6 β(w0 , G) für alle w0 ∈ W mit w 6 w0
β(w, (F → G)) :=
0 sonst
Lemma 2.6.3 Die Fortsetzungen von Belegungen sind für alle Formeln monoton, d. h. für alle
Formeln F folgt aus w1 6 w2 auch β(w1 , F ) 6 β(w2 , F ).
Beweis: Per Induktion über den Aufbau der Formeln:
Monotonie gilt per Definition der Belegung für Aussagenvariablen und offensichtlich für ⊥. Man
weiß oder überlegt sich leicht, dass Maximum und Minimum monotoner Funktionen wieder
monoton sind, also bleibt die Eigenschaft bei Konjunktionen und Disjunktionen erhalten.
Schließlich ist die Belegung für die Implikation so definiert, dass sie monoton wird: Wenn w 6 w00
und β(w, (F → G)) = 1, dann ist per Definition β(w0 , F ) 6 β(w0 , G) für alle w0 mit w 6 w0 ,
insbesondere also auch für alle w0 mit w00 6 w0 , da 6 transitiv ist.
Definition 2.6.4 (a) Eine aussagenlogische Formel F heißt intuitionistische Tautologie, falls
β(w, F ) = 1 für alle Modelle (W, 6), alle Belegungen β und alle w ∈ W .
(b) Zwei aussagenlogische Formeln F1 , F2 heißen intuitionistisch äquivalent zueinander, falls
β(w, F1 ) = β(w, F2 ) für alle Modelle (W, 6), alle Belegungen β und alle w ∈ W .
(c) Eine aussagenlogische Formel F folgt intuitionistisch aus einer Menge {Fi | i ∈ I} von
Formeln, falls für jedes Modell (W, 6), jede Belegung β und jedes w ∈ W , in dem für alle i ∈ I
die Bedingung β(w, Fi ) = 1 erfüllt ist, auch β(w, F ) = 1 gilt.
Man schreibt als Zeichen `int bzw. ∼int und man hat entsprechenden Äquivalenzen wie in der
klasischen Logik, also beispielsweise
`int F ⇐⇒ F ∼int >
F1 ∼int F2 ⇐⇒ `int (F1 ↔ F2 )
F1 `int F2 ⇐⇒ `int (F1 → F2 )
Endliche (oder diskrete) Modelle (W, 6) zeichnet man gerne als gerichtete Graphen, wobei die
Kanten in Richtung der Zugangsrelation weisen, also zu den späteren Zuständen hin, und nur
Kanten zu den unmittelbaren echten Nachfolgern hin gezeichnet werden.
Das einfachste nicht-triviale Modell zeigt bereits zwei wesentliche Unterschiede zwischen der
intuitionistischen und der klassischen Aussagenlogik:
w0 s β(w0 , A0 ) = 1
6
also β(w0 , ¬A0 ) = 0 und β(w0 , ¬¬A0 ) = 1
w s β(w, A0 ) = 0
also β(w, ¬A0 ) = 0 und β(w, ¬¬A0 ) = 1
20
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Man sieht, dass wegen β(w, (A0 ∨ ¬A0 )) = 0 das Prinzip des ausgeschlossenen Dritten verletzt
ist, und ebenfalls in w, dass A0 und ¬¬A0 nicht äquivalent sind, also die Doppelnegationsregel
nicht gilt. (Es gilt nur A0 `int ¬¬A0 .) Man kann sich aber überlegen, dass die Tripelnegationsregel gilt, also ¬A0 ∼int ¬¬¬A0 . 11 Auch die de Morgan’schen Regeln gelten nur teilweise.
Mengendarstellung: Eine Teilmenge von (W, 6) heiße 6-abgeschlossen, wenn sie mit jedem
Element auch alle größeren enthält. Lemma 2.6.3 zeigt, dass zu jeder Formel F in einem Modell
(W, 6) mit Belegung β eine 6-abgeschlossene Menge [[F ]] := {w ∈ W | β(w, F ) = 1} gehört.
Es gilt dann [[⊥]] := ∅, [[(F1 ∧ F2 )]] = [[F1 ]] ∩ [[F2 ]] und [[(F1 ∨ F2 )]] = [[F1 ]] ∪ [[F2 ]]. Schließlich
ist [[(F1 → F2 )]] die maximale 6-abgeschlossene Teilmenge von W \ [[F1 ]] ∪ [[F2 ]]. Im Fall der
Negation ¬F ergibt sich also die größte 6-abgeschlossene Teilmenge im Komplement von [[F ]],
hier andeutungsweise illustriert (spätere Zustände stehen weiter oben):
B JJ
[[F ]]
B J
J
J
B
J β(w, F ) = 1 J
B
J
[[¬F ]]
(W, 6)
J
B
J
J
β(w,
¬F
)
=
1
B
J
J
B
J
J
B
J J
B
J
B
β(w, F ) = 0
B
B
B
Mit dieser Überlegung kann man sich z. B. die Gültigkeit der Tripelnegationsregel plausibel
machen: [[¬F ]] und [[¬¬F ]] sind bereits maximal komplementäre Teilmengen unter den 6abgeschlossenen Mengen, also kann [[¬¬¬F ]] nicht noch größer als [[¬F ]] werden.
Man kann nun Modelle (W, 6) mit Belegung β konstruieren, für die die Abbildung F → [[F ]]
injektiv ist, d. h. man bekommt eine Darstellung von Formeln durch Mengen analog zum Satz
von Stone. Die Tarski-Lindenbaum-Algebra für die intuitionistische Aussagenlogik ist allerdings
keine Boole’sche Algebra mehr, sondern eine sogenannte Heyting-Algebra: ein distributiver beschränkter Verband mit Pseudokomplementen anstelle von Komplementen. 12
Im Gegensatz zur klassischen Logik gibt es bereits mit einer Aussagenvariablen unendlich viele
Formeln, die intuitionistisch paarweise nicht äquivalent zueinander sind. Das Heyting-Pendant
zur Boole’schen Algebra F1 ist also unendlich groß und sieht folgendermaßen aus:
11 Beweisidee:
Aus A0 `int ¬¬A0 bekommt man zum einen durch Substitution ¬A0 `int ¬¬¬A0 , zum andern
durch Kontraposition ¬¬¬A0 `int ¬A0 . Kontraposition funktioniert intuitionistisch aber nur in eine Richtung:
(A → B) `int (¬B → ¬A).
12 c ist Pseudokompement von a, wenn c das eindeutige größte Element mit a u c = 0 ist. Ein Komplement
erfüllt zusätzlich noich a t c = 1.
21
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
>
s
..
.
s
@
@
@
@s
@
@
@s
@s (¬¬A0 → A0 ) → (A0 ∨ ¬A0 )
¬¬A0 ∨ (¬¬A0 → A0 ) @
@
@ s ¬A ∨ ¬¬A
¬¬A0 → A0 s
0
@ 0
@
@
@
@s ¬¬A0
A0 ∨ ¬A0@ s
@
@
s
@s
¬A0 @
A0
@
@s
⊥
Entscheidbarkeit: Man kann zeigen, dass auch für die intuitionistische Aussagenlogik die
Fragen nach Erfüllbarkeit, Äquivalenz oder logischer Folgerung entscheidbar sind, allerdings
kann man nicht mehr einfach Wahrheitstafeln ausrechnen. Essentiell sind folgende Eigenschaften
(die hier nicht bewiesen werden können), am Beispiel des Äquivalenzproblems:
Satz 2.6.5 (a) Es gibt ein vollständiges endliches System von Regeln, aus denen sich (mit
Substitution) alle intuitionistischen Äquivalenzen ableiten lassen.
(b) Wenn zwei Formeln intuitionistisch nicht äquivalent sind, dann gibt es bereits ein endliches
Modell, welches dies aufzeigt.
Das Entscheidungsverfahren für intuitionistische Äquivalenzen funktioniert nun so: Für zwei
gegebene Formeln F und G lässt man zwei Maschinen gleichzeitig laufen. Die erste erzeugt aus
dem endlichen Regelsystem systematisch alle gültigen Äquivalenzen. Wenn F und G äquivalent zueinander sind, wird diese Maschine irgendwann eine Ableitung der Äquivalenz aus den
Regeln aufzeigen. Die zweite Maschine erzeugt systematisch alle endlichen Modelle (z. B. der
Größe nach) und testet für alle Belegungen, ob F und G in allen Zuständen den gleichen Wert
bekommen. Wenn F und G nicht äquivalent zueinander sind, wird diese Maschine irgendwann
ein Gegenbeispiel konstruiert haben.
Im Gegensatz zur klassischen Aussagenlogik folgt die Entscheidbarkeit nicht allein aus Teil (a)
des Satzes, da keine kanonische Normalform für intuitionistische Formeln bekannt ist.
22
MJ, Skript Info-Logik
3
Fassung von 13. Februar 2017
Prädikatenlogik (erster Stufe)
Die Prädikatenlogik ist eine Erweiterung der Aussagenlogik, in der es zum einen möglich ist,
Aussagenvariablen durch genaue Aussagen über eine gegebene Struktur zu ersetzen, und zum
andern durch Quantifikationen eine zusätzliche Ausdrucksstärke zu erhalten. Quantifikationen
werden durch sogenannte Quantoren ausgedrückt und sagen etwas über die Anzahl der Elemente
der Struktur aus, auf die eine Formel zutrifft. Manche Autoren nennen die Prädikatenlogik
daher auch Quantorenlogik“. Bei der hier beschriebenen Logik handelt es sich genauer um die
”
Prädikatenlogik erster Stufe, die nur Quantifikationen über Elemente von Strukturen zulassen.
Die Prädikatenlogik zweiter Stufe lässt dann auch Quantifikationen über Teilmengen zu, etc.
3.1
Syntax
Im Gegensatz zur Aussagenlogik gibt es in der Prädikatenlogik je nach ins Auge gefasster
Struktur verschiedene Sprachen, die einen allen gemeinsamen festen Anteil und einen für eine
Sprache L spezifischen Anteil haben.
Zeichen
– fester Anteil:
Individuenvariablen
Quantoren
Junktoren
Klammern
v0
v1
v2
..
.
∀
∃
>
⊥
¬
∧
∨
→
↔
(
)
Gleichheitszeichen
.
=
– L-spezifischer Anteil:
Funktionszeichen
Relationszeichen
fi
Rj
für i ∈ I
für j ∈ J
Jedes Funktions- und Relationszeichen hat in L eine gegebene
feste Stelligkeit ∈ N.
Bemerkungen: ∀ heißt Allquantor oder universeller Quantor, ∃ heißt Existenzquantor.
Die Indexmengen I und J der Funktions- bzw. Relationszeichen können endlich oder unendlich
sein. Zu verstehen ist die Angabe so, dass z. B. L die Funktionszeichen f0 , f13 und f35 enthält,
wenn I = {0, 13, 35}. Die Stelligkeit ordnet jedem Funktions- und Relationszeichen eine natürliche Zahl zu, die aus dem Zeichen heraus nicht erkennbar ist (aber zum Teil aus der Verwendung
des Zeichens) und bei der Definition einer Sprache L festgelegt werden muss.
Nullstellige Funktionszeichen können mit Konstanten identifiziert werden und werden dann
gerne c0 , c1 , . . . geschrieben. Nullstellige Relationszeichen können mit Aussagenvariablen identifiziert werden und können dann auch, wie in der Aussagenlogik, A0 , A1 , . . . geschrieben werden. 13 Einstellige Relationszeichen heißen auch Prädikate 14 und haben der Prädikatenlogik
ihren Namen gegeben. In Anwendungen wird man häufig andere Namen für die Funktions- und
13 Die meisten Autoren lassen keine 0-stelligen Relationszeichen zu, was den Nachteil hat, dass die Prädikatenlogik keine Erweiterung der Aussagenlogik ist.
14 in der Verwendungsweise als (besondere) Eigenschaft“ wie in Prädikatswein, Prädikatsexamen,. . .
”
23
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Rekationszeichen wählen, etwa f, g, h oder auch +, ◦, −1 für Funktionszeichen; c, d, e oder auch
0, 1 für Konstanten; R, S, T, A, B oder auch 6, ⊆ für Relationszeichen.
Das Gleichheitszeichen wird mit einem Punkt notiert (Ziegler’sche Konvention), um es von dem
metasprachlichen Gleichheitszeichen zu unterscheiden.
Nun werden zunächst Terme, dann atomare Formeln und schließlich beliebige Formel in der
prädikatenlogischen Sprache L definiert. Terme sind Ausdrücke, die für Elemente einer Struktur
stehen werden. Formeln wird man als Aussagen über Strukturen interpretieren können. Jede
dieser Definition funktioniert wie bei den aussagenlogischen Formeln über Induktion. Analog
zur Aussagenlogik könnte man auch hier eine Schachtelungstiefe definieren. Sowohl Terme als
auch Formeln sind Zeichenketten und haben damit automatisch eine definierte Länge. Terme
bekommen eine violette Farbe; Formeln behalten die rote Formelfarbe der Aussagenlogik.
Definition 3.1.1 L-Terme sind alle Zeichenketten, die man nach folgenden Regeln erhält:
• Jede Individuenvariable ist ein L-Term vi (der Länge 1).
• Wenn τ1 ,. . . ,τn L-Terme sind und fi ein n-stelliges Funktionszeichen in L ist, dann ist
fi τ1 . . . τn ein L-Term (der Länge 1 + lg(τ1 ) + · · · + lg(τn )). 15
Insbesondere ist (mit n = 0) jede Konstante ci der Sprache L ein L-Term.
Für Terme wird also die (klammerfreie) polnische Notation verwendet. In Anwendungen wird
für gebräuchliche Funktionszeichen wie +, ◦, −1 meist die traditionelle Schreibeweise benutzt,
also (v0 + v1 ) statt +v0 v1 oder (v0−1 ) statt −1 v0 ; man braucht dann aber u. U. Klammern, um
die eindeutige Lesbarkeit sicherzustellen.
Lemma 3.1.2 (eindeutige Lesbarkeit von Termen) L-Terme sind eindeutig lesbar, d. h.
0
L-Terme sind, dann gilt fi = fj , n = m und τi = τi0 .
wenn fi τ1 . . . τn = fj τ10 . . . τm
Beweis: Übung. Vergleiche die eindeutige Lesbarkeit aussagenlogischer Formeln.
Definition 3.1.3 L-Formeln sind alle Zeichenketten, die atomare L-Formeln sind oder nach
den folgenden Regeln konstruiert werden können.
Atomare L-Formeln sind:
• > und ⊥;
• Rj τ1 . . . τn , wenn Rj ein n-stelliges Relationszeichen in L ist und τ1 ,. . . ,τn L-Terme sind;
.
• τ1 = τ2 , wenn τ1 und τ2 L-Terme sind.
Wenn ϕ1 und ϕ2 L-Formeln sind, dann sind auch die folgenden Zeichenketten L-Formeln (für
jede Individuenvariable vi ):
• (Junktorenregeln) ¬ ϕ1 , (ϕ1 ∧ ϕ2 ), (ϕ1 ∨ ϕ2 ), (ϕ1 → ϕ2 ) und (ϕ1 ↔ ϕ2 )
• (Quantorenregeln) ∀vi ϕ1 und ∃vi ϕ1
Auch hier wird für gebräuchliche (in der Regel binäre) Relationszeichen wie 6 meist die traditionelle Schreibeweise benutzt, also v0 6 v1 statt 6 v0 v1 , wie sie in den obigen Regeln insbesondere
auch für das Gleichheitszeichen vorgesehen ist.
15 f
i τ1 . . . τn ist wieder zu verstehen als die Zeichenkette, die aus dem Zeichen fi und den aneinandergereihten
Zeichenketten für τ1 bis τn besteht.
24
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Lemma 3.1.4 L-Formeln sind eindeutig lesbar.
Beweis: Dies folgt im wesentlichen aus früheren Beobachtungen: Aus der eindeutigen Lesbarkeit der Terme folgt auch, dass eine atomare Formel Rj τ1 . . . τn eindeutig lesbar“ ist. Wenn
”
.
atomare Formeln Rj τ1 . . . τn oder τ1 = τ2 als Teilformeln einer Formel ϕ auftreten, sind sie
durch den Formelanfang oder das Formelende von ϕ, Klammern, Junktoren oder Quantoren
(mit zugehöriger Individuenvariable) eindeutig abgegrenzt (und können nicht unmittelbar aneinanderstoßen). Man kann sie also durch Aussagenvariablen ersetzen und erhält fast eine aussagenlogische Formel. Die eindeutige Lesbarkeit folgt aber bereits aus dem Beweis der eindeutigen
Lesbarkeit aussagenlogischer Formeln, da man die noch zusätzlich verbliebenen Quantoren (mit
zugehöriger Individuenvariable) hierfür wie zusätzliche einstellige Junktoren auffassen kann und
der Beweis mit zusätzlichen null-, ein- oder zweistelligen Junktoren ebenso funktioniert.
Analog zur Aussagenlogik kann man Teilformeln von L-Formeln definieren und zeigen, dass
eine L-Formel ϕ0 , die als Zeichenkette in einer L-Formel ϕ vorkommt, bereits eine Teilformel
ist.
Definition 3.1.5 Der Wirkungsbereich (des Vorkommens) eines Quantors ∃vi bzw. ∀vi in
einer L-Formel ϕ ist diejenige Teilformel ϕ0 , vor der der Quantor unmittelbar steht. 16
Anders ausgedrückt: Beim Aufbauprozess der Formel wurde der Quantor durch Anwenden der
Quantorregel auf ϕ0 eingeführt.
Konvention: In der Kombination mit einem Quantor, also in der Symbolfolge ∃vi bzw. ∀vi , soll
der Anteil vi nicht als Vorkommen der Individuenvariablen vi zählen. Verstehen muss man ihn
eher als eine Art Zeiger, der angibt, auf welche Individuenvariablen in seinem Wirkungsbereich
sich ein Quantor bezieht.
Definition 3.1.6 Ein Vorkommen einer Individuenvariablen vi in einer L-Formel ϕ heißt frei,
wenn es sich nicht im Wirkungsbereich eines Quantors ∃vi bzw. ∀vi befindet.
Ein Vorkommen einer Individuenvariablen vi heißt gebunden durch einen Quantor ∃vi bzw.
∀vi , wenn es sich im Wirkungsbereich ϕ0 dieses Quantors 17 befindet und in ϕ0 frei ist.
Die freien Variablen einer Formel ϕ sind diejenigen Individuenvariablen, die ein freies Vorkommen in ϕ haben.
Beispiel: Sei R0 einstelliges und R1 zweistelliges Relationszeichen.
frei
↓
(R0 v0 → ∃v2
bindet
( ∀v2
∀v1 ∃v1
frei
↓
(R0 v1 ∨ R1 v2 v1 ) → ¬R1 v1 v 2 ))
↑c
|
c
16 Wenn
in einer Formel ein Quantor wie ∃vi mehrfach vorkommt, haben diese Vorkommen jeweils verschiedene
Wirkungsbereiche. Man spricht aber üblicherweise vom Wirkungsbereich eines Quantors“ und meint damit ein
”
konkretes Vorkommen des Quantors in der betreffenden Formel.
17 Man beachte die Konvention aus der vorherigen Fußnote!
25
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Notation: Die Schreibweise τ (vi1 , . . . , vin ) für einen L-Term τ bzw. ϕ(vi1 , . . . , vin ) für eine
L-Formel ϕ soll bedeuten, dass die Individuenvariablen vi1 , . . . , vin paarweise verschieden sind
und dass alle in τ vorkommenden bzw. alle in ϕ frei vorkommende Individuenvariablen enthalten
sind in der Menge {vi1 , . . . , vin }.
Definition 3.1.7 Eine L-Formel ϕ heißt L-Aussage oder L-Satz, wenn in ϕ keine freien Variablen vorkommen.
3.2
L-Strukturen
Sei L eine prädikatenlogische Sprache.
Definition 3.2.1 Eine L-Struktur M besteht aus
• einer nicht-leeren Menge M , dem Universum oder Individuenbereich der Struktur,
sowie für jedes n ∈ N aus:
• einer Funktion fiM : M → M für jeden n-stellige Funktionszeichen fi ∈ L
• und einer Teilmenge RjM ⊆ M n für jeden n-stellige Relationszeichen Rj ∈ L.
Man sagt, dass ein n-stelliges Funktionszeichen fi durch die n-stellige Funktion fiM interpretiert
wird bzw. dass die Funktion fi M Interpretation des Funktionszeichens fi ist. Analog wird ein
n-stelliges Relationszeichen Rj durch eine n-stellige Relation RjM interpretiert, also eine Eigen”
schaft“ von n-Tupeln. Solch eine Relation R wird hier mit ihrem Graphen identifiziert, d. h. mit
der Menge der n-Tupel, auf die die Relation zutrifft. Man schreibt daher sowohl R m1 . . . mn
(für R trifft auf m1 . . . mn zu“) als auch (m1 , . . . , mn ) ∈ R.
”
Im Fall n = 0 ist M 0 = {∅}. Eine 0-stellige Funktion f : M 0 → M kann daher identifiziert
werden mit ihrem Bild f (∅) ∈ M , also mit einer Konstanten. Ein 0-stellige Relation R trifft
entweder auf das einzige 0-Tupel ∅ zu oder trifft nicht zu, je nachdem ob der Graph von R die einelementige Menge {∅} ist oder die leere Menge ∅. Eine 0-stellige Relation kann daher mit einer
Aussagenvariablen gleichgesetzt werden: trifft sie auf ∅ zu, entspricht dies dem Wahrheitswert
1, trifft sie auf ∅ nicht zu, entspricht es dem Wahrheitswert 0.
Beispiel: Sei L1 = {f0 , f1 } mit einem zweistelligen Funktionszeichen f0 und einem nullstelligen Funktionszeichen (d. h. einer Konstanten) f1 . Dann ist M1 := (Z; +, 0) eine L1 -Struktur
mit Universum Z und den Interpretationen f0M1 = + und f1M1 = 0. Analog kann man jede
Gruppe und jedes Monoid auf natürliche Weise als L1 -Struktur auffassen.
In der Definition von Strukturen ist aber keinerlei Gültigkeit von irgendwelchen Gesetzen geforπ
) ist eine L1 -Struktur, wobei f0M2 = g die Funktion sein soll, die
dert Auch M2 := (R \ Q; g, − 17
√
π
(a, b) auf |a|b abbildet, wenn dies eine irrationale Zahl ist, und auf 2 sonst; und f1M2 = − 17
.
Umgekehrt kann man die additive Gruppe der ganzen Zahlen als L-Struktur für verschiedene Sprachen L auffassen, z. B. nur als L0 -Struktur mit L0 = {f0 } oder als L2 -Struktur mit
L2 = {f0 , f1 , f2 } und einem zusätzlichen einstelligen Funktionszeichen f1 , das durch die Inversenabbildung −1 interpretiert wird.
Unterstrukturen und Homomorphismen: Wenn M eine L-Struktur ist und U ⊆ M eine
nicht-leere Teilmenge, die unter allen Funktionen fiM für fi ∈ L abgeschlossen ist, dann definiert
26
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
man die L-Unterstruktur U mit Universum U durch:
• fiU := fiM U n für jedes n-stellige Funktionszeichen fi ∈ L
• und RjU := RjM ∩ U n für jedes n-stellige Relationszeichen Rj ∈ L.
Wenn M und N L-Strukturen sind, heißt eine Abbildung α : M → N ein L-Homomorphismus,
wenn
• α(fiM (m1 , . . . , mn )) = fiN (α(m1 ), . . . , α(mn )) und
• (m1 , . . . , mn ) ∈ RjM =⇒ (α(m1 ), . . . , α(mn )) ∈ RjN
für alle n ∈ N, alle n-stelligen Funktionszeichen fi ∈ L und n-stelligen Relationszeichen
Rj ∈ L und alle m1 , . . . , mn ∈ M . Wenn zusätzlich in der zweiten Bedingung die Äquivalenz
(m1 , . . . , mn ) ∈ RjM ⇐⇒ (α(m1 ), . . . , α(mn )) ∈ RjN gilt, heißt α starker L-Homomorphismus.
Ein L-Isomorphismus ist ein bijektiver L-Homomorphismus α, dessen Umkehrabbildung α−1
ebenfalls ein L-Homomorphismus ist. Äquivalent ist α starker bijektiver L-Homomorphismus.
Beispiel: Wenn man im Beispiel oben die L0 -Struktur (Z; +) betrachtet, sind N und N \ {0}
Universen von L0 -Unterstrukturen, da unter + abgeschlossen. Im Falle der L1 -Struktur (Z; +, 0)
ist N Universum einer L1 -Unterstruktur, nicht aber N \ {0}. Schließlich ist N nicht mehr Universum einer L2 -Unterstruktur von (Z; +, 0, −1 ).
In Mathematik II wurde gezeigt, dass in allen drei Sprachen die Li -Homomorphismen zwischen
Gruppen (in der jeweils natürlichen Interpretation als Li -Struktur) gerade die Gruppenhomomorphismen sind, während bei Monoiden die L2 -Homomorphismen die Monoidhomomorphismen sind, es aber L0 -Homomorphismen geben kann, die keine Monoidhomomorphismen sind.
3.3
Semantik
Definition 3.3.1 Eine Belegung 18 (der Individuenvariablen mit Werten in einer L-Struktur
M) ist eine Abbildung β : {vi | i ∈ N} → M .
Definition 3.3.2 Sei L eine prädikatenlogische Sprache, M eine L-Struktur und β eine Belegung. Dann definiert jeder L-Term τ ein Element τ M [β] ∈ M , die Interpretation des Terms
”
τ in M unter β“:
• vi M [β] := β(vi )
• und induktiv (fi τ1 . . . τn )M [β] := fiM (τ1 M [β], . . . , τn M [β])
wobei n die Stelligkeit des Funktionszeichen fi ist.
Lemma 3.3.3 Wenn β, β 0 zwei Belegungen sind, die auf den in einem Term τ vorkommenden
Individuenvariablen übereinstimmen, dann ist τ M [β] = τ M [β 0 ].
Beweis: Klar (oder formaler Beweis über den Aufbau der Terme).
Definition 3.3.4 Sei L eine prädikatenlogische Sprache, M eine L-Struktur und β eine Belegung in M. Dann bedeutet M ϕ [β], dass die L-Formel ϕ in M gilt, wenn die freien Variablen
wie von β angegeben interpretiert werden. Dies wird wie folgt per Induktion über den Aufbau
der Formeln definiert: 19
18 Aus dem Kontext sollte immer klar sein, ob es sich um eine Belegung von Aussagenvariablen mit Wahrheitswerten oder um eine Belegung der Individuenvariablen mit Elementen einer Struktur handelt.
19 Und damit wird automatisch die verneinte Relation M 6 ϕ [β]“ mitdefiniert.
”
27
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
• M Rj τ1 . . . τn [β] : ⇐⇒
.
• M τ1 = τ2 [β] : ⇐⇒
•
(τ1 M , . . . , τn M ) ∈ RjM für n-stelliges Relationszeichen Rj
τ1 M [β] = τ2 M [β]
für Junktoren wird die Gültigkeit der Relation über deren Wahrheitswertfunktionalität
definiert, d. h.
◦ stets gilt M > [β] und M 6 ⊥ [β]
◦ M ¬ϕ [β]
: ⇐⇒ M 6 ϕ [β]
◦ M (ϕ1 ∧ ϕ2 ) [β] : ⇐⇒ ( M ϕ1 [β] und M ϕ2 [β] )
◦ etc.
• M ∃vi ϕ [β]
: ⇐⇒
es gibt ein m ∈ M mit M ϕ [β vmi ]
• M ∀vi ϕ [β]
: ⇐⇒
für alle m ∈ M gilt M ϕ [β vmi ]
wobei β vmi die Belegung β 0 ist mit β 0 (vj ) :=
n m
β(vj )
falls i = j
falls i =
6 j
Satz 3.3.5 Wenn β, β 0 zwei Belegungen sind, die auf den in einer L-Formel ϕ vorkommenden
freien Individuenvariablen übereinstimmen, dann gilt M ϕ [β] ⇐⇒ M ϕ [β 0 ].
Insbesondere: Wenn ϕ eine L-Aussage ist, ist die Gültigkeit von M ϕ [β] unabhängig von der
Wahl von β. Man schreibt dann M ϕ.
Sprechweise: Wenn M ϕ, sagt man: ϕ trifft in M zu“, ϕ gilt in M“, ϕ ist wahr in M“ oder
”
”
”
M erfüllt ϕ“, M ist Modell von ϕ“. Im Fall von M ϕ [β] fügt man jeweils ein unter β“ an.
”
”
”
Beweis: Beweis per Induktion über den Aufbau der Formeln, und zwar gleichzeitig für alle
möglichen Belegungen (und nicht für festes β, β 0 ):
Für > und ⊥ ist die Aussage trivial; für andere atomare L-Formeln gilt es nach Lemma 3.3.3.
Die Junkorenschritte sind wiederum klar nach Definition 3.3.4, da die freien Variablen 20 von ϕ
= ¬ψ die gleichen wie die von ψ sind, und die freien Variablen von ψ1 und ψ2 jeweils enthalten
sind in den freien Variablen von ϕ = (ψ1 ∗ ψ2 ) für einen beliebigen zweistelligen Junktor ∗.
Sei nun ϕ = ∃vi ψ und β stimme mit β 0 auf den freien Variablen von ϕ überein. Falls M ϕ [β],
0
dann gibt es ein m0 ∈ M mit M ψ [β m
vi ]. Die freien Variablen von ψ sind die freien Variablen
0 m0
0
von ϕ zusammen mit vi : also stimmen β m
vi und β vi auf ihnen überein. Nach Induktion gilt
0
0
daher M ψ [β 0 m
vi ] und somit M ϕ [β ]. Analog für den Allquantor.
Substitutionen Es folgen nun einige Substututionsregeln, die alle eine Verträglichkeit der
Syntax mit der Semantik ausdrücken und die man als Ausdehnung des Kompositionalitätsprinzips verstehen kann. Sie haben die Form: Wenn eine Formel aus einer anderen dadurch entsteht,
dass man Variablen durch Teilformeln ersetzt, ändert sich die Auswertung der Formel in der
gleichen Weise durch Einsetzen der Auswertung der Teilformel.
Da die Prädikatenlogik eine Erweiterung der Aussagenlogik ist, also die Bildungsregeln aussagenlogischer Formeln in der Prädikatenlogik weiter Gültigkeit haben, kann man in einer aussagenlogischen Formel F Aussagenvariablen Ai durch L-Formeln ϕi ersetzen und erhält eine
ϕ1
ϕn
L-Formel F A
.
... A
1
n
Lemma 3.3.6 Wenn F eine aussagenlogische Formel mit Aussagenvariablen A1 ,. . . ,An ist,
20
Variable“ steht nun kurz für Individuenvariable“.
”
”
28
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
ϕ1 ,. . . ,ϕn L-Formeln sind und M eine L-Struktur mit Belegung β ist, dann gilt
MF
ϕ1
ϕn ...
[β] ⇐⇒ βϕ (F ) = 1
A1
An
wobei βϕ eine Belegung der Aussagenvariablen mit βϕ (Ai ) = 1 ⇐⇒ M ϕi [β] ist.
Beweis: Klar nach Definition 3.3.4.
Insbesondere folgt daraus, dass man sich in der Prädikatenlogik auf ein vollständiges Junktorensystem zurückziehen kann und dass in vielen Definitionen und Beweisen über den Aufbau von
Formeln die Junktorenschritte auf z. B. Negation und Konjunktion beschränkt werden können
(wie in Definition 3.3.4 bereits angedeutet).
Notation: Wenn τ (v1 , . . . , vn ) ein L-Term ist, M eine L-Struktur und m1 , . . . , mn ∈ M ,
dann ist τ M [m1 , . . . , mn ] := τ M [β] für Belegungen β mit β(vi ) = mi (wohldefiniert nach Lemma 3.3.3).
τ definiert also eine n-stellige Abbildung τ M : M n → M mit (m1 , . . . , mn ) 7→ τ M [m1 , . . . , mn ].
Wenn τ , σ L-Terme sind, sei τ vσi die Zeichenfolge, die entsteht, wenn man jedes Vorkommen
von vi in τ durch σ ersetzt. Dies ist offenbar wieder ein L-Term und es gilt:
Lemma 3.3.7 (Substitutionslemma für Terme) Sei σ ein L-Term und β eine Belegung
in einer L-Struktur M. Dann gilt für alle L-Terme τ :
τ
σ M [β] σ M
[β] = τ M β
vi
vi
Beweis: Klar durch Nachdenken darüber, was die Formel des Lemmas aussagt.
Für n = 1 bedeutet das Lemma so viel wie τ (σ)M = τ M ◦ σ M . Allgemeiner mit τ (v1 , . . . , vn ),
σ(v1 , . . . , vn ) und o. E. i = 1, kann man das Lemma schreiben als
τ σ(v1 , . . . , vn ), v2 , . . . , vn
M
[m1 , . . . , mn ] = τ (v1 , . . . , vn )M σ M [m1 , . . . , mn ], m2 , . . . , mn .
Notation: Wenn ϕ(v1 , . . . , vn ) eine L-Formel ist, M eine L-Struktur und m1 , . . . , mn ∈ M ,
setzt man M ϕ[m1 , . . . , mn ] : ⇐⇒ M ϕ[β] für Belegungen β mit β(vi ) = mi (wohldefiniert
nach Satz 3.3.5).
ϕ definiert also eine n-stellige Relation ϕM über M mit ϕM = (m1 , . . . , mn ) ∈ M n | M ϕ[m1 , . . . , mn ] .
Wenn ϕ eine L-Fomel ist und σ ein L-Terme sind, sei ϕ vσi die Zeichenfolge, die entsteht, wenn
man jedes freie Vorkommen von vi in ϕ durch σ ersetzt. Dies ist offenbar wieder eine L-Formel.
Um das analoge Substitutionslemma für Formeln zu zeigen, brauchen wir eine Vorbereitung.
Definition 3.3.8 Die Individuenvariable vi heißt frei für σ in ϕ, wenn bei der Ersetzung ϕ vσi
keine Variable von σ durch einen Quantor von ϕ gebunden wird.
Formal über den Aufbau der Formeln: vi ist frei für σ in ϕ, wenn entweder vi nicht frei in ϕ
ist oder wenn vi frei in ϕ ist und einer der folgenden Fälle gilt:
• ϕ ist atomar;
• ϕ ist ¬ψ und vi ist frei für σ in ψ;
29
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
• ϕ ist (ψ ∗ ψ 0 ) für einen zweistelligen Junktor ∗ und vi ist frei für σ in ψ und in ψ 0 ;
• ϕ ist ∃vj ψ oder ∀vj ψ, vi ist frei für σ in ψ und vj kommt in σ nicht vor.
Lemma 3.3.9 (Substitutionslemma für Formeln) Sei σ ein L-Term und β eine Belegung
in einer L-Struktur M. Dann gilt für alle L-Formeln ϕ und alle Variablen vi , die frei für σ in
ϕ sind:
σ M [β] σ
M ϕ [β] ⇐⇒ M ϕ β
vi
vi
Beweis: Beweis per Induktion über den Aufbau der Formeln. Für ϕ = > oder ⊥ gilt die
.
Aussage trivialerweise. Sei ϕ = Rj τ1 . . . τn (und analog ϕ = τ1 = τ2 ). Dann ist nach dem
Substitutionslemma für Terme:
Mϕ
σ
σ M
σ M
[β] ⇐⇒ Rj M τ1
[β] . . . τn
[β]
vi
vi
vi
σ M [β] σ M [β] σ M [β] . . . τn M β
⇐⇒ M ϕ β
⇐⇒ Rj M τ1 M β
vi
vi
vi
Die Junktorenschritte sind unproblematisch.
Sei also ϕ = ∃vj ψ. Wegen der Annahme, dass vi frei für σ in ϕ ist, kommt vj in σ nicht vor.
Wenn vi nicht frei in ϕ ist, ist das Substitutionslemma trivial. Sei also vi frei in ϕ. Dann muss
i 6= j sein. Nun gilt:
σ
σ m0 β
[β] ⇐⇒ es gibt ein m0 ∈ M mit M ψ
vi
vi
vj
h m σ M [β m0 ] i
vj
0
(Induktionsvoraussetzung)
⇐⇒ es gibt ein m0 ∈ M mit M ψ β
vj
vi
h m σ M [β] i
0
(vj kommt in σ nicht vor)
⇐⇒ es gibt ein m0 ∈ M mit M ψ β
vj
vi
h σ M [β] m i
0
(i 6= j)
⇐⇒ es gibt ein m0 ∈ M mit M ψ β
vi
vj
h σ M [β] i
⇐⇒ M ∃vj ψ β
vi
M ∃vj ψ
Analog für den Allquantor.
3.4
Allgemeingültige Formeln und logische Gesetze
3.5
Der Vollständigkeitssatz
3.6
Der Satz von Herbrand
Definition 3.6.1 Eine L-Formel ist in pränexer Normalform, falls sie die Form
Q1 vi1 . . . Qn vin ψ
hat mit Qi ∈ {∃, ∀} und quantorenfreiem ψ (d. h. ψ enthält keine Quantoren).
Lemma 3.6.2 Jede L-Formel ist zu einer L-Formel in pränexer Normalform äquivalent.
30
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Beweis: Atomare L-Formeln sind quantorenfrei und damit in pränexer Normalform. Es reicht
nun zu zeigen, dass Zusammensetzungen von Formeln in pränexer Normalform mit dem vollständigen Junktoren-Quantoren-System {¬, ∧, ∃} wieder in pränexe Normalform gebracht werden
können.
• ∃vi ϕ ist bereits in pränexer Normalform, wenn ϕ es ist.
• ¬Q1 vi1 . . . Qn vin ψ ∼ Q1 vi1 . . . Qn vin ¬ψ mit ∃ = ∀ und ∀ = ∃.
• Seien Q1 vi1 ϕ und χ in pränexer Normalform und vk eine Variable, die in χ nicht frei ist.
Dann gilt
vk
vk
∧ χ) ∼ Q1 vk (ϕ
∧ χ)
(Q1 vi1 ϕ ∧ χ) ∼ (Q1 vk ϕ
vi1
vi 1
Auf diese Weise kann man sukzessive alle Quantoren vor die Klammer ziehen.
Die letzte Umformungsregel gilt auch für die Disjunktion, d. h. (Qvk ϕ ∨ χ) ∼ Qvk (ϕ ∨ χ),
sofern vk nicht frei in χ ist.
Beispiel: (∃v0 ∀v1 Rv0 v1 → ∀v1 ∃v0 Rv0 v1 ) ∼
∼
∼
(¬∃v0 ∀v1 Rv0 v1 ∨ ∀v1 ∃v0 Rv0 v1 )
(∀v0 ∃v1 ¬Rv0 v1 ∨ ∀v2 ∃v3 Rv3 v2 )
∀v0 ∃v1 ∀v2 ∃v3 (¬Rv0 v1 ∨ Rv3 v2 )
∼
∀v2 ∀v0 ∃v1 ∃v3 (¬Rv0 v1 ∨ Rv3 v2 )
aber auch:
Die pränexe Normalform ist also nicht eindeutig. Abgesehen von Offensichtlichem (äquivalente
Darstellung des quantorenfreien Teils; zusätzliche unnötige Quantoren) kann die Reihenfolge
mancher Quantoren vertauscht werden, anderer nicht.
Definition 3.6.3 Eine L-Formel in pränexer Normalform heißt universell, wenn in ihr keine
Existenzquantoren vorkommen, und existenziell, wenn in ihr keine Allquantoren vorkommen. 21
Satz 3.6.4 (a) Eine L-Aussage ϕ in pränexer Normalform kann auf algorithmische Weise zu
einer Erfüllbarkeits-äquivalenten universellen L∗ -Aussage ϕ∗ gemacht werden, wobei L∗ ⊇ L
zusätzliche Funktionszeichen (inklusive Konstanten) enthält.
(b) Eine L-Aussage ϕ in pränexer Normalform kann auf algorithmische Weise zu einer existenziellen L∗ -Aussage ϕ∗ gemacht werden, die genau dann allgemeingültig ist, wenn ϕ es ist.
Die zusätzlichen Funktionszeichen heißen Skolem-Funktionen, ϕ∗ heißt Skolem-Normalform
oder Skolemisierung von ϕ und ϕ∗ Herbrand-Normalform von ϕ.
Bemerkung: Trivialerweise gibt es zu jeder L-Aussage ϕ sogar eine quantorenfreie Erfüllbarkeits-äquivalente Ausssage, nämlich >, falls ϕ erfüllbar ist, und ⊥ andernfalls. Wichtig ist in
diesem Satz daher, dass man die Erfüllbarkeits-äquivalente Ausssage algorithmisch finden kann,
also ohne vorher entscheiden zu müssen, ob ϕ erfüllbar ist oder nicht (was, wie in Kapitel 4
gezeigt wird, im allgemeinen nicht geht).
Beweis: (a) Sei ϕ in pränexer Normalform. Nach Umbennennung der Variablen hat die Formel
folgende Form:
∀v1 . . . ∀vk ∃vk+1 χ,
wobei χ eine L-Formel ist (also weitere Quantoren enthalten kann) und k ∈ N (d .h. k = 0 ist
zugelassen). Nun führt man ein neues k-stelliges Funktionszeichen f ein (im Falle von k = 0
eine neue Konstante) und ersetzt die Formel durch
∀v1 . . . ∀vk χ
21 Quantorenfreie
f v1 . . . vk
vk+1
Formeln sind also sowohl universell als auch existenziell.
31
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Auf diese Weise ersetzt man von außen nach innen (d. h. von links nach rechts) alle vorkommenden Existenzquantoren und erhält zum Schluss ϕ∗ .
Falls ϕ erfüllbar ist, definiert man in einem Modell M ϕ die neuen Funktionen f M folgendermaßen: Für (m1 , . . . , mk ) ∈ M k betrachtet man eine Belegung β mit β(vi ) = mi und wählt
für f M (m1 , . . . , mk ) ein Element, welches den entsprechenden Existenzquantor unter β erfüllt.
Dadurch wird M zu einem Modell M∗ von ϕ∗ expandiert und folglich ist ϕ∗ erfüllbar.
∗
Ist umgekehrt M∗ ein Modell von ϕ∗ und β eine Belegung, dann ist f M (β(v1 ), . . . , β(vk )) ein
Element, welches den entsprechenden Existenzquantor in ϕ unter β erfüllt.
(b) ϕ ist genau dann allgemeingültig, wenn ¬ϕ nicht erfüllbar ist, also nach (a) genau dann,
wenn (¬ϕ)∗ nicht erfüllbar ist, d. h. wenn ¬(¬ϕ)∗ allgemeingültig ist. Zieht man in dieser Fomel
die äußere Negation nach innen, erhält man die existenzielle Formel ϕ∗ .
Beispiel: (a) Die Skolem-Normalform von ∀v0 ∃v1 ∀v2 ∃v3 (¬Rv0 v1 ∨ Rv3 v2 ) ist also
∀v0 ∀v2 (¬R v0 f v0 ∨ R gv0 v2 v2 )
mit neuem einstelligem Funktionszeichen f und neuem zweistelligem Funktionszeichen g. Für
die Herbrand-Normalform führt man folgende Schritte durch:
Formel negieren und pränex machen: ∃v0 ∀v1 ∃v2 ∀v3 ¬(¬Rv0 v1 ∨ Rv3 v2 )
Skolemisieren: ∀v1 ∀v3 ¬(¬Rcv1 ∨ Rv3 hv1 )
erneut negieren und pränex machen: ∃v1 ∃v3 (¬Rcv1 ∨ Rv3 hv1 )
wobei c neue Konstante und h neues einstelliges Funktionszeichen. Im Endeffekt eliminiert man
also die Existenzquantoren in gleicher Weise wie bei der Skolemisierung die Allquantoren.
(b) Bei mehreren Existenzquantoren hintereinander braucht man jeweils ein neues Funktionszeichen gleicher Stelligkeit. ∀v2 ∀v0 ∃v1 ∃v3 (¬Rv0 v1 ∨ Rv3 v2 ) wird bei der Skolemisierung zu
∀v2 ∀v0 (¬R v0 f v0 v2 ∨ R gv0 v2 v2 ) mit neuen zweistelligen Funktionszeichen f und g.
Definition 3.6.5 Ein Term heißt geschlossen, wenn er keine Individuenvariablen enthält. 22
Satz 3.6.6 (Satz von Herbrand) Sei L eine Sprache mit mindestens einer Konstante und
ϕ = ∃v1 . . . ∃vn ψ eine existenzielle Formel mit quantorenfreiem ψ. Dann ist ϕ genau dann
allgemeingültig, wenn es geschlossene L-Terme τ1i , . . . , τni für ein N ∈ N und i = 1, . . . , N gibt
so dass
N
_
τ1n
τN 1
τN n
τ11
...
∨ ··· ∨ ψ
...
ψ(τi1 , . . . , τin ) := ψ
v
v
v
vn
1
n
1
i=1
allgemeingültig ist.
Bemerkung: Man kann für N keine Schranke angeben und sollte sich typischerweise eine große
Zahl darunter vorstellen.
WN
Beweis: Klar ist, dass ψ τvi11 . . . τvin
∃v1 . . . ∃vn ψ, also auch i=1 ψ(τi1 , . . . , τin ) ∃v1 . . . ∃vn ψ,
n
was die Richtung ⇐“ beweist.
”
Für ⇒“ nehmen wir an, dass ϕ allgemeingültig ist, aber keine der möglichen Disjunktionen
”
WN
VN
von Term-Einsetzungen. Also ist jedes ¬ i=1 ψ(τi1 , . . . , τin ) ∼ i=1 ¬ψ(τi1 , . . . , τin ) erfüllbar.
22 Manche
Autoren nennen L-Aussagen auch geschlossene L-Formeln“.
”
32
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Dies bedeutet, dass die Menge {¬ψ vτ11 . . . vτnn | τ1 , . . . , τn geschlossene L-Terme} endlich erfüllbar
ist und nach dem Kompaktheitssatz also ein Modell M hat.
Sei M0 := {τ M | τ geschlossene L-Terme} darin die Teilmenge der Interpretationen geschlossenere Terme. Per Definition ist M0 unter den Funktionen f M für f ∈ L abgeschlossen, also
Universum einer L-Unterstruktur M0 von M. Unterstrukturen sind gerade so definiert, dass alle
geschlossenen Terme die gleiche Interpretation in M0 wie in M haben und dass alle atomaren
L-Aussagen die gleiche Gültigkeit haben. Also gilt auch eine quantorenfreie L-Aussagen in M0
genau dann, wenn sie in M gilt. Insbesondere ist M0 ¬ψ vτ11 . . . vτnn für alle Terme τ1 , . . . , τn . Da
M0 aber nur aus Interpretationen von Termen besteht, folgt sogar M0 ∀v1 . . . ∀vn ¬ψ ∼ ¬ϕ :
im Widerspruch zur Allgemeingültigkeit von ϕ !
Bemerkung 3.6.7 (a) Wenn man L-Aussage ohne Gleichheitszeichen betrachtet, kommt auch
in der Herbrand-Normalform kein Gleichheitszeichen vor. Die Frage, ob eine Disjunktion quantorenfreier L-Aussagen wie im Satz von Herbrand allgemeingültig ist, lässt sich dann in ein
rein aussagenlogisches Problem überführen: Eine quantorenfreie L-Aussage ϕ ohne Gleichheitszeichen ist genau dann allgemeingültig, wenn ihr aussagenlogisches Gerüst“ Fϕ eine Tautologie
”
ist. Dabei entsteht Fϕ , indem man die atomaren Teilformeln von ϕ durch Aussagenvariablen
ersetzt (wobei zwei atomare Formeln genau dann durch die gleiche Aussagenvariable ersetzt
werden, wenn sie gleich sind).
Um die Allgemeingültigkeit von Fϕ zu überprüfen, versucht man am besten mit der Resolutionsmethode die Nicht-Erfüllbarkeit von ¬Fϕ zu zeigen. Indem man das Negationszeichen nach
innen zieht, erhält man de facto folgende Variante der Resolutionsmethode:
Man bringt Fϕ in DNF und betrachtet die einzelnen Disjunktionsglieder als duale Klauseln“
”
d. h. jedes Disjunktionsglied wird zu einer Menge von Literalen, die als ihre Konjunktion verstanden wird. Auf diese dualen Klauseln wenden man nun Resolution an, und sieht, dass Fϕ
genau dann allgemeingültig ist, wenn sich die leere duale Klausel ergibt.
(b) Man kann zeigen, dass man sich immer auf eine Formel ohne Gleichheitszeichen zurück.
ziehen kann: Man ersetzt jede Teilformel τ1 = τ2 einer L-Formel ϕ durch Eτ1 τ2 , wobei E ein
neues zweistelliges Relationszeichen ist, und erhält dadurch eine LE -Formel ϕE ohne Gleichheitszeichen für LE := L ∪ {E}. Sei KE := {γE | γ Gleichheitsaxiom von L}. In jedem Modell
M von KE ist dann E M eine Äquivalenzrelation (sogar eine Kongruenzrelation bzgl. L), und
auf der Menge M/E M der Äquivalenzklassen kann man eine LE -Struktur M/E so definieren,
dass die natürliche Surjektion M → M/E, m 7→ m/E M ein LE -Homomorphismus ist. In M/E
wird E durch die Identität interpretiert, d. h. M/E ϕE ⇐⇒ M/E ϕ. Man kann nun
zeigen: M/E ϕ ⇐⇒ M ϕE . Daraus folgt, dass die L-Formel ϕ genau dann allgemeingültig
V
ist, wenn die LE -Formel ohne Gleichheitszeichen ( KE → ϕE ) es ist.
Wenn man die Allgemeingültigkeit von z. B. (∃v0 ∀v1 Rv0 v1 → ∀v1 ∃v0 Rv0 v1 ) mit dem Satz
von Herbrand zeigen möchte, muss man also geeignete Term-Einsatzungen in die HerbrandNormalform ∃v1 ∃v3 (¬Rcv1 ∨ Rv3 hv1 ) betrachten. Eine Chance, die Allgemeingültigkeit einer
Disjunktion von Term-Einsetzungen zu zeigen, hat man nur, wenn gleiche atomare Formeln
auftreten. In diesem Fall möchte man also durch geeignete Einsetzungen erreichen, dass aus
Rcv1 und Rv3 hv1 die gleiche Formel wird. Hier rreicht man dies offenbar dadurch, dass man
einmal jeweils c für v1 und v3 einsetzt und (¬Rcc ∨ Rchc) erhält, und einmal hc für v1 und
z.B. c für v3 einsetzt und (¬Rchc ∨ Rchhc) erhält. Die Disjunktion beider Formeln ist offenbar
33
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
allgemeingültig. (Bei der Übersetzung in Aussagenlogik würde man ((A0 ∨ A1 ) ∨ (¬A1 ∨ A2 ))
erhalten.)
Unifikation
Die Frage, wie man durch Term-Einsetzungen gleiche atomare Formeln erreichen kann, wird
durch die Unifikation geklärt.
Definition 3.6.8 Sei P = {(τ1 , τ10 ), . . . , (τn , τn0 )} eine Menge von Paaren von L-Termen. P
wird durch eine Folge von Substitutionen vσi1 , . . . , vσik unifiziert, falls
1
τj
k
σ1
σk
σ1
σk
...
= τj0
...
vi 1
vi k
vi 1
vi k
für alle j = 1, . . . , n. Die Menge P heißt dann unifizierbar und die Folge der Substitutionen
Unifikator von P .
Satz 3.6.9 Wenn P unifizierbar ist, dann gibt es einen minimalen Unifikator (auch HauptUnifikator genannt), d. h. jeder Unifikator geht aus dem Hauptunifikator durch weitere Substitutionen hervor.
Folgendes Verfahren entscheidet, ob eine Menge von Paaren unifizierbar ist und bestimmt ggf.
den Hauptunifikator. (Man kann daraus auch einen Beweis des Satzes bekommen.)
1. Sei P gegeben. Starte mit leerer Folge Σ an Substitutionen.
2. Betrachte ein beliebiges (τ , τ 0 ) ∈ P :
(a) Falls τ = f %1 . . . %K und τ 0 = gυ1 . . . υl mit Funktionszeichen f 6= g (auch Konstanten), dann stoppen mit Ausgabe P ist nicht unifizierbar“.
”
(b) Falls τ = f %1 . . . %K und τ 0 = f υ1 . . . υk , dann ersetze P durch
P \ {(τ , τ 0 )} ∪ {(%1 , υ1 ), . . . , (%k , υk )}.
(c) Falls τ = vi = τ 0 , ersetze P durch P \ {(τ , τ 0 )}.
(d) Falls τ = vi 6= τ 0 und vi kommt in τ 0 vor, dann stoppen mit Ausgabe P ist nicht
”
unifizierbar“.
0
(e) Falls τ = vi und vj kommt in τ 0 nicht vor, dann ersetze Σ durch Σ, τvi und P durch
τ0 0 τ0 (σ vi , σ vi ) (σ, σ 0 ) ∈ P, (σ, σ 0 ) 6= (τ , τ 0 ) .
(f) Die letzten beiden Fälle gelten ebenso mit vertauschten Rollen für τ und τ 0 .
3. Falls P 6= ∅: springe zu 2. Falls P = ∅: stoppen mit Ausgabe Hauptunifikator ist Σ“.
”
Bemerkung 1: Das Verfahren stoppt, denn (2b) reduziert entweder die maximale Schachtelungstiefe von Termen in P oder die Anzahl von Termen maximaler Schachtelungstiefe in P ; (2c)
reduziert die Anzahl von Termen in P und (2e) reduziert die Anzahl der Variablen in P .
Bemerkung 2: Der Hauptunifikator Σ kann je nach Reihenfolge der Substitutionen verschiedene
Gestalt annehmen und ist nur im Ergebnis eindeutig. Wenn z. B. P = {(v0 , f c), (f v0 , v1 )}, dann
ist sowohl fv0c , fvf1c als auch fvv10 , fv0c Hauptunifikator; beide liefern als Ergebnis die unifizierten
Paare (f c, f c) und (f f c, f f c).
Anderes Beispiel: Für P = {(v0 , v1 )} sind
v0
v1
und
34
v1
v0
Hauptunifikatoren.
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Zusammenfassung der Herbrand’schen Methode:
Es gibt folgendes Semi-Entscheidungsverfahren für die Allgemeingültigkeit einer Formel ϕ:
1. Gegebenenfalls eliminiert man das Gleichheitszeichen, bringt dann ϕ in pränexe Normalform und den quantorenfreien Teil in DNF.
2. Nun bestimmt man die Herbrand’sche Normalform ϕ∗ .
3. Mithilfe von Unifkation sucht man N geeignete Term-Einsetzungen.
4. Mit der (dualen) Resolutionsmethode testet man die Disjunktion der Termeinsetzungen
auf Allgemeingültigkeit.
5. Man durchläuft Schritte 3. und 4. mit wachsendem N , bis sich eine allgemeingültige Disjunktion von Term-Einsetzungen ergibt. In diesem Fall ist ϕ allgemeingültig. Andernfalls
erhält man keine Antwort und das Verfahren stoppt nicht.
Umgekehrt gilt: wenn ϕ allgemeingültig ist, gibt es ein N und geeigente Term-Einsetzungen,
welche dies nachweisen. Wenn man die möglichen Term-Einsetzungen systematisch abarbeitet,
gibt die Methode für allgemeingültige Formeln irgendwann ein Ergebnis. Daher ist es ein SemiEntscheidungsverfahren.
35
MJ, Skript Info-Logik
4
4.1
4.1.1
4.2
Fassung von 13. Februar 2017
Berechenbarkeit
Turing-Maschinen
NP-Vollständigkeit und der Satz von Cook
Halteproblem und Unentscheidbarkeit der Prädikatenlogik
Sei A = {a1 , . . . , an } 6= ∅ ein endliches Alphabet. Wie üblich bezeichnet A∗ die Menge der
endlichen Wörter über A.
Wenn D ⊆ M und f : D → N eine Funktion ist, kann man f als partielle Funktion von M
nach N betrachten, Notation: f : M 99K N . Für x ∈ D ist f (x) der Funktionswert von x und
f heißt definiert in x; für x ∈ M \ D heißt f an der Stelle x unbestimmt.
Jede Turing-Maschine C mit Alphabet A bestimmt eine partielle Funktion fC mit
v
falls C bei Eingabe w stoppt und Ausgabe v liefert
fC (w) =
unbestimmt sonst
Definition 4.2.1 (a) Eine Funktion f : A∗ → B ∗ heißt berechenbar 23 , falls es eine TuringMaschine gibt, die bei Eingabe w ∈ A∗ stoppt und die Ausgabe f (w) liefert.
Eine partielle Funktion f : A∗ 99K B ∗ heißt berechenbar, falls es eine Turing-Maschine gibt, die
bei Eingabe w ∈ A∗ stoppt und die Ausgabe f (w) liefert, sofern f (w) definiert ist, und nicht
stoppt, falls f (w) unbestimmt ist.
(b) Eine Teilmenge W ⊆ A∗ heißt entscheidbar, falls die charakteristische Funktion χW mit
1 w∈W
χW (w) =
0 w∈
/W
berechenbar ist.
Äquivalent: Es gibt eine Turing-Maschine, die bei Eingabe w ∈ A∗ entscheidet, ob w ∈ W .
(Denn steht 1 für die Ausgabe ja“ und 0 für die Ausgabe nein“, berechnet sie gerade die
”
”
charakteristische Funktion von W .)
(c) Eine Teilmenge W ⊆ A∗ heißt semi-entscheidbar oder aufzählbar, falls die partielle cha”
rakteristische Funktion“ χW 24 mit
1
w∈W
χW (w) =
unbestimmt w ∈
/W
berechenbar ist.
Äquivalent: Es gibt eine Turing-Maschine, die bei Eingabe w ∈ A∗ genau dann stoppt, wenn
w ∈ W.
Bemerkung 4.2.2
(a) Für jedes endliche, nicht-leere Alphabet A = {a1 , . . . , an } gibt es eine Bijektion N → A∗ :
• Falls |A| = 1, betrachte die Abbildung, die der Zahl n die Folge a1 · · · a1 zuordnet.
| {z }
n mal
23 Genauer:
24 Weder
Turing-berechenbar oder Turing-Maschinen-berechenbar.
Name noch Bezeichnungsweise sind Standard-Notationen!
36
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
• Falls |A| = n, kann man zum Beispiel die Elemente von A irgendwie anordnen und dann
die Elemente von A∗ der Länge nach aufzählen und bei gleicher Länge nach lexikografischer
Pl
Ordnung. Die Umkehrabbildung von w = (w0 , . . . , wl ) 7→ i=0 (#wi + 1) · ni , wobei #ak = k,
ist eine solche Abbildung.
(b) Diese Bijektionen sind durch geeignete Turing-Maschinen berechenbar. Man kann also stets
A∗ = N annehmen.
Außerdem sieht man, dass eine Turing-Maschine, die eine Bijektion N → A∗ berechnet, zu einer
Maschine umgewandelt werden kann, welche die Elemente von A∗ aufzählt, d. h. nach und nach
alle Elemente von A∗ produziert.
(c) Es gibt eine berechenbare Bijektion β2 : N × N → N, z. B. die Abbildung (m, n) 7→ 21 (m2 +
n2 + 2mn + 3m + n). Induktiv erhält man dadurch Bijektionen βk : Nk → N. Also kann
man Abbildungen von Nk → N auf berechenbare Weise als Abbildungen N → N darstellen.
Definition 4.2.1 überträgt sich damit auf Funktionen Nk → N bzw. A∗1 × · · · × A∗k → B ∗ . 25
These von Church: Jede intuitiv berechenbare Funktion ist Turing-berechenbar. (D. h. jeder andere präzise Berechbarkeitsbegriff ist entweder gleichwertig oder schwächer als TuringBerechenbarkeit.)
Diese These ist für viele Maschinenmodelle und Programmiersprachen verifiziert und allgemein
akzeptiert. Sie wird im folgenden (und in der voranstehenden Bemerkung) insofern benutzt,
dass bei vielen Berechenbarkeitsfragen nur die intuitive Berechenbarkeit klar gemacht wird,
und nicht konkrete Turing-Maschinen konstruiert werden.
Lemma 4.2.3 (a) W ⊆ A∗ ist genau dann semi-entscheidbar, wenn es eine berechenbare Funktion f : A∗ → A∗ gibt mit Bild(f ) = W .
(b) W ⊆ A∗ ist genau dann entscheidbar, wenn W und A∗ \ W semi-entscheidbar sind.
Beweis: (a) Identifiziere o. E. A∗ mit N.
⇐“: Gegeben n ∈ N, berechne sukzessive alle f (m) für m ∈ N. Falls f (m) = n, stoppe.
”
⇒“: Betrachte die Maschine M, die in ihrem ( l(l+1)
+ k)-ten Berechnungsschritt den k-ten
2
”
Berechnungsschritt für χW (l) durchführt (für l ∈ N und k = 0, . . . , l). Setze f (m) = n, falls n
die m-te Zahl ist, für die die Antwort χW (n) = 1 erreicht wird.
(b) ⇐“: Man berechnet χW (w) und gibt 1 aus, falls χW (w) = 1, und geht in eine beliebige
”
unendliche Schleife, falls χW (w) = 0. Dadurch berechnet man χW . Für χA∗ \W geht es analog.
⇒“: Man berechnet in abwechselnden Schritten χW und χA∗ \W . Eine der beiden Berechnungen
”
muss stoppen; falls es χW ist, Ausgabe 1, andernfalls Ausgabe 0.
Die Technik aus der Beweisrichtung ⇒“ in Teil (a), unendlich viele Berechnungen sukzessive
”
gleichzeitig durchzuführen, nenne ich auch diagonale Berechnung“.
”
Wenn u : A∗ ×A∗ → A∗ eine berechenbare Funktion ist, dann sind natürlich für alle w ∈ A∗ auch
die Funktionen uw : A∗ → A∗ , uw (v) = u(w, v) berechenbar. Analog für partielle Funktionen.
Satz 4.2.4 (a) Es gibt keine universelle berechenbare Funktion, d. h. kein berechenbares u :
kann sogar eine berechenbare Bijektion N∗ → N angeben: das leere Wort wird auf 0 abgebildet, ein
w=
6 ∅ auf β2 (lg(w) − 1, βlgw (w)) + 1.
25 Man
37
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
A∗ × A∗ → A∗ , so dass {uw : A∗ → A∗ | w ∈ A∗ } gerade die Menge aller berechenbaren
Funktionen A∗ → A∗ ist.
(b) Es gibt eine universelle partielle berechenbare Funktion, d. h. ein berechenbares u : A∗ ×
A∗ 99K A∗ , so dass {uw : A∗ 99K A∗ | w ∈ A∗ } gerade die Menge aller berechenbaren partiellen
Funktionen A∗ 99K A∗ ist.
Beweis: (a) Gäbe es solch ein u, wäre auch die Diagonalfunktion δ : A∗ → A∗ , w 7→ u(w, w)
berechenbar, und damit auch δ 0 : A∗ → A∗ , w 7→ u(w, w) a1 . Also müsste es ein w0 ∈ A∗ geben
mit δ 0 = uw0 . Dann wäre aber δ 0 (w0 ) = u(w0 , w0 ) a1 6= u(w0 , w0 ) = uw0 (w0 ).
(b) (vgl. Vorlesung Theoretische Informatik“) Programme einer Turing-Maschine C können auf
”
berechenbare Weise in A∗ codiert werden. Wähle eine feste Codierung C 7→ pCq ∈ A∗ .
Nun gibt es eine universelle Turing-Maschine U, die als Eingabe ein Paar (c, w) ∈ A∗ × A∗
bekommt: Falls c = pCq, simuliert U den Lauf von C mit Eingabe w und gibt ggf. deren
Ausgabe aus. In allen anderen Fällen läuft sie unendlich lange weiter. Die universelle partielle
berechenbare Funktion ist die durch U bestimmte Funktion fU .
Beispiel: Man kann L-Formeln über einem endlichen Alphabet auffassen, wenn man die unendlich vielen Individuenvariablen und möglicherweise unendlich vielen Symbole in L auf geeignete
Weise codiert. Die Menge aller L-Formeln ist dann entscheidbar. (Dies folgt zum Beispiel aus
der eindeutigen Lesbarkeit.)
Die Vollständigkeit des Hilbert-Kalküls zeigt:
Satz 4.2.5 Die Menge aller allgemeingültigen L-Formeln ist semi-entscheidbar.
Satz 4.2.6 (Halteproblem [Turing]) Die Menge
{(c, w) ∈ A∗ × A∗ | c = pCq und die Turing-Maschine C stoppt bei Eingabe w}
ist semi-entscheibar, aber nicht entscheidbar.
Beweis: Semi-Entscheidbarkeit: Falls c = pCq, simuliere den Lauf von C mit Eingabe w und
stoppe, falls C stoppt.
Unentscheidbarkeit: Falls das Halteproblem entscheidbar wäre, könnte man eine universelle
berechenbare Funtkion u konstruieren: Bei Eingabe (c, w), prüfe zunächst, ob c = pCq. Falls ja,
prüfe ob C mit Eingabe w stoppt. Falls auch dies, berechnet fC (w), gib dies als Ausgabe aus
und stoppe. In allen andern Fällen stoppe und gib beliebigen festen Wert (z. B. a1 ) aus.
Folgerung 4.2.7 Es gibt semi-entscheidbare, nicht entscheidbare Teilmengen von A∗ .
Eine unendliche Menge M heißt abzählbar, falls es eine Bijektion N → M gibt, und anderfalls
überabzählbar. 26
Satz 4.2.8 Die Menge Abb(N, {0, 1}) der 0-1-Folgen ist überabzählbar; ebenso die Potenzmengen Pot(N) und Pot(A∗ ) für jedes endliche Alphabet A.
26 Man
darf abzählbar nicht mit aufzählbar verwechseln! Jede aufzählbare Menge ist abzählbar, aber nicht
umgelehrt.
38
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Beweis: Nach Bemerkung 4.2.2 gibt es eine Bijektion β : N → A∗ , die sich zu einer Bijektion
β̃ : Pot(N) → Pot(A∗ ) fortsetzt, nämlich β̃(M ) = {β(n) | m ∈ M } für M ⊆ N. Außerdem
steht Pot(N) in Bijektion mit der Menge der 0-1-Folgen, indem man jeder Teilmenge M ⊆ N
die charakteristische Funktion χM zuordnet.
Es reicht also, die Überabzählbarkeit der Menge der 0-1-Folgen zu zeigen, was mit Cantors
Diagonalargument funktioniert: Angenommen β : N → Abb(N, {0, 1}) wäre eine Bijektion.
Dann betrachtet man die 0-1-Folge α mit α(n) = 1 − β(n)(n). Nach Annahme gibt es ein
n0 ∈ N mit α = β(n0 ). An der Stelle n0 ist aber β(n0 )(n0 ) 6= α(n0 ): Widerspruch.
Der Beweis der Nicht-Existenz einer universellen berechenbaren Funktion benutzt genau dieses
Diagonalargument von Cantor!
Da jede Turing-Maschine durch ihren Code (also eine endliche Zeichenfolge über einem endlichen Alphabet A) beschreibbar und A∗ abzählbar ist, gibt es also nur abzählbar viele (semi-)
entscheidbare Mengen von N. Überabzählbar viele Teilmengen von N sind also nicht (semi-)
entscheidbar. Da es aber auch nur abzählbar viele Beschreibungen von Teilmengen von N gibt
(durch einen endlichen Text, ggf. mit Formeln!), sind die meisten dieser nicht-(semi-)entscheidbaren Mengen auch gar nicht irgendwie beschreibbar. Die Menge
(c, w) ∈ A∗ × A∗ c = pCq und die Turing-Maschine C stoppt nicht bei Eingabe w
ist ein Beispiel einer beschreibbaren, aber nicht semi-entscheidbaren Menge. Denn da ihr Komplement – die Menge aus dem Halteproblem – semi-entscheidbar ist, wäre dieses (d. h. das
Halteproblem) nach Lemma 4.2.3 (b) auch entscheidbar.
Satz 4.2.9 (Unentscheidbarkeit der Prädikatenlogik [Gödel]) Wenn L mindestens ein
zweistelliges Relationszeichen oder ein einstelliges Funktionszeichen enthält, ist
{ϕ | ϕ allgemeingültige L-Aussage}
nicht entscheidbar.
Beweis: Da ϕ genau dann allgemeingültig ist, wenn ¬ϕ nicht erfüllbar ist, kann man ebensogut
zeigen, dass die Menge der erfüllbaren L-Aussagen nicht entscheidbar ist.
Der Beweis führt die Frage auf das Halteproblem zurück: Für jede Turing-Maschine C und
jede Eingabe w wird auf berechenbare Weise eine L-Formel σC,w konstruiert, die genau dann
erfüllbar ist, wenn C bei Eingabe w stoppt. Wenn die Menge der allgemeingültigen L-Aussagen
entscheidbar wäre, könnte man also auch das Halteproblem entscheiden.
Ohne Einschränkung sei A = {0, 1} das Alphabet, über dem die Turing-Maschine arbeitet.
Die Zellen des Bandes kann man sich durch Z indiziert vorstellen (mit Startposition 0), die
Arbeitsschritte (oder Zeitpunkte) sind durch N indiziert (ebenfalls mit Startwert 0). Der Kürze
der Beschreibung wegen werden die gleichen Variablen sowohl für Zellen als auch für Zeitpunkte
verwende, und der Einfachheit halber wird eine von C abhängige Sprache L = LC benutzt.
Man kann sich dann überlegen, dass man diese Sprache z. B. durch ein einziges zweistelliges
Relationszeichen codieren kann.
L besteht aus
• einem zweistelligen Relationszeichen < für die Anordnung der Zellen und der Zeitpunkte;
• zwei einstellige Funktionszeichen N und N −1 für die nachfolgende Zelle/den nachfolgenden
Zeitpunkt bzw. die vorangehende Zelle/den vorangehenden Zeitpunkt;
39
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
• einer Konstanten 0 für die Startposition und den Startzeitpunkt;
• einem zweistelligen Relationszeichen K, wobei Kzt die Position z des Lese-Schreib-Kopfes
zum Zeitpunkt t angibt;
• zwei zweistellige Relationszeichen A0 und A1 , wobei Ai zt angibt, dass zum Zeitpunkt t das
Zeichen i in Zelle z steht;
• für jeden Zustand Zj der Turing-Maschine ein einstelliges Relationszeichen Zj , wobei Zj t
angibt, dass sich die Maschine zum Zeitpunkt t im Zustand Zj befindet. 27
Nun drückt man in einer L-Aussage τ die Grundgegebenheiten einer Turing-Maschine aus, d. h.
• < beschreibt eine diskrete lineare Ordnung ohne Endpunkte, was bedeutet, dass jedes Element z einen unmittelbaren Nachfolger N z und einen unmittelbaren Vorgänger N −1 z hat;
• in jeder Zelle steht immer maximal ein Symbol: ∀z∀t ¬(A0 zt ∧ A1 zt);
• die Maschine ist zu jedem Zeitpunkt t in genau einem Zustand und zu Beginn im Startzustand: Z0 0;
• der Kopf steht immer in genau einer Zelle und zu Beginn in der Startposition: K00.
In einer weiteren L-Aussage πC wird das Programm von C formuliert. Sie besteht aus einer
Konjunktion von Aussagen der Form
.
∀z∀t(((t = 0 ∨ 0 < t) ∧ Kzt ∧ Zj t ∧ Ai zt) → (Kz 0 N t ∧ Zj 0 N t ∧ Ai0 zN t)),
dabei sind z 0 , j 0 und i0 durch das Programm festgelegt; z 0 ist dabei z oder N z oder N −1 z.
Schließlich drückt man in einer L-Aussage εw die Eingabe w = (w0 , . . . , wk ) aus:
((Aw0 00 ∧ Aw1 N 00 ∧ · · · ∧ Awk N k 00) ∧ ∀z((z < 0 ∨ N k 0 < z) → (¬A0 z0 ∧ ¬A1 z0)))
Wenn die Turing-Maschine C nun bei Eingabe w nicht stoppt, ergibt sich aus dem Lauf der
Maschine ein Modell der L-Aussage
σC,w := (τ ∧ πC ∧ εw ∧ ∀t(0 < t → ¬Zs t))
wobei Zs der (ohne Einschränkung einzige) Stoppzustand sei: Universum des Modells ist Z
und man interpretiert die Zeichen in L so, wie intendiert. (Für negative Zeitpunkte kann man
irgendwelche mit den allgemeinen Bedingungen konsistente Konfigurationen wählen).
Ist umgekehrt die L-Aussage σC,w erfüllbar, dann hat sie ein Modell M. Die Menge M0 , die aus
0M und seinen unmittelbaren Nachfolgern N . . . N 0M und Vorgängern N −1 . . . N −1 0M besteht,
ist Universum einer (als Ordnung) zu Z isomorphen Unterstruktur. Auf M0 beschreibt σC,w nun
den Lauf der Turing-Maschine C bei Eingabe w: In Zelle z steht zum Zeitpunkt t das Symbol i
genau dann, wenn σC,w ` Ai zt, etc. In diesem Lauf wird der Stoppzustand nicht erreicht.
Bemerkung 4.2.10 Wenn L nur Prädikate und Konstanten enthält, ist es entscheidbar, ob
eine L-Aussage allgemeingültig ist oder nicht.
4.3
Rekursive Funktionen und Arithmetik
Definition 4.3.1 (a) Eine Funktion f : Nk → N für k ∈ N heißt primitiv rekursiv, wenn sie
entweder eine der folgenden Grundfunktionen ist:
27 Um eine von C unabhängige Sprache zu erhalten, kann man stattdessen ein zweistelliges Relationszeichen
Z nehmen und durch Ztj ausdrücken, dass sich die Maschine zum Zeitpunkt t im Zustand Zj befindet, wobei j
das j-te, in der Anordung < auf 0 folgende Element ist.
40
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
• die konstante Funktion 0 : N0 → N;
• die Nachfolgerfunktion N : N → N, n 7→ n + 1;
• eine Projektionsfunktion πik : Nk → N, (n1 , . . . , nk ) 7→ ni ;
oder sich daraus durch endliche Anwendung folgender Regeln daraus ergibt:
• (Komposition:) Wenn f1 , . . . , fl : Nk → N und g : Nl → N primitiv rekursiv sind, dann
auch die Funktion h : Nk → N mit
h(n1 , . . . , nk ) := g(f1 (n1 , . . . , nk ), . . . , fl (n1 , . . . , nk )).
• (Primitive Rekursion:) Wenn f : Nk → N und g : Nk+1 → N primitiv rekursiv sind, dann
auch die Funktion h : Nk+1 → N mit
h(n1 , . . . , nk , 0) := f (n1 , . . . , nk )
h(n1 , . . . , nk , n + 1) := g(h(n1 , . . . , nk , n), n1 , . . . , nk ).
(b) Eine partielle Funktion f : Nk 99K N heißt rekursiv, wenn zusätzlich folgende Regel zugelassen ist:
• (µ-Rekursion) Wenn f : Nk+1 99K N rekursiv ist, dann auch die Funktion h : Nk 99K N mit
h(n1 , . . . , nk ) :=
µn f (n1 , . . . , nk , n) = 0 falls es existiert
unbestimmt
sonst
Dabei steht µn f (n1 , . . . , nk , n) = 0 für das kleinste n mit f (n1 , . . . , nk , n) = 0.
(c) Eine Teilmenge von Nk heißt (primitiv) rekursiv, wenn ihre charakteristische Funktion
(primitiv) rekursiv ist. Die Teilmenge heißt rekursiv aufzählbar, wenn sie Definitionsbereich
einer partiellen rekursiven Funktion ist. 28
Satz 4.3.2 Die rekursiven (partiellen) Funktionen sind genau die berechenbaren (partiellen)
Funktionen.
Beweisidee: Die Grundfunktionen lassen sich durch Turing-Maschinen berechnen, und die
verschiedenen Kompositions- und Rekursionsschritte lassen sich mit Turing-Maschinen nachbilden. Umgekehrt kann man zeigen, dass sich die Arbeitsweise von Turing-Maschinen durch
rekursive Funktionen beschreiben lassen.
Folgerung 4.3.3 Die rekursiv aufzählbaren Teilmengen von Nk sind genau die semi-entscheidbaren Teilmengen von Nk .
Im Folgenden soll N nicht nur die Menge der natürlichen Zahlen bezeichnen, sondern die LN Struktur darauf, wobei LN = {<, +, ·, 0, 1} und die Zeichen auf die übliche Art und Weise
interpretiert werden. Diese Struktur heißt auch die Arithmetik“.
”
Außerdem sei τ0 = 0 und τn der Term (·(1 + 1) + . . . ) + 1 für n > 1. Es ist also τnN = n.
|
{z
}
n mal
Definition 4.3.4 Für eine L-Struktur M ist die L-Theorie von M die Formelmenge
Th(M) := {ϕ | ϕ L-Aussage mit M ϕ}.
28 Äquivalent:
Wenn sie die leere Menge ist oder das Bild einer rekursiven Funktion ist.
41
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Bemerkung 4.3.5 Wenn die Theorie einer L-Struktur M semi-entscheidbar ist, dann ist sie
auch entscheidbar: Denn das Komplement von Th(M) ist dann ebenfalls semi-entscheidbar, da
die Menge der L-Formeln entscheidbar ist und
ϕ∈
/ Th(M) ⇐⇒ ¬ϕ ∈ Th(M).
Lemma 4.3.6 Alle rekursiven partiellen Funktionen sind durch LN -Formeln definierbar. Es
gibt einen berechenbaren Übergang von einer Turing-Maschine C zu einer LN -Formel ϕC (v0 , v1 ),
die fC definiert, d. h. fC (m) = n ⇐⇒ N ϕC [m, n] ⇐⇒ N ϕC τvm0 τvn1 .
Beweisskizze: Die Formeln kann man unmittelbar aus der Definition rekursiver Funktionen
gewinnen, da sowohl die Grundfunktionen definierbar sind als auch Komposition und Rekursionen in LN ausdrückbar sind. Der berechenbare Übergang ergibt sich aus dem Beweis von
Satz 4.3.2, der konstruktiv ist.
Satz 4.3.7 (Erster Unvollständigkeitssatz von Gödel für die Arithmetik)
(a) Th(N) ist nicht entscheidbar.
(b) Wenn T ⊆ Th(N) semi-entscheidbar ist, dann ist T ` := {ϕ | T ` ϕ} nicht vollständig, d. h.
es gibt LN -Aussagen ψ so, dass weder T ` ψ noch T ` ¬ψ.
Da eine der beiden Formeln ψ und ¬ψ in N gelten muss, wird die Version (b) oft durch den
Slogan Es gibt in N wahre Sätze, die nicht beweisbar sind“ wiedergegeben.
”
Beweis: (a) Sei C eine Turing-Maschine, die die partielle Funktion fC : N 99K N berechnet.
Ohne Einschränkung kann man annehmen, dass C genau dann bei Eingabe n stoppt, wenn
fC (n) definiert ist (also dass der Fall, dass C stoppt, aber keine vernünftige Ausgabe liefert,
nicht eintritt). Dann gilt für ϕC [m, n] wie oben:
N ∃v1 ϕC
τn
⇐⇒ fC (n) ist definiert ⇐⇒ C stoppt bei Eingabe n
v0
Also würde aus der Entscheidbarkeit von Th(N) die Entscheidbarkeit des Halteproblems folgen.
(b) Aus der Semi-Entscheidbarkeit von T folgt analog zu Satz 4.2.5 die Semi-Entscheidbarkeit
von T ` . Also ist T ` 6= Th(N), da Th(N) nach Bemerkung 4.3.5 und Teil (a) nicht semientscheidbar ist.
Zum Abschluss sei ein schwerer Satz erwähnt, der zeigt, dass die rekursiv aufzählbaren Mengen
in N durch Formeln einfacher Art definierbar sind:
Satz 4.3.8 (Davis, Putnam, Robinson, Matiyasevich) R ⊆ Nk ist genau dann rekursiv
aufzählbar, wenn es ein l ∈ N und Polynome P, Q ∈ N[X1 , . . . , Xk ] gibt mit
R = (n1 , . . . , nk ) ∈ N es gibt m1 , . . . , ml ∈ N mit
P (n1 , . . . , nk , m1 , . . . , ml ) = Q(n1 , . . . , nk , m1 , . . . , ml )
d. h. wenn R durch eine Formel
.
∃vk+1 . . . ∃vk+l τ1 (v1 , . . . , vk , vk+1 , . . . , vl+k ) = τ2 (v1 , . . . , vk , vk+1 , . . . , vl+k )
mit LN -Termen τ1 , τ2 definiert ist.
42
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Beweishälfte: Einfach zu sehen ist, dass durch solche Formeln definierte Relationen rekursiv
aufzählbar, d. h. semi-entscheidbar, sind: Man betrachtet eine Aufzählung von Nl und berechnet
für gegebenes (n1 , . . . , nk ) und alle (m1 , . . . , ml ) diagonal“ aus, ob P (n1 , . . . , nk , m1 , . . . , ml ) =
”
Q(n1 , . . . , nk , m1 , . . . , ml ).
Die andere Richtung ist ein schweres mathematisches Theorem, und es ist auch überhaupt
nicht einfach, für offensichtlich entscheidbare Mengen wie etwa die Menge aller Primzahlen die
Polynome zu finden!
43
MJ, Skript Info-Logik
Fassung von 13. Februar 2017
Namenspaten und wichtige Personen:
George Boole (1815–1864): formale Aussagenlogik; Boole’sche Algebra
Luitzen Egbertus Jan Brouwer (1881–1966): Begründer des Intuitionismus
Georg Cantor (1845–1918): Begründer der Mengenlehre; Diagonalargument
Alonzo Church (1903–1995): Church’sche These
Stephen Cook (∗1939): Satz von Cook und Levin
Haskell Brooks Curry (1900–1982): Currying, Curry-Howard-Korrspondenz (und Programmiersprache Haskell)
Martin Davis (∗1928): Satz von Davis, Putnam, Robinson und Matiyasevich
Gottlob Frege (1848–1925): formale Prädiaktenlogik; aus seinem Behauptungsstrich“ ist das
”
Zeichen ` entstanden
Gerhard Gentzen (1909–1945): Gentzen-Kalküle
Kurt Gödel (1906–1978): Vollständigkeitssatz, Unvollständigkeitssatz
Helmut Hasse (1898–1979): Hasse-Diagramme
Leon Henkin (1921–2006): Henkin-Modelle, -Konstanten und -Axiome
Jacques Herbrand (1908–1931): Herbrand-Normalform, Satz von Herbrand
Arend Heyting (1898–1980): formaler Intuitionismus; Heyting-Algebren
David Hilbert (1862–1943): Hilbert-Kalküle
Alfred Horn (1918–2001): Horn-Formeln, Horn-Klauseln
William Howard (∗1926): Curry-Howard-Korrespondenz
Leonid Levin (∗1948): Satz von Cook und Levin
Adolf Lindenbaum (1904–1941): Tarski-Lindenbaum-Algebra
Yuri Matiyasevich (∗1947): Satz von Davis, Putnam, Robinson und Matiyasevich
Augustus de Morgan (1806–1871): Regeln von de Morgan
Charles Sanders Peirce (1839–1914): formale Prädiaktenlogik; Peirce-Funktion – anderer Name
für den NOR-Junktor
Hilary Putnam (1926–2016): Satz von Davis, Putnam, Robinson und Matiyasevich
Julia Robinson (1919–1985): Satz von Davis, Putnam, Robinson und Matiyasevich
Henry Maurice Sheffer (1882–1964): Sheffer-Strich – anderer Name für den NAND-Junktor
Albert Thoralf Skolem (1887–1963): Skolem-Funktionen und -Normalform, Skolemisierung
Marshall Stone (1903–1989): Darstellungssatz von Stone
Alfred Tarski (1901–1983): Tarski-Lindenbaum-Algebra
Alan Turing (1912–1954): Turing-Maschine
John Venn (1834–1923): Venn-Diagramme
.
Martin Ziegler (∗1948): Symbol = für das Gleichheitszeichen in der Prädikatenlogik
44
Herunterladen