Logik und Modelltheoretische Semantik Vorlesung SS 2011

Werbung
Logik und Modelltheoretische Semantik
Vorlesung SS 2011
Hans Leiÿ
Universität München
Centrum für Informations- und Sprachverarbeitung
23. Juli 2011
1 / 97
Organisatorisches
Vorlesung
I Zeit: Do, 14-16 Uhr
I Ort: Raum B254, Eduard-Rumpler-Str. 13
I Voraussetzung: Kurs über Mathematische Grundlagen der CL
I Abschluÿklausur: letzte Semesterwoche
Tafelübung:
I Zeit: Di 14-16
I Ort: Raum 227, Schellingstr. 3
I Hausaufgaben:
2 / 97
Literatur
3 / 97
Boole'sche Algebra
Eine Boole'sche Algebra
B = (B , +, ·, , 0, 1)
ist eine Struktur, in
der folgende Aussagen gelten:
∀x ∀y ∀z (x + (y + z ) = (x + y ) + x )
1.
+
ist assoziativ:
2.
+
ist kommutativ:
3.
+
ist idempotent:
4. 0 ist neutral bzgl.
∀x ∀y (x + y = y + x )
∀x (x + x = x )
+: ∀x (x + 0 = x )
5. Gegenteile sind erschöpfend:
∀x (x + x = 1)
∀x ∀y ∀z (x · (y · z ) = (x · y ) · x )
6.
·
ist assoziativ:
7.
·
ist kommutativ:
8.
·
ist idempotent:
∀x ∀y (x · y = y · x )
∀x (x · x = x )
9. 1 ist neutral bzgl. ·:
∀x (x · 1 = x )
10. Gegenteile sind ausschlieÿend:
11.
+
12.
·
distribuiert über ·:
distribuiert über
∀x (x · x = 0)
∀x ∀y ∀z (x + (y · z ) = (x + y ) · (x + z ))
+: ∀x ∀y ∀z (x · (y + z ) = (x · y ) + (x · z ))
4 / 97
Auf jeder BA gibt es eine partielle Ordnung
≤,
deniert durch
a ≤ b : ⇐⇒ a + b = b.
Bezüglich
≤
+ a = a) und 1
a + 1 = a + (a + a) = a + a = 1). In jedem
+ und · monoton, z.B.
ist 0 das kleinste Element (wegen 0
das gröÿte (wegen
Argument sind
a≤b
Auÿerdem ist
⇒
ac + bc = (a + b)c = bc
⇒
ac ≤ bc
a · 0 = a · (a · a) = (a · a) · a = a · a = 0.
Beispiele:
I Die Algebra der Wahrheitswerte:
B = ({0, 1}, max, min, , 0, 1)
mit 0
:= 1,
1
:= 0
M:
A := { m ∈ M | m ∈
/ A}
I Die Algebra aller Teilmengen einer Menge
P(M ) = (P (M ), ∪, ∩, , ∅, M )
mit
5 / 97
Aussagen, die man aus den Axiomen beweisen kann, gelten in allen
Boole'schen Algebren.
Proposition: Sei
1. Gelten
A
eine Boole'schen Algebra, und
a·b =0
2. (De Morgan)
und
a + b = 1,
a·b =a+b
und
so ist
a , b ∈ A.
a = b.
a + b = a · b.
Beweis:
1.
a = a1 = a(b + b) = ab + ab = 0 + ab = ab
= ab + 0 = ab + bb = (a + b)b = 1b = b.
2. Nach 1. genügt es, folgende zwei Gleichungen zu zeigen:
(ab)(a + b) = aba + abb = aab + a0 = 0b + 0 = 0
(ab) + (a + b) = ab + a1 + 1b = ab + a(b + b) + (a + a)b
= ab + ab + ab + ab + ab
= (a + a)b + (a + a)b = b + b = 1
Was bedeuten die Aussagen in
B
und
P(M )?
6 / 97
Lemma: Ist
und
I 6= ∅
A = (A, +A , ·A ,
A , 0A , 1A ) eine Boole'sche Algebra
eine Menge, so ist auch
AI := (AI , +, ·, , 0, 1)
eine Boole'sche Algebra, wobei
AI
0
:= { f | f : I → A },
:= das f ∈ AI mit f (i ) = 0A
für alle
i ∈I
alle
i ∈I
I
A
1 := das f ∈ A mit f (i ) = 1
für
A
(f + g )(i ) := f (i ) + g (i ), für alle i ∈ I
(f · g )(i ) := f (i ) ·A g (i ), für alle i ∈ I
A
f (i ) := f (i ) ,
für alle
i ∈ I.
Beweis: Man prüft die Axiome durch Nachrechnen, z.B.
((f + g ) · h)(i ) = (f (i ) +A g (i )) ·A h(i )
= (f (i ) ·A h(i )) +A (g (i ) ·A h(i ))
= ((f · h) + (g · h))(i ).
7 / 97
Die Boole'schen Operationen
+ (oder), · (und)
und
(nicht) treten
in der natürlichen Sprache bei mehreren Ausdrucksarten auf:
1. bei Satzverbindungen werden sie in
B interpretiert:
Weder (arbeitet Fritz) noch ((scheint die Sonne) oder
(leuchtet der Mond)) ' ¬ϕ1 ∧ ¬(ϕ2 ∨ ϕ3 )
2. bei Verbindungen von (einstelligen) Prädikaten werden sie in
P(I ) = BI interpretiert, wenn I die Menge
Fritz (arbeitet und (geht nicht baden))
BI
I
' f (A ·B B ) ' (f A) ·B f B
B
.
Bei zweistelligen Prädikaten analog in
(liest oder schreibt) einen Aufsatz.
der Individuen ist:
P(I × I ) = BI ×I : Fritz
3. bei Nominalphrasen (in Subjektsposition) werden sie in
interpretiert:
(Weder Fritz noch Maria) arbeitet
I
B(B )
I
' (f
I
·BB
m)
BB
B
A = (f A) ·B (m A)
B
8 / 97
Eine
n-stellige Wahrheitsfunktion
ist eine Funktion
f : Bn → B.
Einige der Konjunktionen und Subjunktionen der natürlichen
Sprache können durch Wahrheitsfunktionen interpretiert werden,
andere nicht. Neben
weder noch
und, oder, nicht
wenn - dann,
und, oder, nicht
können z.B.
auf Kombinationen von
zurückgeführt werden, z.B.
Wenn S1 , dann S2 . := (nicht S1 ) oder S2 .
Konjunktionen, die nicht durch eine Wahrheitsfunktion interpretiert
werden können, sind z.B.
weil
oder
damit.
f : B2 → B
(p deshalb, weil q) = f (p , q ).
Zeige, daÿ es keine Wahrheitsfunktion
gibt mit
p1 , p2 mit
q1 , q2 mit gleichem
(p1 deshalb, weil q1 ) und (p2 deshalb, weil
Hinweis: man nde umgangssprachliche Aussagen
gleichem Wahrheitswert und Aussagen
Wahrheitswert, wo aber
q2 )
verschiedene Wahrheitswerte haben.
9 / 97
Modallogik
Komplexe Sätze können nicht nur durch Koordinationen, sondern
auch durch Satzadverbien wie
möglicherweise
oder
wahrscheinlich
aus einfachen Sätzen aufgebaut werden.
Leibniz hat die
wirkliche
möglichen Welten unterschieden.
notwendigerweise, wenn sie in allen
und möglicherweise, wenn sie in
von
Nach ihm gilt eine Aussage
möglichen Welten wahr ist,
mindestens einer möglichen Welt wahr ist.
Modallogische Formeln:
ϕ, ψ :=
|
|
|
|
Abkürzung:
⊥
p
¬ϕ
(ϕ ∧ ψ)
ϕ
♦ϕ := ¬¬ϕ
für
(Falsum)
(Aussagevariable )
(nicht ϕ)
(ϕ und ψ)
(es ist notwendig,
daÿ
ϕ)
es ist möglich, daÿ ϕ
10 / 97
Einfache Interpretation: Eine mögliche Welt ist eine Belegung
h : Var → B. ϕ
ist in
wahr, oder
h |= ϕ,
h |= ϕ
⇐⇒
für alle
h |= ♦ϕ
⇐⇒
für ein
Für aussagenlogische
♦ϕ = ϕ
h
ϕ
hieÿe das:
ist erfüllbar .
wenn
[[ϕ]]h = 1.
Das gibt
h0 : Var → B : h0 |= ϕ
h0 : Var → B : h0 |= ϕ
ϕ = ϕ
ist allgemeingültig ,
Feinere Interpretation: die Möglichkeiten sind
relativ
zur
Wirklichkeit (S. Kripke, 1957).
M = (W , R ) besteht aus einer Menge W 6= ∅
R ⊆ W × W . Eine Belegung über
Abbildung h : W × Var → B.
Ein Modell-Rahmen
und einer Erreichbarkeitsrelation
M
ist eine
11 / 97
w von ϕ in
[[ϕ]]M,
h
min ∅ := 1) durch
Der (Wahrheits-) Wert
ist dann deniert (mit
w
[[⊥]]M,
h
w
[[p ]]M,
h
w
[[¬ϕ]]M,
h
w
[[ϕ ∧ ψ]]M,
h
w
[[ϕ]]M,
h
:=
der Welt
w
von
M
bei
h
0
:= h(w , p )
w
:= [[ϕ]]M,
h ,
w · [[ψ]]M,w
:= [[ϕ]]M,
h
h
M,v
:= min{ [[ϕ]]h
| v ∈ W , wRv }.
Insbesondere:
M, w , h |= ϕ
⇐⇒
M, w , h |= ϕ
für alle von
w
aus erreichbaren
v ∈ W.
12 / 97
Prädikatenlogik 1.Stufe
Var = {x0 , x1 , . . .} eine unendliche Menge von
L = Fun ∪ Rel eine (endliche) Menge von (mit einer
Syntax: Sei
Variablen,
Stelligkeit versehenen) Funktions- bzw. Relationszeichen.
L-Terme:
s , t := x
|
c
c ∈ Fun
|
f (t1 , . . . , tn )
f ∈ Fun n-stellig, n ≥ 1
0-stellig
L-Formeln:
ϕ, ψ := ⊥ | s =
˙t
Abkürzungen:
|
R (t1 , . . . , tn )
|
¬ϕ
|
(ϕ ∧ ψ)
|
∃x ϕ
(ϕ ∨ ψ) := ¬(¬ϕ ∧ ¬ψ)
usw.,
∀x ϕ := ¬∃x ¬ϕ
13 / 97
Pränexe Normalform
ϕ(x1 , . . . , xn )
Eine Formel
ist in pränexer Normalform (PNF), wenn
ϕ = Q1 y1 . . . Qk yk ψ(x1 , . . . , xn , y1 , . . . , yk )
Qi ∈ {∃, ∀} und eine quantorenfreie Formel ψ .
0
Formel ϕ(x1 , . . . , xn ) ist zu einer Formel ϕ (x1 , . . . , xn )
für Quantoren
Lemma Jede
in pränexer Normalform äquivalent.
Beweis durch Induktion über den Formelaufbau.
I
I
I
ϕ
ist atomar: dann ist es schon in PNF, also
ϕPNF := ϕ.
¬ϕ: Sei ϕPNF = Q1 x1 . . . Qk xk ψ . Dann ist ¬ϕ äquivalent zu
(¬ϕ)PNF := Q 1 x1 . . . Q k xk ¬ψ , mit ∀ = ∃, ∃ = ∀.
(ϕ1 ∧ ϕ2 ): Sei oBdA ϕPNF
= Qi xi ψi , xi ∈
/ frei (ψ3−i ). Wähle
i
(ϕ1 ∧ ϕ2 )PNF := Q1 x2 Q2 x2 (ψ1 ∧ ψ2 ).
I
∃x ϕ:
Wähle
(∃x ϕ)PNF := ∃x (ϕPNF ).
14 / 97
Skolem'sche Normalform
Lemma Sei
f
∀x1 . . . ∀xn ∃y ϕ
eine L-Aussage,
M
eine L-Struktur und
ein neues Funktionszeichen. Äquivalent sind:
1.
M |= ∀x1 . . . ∀xn ∃y ϕ,
2. Es gibt eine Funktion
f M : Mn → M
mit
(M, f M ) |= ∀x1 . . . ∀xn .ϕ(y /f (x1 , . . . , xn )).
Bew. 2.⇒ 1.: Benutze das Ersetzungslemma,
(M,f M )
ϕ(y /f (x1 , . . . , xn ))[x1 /a1 ,...,x /a ] = ϕM
[x1 /a1 ,...,x /a ,y /f M (a1 ,...,a )] .
n
1.
⇒ 2.:
Deniere
n
n
n
a1 , . . . , an ist M |= ∃y ϕ[x1 /a1 , . . . , xn /an ].
f M (a1 , . . . , an ) durch ein für y geeignetes b ∈ M .
n
Für alle
Ein solches
f
heiÿt Skolemfunktion für
∀x1 . . . ∀xn ∃y ϕ.
15 / 97
Satz (Skolem-Normalform) Zu jeder L-Formel
ϕ(z1 , . . . , zn )
gibt es
neue Funktionszeichen f1 , . . . , fk und eine quantorenfreie Formel
ψ(y1 , . . . , ym , z1 , . . . , zn )
von
L ∪ {f1 , . . . , fk },
sodaÿ
ϕ ist erfüllbar ⇐⇒ ∀y1 . . . ∀ym ψ ist erfüllbar.
Bew: Das Lemma sagt:
∀~x ∃y ϕ0 ist erfüllbar ⇐⇒ ∀~x .ϕ0 (y /f (~x )) erfüllbar ist.
Wende das wiederholt auf
ϕPNF
∀x1 ∃y1 ∀x2 ∃y2 ψ
Beispiel:
an.
ist erfüllbar
⇐⇒
∀x1 ∀x2 ∃y2 .ψ(y1 /f (x1 ))
⇐⇒
∀x1 ∀x2 .ψ(y1 /f (x1 ))(y2 /g (x1 , x2 ))
ist erfüllbar
ist erfüllbar
16 / 97
Korollar Zu jeder
~f ∈
/L
L-Formel ϕ(z1 , . . . , zn ) gibt es Funktionszeichen
L ∪ {~f }-Formel ϕ0 (~x ,~z ), sodaÿ
und eine quantorenfreie
ϕ ist allgemeingültig ⇐⇒ ∃~x ϕ0 ist allgemeingültig.
Bew: Sei
ϕ
ϕ = ∃~x ∀y ψ .
ist allgemeingültig
⇐⇒
¬ϕ
⇐⇒
∀~x ∃y ¬ψ
⇐⇒
∀~x ¬ψ(y /f (~x ))
ist nicht erfüllbar (mit neuem
⇐⇒
¬∃~x ψ(y /f (~x ))
ist nicht erfüllbar
⇐⇒
∃~x ψ(y /f (~x ))
ist nicht erfüllbar
ist nicht erfüllbar
f)
ist allgemeingültig.
Entsprechend für längere Quantorenpräxe. Beachte, daÿ hier die
Allquantoren durch Skolemfunktionen ersetzt werden.
17 / 97
Herbrand-Modelle
L-Term t bzw. eine L-Formel ϕ ist geschlossen, wenn
frei (t ) = ∅ bzw. frei (ϕ) = ∅. Das Herbrand-Universum für L
Ein
H (L) := { t ∈ L-term | t
Eine Herbrand-Struktur für
L
ist eine
ist
ist geschlossen }.
L-Struktur
H = (H , f H , . . . , R H , . . .)
sodaÿ
H = H (L)
und
f H (t1 , . . . , tn ) := f (t1 , . . . , tn )
für alle
n-stelligen
Funktionszeichen
Ein Herbrand-Modell der
die alle Aussagen von
T
f
L-Theorie T
von
L
und
t1 , . . . , tn ∈ H .
ist eine Herbrandstruktur
erfüllt, d.h. mit
H,
H |= T .
18 / 97
Satz Sei
ϕ
eine
L-Aussage
Beweis: OBdA enthalte
in
ϕ
⇒:
A |= ϕ.
ϕ
L nur die
c . Dann
und eine Konstante
Sei
=
˙
ohne
ist erfüllbar genau dann, wenn
Interpretiere
in Skolem'scher Normalform.
ϕ
ein Herbrand-Modell hat.
Funktions- und Relationszeichen
ist
H 6= ∅.
n-stellige
Relationszeichen
R
durch
R H := { (t1 , . . . , tn ) ∈ H n | A |= R (t1 , . . . , tn ) }.
Beh: Ist
ψ
eine
L-Aussage
in Skolem'scher Normalform, so gilt
A |= ψ
⇒
H |= ψ.
Für atomare Aussagen ist nach Def. von
RH
sogar
A |= R (t1 , . . . , tn ) ⇐⇒ H |= R (t1 , . . . , tn );
das überträgt sich mit Induktion auf alle quantorenfreien Aussagen.
19 / 97
ψ = ∀x ψ 0 und A |= ψ . Dann gilt A |= ψ 0 [x /a] für jedes
a ∈ A. Für jedes a = [[t ]]A mit t ∈ H ist 1 = [[ψ 0 ]][x /a] = [[ψ 0 (x /t )]].
Sei nun
Nach Induktion wissen wir
A |= ψ 0 (x /t )
also
H |= ψ 0 (x /t )
und
H |= ψ 0 (x /t ),
⇒
H |= ψ 0 [x /t ].
Das ist für alle
t∈H
so, also
H |= ∀x ψ 0 .
⇐:
Sei
H
ein Herbrand-Modell von
ϕ.
Dann wird
ϕ
von
H
erfüllt.
20 / 97
ψ = ∀x ψ 0 und A |= ψ . Dann gilt A |= ψ 0 [x /a] für jedes
a ∈ A. Für jedes a = [[t ]]A mit t ∈ H ist 1 = [[ψ 0 ]][x /a] = [[ψ 0 (x /t )]].
Sei nun
Nach Induktion wissen wir
A |= ψ 0 (x /t )
also
H |= ψ 0 (x /t )
und
H |= ψ 0 (x /t ),
⇒
H |= ψ 0 [x /t ].
Das ist für alle
t∈H
so, also
H |= ∀x ψ 0 .
⇐:
Sei
H
H
erfüllt.
H einfach H/=˙ A
[t ] := { s ∈ H | A |= s =
˙ t } mit
nimmt,
ein Herbrand-Modell von
Bem. Enthält
L
die Gleichheit
A |= s =
˙t
=
˙,
ϕ.
Dann wird
so ist für
⇐ 6⇒
P ([t ], . . .) : ⇐⇒ A |= P (t , . . .)
s, t ∈ H
von
nur
H |= s =
˙ t.
Der Satz gilt dann auch, wenn man statt
also die Äquivalenzklassen
ϕ
und
f ([t ], . . .) := [f (t , . . .)].
20 / 97
Macht man dasselbe für eine abzählbare Menge von Aussagen, so
erhält man:
Satz (Löwenheim und Skolem) Sei
T
eine
L-Theorie
in einem
L
mit
höchstens abzählbarem Vokabular. Dann gilt:
T hat ein Modell
⇐⇒ T
hat ein höchstens abzählbares Modell
H
21 / 97
Macht man dasselbe für eine abzählbare Menge von Aussagen, so
erhält man:
Satz (Löwenheim und Skolem) Sei
T
eine
L-Theorie
in einem
L
mit
höchstens abzählbarem Vokabular. Dann gilt:
T hat ein Modell
Bew.:
⇒:
Sei
⇐⇒ T
ϕSNF
hat ein höchstens abzählbares Modell
eine Skolem-Normalform von
H
ϕ,
T SNF := { ϕSNF | ϕ ∈ T }.
T SNF ist erfüllbar gdw. T SNF hat ein
SNF abzählbar ist, ist es auch H.
Herbrand-Modell H. Da T
0
Weglassen der Skolemfunktionen liefert ein abzählbares H |= T .
T
ist erfüllbar gdw.
21 / 97
Macht man dasselbe für eine abzählbare Menge von Aussagen, so
erhält man:
Satz (Löwenheim und Skolem) Sei
T
eine
L-Theorie
in einem
L
mit
höchstens abzählbarem Vokabular. Dann gilt:
T hat ein Modell
Bew.:
⇒:
Sei
⇐⇒ T
ϕSNF
hat ein höchstens abzählbares Modell
eine Skolem-Normalform von
H
ϕ,
T SNF := { ϕSNF | ϕ ∈ T }.
T SNF ist erfüllbar gdw. T SNF hat ein
SNF abzählbar ist, ist es auch H.
Herbrand-Modell H. Da T
0
Weglassen der Skolemfunktionen liefert ein abzählbares H |= T .
T
ist erfüllbar gdw.
Bem.: (Skolem'sches Paradox) Auch die übliche Mengenlehre ist ein
solches
T.
Sie hat also ein abzählbares Modell obwohl sie über
überabzählbare Mengen wie
R
spricht.
21 / 97
Vollständigkeitssatz
Def. Die Herbrand-Expansion der
L-Formel ϕ(x1 , . . . , xn )
ist
E (ϕ) := { ϕ(x1 /t1 , . . . , xn /tn ) | t1 , . . . , tn ∈ H }.
∀x1 . . . ∀xn ϕ in
erfüllbar, wenn E (ϕ)
Satz (Gödel,Herbrand,Skolem) Eine Aussage
Skolem'scher Normalform ist genau dann
(aussagenlogisch) erfüllbar ist.
Bew. OBdA sei
ϕ
ohne
=
˙.
Für jede Herbrand-Struktur
H
gilt:
H |= ∀x1 . . . xn .ϕ
⇐⇒
für alle
t1 , . . . , tn ∈ H : H |= ϕ[x1 /t1 , . . .]
⇐⇒
für alle
t1 , . . . , tn ∈ H : H |= ϕ(x1 /t1 , . . .)
⇐⇒
H |= E (ϕ).
22 / 97
Endlichkeitssatz der Aussagenlogik: Eine Menge
T
von Formeln der
Aussagenlogik ist genau dann erfüllbar, wenn jede endliche
Teilmenge von
Beweis
⇒
T
erfüllbar ist.
⇐ sei A1 , A2 , . . . eine
Varn := {A1 , . . . , An }, und
ist oenbar. Für
Aussagevariablen,
Aufzählung aller
Tn := { ϕ ∈ T | Var (ϕ) ⊆ Varn }.
Zu
n
gibt es nur 2
n
g : Varn → B, also nur k ≤ 22
[[·]] : (Varn → B) → B
n
Belegungen
Wertverläufe (Wahrheitstafeln)
A1 · · · An
g1
[[·]]
v1
g2
v2
.
.
.
n
En := {ϕ1 , . . . , ϕk } ⊆ Tn ,
ϕi ∈ En äquivalent.
Also gibt es
einem aus
.
.
.
n
und
jedes ϕ ∈ Tn
ist zu
23 / 97
n ein hn : Varn → B, das En
Tn erfüllt. Deniere daraus eine Belegung g , die T
erfüllt. Ist g (Ak ) für 1 ≤ k < j + 1 schon deniert, so sei

 1, falls es ∞ viele i mit hi (Aj +1 ) = 1 und
hi =j g (dh. h |Var = g |Var ) gibt,
g (Ak +1 ) :=

0, sonst.
S
Beh.: g erfüllt jedes ϕ(A1 , . . . , Am ) ∈ T =
n∈N Tn .
Nach Voraussetzung gibt es zu jedem
und damit ganz
j
j
24 / 97
Beh.:
g
ϕ(A1 , . . . , Am ) ∈ T =
erfüllt jedes
Bew.: Jedes
hn
mit
n≥m
k <m
Tn ⊇ Tm , also
hn mit h =m g gibt.
auch das
ϕ ∈ Tm .
Angenommen, für
gelte schon
hi =k g
Fall 1:
n∈N Tn .
erfüllt
Bleibt zu zeigen, daÿ es ein
ein
S
g (Ak +1 ) = 1.
für
∞
viele
Dann gilt (∗) für
i ∈ N.
k +1
nach Def. von
(∗)
g.
g (Ak +1 ) = 0. Dann gibt es nur endlich viele i mit hi =k g
und hi (Ak +1 ) = 0. Alle anderen hi mit hi =k g haben
h(Ak +1 ) = 0, also hi =k +1 g . Nach (∗) gib es ∞ viele davon.
Fall 2:
25 / 97
Satz (Herbrand 1932) Eine Aussage
∀x1 . . . ∀xn .ϕ in Skolem'schre
E (ϕ) eine
Normalform ist unerfüllbar genau dann, wenn
unerfüllbare
endliche
Teilmenge hat.
Vollständigkeitssatz (abstrakt) der Prädikatenlogik (Gödel 1930)
Die Menge der allgemeingültigen Aussagen der Prädikatenlogik ist
V : L-Aussagen →
˙ B,
Berechnung von V (ϕ)
semi-entscheidbar: es gibt ein Verfahren
sodaÿ für jede
L-Aussage ϕ
die
I in endlich vielen Schritten 1 ergibt, falls
ϕ
allgemeingültig ist,
I in endlich vielen Schritten 0 ergibt oder nicht endet, sonst.
V
kann also von allgemeingültigen
nicht von beliebigen
ϕ, ob
ϕ
erkennen,
daÿ
sie es sind, aber
sie es sind.
26 / 97
Vollständigkeitssatz (konkret) der Prädikatenlogik (Gödel 1930):
Für bestimmte Beweiskalküle
Aussagen
ϕ:
Wenn
ϕ
aus
T
T |= ϕ
`
gilt für erststuge Theorien
folgt, so ist
=⇒
ϕ
aus
T
T
und
beweisbar ,
T ` ϕ.
27 / 97
Beweis-Kalkül für die Prädikatenlogik
Wir erlauben in den Sequenzen
endliche Mengen
Γ
=
˙
s, t
und
∆
von
Γ . ∆ des Gentzenkalküls jetzt
prädikatenlogischen Formeln.
Als Axiome für
nimmt man folgende Sequenzen: für jede Formel
ϕ,
und Variable
alle Terme
x:
Γ . ∆, t =
˙t
(=
˙ 1)
Γ, s =
˙ t , ϕ(x /s ) . ∆, ϕ(x /t ) (=
˙ 2)
Γ, s =
˙ t , ϕ(x /t ) . ∆, ϕ(x /s ) (=
˙ 3 ).
Zum Beispiel bekommt man damit die Transitivität von
(ϕ := r =
˙ x)
s=
˙ t, r =
˙ s . r=
˙t
=
˙
durch
(=
˙ 2)
28 / 97
Für die Quantoren kommen folgende Regeln hinzu:
Γ, ϕ(x /t ) . ∆
(∀L)
Γ, ∀x ϕ . ∆
Γ . ∆, ϕ
(∀R ),
Γ . ∆, ∀x ϕ
falls
Γ, ϕ . ∆
(∃L),
Γ, ∃x ϕ . ∆
falls
x∈
/ frei (Γ, ∆)
Γ . ∆, ϕ(x /t )
(∃R )
Γ . ∆, ∃x ϕ
x∈
/ frei (Γ, ∆)
Auÿerdem nimmt man noch die sogenannte
Γ1 . ∆1 , ϕ
ϕ, Γ2 . ∆2
Γ1 , Γ2 . ∆1 , ∆2
Schnittregel
hinzu:
(Cut ).
Bem.: Man kann zeigen, daÿ man diese Regel nicht braucht.
29 / 97
Lemma
(Korrektheit) Jede im Gentzenkalkül beweisbare Sequenz ist
allgemeingültig.
Bew. Man zeigt die Allgemeingültigkeit der Axiome und die
Korrektheit der Regeln, d.h. daÿ bei jeder Interpretation und
Belegung, die die Obersequenz(en) erfüllt, auch die Untersequenz
erfüllt ist. Die Behauptung folgt dann durch Induktion über die
Beweistiefe.
Beispiel Alle (einstelligen) Funktionen gelten in der PL als total:
. f (x )=
˙ f (x )
(=1 )
. ∃z (z =
˙ f (x ))
(∃R )
. ∀x ∃z (z =
˙ f (x ))
Im zweiten Schritt benutze
(∀R x !)
ϕ(f (x )/z ) := (z =
˙ f (x ))(z /f (x )).
30 / 97
Die Quantorenregeln legen Rezepte zur Konstruktion von
Beweisen nahe. Der Spezialfall der Regel
Γ . ∆, ϕ
Γ . ∆, ∀x ϕ
(∀R ),
falls
x∈
/ frei (Γ, ∆)
∀x ϕ aus den Annahmen Γ zu beweisen,
genügt es, aus Γ die Aussage ϕ für ein beliebiges Objekt x zu
zeigen ( beliebig heiÿt also: über x wird nichts vorausgesetzt.)
mit leerem
∆
besagt: um
Bem. Umbenennbarkeit gebundener Variablen: ist
y∈
/ frei (ϕ),
so ist
. ∀x ϕ ↔ ∀y ϕ(x /y )
Hier ist ein Beweis für einen Teil, der andere geht analog:
ϕ(x /y ) . ϕ(x /y )
∀x ϕ . ϕ(x /y )
(∀ L)
∀x ϕ . ∀y ϕ(x /y )
(∀R , y !)
. ∀x ϕ → ∀y ϕ(x /y )
(→ R )
31 / 97
Beispiel Die Aussage
∃y ∀xR (x , y ) → ∀x ∃yR (x , y )
ist
allgemeingültig (die umgekehrte aber nicht!). Ein Beweis ist:
R (x , y ) . R (x , y )
∀x R (x , y ) . R (x , y )
(∀L)
∀x R (x , y ) . ∃y R (x , y )
(∃R )
∀x R (x , y ) . ∀x ∃y R (x , y )
(∀R , x !)
∃y ∀x R (x , y ) . ∀x ∃y R (x , y )
. ∃y ∀x R (x , y ) → ∀x ∃y R (x , y )
(∃L, y !)
(→ R )
Satz (Vollständigkeit des Gentzenkalküls) Jede allgemeingültige
Sequenz
Γ.∆
ist mit den Kalkülregeln beweisbar.
32 / 97
Verallgemeinerte Quantoren
In der Umgangssprache gibt es neben den Quantoren
mindestens ein (bzw.
Quantoren, z.B.
für alle und
jedes und
für einige ) noch weitere
Singular
Plural
2-stellig
ein
einige
genauso viele wie
jedes
alle
jedes dritte
drei
mindestens drei
viele
wenige
mehr als
weniger als
n-mal
so viele wie
die meisten
die wenigsten
ein Drittel aller
33 / 97
I Manche dieser Quantoren haben nur bei endlichen
Objektbereichen einen klaren Sinn: z.B.
höchstens ein Drittel der komplexen Zahlen
' ??
I Manche dieser Quantoren kann man mit Mitteln der
Prädikatenlogik umschreiben, z.B.
für mindestens drei
' ∃x ∃y ∃z (x 6= y ∧ x 6= z ∧ y 6= z ∧ . . .)
I Manche dieser Quantoren kann man auch dann nicht in der
Prädikatenlogik umschreiben, wenn man nur Interpretationen
durch endliche Strukturen zuläÿt.
für viele
...
' ???
34 / 97
Was ist die Bedeutung solcher Quantoren?
I Ein Quantor drückt etwas über die Quantität , d.h. Gröÿe
im Sinne von Anzahl von etwas, aus.
I Es geht um die Anzahl von Individuen, also um die Gröÿe von
Individuenmengen.
I Also: ein Quantor sollte etwas über die
Individuenmengen
für
viele
für alle
für
für
einige
die meisten
A
Mächtigkeit |A|
von
besagen.
x
gilt
P
' |{ x | P (x ) }|
ist
x
gilt
P
' |{ x | P (x ) }|
ist
groÿ
maximal , besser
:
' |{ x | ¬P (x ) }| = 0
x
gilt
P
' |{ x | P (x ) }| > 0
x
gilt
P
' |{ x | P (x ) }| > |{ x | ¬P (x ) }|
35 / 97
Das legt nahe:
Die Bedeutung eines (einstelligen) (Individuen-) Quantors
ist eine Eigenschaft von (Individuen-) Mengen.
Ein Quantor
Q
vom Typ
h1i
wird auf dem Universum
Eigenschaft von Teilmengen von
U
U
durch eine
interpretiert:
[[Q ]] ⊆ P(U ).
Beispiele:
[[alle ]]
=
{ A | | A| = 0 }
[[einige ]]
=
{ A | | A| > 0 }
[[die meisten]]
=
{ A | | A| > | A| }
[[Qx ϕ]] = 1
⇐⇒
{ a | [[ϕ]][x /a] = 1 } ∈ [[Q ]]
36 / 97
Determinatoren als Quantoren vom Typ h1, 1i
Die natürliche Sprache hat kaum
unbeschränkte Quantoren,
sondern quantiziert fast nur über beschränkte Teilbereiche:
unbeschränkt
für alle gilt
∀x .P (x )
für einige gilt
∃x P (x )
beschränkt
P
P
N gilt P
∀x ∈ N .P (x )
für einige N gilt P
∃x ∈ N .P (x )
Umschreibung
für alle
∀x (N (x ) → P (x ))
∃x (N (x ) ∧ P (x ))
Nicht jeden beschränkten Quantor kann man mit unbeschränkten
Quantoren umschreiben:
für die meisten
N
gilt
P
=
=
6=
Most x ∈ N .P (x )
|N ∩ P | > |N ∩ P |
Most x (N (x ) → P (x ))
o.ä.
37 / 97
Es ist daher besser,
beschränkte Quantoren
zu erlauben:
Quantor(Restriktion,Eigenschaft)
=
Ein Quantor
Q
Q (N , P ) = Qx (N (x ), P (x ))
vom Typ
h1, 1i
wird auf dem Universum
eine Relation zwischen Teilmengen von
U
U
durch
interpretiert:
[[Q ]] ⊆ P(U ) × P(U ).
Beispiele:
[[alle ]]
=
{ ( A, B ) | | A ∩ B | = 0 }
[[einige ]]
=
{ (A, B ) | |A ∩ B | > 0 }
[[die meisten]]
=
{ (A, B ) | |A ∩ B | > |A ∩ B | }
[[Qx (ϕ, ψ)]] = 1
⇐⇒
([[ϕ]], [[ψ]]) ∈ [[Q ]],
wobei
[[ϕ]] := { a | [[ϕ]][x /a] = 1 }.
38 / 97
Für jede Beschränkung
[[die
meisten N]]
N
erhält man eine Eigenschaft von Mengen:
= { B | |N ∩ B | > |N ∩ B | }
= { B | (N , B ) ∈ [[die
Allgemein: aus jedem Quantor
A⊆U
Q
erhält man einen Quantor
vom Typ
QA
vom
meisten]] }
h1, 1i und einem
Typ h1i durch
Bereich
[[Q ]]A := { B | (A, B ) ∈ [[Q ]] }.
Man kann einen Quantor vom Typ
h1, 1i
auch als eine Funktion
Q : P(U ) → P(U ) → B
Q (A)(B ) := Q (A, B ) setzt. Eine mit der
Syntaxregel S → NP VP aufgebaute Aussage wird dann durch die
Funktionsanwendung [[S ]] = [[NP]]([[VP]]) interpretiert:
betrachten, indem man
[[(viele Aen) brüllen]] = [[viele Aen]]([[br üllen]]) = Q (A) (B ).
39 / 97
Quantoren und Negation
In der natürlichen Sprache kann man Quantoren
negieren :
nicht einer = keiner; nicht viele = wenige;
nicht alle = einige nicht;
Jedes
Q
vom Typ
h1, 1i
hat eine äuÿere und eine innere Negation:
(¬Q )(A, B ) : ⇐⇒ ¬ Q (A, B ),
Der zu Q duale Quantor vom Typ
(Q ¬)(A, B ) : ⇐⇒ Q (A, B ).
h1 , 1 i
ist
Q d := ¬(Q ¬).
Beispiel:
((nicht viele) Fische) iegen
viele Fische iegen nicht
Beispiel:
∀
und
∃
=
nicht ((viele Fische) iegen)
=
nicht (viele(Fische,iegen))
=
(viele Fische) (iegen nicht)
=
viele(Fische,nicht-iegen)
sind zu einander dual:
∃x ∈ N ϕ ≡ ¬∀x ∈ N ¬ϕ,
∀x ∈ N ϕ ≡ ¬∃x ∈ N ¬ϕ.
40 / 97
n-stelliger Quantor Q vom Typ h1, . . . , 1i wird auf dem
n
Universum U durch eine n -stellige Mengen-Relation [[Q ]] ⊆ P(U )
Ein
interpretiert. Dem entspricht eine Formel der Gestalt
Qx (ϕ1 , . . . , ϕn ).
OBdA sei das letzte Argumente das
dann ist
Q (A1 ) . . . (An−1 )
Prädikat von Individuen;
die Bedeutung einer quantizierten NP.
Quantizierte NP als Subjekt:
[[(mehr A
B)
sind
P ]] = { (A, B , P ) | |A ∩ P | > |B ∩ P | }
viele
A
wie
B
sind
P ]] = { (A, B , P ) | |A ∩ P | = |B ∩ P | }
so viele
A
wie
B
sind
P ]] = { (A, B , P ) | |A ∩ P | = 3|B ∩ P | }
[[genauso
[[3-mal
als
Quantizierte NP als Objekt:
[[Fritz
kennt (mehr
A
als
B )]] = { (A, B , P ) | |A ∩ P | > |B ∩ P | }
mit
P (x ) =
Fritz kennt
x
41 / 97
Ein Quantor vom Typ
hm1 , . . . , mn i
wird auf
U
durch eine Relation
[[Q ]] ⊆ P(U m1 ) × . . . × P(U m )
n
zwischen (Individuen-)Relationen interpretiert.
Beispiel:
I
h2, 2i-Quantoren Q (R , P ) ' Q (x , y )(R (x , y ), P (x , y )), mit
Relationsnomen R als Restriktion und Relationsnomen oder
symmetrischem Verb P als Prädikat:
Alle|Einige|Viele Brüder sind Zwillinge = Q (B , Z )
I
h1, 2i-Quantoren Q (R , P ) ' Q (x , y )(R (x ) ∧ R (y ), P (x , y ))
mit Nomen als Restriktion und Relationsnomen oder
symmetrischem Verb als Prädikat
Alle Menschen werden Brüder.
Einige Studenten kennen einander.
Q (R )
Q : P(U ) → P(U m ) → B.
Beachte: selbst bei einstelligem Nomen ist die Subjekt-NP
ambig, je nach dem
m ∈ {1, 2}
bei
42 / 97
Eigenschaften von Quantoren
Nicht
jede
Relation
Q ⊆ P(U m1 ) × . . . × P(U m )
n
entspricht einem
Quantor. Was sind logische Eigenschaften von
Ein Quantor
Q
vom Typ
I Monotonie im
k -ten
hm1 , . . . , mn i
Quantoren ?
sollte u.a. erfüllen:
Argument: für alle
Ai ⊆ U m , Ak ⊆ A0k :
i
Q (A1 , . . . , Ak , . . . , An ) ⇒ Q (A1 , . . . , A0k , . . . , An ).
I Invarianz unter Isomorphie: Für jede Bijektion
f :U→U
ist
Q (R1 , . . . , Rn ) ⇐⇒ Q (f (R1 ), . . . , f (Rn ))
I Erweiterbarkeit des Universums: für alle
Q (A1 , . . . , An )
in
Ai ⊆ U m , U ⊆ U 0
U ⇐⇒ Q (A1 , . . . , An )
i
in
U 0.
Literatur: Stanley Peters, Dag Westerstål: Quantiers in Language
and Logic. Clarendon Press, Oxford 2006
43 / 97
Die Anwendung eines Prädikats auf Nominalphrasen im Plural hat
in natürlichen Sprachen verschiedene Lesarten, darunter:
I die distributive Lesart:
I
I
alle Menschen sind sterblich =
Karl und Emil träumen =
I die kollektive Lesart:
jeder Mensch ist sterblich
Karl träumt und Emil träumt
6=
I
Karl und Emil tragen das Klavier
und Emil trägt das Klavier.
Kart trägt das Klavier
I
die 22 Männer bildeten zwei Fuÿballmanschaften
der 22 Männer bildete zwei Fuÿballmannschaften
6=
jeder
I die reziproke/paarweise Lesart:
I
Karl und Emil sind Freunde = (Karl ist Freund von Emil)
und (Emil ist Freund von Karl) .
I
die meisten Geraden schneiden einander = für die meisten
0
Paare ( ,
) von Geraden gilt: und 0 schneiden einander
g g
g
g
Welche Lesart angebracht ist, hängt vom Prädikat ab: drückt es
eine Eigenschaft von Indiviuen, Gruppen oder Individuenpaaren aus?
44 / 97
Wie betrachten hauptsächlich die distributive Lesart:
Q pl x ϕ := { a ∈ U | [[ϕ]][x /a] = 1 } ∈ [[Q ]] ⊆ P(U )
oder für relativierte Quantoren:
Q pl x (ϕ, ψ) := ([[ϕ]], [[ψ]]) ∈ [[Q ]] ⊆ P(U ) × P(U )
Die paarweise (distributive) Lesart bindet zwei Variablen:
Q pl (x , y ) (ϕ, ψ) := ([[ϕ]], [[ψ]]) ∈ [[Q ]] ⊆ P(U × U ) × P(U × U )
ψ(x , y ). Die
Restriktion ϕ kann eine zweistellige Relation ϕ(x , y ) sein die
meisten Freunde , oder aus einem einstelligen ϕ(x ) durch
ϕ(x ) ∧ ϕ(y ) gebildet werden die meisten Geraden .
und hat mindestens ein zweistelliges Prädikat
Bem.: Die kollektive Lesart erfordert Formeln mit Mengenvariablen.
45 / 97
Prädikatenlogische Sprache L(Q )
L
L(Q )
Sei
eine erstuge prädikatenlogische Sprache. Die Erweiterung
von
I als
I als
L
um den Quantor
Q
vom Typ
hm1 , . . . mn i
hat
L(Q )-Terme die L-Terme,
L(Q )-Formeln:
1. die atomaren
L-Formeln,
ϕ und ψ und Variable x auch ¬ϕ, (ϕ ∧ ψ), ∃x ϕ,
Variablen ~
xi = x1 , . . . , xm und Formeln ϕ1 , . . . , ϕn auch
2. mit Formeln
3. mit
i
Q (~x1 , . . . , ~xn )(ϕ1 , . . . , ϕm ).
n
(Falls
m1 = . . . = mn = k , einfach Q (x1 , . . . , xk )(ϕ1 , . . . , ϕn ).)
L(Q )-Struktur ist eine L-Struktur A = (U , Q A , R A , . . .)
A ⊆ P(U n1 ) × . . . × P(U m ). Man deniert
einer Relation Q
Eine
mit
n
A,h
A,h
A
[[Q (~x1 , . . .)(ϕ1 , . . .)]]A
g = 1 : ⇐⇒ (ϕ1 , . . . , ϕn ) ∈ Q
für
h
A
ϕA,
i := {~ai | [[ϕi ]]h[~x /~a ] }
i
i
für
i = 1, . . . , n .
46 / 97
λ-Terme
λ-Terme
sind eine Schreibweise für Funktionen und Daten:
s , t :=
|
|
|
x
c
(t · s )
λx t
Variable
Konstante
Anwendung von
t
auf
s
Funktionsabstraktion von
t
bzgl.
x
Anwendung (t · s ) sind Funktion und Argument
gleichrangig, man kann bei beiden eine Variable haben anders als
Beachte: bei der
bei
f (s )
in Prolog und in der Prädikatenlogik.
Bei jeder Interpretation
D = (D , ·D , c D , . . .)
sollte u.a. gelten:
(λx t · s )D = (λx t )D ·D s D = t D [x /s D ] = (t [x /s ])D .
Das will man durch
mit
sD = tD
Termvereinfachung, s → t ,
D.
ausrechnen können,
bei allen Interpretationen
47 / 97
Termvereinfachung s → t
r →t
(=1 )
(r · s ) → (t · s )
s→u
(=2 )
(r · s ) → (r · u )
y∈
/ frei (t )
(α)
λx t → λy t [x /y ]
(λx t · s ) → t [x /s ]
(β)
r →s
(=3 )
λx r → λx s
x∈
/ frei (t )
(η)
λx (t · x ) → t
Weitere Regeln legen den Umgang mit Konstanten
(add · 0) · y → y ,
gebundene Variablen in
Mit
s →∗ t
fest, z.B.
(add · ((add · x ) · z )) · y → (add · x ) · (add · z · y )
Die syntaktische Einsetzung
y ∈ frei (s )
c
t
t [x /s ]
ist so zu denieren, daÿ
umbenannt werden, damit kein
in den Wirkungsbereich eines
ist gemeint, daÿ man von
gebundener Umbenennung) zu
t
s
λy
von
t
gerät.
mit diesen Regeln (und
kommen kann.
48 / 97
Syntaktische Einsetzung t [x /s ]
Die
frei
in einem
λ-Term
frei (y ) := {y },
frei (c ) := ∅,
vorkommenden Variablen sind:
frei ((s · t )) := frei (s ) ∪ frei (t ),
frei (λx t ) := frei (t ) \ {x }.
Ersetzung (der freien Vorkommen) von x in t durch s ,
t [x /s ], deniert man induktiv über den Aufbau von t :
(
s , falls y ≡ x ,
y [x /s ] :=
y , falls y 6≡ x
Die
kurz:
c [x /s ] := c
(r · t )[x /s ] := (r [x /s ] · t [x /s ])


λy t ,
λy t [x /s ] :=
λy (t [x /s ]),


λz (t [y /z ][x /s ]),
falls
y ≡ x,
sonst, falls
sonst, mit
y∈
/ frei (s ),
z∈
/ frei (λy t · s )
49 / 97
Beispiele für t [x /s ]
λx (y · x )[x / λz (c · z )]
| {z }
| {z }
t
s
λx (y · x )[y /λz (c · z )]
=
λx (y · x ) t [x /s ] = t ,
=
λx (λz (c · z ) · x )
λx (y · x )[y /λz (x · z )]
=
λz ((y · x )[x /z ][y /λz (x · z )])
=
λz ((y · z )[y /λz (x · z )])
=
λz (λz (x · z ) · z )
=α
λu (λz (x · z ) · u )
→∗
λu (λz (x · z ) · u )
λy λx (y · x ) · λz (x · z )
da
da
x∈
/ frei (t )
x∈
/ frei (s )
50 / 97
Die
β -Redexe
eines Terms sind die Teilterme, auf die die
β -Regel
angewendet werden kann.
Durch Anwenden der Reduktionsregeln können neue Redexe
entstehen: in
s
=
λx ((x · y ) · (x · y )) · λv v
→β ((x · y ) · (x · y ))[x /λv v ]
=
((λv v · y ) · (λv v · y )) =: t
→β (y · (λv v · y )),
→β (y · y ),
enthält der Ausgangsterm
s einen β -Redex und
t zwei β -Redexe.
der durch die
Reduktion entstandene Term
51 / 97
Die
Vereinfachung kann sogar divergieren!
Beispiel Für t := λx ((x · x ) · (x · x )) ist
(t · t )
=
(λx ((x · x ) · (x · x )) · t )
→β ((x · x ) · (x · x ))[x /t ]
=
((t · t ) · (t · t ))
→β (((t · t ) · (t · t )) · (t · t )) →β . . .
Eine uneingeschränkte Anwendungsoperation
tisch, wenn man Terme zu irreduziblen
·
ist also problema-
Werten vereinfachen will.
D = (D , ·D , c D , . . .) zu
d ∈ D in d ·D d links als eine
Es ist auch schwierig, eine Interpretation
nden, bei der man jedes Objekt
Funktion interpretieren kann, die auf sich selbst
angewendet wird .
52 / 97
Getypte λ-Terme
Einfacher ist es, wenn man Objekte und Terme verschiedener Typen
σ, τ := α | bool | int | (σ → τ )
typkorrekte Anwendungen (t · s ) benutzt, wo t
von einem Funktionstyp (σ → τ ) und s vom Argumenttyp σ ist.
vorsieht und nur
Ein Typkontext
für Variable
Γ`t:τ
x.
Γ
ist eine Liste von Annahmen
Ein Term
t
hat im Kontext
Γ
x :τ
von Typen
den Typ
τ,
τ
wenn
nach folgenden Regeln herleitbar ist:
x : σ, Γ ` x : σ
(Var )
x≡
6 y, Γ ` x : σ
(Var )
y : τ, Γ ` x : σ
Γ ` t : σ → τ, Γ ` s : σ
(App )
Γ ` (t · s ) : τ
x : ρ, Γ ` t : τ
(Abs )
Γ ` λx t : (ρ → τ )
Der Kontext enthalte auch für Konstante (nur) einen Typ:
c : σ, Γ ` c : σ
(Const ).
53 / 97
Manche Terme haben im selben Kontext viele Typen, z.B.
x : int ` x : int
` λx .x : (int → int)
(Abs )
x :σ`x :σ
` λx .x : (σ → σ)
Andere Terme haben keinen Typ, z.B. die
x : α → β ` x : α → β,
x :α`x :α
x : α ` (x · x ) : β
(Abs )
Selbstanwendung :
(∗App ) α =?(α → β)
(App )
` λx (x · x ) : (α → β)
allgemeinste Typisierung für t suchen, indem man
unbekannte Typen für freie Variable annimmt und die nötigen
Man kann eine
Typgleichungen durch Unikation von Typen löst:
f : α, x : β ` f : α
f : α, x : β ` x : β
f : α, x : β ` (f · x ) : γ
(App , α = (β → γ))
54 / 97
Einfachheitshalber notiert man die Typen als oberen Index, wie in
(f β→γ · x β )γ ,
λx α→β λy (α→β)→α (x · (y · x )α )β .
Beachte: Nach (Abs) haben im Term
von
x
in
t
denselben Typ
σ.
λx σ t
alle freien Vorkommen
Insbesondere gilt:
Γ ` (λxt · s ) : τ
=⇒
Γ ` t [x /s ] : τ.
Man kann zeigen:
Γ`t:τ
Γ ` s : τ.
1. Typerhaltung Ist
von
t,
so ist
und
t →∗ s
eine
Vereinfachung
Γ ` t : τ , so terminiert jede
Reduktionsfolge t →
→ t 00 → . . . (bis auf α-Reduktionen)
derselben Normalform nf (t ).
2. Starke Normalisierung: Ist
t0
in
55 / 97
Interpretation der getypten λ-Terme
Für getypte Terme ist es einfach, Interpretationen anzugeben.
Sei
Typ
die Menge der variablenfreien Typen und
λ-Terme
mit Konstanten
c : τc
mit
τc ∈ Typ.
L
die Sprache der
Eine (volle)
Typstruktur
D = (hDσ iσ∈Typ , c D , . . .)
besteht aus einer Familie von Universen
daÿ für alle Typen
I
σ, τ
und Konstanten
D(σ→τ ) = { f | f : Dσ → Dτ }
Dσ und Elementen c D ,
c : τ gilt:
ist der Bereich aller
(mengentheoretischen) totalen Funktionen von
I
c :τ
so
D
wird durch ein Element c
∈ Dτ
Dσ
nach
Dτ ,
interpretiert.
Beachte: auch wenn die Basistypen durch endliche Bereiche wie
Dbool = {0, 1}
interpretiert werden, ist
D
doch immer unendlich.
56 / 97
e der Typ der Individuen und t (= bool) der Typ der
Wahrheitswerte . Dann kann man logische Formeln als spezielle
Sei
λ-Terme
vom Typ
t
ansehen:
I Junktoren können wir als (getypte) Konstante verstehen:
(ϕ ⇒ ψ) := ((⇒t →(t →t ) · ϕ) · ψ)
I Quantoren können wir als (getypte) Konstante verstehen:
∀x ϕ := (∀(e →t )→t · λx e ϕ).
I (zweistellige) Prädikate und Funktionen sind Konstante
P : e → (e → t )
und
f : e → (e → e ).
Man kann auch Quantoren über Objekte eines Typs
σ 6= e
zulassen:
∀x σ ϕ := (∀(σ→t )→t · λx σ ϕ).
57 / 97
Mit
λ-Termen
können wir die Bedeutung von quantizierten
Nominalphrasen und verallgemeinerten Quantoren ausdrücken.
Eigennamen sind Konstante
c : e.
Peter
7→ c : e
Quantizierte Nominalphrasen haben einen komplexen Typ:
(alle N ) 7→ λP e →t [∀x e ((N · x ) ⇒ (P · x ))t ]t : (e → t ) → t
Verallgemeinerte Quantoren vom Typ
Typ
h1 , 1 i
sind Konstanten vom
(e → t ) → ((e → t ) → t )
alle
7→ λN e →t λP e →t ∀x e ((N · x ) ⇒ (P · x ))t
58 / 97
Wir interpretieren getypte
λ-Terme
D = (hDσ iσ∈Typ , c D , . . .)
mit
in einer vollen Typstruktur
D :=
[
{ Dσ | σ ∈ Typ }.
λ-Term t (x σ , . . .)τ sei eine Typisierung Γ ` t : τ von t ,
deren Annahmen x : σ an den freien Vorkommen von x in t stehen.
σ
Eine Γ respektierende Belegung g : Var → D belegt x aus Γ mit
D
σ
σ
τ
einem Element g (x ) ∈ Dσ . Der Wert [[t (x , . . .) ]]g ∈ Dτ sei dann:
Ein getypter
[[(t σ→τ
σ
[[x σ ]]D
g := g (x ) ∈ Dσ ,
Dσ
[[c σ ]]D
g := c ∈ Dσ ,
σ→τ D D
σ→τ D
· s σ )τ ]]D
]]g · [[s σ ]]D
]]g ([[s σ ]]D
g := [[t
g := [[t
g ),
[[λx σ t τ ]]D
g :=
Die Anwendung
(f ·D a)
das
f : Dσ → Dτ
mit
f (a) = [[t τ ]]D
g [x σ /a]
ist die übliche Funktionsanwendung
f (a )
!
59 / 97
Jeder Termvereinfachungsschritt nach den Regeln des
eine in
D
Prop. Ist
λ-Kalküls
ist
allgemeingültige Gleichung:
t → s,
Bew: Für die
so ist für jede Belegung
g
(β)-Regel (λxt · s ) → t [x /s ]
über
D
D: [[t ]]D
g = [[s ]]g .
sieht man das mit
σ D
σ D
[[(λx σ t · s )τ ]]D
g := [[λx t ]]g ([[s ]]g )
=
[[t ]]D
g [x σ /[[s σ ]]D ]
=
[[t [x /s ] ]]g ,
g
σ
σ τ D
wobei man den letzten Schritt durch Induktion über den Aufbau
von
r
zeigt (Ersetzungslemma).
60 / 97
Montague-Semantik
Idee: Man erhält eine Bedeutung
Ausdrucks
α
α0
Die Belegung
eines natürlichsprachlichen
in zwei Schritten:
1. übersetze
2. werte
[[α]]
α
in einen getypten
λ-Term α0 ,
in einer vollen Typstruktur
g
D
aus:
[[α]] := [[α0 ]]D
g.
legt die Bedeutung indexikalischer Ausdrücke
(Personalpronmina, Zeit- und Ortsadverbien usw.) fest.
Je nachdem, wie ausdrucksstark das betrachtete Fragment der
natürlichen Sprache ist, braucht man eine andere Typsprache
LTyp :
I extensionale Interpretation (für statische Objekte, Relationen):
Grundtypen sind
e
(Individuen) und
t
(Wahrheitswerte),
I intensionale Interpretation (für Adverbien, Glaubensverben
u.a.): Grundtypen sind
e, t
und
s
(Situationen, mögl.Welten)
61 / 97
Montague-Grammatik
R. Montague hat um 1970 eine Alternative zur Generativen
Grammatik von N. Chomsky ausgearbeitet, die eine durch eine
Übersetzung der natürlichsprachlichen Ausdrücke in logische
Formeln angegebene modelltheoretische Semantik hat.
Die
syntaktischen Kategorien
A, B
:= e
sind:
(Entitätenbezeichner)
|
t
(Aussagen)
|
A/B
(A-Ausdrücke, denen ein
B -Ausdruck
fehlt)
|
A//B
(A-Ausdrücke, denen ein
B -Ausdruck
fehlt)
Jeder syntaktischen Kategorie wird ein Typ der Logiksprache
zugeordnet. Ausdrücke der Kategorien
A/B
und
A//B
LTyp
verhalten
sich syntaktisch verschieden, aber semantisch gleich, und erhalten
deshalb denselben Typ.
62 / 97
Die syntaktischen Kategorien der PTQ-Grammatik
Montague,
English
The Proper Treatment of Quantication in Ordinary
[?] verwendet folgende Kategorien:
Kategorie
Informelle Bezeichnung
Basisausdruck
e
Eigennamen
John, hen
t
Satz
CN :=
t/
/e
Gemeinname
man
IV :=
t/e
Verbalphrase
walks
t/IV
Nominalphrase (3.sg), Term
IV/T
Transitives Verb
nd, love
T :=
TV :=
IAV :=
DET :=
IV/IV
VP-Adverb
slowly
t/t
Satzadverb
necessarily
IAV/T
Präposition
in
IV/t
Verb mit Satzkomplement
believe
IV //IV
Verb mit Innitivkomplement
try
T/CN
Determinator
every, a, the
63 / 97
Die extensionale Sprache LTyp getypter λ-Terme
Die Menge
Typ
der einfachen Typen
σ, τ
Die
:= e
| t
| (σ → τ )
σ, τ
ist:
(Individuen)
(Wahrheitswerte)
(Funktionen)
Sprache LTyp besteht aus den Termen t vom Typ τ ,
τ ∈ Typ, die wie folgt aufgebaut sind:
kurz:
t : τ,
für jedes
1. Konstante
2. Ist
s
und Variable
ein Term vom Typ
so ist
3. Ist
c :τ
xσ
t (s )
(oder:
eine Variable und
Term vom Typ
Terme vom Typ
solche vom Typ
σ
(t · s ))
xτ
und
t
sind Terme vom Typ
ein Term vom Typ
ein Term vom Typ
t
τ.
(σ → τ ),
τ.
ein Term vom Typ
τ,
so ist
λx σ t
ein
(σ → τ ).
t heiÿen Formeln und
e Individuenterme.
werden mit
ϕ, ψ
bezeichnet,
64 / 97
Wir nehmen an, daÿ es folgende Konstanten
¬:t→t
∨ : t → (t → t )
∧ : t → (t → t )
c :τ
gibt:
∃τ : (τ → t ) → t
∀τ : (τ → t ) → t
Für diese Konstanten wird die übliche Schreibweise benutzt, z.B.
(ϕ ∧ ψ)
∀x σ ϕ
statt
statt
∧(ϕ)(ψ),
∀σ (λx σ ϕ),
Logische Formeln sind also in den Termen von
LTyp
enthalten.
65 / 97
Übersetzung der syntaktischen Kategorien
A werden Typen A0 von LTyp zugeordnet;
A werden später in λ-Terme vom Typ A0
Syntaktischen Kategorien
Ausdrücke der Kategorie
übersetzt.
Jeder syntaktischen Kategorie
A
e 0 := e
t0
ein Typ
A0
(A/B )0 := (B 0 → A0 )
(A//B )0 := (B 0 → A0 ).
:= t
von
LTyp
wird durch
zugeordnet.
66 / 97
Übersetzung der syntaktischen Kategorien
Ignorieren wir die Verben mit Satzkomplement, so erhalten wir
folgende Typen und entsprechende Objekte:
Kategorie
A
e
t
CN :=
t/
/e
IV :=
t/e
T :=
t/IV
Typ
A0
von
LTyp
e
t
e→t
e→t
(e → t ) → t
Objekt vom Typ
A0
Individuum
Wahrheitswert
Individueneigenschaft
Individueneigenschaft
Eigenschaft von
Individueneigenschaften
TV :=
IV/T
IAV :=
IV/IV
(e → t ) → (e → t )
Modikator von
Individueneigenschaften
t/t
t→t
Eigenschaft von
Wahrheitswerten
IAV/T
DET :=
T/CN
(e → t ) → ((e → t ) → t )
67 / 97
Basisausdrücke und ihre Übersetzung
Zuerst werden den den atomaren Ausdrücken
(evtl. zusammengesetzte) Terme
α0
des Typs
α der Kategorie A
A0 zugeordnet, meist
Konstante. Wir nehmen (für die extensionale Teilsprache) an:
Die syntaktischen Kategorien enthalten folgende Basisausdrücke:
1. Kategorie CN (Gemeinnamen):
man, woman, book
John, Mary, hen (n ∈ N),
Verben): walk, talk,
2. Kategorie e (Individuennamen):
3. Kategorie IV (intransitive
4. Kategorie TV (transitive Verben):
5. Kategorie DET:
nd, see, read
the, a, some, every.
w :A
wA
w hat die Kategorie
Bem: Eigennamen und Pronomen haben bei Montague die
Wir schreiben oft
oder
Kategorie T, hier die Kategorie
statt
e.
A .
Das macht die Übersetzung
uniformer und wird durch die Syntaxregel (S 1) kompensiert, mit
der sie in Ausdrücke der Kategorie
T
umgewandelt werden können.
68 / 97
Jedem Wort
w
der Kategorie
A
wird eine Konstante
w0
vom Typ
A0
zugeordnet, auÿer bei
I den Pronomina
hen : e ,
denen die Variablen
xn : e
zugeordnet
werden, und
I den Quantoren, die wie folgt übersetzt werden:
(everyDET )0 := λP e →t λQ e →t ∀x e (P (x ) → Q (x ))
(aDET )0 := λP e →t λQ e →t ∃x e (P (x ) ∧ Q (x ))
.
(theDET )0 := λP e →t λQ e →t ∃x e ((∀y e (P (y ) ↔ x = y ) ∧ Q (x )).
Die Übersezung von
DET 0
=
(CN 0
→
αDET hat den richtigen Typ
= (e → t ) → ((e → t ) → t ).
T 0)
69 / 97
Für Basisausdrücke anderer Kategorien erhalten wir z.B. folgende
Übersetzungen:
(manCN )0 := man0 : CN 0 = man0 : (e → t ),
(walkIV )0 := walk0 : IV 0 = walk0 : (e → t ),
(Johne )0 := John0 : e .
(heen )0 := xn : e .
Bem.: Die Übersetzung des bestimmten Artikels funktioniert nicht
besonders gut, und der unbestimmte Artikel sollte nicht überall wie
ein Existenzquantor behandelt werden.
70 / 97
Bildung und Übersetzung zusammengesetzter Ausdrücke
Die Bildung komplexer Ausdrücke geben wir durch numerierte
Regeln der folgenden Form an:
(S
Nr.)
Diese Regel besagt: ist
ist der (aus
α1 , . . . , αk
α1
α 1 : A1 , . . . , α k : Ak
α:A
ein Ausdruck der Kategorie
gebildete) Ausdruck
α
A1
usw., so
von der Kategorie
A.
Die Übersetzung eines zusammengesetzten Ausdrucks wird durch
entsprechende Regeln
(T
Nr.)
α10 : A01 , . . . , αk0 : A0k
α0 : A0
angegeben, die angeben, wie die Übersetzung von
α
aus den
Übersetzungen der Teilausdrücke gebildet wird.
71 / 97
Bildung und Übersetzung komplexer Ausdrücke
(S 1)
α:e
α:T
(T 1)
α0 : e
e
→t
λP
[P (α0 )] : (e → t ) → t
(S 2)
δ : DET , ξ : CN
δ ξ:T
(T 2)
δ 0 : (CN 0 → T 0 ), ξ 0 : CN 0
δ 0 (ξ 0 ) : T 0
(S 3n )
ξ : CN , ϕ : t
ξ 0 : CN 0 , ϕ0 : t
(T 3n )
e
ξ such that ϕ[hen /he] : CN
λxn (ξ 0 (xn ) ∧ ϕ0 ) : CN 0
(S 4)
α : T , δ : IV
α δ 3.sg : t
(T 4)
α0 : T 0 ,
δ 0 : IV 0
α0 (δ 0 ) : t
(S 5)
δ : TV , β : T
δ β acc : IV
(T 5)
δ 0 : (T 0 → IV 0 ), β 0 : T 0
δ 0 (β 0 ) : IV 0
72 / 97
(S
11a)
ϕ : t, ψ : t
ϕ and ψ : t
(T
11a)
ϕ0 : t , ψ 0 : t
(ϕ0 ∧ ψ 0 ) : t
(S
11b)
ϕ : t, ψ : t
ϕ or ψ : t
(T
11b)
ϕ0 : t , ψ 0 : t
(ϕ0 ∨ ψ 0 ) : t
(S
12a)
δ : IV , γ : IV
δ and γ : IV
(T
12a)
δ0 : e → t , γ 0 : e → t
λx e (δ 0 (x ) ∧ γ 0 (x )) : e → t
(S
12b)
δ : IV , γ : IV
δ or γ : IV
(T
12b)
δ0 : e → t , γ 0 : e → t
λx e (δ 0 (x ) ∨ γ 0 (x )) : e → t
(S
13)
(T
13)
α : T, β : T
α or β : T
α0 : T 0 ,
β0 : T 0
λP e →t (α0 (P ) ∨ β 0 (P )) : T 0
73 / 97
(S
14n )
α : T,
ϕ:t
ϕ[hen /α] : t
(T
14n )
α 0 : T 0 , ϕ0 : t
α0 (λxne .ϕ0 ) : t
Darin werden zwei Varianten der Ersetzung
1. Die Ersetzung
α ≡ hek
ϕ[hen /α]
ist, werden alle
α[x /β]
benutzt:
in (S 14n ) ist so deniert: falls
hen
in
ϕ
durch
hek
(im jeweils
gleichen Kasus) ersetzt; andernfalls wird das erste Vorkommen
von
hen
durch
α
und die übrigen durch
he
(bzw.
she, it)
ersetzt, wobei der Kasus vom jeweiligen Vorkommen von
hen
und das Genus vom ersten Basisausdruck der Kategorie CN
oder T in
α
übernommen wird.
2. Die Ersetzung
ϕ[hen /he] in (S 3) ist etwas anders: alle
hen in ϕ sollen durch he bzw. she,it ersetzt
Vorkommen von
werden, wobei das Genus sich nach dem Genus des ersten
Basisausdrucks der Kategorie CN in
ξ
richtet.
74 / 97
In der Montague-Grammatik entspricht die Syntaxregel
(S 4 )
der durch
α : T,
αδ
3.sg
s4 (α, δ) = α δ 3.sg
δ : IV
=
:t
α : T,
δ : IV
s4 (α, δ) : t
denierten Funktion
s4 : T × IV → t .
Der Syntaxregel ist eine Übersetzungsregel zugeordnet,
(T 4)
α0 : T 0 ,
δ 0 : IV 0
=
α0 · δ 0 : t 0
die einer Bedeutungsfunktion
α0 : T 0 ,
δ 0 : IV 0
s40 (α0 , δ 0 ) : t 0
t4 := s40 : T 0 × IV 0 → t 0
entspricht.
Also hat man in der Montague-Grammatik:
I Syntaxregel = Konstruktionsfunktion
s : A1 × . . . × An → A
I Syntaktische Struktur = Analysebaum = aus den Namen der
Aufbaufunktionen
s
gebildeter
Konstruktionsterm
75 / 97
Zu jedem Konstruktor
s
gibt es eine Bedeutungsfunktion
t1 : A1 , . . . , tn : An
(S k )
s (t1 , . . . , tn ) : A
s 0:
t10 : A01 , . . . , tn0 : A0n
(T k )
s 0 (t10 , . . . , tn0 ) : A0
Abstrakte Syntax:
I Kategorie = Typausdruck
I syntaktische Struktur = Konstruktionsterm,
I
Syntaxregel = getypter Funktionsname ( Konstruktor )
Die Bedeutung von Ausdrücken kann dann induktiv über den
Aufbau der Konstruktionsterme deniert werden.
Konstruktionsterm
Anwenden der
Konstruktionsfunktionen
Zeichenreihe
s
s0
∼
Anwenden der
Bedeutungsfunktionen
6
Parsen
?
w
Bedeutungsterm
[[
?
w
]]
Bedeutung
76 / 97
Übersetzung von Personalpronomen und Eigennamen
Als Terme aufgefaÿte Pronomen und Eigennamen werden mit (T 1)
übersetzt:
((heen )T )0 =1 λP e →t [P ((heen )0 )] : (e → t ) → t
= λP e →t [P (xne )] : (e → t ) → t .
((Johne )T )0 =1 λP e →t [P ((Johne )0 )] : (e → t ) → t
= λP e →t [P (John0 e )] : (e → t ) → t .
In einem Modell
D
ist der Wert
D
[[λP [P (John0 )]]] ∈ D(e →t )→t
D
[[John0 ]] ∈ De , sondern die
charakteristische Funktion der Menge aller seiner Eigenschaften.
dieses Terms nicht das Individuum
Das wird so kompliziert gemacht, damit die Übersetzung nach
demselben Schema verläuft wie bei koordinierten Termen wie
or Mary
und quantizierten Termen wie
every man
John
(s.u.).
77 / 97
Übersetzung atomarer Aussagen mit intransitivem Verb
Einfache Aussagen werden wie folgt übersetzt.
(((Johne )T walkIVs)t )0 =4 ((Johne )T )0 ((walkIV )0 ) : t
= λP e →t [P (John0 e )](walk0 e →t ) : t
1
Mit einer
β -Reduktion
werden zu
kann der rechte Ausdruck vereinfacht
walk0e →t (John0 e ) : t ,
ohne daÿ sich sein Wert bei einer Belegung
g
über einer Struktur
D
ändert.
Obwohl die Kategorie der Terme nur Nominalphrasen der dritten
Person im Singular enthält, enthalten die Ausdrücke der Kategorie
IV nicht die Vollformen, sondern die Innitive (bzw. Stammformen)
der darin vorkommenden Verben. Deshalb hat die Morphologie der
Vollform des Verbs keinen Einuÿ auf das Übersetzungsergebnis.
78 / 97
Aussagen mit koordinierten Eigennamen werden mit (T 4), (T 13)
und den obigen Übersetzungen von Termen übersetzt wie bei
(((John or Mary)T walkIVs)t )0
=4 ((JohnT or MaryT )T )0 ((walkIV )0 )
=
λP [(JohnT )0 (P ) ∨ (MaryT )0 (P )]((walkIV )0 ) : t
13
=
λP [λQ [Q (John0 e )](P ) ∨ λQ [Q (Mary0 e )](P )](walk0 e →t ) : t .
Durch Anwendungen von
β -Reduktionen
kann dieser Ausdruck
weiter vereinfacht werden zu
λP [λQ [Q (John0 e )](P ) ∨ λQ [Q (Mary0 e )](P )](walk0 e →t ) : t
→ λP [P (John0 ) ∨ P (Mary0 )](walk0 e →t ) : t
β
→β [walke →t (John0 e ) ∨ walke →t (Mary0 e )] : t ,
wieder ohne daÿ sich der Wert bei einer Belegung über einer
Typstruktur
D
ändert. Die entstandene Formel ist die, die man als
Ergebnis erwartet haben sollte.
79 / 97
Die Regel (S 14) ersetzt ein Pseudopronomen
hen
durch einen
Term, z.B.
.
.
.
every : DET
man : CN
.
.
.
hen walks : t hen talks : t
(S 11)
every man : T
hen walks and hen talks : t
(S 14
every man walks and he talks : t
(S 2)
In den Syntaxregeln (S 3), (S 4) und (S 14) geschieht mehr als nur
die Verkettung der Teilausdrücke; es sind also keine kontextfreien
Regeln.
80 / 97
Übersetzung von quantiziertem Subjekt und Relativsatz
Relativsätze (in schlechter Syntax) werden mit (T 3) übersetzt:
((Every man such that he walks)T talksIV )t )0
=4 ((Every man such that he walks)T )0 ((talksIV )0 ) : t
=
((EveryDET (man such that he walks)CN )T )0 (talks0 e →t ) : t
=
(EveryDET )0 (((man such that he walks)CN )0 )(talks0 e →t ) : t
2
=
=3
=4
=
→β
→β
→β
→β
IV t
0 e →t
CN 0
(EveryDET )0 (((manCN such that (heT
n walks ) [hen /he]) ) )(talks
IV t 0
0 e →t
(EveryDET )0 (λxn ((manCN )0 (xn ) ∧ ((heT
):t
n walks ) ) ))(talks
T
IV
0 e →t
DET
0
0 e →t
0
0
(Every
) (λxn (man
(xn ) ∧ ((hen ) ((walks ) ))))(talks
):t
(EveryDET )0 (λxn (man0 e →t (xn ) ∧ λP [P (xn )](walks0 e →t )))(talks0 e →t ) : t
λP λQ ∀xk (P (xk ) → Q (xk ))(λxn (man0 e →t (xn ) ∧ walks0 e →t (xn )))(talks0 e
λQ ∀xk (λxn (man0 e →t (xn ) ∧ walks0 e →t (xn ))(xk ) → Q (xk ))(talks0 e →t ) : t
λQ ∀xk ((man0 e →t (xk ) ∧ walks0 e →t (xk )) → Q (xk ))(talks0 e →t ) : t
∀xk ((man0 e →t (xk ) ∧ walks0 e →t (xk )) → talks0 e →t (xk )) : t
81 / 97
Pronomenauösung innerhalb eines Satzes
Auf welchen Term sich ein Pronomen bezieht, legt der Satzaufbau
durch (S 14) mit Vorkommen derselben Variable
((A woman walks and she talks)t )0
=
=14
=
=11
=4
=
=2
=
hen
fest.
(((hen walks and hen talks)t [hen /(a woman)T ])t )0
((a woman)T )0 (λxn .((hen walks and hen talks)t )0 )
((a woman)T )0 (λxn .(((hen walks)t and (hen talks)t )t )0 )
IV t 0
IV t 0
T
((a woman)T )0 (λxn .(((heT
n walks ) ) ∧ ((hen talks ) ) )
((a woman)T )0 (λxn .(((heen )T )0 ((walksIV )0 ) ∧ ((heen )T )0 ((talksIV )0 )
((aDET womanCN )T )0 (λxn .(λP [P (xn )](walks0 ) ∧ λP [P (xn )](talks0 )
(aDET )0 (womanCN )0 (λxn .(λP [P (xn )](walks0 ) ∧ λP [P (xn )](talks0 )))
λP λQ ∃x (P (x ) ∧ Q (x ))(woman0 )
(λxn (λP [P (xn )](walks0 ) ∧ λP [P (xn )](talks0 )))
→β
λP λQ ∃x (P (x ) ∧ Q (x ))(woman0 )(λxn (walks0 (xn ) ∧ talks0 (xn )))
→β
∃x (woman0 (x ) ∧ λxn (walks0 (xn ) ∧ talks0 (xn ))(x ))
→β
∃x (woman0 (x ) ∧ (walks0 (x ) ∧ talks0 (x )))
82 / 97
Die intensionale Sprache LTyp getypter λ-Terme
Die Extension (Umfang) eines Begris ist die Gesamtheit der
unter den Begri fallenden Objekte, die Intension (Sinn) alles,
was mitgemeint ist (die Gesamtheit der Oberbegrie).
Ein Kontext ist ein Text mit einer Lücke , oder ein Ausdruck γ(x )
mit einer genau einmal frei vorkommenden Variable x . Der Kontext
γ(x )
γ(x ) nicht
Interpretation D, g
ist intensional, wenn das Ersetzungslemma für
d.h. wenn für mindestens ein
α
und eine
gilt,
D
[[γ(x /α)]]D
g 6= [[γ]]g [x /[[α]]D ] .
g
Beispiel: Der Kontext
γ(x ) = Emil glaubt, daÿ x .
ist intensional, da
Emil i.a. nicht alle wahren (oder alle falschen) Aussagen glaubt:
Auch wenn
D
[[Maria liebt Emil]]D
g = [[2 > 1]]g
ist, kann es sein daÿ
D
[[Emil glaubt, daÿ (Maria ihn liebt)]]D
g 6= [[Emil glaubt, daÿ (2 > 1)]]g .
83 / 97
Da es in der natürlichen Sprache viele intensionale Kontexte gibt,
z.B. Glaubensverben mit intensionalen Argumentstellen , muÿ man
bei der Bedeutung feinere Unterschiede machen als es Dt = {0, 1}
für Aussagen erlaubt.
Grundidee: unterscheide zwischen einer intensionalen Bedeutung
und einer extensionsalen Bedeutung eines Terms
Grundtypen
ι
ι
σ, τ
und Typen
:=
|
|
:=
|
|
Intensionen sind
σ, τ
e
t
s
ι
(s → τ )
(σ → τ )
t.
der intensionalen Logik sind
(Individuen)
(Wahrheitswerte)
(Situationen)
(Grundtypen)
(Intensionen vom Typ
τ)
(Funktionen)
situationsabhängige Objekte eines Typs τ ,
τ ) in einer Situation.
Extensionen die Objekte (des Typs
84 / 97
Terme
t:τ
vom Typ
τ
sind, wenn die Teilterme von den durch
Indizes angegeben Typen sind, die folgenden:
t:τ
:=
|
|
|
|
|
|
|
|
|
xτ : τ
cτ : τ
λx σ t τ : (σ → τ )
t σ→τ (s σ ) : τ
∧ t τ : (s → τ )
∨ t s →τ : τ
¬ϕt : t
(ϕt ∧ ψ t ) : t
∀x σ ϕt : t
ϕt : t
(Variable)
(Konstante)
(Funktionsterme)
(Anwendungsterme)
(Intensionsbildung)
(Extensionsbildung)
(Formeln)
85 / 97
Eine volle Typstruktur der intensionalen Logik ist eine volle
D = (Dτ , c D )τ ∈Typ aus Bereichen Dτ mit
Dσ→τ = Dσ → Dτ und Intensionen(!) c D ∈ Ds →τ für jede
nicht-logische Konstante c vom Typ τ . Logische Konstanten ¬, ∧,
∃τ werden wie bisher interpretiert.
Typstruktur
Index. Eine
Proposition ist ein Element von Ds →t , d.h. ein situationsabhängiger
Wahrheitswert. Ein Individuenkonzept ist ein Element von Ds →e ,
d.h. ein situationsabhängiges Individuum.
Jedes
i ∈ Ds
heiÿt
Situation
oder mögliche Welt, oder
Beispiel
I Dem Ausdruck
der Bundeskanzler
I Der Aussage
i ∈ De ,
Ds →e .
entspricht kein
sondern ein situationsabhängiges Individuum aus
Das Wetter ist schön entspricht kein
b ∈ Dt , sondern eine Proposition p ∈ Ds →t .
Wahrheitswert
86 / 97
g
D ordnet jeder Variablen
x : τ bei der Belegung g ein Element g (x τ ) ∈ Dτ zu. Der Wert des
D
Terms t : τ in der Situation i ∈ Ds bei der Belegung g , [[t ]]g ,i wird
Eine Belegung
über der Typstruktur
rekursiv deniert durch:
[[c τ ]]D
g ,i
[[x τ ]]D
g ,i
σ→τ σ D
[[t
(s )]]g ,i
[[λx σ t τ ]]D
g ,i
∧ τ D
[[ t ]]g ,i
D
[[∨ t s →τ ]]g ,i
[[ϕt ]]g ,i
D
:= (c τ )D (i ) ∈ Dτ , für
nicht-logische Konstante,
:= g (x ) ∈ Dτ ,
σ D
:= [[t σ→τ ]]D
g ,i ([[s ]]g ,i ),
:=
das
f ∈ Dσ→τ
mit
f (a) = [[t τ ]]D
g [x /a],i
:=
das
f ∈ Ds →τ
mit
f (j ) = [[t τ ]]D
g ,j
:= [[t s →τ ]]D
g ,i (i ) ∈ Dτ
(
D
1, falls [[ϕ]]g ,j = 1
:=
0, sonst.
für alle
für alle
für alle
a ∈ Dσ ,
j ∈ Ds ,
j ∈ Ds ,
¬(t →t ) , ∧t →(t →t ) und ∃τ : (τ → t ) → t
.τ
= : τ → τ → t werden wie bisher interpretiert.
Die logischen Konstanten
sowie die Identität
87 / 97
Damit läÿt sich G.Freges Unterscheidung zwischen Sinn (Intension)
und Bedeutung (Extension) so präzisieren:
Die Intension von
t:τ
bei
D
und
g
in der Situation
i ∈ Ds
ist
D
∧
{| t τ |}D
g ,i := [[ t ]]g ,i ∈ Ds →τ .
Die Extension von
t:s→τ
bei
D
und
g
in der Situation
i ∈ Ds
ist
D
[[∨ t ]]g ,i ∈ Dτ .
Beispiel
I
I
{| der Morgenstern |}D
g ,i
der morgens erscheinende Stern
(möglicherweise an jedem Tag ein anderer),
[[der Morgenstern]]D
g ,i
ist
ist der am Tag
i
morgens erscheinende
Stern.
88 / 97
Intensionales Fragment der Montague-Grammatik
Das intensionale Fragment erweitert das extensionale Fragment um
(i) Modaloperatoren,
(ii) Verben mit Komplementsätzen,
(iii) Verben mit intensional zu interpretierenden Objekten,
(iv) Adverbien,
(v) Tempusformen.
Mehrstellige Verben, freie Präpositionalphrasen, und das Tempus
von Aussagen behandelt Montague erst in der intensionalen
Teilsprache, da dies mit denselben technischen Mitteln geht, die er
zur Behandlung intensionaler Phänomene braucht.
89 / 97
Grundidee: falls ein Teilausdruck
A B
intensionalem Kontext α (x )
A
B
B
B 0
von α (x /β ) nicht in (β )
βB
eines Ausdrucks in einem
steht, wird er bei der Übersetzung
übersetzt, sondern in
Dadurch wird bei der Auswertung von
[[(β B )0 ]]
i nicht die Bedeutung
β benutzt wird, der von
αA (x B /β B )
g ,i , sondern der Sinn
der Situation
i
∧ (β B )0 .
in der Situation
{| (β B )0 |}g
von
unabhängig ist.
In der natürlichen Sprache kommen intensionale Kontexte
manchmal in einander geschachtelt vor, etwa in
Maria glaubt, daÿ Emil zwar glaubt, sie zu lieben,
es aber in Wirklichkeit nicht tut.
' Maria glaubt, Emil liebe Maria nicht, und
Maria glaubt, Emil glaube, Emil liebe Maria.
Um das behandeln zu können, ist es nützlich, daÿ wir in
Übergang zur Intension durch
∧ t iterieren können.
LTyp
den
90 / 97
Übersetzung der Kategorien
Jeder Kategorie
e0
t0
CN 0
wird ein Typ
:= e
:= t
:= (e → t )
Auÿer bei
und
A
A//B
CN
und
IV
A0
von
LTyp
zugeordnet:
(A/B )0 := ((s → B 0 ) → A0 )
(A//B )0 := ((s → B 0 ) → A0 ).
IV 0
:= (e → t ).
wurden die Argumentkategorien
in intensionale Argumenttypen
(s → B 0 )
B
von
A/B
übersetzt.
Nach den Abkürzungen der Kategorien erhalten wir zum Beispiel:
T 0 = (t /IV )0
TV 0 = (IV /T )0
DET 0 = (T /CN )0
=
=
=
=
=
=
(s
(s
(s
(s
(s
(s
→ IV 0 ) → t
→ (e → t )) → t
→ T 0 ) → IV 0
→ ((s → (e → t )) → t )) → (e → t )
→ CN 0 ) → T 0
→ (e → t )) → ((s → (e → t )) → t )
91 / 97
Basisausdrücke und ihre Übersetzung
Die syntaktischen Kategorien enthalten weitere Basisausdrücke:
1.
believe, claim
sind von der Kategorie
IV /t
(transitive Verben
mit Komplementsatz),
2.
try, want
sind von der Kategorie
IV //IV
(transitive Verben mit
Innitivkomplement)
3.
possibly, necessarily
sind von der Kategorie
t /t
(Satzadverbien),
4.
slowly, rapidly, voluntarily
sind von der Kategorie IAV
(Adverbien)
Da die Argumente von Kategorien der Form
Terme vom Typ
s→
A/B
oder
A//B
in
B 0 übersetzt werden, wird bei der Anwendung
von Funktionen das Argument stets eine Intension sein. Deshalb
muÿ die Übersetzung der Konstanten etwas modiziert werden:
92 / 97
Variable und nicht-logische Konstante einer Kategorie
Variable bzw. Konstante des Typs
A0
A
werden in
übersetzt, z.B.:
(heen )0 := xn : e
(Johne )0 := John0 : e ,
(manCN )0 := man0 e →t : CN 0
(walkIV )0 := walk0 e →t : IV 0
(seekIV /T )0 := seek0 : (s → T 0 ) → IV 0
(believeIV /t )0 := believe0 : (s → t ) → IV 0
Logische Konstante erhalten eine besondere Übersetzung, z.B.:
(aDET )0 := λP s →(e →t ) λQ s →(e →t ) ∃x e [∨P (x ) ∧ ∨Q (c )] : DET 0
0
0
(everyDET )0 := λP s →CN λQ s →IV ∀x e [∨P (x ) → ∨Q (x )] : DET 0 .
93 / 97
Bildung und Übersetzung zusammengesetzer Ausdrücke
Das Subjekt eines Verbs wird extensional, die anderen Argumente
intensional behandelt: Bei der Anwendung des Subjekts
eine Verbalphrase
zur Extension
(β IV )0
∨∧ (β 0 )
nach (T 4) wird in (T 1) zuerst von
= β0
α0
auf
∧ (β 0 )
β eines Verbs α
als Intensionen ∧ (β 0 ) an die
übergegangen. Objekte
werden dagegen nach (T 5,7,8)
Funktion
(αT )0
übergeben.
(S 1)
α:e
α:T
(T 1)
α0 : e
λP s →(e →t ) [∨P (α0 )] : T 0
(S 2)
δ : DET , ξ : CN
δ ξ:T
(T 2)
δ 0 : (s → CN 0 ) → T 0 ,
δ 0 (∧ ξ 0 ) : T 0
(S 3n )
(S 4)
ξ : CN , ϕ : t
ξ such that ϕ[hen /he] : CN
α : T , δ : IV
α δ 3.sg : t
(T 3n )
(T 4)
ξ0 : C
ξ 0 : CN 0 , ϕ0 : t
λxne (ξ 0 (xn ) ∧ ϕ0 ) : CN 0
α0 : (s → IV 0 ) → t ,
α0 (∧ δ 0 ) : t
δ0 : I
94 / 97
(S 5)
δ : TV , β : T
δ β acc : IV
(T 5)
δ 0 : (s → T 0 ) → IV 0 , β 0 : T 0
δ 0 (∧ β 0 ) : IV 0
(S 6)
δ : IAV /T , α : T
δ αacc : IAV
(T 6)
δ 0 : (s → T 0 ) → IAV 0 , α0 : T 0
δ 0 (∧ α0 ) : IAV 0
(S 7)
α : IV /t , ϕ : t
α that ϕ : IV
(T 7)
α0 : (s → t ) → IV 0 , ϕ0 : t
α0 (∧ ϕ0 ) : IV 0
(S 8)
δ : IV //IV , β : IV
δ to β : IV
(T 8)
δ 0 : (s → IV 0 ) → IV 0 , β 0 : IV 0
δ 0 (∧ β 0 ) : IV 0
(S 9)
δ : t /t , ϕ : t
δ ϕ:t
(T 9)
δ 0 : (s → t ) → t , ϕ0 : t
δ 0 ( ∧ ϕ0 ) : t
(S
10)
δ : IV /IV , β : IV
β δ : IV
(T
10)
δ 0 : (s → IV 0 ) → IV 0 , β 0 : IV 0
δ 0 (∧ β 0 ) : IV 0
95 / 97
(S
11a)
ϕ : t, ψ : t
ϕ and ψ : t
(T
11a)
ϕ0 : t , ψ 0 : t
(ϕ0 ∧ ψ 0 ) : t
(S
11b)
ϕ : t, ψ : t
ϕ or ψ : t
(T
11b)
ϕ0 : t , ψ 0 : t
(ϕ0 ∨ ψ 0 ) : t
(S
12a)
δ : IV , γ : IV
δ and γ : IV
(T
12a)
δ0 : e → t , γ 0 : e → t
λx e (δ 0 (x ) ∧ γ 0 (x )) : e → t
(S
12b)
δ : IV , γ : IV
δ or γ : IV
(T
12b)
δ0 : e → t , γ 0 : e → t
λx e (δ 0 (x ) ∨ γ 0 (x )) : e → t
(S
13)
(T
13)
(S
14n )
α : T,
ϕ:t
ϕ[hen /α] : t
(T
14n )
α 0 : T 0 , ϕ0 : t
α0 (∧ λxn .ϕ0 ) : t
(S
16n )
α : T , δ : IV
δ[hen /α] : IV
(T
16n )
α0 : T 0 , δ 0 : IV 0
e
λy .α0 (∧ λxn .δ 0 (y )) : IV 0
α : T, β : T
α or β : T
α0 : T 0 ,
β0 : T 0
λP s →(e →t ) (α0 (P ) ∨ β 0 (P )) : T 0
96 / 97
Beispiel Da Eigennamen und Pronomen nach (S 1) komplexe
Ausdrücke der Kategorie
T
sind, ergibt deren Übersetzung jetzt (im
Unterschied zum extensionalen Fragment):
((Johne )T )0 =1 λP s →(e →t ) [∨P ((Johne )0 )]
= λP s →(e →t ) [∨P (John0 e )] : (s → IV 0 ) → t
0
s →IV 0 [∨P (x e )] : T 0
(heT
n ) := λP
n
Dadurch erhalten wir für einfache Sätze mit intransitiven Verben
das gleiche Übersetzungsergebnis wie im extensionalen Fall:
((JohnT talksIV )t )0
=4
=
=β
=∨∧
(JohnT )0 (∧ (talksIV )0 )
0
0
λP s →IV [∨P (John0e )](∧ (talk0 IV ))
( (talk0 IV ))(John0 e )
(talk0 e →t )(John0 e ).
∨ ∧
0
97 / 97
Herunterladen