Logik und Modelltheoretische Semantik Vorlesung SS 2011 Hans Leiÿ Universität München Centrum für Informations- und Sprachverarbeitung 23. Juli 2011 1 / 97 Organisatorisches Vorlesung I Zeit: Do, 14-16 Uhr I Ort: Raum B254, Eduard-Rumpler-Str. 13 I Voraussetzung: Kurs über Mathematische Grundlagen der CL I Abschluÿklausur: letzte Semesterwoche Tafelübung: I Zeit: Di 14-16 I Ort: Raum 227, Schellingstr. 3 I Hausaufgaben: 2 / 97 Literatur 3 / 97 Boole'sche Algebra Eine Boole'sche Algebra B = (B , +, ·, , 0, 1) ist eine Struktur, in der folgende Aussagen gelten: ∀x ∀y ∀z (x + (y + z ) = (x + y ) + x ) 1. + ist assoziativ: 2. + ist kommutativ: 3. + ist idempotent: 4. 0 ist neutral bzgl. ∀x ∀y (x + y = y + x ) ∀x (x + x = x ) +: ∀x (x + 0 = x ) 5. Gegenteile sind erschöpfend: ∀x (x + x = 1) ∀x ∀y ∀z (x · (y · z ) = (x · y ) · x ) 6. · ist assoziativ: 7. · ist kommutativ: 8. · ist idempotent: ∀x ∀y (x · y = y · x ) ∀x (x · x = x ) 9. 1 ist neutral bzgl. ·: ∀x (x · 1 = x ) 10. Gegenteile sind ausschlieÿend: 11. + 12. · distribuiert über ·: distribuiert über ∀x (x · x = 0) ∀x ∀y ∀z (x + (y · z ) = (x + y ) · (x + z )) +: ∀x ∀y ∀z (x · (y + z ) = (x · y ) + (x · z )) 4 / 97 Auf jeder BA gibt es eine partielle Ordnung ≤, deniert durch a ≤ b : ⇐⇒ a + b = b. Bezüglich ≤ + a = a) und 1 a + 1 = a + (a + a) = a + a = 1). In jedem + und · monoton, z.B. ist 0 das kleinste Element (wegen 0 das gröÿte (wegen Argument sind a≤b Auÿerdem ist ⇒ ac + bc = (a + b)c = bc ⇒ ac ≤ bc a · 0 = a · (a · a) = (a · a) · a = a · a = 0. Beispiele: I Die Algebra der Wahrheitswerte: B = ({0, 1}, max, min, , 0, 1) mit 0 := 1, 1 := 0 M: A := { m ∈ M | m ∈ / A} I Die Algebra aller Teilmengen einer Menge P(M ) = (P (M ), ∪, ∩, , ∅, M ) mit 5 / 97 Aussagen, die man aus den Axiomen beweisen kann, gelten in allen Boole'schen Algebren. Proposition: Sei 1. Gelten A eine Boole'schen Algebra, und a·b =0 2. (De Morgan) und a + b = 1, a·b =a+b und so ist a , b ∈ A. a = b. a + b = a · b. Beweis: 1. a = a1 = a(b + b) = ab + ab = 0 + ab = ab = ab + 0 = ab + bb = (a + b)b = 1b = b. 2. Nach 1. genügt es, folgende zwei Gleichungen zu zeigen: (ab)(a + b) = aba + abb = aab + a0 = 0b + 0 = 0 (ab) + (a + b) = ab + a1 + 1b = ab + a(b + b) + (a + a)b = ab + ab + ab + ab + ab = (a + a)b + (a + a)b = b + b = 1 Was bedeuten die Aussagen in B und P(M )? 6 / 97 Lemma: Ist und I 6= ∅ A = (A, +A , ·A , A , 0A , 1A ) eine Boole'sche Algebra eine Menge, so ist auch AI := (AI , +, ·, , 0, 1) eine Boole'sche Algebra, wobei AI 0 := { f | f : I → A }, := das f ∈ AI mit f (i ) = 0A für alle i ∈I alle i ∈I I A 1 := das f ∈ A mit f (i ) = 1 für A (f + g )(i ) := f (i ) + g (i ), für alle i ∈ I (f · g )(i ) := f (i ) ·A g (i ), für alle i ∈ I A f (i ) := f (i ) , für alle i ∈ I. Beweis: Man prüft die Axiome durch Nachrechnen, z.B. ((f + g ) · h)(i ) = (f (i ) +A g (i )) ·A h(i ) = (f (i ) ·A h(i )) +A (g (i ) ·A h(i )) = ((f · h) + (g · h))(i ). 7 / 97 Die Boole'schen Operationen + (oder), · (und) und (nicht) treten in der natürlichen Sprache bei mehreren Ausdrucksarten auf: 1. bei Satzverbindungen werden sie in B interpretiert: Weder (arbeitet Fritz) noch ((scheint die Sonne) oder (leuchtet der Mond)) ' ¬ϕ1 ∧ ¬(ϕ2 ∨ ϕ3 ) 2. bei Verbindungen von (einstelligen) Prädikaten werden sie in P(I ) = BI interpretiert, wenn I die Menge Fritz (arbeitet und (geht nicht baden)) BI I ' f (A ·B B ) ' (f A) ·B f B B . Bei zweistelligen Prädikaten analog in (liest oder schreibt) einen Aufsatz. der Individuen ist: P(I × I ) = BI ×I : Fritz 3. bei Nominalphrasen (in Subjektsposition) werden sie in interpretiert: (Weder Fritz noch Maria) arbeitet I B(B ) I ' (f I ·BB m) BB B A = (f A) ·B (m A) B 8 / 97 Eine n-stellige Wahrheitsfunktion ist eine Funktion f : Bn → B. Einige der Konjunktionen und Subjunktionen der natürlichen Sprache können durch Wahrheitsfunktionen interpretiert werden, andere nicht. Neben weder noch und, oder, nicht wenn - dann, und, oder, nicht können z.B. auf Kombinationen von zurückgeführt werden, z.B. Wenn S1 , dann S2 . := (nicht S1 ) oder S2 . Konjunktionen, die nicht durch eine Wahrheitsfunktion interpretiert werden können, sind z.B. weil oder damit. f : B2 → B (p deshalb, weil q) = f (p , q ). Zeige, daÿ es keine Wahrheitsfunktion gibt mit p1 , p2 mit q1 , q2 mit gleichem (p1 deshalb, weil q1 ) und (p2 deshalb, weil Hinweis: man nde umgangssprachliche Aussagen gleichem Wahrheitswert und Aussagen Wahrheitswert, wo aber q2 ) verschiedene Wahrheitswerte haben. 9 / 97 Modallogik Komplexe Sätze können nicht nur durch Koordinationen, sondern auch durch Satzadverbien wie möglicherweise oder wahrscheinlich aus einfachen Sätzen aufgebaut werden. Leibniz hat die wirkliche möglichen Welten unterschieden. notwendigerweise, wenn sie in allen und möglicherweise, wenn sie in von Nach ihm gilt eine Aussage möglichen Welten wahr ist, mindestens einer möglichen Welt wahr ist. Modallogische Formeln: ϕ, ψ := | | | | Abkürzung: ⊥ p ¬ϕ (ϕ ∧ ψ) ϕ ♦ϕ := ¬¬ϕ für (Falsum) (Aussagevariable ) (nicht ϕ) (ϕ und ψ) (es ist notwendig, daÿ ϕ) es ist möglich, daÿ ϕ 10 / 97 Einfache Interpretation: Eine mögliche Welt ist eine Belegung h : Var → B. ϕ ist in wahr, oder h |= ϕ, h |= ϕ ⇐⇒ für alle h |= ♦ϕ ⇐⇒ für ein Für aussagenlogische ♦ϕ = ϕ h ϕ hieÿe das: ist erfüllbar . wenn [[ϕ]]h = 1. Das gibt h0 : Var → B : h0 |= ϕ h0 : Var → B : h0 |= ϕ ϕ = ϕ ist allgemeingültig , Feinere Interpretation: die Möglichkeiten sind relativ zur Wirklichkeit (S. Kripke, 1957). M = (W , R ) besteht aus einer Menge W 6= ∅ R ⊆ W × W . Eine Belegung über Abbildung h : W × Var → B. Ein Modell-Rahmen und einer Erreichbarkeitsrelation M ist eine 11 / 97 w von ϕ in [[ϕ]]M, h min ∅ := 1) durch Der (Wahrheits-) Wert ist dann deniert (mit w [[⊥]]M, h w [[p ]]M, h w [[¬ϕ]]M, h w [[ϕ ∧ ψ]]M, h w [[ϕ]]M, h := der Welt w von M bei h 0 := h(w , p ) w := [[ϕ]]M, h , w · [[ψ]]M,w := [[ϕ]]M, h h M,v := min{ [[ϕ]]h | v ∈ W , wRv }. Insbesondere: M, w , h |= ϕ ⇐⇒ M, w , h |= ϕ für alle von w aus erreichbaren v ∈ W. 12 / 97 Prädikatenlogik 1.Stufe Var = {x0 , x1 , . . .} eine unendliche Menge von L = Fun ∪ Rel eine (endliche) Menge von (mit einer Syntax: Sei Variablen, Stelligkeit versehenen) Funktions- bzw. Relationszeichen. L-Terme: s , t := x | c c ∈ Fun | f (t1 , . . . , tn ) f ∈ Fun n-stellig, n ≥ 1 0-stellig L-Formeln: ϕ, ψ := ⊥ | s = ˙t Abkürzungen: | R (t1 , . . . , tn ) | ¬ϕ | (ϕ ∧ ψ) | ∃x ϕ (ϕ ∨ ψ) := ¬(¬ϕ ∧ ¬ψ) usw., ∀x ϕ := ¬∃x ¬ϕ 13 / 97 Pränexe Normalform ϕ(x1 , . . . , xn ) Eine Formel ist in pränexer Normalform (PNF), wenn ϕ = Q1 y1 . . . Qk yk ψ(x1 , . . . , xn , y1 , . . . , yk ) Qi ∈ {∃, ∀} und eine quantorenfreie Formel ψ . 0 Formel ϕ(x1 , . . . , xn ) ist zu einer Formel ϕ (x1 , . . . , xn ) für Quantoren Lemma Jede in pränexer Normalform äquivalent. Beweis durch Induktion über den Formelaufbau. I I I ϕ ist atomar: dann ist es schon in PNF, also ϕPNF := ϕ. ¬ϕ: Sei ϕPNF = Q1 x1 . . . Qk xk ψ . Dann ist ¬ϕ äquivalent zu (¬ϕ)PNF := Q 1 x1 . . . Q k xk ¬ψ , mit ∀ = ∃, ∃ = ∀. (ϕ1 ∧ ϕ2 ): Sei oBdA ϕPNF = Qi xi ψi , xi ∈ / frei (ψ3−i ). Wähle i (ϕ1 ∧ ϕ2 )PNF := Q1 x2 Q2 x2 (ψ1 ∧ ψ2 ). I ∃x ϕ: Wähle (∃x ϕ)PNF := ∃x (ϕPNF ). 14 / 97 Skolem'sche Normalform Lemma Sei f ∀x1 . . . ∀xn ∃y ϕ eine L-Aussage, M eine L-Struktur und ein neues Funktionszeichen. Äquivalent sind: 1. M |= ∀x1 . . . ∀xn ∃y ϕ, 2. Es gibt eine Funktion f M : Mn → M mit (M, f M ) |= ∀x1 . . . ∀xn .ϕ(y /f (x1 , . . . , xn )). Bew. 2.⇒ 1.: Benutze das Ersetzungslemma, (M,f M ) ϕ(y /f (x1 , . . . , xn ))[x1 /a1 ,...,x /a ] = ϕM [x1 /a1 ,...,x /a ,y /f M (a1 ,...,a )] . n 1. ⇒ 2.: Deniere n n n a1 , . . . , an ist M |= ∃y ϕ[x1 /a1 , . . . , xn /an ]. f M (a1 , . . . , an ) durch ein für y geeignetes b ∈ M . n Für alle Ein solches f heiÿt Skolemfunktion für ∀x1 . . . ∀xn ∃y ϕ. 15 / 97 Satz (Skolem-Normalform) Zu jeder L-Formel ϕ(z1 , . . . , zn ) gibt es neue Funktionszeichen f1 , . . . , fk und eine quantorenfreie Formel ψ(y1 , . . . , ym , z1 , . . . , zn ) von L ∪ {f1 , . . . , fk }, sodaÿ ϕ ist erfüllbar ⇐⇒ ∀y1 . . . ∀ym ψ ist erfüllbar. Bew: Das Lemma sagt: ∀~x ∃y ϕ0 ist erfüllbar ⇐⇒ ∀~x .ϕ0 (y /f (~x )) erfüllbar ist. Wende das wiederholt auf ϕPNF ∀x1 ∃y1 ∀x2 ∃y2 ψ Beispiel: an. ist erfüllbar ⇐⇒ ∀x1 ∀x2 ∃y2 .ψ(y1 /f (x1 )) ⇐⇒ ∀x1 ∀x2 .ψ(y1 /f (x1 ))(y2 /g (x1 , x2 )) ist erfüllbar ist erfüllbar 16 / 97 Korollar Zu jeder ~f ∈ /L L-Formel ϕ(z1 , . . . , zn ) gibt es Funktionszeichen L ∪ {~f }-Formel ϕ0 (~x ,~z ), sodaÿ und eine quantorenfreie ϕ ist allgemeingültig ⇐⇒ ∃~x ϕ0 ist allgemeingültig. Bew: Sei ϕ ϕ = ∃~x ∀y ψ . ist allgemeingültig ⇐⇒ ¬ϕ ⇐⇒ ∀~x ∃y ¬ψ ⇐⇒ ∀~x ¬ψ(y /f (~x )) ist nicht erfüllbar (mit neuem ⇐⇒ ¬∃~x ψ(y /f (~x )) ist nicht erfüllbar ⇐⇒ ∃~x ψ(y /f (~x )) ist nicht erfüllbar ist nicht erfüllbar f) ist allgemeingültig. Entsprechend für längere Quantorenpräxe. Beachte, daÿ hier die Allquantoren durch Skolemfunktionen ersetzt werden. 17 / 97 Herbrand-Modelle L-Term t bzw. eine L-Formel ϕ ist geschlossen, wenn frei (t ) = ∅ bzw. frei (ϕ) = ∅. Das Herbrand-Universum für L Ein H (L) := { t ∈ L-term | t Eine Herbrand-Struktur für L ist eine ist ist geschlossen }. L-Struktur H = (H , f H , . . . , R H , . . .) sodaÿ H = H (L) und f H (t1 , . . . , tn ) := f (t1 , . . . , tn ) für alle n-stelligen Funktionszeichen Ein Herbrand-Modell der die alle Aussagen von T f L-Theorie T von L und t1 , . . . , tn ∈ H . ist eine Herbrandstruktur erfüllt, d.h. mit H, H |= T . 18 / 97 Satz Sei ϕ eine L-Aussage Beweis: OBdA enthalte in ϕ ⇒: A |= ϕ. ϕ L nur die c . Dann und eine Konstante Sei = ˙ ohne ist erfüllbar genau dann, wenn Interpretiere in Skolem'scher Normalform. ϕ ein Herbrand-Modell hat. Funktions- und Relationszeichen ist H 6= ∅. n-stellige Relationszeichen R durch R H := { (t1 , . . . , tn ) ∈ H n | A |= R (t1 , . . . , tn ) }. Beh: Ist ψ eine L-Aussage in Skolem'scher Normalform, so gilt A |= ψ ⇒ H |= ψ. Für atomare Aussagen ist nach Def. von RH sogar A |= R (t1 , . . . , tn ) ⇐⇒ H |= R (t1 , . . . , tn ); das überträgt sich mit Induktion auf alle quantorenfreien Aussagen. 19 / 97 ψ = ∀x ψ 0 und A |= ψ . Dann gilt A |= ψ 0 [x /a] für jedes a ∈ A. Für jedes a = [[t ]]A mit t ∈ H ist 1 = [[ψ 0 ]][x /a] = [[ψ 0 (x /t )]]. Sei nun Nach Induktion wissen wir A |= ψ 0 (x /t ) also H |= ψ 0 (x /t ) und H |= ψ 0 (x /t ), ⇒ H |= ψ 0 [x /t ]. Das ist für alle t∈H so, also H |= ∀x ψ 0 . ⇐: Sei H ein Herbrand-Modell von ϕ. Dann wird ϕ von H erfüllt. 20 / 97 ψ = ∀x ψ 0 und A |= ψ . Dann gilt A |= ψ 0 [x /a] für jedes a ∈ A. Für jedes a = [[t ]]A mit t ∈ H ist 1 = [[ψ 0 ]][x /a] = [[ψ 0 (x /t )]]. Sei nun Nach Induktion wissen wir A |= ψ 0 (x /t ) also H |= ψ 0 (x /t ) und H |= ψ 0 (x /t ), ⇒ H |= ψ 0 [x /t ]. Das ist für alle t∈H so, also H |= ∀x ψ 0 . ⇐: Sei H H erfüllt. H einfach H/=˙ A [t ] := { s ∈ H | A |= s = ˙ t } mit nimmt, ein Herbrand-Modell von Bem. Enthält L die Gleichheit A |= s = ˙t = ˙, ϕ. Dann wird so ist für ⇐ 6⇒ P ([t ], . . .) : ⇐⇒ A |= P (t , . . .) s, t ∈ H von nur H |= s = ˙ t. Der Satz gilt dann auch, wenn man statt also die Äquivalenzklassen ϕ und f ([t ], . . .) := [f (t , . . .)]. 20 / 97 Macht man dasselbe für eine abzählbare Menge von Aussagen, so erhält man: Satz (Löwenheim und Skolem) Sei T eine L-Theorie in einem L mit höchstens abzählbarem Vokabular. Dann gilt: T hat ein Modell ⇐⇒ T hat ein höchstens abzählbares Modell H 21 / 97 Macht man dasselbe für eine abzählbare Menge von Aussagen, so erhält man: Satz (Löwenheim und Skolem) Sei T eine L-Theorie in einem L mit höchstens abzählbarem Vokabular. Dann gilt: T hat ein Modell Bew.: ⇒: Sei ⇐⇒ T ϕSNF hat ein höchstens abzählbares Modell eine Skolem-Normalform von H ϕ, T SNF := { ϕSNF | ϕ ∈ T }. T SNF ist erfüllbar gdw. T SNF hat ein SNF abzählbar ist, ist es auch H. Herbrand-Modell H. Da T 0 Weglassen der Skolemfunktionen liefert ein abzählbares H |= T . T ist erfüllbar gdw. 21 / 97 Macht man dasselbe für eine abzählbare Menge von Aussagen, so erhält man: Satz (Löwenheim und Skolem) Sei T eine L-Theorie in einem L mit höchstens abzählbarem Vokabular. Dann gilt: T hat ein Modell Bew.: ⇒: Sei ⇐⇒ T ϕSNF hat ein höchstens abzählbares Modell eine Skolem-Normalform von H ϕ, T SNF := { ϕSNF | ϕ ∈ T }. T SNF ist erfüllbar gdw. T SNF hat ein SNF abzählbar ist, ist es auch H. Herbrand-Modell H. Da T 0 Weglassen der Skolemfunktionen liefert ein abzählbares H |= T . T ist erfüllbar gdw. Bem.: (Skolem'sches Paradox) Auch die übliche Mengenlehre ist ein solches T. Sie hat also ein abzählbares Modell obwohl sie über überabzählbare Mengen wie R spricht. 21 / 97 Vollständigkeitssatz Def. Die Herbrand-Expansion der L-Formel ϕ(x1 , . . . , xn ) ist E (ϕ) := { ϕ(x1 /t1 , . . . , xn /tn ) | t1 , . . . , tn ∈ H }. ∀x1 . . . ∀xn ϕ in erfüllbar, wenn E (ϕ) Satz (Gödel,Herbrand,Skolem) Eine Aussage Skolem'scher Normalform ist genau dann (aussagenlogisch) erfüllbar ist. Bew. OBdA sei ϕ ohne = ˙. Für jede Herbrand-Struktur H gilt: H |= ∀x1 . . . xn .ϕ ⇐⇒ für alle t1 , . . . , tn ∈ H : H |= ϕ[x1 /t1 , . . .] ⇐⇒ für alle t1 , . . . , tn ∈ H : H |= ϕ(x1 /t1 , . . .) ⇐⇒ H |= E (ϕ). 22 / 97 Endlichkeitssatz der Aussagenlogik: Eine Menge T von Formeln der Aussagenlogik ist genau dann erfüllbar, wenn jede endliche Teilmenge von Beweis ⇒ T erfüllbar ist. ⇐ sei A1 , A2 , . . . eine Varn := {A1 , . . . , An }, und ist oenbar. Für Aussagevariablen, Aufzählung aller Tn := { ϕ ∈ T | Var (ϕ) ⊆ Varn }. Zu n gibt es nur 2 n g : Varn → B, also nur k ≤ 22 [[·]] : (Varn → B) → B n Belegungen Wertverläufe (Wahrheitstafeln) A1 · · · An g1 [[·]] v1 g2 v2 . . . n En := {ϕ1 , . . . , ϕk } ⊆ Tn , ϕi ∈ En äquivalent. Also gibt es einem aus . . . n und jedes ϕ ∈ Tn ist zu 23 / 97 n ein hn : Varn → B, das En Tn erfüllt. Deniere daraus eine Belegung g , die T erfüllt. Ist g (Ak ) für 1 ≤ k < j + 1 schon deniert, so sei 1, falls es ∞ viele i mit hi (Aj +1 ) = 1 und hi =j g (dh. h |Var = g |Var ) gibt, g (Ak +1 ) := 0, sonst. S Beh.: g erfüllt jedes ϕ(A1 , . . . , Am ) ∈ T = n∈N Tn . Nach Voraussetzung gibt es zu jedem und damit ganz j j 24 / 97 Beh.: g ϕ(A1 , . . . , Am ) ∈ T = erfüllt jedes Bew.: Jedes hn mit n≥m k <m Tn ⊇ Tm , also hn mit h =m g gibt. auch das ϕ ∈ Tm . Angenommen, für gelte schon hi =k g Fall 1: n∈N Tn . erfüllt Bleibt zu zeigen, daÿ es ein ein S g (Ak +1 ) = 1. für ∞ viele Dann gilt (∗) für i ∈ N. k +1 nach Def. von (∗) g. g (Ak +1 ) = 0. Dann gibt es nur endlich viele i mit hi =k g und hi (Ak +1 ) = 0. Alle anderen hi mit hi =k g haben h(Ak +1 ) = 0, also hi =k +1 g . Nach (∗) gib es ∞ viele davon. Fall 2: 25 / 97 Satz (Herbrand 1932) Eine Aussage ∀x1 . . . ∀xn .ϕ in Skolem'schre E (ϕ) eine Normalform ist unerfüllbar genau dann, wenn unerfüllbare endliche Teilmenge hat. Vollständigkeitssatz (abstrakt) der Prädikatenlogik (Gödel 1930) Die Menge der allgemeingültigen Aussagen der Prädikatenlogik ist V : L-Aussagen → ˙ B, Berechnung von V (ϕ) semi-entscheidbar: es gibt ein Verfahren sodaÿ für jede L-Aussage ϕ die I in endlich vielen Schritten 1 ergibt, falls ϕ allgemeingültig ist, I in endlich vielen Schritten 0 ergibt oder nicht endet, sonst. V kann also von allgemeingültigen nicht von beliebigen ϕ, ob ϕ erkennen, daÿ sie es sind, aber sie es sind. 26 / 97 Vollständigkeitssatz (konkret) der Prädikatenlogik (Gödel 1930): Für bestimmte Beweiskalküle Aussagen ϕ: Wenn ϕ aus T T |= ϕ ` gilt für erststuge Theorien folgt, so ist =⇒ ϕ aus T T und beweisbar , T ` ϕ. 27 / 97 Beweis-Kalkül für die Prädikatenlogik Wir erlauben in den Sequenzen endliche Mengen Γ = ˙ s, t und ∆ von Γ . ∆ des Gentzenkalküls jetzt prädikatenlogischen Formeln. Als Axiome für nimmt man folgende Sequenzen: für jede Formel ϕ, und Variable alle Terme x: Γ . ∆, t = ˙t (= ˙ 1) Γ, s = ˙ t , ϕ(x /s ) . ∆, ϕ(x /t ) (= ˙ 2) Γ, s = ˙ t , ϕ(x /t ) . ∆, ϕ(x /s ) (= ˙ 3 ). Zum Beispiel bekommt man damit die Transitivität von (ϕ := r = ˙ x) s= ˙ t, r = ˙ s . r= ˙t = ˙ durch (= ˙ 2) 28 / 97 Für die Quantoren kommen folgende Regeln hinzu: Γ, ϕ(x /t ) . ∆ (∀L) Γ, ∀x ϕ . ∆ Γ . ∆, ϕ (∀R ), Γ . ∆, ∀x ϕ falls Γ, ϕ . ∆ (∃L), Γ, ∃x ϕ . ∆ falls x∈ / frei (Γ, ∆) Γ . ∆, ϕ(x /t ) (∃R ) Γ . ∆, ∃x ϕ x∈ / frei (Γ, ∆) Auÿerdem nimmt man noch die sogenannte Γ1 . ∆1 , ϕ ϕ, Γ2 . ∆2 Γ1 , Γ2 . ∆1 , ∆2 Schnittregel hinzu: (Cut ). Bem.: Man kann zeigen, daÿ man diese Regel nicht braucht. 29 / 97 Lemma (Korrektheit) Jede im Gentzenkalkül beweisbare Sequenz ist allgemeingültig. Bew. Man zeigt die Allgemeingültigkeit der Axiome und die Korrektheit der Regeln, d.h. daÿ bei jeder Interpretation und Belegung, die die Obersequenz(en) erfüllt, auch die Untersequenz erfüllt ist. Die Behauptung folgt dann durch Induktion über die Beweistiefe. Beispiel Alle (einstelligen) Funktionen gelten in der PL als total: . f (x )= ˙ f (x ) (=1 ) . ∃z (z = ˙ f (x )) (∃R ) . ∀x ∃z (z = ˙ f (x )) Im zweiten Schritt benutze (∀R x !) ϕ(f (x )/z ) := (z = ˙ f (x ))(z /f (x )). 30 / 97 Die Quantorenregeln legen Rezepte zur Konstruktion von Beweisen nahe. Der Spezialfall der Regel Γ . ∆, ϕ Γ . ∆, ∀x ϕ (∀R ), falls x∈ / frei (Γ, ∆) ∀x ϕ aus den Annahmen Γ zu beweisen, genügt es, aus Γ die Aussage ϕ für ein beliebiges Objekt x zu zeigen ( beliebig heiÿt also: über x wird nichts vorausgesetzt.) mit leerem ∆ besagt: um Bem. Umbenennbarkeit gebundener Variablen: ist y∈ / frei (ϕ), so ist . ∀x ϕ ↔ ∀y ϕ(x /y ) Hier ist ein Beweis für einen Teil, der andere geht analog: ϕ(x /y ) . ϕ(x /y ) ∀x ϕ . ϕ(x /y ) (∀ L) ∀x ϕ . ∀y ϕ(x /y ) (∀R , y !) . ∀x ϕ → ∀y ϕ(x /y ) (→ R ) 31 / 97 Beispiel Die Aussage ∃y ∀xR (x , y ) → ∀x ∃yR (x , y ) ist allgemeingültig (die umgekehrte aber nicht!). Ein Beweis ist: R (x , y ) . R (x , y ) ∀x R (x , y ) . R (x , y ) (∀L) ∀x R (x , y ) . ∃y R (x , y ) (∃R ) ∀x R (x , y ) . ∀x ∃y R (x , y ) (∀R , x !) ∃y ∀x R (x , y ) . ∀x ∃y R (x , y ) . ∃y ∀x R (x , y ) → ∀x ∃y R (x , y ) (∃L, y !) (→ R ) Satz (Vollständigkeit des Gentzenkalküls) Jede allgemeingültige Sequenz Γ.∆ ist mit den Kalkülregeln beweisbar. 32 / 97 Verallgemeinerte Quantoren In der Umgangssprache gibt es neben den Quantoren mindestens ein (bzw. Quantoren, z.B. für alle und jedes und für einige ) noch weitere Singular Plural 2-stellig ein einige genauso viele wie jedes alle jedes dritte drei mindestens drei viele wenige mehr als weniger als n-mal so viele wie die meisten die wenigsten ein Drittel aller 33 / 97 I Manche dieser Quantoren haben nur bei endlichen Objektbereichen einen klaren Sinn: z.B. höchstens ein Drittel der komplexen Zahlen ' ?? I Manche dieser Quantoren kann man mit Mitteln der Prädikatenlogik umschreiben, z.B. für mindestens drei ' ∃x ∃y ∃z (x 6= y ∧ x 6= z ∧ y 6= z ∧ . . .) I Manche dieser Quantoren kann man auch dann nicht in der Prädikatenlogik umschreiben, wenn man nur Interpretationen durch endliche Strukturen zuläÿt. für viele ... ' ??? 34 / 97 Was ist die Bedeutung solcher Quantoren? I Ein Quantor drückt etwas über die Quantität , d.h. Gröÿe im Sinne von Anzahl von etwas, aus. I Es geht um die Anzahl von Individuen, also um die Gröÿe von Individuenmengen. I Also: ein Quantor sollte etwas über die Individuenmengen für viele für alle für für einige die meisten A Mächtigkeit |A| von besagen. x gilt P ' |{ x | P (x ) }| ist x gilt P ' |{ x | P (x ) }| ist groÿ maximal , besser : ' |{ x | ¬P (x ) }| = 0 x gilt P ' |{ x | P (x ) }| > 0 x gilt P ' |{ x | P (x ) }| > |{ x | ¬P (x ) }| 35 / 97 Das legt nahe: Die Bedeutung eines (einstelligen) (Individuen-) Quantors ist eine Eigenschaft von (Individuen-) Mengen. Ein Quantor Q vom Typ h1i wird auf dem Universum Eigenschaft von Teilmengen von U U durch eine interpretiert: [[Q ]] ⊆ P(U ). Beispiele: [[alle ]] = { A | | A| = 0 } [[einige ]] = { A | | A| > 0 } [[die meisten]] = { A | | A| > | A| } [[Qx ϕ]] = 1 ⇐⇒ { a | [[ϕ]][x /a] = 1 } ∈ [[Q ]] 36 / 97 Determinatoren als Quantoren vom Typ h1, 1i Die natürliche Sprache hat kaum unbeschränkte Quantoren, sondern quantiziert fast nur über beschränkte Teilbereiche: unbeschränkt für alle gilt ∀x .P (x ) für einige gilt ∃x P (x ) beschränkt P P N gilt P ∀x ∈ N .P (x ) für einige N gilt P ∃x ∈ N .P (x ) Umschreibung für alle ∀x (N (x ) → P (x )) ∃x (N (x ) ∧ P (x )) Nicht jeden beschränkten Quantor kann man mit unbeschränkten Quantoren umschreiben: für die meisten N gilt P = = 6= Most x ∈ N .P (x ) |N ∩ P | > |N ∩ P | Most x (N (x ) → P (x )) o.ä. 37 / 97 Es ist daher besser, beschränkte Quantoren zu erlauben: Quantor(Restriktion,Eigenschaft) = Ein Quantor Q Q (N , P ) = Qx (N (x ), P (x )) vom Typ h1, 1i wird auf dem Universum eine Relation zwischen Teilmengen von U U durch interpretiert: [[Q ]] ⊆ P(U ) × P(U ). Beispiele: [[alle ]] = { ( A, B ) | | A ∩ B | = 0 } [[einige ]] = { (A, B ) | |A ∩ B | > 0 } [[die meisten]] = { (A, B ) | |A ∩ B | > |A ∩ B | } [[Qx (ϕ, ψ)]] = 1 ⇐⇒ ([[ϕ]], [[ψ]]) ∈ [[Q ]], wobei [[ϕ]] := { a | [[ϕ]][x /a] = 1 }. 38 / 97 Für jede Beschränkung [[die meisten N]] N erhält man eine Eigenschaft von Mengen: = { B | |N ∩ B | > |N ∩ B | } = { B | (N , B ) ∈ [[die Allgemein: aus jedem Quantor A⊆U Q erhält man einen Quantor vom Typ QA vom meisten]] } h1, 1i und einem Typ h1i durch Bereich [[Q ]]A := { B | (A, B ) ∈ [[Q ]] }. Man kann einen Quantor vom Typ h1, 1i auch als eine Funktion Q : P(U ) → P(U ) → B Q (A)(B ) := Q (A, B ) setzt. Eine mit der Syntaxregel S → NP VP aufgebaute Aussage wird dann durch die Funktionsanwendung [[S ]] = [[NP]]([[VP]]) interpretiert: betrachten, indem man [[(viele Aen) brüllen]] = [[viele Aen]]([[br üllen]]) = Q (A) (B ). 39 / 97 Quantoren und Negation In der natürlichen Sprache kann man Quantoren negieren : nicht einer = keiner; nicht viele = wenige; nicht alle = einige nicht; Jedes Q vom Typ h1, 1i hat eine äuÿere und eine innere Negation: (¬Q )(A, B ) : ⇐⇒ ¬ Q (A, B ), Der zu Q duale Quantor vom Typ (Q ¬)(A, B ) : ⇐⇒ Q (A, B ). h1 , 1 i ist Q d := ¬(Q ¬). Beispiel: ((nicht viele) Fische) iegen viele Fische iegen nicht Beispiel: ∀ und ∃ = nicht ((viele Fische) iegen) = nicht (viele(Fische,iegen)) = (viele Fische) (iegen nicht) = viele(Fische,nicht-iegen) sind zu einander dual: ∃x ∈ N ϕ ≡ ¬∀x ∈ N ¬ϕ, ∀x ∈ N ϕ ≡ ¬∃x ∈ N ¬ϕ. 40 / 97 n-stelliger Quantor Q vom Typ h1, . . . , 1i wird auf dem n Universum U durch eine n -stellige Mengen-Relation [[Q ]] ⊆ P(U ) Ein interpretiert. Dem entspricht eine Formel der Gestalt Qx (ϕ1 , . . . , ϕn ). OBdA sei das letzte Argumente das dann ist Q (A1 ) . . . (An−1 ) Prädikat von Individuen; die Bedeutung einer quantizierten NP. Quantizierte NP als Subjekt: [[(mehr A B) sind P ]] = { (A, B , P ) | |A ∩ P | > |B ∩ P | } viele A wie B sind P ]] = { (A, B , P ) | |A ∩ P | = |B ∩ P | } so viele A wie B sind P ]] = { (A, B , P ) | |A ∩ P | = 3|B ∩ P | } [[genauso [[3-mal als Quantizierte NP als Objekt: [[Fritz kennt (mehr A als B )]] = { (A, B , P ) | |A ∩ P | > |B ∩ P | } mit P (x ) = Fritz kennt x 41 / 97 Ein Quantor vom Typ hm1 , . . . , mn i wird auf U durch eine Relation [[Q ]] ⊆ P(U m1 ) × . . . × P(U m ) n zwischen (Individuen-)Relationen interpretiert. Beispiel: I h2, 2i-Quantoren Q (R , P ) ' Q (x , y )(R (x , y ), P (x , y )), mit Relationsnomen R als Restriktion und Relationsnomen oder symmetrischem Verb P als Prädikat: Alle|Einige|Viele Brüder sind Zwillinge = Q (B , Z ) I h1, 2i-Quantoren Q (R , P ) ' Q (x , y )(R (x ) ∧ R (y ), P (x , y )) mit Nomen als Restriktion und Relationsnomen oder symmetrischem Verb als Prädikat Alle Menschen werden Brüder. Einige Studenten kennen einander. Q (R ) Q : P(U ) → P(U m ) → B. Beachte: selbst bei einstelligem Nomen ist die Subjekt-NP ambig, je nach dem m ∈ {1, 2} bei 42 / 97 Eigenschaften von Quantoren Nicht jede Relation Q ⊆ P(U m1 ) × . . . × P(U m ) n entspricht einem Quantor. Was sind logische Eigenschaften von Ein Quantor Q vom Typ I Monotonie im k -ten hm1 , . . . , mn i Quantoren ? sollte u.a. erfüllen: Argument: für alle Ai ⊆ U m , Ak ⊆ A0k : i Q (A1 , . . . , Ak , . . . , An ) ⇒ Q (A1 , . . . , A0k , . . . , An ). I Invarianz unter Isomorphie: Für jede Bijektion f :U→U ist Q (R1 , . . . , Rn ) ⇐⇒ Q (f (R1 ), . . . , f (Rn )) I Erweiterbarkeit des Universums: für alle Q (A1 , . . . , An ) in Ai ⊆ U m , U ⊆ U 0 U ⇐⇒ Q (A1 , . . . , An ) i in U 0. Literatur: Stanley Peters, Dag Westerstål: Quantiers in Language and Logic. Clarendon Press, Oxford 2006 43 / 97 Die Anwendung eines Prädikats auf Nominalphrasen im Plural hat in natürlichen Sprachen verschiedene Lesarten, darunter: I die distributive Lesart: I I alle Menschen sind sterblich = Karl und Emil träumen = I die kollektive Lesart: jeder Mensch ist sterblich Karl träumt und Emil träumt 6= I Karl und Emil tragen das Klavier und Emil trägt das Klavier. Kart trägt das Klavier I die 22 Männer bildeten zwei Fuÿballmanschaften der 22 Männer bildete zwei Fuÿballmannschaften 6= jeder I die reziproke/paarweise Lesart: I Karl und Emil sind Freunde = (Karl ist Freund von Emil) und (Emil ist Freund von Karl) . I die meisten Geraden schneiden einander = für die meisten 0 Paare ( , ) von Geraden gilt: und 0 schneiden einander g g g g Welche Lesart angebracht ist, hängt vom Prädikat ab: drückt es eine Eigenschaft von Indiviuen, Gruppen oder Individuenpaaren aus? 44 / 97 Wie betrachten hauptsächlich die distributive Lesart: Q pl x ϕ := { a ∈ U | [[ϕ]][x /a] = 1 } ∈ [[Q ]] ⊆ P(U ) oder für relativierte Quantoren: Q pl x (ϕ, ψ) := ([[ϕ]], [[ψ]]) ∈ [[Q ]] ⊆ P(U ) × P(U ) Die paarweise (distributive) Lesart bindet zwei Variablen: Q pl (x , y ) (ϕ, ψ) := ([[ϕ]], [[ψ]]) ∈ [[Q ]] ⊆ P(U × U ) × P(U × U ) ψ(x , y ). Die Restriktion ϕ kann eine zweistellige Relation ϕ(x , y ) sein die meisten Freunde , oder aus einem einstelligen ϕ(x ) durch ϕ(x ) ∧ ϕ(y ) gebildet werden die meisten Geraden . und hat mindestens ein zweistelliges Prädikat Bem.: Die kollektive Lesart erfordert Formeln mit Mengenvariablen. 45 / 97 Prädikatenlogische Sprache L(Q ) L L(Q ) Sei eine erstuge prädikatenlogische Sprache. Die Erweiterung von I als I als L um den Quantor Q vom Typ hm1 , . . . mn i hat L(Q )-Terme die L-Terme, L(Q )-Formeln: 1. die atomaren L-Formeln, ϕ und ψ und Variable x auch ¬ϕ, (ϕ ∧ ψ), ∃x ϕ, Variablen ~ xi = x1 , . . . , xm und Formeln ϕ1 , . . . , ϕn auch 2. mit Formeln 3. mit i Q (~x1 , . . . , ~xn )(ϕ1 , . . . , ϕm ). n (Falls m1 = . . . = mn = k , einfach Q (x1 , . . . , xk )(ϕ1 , . . . , ϕn ).) L(Q )-Struktur ist eine L-Struktur A = (U , Q A , R A , . . .) A ⊆ P(U n1 ) × . . . × P(U m ). Man deniert einer Relation Q Eine mit n A,h A,h A [[Q (~x1 , . . .)(ϕ1 , . . .)]]A g = 1 : ⇐⇒ (ϕ1 , . . . , ϕn ) ∈ Q für h A ϕA, i := {~ai | [[ϕi ]]h[~x /~a ] } i i für i = 1, . . . , n . 46 / 97 λ-Terme λ-Terme sind eine Schreibweise für Funktionen und Daten: s , t := | | | x c (t · s ) λx t Variable Konstante Anwendung von t auf s Funktionsabstraktion von t bzgl. x Anwendung (t · s ) sind Funktion und Argument gleichrangig, man kann bei beiden eine Variable haben anders als Beachte: bei der bei f (s ) in Prolog und in der Prädikatenlogik. Bei jeder Interpretation D = (D , ·D , c D , . . .) sollte u.a. gelten: (λx t · s )D = (λx t )D ·D s D = t D [x /s D ] = (t [x /s ])D . Das will man durch mit sD = tD Termvereinfachung, s → t , D. ausrechnen können, bei allen Interpretationen 47 / 97 Termvereinfachung s → t r →t (=1 ) (r · s ) → (t · s ) s→u (=2 ) (r · s ) → (r · u ) y∈ / frei (t ) (α) λx t → λy t [x /y ] (λx t · s ) → t [x /s ] (β) r →s (=3 ) λx r → λx s x∈ / frei (t ) (η) λx (t · x ) → t Weitere Regeln legen den Umgang mit Konstanten (add · 0) · y → y , gebundene Variablen in Mit s →∗ t fest, z.B. (add · ((add · x ) · z )) · y → (add · x ) · (add · z · y ) Die syntaktische Einsetzung y ∈ frei (s ) c t t [x /s ] ist so zu denieren, daÿ umbenannt werden, damit kein in den Wirkungsbereich eines ist gemeint, daÿ man von gebundener Umbenennung) zu t s λy von t gerät. mit diesen Regeln (und kommen kann. 48 / 97 Syntaktische Einsetzung t [x /s ] Die frei in einem λ-Term frei (y ) := {y }, frei (c ) := ∅, vorkommenden Variablen sind: frei ((s · t )) := frei (s ) ∪ frei (t ), frei (λx t ) := frei (t ) \ {x }. Ersetzung (der freien Vorkommen) von x in t durch s , t [x /s ], deniert man induktiv über den Aufbau von t : ( s , falls y ≡ x , y [x /s ] := y , falls y 6≡ x Die kurz: c [x /s ] := c (r · t )[x /s ] := (r [x /s ] · t [x /s ]) λy t , λy t [x /s ] := λy (t [x /s ]), λz (t [y /z ][x /s ]), falls y ≡ x, sonst, falls sonst, mit y∈ / frei (s ), z∈ / frei (λy t · s ) 49 / 97 Beispiele für t [x /s ] λx (y · x )[x / λz (c · z )] | {z } | {z } t s λx (y · x )[y /λz (c · z )] = λx (y · x ) t [x /s ] = t , = λx (λz (c · z ) · x ) λx (y · x )[y /λz (x · z )] = λz ((y · x )[x /z ][y /λz (x · z )]) = λz ((y · z )[y /λz (x · z )]) = λz (λz (x · z ) · z ) =α λu (λz (x · z ) · u ) →∗ λu (λz (x · z ) · u ) λy λx (y · x ) · λz (x · z ) da da x∈ / frei (t ) x∈ / frei (s ) 50 / 97 Die β -Redexe eines Terms sind die Teilterme, auf die die β -Regel angewendet werden kann. Durch Anwenden der Reduktionsregeln können neue Redexe entstehen: in s = λx ((x · y ) · (x · y )) · λv v →β ((x · y ) · (x · y ))[x /λv v ] = ((λv v · y ) · (λv v · y )) =: t →β (y · (λv v · y )), →β (y · y ), enthält der Ausgangsterm s einen β -Redex und t zwei β -Redexe. der durch die Reduktion entstandene Term 51 / 97 Die Vereinfachung kann sogar divergieren! Beispiel Für t := λx ((x · x ) · (x · x )) ist (t · t ) = (λx ((x · x ) · (x · x )) · t ) →β ((x · x ) · (x · x ))[x /t ] = ((t · t ) · (t · t )) →β (((t · t ) · (t · t )) · (t · t )) →β . . . Eine uneingeschränkte Anwendungsoperation tisch, wenn man Terme zu irreduziblen · ist also problema- Werten vereinfachen will. D = (D , ·D , c D , . . .) zu d ∈ D in d ·D d links als eine Es ist auch schwierig, eine Interpretation nden, bei der man jedes Objekt Funktion interpretieren kann, die auf sich selbst angewendet wird . 52 / 97 Getypte λ-Terme Einfacher ist es, wenn man Objekte und Terme verschiedener Typen σ, τ := α | bool | int | (σ → τ ) typkorrekte Anwendungen (t · s ) benutzt, wo t von einem Funktionstyp (σ → τ ) und s vom Argumenttyp σ ist. vorsieht und nur Ein Typkontext für Variable Γ`t:τ x. Γ ist eine Liste von Annahmen Ein Term t hat im Kontext Γ x :τ von Typen den Typ τ, τ wenn nach folgenden Regeln herleitbar ist: x : σ, Γ ` x : σ (Var ) x≡ 6 y, Γ ` x : σ (Var ) y : τ, Γ ` x : σ Γ ` t : σ → τ, Γ ` s : σ (App ) Γ ` (t · s ) : τ x : ρ, Γ ` t : τ (Abs ) Γ ` λx t : (ρ → τ ) Der Kontext enthalte auch für Konstante (nur) einen Typ: c : σ, Γ ` c : σ (Const ). 53 / 97 Manche Terme haben im selben Kontext viele Typen, z.B. x : int ` x : int ` λx .x : (int → int) (Abs ) x :σ`x :σ ` λx .x : (σ → σ) Andere Terme haben keinen Typ, z.B. die x : α → β ` x : α → β, x :α`x :α x : α ` (x · x ) : β (Abs ) Selbstanwendung : (∗App ) α =?(α → β) (App ) ` λx (x · x ) : (α → β) allgemeinste Typisierung für t suchen, indem man unbekannte Typen für freie Variable annimmt und die nötigen Man kann eine Typgleichungen durch Unikation von Typen löst: f : α, x : β ` f : α f : α, x : β ` x : β f : α, x : β ` (f · x ) : γ (App , α = (β → γ)) 54 / 97 Einfachheitshalber notiert man die Typen als oberen Index, wie in (f β→γ · x β )γ , λx α→β λy (α→β)→α (x · (y · x )α )β . Beachte: Nach (Abs) haben im Term von x in t denselben Typ σ. λx σ t alle freien Vorkommen Insbesondere gilt: Γ ` (λxt · s ) : τ =⇒ Γ ` t [x /s ] : τ. Man kann zeigen: Γ`t:τ Γ ` s : τ. 1. Typerhaltung Ist von t, so ist und t →∗ s eine Vereinfachung Γ ` t : τ , so terminiert jede Reduktionsfolge t → → t 00 → . . . (bis auf α-Reduktionen) derselben Normalform nf (t ). 2. Starke Normalisierung: Ist t0 in 55 / 97 Interpretation der getypten λ-Terme Für getypte Terme ist es einfach, Interpretationen anzugeben. Sei Typ die Menge der variablenfreien Typen und λ-Terme mit Konstanten c : τc mit τc ∈ Typ. L die Sprache der Eine (volle) Typstruktur D = (hDσ iσ∈Typ , c D , . . .) besteht aus einer Familie von Universen daÿ für alle Typen I σ, τ und Konstanten D(σ→τ ) = { f | f : Dσ → Dτ } Dσ und Elementen c D , c : τ gilt: ist der Bereich aller (mengentheoretischen) totalen Funktionen von I c :τ so D wird durch ein Element c ∈ Dτ Dσ nach Dτ , interpretiert. Beachte: auch wenn die Basistypen durch endliche Bereiche wie Dbool = {0, 1} interpretiert werden, ist D doch immer unendlich. 56 / 97 e der Typ der Individuen und t (= bool) der Typ der Wahrheitswerte . Dann kann man logische Formeln als spezielle Sei λ-Terme vom Typ t ansehen: I Junktoren können wir als (getypte) Konstante verstehen: (ϕ ⇒ ψ) := ((⇒t →(t →t ) · ϕ) · ψ) I Quantoren können wir als (getypte) Konstante verstehen: ∀x ϕ := (∀(e →t )→t · λx e ϕ). I (zweistellige) Prädikate und Funktionen sind Konstante P : e → (e → t ) und f : e → (e → e ). Man kann auch Quantoren über Objekte eines Typs σ 6= e zulassen: ∀x σ ϕ := (∀(σ→t )→t · λx σ ϕ). 57 / 97 Mit λ-Termen können wir die Bedeutung von quantizierten Nominalphrasen und verallgemeinerten Quantoren ausdrücken. Eigennamen sind Konstante c : e. Peter 7→ c : e Quantizierte Nominalphrasen haben einen komplexen Typ: (alle N ) 7→ λP e →t [∀x e ((N · x ) ⇒ (P · x ))t ]t : (e → t ) → t Verallgemeinerte Quantoren vom Typ Typ h1 , 1 i sind Konstanten vom (e → t ) → ((e → t ) → t ) alle 7→ λN e →t λP e →t ∀x e ((N · x ) ⇒ (P · x ))t 58 / 97 Wir interpretieren getypte λ-Terme D = (hDσ iσ∈Typ , c D , . . .) mit in einer vollen Typstruktur D := [ { Dσ | σ ∈ Typ }. λ-Term t (x σ , . . .)τ sei eine Typisierung Γ ` t : τ von t , deren Annahmen x : σ an den freien Vorkommen von x in t stehen. σ Eine Γ respektierende Belegung g : Var → D belegt x aus Γ mit D σ σ τ einem Element g (x ) ∈ Dσ . Der Wert [[t (x , . . .) ]]g ∈ Dτ sei dann: Ein getypter [[(t σ→τ σ [[x σ ]]D g := g (x ) ∈ Dσ , Dσ [[c σ ]]D g := c ∈ Dσ , σ→τ D D σ→τ D · s σ )τ ]]D ]]g · [[s σ ]]D ]]g ([[s σ ]]D g := [[t g := [[t g ), [[λx σ t τ ]]D g := Die Anwendung (f ·D a) das f : Dσ → Dτ mit f (a) = [[t τ ]]D g [x σ /a] ist die übliche Funktionsanwendung f (a ) ! 59 / 97 Jeder Termvereinfachungsschritt nach den Regeln des eine in D Prop. Ist λ-Kalküls ist allgemeingültige Gleichung: t → s, Bew: Für die so ist für jede Belegung g (β)-Regel (λxt · s ) → t [x /s ] über D D: [[t ]]D g = [[s ]]g . sieht man das mit σ D σ D [[(λx σ t · s )τ ]]D g := [[λx t ]]g ([[s ]]g ) = [[t ]]D g [x σ /[[s σ ]]D ] = [[t [x /s ] ]]g , g σ σ τ D wobei man den letzten Schritt durch Induktion über den Aufbau von r zeigt (Ersetzungslemma). 60 / 97 Montague-Semantik Idee: Man erhält eine Bedeutung Ausdrucks α α0 Die Belegung eines natürlichsprachlichen in zwei Schritten: 1. übersetze 2. werte [[α]] α in einen getypten λ-Term α0 , in einer vollen Typstruktur g D aus: [[α]] := [[α0 ]]D g. legt die Bedeutung indexikalischer Ausdrücke (Personalpronmina, Zeit- und Ortsadverbien usw.) fest. Je nachdem, wie ausdrucksstark das betrachtete Fragment der natürlichen Sprache ist, braucht man eine andere Typsprache LTyp : I extensionale Interpretation (für statische Objekte, Relationen): Grundtypen sind e (Individuen) und t (Wahrheitswerte), I intensionale Interpretation (für Adverbien, Glaubensverben u.a.): Grundtypen sind e, t und s (Situationen, mögl.Welten) 61 / 97 Montague-Grammatik R. Montague hat um 1970 eine Alternative zur Generativen Grammatik von N. Chomsky ausgearbeitet, die eine durch eine Übersetzung der natürlichsprachlichen Ausdrücke in logische Formeln angegebene modelltheoretische Semantik hat. Die syntaktischen Kategorien A, B := e sind: (Entitätenbezeichner) | t (Aussagen) | A/B (A-Ausdrücke, denen ein B -Ausdruck fehlt) | A//B (A-Ausdrücke, denen ein B -Ausdruck fehlt) Jeder syntaktischen Kategorie wird ein Typ der Logiksprache zugeordnet. Ausdrücke der Kategorien A/B und A//B LTyp verhalten sich syntaktisch verschieden, aber semantisch gleich, und erhalten deshalb denselben Typ. 62 / 97 Die syntaktischen Kategorien der PTQ-Grammatik Montague, English The Proper Treatment of Quantication in Ordinary [?] verwendet folgende Kategorien: Kategorie Informelle Bezeichnung Basisausdruck e Eigennamen John, hen t Satz CN := t/ /e Gemeinname man IV := t/e Verbalphrase walks t/IV Nominalphrase (3.sg), Term IV/T Transitives Verb nd, love T := TV := IAV := DET := IV/IV VP-Adverb slowly t/t Satzadverb necessarily IAV/T Präposition in IV/t Verb mit Satzkomplement believe IV //IV Verb mit Innitivkomplement try T/CN Determinator every, a, the 63 / 97 Die extensionale Sprache LTyp getypter λ-Terme Die Menge Typ der einfachen Typen σ, τ Die := e | t | (σ → τ ) σ, τ ist: (Individuen) (Wahrheitswerte) (Funktionen) Sprache LTyp besteht aus den Termen t vom Typ τ , τ ∈ Typ, die wie folgt aufgebaut sind: kurz: t : τ, für jedes 1. Konstante 2. Ist s und Variable ein Term vom Typ so ist 3. Ist c :τ xσ t (s ) (oder: eine Variable und Term vom Typ Terme vom Typ solche vom Typ σ (t · s )) xτ und t sind Terme vom Typ ein Term vom Typ ein Term vom Typ t τ. (σ → τ ), τ. ein Term vom Typ τ, so ist λx σ t ein (σ → τ ). t heiÿen Formeln und e Individuenterme. werden mit ϕ, ψ bezeichnet, 64 / 97 Wir nehmen an, daÿ es folgende Konstanten ¬:t→t ∨ : t → (t → t ) ∧ : t → (t → t ) c :τ gibt: ∃τ : (τ → t ) → t ∀τ : (τ → t ) → t Für diese Konstanten wird die übliche Schreibweise benutzt, z.B. (ϕ ∧ ψ) ∀x σ ϕ statt statt ∧(ϕ)(ψ), ∀σ (λx σ ϕ), Logische Formeln sind also in den Termen von LTyp enthalten. 65 / 97 Übersetzung der syntaktischen Kategorien A werden Typen A0 von LTyp zugeordnet; A werden später in λ-Terme vom Typ A0 Syntaktischen Kategorien Ausdrücke der Kategorie übersetzt. Jeder syntaktischen Kategorie A e 0 := e t0 ein Typ A0 (A/B )0 := (B 0 → A0 ) (A//B )0 := (B 0 → A0 ). := t von LTyp wird durch zugeordnet. 66 / 97 Übersetzung der syntaktischen Kategorien Ignorieren wir die Verben mit Satzkomplement, so erhalten wir folgende Typen und entsprechende Objekte: Kategorie A e t CN := t/ /e IV := t/e T := t/IV Typ A0 von LTyp e t e→t e→t (e → t ) → t Objekt vom Typ A0 Individuum Wahrheitswert Individueneigenschaft Individueneigenschaft Eigenschaft von Individueneigenschaften TV := IV/T IAV := IV/IV (e → t ) → (e → t ) Modikator von Individueneigenschaften t/t t→t Eigenschaft von Wahrheitswerten IAV/T DET := T/CN (e → t ) → ((e → t ) → t ) 67 / 97 Basisausdrücke und ihre Übersetzung Zuerst werden den den atomaren Ausdrücken (evtl. zusammengesetzte) Terme α0 des Typs α der Kategorie A A0 zugeordnet, meist Konstante. Wir nehmen (für die extensionale Teilsprache) an: Die syntaktischen Kategorien enthalten folgende Basisausdrücke: 1. Kategorie CN (Gemeinnamen): man, woman, book John, Mary, hen (n ∈ N), Verben): walk, talk, 2. Kategorie e (Individuennamen): 3. Kategorie IV (intransitive 4. Kategorie TV (transitive Verben): 5. Kategorie DET: nd, see, read the, a, some, every. w :A wA w hat die Kategorie Bem: Eigennamen und Pronomen haben bei Montague die Wir schreiben oft oder Kategorie T, hier die Kategorie statt e. A . Das macht die Übersetzung uniformer und wird durch die Syntaxregel (S 1) kompensiert, mit der sie in Ausdrücke der Kategorie T umgewandelt werden können. 68 / 97 Jedem Wort w der Kategorie A wird eine Konstante w0 vom Typ A0 zugeordnet, auÿer bei I den Pronomina hen : e , denen die Variablen xn : e zugeordnet werden, und I den Quantoren, die wie folgt übersetzt werden: (everyDET )0 := λP e →t λQ e →t ∀x e (P (x ) → Q (x )) (aDET )0 := λP e →t λQ e →t ∃x e (P (x ) ∧ Q (x )) . (theDET )0 := λP e →t λQ e →t ∃x e ((∀y e (P (y ) ↔ x = y ) ∧ Q (x )). Die Übersezung von DET 0 = (CN 0 → αDET hat den richtigen Typ = (e → t ) → ((e → t ) → t ). T 0) 69 / 97 Für Basisausdrücke anderer Kategorien erhalten wir z.B. folgende Übersetzungen: (manCN )0 := man0 : CN 0 = man0 : (e → t ), (walkIV )0 := walk0 : IV 0 = walk0 : (e → t ), (Johne )0 := John0 : e . (heen )0 := xn : e . Bem.: Die Übersetzung des bestimmten Artikels funktioniert nicht besonders gut, und der unbestimmte Artikel sollte nicht überall wie ein Existenzquantor behandelt werden. 70 / 97 Bildung und Übersetzung zusammengesetzter Ausdrücke Die Bildung komplexer Ausdrücke geben wir durch numerierte Regeln der folgenden Form an: (S Nr.) Diese Regel besagt: ist ist der (aus α1 , . . . , αk α1 α 1 : A1 , . . . , α k : Ak α:A ein Ausdruck der Kategorie gebildete) Ausdruck α A1 usw., so von der Kategorie A. Die Übersetzung eines zusammengesetzten Ausdrucks wird durch entsprechende Regeln (T Nr.) α10 : A01 , . . . , αk0 : A0k α0 : A0 angegeben, die angeben, wie die Übersetzung von α aus den Übersetzungen der Teilausdrücke gebildet wird. 71 / 97 Bildung und Übersetzung komplexer Ausdrücke (S 1) α:e α:T (T 1) α0 : e e →t λP [P (α0 )] : (e → t ) → t (S 2) δ : DET , ξ : CN δ ξ:T (T 2) δ 0 : (CN 0 → T 0 ), ξ 0 : CN 0 δ 0 (ξ 0 ) : T 0 (S 3n ) ξ : CN , ϕ : t ξ 0 : CN 0 , ϕ0 : t (T 3n ) e ξ such that ϕ[hen /he] : CN λxn (ξ 0 (xn ) ∧ ϕ0 ) : CN 0 (S 4) α : T , δ : IV α δ 3.sg : t (T 4) α0 : T 0 , δ 0 : IV 0 α0 (δ 0 ) : t (S 5) δ : TV , β : T δ β acc : IV (T 5) δ 0 : (T 0 → IV 0 ), β 0 : T 0 δ 0 (β 0 ) : IV 0 72 / 97 (S 11a) ϕ : t, ψ : t ϕ and ψ : t (T 11a) ϕ0 : t , ψ 0 : t (ϕ0 ∧ ψ 0 ) : t (S 11b) ϕ : t, ψ : t ϕ or ψ : t (T 11b) ϕ0 : t , ψ 0 : t (ϕ0 ∨ ψ 0 ) : t (S 12a) δ : IV , γ : IV δ and γ : IV (T 12a) δ0 : e → t , γ 0 : e → t λx e (δ 0 (x ) ∧ γ 0 (x )) : e → t (S 12b) δ : IV , γ : IV δ or γ : IV (T 12b) δ0 : e → t , γ 0 : e → t λx e (δ 0 (x ) ∨ γ 0 (x )) : e → t (S 13) (T 13) α : T, β : T α or β : T α0 : T 0 , β0 : T 0 λP e →t (α0 (P ) ∨ β 0 (P )) : T 0 73 / 97 (S 14n ) α : T, ϕ:t ϕ[hen /α] : t (T 14n ) α 0 : T 0 , ϕ0 : t α0 (λxne .ϕ0 ) : t Darin werden zwei Varianten der Ersetzung 1. Die Ersetzung α ≡ hek ϕ[hen /α] ist, werden alle α[x /β] benutzt: in (S 14n ) ist so deniert: falls hen in ϕ durch hek (im jeweils gleichen Kasus) ersetzt; andernfalls wird das erste Vorkommen von hen durch α und die übrigen durch he (bzw. she, it) ersetzt, wobei der Kasus vom jeweiligen Vorkommen von hen und das Genus vom ersten Basisausdruck der Kategorie CN oder T in α übernommen wird. 2. Die Ersetzung ϕ[hen /he] in (S 3) ist etwas anders: alle hen in ϕ sollen durch he bzw. she,it ersetzt Vorkommen von werden, wobei das Genus sich nach dem Genus des ersten Basisausdrucks der Kategorie CN in ξ richtet. 74 / 97 In der Montague-Grammatik entspricht die Syntaxregel (S 4 ) der durch α : T, αδ 3.sg s4 (α, δ) = α δ 3.sg δ : IV = :t α : T, δ : IV s4 (α, δ) : t denierten Funktion s4 : T × IV → t . Der Syntaxregel ist eine Übersetzungsregel zugeordnet, (T 4) α0 : T 0 , δ 0 : IV 0 = α0 · δ 0 : t 0 die einer Bedeutungsfunktion α0 : T 0 , δ 0 : IV 0 s40 (α0 , δ 0 ) : t 0 t4 := s40 : T 0 × IV 0 → t 0 entspricht. Also hat man in der Montague-Grammatik: I Syntaxregel = Konstruktionsfunktion s : A1 × . . . × An → A I Syntaktische Struktur = Analysebaum = aus den Namen der Aufbaufunktionen s gebildeter Konstruktionsterm 75 / 97 Zu jedem Konstruktor s gibt es eine Bedeutungsfunktion t1 : A1 , . . . , tn : An (S k ) s (t1 , . . . , tn ) : A s 0: t10 : A01 , . . . , tn0 : A0n (T k ) s 0 (t10 , . . . , tn0 ) : A0 Abstrakte Syntax: I Kategorie = Typausdruck I syntaktische Struktur = Konstruktionsterm, I Syntaxregel = getypter Funktionsname ( Konstruktor ) Die Bedeutung von Ausdrücken kann dann induktiv über den Aufbau der Konstruktionsterme deniert werden. Konstruktionsterm Anwenden der Konstruktionsfunktionen Zeichenreihe s s0 ∼ Anwenden der Bedeutungsfunktionen 6 Parsen ? w Bedeutungsterm [[ ? w ]] Bedeutung 76 / 97 Übersetzung von Personalpronomen und Eigennamen Als Terme aufgefaÿte Pronomen und Eigennamen werden mit (T 1) übersetzt: ((heen )T )0 =1 λP e →t [P ((heen )0 )] : (e → t ) → t = λP e →t [P (xne )] : (e → t ) → t . ((Johne )T )0 =1 λP e →t [P ((Johne )0 )] : (e → t ) → t = λP e →t [P (John0 e )] : (e → t ) → t . In einem Modell D ist der Wert D [[λP [P (John0 )]]] ∈ D(e →t )→t D [[John0 ]] ∈ De , sondern die charakteristische Funktion der Menge aller seiner Eigenschaften. dieses Terms nicht das Individuum Das wird so kompliziert gemacht, damit die Übersetzung nach demselben Schema verläuft wie bei koordinierten Termen wie or Mary und quantizierten Termen wie every man John (s.u.). 77 / 97 Übersetzung atomarer Aussagen mit intransitivem Verb Einfache Aussagen werden wie folgt übersetzt. (((Johne )T walkIVs)t )0 =4 ((Johne )T )0 ((walkIV )0 ) : t = λP e →t [P (John0 e )](walk0 e →t ) : t 1 Mit einer β -Reduktion werden zu kann der rechte Ausdruck vereinfacht walk0e →t (John0 e ) : t , ohne daÿ sich sein Wert bei einer Belegung g über einer Struktur D ändert. Obwohl die Kategorie der Terme nur Nominalphrasen der dritten Person im Singular enthält, enthalten die Ausdrücke der Kategorie IV nicht die Vollformen, sondern die Innitive (bzw. Stammformen) der darin vorkommenden Verben. Deshalb hat die Morphologie der Vollform des Verbs keinen Einuÿ auf das Übersetzungsergebnis. 78 / 97 Aussagen mit koordinierten Eigennamen werden mit (T 4), (T 13) und den obigen Übersetzungen von Termen übersetzt wie bei (((John or Mary)T walkIVs)t )0 =4 ((JohnT or MaryT )T )0 ((walkIV )0 ) = λP [(JohnT )0 (P ) ∨ (MaryT )0 (P )]((walkIV )0 ) : t 13 = λP [λQ [Q (John0 e )](P ) ∨ λQ [Q (Mary0 e )](P )](walk0 e →t ) : t . Durch Anwendungen von β -Reduktionen kann dieser Ausdruck weiter vereinfacht werden zu λP [λQ [Q (John0 e )](P ) ∨ λQ [Q (Mary0 e )](P )](walk0 e →t ) : t → λP [P (John0 ) ∨ P (Mary0 )](walk0 e →t ) : t β →β [walke →t (John0 e ) ∨ walke →t (Mary0 e )] : t , wieder ohne daÿ sich der Wert bei einer Belegung über einer Typstruktur D ändert. Die entstandene Formel ist die, die man als Ergebnis erwartet haben sollte. 79 / 97 Die Regel (S 14) ersetzt ein Pseudopronomen hen durch einen Term, z.B. . . . every : DET man : CN . . . hen walks : t hen talks : t (S 11) every man : T hen walks and hen talks : t (S 14 every man walks and he talks : t (S 2) In den Syntaxregeln (S 3), (S 4) und (S 14) geschieht mehr als nur die Verkettung der Teilausdrücke; es sind also keine kontextfreien Regeln. 80 / 97 Übersetzung von quantiziertem Subjekt und Relativsatz Relativsätze (in schlechter Syntax) werden mit (T 3) übersetzt: ((Every man such that he walks)T talksIV )t )0 =4 ((Every man such that he walks)T )0 ((talksIV )0 ) : t = ((EveryDET (man such that he walks)CN )T )0 (talks0 e →t ) : t = (EveryDET )0 (((man such that he walks)CN )0 )(talks0 e →t ) : t 2 = =3 =4 = →β →β →β →β IV t 0 e →t CN 0 (EveryDET )0 (((manCN such that (heT n walks ) [hen /he]) ) )(talks IV t 0 0 e →t (EveryDET )0 (λxn ((manCN )0 (xn ) ∧ ((heT ):t n walks ) ) ))(talks T IV 0 e →t DET 0 0 e →t 0 0 (Every ) (λxn (man (xn ) ∧ ((hen ) ((walks ) ))))(talks ):t (EveryDET )0 (λxn (man0 e →t (xn ) ∧ λP [P (xn )](walks0 e →t )))(talks0 e →t ) : t λP λQ ∀xk (P (xk ) → Q (xk ))(λxn (man0 e →t (xn ) ∧ walks0 e →t (xn )))(talks0 e λQ ∀xk (λxn (man0 e →t (xn ) ∧ walks0 e →t (xn ))(xk ) → Q (xk ))(talks0 e →t ) : t λQ ∀xk ((man0 e →t (xk ) ∧ walks0 e →t (xk )) → Q (xk ))(talks0 e →t ) : t ∀xk ((man0 e →t (xk ) ∧ walks0 e →t (xk )) → talks0 e →t (xk )) : t 81 / 97 Pronomenauösung innerhalb eines Satzes Auf welchen Term sich ein Pronomen bezieht, legt der Satzaufbau durch (S 14) mit Vorkommen derselben Variable ((A woman walks and she talks)t )0 = =14 = =11 =4 = =2 = hen fest. (((hen walks and hen talks)t [hen /(a woman)T ])t )0 ((a woman)T )0 (λxn .((hen walks and hen talks)t )0 ) ((a woman)T )0 (λxn .(((hen walks)t and (hen talks)t )t )0 ) IV t 0 IV t 0 T ((a woman)T )0 (λxn .(((heT n walks ) ) ∧ ((hen talks ) ) ) ((a woman)T )0 (λxn .(((heen )T )0 ((walksIV )0 ) ∧ ((heen )T )0 ((talksIV )0 ) ((aDET womanCN )T )0 (λxn .(λP [P (xn )](walks0 ) ∧ λP [P (xn )](talks0 ) (aDET )0 (womanCN )0 (λxn .(λP [P (xn )](walks0 ) ∧ λP [P (xn )](talks0 ))) λP λQ ∃x (P (x ) ∧ Q (x ))(woman0 ) (λxn (λP [P (xn )](walks0 ) ∧ λP [P (xn )](talks0 ))) →β λP λQ ∃x (P (x ) ∧ Q (x ))(woman0 )(λxn (walks0 (xn ) ∧ talks0 (xn ))) →β ∃x (woman0 (x ) ∧ λxn (walks0 (xn ) ∧ talks0 (xn ))(x )) →β ∃x (woman0 (x ) ∧ (walks0 (x ) ∧ talks0 (x ))) 82 / 97 Die intensionale Sprache LTyp getypter λ-Terme Die Extension (Umfang) eines Begris ist die Gesamtheit der unter den Begri fallenden Objekte, die Intension (Sinn) alles, was mitgemeint ist (die Gesamtheit der Oberbegrie). Ein Kontext ist ein Text mit einer Lücke , oder ein Ausdruck γ(x ) mit einer genau einmal frei vorkommenden Variable x . Der Kontext γ(x ) γ(x ) nicht Interpretation D, g ist intensional, wenn das Ersetzungslemma für d.h. wenn für mindestens ein α und eine gilt, D [[γ(x /α)]]D g 6= [[γ]]g [x /[[α]]D ] . g Beispiel: Der Kontext γ(x ) = Emil glaubt, daÿ x . ist intensional, da Emil i.a. nicht alle wahren (oder alle falschen) Aussagen glaubt: Auch wenn D [[Maria liebt Emil]]D g = [[2 > 1]]g ist, kann es sein daÿ D [[Emil glaubt, daÿ (Maria ihn liebt)]]D g 6= [[Emil glaubt, daÿ (2 > 1)]]g . 83 / 97 Da es in der natürlichen Sprache viele intensionale Kontexte gibt, z.B. Glaubensverben mit intensionalen Argumentstellen , muÿ man bei der Bedeutung feinere Unterschiede machen als es Dt = {0, 1} für Aussagen erlaubt. Grundidee: unterscheide zwischen einer intensionalen Bedeutung und einer extensionsalen Bedeutung eines Terms Grundtypen ι ι σ, τ und Typen := | | := | | Intensionen sind σ, τ e t s ι (s → τ ) (σ → τ ) t. der intensionalen Logik sind (Individuen) (Wahrheitswerte) (Situationen) (Grundtypen) (Intensionen vom Typ τ) (Funktionen) situationsabhängige Objekte eines Typs τ , τ ) in einer Situation. Extensionen die Objekte (des Typs 84 / 97 Terme t:τ vom Typ τ sind, wenn die Teilterme von den durch Indizes angegeben Typen sind, die folgenden: t:τ := | | | | | | | | | xτ : τ cτ : τ λx σ t τ : (σ → τ ) t σ→τ (s σ ) : τ ∧ t τ : (s → τ ) ∨ t s →τ : τ ¬ϕt : t (ϕt ∧ ψ t ) : t ∀x σ ϕt : t ϕt : t (Variable) (Konstante) (Funktionsterme) (Anwendungsterme) (Intensionsbildung) (Extensionsbildung) (Formeln) 85 / 97 Eine volle Typstruktur der intensionalen Logik ist eine volle D = (Dτ , c D )τ ∈Typ aus Bereichen Dτ mit Dσ→τ = Dσ → Dτ und Intensionen(!) c D ∈ Ds →τ für jede nicht-logische Konstante c vom Typ τ . Logische Konstanten ¬, ∧, ∃τ werden wie bisher interpretiert. Typstruktur Index. Eine Proposition ist ein Element von Ds →t , d.h. ein situationsabhängiger Wahrheitswert. Ein Individuenkonzept ist ein Element von Ds →e , d.h. ein situationsabhängiges Individuum. Jedes i ∈ Ds heiÿt Situation oder mögliche Welt, oder Beispiel I Dem Ausdruck der Bundeskanzler I Der Aussage i ∈ De , Ds →e . entspricht kein sondern ein situationsabhängiges Individuum aus Das Wetter ist schön entspricht kein b ∈ Dt , sondern eine Proposition p ∈ Ds →t . Wahrheitswert 86 / 97 g D ordnet jeder Variablen x : τ bei der Belegung g ein Element g (x τ ) ∈ Dτ zu. Der Wert des D Terms t : τ in der Situation i ∈ Ds bei der Belegung g , [[t ]]g ,i wird Eine Belegung über der Typstruktur rekursiv deniert durch: [[c τ ]]D g ,i [[x τ ]]D g ,i σ→τ σ D [[t (s )]]g ,i [[λx σ t τ ]]D g ,i ∧ τ D [[ t ]]g ,i D [[∨ t s →τ ]]g ,i [[ϕt ]]g ,i D := (c τ )D (i ) ∈ Dτ , für nicht-logische Konstante, := g (x ) ∈ Dτ , σ D := [[t σ→τ ]]D g ,i ([[s ]]g ,i ), := das f ∈ Dσ→τ mit f (a) = [[t τ ]]D g [x /a],i := das f ∈ Ds →τ mit f (j ) = [[t τ ]]D g ,j := [[t s →τ ]]D g ,i (i ) ∈ Dτ ( D 1, falls [[ϕ]]g ,j = 1 := 0, sonst. für alle für alle für alle a ∈ Dσ , j ∈ Ds , j ∈ Ds , ¬(t →t ) , ∧t →(t →t ) und ∃τ : (τ → t ) → t .τ = : τ → τ → t werden wie bisher interpretiert. Die logischen Konstanten sowie die Identität 87 / 97 Damit läÿt sich G.Freges Unterscheidung zwischen Sinn (Intension) und Bedeutung (Extension) so präzisieren: Die Intension von t:τ bei D und g in der Situation i ∈ Ds ist D ∧ {| t τ |}D g ,i := [[ t ]]g ,i ∈ Ds →τ . Die Extension von t:s→τ bei D und g in der Situation i ∈ Ds ist D [[∨ t ]]g ,i ∈ Dτ . Beispiel I I {| der Morgenstern |}D g ,i der morgens erscheinende Stern (möglicherweise an jedem Tag ein anderer), [[der Morgenstern]]D g ,i ist ist der am Tag i morgens erscheinende Stern. 88 / 97 Intensionales Fragment der Montague-Grammatik Das intensionale Fragment erweitert das extensionale Fragment um (i) Modaloperatoren, (ii) Verben mit Komplementsätzen, (iii) Verben mit intensional zu interpretierenden Objekten, (iv) Adverbien, (v) Tempusformen. Mehrstellige Verben, freie Präpositionalphrasen, und das Tempus von Aussagen behandelt Montague erst in der intensionalen Teilsprache, da dies mit denselben technischen Mitteln geht, die er zur Behandlung intensionaler Phänomene braucht. 89 / 97 Grundidee: falls ein Teilausdruck A B intensionalem Kontext α (x ) A B B B 0 von α (x /β ) nicht in (β ) βB eines Ausdrucks in einem steht, wird er bei der Übersetzung übersetzt, sondern in Dadurch wird bei der Auswertung von [[(β B )0 ]] i nicht die Bedeutung β benutzt wird, der von αA (x B /β B ) g ,i , sondern der Sinn der Situation i ∧ (β B )0 . in der Situation {| (β B )0 |}g von unabhängig ist. In der natürlichen Sprache kommen intensionale Kontexte manchmal in einander geschachtelt vor, etwa in Maria glaubt, daÿ Emil zwar glaubt, sie zu lieben, es aber in Wirklichkeit nicht tut. ' Maria glaubt, Emil liebe Maria nicht, und Maria glaubt, Emil glaube, Emil liebe Maria. Um das behandeln zu können, ist es nützlich, daÿ wir in Übergang zur Intension durch ∧ t iterieren können. LTyp den 90 / 97 Übersetzung der Kategorien Jeder Kategorie e0 t0 CN 0 wird ein Typ := e := t := (e → t ) Auÿer bei und A A//B CN und IV A0 von LTyp zugeordnet: (A/B )0 := ((s → B 0 ) → A0 ) (A//B )0 := ((s → B 0 ) → A0 ). IV 0 := (e → t ). wurden die Argumentkategorien in intensionale Argumenttypen (s → B 0 ) B von A/B übersetzt. Nach den Abkürzungen der Kategorien erhalten wir zum Beispiel: T 0 = (t /IV )0 TV 0 = (IV /T )0 DET 0 = (T /CN )0 = = = = = = (s (s (s (s (s (s → IV 0 ) → t → (e → t )) → t → T 0 ) → IV 0 → ((s → (e → t )) → t )) → (e → t ) → CN 0 ) → T 0 → (e → t )) → ((s → (e → t )) → t ) 91 / 97 Basisausdrücke und ihre Übersetzung Die syntaktischen Kategorien enthalten weitere Basisausdrücke: 1. believe, claim sind von der Kategorie IV /t (transitive Verben mit Komplementsatz), 2. try, want sind von der Kategorie IV //IV (transitive Verben mit Innitivkomplement) 3. possibly, necessarily sind von der Kategorie t /t (Satzadverbien), 4. slowly, rapidly, voluntarily sind von der Kategorie IAV (Adverbien) Da die Argumente von Kategorien der Form Terme vom Typ s→ A/B oder A//B in B 0 übersetzt werden, wird bei der Anwendung von Funktionen das Argument stets eine Intension sein. Deshalb muÿ die Übersetzung der Konstanten etwas modiziert werden: 92 / 97 Variable und nicht-logische Konstante einer Kategorie Variable bzw. Konstante des Typs A0 A werden in übersetzt, z.B.: (heen )0 := xn : e (Johne )0 := John0 : e , (manCN )0 := man0 e →t : CN 0 (walkIV )0 := walk0 e →t : IV 0 (seekIV /T )0 := seek0 : (s → T 0 ) → IV 0 (believeIV /t )0 := believe0 : (s → t ) → IV 0 Logische Konstante erhalten eine besondere Übersetzung, z.B.: (aDET )0 := λP s →(e →t ) λQ s →(e →t ) ∃x e [∨P (x ) ∧ ∨Q (c )] : DET 0 0 0 (everyDET )0 := λP s →CN λQ s →IV ∀x e [∨P (x ) → ∨Q (x )] : DET 0 . 93 / 97 Bildung und Übersetzung zusammengesetzer Ausdrücke Das Subjekt eines Verbs wird extensional, die anderen Argumente intensional behandelt: Bei der Anwendung des Subjekts eine Verbalphrase zur Extension (β IV )0 ∨∧ (β 0 ) nach (T 4) wird in (T 1) zuerst von = β0 α0 auf ∧ (β 0 ) β eines Verbs α als Intensionen ∧ (β 0 ) an die übergegangen. Objekte werden dagegen nach (T 5,7,8) Funktion (αT )0 übergeben. (S 1) α:e α:T (T 1) α0 : e λP s →(e →t ) [∨P (α0 )] : T 0 (S 2) δ : DET , ξ : CN δ ξ:T (T 2) δ 0 : (s → CN 0 ) → T 0 , δ 0 (∧ ξ 0 ) : T 0 (S 3n ) (S 4) ξ : CN , ϕ : t ξ such that ϕ[hen /he] : CN α : T , δ : IV α δ 3.sg : t (T 3n ) (T 4) ξ0 : C ξ 0 : CN 0 , ϕ0 : t λxne (ξ 0 (xn ) ∧ ϕ0 ) : CN 0 α0 : (s → IV 0 ) → t , α0 (∧ δ 0 ) : t δ0 : I 94 / 97 (S 5) δ : TV , β : T δ β acc : IV (T 5) δ 0 : (s → T 0 ) → IV 0 , β 0 : T 0 δ 0 (∧ β 0 ) : IV 0 (S 6) δ : IAV /T , α : T δ αacc : IAV (T 6) δ 0 : (s → T 0 ) → IAV 0 , α0 : T 0 δ 0 (∧ α0 ) : IAV 0 (S 7) α : IV /t , ϕ : t α that ϕ : IV (T 7) α0 : (s → t ) → IV 0 , ϕ0 : t α0 (∧ ϕ0 ) : IV 0 (S 8) δ : IV //IV , β : IV δ to β : IV (T 8) δ 0 : (s → IV 0 ) → IV 0 , β 0 : IV 0 δ 0 (∧ β 0 ) : IV 0 (S 9) δ : t /t , ϕ : t δ ϕ:t (T 9) δ 0 : (s → t ) → t , ϕ0 : t δ 0 ( ∧ ϕ0 ) : t (S 10) δ : IV /IV , β : IV β δ : IV (T 10) δ 0 : (s → IV 0 ) → IV 0 , β 0 : IV 0 δ 0 (∧ β 0 ) : IV 0 95 / 97 (S 11a) ϕ : t, ψ : t ϕ and ψ : t (T 11a) ϕ0 : t , ψ 0 : t (ϕ0 ∧ ψ 0 ) : t (S 11b) ϕ : t, ψ : t ϕ or ψ : t (T 11b) ϕ0 : t , ψ 0 : t (ϕ0 ∨ ψ 0 ) : t (S 12a) δ : IV , γ : IV δ and γ : IV (T 12a) δ0 : e → t , γ 0 : e → t λx e (δ 0 (x ) ∧ γ 0 (x )) : e → t (S 12b) δ : IV , γ : IV δ or γ : IV (T 12b) δ0 : e → t , γ 0 : e → t λx e (δ 0 (x ) ∨ γ 0 (x )) : e → t (S 13) (T 13) (S 14n ) α : T, ϕ:t ϕ[hen /α] : t (T 14n ) α 0 : T 0 , ϕ0 : t α0 (∧ λxn .ϕ0 ) : t (S 16n ) α : T , δ : IV δ[hen /α] : IV (T 16n ) α0 : T 0 , δ 0 : IV 0 e λy .α0 (∧ λxn .δ 0 (y )) : IV 0 α : T, β : T α or β : T α0 : T 0 , β0 : T 0 λP s →(e →t ) (α0 (P ) ∨ β 0 (P )) : T 0 96 / 97 Beispiel Da Eigennamen und Pronomen nach (S 1) komplexe Ausdrücke der Kategorie T sind, ergibt deren Übersetzung jetzt (im Unterschied zum extensionalen Fragment): ((Johne )T )0 =1 λP s →(e →t ) [∨P ((Johne )0 )] = λP s →(e →t ) [∨P (John0 e )] : (s → IV 0 ) → t 0 s →IV 0 [∨P (x e )] : T 0 (heT n ) := λP n Dadurch erhalten wir für einfache Sätze mit intransitiven Verben das gleiche Übersetzungsergebnis wie im extensionalen Fall: ((JohnT talksIV )t )0 =4 = =β =∨∧ (JohnT )0 (∧ (talksIV )0 ) 0 0 λP s →IV [∨P (John0e )](∧ (talk0 IV )) ( (talk0 IV ))(John0 e ) (talk0 e →t )(John0 e ). ∨ ∧ 0 97 / 97