DGY 15 Semantik Universität Athen, SoSe 2010 Winfried Lechner [email protected] Handout #3 KOMPOSITIONALITÄT + REKURSION = LOGIK 1. DREI ZIELE EINER SEMANTISCHEN THEORIE 1.1. WIEDERHOLUNG Rekursion und Kompositionalität stellen zwei grundlegende Eigenschaften der menschlichen Sprache dar. Hier eine kurze Wiederholung. Rekursivität (Syntax): Sätze und Phrasen der natürlichen Sprachen weisen eine erstaunliche und interessante syntaktische Eigenschaft auf: sie können potentiell unendlich lang sein. Diese Eigenschaft kennt man auch aus anderen Bereichen, wie etwa der Mathematik. Die Menge der sogenannten natürlichen Zahlen ù ist z.B. potentiell unendlich. Dies bedeutet, daß es keine größte Zahl gibt. Wenn etwa jemand behauptet, 213 sei die größte Zahl, ist es möglich, dies auf einfache Art und Weise zu widerlegen, indem man die Zahl 1 zu der Zahl 213 hinzufügt. Man erhält dann 214, und 214 ist größer als 213. Es kann sich bei 213 also nicht um die größte Zahl handeln. Aber auch 214 ist nicht die größte Zahl. Dies ist so, da man zu 214 wiederum 1 addieren kann. Man erhält dann 215. Diese Prozedur läßt sich beliebig oft fortsetzen. Daraus folgt, daß es keine größte Zahl geben kann. Und wenn es nun keine größte Zahl gibt, muß die Menge der Zahlen unendlich sein.1 Für die weitere Diskussion ist insbesondere die Methode wichtig, mit der man bewiesen hat, daß ù potentielle unendlich ist. Der Beweis geht in zwei Schritten vor, er basiert also auf zwei ‘Zutaten’, die sich auch auf die Analyse von natürlicher Sprache übertragen lassen. Erstens benötigt man ein Objekt. Oben war dieses Objekt eine (natürliche) Zahl. Zweitens, man wendet auf dieses Objekt eine rekursive Regel an. Im konkreten Fall gibt es eine Regel, die einer jeden beliebigen Zahl den Wert 1 hinzufügt. Da das Resultat wieder eine Zahl darstellt, kann dieses Resultat nochmal als Eingabe in die Regel verwendet werden, etc... Exakt die selbe Methode führt einen zum Schluß, daß auch Sprache potentiell unendlich ist. Sprache weist also auch die Eigenschaft der Rekursivität auf.2 Wieder benötigt man zwei Zutaten für den Beweis: ein Objekt, in diesem Fall einen sprachlichen Ausdruck; sowie eine rekursive Regel, die auf dieses Objekt angewendet werden kann. Hier ist schließlich der Beweis, daß Sprache rekursiv ist. Ähnlich wie bei Zahlen geht man in zwei Schritten vor. Im ersten Schritt beginnt man mit einem sprachlichen Ausdruck, z.B. der Nominativ NP in (1)a: 1 Sie ist zudem potentiell unendlich, da wir als endliche Individuen, mit einer endlichen Anzahl an Zellen in unserem Gehirn, kein Objekt erkennen können, das tatsächlich (also nicht nur potentiell) unendlich ist. 2 Der folgende Artikel im New Yorker beschreibt die Debatte um Rekursion auf unterhaltsame Art und Weise: http://www.newyorker.com/reporting/2007/04/16/070416fa_fact_colapinto Bitte Vorsicht, der New Yorker ist keine wissenschaftliche Zeitschrift, sondern so etwas wie Spiegel für amerikanische Intellektuelle. (Und Spiegel ist natürlich sowas wie Bild für Intellektuelle.) (1) a. b. c. d. der Freund ...... der Mann der Bruder des Mannes des Bruders des Mannes die Frau der Frau der Frau der Frau Dann, im zweiten Schritt, wendet man auf dieses Objekt - die NP - eine rekursive Operation an. Konkret sieht diese Operation wie in (2) aus: (2) Rekursive Regel Verbinde eine NP mit einer anderen NP auf der linken Seite (und verändere den Kasus der ursprünglichen NP von Nominativ zu Genitiv) Nach der Anwendung von (2) auf (1)a erhält man als Resultat (1)b. Wird diese Regel nochmals angewendet, ist das Ergebnis (1)c. Eine weitere, dritte Applikation führt zu (1)d. So wie bei der Produktion von Zahlen ist es offensichtlich, daß es keinen natürlichen Endpunkt gibt, an dem man die ‘größte mögliche NP’ generiert hätte - genausowenig wie es keine ‘größte Zahl’ gibt, existiert auch keine ‘größte NP’. Sprache ist daher, zumindest in gewissen Bereichen, potentiell unendlich. Es handelt sich bei der Rekursivität von Sprache auch nicht um ein isoliertes Phänomen. Neben den Konstruktionen, die bereits in Handout #2 besprochen wurden, und pränominalen Genitiven wie in (1), sind z.B. Konjunktionen (d.h. NPs, die mit dem Konnektor und3 verbunden werden) typische Vertreter von rekursiven Strukturen. (3) dokumentiert dieses Phänomen mit konjungierten VPs: (3) a. Donald aß b. Donald aß und schlief c. Donald aß und schlief und träumte ...... Kompositionalität (Semantik): Eines der wichtigsten Ziele der natürlichsprachlichen Semantik besteht in der Formulierung einer Theorie, die es erlaubt, Satzbedeutungen (d.h. Mengen von Situationen), systematisch aus den Bedeutungen der Satzteile (d.h. Individuen und andere Denotationen, die wir noch nicht kennengelernt haben) herzuleiten. Zum Beispiel sollte sich die Bedeutung von einem Satz wie Maria las ein blaues Buch nur aus (i) den Bedeutungen der einzelnen Wörter lesen, Maria, las, blau und Buch, sowie (ii) aus der Art, wie diese Bestandteile miteinander kombiniert werden, ergeben. Eine solche Theorie nennt man kompositional, da sie erklärt, wie aus einfachen Denotationen neue, komplexere Bedeutungen gebaut werden können. Kompositionalität ist eine Eigenschaft der Semantik. Jede sinnvolle und brauchbare semantische Theorie ist kompositional. Kompositionalität stellt auch einen wichtigen Faktor bei der Erklärung dar, wie Menschen Sprache erwerben. Auf der einen Seite kann unser Gehirn nur eine endliche Menge an Information speichern. Auf der anderen Seite sind wir jedoch in der Lage, jeden wohlgeformten, 3 Zur Erinnerung: Objektsprache wird, wie üblich, durch Fettdruck/bold face markiert. 3 DGy15 Semantik, SoSe 2010 neuen Satz unserer Sprache zu verstehen. Daraus folgt, daß Sprecher die Bedeutung von Sätzen nicht gelernt haben können. Es muß daher ein System geben, daß aus einer endlichen Anzahl von abstrakten Repräsentationen (den Einträgen für die einzelnen Wörter im mentalen Lexikon) Unendliches schafft (. produziert). Genau für diese Aufgabe ist Rekursivität verantwortlich. Dieses System besteht also aus einer relativ kleinen Anzahl von rekursiven syntaktischen Regeln, mit deren Hilfe komplexe Bedeutungen kompositionalen gebaut werden können. Diese Regeln bilden einen Bestandteil der mentalen Grammatik, die jedem Sprecher angeboren ist. Was wir bisher gesehen haben ist, daß die Semantik der natürlichen Sprache auf einer kompositionalen semantischen Theorie aufbauen muß, und daß diese Semantik rekursive syntaktische Strukturen interpretiert. Wie eine solche kompositionale Theorie konkret aussieht, wurde bisher jedoch noch nicht erklärt. Das Ziel dieses Handouts ist es daher, die ersten Schritt in Richtung einer kompositionalen Semantik zu unternehmen. FRAGE: Ist es möglich, eine semantische Theorie zu erstellen, die kompositional, aber nicht rekursiv ist? 1.2. DREI ZIELE Bereits vor einiger Zeit, in Handout #1, wurden drei unterschiedliche Grundelemente der Bedeutung identifiziert: Individuen, Situationen und Wahrheitswerte. Das Erstellen einer kompositionalen Semantik, die alle drei Komponenten beinhaltet, erweist sich jedoch als recht anspruchsvoll, und wird daher nicht Teil dieses Kurses sein. Statt dessen werden wir uns hier auf eine semantische Theorie konzentrieren, die sich auf eine einzige dieser Komponenten, nämlich die Wahrheitswerte, beschränkt. Diese Vorgehensweise ist auch deshalb sinnvoll, da die Wahrheitswerte eine besondere, fundamentale Stellung nicht nur in der Beschreibung von Bedeutungen, sondern auch in der Darstellung der Beziehung zwischen Bedeutungen einnehmen, und Beziehung zwischen Bedeutungen zentral für das Verständnis von Kompositionalität sind, wie die nächsten Abschnitte zeigen werden. Der weitere Verlauf des Handouts ist wie folgt strukturiert. Zu Beginn wird gezeigt werden, daß die Beschreibung der Denotationen, also die semantische Metasprache, exakt und präzise sein muß, um nicht zu Verwirrung und Inkonsistenzen zu führen (Abschnitt 2). Natürliche Sprachen leiden jedoch an einem Problem: sie sind, zumindest auf den ersten Blick, nicht besonders exakt, und erfüllen daher das Kriterium an eine semantische Metasprache nicht. Dieses Fehlen von Präzision hat zur Folge, daß sich natürliche Sprachen nicht sonderlich gut dazu eignen, Bedeutungen darzustellen. In Abschnitt 2.2 wird das Problem der fehlenden Präzision anhand eines äußerst wichtigen semantischen Phänomens, der sogenannten Ambiguität, dargestellt werden. #3: Aussagenlogik 4 Somit ergibt sich aus der bisherigen Diskussion, daß eine semantische Theorie die drei Charakteristika in (4) besitzen sollte: (4) I. II. III. Die Theorie muß kompositional sein. Die Theorie sollte so präzise wie möglich sein. Die Theorie muß es ermöglichen, Beziehungen zwischen Bedeutungen zu beschreiben. Wir wenden uns daher im Anschluß, im Hauptteil dieses Handouts, einem einfachen semantischen System zu, daß diese drei Eigenschaften in (4) aufweist. Es handelt sich dabei um die Aussagenlogik. Dabei wird insbesondere gezeigt werden, wie dieses System verwendet werden kann, um die Bedeutungen von natürlichsprachlichen Ausdrücken darzustellen. 2. PRÄZISION UND AMBIGUITÄT Der vorliegende Abschnitt zeigt, warum semantische Beschreibungen präzise sein müssen. Weiters wird anhand des Phänomens der Ambiguität nachgewiesen werden, daß natürliche Sprachen diese Eigenschaft der Exaktheit nicht im gewünschten Sinne besitzen. 2.1. WAS IST EINE PRÄZISE SEMANTISCHE METASPRACHE? Bisher wurden bei der semantischen Analyse Sätze aus einer natürlichen Sprache, die als Objektsprache fungierte (in unserem Fall Deutsch) in eine semantische Metasprache (wiederum Deutsch) übersetzt. Die Metasprache wurde dabei mit einigen Symbolen aus der Mengentheorie ({, }, |, =) angereichert: (5) ƒDie Sonne scheint und es hat 23°„ = {s|Die Sonne scheint in s und es hat 23° in s} Da die Beziehung zwischen Objektsprache und semantischer Metasprache vollkommen systematisch ist, also für jeden beliebigen Satz gilt, war es möglich, eine Regel zu erstellen, mit deren Hilfe man die Bedeutung jedes beliebigen Satzes beschreiben kann. Diese Formel wird unten in leicht modifizierter Form nochmals wiederholt (s. Handout #1, S. 12: (37)): (6) Satzbedeutung: Für jeden Satz G gilt: ƒG„ = {s| G in s} (“die Menge der Situationen, sodaß G in s zutrifft/wahr ist”) Doch dieses Verfahren hat - neben der Tatsache, daß es nicht kompositional definiert ist - einen entscheidenden Nachteil. Die metasprachlichen Bedeutungen sind nicht immer so präzise und exakt, wie man sich das bei der Beschreibung von Bedeutungen wünschen würde. Was meint z.B. ein Sprecher, wenn er (7) äußert? (7) Hans schwört nicht die Wahrheit zu sagen a. {s| Hans schwört, zu lügen} b. {s| Hans weigert sich zu schwören, die Wahrheit zu sagen} Will er damit ausdrücken, daß Hans schwört zu lügen, oder aber daß Hans nicht versprechen will, immer die Wahrheit zu sagen? Im ersten Fall sagt Hans, wenn er sein Versprechen hält, nie 5 DGy15 Semantik, SoSe 2010 die Wahrheit. Im zweiten Fall ist es durchaus möglich, daß er auch einmal nicht lügt. Diese beiden Versprechen drücken also zwei völlig unterschiedliche Bedeutungen aus. Daraus folgt, daß der Satz in (7) zwei unterschiedliche Interpretationen besitzt, die zwei unterschiedliche Mengen von Situationen denotieren (s. (7)a und (7)b). Man nennt Sätze wie (7), die mehr als eine Bedeutung besitzen, auch ambig. Da nun alle menschlichen Sprachen dieses Phänomen der Ambiguität aufweisen, steht man vor einem Problem. Wie kann sichergestellt werden, daß die Bedeutungen in der Metasprache nicht auch Ambiguität aufweisen? Dann wäre es nicht möglich, die Denotation eines Satzes exakt festzulegen. Da der Einfluß von Ambiguität nun nicht generell ausgeschlossen werden kann, ist es notwendig, eine Sprache als Metasprache zu verwenden, die nicht durch Ambiguität ‘verunreinigt’ ist. Eine solche Sprache wird, wie in Abschnitt 3 gezeigt werden wird, durch die Logik zur Verfügung gestellt. Doch bevor wir uns den Eigenschaften der Logik zuwenden, ist es hilfreich, sich noch etwas genauer mit dem Begriff der Ambiguität auseinanderzusetzen. Ambiguität stellt nämlich eine der fundamentalen semantischen Charakteristika menschlicher Sprache dar. 2.2. AMBIGUITÄT In natürlichen Sprachen gibt es Ausdrücke, die mit mehr als einer Bedeutung assoziiert sind. Derartige Ausdrücke werden als ambig bezeichnet. Das Phänomen der Ambiguität tritt in zumindest zwei unterschiedlichen Arten auf. (Daneben gibt es noch eine dritte Art, die sogenannten Skopusambiguität.) 2.1. TYP 1: LEXIKALISCHE AMBIGUITÄT Im Fall von lexikalischer Ambiguität (auch Homophonie genannt) besitzt eine einzige lautliche Form eines Wortes mehr als eine Bedeutung: (8) a. φύλλα : b. φίλα : c. φύλα : (9) a. b. c. d. e. [fila] [fila] [fila] ‘Blätter’ ‘Küsse!’ ‘Geschlechter’ Jugendliche sprengten die Bank in die Luft Sitzgelegenheit oder Geldinstitut Hans zeigte uns den Strauß Strauß Blumen oder Vogel Sie erkannte die Bedeutung des Satzes nicht Wichtigkeit oder Denotation Das Schloss war alt Gebäude oder Schließvorrichtung Wir wollten das Schild umfahren daran vorbeifahren oder darüber hinwegfahren Generell ist es sinnvoll, Bedeutungen so zu definieren, daß jedes einzelne Wort - also jeder Lexikoneintrag - nur eine einzige Denotation zugewiesen erhält.4 Eine Möglichkeit, ambige 4 Dies folgt auch aus den beiden Annahmen, daß (i) Denotationen mittels einer Funktion ermittelt werden, und daß (ii) Funktionen Relationen sind, die jedem Objekt immer nur einen einzigen Wert zuweisen. Es ist daher nicht möglich, etwa die Ambiguität von Schloß so wie in (i) zu erfassen: (i) ƒSchloß„ = großes, palastartiges Gebäude,... ƒSchloß„ = Schließvorrichtung an Türen,.... #3: Aussagenlogik 6 Lexikoneinträge darzustellen besteht dann darin, diese Ausdrücke durch das Anfügen eines sogenannten Subskripts, also eines kleinen Zusatzes, zu desambiguieren: (10) a. Schloß1: b. Schloß2: ‘das Gebäude’ ‘die Vorrichtung zum Verschließen einer Tür’ Test für Ambiguität: Es gibt eine einfache Methode festzustellen, ob ein Ausdruck ambig ist, oder nicht. Diese Methode läßt sich als Test verwenden, der so wie in (11) formuliert werden kann: (11) Ein Test für Ambiguität Ein Ausdruck ist ambig, wenn ein Satz, in den dieser Ausdruck eingebettet wird, in ein und dem selben Kontext sowohl wahr als auch falsch sein kann. Anwendung des Tests: Der Ausdruck Athen wird in den Satz (12) eingebettet. Dieser Satz kann nun sowohl als wahr als auch als falsch interpretiert werden. Daraus kann geschlossen werden, daß Athen ambig ist. (12) Athen liegt in Georgia a. wahr, wenn mit Athen eine Stadt in Georgia, USA gemeint ist b. falsch, wenn mit Athen die Hauptstadt von Griechenland gemeint ist 2.2. TYP 2: STRUKTURELLE AMBIGUITÄT Neben der lexikalischen Ambiguität wird natürliche Sprache durch das Phänomen der strukturellen Ambiguität charakterisiert. Bei struktureller Ambiguität sind nicht die Lexeme die Auslöser der Ambiguität, sondern es wird Phrasen oder ganzen Sätzen mehr als eine syntaktische Struktur zugeordnet: (13) Hans und Maria sahen den Mann mit dem Fernglas a. Hans und Maria sahen einen Mann, und dieser Mann hatte ein Fernglas b. Hans und Maria sahen einen Mann, und sie taten dies mit Hilfe eines Fernglases. Satz (13) ist ambig und besitzt zwei unterschiedliche Interpretationen (auch Lesungen oder Lesarten genannt). Um zu verstehen, worin die Ambiguität liegt, und was diese verursacht, ist es notwendig, jede dieser beiden Lesungen so präzise wie möglich darzustellen. Zu Beginn der Analyse wird daher jede Interpretation in eine Paraphrase, so wie in (13)a und (13)b gezeigt, umgeformt. Paraphrasen sind also Umformungen eines ambigen Satzes, die nur mehr eine der möglichen Lesarten zulassen. Anders ausgedrückt desambiguieren Paraphrasen vormals ambige Ausdrücke. Die charakteristische Eigenschaft der syntaktischen Ambiguität besteht nun darin, daß jede Interpretation mit einer unterschiedlichen syntaktischen Struktur verbunden ist. Der Grund für die Ambiguität von (13) liegt also in der Tatsache, daß die Wortfolge Hans und Maria sahen den Mann mit dem Fernglas auf zwei unterschiedliche Arten als syntaktischer Baum analysiert werden kann. In Lesung (13)a modifiziert die PP mit dem Fernrohr das Nomen Mann, so wie 7 DGy15 Semantik, SoSe 2010 in (14)a gezeigt. Wird (13) dagegen so wie in (13)b verstanden, dann fungiert die PP als Modifikator des Prädikats den Mann sehen, und wird daher an die VP adjungiert (s. (14)b): (14) a. [CP Hans und Maria [C sahen [VP [DP den [NP [NP Mann [PP mit dem Fernglas]]]]]]] b. [CP Hans und Maria [C sahen [VP [VP [DP den [NP Mann]] [PP mit dem Fernglas]]]]]] Natürliche vs. formale Sprachen: Im Gegensatz zu natürlichen Sprachen gibt es in den sogenannten formalen Sprachen (Mathematik, Logik, Programmiersprachen, ...; s. Abschnitt 3) keine Ambiguität. Dort, wo Ambiguitäten auftreten könnten werden sie entweder durch Verwendung von Klammern oder durch Konvention (. Übereinkunft) vermieden. Die Formel in (15) kann z.B. aufgrund einer Konvention nur so wie in (15)a interpretiert werden: (15) 9x2+5 a. (9 x 2) + 5 b. 9 x (2 + 5) [= 23] [= 90] (mögliche Interpretation von (15)) (unmögliche Interpretation von (15)) Darstellung von Ambiguität: Am besten stellt man sich einen ambigen Satz nicht als ein einzelnes Objekt, sondern als ein Paar von Sätzen vor, die nur zufälligerweise gleich klingen. (14) illustriert dies mit einem Beispiel. Die beiden Sätze in (14) sind zudem nicht vollständig ident, sondern können, wie gezeigt wurde, durch deren unterschiedliche Struktur von einander unterschieden werden. Betrachten wir als ein zweites Beispiel nochmals den ambigen Satz (7): (7) Hans schwört nicht die Wahrheit zu sagen Auch hier gibt es nach dem oben Gesagten eigentlich zwei Sätze, die nur scheinbar in (7) zusammenfallen. Wieder ist es möglich, diese beiden Sätze durch ihre syntaktische Struktur auseinander zu halten. Konkret bezieht sich in einem Fall die Negation nicht auf das obere Verb schwören ((16)a) , wohingegen in der anderen Lesung die Negation das eingebettete Prädikat die Wahrheit zu sagen modifiziert ((16)b): (16) a. [CP1 Hans schwört1 [VP1 nicht t1 [CP2 die Wahrheit zu sagen]]] b. [CP1 Hans schwört [CP2 [VP2 nicht die Wahrheit zu sagen]]] Aus diesen Beobachtungen folgt eine wichtige, allgemeine Konsequenz: die Bedeutung eines komplexen Ausdrucks ist von seiner Struktur abhängig. (7) besitzt z.B. zwei mögliche Interpretationen, da ein und der selben Form - dem Ausdruck (7) - zwei unterschiedliche syntaktische Strukturen ((16)a und (16)b) zugewiesen werden. Dies unterstützt die Hypothese, daß das semantische System Bedeutungen kompositional berechnet. Nach dem Konzept der Kompositionalität wird die Gesamtbedeutung aus den Teilbedeutung abgeleitet, sowie aus der Art und Weise, wie diese verbunden werden. Und zu dieser ‘Art und Weise der Verbindung’ zählt naturgemäß eben auch die syntaktische Struktur. #3: Aussagenlogik 8 Der nächste Abschnitt kehrt zum Hauptthema dieses Handouts zurück, der Suche nach einer kompositionalen und präzisen Theorie der Bedeutung. Dazu wird zunächst kurz die Aufgabe der Logik skizziert werden. Im Anschluß daran wird die einfachste Logik, die Aussagenlogik, vorgestellt werden. Auf der Basis dieser Diskussion wird ersichtlich werden, wie Kompositionalität funktioniert, und wie eine präzise semantisches System aussehen sollte. 3. LOGIK, FORMALE UND NATÜRLICHE SPRACHEN 3.1. LOGIK Nehmen wir an, jemand weiß, daß die beiden Aussagen in (17)a und (17)b zutreffen. Dann wird dieser Sprecher auch dem Satz (17)c zustimmen müssen. Dies ist so, da (17)c logisch aus (17)a und (17)b folgt. Es handelt sich bei der Abfolge von Sätzen in (17) um eine logische Folgerung, da es nicht denkbar ist, daß (17)a und (17)b wahr sind, (17)c jedoch falsch ist. Der Pfeil Y symbolisiert dabei diese Beziehung, und zeigt an, daß die rechts stehende Aussage aus den darüber stehenden Aussagen folgt. (17) Gültiger Schluß Generelles Schema a. Alle Menschen sind sterblich b. Alle Athener sind Menschen c. Y Alle Athener sind sterblich Alle A sind B Alle C sind A Alle C sind B Im Gegensatz dazu wird ein Sprecher, der (18)a und (18)b als wahr anerkennt, zum Schluß kommen, daß (18)c nicht unbedingt zutreffen muß. Es ist natürlich möglich, daß (18)c zutrifft, dann nämlich, wenn einige Chinesen zwei Staatsbürgerschaften besitzen, aber dies ist nicht notwendigerweise so. (18) Ungültiger Schluß Generelles Schema a. Einige Anwälte sind Briten b. Einige Chinesen sind Anwählte c. Y / Einige Chinesen sind Briten Einige A sind B Einige C sind A Einige C sind B (17) wird auch als ein gültiger logischer Schluß bezeichnet; der Schluß in (18) ist dagegen ungültig. Die Logik befaßt sich im weitesten Sinne mit der Frage, wie gültige logische Schlüsse definiert werden, also wie Argumente aufgebaut sein müssen, um als formal korrekt angesehen zu werden. Genauer gesagt untersucht die Logik, welche Form ein logischer Schluß haben muß, um gültig zu sein. Unter der Form eines Schlusses versteht man das Schema, das diesem Schluß zugrunde liegt. Die beiden Schemata für (17) und (18) werden z.B. am rechten Rand der Seite angezeigt. Ohne näher auf den Begriff des Schemas einzugehen, ist es offensichtlich, daß sich die beiden Schlüsse in (17) und (18) formal nur in einem Punkt unterscheiden: das Schema (17) 9 DGy15 Semantik, SoSe 2010 verwendet dreimal den Quantor5 alle NP. In (18) dagegen findet sich an analoger Stelle dreimal der Ausdruck einige NP. Eine klassische Aufgabe der Logik besteht nun darin, zu zeigen, wie und warum dieser Unterschied für die unterschiedliche Gültigkeit der beiden Schlüsse verantwortlich ist. In der Logik wird also die Form von logischen Schlüssen untersucht. Die Form des Schlusses zeigt sich wiederum in den Gesetzmäßigkeiten der Schemata (dreimal alle NP in (17) vs. dreimal einige NP in (18)). Die Logik kann daher auch als die Lehre von den Gesetzen des Denkens bezeichnet werden. So wie andere Naturgesetze (Gravitation, etc...), können diese Gesetze des Denkens präzise als Regeln definiert werden. Wie sich zeigen wird, ist diese Präzision eine erste Eigenschaft, die für die Diskussion der natürlichsprachlichen Semantik wichtig ist. Zwei weitere Eigenschaften sind Kompositionalität und die Fähigkeit, Beziehungen zwischen Bedeutungen darzustellen. Durch Einführung der Logik in das System lassen sich demnach die drei Anforderungen an eine semantische Theorie, die eingangs in (4) formuliert wurden, verwirklichen. (4) I. II. III. Die Theorie muß kompositional sein. Die Theorie sollte so präzise wie möglich sein. Die Theorie muß es ermöglichen, Beziehungen zwischen Bedeutungen zu beschreiben. Im Folgenden wird die einfachste Art der Logik, die Aussagenlogik, dargestellt werden. Um zu erkennen, wie die Komponenten der Aussagenlogik aufgebaut sind, ist es sinnvoll, zuerst kurz einige wichtige, allgemeine Eigenschaften von formalen Sprachen, zu der auch die Aussagenlogik gehört, kennen zu lernen. 3.2. FORMALE SPRACHEN Die Aussagenlogik zählt - so wie andere moderne Logiken, die Programmiersprachen, oder auch der Morsecode - zu den formalen Sprachen. Formale Sprachen verwenden im Gegensatz zu natürlichen Sprachen nur eindeutige, nicht ambige, Ausdrücke. Dies ist der Kern der Idee der Formalisierung. Formalisierung hilft daher insbesondere, Unklarheiten, die bei Verwendung von menschlicher Sprache entstehen, zu vermeiden (s. Diskussion zu Ambiguität). (19) zeigt zwei typische Repräsentanten von Sätzen der Aussagenlogik. (Was sie bedeuten wird in Abschnitt 4 und 5 erklärt werden.) Es ist auf den ersten Blick offensichtlich, daß sich das Paar in (19) deutlich von Ausdrücken, die in natürlichen Sprachen vorkommen, unterscheiden. (19) a. p v (q ÿ r) b. (r w ¬p) v (¬p ÿ (q v w)) Generell zeichnen sich formale Sprachen durch zumindest die vier untenstehenden Eigenschaften gegenüber natürlichen Sprache aus: 5 Etwas vereinfacht ist ein Quantor ein Ausdruck, der Einheiten zählt oder mißt. Einige Beispiele: jedes Tier, kein Wasser, die meisten Steine, oft, manchmal, mehr Bier, nirgendwo,... #3: Aussagenlogik (20) 10 a. Formale Sprachen weisen keine Ambiguitäten auf. b. Formale Sprachen sind durch sehr strenge formale Prinzipien reglementiert. In formalen Sprachen gibt es nur eine kleine Anzahl an einfachen syntaktischen Regeln (s.u.), und keine produktiven, syntaktischen Operationen wie z.B. syntaktische Bewegung, welche die Syntax verändern könnten. c. Formale Sprachen sind (meist) symbolisch. In einer Formel werden alle natürlichsprachlichen Ausdrücke durch konkret definierte Symbole ersetzt. Diese Symbole kommen üblicherweise nicht in den natürlichen Sprachen vor. d. Es gibt keine ‘kompetenten Sprecher’, welche diese Systeme als Muttersprache erworben hätten. Bei formalen Sprachen handelt sich also nicht um biologische Kommunikationssysteme. Auf die Frage, wie diese Unterschiede zustandekommen, und wie natürliche Sprache in formale Sprache übersetzt wird, wird zu einem späteren Zeitpunkt noch eingegangen werden. 3.3. AUSSAGENLOGIK: DIE IDEE Die Aussagenlogik (sie wird auch Propositionale Logik genannt) ist ein semantisches System, das nur mit den beiden Wahrheitswerten wahr und falsch arbeitet, das also ohne Verwendung von Individuen und Situationen auskommt. Zwar kann diese Theorie noch nicht alles beschreiben, was von einer adäquaten natürlichsprachlichen Semantik verlangt wird. Sie erlaubt aber aufgrund seiner relativen Einfachheit einen ersten Eindruck von der Arbeitsweise des Prinzips der Kompositionalität zu erlangen, sowie auch in die anderen beiden Kriterien aus (4). Die Aussagenlogik stellt die einfachste aller kompositionalen formalen Sprachen dar. Die Aussagenlogik befaßt sich mit den systematischen Bedeutungsrelation zwischen Aussagen (= Sätzen, Propositionen). Betrachten wir ein Beispiel. Aus Satz (21)a folgt z.B. notwendigerweise Satz (21)b, sowie auch Satz (21)c. Wenn (21)a wahr ist, dann müssen auch (21)b und (21)c wahr sein. Dagegen folgt aus (22)a weder (22)b noch (22)c: (21) a. Hans wartet auf den Bus und Hans liest b. Y Hans wartet auf den Bus c. Y Hans liest (22) a. Hans wartet auf den Bus oder Hans liest b. Y / Hans wartet auf den Bus c. Y / Hans liest Da nun der einzige Unterschied zwischen (21) und (22) in der Verwendung von und bzw. oder besteht, muß dieser Unterschied für den Kontrast zwischen (21) und (22) verantwortlich sein. Der Konnektor und stellt also systematisch eine andere Beziehung zwischen den Satzteilen her, als der Konnektor oder. In der Aussagenlogik untersucht man nun, welchen konkreten semantischen Beitrag die Konnektoren und bzw. oder zur Gesamtbedeutung liefern. Zudem erstellt man Regeln, welche die Bedeutung von und bzw. oder mit den beiden Teilsätzen verbinden, um zur Gesamtbedeutung zu gelangen. Man verfährt also so wie in (23) dargestellt: 11 (23) DGy15 Semantik, SoSe 2010 ƒHans wartet auf den Bus und Hans schläft„ = {s| ? } q ! p ƒHans wartet auf den Bus„ ={...} ƒund„ ƒHans schläft„ = {s|...} Dabei wird, dem Prinzip der Kompositionalität folgend, die Gesamtbedeutung eines Satzes systematisch aus den Bedeutungen der Teile abgeleitet. Im Folgenden wird gezeigt werden, wie dies im Detail funktioniert. Formale Sprache, besitzen - genauso wie natürliche Sprachen - eine Syntax und eine Semantik. Die Syntax definiert, welche Form die Sätze der Aussagenlogik haben. Sätze, die syntaktisch wohlgeformt sind werden auch als wohlgeformte Formeln (WFFs, ausgesprochen [vcfs]) bezeichnet. Die Semantik legt dann fest, welche Bedeutung diese WFFs erhalten. Im folgenden Abschnitt 4 wird die Syntax der Aussagenlogik genauer definiert. Abschnitt 5 beschreibt die Interpretation. 4. SYNTAX DER AUSSAGENLOGIK Die Syntax von formalen Sprachen definiert WFFs, indem sie die Regeln auflistet, mit denen diese WFFs gebildet werden können. Das Verfahren ist jenem vergleichbar, das in der generativen Syntax Verwendung findet, wo die Menge der wohlgeformten Sätze durch die Regeln der X’-Syntax, Phrasenstrukturregeln oder ähnliche Methoden generiert werden. So wie die Regeln der natürlichsprachlichen Syntax, sind die syntaktischen Regeln der Aussagenlogik so gebaut, daß man sie, nach einer ersten Applikation, beliebig oft wieder auf das Resultat der Regel anwenden kann. Es handelt sich also um rekursive Regeln., die bereits in Handout #2 eingeführt wurden. Die Sätze der Aussagenlogik wird also durch rekursive Definition der WFFs angegeben. Konkret sieht eine solche Definition so wie in (24) aus. (24) a. BASIS: Jede atomare (nicht zusammengesetzte) Aussage ist eine WFF b. REKURSIVE REGELN i. Wenn φ eine WFF ist, dann ist auch ¬φ eine WFF (Negation, ‘nicht φ’) ii. Wenn φ und ψ WFFs sind, dann sind auch die folgenden Ausdrücke WFFs: (φ v ψ) (φ w ψ) (φ ÿ ψ) (φ : ψ) (Konjunktion, ‘φ und ψ’) (Disjunktion, ‘φ or ψ’) (Materielle Implikation, ‘wenn φ dann ψ’) (Materielle Äquivalenz, ‘φ genau dann wenn ψ’) #3: Aussagenlogik 12 ÜBUNG Sind die folgenden Formeln WFFs? Wenn nicht, dann erklären sie warum. (25) Notationelle Konvention: die äußersten Klammern werden weggelassen (26) a. ¬¬¬¬p e. ¬p v q b. ¬p¬q f. pÿ (p ÿ q v w) c. ¬(pvq) g. qv¬¬p d. ÿ p v q h. p ¬ v ¬q 5. SEMANTIK DER AUSSAGENLOGIK In der Syntax der Aussagenlogik gibt es fünf logische Operatoren: die Negation ¬, die mit nur einem Satz kombiniert wird, sowie die vier Konnektoren v, w, ÿ, :, die jeweils zwei Aussagen miteinander verbinden. Die semantischen Regeln weisen jedem dieser Operatoren eine Bedeutung zu. Am anschaulichsten werden diese Bedeutungen durch Wahrheitstafeln dargestellt.6 Die Wahrheitstafeln, die in 5.1 - 5.5 eingeführt werden, weisen jedem Operator eine Denotation zu. Die Bedeutung von komplexen Ausdrücken wie z.B. (p v q) ÿ (p : (p w ¬q)) kann zudem kompositional aus den Teilbedeutungen berechnet werden (s. Lohenstein S. 37 für Diskussion). Im abschließenden Teil 5.6 finden sich dann die rekursiven Definitionen für die Bedeutung von komplexen Ausdrücken. 5.1. NEGATION Notation: ¬p (27) Beispiele: (28) a. p: b. ¬p: c. ¬p: p ¬p 1 0 0 1 Es hat 20° Celsius Es ist nicht der Fall daß es 20° Celsius hat Es hat nicht 20° Celsius Man beachte, daß die genaue Position der Negation nicht im Satz nicht der Position in der komplexen Formel ¬p entspricht. In ¬p geht die Negation dem ganzen Satz voraus, in (28)c taucht sie jedoch mitten im Satz auf. Diese Eigenschaft läßt sich durch die Annahme erklären, daß die Negation syntaktisch in ihrer Oberflächenposition generiert wird, jedoch in der semantischen Komponente in einer anderen Position interpretiert wird. 6 Wahrheitstafeln wurden zum ersten Mal von Ludwig Wittgenstein im Tractatus logico-philosophicus (1922) sowie von Emil Leon Post (1921) verwendet. 13 DGy15 Semantik, SoSe 2010 5.2. DISJUNKTION Notation: p w q (29) p q pwq 1 1 1 1 0 1 0 1 1 0 0 0 Beispiele: (30) a. p: Es hat 20° Celsius b. q: Es regnet c. p w q: Es hat 20° Celsius oder es regnet Inklusive vs. exklusive Disjunktion: Bei dem Konnektor w handelt sich um die sogenannte inklusive Disjunktion. Wenn zwei wahre Aussagen durch w verbunden werden, dann ist die zusammengesetzte Aussage auch wahr. Im Gegensatz dazu gibt es auch die exklusive Disjunktion, die durch entweder - oder ausgedrückt wird, und die durch strengere Wahrheitsbedingungen gekennzeichnet ist: (31) (32) p q p wexklusiv q 1 1 0 1 0 1 0 1 1 0 0 0 Entweder es regnet oder es schneit 5.3. KONJUNKTION Notation: p v q (33) p q pvq 1 1 1 1 0 0 0 1 0 0 0 0 7 #3: Aussagenlogik (34) (35) 14 Es regnet, und die Straße ist naß Maria wird kommen, aber Peter ist krank 5.4. MATERIELLE IMPLIKATION Notation: p ÿ q (36) p q pÿq 1 1 1 1 0 0 0 1 1 0 0 1 (37) Wenn es regnet, dann ist die Straße naß (38) Man sollte auch Hans informieren wenn Maria eingeladen wird. (39) Wenn ein Mann in Athen ist, dann ist er nicht in Megara ÜBUNG: (Chrysippus, 6Jh v. Chr.). Der Satz in (40) ist ambig. Wie lassen sich die beiden Lesungen aussagenlogisch darstellen? (40) Hans geht auf die Party und Maria kocht wenn Peter auch kommt. a. Wenn Peter auf die Party geht, dann tritt folgendes ein: Hans geht auf die Party und Maria kocht. (Nehmen wir an, Peter geht nicht auf die Party. Unter diesen Umständen ist der Satz wahr, wenn Hans zu Hause bleibt und Maria nicht kocht.) b. Hans geht auf die Party, und wenn Peter auf die Party geht, dann kocht Maria. (Nehmen wir an, Peter geht nicht auf die Party. Unter diesen Umständen ist der Satz falsch, wenn Hans zu Hause bleibt und Maria nicht kocht. In Situationen, die dieser Satz beschreibt, muß Hans auf jeden Fall auf die Party gehen.) 5.5. BIKONDITIONAL/MATERIELLE ÄQUIVALENZ Notation: p : q (41) p q p:q 1 1 1 1 0 0 0 1 0 0 0 1 (42) Wenn Hans das Rennen gewinnt erhält er die Goldmedaille. (43) Das Licht brennt genau dann wenn die Maus den Schalter betätigt 15 DGy15 Semantik, SoSe 2010 5.6. REKURSIVE BEDEUTUNGSREGELN (Dieser Abschnitt ist nicht Teil des Stoffes!) (44) Wenn φ und ψ WFFs der Aussagenlogik sind, dann gilt: a. ƒ¬φ„ = 1 gdw. ƒφ„ = 0 b. ƒφ v ψ„ ƒφ w ψ„ ƒφ ÿ ψ„ ƒφ : ψ„ = = = = 1 1 1 1 gdw. gdw. gdw. gdw. ƒφ„ = 1 und ƒφ„ = 1 oder ƒφ„ = 0 oder ƒφ„ = ƒψ„ ƒψ„ = 1 ƒψ„ = 1 ƒψ„ = 1 6. AUSSAGENLOGISCHE VS. NATÜRLICHSPRACHLICHE KONNEKTOREN Die Denotationen der logischen, in der Aussagenlogik verwendeten Konnektoren und, oder, etc... sind der Interpretation von natürlichsprachlichen Konnektoren sehr ähnlich, aber nicht vollständig ident. Dies soll anhand von zwei Beispielen - der Konjunktion und der materiellen Implikation - verdeutlicht werden. Eine umfassendere Studie dieses Phänomene zeigt eine der Grenzen der Aussagenlogik als Analyseinstrument von natürlicher Sprache auf. Im Allgemeinen kann man mit der Aussagenlogik nur eine sehr kleine Anzahl aller natürlichsprachlichen semantischen Phänomene behandeln. Dies führt zur Entwicklung weiterer, präziserer Logiken wie etwa der Prädikatenlogik, die jedoch in diesem Kurs nicht weiter besprochen werden sollen. 6.1. KONJUNKTION Durch Konjunktion verbundene Sätze in natürlicher Sprache besitzen oft (aber nicht immer) eine zusätzliche Bedeutungskomponente. (45)a und (45)a unterscheiden sich z.B. voneinander darin, daß sie eine unterschiedliche zeitliche Reihenfolge der beiden Ereignisse nahelegen: (45) a. Hans erkrankte an einer Infektion und mußte in ein Krankenhaus eingeliefert werden. b. Hans mußte in ein Krankenhaus eingeliefert werden und erkrankte an einer Infektion. Generell werden natürlichsprachliche Konjunktionen oft nur dann als gültig interpretiert, wenn die beiden Konjunkte in einer zeitlichen Abfolge oder kausalen Relation stehen, sodaß das im ersten Konjunkt ausgedrückte Ereignis dem im zweiten Konjunkt ausgedrückten Ereignis vorangeht, oder dieses verursacht. Eine ähnliche Bedingung gilt für die Sätze der Aussagenlogik nicht: p v q hat, für jeden Wert von p und q, exakt die gleiche Bedeutung wie q v p. 6.2. IMPLIKATION VS. KONDITIONALSATZ Obwohl man dazu neigt, natürlichsprachliche Konditionale (wenn-dann) mit der materiellen Implikation (ÿ) zu assoziieren, weisen die beiden eine Reihe von wichtigen Unterschieden auf. Falscher Vordersatz I: Ein Konditional ist wahr, sobald die Proposition p, die auch der Vordersatz (oder Protasis) genannt wird, wahr ist. Dabei ist es irrelevant, ob der Nachsatz (also q, auch Apodosis genannt) wahr ist oder nicht. In der traditionellen Logik bezeichnet man diese #3: Aussagenlogik 16 Beobachtung als ex falso quodlibet (‘aus dem Falschen folgt was man will’). Warum gilt diese Bedingung nun? Intuitiv kann man ex falso quodlibet mit Beispielen wie in (46) bis (48) begründen. In all diesen Sätzen wird ein falsches p mit einem wahren q kombiniert, der daraus resultierende komplexe Satz wird dennoch als wahr interpretiert. (46) Wenn man in Athen von der Universität zum Flughafen fährt, dann sieht man das Olympische Stadion. (47) Wenn eine Zahl durch 10 geteilt werden kann, dann ist sie gerade. (48) Wenn Du beim nächsten Test eine 8 bekommst, lade ich Dich ins Kino ein. (von Fintel 2000) (46) gilt z.B. auch wenn man von der Universität nach Markopoulo fährt. Und für eine Zahl wie ‘8’ gilt der Vordersatz von (47) nicht, der Nachsatz trifft jedoch zu. Letztlich wird (48) auch als wahr empfunden, wenn man die Erwartungen übertrifft und eine 10 auf den Test bekommt, was wiederum den Vordersatz falsch macht. Natürlich wird man in dieser Situation auch eingeladen. Falscher Vordersatz II (Konditional als Bikonditional): In anderen Kontexten sieht es interessanterweise so aus, als ob der ganze Konditional als falsch interpretiert wird, wenn der Vordersatz falsch und der Nachsatz wahr ist. (49) Wenn ein Schwimmer bei einem olympischen Finalbewerb als erster das Ziel erreicht, wird dieser Schwimmer Olympiasieger. Wenn ein Schwimmer nicht als erster (bei einem olympischen Bewerb) das Ziel erreicht, dann kann er/sie auch nicht Olympiasieger werden. (49) zeigt, daß manche wenn-dann Konditionale in der natürlichen Sprache als Bikonditional interpretiert werden. Akzeptanz von Konditionalen: Im normalen Sprachgebrauch empfindet man die Sätze in (50) als eigenartig. (50) a. #Wenn der Mond aus Käse ist, dann ist Maria krank. b. #Wenn zwei und zwei fünf ist, dann gewinne ich morgen die Lotterie Dies folgt aus der Bedingung, daß in natürlichen Sprachen die beiden Sätze in einem nahen Sinnzusammenhang stehen müssen - irgend etwas muß die beiden verbinden. Die genauen Bedingungen sind zu komplex, um auf sie hier einzugehen. (Sie haben auch etwas mit dem Begriff der Ursache und Wirkung, also dem Konzept der Kausalität, zu tun.) Frage: Logisch gesehen sind die Sätze in (50) wahre Aussagen - (50)b ist sogar eine Tautologie, kann also nie falsch sein. Warum bin ich denn aber nicht reich? Antwort: Es gilt ƒzwei und zwei ist fünf„ = 0. Daraus folgt daß ƒ(50)b„ = 1 gilt. Das bedeutet aber noch lange nicht, daß ƒIch gewinne morgen die Lotterie„ = 1 ebenso gilt. Die Wahrheit von ƒ(50)b„ und das Falschsein von ƒzwei und zwei ist fünf„ ist genauso kompatibel mit ƒIch gewinne morgen die Lotterie„ = 0 17 DGy15 Semantik, SoSe 2010 ÜBUNGEN A. Angenommen, daß p und r falsch sind, sowie daß q wahr ist. Was sind die Wahrheitswerte der folgenden Formeln? (51) a. p w (q w r) e. pÿ (q v r) b. ¬p ÿ ¬q f. ¬(r ÿ p) c. ¬(¬p v ¬q) g. ¬p :((p v r) w p) d. (q w p) ÿ ¬r h. q v (¬(p v q) v ¬(pwq)) B. Übersetzen Sie die natürlichsprachliche Aussagen in (53) in aussagenlogische Formeln. Beispiel: (52) Gestern verlor unser Team, und Peters Mannschaft schaffte den Einzug ins Finale nicht p v ¬q p = Gestern verlor unser Team q = Peters Mannschaft schaffte den Einzug ins Finale (53) a. Wir konnten das Buch nicht finden, versuchten aber ein neues zu bekommen. b. Wenn es regnet und die Temperatur unter 10° sinkt dann steigt die Glatteisgefahr c. Wenn Österreich das Finale erreicht dann wird Österreich, wenn es gewinnt, Europameister d. Daß er krank ist bedeutet nicht, daß er nicht in die Schule gehen kann e. Wenn Hans den Saal nicht findet oder wenn Maria zu spät kommt, dann kann die Versammlung nicht stattfinden und es muß ein neuer Termin gefunden werden #3: Aussagenlogik 18 7. TAUTOLOGIEN, KONTRADIKTIONEN UND KONTINGENTE FORMELN Aussagen können in drei Gruppen eingeteilt: kontintente, tautologische und kontradiktorische Sätze. Ob eine Formel kontingent, tautologisch oder kontradiktorisch ist, kann nun einfach durch einen Blick auf die Wahrheitstafel bestimmt werden. Eine komplexe Aussage ist kontingent, wenn sich unter dem (hierarchisch höchsten) Konnektiv zumindest eine 1 sowie zumindest eine 0 findet. Sie ist eine Tautologie, wenn unter dem Konnektiv nur Einträge mit 1 aufscheinen, und eine Kontradiktion, sofern alle Werte mit 0 belegt sind. (54) p 1 1 0 0 (55) Kontingente Formel q p v q 1 1 1 1 0 1 0 0 1 0 0 1 0 0 0 0 Tautologie p w ¬p 1 1 0 1 1 0 0 1 1 0 1 1 Einige Tautologien a. b. c. d. e. pÿp (p v q) ÿ p (p ÿ q) w p (pÿq) : (¬q ÿ ¬p) ¬p ÿ (p ÿ q) (modus tollens) (ex falso quodlibet) Kontradiktion p v ¬p 1 0 0 1 0 0 0 0 1 0 0 1