SYNTAX: SATZAUFBAU, STRUKTURANALYSE UND Die syntaktische Ebene GRAMMATIKFORMALISMEN Beschreibung (“korrekter”) Sätze durch Kompositionsregeln Die grammatische Abbildung Syntax als Abstraktion bzgl. der zulässigen Anordnung von Wörtern; autonom Konstituenz und Dependenz gegenüber semantischen und pragmatischen Bedingungen Forderungen an eine Grammatik für das Deutsche Segmentierung in Untereinheiten (Konstituenten, “Phrasen”) und Zuordnung Konstituentenstruktur: Kontextfreie Grammatiken einer hierarchischen Anordnung dieser Segmente Generativität syntaktischer Regeln: Unendlicher Gebrauch von endlichen Mitteln Generative Transformationsgrammatik Schnittstelle zur semantischen und pragmatischen Verarbeitung Kategorialgrammatik 1 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 2 Hinweise Grammatik und Satzbegriff Die Grammatik beschreibt notwendige, aber nicht hinreichende Bedingungen für die Formulierung von Äusserungen. Was Sätze sind, hängt von variierenden Gebrauchsbedingungen ab; u.a. logische, Der Satz als traditionell hierarchisch höchste Einheit der Syntax muss kritisch rhetorische, ästhetische Kriterien. hinterfragt werden. Alternativvorschlag: Satz bezeichnet Mengen ähnlicher Verwendungsweisen von Zur Vertiefung des Syntaxkapitels: Typen niedriger Hierarchieebenen — Phrasen und Wörtern. (Stetter) K. Bücher: Vorlesung Grammatiktheorien Chomsky hat das Problem der Satzdefinition durch ein extensionales W. Menzel (U. Hamburg): Vorlesung Sprachorientierte KI: Syntax Annäherungsverfahren zu lösen versucht, nachdem eine intensionale Definition des Satzbegriffs nicht möglich war: Bei hinreichend vielen deskriptiv adäquaten Beschreibungen einzelner Sätze bildet sich eine generative Grammatik heraus, deren Extension die (Teil-) Menge der erzeugbaren Sätze approximiert. 3 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 4 Empirie und Strukturtests Gewinnung von “Beobachtungs”daten für die Modellierung — was soll Grammatik — syntaktische Theorien — Universalgrammatik “gemessen” werden? Deskriptive vs. präskriptive Grammatik Korrektheitsurteile; graduierte Akzeptabilität — abhängig von der Universalgrammatik Verwendungssituation! – Historisch: Mentalistisch/intellektualistisch (“Sprache des Geistes”) Strukturtests: gezielte Stellungsveränderungen und Konsequenzen für – Chomsky: Biologisch orientierter Ansatz (LAD) Akzeptabilität – Ersetzungsprobe: Welche Satzteile lassen sich durch welche anderen Prinzipien ersetzen? Parameter – Pronominalisierungsprobe: Auf welche Satzteile kann man sich durch ein Prinzip der strukturellen Determiniertheit: Alle grammatischen Regeln sind Pronomen beziehen? strukturabhängig (Bildung der Frageform, Passivform) – Weglaßprobe: Welche Satzteile können weggelassen werden? (Spezialfall: (Kompetenzbasierte) Idealisierungen bei Ellipsenbildung) – Fragetest: Welche Satzbestandteile kann man erfragen? – Koordinationstest: Welche Satzteile kann man koordinativ verknüpfen? 5 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 6 Die grammatische Abbildung Zentrale Aufgabe der Syntaxanalyse: Realisierung der grammatischen Abbildung Bestimmung der grammatischen Relationen für jede zulässige Zeichenkette: – Verschiebeprobe: Welche Satzteile kann man an eine andere Satzposition verschieben? Jeder sprachlichen Äußerung wird eine (oder mehrere) Strukturbeschreibung(en) V.a.: Fragesatzbildung, Topikalisierung (“given”–”new”), Ausklammerung zugeordnet, die ihren Inhalt repräsentiert. Modularisierung: – Reguläre Transformationen: Passivbildung 1. Feststellung sequentiell angeordneter diskreter Einheiten (c) Menzel 2. Zuordnung unterschiedlicher Kategorien zu diesen Einheiten 3. Gruppierung der kategorisierten Einheiten (Konstituenten) 4. Zuschreibung grammatischer Funktionen (z.B. Subjekt, Prädikat, Objekt) 5. Identifikation von Dependenzen zwischen funktionalen Einheiten (z.B. Kongruenz) 7 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 8 Grammatik, Parser und Generator Forderungen an die Realisierung der grammatischen Abbildung (Kaplan/Bresnan) Kreativität: Wie werden über unendlichem Definitions- und Wertebereich Repräsentationen gebildet? Endliche Kapazität: Endlich viele Operationen über endlichen Ressourcen Zuverlässigkeit: effektive Berechenbarkeit Ordnungsfreie Komposition: Monotone Inklusion Universalität: Einzelsprachen übergreifend 9 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 10 Konstituentenstrukturgrammatik (Phrasenstrukturgrammatik, PSG) Konstituenz und Dependenz (1) definiert System komplexer (nichtterminaler) Kategorien; Konstituenz: Teil-Ganzes-Relation gestattet, syntaktische Strukturen durch Segmentierung in kleinere Einheiten zu beschreibt, wie Ketten von Elementen zusammengesetzt sind. analysieren, Ausgangssituation: Lineare Folge von Wörtern in zeitlicher Anordnung; und diese durch ihre Stellung im Ganzen zu erklären. Reihenfolge und grammatische Nachbarschaft Einfachste uniforme Möglichkeit zur Beschreibung von Konstituentenstrukturen Konstituenten sind sprachliche Einheiten, die Teile größerer sprachlicher Einheiten durch rekursive Muster . sind. Randbedingungen: Ökonomieprinzip der Minimalität und Redundanzfreiheit 11 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 12 Konstituenz und Dependenz (2) Dependenz und Konstituenz Dependenz als zweite syntaktische Grundrelation geht über das Kriterium der bloßen Form hinaus; bezeichnet Abhängigkeitsverhältnis sprachlicher Elemente durch eine Vorkommensrelation (aus dem Vorkommen eines Elements kann auf das anderer Elemente geschlossen werden). Dependenzgrammatiken fassen den Satz als ein durch eine Abhängigkeitsrelation festgelegtes, hierarchisch geordnetes Ganzes auf. Ziel der Beschreibung: Hierarchische Struktur, die nicht bloß auf der Form, sondern auf “inhaltlichen” Charakteristika beruht. “Standardmodell”: Verb hat zentrale Position, alle nominalen Einheiten hängen direkt von ihm ab — Valenztheorie (Tesnière 1965) Konstituenz und Dependenz ergänzen einander 13 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 14 Syntaktische Phänomene (Menzel) Konstituenz: Unmittelbare Konstituenten (Segmentierung); s. Strukturtests Forderungen an eine Grammatik für das Deutsche Dependenz: Abhängigkeitsverhältnis zwischen sprachlichen Einheiten 1. Flexions- und Kongruenzregeln Valenz: Eigenschaft von Verben (auch Substantiven), Leerstellen zu eröffnen, Person-Numerus-Kongruenz zwischen Verb und Subjekt, die durch andere Satzglieder abgesättigt werden können. z.B. “ich gebe”, “du gibst” Aktanten (Komplemente): obligatorische Verbergänzungen Kasus-Genus-Numerus-Kongruenz zwischen den Elementen einer Anordnung: Starke (NP, PP) und schwache Anordnungsrestriktionen; Einfluss Nominalgruppe, der Satzperspektive (Thema/Rhema) z.B. “einem großen Bären” Rektion/Selektion: Forderung eines bestimmten Merkmals bei einem Aktanten Syntaktische Restriktionen des Verbs bzgl. seiner Ergänzungen: Rektion, (Rektion: morphologisches Merkmal, insbes. Kasus) z.B. “jemanden einer Sache verdächtigen”, “auf jemanden böse sein” Kongruenz: Übereinstimmung von Wortformen bgzl. strukturell definierter Vom Artikelwort bestimmte starke oder schwache Flexion des Adjektivs, morphosyntaktischer Mermale (Kasus, Person, Numerus, Genus): z.B. “ein großer Irrtum”, “der große Irrtum” Subjekt–Verb, Artikel–Adjektiv–Nomen, Relativpronomen–Bezugsnomen, Possesivpronomen–Antezedent, Reflexivpronomen–Subjekt 15 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 16 2. Variable Satzgliedstellung 3. Diskontinuierliche Konstituenten Wortordnung im Deutschen ist grundsätzlich fixiert, aber es gibt beträchtliche Freiheitsgrade in der Anordnung einiger Typen von Konstituenten wie Konstituenten, deren Teile nicht unmittelbar aufeinanderfolgen, sondern durch Nominalgruppen oder Adverbialgruppen — z.B. für Subjekt, direktes und eine variable Zahl anderer Konstituenten voneinander getrennt sind. indirektes Objekt (vgl. Uszkoreit 1983). Verbalklammer : Bei zusammengesetzten Verbalgruppen im Hauptsatz steht Beispiel: In dem Satz der finite Teil des Verbs an zweiter Stelle im Satz, alle anderen am Ende des “Dann hatte der Schaffner dem Mann die Fahrkarte gegeben.” Mittelfelds, z.B. in ist jede Permutation der drei Nominalgruppen zulässig, doch gibt es einige “Er wird sicher innerhalb der nächsten Stunde ankommen.” Grundregeln, die ihre Anordnung beeinflussen: (wichtigster Fall) Die unmarkierte Satzstellung ist Subjekt — indirektes Objekt — direktes Trennung der Nebensätze vom Bezugsobjekt, vor allem Nominalattribute in Objekt (Beispielsatz); kann primär zur Auflösung struktureller Nebensatzform, Mehrdeutigkeiten herangezogen werden. z.B. Relativsätze wie in Kommentar (oder Fokus) folgt auf Nicht-Kommentar. “Ich habe meine Meinung Dir gegenüber nie verheimlicht, daß Du die Reise Personalpronomina stehen vor anderen Nominalgruppen. nicht unternehmen solltest.” Betonung erfolgt im Vorfeld, “leichte” Konstituenten stehen vor “schweren”. 17 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 18 Semantische Probleme in der grammatischen Analyse 4. Koordination Problem: Unter bestimmten inhaltlichen Bedingungen können faktisch beliebige Frageoperatoren warum, wie Koordination Peter und Maria sind verheiratet Vage Quantoren viele Komplexe Quantoren Ungefähr die Hälfte dieser 20–30 Teile “Hecken” ziemlich, weniger Adjektiv-Attribute und Komparativkonstruktionen, Modalpartikel vielleicht, hoffentlich z.B. “Die phantastische überwältigende überzeugende Lösung.” Komparative der größere von beiden Nominalgruppen, z.B. “Krieg und Frieden.” Deixis dort, davor, du Sequenzen koordiniert werden. Wichtigste Fälle: Präpositional-Attribute, z.B. “Der Dicke in meinem Abteil mit dem riesigen Koffer auf dem Sitz neben sich.” 19 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 20 Konstituentenstruktur: Kontextfreie Grammatiken Theorie der formalen Sprachen: Klassifikation der Ausdrucksstärke von Kontinua Wasser, Verkehr Metaphern Kopf (-zeile) Ellipsen diesen auch? Anaphern das, Ich tue es! Kataphern das folgende Präsuppositionen Ich komme mit dem VW. Grammatiken bzw. der von ihnen erzeugten Sprachen Chomsky–Hierarchie – Typ 0: Turing-äquivalente – Typ 1: kontextsensitive – Typ 2: kontextfreie – Typ 3: reguläre Sprachen – Es gibt einen VW These: Kontextfreie Sprachen sind zur Beschreibung der Konstitutentenstruktur – Ich habe einen VW natürlicher Sprachen besonders geeignet. Zentrale Frage: Adäquatheit der Beschreibung? 21 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 22 Beispiel einer kontextfreien Grammatik Definition: Eine kontextfreie (Chomsky-) Grammatik ist ein Quadrupel Kontextfreie Regeln S wobei VP NP N die Menge der nichtterminalen Symbole, V Det N 23 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 Hund Knochen hat der ein einen Det S das ausgezeichnete nichtterminale Startsymbol ist. G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 V NP , N P eine endliche Menge von Produktionen der Form und NP VP Terminalregeln (Lexikon als Teil der Grammatik) T die Menge der terminalen Symbole bezeichnet, mit G = (N,T,P,S) 24 Ableitungsbaum (Konstituentenstrukturbaum) des Satzes “Der Hund hat einen Knochen.” S NP VP V Hund hat VP V hat NP Det einen N Knochen NP Det Der N S NP Det Der N Hund Det Ableitungsbaum als Klammerstruktur einen N Knochen 25 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 26 Verschiedene Beziehungen in Phrasenstrukturbäumen Exkurs: Analysestrategien Top-Down: Beginne mit dem Startsymbol S, “expandiere” dann NP und VP, bis die terminalen Symbole erreicht sind. Bottom-Up: beginne mit den terminalen Symbolen, wende Regeln “umgekehrt” an, bis das Startsymbol S erreicht ist. Orthogonal dazu: Breite-zuerst und Tiefe-zuerst 27 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 28 Beispiel: “Andi sieht Anna mit dem Fernglas.” Syntaktische Mehrdeutigkeit Zwei mögliche Ableitungsbäume Kontextfreie Grammatik: S VP V NP VP PP NP NP PP Det N PN PP Präp NP PN Andi Anna N Fernglas V sieht Det dem Präp mit NP PN VP V NP NP PN Andi 29 Anna Präp mit NP Det N dem Fernglas G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 sieht PP NP VP S c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 30 Syntaktische Mehrdeutigkeit S “Time flies like an arrow” VP NP PN VP V PP NP Präp NP Det N dem Fernglas PN Andi sieht Anna 31 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 mit c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 32 Chomsky-Normalform Eine kontextfreie Grammatik ist in Chomsky-Normalform, falls alle Regeln in die Umformung in Chomsky-Normalform bedeutet, daß man solche Regeln eliminieren Form oder ergänzen muß, auf deren rechter Seite oder haben mit und Regeln der Form nur ein Nichtterminal steht, . mehr als zwei Elemente stehen, nennt man binäre Regeln. Zu jeder kontextfreien Grammatik äquivalente Grammatik mit Terminale und Nichtterminale gemischt vorkommen. existiert eine schwach in Chomsky- Normalform. 33 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 34 Probleme mit Kontextfreien Grammatiken (1) Probleme mit Kontextfreien Grammatiken (2) Merkmals-Übereinstimmung “Welche Limonaden , die es hier gibt , möchtest Du haben ?” Andere diskontinuierliche Komponenten “Der Mann zog den Hund, den er hatte, hinter sich her” Zuweisung ähnlicher Sturkturen an ähnliche Sätze, z.B. Aktiv–Passiv “Ich habe dieses Auto gekauft” “Dieses Auto wurde von mir gekauft” (nach Winograd) 35 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 36 Oberflächenstruktur und Tiefenstruktur (1) Das Modell der Generativen Transformationsgrammatik 37 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 Oberflächenstruktur und Tiefenstruktur (2) Transformationskomponente 39 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 38 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 40 Standard-Theorie und Erweiterungen (1) GTG-Beispiel (Standard-Theorie) 41 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 42 Standard-Theorie und Erweiterungen (2) Standard-Theorie und Erweiterungen (3) 43 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 44 Minimalismus Probabilistische (kontextfreie) Grammatiken Kontextfreies Regelgerüst Annotation der Regeln mit Wahrscheinlichkeiten Kombination der Wahrscheinlichkeiten nicht unproblematisch Eine probabilistische kontextfreie Grammatik ist eine kontextfreie Grammatik, bei der jeder Produktion ein Wahrscheinlichkeitswert zugeordnet ist, wobei gilt: Die Wahrscheinlichkeiten aller Produktionen zu einem bestimmten nicht-terminalen Symbol müssen sich zu 1 aufsummieren. G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 45 46 PCFG – Beispiel S NP NP NP VP DET N NP PP (1.0) (0.7) (0.3) PP VP VP Sei folgende Grammatik gegeben: Kategorialgrammatik P NP V NP VP PP (1.0) (0.6) (0.4) Grammatische Information zum größten Teil im Lexikon Grundkategorien S — Satz N — Nomen (NP — Nominalphrase) Ableitungsbäume S 1.0 0.06174 VP 0.08232 S 1.0 0.6 NP VP PP NP 0.7 0.7 DET N V DET 1.0 N PP VP NP NP 0.7 0.7 P DET N Die Frau sieht das Kind mit dem Fernglas DET N 0.6 V 1.0 NP 0.7 DET N S NP — Verben NP/N — Artikel, Quantoren N/N — Adjektive NP Funktorkategorien 0.4 0.3 NP 0.7 N P DET Die Frau sieht das Kind mit dem Fernglas (Die Werte für die Lexikoneinträge sind der Übersichtlichkeit halber weggelassen) 47 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 48 Regeln Funktionale Applikation als einzige Operation (“Wegkürzen”) A/B B B A B A A Bemerkung: Regeln können auch als Merkmalsterme ausgedrückt werden (Attribute: Funktor und Argumente) Erweiterungen um Unifikationsformalismus: UCG, CUG 49 G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8 50