Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010 1 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 2 Akzeptoren - Transduktoren Akzeptor Transduktor dt 0 S 1 t q 2 a 3 tt 4 5 S 0 [ʃ] Grundkonzept: reguläre Mengen Akzeptor Erkenner © Karin Haenelt, Transduktoren, 16.5.2010 t 1 [t] a q 2 [a] 3 [t] 4 dt tt Grundkonzept: Relationen zwischen regulären Mengen Transduktor Erkenner Generator Übersetzer 3 Transduktor: Betrachtungsweisen Erkenner Betrachtung: beide Bänder werden gelesen berechnete Information: Entscheidung, ob die Paare von Zeichenketten akzeptiert werden oder nicht. Generator Betrachtung: beide Bänder werden geschrieben berechnete Information: Aufzählung der akzeptierten Paare von Zeichenketten. Übersetzer Betrachtung: ein Band wird gelesen, ein Band wird geschrieben berechnete Information: Aufzählung aller möglichen Zeichenketten, welche zusammen mit den gelesenen Zeichenketten, akzeptiert werden © Karin Haenelt, Transduktoren, 16.5.2010 4 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 5 Akzeptoren – Transduktoren: Äquivalenzen Reguläre Ausdrücke über Symbole sind äquivalent spezifizieren Endliche Akzeptoren akzeptieren © Karin Haenelt, Transduktoren, 16.5.2010 reguläre Mengen Reguläre Sprachen Reguläre Ausdrücke über Symbolpaare sind äquivalent spezifizieren Endliche reguläre Transduktoren akzeptieren Relationen Reguläre Sprachpaare 6 Transduktor: Äquivalenzen Endliche Transduktoren sind äquivalent zu regulären Relationen Zu jedem endlichen Transduktor lässt sich eine äquivalente reguläre Relation konstruieren und umgekehrt. Ein Transduktor ist ein endlicher Automat, der zwei reguläre Sprachen in Relation zueinander setzt und eine reguläre Relation repräsentiert © Karin Haenelt, Transduktoren, 16.5.2010 7 Reguläre Relationen Formulierung 1: Das Cartesische Produkt zweier regulärer Mengen L1 und L2 heißt reguläre Relation Formulierung 2: Seien 1, 2 Alphabete formaler Sprachen. Dann ist die Menge der regulären Relationen folgendermaßen bestimmt Die leere Menge ist eine reguläre Relation (x,y) für alle x,y 12 ist eine reguläre Relation Wenn R, R1 und R2 reguläre Relationen sind, dann sind R1 R2 = {(x1x2,y1y2) | (x1,y1) R1, (x2,y,2) R2 } R1 R2 = {(x,y) | (x,y) R1 (x,y) R2 } R* = i=0 Ri reguläre Relationen Nichts sonst ist eine reguläre Relation © Karin Haenelt, Transduktoren, 16.5.2010 8 Reguläre Relationen Beispiele gemäß Formulierung 1: (gab·st) : (geb·en) gemäß Formulierung 2: (gab:geb) · (st:en) © Karin Haenelt, Transduktoren, 16.5.2010 Cartesisches Produkt zweier regulärer Mengen geb en gab st reguläre Relation geb en gab st 9 Reguläre Relationen / Reguläre Ausdrücke über Symbolpaare gegeben zwei Relationen R,S - elementare Ausdrücke Ø, (x,y) - Vereinigung / Summe R ∪ S = {(a,b) | (a,b) ∊ R ∨ (a,b) ∊ S} a x a x , b y b y - Konkatenation / Produkt a x ax b y by - Hülle sing sing sing sing , säng sang säng sang R · S = {(ax,by) | (a,b) ∊ R ∧ (x,y) ∊ S} geb en geben gib st gibst R* * a a aa , , ,... b b bb © Karin Haenelt, Transduktoren, 16.5.2010 * hi hi hihi ,... , , ha ha haha 10 Reguläre Ausdrücke über Symbolpaare Reguläre Ausdrücke über Symbole (gab) (ε | st) Reguläre Ausdrücke über Symbolpaare (gab:geb) {(ε:en), (st:en)} (g:g · a:e · b:b) · {(ε:e · ε:n) ,(s:e · t:n)} geb en en geben geben , , gab st gab gabst © Karin Haenelt, Transduktoren, 16.5.2010 11 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 12 T = ( Q, Σ, Δ, q0, F, δ, σ, w,λ, ρ) Notation Q p, q Σ Σ Zustandsmenge Zustände E Δ A * a u s b g e A w u G e - A l p h a b e t a b e - A l p h a b e r s e g g w a a i n b c g e h t s f u f u u n n n k g k t s f i t o u i - A l p h a b e t t o n g a f ü r E i n g a b e s y m f ü r E i n g a b e k e t e i b e b t e o - l A l p h a b e t e n n n k t i o n Präfix bzw. Startgewicht λ ρ a ε g Menge aller Worte über dem Aus Startzustand Menge von Endzuständen Übergangsfunktion Üb * q0 F δ δ σ x n Menge aller Worte über dem Eingabe * Δ i , , b y u n d Z i f f e r n © Karin Haenelt, Transduktoren, 2.5.2009 , z S u f f i x b z w . E n d g e w i c h t E i n - b z w . A u s g a b e z e i c h e n E i n - b z w . A u s g a b e z e i c h e n r h e n leeres Wort (= Wort der Länge 0) 13 Transduktor: Definition allgemeine Form T = ( Q, Σ, Δ, q0, F, δ, σ, w) Mengen Menge der Zustände Q Menge der Eingabezeichen Σ Menge der Ausgabezeichen Δ ausgezeichnete Elemente Startzustand q0 Q Menge der Endzustände FQ Relationen/Funktionen Angabe des Definitions- und Wertebereichs der Abbildung Zustandsübergangsfunktion δ: Q (Σ {ε}) → 2Q σ: Q (Σ {ε}) Q →Δ* Ausgabefunktion w: Q (Σ {ε}) Q → R+ Gewichtungsfunktion oder Q (Σ {ε}) Q Δ → R+ © Karin Haenelt, Transduktoren, 16.5.2010 14 Transduktor: Darstellung die Kanten sind Elemente der Menge Q ×Σ×Δ× +×Q haben die Form (p,i,o,w,q) pQ Ausgangszustand iΣ Eingabe-Etikett (input label) oΔ Ausgabe-Etikett (output label) w + Gewicht (weight) qQ Zielzustand graphische Darstellung o/w obere Sprache i:o/ w p q © Karin Haenelt, Transduktoren, 16.5.2010 oder p q i untere Sprache 15 Transduktor: zu Grunde liegender Automat Zu Grunde liegender Automat Sei T = ( Q, Σ, Δ, q0, F, δT, σ ) ein endlicher Transduktor, dann ist A = ( Q, X, q0, F, δA) der zu Grunde liegende Automat, wenn gilt: (qi, (x,y), qj) δA und qi, qj mit qj δ(qi,x) und y = σ(qi, x, qj) X ist die Vereinigung aller solcher Paare (x,y) in T Transduktor T s i n g 0 1 2 3 4 s a n g Zu Grunde liegender Automat A (s,s) (a,i) (n,n) (g,g) 0 1 2 3 4 •(q1, (a,i), q2) δA und •q2 δ(q1,a) und • i = σ(q1, a, q2) (Def. vgl. Hanneforth (2002: 3) © Karin Haenelt, Transduktoren, 16.5.2010 16 Transduktor: Identitätstransduktor Identitätstransduktor Der Identitätstransduktor T = ID (A) eines endlichen Automaten A = ( Q,Σ, q0, F, δ) ist wie folgt definiert: T = ( Q, Σ, Σ, q0, F, δ, σ ) mit σ(qi, x, qj) = x für alle x Σ, qi,qj Q, für die gilt: qj δ(qi,x) A = ( Q,Σ, q0, F, δ) m a c h T = ( Q, Σ, Σ, q0, F, δ, σ ) m a c h m a c h (Def. vgl. Hanneforth (2002: 3) © Karin Haenelt, Transduktoren, 16.5.2010 17 Transduktor: Projektionen Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors T = ( Q, Σ, Δ, q0, F, δ, σ ) ist der Automat A = ( Q, Σ, q0, F, δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors T = ( Q, Σ, Δ, q0, F, δT, σ ) ist der Automat A = ( Q, Δ, q0, F, δA) mit (qi, y, qj) δA, wenn qi, qj, x mit y = σ(qi, x, qj) und qj δT(qi,x) T π1(T): A = ( Q, Σ, q0, F, δ) π2(T): A = ( Q, Δ, q0, F, δA) w w i o e g g ε w o g ε w i e g (Def. vgl. Hanneforth (2002: 3) © Karin Haenelt, Transduktoren, 16.5.2010 18 Durch Transduktoren berechenbare Relationen R(T) = { (a,b) Σ*Δ* und (a,b) ist das Etikett eines erfolgreichen Pfades in T} Transduktoren können reguläre (auch: rationale) Relationen berechnen Eine rationale Relation, die eine (partielle Funktion) darstellt, heißt rationale Funktion © Karin Haenelt, Transduktoren, 16.5.2010 19 Sprache eines Transduktors Die Sprache L(T) eines Transduktors T = (Q, q0, F, Σ, Δ, δ, σ) ist die reguläre Relation {(u,v) (Σ*, Δ*) | qf F, so dass gilt: qf δ*(q0,u) und σ*(q0,u) = v } δ* ist die bekannte Erweiterung von δ auf Zeichenreihen über Σ σ* ist die entsprechend erweiterte Ausgabefunktion vgl. (Hanneforth, 2002: 4) © Karin Haenelt, Transduktoren, 16.5.2010 20 Transduktionsabbildung Die Transduktionsabbildung T: Σ*→2Δ* eines Transduktors T ist wie folgt definiert: T (u) = { v Δ* | (u,v) L(T) } T (wog) = { wieg, wog } © Karin Haenelt, Transduktoren, 16.5.2010 w i e g w o o o g g g ε 21 Erweiterte Funktionen δ* und σ* Grundfunktionen für Zeichen p, q Q, a, b : ( q, a ) p ( q, a ) b erweiterte Funktionen für Zeichenreihen q Q, w *, a : * ( q, ) q * ( q, ) * (q, wa) ( * (q, w), a) * (q, wa) * (q, w) ( * (q, w), a) eine Zeichenreihe w* wird von T akzeptiert g.d.w.*(q0,w) F; die Ausgabe ist dann *(q0,w) © Karin Haenelt, Transduktoren, 16.5.2010 22 Erweiterte Funktion σ* : Beispiel erweiterte Funktionen σ* für Zeichenreihen * (q, wa) * (q, w) ( * (q, w), a) a u s 1 2 3 e i n 0 σ σ * ( q , w * ( 0 , e i · a ) = σ * ( q , w · n ) = σ * ( 0 , e = σ * ( 0 , e = © Karin Haenelt, Transduktoren, 16.5.2010 a u ) σ ( δ * ( q , w i ) σ ( δ * ( 0 , e i ) σ ( 2 i ) , a ) ) , n ) , n ) s 23 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 24 Transduktoren mit bestimmten Eigenschaften Aspekt Ausgabestelle Kantenetiketten Endausgabe Typ der Relation Verhältnis der Ein/Ausgabekanten Eingabeseite © Karin Haenelt, Transduktoren, 16.5.2010 Ausprägung Zustand Kante Wörter (Zeichenreihen) Zeichen ε Zeichen oder ε ohne Endausgabe mit Endausgabe Benennung Moore-Automat Mealy-Automat Relation Funktion (Zeichen | ε) : ( Zeichen | ε) Zeichen : Zeichen nicht-deterministisch deterministisch ambig, relational funktional asynchron synchron nicht-sequentiell sequentiell literal oder normalisiert 25 Transduktoren: Ausgabestelle Zwei klassische Modelle: Moore-Maschine (1956): Ausgabe am Zustand Mealy-Maschine (1955): Ausgabe bei Transition © Karin Haenelt, Transduktoren, 16.5.2010 26 Moore-Maschine A (Q, , , , , q 0) Q q0 q, i q endliche Menge von N Zuständen q0, q1, … qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen Startzustand Übergangsfunktion Q Q ; i Ausgabefunktion Q Q q0 0 q1 1 q2 2 © Karin Haenelt, Transduktoren, 16.5.2010 0 q0 q2 q1 1 q1 q0 q2 0 q0 1 1 1 q1 0 0 2 q2 0 1 Hopcroft/Ullmann 1988:43 27 Mealy-Maschine A (Q, , , , , q 0) Q q0 q, i q, i endliche Menge von N Zuständen q0, q1, … qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen Startzustand Übergangsfunktion Q Q ; i 0:y Ausgabefunktion Q 0:n p0 Q q0 p0 p1 0 p0:n p0:y p0:n © Karin Haenelt, Transduktoren, 16.5.2010 1 p1:n p1:y p1:y 0:n q0 1:n 1:n p1 1:y Hopcroft/Ullmann 1988:43 28 Äquivalenz von Mealy und Moore-Maschine Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe Äquivalente Maschinen konstruierbar © Karin Haenelt, Transduktoren, 16.5.2010 29 Transduktoren mit literalen Kantenetiketten literaler / normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben etikettiert oder mit ε Definition. Ein Transduktor T heißt literal oder normalisiert, wenn gilt σ: Q x (Σ {ε}) → Δ {ε} Lemma. Jeder Transduktor, dessen Transduktion nicht ε enthält, kann normalisiert werden. normalisiert S t 0 1 [t] [ʃ] nicht normalisiert d t 4 [t] a q 2 3 [a] t t 6 [t] © Karin Haenelt, Transduktoren, 16.5.2010 5 7 S 0 [ʃ] t 1 [t] a q 2 [a] dt [t] 3 tt [t] 4 5 30 Transduktoren als Funktion bzw. Relation funktionaler Transduktor Für jede Eingabezeichenreihe gibt es höchstens eine Ausgabezeichenreihe f(könn)=kann Definition. Ein Transduktor T heißt funktional, wenn gilt: | T(x) | 1 für alle x * T heißt in diesem Fall auch rationale Funktion ambiger / relationaler Transduktor Für eine Eingabezeichenreihe gibt es mehr als eine Ausgabezeichenreihe f(brach)= {brech, bring} Definition. Ein Transduktor T heißt relational, wenn gilt: | T(x) | > 1 für mindestens ein x * T heißt in diesem Fall auch rationale Relation © Karin Haenelt, Transduktoren, 16.5.2010 31 Transduktoren als Relation einfach endlich ambiger Transduktor Definition. Ein Transduktor T heißt einfach endlich ambig, wenn gilt: T(x) ist endlich für alle x * Beispiel: ein Transduktor mit an → (b | c)n unendlich ambiger Transduktor Definition. Ein Transduktor T heißt unendlich ambig, wenn er nicht einfach endlich ambig ist. Beispiel: ein Transduktor mit a → b c* uniform endlich ambiger Transduktor Definition. Ein Transduktor T heißt uniform endlich ambig, wenn es eine ganze Zahl N gibt, so dass gilt: | T(x) | N für alle x * Beispiel: ein Transduktor mit a → (b | c) vgl. (Hanneforth, 2002: 5) © Karin Haenelt, Transduktoren, 16.5.2010 32 synchroner Transduktor Relation zwischen Eingabe und Ausgabe ist längenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben etikettiert, d.h. keine ε-Kante Definition. Ein Transduktor T heißt synchron, wenn gilt |T (x) | = |x| synchroner Transduktor w w o o | T(x) | g g asynchroner Transduktor w i e g w o g ε = |x| | T(wog) | = | wog | | wog | = | wog | 3 = 3 © Karin Haenelt, Transduktoren, 16.5.2010 33 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 34 Sequentielle Transduktoren … betrachten wir etwas ausführlicher, da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen Eingabeseite deterministisch: sequentieller Transduktor In jedem Zustand gibt es höchstens eine ausgehende Kante mit einem gegebenen Element des Eingabealphabets Eingabe: leere Kette nicht zulässig Ausgabe: leere Kette möglich Eingabe:Ausgabe nicht notwendigerweise 1 Zeichen :1 Zeichen (nicht notwendigerweise längenerhaltend) ein einziger Startzustand © Karin Haenelt, Transduktoren, 16.5.2010 35 Sequentielle Transduktoren bidirektional sequentiell unidirektional sequentiell x:a 1 0 x:a 2 1 © Karin Haenelt, Transduktoren, 16.5.2010 x:a 1 0 y:a unidirektional sequentiell 0 y:b unidirektional sequentiell 2 x:a 1 x:b 2 0 y: 2 36 Sequentielle Transduktoren sequentiell : QQ : Q* | + | *+ p o/w i q subsequentiell wie sequentiell wie sequentiell : F * p o/w i q p a/w i eine Endausgabe endlich-subsequentiell endlich viele Endausgaben nicht sequentiell © Karin Haenelt, Transduktoren, 16.5.2010 wie sequentiell wie sequentiell : F (*)p, p : : Q(ε) Q 2* | 2+ | 2*+ Q(ε)2Q p o1/w i o2/w i q x o1/w o2/w q r 37 Endlich-subsequentielle Transduktoren Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle Transduktoren ermöglicht Behandlung einer ambigen Relation in einem nichtambigen Automaten © Karin Haenelt, Transduktoren, 16.5.2010 38 Sequentielle Transduktoren: Beispiel nicht-sequentieller Transduktor b 0 r 1 b e 2 3 b 0 4 5 a c h r i n g 7 8 9 r a c h r 1 b h r 6 endlichsubsequentieller Transduktor c 2 r 3 a c 4 h ech 5 ing ältere Bezeichnung: p-subsequentieller Transduktor © Karin Haenelt, Transduktoren, 16.5.2010 39 Sequentielle Transduktoren: Zeit-Komplexität Berechnung für eine gegebene Eingabe hängt nur von der Länge der Eingabe ab, nicht von der Größe des Transduktors Berechnung folgt dem Pfad, der durch die Eingabezeichenreihe definiert ist, erzeugt die korrespondierende Ausgabe © Karin Haenelt, Transduktoren, 16.5.2010 40 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 41 Operationen auf Transduktoren rationale Operationen analog zu Akzeptoren Vereinigung, Konkatenation, Hüllenbildung Operationen für Transduktoren Projektion Komposition … Optimierung Determinisierung (hier: Sequentialisierung) … © Karin Haenelt, Transduktoren, 16.5.2010 42 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 43 Abgeschlossenheit endliche Transduktoren sind generell abgeschlossen unter Verkettung, Vereinigung, Hüllenbildung Komposition Invertierung endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2) Intersektion 1) (anb*,cn) (a*bn,cn) ergibt (anbn,cn) abgeschlossen für 1) synchrone FSTs (kein ε, Relation längenerhaltend) 2) endlich-subsequentielle FSTs © Karin Haenelt, Transduktoren, 16.5.2010 44 Entscheidbarkeit es ist entscheidbar, ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann Seien 1,2 Alphabete mit mindestens zwei Buchstaben und R,S 12. Es ist nicht entscheidbar, ob RS=Ø RS R = S (d.h. zwei Transduktoren äquivalent sind) R = 12 (12)\R endlich ist R erkennbar ist (Berstel, 1979:90) © Karin Haenelt, Transduktoren, 16.5.2010 45 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 46 Bidirektionalität Transduktoren sind inhärent bidirektional: repräsentierte Relationen sind Abbildungen von oberer Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen in einigen Fällen ist Abbildung nur in einer Richtung erwünscht in anderen Fällen ist Abbildung in beide Richtungen erwünscht Morphologie: Analyse und Generierung Text:Speech und Speech:Text © Karin Haenelt, Transduktoren, 16.5.2010 47 Bidirektionalität: Beispiel Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen v e +VBZ:s a 3 4 5 l e +VB:ε 0 1 2 6 a:ε 7 v:f 8 e:ε 9 +VBD:t Sigma: a,e,f,l,s,t,v,+VB,+VBD,+VBZ VB: Verb VBZ: Verb –s-Form VBD: Verb Präteritum Beispiel aus: http://www.xrce.xerox.com/competencies/content-analysis/fsCompiler/fsnetwork.html © Karin Haenelt, Transduktoren, 16.5.2010 48 Bidirektionalität: Linguistische Adäquatheit Automaten repräsentieren Regelsysteme, die eine Sprache generieren, die nicht zu 100% einer menschlichen Sprache entspricht es handelt sich um Annäherungen die Annäherungen werden der Analyse- und der Generierungsseite zuweilen unterschiedlich gerecht Beispiel: Kreativität Analyse: produktive Regeln sollen zugelassen werden „be“{Nomn}{Verbendung}: „besteuern“, „besendern“, „besaiten“, „bewalden“ Generierung: Eigenkreationen des Systems möglicherweise unerwünscht: „begelden“, „berechnern“ © Karin Haenelt, Transduktoren, 16.5.2010 49 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 50 Relation: Grundbegriffe geordnetes Paar (a1, a2) zwei Elemente in festgelegter Reihenfolge n-Tupel (a1, …, an) n Elemente in festgelegter Reihenfolge Projektionen eines geordneten Paares Sei X = (a, b) ein geordnetes Paar a, falls b X (a,b) undefiniert , falls X kein geordnetes Paar ist 1 ( X ) Def b, falls a X (a,b) undefiniert , falls X kein geordnetes Paar ist 2 ( X ) Def © Karin Haenelt, Transduktoren, 16.5.2010 51 Relation: Grundbegriffe Cartesisches Produkt Seien A1, ..., An Mengen. Das Cartesische Produkt (direktes Produkt, Kreuzprodukt) von A1, ..., An ist die Menge A1 x A2 := { (a1,a2) | a1 A1 und a2 A2} bzw. A1 x ... x An := { (a1,...,an) | a1 A1 , ..., und an An} Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen: Beziehungen zwischen Elemente verschiedener Mengen Relationen: Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlässigt den Unterschied und spricht nur von Relationen © Karin Haenelt, Transduktoren, 16.5.2010 52 Relation: Grundbegriffe Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation A mach säng sang sing sung wog mach B sing wieg wog geordnetes Paar: (säng,sing) Cartesisches Produkt: {(mach,mach), (mach,sing), (mach,wieg), (mach,wog), (säng,mach), (säng,sing), (säng,wieg), (säng,wog),… (wog,mach), (wog,sing), (wog,wieg), (wog,wog)} Relation R AB „hat den kanonischen Stamm“: {(mach,mach), (säng,sing), (sang,sing), (sing,sing), (sung,sing), (wog,wieg), (wog,wog)} © Karin Haenelt, Transduktoren, 16.5.2010 m m ... s s s s ... a a c c h h i a i i n n n n g g g g w w w w i o o o e g g g g ε 53 Themen Einführung Äquivalenzen: Transduktoren und reguläre Relationen Transduktoren Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren sequentiell, subsequentiell, endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit, Entscheidbarkeit Bidirektionalität Anhang: Grundlagen: Relationen Anhang: Äquivalenz von Mealy- und Moore-Automaten © Karin Haenelt, Transduktoren, 16.5.2010 54 Äquivalenz von Mealy-Maschine und Moore-Maschine MealyX Moore b0 [ q, b] ' ([ q, b], a) '[ q, b] M 1 (Q , , , , , q 0) M 2 (Q , , , ' , ' , [q 0, b0]) beliebiges Element aus (Ausgabealphabet) Repräsentant eines Zustandes in M 2 [ (q, a), (q, a)] b Q Mealy q0 0 1 p0:n p1:n p0 p0:y p1:n p1 p0:n p1:y Q MealyX q0 q0 p0 p0 p1 p1 n y n y n y 0 p0:n p0:n p0:y p0:y p0:n p0:n 1 p1:n p1:n p1:y p1:y p1:y p1:y Q Moore [q0,n] [q0,y] [p0,n] [p0,y] [p1,n] [p1,y] n y n y n y 0 [p0,n] [p0,n] [p0,y] [p0,y] [p0,n] [p0,n] 1 [p1,n] [p1,n] [p1,n] [p1,n] [p1,y] [p1,y] Vgl. Hopcroft/Ullmann 1988:43 © Karin Haenelt, Transduktoren, 16.5.2010 55 Äquivalenz von Mealy- und Moore-Maschine 0:y 0:n p0 0 q0:n 0:n q0 1:n 1:n n p1 1:y 0 nicht erreichbar, d.h. tilgbar q0:yy n p0:n 0 0 1 1 1 p1:n 0 p0:yy 0 n 1 p1:yy 1 1 Hopcroft/Ullmann 1988:45/46 © Karin Haenelt, Transduktoren, 16.5.2010 56 Äquivalenz von Mealy- und Moore-Maschine Moore MealyX '[ q, a ] Q Mealy q0 0 1 p0:n p1:n p0 p0:y p1:n p1 p0:n p1:y © Karin Haenelt, Transduktoren, 16.5.2010 M 1 (Q, , , , , q 0) M 2 (Q, , , , ' , q 0) ( (q, a)) Q MealyX q0 q0 p0 p0 p1 p1 n y n y n y 0 p0:n p0:n p0:y p0:y p0:n p0:n 1 p1:n p1:n p1:y p1:y p1:y p1:y Q Moore [q0,n] n 0 1 [p0,n] [p1,n] [p0,n] [p0,y] [p1,n] [p1,y] [p0,y] [p0,y] [p0,n] [p0,n] n y n y [p1,n] [p1,n] [p1,y] [p1,y] 57 Vielen Dank für das Aufspüren von Fehlern in früheren Versionen und für Verbesserungsvorschläge danke ich Simone Eberhard Katja Niemann Christian Roth Ineta Sejane © Karin Haenelt, Transduktoren, 16.5.2010 58 Literatur Jean Berstel (1979). Transductions and Context-Free Languages. Stuttgart: Teubner. Jean Berstel und Dominique Perrin (2004). Algorithms on Words. In: M.Lothaire (ed). (2004). Applied Combinatorics on Words. http://www-igm.univmlv.fr/~berstel/Lothaire/Lothaire3/appcowC1.ps (version 06.04.2004) Eberhard, Simone; Niemann, Katja und Ineta Sejane (2004). Determinisierung von Transduktoren. Seminarrreferat 28.06.2004. http://kontext.fraunhofer.de/haenelt/kurs/Referate/Eberhard_Niemann_Sejane_S2004/Algori thmusMohri.ppt bzw. pdf Jurafsky, Daniel und James H. Martin (2000): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. New Jersey: Prentice Hall. S. 21-56. Haenelt, Karin (2004). Determinisierung von Transducern. Eine Erläuterung des Algorithmus von Mohri. http://kontext.fraunhofer.de/haenelt/kurs/folien/FstDetermMohri.pdf Haenelt, Karin (2004). Operationen auf endlichen Automaten und Transduktoren. Definitionen, Algorithmen, Erläuterungen und Beispiele – eine Übersicht. http://kontext.fraunhofer.de/haenelt/kurs/folien/FSOperationenDef.pdf Hanneforth, Thomas (2002 ). Finite-State Techniken: Transduktoren. Kursfolien Universität Potsdam. http://www.ling.uni-potsdam.de/kurse/EndlicheTechniken/Transduktoren.pdf © Karin Haenelt, Transduktoren, 16.5.2010 59 Literatur Hopcroft, John E. Rajeev Motwani und Jeffrey D. Ullman (2001): Introduction to Automata Theory, Languages and Computation. Addison-Wesley. http://wwwdb.stanford.edu/~ullman/ialc.html Hopcroft, John E. und Jeffrey D. Ullman. Einführung in die Automatentheorie, formale Sprachen und Komplexitätstheorie. Bonn u. a. : Addison-Wesley, 1988 (engl. Original Introduction to automata theory, languages and computation). Karttunen, Lauri (2003): Finite-State Technology. In: Ruslan Mitkov (Hg.): The Oxford Handbook of Computational Linguistics. Oxford University Press. Mohri, Mehryar (1997): Finite State Transducers in Language and Speech Processing. In: Computational Linguistics, 23, 2, 1997, S. 269-311. http://citeseer.nj.nec.com/mohri97finitestate.html Mohri, Mehryar (1996): On some Applications of finite-state automata theory to natural language processing. In: Journal of Natural Language Egineering, 2, S. 1-20. Mohri, Mehryar und Michael Riley (2002). Weighted Finite-State Transducers in Speech Recognition (Tutorial). Teil 1: http://www.research.att.com/~mohri/postscript/icslp.ps, Teil 2: http://www.research.att.com/~mohri/postscript/icslp-tut2.ps Starke, Peter H. (1969). Abstrakte Automaten. VEB Deutscher Verlag der Wissenschaften. Berlin XEROX Finite State Compiler http://www.xrce.xerox.com/competencies/contentanalysis/fsCompiler/fsnetwork.html © Karin Haenelt, Transduktoren, 16.5.2010 60 Versionen 4.0: 16.5.2010 3.4: 2.5.2009, 3.3: 15.07.2008, 3.2: 18.05.2008, 3.1: 17.05.2007, 3.0: 12.05.2007 2.0: 27.05.2006 1.3: 05.06.2005, 31.05.2005, 30.05.2005, 29.05.2005, 25.05.2005, 1.2: 24.05.2004, 17.05.2004, 28.04.2004, 18.02.2004,15.02.2004, 1.1: 30.05.2003 1.0: 15.01.2003 © Karin Haenelt, Transduktoren, 16.5.2010 61 Copyright © Karin Haenelt, 2003, 2004, 2005, 2006, 2007, 200,. 2009 All rights reserved. The German Urheberrecht (esp. § 2, § 13, § 63 , etc.). shall be applied to these slides. In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes, if the bibliographic data is included as described below. Please quote correctly. If you use the presentation or parts of it for educational and scientific purposes, please observe the laws (copyright, Urheberrecht, etc.) Please include the bibliographic data (author, title, date, page, URL) in your publication (book, paper, course slides, etc.). Deletion or omission of the footer (with name, data and copyright sign) is not permitted Bibliographic data. Karin Haenelt. Transduktoren für die Sprachverarbeitung. Kursfolien. 16.5.2010 (1 15.01.2003) http://kontext.fraunhofer.de/haenelt/kurs/folien/Haenelt_FST.pdf For commercial use: No commercial use is allowed without written permission from the author. In case you are interested in commercial use please contact the author. Court of Jurisdiction is Darmstadt, Germany © Karin Haenelt, Transduktoren, 16.5.2010 62