Transduktoren für die Sprachverarbeitung
Karin Haenelt
16.5.2010
1
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
2
Akzeptoren - Transduktoren
Akzeptor
Transduktor
dt
0
S
1
t
q
2
a
3
tt
4
5
S
0
[ʃ]
Grundkonzept:
reguläre Mengen
Akzeptor
Erkenner
© Karin Haenelt, Transduktoren,
16.5.2010
t
1
[t]
a
q
2
[a]
3
[t]
4
dt
tt
Grundkonzept:
Relationen zwischen
regulären Mengen
Transduktor
Erkenner
Generator
Übersetzer
3
Transduktor: Betrachtungsweisen
Erkenner
Betrachtung: beide Bänder werden gelesen
berechnete Information: Entscheidung, ob die Paare von
Zeichenketten akzeptiert werden oder nicht.
Generator
Betrachtung: beide Bänder werden geschrieben
berechnete Information: Aufzählung der akzeptierten Paare von
Zeichenketten.
Übersetzer
Betrachtung: ein Band wird gelesen, ein Band wird geschrieben
berechnete Information: Aufzählung aller möglichen Zeichenketten,
welche zusammen mit den gelesenen Zeichenketten, akzeptiert
werden
© Karin Haenelt, Transduktoren,
16.5.2010
4
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
5
Akzeptoren – Transduktoren: Äquivalenzen
Reguläre Ausdrücke
über Symbole
sind
äquivalent
spezifizieren
Endliche
Akzeptoren akzeptieren
© Karin Haenelt, Transduktoren,
16.5.2010
reguläre
Mengen
Reguläre
Sprachen
Reguläre Ausdrücke
über Symbolpaare
sind
äquivalent
spezifizieren
Endliche
reguläre
Transduktoren akzeptieren Relationen
Reguläre
Sprachpaare
6
Transduktor: Äquivalenzen
Endliche Transduktoren sind äquivalent zu regulären Relationen
Zu jedem endlichen Transduktor lässt sich eine äquivalente
reguläre Relation konstruieren
und umgekehrt.
Ein Transduktor ist ein endlicher Automat,
der zwei reguläre Sprachen in Relation zueinander setzt
und eine reguläre Relation repräsentiert
© Karin Haenelt, Transduktoren,
16.5.2010
7
Reguläre Relationen
Formulierung 1:
Das Cartesische Produkt zweier regulärer Mengen L1 und L2 heißt
reguläre Relation
Formulierung 2:
Seien 1, 2 Alphabete formaler Sprachen. Dann ist die Menge der
regulären Relationen folgendermaßen bestimmt
Die leere Menge ist eine reguläre Relation
(x,y) für alle x,y 12 ist eine reguläre Relation
Wenn R, R1 und R2 reguläre Relationen sind, dann sind
R1 R2
= {(x1x2,y1y2) | (x1,y1) R1, (x2,y,2) R2 }
R1 R2
= {(x,y) | (x,y) R1 (x,y) R2 }
R*
= i=0 Ri
reguläre Relationen
Nichts sonst ist eine reguläre Relation
© Karin Haenelt, Transduktoren,
16.5.2010
8
Reguläre Relationen
Beispiele
gemäß Formulierung 1:
(gab·st) : (geb·en)
gemäß Formulierung 2:
(gab:geb) · (st:en)
© Karin Haenelt, Transduktoren,
16.5.2010
Cartesisches Produkt zweier
regulärer Mengen
geb en
gab st
reguläre Relation
geb en
gab st
9
Reguläre Relationen /
Reguläre Ausdrücke über Symbolpaare
gegeben zwei Relationen R,S
- elementare Ausdrücke
Ø, (x,y)
- Vereinigung / Summe
R ∪ S = {(a,b) | (a,b) ∊ R ∨ (a,b) ∊ S}
a x a x
,
b y b y
-
Konkatenation / Produkt
a x ax
b y by
-
Hülle
sing sing sing sing
,
säng
sang
säng
sang
R · S = {(ax,by) | (a,b) ∊ R ∧ (x,y) ∊ S}
geb en geben
gib
st gibst
R*
*
a a aa
, , ,...
b b bb
© Karin Haenelt, Transduktoren,
16.5.2010
*
hi hi hihi
,...
, ,
ha ha haha
10
Reguläre Ausdrücke über Symbolpaare
Reguläre Ausdrücke über Symbole
(gab) (ε | st)
Reguläre Ausdrücke über Symbolpaare
(gab:geb) {(ε:en), (st:en)}
(g:g · a:e · b:b) · {(ε:e · ε:n) ,(s:e · t:n)}
geb en en geben geben
,
,
gab st gab gabst
© Karin Haenelt, Transduktoren,
16.5.2010
11
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
12
T = ( Q, Σ, Δ, q0, F, δ, σ, w,λ, ρ)
Notation
Q
p, q
Σ
Σ
Zustandsmenge
Zustände
E
Δ
A
*
a
u
s
b
g
e
A
w
u
G
e
-
A
l
p
h
a
b
e
t
a
b
e
-
A
l
p
h
a
b
e
r
s
e
g
g
w
a
a
i
n
b
c
g
e
h
t
s
f
u
f
u
u
n
n
n
k
g
k
t
s
f
i
t
o
u
i
-
A
l
p
h
a
b
e
t
t
o
n
g
a
f
ü
r
E
i
n
g
a
b
e
s
y
m
f
ü
r
E
i
n
g
a
b
e
k
e
t
e
i
b
e
b
t
e
o
-
l
A
l
p
h
a
b
e
t
e
n
n
n
k
t
i
o
n
Präfix bzw. Startgewicht
λ
ρ
a
ε
g
Menge aller Worte über dem Aus
Startzustand
Menge von Endzuständen
Übergangsfunktion
Üb
*
q0
F
δ
δ
σ
x
n
Menge aller Worte über dem Eingabe
*
Δ
i
,
,
b
y
u
n
d
Z
i
f
f
e
r
n
© Karin Haenelt, Transduktoren,
2.5.2009
,
z
S
u
f
f
i
x
b
z
w
.
E
n
d
g
e
w
i
c
h
t
E
i
n
-
b
z
w
.
A
u
s
g
a
b
e
z
e
i
c
h
e
n
E
i
n
-
b
z
w
.
A
u
s
g
a
b
e
z
e
i
c
h
e
n
r
h
e
n
leeres Wort (= Wort der Länge 0)
13
Transduktor: Definition
allgemeine Form T = ( Q, Σ, Δ, q0, F, δ, σ, w)
Mengen
Menge der Zustände
Q
Menge der Eingabezeichen
Σ
Menge der Ausgabezeichen
Δ
ausgezeichnete Elemente
Startzustand
q0 Q
Menge der Endzustände
FQ
Relationen/Funktionen
Angabe des Definitions- und Wertebereichs der Abbildung
Zustandsübergangsfunktion
δ: Q (Σ {ε}) → 2Q
σ:
Q (Σ {ε}) Q →Δ*
Ausgabefunktion
w:
Q (Σ {ε}) Q → R+
Gewichtungsfunktion
oder Q (Σ {ε}) Q Δ → R+
© Karin Haenelt, Transduktoren,
16.5.2010
14
Transduktor: Darstellung
die Kanten
sind Elemente der Menge Q ×Σ×Δ× +×Q
haben die Form (p,i,o,w,q)
pQ
Ausgangszustand
iΣ
Eingabe-Etikett (input label)
oΔ
Ausgabe-Etikett (output label)
w +
Gewicht (weight)
qQ
Zielzustand
graphische Darstellung
o/w
obere Sprache
i:o/ w
p q
© Karin Haenelt, Transduktoren,
16.5.2010
oder
p
q
i
untere Sprache
15
Transduktor: zu Grunde liegender Automat
Zu Grunde liegender Automat
Sei T = ( Q, Σ, Δ, q0, F, δT, σ ) ein endlicher Transduktor,
dann ist A = ( Q, X, q0, F, δA) der zu Grunde liegende Automat,
wenn gilt:
(qi, (x,y), qj) δA und qi, qj mit qj δ(qi,x) und y = σ(qi, x, qj)
X ist die Vereinigung aller solcher Paare (x,y) in T
Transduktor T
s
i
n
g
0
1
2
3
4
s
a
n
g
Zu Grunde liegender Automat A
(s,s) (a,i) (n,n) (g,g)
0
1
2
3
4
•(q1, (a,i), q2) δA und
•q2 δ(q1,a) und
• i = σ(q1, a, q2)
(Def. vgl. Hanneforth (2002: 3)
© Karin Haenelt, Transduktoren,
16.5.2010
16
Transduktor: Identitätstransduktor
Identitätstransduktor
Der Identitätstransduktor T = ID (A) eines endlichen Automaten
A = ( Q,Σ, q0, F, δ) ist wie folgt definiert:
T = ( Q, Σ, Σ, q0, F, δ, σ ) mit σ(qi, x, qj) = x für alle x Σ, qi,qj Q,
für die gilt: qj δ(qi,x)
A = ( Q,Σ, q0, F, δ)
m
a
c
h
T = ( Q, Σ, Σ, q0, F, δ, σ )
m
a
c
h
m
a
c
h
(Def. vgl. Hanneforth (2002: 3)
© Karin Haenelt, Transduktoren,
16.5.2010
17
Transduktor: Projektionen
Erste und zweite Projektion
Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q, Σ, Δ, q0, F, δ, σ ) ist der Automat A = ( Q, Σ, q0, F, δ)
Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q, Σ, Δ, q0, F, δT, σ ) ist der
Automat A = ( Q, Δ, q0, F, δA) mit (qi, y, qj) δA,
wenn qi, qj, x mit y = σ(qi, x, qj) und qj δT(qi,x)
T
π1(T): A = ( Q, Σ, q0, F, δ)
π2(T): A = ( Q, Δ, q0, F, δA)
w
w
i
o
e
g
g
ε
w
o
g
ε
w
i
e
g
(Def. vgl. Hanneforth (2002: 3)
© Karin Haenelt, Transduktoren,
16.5.2010
18
Durch Transduktoren berechenbare Relationen
R(T) = { (a,b) Σ*Δ* und (a,b) ist das Etikett eines
erfolgreichen Pfades in T}
Transduktoren können reguläre (auch: rationale) Relationen
berechnen
Eine rationale Relation, die eine (partielle Funktion) darstellt,
heißt rationale Funktion
© Karin Haenelt, Transduktoren,
16.5.2010
19
Sprache eines Transduktors
Die Sprache L(T) eines Transduktors T = (Q, q0, F, Σ, Δ, δ, σ) ist
die reguläre Relation {(u,v) (Σ*, Δ*) | qf F, so dass gilt: qf
δ*(q0,u) und σ*(q0,u) = v }
δ* ist die bekannte Erweiterung von δ auf Zeichenreihen
über Σ
σ* ist die entsprechend erweiterte Ausgabefunktion
vgl. (Hanneforth, 2002: 4)
© Karin Haenelt, Transduktoren,
16.5.2010
20
Transduktionsabbildung
Die Transduktionsabbildung T: Σ*→2Δ* eines Transduktors T
ist wie folgt definiert:
T (u) = { v Δ* | (u,v) L(T) }
T (wog) = { wieg, wog }
© Karin Haenelt, Transduktoren,
16.5.2010
w
i
e
g
w
o
o
o
g
g
g
ε
21
Erweiterte Funktionen δ* und σ*
Grundfunktionen für Zeichen
p, q Q, a, b :
( q, a ) p
( q, a ) b
erweiterte Funktionen für Zeichenreihen
q Q, w *, a :
* ( q, ) q
* ( q, )
* (q, wa) ( * (q, w), a)
* (q, wa) * (q, w) ( * (q, w), a)
eine Zeichenreihe w* wird von T akzeptiert g.d.w.*(q0,w) F;
die Ausgabe ist dann *(q0,w)
© Karin Haenelt, Transduktoren,
16.5.2010
22
Erweiterte Funktion σ* : Beispiel
erweiterte Funktionen σ* für Zeichenreihen
* (q, wa) * (q, w) ( * (q, w), a)
a
u
s
1
2
3
e
i
n
0
σ
σ
*
(
q
,
w
*
(
0
,
e
i
·
a
)
=
σ
*
(
q
,
w
·
n
)
=
σ
*
(
0
,
e
=
σ
*
(
0
,
e
=
© Karin Haenelt, Transduktoren,
16.5.2010
a
u
)
σ
(
δ
*
(
q
,
w
i
)
σ
(
δ
*
(
0
,
e
i
)
σ
(
2
i
)
,
a
)
)
,
n
)
,
n
)
s
23
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
24
Transduktoren mit bestimmten Eigenschaften
Aspekt
Ausgabestelle
Kantenetiketten
Endausgabe
Typ der Relation
Verhältnis der
Ein/Ausgabekanten
Eingabeseite
© Karin Haenelt, Transduktoren,
16.5.2010
Ausprägung
Zustand
Kante
Wörter (Zeichenreihen)
Zeichen
ε
Zeichen oder ε
ohne Endausgabe
mit Endausgabe
Benennung
Moore-Automat
Mealy-Automat
Relation
Funktion
(Zeichen | ε) : ( Zeichen | ε)
Zeichen : Zeichen
nicht-deterministisch
deterministisch
ambig, relational
funktional
asynchron
synchron
nicht-sequentiell
sequentiell
literal oder normalisiert
25
Transduktoren: Ausgabestelle
Zwei klassische Modelle:
Moore-Maschine (1956):
Ausgabe am Zustand
Mealy-Maschine (1955):
Ausgabe bei Transition
© Karin Haenelt, Transduktoren,
16.5.2010
26
Moore-Maschine
A (Q, , , , , q 0)
Q
q0
q, i
q
endliche Menge von N Zuständen q0, q1, … qN-1
endliche Menge von Eingabesymbolen
endliche Menge von Ausgabesymbolen
Startzustand
Übergangsfunktion Q Q ; i
Ausgabefunktion Q
Q
q0 0
q1 1
q2 2
© Karin Haenelt, Transduktoren,
16.5.2010
0
q0
q2
q1
1
q1
q0
q2
0
q0
1
1
1
q1
0
0
2
q2
0
1
Hopcroft/Ullmann 1988:43
27
Mealy-Maschine
A (Q, , , , , q 0)
Q
q0
q, i
q, i
endliche Menge von N Zuständen q0, q1, … qN-1
endliche Menge von Eingabesymbolen
endliche Menge von Ausgabesymbolen
Startzustand
Übergangsfunktion Q Q ; i
0:y
Ausgabefunktion Q
0:n
p0
Q
q0
p0
p1
0
p0:n
p0:y
p0:n
© Karin Haenelt, Transduktoren,
16.5.2010
1
p1:n
p1:y
p1:y
0:n
q0 1:n
1:n
p1
1:y
Hopcroft/Ullmann 1988:43
28
Äquivalenz von Mealy und Moore-Maschine
Beide Typen produzieren dieselben Abbildungen zwischen
Eingabe und Ausgabe
Äquivalente Maschinen konstruierbar
© Karin Haenelt, Transduktoren,
16.5.2010
29
Transduktoren mit literalen Kantenetiketten
literaler / normalisierter Transduktor
jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε
Definition. Ein Transduktor T heißt literal oder normalisiert, wenn
gilt
σ: Q x (Σ {ε}) → Δ {ε}
Lemma. Jeder Transduktor, dessen Transduktion nicht ε enthält,
kann normalisiert werden.
normalisiert
S
t
0
1
[t]
[ʃ]
nicht normalisiert
d
t
4
[t]
a
q
2
3
[a]
t
t
6
[t]
© Karin Haenelt, Transduktoren,
16.5.2010
5
7
S
0
[ʃ]
t
1
[t]
a
q
2
[a]
dt
[t]
3
tt
[t]
4
5
30
Transduktoren als Funktion bzw. Relation
funktionaler Transduktor
Für jede Eingabezeichenreihe gibt es höchstens eine
Ausgabezeichenreihe
f(könn)=kann
Definition. Ein Transduktor T heißt funktional, wenn gilt:
| T(x) | 1 für alle x *
T heißt in diesem Fall auch rationale Funktion
ambiger / relationaler Transduktor
Für eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe
f(brach)= {brech, bring}
Definition. Ein Transduktor T heißt relational, wenn gilt:
| T(x) | > 1 für mindestens ein x *
T heißt in diesem Fall auch rationale Relation
© Karin Haenelt, Transduktoren,
16.5.2010
31
Transduktoren als Relation
einfach endlich ambiger Transduktor
Definition. Ein Transduktor T heißt einfach endlich ambig, wenn gilt:
T(x) ist endlich für alle x *
Beispiel: ein Transduktor mit an → (b | c)n
unendlich ambiger Transduktor
Definition. Ein Transduktor T heißt unendlich ambig, wenn er nicht
einfach endlich ambig ist.
Beispiel: ein Transduktor mit a → b c*
uniform endlich ambiger Transduktor
Definition. Ein Transduktor T heißt uniform endlich ambig, wenn es
eine ganze Zahl N gibt, so dass gilt:
| T(x) | N für alle x *
Beispiel: ein Transduktor mit a → (b | c)
vgl. (Hanneforth, 2002: 5)
© Karin Haenelt, Transduktoren,
16.5.2010
32
synchroner Transduktor
Relation zwischen Eingabe und Ausgabe ist längenerhaltend
jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert, d.h. keine ε-Kante
Definition. Ein Transduktor T heißt synchron, wenn gilt |T (x) | = |x|
synchroner Transduktor
w
w
o
o
| T(x) |
g
g
asynchroner Transduktor
w
i
e
g
w
o
g
ε
= |x|
| T(wog) | = | wog |
| wog |
= | wog |
3
= 3
© Karin Haenelt, Transduktoren,
16.5.2010
33
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
34
Sequentielle Transduktoren
… betrachten wir etwas ausführlicher, da sie in der
Verarbeitungspraxis eine bedeutende Rolle spielen
Eingabeseite deterministisch: sequentieller Transduktor
In jedem Zustand gibt es höchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets
Eingabe: leere Kette nicht zulässig
Ausgabe: leere Kette möglich
Eingabe:Ausgabe nicht notwendigerweise 1 Zeichen :1
Zeichen (nicht notwendigerweise längenerhaltend)
ein einziger Startzustand
© Karin Haenelt, Transduktoren,
16.5.2010
35
Sequentielle Transduktoren
bidirektional
sequentiell
unidirektional
sequentiell
x:a
1
0
x:a
2
1
© Karin Haenelt, Transduktoren,
16.5.2010
x:a
1
0
y:a
unidirektional
sequentiell
0
y:b
unidirektional
sequentiell
2
x:a
1
x:b
2
0
y:
2
36
Sequentielle Transduktoren
sequentiell
: QQ
: Q* | + | *+
p
o/w
i
q
subsequentiell
wie sequentiell
wie sequentiell
: F *
p
o/w
i
q
p
a/w
i
eine Endausgabe
endlich-subsequentiell
endlich viele
Endausgaben
nicht sequentiell
© Karin Haenelt, Transduktoren,
16.5.2010
wie sequentiell
wie sequentiell
: F (*)p, p
:
: Q(ε) Q
2* | 2+ | 2*+
Q(ε)2Q
p
o1/w
i
o2/w
i
q
x
o1/w
o2/w
q
r
37
Endlich-subsequentielle Transduktoren
Generalisierung sequentieller Transduktoren
maximal endlich viele Ausgabeketten pro Endzustand
1-subsequentielle Transduktoren = subsequentielle
Transduktoren
ermöglicht Behandlung einer ambigen Relation in einem nichtambigen Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
38
Sequentielle Transduktoren: Beispiel
nicht-sequentieller
Transduktor
b
0
r
1
b
e
2
3
b
0
4
5
a
c
h
r
i
n
g
7
8
9
r
a
c
h
r
1
b
h
r
6
endlichsubsequentieller
Transduktor
c
2
r
3
a
c
4
h
ech
5
ing
ältere Bezeichnung: p-subsequentieller Transduktor
© Karin Haenelt, Transduktoren,
16.5.2010
39
Sequentielle Transduktoren: Zeit-Komplexität
Berechnung für eine gegebene Eingabe
hängt nur von der Länge der Eingabe ab,
nicht von der Größe des Transduktors
Berechnung
folgt dem Pfad, der durch die Eingabezeichenreihe definiert
ist,
erzeugt die korrespondierende Ausgabe
© Karin Haenelt, Transduktoren,
16.5.2010
40
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
41
Operationen auf Transduktoren
rationale Operationen analog zu Akzeptoren
Vereinigung, Konkatenation, Hüllenbildung
Operationen für Transduktoren
Projektion
Komposition
…
Optimierung
Determinisierung (hier: Sequentialisierung)
…
© Karin Haenelt, Transduktoren,
16.5.2010
42
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
43
Abgeschlossenheit
endliche Transduktoren sind generell abgeschlossen unter
Verkettung, Vereinigung, Hüllenbildung
Komposition
Invertierung
endliche Transduktoren sind nicht generell abgeschlossen unter
Differenz
Komplementation 1) 2)
Intersektion 1)
(anb*,cn) (a*bn,cn) ergibt (anbn,cn)
abgeschlossen für
1) synchrone FSTs (kein ε, Relation längenerhaltend)
2) endlich-subsequentielle FSTs
© Karin Haenelt, Transduktoren,
16.5.2010
44
Entscheidbarkeit
es ist entscheidbar, ob ein Transduktor
subsequentiell ist und ob er sequentiell ist
eine rationale Funktion realisiert
determinisiert werden kann
Seien 1,2 Alphabete mit mindestens zwei Buchstaben und
R,S 12. Es ist nicht entscheidbar, ob
RS=Ø
RS
R = S (d.h. zwei Transduktoren äquivalent sind)
R = 12
(12)\R endlich ist
R erkennbar ist
(Berstel, 1979:90)
© Karin Haenelt, Transduktoren,
16.5.2010
45
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
46
Bidirektionalität
Transduktoren sind inhärent bidirektional:
repräsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt
Anwendungsinteressen
in einigen Fällen ist Abbildung nur in einer Richtung
erwünscht
in anderen Fällen ist Abbildung in beide Richtungen
erwünscht
Morphologie: Analyse und Generierung
Text:Speech und Speech:Text
© Karin Haenelt, Transduktoren,
16.5.2010
47
Bidirektionalität: Beispiel
Lexikalischer Transduktor
bildet flektierte Formen auf Lemmata ab
erzeugt zu Lemmata flektierte Formen
v
e
+VBZ:s
a
3
4
5
l
e
+VB:ε
0
1
2
6
a:ε 7 v:f 8 e:ε 9 +VBD:t
Sigma: a,e,f,l,s,t,v,+VB,+VBD,+VBZ
VB: Verb
VBZ: Verb –s-Form
VBD: Verb Präteritum
Beispiel aus:
http://www.xrce.xerox.com/competencies/content-analysis/fsCompiler/fsnetwork.html
© Karin Haenelt, Transduktoren,
16.5.2010
48
Bidirektionalität: Linguistische Adäquatheit
Automaten repräsentieren Regelsysteme,
die eine Sprache generieren,
die nicht zu 100% einer menschlichen Sprache entspricht
es handelt sich um Annäherungen
die Annäherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht
Beispiel: Kreativität
Analyse: produktive Regeln sollen zugelassen werden
„be“{Nomn}{Verbendung}:
„besteuern“, „besendern“, „besaiten“, „bewalden“
Generierung: Eigenkreationen des Systems möglicherweise
unerwünscht:
„begelden“, „berechnern“
© Karin Haenelt, Transduktoren,
16.5.2010
49
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
50
Relation: Grundbegriffe
geordnetes Paar (a1, a2)
zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1, …, an)
n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares
Sei X = (a, b) ein geordnetes Paar
a,
falls b X (a,b)
undefiniert , falls X kein geordnetes Paar ist
1 ( X ) Def
b,
falls a X (a,b)
undefiniert , falls X kein geordnetes Paar ist
2 ( X ) Def
© Karin Haenelt, Transduktoren,
16.5.2010
51
Relation: Grundbegriffe
Cartesisches Produkt
Seien A1, ..., An Mengen. Das Cartesische Produkt (direktes
Produkt, Kreuzprodukt) von A1, ..., An ist die Menge
A1 x A2 := { (a1,a2) | a1 A1 und a2
A2} bzw.
A1 x ... x An := { (a1,...,an) | a1
A1 , ..., und an
An}
Jede Teilmenge des Cartesischen Produktes zweier Mengen A
x B ist eine Korrespondenz
Korrespondenzen: Beziehungen zwischen Elemente verschiedener
Mengen
Relationen: Beziehungen zwischen Elementen einer Menge
die Literatur zu endlichen Automaten vernachlässigt den
Unterschied und spricht nur von Relationen
© Karin Haenelt, Transduktoren,
16.5.2010
52
Relation: Grundbegriffe
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
A
mach
säng
sang
sing
sung
wog
mach
B
sing
wieg
wog
geordnetes Paar: (säng,sing)
Cartesisches Produkt:
{(mach,mach), (mach,sing), (mach,wieg), (mach,wog),
(säng,mach), (säng,sing), (säng,wieg), (säng,wog),…
(wog,mach), (wog,sing), (wog,wieg), (wog,wog)}
Relation R AB „hat den kanonischen Stamm“:
{(mach,mach), (säng,sing), (sang,sing),
(sing,sing), (sung,sing), (wog,wieg), (wog,wog)}
© Karin Haenelt, Transduktoren,
16.5.2010
m
m
...
s
s
s
s
...
a
a
c
c
h
h
i
a
i
i
n
n
n
n
g
g
g
g
w
w
w
w
i
o
o
o
e
g
g
g
g
ε
53
Themen
Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
Definitionen
Transduktoren mit bestimmten Eigenschaften
sequentielle Transduktoren
sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
54
Äquivalenz von
Mealy-Maschine und Moore-Maschine
MealyX
Moore
b0
[ q, b]
' ([ q, b], a)
'[ q, b]
M 1 (Q , , , , , q 0)
M 2 (Q , , , ' , ' , [q 0, b0])
beliebiges Element aus (Ausgabealphabet)
Repräsentant eines Zustandes in M 2
[ (q, a), (q, a)]
b
Q
Mealy
q0
0
1
p0:n p1:n
p0
p0:y p1:n
p1
p0:n p1:y
Q
MealyX
q0
q0
p0
p0
p1
p1
n
y
n
y
n
y
0
p0:n
p0:n
p0:y
p0:y
p0:n
p0:n
1
p1:n
p1:n
p1:y
p1:y
p1:y
p1:y
Q
Moore
[q0,n]
[q0,y]
[p0,n]
[p0,y]
[p1,n]
[p1,y]
n
y
n
y
n
y
0
[p0,n]
[p0,n]
[p0,y]
[p0,y]
[p0,n]
[p0,n]
1
[p1,n]
[p1,n]
[p1,n]
[p1,n]
[p1,y]
[p1,y]
Vgl. Hopcroft/Ullmann 1988:43
© Karin Haenelt, Transduktoren,
16.5.2010
55
Äquivalenz von Mealy- und Moore-Maschine
0:y
0:n
p0
0
q0:n
0:n
q0 1:n
1:n
n
p1
1:y
0
nicht
erreichbar,
d.h. tilgbar
q0:yy
n
p0:n 0
0
1
1
1
p1:n
0
p0:yy
0
n
1
p1:yy
1
1
Hopcroft/Ullmann 1988:45/46
© Karin Haenelt, Transduktoren,
16.5.2010
56
Äquivalenz von Mealy- und Moore-Maschine
Moore
MealyX
'[ q, a ]
Q
Mealy
q0
0
1
p0:n p1:n
p0
p0:y p1:n
p1
p0:n p1:y
© Karin Haenelt, Transduktoren,
16.5.2010
M 1 (Q, , , , , q 0)
M 2 (Q, , , , ' , q 0)
( (q, a))
Q
MealyX
q0
q0
p0
p0
p1
p1
n
y
n
y
n
y
0
p0:n
p0:n
p0:y
p0:y
p0:n
p0:n
1
p1:n
p1:n
p1:y
p1:y
p1:y
p1:y
Q
Moore
[q0,n] n
0
1
[p0,n] [p1,n]
[p0,n]
[p0,y]
[p1,n]
[p1,y]
[p0,y]
[p0,y]
[p0,n]
[p0,n]
n
y
n
y
[p1,n]
[p1,n]
[p1,y]
[p1,y]
57
Vielen Dank
für das Aufspüren von Fehlern in früheren Versionen und für
Verbesserungsvorschläge danke ich
Simone Eberhard
Katja Niemann
Christian Roth
Ineta Sejane
© Karin Haenelt, Transduktoren,
16.5.2010
58
Literatur
Jean Berstel (1979). Transductions and Context-Free Languages. Stuttgart: Teubner.
Jean Berstel und Dominique Perrin (2004). Algorithms on Words. In: M.Lothaire (ed).
(2004). Applied Combinatorics on Words. http://www-igm.univmlv.fr/~berstel/Lothaire/Lothaire3/appcowC1.ps (version 06.04.2004)
Eberhard, Simone; Niemann, Katja und Ineta Sejane (2004). Determinisierung von
Transduktoren. Seminarrreferat 28.06.2004.
http://kontext.fraunhofer.de/haenelt/kurs/Referate/Eberhard_Niemann_Sejane_S2004/Algori
thmusMohri.ppt bzw. pdf
Jurafsky, Daniel und James H. Martin (2000): Speech and Language Processing. An
Introduction to Natural Language Processing, Computational Linguistics and Speech
Recognition. New Jersey: Prentice Hall. S. 21-56.
Haenelt, Karin (2004). Determinisierung von Transducern. Eine Erläuterung des Algorithmus
von Mohri. http://kontext.fraunhofer.de/haenelt/kurs/folien/FstDetermMohri.pdf
Haenelt, Karin (2004). Operationen auf endlichen Automaten und Transduktoren.
Definitionen, Algorithmen, Erläuterungen und Beispiele – eine Übersicht.
http://kontext.fraunhofer.de/haenelt/kurs/folien/FSOperationenDef.pdf
Hanneforth, Thomas (2002 ). Finite-State Techniken: Transduktoren. Kursfolien Universität
Potsdam. http://www.ling.uni-potsdam.de/kurse/EndlicheTechniken/Transduktoren.pdf
© Karin Haenelt, Transduktoren,
16.5.2010
59
Literatur
Hopcroft, John E. Rajeev Motwani und Jeffrey D. Ullman (2001): Introduction to Automata
Theory, Languages and Computation. Addison-Wesley. http://wwwdb.stanford.edu/~ullman/ialc.html
Hopcroft, John E. und Jeffrey D. Ullman. Einführung in die Automatentheorie, formale
Sprachen und Komplexitätstheorie. Bonn u. a. : Addison-Wesley, 1988 (engl. Original
Introduction to automata theory, languages and computation).
Karttunen, Lauri (2003): Finite-State Technology. In: Ruslan Mitkov (Hg.): The Oxford
Handbook of Computational Linguistics. Oxford University Press.
Mohri, Mehryar (1997): Finite State Transducers in Language and Speech Processing. In:
Computational Linguistics, 23, 2, 1997, S. 269-311.
http://citeseer.nj.nec.com/mohri97finitestate.html
Mohri, Mehryar (1996): On some Applications of finite-state automata theory to natural
language processing. In: Journal of Natural Language Egineering, 2, S. 1-20.
Mohri, Mehryar und Michael Riley (2002). Weighted Finite-State Transducers in Speech
Recognition (Tutorial). Teil 1: http://www.research.att.com/~mohri/postscript/icslp.ps, Teil 2:
http://www.research.att.com/~mohri/postscript/icslp-tut2.ps
Starke, Peter H. (1969). Abstrakte Automaten. VEB Deutscher Verlag der Wissenschaften.
Berlin
XEROX Finite State Compiler http://www.xrce.xerox.com/competencies/contentanalysis/fsCompiler/fsnetwork.html
© Karin Haenelt, Transduktoren,
16.5.2010
60
Versionen
4.0: 16.5.2010
3.4: 2.5.2009, 3.3: 15.07.2008, 3.2: 18.05.2008, 3.1:
17.05.2007, 3.0: 12.05.2007
2.0: 27.05.2006
1.3: 05.06.2005, 31.05.2005, 30.05.2005, 29.05.2005,
25.05.2005,
1.2: 24.05.2004, 17.05.2004, 28.04.2004,
18.02.2004,15.02.2004,
1.1: 30.05.2003
1.0: 15.01.2003
© Karin Haenelt, Transduktoren,
16.5.2010
61
Copyright
© Karin Haenelt, 2003, 2004, 2005, 2006, 2007, 200,. 2009
All rights reserved. The German Urheberrecht (esp. § 2, § 13, § 63 , etc.). shall
be applied to these slides. In accordance with these laws these slides are a
publication which may be quoted and used for non-commercial purposes, if the
bibliographic data is included as described below.
Please quote correctly. If you use the presentation or parts of it for educational
and scientific purposes, please observe the laws (copyright, Urheberrecht, etc.)
Please include the bibliographic data (author, title, date, page, URL) in your
publication (book, paper, course slides, etc.).
Deletion or omission of the footer (with name, data and copyright sign) is not
permitted
Bibliographic data. Karin Haenelt. Transduktoren für die Sprachverarbeitung.
Kursfolien. 16.5.2010 (1 15.01.2003)
http://kontext.fraunhofer.de/haenelt/kurs/folien/Haenelt_FST.pdf
For commercial use: No commercial use is allowed without written permission
from the author. In case you are interested in commercial use please contact the
author.
Court of Jurisdiction is Darmstadt, Germany
© Karin Haenelt, Transduktoren,
16.5.2010
62