ppt

Werbung
Transduktoren für die Sprachverarbeitung
Karin Haenelt
16.5.2010
1
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
2
Akzeptoren - Transduktoren
Akzeptor
Transduktor
dt
0
S
1
t
q
2
a
3
tt
4
5
S
0
[ʃ]

Grundkonzept:


reguläre Mengen
Akzeptor
 Erkenner

© Karin Haenelt, Transduktoren,
16.5.2010
t
1
[t]
a
q
2
[a]
3

[t]
4
dt
tt
Grundkonzept:
Relationen zwischen
regulären Mengen
Transduktor
 Erkenner
 Generator
 Übersetzer
3
Transduktor: Betrachtungsweisen



Erkenner
 Betrachtung: beide Bänder werden gelesen
 berechnete Information: Entscheidung, ob die Paare von
Zeichenketten akzeptiert werden oder nicht.
Generator
 Betrachtung: beide Bänder werden geschrieben
 berechnete Information: Aufzählung der akzeptierten Paare von
Zeichenketten.
Übersetzer
 Betrachtung: ein Band wird gelesen, ein Band wird geschrieben
 berechnete Information: Aufzählung aller möglichen Zeichenketten,
welche zusammen mit den gelesenen Zeichenketten, akzeptiert
werden
© Karin Haenelt, Transduktoren,
16.5.2010
4
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
5
Akzeptoren – Transduktoren: Äquivalenzen
Reguläre Ausdrücke
über Symbole
sind
äquivalent
spezifizieren
Endliche
Akzeptoren akzeptieren
© Karin Haenelt, Transduktoren,
16.5.2010
reguläre
Mengen
Reguläre
Sprachen
Reguläre Ausdrücke
über Symbolpaare
sind
äquivalent
spezifizieren
Endliche
reguläre
Transduktoren akzeptieren Relationen
Reguläre
Sprachpaare
6
Transduktor: Äquivalenzen
 Endliche Transduktoren sind äquivalent zu regulären Relationen
 Zu jedem endlichen Transduktor lässt sich eine äquivalente
reguläre Relation konstruieren
 und umgekehrt.
 Ein Transduktor ist ein endlicher Automat,
 der zwei reguläre Sprachen in Relation zueinander setzt
 und eine reguläre Relation repräsentiert
© Karin Haenelt, Transduktoren,
16.5.2010
7
Reguläre Relationen
Formulierung 1:
 Das Cartesische Produkt zweier regulärer Mengen L1 und L2 heißt
reguläre Relation
Formulierung 2:
 Seien 1, 2 Alphabete formaler Sprachen. Dann ist die Menge der
regulären Relationen folgendermaßen bestimmt
 Die leere Menge ist eine reguläre Relation
 (x,y) für alle x,y 12 ist eine reguläre Relation
 Wenn R, R1 und R2 reguläre Relationen sind, dann sind
 R1  R2
= {(x1x2,y1y2) | (x1,y1)  R1, (x2,y,2)  R2 }
 R1  R2
= {(x,y) | (x,y)  R1  (x,y)  R2 }
 R*
= i=0 Ri
reguläre Relationen
 Nichts sonst ist eine reguläre Relation
© Karin Haenelt, Transduktoren,
16.5.2010
8
Reguläre Relationen
Beispiele
 gemäß Formulierung 1:
(gab·st) : (geb·en)
 gemäß Formulierung 2:
(gab:geb) · (st:en)
© Karin Haenelt, Transduktoren,
16.5.2010
Cartesisches Produkt zweier
regulärer Mengen
geb  en
gab  st
reguläre Relation
geb en

gab st
9
Reguläre Relationen /
Reguläre Ausdrücke über Symbolpaare
gegeben zwei Relationen R,S
- elementare Ausdrücke
Ø, (x,y)
- Vereinigung / Summe
R ∪ S = {(a,b) | (a,b) ∊ R ∨ (a,b) ∊ S}
a   x  a x 
     , 
b   y   b y 
-
Konkatenation / Produkt
 a   x   ax 
     
 b   y   by 
-
Hülle
 sing   sing   sing sing 
,




säng
sang
säng
sang 

 
 
R · S = {(ax,by) | (a,b) ∊ R ∧ (x,y) ∊ S}
 geb   en   geben 

   

gib

  st   gibst 
R*
*
 a   a aa 
    , , ,...
 b   b bb 
© Karin Haenelt, Transduktoren,
16.5.2010
*

 hi   hi hihi
,...
    , ,
 ha   ha haha 
10
Reguläre Ausdrücke über Symbolpaare


Reguläre Ausdrücke über Symbole
 (gab) (ε | st)
Reguläre Ausdrücke über Symbolpaare
 (gab:geb) {(ε:en), (st:en)}
 (g:g · a:e · b:b) · {(ε:e · ε:n) ,(s:e · t:n)}
 geb   en en   geben geben 
,

  ,   

 gab   st    gab gabst 
© Karin Haenelt, Transduktoren,
16.5.2010
11
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
12
T = ( Q, Σ, Δ, q0, F, δ, σ, w,λ, ρ)
Notation
Q
p, q
Σ
Σ
Zustandsmenge
Zustände
E
Δ
A
*
a
u
s
b
g
e
A
w
u
G
e
-
A
l
p
h
a
b
e
t
a
b
e
-
A
l
p
h
a
b
e
r
s
e
g
g
w
a
a
i
n
b
c
g
e
h
t
s
f
u
f
u
u
n
n
n
k
g
k
t
s
f
i
t
o
u
i
-
A
l
p
h
a
b
e
t
t
o
n
g
a
f
ü
r
E
i
n
g
a
b
e
s
y
m
f
ü
r
E
i
n
g
a
b
e
k
e
t
e
i
b
e
b
t
e
o
-
l
A
l
p
h
a
b
e
t
e
n
n
n
k
t
i
o
n
Präfix bzw. Startgewicht
λ
ρ
a
ε
g
Menge aller Worte über dem Aus
Startzustand
Menge von Endzuständen
Übergangsfunktion
Üb
*
q0
F
δ
δ
σ
x
n
Menge aller Worte über dem Eingabe
*
Δ
i
,
,
b
y
u
n
d
Z
i
f
f
e
r
n
© Karin Haenelt, Transduktoren,
2.5.2009
,
z
S
u
f
f
i
x
b
z
w
.
E
n
d
g
e
w
i
c
h
t
E
i
n
-
b
z
w
.
A
u
s
g
a
b
e
z
e
i
c
h
e
n
E
i
n
-
b
z
w
.
A
u
s
g
a
b
e
z
e
i
c
h
e
n
r
h
e
n
leeres Wort (= Wort der Länge 0)
13
Transduktor: Definition
allgemeine Form T = ( Q, Σ, Δ, q0, F, δ, σ, w)
Mengen
Menge der Zustände
Q
Menge der Eingabezeichen
Σ
Menge der Ausgabezeichen
Δ
ausgezeichnete Elemente
Startzustand
q0  Q
Menge der Endzustände
FQ
Relationen/Funktionen
Angabe des Definitions- und Wertebereichs der Abbildung
Zustandsübergangsfunktion
δ: Q  (Σ  {ε}) → 2Q
σ:
Q  (Σ  {ε})  Q →Δ*
Ausgabefunktion
w:
Q  (Σ  {ε})  Q → R+
Gewichtungsfunktion
oder Q  (Σ  {ε})  Q  Δ → R+
© Karin Haenelt, Transduktoren,
16.5.2010
14
Transduktor: Darstellung

die Kanten
 sind Elemente der Menge Q ×Σ×Δ× +×Q
 haben die Form (p,i,o,w,q)
 pQ
Ausgangszustand
 iΣ
Eingabe-Etikett (input label)
 oΔ
Ausgabe-Etikett (output label)
 w  +
Gewicht (weight)
 qQ
Zielzustand
 graphische Darstellung
o/w
obere Sprache
i:o/ w
p  q
© Karin Haenelt, Transduktoren,
16.5.2010
oder
p
 q
i
untere Sprache
15
Transduktor: zu Grunde liegender Automat

Zu Grunde liegender Automat
 Sei T = ( Q, Σ, Δ, q0, F, δT, σ ) ein endlicher Transduktor,
 dann ist A = ( Q, X, q0, F, δA) der zu Grunde liegende Automat,
wenn gilt:
 (qi, (x,y), qj)  δA und  qi, qj mit qj  δ(qi,x) und y = σ(qi, x, qj)
 X ist die Vereinigung aller solcher Paare (x,y) in T
Transduktor T
s
i
n
g
0
1
2
3
4
s
a
n
g
Zu Grunde liegender Automat A
(s,s) (a,i) (n,n) (g,g)
0
1
2
3
4
•(q1, (a,i), q2)  δA und
•q2  δ(q1,a) und
• i = σ(q1, a, q2)
(Def. vgl. Hanneforth (2002: 3)
© Karin Haenelt, Transduktoren,
16.5.2010
16
Transduktor: Identitätstransduktor

Identitätstransduktor
 Der Identitätstransduktor T = ID (A) eines endlichen Automaten
A = ( Q,Σ, q0, F, δ) ist wie folgt definiert:
 T = ( Q, Σ, Σ, q0, F, δ, σ ) mit σ(qi, x, qj) = x für alle x  Σ, qi,qj  Q,
für die gilt: qj  δ(qi,x)
A = ( Q,Σ, q0, F, δ)
m
a
c
h
T = ( Q, Σ, Σ, q0, F, δ, σ )
m
a
c
h
m
a
c
h
(Def. vgl. Hanneforth (2002: 3)
© Karin Haenelt, Transduktoren,
16.5.2010
17
Transduktor: Projektionen

Erste und zweite Projektion
 Die erste Projektion π1(T) eines normalisierten Transduktors
T = ( Q, Σ, Δ, q0, F, δ, σ ) ist der Automat A = ( Q, Σ, q0, F, δ)
 Die zweite Projektion π2(T) eines normalisierten1 Transduktors
T = ( Q, Σ, Δ, q0, F, δT, σ ) ist der
 Automat A = ( Q, Δ, q0, F, δA) mit (qi, y, qj)  δA,
 wenn  qi, qj, x mit y = σ(qi, x, qj) und qj  δT(qi,x)
T
π1(T): A = ( Q, Σ, q0, F, δ)
π2(T): A = ( Q, Δ, q0, F, δA)
w
w
i
o
e
g
g
ε
w
o
g
ε
w
i
e
g
(Def. vgl. Hanneforth (2002: 3)
© Karin Haenelt, Transduktoren,
16.5.2010
18
Durch Transduktoren berechenbare Relationen
 R(T) = { (a,b)  Σ*Δ* und (a,b) ist das Etikett eines
erfolgreichen Pfades in T}
 Transduktoren können reguläre (auch: rationale) Relationen
berechnen
 Eine rationale Relation, die eine (partielle Funktion) darstellt,
heißt rationale Funktion
© Karin Haenelt, Transduktoren,
16.5.2010
19
Sprache eines Transduktors
 Die Sprache L(T) eines Transduktors T = (Q, q0, F, Σ, Δ, δ, σ) ist
die reguläre Relation {(u,v)  (Σ*, Δ*) |  qf F, so dass gilt: qf
δ*(q0,u) und σ*(q0,u) = v }
 δ* ist die bekannte Erweiterung von δ auf Zeichenreihen
über Σ
 σ* ist die entsprechend erweiterte Ausgabefunktion
vgl. (Hanneforth, 2002: 4)
© Karin Haenelt, Transduktoren,
16.5.2010
20
Transduktionsabbildung
 Die Transduktionsabbildung T: Σ*→2Δ* eines Transduktors T
ist wie folgt definiert:
T (u) = { v  Δ* | (u,v)  L(T) }
T (wog) = { wieg, wog }
© Karin Haenelt, Transduktoren,
16.5.2010
w
i
e
g
w
o
o
o
g
g
g
ε
21
Erweiterte Funktionen δ* und σ*
 Grundfunktionen für Zeichen
p, q  Q, a, b   :
 ( q, a )  p
 ( q, a )  b
 erweiterte Funktionen für Zeichenreihen
q  Q, w  *, a   :
 * ( q,  )  q
 * ( q,  )  
 * (q, wa)   ( * (q, w), a)
 * (q, wa)   * (q, w) ( * (q, w), a)
eine Zeichenreihe w* wird von T akzeptiert g.d.w.*(q0,w) F;
die Ausgabe ist dann *(q0,w)
© Karin Haenelt, Transduktoren,
16.5.2010
22
Erweiterte Funktion σ* : Beispiel
 erweiterte Funktionen σ* für Zeichenreihen
 * (q, wa)   * (q, w) ( * (q, w), a)
a
u
s
1
2
3
e
i
n
0
σ
σ
*
(
q
,
w
*
(
0
,
e
i
·
a
)
=
σ
*
(
q
,
w
·
n
)
=
σ
*
(
0
,
e
=
σ
*
(
0
,
e
=
© Karin Haenelt, Transduktoren,
16.5.2010
a
u
)
σ
(
δ
*
(
q
,
w
i
)
σ
(
δ
*
(
0
,
e
i
)
σ
(
2
i
)
,
a
)
)
,
n
)
,
n
)
s
23
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
24
Transduktoren mit bestimmten Eigenschaften
Aspekt
Ausgabestelle
Kantenetiketten
Endausgabe
Typ der Relation
Verhältnis der
Ein/Ausgabekanten
Eingabeseite
© Karin Haenelt, Transduktoren,
16.5.2010
Ausprägung
Zustand
Kante
Wörter (Zeichenreihen)
Zeichen
ε
Zeichen oder ε
ohne Endausgabe
mit Endausgabe
Benennung
Moore-Automat
Mealy-Automat
Relation
Funktion
(Zeichen | ε) : ( Zeichen | ε)
Zeichen : Zeichen
nicht-deterministisch
deterministisch
ambig, relational
funktional
asynchron
synchron
nicht-sequentiell
sequentiell
literal oder normalisiert
25
Transduktoren: Ausgabestelle
Zwei klassische Modelle:
 Moore-Maschine (1956):
Ausgabe am Zustand
 Mealy-Maschine (1955):
Ausgabe bei Transition
© Karin Haenelt, Transduktoren,
16.5.2010
26
Moore-Maschine
A  (Q, , ,  ,  , q 0)
Q


q0
 q, i 
 q 
endliche Menge von N Zuständen q0, q1, … qN-1
endliche Menge von Eingabesymbolen
endliche Menge von Ausgabesymbolen
Startzustand
Übergangsfunktion Q    Q ; i  
Ausgabefunktion Q  
Q

q0 0
q1 1
q2 2
© Karin Haenelt, Transduktoren,
16.5.2010

0
q0
q2
q1
1
q1
q0
q2
0
q0
1
1
1
q1
0
0
2
q2
0
1
Hopcroft/Ullmann 1988:43
27
Mealy-Maschine
A  (Q, , ,  ,  , q 0)
Q


q0
 q, i 
 q, i 
endliche Menge von N Zuständen q0, q1, … qN-1
endliche Menge von Eingabesymbolen
endliche Menge von Ausgabesymbolen
Startzustand
Übergangsfunktion Q    Q ; i  
0:y
Ausgabefunktion Q    
0:n
p0
Q
q0
p0
p1

0
p0:n
p0:y
p0:n
© Karin Haenelt, Transduktoren,
16.5.2010
1
p1:n
p1:y
p1:y
0:n
q0 1:n
1:n
p1
1:y
Hopcroft/Ullmann 1988:43
28
Äquivalenz von Mealy und Moore-Maschine
 Beide Typen produzieren dieselben Abbildungen zwischen
Eingabe und Ausgabe
 Äquivalente Maschinen konstruierbar
© Karin Haenelt, Transduktoren,
16.5.2010
29
Transduktoren mit literalen Kantenetiketten

literaler / normalisierter Transduktor
 jede Eingabekante und jede Ausgabekante ist mit einem
Buchstaben etikettiert oder mit ε
 Definition. Ein Transduktor T heißt literal oder normalisiert, wenn
gilt
σ: Q x (Σ  {ε}) → Δ  {ε}
 Lemma. Jeder Transduktor, dessen Transduktion nicht ε enthält,
kann normalisiert werden.
normalisiert
S
t
0
1
[t]
[ʃ]
nicht normalisiert
d
t
4

[t]
a
q
2
3
[a]
t
t
6

[t]
© Karin Haenelt, Transduktoren,
16.5.2010
5
7
S
0
[ʃ]
t
1
[t]
a
q
2
[a]
dt
[t]
3
tt
[t]
4
5
30
Transduktoren als Funktion bzw. Relation
 funktionaler Transduktor
 Für jede Eingabezeichenreihe gibt es höchstens eine
Ausgabezeichenreihe
f(könn)=kann
 Definition. Ein Transduktor T heißt funktional, wenn gilt:
| T(x) |  1 für alle x  *
T heißt in diesem Fall auch rationale Funktion
 ambiger / relationaler Transduktor
 Für eine Eingabezeichenreihe gibt es mehr als eine
Ausgabezeichenreihe
f(brach)= {brech, bring}
 Definition. Ein Transduktor T heißt relational, wenn gilt:
| T(x) | > 1 für mindestens ein x  *
T heißt in diesem Fall auch rationale Relation
© Karin Haenelt, Transduktoren,
16.5.2010
31
Transduktoren als Relation



einfach endlich ambiger Transduktor
 Definition. Ein Transduktor T heißt einfach endlich ambig, wenn gilt:
T(x) ist endlich für alle x  *
 Beispiel: ein Transduktor mit an → (b | c)n
unendlich ambiger Transduktor
 Definition. Ein Transduktor T heißt unendlich ambig, wenn er nicht
einfach endlich ambig ist.
 Beispiel: ein Transduktor mit a → b c*
uniform endlich ambiger Transduktor
 Definition. Ein Transduktor T heißt uniform endlich ambig, wenn es
eine ganze Zahl N gibt, so dass gilt:
| T(x) |  N für alle x  *
 Beispiel: ein Transduktor mit a → (b | c)
vgl. (Hanneforth, 2002: 5)
© Karin Haenelt, Transduktoren,
16.5.2010
32
synchroner Transduktor



Relation zwischen Eingabe und Ausgabe ist längenerhaltend
jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben
etikettiert, d.h. keine ε-Kante
Definition. Ein Transduktor T heißt synchron, wenn gilt |T (x) | = |x|
synchroner Transduktor
w
w
o
o
| T(x) |
g
g
asynchroner Transduktor
w
i
e
g
w
o
g
ε
= |x|
| T(wog) | = | wog |
| wog |
= | wog |
3
= 3
© Karin Haenelt, Transduktoren,
16.5.2010
33
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
34
Sequentielle Transduktoren
 … betrachten wir etwas ausführlicher, da sie in der
Verarbeitungspraxis eine bedeutende Rolle spielen
 Eingabeseite deterministisch: sequentieller Transduktor
 In jedem Zustand gibt es höchstens eine ausgehende Kante
mit einem gegebenen Element des Eingabealphabets
 Eingabe: leere Kette nicht zulässig
 Ausgabe: leere Kette möglich
 Eingabe:Ausgabe nicht notwendigerweise 1 Zeichen :1
Zeichen (nicht notwendigerweise längenerhaltend)
 ein einziger Startzustand
© Karin Haenelt, Transduktoren,
16.5.2010
35
Sequentielle Transduktoren
bidirektional
sequentiell
unidirektional
sequentiell


x:a
1
0
x:a
2
1
© Karin Haenelt, Transduktoren,
16.5.2010
x:a

1
0
y:a
unidirektional
sequentiell

0
y:b
unidirektional
sequentiell
2
x:a
1
x:b
2
0
y:
2
36
Sequentielle Transduktoren
sequentiell
 : QQ
 : Q* | + | *+
p
o/w
i
q
subsequentiell
 wie sequentiell
 wie sequentiell
 : F *
p
o/w
i
q
p
a/w
i
eine Endausgabe
endlich-subsequentiell
endlich viele
Endausgaben
nicht sequentiell
© Karin Haenelt, Transduktoren,
16.5.2010
 wie sequentiell
 wie sequentiell
 : F (*)p, p 
:
 : Q(ε)  Q
2* | 2+ | 2*+
Q(ε)2Q
p
o1/w
i
o2/w
i
q
x
o1/w
o2/w
q
r
37
Endlich-subsequentielle Transduktoren
 Generalisierung sequentieller Transduktoren
 maximal endlich viele Ausgabeketten pro Endzustand
 1-subsequentielle Transduktoren = subsequentielle
Transduktoren
 ermöglicht Behandlung einer ambigen Relation in einem nichtambigen Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
38
Sequentielle Transduktoren: Beispiel
nicht-sequentieller
Transduktor
b
0
r
1
b
e
2
3
b
0
4
5
a
c
h
r
i
n
g
7
8
9
r
a
c
h
r



1
b
h
r
6
endlichsubsequentieller
Transduktor
c
2
r
3
a
c
4
h
ech
5
ing
ältere Bezeichnung: p-subsequentieller Transduktor
© Karin Haenelt, Transduktoren,
16.5.2010
39
Sequentielle Transduktoren: Zeit-Komplexität
 Berechnung für eine gegebene Eingabe
 hängt nur von der Länge der Eingabe ab,
 nicht von der Größe des Transduktors
 Berechnung
 folgt dem Pfad, der durch die Eingabezeichenreihe definiert
ist,
 erzeugt die korrespondierende Ausgabe
© Karin Haenelt, Transduktoren,
16.5.2010
40
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
41
Operationen auf Transduktoren
 rationale Operationen analog zu Akzeptoren
 Vereinigung, Konkatenation, Hüllenbildung
 Operationen für Transduktoren
 Projektion
 Komposition
 …
 Optimierung
 Determinisierung (hier: Sequentialisierung)
 …
© Karin Haenelt, Transduktoren,
16.5.2010
42
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
43
Abgeschlossenheit
 endliche Transduktoren sind generell abgeschlossen unter
 Verkettung, Vereinigung, Hüllenbildung
 Komposition
 Invertierung
 endliche Transduktoren sind nicht generell abgeschlossen unter
 Differenz
 Komplementation 1) 2)
 Intersektion 1)
(anb*,cn) (a*bn,cn) ergibt (anbn,cn)

abgeschlossen für
1) synchrone FSTs (kein ε, Relation längenerhaltend)
2) endlich-subsequentielle FSTs
© Karin Haenelt, Transduktoren,
16.5.2010
44
Entscheidbarkeit
 es ist entscheidbar, ob ein Transduktor
 subsequentiell ist und ob er sequentiell ist
 eine rationale Funktion realisiert
 determinisiert werden kann
 Seien 1,2 Alphabete mit mindestens zwei Buchstaben und
R,S 12. Es ist nicht entscheidbar, ob
 RS=Ø
 RS
 R = S (d.h. zwei Transduktoren äquivalent sind)
 R = 12
 (12)\R endlich ist
 R erkennbar ist
(Berstel, 1979:90)
© Karin Haenelt, Transduktoren,
16.5.2010
45
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
46
Bidirektionalität
 Transduktoren sind inhärent bidirektional:
 repräsentierte Relationen sind Abbildungen von oberer
Sprache zu unterer Sprache und umgekehrt
 Anwendungsinteressen
 in einigen Fällen ist Abbildung nur in einer Richtung
erwünscht
 in anderen Fällen ist Abbildung in beide Richtungen
erwünscht
 Morphologie: Analyse und Generierung
 Text:Speech und Speech:Text
© Karin Haenelt, Transduktoren,
16.5.2010
47
Bidirektionalität: Beispiel
Lexikalischer Transduktor
 bildet flektierte Formen auf Lemmata ab
 erzeugt zu Lemmata flektierte Formen
v
e
+VBZ:s
a
3
4
5
l
e
+VB:ε
0
1
2
6
a:ε 7 v:f 8 e:ε 9 +VBD:t
Sigma: a,e,f,l,s,t,v,+VB,+VBD,+VBZ
VB: Verb
VBZ: Verb –s-Form
VBD: Verb Präteritum
Beispiel aus:
http://www.xrce.xerox.com/competencies/content-analysis/fsCompiler/fsnetwork.html
© Karin Haenelt, Transduktoren,
16.5.2010
48
Bidirektionalität: Linguistische Adäquatheit
 Automaten repräsentieren Regelsysteme,
 die eine Sprache generieren,
 die nicht zu 100% einer menschlichen Sprache entspricht
 es handelt sich um Annäherungen
 die Annäherungen werden der Analyse- und der
Generierungsseite zuweilen unterschiedlich gerecht
 Beispiel: Kreativität
 Analyse: produktive Regeln sollen zugelassen werden
 „be“{Nomn}{Verbendung}:
 „besteuern“, „besendern“, „besaiten“, „bewalden“
 Generierung: Eigenkreationen des Systems möglicherweise
unerwünscht:
 „begelden“, „berechnern“
© Karin Haenelt, Transduktoren,
16.5.2010
49
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
50
Relation: Grundbegriffe



geordnetes Paar (a1, a2)
 zwei Elemente in festgelegter Reihenfolge
n-Tupel (a1, …, an)
 n Elemente in festgelegter Reihenfolge
Projektionen eines geordneten Paares
 Sei X = (a, b) ein geordnetes Paar
a,
falls b X  (a,b)

undefiniert , falls X kein geordnetes Paar ist
 1 ( X )  Def 
b,
falls a X  (a,b)

undefiniert , falls X kein geordnetes Paar ist
 2 ( X )  Def 
© Karin Haenelt, Transduktoren,
16.5.2010
51
Relation: Grundbegriffe
 Cartesisches Produkt
 Seien A1, ..., An Mengen. Das Cartesische Produkt (direktes
Produkt, Kreuzprodukt) von A1, ..., An ist die Menge
 A1 x A2 := { (a1,a2) | a1 A1 und a2
A2} bzw.
 A1 x ... x An := { (a1,...,an) | a1
A1 , ..., und an
An}
 Jede Teilmenge des Cartesischen Produktes zweier Mengen A
x B ist eine Korrespondenz
 Korrespondenzen: Beziehungen zwischen Elemente verschiedener
Mengen
 Relationen: Beziehungen zwischen Elementen einer Menge
 die Literatur zu endlichen Automaten vernachlässigt den
Unterschied und spricht nur von Relationen
© Karin Haenelt, Transduktoren,
16.5.2010
52
Relation: Grundbegriffe
Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation
A
mach
säng
sang
sing
sung
wog
mach
B
sing
wieg
wog
geordnetes Paar: (säng,sing)
Cartesisches Produkt:
{(mach,mach), (mach,sing), (mach,wieg), (mach,wog),
(säng,mach), (säng,sing), (säng,wieg), (säng,wog),…
(wog,mach), (wog,sing), (wog,wieg), (wog,wog)}
Relation R AB „hat den kanonischen Stamm“:
{(mach,mach), (säng,sing), (sang,sing),
(sing,sing), (sung,sing), (wog,wieg), (wog,wog)}
© Karin Haenelt, Transduktoren,
16.5.2010
m
m
...
s
s
s
s
...
a
a
c
c
h
h
i
a
i
i
n
n
n
n
g
g
g
g
w
w
w
w
i
o
o
o
e
g
g
g
g
ε
53
Themen








Einführung
Äquivalenzen: Transduktoren und reguläre Relationen
Transduktoren
 Definitionen
 Transduktoren mit bestimmten Eigenschaften
 sequentielle Transduktoren
 sequentiell, subsequentiell, endlich-subsequentiell
Operationen auf Transduktoren
Abgeschlossenheit, Entscheidbarkeit
Bidirektionalität
Anhang: Grundlagen: Relationen
Anhang: Äquivalenz von Mealy- und Moore-Automaten
© Karin Haenelt, Transduktoren,
16.5.2010
54
Äquivalenz von
Mealy-Maschine und Moore-Maschine
MealyX
Moore
b0
[ q, b]
 ' ([ q, b], a)
 '[ q, b]
M 1  (Q  , , ,  ,  , q 0)
M 2  (Q  , , ,  ' ,  ' , [q 0, b0])
beliebiges Element aus  (Ausgabealphabet)
Repräsentant eines Zustandes in M 2
 [ (q, a),  (q, a)]
b
Q
Mealy
q0

0
1
p0:n p1:n
p0
p0:y p1:n
p1
p0:n p1:y
Q
MealyX
q0
q0
p0
p0
p1
p1

n
y
n
y
n
y

0
p0:n
p0:n
p0:y
p0:y
p0:n
p0:n
1
p1:n
p1:n
p1:y
p1:y
p1:y
p1:y
Q
Moore
[q0,n]
[q0,y]
[p0,n]
[p0,y]
[p1,n]
[p1,y]

n
y
n
y
n
y

0
[p0,n]
[p0,n]
[p0,y]
[p0,y]
[p0,n]
[p0,n]
1
[p1,n]
[p1,n]
[p1,n]
[p1,n]
[p1,y]
[p1,y]
Vgl. Hopcroft/Ullmann 1988:43
© Karin Haenelt, Transduktoren,
16.5.2010
55
Äquivalenz von Mealy- und Moore-Maschine
0:y
0:n
p0
0
q0:n
0:n
q0 1:n
1:n
n
p1
1:y
0
nicht
erreichbar,
d.h. tilgbar
q0:yy
n
p0:n 0
0
1
1
1
p1:n
0
p0:yy
0
n
1
p1:yy
1
1
Hopcroft/Ullmann 1988:45/46
© Karin Haenelt, Transduktoren,
16.5.2010
56
Äquivalenz von Mealy- und Moore-Maschine
Moore
MealyX
 '[ q, a ]
Q
Mealy
q0

0
1
p0:n p1:n
p0
p0:y p1:n
p1
p0:n p1:y
© Karin Haenelt, Transduktoren,
16.5.2010
M 1  (Q, , ,  ,  , q 0)
M 2  (Q, , ,  ,  ' , q 0)
  ( (q, a))
Q
MealyX
q0
q0
p0
p0
p1
p1

n
y
n
y
n
y

0
p0:n
p0:n
p0:y
p0:y
p0:n
p0:n
1
p1:n
p1:n
p1:y
p1:y
p1:y
p1:y
Q

Moore
[q0,n] n

0
1
[p0,n] [p1,n]
[p0,n]
[p0,y]
[p1,n]
[p1,y]
[p0,y]
[p0,y]
[p0,n]
[p0,n]
n
y
n
y
[p1,n]
[p1,n]
[p1,y]
[p1,y]
57
Vielen Dank
 für das Aufspüren von Fehlern in früheren Versionen und für
Verbesserungsvorschläge danke ich




Simone Eberhard
Katja Niemann
Christian Roth
Ineta Sejane
© Karin Haenelt, Transduktoren,
16.5.2010
58
Literatur







Jean Berstel (1979). Transductions and Context-Free Languages. Stuttgart: Teubner.
Jean Berstel und Dominique Perrin (2004). Algorithms on Words. In: M.Lothaire (ed).
(2004). Applied Combinatorics on Words. http://www-igm.univmlv.fr/~berstel/Lothaire/Lothaire3/appcowC1.ps (version 06.04.2004)
Eberhard, Simone; Niemann, Katja und Ineta Sejane (2004). Determinisierung von
Transduktoren. Seminarrreferat 28.06.2004.
http://kontext.fraunhofer.de/haenelt/kurs/Referate/Eberhard_Niemann_Sejane_S2004/Algori
thmusMohri.ppt bzw. pdf
Jurafsky, Daniel und James H. Martin (2000): Speech and Language Processing. An
Introduction to Natural Language Processing, Computational Linguistics and Speech
Recognition. New Jersey: Prentice Hall. S. 21-56.
Haenelt, Karin (2004). Determinisierung von Transducern. Eine Erläuterung des Algorithmus
von Mohri. http://kontext.fraunhofer.de/haenelt/kurs/folien/FstDetermMohri.pdf
Haenelt, Karin (2004). Operationen auf endlichen Automaten und Transduktoren.
Definitionen, Algorithmen, Erläuterungen und Beispiele – eine Übersicht.
http://kontext.fraunhofer.de/haenelt/kurs/folien/FSOperationenDef.pdf
Hanneforth, Thomas (2002 ). Finite-State Techniken: Transduktoren. Kursfolien Universität
Potsdam. http://www.ling.uni-potsdam.de/kurse/EndlicheTechniken/Transduktoren.pdf
© Karin Haenelt, Transduktoren,
16.5.2010
59
Literatur








Hopcroft, John E. Rajeev Motwani und Jeffrey D. Ullman (2001): Introduction to Automata
Theory, Languages and Computation. Addison-Wesley. http://wwwdb.stanford.edu/~ullman/ialc.html
Hopcroft, John E. und Jeffrey D. Ullman. Einführung in die Automatentheorie, formale
Sprachen und Komplexitätstheorie. Bonn u. a. : Addison-Wesley, 1988 (engl. Original
Introduction to automata theory, languages and computation).
Karttunen, Lauri (2003): Finite-State Technology. In: Ruslan Mitkov (Hg.): The Oxford
Handbook of Computational Linguistics. Oxford University Press.
Mohri, Mehryar (1997): Finite State Transducers in Language and Speech Processing. In:
Computational Linguistics, 23, 2, 1997, S. 269-311.
http://citeseer.nj.nec.com/mohri97finitestate.html
Mohri, Mehryar (1996): On some Applications of finite-state automata theory to natural
language processing. In: Journal of Natural Language Egineering, 2, S. 1-20.
Mohri, Mehryar und Michael Riley (2002). Weighted Finite-State Transducers in Speech
Recognition (Tutorial). Teil 1: http://www.research.att.com/~mohri/postscript/icslp.ps, Teil 2:
http://www.research.att.com/~mohri/postscript/icslp-tut2.ps
Starke, Peter H. (1969). Abstrakte Automaten. VEB Deutscher Verlag der Wissenschaften.
Berlin
XEROX Finite State Compiler http://www.xrce.xerox.com/competencies/contentanalysis/fsCompiler/fsnetwork.html
© Karin Haenelt, Transduktoren,
16.5.2010
60
Versionen
 4.0: 16.5.2010
 3.4: 2.5.2009, 3.3: 15.07.2008, 3.2: 18.05.2008, 3.1:
17.05.2007, 3.0: 12.05.2007
 2.0: 27.05.2006
 1.3: 05.06.2005, 31.05.2005, 30.05.2005, 29.05.2005,
25.05.2005,
 1.2: 24.05.2004, 17.05.2004, 28.04.2004,
18.02.2004,15.02.2004,
 1.1: 30.05.2003
 1.0: 15.01.2003
© Karin Haenelt, Transduktoren,
16.5.2010
61
Copyright






© Karin Haenelt, 2003, 2004, 2005, 2006, 2007, 200,. 2009
All rights reserved. The German Urheberrecht (esp. § 2, § 13, § 63 , etc.). shall
be applied to these slides. In accordance with these laws these slides are a
publication which may be quoted and used for non-commercial purposes, if the
bibliographic data is included as described below.
Please quote correctly. If you use the presentation or parts of it for educational
and scientific purposes, please observe the laws (copyright, Urheberrecht, etc.)
Please include the bibliographic data (author, title, date, page, URL) in your
publication (book, paper, course slides, etc.).
Deletion or omission of the footer (with name, data and copyright sign) is not
permitted
Bibliographic data. Karin Haenelt. Transduktoren für die Sprachverarbeitung.
Kursfolien. 16.5.2010 (1 15.01.2003)
http://kontext.fraunhofer.de/haenelt/kurs/folien/Haenelt_FST.pdf
For commercial use: No commercial use is allowed without written permission
from the author. In case you are interested in commercial use please contact the
author.
Court of Jurisdiction is Darmstadt, Germany
© Karin Haenelt, Transduktoren,
16.5.2010
62
Herunterladen