Handout PCFG 1

Werbung
Probabilistic Contextfree Grammar (PCFG)
Beispiel 1 (Tobias Freymann & Marius von der Kohle)
Aufgabe:
Gegeben G = <N,T,P,S> mit N = {S,A,B,C}, T = {a} und
P={
S → AX 1,0
A → BC 0,1 | CB 0,2 | AX 0,3 | XA 0,4
B → a 0,2 | XX 0,8
C → a 0,7 | XX 0,3
X → a 1,0 }
1. Berechnen Sie die Inside-Wahrscheinlichkeit, dass A das Teilwort w1w2 = aa von
w = w1w2w3 = aaa erzeugt.
2. Berechnen Sie die Outside-Wahrscheinlichkeit für Aa bei Eingabe w = aaa.
3. Berechnen Sie die Wahrscheinlichkeit βS(1,3) für die Eingabe w = aaa.
Syntaxbäume für w = aaa
Split in Inside/Outside
für Baum 1
Aufgabe 1
Insidebäume, mit den Indizes 1 und 2, von Wurzel A ausgehend, die w 1w2 = aa erzeugen:
→ P ( S aa) = (0,1*0,2*0,7) + (0,2*0,7*0,2) = 0,014 + 0,028 = 0,042
Hier werden die Wahrscheinlichkeiten multipliziert: A→ CB, C→ a, B→ a für Baum 1, sowie
A→ BC, B→ a, C→ a. Da es zwei Bäume (also Möglichkeiten) gibt, die aa auf Index 1,2
erzeugen, werden beide Wahrscheinlichkeiten addiert.
Aufgabe 2
Outsidebäume:
beide sind identisch, man brauch also nur einmal berechnen:
→ P ( S Aa) = 1,0 * 1,0 = 1,0 (für S→ AX, X→ a)
= Es deckt damit ausnahmslos alle Wahrscheinlichkeiten ab, dass jedes Wort w auf a endet.
1
Probabilistic Contextfree Grammar (PCFG)
Beispiel 1 (Tobias Freymann & Marius von der Kohle)
Aufgabe 3
Syntaxbäume für w = aaa
Hier werden erneut die Wahrscheinlichkeiten der Derivationen des Wortes w = aaa
multipliziert und im (hier gegebenen) Falle von Ambiguitäten addiert:
P(T1) = 1,0 * 0,2 * 0,7 * 0,2 * 1,0 = 0,028
für S→ AX, A→ CB, B→ a, C→ a, X→ a
P(T2) = 1,0 * 0,1 * 0,2 * 0,7 * 1,0 = 0,014
für S→ AX, A→ BC, B→ a, C→ a, X→ a
P(w) = P(T1) + P(T2) = 0,028 + 0,014 = 0,042
l
3
<S, 0.042>
<A, 0.2154>
2
<C, 0.3>
<B, 0.8>
<A, 0.042>
<C, 0.3>
<B, 0.8>
<A, 0.042>
<C, 0.7>
<B, 0.2>
<X, 1.0>
1
<C, 0.7>
<B, 0.2>
<X, 1.0>
1
2
<C, 0.7>
<B, 0.2>
<X, 1.0>
3
i
2
Zugehörige Unterlagen
Herunterladen