Probabilistic Contextfree Grammar (PCFG) Beispiel 1 (Tobias Freymann & Marius von der Kohle) Aufgabe: Gegeben G = <N,T,P,S> mit N = {S,A,B,C}, T = {a} und P={ S → AX 1,0 A → BC 0,1 | CB 0,2 | AX 0,3 | XA 0,4 B → a 0,2 | XX 0,8 C → a 0,7 | XX 0,3 X → a 1,0 } 1. Berechnen Sie die Inside-Wahrscheinlichkeit, dass A das Teilwort w1w2 = aa von w = w1w2w3 = aaa erzeugt. 2. Berechnen Sie die Outside-Wahrscheinlichkeit für Aa bei Eingabe w = aaa. 3. Berechnen Sie die Wahrscheinlichkeit βS(1,3) für die Eingabe w = aaa. Syntaxbäume für w = aaa Split in Inside/Outside für Baum 1 Aufgabe 1 Insidebäume, mit den Indizes 1 und 2, von Wurzel A ausgehend, die w 1w2 = aa erzeugen: → P ( S aa) = (0,1*0,2*0,7) + (0,2*0,7*0,2) = 0,014 + 0,028 = 0,042 Hier werden die Wahrscheinlichkeiten multipliziert: A→ CB, C→ a, B→ a für Baum 1, sowie A→ BC, B→ a, C→ a. Da es zwei Bäume (also Möglichkeiten) gibt, die aa auf Index 1,2 erzeugen, werden beide Wahrscheinlichkeiten addiert. Aufgabe 2 Outsidebäume: beide sind identisch, man brauch also nur einmal berechnen: → P ( S Aa) = 1,0 * 1,0 = 1,0 (für S→ AX, X→ a) = Es deckt damit ausnahmslos alle Wahrscheinlichkeiten ab, dass jedes Wort w auf a endet. 1 Probabilistic Contextfree Grammar (PCFG) Beispiel 1 (Tobias Freymann & Marius von der Kohle) Aufgabe 3 Syntaxbäume für w = aaa Hier werden erneut die Wahrscheinlichkeiten der Derivationen des Wortes w = aaa multipliziert und im (hier gegebenen) Falle von Ambiguitäten addiert: P(T1) = 1,0 * 0,2 * 0,7 * 0,2 * 1,0 = 0,028 für S→ AX, A→ CB, B→ a, C→ a, X→ a P(T2) = 1,0 * 0,1 * 0,2 * 0,7 * 1,0 = 0,014 für S→ AX, A→ BC, B→ a, C→ a, X→ a P(w) = P(T1) + P(T2) = 0,028 + 0,014 = 0,042 l 3 <S, 0.042> <A, 0.2154> 2 <C, 0.3> <B, 0.8> <A, 0.042> <C, 0.3> <B, 0.8> <A, 0.042> <C, 0.7> <B, 0.2> <X, 1.0> 1 <C, 0.7> <B, 0.2> <X, 1.0> 1 2 <C, 0.7> <B, 0.2> <X, 1.0> 3 i 2