Informationstheorie Lösung 6

Werbung
ETH Zürich
Dept. Informatik
Prof. Markus Gross
WS 06/07
Informationstheorie
Lösung 6
6.1
Informationsquelle
a) Wir haben die drei Zustände “die letzte Prüfung war einfach (und die vorletzte schwierig)”, “die beiden letzten Prüfungen waren einfach” und “die letzte Prüfung war
schwierig”, die wir kurz mit “e”, “ee” und “s” bezeichnen.
Das Zustandsübergangsdiagramm ist
1/2
e
1/5
ee
1/2
4/5
1/2
s
1/2
und die entsprechende Zustandsübergangmatrix


0.5 0.5 0.8
 0.5 0
0 
0 0.5 0.2
b) Die stationäre Verteilung kann gemäss des im Unterkapitel 3.6 beschriebenen Verfahrens berechnet werden. Für unsere Quelle erhalten wir
PX (s) =
8
5
16
≈ 0.552, PX (e) =
≈ 0.276, PX (ee) =
≈ 0.172
29
29
29
Somit erhalten wir für die Entropierate
H({Xi }) =
=
16
8
5
· H([0.5, 0.5, 0]) +
· H([0.5, 0, 0.5]) +
· H([0.8, 0.2, 0])
29
29
29
24
5
+
· h(0.2) ≈ 0.952
29 29
6.2
Codes und Bäume
a) Die Definition für die mittlere Baumtiefe ist
X
tT =
P (b)t(b).
b∈B
Ersetzt man nun ein Blatt bc der Tiefe t(bc ) durch zwei Blätter bck0 und bck1 der Tiefe
t(bck0 ) = t(bck1 ) = t(bc ) + 1, dann erhält man
entferne bc
tT ′
f üge bck0 hinzu
f üge bck1 hinzu
z }| { z
}|
{ z
}|
{
=
P (b)t(b) − P (bc )t(bc ) + P (bck0 ) t(bck0 ) + P (bck1 ) t(bck1 )
| {z }
| {z }
b∈B
{z
}
|
t(bc )+1
t(bc )+1
X
tT
= tT − P (bc )t(bc ) + t(bc ) + 1 P (bck0 ) + P (bck1 )
|
{z
}
P (bc )
= tT − P (bc )t(bc ) + (t(bc ) + 1)P (bc )
= tT + P (bc )
b) Wir beweisen dies mittels Induktion:
P
Aussage: Sei S(n) das Prädikat: tT =
z∈Z P (z) gilt für alle Bäume T mit n
”
inneren Knoten und allen Wahrscheinlichkeitsverteilungen an den Blättern.“ Wir
müssen zeigen, dass S(n) für alle n > 0 gilt.
Verankerung S(1): Es gibt zwei Bäume mit einem inneren Knoten: Eine Wurzel mit
nur einem Blatt oder mit zwei Blättern. Es ist leicht zu sehen, das beide Bäume
dass Prädikat erfüllen.
Induktionsschritt S(n) → S(n + 1) : Sei T ′ ein Baum mit n + 1 innneren Knoten
und sei PT ′ eine Wahrscheinlichkeitsverteilung auf den Blättern von T ′ . In jedem
endlichen ausgefüllten Baum existiert immer ein innerer Knoten zc , so dass seine
beiden Kinder Blätter sind, sagen wir bck0 und bck1 . (Ist T ′ nicht ausgefüllt,
so nehmen wir einen inneren Knoten, dessen einzelnes Kind ein Blatt ist und
verfahren analog.)
Sei T der entsprechende Baum, wenn wir die Blätter bck0 und bck1 entfernen
(dafür wird zc zum Blatt bc ). Sei PT diejenige Wahrschenlichkeitsverteilung auf
den Blättern von T , die aus PT ′ entsteht, wenn man bck0 und bck1 entfernt und
stattdessen PT (bc ) = PT ′ (bck0 ) + PT ′ (bck1 ) setzt. Ferner sei ZT die Menge der
inneren Knoten von T (es gilt ZT ′ = ZT ∪ {bc }). Nun gilt:
tT ′ = tT + PT ′ (zc )
X
=
PT (z) + PT ′ (zc )
aus Aufgabe a)
Induktionsannahme
z∈ZT
=
X
z∈ZT
PT ′ (z) + PT ′ (zc ) =
X
z∈ZT ′
PT ′ (z)
c) Von unten nach oben berechnen wir die Wahrscheinlichkeiten P (z) für alle inneren
Knoten z und addieren sie auf:
1
53
100
47
100
52
100
1
100
43
100
9
100
29
100
14
100
10
100
4
100
8
100
10
100
+
14
100
+
16
100
+
22
100
+
29
100
22
100
7
100
5
100
2
100
+
43
100
16
100
6
100
+
52
100
+
53
100
11
100
+1 =
339
100
= 3.39.
Herunterladen