Entropie der Binomialverteilungen

Werbung
Aufgaben zu Komplexität von Algorithmen (SS 09)
Aufgabe 23: Entropie der Binomialverteilungen
X und Y seien Zufallsvariable, die auf dem gleichen Wahrscheinlichkeitsraum (Ω, P )
definiert sind und nur endlich-viele Werte annehmen beispielsweise X die Werte {1, 2, . . . , m}
und Y die Werte {1, 2, . . . , n}. Dann sind die die zugehörigen Wahrscheinlichkeiten wie
üblich definiert:
(1 ≤ i ≤ m, 1 ≤ j ≤ n),
pi,j = P [X = i, Y = j]
als die der “gemeinsamen Verteilung” von X und Y , sowie
ri =
cj =
n
X
j=1
m
X
pi,j = P [X = i] (1 ≤ i ≤ m)
(Verteilung von X)
pi,j = P [Y = j] (1 ≤ j ≤ n)
(Verteilung von Y )
i=1
d.h. die ri bzw. cj sind die Zeilensummen bzw. Spaltensummen der Matrix [pi,j ] 1≤i≤m .
1≤j≤n
Die Zufallsvariablen X und Y sind unabhängig, falls pi,j = ri · cj für alle 1 ≤ i ≤ m
und 1 ≤ j ≤ n gilt.
1. Zeigen Sie, dass im Falle der Unabhängigkeit von X und Y die Gleichung
H(X, Y ) = H(X) + H(Y )
für die beteiligten Entropien gilt. Dabei ist die Entropie von Zufallsvariablen nichts
anderes als die Entropie ihrer Verteilung.
2. Es bezeichne Bn die Menge der Bitstrings der Länge n. Für p mit 0 ≤ p ≤ 1
bezeichne βp die Wahrscheinlichkeitsverteilung mit βp (1) = p, βp (0) = 1 − p auf
(n)
B. Für n ≥ 1 ist dann βp die Binomialverteilung zum Parameter p auf Bn , d.h.
jeder Bitstring w = w1 w2 . . . wn ∈ Bn erhält die Wahrscheinlichkeit
βp(n) (w1 w2 . . . wn ) = βp (w1 ) · βp (w2 ) · · · βp (wn ) = pkwk (1 − p)n−kwk
wobei kwk = ]1 (w) das Hamming-Gewicht von w bezeichnet. Das zeigt, dass
die Zufallsvariablen X1 , X2 , . . . , Xn mit Xj : Bn → B : w = w1 w2 . . . wn 7→ wj
unabhängig und haben jeweils βp als Verteilung haben.
(n)
(n)
Betrachten Sie nun die Quellen Qp = Bn , βp .
(n)
a) Wie drückt sich die Entropie Hp
tion H(x, 1 − x) aus?
(n)
der Quelle Qp
mittels der Entropiefunk-
(3)
b) Berechnen Sie für die Quelle Q1/8 deren Entropie, sowie einen optimalen
binären Präfixcode und bestimmen Sie dessen mittlere (erwartete) Wortlänge.
(Hinweis: verwenden Sie bei der Berechnung der Entropie den numerischen
Wert log2 7 = 2.80735 . . .; bei der Berechnung des Codes ist es bequemer,
mit Häufigkeiten statt mit Wahrscheinlichkeiten zu rechnen.)
(n)
c) Sei µp die mittlere (erwartete) Wortlänge eines optimalen Präfixcodes für
(n)
die Quelle Qp . Zeigen Sie:
(n)
µp
lim
= H(p, 1 − p).
n→∞ n
27. Juni 2009
Herunterladen