Exercise 3.9: Conditional Mutual Information
Wir gehen von den statistisch unabhängigen Zufallsgrößen X, Y und Zmit den folgenden Eigenschaften aus :
Xϵ{1,2} , Yϵ{1,2} , Zϵ{1,2}
PX(X)=PY(Y)=[1/2,1/2] , PZ(Z)=[p,1−p].
Aus X, Y und Z bilden wir die neue Zufallsgröße
W=(X+Y).Z.
Damit ist offensichtlich, dass es zwischen den beiden Zufallsgrößen Xund W statistische Abhängigkeiten gibt, die sich auch in der Transinformation I(X;W)≠0 zeigen werden.
Außerdem wird auch I(Y;W)≠04sowieI(Z; W) ≠ 04 gelten, worauf in dieser Aufgabe jedoch nicht näher eingegangen wird.
In dieser Aufgabe werden drei verschiedene Transinformationsdefinitionen verwendet:
- die herkömmliche Transinformation zwischen X und W:
I(X;W)=H(X)−H(X∣W) ,
- die bedingte Transinformation zwischen X und W bei gegebenem Festwert Z=z:
I(X;W∣Z=z)=H(X∣Z=z)−H(X∣W,Z=z),
- die bedingte Transinformation zwischen X und W bei gegebener Zufallsgröße Z:
I(X;W∣Z)=H(X∣Z)−H(X∣WZ).
Der Zusammenhang zwischen den beiden letzten Definitionen lautet:
I(X;W∣Z)=∑zϵsupp(PZ)PZ(Z).I(X;W∣Z=z).
Hinwies: Die Aufgabe gehört zum Themengebiet von Kapitel 3.2.
Fragebogen
Musterlösung
Die folgende Grafik gilt für Z=1⇒W=X+Y. Unter den Voraussetzungen PX(X)=[1/2,1/2] sowie PY(Y)=[1/2,1/2] ergeben sich somit die Verbundwahrscheinlichkeiten PXW|Z=1(X,W) entsprechend der rechten Grafik (graue Hinterlegung).
Damit gilt für die Transinformation unter der festen Bedingung Z=1:
I(X;W∣Z=1)=∑(x,w)ϵsupp(PXW∣Z=1)PXW∣Z=1(x,w).log2PXW∣Z=1(x,w)PX(X).PW∣Z=1(w)= =2.14.log21/41/2.1/4+2.14.log21/41/2.1/4=0.5(bit) Der erste Term fasst die beiden horizontal schraffierten Felder in obiger Grafik zusammen, der zweite Term die vertikal schraffierten Felder. Letztere liefern wegen log2(1)=0 keinen Beitrag.
2. Für Z=2 gilt zwar 'W={4,6,8}, aber hinsichtlich der Wahrscheinlichkeitsfunktionen ändert sich gegenüber der Teilaufgabe (a) nichts. Demzufolge erhält man auch die gleiche bedingte Transinformation:
I(X;W∣Z=2)=I(X;W∣Z=1)=0.5(bit)
3. Es ist berücksichtigt, dass entsprechend den Teilaufgaben (a) und (b) die bedingten Transinformationen für gegebenes Z=1 und gegebenes Z=2 gleich sind. Damit ist I(X;W|Z), also unter der Bedingung einer stochastischen Zufallsgröße Z={1,2} mit P_Z(Z) = [p, 1 – p], unabhängig von p. Das Ergebnis gilt insbesondere auch für p = 1/2 und p = 3/4.
4. Die Verbundwahrscheinlichkeiten P_{ XW }(⋅) hängen auch von den Z–Wahrscheinlichkeiten p und 1 – p ab. Für Pr(Z = 1) = Pr(Z = 2) = 1/2 ergibt sich das nachfolgend skizzierte Schema. Zur Transinformation tragen nur wieder die beiden horizontal schraffierten Felder bei:
5.
6.
7.