Difference between revisions of "Aufgaben:Exercise 4.5: Mutual Information from 2D-PDF"

From LNTwww
Line 24: Line 24:
 
Für die beiden Randwahrscheinlichkeitsdichtefunktionen gilt dabei:
 
Für die beiden Randwahrscheinlichkeitsdichtefunktionen gilt dabei:
 
:$$f_X(x) = \hspace{-0.5cm}  \int\limits_{\hspace{-0.2cm}y \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} (f_{Y}\hspace{-0.08cm})} \hspace{-0.4cm} f_{XY}(x, y)  
 
:$$f_X(x) = \hspace{-0.5cm}  \int\limits_{\hspace{-0.2cm}y \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} (f_{Y}\hspace{-0.08cm})} \hspace{-0.4cm} f_{XY}(x, y)  
  \hspace{0.15cm}{\rm d}y\hspace{0.05cm},\hspace{0.8cm}
+
  \hspace{0.15cm}{\rm d}y\hspace{0.05cm},$$
:f_Y(y) = \hspace{-0.5cm}  \int\limits_{\hspace{-0.2cm}x \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} (f_{X}\hspace{-0.08cm})} \hspace{-0.4cm} f_{XY}(x, y)  
+
:$$f_Y(y) = \hspace{-0.5cm}  \int\limits_{\hspace{-0.2cm}x \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} (f_{X}\hspace{-0.08cm})} \hspace{-0.4cm} f_{XY}(x, y)  
 
  \hspace{0.15cm}{\rm d}x\hspace{0.05cm}.$$
 
  \hspace{0.15cm}{\rm d}x\hspace{0.05cm}.$$
  
Line 68: Line 68:
 
===Musterlösung===
 
===Musterlösung===
 
{{ML-Kopf}}
 
{{ML-Kopf}}
[[File:P_ID2887__Inf_A_4_5a.png|right|]]
+
[[File:P_ID2887__Inf_A_4_5a.png|right|frame|„Rote” Wahrscheinlichkeitsdichtefunktionen]]
<b>a)</b>&nbsp;&nbsp;Bei der rechteckförmigen Verbund&ndash;WDF <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) gibt es  zwischen <i>X</i> und <i>Y</i> keine statistischen Bindungen  &nbsp;&#8658;&nbsp; <u><i>I</i>(<i>X</i>; <i>Y</i>) = 0</u>.
+
'''(1)'''&nbsp; Bei der rechteckförmigen Verbund&ndash;WDF <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) gibt es  zwischen <i>X</i> und <i>Y</i> keine statistischen Bindungen  &nbsp;&#8658;&nbsp; <u><i>I</i>(<i>X</i>; <i>Y</i>) = 0</u>.
  
 
Formal lässt sich dieses Ergebnis mit der folgenden Gleichung nachweisen:
 
Formal lässt sich dieses Ergebnis mit der folgenden Gleichung nachweisen:
 
+
:$$I(X;Y) = h(X) \hspace{-0.05cm}+\hspace{-0.05cm} h(Y) \hspace{-0.05cm}- \hspace{-0.05cm}h(XY)\hspace{0.02cm}.$$
$$I(X;Y) = h(X) \hspace{-0.05cm}+\hspace{-0.05cm} h(Y) \hspace{-0.05cm}- \hspace{-0.05cm}h(XY)\hspace{0.02cm}.$$
 
 
Die rote Fläche 2D&ndash;WDF <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) ist <i>F</i> = 4. Da <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) in diesem Gebiet konstant ist und das Volumen unter <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) gleich 1 sein muss, gilt <i>C</i> = 1/<i>F</i> = 1/4. Daraus folgt für die differentielle Verbundentropie in &bdquo;bit&rdquo;:
 
Die rote Fläche 2D&ndash;WDF <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) ist <i>F</i> = 4. Da <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) in diesem Gebiet konstant ist und das Volumen unter <i>f<sub>XY</sub></i>(<i>x</i>, <i>y</i>) gleich 1 sein muss, gilt <i>C</i> = 1/<i>F</i> = 1/4. Daraus folgt für die differentielle Verbundentropie in &bdquo;bit&rdquo;:
$$h(XY) \  =  \  \hspace{0.1cm}-\hspace{0.2cm} \int \hspace{-0.9cm} \int\limits_{\hspace{-0.5cm}(x, y) \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} \hspace{0.03cm}(\hspace{-0.03cm}f_{XY}\hspace{-0.08cm})}  
+
:$$h(XY) \  =  \  \hspace{0.1cm}-\hspace{0.2cm} \int \hspace{-0.9cm} \int\limits_{\hspace{-0.5cm}(x, y) \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} \hspace{0.03cm}(\hspace{-0.03cm}f_{XY}\hspace{-0.08cm})}  
 
  \hspace{-0.6cm} f_{XY}(x, y) \cdot {\rm log}_2 \hspace{0.1cm} [ f_{XY}(x, y) ]
 
  \hspace{-0.6cm} f_{XY}(x, y) \cdot {\rm log}_2 \hspace{0.1cm} [ f_{XY}(x, y) ]
  \hspace{0.15cm}{\rm d}x\hspace{0.15cm}{\rm d}y\\
+
  \hspace{0.15cm}{\rm d}x\hspace{0.15cm}{\rm d}y$$
  =  \  {\rm log}_2 \hspace{0.1cm} (4) \cdot \hspace{0.02cm} \int \hspace{-0.9cm} \int\limits_{\hspace{-0.5cm}(x, y) \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} \hspace{0.03cm}(\hspace{-0.03cm}f_{XY}\hspace{-0.08cm})}  
+
:$$\Rightarrow \hspace{0.3cm} h(XY) \  = \ \  {\rm log}_2 \hspace{0.1cm} (4) \cdot \hspace{0.02cm} \int \hspace{-0.9cm} \int\limits_{\hspace{-0.5cm}(x, y) \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} \hspace{0.03cm}(\hspace{-0.03cm}f_{XY}\hspace{-0.08cm})}  
 
  \hspace{-0.6cm} f_{XY}(x, y)  
 
  \hspace{-0.6cm} f_{XY}(x, y)  
 
  \hspace{0.15cm}{\rm d}x\hspace{0.15cm}{\rm d}y = 2 \,{\rm bit}\hspace{0.05cm}.$$
 
  \hspace{0.15cm}{\rm d}x\hspace{0.15cm}{\rm d}y = 2 \,{\rm bit}\hspace{0.05cm}.$$
 
Es ist berücksichtigt, das das Doppelintegral gleich 1 ist. Die Pseudo&ndash;Einheit &bdquo;bit&rdquo; korrespondiert mit dem <i>Logarithmus dualis</i> &nbsp;&#8658;&nbsp; &bdquo;log<sub>2</sub>&rdquo;. Weiterhin gilt:
 
Es ist berücksichtigt, das das Doppelintegral gleich 1 ist. Die Pseudo&ndash;Einheit &bdquo;bit&rdquo; korrespondiert mit dem <i>Logarithmus dualis</i> &nbsp;&#8658;&nbsp; &bdquo;log<sub>2</sub>&rdquo;. Weiterhin gilt:
:* Die beiden Randwahrscheinlichkeitsdichtefunktionen ''f<sub>X</sub>''(''x'') und  ''f<sub>Y</sub>''(''y'') sind jeweils rechteckförmig &#8658; Gleichverteilung zwischen 0 und 2:
+
* Die beiden Randwahrscheinlichkeitsdichtefunktionen ''f<sub>X</sub>''(''x'') und  ''f<sub>Y</sub>''(''y'') sindrechteckförmig &#8658; Gleichverteilung zwischen 0 und 2:
$$h(X) = h(Y) = {\rm log}_2 \hspace{0.1cm} (2) = 1 \,{\rm bit}\hspace{0.05cm}.$$
+
:$$h(X) = h(Y) = {\rm log}_2 \hspace{0.1cm} (2) = 1 \,{\rm bit}\hspace{0.05cm}.$$
:* Setzt man diese Ergebnisse in die obige Gleichung ein, so erhält man:
+
* Setzt man diese Ergebnisse in die obige Gleichung ein, so erhält man:
$$I(X;Y) = h(X) + h(Y) - h(XY) = 1 \,{\rm bit} + 1 \,{\rm bit} - 2 \,{\rm bit} = 0 \,{\rm (bit)}
+
:$$I(X;Y) = h(X) + h(Y) - h(XY) = 1 \,{\rm bit} + 1 \,{\rm bit} - 2 \,{\rm bit} = 0 \,{\rm (bit)}
 
\hspace{0.05cm}.$$
 
\hspace{0.05cm}.$$
[[File:P_ID2888__Inf_A_4_5b_neu.png|right|]]
+
 
<b>b)</b>&nbsp;&nbsp;Auch bei diesem Parallelogramm ergibt sich <i>F</i> = 4, <i>C</i> = 1/4 sowie <i>h</i>(<i>XY</i>) = 2 bit. Die Zufallsgröße <i>Y</i> ist hier wie in der Teilaufgabe (a) zwischen 0 und 2 gleichverteilt. Somit gilt weiter <i>h</i>(<i>Y</i>) = 1 bit.
+
 
 +
[[File:P_ID2888__Inf_A_4_5b_neu.png|right|frame|„Blaue” Wahrscheinlichkeitsdichtefunktionen]]
 +
'''(2)'''&nbsp; Auch bei diesem Parallelogramm ergibt sich <i>F</i> = 4, <i>C</i> = 1/4 sowie <i>h</i>(<i>XY</i>) = 2 bit. Die Zufallsgröße <i>Y</i> ist hier wie in der Teilaufgabe (1) zwischen 0 und 2 gleichverteilt. Somit gilt weiter <i>h</i>(<i>Y</i>) = 1 bit.
  
 
Dagegen ist <i>X</i> dreieckverteilt zwischen 0 und 4 (mit Maximum bei 2). Es ergibt sich hierfür die gleiche differentielle Entropie <i>h</i>(<i>Y</i>) wie bei einer symmetrischen Dreieckverteilung im Bereich zwischen &plusmn;2  (siehe Angabenblatt):
 
Dagegen ist <i>X</i> dreieckverteilt zwischen 0 und 4 (mit Maximum bei 2). Es ergibt sich hierfür die gleiche differentielle Entropie <i>h</i>(<i>Y</i>) wie bei einer symmetrischen Dreieckverteilung im Bereich zwischen &plusmn;2  (siehe Angabenblatt):
$$h(X) = {\rm log}_2 \hspace{0.1cm} [\hspace{0.05cm}2 \cdot \sqrt{ e} \hspace{0.05cm}]
+
:$$h(X) = {\rm log}_2 \hspace{0.1cm} [\hspace{0.05cm}2 \cdot \sqrt{ e} \hspace{0.05cm}]
 
= 1.721 \,{\rm bit}$$
 
= 1.721 \,{\rm bit}$$
$$\Rightarrow \hspace{0.3cm} I(X;Y) =  1.721 \,{\rm bit} + 1 \,{\rm bit} - 2 \,{\rm bit}\hspace{0.05cm}\underline{ = 0.721 \,{\rm (bit)}}
+
:$$\Rightarrow \hspace{0.3cm} I(X;Y) =  1.721 \,{\rm bit} + 1 \,{\rm bit} - 2 \,{\rm bit}\hspace{0.05cm}\underline{ = 0.721 \,{\rm (bit)}}
 
\hspace{0.05cm}.$$
 
\hspace{0.05cm}.$$
[[File:P_ID2889__Inf_A_4_5c_neu.png|right|]]
+
 
<b>c)</b>&nbsp;&nbsp;Bei den grünen Gegebenheiten berechnet sich die Verbundentropie wie folgt:
+
 
$$F = A \cdot B \hspace{0.3cm}  \Rightarrow \hspace{0.3cm} C = \frac{1}{A \cdot B}
+
 
\hspace{0.05cm}$$
+
[[File:P_ID2889__Inf_A_4_5c_neu.png|right|frame|„Grüne” Wahrscheinlichkeitsdichtefunktionen]]
$$\Rightarrow \hspace{0.3cm} h(XY)  =  {\rm log}_2 \hspace{0.1cm} (A \cdot B)  
+
'''(3)'''&nbsp; Bei den grünen Gegebenheiten ergeben sich folgende Eigenschaften:
 +
:$$F = A \cdot B \hspace{0.3cm}  \Rightarrow \hspace{0.3cm} C = \frac{1}{A \cdot B}
 +
\hspace{0.05cm}\hspace{0.3cm}
 +
\Rightarrow \hspace{0.3cm} h(XY)  =  {\rm log}_2 \hspace{0.1cm} (A \cdot B)  
 
\hspace{0.05cm}.$$
 
\hspace{0.05cm}.$$
 
Die Zufallsgröße <i>Y</i> ist nun zwischen 0 und <i>A</i> gleichverteilt und die Zufallsgröße <i>X</i> ist  zwischen 0 und <i>B</i> dreieckverteilt:
 
Die Zufallsgröße <i>Y</i> ist nun zwischen 0 und <i>A</i> gleichverteilt und die Zufallsgröße <i>X</i> ist  zwischen 0 und <i>B</i> dreieckverteilt:
$$h(X)  \ =  \  {\rm log}_2 \hspace{0.1cm} (B \cdot \sqrt{ e})  
+
:$$h(X)  \ =  \  {\rm log}_2 \hspace{0.1cm} (B \cdot \sqrt{ e})  
 
\hspace{0.05cm},$$ $$
 
\hspace{0.05cm},$$ $$
 
  h(Y)  \  =  \  {\rm log}_2 \hspace{0.1cm} (A)\hspace{0.05cm}.$$
 
  h(Y)  \  =  \  {\rm log}_2 \hspace{0.1cm} (A)\hspace{0.05cm}.$$
[[File: P_ID2890__Inf_A_4_5d.png |right|]]
 
 
Damit ergibt sich für die Transinformation zwischen <i>X</i> und <i>Y</i>:
 
Damit ergibt sich für die Transinformation zwischen <i>X</i> und <i>Y</i>:
$$I(X;Y)  \  =      {\rm log}_2 \hspace{0.1cm} (B \cdot \sqrt{ {\rm e}}) + {\rm log}_2 \hspace{0.1cm} (A) - {\rm log}_2 \hspace{0.1cm} (A \cdot B)$$  
+
:$$I(X;Y)  \  =      {\rm log}_2 \hspace{0.1cm} (B \cdot \sqrt{ {\rm e}}) + {\rm log}_2 \hspace{0.1cm} (A) - {\rm log}_2 \hspace{0.1cm} (A \cdot B)$$  
$$  =  \ {\rm log}_2 \hspace{0.1cm} \frac{B \cdot \sqrt{ {\rm e}} \cdot A}{A \cdot B} = {\rm log}_2 \hspace{0.1cm} (\sqrt{ {\rm e}})\hspace{0.15cm}\underline{= 0.721\,{\rm bit}}
+
:$$  =  \ {\rm log}_2 \hspace{0.1cm} \frac{B \cdot \sqrt{ {\rm e}} \cdot A}{A \cdot B} = {\rm log}_2 \hspace{0.1cm} (\sqrt{ {\rm e}})\hspace{0.15cm}\underline{= 0.721\,{\rm bit}}
 
\hspace{0.05cm}.$$
 
\hspace{0.05cm}.$$
 
<i>I</i>(<i>X</i>; <i>Y</i>) ist somit unabhängig von den WDF&ndash;Parametern <i>A</i> und <i>B</i>.
 
<i>I</i>(<i>X</i>; <i>Y</i>) ist somit unabhängig von den WDF&ndash;Parametern <i>A</i> und <i>B</i>.
<br><br><br>
+
 
<b>d)</b>&nbsp;&nbsp;<u>Alle genannten Voraussetzungen</u> sind erforderlich. Allerdings sind nicht für jedes Parallelogramm die Forderungen 2 und 3 zu erfüllen. Nebenstehende Grafik zeigt zwei solche Konstellationen, wobei nun die Zufallsgröße <i>X</i> jeweils gleichverteilt ist zwischen 0 und 1.
+
 
:* Bei der oberen Grafik liegen die beiden eingezeichneten Punkte auf einer Höhe &nbsp;&#8658;&nbsp; <i>f<sub>Y</sub></i>(<i>y</i>) ist dreieckverteilt &nbsp;&#8658;&nbsp; <i>I</i>(<i>X</i>; <i>Y</i>) = 0.721 bit.
+
[[File: P_ID2890__Inf_A_4_5d.png |right|frame|Weitere <i>f<sub>XY</sub></i>–Beispiele]]
:*Die untere Verbund&ndash;WDF besitzt eine andere Transinformation, da die beiden Punkte nicht auf gleicher Höhe liegen &nbsp;&#8658;&nbsp; die WDF <i>f<sub>Y</sub></i>(<i>y</i>) hat hier eine Trapezform. Gefühlsmäßig tippe ich auf <i>I</i>(<i>X</i>;&nbsp;<i>Y</i>)&nbsp;<&nbsp;0.721 bit, da sich das 2D&ndash;Gebiet eher einem Rechteck annähert. Wenn Sie noch  Lust haben, so überprüfen Sie das bitte.   
+
'''(4)'''&nbsp; <u>Alle genannten Voraussetzungen</u> sind erforderlich. Allerdings sind nicht für jedes Parallelogramm die Forderungen 2 und 3 zu erfüllen. Nebenstehende Grafik zeigt zwei solche Konstellationen, wobei nun die Zufallsgröße <i>X</i> jeweils gleichverteilt ist zwischen 0 und 1.
 +
* Bei der oberen Grafik liegen die beiden eingezeichneten Punkte auf einer Höhe &nbsp;&#8658;&nbsp; <i>f<sub>Y</sub></i>(<i>y</i>) ist dreieckverteilt &nbsp;&#8658;&nbsp; <i>I</i>(<i>X</i>; <i>Y</i>) = 0.721 bit.
 +
*Die untere Verbund&ndash;WDF besitzt eine andere Transinformation, da die beiden Punkte nicht auf gleicher Höhe liegen &nbsp;&#8658;&nbsp; die WDF <i>f<sub>Y</sub></i>(<i>y</i>) hat hier eine Trapezform.  
 +
*Gefühlsmäßig tippe ich auf <i>I</i>(<i>X</i>;&nbsp;<i>Y</i>)&nbsp;<&nbsp;0.721 bit, da sich das 2D&ndash;Gebiet eher einem Rechteck annähert. Wenn Sie noch  Lust haben, so überprüfen Sie das bitte.   
 
{{ML-Fuß}}
 
{{ML-Fuß}}
  

Revision as of 07:42, 12 June 2017

Vorgegebene Verbund-Wahrscheinlichkeitsdichtefunktionen

Vorgegeben sind hier die drei unterschiedlichen 2D–Gebiete $f_{XY}(x, y)$, die in der Aufgabe nach ihren Füllfarben mit

  • rote Verbund-WDF
  • blaue Verbund-WDF
  • grüne Verbund-WDF

bezeichnet werden. In den dargestellten Gebieten gelte jeweils $f_{XY}(x, y) = C = \rm const.$

Die Transinformation zwischen den wertkontinuierlichen Zufallsgrößen $X$ und $Y$ kann unter anderem nach folgender Gleichung berechnet werden:

$$I(X;Y) = h(X) + h(Y) - h(XY)\hspace{0.05cm}.$$

Für die hier verwendeten differentiellen Entropien gelten die folgenden Gleichungen:

$$h(X) = -\hspace{-0.7cm} \int\limits_{x \hspace{0.05cm}\in \hspace{0.05cm}{\rm supp}(f_X)} \hspace{-0.55cm} f_X(x) \cdot {\rm log} \hspace{0.1cm} [f_X(x)] \hspace{0.1cm}{\rm d}x \hspace{0.05cm},$$
$$h(Y) = -\hspace{-0.7cm} \int\limits_{y \hspace{0.05cm}\in \hspace{0.05cm}{\rm supp}(f_Y)} \hspace{-0.55cm} f_Y(y) \cdot {\rm log} \hspace{0.1cm} [f_Y(y)] \hspace{0.1cm}{\rm d}y \hspace{0.05cm},$$
$$h(XY) = \hspace{0.1cm}-\hspace{0.2cm} \int \hspace{-0.9cm} \int\limits_{\hspace{-0.5cm}(x, y) \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} (f_{XY}\hspace{-0.08cm})} \hspace{-0.6cm} f_{XY}(x, y) \cdot {\rm log} \hspace{0.1cm} [ f_{XY}(x, y) ] \hspace{0.15cm}{\rm d}x\hspace{0.15cm}{\rm d}y\hspace{0.05cm}.$$

Für die beiden Randwahrscheinlichkeitsdichtefunktionen gilt dabei:

$$f_X(x) = \hspace{-0.5cm} \int\limits_{\hspace{-0.2cm}y \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} (f_{Y}\hspace{-0.08cm})} \hspace{-0.4cm} f_{XY}(x, y) \hspace{0.15cm}{\rm d}y\hspace{0.05cm},$$
$$f_Y(y) = \hspace{-0.5cm} \int\limits_{\hspace{-0.2cm}x \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} (f_{X}\hspace{-0.08cm})} \hspace{-0.4cm} f_{XY}(x, y) \hspace{0.15cm}{\rm d}x\hspace{0.05cm}.$$


Hinweise:

  • Die Aufgabe gehört zum Kapitel AWGN–Kanalkapazität bei wertkontinuierlichem Eingang.
  • Gegeben seien zudem folgende differentielle Entropien:
  • Ist $X$ dreieckverteilt zwischen $x_{\rm min}$ und $x_{\rm max}$, so gilt:   $h(X) = {\rm log} \hspace{0.1cm} [\hspace{0.05cm}\sqrt{ e} \cdot (x_{\rm max} - x_{\rm min})/2\hspace{0.05cm}]\hspace{0.05cm}.$
  • Ist $Y$ gleichverteilt zwischen $y_{\rm min}$ und $y_{\rm max}$,   so gilt: $h(Y) = {\rm log} \hspace{0.1cm} [\hspace{0.05cm}y_{\rm max} - y_{\rm min}\hspace{0.05cm}]\hspace{0.05cm}.$
  • Alle Ergebnisse sollen in „bit” angegeben werden. Dies erreicht man mit „log”  ⇒  „log2”.
  • Sollte die Eingabe des Zahlenwertes „0” erforderlich sein, so geben Sie bitte „0.” ein.


Fragebogen

1

Wie groß ist die Transinformation der roten Verbund-WDF?

$\text{rote Verbund–WDF:}\hspace{0.5cm} I(X; Y) \ = \ $

$\ \rm bit$

2

Wie groß ist die Transinformation der blauen Verbund-WDF?

$\text{blaue Verbund–WDF:}\hspace{0.5cm} I(X; Y) \ = \ $

$\ \rm bit$

3

Wie groß ist die Transinformation der grünen Verbund-WDF?

$\text{grüne Verbund–WDF:}\hspace{0.5cm} I(X; Y) \ = \ $

$\ \rm bit$

4

Welche Voraussetzungen müssen die Zufallsgrößen $X$ und $Y$ gleichzeitig erfüllen, damit allgemein $I(X;Y) = 1/2 \cdot \log (\rm e)$ gilt:

Die Verbund-WDF $f_{XY}(x, y)$ ergibt ein Parallelogramm.
Eine der Zufallsgrößen ($X$ oder $Y$) ist gleichverteilt.
Die andere Zufallsgröße ($X$ oder $Y$) ist dreieckverteilt.


Musterlösung

„Rote” Wahrscheinlichkeitsdichtefunktionen

(1)  Bei der rechteckförmigen Verbund–WDF fXY(x, y) gibt es zwischen X und Y keine statistischen Bindungen  ⇒  I(X; Y) = 0.

Formal lässt sich dieses Ergebnis mit der folgenden Gleichung nachweisen:

$$I(X;Y) = h(X) \hspace{-0.05cm}+\hspace{-0.05cm} h(Y) \hspace{-0.05cm}- \hspace{-0.05cm}h(XY)\hspace{0.02cm}.$$

Die rote Fläche 2D–WDF fXY(x, y) ist F = 4. Da fXY(x, y) in diesem Gebiet konstant ist und das Volumen unter fXY(x, y) gleich 1 sein muss, gilt C = 1/F = 1/4. Daraus folgt für die differentielle Verbundentropie in „bit”:

$$h(XY) \ = \ \hspace{0.1cm}-\hspace{0.2cm} \int \hspace{-0.9cm} \int\limits_{\hspace{-0.5cm}(x, y) \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} \hspace{0.03cm}(\hspace{-0.03cm}f_{XY}\hspace{-0.08cm})} \hspace{-0.6cm} f_{XY}(x, y) \cdot {\rm log}_2 \hspace{0.1cm} [ f_{XY}(x, y) ] \hspace{0.15cm}{\rm d}x\hspace{0.15cm}{\rm d}y$$
$$\Rightarrow \hspace{0.3cm} h(XY) \ = \ \ {\rm log}_2 \hspace{0.1cm} (4) \cdot \hspace{0.02cm} \int \hspace{-0.9cm} \int\limits_{\hspace{-0.5cm}(x, y) \hspace{0.1cm}\in \hspace{0.1cm}{\rm supp} \hspace{0.03cm}(\hspace{-0.03cm}f_{XY}\hspace{-0.08cm})} \hspace{-0.6cm} f_{XY}(x, y) \hspace{0.15cm}{\rm d}x\hspace{0.15cm}{\rm d}y = 2 \,{\rm bit}\hspace{0.05cm}.$$

Es ist berücksichtigt, das das Doppelintegral gleich 1 ist. Die Pseudo–Einheit „bit” korrespondiert mit dem Logarithmus dualis  ⇒  „log2”. Weiterhin gilt:

  • Die beiden Randwahrscheinlichkeitsdichtefunktionen fX(x) und fY(y) sindrechteckförmig ⇒ Gleichverteilung zwischen 0 und 2:
$$h(X) = h(Y) = {\rm log}_2 \hspace{0.1cm} (2) = 1 \,{\rm bit}\hspace{0.05cm}.$$
  • Setzt man diese Ergebnisse in die obige Gleichung ein, so erhält man:
$$I(X;Y) = h(X) + h(Y) - h(XY) = 1 \,{\rm bit} + 1 \,{\rm bit} - 2 \,{\rm bit} = 0 \,{\rm (bit)} \hspace{0.05cm}.$$


„Blaue” Wahrscheinlichkeitsdichtefunktionen

(2)  Auch bei diesem Parallelogramm ergibt sich F = 4, C = 1/4 sowie h(XY) = 2 bit. Die Zufallsgröße Y ist hier wie in der Teilaufgabe (1) zwischen 0 und 2 gleichverteilt. Somit gilt weiter h(Y) = 1 bit.

Dagegen ist X dreieckverteilt zwischen 0 und 4 (mit Maximum bei 2). Es ergibt sich hierfür die gleiche differentielle Entropie h(Y) wie bei einer symmetrischen Dreieckverteilung im Bereich zwischen ±2 (siehe Angabenblatt):

$$h(X) = {\rm log}_2 \hspace{0.1cm} [\hspace{0.05cm}2 \cdot \sqrt{ e} \hspace{0.05cm}] = 1.721 \,{\rm bit}$$
$$\Rightarrow \hspace{0.3cm} I(X;Y) = 1.721 \,{\rm bit} + 1 \,{\rm bit} - 2 \,{\rm bit}\hspace{0.05cm}\underline{ = 0.721 \,{\rm (bit)}} \hspace{0.05cm}.$$


„Grüne” Wahrscheinlichkeitsdichtefunktionen

(3)  Bei den grünen Gegebenheiten ergeben sich folgende Eigenschaften:

$$F = A \cdot B \hspace{0.3cm} \Rightarrow \hspace{0.3cm} C = \frac{1}{A \cdot B} \hspace{0.05cm}\hspace{0.3cm} \Rightarrow \hspace{0.3cm} h(XY) = {\rm log}_2 \hspace{0.1cm} (A \cdot B) \hspace{0.05cm}.$$

Die Zufallsgröße Y ist nun zwischen 0 und A gleichverteilt und die Zufallsgröße X ist zwischen 0 und B dreieckverteilt:

$$h(X) \ = \ {\rm log}_2 \hspace{0.1cm} (B \cdot \sqrt{ e}) \hspace{0.05cm},$$ $$ h(Y) \ = \ {\rm log}_2 \hspace{0.1cm} (A)\hspace{0.05cm}.$$

Damit ergibt sich für die Transinformation zwischen X und Y:

$$I(X;Y) \ = {\rm log}_2 \hspace{0.1cm} (B \cdot \sqrt{ {\rm e}}) + {\rm log}_2 \hspace{0.1cm} (A) - {\rm log}_2 \hspace{0.1cm} (A \cdot B)$$
$$ = \ {\rm log}_2 \hspace{0.1cm} \frac{B \cdot \sqrt{ {\rm e}} \cdot A}{A \cdot B} = {\rm log}_2 \hspace{0.1cm} (\sqrt{ {\rm e}})\hspace{0.15cm}\underline{= 0.721\,{\rm bit}} \hspace{0.05cm}.$$

I(X; Y) ist somit unabhängig von den WDF–Parametern A und B.


Weitere fXY–Beispiele

(4)  Alle genannten Voraussetzungen sind erforderlich. Allerdings sind nicht für jedes Parallelogramm die Forderungen 2 und 3 zu erfüllen. Nebenstehende Grafik zeigt zwei solche Konstellationen, wobei nun die Zufallsgröße X jeweils gleichverteilt ist zwischen 0 und 1.

  • Bei der oberen Grafik liegen die beiden eingezeichneten Punkte auf einer Höhe  ⇒  fY(y) ist dreieckverteilt  ⇒  I(X; Y) = 0.721 bit.
  • Die untere Verbund–WDF besitzt eine andere Transinformation, da die beiden Punkte nicht auf gleicher Höhe liegen  ⇒  die WDF fY(y) hat hier eine Trapezform.
  • Gefühlsmäßig tippe ich auf I(XY) < 0.721 bit, da sich das 2D–Gebiet eher einem Rechteck annähert. Wenn Sie noch Lust haben, so überprüfen Sie das bitte.