Exercise 4.5: Irrelevance Theorem

From LNTwww
Revision as of 14:47, 12 March 2019 by Guenter (talk | contribs)

Betrachtetes Optimalsystem mit Detektor und Entscheider

Untersucht werden soll das durch die Grafik vorgegebene Kommunikationssystem. Die binäre Nachricht  $m ∈ \{m_0, m_1\}$  mit gleichen Auftrittswahrscheinlichkeiten

$${\rm Pr} (m_0 ) = {\rm Pr} (m_1 ) = 0.5$$

wird durch die beiden Signale

$$s_0 = \sqrt{E_s} \hspace{0.05cm},\hspace{0.2cm}s_1 = -\sqrt{E_s}$$

dargestellt, wobei die Zuordnungen  $m_0 ⇔ s_0$  und  $m_1 ⇔ s_1$  eineindeutig sind.

Der Detektor (im Bild grün hinterlegt) liefert zwei Entscheidungswerte

$$r_1 \hspace{-0.1cm} \ = \ \hspace{-0.1cm} s + n_1\hspace{0.05cm},$$
$$r_2 \hspace{-0.1cm} \ = \ \hspace{-0.1cm} n_1 + n_2\hspace{0.05cm},$$

aus denen der Entscheider die Schätzwerte  $\mu ∈ \{m_0, m_1\}$  für die gesendete Nachricht  $m$  bildet. Der Entscheider beinhaltet

  • zwei Gewichtungsfaktoren  $K_1$  und  $K_2$,
  • eine Summationsstelle, und
  • einen Schwellenwertentscheider mit der Schwelle bei $0$.


Betrachtet werden in dieser Aufgabe drei Auswertungen:

  • Entscheidung basierend auf  $r_1$  ($K_1 ≠ 0, K_2 = 0$),
  • Entscheidung basierend auf  $r_2$  ($K_1 = 0, K_2 ≠ 0$),
  • gemeinsame Auswertung von  $r_1$  und  $r_2$  $(K_1 ≠ 0, K_2 ≠ 0)$.


Die zwei Rauschquellen  $n_1$  und  $n_2$  seien voneinander unabhängig und auch unabhängig vom Sendesignal  $s ∈ \{s_0, s_1\}$.

$n_1$  und  $n_2$  können jeweils durch AWGN–Rauschquellen $($weiß, gaußverteilt, mittelwertfrei, Varianz  $\sigma^2 = N_0/2)$  modelliert werden. Verwenden Sie für numerische Berechnungen die Werte

$$E_s = 8 \cdot 10^{-6}\,{\rm Ws}\hspace{0.05cm},\hspace{0.2cm}N_0 = 10^{-6}\,{\rm W/Hz} \hspace{0.05cm}.$$

Die  komplementäre Gaußsche Fehlerfunktion  liefert folgende Ergebnisse:

$${\rm Q}(0) \hspace{-0.1cm} \ = \ \hspace{-0.1cm} 0.5\hspace{0.05cm},\hspace{1.35cm}{\rm Q}(2^{0.5}) = 0.786 \cdot 10^{-1}\hspace{0.05cm},\hspace{1.1cm}{\rm Q}(2) = 0.227 \cdot 10^{-1}\hspace{0.05cm},$$
$${\rm Q}(2 \cdot 2^{0.5}) \hspace{-0.1cm} \ = \ \hspace{-0.1cm} 0.234 \cdot 10^{-2}\hspace{0.05cm},\hspace{0.2cm}{\rm Q}(4) = 0.317 \cdot 10^{-4} \hspace{0.05cm},\hspace{0.2cm}{\rm Q}(4 \cdot 2^{0.5}) = 0.771 \cdot 10^{-8}\hspace{0.05cm}.$$



Hinweise:

  • Für die Fehlerwahrscheinlichkeit eines Systems  $r = s + n$  (wegen  $N = 1$  sind hier  $s, n, r$  Skalare) gilt
$$p_{\rm S} = {\rm Pr} ({\rm Symbolfehler} ) = {\rm Q} \left ( \sqrt{{2 E_s}/{N_0}}\right ) \hspace{0.05cm},$$
wobei ein binäres Nachrichtensignal  $s ∈ \{s_0, s_1\}$ mit
$$s_0 = \sqrt{E_s} \hspace{0.05cm},\hspace{0.2cm}s_1 = -\sqrt{E_s}$$
vorausgesetzt wird und die zweiseitige Rauschleistungsdichte der Größe  $n$  konstant gleich  $\sigma^2 = N_0/2$  ist.


Fragebogen

1

Welche Aussagen gelten hier bezüglich des Empfängers?

Der ML–Empfänger ist hier besser als der MAP–Empfänger.
Der MAP–Empfänger ist hier besser als der ML–Empfänger.
Beide Empfänger liefern hier das gleiche Ergebnis.

2

Welche Fehlerwahrscheinlichkeit ergibt sich mit  $K_2 = 0$?

${\rm Pr(Symbolfehler)}\ = \ $

$\ \%$

3

Welche Fehlerwahrscheinlichkeit ergibt sich mit  $K_1 = 0$?

${\rm Pr(Symbolfehler)}\ = \ $

$\ \%$

4

Kann durch die Verwendung von  $r_1$  und  $r_2$  eine Verbesserung erzielt werden?

Ja.
Nein.

5

Welche Gleichungen gelten für den Schätzwert  $(\mu)$  bei AWGN–Rauschen?

$\mu = {\rm arg \ min} \, \big[(\rho_1 + \rho_2) \cdot s_i \big]$,
$\mu = {\rm arg \ min} \, \big[(\rho_2 \, - 2 \rho_1) \cdot s_i \big]$,
$\mu = {\rm arg \ max} \, \big[(\rho_1 - \rho_2/2) \cdot s_i \big]$.

6

Wie kann diese Regel mit dem vorgegebenen Entscheider (Schwelle bei Null) exakt umgesetzt werden? Es gelte  $K_1 = 1$.

$K_2 \ = \ $

7

Welche (minimale) Fehlerwahrscheinlichkeit ergibt sich mit der Realisierung entsprechend der Teilaufgabe (6)?

${\rm Minimum \ \big[Pr(Symbolfehler)\big]} \ = \ $

$\ \cdot 10^{\rm -8}$


Musterlösung

(1)  Richtig ist die letzte Lösungsalternative:

  • Im Allgemeinen führt der MAP–Empfänger zu einer kleineren Fehlerwahrscheinlichkeit.
  • Sind aber die Auftrittswahrscheinlichkeiten ${\rm Pr}(m = m_0) = {\rm Pr}(m = m_1) = 0.5$ gleich, so liefern beide Empfänger das gleiche Ergebnis.


(2)  Mit $K_2 = 0$ und $K_1 = 1$ ergibt sich

$$r = r_1 = s + n_1\hspace{0.05cm}.$$

Bei bipolarem (antipodischem) Sendesignal und AWGN–Rauschen ist die Fehlerwahrscheinlichkeit des optimalen Empfängers (egal, ob als Korrelations– oder Matched–Filter–Empfänger realisiert) gleich

$$p_{\rm S} = {\rm Pr} ({\rm Symbolfehler} ) = {\rm Q} \left ( \sqrt{ E_s /{\sigma}}\right ) = {\rm Q} \left ( \sqrt{2 E_s /N_0}\right ) \hspace{0.05cm}.$$

Mit $E_s = 8 \cdot 10^{\rm –6} \ \rm Ws$ und $N_0 = 10^{\rm –6} \ \rm W/Hz$ erhält man weiter:

$$p_{\rm S} = {\rm Pr} ({\rm Symbolfehler} ) = {\rm Q} \left ( \sqrt{\frac{2 \cdot 8 \cdot 10^{-6}\,{\rm Ws}}{10^{-6}\,{\rm W/Hz} }}\right ) = {\rm Q} (4) \hspace{0.05cm}\hspace{0.15cm}\underline {= 0.00317 \%}\hspace{0.05cm}.$$

Dieses Ergebnis ist unabhängig von $K_1$, da durch eine Verstärkung oder Dämpfung die Nutzleistung in gleicher Weise verändert wird wie die Rauschleistung.


(3)  Mit $K_1 = 0$ und $K_2 = 1$ gilt für die Entscheidungsgröße:

$$r = r_2 = n_1 + n_2\hspace{0.05cm}.$$

Diese beinhaltet keine Informationen über das Nutzsignal, sondern nur Rauschen, und es gilt unabhängig von $K_2$:

$$p_{\rm S} = {\rm Pr} ({\rm Symbolfehler} ) = {\rm Q} (0) \hspace{0.15cm}\underline {= 50\%} \hspace{0.05cm}.$$


(4)  Die Entscheidungsregel des optimalen Empfängers (egal, ob als MAP oder als ML realisiert) lautet wegen ${\rm Pr}(m = m_0) = {\rm Pr}(m = m_1)$:

$$\hat{m} \hspace{-0.1cm} \ = \ \hspace{-0.1cm} {\rm arg} \max_i \hspace{0.1cm} [ p_{m \hspace{0.05cm}|\hspace{0.05cm}r_1, \hspace{0.05cm}r_2 } \hspace{0.05cm} (m_i \hspace{0.05cm}|\hspace{0.05cm}\rho_1, \hspace{0.05cm}\rho_2 ) ] = {\rm arg} \max_i \hspace{0.1cm} [ p_{r_1, \hspace{0.05cm}r_2 \hspace{0.05cm}|\hspace{0.05cm} m} \hspace{0.05cm} ( \rho_1, \hspace{0.05cm}\rho_2 \hspace{0.05cm}|\hspace{0.05cm} m_i ) \cdot {\rm Pr} (m = m_i)] = {\rm arg} \max_i \hspace{0.1cm} [ p_{r_1, \hspace{0.05cm}r_2 \hspace{0.05cm}|\hspace{0.05cm} s} \hspace{0.05cm} ( \rho_1, \hspace{0.05cm}\rho_2 \hspace{0.05cm}|\hspace{0.05cm} s_i ) ] \hspace{0.05cm}.$$

Diese Verbundwahrscheinlichkeitsdichte kann wie folgt umgeschrieben werden:

$$\hat{m} ={\rm arg} \max_i \hspace{0.1cm} [ p_{r_1 \hspace{0.05cm}|\hspace{0.05cm} s} \hspace{0.05cm} ( \rho_1 \hspace{0.05cm}|\hspace{0.05cm} s_i ) \cdot p_{r_2 \hspace{0.05cm}|\hspace{0.05cm} r_1, \hspace{0.05cm}s} \hspace{0.05cm} ( \rho_2 \hspace{0.05cm}|\hspace{0.05cm} \rho_1, \hspace{0.05cm}s_i ) ] \hspace{0.05cm}.$$

Da nun auch der zweite Multiplikand von der Nachricht ($s_i$) abhängt, sollte $r_2$ auf jeden Fall in den Entscheidungsprozess eingebunden werden. Richtig ist also: JA.


(5)  Bei AWGN–Rauschen mit der Varianz $\sigma^2$ ergeben sich für die beiden in (4) eingeführten Verbunddichten und deren Produkt $P$:

$$p_{r_1\hspace{0.05cm}|\hspace{0.05cm} s}(\rho_1\hspace{0.05cm}|\hspace{0.05cm}s_i) \hspace{-0.1cm} \ = \ \hspace{-0.1cm} \frac{1}{\sqrt{2\pi} \cdot \sigma}\cdot {\rm exp} \left [ - \frac{(\rho_1 - s_i)^2}{2 \sigma^2}\right ]\hspace{0.05cm},\hspace{1cm} p_{r_2\hspace{0.05cm}|\hspace{0.05cm}r_1,\hspace{0.05cm} s}(\rho_2\hspace{0.05cm}|\hspace{0.05cm}\rho_1, \hspace{0.05cm}s_i) \hspace{-0.1cm} \ = \ \hspace{-0.1cm} \frac{1}{\sqrt{2\pi} \cdot \sigma}\cdot {\rm exp} \left [ - \frac{(\rho_2 - (\rho_1 - s_i))^2}{2 \sigma^2}\right ]\hspace{0.05cm}$$
$$ \Rightarrow \hspace{0.3cm} P \hspace{-0.1cm} \ = \ \hspace{-0.1cm} \frac{1}{{2\pi} \cdot \sigma^2}\cdot {\rm exp} \left [ - \frac{1}{2 \sigma^2} \cdot \left \{ (\rho_1 - s_i)^2 + (\rho_2 - (\rho_1 - s_i))^2\right \}\right ]\hspace{0.05cm}.$$

Gesucht wird dasjenige Argument, das dieses Produkt $P$ maximiert, was gleichzeitig bedeutet, dass der Ausdruck in den geschweiften Klammern den kleinstmöglichen Wert annehmen soll:

$$\mu = \hat{m} \hspace{-0.1cm} \ = \ \hspace{-0.1cm}{\rm arg} \max_i \hspace{0.1cm} P = {\rm arg} \min _i \hspace{0.1cm} \left \{ (\rho_1 - s_i)^2 + (\rho_2 - (\rho_1 - s_i))^2\right \} $$
$$\Rightarrow \hspace{0.3cm} \mu = \hat{m} \hspace{-0.1cm} \ = \ \hspace{-0.1cm}{\rm arg} \min _i \hspace{0.1cm}\left \{ \rho_1^2 - 2\rho_1 s_i + s_i^2 + \rho_2^2 - 2\rho_1 \rho_2 + 2\rho_2 s_i+ \rho_1^2 - 2\rho_1 s_i + s_i^2\right \} \hspace{0.05cm}.$$

Dabei bezeichnet $\mu$ den Schätzwert der Nachricht. Bei dieser Minimierung kann nun auf alle Terme verzichtet werden, die nicht von der Nachricht $s_i$ abhängen. Ebenso unberücksichtigt bleiben die Terme $s_i^2$, da $s_0^2 = s_1^2$ gilt. Somit erhält man die deutlich einfachere Entscheidungsregel:

$$\mu = {\rm arg} \min _i \hspace{0.1cm}\left \{ - 4\rho_1 s_i + 2\rho_2 s_i \right \}={\rm arg} \min _i \hspace{0.1cm}\left \{ (\rho_2 - 2\rho_1) \cdot s_i \right \} \hspace{0.05cm}.$$

Richtig ist also schon mal der Lösungsvorschlag 2. Aber nach Multiplikation mit $–1/2$ erhält man auch die zuletzt genannte Entscheidungsregel:

$$\mu = {\rm arg} \max_i \hspace{0.1cm}\left \{ (\rho_1 - \rho_2/2) \cdot s_i \right \} \hspace{0.05cm}.$$

Richtig sind somit die Lösungsvorschläge 2 und 3.


(6)  Setzt man $K_1 = 1$ und $\underline {K_2 = \, -0.5}$, so lautet die optimale Entscheidungsregel mit der Realisierung $\rho = \rho_1 \, – \rho_2/2$:

$$\mu = \left\{ \begin{array}{c} m_0 \\ m_1 \end{array} \right.\quad \begin{array}{*{1}c} {\rm f{\rm \ddot{u}r}} \hspace{0.15cm} \rho > 0 \hspace{0.05cm}, \\ {\rm f{\rm \ddot{u}r}} \hspace{0.15cm} \rho < 0 \hspace{0.05cm}.\\ \end{array}$$

Da $\rho = 0$ nur mit der Wahrscheinlichkeit $0$ auftritt, ist es im Sinne der Wahrscheinlichkeitsrechnung egal, ob man diesem Ereignis „$\rho = 0$” die Nachricht $\mu = m_0$ oder $\mu = m_1$ zuordnet.


(7)  Mit $K_2 = \, -0.5$ erhält man für den Eingangswert des Entscheiders:

$$r = r_1 - r_2/2 = s + n_1 - (n_1 + n_2)/2 = s + n \hspace{0.3cm} \Rightarrow \hspace{0.3cm} n = \frac{n_1 - n_2}{2}\hspace{0.05cm}.$$

Die Varianz dieser Zufallsgröße ist

$$\sigma_n^2 = {1}/{4} \cdot \left [ \sigma^2 + \sigma^2 \right ] = {\sigma^2}/{2}= {N_0}/{4}\hspace{0.05cm}.$$

Daraus ergibt sich für die Fehlerwahrscheinlichkeit analog zur Teilaufgabe (2):

$${\rm Pr} ({\rm Symbolfehler} ) = {\rm Q} \left ( \sqrt{\frac{E_s}{N_0/4}}\right ) = {\rm Q} \left ( 4 \cdot \sqrt{2}\right ) = {1}/{2} \cdot {\rm erfc}(4) \hspace{0.05cm}\hspace{0.15cm}\underline {= 0.771 \cdot 10^{-8}} \hspace{0.05cm}.$$
  • Durch Berücksichtigung von $r_2$ lässt sich also die Fehlerwahrscheinlichkeit von $0.317 \cdot 10^{\rm –4}$ auf den deutlich kleineren Wert $0.771 \cdot 10^{-8}$ absenken, obwohl die Entscheidungskomponente $r_2$ nur Rauschen beinhaltet. Dieses Rauschen $r_2$ erlaubt aber eine Schätzung der Rauschkomponente $n_1$ von $r_1$.
  • Halbiert man die Sendeenergie von $8 \cdot 10^{\rm –6} \ \rm Ws$ auf $4 \cdot 10^{\rm –6} \ \rm Ws$, so ergibt sich hier immer noch die Fehlerwahrscheinlichkeit $0.317 \cdot 10^{\rm –4}$, wie in der Teilaufgabe (2) berechnet. Bei alleiniger Auswertung von $r_1$ würde die Fehlerwahrscheinlichkeit dagegen $0.234 \cdot 10^{\rm –2}$ betragen.