Difference between revisions of "Exercise 2.12: Run–Length Coding and Run–Length Limited Coding"

From LNTwww
Line 32: Line 32:
  
 
{{GraueBox|
 
{{GraueBox|
TEXT='''RLLC–Beispiel 2''':  Wir gehen wieder von obiger Folge und dem Parameter $D = 2$ aus:
+
TEXT=$\text{RLLC-Beispiel 2}$:  Wir gehen wieder von obiger Folge und dem Parameter $D = 2$ aus:
* Quellensymbolfolge:   '''ABAABAAAABBAAB''' ...
+
* Quellensymbolfolge:    $\rm ABAABAAAABBAAB$...
 
* RLC–Dezimalfolge:        '''2; 3; 5; 1; 3;''' ...
 
* RLC–Dezimalfolge:        '''2; 3; 5; 1; 3;''' ...
 
* RLLC&ndash;Dezimalfolge: &nbsp;&nbsp;&nbsp; '''2; 3;'''<font color="#cc0000"><span style="font-weight: bold;"> S;</span></font>'''2; 1; 3;''' ...
 
* RLLC&ndash;Dezimalfolge: &nbsp;&nbsp;&nbsp; '''2; 3;'''<font color="#cc0000"><span style="font-weight: bold;"> S;</span></font>'''2; 1; 3;''' ...
 
* RLLC&ndash;Binärfolge: &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; '''01&prime;11&prime;''' <font color="#cc0000"><span style="font-weight: bold;">00&prime;</span></font>'''10&prime;01&prime;11&prime;'''...
 
* RLLC&ndash;Binärfolge: &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; '''01&prime;11&prime;''' <font color="#cc0000"><span style="font-weight: bold;">00&prime;</span></font>'''10&prime;01&prime;11&prime;'''...
 +
  
 
Man erkennt:  
 
Man erkennt:  
 
*Das Sonderzeichen <b>S</b> ist hier als <b>00</b> binär&ndash;codiert. Dies ist nur ein Beispiel &ndash; es muss nicht so sein.  
 
*Das Sonderzeichen <b>S</b> ist hier als <b>00</b> binär&ndash;codiert. Dies ist nur ein Beispiel &ndash; es muss nicht so sein.  
 
*Da mit $D = 2$ für alle echten RLC&ndash;Werte $1 \le L_i \le 3$ gilt, erkennt der Decoder das Sonderzeichen '''00'''.
 
*Da mit $D = 2$ für alle echten RLC&ndash;Werte $1 \le L_i \le 3$ gilt, erkennt der Decoder das Sonderzeichen '''00'''.
*Er  ersetzt dieses wieder durch $2^D -1$ (im Beispiel drei) <b>A</b>&ndash;Symbole.}}
+
*Er  ersetzt dieses wieder durch $2^D -1$   (im Beispiel drei) $\rm A$&ndash;Symbole.}}
  
  
Line 58: Line 59:
  
  
{Wie viele Bit benötigt man für <u>Run&ndash;Length Coding</U> (RLC) nach der angegebenen Tabelle mit 8 Bit&ndash;Codeworten $($D = 8)$?
+
{Wie viele Bit benötigt man für <u>Run&ndash;Length Coding</U> (RLC) nach der angegebenen Tabelle mit 8 Bit&ndash;Codeworten $(D = 8)$?
 
|type="{}"}
 
|type="{}"}
 
$N_\text{Bit} \ = \ $ { 200 }  
 
$N_\text{Bit} \ = \ $ { 200 }  
  
  
{Ist hier <u>Run&ndash;Length Coding</u> mit 7 Bit&ndash;Codeworten $(D = 8)$ möglich?
+
{Ist hier <u>Run&ndash;Length Coding</u> mit 7 Bit&ndash;Codeworten $(D = 7)$ möglich?
 
|type="()"}
 
|type="()"}
 
- Ja.
 
- Ja.
Line 84: Line 85:
 
===Musterlösung===
 
===Musterlösung===
 
{{ML-Kopf}}
 
{{ML-Kopf}}
'''(1)'''&nbsp; Die Binärfolge besteht aus insgesamt <i>N</i> = 1250 Binärsymbolen (ablesbar aus der letzten Spalte in der Tabelle). <br>Damit benötigt man ohne Codierung ebenso viele Bit: <i>N</i><sub>Bit</sub> <u>= 1250</u>.
+
'''(1)'''&nbsp; Die Binärfolge besteht aus insgesamt $N = 1250$ Binärsymbolen (ablesbar aus der letzten Spalte in der Tabelle). Damit benötigt man ohne Codierung ebenso viele Bit:  
 +
:$$N_\text{Bit}\hspace{0.15cm}\underline{== 1250}.$$
  
'''(2)'''&nbsp; Die gesamte Symbolfolge der Länge <i>N</i> = 1250 beinhaltet <i>N</i><sub>B</sub> = 25 Symbole <b>B</b> und somit   <i>N</i><sub>A</sub> = 1225 Symbole <b>A</b>. <br>Damit gilt für die relative Häufigkeit von <b>B</b>:
+
 
 +
'''(2)'''&nbsp; Die gesamte Symbolfolge der Länge $N = 1250$ beinhaltet $N_{\rm B} = 25$ Symbole ${\rm B}$ und somit $N_{\rm A} = 1225$ Symbole ${\rm A}$. Damit gilt für die relative Häufigkeit von ${\rm B}$:
 
:$$h_{\rm B} = \frac{N_{\rm B}}{N} = \frac{25}{1250} \hspace{0.15cm}\underline{= 0.02} = 2\%\hspace{0.05cm}. $$
 
:$$h_{\rm B} = \frac{N_{\rm B}}{N} = \frac{25}{1250} \hspace{0.15cm}\underline{= 0.02} = 2\%\hspace{0.05cm}. $$
  
'''(3)'''&nbsp; Wir betrachten nun <i>Run&ndash;Length Coding</i> (RLC), wobei jeder Abstand zwischen zwei <b>B</b>&ndash;Symbolen mit 8 Bit dargestellt wird (<i>D</i> = 8). Damit ergibt sich mit <i>N</i><sub>B</sub> = 25:
+
 
 +
'''(3)'''&nbsp; Wir betrachten nun <i>Run&ndash;Length Coding</i> (RLC), wobei jeder Abstand zwischen zwei ${\rm B}$&ndash;Symbolen mit 8 Bit dargestellt wird $(D = 8)$. Damit ergibt sich mit $N_{\rm B} = 25$:
 
:$$N_{\rm Bit} = N_{\rm B} \cdot 8 \hspace{0.15cm}\underline{= 200} \hspace{0.05cm}.$$
 
:$$N_{\rm Bit} = N_{\rm B} \cdot 8 \hspace{0.15cm}\underline{= 200} \hspace{0.05cm}.$$
  
'''(4)'''&nbsp; <i>Run&ndash;Length Coding</i> mit <i>D</i> = 7 erlaubt für <i>L<sub>i</sub></i> nur Werte zwischen 1 und 127. Der Eintrag &bdquo;226&rdquo; in Zeile 19 ist aber größer &nbsp;&nbsp;&#8658;&nbsp;&nbsp; <u>NEIN</u>.
 
  
'''(5)'''&nbsp; Auch bei <i>Run&ndash;Length Limited Coding</i> (RLLC) sind für die &bdquo;echten&rdquo; Abstände <i>L<sub>i</sub></i> mit  <i>D</i> = 7 nur Werte zwischen 1 und 2<sup>7</sup> &ndash; 1 = 127 zulässig. Der Eintrag &bdquo;226&rdquo; in Zeile 19 wird bei RLLC ersetzt durch
+
'''(4)'''&nbsp; Run&ndash;Length Coding mit $D = 7$ erlaubt für $L_i$ nur Werte zwischen $1$ und $2^7-1 =127$. Der Eintrag &bdquo;226&rdquo; in Zeile 19 ist aber größer &nbsp; &nbsp; &#8658; &nbsp; &nbsp; <u>NEIN</u>.
 +
 
 +
 
 +
'''(5)'''&nbsp; Auch bei Run&ndash;Length Limited Coding (RLLC) sind für die &bdquo;echten&rdquo; Abstände $L_i$ mit  $D = 7$ nur Werte zwischen $1$ und $127$ zulässig. Der Eintrag &bdquo;226&rdquo; in Zeile 19 wird bei RLLC ersetzt durch
  
 
* Zeile 19a: <b>S</b> = <b>0000000</b> &nbsp;&nbsp;&#8658;&nbsp;&nbsp; Sonderzeichen, steht für &bdquo;+ 127&rdquo;,
 
* Zeile 19a: <b>S</b> = <b>0000000</b> &nbsp;&nbsp;&#8658;&nbsp;&nbsp; Sonderzeichen, steht für &bdquo;+ 127&rdquo;,
Line 101: Line 107:
  
  
Damit erhält man insgesamt 26 Worte zu je 7 Bit:
+
Damit erhält man insgesamt $26$ Worte zu je sieben Bit:
 
:$$N_{\rm Bit} = 26 \cdot 7 \hspace{0.15cm}\underline{= 182} \hspace{0.05cm}.$$
 
:$$N_{\rm Bit} = 26 \cdot 7 \hspace{0.15cm}\underline{= 182} \hspace{0.05cm}.$$
 +
  
 
'''(6)'''&nbsp; Nun müssen bei RLLC gegenüber RLC (siehe Tabelle) folgende Änderungen vorgenommen werden:
 
'''(6)'''&nbsp; Nun müssen bei RLLC gegenüber RLC (siehe Tabelle) folgende Änderungen vorgenommen werden:
  
* Zeile &nbsp;&nbsp;1: &nbsp;122 = 1 &middot; 63 + 59 &nbsp;&nbsp;(ein Wort mehr),
+
* Zeile &nbsp;&nbsp;1: &nbsp; $122 = 1 &middot; 63 + 59$ &nbsp;&nbsp;(ein Wort mehr),
  
* Zeile &nbsp;&nbsp;6: &nbsp;&nbsp;&nbsp;70 = 1 &middot; 63 + 7 &nbsp;&nbsp;&nbsp;&nbsp;(ein Wort mehr),
+
* Zeile &nbsp;&nbsp;6: &nbsp;&nbsp;&nbsp; $70 = 1 &middot; 63 + 7$ &nbsp;&nbsp;&nbsp;&nbsp;(ein Wort mehr),
  
* Zeile &nbsp;&nbsp;7: &nbsp;&nbsp;&nbsp;80 = 1 &middot; 63 + 17 &nbsp;&nbsp;(ein Wort mehr),
+
* Zeile &nbsp;&nbsp;7: &nbsp;&nbsp;&nbsp; $80 = 1 &middot; 63 + 17$ &nbsp;&nbsp;(ein Wort mehr),
  
* Zeile 12: &nbsp;&nbsp;&nbsp;79 = 1 &middot; 63 + 18 &nbsp;&nbsp;(ein Wort mehr),
+
* Zeile 12: &nbsp;&nbsp;&nbsp; $79 = 1 &middot; 63 + 18$ &nbsp;&nbsp;(ein Wort mehr),
  
* Zeile 13: &nbsp;&nbsp;&nbsp;93 = 1 &middot; 63 + 30 &nbsp;&nbsp;(ein Wort mehr),
+
* Zeile 13: &nbsp;&nbsp;&nbsp; $93 = 1 &middot; 63 + 30$ &nbsp;&nbsp;(ein Wort mehr),
  
* Zeile 19: &nbsp;226 = 3 &middot; 63 + 37  &nbsp;&nbsp;(drei Worte mehr),
+
* Zeile 19: &nbsp; $226 = 3 &middot; 63 + 37$ &nbsp;&nbsp;(drei Worte mehr),
  
* Zeile 25: &nbsp;&nbsp;&nbsp;97 = 1 &middot; 63 + 34  &nbsp;&nbsp;(ein Wort mehr).
+
* Zeile 25: &nbsp;&nbsp;&nbsp; $97 = 1 &middot; 63 + 34$ &nbsp;&nbsp;(ein Wort mehr).
  
  
Damit erhält man insgesamt 34 Worte zu je 6 Bit:
+
Damit erhält man insgesamt $34$ Worte zu je sechs Bit:
 
:$$N_{\rm Bit} = 34 \cdot 6 \hspace{0.15cm}\underline{= 204} \hspace{0.05cm},$$
 
:$$N_{\rm Bit} = 34 \cdot 6 \hspace{0.15cm}\underline{= 204} \hspace{0.05cm},$$
also ein schlechteres Ergebnis als mit 7 Bit gemäß Teilaufgabe (5).
+
also ein schlechteres Ergebnis als mit sieben Bit gemäß Teilaufgabe '''(5)'''.
 
{{ML-Fuß}}
 
{{ML-Fuß}}
  

Revision as of 16:11, 2 October 2018

Tabelle zu Run–Length Coding

Wir betrachten eine Binärquelle mit dem Symbolvorrat $\rm A$ und $\rm B$, wobei $\rm B$ allerdings nur sehr selten auftritt.

  • Ohne Quellencodierung würde man pro Quellensymbol genau ein Bit benötigen, und dementsprechend würde bei einer Quellensymbolfolge der Länge $N$ für die Codebitfolge ebenfalls $N_\text{Bit} = N$ gelten.
  • Entropiecodierung macht hier ohne weitere Maßnahme (Zusammenfassen mehrerer Symbole zu einem Tupel) wegen der ungünstigen Symbolwahrscheinlichkeiten wenig Sinn.
  • Abhilfe schafft Run-Length Coding (RLC), das unter dem genannten Link im Theorieteil beschrieben ist. Zum Beispiel ergibt sich für die Quellensymbolfolge  
$$\rm ABAABAAAABBAAB\text{...}$$

die entsprechende Ausgabe von Run–Lenght Coding:

$$ 2; \ 3; \ 5; \ 1; \ 3; \text{...}$$
  • Natürlich muss man die Längen $L_1 = 2$, $L_2 = 3$, ... der einzelnen, jeweils durch $\rm B$ getrennten Substrings vor der Übertragung binär darstellen. Verwendet man für alle $L_i$ jeweils $D = 3$ (Bit), so erhält man die RLC–Binärfolge
$$010\hspace{0.05cm}\text{'}\hspace{0.05cm}011\hspace{0.05cm}\text{'}\hspace{0.05cm}101\hspace{0.05cm}\text{'}\hspace{0.05cm}001\hspace{0.05cm}\text{'}\hspace{0.05cm}011\hspace{0.05cm}\text{'}\hspace{0.05cm}\text{...}$$

Die Grafik zeigt das das zu analysierende RLC–Ergebnis. In Spalte 2 und 3 sind die Substringlängen $L_i$ binär bzw. dezimal angegeben und in Spalte 4 in kumulierter Form (Werte von Spalte 3 aufsummiert).

Ein Problem von Run-Length Coding (RLC) ist der unbegrenzte Wertebereich der Größen $L_i$. Mit $D = 3$ kann kein Wert $L_i > 7$ dargestellt werden und mit $D = 2$ lautet die Beschränkung $1 \le L_i \le 3$.

Das Problem umgeht man mit Run–Length Limited Coding (RLLC). Ist ein Wert $L_i \ge 2^D$, so ersetzt man $L_i$ durch ein Sonderzeichen S und die Differenz $L_i - 2^D +1$. Beim RLLC–Decoder wird dieses Sonderzeichen S wieder expandiert.



Hinweise:


$\text{RLLC-Beispiel 2}$:  Wir gehen wieder von obiger Folge und dem Parameter $D = 2$ aus:

  • Quellensymbolfolge:    $\rm ABAABAAAABBAAB$...
  • RLC–Dezimalfolge:        2; 3; 5; 1; 3; ...
  • RLLC–Dezimalfolge:     2; 3; S;2; 1; 3; ...
  • RLLC–Binärfolge:           01′11′ 00′10′01′11′...


Man erkennt:

  • Das Sonderzeichen S ist hier als 00 binär–codiert. Dies ist nur ein Beispiel – es muss nicht so sein.
  • Da mit $D = 2$ für alle echten RLC–Werte $1 \le L_i \le 3$ gilt, erkennt der Decoder das Sonderzeichen 00.
  • Er ersetzt dieses wieder durch $2^D -1$ (im Beispiel drei) $\rm A$–Symbole.


Fragebogen

1

Wieviele Bit würde man ohne Quellencodierung benötigen, also mit der Zuordnung $\rm A$   →  0 und $\rm B$   →  1?

$N_\text{Bit} \ = \ $

2

Wie groß ist die relative Häufigkeit des Symbols $\rm B$?

$h_{\rm B}\ = \ $

$\ \%$

3

Wie viele Bit benötigt man für Run–Length Coding (RLC) nach der angegebenen Tabelle mit 8 Bit–Codeworten $(D = 8)$?

$N_\text{Bit} \ = \ $

4

Ist hier Run–Length Coding mit 7 Bit–Codeworten $(D = 7)$ möglich?

Ja.
Nein.

5

Wie viele Bit benötigt man mit Run–Length Limited Coding (RLLC) mit 7 Bit pro Codewort $(D = 7)$?

$N_\text{Bit} \ = \ $

6

Wie viele Bit benötigt man mit Run–Length Limited Coding (RLLC) mit 6 Bit pro Codewort $(D = 6)$?

$N_\text{Bit} \ = \ $


Musterlösung

(1)  Die Binärfolge besteht aus insgesamt $N = 1250$ Binärsymbolen (ablesbar aus der letzten Spalte in der Tabelle). Damit benötigt man ohne Codierung ebenso viele Bit:

$$N_\text{Bit}\hspace{0.15cm}\underline{== 1250}.$$


(2)  Die gesamte Symbolfolge der Länge $N = 1250$ beinhaltet $N_{\rm B} = 25$ Symbole ${\rm B}$ und somit $N_{\rm A} = 1225$ Symbole ${\rm A}$. Damit gilt für die relative Häufigkeit von ${\rm B}$:

$$h_{\rm B} = \frac{N_{\rm B}}{N} = \frac{25}{1250} \hspace{0.15cm}\underline{= 0.02} = 2\%\hspace{0.05cm}. $$


(3)  Wir betrachten nun Run–Length Coding (RLC), wobei jeder Abstand zwischen zwei ${\rm B}$–Symbolen mit 8 Bit dargestellt wird $(D = 8)$. Damit ergibt sich mit $N_{\rm B} = 25$:

$$N_{\rm Bit} = N_{\rm B} \cdot 8 \hspace{0.15cm}\underline{= 200} \hspace{0.05cm}.$$


(4)  Run–Length Coding mit $D = 7$ erlaubt für $L_i$ nur Werte zwischen $1$ und $2^7-1 =127$. Der Eintrag „226” in Zeile 19 ist aber größer     ⇒     NEIN.


(5)  Auch bei Run–Length Limited Coding (RLLC) sind für die „echten” Abstände $L_i$ mit $D = 7$ nur Werte zwischen $1$ und $127$ zulässig. Der Eintrag „226” in Zeile 19 wird bei RLLC ersetzt durch

  • Zeile 19a: S = 0000000   ⇒   Sonderzeichen, steht für „+ 127”,
  • Zeile 19b: 1100011   ⇒   Dezimal 99.


Damit erhält man insgesamt $26$ Worte zu je sieben Bit:

$$N_{\rm Bit} = 26 \cdot 7 \hspace{0.15cm}\underline{= 182} \hspace{0.05cm}.$$


(6)  Nun müssen bei RLLC gegenüber RLC (siehe Tabelle) folgende Änderungen vorgenommen werden:

  • Zeile   1:   $122 = 1 · 63 + 59$   (ein Wort mehr),
  • Zeile   6:     $70 = 1 · 63 + 7$     (ein Wort mehr),
  • Zeile   7:     $80 = 1 · 63 + 17$   (ein Wort mehr),
  • Zeile 12:     $79 = 1 · 63 + 18$   (ein Wort mehr),
  • Zeile 13:     $93 = 1 · 63 + 30$   (ein Wort mehr),
  • Zeile 19:   $226 = 3 · 63 + 37$   (drei Worte mehr),
  • Zeile 25:     $97 = 1 · 63 + 34$   (ein Wort mehr).


Damit erhält man insgesamt $34$ Worte zu je sechs Bit:

$$N_{\rm Bit} = 34 \cdot 6 \hspace{0.15cm}\underline{= 204} \hspace{0.05cm},$$

also ein schlechteres Ergebnis als mit sieben Bit gemäß Teilaufgabe (5).