Difference between revisions of "Aufgaben:Exercise 2.2Z: Average Code Word Length"
From LNTwww
m (Guenter verschob die Seite 2.02Z Mittlere Codewortlänge nach 2.2Z Mittlere Codewortlänge) |
|||
Line 3: | Line 3: | ||
}} | }} | ||
− | [[File:P_ID2417__Inf_Z_2_2.png|right|]] | + | [[File:P_ID2417__Inf_Z_2_2.png|right|Tabellen zur Quellencodierung]] |
− | + | Ziel von Datenkomprimierung ist es, die Nachricht einer Quelle mit möglichst wenigen Binärzeichen darzustellen. | |
− | + | Wir betrachten hier eine wertdiskrete Nachrichtenquelle mit dem Symbolvorrat $\{ A, B, C, D\}$ ⇒ Symbolumfang $M = 4$ und den Auftrittswahrscheinlichkeiten | |
+ | *$p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} = 1/4$ (Teilaufgabe 1), | ||
+ | * $p_{\rm A} = 1/2, \, p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} = 1/8$ (ab Teilaufgabe 2). | ||
− | |||
− | + | Vorausgesetzt wird, dass es zwischen den einzelnen Quellensymbolen keine statistischen Bindungen gibt. | |
− | : | + | Ein Maß für die Güte eines Komprimierungsverfahrens ist die mittlere Codewortlänge $L_{\rm M}$ mit der Zusatzeinheit „bit/Quellensymbol”. Vorgegeben sind drei Zuordnungen. Anzumerken ist: |
+ | * Jeder dieser Binärcodes C1, C2 und C3 ist für eine spezielle Quellenstatistik ausgelegt. | ||
+ | * Alle Codes sind präfixfrei und somit ohne weitere Angabe sofort decodierbar. | ||
− | |||
− | : | + | ''Hinweise:'' |
− | + | *Die Aufgabe gehört zum Kapitel [[Informationstheorie/Allgemeine_Beschreibung|Allgemeine Beschreibung der Quellencodierung]]. | |
− | + | *Sollte die Eingabe des Zahlenwertes „0” erforderlich sein, so geben Sie bitte „0.” ein. | |
− | |||
− | |||
Line 26: | Line 26: | ||
<quiz display=simple> | <quiz display=simple> | ||
− | {Bestimmen Sie die mittlere Codewortlänge für | + | {Bestimmen Sie die mittlere Codewortlänge $L_{\rm M}$ für $p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} = 1/4$. |
|type="{}"} | |type="{}"} | ||
− | $C1:\ \ | + | $\text{C1:}\ \ L_{\rm M} \ = $ { 2 1% } $\ \rm bit/Quellensymbol$ |
− | $C2:\ | + | $\text{C2:}\ \ L_{\rm M} \ = $ { 2.25 1% } $\ \rm bit/Quellensymbol$ |
− | $C3:\ | + | $\text{C3:}\ \ L_{\rm M} \ = $ { 2.25 1% } $\ \rm bit/Quellensymbol$ |
− | {Welche Werte ergeben sich für | + | {Welche Werte ergeben sich für $p_{\rm A} = 1/2, \, p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} = 1/8$? |
|type="{}"} | |type="{}"} | ||
− | $C1:\ | + | $\text{C1:}\ \ L_{\rm M} \ = $ { 2 1% } $\ \rm bit/Quellensymbol$ |
− | $C2:\ | + | $\text{C2:}\ \ L_{\rm M} \ = $ { 1.75 1% } $\ \rm bit/Quellensymbol$ |
− | $C3:\ | + | $\text{C3:}\ \ L_{\rm M} \ = $ { 2.5 1% } $\ \rm bit/Quellensymbol$ |
Line 46: | Line 46: | ||
− | {Für die spezielle | + | {Für die spezielle Quellensymbolfolge $\rm ADBDCBCBADCA$ ergibt sich die Codesymbolfolge $\rm 001101111001100100111000$. |
+ | <br>Welcher Code wurde verwendet? | ||
|type="[]"} | |type="[]"} | ||
− | + der Code C1, | + | + der Code '''C1''', |
− | - der Code C2. | + | - der Code '''C2'''. |
− | {Nach Codierung mit C3 erhält man | + | {Nach Codierung mit '''C3''' erhält man $\rm 001101111001100100111000$. Wie lautet die zugehörige Quellensymbolfolge? |
|type="[]"} | |type="[]"} | ||
− | - | + | - $\rm AACDBACABADAAA$ ... |
− | + | + | + $\rm ACBCCCACAACCD$ ... |
Revision as of 14:07, 16 May 2017
Ziel von Datenkomprimierung ist es, die Nachricht einer Quelle mit möglichst wenigen Binärzeichen darzustellen.
Wir betrachten hier eine wertdiskrete Nachrichtenquelle mit dem Symbolvorrat $\{ A, B, C, D\}$ ⇒ Symbolumfang $M = 4$ und den Auftrittswahrscheinlichkeiten
- $p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} = 1/4$ (Teilaufgabe 1),
- $p_{\rm A} = 1/2, \, p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} = 1/8$ (ab Teilaufgabe 2).
Vorausgesetzt wird, dass es zwischen den einzelnen Quellensymbolen keine statistischen Bindungen gibt.
Ein Maß für die Güte eines Komprimierungsverfahrens ist die mittlere Codewortlänge $L_{\rm M}$ mit der Zusatzeinheit „bit/Quellensymbol”. Vorgegeben sind drei Zuordnungen. Anzumerken ist:
- Jeder dieser Binärcodes C1, C2 und C3 ist für eine spezielle Quellenstatistik ausgelegt.
- Alle Codes sind präfixfrei und somit ohne weitere Angabe sofort decodierbar.
Hinweise:
- Die Aufgabe gehört zum Kapitel Allgemeine Beschreibung der Quellencodierung.
- Sollte die Eingabe des Zahlenwertes „0” erforderlich sein, so geben Sie bitte „0.” ein.
Fragebogen
Musterlösung
- 1. Die mittlere Codewortlänge ergibt sich allgemein zu
- $$L_{\rm M} = p_{\rm A} \cdot L_{\rm A} + p_{\rm B} \cdot L_{\rm B}+ p_{\rm C} \cdot L_{\rm C} + p_{\rm D} \cdot L_{\rm D} \hspace{0.05cm}.$$
- Sind die vier Quellensymbole gleichwahrscheinlich (alle Wahrscheinlichkeiten genau 1/4), so kann dafür auch geschrieben werden:
- $$L_{\rm M} = 1/4 \cdot [ L_{\rm A} + L_{\rm B}+ L_{\rm C} + L_{\rm D}]
\hspace{0.05cm}.$$
- Code C1: LM = 2.00 bit/Quellensymbol,
- Code C2: LM = 2.25 bit/Quellensymbol,
- Code C3: LM = 2.25 bit/Quellensymbol.
- 2. Mit der Codetabelle C1 ergibt sich unabhängig von den Symbolwahrscheinlichkeiten stets die mittlere Codewortlänge LM = 2 bit/Quellensymbol. Für die beiden anderen Codes erhält man
- Code C2: LM = 1/2 · 1 + 1/4 · 2 + 1/8 · 3 + 1/8 · 3 = 1.75 bit/Quellensymbol,
- Code C3: LM = 1/2 · 3 + 1/4 · 2 + 1/8 · 1 + 1/8 · 3 = 2.50 bit/Quellensymbol.
- Man erkennt aus dem Beispiel das Prinzip: Wahrscheinliche Symbole werden durch wenige Binärsymbole dargestellt und unwahrscheinliche durch mehr. Bei gleichwahrscheinlichen Symbolen wählt man am besten auch die Codewortlängen gleich.
- 3. Richtig ist Lösungsvorschlag 1. Ein Code mit einheitlicher Länge aller Codeworte ist zwar präfixfrei, aber auch andere Codes können präfixfrei sein, zum Beispiel die Codes C2 und C3.
- 4. Bereits aus „00” am Anfang erkennt man, dass der Code C2 hier nicht in Frage kommt, da sonst die Quellensymbolfolge mit „AA” beginnen müsste. Tatsächlich wurde der Code C1 verwendet.
- 5. Richtig ist der Lösungsvorschlag 2. Der erste Lösungsvorschlag gibt die Quellensymbolfolge für den Code C2 an, wenn die Codesymbolfolge 001101111001100100111000 lauten würde.