Exercise 3.4: Different Voice Codecs
From LNTwww
Mit der Entwicklung des GSM–Standards nach 1990 ging die Standardisierung verschiedener Sprach–Codecs einher:
- Mit dem ersten Full–Rate–Codec (FR) aus dem Jahr 1991 erreichte man eine Reduktion auf die Datenrate $13 \ \rm kbit/s$, ausreichend gering, um ein Sprachsignal über einen einzigen Verkehrskanal übertragen zu können.
- 1994 wurde der Half–Rate–Codec (HR) mit der Bitrate $5.6 \ \rm kbit/s$ entwickelt mit dem Ziel, bei Bedarf in einem Verkehrskanal zwei Gespräche gleichzeitig übertragen zu können. Die Qualität erreicht allerdings nicht ganz diejenige des Full–Rate–Codecs.
- Der Enhanced Full–Rate Codec (EFR) von 1995 stellte eine erhebliche Weiterentwicklung dar, die auf dem Datenreduktionsverfahren ACELP (Algebraic Code Excited Linear Prediction) basiert. Der EFR–Codec liefert eine Datenrate von $12.2 \ \rm kbit/s$ und steht für den mittlerweile üblichen Qualitätsstandard im Mobilfunk.
- 1999 wurde von der ETSI der Adaptive Multi–Rate Codec (AMR) für GSM standardisiert. Dieser stellt acht verschiedene Modi mit Datenraten zwischen $4.75 \ \rm kbit/s$ und $12.2 \ \rm kbit/s$ bereit. Der AMR–Codec verwendet wie der EFR–Codec das ACELP–Verfahren.
- Der Wideband–AMR (WB–AMR) ist eine Weiterentwicklung des ursprünglichen AMR. Er wurde 2001 vom 3GPP–Konsortium und 2002 von der ITU–T standardisiert und nutzt den Frequenzbereich von $50 \ \rm Hz$ bis $7 \ \rm kHz$. Hier liegt also ein „WideBand–Signal” zugrunde.
Hinweise:
- Die Aufgabe bezieht sich auf die Gemeinsamkeiten von GSM und UMTS.
- Die Grafik zeigt das Betragsspektrum eines Audiosignals und definiert die Merkmale Narrowband und Wideband.
- Wir weisen Sie auf das interaktive Applet Qualität verschiedener Sprachcodecs hin.
Fragebogen
Musterlösung
(1) Richtig sind die Lösungsvorschläge 1 und 3:
- Die erforderliche Datenrate wird reduziert, indem Redundanz und Irrelevanz aus dem Datensignal entfernt wird.
- Das Kunstwort „Codec” weist darauf hin, dass die gleiche Funktionseinheit sowohl für die Codierung als auch für die Decodierung verwendet wird.
(2) Richtig sind die Antworten 2 und 3:
- Der EFR–Codec aus dem Jahre 1995 ist eine erhebliche Weiterentwicklung des Full–Rate Codecs aus dem Jahr 1991, wobei unter anderem die Sprachqualität durch Hintergrundgeräusch weniger beeinträchtigt wird.
- Der EFR–Codec basiert ebenso wie der AMR auf dem Datenreduktionsverfahren ACELP (Algebraic Code Excited Linear Prediction).
- Der erste Lösungsvorschlag ist dagegen falsch. Der EFR–Codec ist wie der FR– und der AMR–Codec nur für den Telefonkanal (300 Hz bis 3.4 kHz) ausgelegt.
- Zur besseren Verständlichkeit und Vermeidung eines dumpfen Klangs erfolgt zusätzlich eine Mittenanhebung und eine Tiefenabsenkung.
(3) Richtig ist nur der Lösungsvorschlag 2:
- Der Vorteil des AMR–Codecs gegenüber dem EFR liegt in seiner größeren Flexibilität.
- Wenn sich die Kanalqualität signifikant verschlechtert, kann fließend zu einem niederratigen Modus umgeschaltet werden, bei dem sich Übertragungsfehler weniger störend auswirken.
- Man kann zudem wie beim Half–Rate Codec zwei Gespräche in einem Verkehrskanal führen.
- Der höchste Modus mit 12.2 kbit/s – und nicht der niedrigste – ist identisch mit dem EFR–Codec. Damit ist offensichtlich, dass der AMR keine bessere Sprachqualität als der EFR liefern kann.
(4) Hier sind alle Antworten richtig:
- Im Wideband–AMR werden neun Modi bereitgestellt, von denen allerdings für den Mobilfunk nur fünf genutzt werden, nämlich diejenigen mit den Datenraten 6.60, 8.85, 12.65, 15.85 und 23.65 kbit/s.
- Die Modi bis 12.65 kbit/s haben den Vorteil, dass ein so codiertes Sprachsignal in einem einzigen GSM–Verkehrskanal untergebracht werden kann. Für die höherratigen Modi benötigt man GSM/EDGE oder UMTS.
- Die höherratigen Modi (15.85 und 23.65 kbit/s) liefern zwar bei Sprache nur noch eine geringe Verbesserung, allerdings aufgrund des größeren Frequenzbereichs eine merkliche Verbesserung bei der Übertragung von Musik.
- Sowohl der WB–AMR 12.65 als auch die höheren Modi von (Narrowband–) AMR zeigen hier Schwächen. Eine noch niedrigere Datenrate liefert bei Musiksignalen äußerst dürftige Ergebnisse.
- Der WB–AMR hat auch bei vergleichbarer Datenrate (12.65 kbit/s) eine bessere Sprachqualität als der NB–AMR mit 12.2 kbit/s. Durch die größere Bandbreite klingt die Sprache natürlicher und Zischlaute wie „s”, „f” und „sch” werden besser verständlich.