Difference between revisions of "Aufgaben:Exercise 3.4: Different Voice Codecs"

From LNTwww
m (Text replacement - "[File:" to "[File:")
Line 5: Line 5:
  
 
[[File:P_ID2221__Mob_A_3_4.png|right|frame|Audiosignale von &bdquo;Narrow–Band&rdquo; <br>und &bdquo;Wide–Band&rdquo;]]
 
[[File:P_ID2221__Mob_A_3_4.png|right|frame|Audiosignale von &bdquo;Narrow–Band&rdquo; <br>und &bdquo;Wide–Band&rdquo;]]
Mit der Entwicklung des GSM–Standards nach 1990 ging die Standardisierung verschiedener Sprach–Codecs einher:
+
The development of the GSM standard after 1990 was accompanied by the standardization of various voice codecs:
*Mit dem ersten Full–Rate–Codec&nbsp; ('''FR''')&nbsp; aus dem Jahr 1991 erreichte man eine Reduktion auf die Datenrate&nbsp; $13 \ \rm kbit/s$, ausreichend gering, um ein Sprachsignal über einen einzigen Verkehrskanal übertragen zu können.
+
*With the first full-rate codec&nbsp; ('''FR''')&nbsp; from 1991 a reduction to the data rate&nbsp; $13 \ \rm kbit/s$ was achieved, sufficiently low to be able to transmit a voice signal over a single traffic channel.
*1994 wurde der ''Half–Rate–Codec''&nbsp; ('''HR''')&nbsp; mit der Bitrate&nbsp; $5.6 \ \rm kbit/s$&nbsp; entwickelt mit dem Ziel, bei Bedarf in einem Verkehrskanal zwei Gespräche gleichzeitig übertragen zu können. Die Qualität erreicht allerdings nicht ganz diejenige des Full–Rate–Codecs.
+
*In 1994 the ''Half-Rate Codec''&nbsp; ('''HR''')&nbsp; with the bitrate&nbsp; $5.6 \ \rm kbit/s$&nbsp; was developed with the aim of being able to transmit two calls simultaneously in one traffic channel if required. However, the quality does not quite reach the full-rate codec.
*Der ''Enhanced Full–Rate Codec''&nbsp; ('''EFR''')&nbsp; von 1995 stellte eine erhebliche Weiterentwicklung dar, die auf dem Datenreduktionsverfahren ACELP (''Algebraic Code Excited Linear Prediction'') basiert. Der EFR–Codec liefert eine Datenrate von&nbsp; $12.2 \ \rm kbit/s$&nbsp; und steht für den mittlerweile üblichen Qualitätsstandard im Mobilfunk.
+
*The ''Enhanced Full-Rate Codec''&nbsp; ('''EFR'')&nbsp; from 1995 represented a significant development based on the data reduction method ACELP (''Algebraic Code Excited Linear Prediction''). The EFR codec delivers a data rate of&nbsp; $12.2 \ \rm kbit/s$&nbsp; and stands for the common quality standard in mobile communications nowadays.
*1999 wurde von der ETSI der ''Adaptive Multi–Rate Codec''&nbsp; ('''AMR''')&nbsp; für GSM standardisiert. Dieser stellt acht verschiedene Modi mit Datenraten zwischen&nbsp; $4.75 \ \rm kbit/s$&nbsp; und&nbsp; $12.2 \ \rm kbit/s$&nbsp; bereit. Der AMR–Codec verwendet wie der EFR–Codec das ACELP–Verfahren.
+
*In 1999, ETSI standardized the ''Adaptive Multi-Rate Codec''&nbsp; ('''AMR''')&nbsp; for GSM. This provides eight different modes with data rates between&nbsp; $4.75 \ \ \rm kbit/s$&nbsp; and&nbsp; $12.2 \ \ \rm kbit/s$&nbsp;. The AMR codec uses the ACELP method like the EFR codec.
*Der ''Wideband–AMR''&nbsp; ('''WB–AMR''')&nbsp; ist eine Weiterentwicklung des ursprünglichen AMR. Er wurde 2001 vom 3GPP–Konsortium und 2002 von der ITU–T standardisiert und nutzt den Frequenzbereich von&nbsp; $50 \ \rm Hz$&nbsp; bis&nbsp; $7 \ \rm kHz$. Hier liegt also ein „WideBand–Signal” zugrunde.
+
*The ''Wideband AMR'' &nbsp; ('''WB-AMR''')&nbsp; is a further development of the original AMR. It was standardized by the 3GPP consortium in 2001 and by ITU-T in 2002 and uses the frequency range from&nbsp; $50 \ \rm Hz$&nbsp; to&nbsp; $7 \rm kHz$. This is therefore based on a "WideBand signal".
  
  
Line 18: Line 18:
  
  
 +
''Notes:''
  
''Hinweise:''
+
*This exercise refers to&nbsp; [[Mobile_Kommunikation/Gemeinsamkeiten_von_GSM_und_UMTS|Gemeinsamkeiten von GSM und
 
 
*Die Aufgabe bezieht sich auf die&nbsp; [[Mobile_Kommunikation/Gemeinsamkeiten_von_GSM_und_UMTS|Gemeinsamkeiten von GSM und
 
 
  UMTS]].  
 
  UMTS]].  
*Die Grafik zeigt das Betragsspektrum eines Audiosignals und definiert die Merkmale ''Narrowband'' und ''Wideband''.  
+
*The graph shows the magnitude spectrum of an audio signal and defines the characteristics ''Narrowband'' and ''Wideband''.  
*Wir weisen Sie auf das interaktive Applet&nbsp; [[Applets:Sprachcodecs|Qualität verschiedener  Sprachcodecs]] hin.  
+
*We refer you to the interactive applet&nbsp; [[Applets:Sprachcodecs|Qualität verschiedener  Sprachcodecs]] hin.  
  
  
===Fragebogen===
+
===Questionnaire===
  
 
<quiz display=simple>
 
<quiz display=simple>
  
{Welche Aufgaben erfüllt ein Sprachcodec?
+
{What tasks does a speech codec perform?
 
|type="[]"}
 
|type="[]"}
+ Er dient zur Ratenreduzierung von digitalisierter Sprache.
+
+ It is used for rate reduction of digitised speech.
- Er ist aus Gründen der Fehlerkorrektur erforderlich.
+
- It is necessary for error correction reasons.
+ Er wird zur Codierung und auch zur Decodierung verwendet.
+
+ It is used for coding and decoding.
  
{Welche Vorteile bietet der EFR–Codec gegenüber dem FR–Codec?
+
{What advantages does the EFR codec offer compared to the FR codec?
 
|type="[]"}
 
|type="[]"}
- Er ist für breitbandige Signale $($Frequenzbereich: &nbsp; $200 \ \rm Hz$&nbsp; bis&nbsp; $7 \ \rm kHz)$&nbsp; ausgelegt.
+
- It is designed for broadband signals $($frequency range: &nbsp; $200 \ \ \rm Hz$&nbsp; bis&nbsp; $7 \ \rm kHz)$&nbsp;.
+ Er bietet eine bessere Klangqualität.
+
+ It provides better sound quality.
+ Die Verbesserung geht auf das ACELP–Verfahren zurück.
+
+ The improvement is due to the ACELP method.
  
{Welche Vorteile bietet der AMR–Codec gegenüber dem EFR–Codec?
+
{What are the advantages of the AMR codec over the EFR codec?
 
|type="[]"}
 
|type="[]"}
- Er liefert eine bessere Sprachqualität.
+
- It provides better voice quality.
+ Er stellt verschiedene Modi bereit und ist damit flexibler.
+
+ It provides different modes and is therefore more flexible.
- Der niedrigste Modus ist identisch mit dem EFR–Standard.
+
- The lowest mode is identical to the EFR standard.
  
{Welche Eigenschaften weist der WB–AMR auf?
+
{What are the characteristics of WB-AMR?
 
|type="[]"}
 
|type="[]"}
+ Der Audio–Frequenzbereich beträgt&nbsp; $50 \ \rm Hz$&nbsp; bis&nbsp; $7 \ \rm kHz$.
+
+ The audio frequency range is&nbsp; $50 \ \rm Hz$&nbsp; bis&nbsp; $7 \ \rm kHz$.
+ Er stellt Modi zwischen&nbsp; $6.60 \ \rm kHz$&nbsp; und&nbsp; $23.85 \ \rm kHz$&nbsp; bereit.
+
+ It provides modes between&nbsp; $6.60 \ \ \rm kHz$&nbsp; and&nbsp; $23.85 \ \rm kHz$&nbsp;.
+ Für die höherratigen Modi ist GSM nicht ausreichend.
+
+ GSM is not sufficient for the higher rate modes.
  
  
 
</quiz>
 
</quiz>
  
===Musterlösung===
+
===Sample Solution===
 
{{ML-Kopf}}
 
{{ML-Kopf}}
  
'''(1)'''&nbsp; Richtig sind die <u>Lösungsvorschläge 1 und 3</u>:  
+
'''(1)'''&nbsp; Correct are the <u>solution suggestions 1 and 3</u>:  
*Die erforderliche Datenrate wird reduziert, indem Redundanz und Irrelevanz aus dem Datensignal entfernt wird.
+
*The required data rate is reduced by removing redundancy and irrelevance from the data signal
*Das Kunstwort &bdquo;Codec&rdquo; weist darauf hin, dass die gleiche Funktionseinheit sowohl für die Codierung als auch für die Decodierung verwendet wird.
+
*The artificial word &bdquo;Codec&rdquo; indicates that the same functional unit is used for both encoding and decoding.
  
  
  
'''(2)'''&nbsp; Richtig sind die <u>Antworten 2 und 3</u>:  
+
'''(2)'''&nbsp; Correct are the <u>answers 2 and 3</u>:  
*Der EFR&ndash;Codec aus dem Jahre 1995 ist eine erhebliche Weiterentwicklung des ''Full&ndash;Rate Codecs'' aus dem Jahr 1991, wobei unter anderem die Sprachqualität durch Hintergrundgeräusch weniger beeinträchtigt wird.  
+
*The EFR&ndash;Codec from 1995 is a significant development of the ''Full&ndash;Rate Codecs'' from 1991, whereby, among other things, speech quality is less affected by background noise.  
*Der EFR&ndash;Codec basiert ebenso wie der AMR auf dem Datenreduktionsverfahren ACELP (''Algebraic Code Excited Linear Prediction'').
+
*Like the AMR, the EFR&ndash;Codec is based on the data reduction method ACELP (''Algebraic Code Excited Linear Prediction'').
*Der erste Lösungsvorschlag ist dagegen falsch. Der EFR–Codec ist wie der FR– und der AMR–Codec nur für den Telefonkanal (300 Hz bis 3.4 kHz) ausgelegt.  
+
*The first proposed solution is wrong. Like the FR and AMR codecs, the EFR codec is only designed for the telephone channel (300 Hz to 3.4 kHz).  
*Zur besseren Verständlichkeit und Vermeidung eines dumpfen Klangs erfolgt zusätzlich eine Mittenanhebung und eine Tiefenabsenkung.
+
*For better intelligibility and to avoid a dull sound, there is also a mid-range boost and a low-frequency cut.
  
  
  
'''(3)'''&nbsp; Richtig ist nur der <u>Lösungsvorschlag 2</u>:  
+
'''(3)'''&nbsp;Only the <u>solution 2</u> is correct:  
*Der Vorteil des AMR&ndash;Codecs gegenüber dem EFR liegt in seiner größeren Flexibilität.  
+
*The advantage of the AMR&ndash;codec over the EFR is its greater flexibility.  
*Wenn sich die Kanalqualität signifikant verschlechtert, kann fließend zu einem niederratigen Modus umgeschaltet werden, bei dem sich Übertragungsfehler weniger störend auswirken.  
+
*If the channel quality deteriorates significantly, it is possible to switch smoothly to a low-rate mode where transmission errors are less disturbing.  
*Man kann zudem wie beim ''Half&ndash;Rate Codec'' zwei Gespräche in einem Verkehrskanal führen.
+
*In addition, as with the Half&ndash Rate Codec, it is possible to have two conversations in one traffic channel.
*Der höchste Modus mit 12.2 kbit/s – und nicht der niedrigste – ist identisch mit dem EFR–Codec. Damit ist offensichtlich, dass der AMR keine bessere Sprachqualität als der EFR liefern kann.
+
*The highest mode at 12.2 kbit/s - and not the lowest - is identical to the EFR codec. It is therefore obvious that AMR cannot provide better voice quality than EFR.
  
  
  
'''(4)'''&nbsp; Hier sind <u>alle Antworten richtig</u>:  
+
'''(4)'''&nbsp; <u>All answers are correct</u>:  
*Im Wideband&ndash;AMR werden neun Modi bereitgestellt, von denen allerdings für den Mobilfunk nur fünf genutzt werden, nämlich diejenigen mit den Datenraten 6.60, 8.85, 12.65, 15.85 und 23.65 kbit/s.  
+
*Nine modes are provided in wideband&ndash;AMR, but only five of them are used for mobile communications, namely those with data rates of 6.60, 8.85, 12.65, 15.85 and 23.65 kbit/s.  
*Die Modi bis 12.65 kbit/s haben den Vorteil, dass ein so codiertes Sprachsignal in einem einzigen GSM&ndash;Verkehrskanal untergebracht werden kann. Für die höherratigen Modi benötigt man GSM/EDGE oder UMTS.
+
*The modes up to 12.65 kbit/s have the advantage that a voice signal encoded in this way can be accommodated in a single GSM&ndash;traffic channel. For the higher rate modes, GSM/EDGE or UMTS is required.
*Die höherratigen Modi (15.85 und 23.65 kbit/s) liefern zwar bei Sprache nur noch eine geringe Verbesserung, allerdings aufgrund des größeren Frequenzbereichs eine merkliche Verbesserung bei der Übertragung von Musik.  
+
*The higher rate modes (15.85 and 23.65 kbit/s) provide only a slight improvement for speech, but due to the larger frequency range, they provide a noticeable improvement for the transmission of music.  
*Sowohl der WB–AMR 12.65 als auch die höheren Modi von (Narrowband–) AMR zeigen hier Schwächen. Eine noch niedrigere Datenrate liefert bei Musiksignalen äußerst dürftige Ergebnisse.
+
*Both the WB-AMR 12.65 and the higher modes of (narrowband) AMR show weaknesses here. An even lower data rate gives extremely poor results with music signals.
*Der WB–AMR hat auch bei vergleichbarer Datenrate (12.65  kbit/s) eine bessere Sprachqualität als der NB–AMR mit 12.2 kbit/s. Durch die größere Bandbreite klingt die Sprache natürlicher und Zischlaute wie „s”, „f” und „sch” werden besser verständlich.
+
*The WB-AMR has a better voice quality than the NB-AMR with 12.2 kbit/s even at a comparable data rate (12.65 kbit/s). Due to the greater bandwidth, speech sounds more natural and sibilants such as "s", "f" and "sch" become more intelligible.
  
 
{{ML-Fuß}}
 
{{ML-Fuß}}

Revision as of 21:14, 28 June 2020

Audiosignale von „Narrow–Band”
und „Wide–Band”

The development of the GSM standard after 1990 was accompanied by the standardization of various voice codecs:

  • With the first full-rate codec  (FR)  from 1991 a reduction to the data rate  $13 \ \rm kbit/s$ was achieved, sufficiently low to be able to transmit a voice signal over a single traffic channel.
  • In 1994 the Half-Rate Codec  (HR)  with the bitrate  $5.6 \ \rm kbit/s$  was developed with the aim of being able to transmit two calls simultaneously in one traffic channel if required. However, the quality does not quite reach the full-rate codec.
  • The Enhanced Full-Rate Codec  ('EFR)  from 1995 represented a significant development based on the data reduction method ACELP (Algebraic Code Excited Linear Prediction). The EFR codec delivers a data rate of  $12.2 \ \rm kbit/s$  and stands for the common quality standard in mobile communications nowadays.
  • In 1999, ETSI standardized the Adaptive Multi-Rate Codec  (AMR)  for GSM. This provides eight different modes with data rates between  $4.75 \ \ \rm kbit/s$  and  $12.2 \ \ \rm kbit/s$ . The AMR codec uses the ACELP method like the EFR codec.
  • The Wideband AMR   (WB-AMR)  is a further development of the original AMR. It was standardized by the 3GPP consortium in 2001 and by ITU-T in 2002 and uses the frequency range from  $50 \ \rm Hz$  to  $7 \rm kHz$. This is therefore based on a "WideBand signal".




Notes:


Questionnaire

1

What tasks does a speech codec perform?

It is used for rate reduction of digitised speech.
It is necessary for error correction reasons.
It is used for coding and decoding.

2

What advantages does the EFR codec offer compared to the FR codec?

It is designed for broadband signals $($frequency range:   $200 \ \ \rm Hz$  bis  $7 \ \rm kHz)$ .
It provides better sound quality.
The improvement is due to the ACELP method.

3

What are the advantages of the AMR codec over the EFR codec?

It provides better voice quality.
It provides different modes and is therefore more flexible.
The lowest mode is identical to the EFR standard.

4

What are the characteristics of WB-AMR?

The audio frequency range is  $50 \ \rm Hz$  bis  $7 \ \rm kHz$.
It provides modes between  $6.60 \ \ \rm kHz$  and  $23.85 \ \rm kHz$ .
GSM is not sufficient for the higher rate modes.


Sample Solution

(1)  Correct are the solution suggestions 1 and 3:

  • The required data rate is reduced by removing redundancy and irrelevance from the data signal
  • The artificial word „Codec” indicates that the same functional unit is used for both encoding and decoding.


(2)  Correct are the answers 2 and 3:

  • The EFR–Codec from 1995 is a significant development of the Full–Rate Codecs from 1991, whereby, among other things, speech quality is less affected by background noise.
  • Like the AMR, the EFR–Codec is based on the data reduction method ACELP (Algebraic Code Excited Linear Prediction).
  • The first proposed solution is wrong. Like the FR and AMR codecs, the EFR codec is only designed for the telephone channel (300 Hz to 3.4 kHz).
  • For better intelligibility and to avoid a dull sound, there is also a mid-range boost and a low-frequency cut.


(3) Only the solution 2 is correct:

  • The advantage of the AMR–codec over the EFR is its greater flexibility.
  • If the channel quality deteriorates significantly, it is possible to switch smoothly to a low-rate mode where transmission errors are less disturbing.
  • In addition, as with the Half&ndash Rate Codec, it is possible to have two conversations in one traffic channel.
  • The highest mode at 12.2 kbit/s - and not the lowest - is identical to the EFR codec. It is therefore obvious that AMR cannot provide better voice quality than EFR.


(4)  All answers are correct:

  • Nine modes are provided in wideband–AMR, but only five of them are used for mobile communications, namely those with data rates of 6.60, 8.85, 12.65, 15.85 and 23.65 kbit/s.
  • The modes up to 12.65 kbit/s have the advantage that a voice signal encoded in this way can be accommodated in a single GSM–traffic channel. For the higher rate modes, GSM/EDGE or UMTS is required.
  • The higher rate modes (15.85 and 23.65 kbit/s) provide only a slight improvement for speech, but due to the larger frequency range, they provide a noticeable improvement for the transmission of music.
  • Both the WB-AMR 12.65 and the higher modes of (narrowband) AMR show weaknesses here. An even lower data rate gives extremely poor results with music signals.
  • The WB-AMR has a better voice quality than the NB-AMR with 12.2 kbit/s even at a comparable data rate (12.65 kbit/s). Due to the greater bandwidth, speech sounds more natural and sibilants such as "s", "f" and "sch" become more intelligible.