Similarities Between GSM and UMTS

Cellular architecture

A characteristic feature of GSM and UMTS is the cellular network structure, which is often approximated by hexagons (left graph):

The colours white, yellow and blue indicate different frequencies $($here: Reuse–factor $3)$, thus avoiding intercell interference.
The graphic on the right shows a more realistic layout with non-hexagonal and also differently sized cells, depending on expected participant density and terrain topology. The base station is also not always located in the center of the cell.

Cellular network structure, idealized (left) and realistic (right)

With GSM–D–Netz $(f_{\rm T} = 900 \ \ \rm MHz)$ the cell radius is specified with maximum $\text{35 km}$ . In the E–net, the maximum radius is only half as large because of the larger carrier frequency $(1800 \ \ \rm MHz)$ .

Cell structure in UMTS

In UMTS–network $(f_{\rm T} \approx 2 \ \rm GHz)$ there are different types of radio cells:

Macro cells cover the complete coverage area and follow the classic design. Both overlaps and "holes" between cells should be minimized. A macro cell usually has many macro–neighbours: For exactly hexagonal cells six, in reality some more. The base stations work with high power $\text{(20 to 40 W)}$, are suspended at a great height and use sectorized antennas. In sparsely populated regions, macro cells have diameters of up to several kilometers. In city centres, however, macro cells are kept compact to increase capacity, often only a few hundred metres in diameter.

Microcells cover a small part of a macrocell and are primarily used to increase local capacity (illumination of dead spots). They usually have only one macro–neighbor, but can also have other micro/pico/femto–neighbors. The power is somewhat lower with $\text{(5 to 10 W)}$ and the devices are smaller than in a macro cell. However, the antennas, most of which are not sectorized, also have to be positioned sufficiently high (on a mast or house wall).

Picocells supply small areas $(d \approx 100 \ \rm m)$ with very high data volume (examples: airports, shopping centres, stadiums). They allow higher data rates, but at the expense of the speed of movement. The devices of a picocell are significantly smaller than those in a microcell and operate with lower power $\text{1 to 5 W}$, but are more flexible in assembly.

Femtocells are often administered privately and uncoordinated (example: WLAN access point), sometimes with private backhaul (own DSL–line). One also speaks of a "Home Base Station". They are "Indoor" operated and work with low power $\text{(< 1 W)}$ .

Interference power and cell breathing

If several subscribers use the same frequency channel, interference may occur and thus a very low carrier–to–interference ratio (CIR) may occur, which considerably impairs the transmission quality. The problem is serious in the case of UMTS, which is based on the multiple access method CDMA (Code Division Multiple Access), since here all participants use the same frequency channel.

To illustrate intra- and intercellular interference

A distinction is made between two types of interference according to the graphic:

Intracell interference occurs when the same frequency channel is used by several users within the same cell. In the above example, this case arises for $f_1 = f_2$.

Intercell interference occurs when users of neighboring cells use the same frequency, in the scenario shown, for example, when $f_3 = f_4$ applies.

Both intra– and intercell interference lead to a reduction in transmission quality. In the case of intercell interference (same frequency channel in adjacent cells), the disturbing influence of the interference power on the transmission quality can be limited by

Cell breathing: If the number of active users increases significantly with UMTS, the cell radius and thus the current interference power is reduced. For the supply of the users at the edge of a busy cell, a less busy neighboring cell steps in.

Power_Control: If the total interference power within a radio cell exceeds a specified limit, the transmission power of all users is reduced accordingly, but this also results in poorer transmission quality.

In contrast, in the case of intracell interference, each user must be regulated individually, for example by reducing transmission power and/or data rate.

Near-Far-Effect

The Near–Far–effect is exclusively a problem of uplink, i.e. the transmission of mobile users to a base station. We consider a scenario with two users at different distances from the base station (Node B) according to the following graphic.

Scenarios for the Near-Far Effect

If both mobile stations transmit with the same power, the reception power of the red user $\rm A$ at the base station is significantly lower than that of the blue user $\rm B$ (left scenario) due to the path loss. In large macro cells the difference can be up to $\text{100 dB}$ . This way the red signal is largely hidden by the blue one.

You can largely avoid the Near–Far–effect if the more distant user $\rm A$ transmits with higher power than user $\rm B$, as indicated in the right scenario. At the base station the reception power of both mobile stations is then (almost) equal.

Note: In an idealized system (one-way channel, ideal A/D–converters, completely linear amplifiers) the transmitted data of the users are orthogonal to each other and one could detect the users individually even with very different receiving powers. This statement is valid for GSM due to the multiple access methods FDMA and TDMA, but also for UMTS (CDMA) and for the 4G–system LTE (TDMA/OFDMA).

In reality, however, orthogonality is not always given due to the following reasons:

different receive paths ⇒ multipath channel,

not ideal properties of spreading and scrambling codes with CDMA,

Asynchrony of users in the time domain (basic path delay) and in the frequency domain (non-ideal oscillators and Doppler shift due to user mobility).

Consequently, the users are no longer orthogonal to each other and the signal-to-noise ratio of the user to be detected is not arbitrarily high compared to the other users:

For GSM and LTE one can assume signal-to-noise ratios of $\text{25 dB}$ and more,
for CDMA only from ca. $\text{15 dB}$ ,
for high rate data transmission rather less.

Leistungsregelung

Um den Near–Far–Effekt entsprechend der rechten Grafik auf der letzten Seite zu vermeiden, ist allerdings eine ausreichend gute Leistungsregelung erforderlich. Hierzu ist anzumerken:

Bei allen Systemen (GSM, UMTS und LTE) muss von einem Dynamikbereich an der Basisstation von $\text{80 dB}$ ausgegangen werden, wobei die Änderungen bezüglich Pfadverlust und Abschattung eher langsam erfolgen und für diese eine Regelung im Sekundenbereich um um $±\text{5 dB}$ ausreicht.

Bei GSM und LTE ist eine Regelung im Sekundenbereich ausreichend, da der Störabstand des zu detektierenden Nutzers zu den anderen Nutzern aufgrund der guten Eigenschaften von FDMA/OFDMA $\text{25 dB}$ und mehr ist. Sehr schnelle Schwankungen des Fast–Fadings $($Dynamikbereich zwischen $\text{10 und 20 dB})$ müssen nicht ausgeglichen werden.

Bei UMTS muss dagegen auch das Fast-Fading kompensiert werden, da der Störabstand der Nutzer zueinander geringer ist als die Schwankungen des Fast–Fadings. Für UMTS wurde Fast Power Control spezifiziert, wodurch die Sendeleistung alle $\text{0.67 ms}$ mit einer initialen Verzögerung von $\text{2 ms}$ um $±\text{1 dB}$ verändert werden kann.

Andernfalls würde die Basisstation von einem Nutzer, der bei Fast–Fading innerhalb von etwa $\text{10 ms}$ von sehr schlechten auf eher gute Fadingbedingungen wechselt, plötzlich um $\text{10 bis 20 dB}$ mehr Leistung empfangen. Alle anderen Nutzer in der Zelle würden dadurch extrem gestört.

Wie bereits erwähnt ist der Near–Far–Effekt und damit auch die Leistungsregelung ausschließlich ein Problem des Uplinks. Für den Downlink ist eine ausgeklügelte Leistungsregelung weniger essentiell.

Versorgt man aber die Nutzer nahe der Basisstation mit einer geringeren Leistung, so verringert sich dadurch auch die Interzellinterferenz.
Das heißt: Alle anderen Nutzer in der betrachteten Zelle werden dann durch den Datenverkehr zu dem nahen Nutzer weniger stark beeinträchtigt.

Verschiedene Handover–Strategien

Ein zweites Problem neben dem Near–Far–Effekt tritt auf, wenn ein Mobilfunkteilnehmer von einer Zelle in eine andere wechselt. Um den Übergang zwischen verschiedenen Zellen für die Nutzer als möglichst unterbrechungsfrei erscheinen zu lassen, wird bei leitungsvermittelten UMTS–Diensten und bei GSM ein so genanntes Handover eingesetzt. Man unterscheidet zwei Arten:

Hard Handover: Hierbei wird zu einem bestimmten Zeitpunkt die Verbindung schlagartig von der aktuellen Basisstation zu einer anderen Basisstation umgeleitet.

Soft Handover: Die Übergabe eines Teilnehmers von einer Basisstation zu einer anderen erfolgt allmählich, bis dieser die erste Zelle endgültig verlassen hat. Durch die Kombination mehrerer Links – bei UMTS bis zu drei – lässt sich sogar ein Diversitätsgewinn erzielen.

$\text{Beispiel 1:}$ Die Grafik zeigt ein Downlink–Szenarien, wobei eine Mobilstation an gewissen Orten sein Signal von zwei verschiedenen Basisstationen $(\rm BS1$ und $\rm BS2)$ empfangen kann.

Handover–Szenarien für den Downlink

Bei Hard Handover wertet die Mobilstation an Punkt $\rm A$ nur das Signal von $\rm BS1$ aus und an Punkt $\rm C$ nur das Signal von $\rm BS2$.
Die Umschaltung erfolgt schlagartig, wenn sich der Teilnehmer am Punkt $\rm B$ befindet.

Verwendet man Soft Handover und Soft Combining, so profitiert die Mobilstation von beiden Signalen.
An jedem Ort $(\rm A, \ B, \ C)$ erhöht sich die Empfangsleistung. Es ergibt sich so ein vom Kanal–SNR abhängiger Diversitätsgewinn, zusätzlich ein Kohärenzgewinn von $\text{3 dB}$.

Diese Aussagen lassen sich auch auf das rechte Szenario übertragen, bei der die Basisstation mit gerichteten Antennen in drei Sektoren abstrahlt. Hierbei ist angenommen, dass der Abstrahlwinkel etwas größer ist als $120^\circ$, wovon in der Praxis ausgegangen werden kann.

Im UMTS–Downlink werden die Daten im Radio Network Controller (RNC) gesplittet, über verschiedene Basisstationen ausgestrahlt und in der Mobilstation wieder zusammengesetzt (Rake Processing).

Im UMTS–Uplink werden die gesendeten Daten von allen beteiligten Basisstationen empfangen. Die Zusammenlegung der Daten (Soft Combining) findet im RNC statt. Dieser leitet anschließend die Daten an das Core Network (CN) weiter. Man unterscheidet hierbei:

Softer Handover: Eine Basisstation (Node B) empfängt das Signal eines Teilnehmers über zwei Sektoren und macht Soft Combining. Es gibt einen Diversitätsgewinn sowie einen Kohärenzgewinn von $\text{3 dB}$.

Intra–RNC Handover: Zwei Basisstationen decodieren das Signal, machen einen CRC–Check und melden ihr Ergebnis an den RNC (oder melden einen CRC–Fehler). Meldet nur ein Node B einen CRC–Fehler, so werden die Daten des anderen verwendet. Hier gibt es keinen Kohärenzgewinn und der Diversitätsgewinn ist geringer als bei Softer Handover.

Typisches Mobilfunkübertragungssystem

Nun sollen einige Komponenten von Mobilfunksystemen erklärt werden, die sowohl bei GSM als auch bei UMTS nötig sind.

Die Grafik zeigt die Komponenten des GSM–Senders; die angegebenen Raten gelten ebenfalls nur für GSM.
Für die GSM–Erweiterung GPRS erhält man andere Zahlenwerte.

Für UMTS ergibt sich eine ähnliche Struktur, wenn auch nicht die exakt gleiche. Zudem sind die Bitraten der UMTS–Datenübertragung deutlich höher, während für die Sprachübertragung von vergleichbaren Raten wie für GSM ausgegangen werden kann.

Komponenten der Sprach– und Datenkommunikation bei GSM

Betrachten wir zunächst die GSM–Sprachübertragung, also den oberen Zweig der Grafik:

Die Datenrate eines auf $4\ \rm kHz$ begrenzten PCM–Sprachsignals ergibt sich bei Abtastung mit $8\ \rm kHz$ und Quantisierung mit $13\ \rm Bit$ zu $104 \ \rm kbit/s$. Durch die Sprachcodierung werden bei GSM für jeden $20\ \rm ms$–Rahmen genau $260\ \rm Bit$ extrahiert. Es wird also ein Bitstrom mit $13 \ \rm kbit/s$ erzeugt.

Aufgabe der gestrichelt eingezeichneten Voice Activity Detection ist es zu entscheiden, ob der aktuelle Sprachrahmen tatsächlich ein Sprachsignal enthält oder eine Sprachpause, während der die Leistung des Sendeverstärkers heruntergefahren werden kann.

Durch Kanalcodierung (CRC und Faltungscode) wird gezielt Redundanz hinzugefügt, um eine Fehlerkorrektur beim Empfänger zu ermöglichen. Dadurch erhöht sich die Brutto–Datenrate auf $22.8 \ \rm kbit/s$, wobei die wichtigeren Bits des Sprachcoders besonders geschützt werden.

Der Interleaver verwürfelt die Bitfolge des Kanalcoders und vermindert so den Einfluss von Bündelfehlern. Hierzu werden die $456$ Eingangsbit auf vier Zeitrahmen zu je $114\ \rm Bit$ aufgeteilt und verschachtelt. Aufeinanderfolgende Bits werden immer in acht verschiedenen Bursts übertragen.

Bei der GSM–Datenübertragung (unterer Zweig der Grafik) ist die Nutzdatenrate auf $9.6 \ \rm kbit/s$ beschränkt, um der Kanalcodierung mehr Raum zu geben. Hier ist die resultierende Coderate mit $192/456 = 0.421$ kleiner als im oberen Zweig $(260/456 = 0.57)$.

Auch das Interleaving ist für Daten anders organisiert als für Sprache. Einheitlich für beide Zweige ist aber die effektive Datenrate von $22.8 \ \rm kbit/s$ nach dem Interleaver. Die restliche Beschreibung gilt für Sprache und Daten gleichermaßen:

Nach dem Interleaving folgt die Verschlüsselung zum Zwecke der Authentifizierung der Teilnehmer und zur Sicherung der Funkschnittstelle gegenüber „Abhören”. UMTS bietet noch einige weitere Sicherheitsmaßnahmen.

Der nächste Block ist die Burstbildung: Die $456\ \rm Bit$ nach Kanalcodierung, Interleaving und Verschlüsselung werden durch Hinzufügen von Signalisierungsbits, Guard Period, usw. auf $625\ \rm Bit$ erweitert, die innerhalb von vier Zeitschlitzen $(4 \cdot T_{\rm Z})$ übertragen werden.

Daraus resultiert die Gesamtdatenrate von $625/(4 · 5769\ \rm µs) \approx 270.833 \ \rm kbit/s$, so dass für jeden der acht per TDMA verschalteten GSM–Nutzer eine Bruttodatenrate von etwa $33.854 \ \rm kbit/s$ zur Verfügung steht.
Bei Sprachübertragung sind davon allerdings nur $38.5\%$ Nutzdaten und bei der Datenübertragung sogar nur $28.4\%$.

Ein wesentlicher Unterschied zwischen GSM und UMTS sind die unterschiedlichen Modulations– und Vielfachzugriffsverfahren:

Bei GSM Gaussian Minimum Shift Keying (GMSK) zusammen mit FDMA und TDMA,
bei UMTS Quaternary Phase Shift Keying sowie CDMA und TDMA.

Hierauf wird in den Kapiteln Systemarchitektur und Basiseinheiten von GSM bzw. Anforderungen an Mobilfunksysteme der dritten Generation noch genauer eingegangen. Weiter ist noch zu beachten:

Das auf CDMA basierende UMTS ist durch die Chiprate von $R_{\rm C} = 3.84 \ \rm Mchip/s$ gekennzeichnet, woraus die Bitrate $R_{\rm B} = R_{\rm C}/J$ gemäß dem gewählten Spreizfaktor $J$ berechnet werden kann.
Mit $J = 4$, ... , $512$ ergeben sich Bruttodatenraten zwischen $7.5 \ \rm kbit/s$ und $960 \ \rm kbit/s$, die abhängig von den aktuellen Kanalbedingungen ausgewählt werden.

Aufgrund der verschiedenartigen Übertragungstechnik ist bei UMTS der Block „Burstbildung” anders organisiert. Diese basiert auf dem Transmission Time Interval (TTI). Ein solches TTI hatte in der ursprünglichen UMTS–Spezifikation eine Dauer zwischen $10\ \rm ms$ und $80\ \rm ms$.

Um den Zeitverlust bei den erforderlichen Blockwiederholungen bei schlechten Kanalbedingungen zu verringern, wurde dieser TTI–Wert in späteren Releases bis auf $2\ \rm ms$ (für HSDPA) herabgesetzt.

$\text{Fazit:}$ Bei GSM und UMTS sind insbesonderefolgende Probleme gemeinsam zu lösen:

eine geeignete Kanalschätzung und Rückmeldung an den Sender,
eine funktionierende Trägerphasen– und Systemtakterkennung,
die Rahmensynchronisation.

Geläufige Sprachcodierverfahren

Für die GSM–Sprachübertragung steht jedem Teilnehmer nur eine Netto–Datenrate von $13\ \rm kbit/s$ zur Verfügung $($mit Kanalcodierung $22.8\ \rm kbit/s)$, während die PCM–Übertragung mit $8\ \rm kHz$ Abtastung und $13\ \rm Bit$ Quantisierung eine Datenrate von $104\ \rm kbit/s$ erfordern würde.

Um das Abtasttheorem mit einer gewissen Toleranz einzuhalten, wird das Audiosignal durch Filterung auf den Frequenzbereich von $300\ \rm Hz$ bis $3.4\ \rm kHz$ begrenzt.

Die nötige Komprimierung um den Faktor $8$ ist Aufgabe der Sprachcodierung (hierunter versteht man eine Sonderform der Quellencodierung), wofür in den 1990er Jahren mehrere Standards definiert wurden:

Der GSM Fullrate Vocoder (zu deutsch: GSM–Vollraten–Sprachcoder) basiert auf den drei Kompressionsverfahren LPC (Linear Predictive Coding), LTP (Long Term Prediction) und RPE (Regular Pulse Excitation). Dieser Coder extrahiert aus jedem $20\ \rm ms$–Sprachrahmen $74$ Parameter mit einem Gesamtumfang von $260\ \rm Bit$, woraus sich die Datenrate $13\ \rm kbit/s$ ergibt. Beim Empfänger muss aus diesen $260\ \rm Bit$ das Sprachsignal wieder synthetisiert werden.

Der GSM Halfrate Vocoder (deutsch: GSM–Halbraten–Sprachcoder) wurde 1994 spezifiziert und bietet die Möglichkeit, ein auf $4\ \rm kHz$ bandbegrenztes Audiosignal bei nahezu gleicher Qualität in einem halben Verkehrskanal zu übertragen. Heutzutage spielt dieser Sprachcodec nur noch eine untergeordnete Rolle.

Der Enhanced Fullrate Codec (kurz EFR–Codec) wurde 1995 für das US–amerikanische DCS 1900–System entwickelt. Er arbeitet nach dem Codierungsverfahren Algebraic Code Excited Linear Prediction (ACELP) und bietet gegenüber dem herkömmlichen Fullrate–Codec aufgrund des ACELP–Prinzips und wegen der verbesserten Fehlererkennung und –verschleierung eine deutlich höhere Sprachqualität.

Aus dem ACELP–Blockschaltbild im Buch „Beispiele von Nachrichtensystemen” erkennt man

die Segmentierung des digitalisierten Sprachsignals in Rahmen und Subblöcke,
die LPC–Analyse durch ein digitales Filter $A(z)$ im rot hinterlegten Block,
die Langzeitprädiktion (LTP) mit Hilfe des adaptiven Codebuchs (blau umrahmt), und
die Suche nach dem besten Eintrag im festen Codebuch (grün hervorgehoben).

Im Kapitel Verschiedene Sprachcodierverfahren des Buches „Beispiele von Nachrichtensystemen” wird unter anderem der EFR–Codec im Detail beschrieben. Die Datenrate von $12.2 \ \rm kbit/s$ ist identisch mit dem höchsten Modus des AMR–Codecs, der auf der nächsten Seite kurz vorgestellt wird.

Adaptive Multi–Rate Codec

Der aufgrund seiner Flexibilität am weitesten verbreitete Sprachcoder ist der AMR–Codec (Adaptive Multi–Rate), der niederfrequente Signale $($im Frequenzbereich zwischen $300\ \rm Hz$ und $3.4\ \rm kHz)$ nach dem ACELP–Prinzip verarbeitet. Dieser Codierer stellt acht verschiedene Modi zur Verfügung mit Datenraten

Modi des AMR– und des Wideband–AMR–Codecs

zwischen $12.2\ \rm kbit/s$ $(244 \ \rm Bit$ pro $20\ \rm ms$–Sprachrahmen$)$
und $4.75\ \rm kbit/s$ $(95 \ \rm Bit$ pro Sprachrahmen$)$.

Drei Modi spielen eine Sonderrolle (in der ersten Zeile der Tabelle dunkler hinterlegt), nämlich

$12.2 \ \rm kbit/s$ – der verbesserte GSM–Vollraten–Codec (EFR–Codec),
$7.4 \ \rm kbit/s$ – Kompression nach dem US–amerikanischen Standard IS–641,
$6.7 \ \rm kbit/s$ – EFR–Sprachübertragung des japanischen PDC–Systems.

$\text{Fazit:}$ Der AMR–Codec zeichnet sich durch folgende Eigenschaften aus:

Er passt sich flexibel an die aktuellen Gegebenheiten des Funkkanals und an die jeweilige Netzauslastung an,

indem er entweder im Vollraten–Modus $($höhere Sprachqualität ⇒ Modus $\ge 7.4 \ \rm kbit/s)$
oder im Halbraten–Modus $($also mit geringerer Datenrate ⇒ Modus $\le 6.7 \ \rm kbit/s)$ arbeitet.

Daneben gibt es noch etliche Zwischenstufen.

Der AMR–Codec bietet sowohl für den Vollraten– als auch für den Halbratenverkehrskanal eine verbesserte Sprachqualität.
Dies ist insbesondere auf die flexibel handhabbare Aufteilung der verfügbaren Brutto–Kanaldatenrate zwischen Sprach– und Kanalcodierung zurückzuführen.

Der AMR–Codec wird bei GSM und UMTS in gleicher Weise eingesetzt.

Ausschließlich bei UMTS Anwendung findet dagegen der Wideband–AMR (W–AMR) für breitbandigere Signale zwischen $50\ \rm Hz$ und $7\ \rm kHz$.
Die Abtastung erfolgt hier mit $16\ \rm kHz$ und die Quantisierung mit $14 \ \rm Bit$.
Die neun definierten Modi des W–AMR sind in der unteren Zeile der obigen Tabelle angegeben, die häufiger genutzten sind wieder dunkel hinterlegt.

Das interaktive Applet Qualität verschiedener Sprachcodecs demonstriert akustisch die erreichbare Sprachqualität der hier beschriebenen Sprachcodecs.