>>> Inhaltsverzeichnis

4. Codecs und Sprachqualität

4.1. VoIP - relevante Codecs

Vor der Übertragung per Internet Protokoll müssen die Sprachdaten in ein möglichst ressourcenschonendes Format konvertiert werden. Die Daten sollten dabei so klein wie möglich sein, ohne dass die Sprachqualität zu stark darunter leidet. Dazu stehen verschiedene Algorithmen zur Verfügung: die Codecs. Jeder Codec hat unterschiedliche Eigenschaften, wie z.B. benötigte Rechenleistung, Komprimierungsgrad, Sprachqualität, Fehlstelleninterpolation (durch Paketverlust) und Verzögerung.

Codec

Bezeichnung

Netzwerkbelastung

Verzögerung

Sprachqualität

G.711 PCM

Pulse Code Modulation

56 / 65kbit/s

0.125 ms

ISDN

G.726 ADPCM

Adaptive Differential Pulse Code Modulation

16, 24, 32, 40 kbit/s

1 ms

ISDN

G.728 LD-CELP

Low Delay Code Excited Linear Prediction

16 kbit/s

4 ms

nahe ISDN

G.729 CS-ACELP

Conjugate Structure Agebraic Code Excited Linear Prediction

8 kbit/s

15ms

gut

G.723.1 MPMLQ

Multiple Maximum Likelihood Quantization

6.3kbit/s

47.5

befriedigend

G.723 ACELP

Algebraic Code Exicted Linear Prediction

5.3kbit/s

%

befriedigend

In den meisten VoIP - Anwendungen wird der G.729 - Codec verwendet, der über ein ausgesprochen gute Sprachqualität bei geringer Netzbelastung verfügt. Der Nutzdatenstrom umfasst bei diesem Codec zusammen mit den Headern ca. 10kbit/s pro Sprachverbindung.

4.2. Sprachqualität

4.2.1. Verzögerung

Insbesondere die Verzögerung spielt bei der Qualitätsbestimmung von VoIP - Verbindung eine große Rolle. Ist sie zu groß, benötigt ein Gespräch große Aufmerksamkeit, damit sich die Gesprächspartner nicht ins Wort fallen. Erfahrungsgemäß sind Verzögerungen bis ca. 0.5s erträglich. Alles was darüber liegt, wirkt sich negativ auf den Gesprächsfluss aus. Bei der Verzögerung spielen aber nicht nur die Codecs selbst eine Rolle, sondern auch das Übertragungsmedium. Die folgenden Tabellen geben einen Überblick über die sich aufaddierenden Verzögerungszeiten der verschiedenen Leitungen / Leitungsarten.

Transportartbedingte Verzögerung:

Übertragungsart

Verzögerung

10 Mbps Ethernet

0.18 ms

T1 - Line

1.1 ms

512 kbps

3.2 ms

64 kbps

25.8 ms

ADSL (640kbps)

3.3 ms

Transportmediumbedingte Verzögerung:

Medium

Verzögerung

Coax - Kabel

0.004 ms x Länge ( in km)

optisches Fiberglas

0.005 ms x Länge ( in km)

Coax - Kabel (Unterwasser)

0.006 ms x Länge ( in km)

Satellit in ca. 14.000km Höhe

110 ms

Satellit in ca. 36.000km Höhe

260 ms

Um Übertragungszeiten in Netzwerken niedrig zu halten, gibt es Mechanismen, die den Datentransport für RTP- Daten beschleunigen. Hierbei wird den Paketen eine hohe Priorität zugewiesen (Priorisierungsmechanismen), die so von Routern und Switches bevorzugt behandelt werden. 

Eine konkrete Realisierung eines solchen Mechanismus ist die Nutzung des ToS - Feldes in allen IP - Paketen, die im Netzwerk übertragenen werden. Das ToS - Feld definiert die Art der Dienstleistung ("Type of Service"), die mit den Paketen erfüllt werden soll. Das ToS - Feld besteht aus 8 Bit, die sich wie folgt aufschlüsseln:

0

Bit 0 -2 ergeben die Prioritätsstufe von 0 (normal) bis 7 (hoch)

1

2

3

Bit 3 gibt die Verzögerunganfordeungen an (1 = schneller Transport, 0 = normal))

4

Bit 4 gibt den zu erwartenden Datendurchsatz an ( 1 = hoch, 0 = niedrig)

5

Bit 5 enthält eine Zuverlässigkeitsforderung ( 1 = hoch, 0 = normal)

6

%

7

Darauf aufbauend kann das Netzwerk mit weiteren "Quality-of-Service" - Mechanismen für Sprachübertragung optimiert werden. So z.B. kann das Netzwerk ständig überwacht werden um die Verfügbarkeit einer genügend großen Bandbreite sicherzustellen. Gegebenenfalls muss der Verkehr eingeschränkt werden. Diese Funktionalität  kann über das Ressource Reservation - Protokoll (RSVP) realisiert werden. 

4.2.2 Jitter - Buffer

Bei der Übertragung von Sprachdaten mit dem Internet Protokoll kann kein kontinuierlicher Datenstrom garantiert werden. Einzelne Pakete können innerhalb des IP - Netzwerks unterschiedliche Wege gehen, wodurch die Pakete nicht immer in der richtigen chronologischen Reihenfolge ankommen. Deshalb muss der Datenempfang einen gewissen Vorlauf haben, damit ungeordnete Datenpakete vor dem Abspielen geordnet werden können. Diese Unregelmäßigkeiten bei der Übertragung von Sprachdaten heißen "Jitter". Um den benötigten Vorlauf des Datenempfangs zu gewährleisten, werden alle Pakete zunächst in einen "Jitter - Buffer" gesammelt und dort wieder in die richtige Reihenfolge gebracht.

Abb.3 Funktionsweise des Jitter - Buffer

4.2.3. Echo - Unterdrückung

Überall wo analoge Technik beim Telefonieren zum Einsatz kommt, kann es zur Entstehung eines Echos in der Leitung kommen. Ist dieses Echo unter 25ms wird es noch nicht als kritisch zu erachten. Ist es jedoch länger, dann hört sich einer der Gesprächspartner zeitversetzt selbst, was sehr leicht irritieren kann. Das Echo kann im Hörer eines analogen Telefons entstehen, bei der Übertragung von Sprachdaten über analoge Leitungen zum Gateway und auch beim Übergang von ISDN in ein analoges Telefonnetz. Eine gutes VoIP - System sollte deshalb die Soundqualität immer mit einem Digitalen Sound Prozessor (DSP) per Echokompensation verbessern. Der DSP ist idealerweise hardwareseitig. Er kann aber auch mit einer Software realisiert werden, die aber nicht so schnell und präzise wie eine Hardwarelösung arbeiten kann.

>>> Inhaltsverzeichnis