xHE-AAC Audiocodierung beim Satelliten-Radio

ID: 558230

xHE-AAC Audiocodierung beim Satelliten-Radio

08.Aug.21 18:49

4316

Dietmar Rudolph † 6.1.22 (D)
Beiträge: 2441
Anzahl Danke: 46

ARD Radio-Programme über Astra

Die Radio-Programme der öffentlich-rechtlichen Sender der Bundesrepublik Deutschland können bekanntlich auch über den Satelliten Astra empfangen werden. Bei den Empfangs-Parametern für diese Programme gibt es demnächst wesentliche Änderungen, was zur Folge hat, daß für den Radio-Hörer i.a. dafür ein neuer Satelliten-Tuner erforderlich wird. (Anmerkungen zur "Lebensdauer" von Rundfunk-Systemen)

Für die Sender ergibt die Änderung eine jährliche Einsparung von ca. 95 mio. € (für die Radio-Programme). Dafür müssen die Hörer mit Anschaffungs-Kosten von ca. 130 € für einen geeigneten Satelliten-Tuner rechnen. Ein solcher Tuner ermöglicht dann allerdings auch, die Fernsehprogramme in HD+ Qualität zu empfangen, weil diese Tuner sowohl die Radio- als auch die TV-Programme empfangen können.

Audio Codierung

Der Grund für die Änderung bezüglich der Radio-Programme besteht in der Anwendung eines weiterentwickleten und damit effektiveren Audio-Codierungs-Verfahrens mit der Bezeichnung "xHE-AAC".

Zur Audio-Codierung siehe auch "Audio-Verarbeitung im Rundfunk" und den darin enthaltenen .pdf Beitrag, Audio-Verarbeitung im Rundfunk (958 kB).

Wesentliche Entwicklungs-Schritte für dieses Verfahren stammen von der Fraunhofer Gesellschaft IIS in Erlangen, wo seit Jahren über Audio-Codierung geforscht wird.

Wie aus der Graphik zu sehen ist, gibt es die xHE-AAC Codierung schon seit 2012. Aber erst 2021 wird sie im Satelliten-Radio eingesetzt; in anderen Anwendungen, z.B. im Smartphone, allerdings schon viel früher.

xHE-AAC Definition der FHG IIS

Hintergrund

xHE-AAC (zusammengesetzt aus Extended HE-AAC und MPEG-D DRC) ist das jüngste Mitglied der MPEG AAC Codec-Familie und wurde hauptsächlich vom Fraunhofer IIS entwickelt. Der Codec vereint Sprach- und Audiocodierung und kann dadurch gleichbleibend hohe Audioqualität für alle Signaltypen (Sprache, Musik oder gemischte Inhalte) gewährleisten, beginnend bei niedrigen 6 kbit/s für Mono- bzw. 12 kbit/s für Stereosignale bis hin zu 500 kbit/s und mehr. Dies macht xHE-AAC zum Audiocodec der Wahl für Digitalradio und adaptive Streaming-Anwendungen. Für Digital Radio Mondiale (DRM) sowie in Googles Betriebssystem Android Pie wird xHE-AAC bereits standardmäßig verwendet.

Adaptives Streaming

xHE-AAC wurde von Anfang an für adaptives Streaming entwickelt: dank der Bitraten-Flexibilität können MPEG-DASH bzw. HLS-fähige Streaming-Apps sowie Streaming Radioplayer auf Übertragungen mit sehr niedriger Bitrate umschalten und ermöglichen dadurch auch unter schwierigen Netzwerkbedingungen eine unterbrechungsfreie Wiedergabe. Sobald die Netzwerkverbindung wieder besser ist, passt sich der xHE-AAC-Player mit einer höheren Bitrate an und schaltet nahtlos über die gesamte Bandbreite an Bitraten, bis hin zu transparenter Qualität. Darüber hinaus kann die eingesparte Bandbreite aufgrund der hervorragenden Codiereffizienz von xHE-AAC für eine Verbesserung der Videoqualität beim Videostreaming genutzt werden.

Lautstärkeregelung und Dynamikumfang

MPEG-D DRC (Loudness and Dynamic Range Control) bietet für xHE-AAC eine obligatorische Lautstärkeregelung, um Inhalte mit gleichbleibender Lautstärke wiederzugeben und bietet volle Kontrolle über den Dynamikumfang – für die bestmögliche Nutzererfahrung beim Hören auf jeder Plattform und in jeder Umgebung.

Kompatibilität von xHE-AAC

xHE-AAC decodiert problemlos die Signale anderer AAC-Codecs, wie etwa AAC-LC, HE-AAC und HE-AAC v2. xHE-AAC-Streams können einfach in bereits existierende Codierungs-Workflows integriert werden, indem bestehende Streams mit höherer Bitrate ergänzt werden.

xHE-AAC für DAB terrestrisch?

Das "Dilemma" bei DAB (Digital Audio Broadcast) besteht darin, daß dort eine früher entwickelte, weniger effektive Audio-Codierung verwendet wird, aber xHE-AAC auch hierfür geeignet wäre. Siehe hierzu: "Wann wird DAB+ zu DAB++".

Aber, ändert man jetzt die Audio-Codierung für DAB+ entsprechend, so könnten z.B. alle DAB+ Radios in neu verkauften Autos damit nichts mehr empfangen. Und auch alle anderen DAB+ Radios wären funktionslos.

Die "Strategie" einiger Broadcaster ist wohl deswegen die, daß zunächst UKW Radio (aus "Kostengründen") abgeschaltet werden muß. Dann kann niemand mehr auf UKW "ausweichen". Wenn es dann nur noch DAB+ Rundfunk gibt, kann man verhältnismäßig "einfach" auf DAB++ umsteigen. Und das dann auch wieder "aus Kostengründen", weil aufgrund der effektiveren xHE-AAC Audio-Codierung ca. doppelt so viele Programme in einem Frequenzblock unter gebracht werden können wie bei DAB+.

Advanced Audio Coding (AAC)

AAC ist die Abkürzung für "MPEG-4 Advanced Audio Coding (AAC)". AAC bezeichnet damit eine ganze "Familie" von Codecs, die "MPEG Dynamic Adaptive Streaming over HTTP (DASH)" verwenden.

Im Blockschaltbild Fig. 2.2 sind die Funktions-Blöcke der "Familien-Mitglieder" mit den Abkürzungen und deren Namen aufgelistet.

Die "Qualität" der akustischen Wiedergabe der codierten Audio-Signale wird in Hörversuchen mit zahlreichen Teilnehmern bestimmt. Das Ergebnis davon sind Kurven, die mit ansteigender Bit-Rate von "brauchbar" bis "vorzüglich" reichen. In der folgenden Graphik sind diese Kurven für "Audio-Signale" (i.W. Musik) als Funktion der Bitrate dargestellt.

Aus Fig. 4 ist erkennbar, daß der xHE-AAC Codec den früheren Codecs in Bezug auf Audio-Qualität (bei gleicher Bitrate) überlegen ist. (Für Bitraten größer 128 kbit/s sind dann alle "excellent".)

Hier in einer anderen Darstellung die subjektiv empfundene Qualität für die Wiedergabe von Musik (Audio-Qualität) für die Codecs der AAC "Familie".

xHE-AAC ist für Bit-Raten größer 32 bit/s "gut" bis "excellent" in der subjektiven Qualitäts-Empfindung.

Sprach-Codierung

Für synthetische Sprache, z.B. für Telephonie im Handy, ist ein "linear predictive" (LPC) Audio-Codierverfahren (z.B. GSM–Vollraten-Codec: Full Rate Vocoder) entwickelt worden, das allerdings Musik nur unzulänglich wiedergeben kann.

Linear Predictive Coding (LPC) ist ein Transformationsverfahren, das in der Sprach-Kompression von Mobilfunksystemen eingesetzt wird. Das Verfahren arbeitet mit Filtertechniken und filtert aus einem Signalgemisch sprachrelevante Komponenten wie die Sprachgrundfrequenz, Lautstärke und Stimmhaftigkeit heraus. Nur die daraus gewonnenen Steuer-Signale werden übertragen. Damit erzeugt dann der Vocoder des Empfangs-Gerätes "künstliche Sprache", die "natürlich" klingt.

Erst der HE-AAC-v2 Codec und besser noch der xHE-AAC Codec sind in der Lage, auch (synthetische) Sprache in angemessener Qualität (bei niedrigen Bitraten) wiederzugeben.

Blockstruktur des xHE-AAC Audio Codecs

In der Figur 1 ist links a) der Encoder (auf der Sender-Seite) und rechts b) der Decoder (auf der Empfänger-Seite) zu sehen.

Der Encoder erhält die Eingangs-Signale als PCM (Puls-Code-Modulation) Daten für "Links" und "Rechts".
Er gewinnt daraus ein Stereo-Signal, das räumliche Informationen enthält (Spacial Stereo Encoder). Dieses digitale Signal wird einer Daten-Reduktion unterzogen (Downmix).
Mit Hilfe eines Tiefpaß-Filters (LP: Low Pass) und eines Hochpaß-Filters (HP: High Pass) wird der Datenstrom in die beiden Teile für tiefe NF-Frequenzen (Low Frequencies) und für hohe NF-Frequenzen (High Frequencies) aufgespalten.
Die tiefen NF-Frequenzen werden im Kern-Codierer (Core Encoder) aufbereitet. Dieser "Core Encoder" enthält die für den xHE-AAC Audio-Codec entscheidende Signal-Verarbeitung.
Die hohen NF-Frequenzen werden im Bandbreiten-Erweiterungs-Codierer (Bandwidth Extension Encoder) verarbeitet (→SBR). Hierbei kommt eine wesentliche Eigenschaft des Gehörs zum Tragen. Für höhere NF-Frequenzen kann gehörmäßig die physikalisch exakte Frequenz nicht mehr bestimmt werden. Das ist eine Eigenschaft der Basilar-Membran im Ohr. Statt der physikalisch exakten NF-Frequenz genügt es daher, pro Frequenz-Intervall die Information für einen Ton in der Mitte des jeweiligen Intervalls zu übermitteln. Aber nicht für alle Frequenz-Intervalle muß tatsächlich ein entsprechender Ton gesendet werden, weil durch den Verdeckungs-Effekt manche davon "unhörbar" bleiben, weil sie von benachbarten lauteren Tönen verdeckt (maskiert) werden. Das führt auf eine Daten-Reduktion für die Übertragung.

Im Decoder werden die entsprechenden Funktions-Blöcke "in umgekehrter Richtung" durchlaufen.

Der Kern-Decoder

Der empfangs-seitige Kern-Decoder ist weniger komplex als der Kern-Encoder. Bei der ITU gibt es nur für diesen Vorgaben, wie er zu funktionieren hat. Für den Kern-Encoder hingegen gibt es keine Vorgaben. Jede Firma, die einen Encoder bauen will, muß diesen selbst "erfinden". Daher sind entsprechende Lösungen Firmen-Geheimnisse und werden nicht publiziert. Folglich findet man nur ein Blockschaltbild für den Kern-Decoder, Fig. 2.

Der Kern-Decoder in Fig. 2. ist "rosa-farben" unterlegt. Er enthält zwei Decodierungs-Algorithmen zwischen denen umgeschaltet wird. Für "Audio-Signale", wie z.B. Musik, wird gemäß AAC decodiert, während für "Sprach-Signale" gemäß ACELP decodiert wird.

ACELP

ACELP ist "Algebraic CELP", also eine Weiterentwicklung von CELP und damit von LPC für Sprachcodierung.

Code Excited Linear Prediction (CELP) ist ein hybrides Verfahren der Sprachkompression, das die Vorteile der Signalformcodierung mit denen der parametrischen Codierung vereint. Es kombiniert Pulscodemodulation (PCM) mit Parametric Stereo (PS), wie der Linear Predictive Coding (LPC). CELP zeichnet sich durch eine gute Sprachqualität aus, vergleichbar mit der Pulscodemodulation (PCM), hat allerdings eine geringere Datenrate im Vergleich zur Pulscodemodulation (PCM) oder zur adaptiven Delta-Pulscodemodulation (ADPCM). Ein hybrider Vocoder basierend auf CELP hat bedingt durch die doppelte Codierung eine wesentlich höhere Komplexität.

Ankündigung der ARD

Zukünftig neues Hörfunkangebot

Das umfangreiche Hörfunkangebot der ARD wird ab dem 20. Juli 2021 über ASTRA 19,2° Ost auf den Transpondern 39 und 61 im modernen Audioformat AAC-LC (Advanced Audio Codec – Low Complexity) verbreitet:

Bayerischer Rundfunk, Norddeutscher Rundfunk, Radio Bremen, Saarländischer Rundfunk, Südwestrundfunk, Westdeutscher Rundfunk
Transponder 39 / Downlink-Frequenz (GHz): 11,053
Polarisation: horizontal / Symbolrate (MSym/s): 22,000 / Fehlerschutz (FEC): 2/3

Hessischer Rundfunk, Mitteldeutscher Rundfunk, Rundfunk Berlin-Brandenburg
Transponder 61 / Downlink-Frequenz (GHz): 10,891
Polarisation: horizontal / Symbolrate (MSym/s): 22,000 / Fehlerschutz (FEC): 2/3

Der Audiostandard AAC-LC ist Bestandteil des DVB-S2-Standards und benötigt bei gleicher Klangqualität weniger Datenrate und erlaubt so eine effizientere und kostengünstigere Verbreitung.

Das bisherige Hörfunkangebot der ARD über Astra läuft noch bis Jahresende 2021.

Änderungen der Satelliten-Empfangsanlage

Satelliten-Empfänger sind immer für Fernsehen und Hörfunk ausgelegt. Hier wird nur auf die notwendige Änderung für den Hörfunk eingegangen.

Nicht ersetzt werden müssen die "Schüssel" und der bzw. die LNBs. Auch braucht die Schüssel nicht neu ausgerichtet zu werden.

Ersetzt werden muß aktuell "nur" der Satelliten-Tuner.

Vor ein paar Jahren war schon einmal ein neuer Sat-Tuner erforderlich, als die Schweizer Radiosender über Eutelsat / Hotbird ihre Modulations-Art von 4PSK auf 8PSK geändert haben. Dafür hatte TechniSat mit dem "Technistar S1+" einen geeigneten Sat-Empfänger.

Zum Empfang der Schweizer Satelliten-Radios auf Hotbird ist dieses Gerät bis auf weiteres brauchbar.

Frequenzbereich : 950 ... 2150 MHz
Viterbiraten : 1/2, 2/3, 3/4, 5/6, 7/8 , (autom. Anpassung)
DVB-S : QPSK
Symbolrate DVB-S : 2 ... 45 Mbaud
DVB-S2 : 8PSK - QPSK
Symbolrate DVB-S2 : 10 ... 31 Mbaud
FEC : RS, LDPC, BCH

UNTERSTÜTZTE FORMATE & CODECS
MPEG-2 : Ja
Video-Formate : TS4, TS, VOB
JPEG : Ja
Audio-Formate : MP2, MP3

Der Technistar S1+ kann die Modulation "DVB-S2" verarbeiten, jedoch nur die Audio-Formate MP2 & MP3. Deswegen mußte er ersetzt werden.

Als Ersatz bot sich der "Technistar S6 HD+" an.

Das Gerät ist etwas kleiner als der S1+, kann dafür aber wesentlich mehr als jener.

UNTERSTÜTZTE FORMATE & CODECS
Video-Codecs : MPEG-2, MPEG-4, H.264, VC-1
Video-Formate : M4V, MP4, MKV, MOV,
MPG, TS, TS4, XVID, M2TS, AVI, ASF
Bild-Formate : BMP, JPEG, GIF, PNG, TIFF
Audio-Formate : AAC, MP3, FLAC, MP2, OGG, DDAC3, AIFF

Wie man sieht, gibt es zwar (fast) keinen Unterschied bei den unterstützten Modulationsarten zwischen den Tunern S1+ und S6 HD+, jedoch bei den verarbeitbaren Audio-Formaten.

Der einzige kleine "Schwachpunkt" des Technisat S6 HD+ besteht darin, daß seine Anschluß-Möglichkeit für einen "alten, analogen" Verstärker nur noch in einer 3mm Kombi-Buchse besteht. Man benötigt dafür dann einen Adapter (von Technisat), der das Audio-Signal über 2 Chinch Stecker (in Stereo) ausgibt und der zusätzlich noch einen weiteren Chinch Stecker für das Video-Signal bereit stellt.
(Digitale Ausgänge hat das Gerät mehrere. Aber man will ja nicht gleich die gesamte vorhandene Stereo-Anlage ersetzen!)
Ein "Schönheits-Fehler" des Technisat S6 HD+ besteht darin, daß (bei Radio-Empfang) der gelbe Balken, der den zeitlichen Fortschritt der einzelnen Sendung anzeigt, bereits beim zweiten Musikstück nicht mehr diesen Fortschritt anzeigt, sondern stehen bleibt. Das ist mit ziemlicher Sicherheit ein Programmierfehler der Software. (Man kann nur hoffen, daß bald ein Update verfügbar sein wird, das diesen Fehler behebt.)
Update: Der Fehler läßt sich beheben, wenn die Nummer des betreffenden Programms nochmals direkt über die Zifferntaste angewählt wird.
Gegenüber dem S1+ hat man beim S6 HD+ auch die Laufschrift "vereinfacht", die den Programm-Inhalt anzeigt. Beim S1+ gab es immerhin noch 2 Laufschriften, wobei eine davon sogar in der Lage war, Sonderzeichen darzustellen!
Update: Aufrund der 8PSK Modulation kommt es zur Stummschaltung, wenn ein "dickeres" Regengebiet die freie Sicht zum Satelliten "versperrt". Das ist meist wenige Minuten ehe ein Platzregen beginnt. Der Pegel des Empfangssignals ist dabei nach wie vor ausreichend hoch, jedoch zeigt die "Qualität" des Signals den Wert "0". Dieser Effekt tritt genau so auch für den Empfang über den Satelliten "Hot Bird /Eutelsat" auf und kann dann für die Programme des Schweizer Radios in der gleichen Art festgestellt werden. Mit der "alten" 4PSK/QPSK Modulation gab es keine derartigen Probleme, weil diese Modulation "robuster" ist.

Beide Sat-Tuner können problemlos durch Abschalten der Stomversorgung ausgeschaltet werden. Nach dem Wiedereinschalten "erwachen" sie wieder (nach ca. 40 sec) in dem Zustand vor dem Abschalten.

Hörtests

Hörtests sind subjektiv. Man muß sich auf einzelne Sender bzw. Programme beschränken.

Programm "Bayern 4 Klassik"
Vergleich von "alt Bayern 4 Klassik" im bisherigen Format (DVB-S: QPSK, MPEG2) mit "Bayern 4 Klassik" (DVB-S2: 8PSK, AAC): Im "A-B" Vergleich ist kein Unterschied wahrnehmbar.
Programm "Swiss Classik" (DVB-S2: 8PSK, MPEG2)
Kein wahrnehmbarer Unterschied zu "Bayern 4 Klassik" im neuen Format.

Der Technisat S6 HD+ ist somit (auch für eine ältere Stereo-Anlage) ein vollwertiger "Ersatz" in Bezug auf Satelliten-Radio.

Für diesen Post bedanken, weil hilfreich und/oder fachlich fundiert.