mp3 - Weblearn

Werbung
MP3 – Kompression von Audio-Daten
Übersicht
MP3-Kompression
von Audio-Daten
Grundlagen, Techniken und praktische Anwendung
MP3 – Kompression von Audio-Daten
Übersicht
1. Übersicht
1.1 Einleitung
Der Aufstieg des Menschen von der Steinzeit bis zur Gegenwart ist durch einige
hundert bahnbrechende Erfindungen gekennzeichnet. Manche von ihnen haben die
Welt und die Gesellschaft verändert; manche von ihnen haben unsere Zivilisation
überhaupt erst ermöglicht. Die Erfindungen haben nicht nur das menschliche Leben
leichter gemacht, sondern auch soziale Wandlungen hervorgerufen, die niemand
voraussehen konnte.
Besonders spektakulär verlief die Entwicklung auf dem Gebiet der Unterhaltungsund Informationstechnologien. In den letzten Jahrzehnten wurden Meilensteine auf
dem Weg in die Zukunft gesetzt. Dazu zählt die Erfindung des Tonfilms, des
Fernsehens, des Computers und der Videotechnik. Nach dem Farbfernsehgerät und
dem CD-Player, die aus dem modernen Leben nicht mehr wegzudenken sind, ist
aber eine gewisse Stagnation in der Entwicklung der Unterhaltungselektronik
eingetreten. Der Markt ist überfüllt mit neuen Technologien wie dem DAT (Digital
Audio Tape, magnetische Bandkassette für Tonaufnahme und –wiedergabe), der
Mini-Disc, der DCC (Digital Compact Cassette), dem Dolby-Surround-Sound oder der
DVD (Digital Versatile Disc). Die Verkaufszahlen dieser Neuheiten sind nicht
überragend, die Produkte stellen durchaus keine Revolution dar. Der Markt sucht
daher intensiv nach einer „Killer-Applikation“, nach einer echten Innovation. In den
Köpfen der Techniker entstehen schon neue, absatzträchtige Ideen.
Eine der neuesten, wirklich großen Entwicklungen in den letzten Jahren ist die
Datenkompression - für die erfolgreiche Vermarktung ist in der Unterhaltungselektronik besonders eine Video- und Audiocodierung vonnöten. Tatsächlich ist es
heute möglich, sowohl Bilder und Videos als auch Klänge zu komprimieren, das
heißt, sie extrem platzsparend zu speichern. Berechnet man die Datenmenge von
einer Stunde Video, kommt man auf einen Speicherplatzbedarf von ca. 38.000
MegaByte (MB) oder auch 38 GigaByte (GB). Zur Zeit übliche Festplatten bieten
jedoch nur ca. 10 GB, CD-ROMs gar nur 650 MB. Eine Komprimierung ist daher
oberstes Gebot.
MP3 – Kompression von Audio-Daten
Übersicht
Primär wird also in der Videokomprimierung eine möglichst geringe Speicherplatzbelastung angestrebt. Bei der Komprimierung von Audio-Daten kommt es nicht
nur auf das Einsparen von Datenträgerkapazitäten an, sondern auch auf das
Erhalten einer möglichst hohen Klangqualität. Das menschliche Gehör ist nämlich bei
Störungen im Audiobereich empfindsamer, als es das Auge beim Wahrnehmen von
visuellen Reizen ist. Das heißt also, kurzzeitiges Rauschen und Knacken ist für die
menschlichen Sinne störender als zum Beispiel ein Flimmern. Daher sind die
Technik und der Erfindergeist bemüht, diesen Anforderungen der Sinne gerecht zu
werden und eine optimale, der CD vergleichbare Tonqualität bei der Kompression zu
erzielen.
Ein weiterer Vorteil der Audiokompression ist zweifellos, dass sich ein Musikstück,
das nur einige wenige MB groß ist, gut über das Internet verteilen lässt. Das Internet
wird somit zu einem neuen Vertriebskanal. Leider nutzen auch viele Internet-User die
neuen Möglichkeiten dazu, Musiktitel illegal zum Download bereitzustellen, es gibt
aber auch schon Modelle von Plattenfirmen, die zum Beispiel Testversionen von
Songs anbieten, die etwa eine Minute lang sind. Wenn das Lied Gefallen findet, kann
man die entsprechende CD gleich online bestellen.
Auch die Software-Branche profitiert von den neuen Verfahren. Mulimedia-Lexika wie
Microsoft Encarta oder Bertelsmann InfoROM verwenden oft kurze Sound-Samples,
beispielsweise berühmte Reden von Politikern oder Ausschnitte aus Musikstücken
bekannter Komponisten. Bisher wurde, um die umfangreichen Sounddaten auf der
CD unterzubringen, einfach die Sample-Rate verringert und damit die Qualität
beeinträchtigt. Auch viele Spiele verwenden CD-Audio-Tracks, die nicht selten einen
Großteil, manchmal bis zu 80%, Speicherplatz auf dem CD-Datenträger belegen. Mit
dem Komprimieren dieser Musik wird der Bedarf maßgeblich reduziert. Den
Entwicklern bleibt so mehr Platz für andere Elemente des Spiels wie neue Levels
oder aufwendigere Grafiken.
Auch im Hörfunk-Bereich stehen die Tore offen für neue Ideen: Internet-Radio ist
eine bereits realisierte Anwendung von Audio-Kompressionsverfahren. Dabei senden
Radio-Stationen auswählbare Rundfunkprogramme, die kostenlos gehört werden
MP3 – Kompression von Audio-Daten
Übersicht
können, direkt ins Netz. Eine Komprimierung ist auf Grund der limitierten Datentransfergeschwindigkeit des Internet hier unerlässlich.
Es gibt also viele Gründe, die für Datenkompression sprechen. Die Unterhaltungsindustrie präsentiert der Musikbranche den zukünftigen De-facto-Standard: MP3.
1.2 Definition – Was ist MP3?
Das Kürzel MP3 steht eigentlich für MPEG/Audio Layer-3. Damit bezeichnet man ein
Verfahren zur Kompression, also zur Verdichtung von Audio-Daten. Ein Ziel bei der
Entwicklung des MP3-Standards war die Verringerung der Datenmenge von
Audiosignalen unter Beibehaltung der ursprünglichen Klangqualität.
Mit der Komprimierung von Multimedia-Daten beschäftigt sich ein Team der
„International Standards Organisation“ (ISO), dem internationalen Pendant zur DIN,
dem es um Qualitätssicherung und Standardisierung geht, und der IEC, der
„International Electro-Technical Commission“. Der Name dieses Teams ist „Moving
Picture Experts Group“, kurz MPEG. Hauptsächlich ist das Ziel der MPEG die
Videokomprimierung, der Audio-Part wurde in diesem Fall einer anderen Kompetenz
übergeben.
Nach jahrelanger Entwicklungszeit stellte diese Gruppe nach anderen AudioKomprimierungs-algorithmen auch den MP3-Standard vor. Dieser große Schritt
gelang Ende des Jahres 1997 dem Fraunhofer Institut für Integrierte Schaltungen
(IIS) in Erlangen in der Bundesrepublik Deutschland. Als Vater des Verfahrens gilt
Ing. Dr. Karlheinz Brandenburg, Abteilungsleiter des Bereichs Audiotechnik und
Multimedia beim Fraunhofer Institut. Bereits zehn Jahre vorher begannen die
Arbeiten
an
Audio-Kompressionsverfahren
im
Rahmen
eines
Projekts
der
Europäischen Union, des EUREKA-Projekts für digitale Audiodatenübertragung.
Durch eine Kooperation mit der Universität Erlangen gelang es dem IIS schließlich,
einen mächtigen Algorithmus auszuarbeiten, der von der International Standards
Organisation als ISO-MPEG Audio Layer-3 standardisiert wurde.
MP3 – Kompression von Audio-Daten
Übersicht
Der Layer-3 entstammt der MPEG-1-Audio-Familie. Das Fraunhofer IIS hat
nacheinander drei Systeme der Audiokomprimierung entwickelt. Diese Systeme
werden einfach mit Layer-1, Layer-2 und Layer-3 bezeichnet. Die drei Layers
unterscheiden sich durch ihre Komplexität und die ansteigende Soundqualität. Der
Layer-3, im folgenden mit MP3 abgekürzt, wurde für verschiedene einstellbare
Qualitäten und Komprimierungsverhältnisse zugeschnitten.
Verfahren
Kompressions
-Rate
Anwendungsbereiche
Originaldaten
-
Audio-CD
Layer-1
1:4
Digital Compact Cassette (DCC)
Layer-2
1:6 – 1:8
Digital Audio Broadcast (DAB), CD-I, DVD
Layer-3
1:12
Internet Radio, Satellitenradio, Heimgebrauch
Die nächste Tabelle gibt Auskunft über die typischen mit Layer-3 erreichbaren Raten.
Klangqualität
Modus
Bitrate
Komprimierungsfaktor
Telefon
Mono
8 kbps
1:96
Besser als Kurzwelle
Mono
16 kbps
1:48
Besser als Mittelwelle
Mono
32 kbps
1:24
Ähnlich wie UKW
Stereo
56-64 kbps
1:24
Fast CD
Stereo
96 kbps
1:16
Subjektiv wie CD
Stereo
112 kbps
1:14
CD-Qualität
Stereo
128 kbps
1:12
Auf einer herkömmlichen Audio-CD beispielsweise ist Platz für 74 Minuten Musik.
Speichert man die einzelnen Titel mit Hilfe eines Programmes, das in der Lage ist,
diese 1:1 auf die Festplatte auszulesen, CD-Ripper genannt, oder mittels des
Windows-Soundrecorders (sndrec32.exe) auf die Festplatte, benötigt man dafür ca.
650 MB Speicherplatz. Da eine solche Belastung der Festplatte indiskutabel ist,
empfiehlt es sich, einen sogenannten MP3-Encoder anzuwenden. Vergleicht man
das Resultat, ist eine Komprimierung von 1:12 bei CD-Qualität ersichtlich. Ein
MP3 – Kompression von Audio-Daten
Übersicht
Musiktitel mit einer Länge von 5 Minuten belegt also nicht mehr 50, sondern nur
mehr knapp 5 Megabyte. Auf eine CD-ROM passen demnach mehr als 10 Stunden
Musik, ohne dass sich diese merklich vom unreduzierten Original unterscheidet. Ein
Nachteil bei einer solchen CD-ROM ist, dass man die Musik weder im heimischen
CD-Player im Wohnzimmer, noch im transportablen Discman genießen kann; dies
wird erst am Computer durch ein spezielles Player- (Abspiel)programm möglich.
1.3 Rechtliches
Die
eigentlichen
Leidtragenden
der
neuen
Audiokompressionsverfahren,
im
Besonderen MP3, sind die Inhaber der Rechte an komprimierten Musikstücken. Sie
müssen tatenlos zusehen, wie Anwender Musiktitel von CDs auf die Festplatte
speichern, mit einem MP3-Encoder in MP3-Dateien umwandeln und anschließend
ins Internet zum illegalen Download bereitstellen. Die rasch ansteigende Zahl der
CD-Brenner in den Haushalten führt auch dazu, dass die äußerst beliebten
selbstgebrannten CD-ROMs, die wie gesagt mit bis zu 150 Songs aufwarten können,
rasch den Besitzer wechseln. Das Schreckgespenst der Musikindustrie wurde
Realität: Das Lebenswerk eines Künstlers landet auf nur einem einzigen CD-Rohling.
Die Musikverleger sind chancenlos gegen das tausendfache Verbreiten von
Raubkopien dieser Art. Handelt es sich wirklich um Raubkopien? Ja, denn Kopien
von der ursprünglichen CD sind allenfalls für private Zwecke erlaubt, Exemplare für
die Weitergabe oder den Tausch herzustellen, bedarf dagegen einer Genehmigung.
Seit das MP3-Verfahren im Umlauf ist und auch im Internet kursiert, gibt es daher
Bemühungen, das Raubkopieren zu unterbinden. Die finanziellen Verluste, die durch
billigstes Kopieren in Massen entstehen, müssten durch entsprechende Lizenzen
wieder aufgefangen werden. Es ist damit zu rechnen, dass die Preise zukünftiger
MP3-Hardware-Player wie MP3-Walkmans oder –Discmans einen beträchtlichen
Aufschlag durch Lizenzgebühren erhalten werden. Auch eine Gebühr für SoftwareMP3-Encoder wäre denkbar und logisch zu begründen.
Dem Hardware-Produzenten Diamond Multimedia, der mit dem „Rio PMP-300“ den
ersten kommerziellen Player im Programm hat, wurde sogar per gerichtlicher
Verfügung untersagt, das Gerät zu verkaufen. Ein Verkaufsstopp wurde erwirkt, er
hielt jedoch nur zehn Tage, weil eine ausdrückliche Verletzung des Urheberrechts
nicht nachgewiesen werden konnte, obwohl zu erwarten ist, dass der Rio gerade bei
MP3 – Kompression von Audio-Daten
Übersicht
Internet-Usern, die regelmäßig illegale Homepages mit MP3-Downloads aufsuchen,
reißenden Absatz finden wird: einfach den neuesten Song aus dem Internet laden,
direkt im Speicher des Players verstauen, schon hat man sich den Kauf einer AudioCD erspart. Aber nicht nur Hardware-Hersteller, sondern auch Betreiber dieser
illegalen Internet-Seiten, die MP3-Titel zum Download anbieten, sollen von
Musikvereinigungen
verklagt
werden.
Manche
Plattenfirmen
setzen
sogar
sogenannte WebRobots ein, „Spürhunde“, die im Internet nach Produktpiraten jagen.
Leider existiert eine unüberschaubare Flut an gesetzeswidrigen MP3-Seiten, gibt
man in einschlägigen Suchmaschinen wie Altavista oder Yahoo! das Stichwort „MP3“
ein, liefert die Suchmaschine eine imposante Liste, es ist unmöglich, alle Seiten zu
besuchen. Täglich kommen neue Homepages dazu, die Songs im MP3-Format
bereitstellen.
Auf der ersten MP3-Konferenz im Juli 1998 in San Diego wurde das Problem der
Audiopiraterie eingehend erörtert. Die verschiedenen Interessensvertreter waren
übereinstimmend der Überzeugung, Audio-Daten seien nur zu schützen, indem man
wirkungsvolle Kopierschutzmaßnahmen wie die digitale Signierung, die es
verhindert, dass ein Musiktitel auf mehr als einem Rechner abgespielt wird,
anwendet. Eigentlich kommt aber jede Art eines Kopierschutzes zu spät, da die MP3Flut nicht mehr einzudämmen ist. Welche Soundformate in Zukunft allerdings noch
erfunden werden, bleibt die große Frage. Wahrscheinlich wird es noch höher
komprimierende Verfahren mit CD-ähnlicher Qualität geben – hierbei wäre ein
Implementieren von Schutzmechanismen von vornherein geboten.
Jedenfalls wird der Ruf nach einem Internet-Urheberrecht immer lauter. Eine
entsprechende EU-Richtlinie ist derzeit (Februar 1999) bereits in Ausarbeitung.
MP3 – Kompression von Audio-Daten
Datenkomprimierung
2. Datenkomprimierung
2.1 Einleitung
Datenkomprimierung hat nicht, wie man vielleicht denken kann, in der heutigen Zeit
auf Grund der günstigen Preise von Speichermedien wie Festplatten mit 10 oder
mehr Gigabyte Kapazität an Bedeutung verloren, sie ist vielmehr unerlässlich im
Zeitalter des Internet und der Online-Medien und auch für Backup-Zwecke
notwendig. Die begrenzte Bandbreite von Telefonleitungen führt dazu, dass sich
Datenübertragungen über das Internet als sehr zeitintensiv gestalten können.
Besonders bei großen Dateien kann eine Komprimierung die Übertragungsdauer
erheblich senken und dadurch ein wirtschaftlicheres Arbeiten ermöglichen. Daher hat
sich im Internet vor allem das „ZIP“-Dateiformat einen Namen gemacht, auch „RAR“,
„ARJ“ oder „LZH“ sind Dateiendungen, die auf komprimierte Daten hindeuten.
Alle Komprimierungsalgorithmen machen sich den großen Grad an Redundanz, den
die meisten Dateien besitzen, zu Nutze. Das bedeutet, dass Dateien mit großer
Redundanz einen relativ geringen effektiven Informationsgehalt aufweisen, das sind
beispielsweise Textdateien, in denen bestimmte Zeichen sehr häufig vorkommen,
oder Bilddateien, die große homogene Flächen mit beispielsweise der gleichen
Farbe besitzen. Der Trick bei diesen Algorithmen ist, die redundanten Informationen
wegzulassen oder zu vereinfachen und dadurch Speicherplatz einzusparen. Raten
von 20% - 50% sind typisch für Textdateien, bei binären Dateien, die ja
ausschließlich aus den 2 Bits Null (0) und Eins (1) bestehen, kann man
Einsparungen von bis zu 90% erzielen.
2.2 Run-Length-Coding
Die einfachste Art, Redundanzen zu kodieren, ist das Run-Length-Coding oder die
Lauflängenkodierung. Sie setzt voraus, dass in einer Datei lange Folgen von sich
wiederholenden Zeichen vorkommen, wie zum Beispiel AAABBBBBBAAACCCCC.
Die Lauflängenkodierung ersetzt nun jede Serie eines Zeichens durch eine einmalige
Angabe des Zeichens und eine Angabe der Anzahl der Wiederholungen. Die obige
Zeichenfolge wird mit 3A6B3A5C kodiert. Dabei wird allerdings vorausgesetzt, dass
die Zeichenfolge nur Buchstaben enthält. Bei binären Dateien kann diese Kodierung
MP3 – Kompression von Audio-Daten
Datenkomprimierung
noch vereinfacht werden, da sich ja die Werte 0 und 1 zwingend abwechseln
müssen, es kann daher auf eine Angabe des Zeichens verzichtet werden. Aus
0000011111000011100 wird beispielsweise dann 5 5 4 3 2.
Bei geeigneten
Dateitypen kann das Run-Lengh-Coding die Größe der Datei beträchtlich reduzieren.
Eine Abwandlung der Lauflängenkodierung ist die variable Lauflängenkodierung.
Sie analysiert die ganze zu komprimierende Datenmenge und weist dem am
häufigsten vorkommenden Zeichen die kürzeste Binärdarstellung, nämlich 0, zu. Das
zweithäufigste Zeichen erhält die 1, dann folgt 01, 10, 11 und so weiter. Damit
benötigt die Kodierung eines Zeichens nicht mehr 8 Bits, sondern je nach der
Häufigkeit nur mehr 1 bis 5 Bits. Zwar muss man die einzelnen Bitfolgen durch
Leerzeichen trennen, es lässt sich jedoch mit der variablen Lauflängenkodierung
eine größere Komprimierung erzielen als mit dem einfachen Run-Length-Coding.
2.3 Huffman-Codierung
Die Huffman-Codierung ist eine verlustfreie Komprimierung, das heißt, dass bei der
Umkehrung
des
Kompressionsvorgangs,
also
der
Dekomprimierung,
die
ursprünglichen Daten aufs Byte genau wiederhergestellt werden können. Der
Huffman-Code ist in zwei Schritte unterteilt. Zuerst werden die Ausgangsdaten
eingelesen und analysiert. Der Algorithmus zählt hier die Häufgkeit der einzelnen
Zeichen und erstellt dann eine hierarchische Baumstruktur, einen sogenannten Trie.
Dazu wird zunächst die Wahrscheinlichkeit eines Zeichens berechnet, mit der es
vorkommt. Danach werden die zwei jeweils seltensten Zeichen zu einem Knoten
zusammengefasst und mit einer Ja/Nein-Entscheidung versehen, die im binären
Bereich mit 0/1 bezeichnet wird. Nach und nach werden alle Knoten zu einem
ganzen Baum zusammengefasst, jedes Zeichen bekommt den Binärcode zugeteilt,
mit dem es in dem Baum erreichbar ist. Im Prinzip funktioniert der Huffman-Code
also wie ein Morsealphabet.
Das Beispiel links stellt den Baum der Zeichenfolge
„em pe drei“ dar. Am öftesten ist das „e“ vertreten,
zweimal das Leerzeichen, alle anderen Zeichen
sind einmal vorhanden. Die Binärzahlen unter den
Kreisen
geben
die
Huffman-Kodierung
und
gleichzeitig den Weg von der Wurzel (in diesem Fall
MP3 – Kompression von Audio-Daten
Der MP3-Algorithmus
10) zu dem gesuchten Zeichen an. Eine 0 steht für eine Abzweigung nach links, eine
1 für eine Abzweigung nach rechts. Nach diesem Schema, das in jeder kodierten
Nachricht beigefügt sein muss, können der Komprimierungsvorgang rückgängig
gemacht und die Originaldaten wiederhergestellt werden. Der Huffman-Algorithmus
findet vor allem in den bekannten Pack-Programmen PKZip oder WinZIP, aber auch
ARJ oder LHA Verwendung, wird auch bei der JPEG-Bildkomprimierung benutzt und
ist ein entscheidender Beitrag zur Erzielung der erheblichen Dateigrößenverminderung bei der MP3-Kompression.
3. Der MP3-Algorithmus
3.1 Einleitung
Die bisher beschriebenen Möglichkeiten der Datenreduzierung arbeiten alle nach
dem gleichen Schema, sie komprimieren die Ausgangsdaten nach einem fest
vorgegebenen Muster und erreichen damit abhängig vom zu komprimierenden
Material meistens ganz ansehnliche Komprimierungsraten. Bei Multimediadaten wie
Video- oder Audiodateien und insbesondere bei der MPEG/Audio-Kompression wird
jedoch nicht einfach Bytefolge für Bytefolge kodiert, der wesentliche Unterschied liegt
darin, dass der Algorithmus die zu kodierenden Daten genauestens analysiert und
die geeignetste Komprimierungsmethode ermittelt. Der MP3-Algorithmus ist daher
ein sogenannter datensensitiver Algorithmus. Um zu optimalen Ergebnissen zu
kommen, nutzt der Algorithmus intensiv die Schwäche der menschlichen Sinne aus,
die wissenschaftlich nur mit der Psychoakustik beschrieben werden kann.
3.2 Psychoakustik
Diese Wissenschaft beschäftigt sich mit allen akustischen Phänomenen, die mit
physikalischen Messmethoden nicht so einfach erfassbar sind. Dazu zählt auch die
Lautheit, deren subjektives Empfinden in den seltensten Fällen mit einer reinen
Schallpegelmessung übereinstimmt. In der Psychoakustik arbeitet man fast
ausschließlich mit streng geschulten und selektierten Testhörern, damit der
Durchschnittshörer beim Abspielen kodierter Dateien keine störenden Effekte
MP3 – Kompression von Audio-Daten
Der MP3-Algorithmus
wahrnimmt. Die Ergebnisse aufwendiger Hörtests bilden die Grundlage für
allgemeingültige Methoden, um das „Ohr übers Ohr hauen zu können“.
Die unterste Kurve in
dem
Diagramm
stellt
die
links
sogenannte
Hörschwelle
dar,
der
Schalldruck (dB)
leiseste Ton, der vom
menschlichen Ohr noch
wahrgenommen werden
kann. Die oberste Kurve
veranschaulicht
Frequenz (kHz)
einen
Ton von 1 kHz mit 80 dB,
der
die
Hörschwelle
drastisch verändert. Ein Ton mit beispielsweise 40 oder 20 dB wird von dem lauteren
vollständig überdeckt, weshalb man ihn vollständig weglassen kann. Genau dieses
Prinzip der simultanen Maskierung macht sich ein MP3-Encoder zu Nutze.
Aber
auch
auf
der
zeitlichen Ebene lassen
sich Signale verdecken,
wie es bei der Vor- und
Rückwärtsmaskierung
der Fall ist. Das Ohr
benötigt
nach
einem
lauten Geräusch eine
sogenannte „Recovery Time“, bis es wieder voll funktionsfähig ist und Signale wieder
hören kann. Daher setzt der Algorithmus nach einem lauten Signal (oder GaussImpuls) eine
psychoakustische
Vorwärtsmaskierung an,
deren
Länge
vom
Schalldruck des Geräusches abhängt. Die Informationen in diesem Bereich sind
daher unhörbar und können ebenfalls weggelassen werden. Nicht nur nach einem
lauten Signal sind verdeckte, also maskierte Daten enthalten, auch kurz vor einem
solchen Signal kann man Einsparungen vornehmen.
Diese Informationen gewinnt der Algorithmus aus der Analyse der digitalen
Filterbänke, die er im Anschluss daran mit einer Art Datenbank vergleicht, die alle
MP3 – Kompression von Audio-Daten
Der MP3-Algorithmus
Arten der Maskierung erkennt. Das Ermitteln der besten Maskierungsmöglichkeit ist
sehr zeitaufwendig und hauptsächlich verantwortlich für die lange Dauer eines
Encoding-Vorganges. Das Input-Audio-Signal, auch Bitstream genannt, wird in
diesem Teil des Vorganges in 32 exakt gleich große Unterkanäle geteilt und
anschließend analysiert. Der Kanal, der die wenigsten Maskierungsmöglichkeiten
bietet,
legt
die
Anzahl
der
Datenbits
fest,
die
beim
nachfolgenden
Quantisierungsprozess verwendet werden.
3.3 Quantisierung
Der durch die Filterbankanalyse errechnete Quantisierungsfaktor bestimmt in der
Quantisierung den Informationsverlust und führt daher zur Datenreduktion. Mehrere
benachbarte Werte werden durch einen neuen Wert ersetzt, indem die Koeffizienten
durch einen Quantisierungsfaktor q(u,v) geteilt und auf den nächsten Integerwert
(ganzzahliger Wert) gerundet werden. Folgende Gleichung wird dabei verwendet:
 1 F u, v 
F Q (u, v)   

 2 qu, v  
Anschließend wird der quantisierte Wert mit dem Quantisierungsfaktor multipliziert
und die Gleichung dadurch umgekehrt. So fallen bei dieser Hin- und Rückrechnung
die von der Psychoakustik ermittelten unhörbaren Frequenzen weg, wenn der
Quantisierungsfaktor korrekt gewählt wird.
Im Anschluss an die Quantisierung werden die 32 Unterkanäle zusammengefasst
und wieder in einen geschlossenen Bitstream geschrieben. Auf dem unten
abgebildeten, stark vereinfachten Schema für die MPEG/Audio-Kompression sind die
bisher beschriebenen Arbeitsschritte abgebildet.
Digitales
Audiosignal
Analyse der
Filterbänke
Quantisierung
Zuweisung der
optimalen
Maskierungsmethode
Zusammenfassung des
Bitstreams
Codiertes
Ausgangssignal
Simultane Maskierung
Vor- und Rückwärtsmaskierung
Stereo-Maskierung (Joint Stereo)
MP3 – Kompression von Audio-Daten
Der MP3-Algorithmus
Diese Methoden der Kompression reichen aus, um die Bitrate und damit die
Komprimierungsrate auf 256 kbps bis 192 kbps mit Layer-2 zu drücken. Das Ziel bei
der Entwicklung von Layer-3 war jedoch eine noch stärkere Komprimierung bis zu 8
kbps, die zwar nur mehr Telefonqualität bietet, dafür aber eine Rate von 1:96
aufweist. Auch der Kompromiss zwischen Platzbedarf und Qualität wird von Layer-3
ausgezeichnet gemeistert, indem er eine Bitrate von 128 kbps möglich macht. Der
Schlüssel zu dieser stärkeren Kompression ist die Diskrete Cosinus-Transformation.
3.4 Layer-3
Die Diskrete Cosinus-Transformation (DCT) ist neben der Fourier-Transformation
ein unentbehrliches Hilfsmittel in der Signalverarbeitung. Diese Operationen finden in
der „Harmonischen Analyse“ Verwendung und transformieren Funktionen vom
Raumbereich in den Frequenzbereich. Durch diese „Frequenzanalyse“ werden
Signale
„bearbeitbarer“.
Die
DCT
verfügt
mittlerweile
über
recht
schnelle
Algorithmen, auch gestaltet sich die Umkehrungsrechnung sehr einfach und hilft, die
CPU-Belastung beim Decoden weiterhin gering zu halten. Beim Layer-3 wird nach
der Aufteilung des Input-Audio-Signals in 32 Unterkanäle im Rahmen der Analyse
der Filterbänke eine leicht abgewandelte Diskrete Cosinus-Transformation (MDCT)
verwendet, durch die unerwünschte Faktoren, die bei der Analyse der Filterbänke
zwangsläufig anfallen, auf ein Minimum reduziert werden. Diese Faktoren ergeben
sich aus der Überlappung der Kanäle und werden „Artefakte“ genannt. Durch eine in
Layer-3 festgelegte Verarbeitung der MDCT-Werte können diese Artefakte aus dem
Bitstream entfernt werden. Auch in den nachfolgenden Operationen wie der
Quantisierung bringt es Vorteile, dass MDCT-Werte gebildet wurden, da das
Quantisieren nun einfacher vonstatten geht.
Ein weiterer Unterschied des Layer-3 zu den vorhergehenden Layer-1 und Layer-2
ist die abschließende Kompression des Bitstreams mit der in Punkt 2.3
beschriebenen Huffman-Codierung. Nach der Quantisierung werden die MDCTKoeffizienten in einer vorherbestimmten Reihenfolge nach ansteigender Frequenz
sortiert und in 3 „Regionen“ aufgeteilt, die mit unterschiedlichen Huffman-Bäumen
verarbeitet werden können, die an die Werte in den jeweiligen Regionen angepasst
sind.
MP3 – Kompression von Audio-Daten
Anwendung
4. Anwendung
4.1 MP3-Programme
Da MP3 ein sogenannter offener Standard ist, das heißt, dass die Decoding-Engine
frei verfügbar ist und in Programmen beliebig eingesetzt werden darf, gibt es vor
allem im Internet eine Vielzahl von mehr oder weniger professionellen Applikationen,
die sich alle mit den vielen Funktionen und Möglichkeiten der MP3-Komprimierung
beschäftigen. Sogar Microsoft hat mit der Lizenzierung von MP3 einen großen Schritt
zur Verbreitung gesetzt, da die De- und Encodier-Routine mit Netshow auf jeder
aktuellen Windows-Installation zur Verfügung steht. Der Encoder ist zwar auf 56
kBit/s beschränkt, der Decoder kann jedoch alle Modi von 8 bis 320 kBit/s
verarbeiten. Durch die Implementierung von MP3 im neuen Media Player ist sogar
Streaming standardmäßig möglich, eine Datei wird nicht erst komplett aus dem Netz
heruntergeladen, sondern sofort abgespielt. Sogar Macromedia Shockwave oder
Music-On-Demand (MOD) der Deutschen Telekom, von denen gar nicht bekannt ist,
dass sie MP3-Komprimierung verwenden, nutzen diese Technologie, um eine
bessere Soundqualität zu erzielen.
Zur MP3-Software zählen die Player zum Abspielen, die Encoder zum Erzeugen der
MP3-Dateien und diverse andere Sparten wie die Playlist-Maker zum Erstellen und
Verwalten von Song-Archiven oder ID3-Tagger zum Bearbeiten der ID3-Tags. Der
erste Schritt, der zu einer MP3-Datei führt, ist das Auslesen der CD-Audio-Tracks mit
einem sogenannten CD-Ripper, der aus den Tracks Wave-Dateien herstellt. Zu der
MP3-Software gehören weiters die Decoder, die den Komprimierungsvorgang wieder
rückgängig machen, und die Front-Ends für verschiedene Encoder.
4.1.1 Player
MP3-Player besitzen ähnliche Funktionen wie ein CD-Player: Start- und Stoptaste,
Tasten, um den vorherigen oder nächsten Songtitel abzuspielen, sowie eine
Pausetaste. Sehr in Mode gekommen sind auch die sogenannten Playlists, denen
man mehrere MP3-Dateien hinzufügen kann, um sie ähnlich einer Datenbank zu
verwalten. Sie sollten daher auch zur Standardausstattung eines jeden Players
MP3 – Kompression von Audio-Daten
Anwendung
gehören. Während MP3-Dateien abgespielt werden, führt der Anwender oft andere
Arbeiten am PC aus. Daher ist eine möglichst geringe CPU-Auslastung ein Kriterium
für die Qualität der Decoding-Engine und damit des Players. Im Gegensatz zur
Komprimierung ist für das Abspielen nicht so viel Rechenleistung nötig.
Unter den zahllosen MP3-Playern ist zweifellos WinAmp am beliebtesten. Der Name
ist aus dem Vorgängerprogramm von WinAmp abgeleitet und bedeutet soviel wie
„Advanced Module Player for Windows“. Nicht nur das MP3-Format wird von Winamp
verstanden, auch andere Soundformate wie WAV, MOD, MIDI oder CD-Audio kann
der Player abspielen. WinAmp ist vollgestopft mit Funktionen und eigentlich ein
„Allroundtalent“ für alles, was MP3-Dateien angeht. WinAmp bringt auch einen
Playlist-Editor mit, durch den sich das Organisieren und Zusammenfassen von
Songtiteln recht einfach und komfortabel gestaltet. Außerdem verfügt WinAmp über
einen graphischen 10-Band-Equalizer, der es dem Benutzer gestattet, FrequenzHöhen und –Tiefen den eigenen musikalischen Vorlieben anzupassen (siehe Bild).
Ein besonderes Feature von WinAmp ist der sogenannte Plug-In-Support.
Durch den Einsatz von solchen ist der Player um viele Funktionen erweiterbar, PlugIns werden entweder für grafische Effekte, veränderte Soundausgabe oder
vereinfachte
Bedienung
verwendet.
Manche
Effekt-Plug-Ins
sind
aufwendig
programmiert und verlangen für die Grafikpracht sogar eine 3Dfx- oder Direct3Dkompatible Grafikkarte. Als Beispiel wäre hier das „Dancing Coke Can – Plug-In“ zu
nennen. Eine Coladosa tanzt 3D-unterstüzt zur Musik auf dem Parkett. Tolle
Lichteffekte und eine rasante Kameraführung machen dieses Plug-In zum Favoriten
auf fast jedem System.
Eine Vielzahl von Plug-Ins beschäftigt sich mit dem Verändern von Geschwindigkeit
oder Pitch des aktuellen Songs. Es gibt auch Möglichkeiten, WinAmp neue
Dateiformate abspielen zu lassen, mit dem entsprechenden Plug-In kann man auch
VQF- oder AAC-Lieder anhorchen.
Ein weiterer Vorteil des WinAmp gegenüber anderen Playern besteht im Einsatz von
sogenannten Skins. Ein Skin ist ein Satz von kleinen Bildern, mit dem die
Benutzeroberfläche neu definiert wird. Im Internet sind zahlreiche dieser Skins
vertreten. WinAmp verfügt auch über einen einfach zu bedienenden ID3-Tag-Editor.
ID3-Tags sind Nicht-Musik-Daten, die in den letzten 128 Byte des Songs zu finden
MP3 – Kompression von Audio-Daten
Anwendung
sind. Hier kann der Benutzer Informationen wie den Titel des Stücks, den Namen des
Interpreten, des Albums und einen persönlichen Kommentar eingeben.
WinAmp’s Prozessorbelastung hält sich mit 4% erstaunlich niedrig, da die neue
Decoding-Engine von Nitrane verwendet wird. Somit läuft WinAmp beim Arbeiten am
Computer
dezent
im
Hintergrund
und
schlägt
nicht
mit
merklichen
Geschwindigkeitseinbußen zu Buche, auf langsamen Rechnern sollte man jedoch
auf Visualisierungsmöglichkeiten verzichten und das VU-Meter abschalten. Alternativ
kann man die Sample-Rate beim Decodieren halbieren oder von Stereo zu Mono
wechseln, um die Performance zu steigern.
Winamp ist Shareware und sollte nach 14 Tagen Testzeit beim Entwickler Nullsoft
registriert werden.
Ein anderer interessanter Player ist Sonique von Night 55. Er kann mit der
intuitivsten Benutzeroberfläche aufwarten und übt einen großen grafischen Reiz auf
das Auge aus. Er bietet fast alle Funktionen, über die auch WinAmp verfügt, nur
Plug-In- und Skin-Support sucht man hier vergeblich, Plug-Ins werden aber
voraussichtlich ab der nächsten Sonique-Version unterstützt werden. Die Playlist des
Sonique-Players ist nicht so komfortabel zu benutzen wie die von WinAmp, dafür hat
Sonique einen Pitch-Controller, mit dem man wie ein DJ beim Scratchen lustige
Effekte generieren kann.
Im Internet kursieren noch massenweise andere Player, täglich kommen neue hinzu,
sie unterscheiden sich jedoch meistens nur im Design und haben fast alle die
gleichen Funktionen. Als Beispiele seien hier NAD, einer der ersten MP3-Player,
Soritong, K-Jöfol, WinJEY, Apollo oder MusicDeck genannt.
4.1.2 CD-Ripper
Um Musik auf den Computer zu übertragen, benötigt man erstens ein CD-ROMLaufwerk und zweitens ein Programm, das in der Lage ist, diese Audio-Daten 1:1
auszulesen. Solche Programme nennt man CD-Ripper, CD-Grabber oder CDDAReader. CDDA steht für Compact Disk Digital Audio und bedeutet, dass es sich um
auf einer CD gespeicherte digitale Audiodaten handelt. Ein kleiner Blick hinter die
Kulissen einer Audio-CD verrät, dass die Daten einer Audio-CD in Blöcke von 2352
MP3 – Kompression von Audio-Daten
Anwendung
Byte aufgeteilt sind. Genau 75 dieser Blöcke ergeben eine Sekunde Musik. Für das
Übertragen der Daten auf den PC ist der Windows-Soundrecorder aus zwei Gründen
ungeeignet, zum ersten geht Qualität verloren, da beim Abspielen eine Komponente
im CD-ROM-Laufwerk eine D/A-Wandlung vornimmt, das heißt, die Daten werden
von digital in analog konvertiert. Beim anschließenden Aufnehmen wird der Vorgang
von der Soundkarte wieder rückgängig gemacht, und die Signale werden wieder in
digitale Daten umgewandelt. Da diese D/A- und A/D-Wandler die teuersten
Komponenten in CD-Laufwerken und Soundkarten sind, erreichen sie hier nur selten
eine ähnliche Qualität wie HiFi-Anlagen. Daher empfiehlt sich zum Auslesen von
Audio-Daten ein CD-Grabber, da dieser die Signale unverändert digital übernimmt
und daher die gleiche (CD-)Qualität (44kHz, 16Bit, Stereo) beibehält.
Am bekanntesten ist sicher der Audiograbber von Jackie Frank. Er ist nicht zuletzt
wegen seiner benutzerfreund-lichen Oberfläche im Internet oft als beliebtester Ripper
angepriesen, auch seine technischen Qualitäten wissen jedoch zu überzeugen.
Audiograbber bietet vielfältige Einstellungsmöglichkeiten, zum Beispiel existiert die
Möglichkeit, verschiedene Rip-Methoden anzuwenden. Standardeinstellung ist die
sogenannte „Buffered Burst Copy“-Methode. Hier werden die 2352-Byte-Blöcke
einfach nacheinander ausgelesen. Diese Methode ist die schnellste, jedoch nicht die
zuverlässigste. Manche CD-ROM-Laufwerke unterstützen nämlich hardwareseitig
keine Jitter-Correction. Jitter entsteht, weil der Red-Book-Standard für Audio-CDs
keine genauere Positionierung des Lese-Lasers als 1/75 Sekunde vorsieht. Beim
Speichern von Audio-Tracks auf die Festplatte reißt bei den angesprochenen
Laufwerken der kontinuierliche Datenstrom ab, hässliche „Knackser“ entstehen. Die
einzige Lösung besteht in der Jitter-Correction, bei der eine Überlappung der Blöcke
um mindestens 1/75 Sekunde vorgenommen wird. CD-Laufwerke von Plextor
können das von Haus aus, bei anderen Modellen muss man auf die zweite RipMethode von Audiograbber zurückgreifen, den „Dynamic Synch Width“, der diese
Überlappung softwareseitig kontrolliert. Die Auslesegeschwindigkeit verringert sich
dadurch natürlich dramatisch. Der Audiograbber kann aber mehr als das, auch
weitere Benutzerunterstützungen sind vorhanden, beispielsweise kann der Ripper
mit CDDB-Support glänzen, was bedeutet, dass er in der weltgrößten Online-CDDatenbank unter der Internetadresse www.cddb.com anhand einer berechneten CDId-Nummer
die
Titelnamen
der
aktuell eingelegten
CD
nachschlägt.
Den
MP3 – Kompression von Audio-Daten
Anwendung
ausgelesenen WAV-Dateien gibt Audiograbber gleich die korrekten Dateinamen
anhand dieser Informationen. Sogar das Normalisieren eines Tracks ist möglich.
Weiters gibt es Möglichkeiten zur Einbindung eines MP3-Codecs in Audiograbber,
mit diesem ist der Ripper imstande, WAV-Dateien umgehend in MP3-Files
umzuwandeln. Es existiert auch eine Sonderform des Audiograbbers, der
AudioCatalyst, der in Zusammenarbeit mit Xing Technologies entstand. Der
AudioCatalyst ist von der CDDA-Technik identisch mit dem Audiograbber, wurde
jedoch von Xing mit deren Encoder, der zur Zeit als der schnellste gilt, erweitert.
Andere empfehlenswerte Ripper sind der Easy CD-DA-Extractor, WinDAC oder
Digital Audio Copy. Die neueste Entwicklung besteht aus einem einzigen VXDGerätetreiber und heißt CDFS.VXD. Man ersetzt einfach die vorhandene Datei im
Windows-System-Verzeichnis und kann sich über eine veränderte Anzeige von
Audio-CDs im Windows-Explorer freuen. Die einzelnen Tracks stehen nun in
verschiedenen Sample-Raten und Bitqualitäten als WAV-Dateien zur Verfügung und
müssen nur noch per Drag-und-Drop an eine beliebige Stelle auf der Festplatte
kopiert
werden.
Der
virtuelle
CDFS-Gerätetreiber
erreicht
hier
Rekord-
Auslesegeschwindigkeiten von 16-fach auf einem 32x-CD-ROM-Laufwerk, der
Audiograbber kommt hier nur auf magere 8-fache Geschwindigkeit. Es ist auch
möglich, MP3-Dateien direkt von der Audio-CD zu erstellen, was derzeit die
schnellste Möglichkeit ist, an MP3-Titel zu kommen.
4.1.3 Encoder
Als Encoder werden die Programme bezeichnet, die den unter Punkt 3
beschriebenen Kompressionsalgorithmus durchführen und damit eine MP3-Datei
erzeugen. Der Markt wird auf der einen Seite dominiert von den Encodern der Firma
Opticom, dem Ableger und Vertriebspartner des Fraunhofer Institutes für Integrierte
Schaltungen. Opticom hat jedoch durch Xing Technologies harte Konkurrenz
bekommen. Deren MP3-Encoder gilt als der schnellste im Internet erhältliche
Umwandler. Es gibt zwar noch viele weitere Encoder, die meisten sind Share- oder
Freeware und verwenden die frei erhältlichen ISO-Codecs, die natürlich bei weitem
nicht so ausgereift sind wie die aktuellen Codecs von Xing oder eben Opticom.
Deren neuestes Produkt nennt sich .mp3 Producer Professional und ist als der
MP3 – Kompression von Audio-Daten
Anwendung
beste Encoder im Internet bekannt. Leider ist die Benützung nicht ganz billig, bis zu
200 US-$ werden für die Registrierung der Profi-Version verlangt, die „AdvancedPlus-Version“ kommt auf 50 $, sie ist jedoch in der Funktionsweise wesentlich
eingeschränkt und bietet beispielsweise kein Low-Compression-Encoding mit
Bitraten von 192 oder 256 kbps. Beide Versionen glänzen jedoch mit einer
benutzerfreundlichen Oberfläche und verfügen seit der Version 2.0 auch über einen
„Batch-Processor“, der beliebig viele WAV-Dateien nacheinander umwandelt. Der
Producer basiert auf den Routinen der Fraunhofer Gesellschaft und garantiert so die
ausgereifteste Technik, die zur Zeit in einem Encoder implementiert ist. Um die
Standard-Bitrate von 128 kbps zu erreichen, verwendet der .mp3 Producer zum
einen die psychoakustische Maskierung, womit er schon eine Komprimierung von 1:5
bei CD-Qualität erreicht, zum anderen wendet er das „Joint Stereo Coding“ an. Das
menschliche Ohr kann nämlich die Stereokanäle bei tiefen Tönen nicht orten, bei
mittleren Tönen ergibt sich die Richtung aus den verschiedenen Zeitpunkten, an
denen die Signale beim linken und rechten Ohr eintreffen. Bei hohen Frequenzen ist
der Stereoeindruck nur noch durch den Lautstärkeunterschied nach-vollziehbar. Den
gleichen Eindruck kann der Fraunhofer-Encoder auch mit dem „Joint Stereo“Verfahren erzeugen. Dabei zerlegt er das Stereo-Signal in ein Mittensignal, das
durch Addition des linken und rechten Kanals gebildet wird, und ein Seitensignal, das
durch Subtraktion der beiden Kanäle entsteht. Da das Seitensignal sehr viel weniger
Informationen enthält, ergibt sich verglichen mit zwei vollwertigen L- und R-Kanälen
eine stark reduzierte Datenmenge, mit der sich die Komprimierungsrate auf 1:10 bis
1:12 drücken lässt. Um Audiodaten noch stärker komprimieren zu können, kommt
beim .mp3 Producer das sogenannte „Intensity Stereo Coding“ zum Einsatz. Die
Datenmenge beläuft sich dabei nur mehr auf einen Summenkanal (L+R) und
Richtungsinformationen. Es lassen sich zwar hier Bitraten von 64 kbps erreichen, der
komprimierte Titel unterscheidet sich dann aber merklich vom Original. Der Encoder
von Opticom erzeugt erfahrungsgemäß mit dieser Technik MP3-Dateien von
hervorragender Qualität, nur der Zeitaufwand ist noch verhältnismäßig hoch, zum
Encoden eines 4-Minuten-Titels kann man auf einem Pentium 133 eine halbe Stunde
einplanen, ab einem Pentium II mit 300 MHz läuft der Vorgang in Echtzeit ab.
Bis zu 8 Mal schneller ist laut Xing Technologies ihr Produkt, der Xing MP3
Encoder. Er ist über das Internet für nur 20 US-$ erhältlich und bietet weit-gehend
MP3 – Kompression von Audio-Daten
Anwendung
die gleichen Funktionen wie der .mp3 Producer. Ein integrierter Batch-Processor,
Drag&Drop-Support und die rasante Arbeitsgeschwindigkeit lassen die Konkurrenz
zum Opticom-Produkt verständlich erscheinen. In der Praxis benötigt der Xing MP3
Encoder für den gleichen 4-Minuten-Song auf einem Pentium II mit 333 MHz und 64
MB RAM nur mehr ca. eine Minute. Bei dem Xing Encoder kann man die Bitrate und
die daraus resultierende Komprimierungsrate in einem sogenannten Profile-Editor
festlegen, der von Haus aus über vordefinierte Profile verfügt, die sich verändern und
erweitern lassen. Die Xing-Encoding-Routine benötigt für eine Bitrate von 128 kbps
kein Joint Stereo, da die Maskierung „oberflächlicher“ vorgenommen wird und sie
hier schon einen höheren Kompressionsfaktor erreicht. Dadurch muss man geringe
Qualitätseinbußen in Kauf nehmen, die aber nur messtechnisch von Bedeutung sind,
einem geschulten Ohr dürfte der Unterschied ebensowenig auffallen wie dem HobbyHörer.
Es gibt auch eine Möglichkeit, den Xing MP3 Encoder in CD-Ripper oder andere
Frontends einzubinden, indem man den beigefügten Command-Line-Encoder, der im
DOS-Modus arbeitet, angibt.
MP3 – Kompression von Audio-Daten
Anwendung
4.1.4 Sonstige Programme
In die Rubrik „Sonstige Programme“ fallen hauptsächlich ID3-Tagger. Sie dienen
zum Bearbeiten des ID3-Tags, der am Ende einer jeden MP3-Datei positioniert ist.
Der ID3-Tag ist kein offiziellen Standard, sondern wurde von privaten Internet-Usern
vorgestellt. Daher entstammen auch die meisten Programme, die sich mit dem
Thema ID3-Tag beschäftigen, der Tastatur von Hobby-Programmierern. Wozu
manche von diesen fähig sind, demonstriert eindrucksvoll Nightmare’s ID3-Tagger.
Er ist ein leistungsfähiges Tool, mit dem man ganze Verzeichnisse mit MP3-Dateien
anhand der ID3-Tags der Songtitel umbenennen kann, auch das Schreiben von ID3Tags anhand der Namen beherrscht der Tagger. Weiters verfügt er über Funktionen
zum Export von Info- oder Playlisten.
Für Besitzer von CD-Brennern interessant ist MPEG DJ GoWave! von XAudio. Es
macht im Grunde nichts anderes als ein MP3-Player, es schickt die Daten jedoch
nicht über die Soundkarte, sondern schreibt die Informationen in eine WAV-Datei auf
die Festplatte, diese Datei kann anschließend auf eine Audio-CD gebrannt werden.
Auch zum Bearbeiten eines Songs benötigt man einen solchen Decoder, da aktuelle
Sound-bearbeitungsprogramme nichts mit MP3-Dateien anfangen können. Eine
Ausnahme: mit der Vollversion
des Fraunhofer-Codecs ist der Windows-
Soundrecorder auch zum Editieren von MP3-Dateien geeignet.
4.2 MP3 Hardware
Eigentlich besteht die einzige Möglichkeit, MP3-Dateien anzuhören, darin, einen
entsprechenden Player am Computer zu laden und den Song zu öffnen. Findige
Entwickler arbeiten jedoch schon seit einiger Zeit an der Einbindung der MP3Technologie in Erfindungen, die entweder wie traditionelle Walkmans arbeiten,
andere sind für den Einbau ins Auto gedacht. Von den meisten Produkten existieren
erst Prototypen, der einzige sich im Verkauf befindliche und in Deutschland
erhältliche Player gehört zu den portablen Geräten und ist unter dem Namen Rio
bekannt.
MP3 – Kompression von Audio-Daten
Anwendung
Diamond Multimedia stellte mit dem Rio PMP300 diese Revolution auf dem AudioMarkt vor. Auf den ersten Blick mutet das Gerät wie ein Walkman oder Mini-DiscPlayer an, alle üblichen Bedientasten wie Play, Stop, Pause sowie Vorwärts und
Rückwärts sind vorhanden, es existieren auch Buttons für Repeat, Random, auch
einen Equalizer hat Diamond auf dem Rio untergebracht. Einzig das minimale
Gewicht und die kompakte Größe lassen den Benutzer merken, dass er es hier mit
einem besonderen Stück Technologie zu tun hat. Der Rio verfügt über 32 MB
internen Speicher auf einer eingebauten Flash-Memory-Card, die über ein
mitgeliefertes Kabel, das mit einem Adapter am parallelen Druckerport des
Computers angeschlossen wird, mit MP3-Titeln bestückt wird. Dieser Vorgang
geschieht
mit
der
komfortablen
„Rio
Manager“-Software,
die
mit
einem
Datendurchsatz von 6 MB in der Minute bis zu 10 Songs in 6 Minuten auf dem
internen Rio-Speicher unterbringt. In der Standardqualität 128 kbps in 44 kHz,
Stereo, kann man so etwa eine halbe Stunde Musik mit sich herumtragen. Es besteht
jedoch die Möglichkeit, den Rio mit externen Flash-Karten, die zur Zeit mit einer
Kapazität von 16 – 32 MB erhältlich sind, zu erweitern. Mit einer solchen 32-MBKarte im Slot haben bis zu 60 Minuten MP3-Musik im Rio Platz. Ein weiterer Vorteil
des
Rio
zu
herkömmlichen
Walkmans
oder
Discmans
ist
die
absolute
Unempfindlichkeit gegenüber Stößen und harten Bewegungen, da die Technik des
MP3-Players keine beweglichen oder mechanischen Teile enthält. Dadurch wird
auch die Energieversorgung des Rio auf einem erstaunlich niedrigen Niveau
gehalten, mit einer einzigen 1,5-Volt-Batterie ergibt sich eine Spieldauer von bis zu
12 Stunden. Im Lieferumfang des 70 Gramm leichten Gerätes, das mit Maßen von
ca. 8 x 6 cm kleiner als eine Zigarettenschachtel ist, befinden sich außerdem
Kopfhörer, ein hervorragendes Handbuch, das auch genauer auf Details der MP3Kompression eingeht, und die renommierte Software „MusicMatch Jukebox“, die ein
All-In-One-Programm ist und Encoder, Player und Manager in sich vereint. Die
einzigen Nachteile des Rio MP3-Players sind der mit 299,- DM noch recht hoch
angesetzte Preis, der den Vergleich mit Walkmans nur wegen der ausgezeichneten
Soundqualität nicht scheuen muss. Ferner ist der Rio in Deutschland noch zu wenig
bekannt, um bisher hohen Absatz finden zu können. Die MP3-Dateien zur
Bespeicherung der Flash-Karten werden entweder von eigenen CDs erstellt oder von
speziell eingerichteten Internet-Seiten wie www.rioport.com oder www.mp3.com
downgeloadet.
MP3 – Kompression von Audio-Daten
Anwendung
Eine andere interessante Entwicklung kommt aus Taiwan und hört auf den Namen
CD-MP, was schon viel über die Spezifikationen des für Sommer 1999 angesagten
Produktes aussagt. Der CD-MP von Naiam benutzt statt Flash-Memory-Karten als
Medium handelsübliche CD-ROMs, was zwar einen CD-Brenner voraussetzt, dafür
aber eine Kapazität von 650 MB ermöglicht. Anders gesagt, verarbeitet der CD-MP
CDs mit bis zu 175 MP3-Titeln, was einer Spieldauer von 10 – 12 Stunden
entspricht. Auch normale Audio-CDs und sogar CD-RWs (wiederbeschreibbare CDROMs) kann der CD-MP abspielen.
Ein ganz neuer Trend bei den MP3-Hardware-Playern ist der Player für das Auto.
Das Mitführen von großen CD-Mengen im Auto entfällt, und der Kauf eines teuren
CD-Wechlers gehört der Vergangenheit an. Ein sehenswertes Produkt hat empeg mit
dem empeg car im Programm. Der 950 US-$ teure Player ist genau wie ein
herkömmliches Autoradio dimensioniert und eignet sich daher zum Einbau in jedes
Auto. Der empeg car arbeitet mit einer 2,5 Zoll großen Laptop-Festplatte mit
serienmäßig 2,1 GB Speicherkapazität, die stoßsicher aufgehängt ist. Gegen einen
Aufpreis bietet empeg auch Festplatten mit bis zu 28 GB Platz an. Bestückt wird der
Car-Player mittels der sich im Lieferumfang befindlichen Windows-Software, die
MP3-Dateien wahlweise über den seriellen oder den USB-Port des PCs auf die
Festplatte des Players schickt. Der empeg car verfügt weiters über einen FM-Tuner,
mit dem sogar Radioprogramme empfangen werden können.
4.3 Internet Radio
Da mit dem MP3-Format das sogenannte Streaming möglich ist, das heißt, dass eine
Datei nicht vollständig vorliegen muss, um sie anhören zu können, eröffnen sich
ganz neue Möglichkeiten der Audio-Verarbeitung. MP3-Dateien können durch das
Streaming unmittelbar abgespielt werden, wenn man sie im Internet wählt, man muss
sie nicht erst komplett herunterladen. Diese Tatsache machen sich einige
Radiostationen wie beispielsweise Radio Moi zu Nutze. Auf der Internet-Seite
www.musicmusicmusic.com erfolgt zuerst eine Anmeldung, bei der der Benutzer
persönliche Informationen eingibt sowie die gewünschte Musikrichtung wie zum
Beispiel Rock & Roll, Blues, Klassik oder Musik der 90er auswählt. Außerdem muss
MP3 – Kompression von Audio-Daten
Anwendung
man seine e-mail-Adresse und die Art der Verbindung (36k-Modem, 56k-Modem,
ISDN ohne Kanalbündelung, ISDN mit Kanalbündelung oder Standleitung) angeben.
Diese Informationen legen die Qualität fest, mit der Musik abgespielt wird.
Anschließend wird eine abgewandelte Version des Players WinPlay3, des MP3Players von Opticom, der in dieser Version auch das Streaming unterstützt,
downgeloadet. Per e-mail bekommt man dann eine Playlist zugeschickt, die WinPlay
öffnen kann, schon kann man die Musik live aus dem Internet zu hören. Der große
Vorteil eines solchen Online-Radios ist, dass man durch einen Klick auf die
Titelwahltaste einfach zum nächsten Song wechseln kann, außerdem bekommt man
in einem Extra-Fenster Informationen zum aktuellen Musiktitel eingeblendet, Name
und Interpret sowie Vertriebsinformationen können hier abgelesen werden. Der
Nachteil bei Radio Moi ist, dass die Soundqualität bei einem Standard-Modem wie
auch bei ISDN noch relativ unbefriedigend ist, da die Verbindungsgeschwindigkeit
nur in den seltensten Fällen ausreichen würde, um eine bessere Qualität zu
empfangen. Bei einem 33k-Modem ist das Radioprogramm sogar nur in 11kHz und
16 kbps verfügbar, selbst hier kommt es noch manchmal zu störenden Aussetzern,
die die Klangqualität merklich trüben.
Echtzeit-MP3-Codecs finden jedoch nicht nur bei Radio Moi Verwendung, sondern
werden auch für andere Live-Übertragungen via ISDN benutzt. So werden
beispielsweise Interviews oder Live-Statements nicht mehr über die Telefonleitung
gesendet, sondern über ISDN, was gleich teuer ist und sogar CD-Qualität ermöglicht.
Störendes Rauschen, das typisch für Telefongespräche ist, fällt gänzlich weg, wenn
man
MP3-Kompression
einsetzt.
In
Versuchsanordnungen
wurden
solche
Sendungen bereits realisiert, zum Beispiel verwendeten alle privaten Radiostationen
Deutschlands während der Olympischen Winterspiele in Albertville (Frankreich,
1992) sehr erfolgreich Layer-3-Codecs für die Übertragung der Reporterkommentare
zwischen den einzelnen Sportstätten und dem zentralen Studio in Meribel. Eine
andere Möglichkeit von Echtzeit-Layer-3-Codecs kam beim Internationalen MusikFestival
in
Bergen
1992
zur
Anwendung,
so
spielte
ein
Organist
ein
selbstkomponiertes Orgelwerk in der Kirche von Trondheim, während das
begleitende Orchester in Bergen stationiert war. Die Orgelmusik wurde mittels ISDN
und MP3-Kompression nach Bergen übertragen.
Die wohl eindrucksvollste und global gesehen gewichtigste Anwendung von Layer-3Codecs ist das ehrgeizige WorldStar-Projekt, das von der WorldSpace-Gesellschaft
MP3 – Kompression von Audio-Daten
Anwendung
ins Leben gerufen wurde. Das Ziel ist die Ausstrahlung von Radioprogrammen, die
drei Viertel der Weltbevölkerung empfangen können sollen. Die Sendungen sind mit
MPEG Layer-3 kodiert. Dazu verwendet WorldStar drei Satelliten, AfriStar, CaribStar
und AsiaStar, die über den jeweiligen Kontinenten in einer geostationären
Umlaufbahn im Orbit kreisen sollen und auch in Gebieten, die geographisch
ungünstige
Voraussetzungen
für
den
Radioempfang
bieten,
kristallklare
Radioprogramme in CD-Qualität zur Verfügung stellen sollen. Der AfriStar-Satellit
wurde am 28. Oktober 1998 mit einer Ariane-4-Rakete in den Weltraum befördert
und deckt nun das Gebiet über Asien ab. Jeder Satellit wird von einer Bodenstation
aus gesteuert und mit Radioprogrammen bestückt. Der Satellit teilt diese Inputs
anschließend in 96 Einzelkanäle mit jeweils 16 kbps auf, die auch gebündelt werden
können, was eine Qualitätssteigerung mit sich zieht. So werden zum Beispiel für die
Übertragung eines Konzerts oder von Musik 8 Kanäle gebündelt, um eine CDQualität
zu
erzielen,
zusammengefasst,
um
für
Nachrichtensendungen
dafür
4
verschiedene
werden
Sprachen
nur
zu
2
Kanäle
ermöglichen.
Selbstverständlich kann man diese Radiosendungen nicht mit traditionellen
Radioempfängern genießen, die bedeutenden Firmen Panasonic, Sanyo, JVC und
Hitachi haben sich aber schon die Rechte an besagten Radiogeräten gesichert und
bereits entsprechende Empfänger vorgestellt. Die Signale werden von einer MiniaturSatellitenparabolantenne aufgefangen und von einem implementierten Decoder in
Klänge umgewandelt, wodurch die hervorragende Soundqualität des WorldStarProjektes erhalten bleibt. Der Abschuss der beiden anderen Satelliten, CaribStar und
AsiaStar, ist für den Herbst 1999 geplant und dürfte zur weiteren Verbreitung des
MP3-Standards sein Übriges beitragen.
MP3 – Kompression von Audio-Daten
Anhang: Literaturliste
5. Zusammenfassung und Ausblick
Der ISO MPEG/Audio Layer-3, kurz MP3, hat seit Anfang 1998 massive Verbreitung
gefunden, da er ausgezeichnete Tonqualität auf CD-Niveau, eine bestechende
Komprimierungsrate von 1:12, die er durch ausgereifte Algorithmen erreicht, und
eine gute Akzeptanz bei Computer- und Internet-Usern vereint. Die Basis für die
MPEG/Audio-Komprimierung
im
Allgemeinen
bildet
die
Psychoakustik.
Der
Algorithmus ermittelt in einem aufwendigen Rechenvorgang Frequenzen, die
entweder vom menschlichen Ohr nicht wahrgenommen werden können oder von
anderen (lauteren) Tönen verdeckt (=maskiert) werden. Diese Frequenzen werden
anschließend herausgefiltert und aus dem Datenbereich entfernt, was die ungeheure
Komprimierungsrate erklärt.
MP3 kommt nicht nur in der Unterhaltungsindustrie zum Einsatz, sondern auch auf
Heimcomputern sind oft MP3-Dateien zu finden, was der guten Erreichbarkeit von
Playern, Encodern und den Songs selbst im Internet zuzuschreiben ist. Leider wird
aus diesem Grund MP3 auch oft für illegale Zwecke verwendet, beispielsweise zur
Zusammenstellung von selbstgebrannten MP3-CDs oder rechtswidrigen InternetSeiten, auf denen Songs im MP3-Format zum Download bereitstehen.
Obwohl die Spezifikationen des MPEG/Audio Layer-3-Algorithmus vollkommen
erscheinen, ruhen sich die Motion Picture Experts Group und das Fraunhofer Institut
nicht auf ihren Lorbeeren aus: Schon sind neue Audioformate in Planung, die noch
stärkere Kompression und noch bessere Klangqualität bei Sampleraten von 8kHz bis
96kHz ermöglichen. MPEG-2-AAC ist eine dieser Neuentwicklungen. AAC steht für
Advanced Audio Coding (Fortgeschrittenes Audio-Kodieren) und soll das MP3Format ablösen. Ob diese Neuerung allerdings vom „Internet-Volk“ und den
Heimanwendern so begeistert aufgenommen wird wie MP3, ist die Frage. AAC
implementiert eine Anzahl zusätzlicher Funktionen, wie zum Beispiel Temporal Noise
Shaping oder eine Frequenz-Vorhersage, die zum Erreichen von besseren
Audioqualitäten beitragen sollen. Auch 5-Kanal-Dolby-Surround-Sound wird in AAC
enthalten sein. Doch auch MPEG-2-AAC ist überholt, schon bevor es fertiggestellt
wurde – der Nachfolger heißt MPEG-4 und soll Audio auf CD-Niveau mit einer
Kompressionsrate von 1:20 bieten.
Herunterladen