MP3 – Kompression von Audio-Daten Übersicht MP3-Kompression von Audio-Daten Grundlagen, Techniken und praktische Anwendung MP3 – Kompression von Audio-Daten Übersicht 1. Übersicht 1.1 Einleitung Der Aufstieg des Menschen von der Steinzeit bis zur Gegenwart ist durch einige hundert bahnbrechende Erfindungen gekennzeichnet. Manche von ihnen haben die Welt und die Gesellschaft verändert; manche von ihnen haben unsere Zivilisation überhaupt erst ermöglicht. Die Erfindungen haben nicht nur das menschliche Leben leichter gemacht, sondern auch soziale Wandlungen hervorgerufen, die niemand voraussehen konnte. Besonders spektakulär verlief die Entwicklung auf dem Gebiet der Unterhaltungsund Informationstechnologien. In den letzten Jahrzehnten wurden Meilensteine auf dem Weg in die Zukunft gesetzt. Dazu zählt die Erfindung des Tonfilms, des Fernsehens, des Computers und der Videotechnik. Nach dem Farbfernsehgerät und dem CD-Player, die aus dem modernen Leben nicht mehr wegzudenken sind, ist aber eine gewisse Stagnation in der Entwicklung der Unterhaltungselektronik eingetreten. Der Markt ist überfüllt mit neuen Technologien wie dem DAT (Digital Audio Tape, magnetische Bandkassette für Tonaufnahme und –wiedergabe), der Mini-Disc, der DCC (Digital Compact Cassette), dem Dolby-Surround-Sound oder der DVD (Digital Versatile Disc). Die Verkaufszahlen dieser Neuheiten sind nicht überragend, die Produkte stellen durchaus keine Revolution dar. Der Markt sucht daher intensiv nach einer „Killer-Applikation“, nach einer echten Innovation. In den Köpfen der Techniker entstehen schon neue, absatzträchtige Ideen. Eine der neuesten, wirklich großen Entwicklungen in den letzten Jahren ist die Datenkompression - für die erfolgreiche Vermarktung ist in der Unterhaltungselektronik besonders eine Video- und Audiocodierung vonnöten. Tatsächlich ist es heute möglich, sowohl Bilder und Videos als auch Klänge zu komprimieren, das heißt, sie extrem platzsparend zu speichern. Berechnet man die Datenmenge von einer Stunde Video, kommt man auf einen Speicherplatzbedarf von ca. 38.000 MegaByte (MB) oder auch 38 GigaByte (GB). Zur Zeit übliche Festplatten bieten jedoch nur ca. 10 GB, CD-ROMs gar nur 650 MB. Eine Komprimierung ist daher oberstes Gebot. MP3 – Kompression von Audio-Daten Übersicht Primär wird also in der Videokomprimierung eine möglichst geringe Speicherplatzbelastung angestrebt. Bei der Komprimierung von Audio-Daten kommt es nicht nur auf das Einsparen von Datenträgerkapazitäten an, sondern auch auf das Erhalten einer möglichst hohen Klangqualität. Das menschliche Gehör ist nämlich bei Störungen im Audiobereich empfindsamer, als es das Auge beim Wahrnehmen von visuellen Reizen ist. Das heißt also, kurzzeitiges Rauschen und Knacken ist für die menschlichen Sinne störender als zum Beispiel ein Flimmern. Daher sind die Technik und der Erfindergeist bemüht, diesen Anforderungen der Sinne gerecht zu werden und eine optimale, der CD vergleichbare Tonqualität bei der Kompression zu erzielen. Ein weiterer Vorteil der Audiokompression ist zweifellos, dass sich ein Musikstück, das nur einige wenige MB groß ist, gut über das Internet verteilen lässt. Das Internet wird somit zu einem neuen Vertriebskanal. Leider nutzen auch viele Internet-User die neuen Möglichkeiten dazu, Musiktitel illegal zum Download bereitzustellen, es gibt aber auch schon Modelle von Plattenfirmen, die zum Beispiel Testversionen von Songs anbieten, die etwa eine Minute lang sind. Wenn das Lied Gefallen findet, kann man die entsprechende CD gleich online bestellen. Auch die Software-Branche profitiert von den neuen Verfahren. Mulimedia-Lexika wie Microsoft Encarta oder Bertelsmann InfoROM verwenden oft kurze Sound-Samples, beispielsweise berühmte Reden von Politikern oder Ausschnitte aus Musikstücken bekannter Komponisten. Bisher wurde, um die umfangreichen Sounddaten auf der CD unterzubringen, einfach die Sample-Rate verringert und damit die Qualität beeinträchtigt. Auch viele Spiele verwenden CD-Audio-Tracks, die nicht selten einen Großteil, manchmal bis zu 80%, Speicherplatz auf dem CD-Datenträger belegen. Mit dem Komprimieren dieser Musik wird der Bedarf maßgeblich reduziert. Den Entwicklern bleibt so mehr Platz für andere Elemente des Spiels wie neue Levels oder aufwendigere Grafiken. Auch im Hörfunk-Bereich stehen die Tore offen für neue Ideen: Internet-Radio ist eine bereits realisierte Anwendung von Audio-Kompressionsverfahren. Dabei senden Radio-Stationen auswählbare Rundfunkprogramme, die kostenlos gehört werden MP3 – Kompression von Audio-Daten Übersicht können, direkt ins Netz. Eine Komprimierung ist auf Grund der limitierten Datentransfergeschwindigkeit des Internet hier unerlässlich. Es gibt also viele Gründe, die für Datenkompression sprechen. Die Unterhaltungsindustrie präsentiert der Musikbranche den zukünftigen De-facto-Standard: MP3. 1.2 Definition – Was ist MP3? Das Kürzel MP3 steht eigentlich für MPEG/Audio Layer-3. Damit bezeichnet man ein Verfahren zur Kompression, also zur Verdichtung von Audio-Daten. Ein Ziel bei der Entwicklung des MP3-Standards war die Verringerung der Datenmenge von Audiosignalen unter Beibehaltung der ursprünglichen Klangqualität. Mit der Komprimierung von Multimedia-Daten beschäftigt sich ein Team der „International Standards Organisation“ (ISO), dem internationalen Pendant zur DIN, dem es um Qualitätssicherung und Standardisierung geht, und der IEC, der „International Electro-Technical Commission“. Der Name dieses Teams ist „Moving Picture Experts Group“, kurz MPEG. Hauptsächlich ist das Ziel der MPEG die Videokomprimierung, der Audio-Part wurde in diesem Fall einer anderen Kompetenz übergeben. Nach jahrelanger Entwicklungszeit stellte diese Gruppe nach anderen AudioKomprimierungs-algorithmen auch den MP3-Standard vor. Dieser große Schritt gelang Ende des Jahres 1997 dem Fraunhofer Institut für Integrierte Schaltungen (IIS) in Erlangen in der Bundesrepublik Deutschland. Als Vater des Verfahrens gilt Ing. Dr. Karlheinz Brandenburg, Abteilungsleiter des Bereichs Audiotechnik und Multimedia beim Fraunhofer Institut. Bereits zehn Jahre vorher begannen die Arbeiten an Audio-Kompressionsverfahren im Rahmen eines Projekts der Europäischen Union, des EUREKA-Projekts für digitale Audiodatenübertragung. Durch eine Kooperation mit der Universität Erlangen gelang es dem IIS schließlich, einen mächtigen Algorithmus auszuarbeiten, der von der International Standards Organisation als ISO-MPEG Audio Layer-3 standardisiert wurde. MP3 – Kompression von Audio-Daten Übersicht Der Layer-3 entstammt der MPEG-1-Audio-Familie. Das Fraunhofer IIS hat nacheinander drei Systeme der Audiokomprimierung entwickelt. Diese Systeme werden einfach mit Layer-1, Layer-2 und Layer-3 bezeichnet. Die drei Layers unterscheiden sich durch ihre Komplexität und die ansteigende Soundqualität. Der Layer-3, im folgenden mit MP3 abgekürzt, wurde für verschiedene einstellbare Qualitäten und Komprimierungsverhältnisse zugeschnitten. Verfahren Kompressions -Rate Anwendungsbereiche Originaldaten - Audio-CD Layer-1 1:4 Digital Compact Cassette (DCC) Layer-2 1:6 – 1:8 Digital Audio Broadcast (DAB), CD-I, DVD Layer-3 1:12 Internet Radio, Satellitenradio, Heimgebrauch Die nächste Tabelle gibt Auskunft über die typischen mit Layer-3 erreichbaren Raten. Klangqualität Modus Bitrate Komprimierungsfaktor Telefon Mono 8 kbps 1:96 Besser als Kurzwelle Mono 16 kbps 1:48 Besser als Mittelwelle Mono 32 kbps 1:24 Ähnlich wie UKW Stereo 56-64 kbps 1:24 Fast CD Stereo 96 kbps 1:16 Subjektiv wie CD Stereo 112 kbps 1:14 CD-Qualität Stereo 128 kbps 1:12 Auf einer herkömmlichen Audio-CD beispielsweise ist Platz für 74 Minuten Musik. Speichert man die einzelnen Titel mit Hilfe eines Programmes, das in der Lage ist, diese 1:1 auf die Festplatte auszulesen, CD-Ripper genannt, oder mittels des Windows-Soundrecorders (sndrec32.exe) auf die Festplatte, benötigt man dafür ca. 650 MB Speicherplatz. Da eine solche Belastung der Festplatte indiskutabel ist, empfiehlt es sich, einen sogenannten MP3-Encoder anzuwenden. Vergleicht man das Resultat, ist eine Komprimierung von 1:12 bei CD-Qualität ersichtlich. Ein MP3 – Kompression von Audio-Daten Übersicht Musiktitel mit einer Länge von 5 Minuten belegt also nicht mehr 50, sondern nur mehr knapp 5 Megabyte. Auf eine CD-ROM passen demnach mehr als 10 Stunden Musik, ohne dass sich diese merklich vom unreduzierten Original unterscheidet. Ein Nachteil bei einer solchen CD-ROM ist, dass man die Musik weder im heimischen CD-Player im Wohnzimmer, noch im transportablen Discman genießen kann; dies wird erst am Computer durch ein spezielles Player- (Abspiel)programm möglich. 1.3 Rechtliches Die eigentlichen Leidtragenden der neuen Audiokompressionsverfahren, im Besonderen MP3, sind die Inhaber der Rechte an komprimierten Musikstücken. Sie müssen tatenlos zusehen, wie Anwender Musiktitel von CDs auf die Festplatte speichern, mit einem MP3-Encoder in MP3-Dateien umwandeln und anschließend ins Internet zum illegalen Download bereitstellen. Die rasch ansteigende Zahl der CD-Brenner in den Haushalten führt auch dazu, dass die äußerst beliebten selbstgebrannten CD-ROMs, die wie gesagt mit bis zu 150 Songs aufwarten können, rasch den Besitzer wechseln. Das Schreckgespenst der Musikindustrie wurde Realität: Das Lebenswerk eines Künstlers landet auf nur einem einzigen CD-Rohling. Die Musikverleger sind chancenlos gegen das tausendfache Verbreiten von Raubkopien dieser Art. Handelt es sich wirklich um Raubkopien? Ja, denn Kopien von der ursprünglichen CD sind allenfalls für private Zwecke erlaubt, Exemplare für die Weitergabe oder den Tausch herzustellen, bedarf dagegen einer Genehmigung. Seit das MP3-Verfahren im Umlauf ist und auch im Internet kursiert, gibt es daher Bemühungen, das Raubkopieren zu unterbinden. Die finanziellen Verluste, die durch billigstes Kopieren in Massen entstehen, müssten durch entsprechende Lizenzen wieder aufgefangen werden. Es ist damit zu rechnen, dass die Preise zukünftiger MP3-Hardware-Player wie MP3-Walkmans oder –Discmans einen beträchtlichen Aufschlag durch Lizenzgebühren erhalten werden. Auch eine Gebühr für SoftwareMP3-Encoder wäre denkbar und logisch zu begründen. Dem Hardware-Produzenten Diamond Multimedia, der mit dem „Rio PMP-300“ den ersten kommerziellen Player im Programm hat, wurde sogar per gerichtlicher Verfügung untersagt, das Gerät zu verkaufen. Ein Verkaufsstopp wurde erwirkt, er hielt jedoch nur zehn Tage, weil eine ausdrückliche Verletzung des Urheberrechts nicht nachgewiesen werden konnte, obwohl zu erwarten ist, dass der Rio gerade bei MP3 – Kompression von Audio-Daten Übersicht Internet-Usern, die regelmäßig illegale Homepages mit MP3-Downloads aufsuchen, reißenden Absatz finden wird: einfach den neuesten Song aus dem Internet laden, direkt im Speicher des Players verstauen, schon hat man sich den Kauf einer AudioCD erspart. Aber nicht nur Hardware-Hersteller, sondern auch Betreiber dieser illegalen Internet-Seiten, die MP3-Titel zum Download anbieten, sollen von Musikvereinigungen verklagt werden. Manche Plattenfirmen setzen sogar sogenannte WebRobots ein, „Spürhunde“, die im Internet nach Produktpiraten jagen. Leider existiert eine unüberschaubare Flut an gesetzeswidrigen MP3-Seiten, gibt man in einschlägigen Suchmaschinen wie Altavista oder Yahoo! das Stichwort „MP3“ ein, liefert die Suchmaschine eine imposante Liste, es ist unmöglich, alle Seiten zu besuchen. Täglich kommen neue Homepages dazu, die Songs im MP3-Format bereitstellen. Auf der ersten MP3-Konferenz im Juli 1998 in San Diego wurde das Problem der Audiopiraterie eingehend erörtert. Die verschiedenen Interessensvertreter waren übereinstimmend der Überzeugung, Audio-Daten seien nur zu schützen, indem man wirkungsvolle Kopierschutzmaßnahmen wie die digitale Signierung, die es verhindert, dass ein Musiktitel auf mehr als einem Rechner abgespielt wird, anwendet. Eigentlich kommt aber jede Art eines Kopierschutzes zu spät, da die MP3Flut nicht mehr einzudämmen ist. Welche Soundformate in Zukunft allerdings noch erfunden werden, bleibt die große Frage. Wahrscheinlich wird es noch höher komprimierende Verfahren mit CD-ähnlicher Qualität geben – hierbei wäre ein Implementieren von Schutzmechanismen von vornherein geboten. Jedenfalls wird der Ruf nach einem Internet-Urheberrecht immer lauter. Eine entsprechende EU-Richtlinie ist derzeit (Februar 1999) bereits in Ausarbeitung. MP3 – Kompression von Audio-Daten Datenkomprimierung 2. Datenkomprimierung 2.1 Einleitung Datenkomprimierung hat nicht, wie man vielleicht denken kann, in der heutigen Zeit auf Grund der günstigen Preise von Speichermedien wie Festplatten mit 10 oder mehr Gigabyte Kapazität an Bedeutung verloren, sie ist vielmehr unerlässlich im Zeitalter des Internet und der Online-Medien und auch für Backup-Zwecke notwendig. Die begrenzte Bandbreite von Telefonleitungen führt dazu, dass sich Datenübertragungen über das Internet als sehr zeitintensiv gestalten können. Besonders bei großen Dateien kann eine Komprimierung die Übertragungsdauer erheblich senken und dadurch ein wirtschaftlicheres Arbeiten ermöglichen. Daher hat sich im Internet vor allem das „ZIP“-Dateiformat einen Namen gemacht, auch „RAR“, „ARJ“ oder „LZH“ sind Dateiendungen, die auf komprimierte Daten hindeuten. Alle Komprimierungsalgorithmen machen sich den großen Grad an Redundanz, den die meisten Dateien besitzen, zu Nutze. Das bedeutet, dass Dateien mit großer Redundanz einen relativ geringen effektiven Informationsgehalt aufweisen, das sind beispielsweise Textdateien, in denen bestimmte Zeichen sehr häufig vorkommen, oder Bilddateien, die große homogene Flächen mit beispielsweise der gleichen Farbe besitzen. Der Trick bei diesen Algorithmen ist, die redundanten Informationen wegzulassen oder zu vereinfachen und dadurch Speicherplatz einzusparen. Raten von 20% - 50% sind typisch für Textdateien, bei binären Dateien, die ja ausschließlich aus den 2 Bits Null (0) und Eins (1) bestehen, kann man Einsparungen von bis zu 90% erzielen. 2.2 Run-Length-Coding Die einfachste Art, Redundanzen zu kodieren, ist das Run-Length-Coding oder die Lauflängenkodierung. Sie setzt voraus, dass in einer Datei lange Folgen von sich wiederholenden Zeichen vorkommen, wie zum Beispiel AAABBBBBBAAACCCCC. Die Lauflängenkodierung ersetzt nun jede Serie eines Zeichens durch eine einmalige Angabe des Zeichens und eine Angabe der Anzahl der Wiederholungen. Die obige Zeichenfolge wird mit 3A6B3A5C kodiert. Dabei wird allerdings vorausgesetzt, dass die Zeichenfolge nur Buchstaben enthält. Bei binären Dateien kann diese Kodierung MP3 – Kompression von Audio-Daten Datenkomprimierung noch vereinfacht werden, da sich ja die Werte 0 und 1 zwingend abwechseln müssen, es kann daher auf eine Angabe des Zeichens verzichtet werden. Aus 0000011111000011100 wird beispielsweise dann 5 5 4 3 2. Bei geeigneten Dateitypen kann das Run-Lengh-Coding die Größe der Datei beträchtlich reduzieren. Eine Abwandlung der Lauflängenkodierung ist die variable Lauflängenkodierung. Sie analysiert die ganze zu komprimierende Datenmenge und weist dem am häufigsten vorkommenden Zeichen die kürzeste Binärdarstellung, nämlich 0, zu. Das zweithäufigste Zeichen erhält die 1, dann folgt 01, 10, 11 und so weiter. Damit benötigt die Kodierung eines Zeichens nicht mehr 8 Bits, sondern je nach der Häufigkeit nur mehr 1 bis 5 Bits. Zwar muss man die einzelnen Bitfolgen durch Leerzeichen trennen, es lässt sich jedoch mit der variablen Lauflängenkodierung eine größere Komprimierung erzielen als mit dem einfachen Run-Length-Coding. 2.3 Huffman-Codierung Die Huffman-Codierung ist eine verlustfreie Komprimierung, das heißt, dass bei der Umkehrung des Kompressionsvorgangs, also der Dekomprimierung, die ursprünglichen Daten aufs Byte genau wiederhergestellt werden können. Der Huffman-Code ist in zwei Schritte unterteilt. Zuerst werden die Ausgangsdaten eingelesen und analysiert. Der Algorithmus zählt hier die Häufgkeit der einzelnen Zeichen und erstellt dann eine hierarchische Baumstruktur, einen sogenannten Trie. Dazu wird zunächst die Wahrscheinlichkeit eines Zeichens berechnet, mit der es vorkommt. Danach werden die zwei jeweils seltensten Zeichen zu einem Knoten zusammengefasst und mit einer Ja/Nein-Entscheidung versehen, die im binären Bereich mit 0/1 bezeichnet wird. Nach und nach werden alle Knoten zu einem ganzen Baum zusammengefasst, jedes Zeichen bekommt den Binärcode zugeteilt, mit dem es in dem Baum erreichbar ist. Im Prinzip funktioniert der Huffman-Code also wie ein Morsealphabet. Das Beispiel links stellt den Baum der Zeichenfolge „em pe drei“ dar. Am öftesten ist das „e“ vertreten, zweimal das Leerzeichen, alle anderen Zeichen sind einmal vorhanden. Die Binärzahlen unter den Kreisen geben die Huffman-Kodierung und gleichzeitig den Weg von der Wurzel (in diesem Fall MP3 – Kompression von Audio-Daten Der MP3-Algorithmus 10) zu dem gesuchten Zeichen an. Eine 0 steht für eine Abzweigung nach links, eine 1 für eine Abzweigung nach rechts. Nach diesem Schema, das in jeder kodierten Nachricht beigefügt sein muss, können der Komprimierungsvorgang rückgängig gemacht und die Originaldaten wiederhergestellt werden. Der Huffman-Algorithmus findet vor allem in den bekannten Pack-Programmen PKZip oder WinZIP, aber auch ARJ oder LHA Verwendung, wird auch bei der JPEG-Bildkomprimierung benutzt und ist ein entscheidender Beitrag zur Erzielung der erheblichen Dateigrößenverminderung bei der MP3-Kompression. 3. Der MP3-Algorithmus 3.1 Einleitung Die bisher beschriebenen Möglichkeiten der Datenreduzierung arbeiten alle nach dem gleichen Schema, sie komprimieren die Ausgangsdaten nach einem fest vorgegebenen Muster und erreichen damit abhängig vom zu komprimierenden Material meistens ganz ansehnliche Komprimierungsraten. Bei Multimediadaten wie Video- oder Audiodateien und insbesondere bei der MPEG/Audio-Kompression wird jedoch nicht einfach Bytefolge für Bytefolge kodiert, der wesentliche Unterschied liegt darin, dass der Algorithmus die zu kodierenden Daten genauestens analysiert und die geeignetste Komprimierungsmethode ermittelt. Der MP3-Algorithmus ist daher ein sogenannter datensensitiver Algorithmus. Um zu optimalen Ergebnissen zu kommen, nutzt der Algorithmus intensiv die Schwäche der menschlichen Sinne aus, die wissenschaftlich nur mit der Psychoakustik beschrieben werden kann. 3.2 Psychoakustik Diese Wissenschaft beschäftigt sich mit allen akustischen Phänomenen, die mit physikalischen Messmethoden nicht so einfach erfassbar sind. Dazu zählt auch die Lautheit, deren subjektives Empfinden in den seltensten Fällen mit einer reinen Schallpegelmessung übereinstimmt. In der Psychoakustik arbeitet man fast ausschließlich mit streng geschulten und selektierten Testhörern, damit der Durchschnittshörer beim Abspielen kodierter Dateien keine störenden Effekte MP3 – Kompression von Audio-Daten Der MP3-Algorithmus wahrnimmt. Die Ergebnisse aufwendiger Hörtests bilden die Grundlage für allgemeingültige Methoden, um das „Ohr übers Ohr hauen zu können“. Die unterste Kurve in dem Diagramm stellt die links sogenannte Hörschwelle dar, der Schalldruck (dB) leiseste Ton, der vom menschlichen Ohr noch wahrgenommen werden kann. Die oberste Kurve veranschaulicht Frequenz (kHz) einen Ton von 1 kHz mit 80 dB, der die Hörschwelle drastisch verändert. Ein Ton mit beispielsweise 40 oder 20 dB wird von dem lauteren vollständig überdeckt, weshalb man ihn vollständig weglassen kann. Genau dieses Prinzip der simultanen Maskierung macht sich ein MP3-Encoder zu Nutze. Aber auch auf der zeitlichen Ebene lassen sich Signale verdecken, wie es bei der Vor- und Rückwärtsmaskierung der Fall ist. Das Ohr benötigt nach einem lauten Geräusch eine sogenannte „Recovery Time“, bis es wieder voll funktionsfähig ist und Signale wieder hören kann. Daher setzt der Algorithmus nach einem lauten Signal (oder GaussImpuls) eine psychoakustische Vorwärtsmaskierung an, deren Länge vom Schalldruck des Geräusches abhängt. Die Informationen in diesem Bereich sind daher unhörbar und können ebenfalls weggelassen werden. Nicht nur nach einem lauten Signal sind verdeckte, also maskierte Daten enthalten, auch kurz vor einem solchen Signal kann man Einsparungen vornehmen. Diese Informationen gewinnt der Algorithmus aus der Analyse der digitalen Filterbänke, die er im Anschluss daran mit einer Art Datenbank vergleicht, die alle MP3 – Kompression von Audio-Daten Der MP3-Algorithmus Arten der Maskierung erkennt. Das Ermitteln der besten Maskierungsmöglichkeit ist sehr zeitaufwendig und hauptsächlich verantwortlich für die lange Dauer eines Encoding-Vorganges. Das Input-Audio-Signal, auch Bitstream genannt, wird in diesem Teil des Vorganges in 32 exakt gleich große Unterkanäle geteilt und anschließend analysiert. Der Kanal, der die wenigsten Maskierungsmöglichkeiten bietet, legt die Anzahl der Datenbits fest, die beim nachfolgenden Quantisierungsprozess verwendet werden. 3.3 Quantisierung Der durch die Filterbankanalyse errechnete Quantisierungsfaktor bestimmt in der Quantisierung den Informationsverlust und führt daher zur Datenreduktion. Mehrere benachbarte Werte werden durch einen neuen Wert ersetzt, indem die Koeffizienten durch einen Quantisierungsfaktor q(u,v) geteilt und auf den nächsten Integerwert (ganzzahliger Wert) gerundet werden. Folgende Gleichung wird dabei verwendet: 1 F u, v F Q (u, v) 2 qu, v Anschließend wird der quantisierte Wert mit dem Quantisierungsfaktor multipliziert und die Gleichung dadurch umgekehrt. So fallen bei dieser Hin- und Rückrechnung die von der Psychoakustik ermittelten unhörbaren Frequenzen weg, wenn der Quantisierungsfaktor korrekt gewählt wird. Im Anschluss an die Quantisierung werden die 32 Unterkanäle zusammengefasst und wieder in einen geschlossenen Bitstream geschrieben. Auf dem unten abgebildeten, stark vereinfachten Schema für die MPEG/Audio-Kompression sind die bisher beschriebenen Arbeitsschritte abgebildet. Digitales Audiosignal Analyse der Filterbänke Quantisierung Zuweisung der optimalen Maskierungsmethode Zusammenfassung des Bitstreams Codiertes Ausgangssignal Simultane Maskierung Vor- und Rückwärtsmaskierung Stereo-Maskierung (Joint Stereo) MP3 – Kompression von Audio-Daten Der MP3-Algorithmus Diese Methoden der Kompression reichen aus, um die Bitrate und damit die Komprimierungsrate auf 256 kbps bis 192 kbps mit Layer-2 zu drücken. Das Ziel bei der Entwicklung von Layer-3 war jedoch eine noch stärkere Komprimierung bis zu 8 kbps, die zwar nur mehr Telefonqualität bietet, dafür aber eine Rate von 1:96 aufweist. Auch der Kompromiss zwischen Platzbedarf und Qualität wird von Layer-3 ausgezeichnet gemeistert, indem er eine Bitrate von 128 kbps möglich macht. Der Schlüssel zu dieser stärkeren Kompression ist die Diskrete Cosinus-Transformation. 3.4 Layer-3 Die Diskrete Cosinus-Transformation (DCT) ist neben der Fourier-Transformation ein unentbehrliches Hilfsmittel in der Signalverarbeitung. Diese Operationen finden in der „Harmonischen Analyse“ Verwendung und transformieren Funktionen vom Raumbereich in den Frequenzbereich. Durch diese „Frequenzanalyse“ werden Signale „bearbeitbarer“. Die DCT verfügt mittlerweile über recht schnelle Algorithmen, auch gestaltet sich die Umkehrungsrechnung sehr einfach und hilft, die CPU-Belastung beim Decoden weiterhin gering zu halten. Beim Layer-3 wird nach der Aufteilung des Input-Audio-Signals in 32 Unterkanäle im Rahmen der Analyse der Filterbänke eine leicht abgewandelte Diskrete Cosinus-Transformation (MDCT) verwendet, durch die unerwünschte Faktoren, die bei der Analyse der Filterbänke zwangsläufig anfallen, auf ein Minimum reduziert werden. Diese Faktoren ergeben sich aus der Überlappung der Kanäle und werden „Artefakte“ genannt. Durch eine in Layer-3 festgelegte Verarbeitung der MDCT-Werte können diese Artefakte aus dem Bitstream entfernt werden. Auch in den nachfolgenden Operationen wie der Quantisierung bringt es Vorteile, dass MDCT-Werte gebildet wurden, da das Quantisieren nun einfacher vonstatten geht. Ein weiterer Unterschied des Layer-3 zu den vorhergehenden Layer-1 und Layer-2 ist die abschließende Kompression des Bitstreams mit der in Punkt 2.3 beschriebenen Huffman-Codierung. Nach der Quantisierung werden die MDCTKoeffizienten in einer vorherbestimmten Reihenfolge nach ansteigender Frequenz sortiert und in 3 „Regionen“ aufgeteilt, die mit unterschiedlichen Huffman-Bäumen verarbeitet werden können, die an die Werte in den jeweiligen Regionen angepasst sind. MP3 – Kompression von Audio-Daten Anwendung 4. Anwendung 4.1 MP3-Programme Da MP3 ein sogenannter offener Standard ist, das heißt, dass die Decoding-Engine frei verfügbar ist und in Programmen beliebig eingesetzt werden darf, gibt es vor allem im Internet eine Vielzahl von mehr oder weniger professionellen Applikationen, die sich alle mit den vielen Funktionen und Möglichkeiten der MP3-Komprimierung beschäftigen. Sogar Microsoft hat mit der Lizenzierung von MP3 einen großen Schritt zur Verbreitung gesetzt, da die De- und Encodier-Routine mit Netshow auf jeder aktuellen Windows-Installation zur Verfügung steht. Der Encoder ist zwar auf 56 kBit/s beschränkt, der Decoder kann jedoch alle Modi von 8 bis 320 kBit/s verarbeiten. Durch die Implementierung von MP3 im neuen Media Player ist sogar Streaming standardmäßig möglich, eine Datei wird nicht erst komplett aus dem Netz heruntergeladen, sondern sofort abgespielt. Sogar Macromedia Shockwave oder Music-On-Demand (MOD) der Deutschen Telekom, von denen gar nicht bekannt ist, dass sie MP3-Komprimierung verwenden, nutzen diese Technologie, um eine bessere Soundqualität zu erzielen. Zur MP3-Software zählen die Player zum Abspielen, die Encoder zum Erzeugen der MP3-Dateien und diverse andere Sparten wie die Playlist-Maker zum Erstellen und Verwalten von Song-Archiven oder ID3-Tagger zum Bearbeiten der ID3-Tags. Der erste Schritt, der zu einer MP3-Datei führt, ist das Auslesen der CD-Audio-Tracks mit einem sogenannten CD-Ripper, der aus den Tracks Wave-Dateien herstellt. Zu der MP3-Software gehören weiters die Decoder, die den Komprimierungsvorgang wieder rückgängig machen, und die Front-Ends für verschiedene Encoder. 4.1.1 Player MP3-Player besitzen ähnliche Funktionen wie ein CD-Player: Start- und Stoptaste, Tasten, um den vorherigen oder nächsten Songtitel abzuspielen, sowie eine Pausetaste. Sehr in Mode gekommen sind auch die sogenannten Playlists, denen man mehrere MP3-Dateien hinzufügen kann, um sie ähnlich einer Datenbank zu verwalten. Sie sollten daher auch zur Standardausstattung eines jeden Players MP3 – Kompression von Audio-Daten Anwendung gehören. Während MP3-Dateien abgespielt werden, führt der Anwender oft andere Arbeiten am PC aus. Daher ist eine möglichst geringe CPU-Auslastung ein Kriterium für die Qualität der Decoding-Engine und damit des Players. Im Gegensatz zur Komprimierung ist für das Abspielen nicht so viel Rechenleistung nötig. Unter den zahllosen MP3-Playern ist zweifellos WinAmp am beliebtesten. Der Name ist aus dem Vorgängerprogramm von WinAmp abgeleitet und bedeutet soviel wie „Advanced Module Player for Windows“. Nicht nur das MP3-Format wird von Winamp verstanden, auch andere Soundformate wie WAV, MOD, MIDI oder CD-Audio kann der Player abspielen. WinAmp ist vollgestopft mit Funktionen und eigentlich ein „Allroundtalent“ für alles, was MP3-Dateien angeht. WinAmp bringt auch einen Playlist-Editor mit, durch den sich das Organisieren und Zusammenfassen von Songtiteln recht einfach und komfortabel gestaltet. Außerdem verfügt WinAmp über einen graphischen 10-Band-Equalizer, der es dem Benutzer gestattet, FrequenzHöhen und –Tiefen den eigenen musikalischen Vorlieben anzupassen (siehe Bild). Ein besonderes Feature von WinAmp ist der sogenannte Plug-In-Support. Durch den Einsatz von solchen ist der Player um viele Funktionen erweiterbar, PlugIns werden entweder für grafische Effekte, veränderte Soundausgabe oder vereinfachte Bedienung verwendet. Manche Effekt-Plug-Ins sind aufwendig programmiert und verlangen für die Grafikpracht sogar eine 3Dfx- oder Direct3Dkompatible Grafikkarte. Als Beispiel wäre hier das „Dancing Coke Can – Plug-In“ zu nennen. Eine Coladosa tanzt 3D-unterstüzt zur Musik auf dem Parkett. Tolle Lichteffekte und eine rasante Kameraführung machen dieses Plug-In zum Favoriten auf fast jedem System. Eine Vielzahl von Plug-Ins beschäftigt sich mit dem Verändern von Geschwindigkeit oder Pitch des aktuellen Songs. Es gibt auch Möglichkeiten, WinAmp neue Dateiformate abspielen zu lassen, mit dem entsprechenden Plug-In kann man auch VQF- oder AAC-Lieder anhorchen. Ein weiterer Vorteil des WinAmp gegenüber anderen Playern besteht im Einsatz von sogenannten Skins. Ein Skin ist ein Satz von kleinen Bildern, mit dem die Benutzeroberfläche neu definiert wird. Im Internet sind zahlreiche dieser Skins vertreten. WinAmp verfügt auch über einen einfach zu bedienenden ID3-Tag-Editor. ID3-Tags sind Nicht-Musik-Daten, die in den letzten 128 Byte des Songs zu finden MP3 – Kompression von Audio-Daten Anwendung sind. Hier kann der Benutzer Informationen wie den Titel des Stücks, den Namen des Interpreten, des Albums und einen persönlichen Kommentar eingeben. WinAmp’s Prozessorbelastung hält sich mit 4% erstaunlich niedrig, da die neue Decoding-Engine von Nitrane verwendet wird. Somit läuft WinAmp beim Arbeiten am Computer dezent im Hintergrund und schlägt nicht mit merklichen Geschwindigkeitseinbußen zu Buche, auf langsamen Rechnern sollte man jedoch auf Visualisierungsmöglichkeiten verzichten und das VU-Meter abschalten. Alternativ kann man die Sample-Rate beim Decodieren halbieren oder von Stereo zu Mono wechseln, um die Performance zu steigern. Winamp ist Shareware und sollte nach 14 Tagen Testzeit beim Entwickler Nullsoft registriert werden. Ein anderer interessanter Player ist Sonique von Night 55. Er kann mit der intuitivsten Benutzeroberfläche aufwarten und übt einen großen grafischen Reiz auf das Auge aus. Er bietet fast alle Funktionen, über die auch WinAmp verfügt, nur Plug-In- und Skin-Support sucht man hier vergeblich, Plug-Ins werden aber voraussichtlich ab der nächsten Sonique-Version unterstützt werden. Die Playlist des Sonique-Players ist nicht so komfortabel zu benutzen wie die von WinAmp, dafür hat Sonique einen Pitch-Controller, mit dem man wie ein DJ beim Scratchen lustige Effekte generieren kann. Im Internet kursieren noch massenweise andere Player, täglich kommen neue hinzu, sie unterscheiden sich jedoch meistens nur im Design und haben fast alle die gleichen Funktionen. Als Beispiele seien hier NAD, einer der ersten MP3-Player, Soritong, K-Jöfol, WinJEY, Apollo oder MusicDeck genannt. 4.1.2 CD-Ripper Um Musik auf den Computer zu übertragen, benötigt man erstens ein CD-ROMLaufwerk und zweitens ein Programm, das in der Lage ist, diese Audio-Daten 1:1 auszulesen. Solche Programme nennt man CD-Ripper, CD-Grabber oder CDDAReader. CDDA steht für Compact Disk Digital Audio und bedeutet, dass es sich um auf einer CD gespeicherte digitale Audiodaten handelt. Ein kleiner Blick hinter die Kulissen einer Audio-CD verrät, dass die Daten einer Audio-CD in Blöcke von 2352 MP3 – Kompression von Audio-Daten Anwendung Byte aufgeteilt sind. Genau 75 dieser Blöcke ergeben eine Sekunde Musik. Für das Übertragen der Daten auf den PC ist der Windows-Soundrecorder aus zwei Gründen ungeeignet, zum ersten geht Qualität verloren, da beim Abspielen eine Komponente im CD-ROM-Laufwerk eine D/A-Wandlung vornimmt, das heißt, die Daten werden von digital in analog konvertiert. Beim anschließenden Aufnehmen wird der Vorgang von der Soundkarte wieder rückgängig gemacht, und die Signale werden wieder in digitale Daten umgewandelt. Da diese D/A- und A/D-Wandler die teuersten Komponenten in CD-Laufwerken und Soundkarten sind, erreichen sie hier nur selten eine ähnliche Qualität wie HiFi-Anlagen. Daher empfiehlt sich zum Auslesen von Audio-Daten ein CD-Grabber, da dieser die Signale unverändert digital übernimmt und daher die gleiche (CD-)Qualität (44kHz, 16Bit, Stereo) beibehält. Am bekanntesten ist sicher der Audiograbber von Jackie Frank. Er ist nicht zuletzt wegen seiner benutzerfreund-lichen Oberfläche im Internet oft als beliebtester Ripper angepriesen, auch seine technischen Qualitäten wissen jedoch zu überzeugen. Audiograbber bietet vielfältige Einstellungsmöglichkeiten, zum Beispiel existiert die Möglichkeit, verschiedene Rip-Methoden anzuwenden. Standardeinstellung ist die sogenannte „Buffered Burst Copy“-Methode. Hier werden die 2352-Byte-Blöcke einfach nacheinander ausgelesen. Diese Methode ist die schnellste, jedoch nicht die zuverlässigste. Manche CD-ROM-Laufwerke unterstützen nämlich hardwareseitig keine Jitter-Correction. Jitter entsteht, weil der Red-Book-Standard für Audio-CDs keine genauere Positionierung des Lese-Lasers als 1/75 Sekunde vorsieht. Beim Speichern von Audio-Tracks auf die Festplatte reißt bei den angesprochenen Laufwerken der kontinuierliche Datenstrom ab, hässliche „Knackser“ entstehen. Die einzige Lösung besteht in der Jitter-Correction, bei der eine Überlappung der Blöcke um mindestens 1/75 Sekunde vorgenommen wird. CD-Laufwerke von Plextor können das von Haus aus, bei anderen Modellen muss man auf die zweite RipMethode von Audiograbber zurückgreifen, den „Dynamic Synch Width“, der diese Überlappung softwareseitig kontrolliert. Die Auslesegeschwindigkeit verringert sich dadurch natürlich dramatisch. Der Audiograbber kann aber mehr als das, auch weitere Benutzerunterstützungen sind vorhanden, beispielsweise kann der Ripper mit CDDB-Support glänzen, was bedeutet, dass er in der weltgrößten Online-CDDatenbank unter der Internetadresse www.cddb.com anhand einer berechneten CDId-Nummer die Titelnamen der aktuell eingelegten CD nachschlägt. Den MP3 – Kompression von Audio-Daten Anwendung ausgelesenen WAV-Dateien gibt Audiograbber gleich die korrekten Dateinamen anhand dieser Informationen. Sogar das Normalisieren eines Tracks ist möglich. Weiters gibt es Möglichkeiten zur Einbindung eines MP3-Codecs in Audiograbber, mit diesem ist der Ripper imstande, WAV-Dateien umgehend in MP3-Files umzuwandeln. Es existiert auch eine Sonderform des Audiograbbers, der AudioCatalyst, der in Zusammenarbeit mit Xing Technologies entstand. Der AudioCatalyst ist von der CDDA-Technik identisch mit dem Audiograbber, wurde jedoch von Xing mit deren Encoder, der zur Zeit als der schnellste gilt, erweitert. Andere empfehlenswerte Ripper sind der Easy CD-DA-Extractor, WinDAC oder Digital Audio Copy. Die neueste Entwicklung besteht aus einem einzigen VXDGerätetreiber und heißt CDFS.VXD. Man ersetzt einfach die vorhandene Datei im Windows-System-Verzeichnis und kann sich über eine veränderte Anzeige von Audio-CDs im Windows-Explorer freuen. Die einzelnen Tracks stehen nun in verschiedenen Sample-Raten und Bitqualitäten als WAV-Dateien zur Verfügung und müssen nur noch per Drag-und-Drop an eine beliebige Stelle auf der Festplatte kopiert werden. Der virtuelle CDFS-Gerätetreiber erreicht hier Rekord- Auslesegeschwindigkeiten von 16-fach auf einem 32x-CD-ROM-Laufwerk, der Audiograbber kommt hier nur auf magere 8-fache Geschwindigkeit. Es ist auch möglich, MP3-Dateien direkt von der Audio-CD zu erstellen, was derzeit die schnellste Möglichkeit ist, an MP3-Titel zu kommen. 4.1.3 Encoder Als Encoder werden die Programme bezeichnet, die den unter Punkt 3 beschriebenen Kompressionsalgorithmus durchführen und damit eine MP3-Datei erzeugen. Der Markt wird auf der einen Seite dominiert von den Encodern der Firma Opticom, dem Ableger und Vertriebspartner des Fraunhofer Institutes für Integrierte Schaltungen. Opticom hat jedoch durch Xing Technologies harte Konkurrenz bekommen. Deren MP3-Encoder gilt als der schnellste im Internet erhältliche Umwandler. Es gibt zwar noch viele weitere Encoder, die meisten sind Share- oder Freeware und verwenden die frei erhältlichen ISO-Codecs, die natürlich bei weitem nicht so ausgereift sind wie die aktuellen Codecs von Xing oder eben Opticom. Deren neuestes Produkt nennt sich .mp3 Producer Professional und ist als der MP3 – Kompression von Audio-Daten Anwendung beste Encoder im Internet bekannt. Leider ist die Benützung nicht ganz billig, bis zu 200 US-$ werden für die Registrierung der Profi-Version verlangt, die „AdvancedPlus-Version“ kommt auf 50 $, sie ist jedoch in der Funktionsweise wesentlich eingeschränkt und bietet beispielsweise kein Low-Compression-Encoding mit Bitraten von 192 oder 256 kbps. Beide Versionen glänzen jedoch mit einer benutzerfreundlichen Oberfläche und verfügen seit der Version 2.0 auch über einen „Batch-Processor“, der beliebig viele WAV-Dateien nacheinander umwandelt. Der Producer basiert auf den Routinen der Fraunhofer Gesellschaft und garantiert so die ausgereifteste Technik, die zur Zeit in einem Encoder implementiert ist. Um die Standard-Bitrate von 128 kbps zu erreichen, verwendet der .mp3 Producer zum einen die psychoakustische Maskierung, womit er schon eine Komprimierung von 1:5 bei CD-Qualität erreicht, zum anderen wendet er das „Joint Stereo Coding“ an. Das menschliche Ohr kann nämlich die Stereokanäle bei tiefen Tönen nicht orten, bei mittleren Tönen ergibt sich die Richtung aus den verschiedenen Zeitpunkten, an denen die Signale beim linken und rechten Ohr eintreffen. Bei hohen Frequenzen ist der Stereoeindruck nur noch durch den Lautstärkeunterschied nach-vollziehbar. Den gleichen Eindruck kann der Fraunhofer-Encoder auch mit dem „Joint Stereo“Verfahren erzeugen. Dabei zerlegt er das Stereo-Signal in ein Mittensignal, das durch Addition des linken und rechten Kanals gebildet wird, und ein Seitensignal, das durch Subtraktion der beiden Kanäle entsteht. Da das Seitensignal sehr viel weniger Informationen enthält, ergibt sich verglichen mit zwei vollwertigen L- und R-Kanälen eine stark reduzierte Datenmenge, mit der sich die Komprimierungsrate auf 1:10 bis 1:12 drücken lässt. Um Audiodaten noch stärker komprimieren zu können, kommt beim .mp3 Producer das sogenannte „Intensity Stereo Coding“ zum Einsatz. Die Datenmenge beläuft sich dabei nur mehr auf einen Summenkanal (L+R) und Richtungsinformationen. Es lassen sich zwar hier Bitraten von 64 kbps erreichen, der komprimierte Titel unterscheidet sich dann aber merklich vom Original. Der Encoder von Opticom erzeugt erfahrungsgemäß mit dieser Technik MP3-Dateien von hervorragender Qualität, nur der Zeitaufwand ist noch verhältnismäßig hoch, zum Encoden eines 4-Minuten-Titels kann man auf einem Pentium 133 eine halbe Stunde einplanen, ab einem Pentium II mit 300 MHz läuft der Vorgang in Echtzeit ab. Bis zu 8 Mal schneller ist laut Xing Technologies ihr Produkt, der Xing MP3 Encoder. Er ist über das Internet für nur 20 US-$ erhältlich und bietet weit-gehend MP3 – Kompression von Audio-Daten Anwendung die gleichen Funktionen wie der .mp3 Producer. Ein integrierter Batch-Processor, Drag&Drop-Support und die rasante Arbeitsgeschwindigkeit lassen die Konkurrenz zum Opticom-Produkt verständlich erscheinen. In der Praxis benötigt der Xing MP3 Encoder für den gleichen 4-Minuten-Song auf einem Pentium II mit 333 MHz und 64 MB RAM nur mehr ca. eine Minute. Bei dem Xing Encoder kann man die Bitrate und die daraus resultierende Komprimierungsrate in einem sogenannten Profile-Editor festlegen, der von Haus aus über vordefinierte Profile verfügt, die sich verändern und erweitern lassen. Die Xing-Encoding-Routine benötigt für eine Bitrate von 128 kbps kein Joint Stereo, da die Maskierung „oberflächlicher“ vorgenommen wird und sie hier schon einen höheren Kompressionsfaktor erreicht. Dadurch muss man geringe Qualitätseinbußen in Kauf nehmen, die aber nur messtechnisch von Bedeutung sind, einem geschulten Ohr dürfte der Unterschied ebensowenig auffallen wie dem HobbyHörer. Es gibt auch eine Möglichkeit, den Xing MP3 Encoder in CD-Ripper oder andere Frontends einzubinden, indem man den beigefügten Command-Line-Encoder, der im DOS-Modus arbeitet, angibt. MP3 – Kompression von Audio-Daten Anwendung 4.1.4 Sonstige Programme In die Rubrik „Sonstige Programme“ fallen hauptsächlich ID3-Tagger. Sie dienen zum Bearbeiten des ID3-Tags, der am Ende einer jeden MP3-Datei positioniert ist. Der ID3-Tag ist kein offiziellen Standard, sondern wurde von privaten Internet-Usern vorgestellt. Daher entstammen auch die meisten Programme, die sich mit dem Thema ID3-Tag beschäftigen, der Tastatur von Hobby-Programmierern. Wozu manche von diesen fähig sind, demonstriert eindrucksvoll Nightmare’s ID3-Tagger. Er ist ein leistungsfähiges Tool, mit dem man ganze Verzeichnisse mit MP3-Dateien anhand der ID3-Tags der Songtitel umbenennen kann, auch das Schreiben von ID3Tags anhand der Namen beherrscht der Tagger. Weiters verfügt er über Funktionen zum Export von Info- oder Playlisten. Für Besitzer von CD-Brennern interessant ist MPEG DJ GoWave! von XAudio. Es macht im Grunde nichts anderes als ein MP3-Player, es schickt die Daten jedoch nicht über die Soundkarte, sondern schreibt die Informationen in eine WAV-Datei auf die Festplatte, diese Datei kann anschließend auf eine Audio-CD gebrannt werden. Auch zum Bearbeiten eines Songs benötigt man einen solchen Decoder, da aktuelle Sound-bearbeitungsprogramme nichts mit MP3-Dateien anfangen können. Eine Ausnahme: mit der Vollversion des Fraunhofer-Codecs ist der Windows- Soundrecorder auch zum Editieren von MP3-Dateien geeignet. 4.2 MP3 Hardware Eigentlich besteht die einzige Möglichkeit, MP3-Dateien anzuhören, darin, einen entsprechenden Player am Computer zu laden und den Song zu öffnen. Findige Entwickler arbeiten jedoch schon seit einiger Zeit an der Einbindung der MP3Technologie in Erfindungen, die entweder wie traditionelle Walkmans arbeiten, andere sind für den Einbau ins Auto gedacht. Von den meisten Produkten existieren erst Prototypen, der einzige sich im Verkauf befindliche und in Deutschland erhältliche Player gehört zu den portablen Geräten und ist unter dem Namen Rio bekannt. MP3 – Kompression von Audio-Daten Anwendung Diamond Multimedia stellte mit dem Rio PMP300 diese Revolution auf dem AudioMarkt vor. Auf den ersten Blick mutet das Gerät wie ein Walkman oder Mini-DiscPlayer an, alle üblichen Bedientasten wie Play, Stop, Pause sowie Vorwärts und Rückwärts sind vorhanden, es existieren auch Buttons für Repeat, Random, auch einen Equalizer hat Diamond auf dem Rio untergebracht. Einzig das minimale Gewicht und die kompakte Größe lassen den Benutzer merken, dass er es hier mit einem besonderen Stück Technologie zu tun hat. Der Rio verfügt über 32 MB internen Speicher auf einer eingebauten Flash-Memory-Card, die über ein mitgeliefertes Kabel, das mit einem Adapter am parallelen Druckerport des Computers angeschlossen wird, mit MP3-Titeln bestückt wird. Dieser Vorgang geschieht mit der komfortablen „Rio Manager“-Software, die mit einem Datendurchsatz von 6 MB in der Minute bis zu 10 Songs in 6 Minuten auf dem internen Rio-Speicher unterbringt. In der Standardqualität 128 kbps in 44 kHz, Stereo, kann man so etwa eine halbe Stunde Musik mit sich herumtragen. Es besteht jedoch die Möglichkeit, den Rio mit externen Flash-Karten, die zur Zeit mit einer Kapazität von 16 – 32 MB erhältlich sind, zu erweitern. Mit einer solchen 32-MBKarte im Slot haben bis zu 60 Minuten MP3-Musik im Rio Platz. Ein weiterer Vorteil des Rio zu herkömmlichen Walkmans oder Discmans ist die absolute Unempfindlichkeit gegenüber Stößen und harten Bewegungen, da die Technik des MP3-Players keine beweglichen oder mechanischen Teile enthält. Dadurch wird auch die Energieversorgung des Rio auf einem erstaunlich niedrigen Niveau gehalten, mit einer einzigen 1,5-Volt-Batterie ergibt sich eine Spieldauer von bis zu 12 Stunden. Im Lieferumfang des 70 Gramm leichten Gerätes, das mit Maßen von ca. 8 x 6 cm kleiner als eine Zigarettenschachtel ist, befinden sich außerdem Kopfhörer, ein hervorragendes Handbuch, das auch genauer auf Details der MP3Kompression eingeht, und die renommierte Software „MusicMatch Jukebox“, die ein All-In-One-Programm ist und Encoder, Player und Manager in sich vereint. Die einzigen Nachteile des Rio MP3-Players sind der mit 299,- DM noch recht hoch angesetzte Preis, der den Vergleich mit Walkmans nur wegen der ausgezeichneten Soundqualität nicht scheuen muss. Ferner ist der Rio in Deutschland noch zu wenig bekannt, um bisher hohen Absatz finden zu können. Die MP3-Dateien zur Bespeicherung der Flash-Karten werden entweder von eigenen CDs erstellt oder von speziell eingerichteten Internet-Seiten wie www.rioport.com oder www.mp3.com downgeloadet. MP3 – Kompression von Audio-Daten Anwendung Eine andere interessante Entwicklung kommt aus Taiwan und hört auf den Namen CD-MP, was schon viel über die Spezifikationen des für Sommer 1999 angesagten Produktes aussagt. Der CD-MP von Naiam benutzt statt Flash-Memory-Karten als Medium handelsübliche CD-ROMs, was zwar einen CD-Brenner voraussetzt, dafür aber eine Kapazität von 650 MB ermöglicht. Anders gesagt, verarbeitet der CD-MP CDs mit bis zu 175 MP3-Titeln, was einer Spieldauer von 10 – 12 Stunden entspricht. Auch normale Audio-CDs und sogar CD-RWs (wiederbeschreibbare CDROMs) kann der CD-MP abspielen. Ein ganz neuer Trend bei den MP3-Hardware-Playern ist der Player für das Auto. Das Mitführen von großen CD-Mengen im Auto entfällt, und der Kauf eines teuren CD-Wechlers gehört der Vergangenheit an. Ein sehenswertes Produkt hat empeg mit dem empeg car im Programm. Der 950 US-$ teure Player ist genau wie ein herkömmliches Autoradio dimensioniert und eignet sich daher zum Einbau in jedes Auto. Der empeg car arbeitet mit einer 2,5 Zoll großen Laptop-Festplatte mit serienmäßig 2,1 GB Speicherkapazität, die stoßsicher aufgehängt ist. Gegen einen Aufpreis bietet empeg auch Festplatten mit bis zu 28 GB Platz an. Bestückt wird der Car-Player mittels der sich im Lieferumfang befindlichen Windows-Software, die MP3-Dateien wahlweise über den seriellen oder den USB-Port des PCs auf die Festplatte des Players schickt. Der empeg car verfügt weiters über einen FM-Tuner, mit dem sogar Radioprogramme empfangen werden können. 4.3 Internet Radio Da mit dem MP3-Format das sogenannte Streaming möglich ist, das heißt, dass eine Datei nicht vollständig vorliegen muss, um sie anhören zu können, eröffnen sich ganz neue Möglichkeiten der Audio-Verarbeitung. MP3-Dateien können durch das Streaming unmittelbar abgespielt werden, wenn man sie im Internet wählt, man muss sie nicht erst komplett herunterladen. Diese Tatsache machen sich einige Radiostationen wie beispielsweise Radio Moi zu Nutze. Auf der Internet-Seite www.musicmusicmusic.com erfolgt zuerst eine Anmeldung, bei der der Benutzer persönliche Informationen eingibt sowie die gewünschte Musikrichtung wie zum Beispiel Rock & Roll, Blues, Klassik oder Musik der 90er auswählt. Außerdem muss MP3 – Kompression von Audio-Daten Anwendung man seine e-mail-Adresse und die Art der Verbindung (36k-Modem, 56k-Modem, ISDN ohne Kanalbündelung, ISDN mit Kanalbündelung oder Standleitung) angeben. Diese Informationen legen die Qualität fest, mit der Musik abgespielt wird. Anschließend wird eine abgewandelte Version des Players WinPlay3, des MP3Players von Opticom, der in dieser Version auch das Streaming unterstützt, downgeloadet. Per e-mail bekommt man dann eine Playlist zugeschickt, die WinPlay öffnen kann, schon kann man die Musik live aus dem Internet zu hören. Der große Vorteil eines solchen Online-Radios ist, dass man durch einen Klick auf die Titelwahltaste einfach zum nächsten Song wechseln kann, außerdem bekommt man in einem Extra-Fenster Informationen zum aktuellen Musiktitel eingeblendet, Name und Interpret sowie Vertriebsinformationen können hier abgelesen werden. Der Nachteil bei Radio Moi ist, dass die Soundqualität bei einem Standard-Modem wie auch bei ISDN noch relativ unbefriedigend ist, da die Verbindungsgeschwindigkeit nur in den seltensten Fällen ausreichen würde, um eine bessere Qualität zu empfangen. Bei einem 33k-Modem ist das Radioprogramm sogar nur in 11kHz und 16 kbps verfügbar, selbst hier kommt es noch manchmal zu störenden Aussetzern, die die Klangqualität merklich trüben. Echtzeit-MP3-Codecs finden jedoch nicht nur bei Radio Moi Verwendung, sondern werden auch für andere Live-Übertragungen via ISDN benutzt. So werden beispielsweise Interviews oder Live-Statements nicht mehr über die Telefonleitung gesendet, sondern über ISDN, was gleich teuer ist und sogar CD-Qualität ermöglicht. Störendes Rauschen, das typisch für Telefongespräche ist, fällt gänzlich weg, wenn man MP3-Kompression einsetzt. In Versuchsanordnungen wurden solche Sendungen bereits realisiert, zum Beispiel verwendeten alle privaten Radiostationen Deutschlands während der Olympischen Winterspiele in Albertville (Frankreich, 1992) sehr erfolgreich Layer-3-Codecs für die Übertragung der Reporterkommentare zwischen den einzelnen Sportstätten und dem zentralen Studio in Meribel. Eine andere Möglichkeit von Echtzeit-Layer-3-Codecs kam beim Internationalen MusikFestival in Bergen 1992 zur Anwendung, so spielte ein Organist ein selbstkomponiertes Orgelwerk in der Kirche von Trondheim, während das begleitende Orchester in Bergen stationiert war. Die Orgelmusik wurde mittels ISDN und MP3-Kompression nach Bergen übertragen. Die wohl eindrucksvollste und global gesehen gewichtigste Anwendung von Layer-3Codecs ist das ehrgeizige WorldStar-Projekt, das von der WorldSpace-Gesellschaft MP3 – Kompression von Audio-Daten Anwendung ins Leben gerufen wurde. Das Ziel ist die Ausstrahlung von Radioprogrammen, die drei Viertel der Weltbevölkerung empfangen können sollen. Die Sendungen sind mit MPEG Layer-3 kodiert. Dazu verwendet WorldStar drei Satelliten, AfriStar, CaribStar und AsiaStar, die über den jeweiligen Kontinenten in einer geostationären Umlaufbahn im Orbit kreisen sollen und auch in Gebieten, die geographisch ungünstige Voraussetzungen für den Radioempfang bieten, kristallklare Radioprogramme in CD-Qualität zur Verfügung stellen sollen. Der AfriStar-Satellit wurde am 28. Oktober 1998 mit einer Ariane-4-Rakete in den Weltraum befördert und deckt nun das Gebiet über Asien ab. Jeder Satellit wird von einer Bodenstation aus gesteuert und mit Radioprogrammen bestückt. Der Satellit teilt diese Inputs anschließend in 96 Einzelkanäle mit jeweils 16 kbps auf, die auch gebündelt werden können, was eine Qualitätssteigerung mit sich zieht. So werden zum Beispiel für die Übertragung eines Konzerts oder von Musik 8 Kanäle gebündelt, um eine CDQualität zu erzielen, zusammengefasst, um für Nachrichtensendungen dafür 4 verschiedene werden Sprachen nur zu 2 Kanäle ermöglichen. Selbstverständlich kann man diese Radiosendungen nicht mit traditionellen Radioempfängern genießen, die bedeutenden Firmen Panasonic, Sanyo, JVC und Hitachi haben sich aber schon die Rechte an besagten Radiogeräten gesichert und bereits entsprechende Empfänger vorgestellt. Die Signale werden von einer MiniaturSatellitenparabolantenne aufgefangen und von einem implementierten Decoder in Klänge umgewandelt, wodurch die hervorragende Soundqualität des WorldStarProjektes erhalten bleibt. Der Abschuss der beiden anderen Satelliten, CaribStar und AsiaStar, ist für den Herbst 1999 geplant und dürfte zur weiteren Verbreitung des MP3-Standards sein Übriges beitragen. MP3 – Kompression von Audio-Daten Anhang: Literaturliste 5. Zusammenfassung und Ausblick Der ISO MPEG/Audio Layer-3, kurz MP3, hat seit Anfang 1998 massive Verbreitung gefunden, da er ausgezeichnete Tonqualität auf CD-Niveau, eine bestechende Komprimierungsrate von 1:12, die er durch ausgereifte Algorithmen erreicht, und eine gute Akzeptanz bei Computer- und Internet-Usern vereint. Die Basis für die MPEG/Audio-Komprimierung im Allgemeinen bildet die Psychoakustik. Der Algorithmus ermittelt in einem aufwendigen Rechenvorgang Frequenzen, die entweder vom menschlichen Ohr nicht wahrgenommen werden können oder von anderen (lauteren) Tönen verdeckt (=maskiert) werden. Diese Frequenzen werden anschließend herausgefiltert und aus dem Datenbereich entfernt, was die ungeheure Komprimierungsrate erklärt. MP3 kommt nicht nur in der Unterhaltungsindustrie zum Einsatz, sondern auch auf Heimcomputern sind oft MP3-Dateien zu finden, was der guten Erreichbarkeit von Playern, Encodern und den Songs selbst im Internet zuzuschreiben ist. Leider wird aus diesem Grund MP3 auch oft für illegale Zwecke verwendet, beispielsweise zur Zusammenstellung von selbstgebrannten MP3-CDs oder rechtswidrigen InternetSeiten, auf denen Songs im MP3-Format zum Download bereitstehen. Obwohl die Spezifikationen des MPEG/Audio Layer-3-Algorithmus vollkommen erscheinen, ruhen sich die Motion Picture Experts Group und das Fraunhofer Institut nicht auf ihren Lorbeeren aus: Schon sind neue Audioformate in Planung, die noch stärkere Kompression und noch bessere Klangqualität bei Sampleraten von 8kHz bis 96kHz ermöglichen. MPEG-2-AAC ist eine dieser Neuentwicklungen. AAC steht für Advanced Audio Coding (Fortgeschrittenes Audio-Kodieren) und soll das MP3Format ablösen. Ob diese Neuerung allerdings vom „Internet-Volk“ und den Heimanwendern so begeistert aufgenommen wird wie MP3, ist die Frage. AAC implementiert eine Anzahl zusätzlicher Funktionen, wie zum Beispiel Temporal Noise Shaping oder eine Frequenz-Vorhersage, die zum Erreichen von besseren Audioqualitäten beitragen sollen. Auch 5-Kanal-Dolby-Surround-Sound wird in AAC enthalten sein. Doch auch MPEG-2-AAC ist überholt, schon bevor es fertiggestellt wurde – der Nachfolger heißt MPEG-4 und soll Audio auf CD-Niveau mit einer Kompressionsrate von 1:20 bieten.