DIGITAL AUDIO Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in der PDF-Version nicht enthalten sind. Übersicht Was ist Audio? Eigenschaften von Schallwellen Das menschliche Ohr Räumliches Hören, Töne, Klänge & Geräusche Warum Audio digitalisieren? Analog zu Digital Probleme der AD/DA-Wandlung Psychoakustik Kompression (MP3) Übertragung (MIDI) Audio Retrieval AGENDA 2 Was ist Audio? I Töne Sprache Geräusche Musik ... Was ist Audio? 3 Was ist Audio? II Schall ! Schwingungen (Wellen) die sich in einem Träger räumlich ausbreiten (Veränderung des Drucks) " Flüssigkeiten " Festkörpern " Gasen (Schallgeschwindigkeit: 330m/s = 1188 km/h) ! periodische Schwingungen (Klänge) " Musikinstrumente " Gesang " Wind " ... ! nichtperiodische Schwingungen " Sprache " Geräusche " ... Was ist Audio? 4 Was ist Audio? II Amplitude ! objektiv: Energie des Klanges ! subjektiv: Lautstärke der Schwingung Was ist Audio? 5 Was ist Audio? III Frequenzen ! Infraschall: 0 bis 20 Hertz (Hz) ! Hörschall: 20 bis 20 kHz ! Ultraschall: 20 kHz bis 1 GHz ! Hyperschall: 1 GHz bis 10 THz Was ist Audio? 6 Was ist Audio? IV Was ist Audio? 7 Longitudinal- und Transversalwellen Longitudinalwelle: ! Oszillatoren schwingen in der Ausbreitungsrichtung Transversalwelle: ! Oszillatoren schwingen quer zur Ausbreitungsrichtung Eigenschaften von Schallwellen 8 Wellenlänge Die Länge einer Welle (d.h. der Abstand bis zur nächsten Wiederholung) bestimmt sich aus der Periodenlänge T und der Ausbreitungsgeschwindigkeit c Eigenschaften von Schallwellen 9 Reexion Reexionsgesetz (Einfallswinkel gleich Ausfallswinkel) gilt für Schallwellen nur, wenn die Grenzäche groß genug im Vergleich zur Wellenlänge ist ! d.h. in kleineren Räumen keine Reexion tiefer Frequenzen Rauigkeit der Oberäche führt zu di!user (zerstreuender) Reexion, wenn Unebenheiten in der Größenordnung der Wellenlänge ! d.h. auch bei zentimetergroßen Unebenheiten wirkt Wand auf tie!requenten Schall als "glatt" Eigenschaften von Schallwellen 10 Absorption, Brechung Ein Teil der Schallenergie wird nicht reektiert ! Absorptionsgrad abhängig vom Material und der Schallfrequenz Dissipation: Umwandlung in Wärmeenergie Transmission: Weiterleitung im absorbierenden Medium Aufteilung der absorbierten Energie in Dissipation und Transmission ! frequenzabhängig: niedrige Frequenzen höhere Transmission (Körperschall) Auch Schall wird gebrochen, z.B. bei Luftschichten verschiedener Temperatur Eigenschaften von Schallwellen 11 Beugung Schall-"Schatten" entsteht erst, wenn ein Gegenstand groß genug im Vergleich zur Wellenlänge ist Bei Gegenständen in Größenordnung der Wellenlänge tritt Beugung auf ! Wellen iessen "um das Hindernis herum" ! Wellen werden von einem Spalt zerstreut Eigenschaften von Schallwellen 12 Das menschliche Ohr Das menschliche Ohr 13 Das menschliche Ohr Aussenohr: ! HRTF = Head Related Transfer Function Mittelohr: ! Trommelfell, Hammer, Amboss, Steigbügel: Verstärkung der Kraftwirkung Innenohr: ! Schnecke (cochlea) ! Aufgerollte Röhren (Gänge), gefüllt mit Lymphüssigkeit Das menschliche Ohr 14 Schnecke (Cochlea) Das menschliche Ohr 15 Räumliches Hören Stereo-E!ekt ! Unterschiedliche Lautstärke des Schallereignisses an beiden Ohren ! Zeitliche Verzögerung des selben Schallereignisses in seiner Wahrnehmung durch beide Ohren ! Verzögerungsmessung liefert Information über Entfernung der Quelle Kann ein einseitig tauber Mensch räumlich hören? ! Eingeschränkt: ja! ! Reexion und Beugung an Umwelt und Ohrmuscheln liefern umfangreiche Information Frequenzabhängigkeit der Ortung: ! Niedrige Frequenzen generell schlechter zu orten ! Konsequenz physikalischer Tatsachen (Wellenlänge:Hindernis) ! Siehe z.B. „Subwoofer“-Technologie Räumliches Hören 16 Laufzeitdi!erenzen Räumliches Hören 17 Head Related Transfer Functions (HRTF) Für alle Positionen rund um den Kopf Impulsantwort von der Position zu beiden Ohren messen (HRIR) Fourier-Transformation davon ist die HRTF ! Enthält alle physikalischen cues für die Lokalisierung ! HRTF von Mensch zu Mensch verschieden ! Sobald HRTF für beide Ohren bekannt ist, kann mit einem Kopfhörer Raumklang (also auch vorne/hinten und oben/unten) erzeugt werden Räumliches Hören 18 19 Ton, Klang und Geräusch Töne sind vom Menschen wahrnehmbare kleine Luftdruckänderungen Primärempndungen der Tonwahrnehmung: ! Tonhöhe (Bsp. verschiedene Klaviertasten) ! Lautstärke (Bsp. Trommelanschlag) ! Klangfarbe (Bsp. gleicher Ton auf verschiedenen Instrumenten) Ton: ! reine Sinusschwingung Klang: ! Überlagerung von mehreren Sinusschwingungen ! alle drei Primärempndungen wahrnehmbar Geräusch: ! entsteht durch unregelmäßige Schwingungen einer Schallquelle ! nur Lautstärke wahrnehmbar Klänge und Geräusche 20 Warum Digital ? Qualität der Reproduktion ! Qualität ist NUR abhängig von der Analog/Digital/AnalogKonvertierung ! Qualität ist unabhängig von " Verarbeitung (z. B. Geräte) " Transport (z. B. Kabel) " Speicherung (z. B. Festplatte, Magnetband, CD) ! Möglichkeiten der Konvertierung/Bearbeitung " verlustfreies Kopieren " nicht-sequentieller Zugri! " nicht-destruktives Editing " platzsparendere Speicherung " ... Warum Digital? 21 Analog zu Digital I PAM (Puls Amplitude Modulation) ! Ermittlung von Amplitudenwerten innerhalb eines Zeitintervalls Analog zu Digital 22 Analog zu Digital II PWM (Puls Width Modulation) ! Ermittlung von Impulsen, deren Länge die Intensität des analogen Signals wiedergibt Analog zu Digital 23 Analog zu Digital III PCM (Pulse Code Modulation) ! universelles Verfahren zur Digitalisierung von analogen Zeitreihen ! Sampling " Abtastung des analogen Signals in einem festgelegten Zeitintervall " Verwendung von PAM ! Quantisierung " Zuordung eines ganzzahligen Wertes innerhalb eines festgelegten Zahlenbereiches Analog zu Digital 24 Probleme der AD/DA-Wandlung I Nyquist Abtast-Theorem ! Harry Nyquist (1889 – 1976) ! Mathematisch bewiesen durch Claude E. Shannon und Vladimir Aleksandrovich Kotelnikov Nyquist ! die Abtastrate (Sampling Frequenz) muss doppelt so hoch sein, wie die höchste Frequenz des abzutastenden Signals ! Folge: Frequenz-Überlappung (Aliasing) ggf. falsche Rekonstruktion des Signals Shannon Kotelnikov Probleme der AD/DA-Wandlung 25 Probleme der AD/DA-Wandlung II Quantisierungsrauschen ! Fehler durch Rundung bei der Digitalisierung Probleme der AD/DA-Wandlung 26 Probleme der AD/DA-Wandlung II ! Beispiele Probleme der AD/DA-Wandlung 27 Probleme der AD/DA-Wandlung III Verzerrungen (Clipping) ! Übersteuerung des Eingangsignals ! Abschneiden der Spitzen eines Signals ! Folge von Variablenüberläufen Probleme der AD/DA-Wandlung 28 Psychoakustik I Hörschwelle ! unterschiedliche Empndlichkeit (Lautstärkeeindruck) des Gehörs für verschiedene Frequenzbereiche ! höchste Empndlichkeit im Bereich von 2 kHz bis 4kHz Psychoakustik 29 Psychoakustik II Psychoakustik 30 Psychoakustik III Maskierung ! Überdeckung eines Frequenzbereiches durch ein Störsignal (gleichzeitige Maskierung) ! Zeitliche Maskierung verdeckt auch nach Abschalten des Störsignals den betre!enden Frequenzbereich (zeitliche Maskierung) Psychoakustik 31 Audio-Kompression Dynamikkompression ! Einsatz nichtlinerarer (logarithmischer) Quantisierung ! kleine Signale werden mit niedrigeren Bitwerten kodiert ! Beispiele: A-law, u-Law Psychoakustische Kompression ! Verwendung von Subband-Kodierung & Maskierung ! dadurch Entfernung von irrelevanten Daten ! Reduktion der Datenrate ! Beispiel: MP3, AAC Kompression 32 Kompression MP3 (I) Übersicht Kurzform von MPEG-1 Audio Layer 3 ! Verwendung der »psychoakustischen Kompression« ! Nicht für den Menschen hörbare Informationen werden entfernt ! Entfernung von Redundanzen Kompression von Audiodaten bei vermeintlich geringem Qualitätsverlust ! Kanalkopplung (Stereo) – Di!erenzsignalbildung ! Entfernung nicht hörbarer Frequenzen und maskierter Audioinformation Karl-Heinz Brandenburg, Harald Popp: An Introduction to MPEG Layer 3. EBU Technical Review, Juni 2000. ! http://www.iis.fhg.de/amm/ Kompression 33 Kompression MP3 II Algorithmus (Übersicht) Kompression 34 Kompression MP3 III Algorithmus (1) ! Anwendung eines Faltungslters, um ein Signal in 32 Bänder zu unterteilen ! Berechnung des Schallddruckpegels eines Bandes ! wenn der Schalldruckpegel eines Bandes kleiner ist als der Maskierungsschwellwert eines Nachbarbandes, wird dieses Band nicht kodiert. ! Andernfalls werden die Koe!zienten quantisiert Kompression 35 Kompression MP3 IV Algorithmus (2) ! Unterteilung des Datenstromes in Frames ! Ein Frame entspricht einem Tonsignal über eine bestimmte Zeiteinheit ! Jeder Frame enthält 384 (1152) Samples, die Abtastwerte aus 32 Teilbändern repräsentieren ! Aus jedem Teilband stammen 12 Werte Kompression 36 Kompression MP3 V Algorithmus (Übersicht) Kompression 37 Kompression MP3 VI Datenrate von 32 bis zu 320 KBit/ s Samplingrate 32/44,1/48 kHz16 Bit Stereo Abb. zeigt typische Kompressionsartefakte bei der Fourier-Transformation Kompression 38 Advanced Audio Coding (AAC) Vergleich zu MP3 ! bessere Qualität bei gleicher Dateigröße ! tonale und geräuschhafte Elemente im Eingangssignal e!ektiver erkannt und kodiert ! Pre-Echo Problem (Kompressionsartefakte) verbessert. ! Unterstützung für Multichannel-Audio (bis 48) ! Bis zu 96 KHz Abtastfrequenz ! DRM-Verfahren »FairPlay« implementiert Entwicklung ! Standardisiert bei der ISO MPEG2/MPEG4, EBU-Recommendation ! Dolby (AC3), Fraunhofer IIS (MP3), AT&T, Sony, Nokia ... Erweiterung HE-AAC für niedrige Bitraten ! MPEG-4 High E"ciency Advanced Audio Coding, mit Spectral Band Replication (SBR) auch AACplus v1 ! Mit Parametric Stereo (PS) auch AACplus v2 Kompression 39 Hörbeispiele Audiocodecs http://inka.fhtw-berlin.de/Herzog/ Kompression 40 Übertragung - MIDI (I) MIDI (Musical Instrument Digital Interface) ! standardisiertes Protokoll zur Steuerung elektronischer Musikinstrumente und Musike!ektgeräte ! physikalische Schnittstelle ! Überbegri! für die Musik, die diesem Standard genügt ! 1984 entwickelt ! Standardisierung und Weiterentwicklung durch " International Midi Organisation (IMA) " MIDI Manufacturers Association(MMA) http://www.midi.org/ Übertragung 41 Übertragung - MIDI (II) Komponenten ! Sequenzer " Komponieren/Wiedergabe von Musik mit Rechner " MIDI Sequenzen werden in MIDIDateien gespeichert ! Synthesizer " Synthetische Erzeugung und Manipulation von Klängen ! Sampler " Wie Synthesizer, jedoch synthetisiert ein Sampler Töne aus einer Palette von Instrument-Samples Übertragung 42 Übertragung - MIDI III Datenformat ! instrumentenbezogene Kodierung " Lautstärke " Grundfrequenz " Bezeichnung des Instruments ! MIDI-Nachrichten bestehen aus einem Statusbyte und bis zu 3 Datenbytes " Statusbyte 1 B B B K K K K " Datenbyte 0 _ _ _ _ _ _ _ " Statusbyte kündigen eine Aktion an und gliedern sich in Kanal- und Systembefehle. " Kanalbefehle (BBB) beziehen sich auf der insgesamt 16 Kanäle (KKKK), mit denen jeweils ein angeschlossenes Instrument assoziiert ist Übertragung 43 Übertragung - MIDI (IV) Vorteile ! MIDI-Dateien sind plattformübergreifend ! MIDI-Dateien sind sehr klein: 1 min Musik ca. 15- 30 Kbyte ! MIDI Kodierung entspricht der Vorgehensweise beim klassischen Komponieren Nachteile ! Ohne wirklich gute Instrumente kein schöner Klang, da synthetische Klangerzeugung ! keine Sprache oder Geräusche ! MIDI-Dateien klingen auf unterschiedlichen Systemen, je nach eingesetzten Geräten unterschiedlich Übertragung 44 Übertragung MIDI V General Midi (GM) ! Standard-Erweiterung ermöglicht geräteunabhängig möglichst originalgetreue Wiedergabe Midi über IEEE 1394 (FireWire) ! Verwendung aktueller Technologien und Protokolle Übertragung 45 Audio Retrieval Tempoerkennung ! Verfahren zur automatischen Schätzung des Rhythmus beschreibenden Elemente Tempo, Taktart und Mikrotime Query by Humming (QbH) ! Melodieerkennung/Musiktitelerkennung auf Grundlage gesungener oder anderer monophoner Melodien ! Bsp: http://www.musicline.de/de/melodiesuche/ Statistische Klassikation ! Jedes Geräusch hat typische Werte (loudness, pitch, brightness, bandwidth) ! Trainingsset von Geräuschen einer Klasse ermöglicht Einordnung (Bsp. Gelächter, Beifall, Kinder) ... Audio Retrieval 46 Film: http://www.celemony.com/ Literatur »Taschenbuch Multimedia« ! HENNING, PETER A., Fachbuchverlag Leipzig, 2. Auage 2001, gebundene Ausgabe, 603 Seiten, ISBN 3446217517, ca. ! 20 »Multimedia Technologie« ! Grundlagen, Komponenten und Systeme Steinmetz, Henning, Springer Verlag Heidelberg, 3. überarbeitete Auage 2000, gebundene Ausgabe, 968 Seiten, ISBN 3-540-67332-6, ca. ! 55 »The Art of DIGITAL AUDIO« ! Watkinson, John, Focal Press Oxford, Third Edition 2001, Hardcover, 752 Seiten, ISBN 0-240-51587-0, ca. ! 84 Literatur 48 Links http://www.ieee.org http://www.itu.int/ITU-T/ http://www.cs.columbia.edu/~hgs/audio/ http://www.digitalaudioguide.com/glossary.htm http://www.mp3encoding.de http://www.midi.org/ http://www.superaudio-cd.com/ Links 49