Digital Audio

Werbung
DIGITAL AUDIO
Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in der PDF-Version nicht enthalten sind.
Übersicht
Was ist Audio?
Eigenschaften von Schallwellen
Das menschliche Ohr
Räumliches Hören, Töne, Klänge & Geräusche
Warum Audio digitalisieren?
Analog zu Digital
Probleme der AD/DA-Wandlung
Psychoakustik
Kompression (MP3)
Übertragung (MIDI)
Audio Retrieval
AGENDA
2
Was ist Audio? I
Töne
Sprache
Geräusche
Musik
...
Was ist Audio?
3
Was ist Audio? II
Schall
! Schwingungen (Wellen) die sich in einem Träger
räumlich ausbreiten (Veränderung des Drucks)
" Flüssigkeiten
" Festkörpern
" Gasen
(Schallgeschwindigkeit: 330m/s = 1188 km/h)
! periodische Schwingungen
(Klänge)
" Musikinstrumente
" Gesang
" Wind
" ...
! nichtperiodische Schwingungen
" Sprache
" Geräusche
" ...
Was ist Audio?
4
Was ist Audio? II
Amplitude
! objektiv:
Energie des Klanges
! subjektiv:
Lautstärke der Schwingung
Was ist Audio?
5
Was ist Audio? III
Frequenzen
! Infraschall: 0 bis 20 Hertz (Hz)
! Hörschall: 20 bis 20 kHz
! Ultraschall: 20 kHz bis 1 GHz
! Hyperschall: 1 GHz bis 10 THz
Was ist Audio?
6
Was ist Audio? IV
Was ist Audio?
7
Longitudinal- und Transversalwellen
Longitudinalwelle:
! Oszillatoren schwingen in der
Ausbreitungsrichtung
Transversalwelle:
! Oszillatoren schwingen quer
zur Ausbreitungsrichtung
Eigenschaften von Schallwellen
8
Wellenlänge
Die Länge einer Welle
(d.h. der Abstand bis zur nächsten Wiederholung)
bestimmt sich aus der Periodenlänge T und der
Ausbreitungsgeschwindigkeit c
Eigenschaften von Schallwellen
9
Reexion
Reexionsgesetz (Einfallswinkel
gleich Ausfallswinkel) gilt für
Schallwellen nur, wenn die
Grenzäche groß genug im
Vergleich zur Wellenlänge ist
! d.h. in kleineren Räumen keine
Reexion tiefer Frequenzen
Rauigkeit der Oberäche führt
zu di!user (zerstreuender)
Reexion, wenn Unebenheiten
in der Größenordnung der
Wellenlänge
! d.h. auch bei zentimetergroßen
Unebenheiten wirkt Wand auf
tie!requenten Schall als "glatt"
Eigenschaften von Schallwellen
10
Absorption, Brechung
Ein Teil der Schallenergie wird nicht reektiert
! Absorptionsgrad abhängig vom Material und der Schallfrequenz
Dissipation: Umwandlung in Wärmeenergie
Transmission: Weiterleitung im absorbierenden Medium
Aufteilung der absorbierten Energie in
Dissipation und Transmission
! frequenzabhängig: niedrige Frequenzen
höhere Transmission (Körperschall)
Auch Schall wird gebrochen,
z.B. bei Luftschichten
verschiedener Temperatur
Eigenschaften von Schallwellen
11
Beugung
Schall-"Schatten" entsteht erst, wenn ein Gegenstand
groß genug im Vergleich zur Wellenlänge ist
Bei Gegenständen in Größenordnung der Wellenlänge
tritt Beugung auf
! Wellen iessen "um das Hindernis herum"
! Wellen werden von einem Spalt zerstreut
Eigenschaften von Schallwellen
12
Das menschliche Ohr
Das menschliche Ohr
13
Das menschliche Ohr
Aussenohr:
! HRTF = Head Related
Transfer Function
Mittelohr:
! Trommelfell, Hammer,
Amboss, Steigbügel:
Verstärkung der
Kraftwirkung
Innenohr:
! Schnecke (cochlea)
! Aufgerollte Röhren
(Gänge), gefüllt mit
Lymphüssigkeit
Das menschliche Ohr
14
Schnecke (Cochlea)
Das menschliche Ohr
15
Räumliches Hören
Stereo-E!ekt
! Unterschiedliche Lautstärke des Schallereignisses an beiden Ohren
! Zeitliche Verzögerung des selben Schallereignisses in seiner
Wahrnehmung durch beide Ohren
! Verzögerungsmessung liefert Information über Entfernung der
Quelle
Kann ein einseitig tauber Mensch räumlich hören?
! Eingeschränkt: ja!
! Reexion und Beugung an Umwelt und Ohrmuscheln liefern umfangreiche
Information
Frequenzabhängigkeit der Ortung:
! Niedrige Frequenzen generell schlechter zu orten
! Konsequenz physikalischer Tatsachen (Wellenlänge:Hindernis)
! Siehe z.B. „Subwoofer“-Technologie
Räumliches Hören
16
Laufzeitdi!erenzen
Räumliches Hören
17
Head Related Transfer Functions (HRTF)
Für alle Positionen rund
um den Kopf
Impulsantwort von der
Position zu beiden Ohren
messen (HRIR)
Fourier-Transformation
davon ist die HRTF
! Enthält alle physikalischen
cues für die Lokalisierung
! HRTF von Mensch zu
Mensch verschieden
! Sobald HRTF für beide
Ohren bekannt ist, kann mit
einem Kopfhörer Raumklang
(also auch vorne/hinten und
oben/unten) erzeugt werden
Räumliches Hören
18
19
Ton, Klang und Geräusch
Töne sind vom Menschen wahrnehmbare kleine
Luftdruckänderungen
Primärempndungen der Tonwahrnehmung:
! Tonhöhe (Bsp. verschiedene Klaviertasten)
! Lautstärke (Bsp. Trommelanschlag)
! Klangfarbe (Bsp. gleicher Ton auf verschiedenen Instrumenten)
Ton:
! reine Sinusschwingung
Klang:
! Überlagerung von mehreren Sinusschwingungen
! alle drei Primärempndungen wahrnehmbar
Geräusch:
! entsteht durch unregelmäßige Schwingungen einer Schallquelle
! nur Lautstärke wahrnehmbar
Klänge und Geräusche
20
Warum Digital ?
Qualität der Reproduktion
! Qualität ist NUR abhängig von der Analog/Digital/AnalogKonvertierung
! Qualität ist unabhängig von
" Verarbeitung (z. B. Geräte)
" Transport (z. B. Kabel)
" Speicherung (z. B. Festplatte, Magnetband, CD)
! Möglichkeiten der Konvertierung/Bearbeitung
" verlustfreies Kopieren
" nicht-sequentieller Zugri!
" nicht-destruktives Editing
" platzsparendere Speicherung
" ...
Warum Digital?
21
Analog zu Digital I
PAM (Puls Amplitude Modulation)
! Ermittlung von Amplitudenwerten innerhalb eines Zeitintervalls
Analog zu Digital
22
Analog zu Digital II
PWM (Puls Width Modulation)
! Ermittlung von Impulsen, deren Länge die Intensität des
analogen Signals wiedergibt
Analog zu Digital
23
Analog zu Digital III
PCM (Pulse Code Modulation)
! universelles Verfahren zur
Digitalisierung von
analogen Zeitreihen
! Sampling
" Abtastung des analogen Signals in
einem festgelegten Zeitintervall
" Verwendung von PAM
! Quantisierung
" Zuordung eines ganzzahligen
Wertes innerhalb eines
festgelegten Zahlenbereiches
Analog zu Digital
24
Probleme der AD/DA-Wandlung I
Nyquist Abtast-Theorem
! Harry Nyquist (1889 – 1976)
! Mathematisch bewiesen durch
Claude E. Shannon und
Vladimir Aleksandrovich Kotelnikov
Nyquist
! die Abtastrate (Sampling Frequenz) muss
doppelt so hoch sein, wie die höchste
Frequenz des abzutastenden Signals
! Folge: Frequenz-Überlappung (Aliasing)
ggf. falsche Rekonstruktion des Signals
Shannon
Kotelnikov
Probleme der AD/DA-Wandlung
25
Probleme der AD/DA-Wandlung II
Quantisierungsrauschen
! Fehler durch Rundung bei der Digitalisierung
Probleme der AD/DA-Wandlung
26
Probleme der AD/DA-Wandlung II
! Beispiele
Probleme der AD/DA-Wandlung
27
Probleme der AD/DA-Wandlung III
Verzerrungen (Clipping)
! Übersteuerung des Eingangsignals
! Abschneiden der Spitzen eines Signals
! Folge von Variablenüberläufen
Probleme der AD/DA-Wandlung
28
Psychoakustik I
Hörschwelle
! unterschiedliche Empndlichkeit
(Lautstärkeeindruck) des Gehörs
für verschiedene
Frequenzbereiche
! höchste Empndlichkeit im
Bereich von 2 kHz bis 4kHz
Psychoakustik
29
Psychoakustik II
Psychoakustik
30
Psychoakustik III
Maskierung
! Überdeckung eines Frequenzbereiches durch ein Störsignal
(gleichzeitige Maskierung)
! Zeitliche Maskierung verdeckt auch nach Abschalten
des Störsignals den betre!enden Frequenzbereich
(zeitliche Maskierung)
Psychoakustik
31
Audio-Kompression
Dynamikkompression
! Einsatz nichtlinerarer (logarithmischer) Quantisierung
! kleine Signale werden mit niedrigeren Bitwerten kodiert
! Beispiele: A-law, u-Law
Psychoakustische Kompression
! Verwendung von Subband-Kodierung & Maskierung
! dadurch Entfernung von irrelevanten Daten
! Reduktion der Datenrate
! Beispiel: MP3, AAC
Kompression
32
Kompression MP3 (I) Übersicht
Kurzform von MPEG-1 Audio Layer 3
! Verwendung der
»psychoakustischen Kompression«
! Nicht für den Menschen hörbare
Informationen werden entfernt
! Entfernung von Redundanzen
Kompression von Audiodaten
bei vermeintlich geringem Qualitätsverlust
! Kanalkopplung (Stereo) – Di!erenzsignalbildung
! Entfernung nicht hörbarer Frequenzen und maskierter Audioinformation
Karl-Heinz Brandenburg, Harald Popp:
An Introduction to MPEG Layer 3. EBU Technical Review, Juni 2000.
! http://www.iis.fhg.de/amm/
Kompression
33
Kompression MP3 II
Algorithmus (Übersicht)
Kompression
34
Kompression MP3 III
Algorithmus (1)
! Anwendung eines Faltungslters, um ein Signal in 32 Bänder zu
unterteilen
! Berechnung des Schallddruckpegels eines Bandes
! wenn der Schalldruckpegel eines Bandes kleiner ist als der
Maskierungsschwellwert eines Nachbarbandes, wird dieses Band
nicht kodiert.
! Andernfalls werden die Koe!zienten quantisiert
Kompression
35
Kompression MP3 IV
Algorithmus (2)
! Unterteilung des
Datenstromes
in Frames
! Ein Frame entspricht einem
Tonsignal über eine
bestimmte Zeiteinheit
! Jeder Frame enthält 384
(1152) Samples, die
Abtastwerte
aus 32 Teilbändern
repräsentieren
! Aus jedem Teilband
stammen 12 Werte
Kompression
36
Kompression MP3 V
Algorithmus (Übersicht)
Kompression
37
Kompression MP3 VI
Datenrate von 32 bis zu 320 KBit/
s
Samplingrate 32/44,1/48 kHz16
Bit Stereo
Abb. zeigt typische
Kompressionsartefakte bei der
Fourier-Transformation
Kompression
38
Advanced Audio Coding (AAC)
Vergleich zu MP3
! bessere Qualität bei gleicher Dateigröße
! tonale und geräuschhafte Elemente im Eingangssignal e!ektiver erkannt und
kodiert
! Pre-Echo Problem (Kompressionsartefakte) verbessert.
! Unterstützung für Multichannel-Audio (bis 48)
! Bis zu 96 KHz Abtastfrequenz
! DRM-Verfahren »FairPlay« implementiert
Entwicklung
! Standardisiert bei der ISO MPEG2/MPEG4, EBU-Recommendation
! Dolby (AC3), Fraunhofer IIS (MP3), AT&T, Sony, Nokia ...
Erweiterung HE-AAC für niedrige Bitraten
! MPEG-4 High E"ciency Advanced Audio Coding,
mit Spectral Band Replication (SBR) auch AACplus v1
! Mit Parametric Stereo (PS) auch AACplus v2
Kompression
39
Hörbeispiele
Audiocodecs
http://inka.fhtw-berlin.de/Herzog/
Kompression
40
Übertragung - MIDI (I)
MIDI (Musical Instrument Digital Interface)
! standardisiertes Protokoll zur Steuerung
elektronischer Musikinstrumente und Musike!ektgeräte
! physikalische Schnittstelle
! Überbegri! für die Musik, die diesem Standard genügt
! 1984 entwickelt
! Standardisierung und Weiterentwicklung durch
" International Midi Organisation (IMA)
" MIDI Manufacturers Association(MMA)
http://www.midi.org/
Übertragung
41
Übertragung - MIDI (II)
Komponenten
! Sequenzer
" Komponieren/Wiedergabe von
Musik mit Rechner
" MIDI Sequenzen werden in MIDIDateien gespeichert
! Synthesizer
" Synthetische Erzeugung und
Manipulation von Klängen
! Sampler
" Wie Synthesizer, jedoch synthetisiert
ein Sampler Töne aus einer Palette
von Instrument-Samples
Übertragung
42
Übertragung - MIDI III
Datenformat
! instrumentenbezogene Kodierung
" Lautstärke
" Grundfrequenz
" Bezeichnung des Instruments
! MIDI-Nachrichten bestehen aus
einem Statusbyte und bis zu 3
Datenbytes
" Statusbyte 1 B B B K K K K
" Datenbyte 0 _ _ _ _ _ _ _
" Statusbyte kündigen eine Aktion an und
gliedern sich in Kanal- und Systembefehle.
" Kanalbefehle (BBB) beziehen sich auf
der insgesamt 16 Kanäle (KKKK), mit denen
jeweils ein angeschlossenes Instrument
assoziiert ist
Übertragung
43
Übertragung - MIDI (IV)
Vorteile
! MIDI-Dateien sind plattformübergreifend
! MIDI-Dateien sind sehr klein: 1 min Musik ca. 15- 30 Kbyte
! MIDI Kodierung entspricht der Vorgehensweise beim
klassischen Komponieren
Nachteile
! Ohne wirklich gute Instrumente kein schöner Klang,
da synthetische Klangerzeugung
! keine Sprache oder Geräusche
! MIDI-Dateien klingen auf unterschiedlichen Systemen,
je nach eingesetzten Geräten unterschiedlich
Übertragung
44
Übertragung MIDI V
General Midi (GM)
! Standard-Erweiterung
ermöglicht
geräteunabhängig
möglichst originalgetreue
Wiedergabe
Midi über IEEE 1394
(FireWire)
! Verwendung aktueller
Technologien und
Protokolle
Übertragung
45
Audio Retrieval
Tempoerkennung
! Verfahren zur automatischen Schätzung des Rhythmus
beschreibenden Elemente Tempo, Taktart und Mikrotime
Query by Humming (QbH)
! Melodieerkennung/Musiktitelerkennung auf Grundlage
gesungener oder anderer monophoner Melodien
! Bsp: http://www.musicline.de/de/melodiesuche/
Statistische Klassikation
! Jedes Geräusch hat typische Werte (loudness, pitch,
brightness, bandwidth)
! Trainingsset von Geräuschen einer Klasse ermöglicht
Einordnung (Bsp. Gelächter, Beifall, Kinder)
...
Audio Retrieval
46
Film: http://www.celemony.com/
Literatur
»Taschenbuch Multimedia«
! HENNING, PETER A., Fachbuchverlag Leipzig,
2. Auage 2001, gebundene Ausgabe,
603 Seiten, ISBN 3446217517, ca. ! 20
»Multimedia Technologie«
! Grundlagen, Komponenten und Systeme
Steinmetz, Henning, Springer Verlag
Heidelberg, 3. überarbeitete Auage 2000,
gebundene Ausgabe, 968 Seiten,
ISBN 3-540-67332-6, ca. ! 55
»The Art of DIGITAL AUDIO«
! Watkinson, John, Focal Press Oxford,
Third Edition 2001, Hardcover, 752 Seiten,
ISBN 0-240-51587-0, ca. ! 84
Literatur
48
Links
http://www.ieee.org
http://www.itu.int/ITU-T/
http://www.cs.columbia.edu/~hgs/audio/
http://www.digitalaudioguide.com/glossary.htm
http://www.mp3encoding.de
http://www.midi.org/
http://www.superaudio-cd.com/
Links
49
Herunterladen