Digitale Signal-Verarbeitung 1 Kapitel 6: Audio-Effekte Inhaltsverzeichnis 1. MÖGLICHE ANSÄTZE FÜR AUDIO-EFFEKTE .................................................................................. 2 2. AMPLITUDENÄNDERUNG ...................................................................................................................... 3 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 3. ZEITVERZÖGERUNG ............................................................................................................................... 6 3.1. 3.2. 3.3. 3.4. 3.5. 4. ECHO ...................................................................................................................................................... 6 REVERBERATION .................................................................................................................................... 6 PHASING ................................................................................................................................................. 7 FLANGING .............................................................................................................................................. 7 CHORUS ................................................................................................................................................. 8 FREQUENZSELEKTION .......................................................................................................................... 9 4.1. 4.2. 4.3. 4.4. 5. CLIPPING/OVERDRIVE ............................................................................................................................ 3 COMPRESSION ........................................................................................................................................ 3 EXPANSION ............................................................................................................................................ 5 DUCKER ................................................................................................................................................. 5 NOISE GATING ....................................................................................................................................... 5 TREMOLO ............................................................................................................................................... 5 GRAPHIC EQUALIZER ............................................................................................................................. 9 PARAMETRIC EQUALIZER ..................................................................................................................... 11 PRÄSENZ .............................................................................................................................................. 13 WAH..................................................................................................................................................... 13 FREQUENZÄNDERUNG ......................................................................................................................... 14 5.1. 5.2. 5.3. 5.4. PITCH SHIFTING .................................................................................................................................... 14 TIME STRECHING.................................................................................................................................. 15 VIBRATO .............................................................................................................................................. 15 SIDEBAND MODULATION ..................................................................................................................... 15 Ergänzende Literatur [1] S.J. Orfanidis, „Introduction to Signal Processing“, Prentice Hall, 1996. [2] http://www.harmony-central.com/Effects/ [3] http://users.chariot.net.au/~gmarts/guitar.htm 75947166 / 14.05.16 Seite 1 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 1. Mögliche Ansätze für Audio-Effekte Die allgemein verwendeten Effekte lassen sich vier Kategorien zuordnen. Alle Effekte können sowohl analog (HW) als auch softwaremässig (z.B. mit Matlab) realisiert werden. Mit „Digitalen Signal Prozessoren“ lassen sich die Vorteile von beiden vereinen. Ansatz Effekte Analoge Lösung Amplitudenänderung Clipping/Overdrive Compression Ducker Expansion Noise Gating Tremolo Nichtlineare Bauteile (Dioden) Steuerbarer Spannungsteiler (FET) Software- If (abs(x) < knie) { Lösung verst = gross; } else { verst = klein; } DSPAdaptive Filter Lösung Zeitverzögerung Echo Reverberation Chorus Flanging Phasing Frequenzselektion Graphic Equalizer Parametric Equalizer Präsenz Wah Frequenzänderung Hall-Spirale Endlosband mit versetzten Schreib- und Leseköpfen CCD-Ketten Ringbuffer (mit mehreren Pointern) Bandpässe, Bandsperren Doppel-T-Filter Endlosband mit rotierenden Schreibund/oder Leseköpfen Ring-Modulatoren Analog-Multiplizierer Ringbuffer FIR-Filter IIR-Filter und Filterbänke Pitch Shifting Time Streching Vibrato Sideband Modulation Frequenzbereich Frequenzbereich FFT-Filter-IFFT FFT-Filter-IFFT Ringbuffer (mit mehreren Pointern) Multiraten-Systeme Frequenzbereich Ringbuffer Veränderte Phasenlage wird vom menschlichen Gehör nicht wahrgenommen. Deshalb gibt es auch keine Effekte, die die Phasenlage der Signalkomponenten in Betracht ziehen. Anmerkung: In der Bildverarbeitung ist die Situation komplett verschieden. Veränderungen in der Phasenlage (Kanten, Farbübergänge) werden viel stärker wahrgenommen als jene in der Amplitude (Helligkeit, Kontrast). 75947166 / 14.05.16 Seite 2 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 2. Amplitudenänderung Diese Methoden sind einfach implementierbar, da nur die momentane Lautstärke angepasst wird. 2.1. Clipping/Overdrive Das Signal wird auf einen bestimmten Wert begrenzt (abgeschnitten). In der Analogtechnik hat sich diese Schaltung bewährt. Mit dem Potentiometer kann stufenlos zwischen „hard clipping“ und „soft clipping“ gewählt werden. Hier wird immer mit Momentanwerten gearbeitet; es findet also keine zeitliche Mittelung der Lautstärke statt. Durch die nichtlineare Kennlinie werden Oberwellen (Harmonische) erzeugt, die den Klang schriller und voller machen. Anwendung vor allem bei Gitarren. in P out D D 2.2. Compression Clipping schneidet einfach die Spitzen ab. Compression variiert die Verstärkung so, dass leise Passagen verstärkt und laute Passagen abgeschwächt werden. Attac gibt an, wie schnell (ca. 50ms) die Verstärkung zurückgeregelt wird, wenn die Lautstärke zunimmt. Decay gibt an, wie schnell (ca. 200ms) die Verstärkung erhöht wird, wenn die Lautstärke abnimmt. Weil hier kein nichtlineares Verhalten vorliegt, werden auch keine Oberwellen erzeugt. Diese Art von Kompression wird sehr oft bei Mikrofon-Aufnahmen in lärmiger Umgebung eingesetzt. Bei Saiteninstrumenten wirkt die Schaltung dem Abfall der Lautstärke nach dem Zupfen entgegen. Companding: Kompression => „Kanal“ => Expansion. Damit kann das SNR (signal to noise ratio) bei Übertragungskanälen verbessert und Übersteuerung vermieden werden. 75947166 / 14.05.16 Seite 3 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 75947166 / 14.05.16 Seite 4 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 2.3. Expansion Da die Input-Output-Kennlinie des Kompressors monoton ist, kann aus jedem komprimierten Signal das ursprüngliche wieder gewonnen werden. Das ist die Aufgabe des Expanders. Companding: Kompression => „Kanal“ => Expansion. Damit kann das SNR (signal to noise ratio) bei Übertragungskanälen verbessert und Übersteuerung vermieden werden. Beispiel: Dolby A: „Kanal“ ist ein Tonband => Aufnahme: leise (rauschgefährdete) Passagen lauter als normal => Abspielen: Abschwächung der leisen Passagen 2.4. Ducker Der „Ducker“ (engl. to duck = sich ducken) dient dem Abschwächen der Musik während einer Ansage. Er arbeitet genau gleich wie der Compressor, nur dass das Sprachsignal verwendet wird, um die Verstärkung der Musik zu steuern. Es ist somit ein einfaches adaptives Filter. Sprache (kick drum) Level Gain Detector c[n] Control g[n] Musik Mischkonstante Ausgang 2.5. Noise Gating Funktioniert wie Compression, nur werden hier die leisen Passagen abgeschwächt oder sogar ganz ausgelöscht. Damit kann schwaches Rauschen und Brummen in einer Sprech-, Spiel- oder Sendepause eliminiert werden. 2.6. Tremolo Die Lautstärke wird periodisch mit einer Geschwindigkeit von einigen Hertz verändert. 75947166 / 14.05.16 Seite 5 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 3. Zeitverzögerung Allen hier erwähnten Methoden ist gemeinsam, dass das ursprüngliche Signal verzögert und eventuell abgeschwächt zum Original addiert wird. Die Unterschiede liegen in der Verzögerungszeit und der Abschwächung. Einige Effekte nutzen zudem mehrere Verzögerungspfade parallel. 3.1. Echo Das menschliche Ohr nimmt ein Echo als solches war, wenn die Verzögerung grösser als 50ms ist. 1/50ms = 20Hz = untere Grenzfrequenz des menschlichen Gehörs. Das Echo ist ein Grundbaustein für kompliziertere Audioeffekte. D·Ts: roundtrip-Delay a: Dämpfung (Reflexion und Ausbreitung) FIR-Kamm-Filter mit äquidistanten „notches“ 3.2. Reverberation Der Fachbegriff „Reverberation“ bedeutet Widerhall oder Nachhall. Der Nachhall ist das Resultat der Schallreflexion an den Wänden (und Gegenständen) im Raum. Da die Abstände zu Wänden, Decke und Boden verschieden sind, erzeugen sie nacheinander „einzelne“ frühe Reflexionen. Die ersten Reflexionen werden wieder reflektiert, was viele, „zufällige“, abfallende späte/diffuse Reflexionen Ih[n]I verursacht, was das Raumempfinden ausmacht. Die Nachhallzeit ist definiert als Zeit, bis der Schallpegel um 60dB abgeklungen ist. Die Nachhallzeit hängt von der Raumgrösse und dem Absorptionsvermögen der Wände ab. Sie beträgt für Konzerthallen ca. 1.5 bis 2s. 75947166 / 14.05.16 Seite 6 / 15 frühe Reflexionen späte Reflexionen nTs Rumc&Hhrt@ZSN@SoE@ZHAW Im obigen Beispiel: „Schröders Nachhall-Prozessor“ 3.3. Phasing Das Signal wird um einen Bruchteil einer Millisekunde verzögert (= phasenverschoben) und zum Originalsignal addiert. Wo die Phasenlage ein Vielfaches von 2π ist, wird das Signal verstärkt, bei (2n+1)π löschen sich die Signale aus. Bei linearem Phasengang sind die Lücken im Frequenzspektrum linear (und nicht harmonisch) verteilt. Der Name Phasing ist etwas irreführend. Der Effekt beruht nicht auf der Änderung der Phasenlage, sondern auf Verstärken bzw. Auslöschen bestimmter Frequenzkomponenten, verursacht durch Addition des verzögerten Signals zum Original. 3.4. Flanging Funktioniert wie Phasing, aber die Zeitverzögerung ist grösser und liegt im Bereich 1 bis 10ms. Dadurch ergeben sich viel mehr Kerben im Frequenzgang und es werden bestimmte Frequenzen und ihre Oberwellen hervorgehoben. Häufig wird die Zeitverzögerung mit einer tiefen Frequenz variiert, was einen eher unnatürlichen speziellen Klag erzeugt. 75947166 / 14.05.16 Seite 7 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 3.5. Chorus 75947166 / 14.05.16 Seite 8 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 4. Frequenzselektion Einzelne Frequenzen oder ganze Frequenzbereiche sollen angepasst werden, um ein ausgeglichenes Gesamtes zu ergeben oder um spezielle Effekte zu erreichen. Dazu werden sowohl in der Analog- als auch in der Digital-Technik vornehmlich Bandpässe und Bandsperren eingesetzt. 4.1. Graphic Equalizer Mit einem Equalizer wird der Frequenzgang kompensiert (equalize = ausgleichen). Grafische Equalizer verwenden N parallele BP-Filter (z.B. 1. Ordnung). Die Mittenfrequenzen sind äquidistant auf logarithmischer Frequenzskala, d.h. aufeinander folgende Mittenfrequenzen werden mit einem konstanten Faktor multipliziert, was unserem Gehör entspricht. (Z.B. Faktor 2 = Oktave: z.B. 50Hz, 100Hz, 200Hz, 400Hz, 800Hz, 1600Hz, 3200Hz, 6400Hz, 12800Hz). Die Ausgänge jedes Bandpassfilters werden separat verstärkt resp. abgeschwächt (± 6-20 dB). Die Ausgänge der einzelnen Bandpässe werden gewichtetet addiert. Grafische Equalizer weisen eine (weitgehend) lineare Phase und (fast) keine Zeitverzögerung auf 75947166 / 14.05.16 Seite 9 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW und der Rippel ist sehr klein. Für Analog-Freaks: http://www.ethanwiner.com/spectrum.html (= Quelle dieses Schemas) Der Mittelabgriffe der 50kΩ-Potentiometer werden über LCR-Serie-Schwingkreise geerdet. Die Induktivitäten L werden dabei mit Gyratoren erzeugt (Bild rechts). Konkret sind also die Mittelabgriffe der Potentiometer jeweils für die Resonanzfrequenz ω2 = 1/(L∙C) über den Widerstand R1 geerdet. Ist die Potentiometer-Stellung ganz unten (Cut), wird das Eingangssignal für diese Frequenz über den LCR-Serie-Schwingkreis fast kurzgeschlossen und wenig verstärkt: Am nicht-invertierenden Eingang: ve = R1/(RE+R1) = 0.091 Operations-Verstärker-Verstärkung: va = 1+RE/(50kΩ+1kΩ) = 1.196 Total Verstärkung (Cut): v = ve∙va = 0.109 = -19dB Ist die Potentiometer-Stellung ganz oben (Boost), wird das Eingangssignal für diese Frequenz über den LCR-Serie-Schwingkreis kaum abgeschwächt und stark verstärkt: Am nicht-invertierenden Eingang: ve = (R1+50kΩ)/(RE+R1+50kΩ) = 0.836 Operations-Verstärker-Verstärkung: va = 1+RE/1kΩ = 11 Total Verstärkung (Boost): v = ve∙va = 9.197 = +19dB Interessant an dieser Schaltung ist, dass sich das Rauschen der unteren OperationsVerstärker bei Potentiometern in Mittelstellung gerade aufhebt. Häufig sieht man Schaltungen mit parallel geschalteten Doppel-T-Filtern. Der grosse Nachteil dieser Schaltungen ist, dass sich das Rauschen aller Operationsverstärker aufsummiert. Und der Bauteilaufwand ist für beide Schaltungen gleich gross. 75947166 / 14.05.16 Seite 10 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 4.2. Parametric Equalizer Beim parametrischen Equalizer wird eine Frequenz angehoben (Bandpass) bzw. abgesenkt (Bandsperre). Alle anderen Frequenzanteile werden unverändert ausgegeben. Beim parametrischen Equalizer können Mittenfrequenz, Bandbreite und Anhebung/Abschwächung frei gewählt werden. Zusammengefasst: der grafische Equalizer arbeitet mit vielen fest eingestellten Bandpässen, von denen nur die Verstärkung verändert werden kann. Der parametrische Equalizer benutzt nur einen Bandpass/Bandsperre, der aber beliebig konfiguriert werden kann. Der grafische Equalizer ist intuitiv verständlich und einfach zu bedienen. Spezielle Situationen (Rückkopplungspfeifen, Resonanzen, Instrumentenlautstärke stark frequenzabhängig, etc.) erfordern jedoch oft den Einsatz des wesentlich flexibleren parametrischen Equalizers. Parametrische Equalizer werden oft mit je einem Bass- und Hochton-Regler kombiniert, um die Extremfrequenzen fein angleichen zu können. Mehrere parametrische Equalizer können in Serie geschaltet werden, um (beliebig) komplexe Frequenzgänge realisieren zu können. 75947166 / 14.05.16 Seite 11 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 75947166 / 14.05.16 Seite 12 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 4.3. Präsenz Frequenzkomponenten im Bereich 2.5kHz werden verstärkt. Das sind die hohen Frequenzanteile in der menschlichen Sprache. Da hohe Frequenzen in der Luft stärker gedämpft werden (weit entfernte Schallquellen tönen deshalb dumpfer), wirkt das Anheben dieser Frequenzen so, als ob die Stimme ganz nahe (= präsent) wäre. 4.4. Wah Eine Frequenz im Bereich 400Hz -2kHz wird resonant hervorgehoben. Oft wird die Resonanzfrequenz mittels Pedal verändert. 75947166 / 14.05.16 Seite 13 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW 5. Frequenzänderung Die Frequenz unabhängig von der Signaldauer zu verändern, ist wohl am anspruchsvollsten. Eingesetzt wird diese Technik, um die Stimmung von Instrumenten anzupassen oder die Dauer einer Tonspur mit einer Filmspur zu synchronisieren. Der berühmteste Effekt der auf der Frequenzänderung aufbaut, ist wohl die Mikey-MouseStimme. 5.1. Pitch shifting Die Tonhöhe wird geändert. Die nahe liegende Idee einfach das Tape schneller (oder langsamer) laufen zu lassen, führt nicht zum gewünschten Resultat, weil die Dauer umgekehrt proportional zur Frequenz mit verändert wird. Die Funktionsweise wird erklärt für eine Erhöhung der Frequenz. Für das Absenken der Frequenz gelten analoge Überlegungen. Das Original-Signal wird aufgeteilt in kurze Blöcke (Länge < 20ms, sonst Echoeffekt). Die Blöcke werden um den gewünschten Faktor schneller abgespielt. In den entstehenden Lücken wird ein Teil des Blockes wiederholt. Problematisch ist, dass nur ein Teil des Blockes wiederholt wird und dass zwischen den Blöcken ein abrupter Signal-Übergang entstehen kann, welcher neue störende Frequenzanteile erzeugt. Es ist deshalb besser, die Blöcke überlappend neu zusammenzusetzen. Im Überlappungsbereich sorgt eine Fensterfunktion für einen sanften Übergang. Zudem werden die Blocklängen nicht fix gewählt, sondern an die Grundfrequenz dynamisch adaptiert. Die Blocklänge wird oft so gewählt, dass zwei Grundwellen Platz finden. Originalsignal aufgeteilt in kurze Blöcke Block 1 Block 2 Block 3 Block 4 Blöcke schneller abgespielt und teilweise wiederholt Block 1 B. 1 Block 2 B. 2 Block 3 B. 3 Block 4 B. 4 Blöcke schneller abgespielt und überlappend wiederholt Block 1 Block 1 Block 2 Block 2 Block 3 Block 3 Block 4 Block 4 Neben dieser im Zeitbereich skizzierten Methode gibt es auch Verfahren im Frequenzbereich, die vor allem bei Offline-Verarbeitung vorteilhaft sind. „Instrumental shifting“ arbeitet nach der oben beschriebenen Methode. Sie zeichnet sich aus durch einen weichen Übergang. Für das Transponieren von Stimmen über mehr als etwa einen Halbton ist sie weniger geeignet, da die Hüllkurve des Frequenzgangs mit transponiert wird, was unnatürlich klingt. Hier wird mit Vorteil „PSOLA-Shifting“ (Pitch Synchronous OverLap and Add) angewendet. „Hybrid Shifting“ verbindet die Vorteile von beiden Verfahren. 75947166 / 14.05.16 Seite 14 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW Analog wurde pitch shifting so gelöst: Ein fixer Schreibkopf nimmt das Signal auf ein Endlosband auf. Die Leseköpfe sind auf einer rotierenden Trommel angebracht. Jederzeit ist ein Lesekopf am Band und kann das Signal abspielen. Steht die Trommel still, ist das Signal am Lesekopf identisch mit jenem am Schreibkopf. Dreht die Trommel so, dass die relative Geschwindigkeit erhöht wird, steigt die Frequenz am Lesekopf. Dreht die Trommel so, dass die relative Geschwindigkeit gesenkt wird, sinkt die Frequenz am Lesekopf. Lese kopf Lese kopf Lese kopf Lese kopf Schreib kopf Endlos-Band 5.2. Time Streching Die Verfahren ähneln jenen, die beim pitch shifting angewendet werden. 5.3. Vibrato Funktioniert ähnlich wie pitch shifting. Es geht nicht in erster Linie um das Verschieben der Frequenz in einen anderen Bereich, sondern um das Variieren der Tonhöhe um das Original herum. Achtung: Tremolo (Amplituden-Modulation) und Vibrato (Frequenz-Modulation) werden oft verwechselt. 5.4. Sideband Modulation Zwei Signale werden miteinander multipliziert. y(t) = x1(t)∙x2(t) o---o Y(f) = X1(f)*X2(f) Die Multiplikation im Zeitbereich entspricht einer Faltung im Frequenzbereich. D.h. Es entstehen neue Frequenzkomponenten, nämlich Anteile mit der Differenz- und der Summenfrequenz der beiden Eingangssignale. Die Sideband Modulation heisst auch Ring Modulation, da die Multiplikation analog mit einem Dioden-Ring (Brückengleichrichter) und zwei Transformatoren ausgeführt werden kann. Heute stehen Analog-Multiplizierer als ICs zur Verfügung: y(t) = e^(ln(x1(t)+ln(x2(t)) Sideband Modulation tönt nicht harmonisch, da die neu entstehenden Komponenten keine Vielfachen der Ausgangsfrequenzen sind. Sideband Modulation gehört zum Alltagsgeschäft der Nachrichtentechnik, um Signalspektren in einen anderen Frequenzbereich zu verschieben. Damit lassen sich z.B. auf einer Leitung viele Telefongespräche gleichzeitig übertragen: Gespräch 1: 0.3-4kHz Gespräch 2: 4.3-8kHz Gespräch 3: 8.3-12kHz etc. 75947166 / 14.05.16 Seite 15 / 15 Rumc&Hhrt@ZSN@SoE@ZHAW