1. Mögliche Ansätze für Audio

Werbung
Digitale Signal-Verarbeitung 1
Kapitel 6: Audio-Effekte
Inhaltsverzeichnis
1.
MÖGLICHE ANSÄTZE FÜR AUDIO-EFFEKTE .................................................................................. 2
2.
AMPLITUDENÄNDERUNG ...................................................................................................................... 3
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
3.
ZEITVERZÖGERUNG ............................................................................................................................... 6
3.1.
3.2.
3.3.
3.4.
3.5.
4.
ECHO ...................................................................................................................................................... 6
REVERBERATION .................................................................................................................................... 6
PHASING ................................................................................................................................................. 7
FLANGING .............................................................................................................................................. 7
CHORUS ................................................................................................................................................. 8
FREQUENZSELEKTION .......................................................................................................................... 9
4.1.
4.2.
4.3.
4.4.
5.
CLIPPING/OVERDRIVE ............................................................................................................................ 3
COMPRESSION ........................................................................................................................................ 3
EXPANSION ............................................................................................................................................ 5
DUCKER ................................................................................................................................................. 5
NOISE GATING ....................................................................................................................................... 5
TREMOLO ............................................................................................................................................... 5
GRAPHIC EQUALIZER ............................................................................................................................. 9
PARAMETRIC EQUALIZER ..................................................................................................................... 11
PRÄSENZ .............................................................................................................................................. 13
WAH..................................................................................................................................................... 13
FREQUENZÄNDERUNG ......................................................................................................................... 14
5.1.
5.2.
5.3.
5.4.
PITCH SHIFTING .................................................................................................................................... 14
TIME STRECHING.................................................................................................................................. 15
VIBRATO .............................................................................................................................................. 15
SIDEBAND MODULATION ..................................................................................................................... 15
Ergänzende Literatur
[1] S.J. Orfanidis, „Introduction to Signal Processing“, Prentice Hall, 1996.
[2] http://www.harmony-central.com/Effects/
[3] http://users.chariot.net.au/~gmarts/guitar.htm
75947166 / 14.05.16
Seite 1 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
1. Mögliche Ansätze für Audio-Effekte
Die allgemein verwendeten Effekte lassen sich vier Kategorien zuordnen.
Alle Effekte können sowohl analog (HW) als auch softwaremässig (z.B. mit Matlab) realisiert
werden. Mit „Digitalen Signal Prozessoren“ lassen sich die Vorteile von beiden vereinen.
Ansatz
Effekte
Analoge
Lösung
Amplitudenänderung
Clipping/Overdrive
Compression
Ducker
Expansion
Noise Gating
Tremolo
Nichtlineare
Bauteile (Dioden)
Steuerbarer
Spannungsteiler
(FET)
Software- If (abs(x) < knie) {
Lösung
verst = gross;
} else {
verst = klein;
}
DSPAdaptive Filter
Lösung
Zeitverzögerung
Echo
Reverberation
Chorus
Flanging
Phasing
Frequenzselektion
Graphic
Equalizer
Parametric
Equalizer
Präsenz
Wah
Frequenzänderung
Hall-Spirale
Endlosband
mit versetzten
Schreib- und
Leseköpfen
CCD-Ketten
Ringbuffer
(mit mehreren
Pointern)
Bandpässe,
Bandsperren
Doppel-T-Filter
Endlosband mit
rotierenden Schreibund/oder Leseköpfen
Ring-Modulatoren
Analog-Multiplizierer
Ringbuffer
FIR-Filter
IIR-Filter und
Filterbänke
Pitch Shifting
Time Streching
Vibrato
Sideband Modulation
Frequenzbereich Frequenzbereich
FFT-Filter-IFFT
FFT-Filter-IFFT
Ringbuffer
(mit mehreren
Pointern)
Multiraten-Systeme
Frequenzbereich
Ringbuffer
Veränderte Phasenlage wird vom menschlichen Gehör nicht wahrgenommen. Deshalb gibt
es auch keine Effekte, die die Phasenlage der Signalkomponenten in Betracht ziehen.
Anmerkung: In der Bildverarbeitung ist die Situation komplett verschieden. Veränderungen in
der Phasenlage (Kanten, Farbübergänge) werden viel stärker wahrgenommen als jene in der
Amplitude (Helligkeit, Kontrast).
75947166 / 14.05.16
Seite 2 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
2. Amplitudenänderung
Diese Methoden sind einfach implementierbar, da nur die momentane Lautstärke angepasst
wird.
2.1. Clipping/Overdrive
Das Signal wird auf einen bestimmten Wert begrenzt
(abgeschnitten).
In der Analogtechnik hat sich diese Schaltung bewährt. Mit dem
Potentiometer kann stufenlos zwischen „hard clipping“ und „soft
clipping“ gewählt werden.
Hier wird immer mit Momentanwerten gearbeitet; es findet also
keine zeitliche Mittelung der Lautstärke statt. Durch die nichtlineare
Kennlinie werden Oberwellen (Harmonische) erzeugt, die den Klang
schriller und voller machen. Anwendung vor allem bei Gitarren.
in
P
out
D
D
2.2. Compression
Clipping schneidet einfach die Spitzen ab. Compression variiert die Verstärkung so, dass
leise Passagen verstärkt und laute Passagen abgeschwächt werden.
Attac gibt an, wie schnell (ca. 50ms) die Verstärkung zurückgeregelt wird, wenn die
Lautstärke zunimmt. Decay gibt an, wie schnell (ca. 200ms) die Verstärkung erhöht wird,
wenn die Lautstärke abnimmt.
Weil hier kein nichtlineares Verhalten vorliegt, werden auch keine Oberwellen erzeugt.
Diese Art von Kompression wird sehr oft bei Mikrofon-Aufnahmen in lärmiger Umgebung
eingesetzt.
Bei Saiteninstrumenten wirkt die Schaltung dem Abfall der Lautstärke nach dem Zupfen
entgegen.
Companding: Kompression => „Kanal“ => Expansion. Damit kann das SNR (signal to noise
ratio) bei Übertragungskanälen verbessert und Übersteuerung vermieden werden.
75947166 / 14.05.16
Seite 3 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
75947166 / 14.05.16
Seite 4 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
2.3. Expansion
Da die Input-Output-Kennlinie des Kompressors monoton ist, kann aus jedem komprimierten
Signal das ursprüngliche wieder gewonnen werden. Das ist die Aufgabe des Expanders.
Companding: Kompression => „Kanal“ => Expansion. Damit kann das SNR (signal to noise
ratio) bei Übertragungskanälen verbessert und Übersteuerung vermieden werden.
Beispiel: Dolby A: „Kanal“ ist ein Tonband
=> Aufnahme: leise (rauschgefährdete) Passagen lauter als normal
=> Abspielen: Abschwächung der leisen Passagen
2.4. Ducker
Der „Ducker“ (engl. to duck = sich ducken) dient dem Abschwächen der Musik während einer
Ansage. Er arbeitet genau gleich wie der Compressor, nur dass das Sprachsignal verwendet
wird, um die Verstärkung der Musik zu steuern. Es ist somit ein einfaches adaptives Filter.
Sprache
(kick drum)
Level
Gain
Detector c[n] Control
g[n]
Musik
Mischkonstante
Ausgang
2.5. Noise Gating
Funktioniert wie Compression, nur werden hier die
leisen Passagen abgeschwächt oder sogar ganz
ausgelöscht.
Damit kann schwaches Rauschen und Brummen in
einer Sprech-, Spiel- oder Sendepause eliminiert
werden.
2.6. Tremolo
Die Lautstärke wird periodisch mit einer Geschwindigkeit von einigen Hertz verändert.
75947166 / 14.05.16
Seite 5 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
3. Zeitverzögerung
Allen hier erwähnten Methoden ist gemeinsam, dass das ursprüngliche Signal verzögert und
eventuell abgeschwächt zum Original addiert wird.
Die Unterschiede liegen in der Verzögerungszeit und der Abschwächung. Einige Effekte
nutzen zudem mehrere Verzögerungspfade parallel.
3.1. Echo
Das menschliche Ohr nimmt ein Echo als solches war, wenn die Verzögerung grösser als
50ms ist. 1/50ms = 20Hz = untere Grenzfrequenz des menschlichen Gehörs.
Das Echo ist ein
Grundbaustein für
kompliziertere Audioeffekte.
D·Ts: roundtrip-Delay
a: Dämpfung (Reflexion und
Ausbreitung)
FIR-Kamm-Filter mit äquidistanten „notches“
3.2. Reverberation
Der Fachbegriff „Reverberation“ bedeutet Widerhall oder
Nachhall.
Der Nachhall ist das Resultat der Schallreflexion an den Wänden
(und Gegenständen) im Raum.
Da die Abstände zu Wänden, Decke und Boden verschieden
sind, erzeugen sie nacheinander „einzelne“ frühe Reflexionen.
Die ersten Reflexionen werden wieder reflektiert, was
viele, „zufällige“, abfallende späte/diffuse Reflexionen
Ih[n]I
verursacht, was das Raumempfinden ausmacht.
Die Nachhallzeit ist definiert als Zeit, bis der Schallpegel
um 60dB abgeklungen ist. Die Nachhallzeit hängt von
der Raumgrösse und dem Absorptionsvermögen der
Wände ab. Sie beträgt für Konzerthallen ca. 1.5 bis 2s.
75947166 / 14.05.16
Seite 6 / 15
frühe Reflexionen
späte Reflexionen
nTs
Rumc&Hhrt@ZSN@SoE@ZHAW
Im obigen Beispiel: „Schröders Nachhall-Prozessor“
3.3. Phasing
Das Signal wird um einen Bruchteil einer Millisekunde verzögert (= phasenverschoben) und
zum Originalsignal addiert. Wo die Phasenlage ein Vielfaches von 2π ist, wird das Signal
verstärkt, bei (2n+1)π löschen sich die Signale aus. Bei linearem Phasengang sind die
Lücken im Frequenzspektrum linear (und nicht harmonisch) verteilt.
Der Name Phasing ist etwas irreführend. Der Effekt beruht nicht auf der Änderung der
Phasenlage, sondern auf Verstärken bzw. Auslöschen bestimmter Frequenzkomponenten,
verursacht durch Addition des verzögerten Signals zum Original.
3.4. Flanging
Funktioniert wie Phasing, aber die Zeitverzögerung ist grösser und liegt im Bereich 1 bis
10ms. Dadurch ergeben sich viel mehr Kerben im Frequenzgang und es werden bestimmte
Frequenzen und ihre Oberwellen hervorgehoben.
Häufig wird die Zeitverzögerung mit einer tiefen Frequenz variiert, was einen eher
unnatürlichen speziellen Klag erzeugt.
75947166 / 14.05.16
Seite 7 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
3.5. Chorus
75947166 / 14.05.16
Seite 8 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
4. Frequenzselektion
Einzelne Frequenzen oder ganze Frequenzbereiche sollen angepasst werden, um ein
ausgeglichenes Gesamtes zu ergeben oder um spezielle Effekte zu erreichen.
Dazu werden sowohl in der Analog- als auch in der Digital-Technik vornehmlich Bandpässe
und Bandsperren eingesetzt.
4.1. Graphic Equalizer
Mit einem Equalizer wird der Frequenzgang kompensiert (equalize = ausgleichen).
Grafische Equalizer verwenden N parallele BP-Filter (z.B. 1. Ordnung). Die Mittenfrequenzen
sind äquidistant auf logarithmischer Frequenzskala, d.h. aufeinander folgende
Mittenfrequenzen werden mit einem konstanten Faktor multipliziert, was unserem Gehör
entspricht. (Z.B. Faktor 2 = Oktave: z.B. 50Hz, 100Hz, 200Hz, 400Hz, 800Hz, 1600Hz,
3200Hz, 6400Hz, 12800Hz).
Die Ausgänge jedes Bandpassfilters werden separat verstärkt resp. abgeschwächt (± 6-20
dB).
Die Ausgänge der einzelnen Bandpässe werden gewichtetet addiert.
Grafische Equalizer weisen eine (weitgehend) lineare Phase und (fast) keine
Zeitverzögerung auf
75947166 / 14.05.16
Seite 9 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
und der Rippel ist sehr klein.
Für Analog-Freaks: http://www.ethanwiner.com/spectrum.html (= Quelle dieses Schemas)
Der Mittelabgriffe der 50kΩ-Potentiometer werden über LCR-Serie-Schwingkreise geerdet.
Die Induktivitäten L werden dabei mit Gyratoren erzeugt (Bild rechts).
Konkret sind also die Mittelabgriffe der Potentiometer jeweils für die Resonanzfrequenz
ω2 = 1/(L∙C) über den Widerstand R1 geerdet.
Ist die Potentiometer-Stellung ganz unten (Cut), wird das Eingangssignal für diese Frequenz
über den LCR-Serie-Schwingkreis fast kurzgeschlossen und wenig verstärkt:
Am nicht-invertierenden Eingang: ve = R1/(RE+R1) = 0.091
Operations-Verstärker-Verstärkung: va = 1+RE/(50kΩ+1kΩ) = 1.196
Total Verstärkung (Cut): v = ve∙va = 0.109 = -19dB
Ist die Potentiometer-Stellung ganz oben (Boost), wird das Eingangssignal für diese
Frequenz über den LCR-Serie-Schwingkreis kaum abgeschwächt und stark verstärkt:
Am nicht-invertierenden Eingang: ve = (R1+50kΩ)/(RE+R1+50kΩ) = 0.836
Operations-Verstärker-Verstärkung: va = 1+RE/1kΩ = 11
Total Verstärkung (Boost): v = ve∙va = 9.197 = +19dB
Interessant an dieser Schaltung ist, dass sich das Rauschen der unteren OperationsVerstärker bei Potentiometern in Mittelstellung gerade aufhebt.
Häufig sieht man Schaltungen mit parallel geschalteten Doppel-T-Filtern. Der grosse
Nachteil dieser Schaltungen ist, dass sich das Rauschen aller Operationsverstärker
aufsummiert. Und der Bauteilaufwand ist für beide Schaltungen gleich gross.
75947166 / 14.05.16
Seite 10 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
4.2. Parametric Equalizer
Beim parametrischen Equalizer wird eine Frequenz angehoben (Bandpass) bzw. abgesenkt
(Bandsperre). Alle anderen Frequenzanteile werden unverändert ausgegeben. Beim
parametrischen Equalizer können Mittenfrequenz, Bandbreite und Anhebung/Abschwächung
frei gewählt werden.
Zusammengefasst: der grafische Equalizer arbeitet mit vielen fest eingestellten Bandpässen,
von denen nur die Verstärkung verändert werden kann. Der parametrische Equalizer benutzt
nur einen Bandpass/Bandsperre, der aber beliebig konfiguriert werden kann.
Der grafische Equalizer ist intuitiv verständlich und einfach zu bedienen. Spezielle
Situationen (Rückkopplungspfeifen, Resonanzen, Instrumentenlautstärke stark
frequenzabhängig, etc.) erfordern jedoch oft den Einsatz des wesentlich flexibleren
parametrischen Equalizers.
Parametrische Equalizer werden oft mit je einem Bass- und Hochton-Regler kombiniert, um
die Extremfrequenzen fein angleichen zu können.
Mehrere parametrische Equalizer können in Serie geschaltet werden, um (beliebig)
komplexe Frequenzgänge realisieren zu können.
75947166 / 14.05.16
Seite 11 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
75947166 / 14.05.16
Seite 12 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
4.3. Präsenz
Frequenzkomponenten im Bereich 2.5kHz werden verstärkt. Das sind die hohen
Frequenzanteile in der menschlichen Sprache. Da hohe Frequenzen in der Luft stärker
gedämpft werden (weit entfernte Schallquellen tönen deshalb dumpfer), wirkt das Anheben
dieser Frequenzen so, als ob die Stimme ganz nahe (= präsent) wäre.
4.4. Wah
Eine Frequenz im Bereich 400Hz -2kHz wird resonant hervorgehoben.
Oft wird die Resonanzfrequenz mittels Pedal verändert.
75947166 / 14.05.16
Seite 13 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
5. Frequenzänderung
Die Frequenz unabhängig von der Signaldauer zu verändern, ist wohl am anspruchsvollsten.
Eingesetzt wird diese Technik, um die Stimmung von Instrumenten anzupassen oder die
Dauer einer Tonspur mit einer Filmspur zu synchronisieren.
Der berühmteste Effekt der auf der Frequenzänderung aufbaut, ist wohl die Mikey-MouseStimme.
5.1. Pitch shifting
Die Tonhöhe wird geändert. Die nahe liegende Idee einfach das Tape schneller (oder
langsamer) laufen zu lassen, führt nicht zum gewünschten Resultat, weil die Dauer
umgekehrt proportional zur Frequenz mit verändert wird.
Die Funktionsweise wird erklärt für eine Erhöhung der Frequenz. Für das Absenken der
Frequenz gelten analoge Überlegungen.
Das Original-Signal wird aufgeteilt in kurze Blöcke (Länge < 20ms, sonst Echoeffekt).
Die Blöcke werden um den gewünschten Faktor schneller abgespielt. In den entstehenden
Lücken wird ein Teil des Blockes wiederholt. Problematisch ist, dass nur ein Teil des Blockes
wiederholt wird und dass zwischen den Blöcken ein abrupter Signal-Übergang entstehen
kann, welcher neue störende Frequenzanteile erzeugt.
Es ist deshalb besser, die Blöcke überlappend neu zusammenzusetzen. Im
Überlappungsbereich sorgt eine Fensterfunktion für einen sanften Übergang.
Zudem werden die Blocklängen nicht fix gewählt, sondern an die Grundfrequenz dynamisch
adaptiert. Die Blocklänge wird oft so gewählt, dass zwei Grundwellen Platz finden.
Originalsignal aufgeteilt in kurze Blöcke
Block 1
Block 2
Block 3
Block 4
Blöcke schneller abgespielt und teilweise wiederholt
Block 1
B. 1
Block 2
B. 2
Block 3
B. 3
Block 4
B. 4
Blöcke schneller abgespielt und überlappend wiederholt
Block 1
Block 1
Block 2
Block 2
Block 3
Block 3
Block 4
Block 4
Neben dieser im Zeitbereich skizzierten Methode gibt es auch Verfahren im
Frequenzbereich, die vor allem bei Offline-Verarbeitung vorteilhaft sind.
„Instrumental shifting“ arbeitet nach der oben beschriebenen Methode. Sie zeichnet sich aus
durch einen weichen Übergang. Für das Transponieren von Stimmen über mehr als etwa
einen Halbton ist sie weniger geeignet, da die Hüllkurve des Frequenzgangs mit transponiert
wird, was unnatürlich klingt. Hier wird mit Vorteil „PSOLA-Shifting“ (Pitch Synchronous
OverLap and Add) angewendet. „Hybrid Shifting“ verbindet die Vorteile von beiden
Verfahren.
75947166 / 14.05.16
Seite 14 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
Analog wurde pitch shifting so gelöst:
Ein fixer Schreibkopf nimmt das Signal auf ein
Endlosband auf.
Die Leseköpfe sind auf einer rotierenden
Trommel angebracht.
Jederzeit ist ein Lesekopf am Band und kann
das Signal abspielen.
Steht die Trommel still, ist das Signal am
Lesekopf identisch mit jenem am Schreibkopf.
Dreht die Trommel so, dass die relative
Geschwindigkeit erhöht wird, steigt die
Frequenz am Lesekopf.
Dreht die Trommel so, dass die relative
Geschwindigkeit gesenkt wird, sinkt die
Frequenz am Lesekopf.
Lese
kopf
Lese
kopf
Lese
kopf
Lese
kopf
Schreib
kopf
Endlos-Band
5.2. Time Streching
Die Verfahren ähneln jenen, die beim pitch shifting angewendet werden.
5.3. Vibrato
Funktioniert ähnlich wie pitch shifting. Es geht nicht in erster Linie um das Verschieben der
Frequenz in einen anderen Bereich, sondern um das Variieren der Tonhöhe um das Original
herum.
Achtung: Tremolo (Amplituden-Modulation) und Vibrato (Frequenz-Modulation) werden oft
verwechselt.
5.4. Sideband Modulation
Zwei Signale werden miteinander multipliziert.
y(t) = x1(t)∙x2(t)
o---o
Y(f) = X1(f)*X2(f)
Die Multiplikation im Zeitbereich entspricht einer Faltung im Frequenzbereich. D.h. Es
entstehen neue Frequenzkomponenten, nämlich Anteile mit der Differenz- und der
Summenfrequenz der beiden Eingangssignale.
Die Sideband Modulation heisst auch Ring Modulation, da die Multiplikation analog mit
einem Dioden-Ring (Brückengleichrichter) und zwei Transformatoren ausgeführt werden
kann. Heute stehen Analog-Multiplizierer als ICs zur Verfügung: y(t) = e^(ln(x1(t)+ln(x2(t))
Sideband Modulation tönt nicht harmonisch, da die neu entstehenden Komponenten keine
Vielfachen der Ausgangsfrequenzen sind.
Sideband Modulation gehört zum Alltagsgeschäft der Nachrichtentechnik, um Signalspektren
in einen anderen Frequenzbereich zu verschieben.
Damit lassen sich z.B. auf einer Leitung viele Telefongespräche gleichzeitig übertragen:
Gespräch 1: 0.3-4kHz
Gespräch 2: 4.3-8kHz
Gespräch 3: 8.3-12kHz
etc.
75947166 / 14.05.16
Seite 15 / 15
Rumc&Hhrt@ZSN@SoE@ZHAW
Herunterladen