Hauptseminar: Musikalische Datenbanken Hörmodelle & Psychoakustische Phänomene Wie funktioniert das Ohr und welche „seltsamen” Dinge ereignen sich beim täglichen Hören? Akustische Informationsverarbeitung des Gehörs und deren maschinelle Simulation. TU Chemnitz, WS 2004/2005 Janina Bär Gliederung 1. Das Ohr 1.1 Aufbau des Ohres 1.2 So hören wir 2. Hörmodelle 3. Psychoakustische Phänomene 3.1 Einleitung 3.2 Die Hörschwelle 3.3 Maskierung 3.3.1 Simultane Maskierung 3.3.2 Zeitliche Maskierung 3.4 Der Haas-Effekt 3.5 Dominierende Hörempfindung 3.6 Transiente Töne 3.7 Tonhöhenempfindung 3.8 Virtuelles Hören 3.8.1 Ersetzen fehlender Töne 3.8.2 Grundtonhören 4. Quellenangabe 1. Das Ohr 1.1 Teile des Ohres Das Ohr besteht aus drei Teilen: 1. Das Außenohr Das Ohr bzw. die Ohrmuschel dient dem Richtungshören. Der Gehörgang leitet den Schall weiter. 2. Das Mittelohr Das Trommelfell ist straff, wie bei einer Abb. 1: Teile des Ohrs richtigen Trommel und wird durch den Schall in Schwingungen versetzt. Die drei Gehörknöchelchen Hammer, Amboß und Steigbügel leiten die Schwingungen des Trommelfells ans Innenohr weiter. 3. Das Innenohr Die Schnecke oder Cochlea ist mit Flüssigkeit gefüllt. Sie enthält sehr sensible Zellen, die sogenannten Haarzellen. Diese 21000 bis 30000 Haarzellen spielen beim Hören eine wichtige Rolle. Der Hörnerv führt von der Cochlea ins Gehirn. Quelle: MED-EL GmbH 1. Das Ohr 1.2 So hören wir 1. Schallwellen führen zu Luftdruckschwankungen, die durch den Gehörgang auf das Trommelfell übertragen werden. 2. Das Trommelfell schwingt im Takt des akustischen Reizes. 3. Durch diese Schwingungen werden die Gehörknöchelchen bewegt, wodurch der akustische Reiz an die Cochlea weiterAbb. 2: Funktionsweise des Ohrs geleitet wird. 4. Die Schallschwingungen werden auf ihrem Weg vom äußeren Ohr zur Cochlea verstärkt. 5. Diese Schwingungen versetzen die Flüssigkeit in der Cochlea und damit die Haarzellen in Bewegung. Die Haarzellen werden so zur Auslösung von elektrischen Impulsen (sog. Aktionspotentialen) angeregt. 6. Die Aktionspotentiale gelangen über den Hörnerv zum Gehirn. 7. Das Gehirn empfängt die Aktionspotentiale des Hörnervs und interpretiert sie als akustisches Ereignis (Geräusch, Klang, Sprache). Quelle: MED-EL GmbH 2. Hörmodelle Hörmodelle – Wozu? Um die Gesetzmäßigkeiten und Mechanismen des Hörens an sich zu verstehen. Dabei soll nicht jede einzelne Nervenzellen simuliert werden, sondern eher der gesamte Vorgang. Dieser wird in einzelne Phasen (Blöcke: Filterbank, Kompression, internes Rauschen, Modulationsfilterbank, binaurale Störschallunterdrückung, zentraler „optimaler” Mustererkenner) unterteilt und mit technischen Bauelementen modelliert. Abb. 3: Das Ohr aus der Sicht eines Physikers 2. Hörmodelle Beispiele für Hörmodelle: 1. Das Lautheitsmodell... ...beschreibt die Lautheitswahrnehmung die abhänig von der Schallintensität, dem Schallspektrum und Schalldauer ist. Die Modulationsblöcke „Modulationsfilterbank”, „Internes Rauschen” und „binaurale Störschallunterdrückung” werden dabei nicht betrachtet. 2. Das Boston-Modell... ...beschreibt die Leistungen des binauralen (zweiohrigen) Hörens unter expliziter Modellierung von Neuroneneigenschaften. 3. Das Bochumer Modell... ...benutzt nachrichtentechnische Funktionselemente, um charakteristische Eigenschaften der binauralen Informationsverarbeitung im Gehirn funktionell zu modellieren. 4. Das Modell der Cambridge-Arbeitsgruppe... ...setzt Schwerpunkte bei der Tonhöhenerkennung und dem Übergang von der Wahrnehmung aperiodischer Vorgänge in periodische Vorgänge. 5. Oldenburger Perzeptionsmodell... ...legt einen besonderen Schwerpunkt auf die zeitlichen Eigenschaften der Signalverarbeitung im Gehör und bildet eine relativ große Zahl von psychoakustischen Effekten quantitativ nach. Eine Stärke des Modells ist die „optimale” Mustererkennung. 3. Psychoakustische Phänomene 3.1 Einführung „Definition” Die Psychoakustik befasst sich mit dem Zusammenhang zwischen physikalischem Reiz (Lautstärke, Tonhöhe, Frequenz) und der darauffolgenden psychologischen Reaktion des Menschen. Audiocodierer, die psychoakustische Phänomene nutzen, nennt man: „Perceptual Audio Coder” -> Vortrag Nadine Es gibt derzeit kein technisches Verfahren zur Bewertung solcher AudioCodierer. Deswegen müssen Hörtests mit geschulten Testpersonen durchgeführt werden. Die Psychoakustik bildet somit eine sinnvolle Ergänzung der objektiven Beschreibung von Geräuschen, mit deren Hilfe sich die subjektive Wirkung von Schallreizen auf den Menschen näher erklären lässt. 3. Psychoakustische Phänomene 3.2 Die Hörschwelle Töne müssen eine Mindestlautstärke haben, um wahrgenommen zu werden. Diese Mindestlautstärke ist abhängig von der Frequenz des Tons. Spielt man einer Testperson Töne verschiedener Frequenz vor, deren Lautstärke man erhöht, bis der Ton gerade wahrgenommen wird, erhält man folgendes Diagramm: Abb. 4: Die Hörschwelle als Funktion der Frequenz 3. Psychoakustische Phänomene 3.3 Maskierung 3.3.1 Simultane Maskierung Ein Ton von 1 kHz und einer Lautstärke von 60 db (sog. Maskierungston) verändert die Hörschwelle drastisch. Töne höherer Frequenz müssen nun wesentlich lauter sein, um überhaupt wahrgenommen zu werden. Abb. 5: Hörschwelle Abb. 6: Änderung der Hörschwelle Oder anders: Wenn sonst Stille herrscht, hört man einen sehr leisen Ton von 1 kHz sofort, während beispielsweise ein Ton von 100 Hz bei selber Lautstärke evtl. nicht wahrnehmbar ist. 3. Psychoakustische Phänomene 3.3 Maskierung 3.3.2 Zeitliche Maskierung = Signale auf der Zeitachse ausblenden Nach der Registrierung eines lauten Tons / Geräuschs (Gauß-Impuls) benötigt das Gehör eine gewisse „Erholungszeit” (Recovery Time). Während dieser nimmt es einen ähnlichen, leiseren Ton nicht wahr. Die Zeit, die vergeht bis man den leiseren Ton wieder wahrnimmt, ist abhängig vom Lautstärke- und Frequenzverhältnis der beiden Töne. Sie liegt im Bereich von ca. 5 – 20 ms. Allerdings werden auch keine Töne wahrgenommen, die vor dem Gauß-Impuls liegen. Abb. 7: Gauß-Impuls 3. Psychoakustische Phänomene 3.4 Der Haas-Effekt Geht auf Untersuchungen von Helmut Haas zurück: „Über den Einfluss eines Einfach-Echos auf die Hörsamkeit von Sprache” (1951) für Verzögerungszeiten zwischen 10 – 30ms gilt: für die Lokalisierung des Schallsenders ist der zuerst einfallende Schall maßgeblich – unabhängig davon, aus welcher Richtung der verzögerte Schall eintrifft – man hört nur eine Schallquelle für Verzögerungszeiten > 40ms gilt: man bemerkt das Vorhandensein getrennter Schallreflexionen man lokalisiert die Schallquelle trotzdem aus der Richtung des ersten Schalls für Verzögerungszeiten > 50ms gilt: Direktsignal und Reflexion / verzögert ausgestrahltes Signal werden als zeitlich Abb. 8: Verschmelzungszone des Haas-Effekts und räumlich getrennt empfunden -> Echo Beispiel: Raumakustik 3. Psychoakustische Phänomene 3.5 Dominierende Hörempfindung Wesselsche Täuschung: Die zuerst eintreffende Schallfront bestimmt, welches Ohr welcher Klangfarbe folgt. (Gesetz der ersten Wellenfront) 3. Psychoakustische Phänomene 3.5 Dominierende Hörempfindung Experiment: Rechtes Ohr: wechselweise zunächst hoher Ton, danach tiefer Ton Linkes Ohr: zeitgleich wechselweise tiefer Ton, danach hoher Ton Effekt: scheinbar auf einer Seite nur der hohe und auf der anderen Seite nur der tiefe Ton zu hören Ergebnis: zeigt, dass ein Ohr die Hörempfindung dominieren kann, und zwar dasjenige, das zuerst gereizt wird denn: hohe Töne (höhere Frequenz) kommen „schneller” an 3. Psychoakustische Phänomene 3.6 Transiente Töne transienter Schall = nicht wiederkehrender zeitlicher Beginn eines Tons Das menschliche Gehirn ermittelt anhand des charakteristischen Einschwingverhaltens der Töne Instrumente und Stimmen. Dabei greift es auf Erfahrungen / Gelerntes zurück (akustische Mustererkennung). Ergebnis: Wir erkennen eine Einheit aus definierter Tonhöhe, Lautstärke und Klangfarbe Abb. 9: Grundton und Oberton Experiment: zeigt die Bedeutung der Art und Weise, wie sich der Klang und sein Obertonspektrum in der Zeit von weniger als 0,1 s aufbaut Töne ohne das charakteristische Einschwingverhalten werden vom Menschen nicht mehr exakt erkannt. 3. Psychoakustische Phänomene 3.7 Tonhöhenempfindung Der Mensch empfindet eine Tonhöhe relativ zu einer anderen. Begründung: diese Information ist für die „musikalische Botschaft” die wesentlichste. (minimaler Aufwand, maximaler Effekt) Das Gehirn nimmt die Melodie als Sequenz von Tonhöhenunterschieden wahr, nicht als Sequenz von Tonhöhenwerten. Deswegen ist die Tonhöhe eine Referenzgröße. Das Kurzzeitgedächtnis speichert (meist) die gerade verarbeitet Frequenz als Referenz oder sie (die Frequenz) ist das erwartete Ergebnis auf Grund eines Lernprozesses. Mit ihr vergleichen wir das momentan Gehörte und gelangen zu Aussagen wie: „Das klingt aber schief!” Melodieaufspaltung: Unser Gehirn neigt dazu Töne nach der Nähe ihrer Tonhöhe zusammenzufassen, statt nach ihrer zeitlichen Nähe. Deswegen sind wir fähig mehrstimmige Musik zu erfassen. 3. Psychoakustische Phänomene 3.8 Virutelles Hören 3.8.1 Ersetzen fehlender Töne Gleitender Ton = schneller, periodischer Wechsel der Frequenz bei gleichbleibender Lautstärke Wenn man dieses „Schwingen” zerschneidet, nimmt der Mensch diese Pausen wahr. Abb. 10: gleitender Ton mit Unterbrechungen Füllt man die „Lücken” mit einem Rauschen, wird das fehlende Stück durch das Ohr ergänzt. (Gesetz der guten Fortsetzung) Bemerkung: man hört das Rauschen auch Abb. 11: gleitender Ton mit Rauschen 3. Psychoakustische Phänomene 3.8 Virutelles Hören 3.8.2 Grundtonhören Der Grundton ergibt sich aus der Differenz 2er aufeinanderfolgender Obertöne. Falls der Grundton im Signal fehlt, ist das menschliche Gehirn in er Lage ihn zu „komponieren”. Beispiel: Telefon Abb. 12: Grundton und Oberton - - - - - - - 4. Quellenangabe Felber, Michael: Psychoakustische Phänomene, Vortrag im Rahmen des Seminars Musikalische Datenbanken TU Chemnitz, SS 2002 URL: http://www.michael-felber.de/index.php Fiedler, Martin: Projektarbeit Datenkompression (4.2.2 Psychoakustische Phänomene) TU Chemnitz, 1999/2000 URL: http://www-user.tu-chemnitz.de/~mfie/compproj/4media.htm#psycho Kollmeier, Birger: Cocktail-Partys und Hörgeräte: Biophysik des Gehörs Physikalisch inspirierte Hörmodelle weisen den Weg zu intelligenten Hörgeräten 2002 URL: http://medi.uni-oldenburg.de/download/docs/paper/kollmeier_2002_biophysik.pdf MED-EL GmbH – deutsche Homepage URL: http://www.medel.com/lang/ger/ Scheuermann, Thorsten: Proseminar: Redundanz – MP3-Audiokompression (3. Psychoakustik) Universität Karlsruhe, WS 1998/1999 URL: http://goethe.ira.uka.de/seminare/redundanz/vortrag14/#psychoakustik Sengpiel, Eberhard: Haas-Effekt und Präzedenz-Effekt (Gesetz der ersten Wellenfront) Universität der Künste Berlin URL: http://www.sengpielaudio.com/Haas-Effekt.pdf Stumpe, Jörg Realität und Wahrnehmung in der Akustik (4. Psychoakustik) Universität Oldenburg, 2000 URL: http://www-cg-hci.informatik.uni-oldenburg.de/~airweb/Seminarphase/JoergStumpe/ html/Psychoakustik.html Yost, William A.: Fundamentals of haering: an introduction (third edition) Academic Press Limited, London, 1994