Hearing The Gateway to Speech Perception Der Hörer • Kommunikation: Übertragung von Gedanken oder Gefühlen von einem Sprecher zu ein einem Hörer. • Bedeutungen werden den Lautmustern entnommen. • Grundlage für die auditive Analyse bilden die Gebiete der Phonetik, der Phonologie, ebenso wie Morphologie und Syntax. www.ocw.mit.edu/OcwWeb/Electrical-Engineering-and-Computer-Science/6-542JFall-2005/Syllabus/ 1. Wie funktioniert „hören“? • Das menschliche Gehörsystem analysiert Klänge anhand Frequenz- und Intensitätsänderungen (in der Zeit). • Nicht nur Änderung in Amplitude, sondern auch in ihrer Übertragungsart (Außenohr Mittelohr Cochlea Gehörnerv Gehirn) • Mittelohr: Druckwellenmechan. Schwingungen (mittels Gehörknöchelchenkette) • Transformation der Schwingungen in der im Temporallappen liegenden Cochlea: mechanische Schwingungen Wanderwellen • Nervenenden der Cochlea Nervenimpulse Gehirn Das Ohr Außenohr Mittelohr Innenohr http://commons.wikimedia.org/wiki/Image:HumanEar.jpg Wieso benötigt der Mensch zwei Ohren? • Der Mensch benötigt zwei Ohren, um die Schallquelle zu bestimmen. • Handelt es sich jedoch um eine gehörlose bzw. schwerhörige Person, besteht die Schwierigkeit darin, festzustellen, woher ein Geräusch/Klang kommt und wo sich somit unter Umständen weitere Personen (im Raum) befinden. 2. Aus welchen Teilen besteht das Außenohr? a) b) Ohrmuschel Eigenschaften: Klangfilterung; empfänglicher gegenüber Klängen auf der Vorderseite des Körpers; Richtungshören Funktion: Schutz des äußeren Gehörganges und des Trommelfells Äußerer Gehörgang Eigenschaften: Offenes Rohr, 2,5 cm lang; Mittenfrequenz der ersten Resonanz 3.400 Hz, schließt mit dem Trommelfell ab. Funktion: Schutz der empfindlichen Teilen des Ohrs vor eindringenden Substanzen/Gegenständen (z.B. Staub, Insekten); zusätzlicher Schutz durch ‚Ohrenschmalz‘ 2a) Welche Schallwellen werden verstärkt, welche nicht? (welche Eigenschaften kann das Ohr somit erfüllen?) • Verstärkung der mittleren und hohen Frequenzbereiche eines Klanges durch den äußeren Gehörgang um ein 2-4faches. • Empfänglicher für Klänge „vor“ dem Kopf; somit wird die Eigenschaft des Richtungshörens erfüllt. • Wichtig für: die Wahrnehmung von (stimmlosen) Frikativen, da hier die Grundfrequenz nur ca. 2.000 Hz beträgt. Das Mittelohr I • Beginnt am Trommelfell, welches auf die Druckveränderungen (über ein weiten Frequenzumfang) reagiert. • Das Trommelfell hat eine Größe von ca. 0,55 cm2 (aktiv) und ist fest verbunden mit der Gehörknöchelchenkette, bestehend aus Hammer, Amboss und Steigbügel. • Vom Hammer ausgehend: Trommelfellspanner, mittels dessen Kontraktion die Spannung bzw. die Schwingungseigenschaft des Trommelfells variiert. Das Mittelohr II • Niedrige Frequenzen: Trommelfell schwingt als Ganzes mit; dagegen bei • Höheren Frequenzen: nur bestimmte Teile des Trommelfells schwingen bei bestimmten Frequenzbereichen mit, was dem Schutz des Innenohres dient. • Der Schalldruckpegel wird um 30 dB erhöht, da ein Ausgleich zwischen dem Trommelfell und dem flächenmäßig kleineren ovalen Fenster (0,03 cm2) hergestellt werden muss, um sowohl den Luftwiderstand sowie auch die Lymphflüssigkeit auszugleichen. Das Mittelohr III • Die im Außenohr empfangenen und verstärkten Schwingungen werden im Mittelohr übertragen und zu mechanischen Schwingungen modifiziert. • Funktionen: a) Schalldruckverstärkung b) Luftdruckausgleich mittels der Eustachischen Röhre, die mit dem Nasenrachenraum verbunden ist (Druck zu beiden Seiten des Trommelfells gleich). c) Schalldämpfung, wenn ein Pegel von 85-90 dB erreicht wird ( 2 Theorien!?). 3. Die Gehörknöchelchenkette – ein Hebelsystem • Hammer: befestigt am Trommelfell • Amboss: als „Achse“ wirkend zwischen Hammer und Steigbügel • Steigbügel: bildet die Verbindung zum Innenohr und setzt am ovalen Fenster an. • Insgesamt schließt sie die Lücke zwischen Trommelfell und Cochlea. • Mittels Schwingen des Trommelfells setzt sich dieses System in „Bewegung“ und leitet die Schwingungen ins Innenohr weiter. 3. Die Gehörknöchelchenkette – ein Hebelsystem • Zwei Theorien zur Funktion des Systems: 1) Schutz des Innenohres: zu hohe Frequenzen werden gedämpft mittels der Kontraktion eines an den Steigbügel ansetzenden Muskel (m. stapedius). Auswirkung: der Steigbügel wird zu einer Seite „gezogen“, der Winkel zum ovalen Fenster verändert und der Druck somit reduziert. 2) Versteifung des Hebelsystems Intensitätsregulierung, d.h., der volle Druck wird nicht übertragen. • • • • Das Innenohr I Im Temporallappen gelegen, bestehend aus Vestibulum und Labyrinth (Bogengänge + Cochlea, in welcher die erste Schallanalyse stattfindet) Cochlea ~ Schnecke, die in der Mitte durch die Basilarmembran und die Reissner‘sche Membran (Endolymphschlauch) geteilt ist. Oberhalb: Scala vestibuli (Vorhoftreppe), hinter ovalem Fenster gelegen. Unterhalb: Paukentreppe mit rundem Fenster (Druckausgleich Überdruck in Perilymphe durch Eindrücken des ov. Fensters, dann Unterdruck durch entgegen gesetzten Vorgang). Cochlea • • • • Das Innenohr II Zwischen Vorhof- und Paukentreppe: Scala media, eigentliches Gehörorgan. Abgegrenzt durch die beiden Membranen, wobei auf der Basilarmembran das Cortische Organ, der eigentliche „Hörapparat“ liegt. Bestehend aus: Tausenden von Haarzellen, worüber sich eine gallertartige Masse befindet: Tektorialmembran. Es kommt zu Berührungen zwischen T- und BM „Abknicken“ der Härchen Stimulation (Reiztransformation : Nervenimpulse ans Gehirn) Zusammenfassung • Außenohr: Schallempfänger, Schallverstärker • Mittelohr: mechanische Übertragung sowie Schallverstärker • Innenohr: Reiztransformator The Acoustic Cues Überblick • Akustische Sprachmuster - komplex und veränderbar • Frage, ob bestimmte Eigenschaften von größerer Bedeutung sind als andere. • Sprachwissenschaftler: Modifikation bestimmter Parameter des Sprachsignals Test, ob die Hörer die Effekte der Sprachwahrnehmung erkennen. • • • • • 1. Delattre, Liberman, Cooper and Gerstman Produktion von Vokalen mittels des Pattern Playback – Systems (steady-state Formanten). Untersuchung der unterschiedlichen Formantenfrequenzen. Ergebnisse: F1 und F2 sind die wichtigsten Hinweise für die Identifikation von (Vorderzungen-)Vokalen (obwohl es Überlappungen der F1- und F2-Ebenen gibt). F0 und F3 nur zusätzliche Eigenschaften. Formant zwischen F1 und F2 notwendig zur Identifikation von Hinterzungenvokalen. http://www.ling.su.se/staff/hartmut/kempln.htm • - Vokale: stimmhaft offenes Ansatzrohr Produktion von Formanten - Wichtigstes Merkmal: Formantfrequenzen • Approximanten: - stimmhaft - Transitionen (schneller als bei Diphthongen) - Änderung von F2 (und F3) • Diphthonge: - Änderung der Vokalqualität und somit der Formanten (F2) - Transitionen • - Nasale: Artikulationsort Totalverschluss Beeinflussung benachbarter Laute - Antiresonanzen • Plosive: - Totalverschluss (oral+velopharyngeal) - Verschlusslösung - Änderung der Formantfrequenz z.B. zw. Lösungsverschluss und Vokal (Modifikation des Vokaltraktes) 3) Was ist das Interessante an Plosiven? • Verschluss – Lösung – Burst • Erneute Formantbewegung zum nächsten Laut (Vokal) • Frikative: - Turbulenter Luftstrom (Friktion) - Sibilanten vs. NichtSibilanten (Differenzierung in der Frequenz) • Affrikaten: - Kombination aus den Eigenschaften von Plosiven und Frikativen 2) Was besagt das „Konzept der Normalisierung“? • Geschlechtsspezifische Unterschiede in Vokaltrakt sowie den pharyngealen- und Resonanzräumen. • Vokalidentifikation: es gibt keine Abgleichungsformel, um Frequenzen zu vereinheitlichen z.B. im Kontext [b-t] ist der Vokal entweder als [ɛ] oder [I] realisiert. • Vokale als „Referenzen“ für Abgleichungs – prozess.