Rohrmodelle für Vokale Jonathan Harrington, IPDS, Kiel Mai 2003 Herunterladen: http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf Die Stelle der geringsten Verengung Wie Konsonanten haben Vokale eine gewisse 'Artikulationsstelle' oder Stelle der geringsten Verengung, die: • zwischen dem Glottis und hartem Gaumen gebildet wird • einen bedeutenden Einfluss auf das akustische Signal ausübt Stelle der geringsten Verengung [i] [A] Allgemeines Drei-Rohrmodell für Vokale Wegen der Verengungsstelle wird der Mundraum in drei Räume aufgeteilt, die mit drei Röhren entsprecherender Länge modelliert werden können Verengungsrohr L cm a cm2 Vorderrohr Hinterrohr Diese Modelle entsprechen der Länge und Querschnittsfläche vom jeweiligen Rohr L cm a cm2 Beitrag der Röhre zur Akustik der Vokale [i] Alle Röhre tragen zur Akustik/Formanten bei, diese Merkmale jedoch am meisten (in dieser Reihenfolge): 1. Verengungsstelle [u] [y] 2. Rohrlänge [E] 3. Verengungsbreite Kaum akustische Unterschiede wegen: Der Biegung vom Vokaltrakt Variationen in der Breite hinter oder vor der maximalen Verengung Resonanz in einem einheitlichen Rohr: Wellenlänge Jede Frequenz erzeugt Luftdruckveränderungen, die sich in regelmässigen Abstanden wiederholen l Entfernung Max. Min. Max. Luftdruck Wellenlänge (l cm) = räumlicher Abstand zwischen Perioden Luftdruck l Max. Atmos. Min Entfernung Beziehung zur Frequenz (f) l (cm) = c (cm/s) / f (Hz) f =c/l (c ist die Schallgeschwindigkeit, 35000 cm/s) Bedingungen für Resonanz in einem einheitlichen Rohr • Am gechlossenen Ende: Luftdruckmaximum • Am offenen Ende: Atmosphärischer Luftdruck 17.5 cm l l = 4 x 17.5 = 70 cm l/4 Die erste Resonanzfrequenz = F1 = c / l = 35000/70 = 500 Hz Zweite Resonanz l l = 4 x 17.5/3 = 23.3 cm 17.5 cm 3l/4 F2 = c / l = 35000/23.3 = 1500 Hz Allgemeine Formel c F Hz 4 L 2n 1 n 35000 F 4 17.5 3 2 c = Schallgeschwindigkeit, 35000 cm/s L = Rohrlänge n = Formantnummer = 1500 Hz Einfluss von Längenunterschieden Je grösser L (also je länger das Rohr), umso grösser der Nenner, daher umso kleiner Fn (umso niedriger die Formanten) 1. Rohrlänge: Lippenrundung Durch Lippenrundung wird hautpsächlich der Vorderrohr länger Ein Sprecher (M) Akustische Folgen • Senkung von F2 und F3 • Kaum eine F1-Änderung, da F1 meistens von den Verengungs- und Hinterröhren abhängt (die bei Lippenrundung kaum geändert werden) 360 340 320 300 F1 (Hz) [O] 280 [e] geben geben geben Degen degen beten Degen beten beten Dösen Dösen Göthe Göthe Göthe Dösen böten böten böten 2400 2000 1600 F2 (Hz) 2. Rohrlänge: männlich/weiblich Die bedeutenden Unterschiede sind in der Pharynxlänge also im Hinterrohr (kürzer in Frauen) Akustische Folgen • Erhöhung der Formanten von vorderen und offenen Vokalen • Wenige Auswirkungen auf hintere Vokale 300 i: o: o: 500 700 a: a: 900 [i:] bieten [o:] baten [a:] baten F1 (Hz) i: 3000 2000 1000 F2 (Hz) männlich weiblich Änderungen der Schallgeschwindigkeit (c) c F 4 L 2n 1 n Hz Je höher/niedriger der Zähler, umso höher/niedriger Fn My name is Yelda Normal 2 kHz Einatmung von Heliox (c ist höher) 2 kHz Einatmung von SchwefelHexafluorid (c ist niedriger) 2 kHz Beispiele: John Ohala, Phonetics Laboratory San Francisco Perturbation Theorie Formanten berechnen für ein einheitliches Rohr gedrückt Wie ändern sich die Formanten? Nodes und Antinodes Die Formantänderung hängen von der Verteilung im einheitlichen Rohr von Nodes und Antinodes ab. Auswirkung einer Verengung an dieser Stelle Node (N) = ein Luftdruckmaximum oder -minimum Antinode (A) = ein atmosphärischer Luftdruck Formanterhöhung Formantsenkung Die Verteilung von Nodes (N) und Antinodes (A) Lippen Glottis A Erster Formant (F1 = 500 Hz) N Zweiter Formant (F2 = 1500 Hz) N A N A Dritter Formant (F3 = 2500 Hz) A N A N A N Luftdruck Max. Atmos. Min. Offene Vokale und F1-Erhöhung Offene Vokale wie [a A] werden erzeugt durch: Akustische Folgen Lippen • Eine Verengung in der Pharynx Pharynx Glottis F1 = 500 Hz • Eine breitere Mundöffnung Harter G. Velum A Breiter daher F1 Erhöhung [a] [i] Pharynx N Enger daher F1Erhöhung Hohe vordere Vokale und F2-Erhöhung Rohrmodell für [i] ca. 11 cm Harter Gaumen Lippen Glottis N A A N F2-Erhöhung wegen N-Verengung A N A N A N F3-Senkung wegen AVerengung Daher für [i]: F2 hoch und sehr nach an F3 Hohe hintere Vokale und F2-Senkung Modell für [u] ca. 6 cm Weicher Gaumen Glottis Lippen N A A N F2-Senkung wegen AVerengung A N A N A N F3-Erhöhung wegen NVerengung Daher für [u]: F2 niedrig und weit weg von einem hohen F3 Vokalverteilung in den Sprachen der Welt Liljencrants & Lindblom, 1972, Adaptive Dispersion Theory (ADT), Language. Sprachen bevorzugen Vokale, die für den Hörer maximal unterschiedlich sind. Daher haben Sprachen mit wenigen Vokalphonemen fast immer [i u a], weil sie in dem F1 x F2 Raum maximal verteilt sind hoch niedrig F2 niedrig i u F1 hoch a ADT und Lippenrundung ADT erklärt auch weshalb Sprachen ungerundete vordere und gerundete hintere Vokale bevorzugen F2 hoch niedrig F1 hoch i niedrig u y e O F a o Vokalröhre, Nomogramme, und die QuantalTheorie Jonathan Harrington IPDS, Kiel, Mai 2003 Herunterladen: http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf Allgemeines Drei-Rohr Modell für Vokale (ohne Lippenrohr) L = 16.5 cm Avg = 0.1 cm2 Ah = 4 cm2 Glottis Lippen Vorderrohr Hinterrohr Lvg = 2 cm Verengungsrohr Festgelegte Parameter Vokaltraktlänge, L = 16.5 cm Verengungsrohr-Länge Lvg = 2 cm Verengungsrohr-Querschnittsfläche Avg = 0.1 cm2 Hinterrohr-Querschnittsfläche = 4 cm2 Allgemeines Drei-Rohr Modell für Vokale Veränderliche Parameter Die Länge vom Hinterrohr Lh Die Länge vom Vorderrohr, Lv wird dementsprechend geändert, sodass die Gesamtlänge vom Vokaltrakt, L, bei 16.5 cm konstant bleibt L = 16.5 cm 2 cm Lv = 4.5 cm [i] Lh = 10 cm 2 cm Lv = 10.5 cm [u] Lh = 4 cm Formantberechnung in einem Dreirohrmodell Lippen Glottis Die Formantwerte können aus der Zusammensetzung von drei Rohrensystemen modelliert werden, angenommen dass, der Ein- und Ausgang zum Verengungsrohr klein ist 1. Hinterrohr wird modelliert als ein Rohr an beiden Enden geschlossen 2. Hinter- und Verengungsrohr zusammen werden als Helmholtzresonator modelliert (Physiker: Hermann von Helmholtz) 3. Vorderrohr wird modelliert als ein Rohr hinten geschlossen, vorne offen 1. Hinterrohr Formanten in einem Rohr, beide Enden geschlossen nc Fh Hz 2Lh n Zum Beispiel für F2 im Hinterrohr für Lh = 13 cm 2x35000 F2h 2692 Hz 2x13 Nomogramm vom Hinterrohr Nomogramm: Eine Abbildung, in der gleichzeitig mehrere Skalen gezeigt wird Lv: Vorderrohrlänge (cm) 3000 L=16.5 cm Lv = 1.5 cm 2692 Hz Lh = 13 cm 1000 Lvg=2 cm F2h 2692 Hz 0 Frequenz (Hz) 5000 13.5 10.5 7.5 5.5 3.5 1.5 0 1 3 5 7 9 11 13 15 Lh: Hinterrohlänge (cm) Nomogramm vom Hinterrohr (fortgesetzt) Damit wir die Bewirkung der Hinterrohrlänge auf die Formanten feststellen können, wird F1-F3 für das Hinterrohr für alle möglichen Lh-Werte berechnet Lv: Vorderrohrlänge (cm) F2h F1h 1000 3000 Hinterrohrformanten F3h 2692 Hz 0 Frequenz (Hz) 5000 13.5 10.5 7.5 5.5 3.5 1.5 0 1 3 5 7 9 11 13 15 Lh: Hinterrohlänge (cm) 2. Helmholtzresonator Lv = 2 cm Lh (variabl) Ah = 4 cm2 Av = 0.1 cm2 F HELM c 2π Av Hz Lh x Ah x Lv (p =3.141593..) zB für Lh = 8 cm F HELM 35000 2xπ 0.1 Hz 220 Hz 8x4x2 1000 2000 3000 4000 5000 13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0 Lv (cm) F3h F2h F1h 220 Hz FHELM 0 Frequenz (Hz) Nomogramm vom Hinterrohr und Helmholtzresonator 1 2 3 4 5 6 7 8 9 11 13 15 Lh (cm) 3. Vorderrohr Rohr hinten geschlossen, vorne offen: Fv n c 4 Lv 2n 1 Hz zB wenn Lv = 6.5 cm 35000 Fv Hz 1346 Hz 4 6.5 2 1 1 Nomogramm: Alle Röhre 11.5 9.5 7.5 5.5 3.5 1.5 0 0 Lv (cm) 4000 5000 13.5 3000 F3v F2h F2v 2000 Frequenz (Hz) F3h F1h 1000 F1v 0 FHELM Lh (cm) 1 2 3 4 5 6 7 8 9 11 13 15 Die Formanten in einem Drei-Rohr-System lassen sich aus den unteren n Formanten von allen Röhren erstellen Formanten in einem Dreirohrsystem Was sind F1-F5 für dieses 3-Rohr-System? 3.5 cm Lv (cm) 9.5 7.5 5.5 5000 13.5 11.5 2 cm 3.5 1.5 Lh = 11 cm 0 0 X 3000 4000 F5 (=F3h) = 4773 Hz X F4 (=F2h) = 3182 Hz F3 (=F1v) = 2500 Hz 2000 X X 1000 F2 (=F1h) = 1591 Hz F1 (=FHELM) = 188 Hz 0 X 1 2 3 4 5 6 7 8 9 Lh (cm) 11 13 15 Nomogramm: Drei-Rohr-System Drei-Rohr-System 1000 2000 3000 4000 5000 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0 Lv (cm) 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0 F3 F2 F1 0 Frequenz (Hz) Individuelle Röhre 1 3 5 7 9 11 13 15 Lh (cm) 1 3 5 7 9 11 13 15 Quantal-Theorie der gesprochenenSprache (K. Stevens, MIT. Siehe Journal of Phonetics, 1989) 1. Die Beziehung zwischen Produktion und Akustik der Sprache ist nicht-lineär. 2. Die Nicht-Linearität hat Quantalgebiete zur Folge. (Quantalgebiet: grosse artikulatorische Änderung, kaum eine akustische Änderung). 3. Sprachen bevorzugen Laute aus unterschiedlichen Quantalgebieten. 1. Nicht-Linearität Lineär Nicht-lineär Die Änderung von x und y sind im Verhältnis zueinander y Akustik x Produktion 2. Nicht-Linearität und Quantalgebiete Nicht-Linearität hat Quantal-Gebiete zur Folge Q: Innerhalb eines Q-Gebiets verursachen grosse artikulatorische Änderungen kaum eine akustische Q Änderung Q T (Transition): eine kleine artikulatorische Änderung verursacht eine bedeutende akustische Änderung T Frikativ Akustik: Lautstärke Approximant Plosiv Artikulation: Verengungsgrad 3. Bevorzugte Laute Sprachen bevorzugen Laute aus unterschiedlichen Q-gebieten Akustik X Frikativ Approximant Plosiv Vorteilhaft für den Sprecher Der Sprecher muss nicht innerhalb eines Q-Gebietes auf eine präzise Weise sprechen, weil hier artikulatorische Änderungen kaum akustische Änderungen zur Folge haben Vorteilhaft für den Hörer Laute aus unterschiedlichen Q-Gebieten sind akustisch recht distinktiv (zB Approximant vs. Frikativ vs Plosiv). 1. Vokale und Nicht-Linearität Die Beziehung zwischen Artikulation und Akustik der Vokale ist nichtlineär, weil: Kontinuierliche Änderung in den Rohrlängen manchmal eine geringe, manchmal eine starke Änderung der Formanten zur Folge haben Lv (cm) 13.5 10.5 6.5 4.5 2.5 0.5 0 Frequenz F3 F2 F1 gering 1 stark 3 5 7 9 11 13 15 Lh (cm) 2. Q-Gebiete in Vokalen Quantalgebiete gibt es an Stellen, wo die Assoziation zwischen Röhren und Formanten wechselt F2 = F2 Hinterrohr F2 = F2 Vorderrohr 0 1000 2000 3000 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0 1 F1 = F1 Vorderrohr 3 5 7 9 11 13 15 F1 = F1 HELM Wegen dieser Wechselung haben in diesen Bereichen unterschiedliche Vokaltraktgestaltung fast die selben Formantwerte (und sind daher Q-Gebiete) Lv (cm) 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0 F3 F2 F1 Lh (cm) 1 3 5 7 9 11 13 15 3. Q-Gebiete und bevorzugte Vokale Die Häufigkeit von [i] und [u] in den Sprachen der Welt kann durch die Q-Theorie erklärt werden: Lv (cm) 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0 F3 F2 F1 Lh (cm) 1 3 u 5 7 9 11 13 15 i