vok2

Werbung
Rohrmodelle für Vokale
Jonathan Harrington, IPDS, Kiel
Mai 2003
Herunterladen:
http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf
Die Stelle der geringsten Verengung
Wie Konsonanten haben Vokale eine gewisse 'Artikulationsstelle'
oder Stelle der geringsten Verengung, die:
• zwischen dem Glottis und hartem Gaumen gebildet wird
• einen bedeutenden Einfluss auf das akustische Signal ausübt
Stelle der
geringsten
Verengung
[i]
[A]
Allgemeines Drei-Rohrmodell für Vokale
Wegen der Verengungsstelle wird der Mundraum in drei Räume
aufgeteilt, die mit drei Röhren entsprecherender Länge modelliert
werden können
Verengungsrohr
L cm
a cm2
Vorderrohr
Hinterrohr
Diese Modelle entsprechen der Länge und
Querschnittsfläche vom jeweiligen Rohr
L cm
a cm2
Beitrag der Röhre zur Akustik der Vokale
[i]
Alle Röhre tragen zur Akustik/Formanten bei, diese Merkmale jedoch
am meisten (in dieser Reihenfolge):
1. Verengungsstelle
[u]
[y]
2. Rohrlänge
[E]
3. Verengungsbreite
Kaum akustische Unterschiede wegen:
Der Biegung vom Vokaltrakt

Variationen in der Breite hinter oder vor der maximalen Verengung

Resonanz in einem einheitlichen Rohr: Wellenlänge
Jede Frequenz erzeugt Luftdruckveränderungen, die sich in
regelmässigen Abstanden wiederholen
l
Entfernung
Max. Min. Max.
Luftdruck
Wellenlänge (l cm) = räumlicher Abstand zwischen Perioden
Luftdruck
l
Max.
Atmos.
Min
Entfernung
Beziehung zur Frequenz (f)
l (cm) = c (cm/s) / f (Hz)
f =c/l
(c ist die Schallgeschwindigkeit, 35000 cm/s)
Bedingungen für Resonanz in einem einheitlichen Rohr
• Am gechlossenen Ende: Luftdruckmaximum
• Am offenen Ende: Atmosphärischer Luftdruck
17.5 cm
l
l = 4 x 17.5 = 70 cm
l/4
Die erste Resonanzfrequenz = F1 = c / l = 35000/70 = 500 Hz
Zweite Resonanz
l
l = 4 x 17.5/3 = 23.3 cm
17.5 cm
3l/4
F2 = c / l = 35000/23.3 = 1500 Hz
Allgemeine Formel
c
F 
Hz
4
L
2n  1
n
35000
F 
4
17.5
3
2
c = Schallgeschwindigkeit, 35000 cm/s
L = Rohrlänge
n = Formantnummer
= 1500 Hz
Einfluss von Längenunterschieden
Je grösser L (also je länger das Rohr), umso grösser der
Nenner, daher umso kleiner Fn (umso niedriger die Formanten)
1. Rohrlänge: Lippenrundung
Durch Lippenrundung wird hautpsächlich der Vorderrohr länger
Ein Sprecher (M)
Akustische Folgen
• Senkung von F2 und F3
• Kaum eine F1-Änderung, da F1 meistens
von den Verengungs- und Hinterröhren
abhängt (die bei Lippenrundung kaum
geändert werden)
360 340 320 300
F1 (Hz)
[O]
280
[e]
geben
geben
geben
Degen
degen
beten
Degen
beten
beten
Dösen
Dösen
Göthe
Göthe
Göthe
Dösen
böten
böten
böten
2400
2000
1600
F2 (Hz)
2. Rohrlänge: männlich/weiblich
Die bedeutenden Unterschiede sind in der Pharynxlänge also im
Hinterrohr (kürzer in Frauen)
Akustische Folgen
• Erhöhung der Formanten von vorderen und offenen Vokalen
• Wenige Auswirkungen auf hintere Vokale
300
i:
o:
o:
500
700
a:
a:
900
[i:] bieten
[o:] baten
[a:] baten
F1 (Hz)
i:
3000
2000
1000
F2 (Hz)
männlich
weiblich
Änderungen der Schallgeschwindigkeit (c)
c
F 
4
L
2n  1
n
Hz
Je höher/niedriger der Zähler,
umso höher/niedriger Fn
My name is Yelda
Normal
2 kHz
Einatmung
von Heliox
(c ist höher)
2 kHz
Einatmung
von SchwefelHexafluorid (c
ist niedriger)
2 kHz
Beispiele: John Ohala, Phonetics Laboratory San Francisco
Perturbation Theorie
Formanten berechnen für ein einheitliches Rohr
gedrückt
Wie ändern sich die Formanten?
Nodes und Antinodes
Die Formantänderung hängen von der Verteilung im
einheitlichen Rohr von Nodes und Antinodes ab.
Auswirkung einer
Verengung an
dieser Stelle
Node (N) = ein
Luftdruckmaximum oder
-minimum
Antinode (A) = ein
atmosphärischer
Luftdruck
Formanterhöhung
Formantsenkung
Die Verteilung von Nodes (N) und Antinodes (A)
Lippen
Glottis
A Erster Formant (F1 = 500 Hz) N
Zweiter Formant (F2 = 1500 Hz)
N
A
N
A
Dritter Formant (F3 = 2500 Hz)
A
N
A
N
A
N
Luftdruck
Max.
Atmos.
Min.
Offene Vokale und F1-Erhöhung
Offene Vokale wie [a A]
werden erzeugt durch:
Akustische Folgen
Lippen
• Eine Verengung in der Pharynx
Pharynx
Glottis
F1 = 500 Hz
• Eine breitere Mundöffnung
Harter G. Velum
A
Breiter daher F1
Erhöhung
[a] [i]
Pharynx
N
Enger daher F1Erhöhung
Hohe vordere Vokale und F2-Erhöhung
Rohrmodell für [i]
ca. 11 cm
Harter Gaumen
Lippen
Glottis
N
A
A
N
F2-Erhöhung wegen
N-Verengung
A
N
A
N
A
N
F3-Senkung wegen AVerengung
Daher für [i]: F2 hoch und sehr nach an F3
Hohe hintere Vokale und F2-Senkung
Modell für [u]
ca. 6 cm
Weicher Gaumen
Glottis
Lippen
N
A
A
N
F2-Senkung wegen AVerengung
A
N
A
N
A
N
F3-Erhöhung wegen NVerengung
Daher für [u]: F2 niedrig und weit weg von einem hohen F3
Vokalverteilung in den Sprachen der Welt
Liljencrants & Lindblom, 1972, Adaptive Dispersion Theory
(ADT), Language.
Sprachen bevorzugen Vokale, die für den Hörer maximal
unterschiedlich sind.
Daher haben Sprachen mit wenigen Vokalphonemen fast immer [i
u a], weil sie in dem F1 x F2 Raum maximal verteilt sind
hoch
niedrig
F2
niedrig
i
u
F1
hoch
a
ADT und Lippenrundung
ADT erklärt auch weshalb Sprachen ungerundete vordere und
gerundete hintere Vokale bevorzugen
F2
hoch
niedrig
F1
hoch
i
niedrig
u

y
e O
F
a
o
Vokalröhre, Nomogramme, und die QuantalTheorie
Jonathan Harrington
IPDS, Kiel, Mai 2003
Herunterladen:
http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf
Allgemeines Drei-Rohr Modell für Vokale (ohne
Lippenrohr)
L = 16.5 cm
Avg = 0.1 cm2
Ah = 4 cm2
Glottis
Lippen
Vorderrohr
Hinterrohr
Lvg = 2 cm
Verengungsrohr
Festgelegte Parameter
Vokaltraktlänge, L = 16.5 cm
Verengungsrohr-Länge Lvg = 2 cm
Verengungsrohr-Querschnittsfläche Avg = 0.1 cm2
Hinterrohr-Querschnittsfläche = 4 cm2
Allgemeines Drei-Rohr Modell für Vokale
Veränderliche Parameter
Die Länge vom Hinterrohr Lh
Die Länge vom Vorderrohr, Lv wird dementsprechend geändert,
sodass die Gesamtlänge vom Vokaltrakt, L, bei 16.5 cm konstant
bleibt
L = 16.5 cm
2 cm
Lv = 4.5 cm
[i]
Lh = 10 cm
2 cm
Lv = 10.5 cm
[u]
Lh = 4 cm
Formantberechnung in einem Dreirohrmodell
Lippen
Glottis
Die Formantwerte können aus der Zusammensetzung von drei
Rohrensystemen modelliert werden, angenommen dass, der Ein- und
Ausgang zum Verengungsrohr klein ist
1. Hinterrohr wird modelliert als ein Rohr an
beiden Enden geschlossen
2. Hinter- und Verengungsrohr zusammen
werden als Helmholtzresonator modelliert
(Physiker: Hermann von Helmholtz)
3. Vorderrohr wird modelliert als ein Rohr
hinten geschlossen, vorne offen
1. Hinterrohr
Formanten in einem Rohr, beide Enden geschlossen
nc
Fh 
Hz
2Lh
n
Zum Beispiel für F2 im Hinterrohr für Lh = 13 cm
2x35000
F2h 
 2692 Hz
2x13
Nomogramm vom Hinterrohr
Nomogramm: Eine Abbildung, in der gleichzeitig mehrere Skalen
gezeigt wird
Lv: Vorderrohrlänge (cm)
3000
L=16.5 cm
Lv = 1.5 cm
2692 Hz
Lh = 13 cm
1000
Lvg=2 cm
F2h  2692 Hz
0
Frequenz (Hz)
5000
13.5 10.5 7.5 5.5 3.5 1.5 0
1
3
5
7
9 11 13 15
Lh: Hinterrohlänge (cm)
Nomogramm vom Hinterrohr (fortgesetzt)
Damit wir die Bewirkung der Hinterrohrlänge auf die Formanten
feststellen können, wird F1-F3 für das Hinterrohr für alle
möglichen Lh-Werte berechnet
Lv: Vorderrohrlänge (cm)
F2h
F1h
1000
3000
Hinterrohrformanten
F3h
2692 Hz
0
Frequenz (Hz)
5000
13.5 10.5 7.5 5.5 3.5 1.5 0
1
3
5
7
9 11 13 15
Lh: Hinterrohlänge (cm)
2. Helmholtzresonator
Lv = 2 cm
Lh (variabl)
Ah = 4 cm2
Av = 0.1 cm2
F
HELM
c

2π
Av
Hz
Lh x Ah x Lv
(p =3.141593..)
zB für Lh = 8 cm
F
HELM
35000

2xπ
0.1
Hz  220 Hz
8x4x2
1000 2000 3000 4000 5000
13.5 11.5 9.5
7.5
5.5
3.5
1.5
0 0
Lv (cm)
F3h
F2h
F1h
220 Hz
FHELM
0
Frequenz (Hz)
Nomogramm vom Hinterrohr und Helmholtzresonator
1 2 3 4 5 6 7 8 9
11
13
15
Lh (cm)
3. Vorderrohr
Rohr hinten geschlossen, vorne offen:
Fv
n
c
4
Lv
2n  1
Hz
zB wenn Lv = 6.5 cm
35000
Fv 
Hz  1346 Hz
4
6.5
2 1
1
Nomogramm: Alle Röhre
11.5
9.5
7.5
5.5
3.5
1.5
0
0
Lv (cm)
4000
5000
13.5
3000
F3v
F2h
F2v
2000
Frequenz (Hz)
F3h
F1h
1000
F1v
0
FHELM
Lh (cm)
1
2
3
4
5
6
7
8
9
11
13
15
Die Formanten in einem Drei-Rohr-System lassen sich aus den unteren
n Formanten von allen Röhren erstellen
Formanten in einem Dreirohrsystem
Was sind F1-F5 für dieses
3-Rohr-System?
3.5
cm
Lv (cm)
9.5
7.5
5.5
5000
13.5 11.5
2 cm
3.5
1.5
Lh = 11
cm
0 0
X
3000
4000
F5 (=F3h) = 4773 Hz
X
F4 (=F2h) = 3182 Hz
F3 (=F1v) = 2500 Hz
2000
X
X
1000
F2 (=F1h) = 1591 Hz
F1 (=FHELM) = 188 Hz
0
X
1 2 3 4 5 6 7 8 9
Lh (cm)
11
13
15
Nomogramm: Drei-Rohr-System
Drei-Rohr-System
1000 2000 3000 4000 5000
13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
Lv (cm)
13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
F3
F2
F1
0
Frequenz (Hz)
Individuelle Röhre
1
3
5
7
9
11 13 15
Lh (cm)
1
3
5
7
9
11 13 15
Quantal-Theorie der gesprochenenSprache
(K. Stevens, MIT. Siehe Journal of Phonetics, 1989)
1. Die Beziehung zwischen Produktion und Akustik der
Sprache ist nicht-lineär.
2. Die Nicht-Linearität hat Quantalgebiete zur Folge.
(Quantalgebiet: grosse artikulatorische Änderung, kaum
eine akustische Änderung).
3. Sprachen bevorzugen Laute aus unterschiedlichen Quantalgebieten.
1. Nicht-Linearität
Lineär
Nicht-lineär
Die Änderung von x und y sind
im Verhältnis zueinander
y
Akustik
x
Produktion
2. Nicht-Linearität und Quantalgebiete
Nicht-Linearität hat Quantal-Gebiete zur Folge
Q: Innerhalb eines Q-Gebiets
verursachen grosse artikulatorische
Änderungen kaum eine akustische
Q
Änderung
Q
T (Transition): eine kleine
artikulatorische Änderung
verursacht eine bedeutende
akustische Änderung
T
Frikativ
Akustik:
Lautstärke
Approximant
Plosiv
Artikulation: Verengungsgrad
3. Bevorzugte Laute
Sprachen bevorzugen Laute aus unterschiedlichen Q-gebieten

Akustik

X Frikativ
Approximant

Plosiv
Vorteilhaft für den Sprecher
Der Sprecher muss nicht innerhalb eines Q-Gebietes auf eine präzise
Weise sprechen, weil hier artikulatorische Änderungen kaum
akustische Änderungen zur Folge haben
Vorteilhaft für den Hörer
Laute aus unterschiedlichen Q-Gebieten sind akustisch recht distinktiv
(zB Approximant vs. Frikativ vs Plosiv).
1. Vokale und Nicht-Linearität
Die Beziehung zwischen Artikulation und Akustik der Vokale ist nichtlineär, weil:
Kontinuierliche Änderung in den Rohrlängen manchmal eine geringe,
manchmal eine starke Änderung der Formanten zur Folge haben
Lv (cm)
13.5 10.5
6.5 4.5 2.5 0.5 0
Frequenz
F3
F2
F1
gering
1
stark
3
5
7
9
11 13 15
Lh (cm)
2. Q-Gebiete in Vokalen
Quantalgebiete gibt es an Stellen, wo die Assoziation
zwischen Röhren und Formanten wechselt
F2 = F2 Hinterrohr
F2 = F2 Vorderrohr
0
1000 2000 3000
13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
1
F1 = F1 Vorderrohr
3
5
7
9
11 13 15
F1 = F1 HELM
Wegen dieser Wechselung haben in diesen Bereichen
unterschiedliche Vokaltraktgestaltung fast die selben Formantwerte
(und sind daher Q-Gebiete)
Lv (cm)
13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
F3
F2
F1
Lh (cm)
1
3
5
7
9
11 13 15
3. Q-Gebiete und bevorzugte Vokale
Die Häufigkeit von [i] und [u] in den Sprachen der Welt kann
durch die Q-Theorie erklärt werden:
Lv (cm)
13.5 10.5 8.5 6.5 4.5 2.5 0.5 0
F3
F2
F1
Lh (cm)
1
3
u
5
7
9
11 13 15
i
Herunterladen