Kapitel2 - home.edvsz.fh

2. Physikalische Grundlagen
2.1 Die Entstehung von Schall
Schall ist bewegte Luft. Die Anzahl der Schwingungen pro Sekunde der Bewegung, die Frequenz
bestimmt die Tonhöhe, die Amplitude der Bewegung die Lautstärke. Die Luft ihrerseits wird von etwas
in Bewegung gesetzt. Dies kann eine Saite eines Musikinstrumentes sein, eine Membran (Trommelfell), eine Metallplatte oder die Stimmbänder eines Menschen.
Zupft man beispielsweise eine Saite, so wird diese ausgelenkt und beginnt zu schwingen. Zu Beginn
sind die Schwingungen sehr unregelmäßig, danach setzen sich sinusförmige Schwingungen mit
bestimmten Frequenzen durch. Bild 2.1 zeigt einen Ton eines Klaviers (piano.wav) als Funktion der
Zeit. Dabei sind nicht die einzelnen Schwingungen dargestellt, sondern die sogenannte „Hüllkurve“.
Bild 2.1: Hüllkurve eines Klaviertones
Zu Beginn des Tones finden wir ein schnelles Ansteigen der Lautstärke, die dann für kurze Zeit auf
hohem Niveau bleibt. Anschließend fällt der Ton rapide ab und geht dann in eine Schwebung über, um
zum Schluß auszuklingen.
Bild 2.2: Definition von Attack, Decay, Sustain und Release (ADSR)
Der Signalverlauf des Klaviertones entspricht im Prinzip der zeitlichen Abfolge eines Klanges in Bild
2.2. Man unterteilt die Hüllkurve allgemein in vier Abschnitte. Der erste dieser Abschnitte ist die
„Attack“-Phase, in der die Erregung der Schallquelle erfolgt. Die Attack-Phase gibt an, wie lange es
vom Beginn der Erregung dauert, bis der Klang sein Maximum erreicht hat. Die dritte Phase, die
Sustain-Phase, zeichnet sich dadurch aus, daß sich die Lautstärke des Klanges nur unwesentlich
2-1
ändert. Zwischen Attack und Sustain liegt die Decay-Phase. Der Klang klingt dann in der ReleasePhase aus. Gelegentlich sieht man zwischen Attack und Decay noch einen Hold-Phase, innerhalb
derer die Lautstärke auf hohem Niveau konstant ist. Bild 2.2 ist natürlich nur eine Idealisierung. Man
sieht es am Klavierklang. Da finden wir anstelle von Sustain und Release eine schwächer werdende
Schwebung. Dies liegt daran, daß beim Klavier nie nur eine Saite angeschlagen wird, sondern
gleichzeitig zwei bei den tiefen Tönen und drei bei den hohen Tönen. Wenn diese Saiten nicht exakt
auf der gleichen Frequenz schwingen, so treten diese Schwebungen auf.
Während der Attack- und Decay-Phase haben wir es nicht nur mit einfachen harmonischen Schwingungen zu tun, sondern mit einem Frequenzgemisch. Diese Phasen sind charakteristisch für das
jeweilige Musikinstrument. Die Sustain- und Release-Phase hingegen zeichnen sich durch eine
Grundschwingung und Oberschwingungen aus.
Die Kenntnis der einzelnen Phasen ermöglicht eine konkrete Anwendung für die digitale Audiotechnik,
nämlich die Synthese von Klängen. Beispielsweise ist die Sustain-Phase fast periodisch. Will man
diese Phase verlängern, so kopiert man eine geeignete Sequenz aus dieser Phase und fügt sie ein.
Bild 2.3 zeigt ein sogenanntes „Wasserfall-Diagramm“ des Klavierklanges
Bild 2.3: Wasserfall-Diagramm des Klavierklanges
Definieren wir die waagerechte Achse als x-Achse und die senkrechte Achse als y-Achse, so haben
wir noch ein z-Achse, die in die Zeichenebene hineingeht. Beim Wasserfall-Diagramm finden wir auf
der x-Achse logarithmisch die Frequenz aufgetragen und auf der y-Achse die Höhe des jeweiligen
spektralen Anteils. Die z-Achse ist die Zeitachse, die ersten Ereignisse sind ganz hinten, das letzte
Ereignis ganz vorne. Was ist nun das Wasserfall-Diagramm? In kurzen Zeitabständen wird vom
Schallereignis eine Fourieranalyse vorgenommen und damit das sogenannte Spektrum des Signals
zum jeweiligen Zeitpunkt berechnet. Es zeigt auf der y-Achse die Größe des jeweiligen spektralen
Anteiles (die Frequenzen oder Töne), aus denen sich das Signal im Augenblick zusammensetzt. Die
Frequenzen sind auf der x-Achse vorgegeben. Da sich das Signal mit der Zeit ändert, ändern sich
auch die spektralen Anteile, so daß die Form eines Hochgebirges entsteht (Deshalb auch der Name
Wasserfall-Diagramm). Bei unserem Klavierton sehen wir, daß zu Beginn des Tones, während der
Attack- und Decay-Phase, sehr viele Frequenzen vorkommen, deren Anteil immer weniger wird. Was
übrigbleibt, sind harmonische Schwingungen. Die Grundschwingung beträgt 329 Hertz, die
2-2
Oberschwingungen sind ganzzahlige Vielfache von 329 Hertz. Das Hertz ist das Maß für die Anzahl
der Schwingungen pro Sekunde, also der Frequenz. Man kann eine Saite auf vielfältige Arten und
Weisen zum Schwingen bringen: Zupfen oder Anschlagen wie bei der Gitarre, mit einem Filzhammer
wie beim Klavier, Zerren wie bei der Geige oder Anreißen wie beim Cembalo. Attack- und DecayPhase sehen dann sehr unterschiedlich aus, die anderen Phasen unterscheiden sich da nicht so sehr.
Der Grund für die periodischen Schwingungen ist der, daß eine an beiden Enden eingespannte Saite
nicht beliebig schwingen kann (Bild 2.4)
Bild 2.4: Schwingung einer Saite
Im unteren Teil des Bildes sehen wir verschiedene Schwingungsmodi einer Saite. Die rote Schwingung
ist die Grundschwingung, im Klavierbeispiel 329 Hertz. Die grüne Schwingung hat die doppelte
Frequenz, 658 Hz. Man nennt sie auch die erste Oberschwingung. Wir finden dann noch Schwingungen der dreifachen Frequenz (blau), der vierfachen (gelb) und der fünffachen Frequenz (pink). Diese
Schwingungen sind alle sinusförmig derart, daß sich Schwingungsknoten (da wo nichts passiert) an
den Enden der Saite befindet. Es können auch Schwingungsknoten im Bereich der Saite auftreten.
Eine Sinusschwingung mit einer beliebigen Frequenz (beispielsweise 1.65*329Hz) kann hier nicht
„überleben“, da einer der Schwingungsknoten nicht an den Enden der Saiten wäre. Sie kann kurzfristig
während der Attack-Phase auftreten, verschwindet jedoch schnell während der Decay-Phase. Wir
haben nun die verschiedenen Schwingungsmodi einer Saite gesehen. Diese Modi können auch
gleichzeitig auftreten und sich überlagern, das Ergebnis der Überlagerung sehen wir im Bild 2.4 oben:
Dies ist die Auslenkung der Saite als Überlagerung der Einzelschwingung. Diese Auslenkung ist die,
die wirklich auftritt.
Damit können wir zwei Dinge erkennen: Erstens, die Art und Weise, wie man eine Saite erregt (Bild 2.4
oben) bestimmt das Verhältnis der einzelnen Oberschwingungen, was sogar noch in der Sustain- und
Release-Phase erkennbar ist. Zweitens, daß man eine beliebige (periodische) Kurvenform (Bild 2.4
oben) zusammensetzen kann aus sinusförmigen Schwingungen mit der Grundfrequenz und ganzzahligen Vielfachen dieser Grundfrequenz (Bild 2.4 unten). Dies ist das Theorem von Fourier.
2-3
Nun gibt es ja nicht nur Musikinstrumente mit Saiten, es gibt auch zweidimensionale Schwinger wie
Trommelfelle oder Metallplatten. Eine Saite ist ein eindimensionaler Schwinger, Trommeln sind zweidimensional. Es existiert eine Vielfalt von Schwingungsformen. Schon im 18. Jahrhundert hat sie Ernst
Florens Friedrich Chladni (1756-1827) eingehend untersucht. Streut man feinkörnigen Sand auf eine
Metallplatte und streicht sie mit einem Geigenbogen an (Bild 2.5a), so gerät diese Platte in Schwingungen und der Sand sammelt sich in den Bereichen der Platten, die nicht schwingen. Es kann zu
sehr vielen unterschiedlichen Schwingungsformen kommen (Bild 2.5b)
a
b
Bild 2.5: a.) Erregung einer Metallplatte, b.) mögliche Schwingungsformen für runde und rechteckige
Platten
Welche Schwingung sich einstellt, hängt davon ab, an welcher Stelle man die Platte anregt und an
welchen Stellen sie befestigt ist. Außerdem spielt die geometrische Form (z. B. rechteckig oder rund)
eine Rolle. Die Schwingungsform bestimmt aber den Klang. Obwohl diese Schwingungsformen seit
Chladni bekannt sind, wurde eine mathematische Lösung für rechteckige Platten erst 1909 gefunden.
2-4
Das Bild 2.6 zeigt die Simulation einer kreisförmigen Membran mit 2 Schwingungen in radialer und
einer Schwingung in -Richtung. Bei den vorgegebenen Werten n=1 und nr=2 ist dies die
Besselfunktion Jn =J21 , dargestellt von 0 (in der Mitte) bis zur Nullstelle nr=2.
Bild 2.6: Simulation einer schwingenden Membran
Zwar geigt man heute keine Platten mehr in Orchestern und Bands, aber man kann hier beispielsweise
auch sehen, daß es für den Klang nicht egal ist, an welcher Stelle der Trommel man draufhaut.
Weiterhin
treten
solche
Lautsprechermembranen auf.
Schwingungen
als
unerwünschte
Partialschwingungen
von
Es gibt aber auch noch andere konkrete Anwendungen der Chladnischen Erkenntnisse. Klopft man
beispielsweise an ein Glas, so stellt sich eine charakteristische Schwingung ein, die für alle Gläser der
gleichen Form etwa gleich ist. Diese Schwingung ändert sich grundlegend, wenn das Glas einen Riss
hat oder sonstwie defekt ist. Die Schwingung sagt daher etwas über den Zustand des Glases aus.
Klopft man also am Ende des Produktionsprozesses von Gläsern (oder Dachpfannen oder oder
oder...) an das Produkt und analysiert die Schwingungsform, so kann man ohne Eingriff des Menschen
erkennen, ob das jeweilige Produkt einwandfrei ist oder nicht. So läßt sich digitale Audiotechnik auch
in der Endkontrolle von Massenware einsetzen. (Eine weitere Erkenntnis findet man auch im
alltäglichen Leben: Je größer der Sprung in der Schüssel, umso schräger der Ton. Das weiss der
Moderator einer bekannten Talentesuchsendung sehr genau.)
Zum Schluß dieses Abschnittes noch einige Anmerkungen zur menschlichen Stimme und Sprache.
Bild 2.7 zeigt einen Querschnitt durch den Bereich des menschlichen Körpers, im dem die Stimmbildung stattfindet.
2-5
Bild 2.7: Stimmbildende Organe
Im Kehlkopf befinden sich die Stimmlippen, die während des Atemvorganges geöffnet sind. Es sind
schwingungsfähige, faltenartige Vorsprünge. Bei der Stimmerzeugung sind sie geschlossen. Die
Lunge drückt durch die Luftröhre von unten Luft mit Überdruck durch die Stimmlippen, die sich daraufhin öffnen. Der Überdruck entweicht, die Lippen schließen sich wieder. Auf diese Art und Weise entsteht eine Schwingung. Man diesen Vorgang mit einem Kochtopf vergleichen, der mit einem Deckel
verschlossen ist. Im Topf baut sich ein Überdruck auf, der den Deckel anhebt. Es entweicht Dampf
und der Deckel schließt sich wieder. Dann beginnt der Vorgang von neuem.
Die Schwingfrequenz der Stimmlippen liegt im Bereich von unter 100 Hz und über 1000 Hz. Je höher
die Frequenz, um so höher der Ton. Die Tonhöhe hängt von Spannung und Dicke der Stimmlippen ab.
Die männliche Sprechstimme liegt bei etwa 120 Hz, die weibliche bei 220 Hz. Die Schallschwingung
enthält den Grundton und Obertöne. Sie ist sehr obertonreich, die Amplitude fällt mit etwa 12dB pro
Oktave ab. Rachen, Mund und Nasenhöhle dienen als Resonatoren und Filter und verstärken bzw.
schwächen bestimmte Frequenzbereiche ab. Auch jedes Musikinstrument hat solche Resonanzräume.
Die sind jedoch starr. Beim Menschen wirken mehr als 50 Muskeln bei der Klangbildung mit.
Jeder Vokal hat ganz typisch ausgeprägte Oberton-Muster . Man bezeichnet Bereiche verstärkter
Obertöne als „Formanten.“ Beim „i“ ist z. B. der erste Oberton (die Oktave) und der neunte besonders
stark ausgeprägt.
Manche Laute werden auch mit Hilfe der Zähne oder der Lippen erzeugt: So erzeugt beispielsweise
Luft, die durch die Zähne geblasen wird, ein Rauschen, also den Laut „sch“. Mit den Lippen erzeugen
wir Explosivlaute wie „p“ und „b“. Die Erzeugung von Sprache ist ein sehr komplexes Gebiet und für
Interessierte sei auf Spezialliteratur verwiesen.
2-6
2.2 Schallausbreitung und Raumakustik
Vom physikalischen Standpunkt betrachtet ist Schall eine Welle: In Gasen und Flüssigkeiten immer
eine Longitudinalwelle, in Festkörpern finden wir auch Transversalwellen.
Wenn wir einmal von der Vorstellung eines „ruhenden“ Gases ausgehen, so würde ein Bild eines
solchen ruhenden Gases ein mittleres Grau ergeben; Die Moleküle haben alle die gleichen Abstände
voneinander. Diese Vorstellung vernachlässigt zwar bewusst die Brownsche Molekularbewegung,
diese Bewegung lässt sich aber ohne weiteres überlagern, so dass wir sie hier wirklich
vernachlässigen können.
Versetzt man nun das Gas an der linken Seite mit Hilfe einer sinusförmigen Erregung in Bewegung, so
ergibt sich folgendes Bild:
Bild 2.8: Longitudinalwelle (oben) und Auslenkung der Moleküle aus der Ruhelage (unten)
Quelle: Wikipedia, Longitudinalwelle_Transversalwelle.png, Autor Raphael Frey
Es entsteht eine Longitudinalwelle, die sich von links nach rechts ausbreitet. An manchen Stellen sind
die Gasmoleküle dicht aneinander (dunkel dargestellt), an anderen Stellen wiederum weiter
voneinander entfernt (hell dargestellt). Die Schwingungsrichtung der Gasmoleküle ist in bzw.
entgegengesetzt zur Ausbreitungsrichtung. Der untere Teil des Bildes zeigt die Abweichung der
Moleküldichte von der mittleren Dichte. Die Welle wandert von links nach rechts, in diese Richtung
findet also auch ein Energietransport statt.
Betrachtet man die einzelnen Gasmoleküle, so stellt sich der Sachverhalt so dar:
Bild 2.9: Longitudinalwelle
2-7
Die Auslenkung in y-Richtung im oberen Teil des Bildes zeigt den Grad der Auslenkung der Moleküle
von ihrer Ruheposition. Dabei gibt die x-Koordinate den Ort der Moleküle in Ruhe an. Im unteren Teil
erkennt man die tatsächliche Position der Moleküle. Deshalb liegen die Punkte im unteren Teil des
Bildes nicht direkt unter den Punkten im oberen Teil.
Für die Dichte der Moleküle gilt allgemein die Wellengleichung. Im Falle der Ausbreitung in x-Richtung
die der ebenen Welle:
yx, t   y max * cos  t  k x   0 
Dabei ist ymax die Amplitude der Auslenkung (auch Elongation genannt), k die Wellenzahl und 0 der
Nullphasenwinkel. Es gilt
  2f 
2
T
f ist die Frequenz der Schwingung, also die Anzahl der Schwingungen pro Sekunde und T die
Periodendauer mit T=1/f. Die Wellenzahl k ist definiert als
k
2

mit der Wellenlänge .
Eine weitere wichtige Größe ist die Schallschnelle
vx, t   ymax *  * sin  t  k x  0 
Die Schallschnelle ist die Geschwindigkeit, mit der die Luftmoleküle sich hin- und her bewegen und
nicht zu verwechseln mit der Schallgeschwindigkeit c. Bei einer Frequenz von 1000 Hertz beträgt die
Schallschnelle an der Hörschwelle des Menschen etwa 5 *10-8 Meter/Sekunde.
Der Schalldruck ist gleich der Schnelle, multipliziert mit der Dichte  des Gases und der
Schallgeschwindigkeit:
px, t    * c * ymax *  * sin  t  k x  0 
Der mittlere Luftdruck der Atmosphäre beträgt auf Meereshöhe 101325 Pa (Pascal, N/m 2), dies
entspricht 1013,25 hPa (Hektopascal). Der kleinste wahrnehmbare Druckunterschied, die Hörschwelle,
liegt in der Größenordnung von 20 Pascal.
Bei einer ebenen Welle ist der Quotient aus Schalldruck und Schallschnelle konstant und beträgt
Z0 
p
 *c
v
Man bezeichnet diesen Quotienten auch als Schallkennimpedanz. Bei Normaldruck und einer
Temperatur von 20°C ist diese für Luft gleich
Z 0  408
2-8
N sec
m2
Weiterhin gilt der Zusammenhang zwischen Schallgeschwindigkeit, Frequenz und Wellenlänge:
c f *
Die Ausbreitungsgeschwindigkeit der Schallwelle, die Schallgeschwindigkeit, berechnet man für Luft
mit hinreichender Genauigkeit zu
T  m

c   331,6  0.6 *
*
C  sec

Dabei ist T in dieser Gleichung die Temperatur in Grad Celsius.
Dies bedeutet aber auch, dass der Schall etwa 3 msec benötigt, um eine Strecke von 1 Meter
zurückzulegen.
Ein Einschub aus der Praxis: Digitalisiert man Daten und gibt sie „in Echtzeit“ weiter, so verweilen die
Daten eine kurze Zeit im System, bis sie wiedergegeben werden. Dies ist die sogenannte „Latenzzeit“.
Sind bei bei audiovisuellen Daten die Latenzzeiten für das Bild einerseits und den Ton andererseits
unterschiedlich, kann dies beim Zuschauer zu Irritationen führen. Wir sind es aus dem täglichen Leben
gewohnt, dass die optische Information „Lippenbewegung“ kurze Zeit vor der akustischen Information
„Stimme“ aufgenommen wird. Ist die Diskrepanz jedoch zu groß, stört es den Betrachter. Ganz
schlimm wird es jedoch, wenn bei audiovisuellen Daten der Ton vor dem Bild kommt. Darauf sollte
man als Anwender auf jeden Fall achten, wenn man solche Daten bearbeitet.
Bild 2.10 zeigt eine Kugelwelle:
Bild 2.10: Kugelwelle
Für den Schalldruck einer Kugelwelle findet man
p r, t  
A
* sin t  kr  0 
r
Man unterscheidet bei Schall vier verschiedene Bereiche, wobei die Bereichsgrenzen von Autor zu
Autor leicht variieren:
Infraschall:
Hörbarer Schall:
Ultraschall:
Hyperschall:
0Hz < f <20Hz
20Hz < f <20kHz
20kHz< f < 500MHZ
500MHz < f < 
2-9
In der digitalen Audiotechnik beschäftigen wir uns nur mit dem hörbaren Schall. Um einen ersten
Eindruck von der Größenordnung der Wellenlänge einer Schallwelle zu erhalten, berechnen wir die
Wellenlängen  der niedrigsten und der höchsten Frequenz des Hörbereiches, 20 Hertz und 20
Kilohertz:

c
f
Dabei ist  die Wellenlänge, c die Schallgeschwindigkeit in Luft und f die Frequenz. Die
Schallgeschwindigkeit wird dabei der Einfachheit halber mit 340 Metern pro Sekunde angenommen.

340 m * sec
 17 m
sec* 20
Für eine Frequenz von 20 Hertz erhält man eine Wellenlänge von 17 m, für 20kHz 17 mm. Dies ist ein
Längenverhältnis von 1000:1. Dazu ein Vergleich aus der Elektrotechnik: Eine Wellenlänge von 17
Metern entspricht dem Kurzwellenbereich, eine Wellenlänge von 17 Millimetern dem Millimeterwellenbereich (Gigahertz). Während man Kurzwellenempfänger noch mit Standardbauelementen wie
Widerständen, Spulen und Kondensatoren aufbauen kann, benötigt man im Millimeterwellenbereich
Hohlleiter und Resonatoren, also völlig andere Bauelemente. Immer dann, wenn ein Bauelement in die
Größenordnung der Wellenlänge kommt, kann man es nicht mehr als konzentriertes Bauelement auffassen. Außerdem beeinflußt es das elektromagnetische Feld.
Ähnliches gilt auch für den Schall. So wird vielleicht verständlich, daß eine gute Lautsprecherbox drei
Lautsprecher für die unterschiedlichen Frequenzbereiche hat.
Der Schall breitet sich von der Schallquelle aus, wird von Oberflächen teilweise absorbiert, teilweise
reflektiert, breitet sich weiter aus, wird wieder reflektiert etc., so daß sich in einem Raum ein recht
komplexes Schallfeld einstellen kann. Man bezeichnet dies als Raumakustik. Deutlich bewußt wird uns
dies in großen halligen Räumen wie beispielsweise Kirchen und einen Konzertsaal zu entwerfen ist
nicht nur eine architektonische Herausforderung, sondern der Architekt muß auch eine Menge über
Akustik wissen.. Aber auch kleinere Räume haben eine ihnen eigentümliche Akustik. Man mischt
sogar Studioaufnahmen ein wenig Nachhall zu, weil das Ohr die trockenen Studiotöne gar nicht mag.
Oberflächen von Wänden und Einrichtungsgegenständen reflektieren den Schall, absorbieren jedoch
einen gewissen Anteil. Diese Absorption hängt von Material und der Frequenz ab. Beispielsweise
absorbiert Stoff mehr Schallenergie als Holz. So kann es geschehen, daß sich die akustischen
Eigenschaften eines Konzertsaales ändern, wenn viel Publikum im Raum ist, weil deren Kleidung den
Schall absorbiert.
Weiterhin können Schallwellen und deren Reflektionen miteinander interferieren. Dies bedeutet, dass
die originale Welle
und die reflektierte einander verstärken (konstruktive Interferenz) oder
abschwächen (destruktive Interferenz) können. Dies hängt von der Phasenlage der Wellen ab. Da die
Phasenlage (an einem bestimmten Ort) von der Wellenlänge abhängt, kann es vorkommen, dass an
einem Ort bestimmte Wellenlängen verstärkt und andere abgeschwächt werden. Dies führt zu einer
Verfärbung des Klanges. Bild 2.11 zeigt ein Beispiel dafür.
2-10
Bild 2.11: Mikrofonstandort und Klangverfärbungen (Quelle: Dickreiter, Bild 5.50)
Solche Klangverfärbungen kann man auch vermeiden, indem man in diesem Beispiel den
Sprechertisch mit einer schallschluckenden Oberfläche versieht.
Zwischen einem Erzeuger und einer reflektierenden Wand oder zwei Wänden können auch stehende
Wellen auftreten (Bild 2.12) und zwar dann, wenn der Abstand Erzeuger/Wand (bzw. Wand/Wand) ein
Vielfaches der halben Wellenlänge beträgt (n*/2, n=1, 2, 3,...) Dies kann dazu führen, dass je nach
Standort eines Mikrofones bestimmte Töne verstärkt oder abgeschwächt aufgenommen werden.
Bild 2.12: Stehende Wellen (Quelle: Dickreiter, Bild 1.7)
Will man Reflektionen vermeiden, so muss der Schall absorbiert werden. Dies kann in porösen
Materialen (Faserstoffe und offenporigen Schäume) geschehen. Durch Reibung wird dabei
Schallenergie in Wärmeenergie umgewandelt. Dies gelingt umso besser, je höher die Schallschnelle
im Bereich des absorbierenden Materials ist.
2-11
Bild 2.13: Schallabsorption. Links: Dämmmaterial in unmittelbarer Nähe einer Wand,
rechts: Dämmmaterial in einiger Entfernung von der Wand (Quelle: Dickreiter, Bild 1.13)
Bei einer harten Wand befindet sich an der Wand ein Schnelleknoten, in einem Abstand von /4 tritt
das erste Schnellmaximum auf. Im Bild 2.13 links ist das Dämmmaterial unmittelbar auf der Wand
aufgebracht. Bei kleinen Wellenlängen (unten im Bild) ist die Dämpfung gut, da das Material im
Bereich des Bauches der Schallschnelle liegt. Bei der großen Wellenlänge liegt das Material im
Bereich des Knotens der Schnelle und ist damit praktisch unwirksam. Montiert man das Material
hingegen in einigem Abstand von der Wand, so findet eine Dämpfung auch für niedrige Frequenzen
statt. Je größer die Dicke der absorbierenden Schicht und deren Entfernung von der Wand ist, umso
wirkungsvoller ist die Dämpfung bei niedrigen Frequenzen. Als leicht anzubringender Absorber für
Höhen hat sich ein Vorhang aus nicht zu leichtem Stoff erwiesen, der in einigem Abstand von der
Wand angebracht wird. Dabei wirkt der Vorhang bei Wellenlängen, die kürzer als der vierfache
Abstand zwischen Wand und Vorhang sind.
Wenn eine Schallquelle in einem Raum allseitig einen kurzen Impuls abstrahlt, so dauert es eine
gewisse Zeit, bis die erste Reflektionen wahrgenommen werden. Dann folgen die Reflektionen in
immer kürzeren Abständen, wobei sie allerdings an Intensität verlieren. Im Idealfall findet man das
„diffuse Schallfeld“ vor, welches den gesamten Raum erfüllt und keinerlei Vorzugsrichtung hat.
Befinden sich in einem Raum viele „Streukörper“ (Mobiliar etc.) und sind die Wände nicht eben,
sondern strukturiert, ist das Diffusionsschallfeld am gleichmäßigsten.
2-12
Bild 2.14: Impulsschall und seine Reflektionen (Quelle: Dickreiter, Bild 1.18)
In der Hörakustik gibt es Fachbegriffe wie „Hörsamkeit“ und „Durchsichtigkeit“, die sich auf die
akustischen Eigenschaften eines Raumes beziehen. Bild 2.15 zeigt zwei Oszillogramme von Räumen
mit schlechter (links) und guter Hörsamkeit.
Bild 2.15: Beispiele von Räumen mit schlechter (links) und guter Hörsamkeit (rechts)
(Quelle: Dickreiter, Bild 1.20)
2-13
Ein letztes Beispiel für die Beeinflussung von Schallwellen ist im Bild 2.16 dargestellt: Die Beugung und
Abschattung.
Bild 2.16: Schallabschattung und Beugung (Quelle: Dickreiter, Bild 1.12)
Eine ebene Welle trifft auf drei Hindernisse unterschiedlicher Größe. Sind deren Abmessungen klein
gegenüber der Wellenlänge, so wird auftreffender Schall nicht (hier in die linke „Halbebene“) reflektiert,
sondern um das Hindernis herum gebeugt. Je größer das Hindernis, umso größer der „Schallschatten“
Große Wellenlängen (tiefe Töne) werden bei einem Hindernis stärker gebeugt als kleine Wellenlängen
(hohe Töne), so daß man hinter einem Hindernis nicht nur Schallschatten sondern auch eine
Klangverfärbung zugunsten der tiefen Töne vorfindet.
2.3 Lautstärke: Dezibel, Phon und Sone
Die Lautstärke ist ein Maß für die Energie, die dem Ohr zugeführt wird. Zuerst soll jedoch der Begriff
„dB“ oder „Dezibel“ erklärt werden. Dieses ist ein Maß für die Stärke des Schalldruckes an einem
Meßort. Für die Stärke eines Schallereignisses gilt
p
Schalldruc k
 10 * log10  
dB
 p0 
Dabei ist p die Leistung der Schallquelle pro Quadratmeter und p0 die Referenzleistung von 10-12
Watt pro Quadratmeter, der sogenannten Hörschwelle. (Nicht verwechseln mit dem Schalldruck p!)
Diese Hörschwelle ist ein Durchschnittswert, der durch Messungen an vielen Menschen ermittelt
wurde. Wie empfindlich unser Gehör eigentlich ist, zeigt sich daran, daß man eine Schallquelle mit
einer Ausgangsleistung von 1 Watt und einer Frequenz von 3500 Hertz theoretisch gerade noch in
einer Entfernung von 564 Kilometern (Ich habe diesen Zahlenwert zweimal nachgeschaut!) hören
könnte. Die Quelle würde bei einem konkreten Versuch allerdings vom Umgebungsgeräusch übertönt
werden. Die Anpassungsfähigkeit unseres Gehörs zeigt die Tatsache, daß die Hörschwelle bei 0 dB
liegt, das entspricht einem Schalldruck von 10-12 Watt pro Quadratmeter. Die Schmerzgrenze liegt bei
130 dB. Lösen wir obige Formel nach p auf und setzten den Wert von 130 dB ein, so erhalten wir für p
den Wert von p=10W/m2. Ein Meßgerät zur Lautstärkemessung müßte umschaltbare Meßbereiche
haben, um die Werte noch einwandfrei erfassen zu können.
2-14
Während die Schalleistung eine objektiv meßbare physikalische Größe ist, ist die Lautstärke eher ein
subjektiver Begriff. Die Lautstärke mißt man in „dB(A)“, „dBA“ oder „Phon“. Sie hat natürlich mit der
Schalleistung zu tun, die ein Gerät oder Musikinstrument abgibt. Da das Ohr aber für unterschiedliche
Frequenzen auch unterschiedlich empfindlich ist, wird ein Ton mit der Frequenz von 1kHz lauter
empfunden im Vergleich zu einem Ton von 100 Hertz oder 10 kHz, obwohl die abgestrahlte
Schalleistung gleich groß ist. Um die Sache noch zu komplizieren hängt die Empfindlichkeit des Ohres
auch noch von der Lautstärke des Tones ab - und auch noch von der Kurvenform des Tones.
Die Lautstärke in Phon eines Schallereignisses entspricht dem Schalldruckpegel eines Sinustones
von 1000 Hertz, der gleichlaut empfunden wird. Dabei spielt das Spektrum des Schallereignisses keine
Rolle. Handelt es sich beim Schallereignis um einen reinen Sinuston, so wird die
Frequenzabhängigkeit der Lautstärkeempfindung durch die sogenannten Isophonen - das sind Kurven
gleicher Lautstärkeempfindung - beschrieben (Bild 2.17)
Bild 2.17: Isophonen (Quelle: Wikipedia, Akustik_db2phon.jpg, Autor Skyhead)
Die unterste Kurve gibt die Hörschwelle in Abhängigkeit von der Frequenz an. Wir finden bei f=1000
Hertz einen Wert von 3 Phon, was in diesem speziellen Fall auch einem Pegel von 3 dB entspricht.
(Eine andere Quelle (Dickreiter, SD. 110) gibt 4 Phon an). Der Wert von 3 bzw. 4 Phon anstatt 0
db/Phon rührt daher, dass international als Bezugsschalldruck (0 Phon/dB) der runde Wert von 20
Pascal (20 N/m2) angesetzt wird.
Die Ermittlung der Lautstärke von Sinustönen kann recht einfach durchgeführt werden, wesentlich
schwieriger ist die Messung von Klängen und Geräuschen. Will man solche Klangereignisse messen,
so bedient man sich der Bewertungskurve A nach Bild 2.18. Man sieht, daß für eine Frequenz von
1000 Hz die Lautstärke und der Schalldruck übereinstimmen, bei allen anderen Frequenzen muß ein
Korrekturfaktor vorgesehen werden.
2-15
Bild 2.18: Bewertungskurven für die Lautstärke
Übrigens nimmt das Gehirn von 1 Phon gerade noch wahr, so daß man auf etwa 130 unterschiedliche
Lautstärkeempfindungen kommt - mehr nicht.
Um die Sache noch etwas komplizierter zu machen: Es gibt einen Unterschied zwischen dem
Schalldruckpegel einerseits und der subjektiv empfunden Lautheit andererseits. In Bild 2.19 ist der
Zusammenhang zwischen dem Lautstärkepegel in Phon und der Lautheit in Sone wiedergegeben.
Bild 2.19: Zusammenhang Phon/Sone (Quelle: Wikipedia, Akustik_phon2sone3.jpg, Autor Skyhead)
2-16
Oberhalb eines Lautstärkepegels von 40 Phon finden wir einen linearen Zusammenhang zwischen
Phon und Sone:
Lautstärke pegel LN : LN  40  33.22 * log10 Sone  Phon
Lautheit N : N  10
0.30103 Phon  40 
10
Sone
Unterhalb 1 Sone/40 Phon lautet der Zusammenhang
Lautstärke pegel L N = 40 · (
N
+ 0,0005) 0,35 Phon
Sone
Die Tabelle 2.1 gibt den Lärmpegel in dBA für verschiedene Schallereignisse an:
Lärmquelle bzw. Geräusch
Lärmpegel in dBA
Schmerzgrenze
Preßlufthammer in 12 Meter Entfernung
Fabriken und Werkstätten
starker Straßenverkehr
normale Unterhaltung in einem Meter Abstand
Bahnhofshalle, Stadion
großes Büro
Ladengeschäft
Speiserestaurant
mittelgroßes Büro
Auto bei 80 km/h
Autowerkstatt
kleines Ladengeschäft
Hotel, Zimmer
Wohnung in der Großstadt
Wohnung auf dem Land
Kino ohne Publikum, leerer Hörsaal, leere Kirche
Wie oben, jedoch vollbesetzt
Rundfunkstudio, leer
Flüstern
Hörschwelle
Tabelle 2.1: Lärmpegel in dBA
2-17
130
97
50 - 75
68
65
55 - 65
60 - 65
45 - 60
45 - 55
45 - 55
45 - 50
55
45 - 55
42
40
30
25 - 35
30 - 50
20 - 25
10 - 20
0-5
Tabelle 2.2 zeigt einen Überblick über die Spitzenleistung einiger Musikinstrumente sowie ihren
Schallpegel in drei Metern Abstand vom Instrument:
Instrument
Klarinette
Kontrabaß
Klavier
Trompete
Posaune
Große Trommel
Spitzenleistung (Watt)
0.05
0.16
0.27
0.31
6.00
25.00
Schallpegel in dB
86
92
94
94
107
113
Tabelle 2.2: Spitzenleistungen von Musikinstrumenten
Obige Zahlenwerte für die Lärmquellen wurden einem Akustikbuch aus den 80er Jahren entnommen.
Darin zitiert der Autor auch Daten aus älteren Akustikbüchern. Blätterrauschen in sanftem Lufthauch
20 dB, ruhige Straße 30 dB, abendliche Geräusche in der Londoner Innenstadt 40 dB! Ein Kennzeichen dafür, wieviel Lärm in den letzten Jahren hinzugekommen ist.
2.4. Über die menschliche Stimme und den Tonumfang von Instrumenten
Bild 2.20 zeigt einige Informationen über den Frequenz- und Dynamikbereich der menschlichen
Stimme und der Musik
Bild 2.20: Frequenz- und Dynamikbereich der menschlichen Stimme und von Musik
Daß Männer eine tiefere Stimme als Frauen haben, erkennt man an den Kästen „männliche Tonhöhe“
und „weibliche Tonhöhe“. Dazu muß allerdings gesagt werden, daß es sich hier nur um die Grundfrequenz handelt. Natürlich gibt es auch Oberwellen. Die Grundwellen der menschlichen Stimme
2-18
liegen zwischen 100 Hz und 300 Hz. Diese Frequenzen werden von kleinen Lautsprechern gar nicht
wiedergegeben, das Ohr und das Gehirn „denken sie sich dazu“, so daß man auch an kleinen Radiogeräten eine verständliche Wiedergabe hat.
Gerade beim Sprechen von Vokalen werden die Stimmlippenschwingungen durch Resonanzen in
Mund, Nase und Rachen auf charakteristische Weise gefiltert. Jeder Vokal ist charakterisiert durch
bestimmte Frequenzbereiche, innerhalb derer alle Teiltöne durch diese Resonanzen verstärkt werden.
Dies geschieht unabhängig vom Stimmlippengrundton. Diese Frequenzbereiche werden auch
„Formanten“ genannt und sind im Bild 2.21 für alle Vokale dargestellt.
Bild 2.21: Formantenbereiche der Vokale der deutschen Sprache. (Quelle: Dickreiter, Bild 2.8)
Hören kann man Töne im Frequenzbereich zwischen etwa 20 Hertz und 20.000 Hertz, wobei das
Hörvermögen mit dem Alter abnimmt. Bild 2.9 zeigt den Tonumfang verschiedener Musikinstrumente,
wobei das Klavier den größten Tonumfang hat. Der höchste Ton auf der Klaviatur ist das fünfgestrichene C mit einer Grundfrequenz von 4186 Hertz. Wir können natürlich auch Töne darüber
hören, sie aber nicht mehr eindeutig musikalisch zuzuordnen.
Eine Oktave entspricht einem Frequenzverhältnis von 2:1. Nach einer Oktave wiederholt sich die
Tonfolge wieder. Man teilt eine Oktave in zwölf Halbtöne auf, deren Frequenzverhältnis
Frequenz von Halbton (n  1) 12
 2  1.059463..
Frequenz von Halbton (n)
beträgt. Ohne in die Harmonielehre abzuschweifen, muß aber angemerkt werden, daß diese „reine“
Stimmung unter Musikern nicht unumstritten ist. Vielfach stimmt man Instrumente „temperiert“, um
diesem Dilemma zu entgehen. Tabelle 2.3 gibt die Frequenzen der zwölf Halbtöne vom eingestrichenen C bis zum eingestrichenen H an. Alle anderen Frequenzen kann man aus dieser Tabelle
ermitteln, indem man die Frequenz des eingestrichenen Tones mit 2, 4, 8 multipliziert (höhere Töne)
beziehungsweise durch 2, 4, 8 dividiert (tiefere Töne)
2-19
Ton
Frequenz/Hertz
C, His
Cis, Des
D
Dis, Es
E, Fes
Eis, F
Fis, Ges
G
Gis, As
A
Ais, B
H, Ces
His, C‘‘
523.25
554.37
587.33
622,25
659.26
698.46
739.99
783.99
830.61
880
932.33
987.77
1046.5
Tabelle 2.3: Töne der eingestrichenen Tonleiter
Der gerade Wert von 880 Hertz für das eingestrichene A kommt dadurch zustande, daß der Ton eine
Oktave darunter der Kammerton A ist, der 1939 mit 440 Hertz festgelegt wurde. Vorher galten 435
Hertz. Diese Umstellung hat übrigens vielen alten Klavieren das Leben gekostet: Damit eine Saite
höher klingt, muß man sie stärker spannen. Zum Umstimmen des Klaviers mußten daher alle Saiten
der 88 Tasten stärker gespannt werden. Das hat dann der Rahmen, auf dem die Saiten befestigt sind,
nicht ausgehalten...
Das Empfinden, daß eine Oktave gerade der doppelten Frequenz entspricht, gilt nur für zusammengesetzte Töne, also beispielsweise dem Ton einer Klaviersaite, bei dem Grundton und Oberwellen
gemeinsam erklingen. Bietet man Versuchspersonen einen reinen Sinuston an und fragt sie, bei
welchem Ton den nun eine Oktave erreicht ist, so wird dies im allgemeinen nicht die doppelte
Frequenz sein.
2-20
Bild 2.22: Tonumfang verschiedener Musikinstrumente
2-21
2.5 Das Gehör
Wie funktioniert das Gehör? Bild 2.23 zeigt eine Zeichnung des gesamten Ohres von der Ohrmuschel
bis zum Innenohr.
Bild 2.23: Aufbau des Hörorgans
Die Schallwellen, welche an unser Ohr dringen, lösen im Innenohr elektrische Signale aus, die über
Nervenfasern zum Gehirn weitergeleitet werden. Die Klänge, die wir dann letztlich in unserem
Bewußtsein wahrnehmen, sind dann das Ergebnis eines Verarbeitungsprozesses im Gehirn, der
teilweise noch unerforscht ist. Der Aufbau des Ohres und die Lage der Nerven sind hingegen gut
bekannt.
Die Ohrmuschel, auch Pinna genannt, dient nicht nur der Befestigung einer Brille oder als Objekt
intensiven Piercings, sie hat auch eine Funktion bei der Wahrnehmung. Wenn man die Ohrmuschel an
den Kopf anlegt oder alle Vertiefungen mit Wachs verstopft, kann man vielfach nicht mehr wahrnehmen, aus welcher Richtung ein Schallereignis kommt.
Es schließt sich der Gehörgang (Meatus) an. Dieser endet am Trommelfell. Der Gehörgang ist ein
vergleichsweise breitbandiger Resonator mit einer Resonanzfrequenz von etwa 2700 - 2800 Hertz.
Bedingt durch diese Resonanz und der Eigenschaften von Mittelohr und Innenohr sind wir besonders
empfindlich im Frequenzbereich von 3400 Hertz. (Dies ist noch ein Relikt aus unseren Tagen als
Neandertaler: In diesem Frequenzbereich ist das Rascheln angesiedelt, was uns Beute oder Feinde
ankündigte.) Die Schallwellen versetzen das Trommelfell in Schwingung. Diese Schwingungen werden
über drei kleine Knochen im Mittelohr auf eine Membran über dem ovalen Fenster übertragen und
gelangen von dort in die flüssigkeitsgefüllte Schnecke. Diese drei Knöchelchen machen das Innenohr
aus und heißen Hammer (Malleus), Amboß (Incus) und Steigbügel (Stapes). Sie sind beweglich, ihre
Eigenresonanz beträgt etwa 1.2 kHz. In der Elektrotechnik benutzt man zum Anpassen einer
Impedanz einen Transformator; diese drei Knöchelchen sind das mechanische Analogon (im Prinzip
ein Hebel) dazu. Sie passen die Impedanz des Gehörganges an die Impedanz der Schnecke an.
2-22
Der für uns wichtigste Teil des Innenohres ist die Schnecke (Cochlea). Sie ist eine konisch zulaufende
Röhre, die spiralig aufgewickelt ist. Abgerollt ist sie etwa 3 cm lang. Im Innern der Schnecke befindet
sich die Basilarmembran, Auf der Basilarmembran befinden sich Härchen, die mit Sinneszellen
verbunden sind. Diese sind über die Hörnerven mit dem Teil der Großhirnrinde verbunden, welcher für
das Hören verantwortlich ist. Hören wir zu laute Musik oder sind wir starkem Lärm ausgesetzt, so kann
es geschehen, daß diese Härchen abbrechen. Leider wachsen sie nicht mehr nach, so daß das Hörvermögen bei den Frequenzen, die den abgebrochenen Härchen entsprechen, verloren geht.
Vielfach wird die Schnecke abgewickelt dargestellt (Bild 2.24).
Bild 2.24: Abgewickelte Schnecke
Der Steigbügel versetzt über das ovale Fenster die Flüssigkeit in Schwingungen. Je nach Frequenz
werden bestimmte Härchen auf der Basilarmembran in Schwingungen versetzt, die ihrerseits
wiederum Sinneszellen anregen, was wir dann letztlich als Ton wahrnehmen. Betrachtet man die
Skalen in Bild 2.24, so stellt man eine logarithmische Aufteilung der Frequenzwahrnehmung über die
Länge der Basilarmembran fest. So gesehen ist die Schnecke ein Spektrumanalysator, welches zu
jedem Zeitpunkt die im Schall vorhandenen Töne an das Gehirn weitermeldet.
Das experimentell gefundene Weber-Fechnersche Gesetz besagt, daß die Sinnesempfindung der
Lautstärke proportional ist zum Zehnerlogarithmus der Schallintensität
Lautstärke  log10 Schall int ensität 
Wollen wir also unsere Lieblingsmusik doppelt so laut hören, müssen wir die Leistung unseres
Verstärkers verzehnfachen. Dies ist übrigens auch das Problem beim Abdämmen von Störgeräuschen. Will man das Störgeräusch auf die Hälfte absenken, so muß man 90 Prozent der
Schallenergie vernichten. Das Weber-Fechnersche Gesetz gilt allerdings nicht bei ganz leisen und bei
ganz lauten Schallereignissen. Es gilt übrigens - wenn auch nicht Thema dieses Scripts - auch im
Bereich der optischen Wahrnehmung.
2-23
Zum Innenohr gehören noch drei Bogengänge. Diese sind unser Gleichgewichtsorgan und haben mit
dem Hören nichts zu tun. Neueste Forschungen weisen jedoch darauf hin, daß man Signale, mit
denen man Ultraschallwellen im Bereich von etwa 40 kHz moduliert hat, mit Hilfe der Nervenzellen in
den Bogengängen wahrnehmen kann. Der Ultraschall muß eine relativ hohe Intensität haben. Dies
kann man erreichen, indem man Ultraschallsender auf die Wangenknochen oder Schläfenknochen
aufsetzt. Inwieweit sich eine sinnvolle Nutzung ergibt, wird die Zukunft zeigen.
Quellenverzeichnis der Abbildungen:
Dickreiter: Michael Dickreiter, Handbuch der Tonstudiotechnik, K. G. Saur, München 1997.
Wikipedia: http://de.wikipedia.org/wiki/....
2-24