2. Physikalische Grundlagen 2.1 Die Entstehung von Schall Schall ist bewegte Luft. Die Anzahl der Schwingungen pro Sekunde der Bewegung, die Frequenz bestimmt die Tonhöhe, die Amplitude der Bewegung die Lautstärke. Die Luft ihrerseits wird von etwas in Bewegung gesetzt. Dies kann eine Saite eines Musikinstrumentes sein, eine Membran (Trommelfell), eine Metallplatte oder die Stimmbänder eines Menschen. Zupft man beispielsweise eine Saite, so wird diese ausgelenkt und beginnt zu schwingen. Zu Beginn sind die Schwingungen sehr unregelmäßig, danach setzen sich sinusförmige Schwingungen mit bestimmten Frequenzen durch. Bild 2.1 zeigt einen Ton eines Klaviers (piano.wav) als Funktion der Zeit. Dabei sind nicht die einzelnen Schwingungen dargestellt, sondern die sogenannte „Hüllkurve“. Bild 2.1: Hüllkurve eines Klaviertones Zu Beginn des Tones finden wir ein schnelles Ansteigen der Lautstärke, die dann für kurze Zeit auf hohem Niveau bleibt. Anschließend fällt der Ton rapide ab und geht dann in eine Schwebung über, um zum Schluß auszuklingen. Bild 2.2: Definition von Attack, Decay, Sustain und Release (ADSR) Der Signalverlauf des Klaviertones entspricht im Prinzip der zeitlichen Abfolge eines Klanges in Bild 2.2. Man unterteilt die Hüllkurve allgemein in vier Abschnitte. Der erste dieser Abschnitte ist die „Attack“-Phase, in der die Erregung der Schallquelle erfolgt. Die Attack-Phase gibt an, wie lange es vom Beginn der Erregung dauert, bis der Klang sein Maximum erreicht hat. Die dritte Phase, die Sustain-Phase, zeichnet sich dadurch aus, daß sich die Lautstärke des Klanges nur unwesentlich 2-1 ändert. Zwischen Attack und Sustain liegt die Decay-Phase. Der Klang klingt dann in der ReleasePhase aus. Gelegentlich sieht man zwischen Attack und Decay noch einen Hold-Phase, innerhalb derer die Lautstärke auf hohem Niveau konstant ist. Bild 2.2 ist natürlich nur eine Idealisierung. Man sieht es am Klavierklang. Da finden wir anstelle von Sustain und Release eine schwächer werdende Schwebung. Dies liegt daran, daß beim Klavier nie nur eine Saite angeschlagen wird, sondern gleichzeitig zwei bei den tiefen Tönen und drei bei den hohen Tönen. Wenn diese Saiten nicht exakt auf der gleichen Frequenz schwingen, so treten diese Schwebungen auf. Während der Attack- und Decay-Phase haben wir es nicht nur mit einfachen harmonischen Schwingungen zu tun, sondern mit einem Frequenzgemisch. Diese Phasen sind charakteristisch für das jeweilige Musikinstrument. Die Sustain- und Release-Phase hingegen zeichnen sich durch eine Grundschwingung und Oberschwingungen aus. Die Kenntnis der einzelnen Phasen ermöglicht eine konkrete Anwendung für die digitale Audiotechnik, nämlich die Synthese von Klängen. Beispielsweise ist die Sustain-Phase fast periodisch. Will man diese Phase verlängern, so kopiert man eine geeignete Sequenz aus dieser Phase und fügt sie ein. Bild 2.3 zeigt ein sogenanntes „Wasserfall-Diagramm“ des Klavierklanges Bild 2.3: Wasserfall-Diagramm des Klavierklanges Definieren wir die waagerechte Achse als x-Achse und die senkrechte Achse als y-Achse, so haben wir noch ein z-Achse, die in die Zeichenebene hineingeht. Beim Wasserfall-Diagramm finden wir auf der x-Achse logarithmisch die Frequenz aufgetragen und auf der y-Achse die Höhe des jeweiligen spektralen Anteils. Die z-Achse ist die Zeitachse, die ersten Ereignisse sind ganz hinten, das letzte Ereignis ganz vorne. Was ist nun das Wasserfall-Diagramm? In kurzen Zeitabständen wird vom Schallereignis eine Fourieranalyse vorgenommen und damit das sogenannte Spektrum des Signals zum jeweiligen Zeitpunkt berechnet. Es zeigt auf der y-Achse die Größe des jeweiligen spektralen Anteiles (die Frequenzen oder Töne), aus denen sich das Signal im Augenblick zusammensetzt. Die Frequenzen sind auf der x-Achse vorgegeben. Da sich das Signal mit der Zeit ändert, ändern sich auch die spektralen Anteile, so daß die Form eines Hochgebirges entsteht (Deshalb auch der Name Wasserfall-Diagramm). Bei unserem Klavierton sehen wir, daß zu Beginn des Tones, während der Attack- und Decay-Phase, sehr viele Frequenzen vorkommen, deren Anteil immer weniger wird. Was übrigbleibt, sind harmonische Schwingungen. Die Grundschwingung beträgt 329 Hertz, die 2-2 Oberschwingungen sind ganzzahlige Vielfache von 329 Hertz. Das Hertz ist das Maß für die Anzahl der Schwingungen pro Sekunde, also der Frequenz. Man kann eine Saite auf vielfältige Arten und Weisen zum Schwingen bringen: Zupfen oder Anschlagen wie bei der Gitarre, mit einem Filzhammer wie beim Klavier, Zerren wie bei der Geige oder Anreißen wie beim Cembalo. Attack- und DecayPhase sehen dann sehr unterschiedlich aus, die anderen Phasen unterscheiden sich da nicht so sehr. Der Grund für die periodischen Schwingungen ist der, daß eine an beiden Enden eingespannte Saite nicht beliebig schwingen kann (Bild 2.4) Bild 2.4: Schwingung einer Saite Im unteren Teil des Bildes sehen wir verschiedene Schwingungsmodi einer Saite. Die rote Schwingung ist die Grundschwingung, im Klavierbeispiel 329 Hertz. Die grüne Schwingung hat die doppelte Frequenz, 658 Hz. Man nennt sie auch die erste Oberschwingung. Wir finden dann noch Schwingungen der dreifachen Frequenz (blau), der vierfachen (gelb) und der fünffachen Frequenz (pink). Diese Schwingungen sind alle sinusförmig derart, daß sich Schwingungsknoten (da wo nichts passiert) an den Enden der Saite befindet. Es können auch Schwingungsknoten im Bereich der Saite auftreten. Eine Sinusschwingung mit einer beliebigen Frequenz (beispielsweise 1.65*329Hz) kann hier nicht „überleben“, da einer der Schwingungsknoten nicht an den Enden der Saiten wäre. Sie kann kurzfristig während der Attack-Phase auftreten, verschwindet jedoch schnell während der Decay-Phase. Wir haben nun die verschiedenen Schwingungsmodi einer Saite gesehen. Diese Modi können auch gleichzeitig auftreten und sich überlagern, das Ergebnis der Überlagerung sehen wir im Bild 2.4 oben: Dies ist die Auslenkung der Saite als Überlagerung der Einzelschwingung. Diese Auslenkung ist die, die wirklich auftritt. Damit können wir zwei Dinge erkennen: Erstens, die Art und Weise, wie man eine Saite erregt (Bild 2.4 oben) bestimmt das Verhältnis der einzelnen Oberschwingungen, was sogar noch in der Sustain- und Release-Phase erkennbar ist. Zweitens, daß man eine beliebige (periodische) Kurvenform (Bild 2.4 oben) zusammensetzen kann aus sinusförmigen Schwingungen mit der Grundfrequenz und ganzzahligen Vielfachen dieser Grundfrequenz (Bild 2.4 unten). Dies ist das Theorem von Fourier. 2-3 Nun gibt es ja nicht nur Musikinstrumente mit Saiten, es gibt auch zweidimensionale Schwinger wie Trommelfelle oder Metallplatten. Eine Saite ist ein eindimensionaler Schwinger, Trommeln sind zweidimensional. Es existiert eine Vielfalt von Schwingungsformen. Schon im 18. Jahrhundert hat sie Ernst Florens Friedrich Chladni (1756-1827) eingehend untersucht. Streut man feinkörnigen Sand auf eine Metallplatte und streicht sie mit einem Geigenbogen an (Bild 2.5a), so gerät diese Platte in Schwingungen und der Sand sammelt sich in den Bereichen der Platten, die nicht schwingen. Es kann zu sehr vielen unterschiedlichen Schwingungsformen kommen (Bild 2.5b) a b Bild 2.5: a.) Erregung einer Metallplatte, b.) mögliche Schwingungsformen für runde und rechteckige Platten Welche Schwingung sich einstellt, hängt davon ab, an welcher Stelle man die Platte anregt und an welchen Stellen sie befestigt ist. Außerdem spielt die geometrische Form (z. B. rechteckig oder rund) eine Rolle. Die Schwingungsform bestimmt aber den Klang. Obwohl diese Schwingungsformen seit Chladni bekannt sind, wurde eine mathematische Lösung für rechteckige Platten erst 1909 gefunden. 2-4 Das Bild 2.6 zeigt die Simulation einer kreisförmigen Membran mit 2 Schwingungen in radialer und einer Schwingung in -Richtung. Bei den vorgegebenen Werten n=1 und nr=2 ist dies die Besselfunktion Jn =J21 , dargestellt von 0 (in der Mitte) bis zur Nullstelle nr=2. Bild 2.6: Simulation einer schwingenden Membran Zwar geigt man heute keine Platten mehr in Orchestern und Bands, aber man kann hier beispielsweise auch sehen, daß es für den Klang nicht egal ist, an welcher Stelle der Trommel man draufhaut. Weiterhin treten solche Lautsprechermembranen auf. Schwingungen als unerwünschte Partialschwingungen von Es gibt aber auch noch andere konkrete Anwendungen der Chladnischen Erkenntnisse. Klopft man beispielsweise an ein Glas, so stellt sich eine charakteristische Schwingung ein, die für alle Gläser der gleichen Form etwa gleich ist. Diese Schwingung ändert sich grundlegend, wenn das Glas einen Riss hat oder sonstwie defekt ist. Die Schwingung sagt daher etwas über den Zustand des Glases aus. Klopft man also am Ende des Produktionsprozesses von Gläsern (oder Dachpfannen oder oder oder...) an das Produkt und analysiert die Schwingungsform, so kann man ohne Eingriff des Menschen erkennen, ob das jeweilige Produkt einwandfrei ist oder nicht. So läßt sich digitale Audiotechnik auch in der Endkontrolle von Massenware einsetzen. (Eine weitere Erkenntnis findet man auch im alltäglichen Leben: Je größer der Sprung in der Schüssel, umso schräger der Ton. Das weiss der Moderator einer bekannten Talentesuchsendung sehr genau.) Zum Schluß dieses Abschnittes noch einige Anmerkungen zur menschlichen Stimme und Sprache. Bild 2.7 zeigt einen Querschnitt durch den Bereich des menschlichen Körpers, im dem die Stimmbildung stattfindet. 2-5 Bild 2.7: Stimmbildende Organe Im Kehlkopf befinden sich die Stimmlippen, die während des Atemvorganges geöffnet sind. Es sind schwingungsfähige, faltenartige Vorsprünge. Bei der Stimmerzeugung sind sie geschlossen. Die Lunge drückt durch die Luftröhre von unten Luft mit Überdruck durch die Stimmlippen, die sich daraufhin öffnen. Der Überdruck entweicht, die Lippen schließen sich wieder. Auf diese Art und Weise entsteht eine Schwingung. Man diesen Vorgang mit einem Kochtopf vergleichen, der mit einem Deckel verschlossen ist. Im Topf baut sich ein Überdruck auf, der den Deckel anhebt. Es entweicht Dampf und der Deckel schließt sich wieder. Dann beginnt der Vorgang von neuem. Die Schwingfrequenz der Stimmlippen liegt im Bereich von unter 100 Hz und über 1000 Hz. Je höher die Frequenz, um so höher der Ton. Die Tonhöhe hängt von Spannung und Dicke der Stimmlippen ab. Die männliche Sprechstimme liegt bei etwa 120 Hz, die weibliche bei 220 Hz. Die Schallschwingung enthält den Grundton und Obertöne. Sie ist sehr obertonreich, die Amplitude fällt mit etwa 12dB pro Oktave ab. Rachen, Mund und Nasenhöhle dienen als Resonatoren und Filter und verstärken bzw. schwächen bestimmte Frequenzbereiche ab. Auch jedes Musikinstrument hat solche Resonanzräume. Die sind jedoch starr. Beim Menschen wirken mehr als 50 Muskeln bei der Klangbildung mit. Jeder Vokal hat ganz typisch ausgeprägte Oberton-Muster . Man bezeichnet Bereiche verstärkter Obertöne als „Formanten.“ Beim „i“ ist z. B. der erste Oberton (die Oktave) und der neunte besonders stark ausgeprägt. Manche Laute werden auch mit Hilfe der Zähne oder der Lippen erzeugt: So erzeugt beispielsweise Luft, die durch die Zähne geblasen wird, ein Rauschen, also den Laut „sch“. Mit den Lippen erzeugen wir Explosivlaute wie „p“ und „b“. Die Erzeugung von Sprache ist ein sehr komplexes Gebiet und für Interessierte sei auf Spezialliteratur verwiesen. 2-6 2.2 Schallausbreitung und Raumakustik Vom physikalischen Standpunkt betrachtet ist Schall eine Welle: In Gasen und Flüssigkeiten immer eine Longitudinalwelle, in Festkörpern finden wir auch Transversalwellen. Wenn wir einmal von der Vorstellung eines „ruhenden“ Gases ausgehen, so würde ein Bild eines solchen ruhenden Gases ein mittleres Grau ergeben; Die Moleküle haben alle die gleichen Abstände voneinander. Diese Vorstellung vernachlässigt zwar bewusst die Brownsche Molekularbewegung, diese Bewegung lässt sich aber ohne weiteres überlagern, so dass wir sie hier wirklich vernachlässigen können. Versetzt man nun das Gas an der linken Seite mit Hilfe einer sinusförmigen Erregung in Bewegung, so ergibt sich folgendes Bild: Bild 2.8: Longitudinalwelle (oben) und Auslenkung der Moleküle aus der Ruhelage (unten) Quelle: Wikipedia, Longitudinalwelle_Transversalwelle.png, Autor Raphael Frey Es entsteht eine Longitudinalwelle, die sich von links nach rechts ausbreitet. An manchen Stellen sind die Gasmoleküle dicht aneinander (dunkel dargestellt), an anderen Stellen wiederum weiter voneinander entfernt (hell dargestellt). Die Schwingungsrichtung der Gasmoleküle ist in bzw. entgegengesetzt zur Ausbreitungsrichtung. Der untere Teil des Bildes zeigt die Abweichung der Moleküldichte von der mittleren Dichte. Die Welle wandert von links nach rechts, in diese Richtung findet also auch ein Energietransport statt. Betrachtet man die einzelnen Gasmoleküle, so stellt sich der Sachverhalt so dar: Bild 2.9: Longitudinalwelle 2-7 Die Auslenkung in y-Richtung im oberen Teil des Bildes zeigt den Grad der Auslenkung der Moleküle von ihrer Ruheposition. Dabei gibt die x-Koordinate den Ort der Moleküle in Ruhe an. Im unteren Teil erkennt man die tatsächliche Position der Moleküle. Deshalb liegen die Punkte im unteren Teil des Bildes nicht direkt unter den Punkten im oberen Teil. Für die Dichte der Moleküle gilt allgemein die Wellengleichung. Im Falle der Ausbreitung in x-Richtung die der ebenen Welle: yx, t y max * cos t k x 0 Dabei ist ymax die Amplitude der Auslenkung (auch Elongation genannt), k die Wellenzahl und 0 der Nullphasenwinkel. Es gilt 2f 2 T f ist die Frequenz der Schwingung, also die Anzahl der Schwingungen pro Sekunde und T die Periodendauer mit T=1/f. Die Wellenzahl k ist definiert als k 2 mit der Wellenlänge . Eine weitere wichtige Größe ist die Schallschnelle vx, t ymax * * sin t k x 0 Die Schallschnelle ist die Geschwindigkeit, mit der die Luftmoleküle sich hin- und her bewegen und nicht zu verwechseln mit der Schallgeschwindigkeit c. Bei einer Frequenz von 1000 Hertz beträgt die Schallschnelle an der Hörschwelle des Menschen etwa 5 *10-8 Meter/Sekunde. Der Schalldruck ist gleich der Schnelle, multipliziert mit der Dichte des Gases und der Schallgeschwindigkeit: px, t * c * ymax * * sin t k x 0 Der mittlere Luftdruck der Atmosphäre beträgt auf Meereshöhe 101325 Pa (Pascal, N/m 2), dies entspricht 1013,25 hPa (Hektopascal). Der kleinste wahrnehmbare Druckunterschied, die Hörschwelle, liegt in der Größenordnung von 20 Pascal. Bei einer ebenen Welle ist der Quotient aus Schalldruck und Schallschnelle konstant und beträgt Z0 p *c v Man bezeichnet diesen Quotienten auch als Schallkennimpedanz. Bei Normaldruck und einer Temperatur von 20°C ist diese für Luft gleich Z 0 408 2-8 N sec m2 Weiterhin gilt der Zusammenhang zwischen Schallgeschwindigkeit, Frequenz und Wellenlänge: c f * Die Ausbreitungsgeschwindigkeit der Schallwelle, die Schallgeschwindigkeit, berechnet man für Luft mit hinreichender Genauigkeit zu T m c 331,6 0.6 * * C sec Dabei ist T in dieser Gleichung die Temperatur in Grad Celsius. Dies bedeutet aber auch, dass der Schall etwa 3 msec benötigt, um eine Strecke von 1 Meter zurückzulegen. Ein Einschub aus der Praxis: Digitalisiert man Daten und gibt sie „in Echtzeit“ weiter, so verweilen die Daten eine kurze Zeit im System, bis sie wiedergegeben werden. Dies ist die sogenannte „Latenzzeit“. Sind bei bei audiovisuellen Daten die Latenzzeiten für das Bild einerseits und den Ton andererseits unterschiedlich, kann dies beim Zuschauer zu Irritationen führen. Wir sind es aus dem täglichen Leben gewohnt, dass die optische Information „Lippenbewegung“ kurze Zeit vor der akustischen Information „Stimme“ aufgenommen wird. Ist die Diskrepanz jedoch zu groß, stört es den Betrachter. Ganz schlimm wird es jedoch, wenn bei audiovisuellen Daten der Ton vor dem Bild kommt. Darauf sollte man als Anwender auf jeden Fall achten, wenn man solche Daten bearbeitet. Bild 2.10 zeigt eine Kugelwelle: Bild 2.10: Kugelwelle Für den Schalldruck einer Kugelwelle findet man p r, t A * sin t kr 0 r Man unterscheidet bei Schall vier verschiedene Bereiche, wobei die Bereichsgrenzen von Autor zu Autor leicht variieren: Infraschall: Hörbarer Schall: Ultraschall: Hyperschall: 0Hz < f <20Hz 20Hz < f <20kHz 20kHz< f < 500MHZ 500MHz < f < 2-9 In der digitalen Audiotechnik beschäftigen wir uns nur mit dem hörbaren Schall. Um einen ersten Eindruck von der Größenordnung der Wellenlänge einer Schallwelle zu erhalten, berechnen wir die Wellenlängen der niedrigsten und der höchsten Frequenz des Hörbereiches, 20 Hertz und 20 Kilohertz: c f Dabei ist die Wellenlänge, c die Schallgeschwindigkeit in Luft und f die Frequenz. Die Schallgeschwindigkeit wird dabei der Einfachheit halber mit 340 Metern pro Sekunde angenommen. 340 m * sec 17 m sec* 20 Für eine Frequenz von 20 Hertz erhält man eine Wellenlänge von 17 m, für 20kHz 17 mm. Dies ist ein Längenverhältnis von 1000:1. Dazu ein Vergleich aus der Elektrotechnik: Eine Wellenlänge von 17 Metern entspricht dem Kurzwellenbereich, eine Wellenlänge von 17 Millimetern dem Millimeterwellenbereich (Gigahertz). Während man Kurzwellenempfänger noch mit Standardbauelementen wie Widerständen, Spulen und Kondensatoren aufbauen kann, benötigt man im Millimeterwellenbereich Hohlleiter und Resonatoren, also völlig andere Bauelemente. Immer dann, wenn ein Bauelement in die Größenordnung der Wellenlänge kommt, kann man es nicht mehr als konzentriertes Bauelement auffassen. Außerdem beeinflußt es das elektromagnetische Feld. Ähnliches gilt auch für den Schall. So wird vielleicht verständlich, daß eine gute Lautsprecherbox drei Lautsprecher für die unterschiedlichen Frequenzbereiche hat. Der Schall breitet sich von der Schallquelle aus, wird von Oberflächen teilweise absorbiert, teilweise reflektiert, breitet sich weiter aus, wird wieder reflektiert etc., so daß sich in einem Raum ein recht komplexes Schallfeld einstellen kann. Man bezeichnet dies als Raumakustik. Deutlich bewußt wird uns dies in großen halligen Räumen wie beispielsweise Kirchen und einen Konzertsaal zu entwerfen ist nicht nur eine architektonische Herausforderung, sondern der Architekt muß auch eine Menge über Akustik wissen.. Aber auch kleinere Räume haben eine ihnen eigentümliche Akustik. Man mischt sogar Studioaufnahmen ein wenig Nachhall zu, weil das Ohr die trockenen Studiotöne gar nicht mag. Oberflächen von Wänden und Einrichtungsgegenständen reflektieren den Schall, absorbieren jedoch einen gewissen Anteil. Diese Absorption hängt von Material und der Frequenz ab. Beispielsweise absorbiert Stoff mehr Schallenergie als Holz. So kann es geschehen, daß sich die akustischen Eigenschaften eines Konzertsaales ändern, wenn viel Publikum im Raum ist, weil deren Kleidung den Schall absorbiert. Weiterhin können Schallwellen und deren Reflektionen miteinander interferieren. Dies bedeutet, dass die originale Welle und die reflektierte einander verstärken (konstruktive Interferenz) oder abschwächen (destruktive Interferenz) können. Dies hängt von der Phasenlage der Wellen ab. Da die Phasenlage (an einem bestimmten Ort) von der Wellenlänge abhängt, kann es vorkommen, dass an einem Ort bestimmte Wellenlängen verstärkt und andere abgeschwächt werden. Dies führt zu einer Verfärbung des Klanges. Bild 2.11 zeigt ein Beispiel dafür. 2-10 Bild 2.11: Mikrofonstandort und Klangverfärbungen (Quelle: Dickreiter, Bild 5.50) Solche Klangverfärbungen kann man auch vermeiden, indem man in diesem Beispiel den Sprechertisch mit einer schallschluckenden Oberfläche versieht. Zwischen einem Erzeuger und einer reflektierenden Wand oder zwei Wänden können auch stehende Wellen auftreten (Bild 2.12) und zwar dann, wenn der Abstand Erzeuger/Wand (bzw. Wand/Wand) ein Vielfaches der halben Wellenlänge beträgt (n*/2, n=1, 2, 3,...) Dies kann dazu führen, dass je nach Standort eines Mikrofones bestimmte Töne verstärkt oder abgeschwächt aufgenommen werden. Bild 2.12: Stehende Wellen (Quelle: Dickreiter, Bild 1.7) Will man Reflektionen vermeiden, so muss der Schall absorbiert werden. Dies kann in porösen Materialen (Faserstoffe und offenporigen Schäume) geschehen. Durch Reibung wird dabei Schallenergie in Wärmeenergie umgewandelt. Dies gelingt umso besser, je höher die Schallschnelle im Bereich des absorbierenden Materials ist. 2-11 Bild 2.13: Schallabsorption. Links: Dämmmaterial in unmittelbarer Nähe einer Wand, rechts: Dämmmaterial in einiger Entfernung von der Wand (Quelle: Dickreiter, Bild 1.13) Bei einer harten Wand befindet sich an der Wand ein Schnelleknoten, in einem Abstand von /4 tritt das erste Schnellmaximum auf. Im Bild 2.13 links ist das Dämmmaterial unmittelbar auf der Wand aufgebracht. Bei kleinen Wellenlängen (unten im Bild) ist die Dämpfung gut, da das Material im Bereich des Bauches der Schallschnelle liegt. Bei der großen Wellenlänge liegt das Material im Bereich des Knotens der Schnelle und ist damit praktisch unwirksam. Montiert man das Material hingegen in einigem Abstand von der Wand, so findet eine Dämpfung auch für niedrige Frequenzen statt. Je größer die Dicke der absorbierenden Schicht und deren Entfernung von der Wand ist, umso wirkungsvoller ist die Dämpfung bei niedrigen Frequenzen. Als leicht anzubringender Absorber für Höhen hat sich ein Vorhang aus nicht zu leichtem Stoff erwiesen, der in einigem Abstand von der Wand angebracht wird. Dabei wirkt der Vorhang bei Wellenlängen, die kürzer als der vierfache Abstand zwischen Wand und Vorhang sind. Wenn eine Schallquelle in einem Raum allseitig einen kurzen Impuls abstrahlt, so dauert es eine gewisse Zeit, bis die erste Reflektionen wahrgenommen werden. Dann folgen die Reflektionen in immer kürzeren Abständen, wobei sie allerdings an Intensität verlieren. Im Idealfall findet man das „diffuse Schallfeld“ vor, welches den gesamten Raum erfüllt und keinerlei Vorzugsrichtung hat. Befinden sich in einem Raum viele „Streukörper“ (Mobiliar etc.) und sind die Wände nicht eben, sondern strukturiert, ist das Diffusionsschallfeld am gleichmäßigsten. 2-12 Bild 2.14: Impulsschall und seine Reflektionen (Quelle: Dickreiter, Bild 1.18) In der Hörakustik gibt es Fachbegriffe wie „Hörsamkeit“ und „Durchsichtigkeit“, die sich auf die akustischen Eigenschaften eines Raumes beziehen. Bild 2.15 zeigt zwei Oszillogramme von Räumen mit schlechter (links) und guter Hörsamkeit. Bild 2.15: Beispiele von Räumen mit schlechter (links) und guter Hörsamkeit (rechts) (Quelle: Dickreiter, Bild 1.20) 2-13 Ein letztes Beispiel für die Beeinflussung von Schallwellen ist im Bild 2.16 dargestellt: Die Beugung und Abschattung. Bild 2.16: Schallabschattung und Beugung (Quelle: Dickreiter, Bild 1.12) Eine ebene Welle trifft auf drei Hindernisse unterschiedlicher Größe. Sind deren Abmessungen klein gegenüber der Wellenlänge, so wird auftreffender Schall nicht (hier in die linke „Halbebene“) reflektiert, sondern um das Hindernis herum gebeugt. Je größer das Hindernis, umso größer der „Schallschatten“ Große Wellenlängen (tiefe Töne) werden bei einem Hindernis stärker gebeugt als kleine Wellenlängen (hohe Töne), so daß man hinter einem Hindernis nicht nur Schallschatten sondern auch eine Klangverfärbung zugunsten der tiefen Töne vorfindet. 2.3 Lautstärke: Dezibel, Phon und Sone Die Lautstärke ist ein Maß für die Energie, die dem Ohr zugeführt wird. Zuerst soll jedoch der Begriff „dB“ oder „Dezibel“ erklärt werden. Dieses ist ein Maß für die Stärke des Schalldruckes an einem Meßort. Für die Stärke eines Schallereignisses gilt p Schalldruc k 10 * log10 dB p0 Dabei ist p die Leistung der Schallquelle pro Quadratmeter und p0 die Referenzleistung von 10-12 Watt pro Quadratmeter, der sogenannten Hörschwelle. (Nicht verwechseln mit dem Schalldruck p!) Diese Hörschwelle ist ein Durchschnittswert, der durch Messungen an vielen Menschen ermittelt wurde. Wie empfindlich unser Gehör eigentlich ist, zeigt sich daran, daß man eine Schallquelle mit einer Ausgangsleistung von 1 Watt und einer Frequenz von 3500 Hertz theoretisch gerade noch in einer Entfernung von 564 Kilometern (Ich habe diesen Zahlenwert zweimal nachgeschaut!) hören könnte. Die Quelle würde bei einem konkreten Versuch allerdings vom Umgebungsgeräusch übertönt werden. Die Anpassungsfähigkeit unseres Gehörs zeigt die Tatsache, daß die Hörschwelle bei 0 dB liegt, das entspricht einem Schalldruck von 10-12 Watt pro Quadratmeter. Die Schmerzgrenze liegt bei 130 dB. Lösen wir obige Formel nach p auf und setzten den Wert von 130 dB ein, so erhalten wir für p den Wert von p=10W/m2. Ein Meßgerät zur Lautstärkemessung müßte umschaltbare Meßbereiche haben, um die Werte noch einwandfrei erfassen zu können. 2-14 Während die Schalleistung eine objektiv meßbare physikalische Größe ist, ist die Lautstärke eher ein subjektiver Begriff. Die Lautstärke mißt man in „dB(A)“, „dBA“ oder „Phon“. Sie hat natürlich mit der Schalleistung zu tun, die ein Gerät oder Musikinstrument abgibt. Da das Ohr aber für unterschiedliche Frequenzen auch unterschiedlich empfindlich ist, wird ein Ton mit der Frequenz von 1kHz lauter empfunden im Vergleich zu einem Ton von 100 Hertz oder 10 kHz, obwohl die abgestrahlte Schalleistung gleich groß ist. Um die Sache noch zu komplizieren hängt die Empfindlichkeit des Ohres auch noch von der Lautstärke des Tones ab - und auch noch von der Kurvenform des Tones. Die Lautstärke in Phon eines Schallereignisses entspricht dem Schalldruckpegel eines Sinustones von 1000 Hertz, der gleichlaut empfunden wird. Dabei spielt das Spektrum des Schallereignisses keine Rolle. Handelt es sich beim Schallereignis um einen reinen Sinuston, so wird die Frequenzabhängigkeit der Lautstärkeempfindung durch die sogenannten Isophonen - das sind Kurven gleicher Lautstärkeempfindung - beschrieben (Bild 2.17) Bild 2.17: Isophonen (Quelle: Wikipedia, Akustik_db2phon.jpg, Autor Skyhead) Die unterste Kurve gibt die Hörschwelle in Abhängigkeit von der Frequenz an. Wir finden bei f=1000 Hertz einen Wert von 3 Phon, was in diesem speziellen Fall auch einem Pegel von 3 dB entspricht. (Eine andere Quelle (Dickreiter, SD. 110) gibt 4 Phon an). Der Wert von 3 bzw. 4 Phon anstatt 0 db/Phon rührt daher, dass international als Bezugsschalldruck (0 Phon/dB) der runde Wert von 20 Pascal (20 N/m2) angesetzt wird. Die Ermittlung der Lautstärke von Sinustönen kann recht einfach durchgeführt werden, wesentlich schwieriger ist die Messung von Klängen und Geräuschen. Will man solche Klangereignisse messen, so bedient man sich der Bewertungskurve A nach Bild 2.18. Man sieht, daß für eine Frequenz von 1000 Hz die Lautstärke und der Schalldruck übereinstimmen, bei allen anderen Frequenzen muß ein Korrekturfaktor vorgesehen werden. 2-15 Bild 2.18: Bewertungskurven für die Lautstärke Übrigens nimmt das Gehirn von 1 Phon gerade noch wahr, so daß man auf etwa 130 unterschiedliche Lautstärkeempfindungen kommt - mehr nicht. Um die Sache noch etwas komplizierter zu machen: Es gibt einen Unterschied zwischen dem Schalldruckpegel einerseits und der subjektiv empfunden Lautheit andererseits. In Bild 2.19 ist der Zusammenhang zwischen dem Lautstärkepegel in Phon und der Lautheit in Sone wiedergegeben. Bild 2.19: Zusammenhang Phon/Sone (Quelle: Wikipedia, Akustik_phon2sone3.jpg, Autor Skyhead) 2-16 Oberhalb eines Lautstärkepegels von 40 Phon finden wir einen linearen Zusammenhang zwischen Phon und Sone: Lautstärke pegel LN : LN 40 33.22 * log10 Sone Phon Lautheit N : N 10 0.30103 Phon 40 10 Sone Unterhalb 1 Sone/40 Phon lautet der Zusammenhang Lautstärke pegel L N = 40 · ( N + 0,0005) 0,35 Phon Sone Die Tabelle 2.1 gibt den Lärmpegel in dBA für verschiedene Schallereignisse an: Lärmquelle bzw. Geräusch Lärmpegel in dBA Schmerzgrenze Preßlufthammer in 12 Meter Entfernung Fabriken und Werkstätten starker Straßenverkehr normale Unterhaltung in einem Meter Abstand Bahnhofshalle, Stadion großes Büro Ladengeschäft Speiserestaurant mittelgroßes Büro Auto bei 80 km/h Autowerkstatt kleines Ladengeschäft Hotel, Zimmer Wohnung in der Großstadt Wohnung auf dem Land Kino ohne Publikum, leerer Hörsaal, leere Kirche Wie oben, jedoch vollbesetzt Rundfunkstudio, leer Flüstern Hörschwelle Tabelle 2.1: Lärmpegel in dBA 2-17 130 97 50 - 75 68 65 55 - 65 60 - 65 45 - 60 45 - 55 45 - 55 45 - 50 55 45 - 55 42 40 30 25 - 35 30 - 50 20 - 25 10 - 20 0-5 Tabelle 2.2 zeigt einen Überblick über die Spitzenleistung einiger Musikinstrumente sowie ihren Schallpegel in drei Metern Abstand vom Instrument: Instrument Klarinette Kontrabaß Klavier Trompete Posaune Große Trommel Spitzenleistung (Watt) 0.05 0.16 0.27 0.31 6.00 25.00 Schallpegel in dB 86 92 94 94 107 113 Tabelle 2.2: Spitzenleistungen von Musikinstrumenten Obige Zahlenwerte für die Lärmquellen wurden einem Akustikbuch aus den 80er Jahren entnommen. Darin zitiert der Autor auch Daten aus älteren Akustikbüchern. Blätterrauschen in sanftem Lufthauch 20 dB, ruhige Straße 30 dB, abendliche Geräusche in der Londoner Innenstadt 40 dB! Ein Kennzeichen dafür, wieviel Lärm in den letzten Jahren hinzugekommen ist. 2.4. Über die menschliche Stimme und den Tonumfang von Instrumenten Bild 2.20 zeigt einige Informationen über den Frequenz- und Dynamikbereich der menschlichen Stimme und der Musik Bild 2.20: Frequenz- und Dynamikbereich der menschlichen Stimme und von Musik Daß Männer eine tiefere Stimme als Frauen haben, erkennt man an den Kästen „männliche Tonhöhe“ und „weibliche Tonhöhe“. Dazu muß allerdings gesagt werden, daß es sich hier nur um die Grundfrequenz handelt. Natürlich gibt es auch Oberwellen. Die Grundwellen der menschlichen Stimme 2-18 liegen zwischen 100 Hz und 300 Hz. Diese Frequenzen werden von kleinen Lautsprechern gar nicht wiedergegeben, das Ohr und das Gehirn „denken sie sich dazu“, so daß man auch an kleinen Radiogeräten eine verständliche Wiedergabe hat. Gerade beim Sprechen von Vokalen werden die Stimmlippenschwingungen durch Resonanzen in Mund, Nase und Rachen auf charakteristische Weise gefiltert. Jeder Vokal ist charakterisiert durch bestimmte Frequenzbereiche, innerhalb derer alle Teiltöne durch diese Resonanzen verstärkt werden. Dies geschieht unabhängig vom Stimmlippengrundton. Diese Frequenzbereiche werden auch „Formanten“ genannt und sind im Bild 2.21 für alle Vokale dargestellt. Bild 2.21: Formantenbereiche der Vokale der deutschen Sprache. (Quelle: Dickreiter, Bild 2.8) Hören kann man Töne im Frequenzbereich zwischen etwa 20 Hertz und 20.000 Hertz, wobei das Hörvermögen mit dem Alter abnimmt. Bild 2.9 zeigt den Tonumfang verschiedener Musikinstrumente, wobei das Klavier den größten Tonumfang hat. Der höchste Ton auf der Klaviatur ist das fünfgestrichene C mit einer Grundfrequenz von 4186 Hertz. Wir können natürlich auch Töne darüber hören, sie aber nicht mehr eindeutig musikalisch zuzuordnen. Eine Oktave entspricht einem Frequenzverhältnis von 2:1. Nach einer Oktave wiederholt sich die Tonfolge wieder. Man teilt eine Oktave in zwölf Halbtöne auf, deren Frequenzverhältnis Frequenz von Halbton (n 1) 12 2 1.059463.. Frequenz von Halbton (n) beträgt. Ohne in die Harmonielehre abzuschweifen, muß aber angemerkt werden, daß diese „reine“ Stimmung unter Musikern nicht unumstritten ist. Vielfach stimmt man Instrumente „temperiert“, um diesem Dilemma zu entgehen. Tabelle 2.3 gibt die Frequenzen der zwölf Halbtöne vom eingestrichenen C bis zum eingestrichenen H an. Alle anderen Frequenzen kann man aus dieser Tabelle ermitteln, indem man die Frequenz des eingestrichenen Tones mit 2, 4, 8 multipliziert (höhere Töne) beziehungsweise durch 2, 4, 8 dividiert (tiefere Töne) 2-19 Ton Frequenz/Hertz C, His Cis, Des D Dis, Es E, Fes Eis, F Fis, Ges G Gis, As A Ais, B H, Ces His, C‘‘ 523.25 554.37 587.33 622,25 659.26 698.46 739.99 783.99 830.61 880 932.33 987.77 1046.5 Tabelle 2.3: Töne der eingestrichenen Tonleiter Der gerade Wert von 880 Hertz für das eingestrichene A kommt dadurch zustande, daß der Ton eine Oktave darunter der Kammerton A ist, der 1939 mit 440 Hertz festgelegt wurde. Vorher galten 435 Hertz. Diese Umstellung hat übrigens vielen alten Klavieren das Leben gekostet: Damit eine Saite höher klingt, muß man sie stärker spannen. Zum Umstimmen des Klaviers mußten daher alle Saiten der 88 Tasten stärker gespannt werden. Das hat dann der Rahmen, auf dem die Saiten befestigt sind, nicht ausgehalten... Das Empfinden, daß eine Oktave gerade der doppelten Frequenz entspricht, gilt nur für zusammengesetzte Töne, also beispielsweise dem Ton einer Klaviersaite, bei dem Grundton und Oberwellen gemeinsam erklingen. Bietet man Versuchspersonen einen reinen Sinuston an und fragt sie, bei welchem Ton den nun eine Oktave erreicht ist, so wird dies im allgemeinen nicht die doppelte Frequenz sein. 2-20 Bild 2.22: Tonumfang verschiedener Musikinstrumente 2-21 2.5 Das Gehör Wie funktioniert das Gehör? Bild 2.23 zeigt eine Zeichnung des gesamten Ohres von der Ohrmuschel bis zum Innenohr. Bild 2.23: Aufbau des Hörorgans Die Schallwellen, welche an unser Ohr dringen, lösen im Innenohr elektrische Signale aus, die über Nervenfasern zum Gehirn weitergeleitet werden. Die Klänge, die wir dann letztlich in unserem Bewußtsein wahrnehmen, sind dann das Ergebnis eines Verarbeitungsprozesses im Gehirn, der teilweise noch unerforscht ist. Der Aufbau des Ohres und die Lage der Nerven sind hingegen gut bekannt. Die Ohrmuschel, auch Pinna genannt, dient nicht nur der Befestigung einer Brille oder als Objekt intensiven Piercings, sie hat auch eine Funktion bei der Wahrnehmung. Wenn man die Ohrmuschel an den Kopf anlegt oder alle Vertiefungen mit Wachs verstopft, kann man vielfach nicht mehr wahrnehmen, aus welcher Richtung ein Schallereignis kommt. Es schließt sich der Gehörgang (Meatus) an. Dieser endet am Trommelfell. Der Gehörgang ist ein vergleichsweise breitbandiger Resonator mit einer Resonanzfrequenz von etwa 2700 - 2800 Hertz. Bedingt durch diese Resonanz und der Eigenschaften von Mittelohr und Innenohr sind wir besonders empfindlich im Frequenzbereich von 3400 Hertz. (Dies ist noch ein Relikt aus unseren Tagen als Neandertaler: In diesem Frequenzbereich ist das Rascheln angesiedelt, was uns Beute oder Feinde ankündigte.) Die Schallwellen versetzen das Trommelfell in Schwingung. Diese Schwingungen werden über drei kleine Knochen im Mittelohr auf eine Membran über dem ovalen Fenster übertragen und gelangen von dort in die flüssigkeitsgefüllte Schnecke. Diese drei Knöchelchen machen das Innenohr aus und heißen Hammer (Malleus), Amboß (Incus) und Steigbügel (Stapes). Sie sind beweglich, ihre Eigenresonanz beträgt etwa 1.2 kHz. In der Elektrotechnik benutzt man zum Anpassen einer Impedanz einen Transformator; diese drei Knöchelchen sind das mechanische Analogon (im Prinzip ein Hebel) dazu. Sie passen die Impedanz des Gehörganges an die Impedanz der Schnecke an. 2-22 Der für uns wichtigste Teil des Innenohres ist die Schnecke (Cochlea). Sie ist eine konisch zulaufende Röhre, die spiralig aufgewickelt ist. Abgerollt ist sie etwa 3 cm lang. Im Innern der Schnecke befindet sich die Basilarmembran, Auf der Basilarmembran befinden sich Härchen, die mit Sinneszellen verbunden sind. Diese sind über die Hörnerven mit dem Teil der Großhirnrinde verbunden, welcher für das Hören verantwortlich ist. Hören wir zu laute Musik oder sind wir starkem Lärm ausgesetzt, so kann es geschehen, daß diese Härchen abbrechen. Leider wachsen sie nicht mehr nach, so daß das Hörvermögen bei den Frequenzen, die den abgebrochenen Härchen entsprechen, verloren geht. Vielfach wird die Schnecke abgewickelt dargestellt (Bild 2.24). Bild 2.24: Abgewickelte Schnecke Der Steigbügel versetzt über das ovale Fenster die Flüssigkeit in Schwingungen. Je nach Frequenz werden bestimmte Härchen auf der Basilarmembran in Schwingungen versetzt, die ihrerseits wiederum Sinneszellen anregen, was wir dann letztlich als Ton wahrnehmen. Betrachtet man die Skalen in Bild 2.24, so stellt man eine logarithmische Aufteilung der Frequenzwahrnehmung über die Länge der Basilarmembran fest. So gesehen ist die Schnecke ein Spektrumanalysator, welches zu jedem Zeitpunkt die im Schall vorhandenen Töne an das Gehirn weitermeldet. Das experimentell gefundene Weber-Fechnersche Gesetz besagt, daß die Sinnesempfindung der Lautstärke proportional ist zum Zehnerlogarithmus der Schallintensität Lautstärke log10 Schall int ensität Wollen wir also unsere Lieblingsmusik doppelt so laut hören, müssen wir die Leistung unseres Verstärkers verzehnfachen. Dies ist übrigens auch das Problem beim Abdämmen von Störgeräuschen. Will man das Störgeräusch auf die Hälfte absenken, so muß man 90 Prozent der Schallenergie vernichten. Das Weber-Fechnersche Gesetz gilt allerdings nicht bei ganz leisen und bei ganz lauten Schallereignissen. Es gilt übrigens - wenn auch nicht Thema dieses Scripts - auch im Bereich der optischen Wahrnehmung. 2-23 Zum Innenohr gehören noch drei Bogengänge. Diese sind unser Gleichgewichtsorgan und haben mit dem Hören nichts zu tun. Neueste Forschungen weisen jedoch darauf hin, daß man Signale, mit denen man Ultraschallwellen im Bereich von etwa 40 kHz moduliert hat, mit Hilfe der Nervenzellen in den Bogengängen wahrnehmen kann. Der Ultraschall muß eine relativ hohe Intensität haben. Dies kann man erreichen, indem man Ultraschallsender auf die Wangenknochen oder Schläfenknochen aufsetzt. Inwieweit sich eine sinnvolle Nutzung ergibt, wird die Zukunft zeigen. Quellenverzeichnis der Abbildungen: Dickreiter: Michael Dickreiter, Handbuch der Tonstudiotechnik, K. G. Saur, München 1997. Wikipedia: http://de.wikipedia.org/wiki/.... 2-24