Z u s a t z t ex t e Die Zusatztexte wurden aus dem Lehrbuch Kompaktkurs Physik von H. Pfeifer, H. Schmiedel und R. Stannarius entnommen. B.G.Teubner, 2004, ISBN 3-519-00472-0 Kapitel Thema Abschnitt Wellen Kap. 5 Wellen, Wellengleichung Wellenausbreitung 5.2 5.3 Der zweite Hauptsatz der Thermodynamik Kap. 9 Der Carnot-Zyklus Der 2. Hauptsatz der Thermodynamik 9.1 9.2 Dämpfe und reale Gase Kap. 13 Die Van-der-Waals-Gleichung, Virialentwicklung 13.1 Elektrostatik Kap. 16 Dielektrika 16.6 Magnetfelder Kap. 18 Magnetostatik 18.4 Wellenoptik Kap. 22 Kohärenz Interferenz 22.1 22.2 Polarisation des Lichtes Kap. 23 Polarisation Fresnel-Formeln Natürliche Doppelbrechung Zirkular und elliptisch polarisiertes Licht Optische Aktivität 23 23.1 23.2 23.3 Strahlungsformeln 25.2 Wärmestrahlung 23.4 Physikal isches Praktikum Prof. Dr. Dr. h.c. Harry Pfeifer Prof. Dr. Herbert Schmiedel Prof. Dr. Ralf Stannarius Kompaktkurs Physik mit virtuellen Experimenten und Übungsaufgaben August 2004 B. G. Teubner Verlag / GWV Fachverlage GmbH, Wiesbaden 84 5 Schwingungen und Wellen mit x0 (t) = 2x̂ cos{[(ω1 − ω2 )/2]t + (α1 − α2 )/2}, ωs = (ω1 + ω2 )/2 und αs = (α1 +α2 )/2, d.h. es entsteht eine Schwingung mit der mittleren Frequenz (ω1 +ω2 )/2 und einer Amplitude x̂s = |x0 (t)|, die periodisch zwischen 0 und dem Maximalwert 2x̂ schwankt. Diese Erscheinung nennt man Schwebung (beat phenomenon). A 32 (3) Senkrechte Polarisation (~ea1 = ~ex , ~ea2 = ~ey ), gleiche Amplitude (x̂ = ŷ = â) und gleiche Frequenz (ωx = ωy = ω). Es ergibt sich in der x-y-Ebene i.Allg. eine Ellipse (elliptisch polarisierte Schwingung, elliptically polarized oscillation), die für αx −αy = 0, π, 2π usw. zu einer linear polarisierten Schwingung und für αx −αy = π/2, 3π/2, 5π/2 usw. zu einer zirkular polarisierten Schwingung entartet (s.Abb.39). (4) Senkrechte Polarisation (~ea1 = ~ex , ~ea2 = ~ey ), gleiche Amplitude (x̂ = ŷ = â) und kommensurable (commensurate) Frequenzen (d.h. der Quotient beider ist eine rationale Zahl ). Es ergeben sich in der x-y-Ebene geschlossene Kurven, die man als Lissajous-Figuren (Lissajous figures, Jules Antoine Lissajous 1822-1880) bezeichnet. Sie lassen sich einfach konstruieren und finden in der Messtechnik bei der Bestimmung von Frequenzverhältnissen Anwendung: Die Zahl der Berührpunkte der Figur mit dem einhüllenden Quadrat der Kantenlänge 2â, die man in x-Richtung zählt, zu der entsprechenden Zahl in y-Richtung ist gleich dem Verhältnis ωy /ωx . Als Beispiel zeigt Abb.40 die Lissajous-Figur für ein Frequenzverhältnis ωy /ωx = 2. A 33 (2) (1) y y x 2a 2a 2a (3) y x 2a 2a x 2a Abbildung 39. Lissajous-Figuren für ein Frequenzverhältnis 1, gleiche Amplituden, aber verschiedene Phasendifferenzen: (1) αx − αy = 0, (2) αx − αy = π/2, (3) αx − αy = π 5.2 Wellen Wenn man ein Teilchen eines Fluids oder eines Festkörpers zu einer erzwungenen Schwingung mit der Frequenz ω anregt, so erfahren, infolge der Wechselwirkungskräfte zwischen den Teilchen, zunächst die unmittelbaren Nachbarn eine aufgeprägte Kraft der gleichen Frequenz. Diese Nachbarn beginnen deshalb (phasenverschoben) 5.2 Wellen 85 y x 2a 2a Abbildung 40. Lissajous-Figur für x = â cos(ωt + αx ) und y = â cos(2ωt + αy ) mit αx − αy = π/4 ebenfalls erzwungene Schwingungen auszuführen, die sie analog an ihre nächsten Nachbarn übertragen, so dass schließlich die Auslenkungen aller Teilchen aus ihren Ruhelagen sowohl eine zeitliche als auch räumliche Periodizität aufweisen. Erfolgt die Auslenkung in der Ausbreitungsrichtung dieser Erregung, so spricht man von einer longitudinalen Welle (longitudinal wave) im Gegensatz zu den transversalen Wellen (transverse waves) bei senkrechter Auslenkung. Harmonisch nennt man eine Welle (harmonische Welle, harmonic wave), wenn die Auslenkungen aus den Ruhelagen harmonische Schwingungen sind (s.S.16). In Abb.41 ist die Entstehung einer harmonischen longitudinalen Welle in einem eindimensionalen Kristall, der sich in x-Richtung erstreckt, durch eine Folge von Momentaufnahmen dargestellt. Für die Zeitintervalle zwischen den Aufnahmen wurde eine Viertelperiode der harmonischen Schwingungen gewählt. Während also jedes einzelne Teilchen eine erzwungene Schwingung mit der gleichen Periode (period) T ausführt, hängt seine Nullphase vom Ort der Ruhelage des betreffenden Teilchens ab. Den kleinsten Abstand zwischen Teilchen mit gleicher Nullphase bezeichnet man als Wellenlänge (wave length oder wavelength) λ (s.Abb.41). Damit lässt sich eine eindimensionale harmonische longitudinale Welle in der Form 2π 2π ˆ ξ(t, x) = ξ cos t∓ x (137) T λ schreiben, wobei ξ(t, x) die Auslenkung in x-Richtung zur Zeit t für ein Teilchen bezeichnet, dessen Ruhelage die Koordinate x besitzt. Das Minuszeichen gilt für eine in die positive x-Richtung fortschreitende Welle und das Pluszeichen für die entgegengesetzte Richtung. Führt man in Analogie zur Kreisfrequenz (angular frequency) ω = 2π/T die Kreiswellenzahl (circular wave number) kx = 2π/λ ein, so ergibt sich aus Gl.(137) ξ(t, x) = ξˆ cos(ωt ∓ kx x). (138) Für eine Welle im dreidimensionalen Raum ist kx x durch kx x + ky y + kz z zu ersetzen, so dass sich an Stelle von Gl.(138) die allgemeine Gleichung ξ(t, ~r) = ξˆ cos(ωt − ~k~r) mit dem 86 5 Schwingungen und Wellen Zeitpunkt der Momentaufnahme t9 t8 t7 t6 λ t5 t4 Abbildung 41. Ausbildung einer longitudinalen harmonischen Welle in einem eindimensionalen Kristall, der sich in x-Richtung erstreckt. Für die Zeitpunkte ti der Momentaufnahmen gilt: t1 = 0, t2 = T /4, t3 = 2T /4, t4 = 3T /4, t5 = T usw. t3 t2 Ortskoordinate x t1 t5−t1 = T Wellenzahlvektor oder Wellenvektor (circular wave vector) ~k = kx~ex + ky ~ey + kz ~ez ergibt. Hierbei gilt (kx2 + ky2 + kz2 )1/2 = 2π/λ. Für die Phasengeschwindigkeit (phase velocity) υP , das ist die Geschwindigkeit, mit der sich eine herausgegriffene Phase, z.B. ein Maximum einer harmonischen Welle, bewegt, gilt auf Grund der Definitionen von λ (Weg) und T (Zeit) υP = λ/T . Dafür kann man mit kx = 2π/λ und ω = 2π/T auch υP = ω kx (139) schreiben. Beim Übergang von einem Medium in ein anderes bleibt die Frequenz erhalten (erzwungene Schwingungen der Teilchen), jedoch wird sich i.Allg. die Wellenlänge, die von der Stärke der Wechselwirkung zwischen den Teilchen und ihrem mittleren Abstand abhängt, ändern. Wenn in einem Medium das Produkt aus Wellenlänge und Frequenz nicht konstant ist, sondern von der Frequenz abhängt, spricht man von Dispersion (dispersion). Diese Erscheinung führt zu der Notwendigkeit, eine weitere Geschwindigkeit einzuführen: Um Signale mit einer Welle zu übertragen, muss diese moduliert werden, denn eine harmonische Welle liefert beim Empfänger nur eine harmonische Schwingung mit den zeitlich konstanten Parametern Amplitude, Frequenz und Nullphase. Erst durch Modulation (modulation), d.h. durch zeitliche Variation einer dieser drei Größen, ist es möglich, Signale zu übermitteln. Wir betrachten als einfachstes 5.2 Wellen 87 Signal einen Rechteckimpuls, der durch Erhöhung der Amplitude einer harmonischen Welle über ein kurzes Zeitintervall realisiert wird (Amplitudenmodulation, amplitude modulation). Durch eine mathematische Operation, die sog. Fourierzerlegung, kann man diese Welle mit zeitabhängiger Amplitude in harmonische Wellen zerlegen, die unterschiedliche aber zeitlich konstante Amplituden, Frequenzen und Nullphasen besitzen. Wenn nun diese einzelnen Wellen infolge der Dispersion unterschiedliche Phasengeschwindigkeiten haben, so wird sich der Impuls im Laufe der Zeit verformen und sein Schwerpunkt wird sich mit einer Geschwindigkeit bewegen, die i.Allg. nicht mit der Phasengeschwindigkeit der unmodulierten Welle übereinstimmt. Diese Geschwindigkeit, mit der sich ein Signal fortpflanzt, das einer Welle aufmoduliert ist, nennt man Gruppengeschwindigkeit (group velocity) υG . Eine einfache Rechnung liefert dafür eine zu Gl.(139) analoge Beziehung: υG = A 34 dω . dkx (140) A 35 Wir betrachten zwei harmonische Wellen mit den Frequenzen ω und ω + ∆ω und den zugehörigen Kreiswellenzahlen kx und kx + ∆kx . Die beiden Wellen verstärken sich (Maximum der Erregung), wenn die beiden Phasen gleich sind, d.h. für ωt − kx x = (ω + ∆ω)t − (kx + ∆kx )x. Daraus ergibt sich 0 = t∆ω − x∆kx , oder für die Geschwindigkeit, mit der sich das Maximum fortbewegt, x/t = ∆ω/∆kx . Nach dem Grenzübergang folgt die gesuchte Gl.(140). In einem Fluid kann sich nur eine longitudinale Welle ausbilden. Die Ausbreitung dieser Welle erfolge in x−Richtung und wir betrachten ein Volumenelement, das zum Zeitpunkt t die Größe A∆x (s.Abb.42) besitze, wobei A die Querschnittsfläche senkrecht zu x bezeichnet. Mit der mittleren Dichte ρ des Fluids und den vom Ort (x) und der Zeit (t) abhängigen Größen Druck (p) und Geschwindigkeit (υx ) ergibt sich aus dem 2. Newton’schen Axiom ∂υx 1 ∂p ≈− . ∂t ρ ∂x (141) Die Differentialquotienten wurden als partielle Ableitungen geschrieben, da bei den jeweiligen Differentiationen die anderen unabhängigen Variablen konstant zu halten sind. Für die Kraft, die z.Zt. t auf das Massenelement ρA∆x wirkt, gilt Fx = −[p(t, x + ∆x) − p(t, x)]A oder Fx = [−(∂p/∂x)∆x]A. Einsetzen dieses Ausdrucks in das 2. Newton’sche Axiom (ρA∆x)(dυx /dt) = Fx und Vernachlässigung des in der Geschwindigkeit quadratischen Terms (dυx /dt = ∂υx /∂t + (∂υx /∂x)υx ≈ ∂υx /∂t) liefert die Gl.(141). 88 5 Schwingungen und Wellen Um eine zweite Gleichung zu erhalten, betrachten wir den Zeitpunkt t + dt. Unter Verwendung der Definitionsgleichung für die Kompressibilität κ = −(1/V )dV /dp (s.Gl.(80), S.53) folgt mit κ = κa ∂p ∂υx = −κa . ∂x ∂t (142) Zur Zeit t + dt befindet sich die linke Seite des Volumenelementes (s.Abb.42) bei x + υx (x)dt und die rechte Seite bei x + ∆x + υx (x + ∆x)dt. Wegen υx (x + ∆x) = υx (x) + (∂υx /∂x)∆x ergibt sich für die Volumenänderung zwischen t und t + dt der Wert dV = A(∂υx /∂x)∆xdt. Einsetzen von dV und V = A∆x in die Definitionsgleichung der Kompressibilität κ = −(1/V )dV /dp (s.Gl.(80), S.53) liefert die Beziehung κ = −(∂υx /∂x)dt/dp oder mit dp/dt = ∂p/∂t die gesuchte Gl.(142). Für κ ist die adiabatische Kompressibilität κa einzusetzen, da bei den Schallwellen sehr schnelle Volumenänderungen auftreten, die deshalb ohne Austausch von Wärmeenergie mit der Umgebung, d.h. adiabatisch erfolgen. x x+∆ x A p(x+∆ x) p(x) vx (x) v x (x+ ∆ x) Abbildung 42. Zur Ableitung der Phasen- und Gruppengeschwindigkeit der longitudinalen Welle, die sich in xRichtung in einem Fluid ausbreitet Differenziert man die Gl.(141) nach x und die Gl.(142) nach t, so müssen die beiden Ausdrücke gleich sein, und man erhält die eindimensionale Wellengleichung (one-dimensional wave equation) für den Druck ∂2p 1 ∂2p = . ∂t2 κa ρ ∂x2 (143) Die allgemeine Lösung dieser Wellengleichung lautet p(t, x) = p(u) mit u = t ∓ (κa ρ)1/2 x, wie man leicht durch Einsetzen in Gl.(143) zeigen kann. Die spezielle Lösung p(t, x) = p̂ cos(ωu) oder p(t, x) = p̂ cos[ωt ∓ ω(κa ρ)1/2 x] stellt die harmonische Welle dar. Ein Vergleich mit der Gl.(138), S.85, liefert unter Verwendung der Formeln für die Phasengeschwindigkeit υP (Gl.(139), S.86) bzw. die Gruppengeschwindigkeit υG (Gl.(140), S.87) das Ergebnis 5.3 Wellenausbreitung υP = υG = √ 1 . κa ρ 89 (144) In ähnlicher Weise ergeben sich die in Tab.17 zusammengestellten Formeln für die Phasen- und Gruppengeschwindigkeiten mechanischer Wellen. Führt man in Gl.(143) die Phasengeschwindigkeit υP nach Gl.(144) ein und erweitert auf drei Dimensionen, so erhält man die dreidimensionale Wellengleichung (threedimensional wave equation) für den Druck 2 ∂2p ∂2p ∂ p ∂2p 2 = υ + + . (145) P ∂t2 ∂x2 ∂y 2 ∂z 2 Ü 35 Ü 36 Ü 37 A 36 Tabelle 17. Phasengeschwindigkeit mechanischer Wellen (κa = adiabatische Kompressibilität, ρ = Dichte, E = Elastizitätsmodul, K = Kompressionsmodul, G = Torsionsmodul, σ = Oberflächenspannung). Die Gruppengeschwindigkeit (υG ) ist mit Ausnahme der Oberflächenwellen gleich der Phasengeschwindigkeit (υP ) Wellenart Phasengeschwindigkeit Beispiel longitudinale Welle in einem Fluid p Luftsäule in einem Rohr (Orgelpfeife) longitudinale Welle in einem dünnen Stab p durch Eisenbahnschienen übertragener Schall transversale Seilwelle (Spannkraft F , Querschnittsfläche A) p Saite eines Streichinstruments longitudinale Welle in einem Festkörper p longitudinale Erdbebenwellen Torsionswelle (Scherwelle) p periodische Achse Oberflächenwelle einer tiefen Flüssigkeit (k = 2π/λ, g = Erdbeschleunigung) p Wellen auf Wasseroberflächen 1/(κa ρ) E/ρ F/(ρ A) [K + (4/3)G]/ρ G/ρ (g/k) + σk/ρ Verdrillung einer 5.3 Wellenausbreitung 5.3.1 Stehende Wellen Wenn eine in die positive x-Richtung fortschreitende harmonische Welle p(t, x) = p̂ cos(ωt − kx x) an der Stelle x = ` auf ein anderes Medium trifft, kommt es i.Allg. zu 90 5 Schwingungen und Wellen einer Reflexion, d.h. es entsteht eine Welle, die sich von x = ` aus in die negative xRichtung ausbreitet. Die Amplitude p̂r dieser reflektierten Welle muss zwischen den Grenzwerten 0 und p̂ liegen. p̂r = 0 bedeutet, dass die gesamte Leistung der Welle p(t, x) in das andere Medium übergeht, d.h. es tritt keine Reflexion auf. In der Optik bezeichnet man dieses Medium dann als schwarzen Körper (black body), in der Nachrichtentechnik spricht man von Anpassung (matching). Der andere Grenzfall p̂r = p̂ heißt Totalreflexion (total reflection). Zur vollständigen Charakterisierung der reflektierten Welle muss außer ihrer Amplitude noch die Nullphase bekannt sein. Ist die Differenz der Nullphasen für die beiden Wellen p(t, x) und pr (t, x) an der Stelle x = ` null, so verstärken sie sich an dieser Stelle maximal (Reflexion am losen Ende, soft reflection), während sie sich bei einer Phasendifferenz π maximal schwächen (Reflexion am festen Ende, hard reflection). Zur Beschreibung der Effekte, die sich aus der Überlagerung einer hinlaufenden und einer reflektierten Welle ergeben, nehmen wir der Einfachheit halber an, dass bei x = 0, von wo aus die Welle p(t, x) startet, Anpassung vorliegt, so dass im Gebiet 0 ≤ x ≤ ` nur die beiden Wellen p(t, x) und pr (t, x) existieren. Für den Spezialfall einer Totalreflexion am losen Ende gilt pr (t, x) = p̂ cos(ωt + kx x − kx 2`). (146) Das positive Vorzeichen von kx x resultiert aus der Tatsache, dass die reflektierte Welle in die negative x-Richtung läuft, während die Nullphase −kx 2` sichert, dass die beiden Wellen p(t, x) und pr (t, x) bei x = ` die gleiche Nullphase, nämlich −kx `, besitzen. An der Stelle x gilt also zum Zeitpunkt t für die Gesamterregung, die man als stehende Welle (standing wave) bezeichnet, p(t, x) + pr (t, x) = 2p̂ cos(kx x − kx `) cos(ωt − kx `). (147) Aus p(t, x)+pr (t, x) = p̂ cos(ωt−kx x)+ p̂ cos(ωt+kx x−kx 2`) folgt unter Verwendung des Additionstheorems cos α + cos β = 2 cos[(α − β)/2] cos[(α + β)/2] und unter Beachtung von cos(α − β) = cos(β − α) sofort die Gl.(147). Die Gl.(147) beschreibt eine harmonische Schwingung mit einer vom Ort abhängigen Amplitude |2p̂ cos(kx x − kx `)|. Wegen kx = 2π/λ ist die Amplitude an den Stellen x = `−λ/4, `−3λ/4 usw. gleich null. Man nennt diese Stellen die Knoten (nodes) der stehenden Welle, während für x = `, `−λ/2 usw. die Amplitude den Maximalwert 2p̂ besitzt (Bäuche, antinodes, der stehenden Welle). Eine analoge Überlegung liefert für die Totalreflexion am festen Ende Knoten an den Stellen x = `, ` − λ/2 usw. und Bäuche bei x = ` − λ/4, ` − 3λ/4 usw. Zusammengefasst ergeben sich aus diesen Ergebnissen die beiden folgenden Aussagen: (1) Der Abstand zwischen einem Bauch und einem benachbarten Knoten ist λ/4. (2) Bei Reflexion an einem festen (losen) Ende entsteht an der Reflexionsstelle ein Knoten (Bauch). 5.3 Wellenausbreitung 91 Wenn sowohl bei x = 0 als auch bei x = ` eine Reflexion auftritt, so entsteht ein resonanzfähiges System. Im Gegensatz zum linearen Oszillator (s.S.78) gibt es hier aber unendlich viele Resonanzen, die sog. Eigenschwingungen (eigenmodes). Als erstes Beispiel betrachten wir die beidseitig eingespannte Saite (string) eines Streichinstrumentes. Aus der Forderung, dass sich an beiden Enden, d.h. bei x = 0 und x = `, ein Knoten ausbilden muss, folgt die Resonanzbedingung zu ` = nλ/2 mit n = 1, 2, 3 usw. Die Erregung für n = 1 nennt man die Grundschwingung (fundamental vibration) oder auch die 1. Eigenschwingung (first harmonic). n = 2 wird als 1. Oberschwingung (first overtone) oder auch als 2. Eigenschwingung (second harmonic) bezeichnet usw. Die Resonanzfrequenzen ergeben sich aus der Formel für die Phasengeschwindigkeit υP = λf = (F/ρA)1/2 (s.Tab.17, S.89) mit λ = 2`/n zu s n F f= (148) , 2` ρA wobei F die Kraft bezeichnet, mit der die Saite gespannt wird, deren Querschnittsfläche A und deren Dichte ρ ist. Für die Eigenschwingungen einer Luftsäule (air filled pipe), die sich in einem Rohr der Länge ` befindet, das am einen Ende offen und am anderen Ende mit einem Deckel verschlossen ist (gedackte Orgelpfeife, closed organ pipe) muss ` gleich den möglichen Abständen zwischen Knoten und Bauch sein, d.h. ` = (2n − 1)λ/4 mit n = 1, 2, 3 usw. Unter Verwendung der Formel für die Phasengeschwindigkeit (Gl.(144), S.89) ergeben sich die Resonanzfrequenzen zu r 1 2n − 1 f= . (149) 4` κa ρ Eine einfache Überlegung zeigt, dass für die beidseitig offene Orgelpfeife (open organ pipe) der Faktor (2n − 1) in Gl.(149) durch 2n zu ersetzen ist. Ü 38 5.3.2 Der Doppler-Effekt Zur Behandlung des Doppler-Effekts (Doppler effect, Johann Christian Doppler 1803-1853) betrachten wir im Folgenden eine Schallquelle, die harmonische Wellen mit der Frequenz f aussendet. Wenn die Schallquelle in dem Medium ruht, in dem sich die Schallwellen ausbreiten, so sei deren Wellenlänge λ. Ein Beobachter, der sich einer solchen Schallquelle mit der Geschwindigkeit υB nähert (moving detector), überstreicht in einer Sekunde f + υB /λ Wellenmaxima, d.h. er registriert eine erhöhte Frequenz fB = f + υB /λ. Diese Beziehung lässt sich wegen υP = λf auch in der Form fB = f (1 + υB /υP ) (150) 92 5 Schwingungen und Wellen schreiben. Entfernt sich der Beobachter von der im Medium ruhenden Schallquelle, so ist υB in Gl.(150) durch −υB zu ersetzen, d.h. die Frequenz verringert sich. In dem anderen Fall, bei dem der Beobachter im Medium ruht und sich die Schallquelle mit der Geschwindigkeit υS dem Beobachter nähert (moving source), verkürzt sich die Wellenlänge der Schallwellen in dieser Richtung, denn die Schallquelle verfolgt die von ihr ausgesandte Welle, so dass sich die Wellenlänge um diejenige Strecke reduziert, die die Schallquelle in der Zeit T = 1/f zurücklegt. Es ergibt sich also λS = λ − υS T , oder, wegen fS = υP /λS und f = υP /λ, fS = f . 1 − υS /υP (151) A 37 Bei Entfernung der Schallquelle ist υS in Gl.(151) durch −υS zu ersetzen, d.h. der Beobachter registriert einen tieferen Ton. Diese Erscheinung ist dem Besucher von Motorrad- oder Autorennen wohlbekannt. Während der Annäherung des Fahrzeugs hört er einen höheren und beim Entfernen einen tieferen Ton als der Tourenzahl des Motors entspricht. Mit wachsender Geschwindigkeit υS der Schallquelle wird die Wellenlänge λS = λ − υS T immer kleiner, bis sie für λ = υS T , d.h. für υS = υP , verschwindet. Die Wellen drängen sich dabei an der Frontseite der Schallquelle zusammen und es entsteht die Schallmauer (sound barrier). A 38 a) b) c) x d) 2α Abbildung 43. Ausbreitung der Schallwellen eines Flugzeugs, das sich mit der Geschwindigkeit υS in die x-Richtung bewegt: a) υS = 0, b) υS < υP , c) υS = υP , d) υS > υP , wobei υP die Schallgeschwindigkeit bezeichnet In Abb.43 ist die Ausbreitung der Schallwellen für ein Flugzeug (Pfeifton des Motors) (a) im Stand, (b) bei Unterschallgeschwindigkeit, (c) bei Erreichen der Schallgeschwindigkeit und (d) im Überschallbereich dargestellt. Im Überschallflug bilden die zusammengedrängten Schallwellen einen Mach-Kegel (Mach cone, Ernst Mach 1838-1916), für dessen Öffnungswinkel α man leicht an Hand von Abb.43d die Beziehung υP sin α = (152) υS 5.4 Schallwellen (Akustik) 93 ableitet. Den Quotienten υS /υP , d.h. den Kehrwert von sin α, bezeichnet man als Mach-Zahl (Mach number). Das Auftreffen des Mach-Kegels, den z.B. ein mit Überschallgeschwindigkeit fliegendes Objekt erzeugt, wird am Erdboden akustisch als Knall registriert. 5.4 Schallwellen (Akustik) Schallwellen (sound waves) sind longitudinale oder transversale mechanische Wellen, die sich in elastischen Medien ausbreiten. Für den Menschen liegt der Hörbereich (audible frequency range) zwischen 16 Hz und 20 kHz, wobei die obere Grenzfrequenz mit wachsendem Alter immer niedriger wird und in die Größenordnung von 10 kHz kommt. Wellen mit Frequenzen im Gebiet zwischen 20 kHz und 10 GHz bezeichnet man als Ultraschallwellen (supersonic waves), solche oberhalb von 10 GHz als Hyperschallwellen (hypersonic waves). Die letzteren treten als thermische Gitterschwingungen in Festkörpern auf. Eine harmonische Welle im Hörbereich nennt man einen Ton (tone). Ein Klang (sound) besteht aus einem Grundton und mehreren Obertönen. Sind einige Obertöne besonders intensiv, so spricht man von einem Akkord (accord). Töne, Klänge und Akkorde sind streng periodisch. Nichtperiodische akustische Erregungen nennt man Geräusch (noise). Für die Schallgeschwindigkeit in Luft gilt nach Gl.(144), S.89, υP = (κa ρ)−1/2 , wobei ρ die Dichte der Luft und κa = (pγ)−1 die adiabatische Kompressibilität (s.S.53) der Luft bezeichnet. Ersetzt man in dieser Beziehung die Dichte der Luft nach Gl.(91), S.58, so folgt p υP = RT γ/M . (153) Bei T = 273 K ergibt sich also für die Schallgeschwindigkeit (sound velocity) in Luft (M ≈ 29, 0 · 10−3 kg/mol, s.S.55, sowie γ = 1, 4) 331,0 m/s, was relativ gut mit dem experimentellen Wert von 331,45 m/s für trockene Luft [LID90] übereinstimmt. Wesentlich ist auch, dass die Schallgeschwindigkeit nach Gl.(153) nicht vom Druck abhängt, dass sie mit der Wurzel aus der Temperatur zu- und mit der Wurzel aus der molaren Masse abnimmt. 5.4.1 Größen des Schallfeldes Nach Abschn.5.2, gilt für die Zeit- und Ortsabhängigkeit des Drucks bei einer harmonischen Welle, die sich in die positive x−Richtung bewegt, p(t, x) = p̂ cos[ω(t−x/υP )] mit ω = 2π/T und ω/υP = 2π/λ. Da sich der Gesamtdruck aus der Summe von p(t, x) und dem statischen Druck ps zusammensetzt, bezeichnet man p(t, x) genauer als den Schallwechseldruck (sound pressure). Wie wir noch sehen werden, ist bei den üblichen Schallintensitäten die Amplitude p̂ des Schallwechseldrucks um 9 Der zweite Hauptsatz der Thermodynamik Werner Heisenberg: Der erste Trunk aus dem Becher der Naturwissenschaft macht atheistisch, aber auf dem Grund des Bechers wartet Gott. 9.1 Der Carnot-Zyklus Wir beginnen mit der Definition von rechts- bzw. linksläufigen Zyklen (Zyklus = Kreisprozess, cycle): Bei einem rechtsläufigen Zyklus (clockwise cycle) werden die verschiedenen Zustände im p-V -Diagramm im Uhrzeigersinn durchlaufen. p 1 2 Abbildung 51. Beispiel für einen rechtsläufigen Zyklus V A 43 A 44 Dies ist schematisch in der Abb.51 dargestellt, wo man vom Ausgangszustand 1 zunächst über höhere Drücke nach 2 und dann bei niedrigeren Drücken wiederRzurück 2 nach 1 gelangt. Die senkrecht schraffierte Fläche Ak wird durch das Integral 1 pdV auf dem oberen Weg und die horizontal schraffierte Fläche A= durch das entsprechende Integral auf dem unteren Weg gegeben, so dass H sich wegen H δW = −pdV (s.S.112) für die am System insgesamt verrichtete Arbeit δ W = − pdV = −Ak + A= < 0 ergibt: Bei einem rechtsläufigen Zyklus verrichtet das System Arbeit, d.h. es wandelt Wärmeenergie in mechanische Energie um (Wärmekraftmaschine, heat engine). Wenn dagegen der Zyklus entgegen dem Uhrzeigersinn durchlaufen wird (linksläufiH ger Zyklus, anticlockwise cycle), folgt analog δ W > 0, was bedeutet, dass man am System Arbeit verrichten muss. Diese wird verwendet, um Wärmeenergie zu transportieren. Dient der Transport zur Abkühlung eines Raumes, wobei die Wärmeenergie einem großen Reservoir, z.B. der Umgebung, zugeführt wird, so spricht man 118 9 Der zweite Hauptsatz der Thermodynamik von einer Kältemaschine (refrigeration machine). Wenn man aber einem Raum auf diese Weise, d.h. durch periodische Wiederholung eines linksläufigen Zyklus, Wärmeenergie zuführt, die einem großen Reservoir, z.B. dem Grundwasser, entzogen wird, so nennt man die Anlage eine Wärmepumpe (heat pump). A 45 A 46 Beim Carnot-Zyklus (Carnot cycle, Sadi Carnot 1796-1832) wird vorausgesetzt, dass alle Zustandsänderungen reversibel erfolgen. Wärmereservoir T1 ∆ Q 12 > 0 Wärmeschalter Arbeitsgas ∆ W< 0 ∆Q 34 <0 Wärmereservoir Wärmeschalter Abbildung 52. Schematische Darstellung einer Apparatur zur Realisierung des CarnotZyklus. Da das Arbeitsgas nach Vollendung eines Zyklus wieder die gleiche innere Energie wie am Anfang besitzt, gilt ∆Q12 + ∆Q34 + ∆W = 0. Ein Beispiel für den Verlauf von Druck und Volumen für 1 Mol Luft als Arbeitsgas mit T1 = 1000 K und T2 = 500 K zeigt die Abb.53 T2 < T 1 Einen Prozess bezeichnet man als reversibel (reversible), wenn das System dabei nur thermodynamische Gleichgewichtszustände (charakterisiert durch Zustandsgrößen wie z.B. p, T ) durchläuft. Dies bedeutet insbesondere, (1.) dass die Reibung vernachlässigbar sein muss, denn nur unter dieser Bedingung wird verhindert, dass mechanische Energie irreversibel (irreversibly), d.h. unumkehrbar, in Wärmeenergie übergeht (Dissipation, dissipation), (2.) dass sich bei einem thermischen Kontakt des Systems mit der Umgebung die Temperaturen von System und Umgebung nur infinitesimal unterscheiden, denn nur dann kann das System durch eine einheitliche Temperatur beschrieben werden, und (3.) dass es im System nur infinitesimale Druckdifferenzen geben darf, denn dann kann man es mit einem einheitlichen Druck beschreiben. Der Carnot-Zyklus besteht aus zwei isothermen (1 → 2 und 3 → 4) und zwei adiabatischen (2 → 3 und 4 → 1) Zustandsänderungen, also aus insgesamt vier Takten (s.Abb.53). Im 1. Takt (1 → 2) dehnt sich das Gas, das aus n Molen eines idealen Gases bestehe (die Erweiterung auf nichtideale Gase findet man im Abschn.9.2 auf S.123), isotherm vom Volumen V1 auf V2 im Kontakt mit einem heißen Reservoir der Temperatur T1 aus (in Abb.52 ist der obere Wärmeschalter geschlossen). Für 9.1 Der Carnot-Zyklus 119 die dabei zugeführte Wärmeenergie ∆Q12 und die am Gas verrichtete Arbeit ∆W12 folgt nach einer kleinen Zwischenrechnung ∆Q12 = −∆W12 = nRT1 ln(V2 /V1 ). (186) RV2 Für die am Gas verrichtete Arbeit ∆W12 gilt (s.S.112) ∆W12 = − V 1 pdV . Unter Verwendung der Zustandsgleichung für ideale Gase (s. Gl.(161), S.98) p = nRT1 /V liefert die Integration ∆W12 = −nRT1 ln(V2 /V1 ). Die zugeführte Wärmeenergie ∆Q12 ergibt sich aus dem 1. Hauptsatz (s. Gl.(179), S.111) mit ∆U12 = 0 (isotherme Zustandsänderung) zu ∆Q12 = −∆W12 . A 47 A 48 Abbildung 53. Beispiel eines Carnot-Zyklus (Isothermen 1 → 2 und 3 → 4, Adiabaten 2 → 3 und 4 → 1) im p-V -Diagramm für 1 Mol Luft (Adiabatenkoeffizient γ = 1,4) als Arbeitsgas mit T1 = 1000 K und T2 = 500 K Im 2. Takt (2 → 3) (beide Wärmeschalter in Abb.52 sind geöffnet) dehnt sich das Gas adiabatisch vom Volumen V2 auf V3 aus, wobei die Temperatur von T1 auf T2 absinkt. Wegen der adiabatischen Zustandsänderung, d.h. ∆Q23 = 0, folgt für die dabei am Gas verrichtete Arbeit ∆W23 aus Gl.(179), S.111, mit ∆U23 = nCVm (T2 − T1 ) ∆W23 = nCVm (T2 − T1 ). (187) Im 3. Takt wird das Gas isotherm vom Volumen V3 auf ein bestimmtes Volumen V4 (s.u.) im Kontakt mit einem kalten Reservoir der Temperatur T2 komprimiert (in Abb.52 ist der untere Wärmeschalter geschlossen). Es ergibt sich analog zu Gl.(186) V4 ∆Q34 = −∆W34 = nRT2 ln . (188) V3 120 9 Der zweite Hauptsatz der Thermodynamik Der 4. Takt schließlich (beide Wärmeschalter in Abb.52 sind geöffnet) besteht aus einer adiabatischen Kompression von V4 auf V1 . Dabei erwärmt sich das Gas. Die bisher noch nicht festgelegte Größe von V4 muss nun so gewählt werden, dass die Erwärmung wieder auf die ursprüngliche Temperatur T1 führt, damit der Zyklus geschlossen ist. Für die beim 4. Takt am Gas verrichtete Arbeit ∆W41 gilt analog zu Gl.(187) ∆W41 = nCVm (T1 − T2 ). (189) Für die insgesamt am Gas verrichtete Arbeit ∆W = ∆W12 + ∆W23 + ∆W34 + ∆W41 folgt durch Einsetzen der Gln.(186)-(189) und unter Verwendung der dritten PoissonGleichung (s.Gl.(183), S.113) V2 ∆W = −nR(T1 − T2 ) ln . (190) V1 Aus ∆W = ∆W12 + ∆W23 + ∆W34 + ∆W41 erhält man durch Einsetzen der Gln.(186)(189) ∆W = −nRT1 ln(V2 /V1 ) − nRT2 ln(V4 /V3 ). Die dritte Poisson-Gleichung (s. die Gln.(183), S.113) liefert für den 2. Takt T1 V2γ−1 = T2 V3γ−1 und für den 3. Takt T2 V4γ−1 = T1 V1γ−1 . Die Division dieser beiden Gleichungen durcheinander gibt V2 /V1 = V3 /V4 und damit folgt für ∆W die Gl.(190). A 49 A 50 Die von uns gewählte Umlaufsrichtung (rechtsläufiger Zyklus) bedeutet, dass wir den Carnot-Zyklus als Wärmekraftmaschine behandelt haben. Der Wirkungsgrad (efficiency) ηWK einer Wärmekraftmaschine ist definiert als Quotient aus der von der Maschine verrichteten Arbeit (−∆W ) und der ihr vom heißen Reservoir zugeführten Wärmeenergie (+∆Q12 ) ηWK = −∆W ∆Q12 + ∆Q34 = . ∆Q12 ∆Q12 Für eine Carnot-Maschine folgt durch Einsetzen der Gln.(190) und (186) −∆W T1 − T2 Carnot ηWK = = . ∆Q12 Carnot T1 (191) (192) Von der zugeführten Wärmeenergie ∆Q12 wird also nur der Bruchteil ηWK in mechanische Energie umgewandelt, der Rest wird bei der Temperatur T2 an das kalte Reservoir (Kühler) abgegeben. Dies erfolgt beim 3. Takt. Für diese Wärmeenergie (−∆Q34 ) ergibt sich aus Gl.(188) unter Verwendung der Beziehung V2 /V1 = V3 /V4 (s. den kleingedruckten Text nach Gl.(190)) V2 − ∆Q34 = nRT 2 ln . (193) V1 9.1 Der Carnot-Zyklus 121 Setzt man für T1 und T2 die Temperaturen ein, die beim Ottomotor auftreten (Kühlertemperatur T2 ≈ 350 K, Temperatur nach Zünden des Benzin-LuftGemisches T1 ≈ 2700 K), so würde sich nach Gl.(192) ein Wirkungsgrad von 0,87 ergeben, der noch deutlich über dem Idealwert von 0,56 für den Ottomotor bei einer Verdichtung von 8 liegt (s.S.115). Für die Verwendung des Carnot-Prozesses als Wärmepumpe (heat pump) muss der Zyklus entgegen dem Uhrzeigersinn durchlaufen und die an das wärmere Reservoir abgegebene Wärmeenergie (−∆Q12 ) möglichst groß gemacht werden. Der Wirkungsgrad ηWP einer Wärmepumpe ist durch das Verhältnis von −∆Q12 und der zugeführten Arbeit ∆W gegeben −∆Q12 ∆W und es folgt aus Gl.(192) für den Carnot-Prozess ηWP = Carnot ηWP = T1 . T1 − T2 (194) (195) Dieser Wirkungsgrad ist wegen T1 > T2 stets größer als 1. Als Anwendungsbeispiel wollen wir die Wirkungsgrade für (ideale) Wohnungsheizungen betrachten: Für Öl-, Gas- oder Kohleheizungen liegt der Wirkungsgrad bei ca. 70%, d.h. 1 J chemische Energie gibt 0,7 J Wärmeenergie. Bei einer elektrischen Wohnungsheizung ist der Wirkungsgrad der Kraftwerke entscheidend. Er liegt bei der Verwendung von fossilen Brennstoffen in der Nähe von 40%, d.h. 1 J chemische Energie liefert nur 0,4 J Wärmeenergie. Bei einer elektrisch betriebenen Wärmepumpe mit einer gewünschten Zimmertemperatur von 23°C und unter Verwendung des Grundwassers mit z.B. 8°C als das kalte Reservoir folgt für den größtmöglichen Wirkungsgrad 0, 4 · 296/(296 − 281) = 7, 89, also 789%. Dies bedeutet, dass durch 1 J chemische Energie 7,89 J Wärmeenergie erzeugt werden. Bei der Verwendung des Carnot-Prozesses zur Kälteerzeugung (Kältemaschine, refrigeration machine) muss der Zyklus ebenfalls entgegen dem Uhrzeigersinn durchlaufen werden, jedoch soll hier die dem kalten Reservoir entzogene Wärmeenergie (∆Q34 ) möglichst groß sein. Der Wirkungsgrad ηKM wird demzufolge durch das Verhältnis von ∆Q34 und der am System verrichteten Arbeit ∆W gegeben: ∆Q34 . ∆W Aus den Gln. (193) und (190) folgt für den Carnot-Prozess ηKM = Carnot ηKM = T2 . T1 − T2 (196) (197) 122 9 Der zweite Hauptsatz der Thermodynamik Für eine ideale Kältemaschine zur Abkühlung von Zimmertemperatur (T1 = 300 K) auf die Temperatur des flüssigen Heliums (T2 = 4 K) ergibt sich nach Gl.(197) ein Wirkungsgrad von nur 0,014. Dies bestätigt die allgemeine Erfahrung, dass die Erzeugung tiefer Temperaturen kostenaufwendig ist. Aus Gl.(192) folgt mit −∆W = ∆Q12 +∆Q34 (1. Hauptsatz) zunächst die Beziehung (∆Q12 +∆Q34 )/∆Q12 = (T1 −T2 )/T1 , woraus sich 1+∆Q34 /∆Q12 = 1−T2 /T1 oder ∆Q12 /T1 + ∆Q34 /T2 = 0 ergibt. Bezeichnen wir allgemein die bei einer Temperatur Ti zugeführte Wärmeenergie mit ∆Qi , so lässt sich die letztere Gleichung in der Form ∆Q2 ∆Q1 + =0 T1 T2 (198) schreiben. Da man den Quotienten ∆Qi /Ti als (zugeführte) reduzierte Wärmeenergie (reduced heat) bezeichnet, besagt Gl.(198), dass beim Carnot-Zyklus die Summe der zugeführten reduzierten Wärmeenergien verschwindet. Wenn aber bei den Zustandsänderungen irreversible Anteile, wie z.B. Reibungsverluste enthalten sind (es ist dann natürlich kein Carnot-Zyklus mehr), dann wird der Wirkungsgrad Carnot = (T1 − T2 )/T1 und die Summe der zugeführten reduzierten ηWK kleiner als ηWK Wärmeenergien kleiner als null. p Abbildung 54. Zerlegung eines beliebigen Zyklus im p-V −Diagramm in (differentiell kleine) Teilzyklen bestehend aus je 2 Isothermen und 2 Adiabaten (s.Abb.49, S.114) V Ein beliebiger Zyklus lässt sich im p-V -Diagramm in differentiell kleine Teilzyklen zerlegen, die aus jeweils zwei Isothermen und zwei Adiabaten entsprechend den 4 Takten beim Carnot-Zyklus bestehen (s.Abb.54). Da sich aber auf den gemeinsamen Isothermen und Adiabaten benachbarter Teilzyklen die Beträge ∆Q/T kompensieren, weilP sie entgegengesetzt durchlaufen werden, bleibt nur die Randkurve übrig und es folgt i ∆Qi /Ti ≤ 0, oder nach dem Übergang zu differentiell kleinen Größen, 9.2 Der zweite Hauptsatz der Thermodynamik I δQ ≤ 0, T 123 (199) wobei das ”kleiner als” für irreversible und das Gleichheitszeichen für reversible Zyklen steht. Diese Beziehung gilt entsprechend der obigen Ableitung zunächst nur für ideale Gase. Nach dem 2. Hauptsatz der Wärmelehre gilt sie aber allgemein. 9.2 Der zweite Hauptsatz der Thermodynamik Der 2. Hauptsatz der Thermodynamik (second law of thermodynamics) ist, ebenso wie der 1. Hauptsatz (der Energiesatz), ein Erfahrungssatz. Er ist nur scheinbar komplizierter als der 1. Hauptsatz, da er oft ganz verschieden formuliert wird. Wir werden im Folgenden vier äquivalente Formulierungen kennenlernen. Die einfachste und aus der täglichen Erfahrung unmittelbar ableitbare Formulierung stammt von Rudolf Emanuel Clausius (1822-1888) und lautet: Wärmeenergie geht ohne äußere Beeinflussung stets von dem wärmeren zum kälteren Körper über. Als Ergebnis eines solchen Übergangs von Wärmeenergie erwärmt sich der kältere Körper auf Kosten des wärmeren Körpers, der sich dabei abkühlt, bis eine einheitliche Temperatur, die Mischungstemperatur (mixing temperature), erreicht ist. Zu einer zweiten Formulierung gelangen wir durch die Kopplung einer beliebigen Wärmekraftmaschine (WK) mit einer idealen Wärmepumpe (WP, Carnot-Maschine) entsprechend Abb.55: Die Wärmekraftmaschine nimmt vom heißen Reservoir (T1 ) heißes Reservoir (T1 ) ∆Q1 WK ∆Q’1 ∆W WP (Carnot−Maschine) ∆Q 2 ∆Q’2 Abbildung 55. Kopplung von einer beliebigen Wärmekraftmaschine (WK) mit einer Carnot-Maschine, die hier als Wärmepumpe (WP) betrieben wird, zum Beweis, dass der Wirkungsgrad einer beliebigen Wärmekraftmaschine höchstens gleich dem einer Carnot-Wärmekraftmaschine sein kann kaltes Reservoir (T2 ) die Wärmeenergie Q1 > 0 auf, gibt an das kalte Reservoir (T2 ) die Wärmeenergie 13 Dämpfe und reale Gase Georg Christoph Lichtenberg: Acht Bände hat er geschrieben. Er hätte gewiss besser getan, er hätte acht Bäume gepflanzt oder acht Kinder gezeugt. 13.1 Die Van-der-Waals-Gleichung, Virialentwicklung Als Dampf (vapor), genauer gesagt als gesättigten Dampf (saturated vapor), bezeichnet man das Gas, das sich in einem abgeschlossenen Volumen über einer Flüssigkeit bildet. Ein derartiges Gas heißt auch reales Gas (real gas). Dessen Druck im Gleichgewicht mit der Füssigkeit bei der gegebenen Temperatur heißt Sättigungsdampfdruck. Für Wasserdampf gibt es im Englischen wegen der großen technischen Bedeutung ein eigenes Wort (steam). Ungesättigter Dampf (unsaturated vapor) liegt vor, wenn der Dampfdruck niedriger ist als der Sättigungsdampfdruck. Überhitzter Dampf (superheated vapor) besitzt eine höhere Temperatur als der gesättigte Dampf. Mit Vergrößerung des Volumens bei konstanter Masse (Stoffmenge) erfolgt schließlich der Übergang zum idealen Gas (ideal gas). Den Druck des gesättigten Dampfes bezeichnen wir mit psv , wobei sv an saturated vapor erinnern soll. psv ist stoffspezifisch und hängt von der Temperatur ab, aber nicht vom Volumen. Den dampfförmigen, den flüssigen und den festen Zustand eines Stoffes nennt man seine drei Aggregatzustände (aggregation states). Demgegenüber bezeichnet man als Phasen (phases) homogene Gebiete eines Stoffes, die durch unterschiedliche Anordnung der Teilchen charakterisiert sind. Zu den Phasen zählen also neben den drei Aggregatzuständen evtl. noch verschiedene Modifikationen (polymorphs) des Stoffes im festen Zustand. Beispielsweise sind Graphit und Diamant zwei Modifikationen des festen Kohlenstoffes. In Abb.62 ist das p-V -Diagramm einer bestimmten Stoffmenge (z.B. 1 kg) für den Bereich schematisch dargestellt, in dem nur der gasförmige oder der flüssige oder beide Aggregatzustände auftreten können. Im schräg schraffierten Gebiet liegt der Stoff in diesen beiden Zuständen vor, man spricht von der Koexistenz (coexistence)des flüssigen und des gasförmigen Aggregatzustandes. Demzufolge muss der Druck gleich dem Sättigungsdampfdruck psv und damit unabhängig vom Volumen sein (horizontale Geradenstücke in Abb.62). Im punktierten Gebiet ist das Volumen, das der vorgegebenen Stoffmenge zur Verfügung steht, so klein, dass der Stoff nur im flüssigen Aggregatzustand existieren kann. Dies bedingt einen sehr starken Anstieg des Drucks mit abnehmendem Volumen. Für große Volumina dagegen (V → ∞) erfolgt der Übergang zum idealen Gas, so dass der Druck entsprechend Gl.(161), S.98, umgekehrt proportional zum Volumen abnehmen muss. Oberhalb einer gewissen Temperatur, die man als kritische Temperatur (critical temperature) Tc des Stoffes bezeichnet, gibt es keinen Unterschied mehr zwischen dem flüssigen und dem gasförmigen Aggregatzustand. Der Druck, bei 146 13 Dämpfe und reale Gase p Abbildung 62. Schematische Darstellung des p-V Diagramms eines Stoffes im Bereich flüssig/gasförmig. Der kritische Punkt ist durch den Wendepunkt der Isothermen T4 = Tc mit dem kritischen Druck p = pc und dem kritischen Volumen V = Vc geT6 geben. Wurde das Diagramm T5 für 1 kg des Stoffes aufgenomT 4 = T c men, so ist die kritischen Dichte ρc = 1 kg/Vc pc T1 T 2 Vc T3 V dem das Gebiet der Koexistenz verschwindet, nennt man den kritischen Druck (critical pressure) pc . An dieser Stelle besitzt die Isotherme der kritischen Temperatur einen Wendepunkt. Wenn das p-V -Diagramm für eine Masse m des Stoffes dargestellt wird, ist das zugehörige kritische Volumen (critical volume) Vc mit der kritischen Dichte (critical density) über die Beziehung ρc = m/Vc verknüpft. Am kritischen Punkt wird die Dichte der Flüssigkeit ρliq gleich der Dichte des gesättigten Dampfes ρsv . Die aus Abb.62 entnehmbare Abhängigkeit des Dampfdrucks psv von der Temperatur T ist schematisch in Abb.63 dargestellt. p sv p c Abbildung 63. Dampfdruckkurve entsprechend den horizontalen Geradenstücken im p-V Diagramm von Abb.62 T 1 T2 T 3 T4=Tc T 13.1 Die Van-der-Waals-Gleichung, Virialentwicklung 147 Die Dampfdruckkurve endet bei der kritischen Temperatur Tc , da oberhalb davon kein Unterschied mehr zwischen Flüssigkeit und Dampf besteht. Bei T = Tc wird ρliq = ρsv . Die Tab.29 enthält einige Zahlenwerte für den Dampfdruck von Wasser. Tabelle 29. Der Sättigungsdampfdruck psv des Wassers in kPa für Temperaturen ϑ in °C zwischen 0 °C und der kritischen Temperatur 373,99 °C [LID90]. Man beachte die Umrechnung T /K = ϑ/°C+273,15 ϑ/ °C psv / kPa ϑ/ °C psv / kPa 0 0,01 5 10 15 20 0,61129 0,61173 0,87260 1,2281 1,7056 2,3388 25 50 100 200 300 373,99 3,1690 12,344 101,32 1553,6 8583,8 22064 Eine Flüssigkeit siedet, wenn ihr Dampfdruck gleich dem äußeren Luftdruck ist. Bei dieser Temperatur, die man als Siedetemperatur (boiling point) Tb bezeichnet, muss also die Dampfbildung nicht nur an der Oberfläche, sondern auch im Inneren erfolgen. Es bilden sich die bekannten Blasen, die allerdings bei einer gleichmäßigen Temperaturverteilung nur im oberen Teil der Flüssigkeit auftreten, da in den tieferen Schichten zum äußeren Luftdruck noch der Schweredruck der Flüssigkeit hinzukommt. Unter verringertem Luftdruck siedet die Flüssigkeit schon bei niedrigeren Temperaturen. Dies erklärt, warum man in den Bergen Speisen länger als im Tal kochen muss, bis sie gar sind und weshalb durch Kochen in Drucktöpfen Energie gespart werden kann. Das Sieden unter verringertem Druck wird in der Technik bei der sog. Vakuumdestillation verwendet. In der Tab.30 sind für Wasser, schweres Wasser, Ammoniak, Kohlendioxid und Helium die kritischen Drücke und Temperaturen sowie die Siedetemperaturen für einen äußeren Druck von 101,325 kPa zusammengestellt. Das in Abb.62 dargestellte Verhalten kann näherungsweise durch die empirische vander-Waals-Gleichung (van der Waals equation, Johannes Diderik van der Waals 1837-1923) (p + a (n/V )2 )(V − nb) = nRT (237) beschrieben werden. Hierin bezeichnet p den Druck (in Pa), V das Volumen (in m3 ), T die Temperatur (in K), n die Stoffmenge (in mol) des Gases und R die allgemeine Gaskonstante (R = 8, 314472(15) Jmol−1 K−1 [COD98]), a und b sind die van-derWaals-Konstanten (van der Waals coefficients), für die man einige Zahlenwerte in der Tab.31 findet. 148 13 Dämpfe und reale Gase Tabelle 30. Kritischer Druck pc in MPa, kritische Temperatur in °C (ϑc ) und Siedetemperatur bei einem äußeren Druck von 101,325 kPa in °C (ϑb ) [LID90]. Bei CO2 bezeichnet ϑb die Sublimationstemperatur in °C (s. S.162). Man beachte die Umrechnung T / K = ϑ/ °C + 273,15 Stoff kritischer Druck pc in MPa Wasser (H2 O, water) 22,064 schweres Wasser 21,671 (D2 O, heavy water) Ammoniak 11,4 (NH3 , ammonia) 7,37 Kohlendioxid (CO2 , carbon dioxide) Helium (4 He, helium) 0,227 kritische Temperatur ϑc in °C Siedetemperatur ϑb in °C +373,99 +370,74 +100 +101,42 +132,5 +31 −267, 96 −33, 35 −78, 5 (Sublimation) −268, 93 Zur Interpretation der van-der-Waals-Gleichung vergleichen wir sie mit der Zustandsgleichung des idealen Gases (Gl.(161), S.98). Es folgt pideal = p + a(n/V )2 (238) Videal = V − n b. (239) und Der tatsächliche Druck p ist also um den Term a(n/V )2 , der Binnendruck (internal pressure) genannt wird, kleiner als der des idealen Gases pideal . Die Ursache dafür sind die Anziehungskräfte zwischen den Teilchen, die beim idealen Gas vernachlässigt werden. Andererseits folgt aus Gl.(239), dass das tatsächliche Volumen V um den als Kovolumen (internal volume) bezeichneten Term nb größer ist als das Volumen des idealen Gases Videal . Dies wird verständlich, da beim idealen Gas angenommen wurde, dass die Teilchen kein Eigenvolumen besitzen, sondern punktförmig sind. Der näherungsweise Charakter der van-der-Waals-Gleichung (Gl.(237)) äußert sich darin, dass sie das Verhalten im Gebiet der Koexistenz der beiden Aggregatzustände (schräg schraffiertes Gebiet in Abb.62, S.146) nicht richtig widergibt. In Abb.64 sind Tabelle 31. Van-der-Waals-Konstanten für Kohlendioxid, Wasser und Wasserstoff [LID90] Stoff a/ Pa m6 mol−2 b / m3 mol−1 Kohlendioxid (CO2 , carbon dioxide) Wasser (H2 O, water) Wasserstoff (H2 , hydrogen) 0,364 0,554 0,0248 4, 267 · 10−5 3, 049 · 10−5 2, 661 · 10−5 13.1 Die Van-der-Waals-Gleichung, Virialentwicklung 149 die nach Gl.(237) für 1 Mol Wasser unter Verwendung der van-der-Waals-Konstanten nach Tab.31 berechneten Isothermen dargestellt. A 59 Abbildung 64. Isothermen für 1 Mol Wasser berechnet nach der van-der-WaalsGleichung (s.Gl.(237)) und unter Verwendung der Zahlenwerte von Tab.31. T1 = 500 K, T2 = 550 K, T3 = 600 K, Tc ≈ 647 K, T4 = 700 K Man erkennt, dass die Ergebnisse im Gebiet der Koexistenz nicht richtig sein können. Einerseits sind negative Werte für den Druck physikalisch unsinnig und andererseits findet man experimentell auch nicht den S-förmigen Kurvenverlauf. Dieser Kurve kann man aber den Sättigungsdampfdruck psv , also die Ordinate des horizontalen Stückes des tatsächlichen Kurvenverlaufs (s.Abb.62, S.146) entnehmen, indem man eine horizontale Gerade für die betreffende Isotherme so zieht, dass der Inhalt der von der Horizontalen und dem oberen Schleifenstück begrenzten Fläche gleich dem Inhalt der Fläche zwischen der Horizontalen und dem unteren Schleifenstück ist (Maxwell-Konstruktion, Maxwell construction). Geringe Teile der von der van-der-Waals-Gleichung gelieferten S-förmigen Schleife können bei entsprechender Sorgfalt (Beobachtung von labilen Zuständen) experimentell realisiert werden: Wenn bei Verringerung des Volumens infolge einer Abwesenheit von Kondensationskeimen keine Flüssigkeitsausscheidung (Tröpfchenbildung) stattfindet, kann das Gas einen höheren Druck als den Sättigungsdampfdruck annehmen (übersättigter Dampf, supersaturated vapor). Andererseits kann sich eine Flüssigkeit unter einem geringeren Druck als dem Sättigungsdampfdruck befinden, ohne zu sieden (Siedeverzug, delay in boiling). Allerdings sind diese Zustände labil. Bei Gültigkeit der van-der-Waals-Gleichung lassen sich das kritische Volumen Vc und die kritische Temperatur Tc in einfacher Weise aus der Stoffmenge n, der Gaskonstanten R und den van-der-Waals-Konstanten a und b berechnen. 150 13 Dämpfe und reale Gase Die Differentiation der van-der-Waals-Gleichung (Gl.(237), S.147) p = nRT (V − nb)−1 − a(n/V )2 nach dem Volumen liefert dp/dV = −nRT (V − nb)−2 + 2an2 V −3 . Nullsetzen dieser Ableitung gibt die 1. Bedingung (V −nb)2 (RT )−1 = V 3 (2an)−1 . Damit es sich um einen Wendepunkt handelt, muss auch die 2. Ableitung d2 p/dV 2 = 2nRT (V − nb)−3 − 6an2 V −4 verschwinden. Die daraus folgende 2. Bedingung (V −nb)3 (RT )−1 = V 4 (3an)−1 dividieren wir durch die erste, womit sich V = Vc = 3nb ergibt. Dieses Ergebnis setzen wir in die 1. Bedingung ein und erhalten schließlich T = Tc = 8a/(27bR). Neben der van-der-Waals-Gleichung gibt es noch zahlreiche andere Möglichkeiten, das Verhalten realer Gase analytisch zu beschreiben. Eine allgemeine besteht darin, den Druck durch eine Reihenentwicklung nach dem Quotienten n/V darzustellen: p= nRT 1 + A(T ) (n/V ) + B(T ) (n/V )2 + ... . V (240) Man bezeichnet dies als Virialentwicklung (virial expansion) und die Koeffizienten A(T ) ,B(T ) usw. als Virialkoeffizienten (virial coefficients). Sie hängen nur von der Temperatur ab und sind charakteristische Größen des betreffenden Gases. Die Temperatur, für die der erste Virialkoeffizient verschwindet, nennt man die BoyleTemperatur (Boyle temperature, Robert Boyle 1627-1691) TB . Bei dieser Temperatur kann das reale Gas noch am ehesten durch die Zustandsgleichung des idealen Gases (Gl.(161), S.98) beschrieben werden. Für Wasser ergibt sich, wenn man die Gültigkeit der van-der-Waals-Gleichung voraussetzt, TB = 2185 K. A 60 Ü 68 Schreibt man die van-der-Waals-Gleichung (Gl.(237), S.147) in der Form p = nRT V −1 (1 − nb/V )−1 − a(n/V )2 , so liefert die Entwicklung des ersten Summanden p = nRT V −1 [1 + nb/V + (nb/V )2 + ...] − nRT V −1 [an/(RT V )] oder p = nRT V −1 [1 + (b − a/RT )(n/V ) + b2 (n/V )2 + ...], woraus man durch Vergleich mit der Virialentwicklung (Gl.(240)) A(T ) = b − a/RT und B(T ) = b2 erhält. Die erste Gleichung liefert für die Boyle-Temperatur TB = a/Rb. 13.2 Der Joule-Thomson-Effekt Die Anziehungskräfte zwischen den Teilchen eines realen Gases (Term a in der vander-Waals-Gleichung, Gl.(237), S.147) und ihre Eigenvolumina (Term b) sind die Ursache für den Joule-Thomson-Effekt (Joule-Thomson effect, James Prescott Joule 1818-1889, William Thomson = Lord Kelvin 1824-1907), der bei der Kühlung und Gasverflüssigung eine wichtige Anwendung gefunden hat. Das reale Gas wird von dem Kolben 1 mit dem konstanten Anfangsdruck p1 und bei einer Anfangstemperatur T1 durch eine gedrosselte Leitung (z.B. eine Düse oder ein Rohrstück mit einem Wattepfropfen) hindurchgepresst. Auf der anderen Seite wird der Druck p2 < p1 durch Verschiebung des Kolbens 2 aufrecht erhalten (s.Abb.65). Unter der 180 16 Elektrische Gleichfelder (Elektrostatik) ~ und die Ladung −Q eine gleich Die Ladung +Q erfährt eine Kraft EQ in Richtung von E große, aber entgegengesetzt gerichtete Kraft. Für den Betrag des dadurch erzeugten ~ · |~ p| sin ϑ, wobei Drehmoments (s.S.40) folgt also EQ(`/2) sin ϑ + EQ(`/2) sin ϑ oder |E| ϑ den Winkel zwischen der Richtung des Dipolmoments und der elektrischen Feldstärke bezeichnet. Da das Drehmoment in die Abbildungsebene hineingerichtet ist (Rechtsschraube), kann man auf Grund der Definition des Vektorproduktes (s.S.11) schreiben ~ Um den elektrischen Dipol aus der senkrechten Richtung zu E ~ in die um den T~ = p ~ × E. Winkel ϑ geneigte Richtung zu drehen, muss die Ladung +Q um die Strecke (`/2) cos ϑ ~ bewegt werden. Dies führt zu einer Abnahme der in Richtung der wirkenden Kraft QE potentiellen Energie um den Betrag EQ(`/2) cos ϑ. Ein gleichgroßer Term ergibt sich für die mit der Drehung verbundene Bewegung der Ladung −Q, so dass man - auf Grund der Definition des skalaren Produktes (s.S.21) - für die potentielle Energie des Dipols ~ schreiben kann. bezüglich seiner senkrechten Orientierung Wpot = −~ p·E Ü 87 16.6 Dielektrika Wir beginnen mit zwei Experimenten: Ein idealer Plattenkondensator habe im Vakuum die Kapazität Cv . Im ersten Experiment bringen wir auf diesen Kondensator die Ladung Qv . Dies bedeutet, dass die eine Platte die Ladung +Qv und die andere die Ladung −Qv erhält. Dann messen wir die Spannung, für die gemäß Gl.(270), S.172, Uv = Qv /Cv gelten muss. Nach Ausfüllung des Raumes zwischen den beiden Platten mit einem isolierenden Stoff, den man als Dielektrikum (dielectric) bezeichnet, verringert sich die Spannung auf U < Uv . Im zweiten Experiment legen wir an die Platten des Kondensators eine konstante Spannung Uv an und messen die von ihm gespeicherte Ladung. Im Vakuum muss nach Gl.(270), S.172, Qv = Cv Uv gelten. Nach Ausfüllung mit dem Dielektrikum erhöht sich die Ladung auf Q > Qv , und zwar um den gleichen Faktor, um den die Spannung im ersten Experiment abnahm. Diese experimentellen Befunde lassen sich dadurch erklären, dass das Dielektrikum die Kapazität des Kondensators vergrößert. Man schreibt C = εr Cv , (284) wobei εr ≥ 1 die relative Dielektrizitätskonstante oder Permittivitätszahl oder Dielektrizitätszahl (permittivity oder dielectric constant) des Materials ist, sofern dieses den gesamten Feldraum ausfüllt. Einige Zahlenwerte sind in Tab.36 zusammengestellt. A 68 A 69 Wenn das elektrische Feld, das auf das Dielektrikum einwirkt, zeitlich periodisch ist, so hängt εr von der Frequenz f ab, d.h. es gilt εr = εr (f ). Für Stoffe, die aus polaren Molekülen bestehen, wie z.B. Wasser, tritt die Frequenzabhängigkeit bereits im 16.6 Dielektrika 181 Tabelle 36. Experimentelle Werte für die relative Dielektrizitätkonstante εr einiger Stoffe [LID90]. ϑ bezeichnet die Temperatur in °C. Man beachte die Umrechnung T /K = ϑ/°C+273,15 Stoff Polystyrol (polystyrene) Silizium (Si, silicon) Germanium (Ge, germanium) Wasser (H2 O, water) Methanol (CH3 OH, methanol) Benzol (C6 H6 , benzene) Stickstoff (N2 , nitrogen) 0,1 MPa Sauerstoff (O2 , oxygen) 0,1 MPa Luft (dry air, CO2 free) 0,1 MPa ϑ/ °C 25 20 20 0 20 60 100 20 25 20 25 20 20 20 εr 2, 55 ± 0, 01 11,8 16,0 87,90 80,20 66,73 55,51 33,62 32,63 2,284 2,274 1,000547 1,000495 1,000537 MHz-Bereich auf und führt zu einer monotonen Abnahme von εr . So verringert sich die relative Dielektrizitätskonstante des Wassers auf ca. 1,8, wenn man zu Frequenzen von der Größenordnung 1014 Hertz (Frequenzbereich des Lichtes, s.S.289) übergeht. Die Ursache dafür wird auf S.187 behandelt. Abgesehen von dieser monotonen Abnahme findet man noch bei allen Stoffen oberhalb von ca. 1012 Hz Bereiche, in denen εr eine charakteristische Frequenzabhängigkeit zeigt, wie sie schematisch in der oberen Abbildung von √ Abb.156, S.316, für die Größe n ∝ εr dargestellt ist. Die Ursachen dafür werden auf S.187 erläutert. Die Werte in Tab.36 gelten für f → 0. Für die Verringerung der elektrischen Spannung im ersten Experiment gilt gemäß Gl.(284) U/Uv = 1/εr . Dies bedeutet, dass auch die elektrische Feldstärke um den Faktor 1/εr verringert wird. Die Ursache dafür sind Ladungen, die an der Oberfläche des Dielektrikums durch das Anlegen des elektrischen Feldes erzeugt werden und die man Polarisationsladungen (polarization charges) nennt. Im Gegensatz dazu bezeichnet man die Ladungen auf den Kondensatorplatten (hier Qv ) als freie Ladungen (free charges). Die Größe Qp der Polarisationsladungen ergibt sich aus der Bedingung Qv − Qp = Qv /εr (s.Abb.80) zu Qp = Qv (1 − 1/εr ). (285) Man beachte, dass diese Gleichung nur für einen idealen Plattenkondensator (s.Abb.74, S.173) gilt, der vollständig mit dem Dielektrikum ausgefüllt ist. 182 z 16 Elektrische Gleichfelder (Elektrostatik) −Qv +Q p −Qp +Q v Abbildung 80. Die auf der Oberfläche des Dielektrikums durch Polarisation erzeugten Ladungen Qp sind die Ursache für die Verringerung der elektrischen Feldstärke im Inneren des Dielektrikums Polarisationsladungen in einem Leiter lassen sich experimentell leicht nachweisen, indem man zwei sich berührende Leiterplatten in das elektrische Feld bringt und so orientiert, dass die Platten senkrecht zur elektrischen Feldstärke stehen. Nach Trennung der beiden Platten im Feld sitzt dann auf der einen Platte die Polarisationsladung Qp und auf der anderen −Qp . Sind die Platten mit gut isolierenden Griffen versehen, so kann man die Ladungen mühelos aus dem Feld herausbringen und anschließend messen. Wenn das Feld von einem idealen Plattenkondensator herrührt, auf den die Ladung Qv gebracht wurde (1. Experiment von S.180), so muss Qp = Qv gelten, da im Inneren eines Leiters kein elektrisches Feld existieren darf. Dies bedeutet gemäß Gl.(285), dass die (statische) relative Dielektrizitätskonstante eines Leiters unendlich ist. Das durch die Ladungen Qp im Dielektrikum erzeugte Dipolmoment pro Volumen, d.h. die Größe Qp `/(A`), nennt man elektrische Polarisation (electric polarization). Da die Richtung des Dipolmomentes von der negativen zur positiven Ladung (s.S.178) festgelegt wurde, kann man die elektrische Polarisation als Vektor P~ definieren und man erhält nach einer kleinen Zwischenrechnung ~ P~ = ε0 (εr − 1)E. (286) Für den Betrag der elektrischen Polarisation gilt definitionsgemäß P = Qp `/(A`), woraus mit Gl.(285) und unter Verwendung der Beziehung Qv = ε0 AEv (s. den kleingedruckten Text nach Gl.(273) auf S.175) folgt P = ε0 Ev (1 − 1/εr ). Die Ersetzung von Ev durch εr E schließlich liefert die gesuchte Gl.(286). Die Größe εr − 1 wird elektrische Suszeptibilität (electric susceptibility) χe genannt. Die früher übliche cgs-Suszeptibilität (cgs susceptibility), für die wir κe schreiben, wurde durch die Beziehung κe = (εr −1)/(4π) definiert, so dass χe = 4πκe 16.6 Dielektrika 183 gilt. Korrekterweise muss man χe und entsprechend auch κe als Volumensuszeptibilitäten bezeichnen, da P~ als Dipolmoment pro Volumen definiert ist. Die Definitionen der Massensuszeptibilität (mass susceptibility) und der molaren Suszeptibilität (molar susceptibility) kann man der Tab.37 entnehmen. Tabelle 37. Die drei verschiedenen elektrischen Suszeptibilitäten Bezeichnung Definition Einheit Volumensuszeptibilität χe = εr − 1 Massensuszeptibilität χe, ma = χe /ρ (Dichte ρ) m3 / kg molare Suszeptibilität χe, mo = χe M/ρ (molare Masse M ) m3 / mol 1 Die Unterscheidung in freie Ladungen und Polarisationsladungen macht es notwendig, darauf hinzuweisen, dass die Größe Q im verallgemeinerten Coulomb-Gesetz (s.Gl.(272), S.174) nur die freien Ladungen bezeichnet, die sich innerhalb der geschlossenen Fläche befinden, denn diese sind die Ursache der elektrischen Erregung des leeren Raumes und der Polarisation der Dielektrika. Führt man den als elektrische Flussdichte oder elektrische Verschiebung (electric displacement) bezeichneten Vektor ~ = εr ε 0 E ~ D ein, so erhält das verallgemeinerte Coulomb-Gesetz die einfache Form I ~ · d~a = Q. D (287) (288) (A) ~ durch die Oberfläche (A), Diese Gleichung besagt, dass der Fluss des Vektors D die das Volumen mit der freien Ladung Q umfasst, unabhängig davon ist, ob und in welcher Verteilung Dielektrika den Raum erfüllen. Der analoge Fluss der elektrischen Feldstärke dagegen wird wegen Gl.(287) auch durch die Dielektrika und damit auch durch die Polarisationsladungen bestimmt. ~ gemäß der Definition (s.Gl.(265), S.169) Während man die elektrische Feldstärke E ~ durch die Kraft auf eine Punktladung ermitteln kann, muss man zur Messung von D die Gl.(288) verwenden, da diese die elektrische Flussdichte mit einer direkt messbaren Größe, nämlich der elektrischen Ladung, verknüpft: Wir bringen an die betreffende Stel~ gemessen werden soll, zwei sich berührende Leiterplatten gleicher Größe le, an der D (Fläche A) und messen, wie im kleingedruckten Text auf S.182 beschrieben, die Ladung Qp für verschiedene Orientierungen. Die Normale zu derjenigen Orientierung der Plat~ an. Der Betrag von D ~ folgt ten, für die Qp maximal wird, gibt dann die Richtung von D 184 16 Elektrische Gleichfelder (Elektrostatik) aus Gl.(288) zu Qp,max /A, indem wir mit dem Integral die Platte umschließen, die die Ladung +Qp,max trägt. Aus Gl.(288) folgt die wichtige Tatsache, dass die senkrechte Komponente D⊥ der elektrischen Flussdichte stetig durch eine Grenzfläche zwischen Stoffen mit unterschiedlichen relativen Dielektrizitätskonstanten (εr1 und εr2 ) hindurchgeht. Damit folgt aber aus Gl.(287), dass sich die senkrechte Komponente der elektrischen Feldstärke E⊥ beim Übergang von 1 nach 2 sprunghaft um den Faktor εr1 /εr2 ändern muss. Für die zur Grenzfläche parallelen Komponenten dagegen gilt das Umgekehrte: Ek geht stetig hindurch, während Dk springt. Zum Beweis füllen wir die linke Hälfte eines idealen Plattenkondensators, an den eine konstante Spannung U angelegt wird (s.Abb.74, S.173), mit einem Dielektrikum der relativen Dielektrizitätskonstante εr1 aus und die rechte Hälfte mit εr2 . Die elektrische Feldstärke verläuft damit parallel zur Grenzfläche. Da andererseits die elektrische Feldstärke in beiden Hälften den gleichen Wert, nämlich U/` besitzen muss, geht Ek stetig durch die Grenzfläche hindurch, während nach Gl.(287) Dk links den Wert εr1 ε0 U/` und rechts den Wert εr2 ε0 U/` besitzen muss, was bedeutet, dass Dk beim Durchgang durch die Grenzfläche von 1 nach 2 um den Faktor εr2 /εr1 springt. Unter Verwendung dieser Aussagen ergibt sich aus Abb.81 die Beziehung tan α1 εr1 = , tan α2 εr2 E1 E1 α1 E1|| (289) 1 E 2|| E2 α2 E2 2 Abbildung 81. Zum Brechungsgesetz für elektrische Feldlinien beim Übergang von einem Dielektrikum (1) zu einem anderen (2) 16.6 Dielektrika 185 die man als Brechungsgesetz für elektrische Feldlinien (law of refraction for electric field lines) bezeichnet. Vom Snellius’schen Brechungsgesetz (Snell’s law) für Lichtstrahlen (Gl.(446), s.S.305) unterscheidet es sich dadurch, dass der Tangens an Stelle des Sinus und die relative Dielektrizitätskonstante εr an Stelle des Brechungsindexes n steht und dass die Indizes auf der rechten Seite nicht vertauscht sind. Aus Abb.81 liest man ab tan α1 = E1k /E1⊥ und tan α2 = E2k /E2⊥ . Wegen E1k = E2k folgt durch Division tan α1 / tan α2 = E2⊥ /E1⊥ . Ersetzt man hier noch E⊥ durch D⊥ /εr ε0 (s.Gl.(287), S.183) und beachtet die Stetigkeitsbedingung D2⊥ = D1⊥ , so ergibt sich die Gl.(289). Wir kommen nun zurück zu dem Experiment, das auf S.180 beschrieben wurde. Durch Ausfüllen des Raumes zwischen den beiden Platten eines idealen Plattenkondensators mit einem isolierenden Stoff der relativen Dielektrizitätskonstante εr ~ v = (Uv /`)~ez auf (s.Abb.80, S.182) verringert sich die elektrische Feldstärke von E ~ ~ E = Ev /εr . Einsetzen dieser Beziehung in die Gl.(286), S.182, gibt ~ =E ~ v − P~ /ε0 . E (290) Der zweite Summand auf der rechten Seite dieser Gleichung beschreibt die feldschwächende Wirkung der Polarisationsladungen Qp . Allerdings gilt Gl.(290) nur unter der Voraussetzung, dass das Dielektrikum den gesamten Raum ausfüllt. Für ~ als auch P~ vom betracheine beliebige Verteilung des Dielektrikums hängt sowohl E teten Ort im Dielektrikum ab und es lässt sich keine zu Gl.(290) analoge Beziehung aufschreiben. In all den Fällen aber, bei denen man das vom Dielektrikum ausgefüllte ~ und P~ innerhalb Raumgebiet durch ein Rotationsellipsoid annähern kann, hängen E des Dielektrikums nicht vom Ort ab (sie sind homogen). Für den Fall, dass die Sym~ v gerichtet ist, gilt metrieachse ~a des Rotationsellipsoids parallel oder senkrecht zu E [SOM49] ~ =E ~ v − N P~ /ε0 . E (291) N ist der Entelektrisierungsfaktor (depolarization factor), für den Zahlenwerte in Tab.38 angegeben sind. Für einen Rundstab, der parallel zum elektrischen Feld ~ v orientiert ist, ergibt sich also N = 0 und für die senkrechte Anordnung N = 1/2. E Durch Einsetzen von Gl.(286), S.182, in Gl.(291) folgt ~ = E ~v E , 1 + (εr − 1)N woraus man ersieht, dass der Feldschwächungsfaktor 1/[1 + (εr − 1)N ] ist. (292) 186 16 Elektrische Gleichfelder (Elektrostatik) Tabelle 38. Entelektrisierungsfaktor N für Rotationsellipsoide mit dem Achsenverhältnis a/b, wobei a die Länge der Rotationsachse und b den Durchmesser des Rotationsellipsoids senkrecht dazu bezeichnet. Die Formeln für beliebige Werte von a/b findet man bei [SOM49] Achsenverhältnis a/b des Rotationsellipsoids Rotationsachse a parallel zum elektrischen Feld Rotationsachse a senkrecht zum elektrischen Feld a/b = ∞ (Rundstab) a/b 1 a/b = 1 (Kugel) a/b 1 a/b = 0 (Kreisscheibe) 0 (a/b)−2 ln(2a/b) 1/3 1 − (π/2)(a/b) 1 1/2 1/2[1 − (a/b)−2 ln(2a/b) 1/3 (π/4)(a/b) 0 Nach Tab.38 besitzt ein dielektrischer Stab mit kreisförmigem Querschnitt (Rundstab) in einem elektrischen Feld bei paralleler Orientierung ein um den Faktor 1 + (εr − 1)/2 mal größeres elektrisches Dipolmoment als bei senkrechter Stellung. Dies entspricht einer um den gleichen Faktor verringerten potentiellen Energie (s.Gl.(283), S.179, mit cos ϑ = 1), weshalb sich ein solcher Stab bei drehbarer Aufhängung parallel zum elektrischen Feld einstellt. A 70 A 71 A 72 A 73 Je nach dem Mechanismus für das Entstehen der Polarisationsladungen spricht man von Verschiebungspolarisation (displacement polarization) oder Orientierungspolarisation (orientation polarization). Die Verschiebungspolarisation tritt bei allen Stoffen auf, während die Orientierungspolarisation noch bei denjenigen Stoffen hinzukommt, die aus polaren Molekülen aufgebaut sind. Zur Verschiebungspolarisation: In isotropen Medien werden durch Anlegen eines ~ die positiv geladenen Atomkerne gegenüber den Elektroelektrischen Feldes E nenhüllen der Atome oder Moleküle in Richtung dieses elektrischen Feldes verschoben, so dass ein elektrisches Dipolmoment p~α entsteht, für das man ~ p~α = αE (293) schreiben kann. α besitzt die Einheit Asm2 /V und heißt Polarisierbarkeit (polarizability) des betreffenden Atoms bzw. Moleküls. Für die elektrische Polarisation P~ ergibt sich, wenn cα die Konzentration der Teilchen mit der Polarisierbarkeit α ist, gemäß der Definition von S.182, ~ P~ = cα αE. (294) Die Konzentration cα berechnet sich aus der molaren Masse Mα und der Dichte ρα des Stoffes unter Verwendung der Anzahl der Teilchen in einem Mol (AvogadroKonstante NA ) zu cα = NA ρα /Mα . Ein Vergleich der Gln.(294) und (286), S.182, liefert die Beziehung εr − 1 = αcα /ε0 . Dies ist aber nur für verdünnte Systeme 16.6 Dielektrika 187 richtig, bei denen das von den Nachbardipolen erzeugte elektrische Feld am Ort des ~ ist. Die betrachteten Dipols klein gegen das von außen angelegte elektrische Feld E Berücksichtigung dieser Wechselwirkung (s. z.B. [GRE84]) führt zu der Beziehung cα εr − 1 = α. εr + 2 3ε0 (295) Sie wird Clausius-Mosotti-Gleichung (Clausius-Mosotti equation) genannt, da Rudolf Emanuel Clausius (1822-1888) und Ottaviano Fabricio Mosotti (1791-1863) halbempirisch einen Zusammenhang zwischen dem Quotienten (εr − 1)/(εr + 2) und molekularen Konstanten gefunden hatten. Die Gl.(295) geht für verdünnte Systeme (εr ≈ 1) in die obige Näherungsformel εr − 1 = αcα /ε0 über. Die Orientierungspolarisation kommt hinzu, wenn einige Teilchen ein permanentes elektrisches Dipolmoment p~ besitzen. Da die Orientierung dieser Dipolmomente zwei konkurrierenden Einflüssen unterliegt, nämlich der ausrichtenden Wirkung des elektrischen Feldes und der destruktiven Wirkung der thermischen Bewegung, ergibt sich auf Grund der Boltzmann-Verteilung (s.S.103) ein effektives elektrisches ~ der Größe Dipolmoment in Richtung von E p~eff = p2 ~ E. 3kT (296) Für die Wahrscheinlichkeitsdichte der potentiellen Energie Epot gilt (s.Gl.(171), S.103) P (Epot ) = G(Epot ) exp(−Epot /kT ), wobei G(Epot ) das statistische Gewicht der Energie ~ und bezeichnet. Für Epot ist die Größe −Ep cos ϑ mit ϑ als dem Winkel zwischen E p ~ einzusetzen (s.Gl.(283), S.179). Aus G(Epot )dEpot = G(ϑ)dϑ mit G(Epot ) = K ergibt sich G(ϑ) = KpE R π sin ϑ für das statistische Gewicht von ϑ. Die Konstante K folgt aus der RBedingung 0 G(ϑ)dϑ = 1 zu K = (2pE)−1 . Damit erhält man die Beziehung π peff = 0 (p cos ϑ)(1/2) sin ϑ exp [(pE/kT ) cos ϑ] dϑ oder, unter der bei nicht zu tiefen Temperaturen gut erfüllten Näherung exp[(pE/kT ) cos ϑ] ≈ 1 + (pE/kT ) cos ϑ, die Gl.(296). Eine analoge Behandlung wie nach Gl.(293) führt dann in Erweiterung von Gl.(295) zur Debye-Gleichung (Debye equation, Peter Debye 1884-1966) cα εr − 1 p2 = α + (cp /cα ) , (297) εr + 2 3ε0 3kT wobei cp die Konzentration der Teilchen mit permanentem Dipolmoment bezeichnet. Die Ausrichtung eines polaren Moleküls nach Anlegen eines elektrischen Feldes erfolgt nicht momentan, sondern mit einer gewissen Zeitverzögerung. Die Zeitkonstante heißt dielektrische Relaxationszeit (dielectric relaxation time). Wegen der Zeitverzögerung verringert sich der Beitrag der Orientierungspolarisation mit wachsender Frequenz und 188 16 Elektrische Gleichfelder (Elektrostatik) verschwindet schließlich vollständig. Dies ist die Ursache für die auf S.181 erwähnte Frequenzabhängigkeit der relativen Dielektrizitätskonstante. Ü 88 Ü 89 Ü 90 Ü 91 218 18 Magnetfelder Für die Induktivität eines geraden zylindrischen Leiterstücks mit dem Radius R und der Länge ` ergibt sich unter den Voraussetzungen ` R und µr = 1 die Beziehung [PFE77] L = µ0 (2π)−1 ` [ln(2`/R) − 0, 75]. Dies bedeutet, dass ein Drahtstück der Länge ` = 0, 01 m und mit einem Radius R = 5 · 10−4 m eine Induktivität von ca. 6 nH besitzt. Ü 108 Ü 109 Ü 110 A 83 18.4 Magnetostatik Bringt man Materie in ein Magnetfeld, so werden in den Elektronenhüllen der Atome und Moleküle innere Ströme (internal currents, s.Abb.102 und S.393) induziert, die nach der Lenz’schen Regel (s.S.208) das erzeugende Magnetfeld schwächen. Diese Erscheinung nennt man Diamagnetismus (diamagnetism). Im Gegensatz dazu nennen wir die bisher behandelten Ströme (s.Abschn.17, S.189ff.), die durch elektrische Leiter geführt und mit Amperemetern gemessen werden können, freie Ströme (free currents). Während die freien Ströme auf Grund des Durchflutungsgesetzes (s.Gl.(317), S.201) unmittelbar die Wirbel (s. die Legende zu Abb.93 auf S.201) ~ an einem beliebigen Ort ~r liefern, werden die Wirder magnetischen Feldstärke H ~ an diesem Ort sowohl von den freien als auch bel der magnetischen Flussdichte B von den inneren Strömen und damit von der relativen Permeablilität µr des Stoffes und ihrer Verteilung im Raum bestimmt. Dies ist analog zur Elektrostatik, wo die freien Ladungen Q gemäß dem verallgemeinerten Coulomb-Gesetz (Gl.(290), S.185) Abbildung 102. Innere Ströme in einem zylinderförmigen Stück Materie, die nach Anlegen eines Magnetfeldes, das in die Zeichenebene hinein gerichtet ist, senkrecht zum Querschnitt induziert werden. Die Ströme gleichen sich im Inneren aus, da an jeder Trennungsfläche beiderseits entgegengesetzt gleich große Ströme fließen. Damit bleibt nur an der Oberfläche ein effektiver Kreisstrom übrig, der rings um den Zylinder fließt ~ r) sind, während die Quellen der elekdie Quellen der elektrischen Flussdichte D(~ ~ trischen Feldstärke E(~r) durch die freien Ladungen und die Polarisationsladungen 18.4 Magnetostatik 219 und damit durch die relative Dielektrizitätskonstante εr des Stoffes und ihre Verteilung im Raum bestimmt werden. Da außerdem die elektrische Kraftwirkung durch ~ (s.Gl.(265), S.169) und die magnetische Kraftwirkung die elektrische Feldstärke E ~ (s.Gl.(324), S.210) bestimmt wird, ergibt sich durch die magnetische Flussdichte B die physikalische Analogie (physical analogy) der Tab.43. Tabelle 43. Physikalische Analogie zwischen elektrischen und magnetischen Größen Elektrische Größen Magnetische Größen ~ elektrische Feldstärke E ~ elektrische Flussdichte D ~ magnetische Flussdichte B ~ magnetische Feldstärke H ~ = εr ε 0 E ~ = µr µ0 H ~ (s.Gl.(288), S.183) und B ~ Andererseits legen die Beziehungen D (s.Gl.(319), S.203) die in der Tab.44 aufgelistete formale Analogie (formal analogy) nahe. Tabelle 44. Formale Analogie zwischen elektrischen und magnetischen Größen Elektrische Größen Magnetische Größen Einheit V/m Symbol ~ H Einheit Feldstärke Symbol ~ E Flussdichte ~ = ε0 E ~ +P ~e D As/m2 ~ = µ0 H ~ +P ~m B Vs/m2 Influenz- bzw. Induktionskonstante ε0 As/Vm µ0 Vs/Am relative Dielektrizitätskonstante bzw. relative Permeabilität εr ~ = εr ε0 E) ~ (D 1 µr ~ = µr µ0 H) ~ (B 1 Suszeptibilität χe = εr − 1 ~e P ~e = χe ε0 E) ~ (P 1 χm = µr − 1 ~m P ~m = χm µ0 H) ~ (P ~ = χm H ~ M 1 Bezeichnung Polarisation Magnetisierung (magnetization) - As/m2 - A/m Vs/m2 A/m Mit dieser Tabelle lassen sich Formeln, die in der Elektrostatik (s.Abschn.16, S.166ff.) abgeleitet wurden, einfach auf den magnetischen Fall übertragen. Einige Beispiele sind in der Tab.45 zusammengestellt. In der vorletzten Zeile dieser Tabelle tritt der gleiche Faktor N bei der elektrischen und der magnetischen Feldstärke auf. Er wird deshalb sowohl Entelektrisierungsfaktor als auch Entmagnetisierungsfaktor (demagnetization factor) genannt. Zahlenwerte findet man in der Tab.38, S.186. Beim magnetischen Analogon zum verallgemeinerten Coulomb-Gesetz (letzte Spalte in Tab.45) 220 18 Magnetfelder Tabelle 45. Analogien zwischen Formeln der Elektrostatik und der Magnetostatik Energiedichte des Feldes Stetigkeit der Feldgrößen an Grenzflächen Schwächung des Feldes durch Polarisation der Materie Oberflächenintegral der Flussdichte Elektrostatik RD 0 ~ · dD ~0 E 0 (s.Gl.(278), S.177), bzw. für εr = const: ~ · D ~ /2 E (s.Gl.(279), S.177) Magnetostatik RB 0 ~ · dB ~0 H D⊥ , Ek (s.S.184) ~ =E ~v − NP ~e /ε0 E (s.Gl.(291), S.185) H ~ · d~s = Q D (s.Gl.(272), S.174) B⊥ , Hk I ~ · d~a = 0 B 0 bzw. für µr = const: ~ · B ~ /2 H ~ =H ~ v − NP ~m /µ0 H H ~ · d~s = 0 B (339) (A) steht auf der rechten Seite null, da es bis heute trotz intensiver Anstrengungen (noch?) nicht gelungen ist, magnetische Ladungen (magnetic charges), die auch magnetische Monopole (magnetic monopoles) genannt werden, experimentell nachzuweisen. n I Abbildung 103. Zur Berechnung der Anziehungskraft eines Elektromagneten. A ist die Querschnittsfläche des Eisenjochs und `Lu die Dicke des Luftspaltes F A Lu Als Beispiel für die Anwendung der Tatsache, dass B⊥ stetig durch eine Grenzfläche geht, wollen wir die Anziehungskraft eines Elektromagneten (electromagnet, s.Abb.103) berechnen. Der Luftspalt `Lu sei klein gegen die Wurzel aus der Querschnittsfläche A des Eisenjochs (`Lu A1/2 ) und die relative Permeabilität 18.4 Magnetostatik 221 des Eisens µr groß gegen 1, so dass das magnetische Streufeld vernachlässigt werden kann. Dann folgt für die Anziehungskraft F = µ0 µr nI `µ + 2µr `Lu 2 A, (340) wobei n die Windungszahl der Feldspule, I den Feldstrom und `µ die Weglänge der magnetischen Feldlinien im Eisen bezeichnet. Aus dem Durchflutungsgesetz (s.Gl.(317), S.201) folgt Hµ `µ + 2HLu `Lu = nI, wobei Hµ die magnetische Feldstärke im Eisen und HLu die magnetische Feldstärke im Luftspalt ist. Wegen der Stetigkeit von B⊥ gilt Bµ = BLu oder (s.Gl.(319), S.203) Hµ = HLu /µr . Setzen wir dies in die Gleichung Hµ `µ + 2HLu `Lu = nI ein, so ergibt sich HLu = µr nI/(`µ + 2µr `Lu ). Die Energie des magnetischen Feldes in den beiden Luftspalten wird damit zu (s.Tab.45) Em,Lu = 2`Lu A(µ0 /2)[µr nI/(`µ +2µr `Lu )]2 . Für die Energie des Magnetfeldes im Eisen erhalten wir Em,µ = `µ Aµ0 µr [nI/(`µ +2µr `Lu )]2 /2, so dass sich für die Gesamtenergie des Magnetfeldes Em = Em,Lu + Em,µ = (A/2)µ0 µr (nI)2 /(`µ + 2µr `Lu ) ergibt. Damit folgt für die Kraft F = −dEm /d`Lu = Aµ0 (µr nI)2 (`µ + 2µr `Lu )−2 . Für n = 200, I = 10 A, `µ = 0, 25 m, A = 2 · 10−4 m2 , µr = 300 und `Lu = 0 beträgt somit die Anziehungskraft F = 1448 N. Bei einem Luftspalt von nur 1 mm verringert sich dieser Wert auf ungefähr 125 N, d.h. auf ≤ 10%. Der am Anfang dieses Abschnitts (s.S.218) beschriebene Diamagnetismus (diamagnetism) lässt sich makroskopisch dadurch nachweisen, dass die magnetische Suszeptibilität χm (s.Tab.44, S.219) kleiner als null (Lenz’sche Regel, s.S.208) und temperaturunabhängig ist. Der Diamagnetismus tritt bei allen Stoffen auf, er wird aber in den Fällen, bei denen der Stoff (permanente) elementare magnetische Dipole (z.B. Übergangsmetallionen) enthält, meist durch deren Wirkung völlig überdeckt. Es ergibt sich dann eine positive Suszeptibilität, die je nach der Stärke der Wechselwirkung zwischen den Dipolen sogar sehr groß gegen eins werden kann. Bei vernachlässigbarer Wechselwirkung jedoch liegen die gleichen Bedingungen vor wie bei der Orientierungspolarisation in der Elektrostatik (s.S.186) und es ergibt sich durch Übertragung der Gl.(297), S.187, χm = C T (341) mit m2I . (342) 3k cp ist die Konzentration und mI das magnetische Moment der elementaren Dipole. C = cp µ0 Aus Gl.(297), S.187, folgt für den Anteil, der von den elementaren Dipolen herrührt (α = 0) und bei Vernachlässigung der Wechselwirkung zwischen den Dipolen (εr + 2 ≈ 3) die 222 18 Magnetfelder Beziehung εr − 1 = cp p2 /(3kT ε0 ). Die Übertragung auf den magnetischen Fall (εr → µr ; ε0 → µ0 ; p → pm ) ergibt mit pm = µ0 mI (s.Gl.(326), S.212) und χm = µr − 1 (s.Tab.44, S.219) die gesuchten Gln.(341) und (342). Die Gl.(341) wird als Curie-Gesetz (Curie’s law, Pierre Curie 1859-1906) und die Konstante C als Curie-Konstante (Curie constant) bezeichnet. In der Tab.46 sind Zahlenwerte für die magnetische Suszeptibilität (magnetic susceptibility) χm von einigen diamagnetischen und paramagnetischen Stoffen zusammengestellt. Korrekterweise muss man χm magnetische Volumensuszeptibilität nennen, da in der Literatur, analog zum elektrischen Fall (s.Tab.37, S.183), auch die magnetische Massensuszeptibilität χm,ma = χm /ρ und die molare magnetische Suszeptibilität (molar magnetic susceptibility) χm,mo = χm M/ρ verwendet werden, wobei ρ die Dichte und M die molare Masse des Stoffes darstellt. Darüber hinaus ist es oft auch noch üblich, Messwerte für die magnetische cgs-Suszeptibilität κm = χm /(4π) anzugeben. Tabelle 46. Experimentelle Werte für die magnetische Suszeptibilität χm = µr − 1 einiger diamagnetischer und paramagnetischer Stoffe [LID90] Stoff T /K χm · 106 Wismut (Bi, bismuth) Kupfer (Cu, copper) Wasser (H2 O, water) Stickstoff (N2 , nitrogen) 0,1 MPa 293 296 293 293 −165 −9, 63 −9, 03 −0, 0667 Aluminium (Al, aluminum) Platin (Pt, platinum) Sauerstoff (O2 , oxygen) 0,1 MPa Sauerstoff flüssig (liquid oxygen) 293 290 293 70,8 + 20,8 + 279 + 1,76 + 4220 Eisen, Nickel, Kobalt und einige andere Stoffe zeigen Ferromagnetismus (ferromagnetism). Dieser beruht auf einer Kopplung zwischen den elementaren magnetischen Dipolen und ist damit eine kollektive Eigenschaft, d.h. es gibt keine ferromagnetischen Atome oder Moleküle. Ein ferromagnetischer Stoff, er wird auch als Ferromagnetikum (ferromagnet) bezeichnet, besitzt eine charakteristische Temperatur TC , die sog. Curie-Temperatur (Curie temperature, Pierre Curie 1859-1906). Einige experimentelle Werte sind in der Tab.47 zusammengestellt. Oberhalb der Curie-Temperatur gilt das Weiss-Gesetz (Curie-Weiss law, Pierre Weiss 1865-1940) C χm = , (343) T − TC so dass für T TC paramagnetisches Verhalten vorliegt. Unterhalb der CurieTemperatur dagegen (ferromagnetisches Verhalten) ist die magnetische Suszeptibi- 18.4 Magnetostatik 223 Tabelle 47. Curie-Temperatur TC in Kelvin für einige Ferromagnetika [HER94] Ferromagnetikum chemisches Symbol TC / K Eisen (iron) Kobalt (cobalt) Nickel (nickel) Cu-Mn-Al-Legierung (Cu-Mn-Al alloy) Gadolinium (gadolinium) Dysprosium (dysprosium) Fe Co Ni Cu2 MnAl Gd Dy 1042 1400 631 603 289 87 lität χm sehr groß und hängt sowohl von der Größe der magnetischen Feldstärke H als auch von der Vorgeschichte ab. Die Abb.104 zeigt schematisch die Abhängigkeit der Magnetisierung M = χm H eines Ferromagnetikums von der magnetischen Feldstärke H. Eine solche Abhängigkeit nennt man Hysterese- oder HysteresisKurve (hysteresis cycle). Der gestrichelte Teil in Abb.104 heißt Neukurve (virgin curve). Er gehört nicht zur Hysterese-Kurve und beschreibt die Abhängigkeit der Magnetisierung von der magnetischen Feldstärke für ein ursprünglich unmagnetisches Material. Die Pfeile an der Kurve geben die Umlaufsrichtung an. MS heißt Sättigungsmagnetisierung (saturation magnetization), MR Remanenz (remanence oder residual magnetization oder retentivity) und HC Koerzitivkraft oder (coercive force oder coercivity). Permanentmagnete (permanent magnets) sind magnetisierte Stäbe aus ferromagnetischem Material mit großer Remanenz. Aus Abb.104 geht hervor, dass man bei ferromagnetischen Materialien eine magnetische Suszeptibilität i.Allg. nicht eindeutig angeben kann. Man definiert deshalb die Anfangssuszeptibilität (initial susceptibility) χam durch die Steigung der Neukurve am Nullpunkt dMneu χam = . (344) dH H=0 M MS MR −HC H Abbildung 104. Hysterese-Kurve eines ferromagnetischen Materials 224 18 Magnetfelder Trägt man nicht die Magnetisierung M , sondern die magnetische Flussdichte B als Funktion der magnetischen Feldstärke H auf, so ergibt sich eine ähnliche Kurve wie in Abb.104, jedoch mit dem Unterschied, dass keine Sättigung auftritt. Das heißt, für H > 0 verläuft die Kurve bei großen Werten von H nicht horizontal, sondern steigt linear an. Analog ändert sich das Verhalten für H < 0. Nach Tab.44, S.219, gilt B = µ0 H + Pm , woraus mit Pm = µ0 M und und M = χm H die Beziehung B = µ0 H + µ0 M folgt. Selbst wenn die Magnetisierung M ihren Sättigungswert MS erreicht hat, wächst B wegen des ersten Terms noch linear mit H an. Beim einmaligen Durchlaufen der Hysterese-Kurve eines Ferromagnetikums mit dem Volumen V geht die magnetische Energie I ~ · dM ~ (345) ∆Wm = µ0 V H in Form von Wärme verloren. RB ~ 0 dB ~ 0 . Dies bedeutet, dass bei H H ~ B ~ verloren geht. Mit einem Durchlaufen der Hysterese-Kurve die Energie ∆Wm = V Hd ~ ~ ~ ~ ~ ~ ~ ~ B = µ0 H+Pm und Pm = µ0 M (s.Tab.44, S.219) folgt zunächst B = µ0 H+µ 0 M und nach H ~ M ~, Einsetzen in das Umlaufintegral und Durchführung der Integration ∆Wm = µ0 V Hd H ~ H ~ ist Null. denn das Umlaufintegral Hd Nach Tab.45, S.220, gilt für die magnetische Energie V 0 Aus diesem Grunde verwendet man in Transformatoren, Elektromotoren und Generatoren Ferromagnetika mit einer möglichst schmalen Hysterese-Schleife (magnetisch weiches Material, soft magnetic material). Im Gegensatz dazu benötigt man für Permanentmagnete und vor allem für digitale magnetische Informationsspeicher (Disketten, Festplatten) magnetisch hartes Material (hard magnetic material), bei dem die Hysterese-Kurve näherungsweise zu einem Rechteck mit den Kanten parallel zu den M -H-Achsen entartet ist, so dass Remanenz und Koerzitivkraft maximale Werte annehmen. Die Ursache des Ferromagnetismus ist die Ausbildung von Weiss-Bezirken (Weiss domains oder ferromagnetic domains, Pierre Weiss 18651940). Das sind Gebiete, in denen die elementaren magnetischen Dipole infolge ihrer Wechselwirkung untereinander parallel ausgerichtet sind. Jeder Weiss-Bezirk wirkt damit wie ein magnetischer Dipol, aber mit entsprechend größerem Dipolmoment. Für M = 0 sind die Weiss-Bezirke statistisch im Raum orientiert. Nach Anlegen eines Magnetfeldes mit wachsender Intensität klappen immer mehr Bezirke in die Richtung des Magnetfeldes, was sich mit einer Induktionsspule und nach genügender Verstärkung akustisch durch Rauschen in einem Lautsprecher nachweisen lässt (Barkhausen-Effekt, Barkhausen effect, Heinrich Georg Barkhausen 1881-1956). Beim Antiferromagnetismus (antiferromagnetism), den einige Festkörper, wie 18.4 Magnetostatik 225 z.B. α-Fe2 O3 , MnO oder MnF2 zeigen, existieren ebenfalls magnetische Bezirke, jedoch sind innerhalb eines Bezirks die elementaren magnetischen Dipole antiparallel ausgerichtet, so dass das resultierende Dipolmoment eines solchen Bezirks null ist. Mit wachsender Temperatur zerbrechen diese Bezirke. Es entsteht damit eine wachsende Zahl ungekoppelter elementarer magnetischer Dipole, die schließlich zu einem paramagnetischen Verhalten des Festkörpers führen. Die Temperaturabhängigkeit der magnetischen Suszeptibilität χm ist schematisch in Abb.105 dargestellt. Oberhalb der Néel-Temperatur (Néel temperature, Louis Eugène Felix Néel, 19042000) TN , d.h. für T > TN , gilt das Néel-Gesetz (Néel’s law) C , (346) T +θ wobei θ und TN die beiden charakteristischen Temperaturen eines antiferromagnetischen Materials sind. χm = χm Abbildung 105. Temperaturabhängigkeit der magnetischen Suszeptibilität χm bei einem Antiferromagnetikum. Oberhalb der Néel-Temperatur TN gilt die Gl.(346) −θ TN T Beim Ferrimagnetismus (ferrimagnetism) existieren, wie beim Antiferromagnetismus, Bezirke, in denen die elementaren magnetischen Dipole antiparallel ausgerichtet sind, jedoch haben jeweils benachbarte Dipole unterschiedliche Dipolmomente, so dass sie sich nur zu einem gewissen Bruchteil kompensieren. Damit verhalten sich ferrimagnetische Festkörper, wie z.B. Magnetit (FeOFe2 O3 ), ähnlich wie Ferromagnetika. Durch Einbau von Fremdatomen an Stelle des Eisens (es entsteht XOFe2 O3 mit X=Mn, Co, Ni, Cu, Mg, Zn u.a.) kann man die Hysteresekurve gezielt verändern. Da diese Materialien, die man als Ferrite (ferrites) bezeichnet, außerdem nichtleitend sind und deshalb keine Wirbelstromverluste zeigen, finden sie in der Elektronik als Spulenkernmaterial breite Anwendung. Die im vorliegenden Abschnitt beschriebenen magnetischen Erscheinungen treten auch in der Elektrostatik auf. Ferroelektrika (ferroelectrics) sind z.B. Seignettesalz (COOK-CHOH-CHOH-COONa · 4H2 O) oder Bariumtitanat (BaTiO3 ), deren relative Dielektrizitätskonstante εr durchaus Werte über 1000 erreichen kann. Die 226 18 Magnetfelder Remanenz existiert auch, dem Permanentmagneten entspricht das Elektret (electret). Antiferroelektrische Eigenschaften besitzt z.B. WO3 und auch Kristalle mit ferrielektrischen Eigenschaften sind bekannt Ü 111 Ü 112 22 Wellenoptik Max von Laue: Wirklichkeit ist etwas, das Wirkungen ausübt. 22.1 Kohärenz Nach der Quantenphysik wird eine elektromagnetische Welle dann abgestrahlt, wenn ein System, z.B. ein Atom, aus einem angeregten Zustand (excited state) in einen energetisch tiefer liegenden Zustand, z.B. den Grundzustand (ground state), d.h. den tiefsten, stabilen Energiezustand, übergeht. Die Frequenz f der Welle folgt aus der Beziehung f = ∆E/h, wobei h die Planck-Konstante (s.A.1, S.1245) und ∆E den Energieunterschied zwischen den beiden Zuständen bezeichnet. Die Dauer τ des Emissionsvorgangs nennt man auch mittlere Lebensdauer (mean life time) des angeregten Zustandes. Mit den Methoden der Quantenphysik ist es möglich, sowohl die Energiedifferenz ∆E als auch die zugehörige Lebensdauer τ zu berechnen. Wir nehmen diese Größen hier als gegeben an. Aus τ ergibt sich mit der Lichtgeschwindigkeit c für die Länge λc des Wellenzuges (Kohärenzlänge, coherence length) `c = cτ (478) und für die Halbwertsbreite der zugehörigen Spektrallinie ∆f ≈ 1 . τ (479) A 123 Zum Beweis dieser letzteren Gleichung verwenden wir das Fourier-Theorem (Fourier theorem, Joseph Fourier 1768-1830), wonach sich jede beliebige Zeitfunktion F (t) (abgesehen von ”exotischen” Fällen) durch eine Überlagerung von harmonischen Schwingungen darstellen lässt. Für F (t) wählen wir die Komponente E(t) der elektrischen Feldstärke der elektromagnetischen Welle senkrecht zu ihrer Ausbreitungsrichtung. Dann gilt (Fourier-Transformation, Fourier transformation) Z ∞ [Ec (ω) cos ωt + Es (ω) sin ωt]dω E(t) = (480) 0 mit Ec (ω) = 1 π Z +∞ E(t) cos ωtd t −∞ und Es (ω) = 1 π Z +∞ E(t) sin ωtd t. (481) −∞ Man beachte, dass Ec (ω) und Es (ω) spektrale Dichten sind, die die Einheit Vs/m besitzen. Die Größe 332 22 Wellenoptik 1/2 Ê(ω) = Ec2 (ω) + Es2 (ω) (482) bezeichnet man als das Amplitudenspektrum der Zeitfunktion E(t). Die Anwendung dieser Beziehungen auf den in Abb.168a dargestellten Wellenzug (wave train) liefert unter der Voraussetzung, dass der Wellenzug aus einer großen Anzahl von Perioden besteht (ω0 τ 1), für das Amplitudenspektrum, das in Abb.168b dargestellt ist, Ê0 τ sin[(ω0 − ω)τ /2] (483) Ê(ω) = . 2π [(ω0 − ω)τ /2] E(t ) −1 f0 ^ E 0 a) −τ/2 τ/2 t 0 Abbildung 168. a) Wellenzug E(t) der Dauer τ , der Amplitude Ê0 und der Frequenz f0 . b) Amplitudenspektrum Ê(ω) des Wellenzuges E(t). ∆f ist die Halbwertsbreite der Spektrallinie ^ 2π (ω) ^ τE 0 1,0 0,5 (∆ f ) τ b) −3 −2 −1 0 1 2 3 ( f −f ) τ 0 Einsetzen von E(t) = Ê0 cos ωt für −τ /2 ≤ t ≤ +τ /2 und E(t) = 0 für |t| > τ /2 R +τ /2 in die beiden Gln.(481) liefert Ec = π −1 −τ /2 Ê0 cos ω0 t cos ω tdt und, wegen der Symmetrie, Es = 0. Das Integral formen wir mit Hilfe des Additionstheorems α cos β = R +τcos /2 (1/2) cos(α + β) + (1/2)cos(α − β) zu dem Ausdruck Ec = Ê0 (2π)−1 −τ /2 [cos(ω0 + ω)t + cos(ω0 − ω) t] dt um. Unter der Voraussetzung ω0 τ 1 folgt Ec = (Ê0 /π){sin[(ω0 − ω)τ /2]}/(ω0 − ω), womit sich nach Einsetzen in die Gl.(482) und mit Es = 0 die gesuchte Gl.(483) ergibt. 22.1 Kohärenz 333 Das Hauptmaximum des Amplitudenspektrums E(ω) in Abb.168b) wird umso größer, je länger die mittlere Lebensdauer τ des angeregten Zustands ist. Gleichzeitig wird die Frequenzdifferenz |f0 − f | zu den Nebenmaxima immer geringer. Nebenmaxima treten gar nicht mehr auf, wenn die Amplitude Ê0 des Wellenzuges nicht konstant ist, sondern exponentiell abnimmt. Die Halbwertsbreite (full width at half maximum, abgekürzt mit FWHM) ∆f der Spektrallinie ergibt sich aus der Bedingung {sin[π(τ /2)∆f ]}/[π(τ /2)∆f ] = 1/2 (s.Gl.(483)) zu ∆f ≈ 1, 21/τ , womit die Gl.(479) bewiesen ist. Für isolierte Atome und Übergänge im sichtbaren Licht ist τ von der Größenordnung 10 ns. Dieser Wert verkürzt sich aber mit zunehmender Dichte des Gases und mit wachsender Temperatur durch die Stöße zwischen den Atomen. Die entsprechende Vergrößerung der Linienbreite nach Gl.(479), S.331, heißt Stoßverbreiterung (impact broadening oder collisional broadening). Wenn die auftretenden Energieunterschiede ∆E (s.S.331) nicht alle gleich, sondern über einen gewissen Bereich verteilt sind, ergibt sich die beobachtete Spektrallinie als Überlagerung von Spektrallinien mit verschiedenen Resonanzfrequenzen. Die dadurch bedingte Vergrößerung der Linienbreite nennt man inhomogene Linienverbreiterung (inhomogeneous line broadening). In Gasen führt der Doppler-Effekt zu einer inhomogenen Verbreiterung der Spektrallinien. Bei den als Laser (light amplification by stimulated emission of radiation) bezeichneten Lichtquellen werden Atome, Ionen oder Moleküle durch äußere Anregung, z.B durch elektromagnetische Strahlung mit einer Frequenz, die größer sein muss, als die des gewünschten Laserlichts (fL ), in einen angeregten Zustand gebracht. In diesem Zustand soll das Teilchen die Energie Ea und eine möglichst lange Lebensdauer besitzen. Außerdem muss unterhalb von Ea ein Zustand mit der Energie Eu = Ea − hfL existieren, wobei h die Planck-Konstante bezeichnet. Der Laser funktioniert nur dann, wenn sich im oberen Energieniveau Ea mehr Atome befinden als im unteren (Besetzungsinversion, population inversion). Sobald dann eines der Teilchen spontan vom angeregten Zustand nach diesem unteren Zustand übergeht, sendet es Licht der Frequenz fL aus, durch das weitere Teilchen infolge der induzierten Emission (s.S.419) veranlasst werden, den Übergang von Ea nach Eu zu vollziehen. Dabei senden sie, und das ist das Wesentliche, Licht mit der gleichen Frequenz (fL ) und mit der gleichen Phase aus. Indem man dieses Licht durch Reflexion an zwei gegenüber liegenden Spiegeln immer wieder das Lasermaterial durchlaufen lässt, kommt es zu einer lawinenartigen Verstärkung der Lichtintensität. Die Abstrahlung dieses Laserlichts realisiert man meist dadurch, dass einer der beiden Spiegel teildurchlässig ist. In Abb.169 ist der Aufbau des weit verbreiteten Helium-Neon-Lasers schematisch dargestellt. In einer Gasentladungsröhre (Länge 0,3...1 m) befinden sich die Edelgase Helium und Neon (Mischungsverhältnis etwa 10:1) bei niedrigem Druck (0,3...1 kPa). Nach Zündung mit einem Hochspannungsimpuls ( ≈ 10 kV) brennt eine Glimmentladung in der Kapillare (Durchmesser ≈ 1 mm) bei einer Spannung von etwa 1 kV. Die Parameter der Gasentladung sind so gewählt, dass sich für die Neon-Atome 334 22 Wellenoptik Kathode S1 Anode Glaskapillare + − S2 Abbildung 169. Prinzipskizze des Gaslasers. Der Spiegel S2 ist teildurchlässig. E /eV 20,55 1 S0 3 19,77 S1 e−He− Stöße Ne∗ 5s He∗−Ne− Stöße 0,633 µm Ne∗ 4s 1,15 µm Ne∗ 3p Ne∗ 3s Wandstöße 0 He Ne Abbildung 170. Energieniveauschema des Helium-Neon-Gasgemisches. Eingezeichnet sind die Laserübergänge zwischen den Niveaus Ne∗ 4s bzw. Ne∗ 5s und Ne∗ 3p. Die Niveaus Ne∗ 4s und Ne∗ 5s sind stärker besetzt als die Ne∗ 3p-Niveaus (Besetzungsinversion). Sie werden vorwiegend durch Atomstöße zwischen angeregten Heliumatomen und Neonatomen gefüllt. Die unteren Ne∗ 3p-Laserniveaus werden durch spontane Strahlungsübergänge zu den Ne∗ 3s-Niveaus entleert, und diese wiederum durch Stöße mit der Wand der Kapillare. 22.1 Kohärenz 335 eine Besetzungsinversion zwischen den 4s- und 5s-Niveaus (obere Energieniveaus Ea , die Elektronenkonfigurationen der angeregten Neon-Atome ist Ne∗ 4s bzw. Ne∗ 5s (mit Ne∗ =1s2 2s2 2p5 ), s.S.472, 1255) und den 3p-Niveaus (untere Energieniveaus Eu , die Elektronenkonfigurationen der niedriger angeregten Neon-Atome ist Ne∗ 3p) einstellt, s. Abb.170. Diese Besetzungsinversion kommt zum einen dadurch zustande, dass die in der Überzahl vorhandenen Helium-Atome durch Elektronenstöße in die angeregten Niveaus 3 S1 und 1 S0 (die Elektronenkonfigurationen der angeregten Helium-Atome He∗ ist 1s2s, s. Abb.251, S.478) gelangen, die auf Grund der Auswahlregeln für elektrische Dipolübergänge (s.S.464) eine so lange Lebensdauer besitzen, dass sie nicht durch Photonenemission in den Grundzustand zurückkehren, sondern viel eher mit nichtangeregten Neon-Atomen zusammenstoßen und dabei ihre Energie an die Neon-Atome weitergeben, die sich dann in den angeregten Zuständen Ne∗ 5s bzw. Ne∗ 4s befinden. Der Energietransfer He∗ + Ne → He + Ne∗ 4s/5s ist besonders günstig, da die Ne∗ 5s- bzw. Ne∗ 4s-Energieterme nahezu den gleichen energetischen Abstand vom Grundzustand besitzen wie die angeregten 3 S1 und 1 S0 -Zustände des Heliums (Resonanzenergieübertragung). Auf der anderen Seite ist die mittlere Lebensdauer der angeregten Zustände Ne∗ 5s bzw. Ne∗ 4s etwa um den Faktor 10 größer als die der Ne∗ 3p-Niveaus, die spontan in die darunter liegenden Ne∗ 3s-Zustände zerfallen. Die Ne∗ 3s-Zustände sind ebenso wie die 3 S1 und 1 S0 -Zustände des Heliums metastabil (elektrische Dipolübergänge in den Grundzustand sind verboten). Damit die Besetzungsinversion im Neon-Energieniveauschema (s. Abb.170) aufrecht erhalten werden kann, müssen die Ne∗ 3s-Niveaus hinreichend schnell durch Übergänge in den Grundzustand entvölkert werden. Dies ist möglich durch Stöße der Ne-Atome mit der Wand der Kapillare, die daher möglichst eng gewählt wird. Aus dem Energieniveauschema in Abb.170 sieht man, dass im Helium-Neon-Laser bei mehreren Übergängen eine Besetzungsinversion vorhanden ist, d. h. dass mehrere Übergänge für eine Laserstrahlung ausgewählt werden können. Die beiden gebräuchlichsten sind die von Ne∗ 5s nach Ne∗ 3p (λ = 632, 8 nm) bzw. von Ne∗ 4s nach Ne∗ 3p (λ = 1152 nm). Die Auswahl eines speziellen Übergangs und seiner Strahlungsfeldcharakteristik (d.h. Frequenzbreite, Polarisation und transversale Intensitätsverteilung) für die Lasertätigkeit heißt Modenselektion (mode selection). Die Verstärkung einer gewünschten Linie erreicht man dadurch, dass man im aktiven Lasermaterial (hier Neon-Atome mit Besetzungsinversion) stehende Wellen der betreffenden Wellenlänge mit einer bestimmten transversalen Intensitätsverteilung erzeugt. In Abb.169 wird durch die Anordnung der beiden Spiegel ein optischer Resonator gebildet, in dem sich stehende Lichtwellen bilden können, deren Wellenlänge, analog zu den stehenden Schallwellen in einer Pfeife mit geschlossenen Enden (vgl.S.91), der Bedingung κλ/2 = ` genügen muss. Die ganze Zahl κ ist gewöhnlich sehr groß, für ` = 30 cm und λ = 632,8 nm erhält man κ ≈ 9, 5 · 105 . Die transversale Intensitätsverteilung im Laserstrahl wird durch strahlbegrenzende Blenden und die Größe und Krümmung der Resonatorspiegel bestimmt und kann durch zwei kleine ganze Zahlen (l, m) charakterisiert werden. Das Zahlentripel (κ, l, m) definiert eine Eigenmode 336 22 Wellenoptik (eigenmode) des optischen Laserresonators. Der Wellenlängenabstand benachbarter longitudinaler Moden ergibt sich zu ∆λ = 2`/κ − 2`/(κ + 1) ≈ 2`/κ2 . Für den Frequenzabstand ∆f ≈ |(c/λ2 )∆λ| folgt mit λ = 2`/κ und ∆λ ≈ 2`/κ2 die Beziehung ∆f ≈ c/(2`). Im betrachteten Beispiel ergibt sich also ∆f ≈ 0, 5 GHz. Da sich die Neon-Atome im Laser bewegen (Maxwell’sche Geschwindigkeitsverteilung) und da die Photonenemission der Atome durch Stöße gestört wird, sind die von den Atomen in der Gasentladungsröhre emittierten Spektrallinien inhomogen verbreitert (Doppler- und Stoßverbreiterung), wobei die Halbwertsbreite bei etwa 1...2 GHz liegt und damit im vorliegenden Beispiel 2...4 longitudinale Eigenmoden des Resonators umfaßt. Der optische Resonator des Lasers verstärkt diese die Spektrallinie überlappenden Eigenmoden, die man dann in der Laserstrahlung wiederfindet. Die spektrale Breite der Lasermoden wird durch die Güte des Resonators (in Analogie zur Güte eines Schwingkreises, s.Gl.398) und durch die Quanteneigenschaften des Lichtfeldes im Laser bestimmt. Die Güte des optischen Resonators wächst mit den Reflexionskoeffizienten der verwendeten Spiegel und wird durch Strahlungsverluste (Streuung und Absorption bei der ausgewählten Wellenlänge an Laserbauelementen) kleiner. Durch Dämpfung unerwünschter Moden (Wahl geeigneter Filter und Blenden) kann man Einmodenlaser (single mode laser) konstruieren, deren spektrale Breite nur wenige Hertz beträgt. Die Festlegung der Polarisationsrichtung der Laserstrahlung erfolgt in Abb.169 durch die das Laserrohr auf beiden Seiten abschließenden Brewster-Fenster (Brewster windows). Dies sind planparallele Glasplatten, die um den Brewster-Winkel zur Symmetrieachse der Spiegel geneigt sind. Die zu verstärkenden Wellen, deren elektrischer Feldvektor in der Zeichenebene (Einfallsebene) schwingt, treten ohne Verlust in das Brewster-Fenster ein. Alle anderen Wellenlängen und Polarisationsrichtungen werden an den Brewster-Fenstern von der Symmetrieachse wegreflektiert, erleiden dadurch Verluste und werden nicht verstärkt. Nach vielfachem Hin- und Herlaufen der Welle bleibt schließlich nur noch die gewünschte Mode mit der linearen Polarisation übrig. Das vom Laser emittierte Licht zeichnet sich durch eine zeitlich und räumlich weit ausgedehnte feste Phase und Polarisationsrichtung aus. Es ist gebündelt und kann durch zusätzliche Linsen weiter fokussiert werden. Durch schnelle Schaltung der Güte des Resonators können kurze (Piko- bis Femtosekunden) und sehr intensive (Giga- bis Terawatt) Lichtimpulse erzeugt werden. In der Tab.70 sind experimentell bestimmte Linienbreiten ∆f für verschiedene Lichtquellen angegeben. Die daraus mit den Gln.(478) bzw. (479), S.331, berechneten Werte für die mittlere Dauer (τ ) und Länge (Kohärenzlänge λc ) der emittierten Wellenzüge besitzen nur dann eine physikalische Bedeutung, wenn die Linien homogen verbreitert sind. Dies gilt für Laserlicht und näherungsweise auch für das Licht gekühlter Spektrallampen. Eine Analogie zum Schall soll schließlich noch die Bedeutung der verschiedenen Arten von Licht erläutern: Wir betrachten eine größere Anzahl im Raum verteilter Lautsprecher (Lichtquellen). Natürliches weißes Licht entspricht dann dem Schall, 22.2 Interferenz 337 der entsteht, wenn jeder Lautsprecher zu statistisch verteilten Zeiten einen Ton abgibt, der nur kurz ist und dessen Frequenzen über ein breites Intervall verteilt sind. Natürliches farbiges Licht, wie man es nach dem Durchgang durch ein Farbfilter erhält, bedeutet, dass die Frequenzen auf ein mehr oder weniger schmales Intervall beschränkt sind. Das Licht, das von einer Spektrallinie herrührt, entspricht dem Schall, bei dem alle Frequenzen gleich sind. Die Analogie zum kohärenten Licht (coherent light), ist der Schall, der entsteht, wenn alle Lautsprecher mit der gleichen Frequenz und jeder mit fester Phase einen (im Idealfall unendlich langen) Ton abgeben. Zwischen kohärenten Lichtstrahlen besteht demnach über einen bestimmten Raum- und Zeitbereich eine feste Phasenbeziehung. Ü 137 Ü 138 Tabelle 70. Linienbreite ∆f und daraus berechnete mittlere Dauer (τ ) und Länge (λc ) der emittierten Wellenzüge für einige Lichtquellen. λc ist die Kohärenzlänge der betreffenden Lichtquelle (s.S.331) Lichtquelle ∆f 14 Hz τ = 1/∆f λc = c0 τ weißes Licht mit Farbfilter ca. 10 (0,01 ps) (3 µm) Spektrallampe bei Zimmertemperatur 1,5 GHz (0,67 ns) (0,2 m) Spektrallampe gekühlt (77 K) 500 MHz 2 ns 0,6 m Halbleiterlaser 2 MHz 0,5 µs 150 m Einmoden-Helium-Neon-Laser 10 Hz 0,1 s 30000 km 22.2 Interferenz Die Überlagerung kohärenter Lichtstrahlen nennt man Interferenz (interference). Handelt es sich um parallele Strahlen, so spricht man von Fraunhofer-Interferenz (Fraunhofer interference, Joseph von Fraunhofer 1787-1826), ansonsten von FresnelInterferenz (Fresnel interference, Jean Augustin Fresnel 1788-1827). Räumliche Hindernisse, wie z.B. eine Kante oder ein Schirm mit einem Spalt, geben Anlass zu Interferenzen, deren Gesamtheit man als Beugung (diffraction) bezeichnet. Interferenzfarben (interference colors) treten dann auf, wenn von einfallendem weißem Licht ein gewisser Wellenlängenbereich durch Interferenz ausgelöscht wird. Auf diese Weise entstehen z.B. die schillernden Farben der Seifenblasen, der dünnen Ölschichten auf regennassen Fahrbahnen oder auch der (sich beim Erhitzen bildenden) dünnen Oxidschichten auf blanken Metalloberflächen (Anlauffarben, annealing colors). Die Ursache ist die Interferenz zwischen dem an der Vorderund der Rückseite einer durchsichtigen Schicht reflektierten Licht. Als Beispiel für Fraunhofer-Interferenzen betrachten wir die Newton-Ringe (Newton rings, Isaac Newton 1643-1727). Auf eine plankonvexe Linse, die auf einer ebenen Glasplatte 338 22 Wellenoptik liegt (s.Abb.171), falle von oben senkrecht paralleles Licht mit der Wellenlänge λ. Dann sieht man (bei Betrachtung von oben) konzentrische dunkle Ringe, die nach außen hin in ihrer Intensität umso stärker abnehmen, je kleiner die Kohärenzlänge des Lichtes ist. Für den Radius dieser Ringe ergibt sich r = (κ R λ)1/2 (484) mit κ = 0, 1, 2, ... Diese Gleichung kann bei bekanntem Krümmungsradius R der Linse zur Wellenlängenmessung benutzt werden. Licht R R Abbildung 171. Zur Entstehung der Newton-Ringe. R ist der Krümmungsradius der plankonvexen Linse und 2` der Wegunterschied zwischen den beiden Strahlen, die, im Abstand r von der Mitte, an der Unterseite der Linse bzw. der Oberseite der Glasplatte reflektiert werden r Der Wegunterschied zwischen den beiden Strahlen, die an der Unterseite der Linse bzw. an der Oberseite der Glasplatte reflektiert werden, ist nach Abb.171 gleich 2`. Diese Größe ergibt sich aus der Beziehung r2 + (R − `)2 = R2 und unter der Voraussetzung ` R zu 2` = r2 /R. Da bei der Reflexion an der Oberseite der Glasplatte (d.h. an der Grenze von einem optisch dünneren (Luft) zu einem optisch dichteren Stoff (Glas)) ein Phasensprung π auftritt (s.S.373), beträgt die gesamte Phasenverschiebung zwischen den beiden reflektierten Strahlen (2`/λ)2π + π. Auslöschung tritt auf, wenn diese Phasenverschiebung gleich (2κ + 1)π mit κ = 0, 1, 2, ... ist. Damit folgt 2`/λ = κ. Einsetzen von 2` = r2 /R ergibt r2 = κRλ, d.h. die gesuchte Gl.(484). Fresnel-Interferenzen lassen sich mit zwei punktförmigen Lichtquellen erzeugen. Allerdings müssen die beiden Lichtquellen kohärentes Licht ausstrahlen. Diese Bedingung erfüllt man am einfachsten dadurch, dass man mit Hilfe der geometrischen Optik von einer realen punktförmigen Lichtquelle L zwei virtuelle Bilder L1 und L2 entwirft, die dann Fresnel-Interferenzen erzeugen (s. die Abb.172 und Abb.173). Die mitunter für kohärent verwendete Bezeichnung interferenzfähig sollte man nach Möglichkeit vermeiden, da sich, wie im nächsten Abschnitt gezeigt wird, auch mit nichtkohärenten Lichtquellen Interferenzen erzeugen lassen. 22.3 Interferenz inkohärenter Strahlungsquellen 339 L L2 L1 L1 L2 L S Interferenzgebiet Interferenzgebiet Abbildung 172. Fresnel’scher Doppelspiegel (Fresnel mirrors). S ist ein Schirm, mit dem die Lichtquelle L gegenüber dem Interferenzgebiet abgedeckt wird, so dass dort nur die beiden virtuellen Lichtquellen L1 und L2 interferieren Ü 139 Ü 140 A 124 A 125 A 126 Abbildung 173. Fresnel’sches Biprisma (Fresnel biprism) A 127 A 128 A 129 A 130 A 131 22.3 Interferenz inkohärenter Strahlungsquellen In Abb.174 bezeichnen L1 und L2 zwei punktförmige Lichtquellen mit dem Abstand `, die Licht der gleichen Frequenz und Intensität abstrahlen. Das Licht sei jedoch inkohärent. Der Schirm, auf dem die Interferenzen gemessen werden sollen, sei parallel zu `. Da es sich um inkohärentes Licht handelt, kommt es nicht zur Ausbildung von FresnelInterferenzen: Die von einem Detektor D gemessene Intensität I zeigt bei einer Verschiebung auf dem Schirm parallel zu ` keinerlei Periodizitäten. Wenn man aber zwei Detektoren D0 und D einsetzt und deren jeweils zum gleichen Zeitpunkt gemessenen Intensitäten I0 und I miteinander multipliziert, so ergibt sich nach Mittelung über eine große Anzahl von Einzelmessungen hI0 Ii = 1 2 hI0 i{2 + cos[(2π`/λ) sin δ]}. 3 (485) 23 Polarisation des Lichtes Marie von Ebner-Eschenbach: Wer nichts weiß, muss alles glauben. Licht gehört zu den elektromagnetischen Wellen (electromagnetic waves). Diese ergeben sich als Lösung der Maxwell-Gleichungen beispielsweise für das Feld eines elektrischen Dipols, dessen Dipolmoment eine Funktion der Zeit ist (s.S.280). Nehmen wir eine sinusförmige Zeitabhängigkeit mit der Frequenz f an und betrachten Abstände vom Dipol, die groß sind gegen die Wellenlänge λ = c/f , wobei c die Lichtgeschwindigkeit in dem betreffenden Dielektrikum (Medium) bezeichnet, so liefert die Theorie die für das Folgende wesentlichen Aussagen: ~ ~ (1) Die elektrische E(t) und die magnetische Feldstärke H(t) stehen senkrecht aufeinander und senkrecht auf der Ausbreitungsrichtung der elektromagnetischen Wellen (s.S.285). ~ · d~a, wobei sich (2) Die durch eine Fläche d~a transportierte mittlere Leistung ist S ~ (Poynting-Vektor, s.S.286) aus dem über die Zeit gemittelten Vekder Vektor S ~ = torprodukt der elektrischen und magnetischen Feldstärke ergibt, d.h. es gilt S ~ ~ hE(t) × H(t)it . (3) Die elektrische und die magnetische Feldstärke sind in Phase und für den Zusam1/2 1/2 ~ ~ menhang zwischen ihren Beträgen gilt |E(t)|(ε = |H(t)|(µ (s.Gl.(426), r ε0 ) r µ0 ) S.286). Wir brauchen also im Weiteren zur Beschreibung der elektromagnetischen Wellen ~ nur den Vektor E(t) anzugeben. Außerdem kann man für die meisten Stoffe, die in der Optik eine wesentliche Rolle spielen, µr = 1 setzen. A 135 A 136 A 137 Zur Definition der Polarisation des Lichtes (polarization of light) betrachte man die Abb.201. Die Ausbreitung der elektromagnetischen Welle mit der Frequenz f und der Wellenlänge λ erfolge in z-Richtung, d.h. senkrecht zur Zeichenebene auf den Beobachter zu. Wenn dann die elektrische Feldstärke ständig in einer die z-Achse enthaltenden, vorgegebenen Ebene senkrecht zu z liegt, z.B. ~ E(t) = ~ex Êx sin[ωt − (2π/λ)z] mit ω = 2πf und ~ex als dem Einheitsvektor in x-Richtung (s.Abb.201, oberes Bild), dann spricht man von einer linear polarisierten Welle (plane-polarized wave). Diese Ebene, im vorliegenden Fall ist es die x-z-Ebene, nennt man die Schwingungsebene (plane of oscillation). Die dazu senkrechte Ebene, in der der Vektor der magnetischen Feldstärke liegt, heißt Polarisationsebene (plane of polarization). Ü 145 A 138 A 139 In der neueren, vor allem englischsprachigen Literatur, scheint sich allerdings zunehmend die Verwendung des Begriffs Polarisationsebene für jene Ebene durchzusetzen, in der das elektrische Feld schwingt. 370 23 Polarisation des Lichtes y linear z x y rechtselliptisch z x y rechtszirkular polarisiert z x Abbildung 201. Zur Definition der Polarisation einer elektromagnetischen Welle. Der Pfeil stellt die elektrische ~ Feldstärke E(t) dar. Die Ausbreitung der Welle erfolgt in z-Richtung, d.h. senkrecht zur Zeichenebene auf den Betrachter zu Addiert man zu dieser Welle eine zweite, senkrecht dazu linear polarisierte Welle (ihre Schwingungsebene ist die y-z-Ebene in Abb.201) mit einer Phasenverschiebung von +π/2, so ergibt sich eine rechtselliptisch polarisierte Welle (right-handed ~ elliptically polarized wave) E(t) = ~ex Êx sin[ωt − (2π/λ)z] + ~ey Êy cos[ωt − (2π/λ)z] (s.Abb.201, mittleres Bild), die im Spezialfall gleicher Amplituden (Êx = Êy = Ê) rechtszirkular polarisierte Welle (right-handed circularly polarized wave) heißt (s.Abb.201, unteres Bild). Für eine Phasenverschiebung von −π/2 kehrt sich die Umlaufsrichtung in dem mittleren und unteren Bild von Abb.201 um und man spricht von einer linkselliptisch (left-handed) bzw. linkszirkular (left-handed circularly) polarisierten Welle. Wir betrachten einen rechtszirkular polarisierten Lichtstrahl. Dann gilt: (1) Die Momentaufnahme des elektrischen Feldes stellt eine Rechtsschraube dar. (2) In einer festen Ebene senkrecht zur Ausbreitungsrichtung dreht sich die elektrische Feldstärke bei Betrachtung entgegen der Strahlrichtung im Uhrzeigersinn (s.Abb.201, unteres Bild). Damit besteht also die Ausbreitung des rechtszirkular polarisierten Lichtsstrahls in einer Parallelverschiebung der Rechtsschraube, d.h. ohne Drehung, längs ihrer Achse. 23.1 Die Fresnel-Formeln 371 23.1 Die Fresnel-Formeln Wir betrachten Licht, das auf die ebene Grenzfläche zwischen zwei verschiedenen Medien treffe und nehmen zunächst an (1. Fall ), dass das Licht linear polarisiert sei mit der elektrischen Feldstärke senkrecht zur Einfallsebene (s.Abb.202). Durch die Indizes e, r und g kennzeichnen wir die einfallende, die reflektierte bzw. die gebrochene Welle. Dann ergibt sich aus der Forderung nach der Stetigkeit der zur Grenzfläche parallelen Komponente der elektrischen Feldstärke (s.S.184) eine erste Gleichung, nämlich Ee + Er = Eg . (511) Er Ee α1 α 1 Eg α2 n1 n2 Abbildung 202. Eine linear polarisierte elektromagnetische Welle trifft auf die ebene Grenzfläche zwischen zwei Medien mit den Brechungsindizes n1 und n2 . Die Schwingungsebene stehe senkrecht auf der Einfallsebene, was durch die Punkte angezeigt wird. Ee , Er und Eg bezeichnen die elektrische Feldstärke für die einfallende, die reflektierte bzw. die gebrochene Welle Eine zweite Gleichung folgt aus der Tatsache, dass in der Grenzfläche keine Energieanreicherung oder Energieverarmung stattfinden darf. Da der Poynting-Vektor proportional zu nE 2 ist, wobei n den Brechungsindex des betreffenden Mediums bezeichnet, ergibt sich (Ee2 − Er2 )n1 cos α1 = Eg2 n2 cos α2 . (512) ~ = hE(t) ~ ~ Für den Poynting-Vektor S × H(t)i t (s.S.286) können wir schreiben S ∝ ~ ~ E(t)H(t), da E(t) und H(t) senkrecht aufeinander stehen und in Phase sind (s.S.369). Wegen E(εr ε0 )1/2 = H(µr µ0 )1/2 (s.S.369) sowie der Beziehung n = (εr µr )1/2 (s.Gl.(447a), S.306) folgt mit µr = 1, dass S in jedem Zeitpunkt proportional zu nE 2 (t) sein muss. Die dritte Gleichung schließlich ist das Brechungsgesetz (s.Gl.(446), S.305) 372 23 Polarisation des Lichtes sin α1 n2 = . sin α2 n1 (513) A 140 Aus diesen drei Gleichungen folgen nach einer einfachen Zwischenrechnung die Beziehungen sin(α1 − α2 ) sin(α1 + α2 ) (514) 2 sin α2 cos α1 . sin(α1 + α2 ) (515) Er = −Ee und Eg = E e Die Gl.(512) dividiert durch die Gl.(511) gibt wegen a2 − b2 = (a − b)(a + b) die Beziehung (Ee − Er )n1 cos α1 = Eg n2 cos α2 . Mit Gl.(513) folgt (Ee − Er ) cos α1 = (Eg cos α2 ) sin α1 / sin α2 . Hier ersetzen wir Eg nach Gl.(511) und erhalten (Ee − Er ) cos α1 sin α2 = (Ee + Er ) cos α2 sin α1 . Die Auflösung dieses Ausdrucks nach Er gibt Er = Ee · [cos α1 sin α2 − sin α1 cos α2 ]/[cos α1 sin α2 + sin α1 cos α2 ]. Unter Beachtung des Additionstheorems sin(α1 ± α2 ) = sin α1 cos α2 ± sin α2 cos α1 ist dies identisch mit der gesuchten Gl.(514). Setzen wir die Gl.(514) in Gl.(511) ein, so folgt Eg = Ee [sin(α1 + α2 ) − sin(α1 − α2 )]/ sin(α1 + α2 ). Für den Zähler ergibt sich unter Verwendung des erwähnten Additionstheorems 2 sin α2 cos α1 und damit die gesuchte Gl.(515). Im 2. Fall liegt die elektrische Feldstärke in der Einfallsebene (s.Abb.203). Ee α1 α Er 1 n1 n2 α2 Eg Abbildung 203. Eine linear polarisierte elektromagnetische Welle trifft auf die ebene Grenzfläche zwischen zwei Medien mit den Brechungsindizes n1 und n2 . Die Schwingungsebene liege in der Einfallsebene, was ~ e, E ~r durch die Querstriche angezeigt wird. E ~ g bezeichnen die elektrische Feldstärke und E für die einfallende, die reflektierte bzw. die gebrochene Welle 23.1 Die Fresnel-Formeln 373 Die Forderung nach der Stetigkeit der zur Grenzfläche parallelen Komponente der elektrischen Feldstärke liefert hier an Stelle von Gl.(511) die Beziehung Ee cos α1 + Er cos α1 = Eg cos α2 . (516) Die beiden anderen Bedingungen sind identisch mit den Gln.(512) und (513). Durch Auflösung dieser Gleichungen nach Er und Eg analog zu dem kleingedruckten Text oben ergeben sich die Beziehungen tan(α1 − α2 ) tan(α1 + α2 ) (517) 2 sin α2 cos α1 . sin(α1 + α2 ) cos(α1 − α2 ) (518) Er = −Ee und Eg = Ee Die Gln.(514), (515), (517) und (518) werden als Fresnel-Formeln (Fresnel equations) bezeichnet. Sie wurden 1822 von Jean Augustin Fresnel (1788-1827) ohne Kenntnis der Theorie der elektromagnetischen Wellen auf viel kompliziertere Weise abgeleitet. Wir wollen im Folgenden drei wichtige Schlussfolgerungen bzw. Anwendungen der Fresnel-Formeln behandeln. (1) Die Gln.(514) und (517) besagen, dass bei der Reflexion an einem optisch dichteren Medium (n2 > n1 ) die Phase der reflektierten Welle um π springt, während sie sich für n2 < n1 nicht ändert. Aus n2 > n1 folgt nach Gl.(513) die Ungleichung α1 > α2 . Setzt man dies in die Gln.(514) und (517) ein, so ergibt sich eine Vorzeichenumkehr (Er ∝ −Ee ), was einem Phasensprung um den Winkel π entspricht. Bei n2 < n1 folgt α1 < α2 und Er ∝ +Ee . (2) Aus der Gl.(517) folgt, dass Er verschwindet, sobald der reflektierte und der gebrochene Strahl einen Winkel π/2 miteinander bilden (α1 + α2 = π/2, s.Abb.203), da dann der Nenner unendlich wird. Es bleibt also bei einfallendem natürlichem, d.h. unpolarisiertem Licht im reflektierten Strahl nur die Komponente Er nach Gl.(514) übrig. Dies bedeutet: Wenn der reflektierte und der gebrochene Strahl senkrecht aufeinander stehen, so ist das reflektierte Licht zu 100% linear polarisiert, und zwar in der Weise, dass die elektrische Feldstärke senkrecht auf der Einfallsebene steht (Brewster-Gesetz, Brewster law, David Brewster 1781-1868). Der gebrochene Strahl ist dagegen nur zum Teil linear polarisiert; denn es gibt sowohl eine Komponente der elektrischen Feldstärke senkrecht (Eg nach Gl.(515)) als auch parallel (Eg nach Gl.(518)) zur Einfallsebene. Allerdings muss die letztere Komponente überwiegen, da ja dem natürlichen Licht durch die Reflexion ein linear 374 23 Polarisation des Lichtes polarisierter Anteil entzogen ist. Das Brewster-Gesetz lässt sich anschaulich verstehen, wenn man den Übergang des Lichtes vom Vakuum (n1 = 1) zu einem Medium (n2 > 1) betrachtet und bedenkt, dass eine linear schwingende Ladung (Hertz’scher Dipol) nicht in ihrer Schwingungsrichtung strahlt (s.Gl.430, S.287). Da nun die am Auftreffpunkt des einfallenden Strahles im Medium sitzenden Ladungen zu erzwungenen Schwingungen in Richtung der elektrischen Feldstärke (Richtung der Striche am gebrochenen Strahl in Abb.203) angeregt werden, muss Er für α1 + α2 = π/2 verschwinden. (3) Reflexminderung durch Beschichtung. Durch Bedampfung einer Linse mit einer dünnen durchsichtigen Schicht geeigneter Dicke ` und mit einem geeigneten Brechungsindex nA (s.u.) lässt sich erreichen, dass praktisch das gesamte auffallende Licht in die Linse eintritt. Auf diese Weise erhöht man bei modernen Objektiven von Ferngläsern, Photoapparaten usw. die Lichtstärke (Antireflexionsschicht, T-Optik, Vergütung von Linsen, antireflection coating). Eine vollständige Unterdrückung der Reflexion gelingt allerdings nur für senkrechten Einfall und eine bestimmte Wellenlänge des Lichtes. Durch Übereinanderdampfen von Antireflexionsschichten für verschiedene Wellenlängen lässt sich aber die Reflexion auch in gewissen Wellenlängenbereichen weitestgehend unterdrücken. Wenn man die Dicke λ der Antireflexionsschicht so wählt, dass ` = λA /4 (519) gilt, wobei λA die Wellenlänge des Lichtes in der Antireflexionsschicht bezeichnet, so löscht sich die an der oberen Grenzfläche der Schicht reflektierte Welle (0 in Abb.204) mit der an der unteren Grenzfläche reflektierten Welle (1 in Abb.204) aus. A 141 0 12 Luft n Lu Antireflexionsschicht nA Linse n Li Abbildung 204. Zur Wirkungsweise einer Antireflexionsschicht. nLi , nA und nLu bezeichnen die Brechungsindizes des Linsenmaterials, der Antireflexionsschicht bzw. der Luft 23.2 Natürliche Doppelbrechung 375 Allerdings muss dafür die Beziehung nLi > nA > nLu erfüllt sein, da nur dann in beiden Fällen die Reflexion an einem optisch dichteren Medium erfolgt und damit der Phasenunterschied lediglich durch die Wegdifferenz 2` = λA /2 gegeben wird. An der Interferenz mit der Welle 0 ist aber nicht nur die Welle 1 beteiligt, die einmal durch die Schicht hin- und hergegangen ist, sondern es tragen auch alle diejenigen Wellen zur Interferenz bei, die das zweimal (Welle 2 in Abb.204), dreimal usw. getan haben. Damit es zur Auslöschung zwischen der Welle 0 und der Summe der Wellen 1, 2, 3, ... kommt, muss neben Gl.(519) noch die Bedingung nA = √ nLu nLi (520) erfüllt werden. Aus Gl.(514), S.372, ergibt sich unter Verwendung des Additionstheorems sin(α1 ±α2 ) = sin α1 cos α2 ± sin α2 cos α1 und unter der Annahme eines nahezu senkrechten Einfalls (cos α1 ≈ cos α2 ≈ 1) die Gleichung Er = −Ee (sin α1 − sin α2 )/(sin α1 + sin α2 ). Mit dem Brechungsgesetz (Gl.(513), S.372) vereinfacht sich diese Beziehung zu Er = −Ee (n2 − n1 )/(n2 + n1 ). Das gleiche Resultat folgt für Er nach Gl.(517), S.373, da bei kleinen Winkeln (senkrechter Auffall) der Tangens durch den Sinus ersetzt werden kann. Damit ergibt sich für den Reflexionsfaktor (Er /Ee ) an der Grenzfläche Luft/Antireflexionsschicht ρ = −(nA − nLu )/(nA + nLu ), an der Grenzfläche Antireflexionsschicht/Linse σ = −(nLi − nA )/(nLi + nA ) und an der Grenzfläche Antireflexionsschicht/Luft −(nLu − nA )/(nLu + nA ) = −ρ. Die relative elektrische Feldstärke der Welle 0 ist damit ρ. Für die der Welle 1 folgt (−1)(1 + ρ) · σ(1 − ρ), wobei der erste Faktor die Weglänge berücksichtigt. Der zweite Faktor ergibt sich aus der Stetigkeit der zur Grenzschicht parallelen Komponente der elektrischen Feldstärke, die auf der Seite der Luft gleich Ee + ρEe ist. Der dritte Faktor berücksichtigt die Reflexion an der unteren Grenzfläche der Antireflexionsschicht und der vierte Faktor die Reflexion an der oberen Grenzfläche. Analog ergibt sich (−1)2 (1+ρ)σ 2 (−ρ)(1−ρ) für die relative elektrische Feldstärke der Welle 2 usw. Die Summe der relativen elektrischen Feldstärken für die Wellen 1,2,3,... ist also (−1)(1−ρ)(1+ρ)σ[1+ρσ+(ρσ)2 +...], wofür sich unter Verwendung der SummenP∞ formel n=0 q n = (1 − q)−1 (gültig für 0 < q < 1) der Ausdruck (−1)(1−ρ2 )σ(1−ρσ)−1 ergibt. Die Bedingung ρ + (−1) · (1 − ρ2 )σ(1 − ρσ)−1 = 0 (Auslöschung der Welle 0 durch die Summe der Wellen 1,2,3,...) wird erfüllt für ρ = σ. Einsetzen der obigen Beziehungen für ρ und σ liefert die Gleichung (nA − nLu )(nLi + nA ) = (nLi − nA )(nA + nLu ) oder n2A = nLu nLi . Ü 146 23.2 Natürliche Doppelbrechung Ein Kristall (crystal) entsteht durch Aneinanderreihung der kleinsten Einheit der betreffenden Kristallstruktur. Diese Einheit nennt man Elementarzelle oder Ein- 376 23 Polarisation des Lichtes heitszelle (unit cell). Sie wird durch die drei Basisvektoren (unit vectors) ~a, ~b und ~c aufgespannt. Diese Basisvektoren verbinden äquivalente Punkte des Kristalls miteinander, d.h. Punkte, deren Umgebung im Kristall völlig gleich ist. Die Gesamtheit aller durch die Vektoren ~rn1 ,n2 ,n3 = n1~a + n2~b + n3~c mit ganzzahligen Werten n1 , n2 , n3 entstehenden Punkte bildet das Gitter (lattice) des Kristalls. Alle Gitter lassen sich in die sieben Kristallsysteme (crystal systems) einordnen, die in der Tab.72 zusammengestellt sind. Tabelle 72. Die sieben Kristallsysteme. Durch Kombination mit den in der letzten Spalte angegebenen Zentrierungstypen entstehen die vierzehn Bravais-Gitter (s.Abb.205). ~a, ~b und ~c sind die drei Basisvektoren der Einheitszelle. Vereinbarungsgemäß zeichnet man ~c nach oben (s.Abb.205). In der Spalte ”Winkel zwischen den Basisvektoren” stellt die erste Angabe den Winkel zwischen ~b und ~c dar, die zweite betrifft ~a, ~c und die dritte ~a, ~b Kristallsystem Länge der Basisvektoren (a 6= b 6= c) Winkel zwischen den Basisvektoren (α 6= β 6= γ 6= α), (α, β, γ 6= π/2) Zentrierungstyp (zusammen mit dem Kristallsystem liefern sie die Bravais-Gitter) kubisch (cubic) trigonal (trigonal) a, a, a a, a, a π/2, π/2, π/2 α, α, α P, I, F P tetragonal (tetragonal) hexagonal (hexagonal) a, a, c a, a, c π/2, π/2, π/2 π/2, π/2, 2π/3 P, I P rhombisch (rhombic) monoklin (monoclinic) triklin (triclinic) a, b, c a, b, c a, b, c π/2, π/2, π/2 π/2, β, π/2 α, β, γ P, I, F, C P, C P Der Würfel gehört zum kubischen und der ”Ziegelstein” zum rhombischen Kristallsystem. Das kubische Kristallsystem besitzt die größte und das trikline Kristallsystem die geringste Symmetrie. Das trigonale Kristallsystem wird mitunter auch als rhomboedrisch (rhombohedral), das rhombische als orthorhombisch (orthorhombic) bezeichnet. Wenn die Einheitszelle nur an den Ecken besetzt ist, nennt man sie primitiv (simple, Symbol P oder s); ist noch der Schnittpunkt der Raumdiagonalen besetzt, so heißt sie innenzentriert (body-centred, Symbol I oder b.c.). Sind neben den Ecken noch die Zentren der Flächen besetzt, so wird die Einheitszelle flächenzentriert (face-centred, Symbol F oder f.c.) genannt. Das Symbol C ist für die Fälle vorgesehen, bei denen die Flächen nicht gleichwertig sind und nur die von ~a,~b aufgespannte Fläche zentriert ist (A und B betreffen die Flächen ~b, ~c bzw. ~a, ~c). Ein Kristall, der aus primitiven Einheitszellen (P) besteht, enthält also, da hier alle Gitterpunkte den benachbarten Einheitszellen gemeinsam sind, nur einen Gitterpunkt pro Einheitszelle. Bei A, B, C, I sind es zwei und bei F vier. Da nicht alle Kombinationen der sieben Kristallsysteme mit jedem Zentrierungstyp (packing type) I, F, A, B und C sinnvoll sind (d.h. die Symmetrie der primitiven 23.2 Natürliche Doppelbrechung 377 Einheitszelle erhalten, s. Tab.72), entstehen die vierzehn in Abb.205 dargestellten Bravais-Gitter (Bravais-lattices, Auguste Bravais 1811-1863). A 142 Abbildung 205. Die vierzehn Bravais-Gitter (s. auch Tab.72) In Kristallen, die zum kubischen Kristallsystem gehören, wie z.B. Steinsalz oder Diamant, und in amorphen Stoffen (z.B. Glas) hängt die relative Dielektrizitätskonstante εr nicht von der Richtung des elektrischen Feldes ab. Für die elektromagnetischen Wellen bedeutet dies (s.Gl.(447a), S.306), dass der Brechungsindex n unabhängig von der Ausbreitungsrichtung der Wellen ist. Man spricht von einem optisch isotropen Medium (isotropic medium). In allen anderen Fällen kann eine optische Anisotropie (anisotropy) auftreten, die meist mit einer Anisotropie anderer Eigenschaften, wie z.B. der Wärmeleitfähigkeit oder des Elastizitätsmoduls verknüpft ist. Die optische Anisotropie bedeutet, dass der Brechungsindex von der Ausbreitungsrichtung des Lichtes bezüglich der Einheitszelle des Kristalls abhängt, oder, mit anderen Worten, dass der Brechungsindex ein Tensor sein muss. 378 23 Polarisation des Lichtes Bei Kristallen, die zum trigonalen, tetragonalen oder hexagonalen Kristallsystem gehören, ist dieser Tensor axialsymmetrisch, d.h. zwei seiner drei Hauptwerte sind gleich (s.Tab.73). Man spricht dann von optisch einachsigen Kristallen (uniaxial crystals). Die Richtung der Symmetrieachse des Tensors wird als optische Achse (optical axis) und jede Ebene, die durch die optische Achse und einen nicht auf ihr liegenden (beliebigen) Punkt bestimmt wird, als Hauptschnitt (principal section) des Kristalls bezeichnet. Die optische Achse stimmt bei optisch einachsigen Kristallen mit der Symmetrieachse der betreffenden Elementarzelle überein. Bei Kristallen, die zum rhombischen, monoklinen oder triklinen Kristallsystem gehören, können die drei Hauptwerte verschieden sein, so dass der Kristall zwei optische Achsen besitzt (optisch zweiachsige Kristalle, biaxial crystals). Wir behandeln zunächst die Ausbreitung einer ebenen, linear polarisierten elektromagnetischen Welle in einem optisch einachsigen Kristall, indem wir denjenigen Hauptschnitt betrachten, in dem der Vektor der Strahlrichtung (s.u.) liegt. Dann gibt es zwei Möglichkeiten. Bei der einen steht die elektrische Feldstärke senkrecht auf diesem Hauptschnitt (ordentliche Welle, ordinary wave, s.Abb.206, bei der anderen liegt sie in dieser Ebene (außerordentliche Welle, extraordinary wave, s.Abb.207). Wenn wir im Folgenden von der Strahlrichtung (ray direction) sprechen, meinen ~ der betreffenwir die Richtung des Energietransportes, d.h. des Poynting-Vektors S den elektromagnetischen Welle. Die Ausbreitungsrichtung der Welle (direction of wave propagation) ist dagegen die Richtung des Wellenvektors ~k, also der Normalen auf den Flächen gleicher Phase der elektromagnetischen Welle. Diese Normale wird in Abb. 209, S.382 als Wellennormale bezeichnet. Tabelle 73. Hauptwerte des Brechungsindexes verschiedener Kristalle bei Zimmertemperatur und λ0 = 589, 3 nm [LID90], [KOH96]. no ist der Brechungsindex für die ordentliche Welle, die ne gelten für die außerordentliche(n) Welle(n) Kristall Quarz (SiO2 , quartz) Kristallsystem trigonal optische Bezeichnung Kalkspat (CaCO3 , calcspar) Natriumnitrat Gips Glimmer, (NaNO3 , (CaSO4 · 2H2 O, ostindisch sodium nitrate) gypsum) (mica) trigonal trigonal monoklin monoklin n1 = 1, 5593 n2 = 1, 5944 n3 = 1, 5612 no = 1, 544 ne = 1, 553 no = 1, 658 no = 1, 5854 ne = 1, 486 ne = 1, 3369 n1 = 1, 5298 n2 = 1, 5228 n3 = 1, 5208 einachsigpositiv einachsig-negativ zweiachsig Bei der ordentlichen Welle steht die elektrische Feldstärke stets senkrecht auf der optischen Achse (s.Abb.206a, S.380), so dass die in Frage kommende relative Dielek- 23.2 Natürliche Doppelbrechung 379 trizitätskonstante und damit der zugehörige Brechungsindex no unabhängig vom Winkel ϑ zwischen der Ausbreitungsrichtung und der optischen Achse ist: Das Licht breitet sich in allen Richtungen mit der gleichen Geschwindigkeit (c0 /no ) aus. Im Gegensatz dazu (s.Abb.207) hängt bei der außerordentlichen Welle die relative Dielektrizitätskonstante in Richtung des elektrischen Feldes von ϑ ab. Dies bedeutet, dass auch der Brechungsindex n und damit die Lichtgeschwindigkeit (c0 /n) von ϑ abhängen, woraus die Bezeichnung ”außerordentlich” resultiert. Wie man aus Abb.207b leicht ablesen kann, folgt für die Lichtgeschwindigkeit der außerordentlichen Welle in Richtung der optischen Achse c0 /no und senkrecht dazu c0 /ne . In Richtung der optischen Achse (ϑ = 0) besitzt die außerordentliche Welle also die gleiche Geschwindigkeit wie die ordentliche Welle (c0 /no ). Wenn die Geschwindigkeit der außerordentlichen Welle in allen anderen Richtungen größer ist, dies bedeutet ne < no , dann nennt man den Kristall einachsig-negativ (negative uniaxial), ansonsten einachsig-positiv (s.Tab.73). Die Abb.207b zeigt demzufolge die Verhältnisse für einen einachsig-negativen Kristall. Der außerordentliche Brechungsindex einer Welle, deren Normale den Winkel ϑ mit der optischen Achse einschließt, ist gegeben durch 1 sin2 ϑ cos2 ϑ = + . n2 (ϑ) n2e n2o (521) ~ D ~ = ε0 ↔ ~ H, ~ B ~ = µ0 H ~ einer sich im Kristall ausbreitenden ebenen ε r E, Die Felder E, Welle mit der Kreisfrequenz ω und dem Wellenvektor ~k besitzen alle den Phasenfaktor ~ = 0 liefert die Bedingung ~k · D ~ = 0, d. exp{−i(ωt − ~k · ~r )}. Die Maxwell-Gleichung div D ~ ~ h. der D-Vektor der Welle steht senkrecht auf dem Wellenvektor k. Wir betrachten einen nichtabsorbierenden, optisch einachsigen Kristall mit der z-Achse als der Symmetrieach↔ se. Der Tensor der relativen Dielektrizitätskonstanten ε r ist dann diagonal und besitzt die Hauptachsenwerte εxx = εyy = n2o und εzz = n2e , (s. Gl. 464, S.316). Die Energiedichte des elektrischen Feldes der Welle im Kristall, ausgedrückt durch den Vektor ~ Bei festgehaltenem Wert der Energie~ ist gegeben durch Wel = 1/(2ε0 )D ~ (↔ ε r )−1 D. D, ~ auf dem Ellipsoid dichte Wel = Wel0 liegen die möglichen Endpunkte der Vektoren D 2 2 2 2 2 (Dx + Dy )/no + Dz /ne = 2ε0 Wel0 . Der Vektor der außerordentlichen Welle schwingt in der von der optischen Achse und von ~k aufgespannten Ebene (dies sei die x-z-Ebene) und steht senkrecht auf dem Wellenvektor ~k, der mit der z-Achse den Winkel ϑ einschließen soll. Die Schnittkurve der x-z-Ebene mit dem obigen Ellipsoid ist eine Ellipse. Normiert man diese zu x2 /n2o + z 2 /n2e = 1, so ergibt der Abstand des Mittelpunkts der Ellipse zum Punkt x = n(ϑ) · sin(π/2 − ϑ), z = n(ϑ) · cos(π/2 − ϑ) auf dem Umfang der Ellipse gerade die Brechzahl der außerordentlichen Welle n(ϑ), da die Schwingungsrichtung von ~ mit der z-Richtung den Winkel π/2 − ϑ bildet. Setzt man die Werte für x und z in D die Ellipsengleichung ein, erhält man die gesuchte Gl.(521). 380 23 Polarisation des Lichtes optische Achse optische Achse Wellennormale c0 /no a) b) optische Achse optische Achse Wellennormale c0 /no c0 /n c0 /ne a) b) Abbildung 206. a) Zur Ausbreitung linear polarisierten Lichtes in einem optisch einachsigen Kristall. Die elektrische Feldstärke stehe senkrecht auf der durch die optische Achse und die Ausbreitungsrichtung aufgespannten Ebene, was durch die Punkte angedeutet wird (ordentliche Welle). In diesem Fall ist die Lichtgeschwindigkeit c0 /no unabhängig vom Winkel ϑ zwischen der Ausbreitungsrichtung und der optischen Achse (s.Abb.b) Abbildung 207. a) Zur Ausbreitung linear polarisierten Lichtes in einem optisch negativ einachsigen Kristall. Die elektrische Feldstärke und die dielektrische Verschiebung (durch die Striche angedeutet) liegen in der durch die optische Achse und die Ausbreitungsrichtung aufgespannten Ebene (außerordentliche Welle). In diesem Fall hängt die Lichtgeschwindigkeit vom Winkel ϑ zwischen der Ausbreitungsrichtung und der optischen Achse ab (s.Abb.b). In optisch zweiachsigen Kristallen gibt es keine ordentliche Welle, sondern zwei außerordentliche Wellen. Diese sind senkrecht zueinander linear polarisiert und ihre Geschwindigkeiten stimmen in zwei Richtungen, den beiden optischen Achsen, überein. Um die Brechung des Lichtes beim Eintritt vom Vakuum in einen optisch einachsigen Kristall zu behandeln, betrachten wir denjenigen Hauptschnitt, der senkrecht zur Kristalloberfläche steht. Das heißt, die optische Achse liegt in der Einfallsebene und bildet mit der Oberflächennormalen einen beliebigen Winkel γ (s.Abb.208). Wenn das einfallende Licht linear polarisiert ist, und zwar in der Weise, dass die elektrische Feldstärke senkrecht zur Einfallsebene steht, so muss sich das Licht im Kristall als ordentliche Welle fortpflanzen. Im Snellius’schen Brechungsgesetz (s.Gl.(446), S.305) ist also n1 = 1 (Vakuum) und n2 = no (ordentliche Welle) einzusetzen, d.h. es gilt sin α1 / sin α2 = no . Liegt dagegen die elektrische Feldstärke in der Einfallsebene, so folgt sin α1 / sin α2 = n(ϑ), wobei n nach Abb.207b eine Funktion des Winkels zwischen der Wellennormalen und der optischen Achse (ϑ = γ + α2 ) ist (s. Gl.(521)). 23.2 Natürliche Doppelbrechung α1 γ he isc hse t op Ac 381 Vakuum einachsiger Kristall α2 Abbildung 208. Zur Brechung des Lichtes beim Eintritt in einen optisch einachsigen Kristall Da man natürliches, d.h. unpolarisiertes Licht stets in zwei senkrecht zueinander linear polarisierte Wellen zerlegen kann, ergibt sich bei der Brechung von natürlichem Licht die folgende Erscheinung, die man als Doppelbrechung (birefringence oder double refraction) bezeichnet: Ein einfallender Lichtstrahl spaltet in zwei gebrochene Strahlen auf, die beide linear polarisiert sind. Der eine Strahl, bei dem die elektrische Feldstärke senkrecht zur Einfallsebene steht, gehorcht dem Snellius’schen Brechungsgesetz mit dem ordentlichen Brechungsindex no . Er wird deshalb als ordentlicher Strahl bezeichnet. Bei dem anderen Strahl liegt die elektrische Feldstärke ebenso wie die elektrische Verschiebung in der Einfall~ und D ~ sind aber in diesem Fall nicht mehr parallel zueinander, sondern sebene. E bilden einen Winkel δ miteinander. Um denselben Winkel weicht die Strahlrichtung (s.S.378) von der Ausbreitungsrichtung der Welle (Normale auf den Ebenen gleicher Phase) ab. Den Verlauf des außerordentlichen Strahls kann man mit Hilfe des Huygens-Prinzips (s.S.363ff.) konstruieren. Die Abb.209 zeigt dies für den Spezialfall α1 = 0. Die Doppelbrechung kann benutzt werden, um linear polarisiertes Licht zu erzeugen. Dies ist am einfachsten dann möglich, wenn der ordentliche und der außerordentliche Strahl unterschiedlich stark von dem betreffenden Kristall absorbiert werden (Dichroismus, dichroism). Ein klassischer Vertreter dieser Gruppe ist der grüne Turmalin (tourmaline). Bestrahlt man eine ca. 1 mm dicke Turmalinplatte senkrecht mit natürlichem Licht, dann wird der ordentliche Strahl praktisch vollständig absorbiert und nur der außerordentliche hindurch gelassen. Als Polaroid-Filter (polaroid) bezeichnet man eine Kunststofffolie, in die langgestreckte, dichroitische Moleküle eingelagert sind. Durch Dehnung oder Einwirkung elektrischer Felder werden diese Moleküle bei der Herstellung der Folie so ausge- 382 23 Polarisation des Lichtes Vakuum e ch tis se p o ch A Kristall Abbildung 209. Konstruktion des außerordentlichen Strahls unter Verwendung des Huygens-Prinzips. Eine linear polarisierte Welle, deren elektrische Feldstärke in der Einfallsebene liegt, treffe senkrecht auf die Oberfläche eines einachsig-negativen Kristalls. Die gepunkteten bzw. gestrichelten Strecken entsprechen den Lichtgeschwindigkeiten c0 /no bzw. c0 /ne . Während sich die WelWellen− E lenfronten (Flächen gleicher Phase) im front Kristall in die gleiche Richtung wie im D δ Poynting− Vakuum bewegen (Ausbreitungsrichtung der Welle, s.S.378), weicht die StrahlrichVektor Wellennormale tung (s.S.378) davon ab richtet, dass das Material als Ganzes wie ein dichroitischer Kristall wirkt. Solche Polaroid-Filter lassen sich großflächig herstellen, jedoch liegt der Polarisationsgrad (degree of polarization), d.h. der prozentuale Anteil der Intensität des linear polarisierten Lichtes, meist unter 99%. Für exakte Messungen reicht dies nicht aus. Man muss dann Polarisationsprismen (polarization prisms) verwenden, bei denen durch eine geeignete geometrische Anordnung der ordentliche und der außerordentliche Strahl räumlich voneinander getrennt werden. Das erste brauchbare Polarisationsprisma wurde von William Nicol (1768-1851) entwickelt. Dieses Nicol-Prisma (Nicol prism) hat, infolge der schräg stehenden Endflächen, den Nachteil, dass der durchgehende außerordentliche Strahl parallel verschoben ist. Außerdem sind diese Prismen relativ lang. Abbildung 210. Glan-Thompson-Prisma. Der Doppelpfeil bezeichnet, wie üblich, die optische Achse. Der an der Schicht (Kanadabalsam) zwischen den beiden Kalkspatkristallen total reflektierte ordentliche Strahl wird an der geschwärzten Seitenwand absorbiert, so dass nur der außerordentliche Strahl hindurch tritt Am häufigsten wird heute das in der Abb.210 dargestellte Glan-ThompsonPrisma (Glan-Thompson prism, Paul Glan 1846-1898, Silvanus Philipps Thompson 1851-1916) benutzt, das senkrecht stehende Endflächen besitzt. Es handelt sich um einen Kalkspatkristall, den man zunächst so schleift, dass die Endflächen parallel zur 23.3 Zirkular und elliptisch polarisiertes Licht 383 optischen Achse stehen. Danach wird er diagonal durchgeschnitten und anschließend wieder mit einem durchsichtigen Klebstoff verkittet, dessen Brechungsindex zwischen den beiden Werten für Kalkspat (1,486 und 1,658, s.Tab.73, S.378) liegen muss. Gut geeignet dafür ist Kanadabalsam (Canada balsam) mit einem Brechungsindex n = 1, 542. Treffen der parallel verlaufende ordentliche und außerordentliche Strahl an die verkittete Grenzfläche, so wird der ordentliche Strahl (wegen no > n) total reflektiert und der außerordentliche Strahl infolge der normalen Brechung (wegen ne < n) an der dünnen Schicht Kanadabalsam nur geringfügig seitlich versetzt. Durch Schwärzung der Seitenwand des Prismas erreicht man eine fast vollständige Absorption des ordentlichen Strahls und damit einen Polarisationsgrad von nahezu 100%. Ü 147 Ü 148 Ü 149 Ü 150 23.3 Zirkular und elliptisch polarisiertes Licht Wir betrachten eine Platte, die aus einem optisch einachsigen Kristall so heraus geschnitten ist, dass die optische Achse parallel zur Oberfläche liegt. Damit geht senkrecht auffallendes Licht unabhängig von seiner Polarisationsrichtung ungebrochen durch diese Platte hindurch, jedoch besitzen der ordentliche und der außerordentliche Strahl, in den das Licht durch den Kristall zerlegt wird, beim Austritt aus der Platte eine Phasenverschiebung α (Verzögerungsplatte, retardation plate). Nennen wir die Vakuumwellenlänge des Lichtes λ0 , die Dicke der Platte `, den Brechungsindex für den ordentlichen Strahl no und für den außerordentlichen Strahl ne , so gilt α = 2π ` (no − ne ). λ0 (522) Wir bezeichnen mit λor die Wellenlänge des ordentlichen Strahles in dem Kristall, aus dem die Platte gefertigt wurde. Dann erfährt der ordentliche Strahl beim Durchlaufen dieser Platte die Phasenverschiebung 2π`/λor . Analog folgt für den außerordentlichen Strahl, dessen Wellenlänge λau genannt werde, 2π`/λau . Wegen λor = λ0 /no und λau = λ0 /ne (s.S.379) ergibt sich für die Differenz α dieser beiden Phasenverschiebungen die Gl.(522). Im Spezialfall |α| = π/2 spricht man von einem λ/4-Plättchen (quarter-wave plate) und bei |α| = π von einem λ/2-Plättchen (half-wave plate). Ein λ/4-Plättchen verwandelt i.Allg. linear polarisiertes in elliptisch polarisiertes Licht. Bei entsprechender Justierung ist dieses Licht zirkular polarisiert. Umgekehrt entsteht linear polarisiertes Licht, wenn man zirkular polarisiertes Licht durch das λ/4-Plättchen schickt. 384 23 Polarisation des Lichtes Wir lassen das linear polarisierte Licht so auf das λ/4-Plättchen fallen, dass die elektrische Feldstärke um π/4 gegenüber der optischen Achse geneigt ist. Dann besitzen der ordentliche und der außerordentliche Strahl die gleiche Amplitude. Beim Austritt aus dem λ/4-Plättchen überlagern sich also zwei Wellen, die die gleiche Ausbreitungsrichtung, die gleiche Amplitude und eine Phasenverschiebung von π/2 besitzen Dies ist aber gerade eine zirkular polarisierte Welle (s.S.370). Umgekehrt ergibt sich beim Auftreffen einer zirkular polarisierten Welle nach dem Durchgang durch das λ/4-Plättchen linear polarisiertes Licht. Wenn der Winkel zwischen der elektrischen Feldstärke der einfallenden Welle und der optischen Achse zwischen 0 und π/4 liegt, entsteht am Ausgang elliptisch polarisiertes Licht. Um ein λ/4-Plättchen herzustellen, muss dieses nach Gl.(522) eine Dicke λ = (λ0 /4)· |no −ne |−1 besitzen. Für Kalkspat und λ0 = 589, 3 nm bedeutet dies (s.Tab.73, S.378) λ = 0, 86 mm, während sich für Quarz λ = 16, 4 mm ergibt. Da die Herstellung sehr dünner Plättchen technisch schwieriger ist, bestehen die λ/4-Plättchen meist aus Quarz. Durch Verwendung eines Polarisationsfilters (polarizing filter), wie z.B. eines Polarisationsprismas, und eines λ/4-Plättchens lässt sich feststellen, ob ankommendes Licht linear polarisiert (linearly polarized light) (l), zirkular polarisiert (circularly polarized light) (z), elliptisch polarisiert (elliptically polarized light) (e) oder unpolarisiert (unpolarized light) (u) ist oder welche Mischung aus diesen verschiedenen Lichtarten vorliegt (Polarisationsanalyse, polarization analysis, s. die Tab.74). Mit Hilfe eines λ/2-Plättchens kann man die Polarisationsebene linear polarisierten Lichtes um einen vorgegeben Winkel ∆φ drehen. Eine einfache Überlegung zeigt, dass dies erreicht wird, wenn der Winkel β zwischen der elektrischen Feldstärke des einfallenden Lichtes und der optischen Achse der Beziehung β = ∆φ/2 (523) genügt. Die elektrische Feldstärke des einfallenden Lichtes besitze die Amplitude Ê und bilde mit der optischen Achse den Winkel β. Dann folgt für die Amplitude des ordentlichen Strahles Ê⊥ = Ê sin β und für die des außerordentlichen Strahles Êk = Ê cos β. Nach Durchlaufen des λ/2-Plättchens gilt für die Komponente der elektrischen Feldstärke senkrecht bzw. parallel zur optischen Achse E⊥ = Ê sin β cos(ωt − 2π`no /λ0 ) bzw. Ek = Ê cos β cos(ωt − 2π`ne /λ0 ). Wegen π = 2π(`/λ0 )(no − ne ) lässt sich die Gleichung für E⊥ umschreiben in E⊥ = Ê sin β cos ωt − 2π`ne /λ0 ) − π], woraus man wegen cos(γ − π) = − cos γ die Beziehung E⊥ = −Ê sin β cos(ωt − 2π`ne /λ0 ) erhält. Die Richtung der elektrischen Feldstärke hat sich also nach Durchgang durch das λ/2-Plättchen um den Winkel 2β gedreht. Ü 151 Ü 152 Ü 153 23.4 Künstliche Doppelbrechung 385 Tabelle 74. Schema einer Polarisationsanalyse zur Feststellung, ob Licht linear polarisiert (l), zirkular polarisiert (z), elliptisch polarisiert (e) oder unpolarisiert (u) ist oder welche Mischung aus diesen verschiedenen Lichtarten vorliegt 1. Experiment: Verwendung eines Polarisationsfilters Änderung der Lichtintensität bei Drehung des Polarisa- Lichtart tionsfilters Auslöschung keine Abhängigkeit Minimum l u, z oder ( u+z ) e, ( u+e ) oder ( u+l ) 2. Experiment: Vor das Polarisationsfilter wird ein λ/4-Plättchen gesetzt, das um die Richtung des einfallenden Strahles gedreht werden kann (Drehwinkel β) Im 1. Experiment hat sich keine Abhängigkeit ergeben, d.h. es liegt u, z oder ( u+z ) vor Änderung der Lichtintensität bei Drehung des Polarisationsfilters für beliebige Werte von β Lichtart keine Abhängigkeit Auslöschung Minimum u z u+z Im 1. Experiment hat sich ein Minimum ergeben, d.h. es liegt e, ( u+e ) oder ( u+l) vor Änderung der Lichtintensität bei Drehung des Polarisationsfilters für einen bestimmten Wert von β Lichtart Auslöschung Minimum keine Abhängigkeit e u+e u+l 23.4 Künstliche Doppelbrechung Stoffe, die von Natur aus optisch isotrop sind, können durch die Einwirkung äußerer Kräfte (mechanische Verformung, Strömung, elektrische oder magnetische Felder) doppelbrechend werden. Die Spannungsdoppelbrechung (photoelasticity oder strain double refraction) wird vor allem bei Kunststoffen und Gläsern beobachtet. In der Zugrichtung vergrößert sich der Abstand der Moleküle, wodurch der Brechungsindex kleiner wird, wogegen er sich senkrecht dazu vergrößert. Zur experimentellen Untersuchung des Spannungszustandes mechanisch belasteter Bauteile, wie z.B. eines Kranhakens, stellt man ein Modell aus durchsichtigem Kunststoff her. Bringt man dieses Modell zwischen gekreuzte Polarisationsfilter, so wird bei Belastung das ansonsten schwarze Gesichtsfeld an den kritischen Stellen aufgehellt. Eine andere Anwendung findet die Spannungsdoppelbrechung bei der Untersuchung von gläsernen Bauteilen (Linsen, Glasküvetten usw.), da rasch abgekühlte Gläser unter permanenten inneren Spannungen stehen. Die Verringerung dieser Spannungen durch wiederholtes langsames Aufheizen und Abkühlen (Anlassen, annealing) lässt sich mit Hilfe der Spannungsdoppelbrechung kontrollieren. 386 23 Polarisation des Lichtes Legt man ein elektrisches Feld an eine Substanz an, die aus polaren, beweglichen Molekülen besteht, wie z.B. Nitrobenzol oder Schwefelkohlenstoff, so wird diese doppelbrechend mit der optischen Achse in Richtung des elektrischen Feldes (Kerr-Effekt, Kerr effect, John Kerr 1824-1907). Für die Differenz aus dem Brechungsindex der ordentlichen (no ) und der außerordentlichen (ne ) Welle gilt no − ne = K E λ0 E 2 , (524) wobei E die elektrische Feldstärke und λ0 die Vakuumwellenlänge bezeichnet. KE nennt man Kerr-Konstante (Kerr constant). Sie hängt vom Material ab und verringert sich mit wachsender Temperatur (s. Boltzmann-Verteilung, S.103ff). Für Nitrobenzol (C6 H5 NO2 ) bei Zimmertemperatur und λ0 = 589, 3 nm findet man KE = 2, 48 · 10−12 m/V2 . Die Zeitkonstante für die Ausbildung und den Abbau der Doppelbrechung ist sehr kurz, sie liegt in der Größenordnung der thermischen Umorientierungszeiten der Moleküle (10−10 s). Aus diesem Grund lassen sich, indem man eine Kerr-Zelle zwischen gekreuzte Polarisationsfilter setzt, Lichtschalter oder Lichtmodulatoren (Kerr shutter) bis zu Modulationsfrequenzen von mehreren hundert MHz realisieren. Legt man an Stelle des elektrischen Feldes E ein Magnetfeld H an, so entsteht ebenfalls eine Doppelbrechung (Cotton-Mouton-Effekt, Cotton-Mouton effect, Aimé Cotton 1869-1951, Jean Louis Mouton 1844-1879). Für diese gilt analog zu Gl.(524) no − ne = K C λ0 H 2 . (525) KC heißt Cotton-Mouton-Konstante (Cotton-Mouton constant). Allerdings ist dieser Effekt wesentlich schwächer (KC = 3, 81 · 10−14 m/A2 für Nitrobenzol bei Zimmertemperatur und λ0 = 589, 3 nm) und langsamer, so dass er praktisch keine Anwendung gefunden hat. Abschließend sei erwähnt, dass sowohl die natürliche als auch die künstliche Doppelbrechung in der Mikroskopie zur Erhöhung von Kontrasten Verwendung findet, indem man das Objekt zwischen gekreuzte Polarisationsfilter bringt (Polarisationsmikroskop, polarization microscope). Ü 154 23.5 Optische Aktivität 23.5.1 Drehung der Polarisationsebene Unter optischer Aktivität (optical activity) versteht man die Fähigkeit bestimmter Stoffe, die Schwingungsebene linear polarisierten Lichtes beim Durchgang durch diese Stoffe zu drehen. Zur Messung verwendet man ein Polarimeter (polariscope oder polarimeter). Die einfachste Ausführungsform besteht aus einer Lichtquelle, deren Licht durch eine geeignete Optik parallel gemacht wird (Kollimator, collimator), einem ersten Polarisationsfilter (Polarisator, polarizer) und einem zweiten, 23.5 Optische Aktivität 387 drehbar angeordneten Polarisationsfilter (Analysator, analyzer). Der zu untersuchende Stoff wird zwischen den Polarisator und den zunächst um 90° gedrehten Analysator gebracht, so dass es zu einer Aufhellung des Gesichtsfeldes kommt. Durch Nachdrehen des Analysators um einen Winkel α wird wieder Dunkelheit erzeugt. Erfolgt die Drehung für den dem Lichtstrahl entgegen blickenden Beobachter im Uhrzeigersinn (der Drehwinkel α ist negativ), so nennt man die Substanz rechtsdrehend (right rotating oder dextrorotatory) und im anderen Fall linksdrehend (left rotating oder laevorotatory). Auf diese Weise lassen sich Drehungen der Polarisationsebene mit einer Genauigkeit von ca. 0,1° messen. Drehungen der Polarisationsebene werden bei einigen Festkörpern beobachtet, bei Lösungen optisch aktiver Moleküle, bei Flüssigkristallen und bei beliebigen Stoffen, wenn man in Strahlrichtung ein Magnetfeld anlegt. Da sich eine linear polarisierte Welle in eine rechtszirkular und eine linkszirkular polarisierte Welle gleicher Amplitude zerlegen lässt, kann man die Drehung dadurch erklären, dass diese beiden Wellen unterschiedliche Geschwindigkeiten (cR und cL ) besitzen. Führt man noch unter Verwendung der Vakuumlichtgeschwindigkeit c0 die Brechungsindizes nR = c0 /cR und nL = c0 /cL ein, so ergibt sich für den Winkel α, um den die Schwingungsebene nach Durchlaufen der Strecke ` gedreht ist, α= π` (nR − nL ), λ0 (526) wobei λ0 die Vakuumwellenlänge des Lichtes darstellt. ~ R der sich entlang der z-Achse ausbreitenden rechtszirFür die elektrische Feldstärke E ~ R (t, z) = ~ex Ê sin ωt−(2πnR /λ0 )z]+~ey Ê cos ωt− kular polarisierten Welle gilt (s.S.370) E ~ L (t, z) = ~ex Ê sin ωt − (2πnR /λ0 )z] und analog für die linkszirkular polarisierte Welle E (2πnL /λ0 )z] −~ey Ê cos ωt − (2πnR /λ0 )z]. Nach Durchlaufen der Strecke z ergibt sich also ~ z) = E ~ R (t, z) + E ~ L (t, z). Unter Verwendung der Additionstheoreme sin β + sin γ = E(t, 2 sin[(β + γ)/2] cos[(β − γ)/2] und cos β − cos γ = −2 sin[(β + γ)/2] sin[(β − γ)/2] folgt ~ z) = 2Ê sin ωt − πz(nR + nL )/λ0 ]{~ex cos[πz(nR − nL )/λ0 ] + ~ey sin[πz(nR − damit E(t, nL )/λ0 ]}. Für z = 0 ist die Amplitude demzufolge gleich 2Êx und für z = λ gleich 2Ê{~ex cos[πλ(nR − nL )/λ0 ] + ~ey sin[πλ(nR − nL )/λ0 ]}, so dass die Schwingungsebene um den Winkel α = πλ(nR − nL )/λ0 gedreht wurde (s.Abb.211). Die experimentell gefundene Tatsache, dass die Differenz der Brechungsindizes nR − nL von der Vakuumwellenlänge abhängt, bezeichnet man als optische Rotationsdispersion (optical rotary dispersion, abgekürzt mit ORD). Es ist üblich, an Stelle der Größe nR − nL den Drehwinkel in Grad (degree, Symbol °) pro durchstrahlter Schichtdicke ` anzugeben. Diese Größe (Kα ) wird Drehvermögen (optical rotation) genannt. Nach Gl.(526) gilt unter Beachtung der Tatsache, dass 180° dem Winkel π rad entsprechen, 388 23 Polarisation des Lichtes y Abbildung 211. Eine linear polarisierte Welle, deren Schwingungsebene mit der x − z−Ebene zusammenfalle, breite sich in z-Richtung aus, d.h. auf den Beobachter zu. Nach Durchlaufen einer optisch aktiven Schicht mit der Dicke λ sei die Schwingungsebene um den Winkel α gedreht. Für α > 0 ist der Stoff definitionsgemäß (s.S.386) linksdrehend und es gilt nach Gl.(526) nR > nL α z x Kα = 180◦ (nR − nL ). λ0 (527) Einige Messwerte für optisch aktive Festkörper (optically active solids) zeigt die Tab.75. Dabei erfolgt die Drehung nur dann, wenn die Strahlrichtung mit der optischen Achse zusammenfällt. Bei Quarz existieren sowohl rechts- als auch linksdrehende Kristalle. Tabelle 75. Das Drehvermögen Kα einiger optisch aktiver Festkörper bei 20 °C Vakuumwellenlänge λ0 / nm Festkörper Zinnober (HgS, cinnabar) Quarz (SiO2 , quartz) Natriumchlorat (NaClO3 , sodium chlorate) 486,1 589,3 686,7 32,8 4,67 21,7 3,13 15,7 2,27 780,8 325 12,7 Eine Drehung der Schwingungsebene zeigen auch Flüssigkeiten und Lösungen, sofern sie asymmetrische Moleküle enthalten. Die Asymmetrie muss aber derart beschaffen sein, dass von dem Molekül ein Spiegelbildisomer (optical isomer oder enantiomer) existiert, wie dies schematisch in der Abb.212 dargestellt ist. Das eine Isomer dreht die Schwingungsebene des Lichtes in der einen, das andere in der entgegengesetzten Richtung, jedoch um den gleichen Betrag. Beispiele sind der Traubenzucker (glucose, dextrose), der rechts dreht, und der linksdrehende Fruchtzucker (fructose oder laevulose). Beide Zucker besitzen die gleiche Summenformel C6 H12 O6 . Ein Gemisch rechts- und linksdrehender Isomere gleicher Konzentration nennt man Racemat (racemate); es bewirkt keine Drehung der Schwingungsebene. 23.5 Optische Aktivität A B 389 A D C D B C Abbildung 212. Spiegelbildisomere eines Moleküls bestehend aus den Bauteilen (Atome, Molekülgruppen) A, B, C und D in tetraedrischer Anordnung Rohrzucker (saccharose, sucrose), der durch chemische Verbindung von Traubenund Fruchtzucker unter Wasseraustritt entsteht (C12 H22 O11 ), dreht die Schwingungsebene nach rechts. Der Drehwinkel von Lösungen ist proportional zur Konzentration der optisch aktiven Moleküle. Dies nutzt man aus, um z.B. bei zuckerkranken Personen die Konzentration des Zuckers (Traubenzucker) im Harn zu bestimmen. Besonders starke Drehungen der Schwingungsebene werden bei optisch anisotropen Flüssigkristallen beobachtet. Flüssigkristalle (liquid crystals) sind Flüssigkeiten, die aus langgestreckten Molekülen bestehen, die in gewissen Temperaturbereichen geordnet sind. Es gibt im Wesentlichen drei Typen, die man als nematische (nematic), smektische (smectic) und cholesterische (cholesteric) Flüssigkristalle bezeichnet. nematisch smektisch p0 2 cholesterisch Abbildung 213. Molekülorientierung in nematischen, smektischen und cholesterischen Flüssigkristallen, p0 ist die Ganghöhe (pitch) des cholesterischen Flüssigkristalls Wenn bei einem cholesterischen Flüssigkristall die Wellenlänge λ des Lichtes klein gegen das Produkt p = p0 · |no − ne | aus Ganghöhe p0 (pitch) und Brechzahlanisotropie |no − ne | ist, dann dreht sich die Schwingungsebene entsprechend der Schraubung (adiabatischer Fall). Für λ ≈ p wird diejenige zirkular polarisierte Welle, deren Drehsinn mit dem der Molekülordnung übereinstimmt, reflektiert. Wenn schließlich die Wellenlänge λ groß gegen p ist, kommt es wieder zu einer Drehung 390 23 Polarisation des Lichtes der Schwingungsebene, jedoch hängen Drehsinn und Betrag der Drehung in komplizierter Weise von λ und p0 sowie den Brechungsindizes für die ordentliche und die außerordentliche Welle ab, wobei die optische Achse durch die Schraubenrichtung gegeben ist [DEG74]. Cholesterische Flüssigkristalle besitzen Ganghöhen von ca. 0,2 µm bis ∞. Bei p = 3, 6 µm gilt für sichtbares Licht λ p und es ergibt sich ein Drehwinkel von 105 Grad pro mm Schichtdicke (!). Bei den heute weit verbreiteten Flüssigkristallanzeigen (liquid-crystal displays, abgekürzt mit LCD) befindet sich ein nematischer Kristall in einer 5 µm bis 15 µm dicken Schicht zwischen zwei Glasplättchen. Diese sind innen mit lichtdurchlässigen Elektroden überzogen, die so präpariert wurden, z.B. durch Einritzen von Furchen, dass sich die Moleküle in einer Vorzugsrichtung anlagern. Sind die beiden Vorzugsrichtungen um 90° gegeneinander verdreht, dann ordnen sich die Moleküle in der Schicht schraubenförmig, wie bei einem cholesterischen Flüssigkristall, an. Setzt man nun noch vor dieses Plättchenpaar eine Polarisationsfolie (Polarisator) und dahinter eine zweite aber um 90° gedrehte Polarisationsfolie (Analysator), so geht das Licht durch diese Zelle (TN-Zelle, twisted nematic cell) hindurch, da der Flüssigkristall die Schwingungsebene ja gerade um 90° dreht. Wenn man aber zwischen die beiden Elektroden eine geringe Spannung von ca. 1,5 V bis 5 V anlegt, dann orientieren sich die Moleküle in Richtung des elektrischen Feldes, also senkrecht zu den Plättchen. Die Drehung der Schwingungsebene entfällt und die TN-Zelle wird lichtundurchlässig. Man kann aber auch - und dies ist meist der Fall - in Reflexion arbeiten, indem man unmittelbar hinter die Analysatorfolie einen Aluminiumspiegel setzt. Werden die Elektroden schließlich noch in einzelne geometrische Segmente mit getrennten Spannungszuführungen unterteilt, so lassen sich die bekannten dunklen Ziffernsymbole vor einem grauen Hintergrund (diffus von dem Aluminiumspiegel reflektiertes Licht) erzeugen. Der besondere Vorteil der LCD’s ist der geringe Leistungsbedarf von nur etwa 5 mW/m2 . Bringt man eine isotrope Substanz, wie z.B. Glas oder Schwefelkohlenstoff, in eine stromdurchflossene Spule und schickt einen linear polarisierten Lichtstrahl hindurch, so wird die Schwingungsebene gedreht. Diese Erscheinung nennt man Magnetorotation (magnetorotation) oder Faraday-Effekt (Faraday effect, Michael Faraday 1791-1867). Der Drehwinkel α ist proportional zur Dicke ` der durchstrahlten Substanz und zur Komponente BS der magnetischen Flussdichte in Strahlrichtung. Man schreibt α = KV ` B S . (528) Die Größe KV heißt Verdet-Konstante (Verdet constant, Marcel Emile Verdet 1824-1866). Sie ist eine von der Wellenlänge und der Temperatur abhängige Stoffkonstante (s.Tab.76). Die Gl.(528) besagt, dass für KV > 0 die Schwingungsebene die gleiche Schraubung erfährt wie der felderzeugende Strom. 23.5 Optische Aktivität 391 Tabelle 76. Verdet-Konstante KV für einige Stoffe bei Zimmertemperatur und λ0 = 589, 3 nm Stoff KV / (rad T−1 m−1 ) Steinsalz (NaCl, sodium chloride) Schwefelkohlenstoff (CS2 , carbon disulphide) Wasser (H2 O, water) Kohlendioxid (CO2 , carbon dioxide) bei 0,1MPa 10,8 12,3 3,8 0,0025 Wir betrachten einen linear polarisierten Lichtstrahl, der eine Spule in der positiven zRichtung durchsetzt. Der felderzeugende Strom soll mit der Strahlrichtung eine Rechtsschraube bilden, so dass nach der Korkenzieherregel (s.S.199) BS größer als null ist. Damit ergibt sich aus Gl.(528) α > 0, was nach der Festlegung von S.386 einer Linksdrehung der Schwingungsebene entspricht (s.Abb.211, S.388). Bei diamagnetischen Stoffen lässt sich die Drehung klassisch auf die Beeinflussung der Elektronenbewegung durch das magnetische Feld zurückführen. Es ergibt sich für die Verdet-Konstante eine Proportionalität zur negativen Ableitung der Brechzahl nach der Vakuumwellenlänge (s.Gl.(531), S.394). Im Spektralbereich normaler Dispersion, d.h. wenn dn/dλ0 < 0 gilt (s.S.312), folgt damit KV > 0. Für paramagnetische oder ferromagnetische Stoffe, d.h. Substanzen mit ungepaarten Elektronen, wie z.B. Salze von Übergangsmetallionen sowie ihre Lösungen, ist die Verdet-Konstante meist negativ. Die Tatsache, dass beim Faraday-Effekt, im Gegensatz zu den bisher behandelten Drehungen der Polarisationsebene, der Drehwinkel sein Vorzeichen ändert, wenn man die Strahlrichtung umkehrt (BS in Gl.(528) wird zu −BS ), hat interessante Konsequenzen, auf die im nächsten Abschnitt näher eingegangen wird. 23.5.2 Nichtreziproke Bauelemente Ein ideales nichtreziprokes Bauelement (nonreciprocal unit) überträgt einen Energiestrom in der einen Richtung ungeschwächt, in der anderen jedoch gar nicht. Das bekannteste Beispiel aus der Mechanik ist das Ventil (valve), das einen Massenstrom nur in einer Richtung passieren lässt. Ein optisches Ventil (optical valve) kann man unter Verwendung des Faraday-Effektes durch folgende Anordnung realisieren: Die magnetische Flussdichte BS der Feldspule und die Dicke ` der durchstrahlten Substanz werden so gewählt, dass der Drehwinkel α (s.Gl.(528)) für die beiden Strahlrichtungen π/4 bzw. −π/4 beträgt. Links und rechts von der Feldspule werden außerdem Polarisationsfilter angebracht, deren Durchlassrichtungen gegeneinander um den Winkel π/4 verdreht sind. Auf diese Weise wird unpolarisiertes Licht, wenn es von der einen Richtung kommt, als linear polarisiertes Licht hindurch gelassen, in der anderen Richtung jedoch gesperrt. Praktische Anwendung findet dieses Prinzip in der Mikrowellentechnik beim Richtungsleiter (isolator). Da in Hohlleitern 414 25 Wärmestrahlung Raumwinkel dΩ abgestrahlt wird, die Beziehung dΦ = L cos ϑ da dΩ. Ü 157 (543) Ü 158 25.2 Strahlungsformeln Wir bezeichnen mit dΦf die Leistung, die von einem Flächenelement da im Frequenzintervall von f bis f + df bei der Temperatur T in den Raumwinkel dΩ abgestrahlt wird. Dann definiert man die spektrale Strahldichte (spectral radiance) Lf (ϑ, T ) durch die Gleichung dΦf = Lf cos ϑ da dΩ df. (544) Der Zusammenhang mit der in Tab.81 definierten Strahldichte L ergibt sich unter Beachtung von Gl.(543) zu Z ∞ Lf df = L. (545) 0 Der spektrale Absorptionskoeffizient (spectral absorptance) βf (ϑ, T ), der nicht mit dem auf S.397 eingeführten Extinktionskoeffizienten α verwechselt werden darf, ist das Verhältnis aus der Strahlungsleistung, die von einem Körper bei der Temperatur T im Frequenzintervall vonf bis f + df absorbiert wird, zu der Strahlungsleistung, die im gleichen Frequenzintervall unter dem Winkel ϑ auf den Körper fällt. Analog definiert man den spektralen Reflexionskoeffizienten (spectral reflectance) γf (ϑ, T ) so, dass βf + γf = 1 (546) gilt. Ein schwarzer Körper (black body) absorbiert per definitionem alle auffallende Strahlung. Für derartige Körper, die wir im Folgenden mit dem Index s kennzeichnen wollen, gilt also βf s = 1. (547) Ein schwarz gestrichener oder berußter Körper erfüllt die Bedingung (547) nur unvollkommen, sehr gut dagegen ein kleines Loch in der Wand eines innen geschwärzten Hohlkörpers (s.Abb.226). Lichtstrahlen, die durch das Loch ins Innere gelangen, werden vielfach reflektiert und wegen der Schwärzung der Wände jedesmal stark in ihrer Intensität geschwächt, weshalb nur eine geringe Wahrscheinlichkeit besteht, dass einfallendes Licht durch das Loch wieder nach außen gelangt. Dieses erscheint daher absolut schwarz. Heizt man aber die Wände des Hohlraums auf, so wird die aus der Öffnung austretende Strahlung bei höheren Temperaturen vom menschlichen Auge wahrgenommen: Das Loch beginnt bei Temperaturen ab ca. 650°C zu leuchten, 25.2 Strahlungsformeln 415 Abbildung 226. Praktische Realisierung eines schwarzen Körpers durch das Loch in der Wand eines innen geschwärzten Hohlkörpers. Die Seitenbleche sind ebenfalls geschwärzt und reduzieren zusätzlich die Wahrscheinlichkeit, dass einfallendes Licht wieder durch das Loch austritt. Wenn die absolute Temperatur T des Körpers größer als null ist, wirkt der schwarze Körper selbst als Strahler (Hohlraumstrahler, hohlraum radiator) zunächst tiefrot und schließlich grellweiß (Wien’sches Verschiebungsgesetz, s.S.420). Wegen der Realisierung des schwarzen Körpers durch derartige Hohlräume bezeichnet man die Strahlung des schwarzen Körpers, die schwarze Strahlung (blackbody radiation), auch oft als Hohlraumstrahlung (cavity radiation). Das Kirchhoff ’sche Strahlungsgesetz (Kirchhoff’s law of radiation, Gustav Robert Kirchhoff 1824-1887) besagt, dass die spektrale Strahldichte Lf eines beliebigen Körpers proportional zu seinem spektralen Absorptionskoeffizienten βf ist und dass die Proportionalitätskonstante für alle Körper den gleichen Wert besitzt. Auf Grund der Definition des schwarzen Körpers (s.Gl.(547)) folgt, dass diese Proportionalitätskonstante gleich der spektralen Strahldichte Lf s des schwarzen Körpers sein muss. Damit lässt sich das Kirchhoff’sche Strahlungsgesetz in der folgenden Form schreiben Lf = Lf s . βf (548) Das Kirchhoff’sche Strahlungsgesetz beweisen wir für den Spezialfall senkrechter Strahlung (ϑ = 0). Das betrachtete System bestehe aus einem Lichtwellenleiter (s.S.309), der auf der einen Seite senkrecht an die Oberfläche eines schwarzen Körpers und auf der anderen Seite senkrecht an die Oberfläche eines beliebigen Körpers angekoppelt ist. Beide Körper sollen nur über den Lichtwellenleiter Energie austauschen können und sich im thermischen Gleichgewicht bei der Temperatur T befinden. Der schwarze Körper emittiert dann im Frequenzintervall df die Strahlungsleistung ∆Φf s = Lf s Adf ∆Ω, wobei A die Querschnittsfläche des Lichtwellenleiters und ∆Ω das Intervall des Raumwinkels bezeichnet, in dem der Lichtwellenleiter die Strahlung überträgt (s. den kleingedruckten Text auf S.309). Von dieser Leistung absorbiert der nichtschwarze Körper den Anteil βf ∆Φf s und reflektiert den Rest (1 − βf )∆Φf s . Außerdem emittiert der nichtschwarze Körper im gleichen Frequenzintervall df die Strahlungsleistung ∆Φf = Lf Adf ∆Ω. Wegen des vorausgesetzten thermischen Gleichgewichts muss gelten ∆Φf s = (1 − βf )∆Φf s + ∆Φf . Nach Einsetzen der Ausdrücke für ∆Φf s und ∆Φf folgt Lf s = (1 − βf )Lf s + Lf und damit die gesuchte Gleichung Lf = βf Lf s . 416 25 Wärmestrahlung Die spektrale Energiedichte (spectral energy density) ρs (f, T ) der schwarzen Strahlung wird folgendermaßen definiert: Wir betrachten einen Hohlraum, der von schwarzen Wänden begrenzt wird und der sich im thermischen Gleichgewicht bei der Temperatur T befindet. Dann ist ρs (f, T )df dV die Energie, die das Volumenelement dV infolge der elektromagnetischen Strahlung mit Frequenzen zwischen f und f + df enthält. Es lässt sich zeigen, dass ρs mit der spektralen Strahldichte Lf s des schwarzen Körpers (s.S.414) in folgender Weise zusammenhängt: ρs (f, T ) = 4π Lf s , c0 (549) wobei c0 die Lichtgeschwindigkeit im Vakuum bezeichnet. Ein kleines Loch der Fläche da in der Wand des Hohlraums soll das thermische Gleichgewicht nicht stören. Da die Hohlraumstrahlung über den Raumwinkel 4π isotrop verteilt ist und sich mit Lichtgeschwindigkeit ausbreitet, folgt für die Leistung, die durch das Loch im Frequenzintervall von f bis f + df in den Raumwinkel dΩ abgestrahlt wird, dΦf s = (da)(cos ϑ)c0 (dΩ/4π)ρs df . Durch Vergleich mit der auf den schwarzen Körper angewandten Gl.(544), S.414, erhält man die Beziehung Lf s = (c0 /4π)ρs , d.h. die gesuchte Gl.(549). Außerdem ersieht man, dass Lf s nicht von ϑ abhängt, oder, mit anderen Worten, dass da ein Lambert-Strahler ist. Mit Hilfe dieser Gleichung findet man leicht für die Strahlungsleistung, die von der schwarzen Fläche da im Frequenzintervall von f bisf + df in den Halbraum abgestrahlt wird, d.h. für die spezifische Ausstrahlung des schwarzen Körpers, ! Z c0 (550) Ms = Lf s cos ϑdΩ dadf = ρs (f, T )dadf. 4 (2π) Für die spezifische AusstrahlungR giltRauf Grund der Definition der spektralen Strahlπ/2 2π dichte Lf (s.Gl.(544), S.414) ( 0 Lf s cos ϑ sin ϑ dϑ dϕ )da df . Einsetzen der 0 Gl.(549) führt auf das Integral ( R π/2 R 2π 0 0 R π/2 R 2π 0 0 cos ϑ sin ϑ dϑ dϕ )c0 (4π)−1 ρs da df . Wegen cos ϑ sin ϑ dϑ dϕ = π ergibt sich daraus die Gl.(550). Da diese Strahlungsleistung messtechnisch gut zugänglich ist, kann man auf diese Weise auch die spektrale Energiedichte ρs (f, T ) der schwarzen Strahlung experimentell bestimmen. Das Ergebnis zeigt die Abb.227. Bei großen und kleinen Frequenzen wird ρs sehr klein. Dazwischen besitzt es ein Maximum, das sich mit wachsender Temperatur nach höheren Frequenzen (kürzeren Wellenlängen) verschiebt (Wien’sches Verschiebungsgesetz, s.S.420). Nachdem alle Versuche zur Erklärung der Frequenz- und Temperaturabhängigkeit von ρs aus den bisher bekannten Gesetzen der Physik gescheitert waren, trat Max Planck (1858-1947) am 14. Dezember 1900 im Hörsaal des Physikalischen Instituts 25.2 Strahlungsformeln 417 Abbildung 227. Die spektrale Energiedichte ρs (f, T ) der schwarzen Strahlung als Funktion der Frequenz für verschiedene Temperaturen der Berliner Universität vor die Mitglieder der Deutschen Physikalischen Gesellschaft und zeigte, dass sich eine theoretische Begründung für die Funktion ρs (f, T ) nur finden lässt, wenn man eine der bisherigen Physik gänzlich fremde Annahme zugrunde legt. Diese besteht darin, dass gewisse physikalische Größen, im vorliegenden Fall war es die Energie (eines harmonischen Oszillators mit der Eigenfrequenz f ), nicht beliebige Werte annehmen können, sondern quantisiert sind. Mit der hierdurch begründeten Quantentheorie und der 1905 von Albert Einstein (1879-1955) entwickelten Relativitätstheorie (s.Abschn.20.3, S.291ff.) begann eine neue Ära der Physik und man bezeichnet heute die Gesamtheit der zuvor gewonnenen physikalischen Erkenntnisse und Gesetze als klassische Physik (classical physics). Der wesentliche Punkt bei der von Max Planck vorgestellten Ableitung der Formel für ρs (f, T ) war die Forderung, dass ein Resonator mit der Frequenz f Energie nicht in beliebigen Portionen abgeben oder aufnehmen kann, sondern nur in ganzzahligen Vielfachen des Energiequants (quantum of energy) hf, wobei die Naturkonstante h die Größe h = 6, 62606876(52) · 10−34 Js (551) besitzt [COD99] und als Planck-Konstante oder Planck’sches Wirkungsquantum (Planck constant) bezeichnet wird. Mit dieser Forderung ergibt sich die Planck’sche Strahlungsformel (Planck’s radiation formula) A 147 ρs (f, T ) = 1 8πhf 3 . c0 3 exp(hf /kT ) − 1 (552) 418 25 Wärmestrahlung Die Bedingung für die Ausbildung stehender Wellen in einer Dimension der Länge ` lautet ` = nλ/2, wobei n eine ganze Zahl und λ die Wellenlänge bezeichnet. Diese Beziehung wenden wir auf die elektromagnetischen Wellen im Vakuum an, so daß λ die zur Frequenz f gehörige Vakuumwellenlänge λ0 = c0 /f ist. Damit folgt für die Anzahl der stehenden Wellen (= Anzahl der Resonatoren) bei vorgegebener Länge ` und Frequenz f die Gleichung n = 2`f /c0 . Die Erweiterung auf drei Dimensionen (Würfel mit der Kantenlänge `) führt auf die Beziehung n21 + n22 + n23 = (2`f /c0 )2 . Mit dieser Gleichung lässt sich die Anzahl der stehenden Wellen im Frequenzintervall von f bis f + df berechnen. Zu diesem Zweck gehen wir in das durch n1 , n2 und n3 aufgespannte kartesische Koordinatensystem. Das Volumen zwischen den Radien 2`f /c0 und 2`(f + df )/c0 ist 4π(2`f /c0 )2 2(`/c0 )df . Da n1 , n2 und n3 nur positiv sein dürfen, kommt lediglich der entsprechende Kugelschalenoktant in Frage und es ergibt sich für die Anzahl der stehenden Wellen (1/8)4π(2`f /c0 )2 2(`/c0 )df . Diese Zahl ist noch mit dem Faktor 2 zu multiplizieren, da die elektromagnetischen Wellen zu den Transversalwellen gehören (es sind jeweils zwei Wellen gleicher Frequenz aber unterschiedlicher Polarisationsrichtungen möglich). Damit folgt für die Anzahl der stehenden Wellen pro Volumen der Ausdruck 8πf 2 c−3 0 df . Dieses Ergebnis ist unabhängig von der Form des Hohlraumes, für den im vorliegenden Fall ein Würfel gewählt wurde. Die Planck’sche Quantisierungsbedingung besagt, dass ein Resonator nur die diskreten Energien En = nhf mit n = 0, 1, 2, ... annehmen kann, so dass sich für die mittlere Energie (s. BoltzmannP P Verteilung, S.103) die Beziehung hEi = [ n nhf exp(−nhf /kT )][ n exp(−nhf /kT )]−1 ergibt, wobei k die Boltzmann-Konstante und T die Temperatur bezeichnet. Nun gilt P exp(−nhf /kT ) = [1 − exp(−hf /kT )]−1 (s.A.6.4, S.1261, geometrische Reihe). Difn ferenziert man die linke und die rechte Seite dieser Gleichung nach −1/(kT ), so folgt auP ßerdem nhf exp(−nhf /kT ) = [hf exp(−hf /kT )] · [1 − exp(−hf /kT )]−2 . Einsetzen n dieser beiden Gleichungen in die Beziehung für hEi liefert hEi = [hf exp(−hf /kT )][1 − exp(−hf /kT )]−1 oder hEi = hf [exp(hf /kT ) − 1]−1 . Wir sehen, dass sich dieser Audruck für hf kT vereinfacht zu hEi = kT , dem Ergebnis der klassischen Physik. Unter Verwendung der oben abgeleiteten Anzahl 8πf 2 c−3 0 df der stehenden Wellen pro Volumeneinheit und der Formel für die mittlere Energie hEi jeder dieser Wellen, folgt ρs (f, T )df = −1 −1 (8πf 3 hc−3 oder ρs (f, T ) = 8πf 3 hc−3 , d.h. die 0 df )[exp(hf /kT ) − 1] 0 [exp(hf /kT ) − 1] Gl.(552). Von Albert Einstein (1879-1955) stammt eine Ableitung der Planck’schen Strahlungsformel, die davon ausgeht, dass die Teilchen der Hohlraumwand, die mit der schwarzen Strahlung in Wechselwirkung stehen, ständig Photonen (s. den kleingedruckten Text auf S.404) emittieren und absorbieren. Die mittlere Dichte (mittlere Anzahl pro Volumeneinheit) der dadurch im Hohlraum vorhandenen Photonen mit Frequenzen zwischen f und f + df ist dann bis auf eine Proportionalitätskonstante gleich der gesuchten Größe ρs (f, T )df . Bei dieser Ableitung musste Einstein allerdings eine Annahme über die Emission von Photonen machen, die damals eine reine Hypothese darstellte und deren Richtigkeit erst Jahrzehnte später durch die Entwicklung des Lasers (s.S.333) bestätigt wurde: Wenn sich ein Teilchen in einem Zustand 25.2 Strahlungsformeln 419 mit der Energie E befindet, dann kann es bekanntlich ein auftreffendes Photon der Energie hf absorbieren, indem es in einen angeregten Zustand mit der Energie E+hf übergeht. Nach Einstein kann das auftreffende Photon aber auch mit der gleichen Wahrscheinlichkeit das Teilchen vom angeregten Zustand in den Ausgangszustand der Energie E versetzen, wobei ein zweites Photon gleicher Frequenz und Phase entsteht (induzierte Emission, stimulated emission). Die bis dahin allein bekannte spontane Emission (spontaneous emission) von Photonen, d.h. der Übergang eines Teilchens von E + hf nach E ohne äußere Einwirkung, dominiert allerdings bei den üblichen thermischen Lichtquellen (Glühlampen, Gasentladungen usw.); denn es ergibt sich für den relativen Anteil rind der induzierten Emissionsübergänge der Ausdruck hf (553) rind = exp − kT der bei T ≈ 2200 K und λ0 ≈ 550 nm kleiner als 10−5 ist. Es sei n(f ) bzw. n∗ (f ) die Dichte (Anzahl pro Volumeneinheit) der mit der Strahlung wechselwirkenden Teilchen in der Hohlraumwand, deren Resonanzfrequenz f ist und die im Grundzustand die Energie E0 , bzw. im angeregten Zustand die Energie E0 + hf besitzen. Das Verhältnis der Dichten (Anzahl der Teilchen pro m3 ) ergibt sich nach der Boltzmann-Verteilung (s.S.103) zu n∗ (f )/n(f ) = exp(−hf /kT ). Für die Anzahl der pro Zeit und Volumen absorbierten Photonen der Energie hf schreiben wir K1 n(f )ρs (f, T ), wobei K1 ein Proportionalitätsfaktor ist. Die Anzahl der pro Zeit und Volumen emittierten Photonen der Energie hf folgt als Summe aus dem Beitrag der spontanen Emission K2 n∗ (f ), mit K2 als einem zweiten Proportionalitätsfaktor, und dem der induzierten Emission K1 n∗ (f )ρs (f, T ). Im thermischen Gleichgewicht muss demnach gelten K1 n(f )ρs (f, T ) = K1 n∗ (f )ρs (f, T ) + K2 n∗ (f ). Unter Verwendung der obigen Formel für das Verhältnis n∗ (f )/n(f ) erhalten wir ρs (f, T ) = (K2 /K1 )[exp(hf /kT ) − 1]−1 . Die Einstein’sche Ableitung liefert also die Planck’sche Strahlungsformel (s.Gl.(552)), wenn man für den Quotienten der beiden Proportionalitätsfaktoren K2 /K1 die Größe 8πhf 3 /c30 einsetzt. Diese Tatsache erlaubt eine Berechnung des relativen Anteils rind der induzierten Emissionsübergänge an der Gesamtemission. Definitionsgemäß gilt rind = [K1 n∗ (f )ρs (f, T )][K1 n∗ (f )ρs (f, T ) + K2 n∗ (f )]−1 . Setzen wir hier die obige Gleichung ρs (f, T ) = (K2 /K1 ) · [exp(hf /kT ) − 1]−1 ein, so folgt rind = exp(−hf /kT ), d.h. die Gl.(553). Um die spektrale Energiedichte der schwarzen Strahlung nach Gl.(552) als Funktion der Vakuumwellenlänge λ0 darzustellen, genügt Res nicht, f durchR c0 /λ0 zu erset∞ ∞ zen; denn es muss ja außerdem die Bedingung 0 ρs (f, T )df = 0 ρs (λ 0 , T )dλ 0 (Gleichheit der Energiedichten) erfüllt werden. Man erhält A 148 ρs (λ0 , T ) = 8πhc0 1 . λ50 exp[hc0 /(λ0 kT )] − 1 (554) 420 25 Wärmestrahlung R∞ R∞ Die Bedingung für die Gleichheit der Energiedichten 0 ρs (f, T )df = 0 ρs (λ0 , T ) dλ0 wird erfüllt durch ρs (λ0 , T ) = ρs (f, T )|df /dλ0 |. Wegen f = c0 /λ0 oder |df /dλ0 | = c0 /λ20 folgt ρs (λ0 , T ) = ρs (f, T )c0 /λ20 und damit nach Einsetzen von Gl.(552) die gesuchte Gl.(554). Das Produkt 2πhc20 wird mitunter als erste Strahlungskonstante (first radiation constant) und der Quotient hc0 /k als zweite Strahlungskonstante (second radiation constant) bezeichnet. Das Maximum dieser Funktion tritt auf, wenn die Bedingung dρs (λ0 , T )/dλ0 = 0 erfüllt ist. Einsetzen von Gl.(554) führt auf die Beziehung 5{1−exp[−hc0 /(λ0,max kT )]} = hc0 /(λ0,max kT ). Das Ergebnis der numerischen Lösung [LID90] λ0,max T = 2, 897756(24) · 10−3 m · K (555) wird Wien’sches Verschiebungsgesetz (Wien’s displacement law, Wilhelm Wien 1864-1928) genannt. Als Nächstes wollen wir die Gesamtleistung berechnen, die von einem Quadratmeter eines schwarzen Körpers in den Halbraum abgestrahlt wird. Nach Tab.81, S.413, ist dies gleich der spezifischen Ausstrahlung einer schwarzen Fläche (Ms ). Unter Verwendung des Ausdrucks (550), S.416, und der Planck’schen Strahlungsformel erhält man nach Integration über den gesamten Frequenzbereich von 0 bis ∞ das Stefan-Boltzmann-Gesetz (Stefan-Boltzmann law, Joseph Stefan 1853-1893, Ludwig Boltzmann 1844-1906) Ms = σT 4 . (556) Die dabei auftretende Größe [COD99] σ= 2π 5 k 4 = 5, 670400(40) · 10−8 W m−2 K−4 15 c20 h3 (557) wird Stefan-Boltzmann-Konstante (Stefan-Boltzmann constant) genannt. R∞ Der Ausdruck (550), S.416, liefert die Gleichung Ms = (c0 /4)R 0 ρs (f, T )df . Mit ∞ 3 der Planck’schen Strahlungsformel (Gl.(552)) folgt Ms = 2πhc−2 f [exp(hf /kT ) − 0 0 R −2 −1 4 ∞ 3 1] df . Die Substitution hf /kT = ξ führt auf M ξ [exp ξ− s = 2πhc0 (kT /h) 0 R∞ 1]−1 dξ. Mit dem Integral 0 ξ 3 [exp ξ − 1]−1 dξ = π 4 /15 (s.S.1260) ergibt sich Ms = 4 4 (2π 5 /15)h−3 c−2 0 k T . Unter der Annahme, dass die Sonne ein schwarzer Strahler ist, lässt sich die Oberflächentemperatur TS der Sonne sowohl mit Hilfe des Stefan-Boltzmann-Gesetzes als auch des Wien’schen Verschiebungsgesetzes berechnen. Die extraterrestrische Solarkonstante (solar constant) SS , das ist die Leistung, die an der äußeren Grenze der Erdatmosphäre beim mittleren Sonnenabstand senkrecht auf 1 m2 einfällt (Energiestromdichte), hat den Wert [LID90] 25.3 Pyrometrie / Farben SS = (1395 ± 30) W/m2 . 421 (558) Nennen wir den Sonnenradius rS , so folgt aus dem Stefan-Boltzmann-Gesetz (s.Gl. (556)) für die von der Sonnenoberfläche nach außen abgestrahlte Gesamtleistung σTS4 4πrS2 . Dieser Wert muss gleich dem Produkt aus SS und der Kugeloberfläche 2 4πrSE sein, wenn rSE den mittleren Abstand der Erde von der Sonne bezeichnet. Daraus folgt TS ≈ 5800 K. 2 Aus der Gleichung σTS4 4πrS2 = SS 4πrSE ergibt sich TS = (SS /σ)1/4 (rSE /rS )1/2 . Einsetzen der Zahlenwerte SS = 1395 W/m2 , σ = 5, 6705 · 10−8 Wm−2 K−4 , rSE = 149, 6 · 109 m und rS = 696 · 106 m liefert TS = 5806 K. Das Maximum der spektralen Verteilung des Sonnenlichtes liegt bei einer Wellenlänge, für die das menschliche Auge unter ungünstigen Lichtverhältnissen (Dunkeladaption) seine maximale Empfindlichkeit besitzt (ca. 500 nm nach Abb.225, S.410). Mit Hilfe des Wien’schen Verschiebungsgesetzes (Gl.(555)) erhält man daraus TS ≈ 5800 K. Das Sonnenspektrum stimmt in seiner Intensitätsverteilung für λ0 ≥ 600 nm recht gut mit dem Planck’schen Strahlungsgesetz (Gl.(554)) überein. Im kurzwelligen Teil treten jedoch merkliche Abweichungen sowohl nach niedrigeren als auch nach höheren Intensitäten auf, da sich hier einerseits die vielen eng zusammenliegenden Absorptionslinien (Fraunhofer-Linien, s.S.312) bemerkbar machen und da sich andererseits eine zusätzliche Strahlung aus den äußeren Schichten des Sonnenatmosphäre überlagert. Ü 159 Ü 160 25.3 Pyrometrie / Farben Die Pyrometrie (pyrometry) befasst sich mit der Messung von Temperaturen durch die von dem betreffenden Körper ausgesandte Wärmestrahlung. Moderne Schmalband- oder Spektralpyrometer (narrow-band pyrometers oder spectral pyrometers) verwenden infrarotempfindliche photoelektrische Zellen (s.S.234) mit vorgeschalteten optischen Filtern. Bei den optischen Pyrometern (optical pyrometers) wird das Bild des strahlenden Körpers in einer Ebene erzeugt, in der sich ein Wolframfaden befindet. Dieser wird durch einen elektrischen Strom soweit aufgeheizt, bis er sich bei der Betrachtung durch ein Okular und Rotfilter nicht mehr von dem Bild des strahlenden Körpers abhebt. Bei den Gesamtstrahlungspyrometern (total-radiation pyrometers) schließlich wird die Wärmestrahlung über einen Hohlspiegel auf eine geschwärzte Folie fokussiert, die mit einer Thermosäule (thermopile) verbunden ist. Thermosäulen bestehen aus mehreren Thermoelementen (s.S.520), die zur Erhöhung der pro vorgegebener Temperaturdifferenz erzeugten http://www.springer.com/978-3-8351-0074-9