EINFÜHRUNG IN DIE THEORETISCHE PHYSIK FRITZ HAAKE 2 Vorwort Das 1982 erschienene Buch ist längst vergriffen. Der Nachfolger des damaligen Verlages ist an einer Neuauflage nicht interessiert. Der Anregung von Lesern und Kollegen folgend mache ich den Text nun frei zugänglich. Damit wird Wechselwirkung mit Nutzern möglich. Mir mitgeteilte Druckfehler und Unstimmigkeiten werde ich laufend korrigieren. Auch Anregungen zu größeren Änderungen und Anpassung an inzwischen veränderte Bedürfnisse der Lehrerausbildung sind mir willkommen. Essen, Oktober 2002 Fritz Haake 3 4 Inhaltsverzeichnis Inhaltsverzeichnis 5 1 Masse 1.1 Freie Teilchen . . . . . . . . . . . . 1.2 Träge Teilchen . . . . . . . . . . . 1.3 Ein Beispiel: konstante Kraft . . . 1.4 Das Galileische Relativitätsprinzip 1.5 Schwere Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 11 12 13 15 2 Schwingungen 2.1 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . 2.2 Der Energieeigensatz . . . . . . . . . . . . . . . . . . . . . . 2.3 Der Energiesatz für beliebige konservative Kräfte . . . . . . 2.4 Der gedämpfte harmonische Oszillator . . . . . . . . . . . . 2.5 Resonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Antwort auf beliebige periodische Anregung (Fourierreihen) 2.7 Antwort auf beliebige Anregung . . . . . . . . . . . . . . . . 2.8 Idealisierter Kraftstoß (Deltafunktion) . . . . . . . . . . . . 2.9 Zwei gekoppelte harmonische Oszillatoren . . . . . . . . . . 2.10 Der mechanische Energiesatz für Systeme vieler Teilchen . . 2.11 Schwingungen von mehreren Freiheitsgraden . . . . . . . . . 2.12 Erzwungene Schwingungen von mehreren Freiheitsgraden . 2.13 Transversale Schwingungen der gespannten Saite . . . . . . 2.14 Theorie der Dämpfung(Modell) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 19 21 23 26 29 33 35 39 42 45 48 51 53 57 3 Nichtrelativistische Bewegung im Gravitationsfeld 3.1 Das 1/r-Potential . . . . . . . . . . . . . . . . . . . . . 3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential 3.3 Die Bahnkurven . . . . . . . . . . . . . . . . . . . . . 3.4 Das Zweikörperproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 63 65 68 71 4 Statische wirbelfreie Felder 4.1 Wirbelfreie Vektorfelder . . . . . . . . . . . 4.2 Quellen wirbelfreier Felder . . . . . . . . . . 4.3 Lokale Quellen . . . . . . . . . . . . . . . . 4.4 Elektrostatisches Potential . . . . . . . . . . 4.5 Geladenes Teilchen vor einem Leiter . . . . 4.6 Sphärische Ladungs- bzw. Massenverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 73 76 78 81 83 84 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 INHALTSVERZEICHNIS 4.7 4.8 4.9 4.10 Monopole, Dipole, Multipole . . . . . . . . . . . . . . . Die Form der Erde . . . . . . . . . . . . . . . . . . . . . Die Energie eines Haufens von Ladungen . . . . . . . . . Die Energie eines Ladungshaufens in einem äußeren Feld . . . . 86 90 93 95 5 Statische Magnetfelder ~ x) . . . . . . . . . . . . . . 5.1 Das magnetische (Induktions-)Feld B(~ 5.2 Das Magnetfeld eines geraden stromdurchflossenen Drahtes . . . 5.3 Wirbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Lokale Wirbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Magnetische Monopole . . . . . . . . . . . . . . . . . . . . . . . . 5.6 Die Feldgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 5.7 Das Fernfeld stationärer Ströme . . . . . . . . . . . . . . . . . . . 5.8 Magnetisches Moment und Drehimpuls . . . . . . . . . . . . . . . ~ x) auf einen magnetischen 5.9 Kraft und Drehmoment eines Feldes B(~ Dipol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 97 99 99 102 104 105 108 111 6 Das 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 elektromagnetische Feld Faradays Induktionsexperiment . . . . . . . . . . Der Maxwellsche Verschiebungsstrom . . . . . . . Die Maxwellschen Gleichungen . . . . . . . . . . Der Energieerhaltungssatz . . . . . . . . . . . . . Die Wellengleichung für die Potentiale . . . . . . Ebene elektromagnetische Wellen im freien Raum Die retardierten Potentiale . . . . . . . . . . . . . Elektrische Dipolstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 113 115 116 117 119 120 123 126 7 Elektromagnetische Felder in Materie 7.1 Polarisation und Magnetisierung . . . . . . . . . . . 7.2 Materialgesetze für Polarisation und Magnetisierung 7.3 Wellen in linearen Dielektrika . . . . . . . . . . . . . 7.4 Modell eines Dielektrikums . . . . . . . . . . . . . . 7.5 Ohmsches Gesetz . . . . . . . . . . . . . . . . . . . . 7.6 Wellen in Leitern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 129 134 136 137 138 139 8 Symmetrien 8.1 Der Raum ist homogen . 8.2 Der Raum ist isotrop . . 8.3 Die Zeit ist homogen . . 8.4 Galileiinvarianz . . . . . 8.5 Lorentzinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 141 143 150 150 152 9 Spezielle Relativitätstheorie 9.1 Die Lorentztransformation der Koordinaten . . 9.2 Relativität der Gleichzeitigkeit . . . . . . . . . 9.3 Zeitdilatation . . . . . . . . . . . . . . . . . . . 9.4 Längenkontraktion . . . . . . . . . . . . . . . . 9.5 Addition von Geschwindigkeiten . . . . . . . . 9.6 Lorentzinvarianz der Maxwellschen Gleichungen 9.7 Feld einer gleichförmig bewegten Punktladung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 155 158 158 161 162 163 165 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . INHALTSVERZEICHNIS 7 9.8 Lorentzskalare und Lorentzvektoren . . . . . . . . . . . . . . . . 9.9 Relativistischer Impuls und Viererimpuls eines Teilchens . . . . . 9.10 Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.11 Bewegung im konstanten elektrischen Feld . . . . . . . . . . . . . 9.12 Eine bequeme Schreibweise . . . . . . . . . . . . . . . . . . . . . 166 168 170 173 174 10 Bewegung schneller Teilchen im Gravitationsfeld 10.1 Rückblick auf die Newtonsche Theorie . . . . . . . 10.2 Einsteins Äquivalenzprinzip . . . . . . . . . . . . . 10.3 Die Viererkraft im Gravitationsfeld . . . . . . . . . 10.4 Lichtstrahlen im Gravitationsfeld . . . . . . . . . . 10.5 Der metrische Tensor ist das Gravitationsfeld . . . 10.6 Der Newtonsche Grenzfall . . . . . . . . . . . . . . 10.7 Frequenzverschiebung fallender Photonen . . . . . 10.8 Nochmal auf die rotierende Scheibe! . . . . . . . . 10.9 Das statische isotrope Gravitationsfeld . . . . . . . 10.10Bewegungsgleichungen im statischen isotropen Feld 10.11Periheldrehung der Planeten . . . . . . . . . . . . . 10.12Lichtablenkung durch die Sonne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 179 180 181 184 186 188 190 192 194 196 199 202 11 Quanten 11.1 Teilchen sind Wellen . . . . . . . . . . . . . 11.2 Heisenbergs Unschärferelation . . . . . . . . 11.3 Die Grundprinzipien der Quantenmechanik 11.4 Die Schrödingergleichung . . . . . . . . . . 11.5 Normierung der Wellenfunktion . . . . . . . 11.6 Mittelwerte . . . . . . . . . . . . . . . . . . 11.7 Freie Pakete zerfließen . . . . . . . . . . . . 11.8 Das Ehrenfestsche Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 205 210 211 212 215 216 218 220 12 Quanten in Kästen 12.1 Eindimensionale Potentialstufe . . . . . . . 12.2 Eindimensionaler Kasten mit starrem Rand 12.3 Potentialtopf endlicher Tiefe . . . . . . . . . 12.4 Quanten durchdringen Wände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 223 226 229 232 13 Harmonisch gebundene Quanten 13.1 Eindimensionaler harmonischer Oszillator . . . . . . . . . . . . . 13.2 Die Orthogonalität normierbarer Eigenfunktionen hermitescher Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3 Die erzwungene Schwingung des harmonischen Oszillators . . . . 13.4 Die Umgebung belässt nur den Grundzustand stabil . . . . . . . 235 235 14 Das 14.1 14.2 14.3 14.4 14.5 253 253 254 256 257 259 Wasserstoffatom Relativ- und Schwerpunktsbewegung . . . . . . Bewegung im Coulombfeld . . . . . . . . . . . . Der Bahndrehimpuls . . . . . . . . . . . . . . . Kommutierende Operatoren haben gemeinsame Die Eigenwerte des Bahndrehimpulses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenfunktionen . . . . . . . . . . 240 243 245 8 INHALTSVERZEICHNIS 14.6 14.7 14.8 14.9 Die Eigenfunktionen des Bahndrehimpulses Das Radialproblem beim Coulombfeld . . . Die Auswahlregeln . . . . . . . . . . . . . . Verwandte Zweikörpersysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 266 270 272 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen 275 15.1 Die Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . 275 15.2 Die klassische Hamiltonfunktion . . . . . . . . . . . . . . . . . . . 277 15.3 Klassische (nichtrelativistische) Bewegung im konstanten Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 15.4 Geladenes Quant im konstanten Magnetfeld . . . . . . . . . . . . 282 15.5 Eichinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 15.6 Zeemaneffekt beim Wasserstoffatom (ohne Spin) . . . . . . . . . 286 16 Spin 16.1 Der Spin des Elektrons . . . . . . . . . . . . . . . . . . . . . . . . 16.2 Das magnetische Moment von Teilchen mit Spin . . . . . . . . . 16.3 Der anomale Zeemaneffekt beim H-Atom . . . . . . . . . . . . . 289 289 292 293 17 Grundbegriffe der Statistik 17.1 Wahrscheinlichkeit von Ereignissen . . . . 17.2 Diskrete eindimensionale Zufallsbewegung 17.3 Die Binomialverteilung für große N . . . . 17.4 Eindimensionale Diffusion . . . . . . . . . 17.5 Der Zentrale Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 297 298 299 300 303 18 Statistische Behandlung von Vielteilchensystemen 18.1 Ensembles . . . . . . . . . . . . . . . . . . . . . . . . 18.2 Stationäre Ensembles . . . . . . . . . . . . . . . . . . 18.3 Die Energieabhängigkeit der Zustandsdichte . . . . . 18.4 Das mikrokanonische Ensemble . . . . . . . . . . . . 18.5 Das kanonische Ensemble . . . . . . . . . . . . . . . 18.6 Das großkanonische Ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 307 308 310 311 313 317 19 Thermodynamische Variable 19.1 Entropie . . . . . . . . . . . 19.2 Temperatur . . . . . . . . . 19.3 Druck . . . . . . . . . . . . 19.4 Chemisches Potential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 319 322 325 327 . . . . . . 331 331 334 340 343 348 352 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Ideale Gase 20.1 Ununterscheidbarkeit identischer Teilchen 20.2 Thermische Photonen . . . . . . . . . . . 20.3 Thermische Phononen in Festkörpern . . . 20.4 Das ideale Bosegas . . . . . . . . . . . . . 20.5 Bose-Einstein-Kondensation . . . . . . . . 20.6 Das ideale Fermigas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . INHALTSVERZEICHNIS 21 Begründung der Thermodynamik makroskopischer 21.1 Arbeit und Wärme bei Zustandsänderungen . . . . . 21.2 Erster Hauptsatz . . . . . . . . . . . . . . . . . . . . 21.3 Entropieänderungen bei Zustandsänderungen . . . . 21.4 Zweiter Hauptsatz . . . . . . . . . . . . . . . . . . . 21.5 Unmöglichkeit des perpetuum mobile zweiter Art . . 21.6 Unmöglichkeit des perfekten Kühlapparats . . . . . . 21.7 Die Carnotmaschine . . . . . . . . . . . . . . . . . . 21.8 Relaxation ins Gleichgewicht . . . . . . . . . . . . . Abbildungsverzeichnis Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 . . . . . . . . 359 359 360 360 361 362 364 364 367 371 10 INHALTSVERZEICHNIS Kapitel 1 Masse 1.1 Freie Teilchen Das freie Teilchen ist eine nützliche Idealisierung. Seine Freiheit ist eine Freiheit von Kräften. Beispiele für näherungsweise freie Teilchen kennen Sie vom Luftkissentisch und aus der Raumfahrt. Das freie Teilchen ändert im Lauf der Zeit seine Geschwindigkeit nicht. Es bewegt sich geradlinig und legt in gleichen Zeitabschnitten ∆t gleiche Wegstücke ∆~x = (∆x, ∆y, ∆z) zurück, so dass für seine Geschwindigkeit gilt ~v = (vx , vy , vz ) = µ ∆x ∆y ∆z , , ∆t ∆t ∆t ¶ −−−→ = const . (1.1) Wenn ein Teilchen in einem Bezugssystem S frei ist, so auch in jedem anderen, S 0 , das sich relativ zu S gleichförmig und geradlinig bewegt. Alle diese Systeme heißen Inertialsysteme. Es ist gleichgültig, welches Inertialsysteme zur Beschreibung der Bewegung des freien Teilchens benutzt wird. Beispielsweise kann ein Ruhesystem gewählt werden, d. h. ein Koordinatensystem, bezüglich −−−→ dessen das Teilchen unbewegt ruht. Jedenfalls gilt ~v = const in allen Inertialsystemen. Wenn sich zwei Teilchen mit gleichförmiger Geschwindigkeit ~v1 und ~v2 bewegen, so lässt sich aus Prinzip nicht entscheiden, welches von beiden ruht und welches in Bewegung ist. Im Ruhesystem eines der beiden bewegt sich das andere. 1.2 Träge Teilchen ~ Um die Geschwindigkeit eines Teilchens zu ändern, bedarf es einer Kraft K. p 2 2 2 Zur Änderung |∆~v | = (∆vx ) + (∆vy ) + (∆vz ) in der Zeitspanne ∆t ist eine um so größere Kraft vonnöten, je träger ein Teilchen ist. Für hinreichend kleine Zeitspannen ∆t und Geschwindigkeitsänderungen ∆~v ergibt sich im Experiment die Proportionalität ∆~v ~ . ∼K ∆t 11 (1.2) 12 1 Masse Der Proportionalitätsfaktor heißt die träge Masse m des Teilchens. Je größer sie ist, desto träger ist das Teilchen. Für alle Teilchen gilt m≥0, (1.3) da erfahrungsgemäß die Änderungsrate der Geschwindigkeit ∆~v ∆t und die ~ gleichgerichtet sind. Kraft K Anstatt das Gesetz (1.2) für endliche aber hinreichend kleine Differenzen ∆t und ∆~v zu formulieren, führt man den Differentialquotienten lim ∆t→0 d~v ∆~v = = ∆t dt µ dvx dvy dvz , , dt dt dt ¶ (1.4) ein und nennt den Grenzwert d~v /dt der Änderung der Geschwindigkeit im beliebig kleinen Zeitintervall die Beschleunigung des Teilchens. Mit Hilfe dieses Begriffes schreibt sich das Gesetz (1.2) in der wohlbekannten Form ~ = m d~v . K dt (1.5) Sie kennen (1.5) als eines der Newtonschen Grundgesetze der Mechanik. Es erlaubt, sobald die auf das Teilchen wirkende Kraft als Funktion der Koordinaten des Teilchens bekannt ist, die Berechnung der möglichen Bahnkurven ~x(t) = (x(t), y(t), z(t)). 1.3 Ein Beispiel: konstante Kraft Ich erinnere Sie an den einfachsten Fall einer nicht gleichförmigen Bewegung: Ein Teilchen ist einer räumlich und zeitlich konstanten Kraft ausgesetzt. Beispiele solcher Kräfte sind - mit guter Näherung - die Schwerkraft nahe der Erdoberfläche und die elektrische Kraft, die ein geladenes Teilchen zwischen den parallelen Platten eines ebenen Plattenkondensators erfährt. Zur Beschreibung der Bahnkurve wählen wir das Koordinatensystem so, dass ~ = (0, 0, K). Dann lautet das Grundgesetz (1.5) K dvx = 0, dt dvy =0, dt dvz 1 = K . dt m (1.6) Die beiden ersten dieser Gleichungen besagen, dass die x- und y-Komponenten der Geschwindigkeit sich zeitlich nicht ändern, d. h. vx (t) = vx (0) = const und vy (t) = vy (0) = const. Es lässt sich dann übrigens immer ein Koordinatensystem angeben, in dem vx = vy = 0 ist. Die letzte der drei Gleichungen besagt, dass die Beschleunigung des Teilchens in z-Richtung zeitlich konstant ist. Demnach gilt für die Geschwindigkeit vz (t) = 1 Kt + vz (0) , m (1.7) 1.4 Das Galileische Relativitätsprinzip 13 wobei die Integrationskonstante vz (0) die Bedeutung der anfänglichen Geschwindigkeit in z-Richtung hat. Die drei Lösungen der Gleichungen (1.6) lassen sich zu der Vektorgleichung ~v (t) = ~v (0) + 1 ~ Kt m (1.8) zusammenfassen. Wenn wir beachten, dass die Geschwindigkeit des Teilchens die zeitliche Änderung der Ortskoordinaten gibt, µ ¶ ∆~x d~x dx dy dz ~v = lim = = , , , (1.9) ∆t→0 ∆t dt dt dt dt so können wir (1.8) als Differentialgleichungen für den Ortsvektor ~x = (x, y, z) auffassen, dx = vx (0), dt dy = vy (0), dt dz 1 = vz (0) + Kt . dt m (1.10) Durch Integration über die Zeit erhalten wir die Bestimmungsgleichungen der Bahnkurve x(t) = vx (0)t + x(0) y(t) = vy (0)t + y(0) 1 Kt2 + vz (0)t + z(0) , z(t) = 2m (1.11) die sich wieder zu einer Vektorgleichung vereinigen lassen, ~x(t) = ~x(0) + ~v (0)t + 1 ~ 2 Kt . 2m (1.12) Die drei Integrationskonstanten x(0), y(0), z(0) haben offensichtlich die Bedeutung der anfänglichen Koordinaten des Teilchens. Insgesamt treten in der Bahnkurve (1.11) sechs Integrationskonstanten auf, die drei anfänglichen Geschwindigkeitskomponenten neben den drei anfänglichen Koordinaten. Die Zahl der Integrationskonstanten erklärt sich dadurch, dass jede der drei Bewegungsgleichungen (1.6) zweimal integriert werden musste, damit die Lösung (1.11) entstand. 1.4 Das Galileische Relativitätsprinzip Über das freie Teilchen hatte ich gesagt, es sei gleichgültig, von welchem Inertialsystem aus seine Bewegung beschrieben wird; in allen Inertialsystemen −−−→ ~ wirkt, so gilt zwar in keinem gilt ~v = const. Wenn auf ein Teilchen eine Kraft K −−−→ ~ Koordinatensystem, bezüglich dessen K 6= 0 konstatiert wird, ~v = const. Ich 14 1 Masse zeige aber jetzt, zunächst für den eben betrachteten Spezialfall einer konstanten Kraft, dass zur Beschreibung der Bewegung immer noch alle gleichförmig zueinander bewegten Koordinatensysteme gleichberechtigt sind. Führen wir insbesondere ein Koordinatensystem S 0 ein, dessen Ursprung im bisher benutzten Koordinatensystem S die Koordinaten ~x0 (t) = ~x(0) + ~v (0)t (1.13) hat und dessen Achsen zu den entsprechenden von S parallel liegen. S 0 ist ein anfängliches Ruhesystem des Teilchens. Der Ursprung von S 0 bewegt sich relativ zu S gleichförmig mit ~v (0); zur Zeit t = 0 liegt er bei ~x(0), wo dann auch gemäß (1.12) das betrachtete Teilchen sitzt. Wenn die Uhren im S 0 genauso laufen wie in K, was für hinreichend kleine Relativitätsgeschwindigkeit ~v (0) eine Erfahrungstatsache ist, so misst der das Koordinatensystem S 0 benutzende Beobachter für die Koordinaten des Teilchen x0 (t) = 0, y 0 (t) = 0, z 0 (t) = 1 Kt2 2m (1.14) bzw. in Vektorform ~x0 (t) = 1 ~ 2 Kt . 2m (1.15) Zwischen den Koordinaten des Teilchens in S und S 0 besteht der Zusammenhang ~x = ~x0 + ~x(0) + ~v (0)t, t = t0 , (1.16) der als Galileitransformation bezeichnet wird. Es ist wie gesagt gleichgültig, ob die Bewegung des Teilchens unter dem ~ im Koordinatensystem S oder im Koordinatensystem S 0 Einfluss der Kraft K beschrieben wird. Zwar ändert sich unter der Galileitransformation (1.16) die Bahnkurve, und zwar von (1.12) zu (1.15); gleich bleibt jedoch in S und S 0 (und ~ = md2 ~x/dt2 . Denn wir erhalten allen Inertialsystemen) das Grundgesetz K durch zweimaliges Differenzieren nach der Zeit aus (1.15) à ! ~ 2 d2 ~x0 d2 Kt ~ m 02 = m 2 =K dt dt 2m und aus (1.12) d2 ~x d2 m 2 =m 2 dt dt à ~ 2 Kt + ~v (0)t + ~x(0) 2m ! ~ , =K also in beiden Fällen dieselbe Differentialgleichung. −−−→ ~ = const Was ich hier am Beispiel des speziellen Kraftgesetzes K vorgeführt ~ = K(~ ~ x) richtig: Das Grundgesetz habe, ist auch für andere Kraftgesetze K ~ = md~v /dt gilt in gleicher Form in allen Inertialsystemen, d. h. allen KoK ordinatensystemen, die durch die Galileitransformation (1.16)verknüpft sind. 1.5 Schwere Teilchen 15 Der Grund für die Invarianz (Unveränderlichkeit) des Grundgesetzes unter der Galileitransformation ergibt sich aus folgender Überlegung: einerseits ist die Beschleunigung eines Teilchens in allen Inertialsystemen gleich. Wenn wir nämlich in (1.16)~x und ~x0 als zeitabhängige Ortsvektoren eines Teilchens ansehen, so gilt d2 ~x d2 ~x0 d2 d2 ~x0 = + 2 (~x(0) + ~v (0)t) = . 2 2 dt dt dt dt2 Andererseits sind Größe und Richtung der an einem Punkt im Raum auf das ~ x) unabhängig davon, ob wir den Raumpunkt mit Teilchen wirkenden Kraft K(~ Koordinaten bezüglich S oder bezüglich S 0 versehen. Die Invarianz des Grundgesetzes unter der Galileitransformation (1.16)ist eine wichtige Symmetrieeigenschaft des Grundgesetzes (1.5). Sie beinhaltet auch das wohlbekannte Additionsgesetz für Geschwindigkeiten. Hat ein Teilchen im System S 0 zu einem bestimmten Zeitpunkt die Geschwindigkeit ~v 0 und bewegt sich S 0 relativ zu S gleichförmig mit ~u, so hat das Teilchen in S die Geschwindigkeit ~v = ~v 0 + ~u . Abbildung 1.1 Empirisch ist das soeben besprochene Additionstheorem für Geschwindigkeiten genau wie das Newtonsche Grundgesetz schön abgesichert. Allerdings nur für Teilchen- und Relativgeschwindigkeiten, die allesamt klein gegenüber der Lichtgeschwindigkeit c ≈ 300 000 km/s sind. Sobald Geschwindigkeiten im Spiel sind, die betragsmäßig auch nur einige Prozent von c betragen, werden sowohl das Vektoradditionsgesetz für Geschwindigkeiten wie auch das Newtonsche Grundgesetz unrichtig. Die dann an ihre Stelle tretenden Gesetze besprechen wir im Kapitel 9. Vorläufig beschränken wir uns auf den nichtrelativistischen“ ” Newtonschen Grenzfall |~v |/c ¿ 1. 1.5 Schwere Teilchen Die Wanderer und Bergsteiger unter Ihnen kennen den Unterschied zwischen leichten und schweren Rucksäcken. Verschiedene Teilchen erfahren an der Erdoberfläche eine verschiedene Schwerkraft. Im durch die Abbildung 1.5 beschriebenen Gedankenexperiment lässt sich die Schwere“ eines Körpers quantitativ ” erfassen. Je schwerer ein an einer Feder aufgehängter Körper ist, desto weiter dehnt sich dieselbe aus. Nach geeigneter Eichung der Feder kann der Betrag der auf einen 16 1 Masse Abbildung 1.2 aufgehängten Körper wirkenden Schwerkraft aus der Verlängerung ∆z der Feder abgelesen werden. Die Schwerkraft, die ein Probekörper an der Erdoberfläche erfährt, ist stets zum Erdmittelpunkt hin gerichtet. Ihre Richtung ändert sich, wenn der fragliche Probekörper auf der Erdoberfläche bewegt wird. Folglich ist die Schwerkraft nicht eine Eigenschaft des Probekörpers allein, sondern eine gemeinsame Eigenschaft desselben und der ihn anziehenden Erde. Um die Schwere eines Probekörpers als richtungsunabhängige Eigenschaft seiner selbst zu charakterisieren, wird der Begriff der schweren Masse eingeführt durch ~ schwer | . mschwer ∼ |K (1.17) ~ schwer | in Newton Wenn die schwere Masse in kg und die Schwerkraft |K −2 (1 N = 1 kg · m · s ) gemessen werden, so ergibt sich der Proportionalitätsfaktor ~ schwer |/mschwer g = |K (1.18) aus Messungen an der Erdoberfläche zu g = 9, 81 m·s−2 . (1.19) Allerdings verkleinert sich der Proportionalitätsfaktor für wachsende Entfernung vom Erdmittelpunkt. Sie haben die Anziehungskraft zwischen zwei Teilchen mit den schweren Massen mschwer und Mschwer im Labor gemessen und das berühmte Newtonsche Gravitationsgesetz gefunden. Dieses besagt: - Die beiden Teilchen ziehen sich gegenseitig an. - Die beiden Anziehungskräfte sind betragsmäßig gleich (actio = reactio) und einander entgegengerichtet; ihre Richtungen sind parallel zur Verbindungslinie der (Schwerpunkte der) Teilchen. 1.5 Schwere Teilchen 17 - Der Betrag der Gravitationskraft ist proportional zu den beiden schweren Massen, ~ ∼ mschwer |K und ~ ∼ Mschwer |K| - Mit wachsender Entfernung r der beiden Teilchen nimmt der Betrag der Gravitationskraft ab, u. z. umgekehrt proportional zum Quadrat der Entfernung, ~ ∼ |K| 1 . r2 Insgesamt lässt sich der Betrag der Gravitationskraft ausdrücken als ~ =G |K| mschwer Mschwer , r2 (1.20) wobei G = 6, 67 × 10−11 N m2 kg−2 (1.21) die so genannte Gravitationskonstante ist. Jeder Körper ist zugleich träge und schwer. Die Trägheit wird quantifiziert durch die träge Masse, die Schwere durch die Masse. Warum tragen beide Größen den Namen Masse? Die Antwort begründet sich in einem Messergebnis, das zuerst von Galilei (1564 - 1642) gefunden und seither immer wieder mit wachsender Genauigkeit nachgeprüft wurde: Das Verhältnis von schwerer Masse und träger Masse ist für alle Teilchen gleich. Der Zahlenwert des Verhältnisses hängt von der Wahl der Einheiten ab, hat also keine physikalische Bedeutung. Es ist üblich, sowohl mschwer als auch mträge in kg zu messen. Dann gilt mschwer = mträge (1.22) und daher heißen beide Größen Masse. Meistens spricht man undifferenziert von der Masse eines Körpers, ohne besonders hervorzuheben, ob jeweils die Trägheit oder die Schwere des Körpers zur Debatte steht. Die Gleichheit von schwerer und träger Masse ist, nach unserem heutigen Verständnis der Materie, von fundamentalerer Bedeutung als die beiden ~ = md~v /dt und K = GmM/r 2 . Ersteres gilt nur Newtonschen Gesetze K näherungsweise für Teilchen mit v ¿ c, letzteres nur näherungsweise für Teilchen mit hinreichend kleinen Massen in hinreichend großen Entfernungen voneinander. Der Planet Merkur merkt im Perihel (Punkt kleinsten Abstands zur Sonne) seiner Bahn eine Abweichung der Anziehungskraft der Sonne von diesem Gesetz. Einstein folgerte aus mschwer = mträge eine Gravitationstheorie, die allgemeine Relativitätstheorie, die genauer ist als das Newtonsche Gesetz. 18 1 Masse Kapitel 2 Schwingungen 2.1 Der harmonische Oszillator Betrachten wir ein Teilchen der Masse m, das längs einer Geraden beweglich und durch eine harmonische Rückstellkraft an eine Gleichgewichtslage gebunden ist. Wenn wir die Auslenkung des Teilchens aus der Gleichgewichtslage mit der Koordinate x parametrisieren, so kommt die Harmonizität der Rückstellkraft zum Ausdruck in der Linearität der Kraft K = −kx (2.1) in der Auslenkung x. Der Proportionalitätsfaktor k wird zuweilen als Kraftkonstante bezeichnet und ist als positiv definiert. Das Minuszeichen im Kraftgesetz (2.1) zeigt somit an, dass die Kraft der Auslenkung stets entgegenwirkt und tatsächlich eine Rückstellkraft ist. ~ = md~v /dt Für das in Rede stehende Teilchen gibt das Newtonsche Gesetz K als Bewegungsgleichung die so genannte Schwingungsgleichung m d2 x = −kx , dt2 (2.2) aus der wir nun die Bahnkurve x(t) gewinnen wollen. Mit Hilfe von ω 2 = k/m (2.3) und d2 x/dt2 = ẍ bringen wir die Bewegungsgleichung (2.2) zunächst in die schönere Form ẍ + ω 2 x = 0 . (2.4) Eine Lösung der Differentialgleichung (2.4) lässt sich sofort angeben, x(t) = 0 . 19 (2.5) 20 2 Schwingungen Sie entspricht dem Ruhezustand des Teilchens in der Gleichgewichtslage und heißt die triviale Lösung. Es muss zwei linear unabhängige nichttriviale Lösungen geben, da die Differentialgleichung (2.4) von zweiter Ordnung ist. Ein mögliches Paar solcher Lösungen ist sin ωt und cos ωt. Wegen der Linearität der Bewegungsgleichung gilt das Superpositionsprinzip. Die allgemeinste Lösung ergibt sich daher als die Schwingung x(t) = a cos ωt + b sin ωt . (2.6) Die beiden Integrationskonstanten a und b können durch Anfangsbedingungen festgelegt werden, z. B. durch die anfängliche Auslenkung x(0) und die anfängliche Geschwindigkeit ẋ(0). Dann entsteht aus (2.6) x(t) = x(0) cos ωt + 1 ẋ(0) sin ωt. ω (2.7) Wir können auch die Additionstheoreme für Sinus und Kosinus benutzen und schreiben x(t) = xmax cos(ωt − ϕ) (2.8) und die beiden Integrationskonstanten xmax , ϕ durch x(0) und ẋ(0) ausdrücken. Dabei finden wir für die Amplitude xmax der Schwingung xmax = p x(0)2 + (ẋ(0)/ω)2 (2.9) und für die Phase ϕ tan ϕ = ẋ(0)/ωx(0) . (2.10) Es ist für viele, vor allem rechnerische Zwecke bequem, statt mit cos ωt und sin ωt mit Exponentialfunktionen zu arbeiten. Setzen wir zur Lösung der Gleichung (2.4) an x(t) = eλt , (2.11) so erhalten wir aus (2.4) die Forderung (λ2 + ω 2 ) eλt = 0 . (2.12) Der Ansatz (2.11) führt offenbar zu Lösungen für λ = ±iω. Diese lauten e±iωt , oder linear kombiniert, x(t) = A e−iωt + B e−iωt . (2.13) 2.2 Der Energieeigensatz 21 Die beiden Integrationskonstanten A und B lassen sich wieder durch x(0) und ẋ(0) ausdrücken x(t) = = µ µ ¶ ¶ 1 i i 1 x(0) − ẋ(0) e iωt + x(0) + ẋ(0) e−iωt 2 ω 2 ω ¶ µ i 1 (2.14) x(0) − ẋ(0) e iωt + c.c. . 2 ω Offensichtlich gilt A = B ∗ , und das muss auch so sein, damit x(t) reell bleibt. Mit Hilfe von eiα = cos α + i sin α (2.15) lässt sich die Lösung (2.14) wieder auf die Form (2.7) oder (2.8) zurückführen. 2.2 Der Energieeigensatz Anstatt Lösungen der Schwingungsgleichung zu raten oder durch Exponentialansätze zu suchen, können wir sie auch durch zweimaliges Integrieren konstruieren. Dabei finden wir nicht nur die bekannten Lösungen, sondern auch, nach einer Integration, einen der wichtigsten Sätze der Physik, den Energieerhaltungssatz. Multiplizieren wir nämlich beide Seiten der Schwingungsgleichung (2.2) mit der Geschwindigkeit ẋ, so lässt sich die entstehende Gleichung, mẋẍ + k ẋx = 0 , als das Verschwinden einer totalen Zeitableitung schreiben, ¶ µ 1 1 d 2 2 mẋ + kx = 0 . dt 2 2 (2.16) (2.17) Folglich bleibt die Größe 1 1 mẋ2 + kx2 = E ≥ 0 , 2 2 (2.18) die Energie des Oszillators, zeitlich konstant. Sie besteht aus zwei nichtnegativen additiven Anteilen, der kinetischen Energie T = m 2 ẋ 2 (2.19) U= k 2 x . 2 (2.20) und der potenziellen Energie 22 2 Schwingungen Wenn U zunimmt, d. h. wenn die Auslenkung |x| wächst, muss T abnehmen, d. h. die Geschwindigkeit |ẋ| sich verkleinern, U ist maximal, Umax = E, wenn T = 0, d. h. wenn das Teilchen ruht. Ein solcher Momentanzustand liegt immer in den Umkehrpunkten ±x = xmax = p 2E/k (2.21) vor. Dagegen hat die Geschwindigkeit den Maximalwert ±ẋ = ẋmax = p 2E/m (2.22) jedesmal, wenn das Teilchen die Gleichgewichtslage bei x = 0 durchläuft, denn dort hat die potenzielle Energie den kleinstmöglichen Wert U = 0 Abbildung (2.1). Die potenzielle Energie lässt sich durch die Kraft ausdrücken und umgekehrt. Sie verifizieren leicht, dass die Kraft der negativen Ableitung der potenziellen Energie gleich ist, d K = −kx = − dx µ k 2 x 2 ¶ =− d U , dx Abbildung 2.1 und die potenzielle Energie dem negativen Integral über die Kraft, (2.23) 2.3 Der Energiesatz für beliebige konservative Kräfte U =+ Zx 1 dx kx = kx2 = − 2 0 0 0 Zx dx0 K(x0 ) . 23 (2.24) 0 Man sagt auch, dass beim Vergrößern von x gegen die Kraft K Arbeit geleistet wird. Dabei wird die Arbeit als potenzielle Energie gespeichert. Die Begriffsbildungen Energie, kinetische Energie und potenzielle Energie werden wir später vertiefen. Vorläufig konzentrieren wir uns auf die Aufgabe, die Bahnkurve x(t) des Oszillators zu konstruieren. Zu diesem Zweck lösen wir den Energiesatz (2.18) nach der Geschwindigkeit auf, s µ ¶ 2 k 2 dx ẋ(t) = , (2.25) E− x = m 2 dt und integrieren. Wir erhalten x(t) Z x(0) q dx 2 m ¡ E− k 2 x2 ¢= Zt dt = t , (2.26) 0 wobei jetzt x(0) als zweite Integrationskonstante neben E auftritt. Gleichfalls möglich und sogar ein wenig bequemer p ist es, statt der anfänglichen Auslenkung x(0) die größte Amplitude, xmax = 2E/k, als Integrationskonstante zu wählen und einen der (∞ vielen) Zeitpunkte, an denen x = +xmax vorliegt, als tmax zu p bezeichnen. Mit Hilfe von ω = k/m erhalten wir dann statt (2.26) x(t) Z +xmax p dx x2max − x2 = ω(t − tmax ) . (2.27) Das links stehende Integral hat den Wert − arccos (x(t)/xmax ). Damit ist die aus 2.1 bekannte Lösung x(t) = xmax cos ω(t − tmax ) (2.28) wiedergefunden. Diesmal, wohlgemerkt, nicht durch gescheites Raten sondern durch direkte Integration der Bewegungsgleichung. 2.3 Der Energiesatz für beliebige konservative Kräfte Beim Integrieren der Bewegungsgleichung mẍ+kx = 0 zum Energiesatz E = mẋ/2 + kx2 /2 war gar nicht wesentlich, dass die Kraft linear in x ist; vielmehr nur, dass K = K(x) nur von x abhängt und nicht etwa auch von ẋ, ẍ etc. Kräfte, die eindeutige Funktionen einer Koordinate x sind, heißen konservativ (konservativ = erhaltend; Energieerhaltung). Wirkt eine beliebige derartige Kraft auf ein Teilchen, so lautet die Newtonsche Bewegungsgleichung 24 2 Schwingungen mẍ − K(x) = 0 . (2.29) Durch Multiplikation mit der Geschwindigkeit ẋ entsteht hieraus mẋẍ − ẋK(x) = 0 . (2.30) Schreiben wir die Kraft als negative Ableitung einer Funktion U (x) K(x) = − d U (x) = −U 0 (x) , dx (2.31) so lässt sich (2.30) offenbar wieder als der Erhaltungssatz d dt µ 1 mẋ2 + U (x) 2 ¶ =0 (2.32) oder 1 mẋ2 + U (x) = const = E 2 (2.33) schreiben. Dabei ist U (x) die potenzielle und T = 21 mẋ2 wieder die kinetische Energie. Wie schon beim harmonischen Oszillator erlaubt der Energiesatz (2.33) vor jeder weiteren Rechnung qualitative Einblicke in den Ablauf der Bewegung des Teilchens. Wenn etwa die potenzielle Energie den in Abbildung 2.2 skizzierten Verlauf hat, so gilt für die Energie E ≥ Umin , (2.34) da die kinetische Energie nicht negativ sein kann. Durch den Wert der Energie sind zwei Umkehrpunkte x1 (e) und x2 (E) festgelegt, in denen das Teilchen momentan ruht und die die Aufenthaltsmöglichkeit des Teilchens einschränken, x1 (E) ≤ x ≤ x2 (E) . (2.35) Die Teilchenkoordinate schwingt dann zwischen den beiden Umkehrpunkten hin und her. Allerdings verläuft die Schwingung nicht harmonisch, d. h. sinusoder kosinusförmig mit einer Frequenz ω, es sei denn, U (x) habe genau die Form einer quadratischen Parabel. Man spricht von einer nichtlinearen oder anharmonischen Schwingung. Die Berechnung der Bahnkurve x(t) kann für die nichtlineare Schwingung bis auf eine Quadratur genauso durchgeführt werden wie für die harmonische Schwingung. Durch Auflösen des Energiesatzes (2.33) nach der Geschwindigkeit erhalten wir wieder (2.25), also 2.3 Der Energiesatz für beliebige konservative Kräfte 25 Abbildung 2.2 dx =± dt r 2 (E − U (x)) m (2.36) und hieraus durch Integration nach der Zeit t=± r m 2 Z dx (E − U (x)) −1/2 + const . (2.37) Zur Gewinnung der Bahnkurve ist nur die eine in (2.37) offene Quadratur auszuführen. Für die Dauer einer Schwingung ergibt sich aus (2.37) das Resultat T = = r √ x Z2 m 2 2m x1 Zx2 x1 dx(E − U (x))−1/2 − dx (E − U (x)) −1/2 . Zx1 x2 dx (E − U (x)) −1/2 (2.38) Im allgemeinen wird die Dauer einer nichtlinearen Schwingung von der Energie E abhängen. Als kleine Übung bleibt Ihnen, durch Ausführen des Integrals in (2.38) für den p Fall der harmonischen Bindung, U = kx2 /2, das altbekannte Resultat T = 2π m/k = 2π/ω zu gewinnen. Beachten Sie, dass T in diesem Spezialfall von der Energie E der Schwingung (u. somit auch von der Schwingungsamplitude) unabhängig ist. 26 2 Schwingungen Die eben gegebene Diskussion lässt sich leicht verallgemeinern auf potenzielle Energien U (x), die komplizierter verlaufen als in Abbildung 2.2 veranschaulicht. Ein interessanter Fall ist in Abbildung 2.3 dargestellt. Abbildung 2.3 Wenn die Energie des Teilchens wie in der Skizze eingetragen im Intervall U2 < E < U 4 (2.39) liegt, so kann sich das Teilchen wegen E = T + U ≥ U im Bereich x1 ≤ x ≤ x 3 (2.40) aufhalten und dort eine nichtlineare Schwingung der oben beschriebenen Art ausführen; es kann sich aber auch im nach rechts unbegrenzten Intervall x5 ≤ x < ∞ (2.41) befinden und wird sich dann für t → ∞ ins Unendliche verflüchtigen. Zur Übung bleibt Ihnen die qualitative Diskussion der Teilchenbahn in den Fällen E > U4 , E = U4 , E ≤ U2 . Im übrigen sollten Sie auch bei Ihrer nächsten Fahrt auf der Achterbahn an den Energiesatz denken. 2.4 Der gedämpfte harmonische Oszillator Nicht alle Kräfte sind konservativ. Als ein Beispiel einer nichtkonservativen Kraft betrachten wir die in der Teilchengeschwindigkeit lineare Reibungskraft ~ = −α~x˙ , K α>0. (2.42) Derartige Reibungskräfte wirken z. B. auf makroskopische Körper, die sich durch viskose Flüssigkeiten bewegen. 2.4 Der gedämpfte harmonische Oszillator 27 Zur Illustration behandeln wir hier den Einfluss der Reibung auf die eindimensionale harmonische Schwingung. Wenn wir neben einer linearen Rückstellkraft auch die Reibungskraft (2.41) in Rechnung stellen, so finden wir als Newtonsche Bewegungsgleichung eines Teilchens der Masse m mẍ + αẋ + kx = 0 . (2.43) Da nun die gesamte auf das Teilchen wirkende Kraft geschwindigkeitsabhängig ist, gilt der Energiesatz in der bisherigen Form nicht mehr. Anfänglich im Oszillator steckende Energie geht demselben im Laufe der Zeit verloren: ein gedämpft schwingendes Pendel kommt nach einer Weile zur Ruhe. Sie wissen, dass die Oszillatorenergie in Wärme verwandelt wird, d. h. sich in ungeordneter Bewegung der Teilchen im reibenden Medium wiederfindet. Wir werden diesen Dissipationsprozess in 2.13 im Einzelnen diskutieren. Da die Bewegungsgleichung (2.43) linear ist, lässt sie sich ebenso wie die des ungedämpften harmonischen Oszillators in 2.1 durch den Exponentialansatz x(t) = eλt (2.44) lösen. Für den Parameter λ erhalten wir aus (2.43) die Forderung (die Säkulargleichung) mλ2 + αλ + k = 0 , die durch die beiden Werte (die Eigenwerte) ) ( r³ α ´2 k α ± − λ± = − 2m 2m m (2.45) (2.46) befriedigt wird. Bequemlichkeitshalber führen wir wieder die Frequenz der ungedämpften Schwingung r k (2.47) ω0 = m ein und zusätzlich die so genannte Dämpfungskonstante γ= α . 2m Damit schreiben sich die beiden Eigenwerte q λ± = −γ ± γ 2 − ω02 . (2.48) (2.49) Die beiden gefundenen Lösungen (2.44) mit (2.49) der Bewegungsgleichung (2.43) ergeben nach Superposition die allgemeine Lösung √ 2 2 √ 2 2 (2.50) x(t) = Ae−(γ− γ −ω0 )t + Be−(γ+ γ −ω0 )t . 28 2 Schwingungen Die beiden Integrationskonstanten A und B können ähnlich wie in 2.1 durch Anfangsbedingungen festgelegt, also etwa durch die anfängliche Auslenkung x(0) und die anfängliche Geschwindigkeit ẋ(0) wie folgt ausgedrückt werden A = B = · µ ¶¸ . q ẋ(0) + x(0) γ + − 2 γ 2 − ω02 · µ ¶¸ . q q 2 2 −ẋ(0) − x(0) γ − γ − ω0 2 γ 2 − ω02 . q γ2 ω02 (2.51) Der gedämpfte Oszillator verhält sich qualitativ verschieden, je nachdem ob die Dämpfungskonstante γ kleiner, gleich oder größer ist als die Frequenz∗) ω0 der ungedämpften Schwingung. Im Fall schwacher Dämpfung, γ < ω0 , werden λ± komplex, d. h. in q q γ 2 − ω02 = i ω02 − γ 2 ≡ iω (2.52) ist dann ω eine reelle Frequenz. Die Lösung (2.50) beschreibt eine gedämpfte Schwingung, x(t) = (A e+iωt + B e−iωt )e−γt . (2.53) Beachten Sie, dass der oszillatorische Faktor in (2.53) harmonisch schwingt mit der Frequenz ω, die von der Eigenfrequenz ω0 bei Abwesenheit von Dämpfung verschieden ist. Die Benennung des Parameters γ als Dämpfungskonstante rührt genau daher, dass die Lösung (2.53) zeitlich exponentiell abklingt, u. z. auf einer Zeitskala 1/γ. Die Zeit 1/γ wird auch als Abklingzeit bezeichnet. Im so genannten Fall der Überdämpfung, γ > ω0 , sind beide Eigenwerte λ± reell. Nach hinreichend langer Zeit wird die Lösung (2.50) dabei wegen |λ− | < |λ+ | dominiert durch den ersten Summanden, √ 2 2 (2.54) x(t) → A e−(γ− λ −ω0 )t . Bei starker Überdämpfung, γ À ω0 , lässt sich λ− durch wenige Glieder einer Potenzreihe in (ω0 /γ) approximieren, −λ− µ ¶ q γ 1 − 1 − ω02 /γ 2 ¶ µ 1 ω02 . . . ≈ γ 1−1+ 2 γ2 = ≈ ω02 /2γ . (2.55) Da nun 1/|λ− | die Bedeutung einer Abklingzeit hat, sehen wir interessanterweise dieselbe mit wachsendem γ wachsen. ∗) Frequenz bedeutet hier immer das 2π-fache der inversen Schwingungsdauer 2.5 Resonanz 29 Im Fall der kritischen Dämpfung, γ = ω0 fallen die beiden Eigenwerte λ+ und λ− zusammen. Der Exponentialansatz (2.44) ergibt somit nur eine Lösung der Bewegungsgleichung. Eine zweite, linear unabhängige muss existieren, da (2.43) eine Differentialgleichung zweiter Ordnung ist. Wir verifizieren sie leicht als te−γt und können die allgemeine Lösung dann wieder durch Superposition der beiden Partikularlösungen angeben als x(t) = (a + bt)e−γt . (2.56) Beim Bau von Messinstrumenten mit schwingungsfähigen Zeigern wird oft die kritische Dämpfung eingestellt, um zu erreichen, dass der Zeiger schnellstmöglich auf zeitliche Änderung der zu messenden Größe antwortet. Wir hatten oben (s. (2.55)) gesehen, dass die Abklingzeit des Oszillators im Grenzfall großer Dämpfung mit γ wächst wie 2γ/ω02 ; im Grenzfall kleiner Dämpfung beträgt aber gemäß (2.53) die Abklingzeit 1/γ und wächst zu großen Werten mit γ → 0; die kleinstmögliche Abklingzeit ergibt sich gerade für γ = ω0 . Abbildung 2.4 zeigt das Produkt der Abklingzeit τ mit der Frequenz ω0 als Funktion von γ/ω0 und macht das Argument sinnfälliger. Abbildung 2.4 2.5 Resonanz Manchmal finden Sie im Wald morsche Bäume, die sich von Hand fällen lassen. Mit gleichmäßigem Drücken oder Ziehen gelingt es zwar nicht, wohl aber mit rhythmischem Drücken und Ziehen im Takt einer Eigenfrequenz“ des ” Baumes. Um die Theorie dieses Resonanzphänomens abzuhandeln, berücksichtigen wir in der Bewegungsgleichung des Oszillators neben der Rückstell- und der Reibungskraft eine äußere zeitlich periodische monochromatische Kraft gemäß mẍ + 2mλẋ + mω02 x = F (t) = F1 cos ω1 t . (2.57) Aus Bequemlichkeit lösen wir diese Gleichung in komplexer Form, d. h. suchen zunächst die Lösung ξ(t) der Differentialgleichung 30 2 Schwingungen Abbildung 2.5 mξ¨ + 2mγ ξ˙ + mω02 ξ = F1 eiω1 t (2.58) und nehmen von der Lösung den Realteil. Dieser löst die ursprüngliche Gleichung (2.57), denn (2.58) lautet µ ¶³ ´ d2 d 2 m 2 + 2mγ Re ξ(t) + i Im ξ(t) = F1 cos ω1 t + iF1 sin ω1 t , + mω0 dt dt (2.59) und die Gleichheit zweier komplexer Zahlen ist gegeben bei Gleichheit ist gegeben bei Gleichheit der Real- und Imaginärteile. Es lohnt sich, komplex zu rechnen, da Exponentialfunktionen einfachere Differentialregeln haben als Sinus und Kosinus. Gleichung (2.58) ist eine inhomogene lineare Differentialgleichung, deren allgemeine Lösung sich durch Superposition einer beliebigen Partikularlösung der inhomogenen Gleichung mit der allgemeinen Lösung der zugehörigen homogenen Gleichung ergibt. Eine Partikularlösung der inhomogenen Gleichung finden wir durch den Exponentialansatz x(t) = a1 ei(ω1 t−ϕ1 ) (2.60) mit der reellen Amplitude a1 und der Phase ϕ1 . Dieser Ansatz liegt nahe, denn wenn Sie mit der Frequenz ω1 am Baum rütteln, so sollte er auch mit dieser Frequenz schwingen. Tragen wir den Ansatz in die Bewegungsgleichung (2.58) ein, so erhalten wir die Forderung (−mω12 + i2mγω1 + mω02 ) a1 ei(ω1 t−ϕ1 ) = F1 eiω1 t (2.61) Offenbar lässt sich diese Forderung erfüllen, wenn die komplexe Amplitude a1 e−iϕ1 zu a1 e−iϕ1 = F1 /m ω02 − ω12 + i2γω1 (2.62) 2.5 Resonanz 31 gewählt wird. Hiermit sind die Phase ϕ1 und die reelle Amplitude a1 festgelegt als und a1 = a1 (ω1 ) = p F1 /m (ω02 − ω12 )2 + 4γ 2 ω12 tan ϕ1 = tan ϕ1 (ω1 ) = 2γω1 . ω02 − ω12 (2.63) (2.64) Die allgemeine Lösung von (2.58) lautet nun, mit zwei beliebigen reellen Integrationskonstanten a und ϕ, ξ(t) = ae−iϕ e(iω−γ)t + a1 e−iϕ1 eiω1 t , (2.65) denn der erste Summand ist genau die im letzten Paragrafen diskutierte allgemeine Lösung der homogenen Schwingungsgleichung mit q ω = ω02 − γ 2 . (2.66) Der Realteil x(t) = Reξ(t) ist die gesuchte allgemeine Lösung von (2.57). Er hat die Form x(t) = a cos(ωt − ϕ)e−γt + a1 cos(ω1 t − ϕ1 ) . (2.67) Beachten Sie, dass die hier additiv auftretende freie gedämpfte Schwingung nach hinreichend langer Zeit abgeklungen ist, während die erzwungene Schwingung der äußeren periodischen Einwirkung unentwegt folgt. Diese andauernde erzwungene Schwingung will ich Ihnen noch in Einzelheiten erläutern. Die Amplitude a1 = a1 (ω1 ) ist proportional zu F1 /m, d. h. um so größer, je weniger träge das schwingende Teilchen und je größer die Amplitude der erzwungenen Kraft F1 sind. Sie können letzteres Resultat als die Feststellung lesen, dass sich mit Bulldozern fast jeder Baum umreißen (ω1 = 0) lässt. Einen größeren morschen Baum merklich aus der Ruhestellung auszulenken oder ihn gar zu fällen, gelingt Ihnen aus eigener Kraft i. Allg. jedoch nur, wenn Sie die Frequenzabhängigkeit der Amplitude a1 (ω1 ) ausnutzen. Diskutieren wir diese Abhängigkeit für den Fall schwacher Dämpfung γ ¿ ω0 . Die maximale Antwort a1 (ω1 ) des Oszillators stellt sich bei festen Werten von γ und ω0 für diejenige Frequenz ω1 der äußeren Störung ein, bei der da1 /dω1 = 0 und d2 a1 /dω12 < 0 ist. Aus (2.63) finden wir diese Resonanzfrequenz zu ωres = (ω02 − 2γ 2 )1/2 ≈ ω0 − γ 2 /ω0 . (2.68) Ebenso wie die Eigenfrequenz (2.66) der freien ungedämpften Schwingung liegt die Resonanzfrequenz ωres nahe der Eigenfrequenz ω0 des freien konservativen Oszillators, < ωres ≈ ω0 − γ 2 /ω0 ∼ ω ≈ ω0 − γ 2 /2ω0 < ∼ ω0 , (2.69) 32 2 Schwingungen falls die Dämpfung im Sinne von γ ¿ ω0 sehr schwach ist. An der Resonanzfrequenz hat die Schwingungsamplitude den Wert a1,max = F1 , 2mωγ (2.70) der für kleine Dämpfung sehr groß sein kann; so groß, dass die Resonanzkatastrophe eintritt und der Baum aus den Wurzeln gerissen wird; jedenfalls viel größer als die Antwort auf eine statische äußere Störung a1 (ω1 = 0) = F1 . mω02 (2.71) Um ein Maß für die Schärfe der Resonanz zu erhalten, können √ wir nach den Frequenzen fragen, für die die Amplitude a1 (ω1 ) auf das (1/ √2)-fache des Maximums (2.70) abgefallen ist. Die Forderung a1 (ω) = a1,max / 2 führt auf eine quadratische Gleichung mit den Wurzeln ω2 = ≈ ω02 − 2γ 2 ± 2γω0 ω02 (1 ± 2γ/ω0 ) , q 1 − γ 2 /ω02 (2.72) also ω ≈ ω0 ± γ . (2.73) Die Breite der Resonanzkurve“ a1 = a1 (ω1 ) ist also im betrachteten Grenzfall ” proportional zur Dämpfungskonstanten und somit klein im Vergleich zur Resonanzfrequenz selbst. Die Abbildung 2.6 zeigt den Verlauf der Resonanzkurve. Abbildung 2.6 2.6 Antwort auf beliebige periodische Anregung (Fourierreihen) 33 Für die Phase ϕ1 zwischen der äußeren Kraft und der Antwort des Oszillators finden wir aus (2.64) für Frequenzen weit unterhalb der Resonanz den kleinen Wert ϕ1 ≈ π 2γω1 ¿ ω02 − ω12 2 für ω0 − ω1 À γ ; (2.74) also schwingt der Oszillator dabei praktisch in Phase mit der äußeren Kraft. Für ω1 = ω0 ist die Phase ϕ1 auf den Wert π/2 angewachsen und für Frequenzen weit oberhalb der Resonanz schwingt der Oszillator praktisch im Gegentakt zur äußeren Kraft, d. h. es gilt ϕ1 < ∼π für ω1 − ω0 À γ (2.75) Die Abbildung 2.7 macht deutlich, dass sich der Phasensprung von Null nach π innerhalb eines Frequenzintervalls der Größenordnung γ vollzieht. Für die Beobachtung dieses Phasensprungs sowie der vorher besprochenen Resonanzphänomene im Labor (lieber doch nicht im Wald!) wünsche ich Ihnen viel Spaß. Abbildung 2.7 2.6 Antwort auf beliebige periodische Anregung (Fourierreihen) Im letzten Paragrafen hatten wir nur monochromatische äußere Störungen betrachtet. Jetzt will ich die Untersuchung ausdehnen auf Kräfte, die zwar zeitlich periodisch sind mit der Periode τ gemäß F (t) = F (t + τ ) (2.76) die aber nicht notwendig monochromatisch schwingen wie ei2πt/τ . Die Antwort x(t) des Oszillators auf derartige äußere Kräfte finden wir leicht, wenn wir nur 34 2 Schwingungen beachten, dass sich eine Funktion f (t) mit der Periodizität (2.76) immer ∗) durch eine Summe monochromatischer Funktionen, die Fourierreihe X F (t) = Fn einΩt , Ω= n=0,±1,±2,... 2π τ (2.77) mit geeigneten Koeffizienten Fn darstellen lässt. Die Fourierkoeffizienten Fn sind durch die Funktion F (t) eindeutig festgelegt. Um sie zu konstruieren, multiplizieren wir beide Seiten von (2.77) mit eimΩt , integrieren über die Zeit von 0 bis τ und beachten die für ganzzahlige m und n gültige Regel 1 τ Zτ dt ei(n−m)Ωt = δnm = 0 ½ 1 0 für für n=m n 6= m . (2.78) Es ergibt sich Fm 1 = τ Zτ dt e−imΩt F (t) . (2.79) 0 Nach den Überlegungen des 2.5 ruft eine auf den Oszillator einwirkende Kraft Fn einΩt die Antwort x(t) = m(ω02 Fn einΩt − n2 Ω2 + i2γnΩ) (2.80) hervor. Wegen der Linearität der Schwingungsgleichung m(ẍ + 2γ ẋ + ω02 x) = F (t) (2.81) lässt sich die Lösung derselben bei Vorliegen der äußeren Kraft (2.77) durch Superposition der Antworten (2.80) auf die monochromatischen Bestandteile Fn einΩt konstruieren. Sie lautet also, unter Einschluss des Einschwingungsvorgangs, x(t) = X Fn 2 (ω0 − n2 Ω2 + i2γnΩ)−1 einΩt + a cos(ωt − ϕ)e−γt (2.82) m n=0,±1,±2,... mit ω = (ω02 − γ 2 )1/2 . Bis auf den zeitlich abklingenden Einschwingungsvorgang ist diese Lösung offenbar auch periodisch mit der Periode τ = 2π/Ω. Zu einer gegebenen periodischen äußeren Kraft F (t) sind nur die Fourierkoeffizienten Fn aus (2.79) zu bestimmen, damit die allgemeine Lösung (2.82) der Schwingungsgleichung (2.81) explizit angegeben werden kann. Wenn eine (und nur eine!) der Frequenzen nΩ nahe bei der Resonanzfrequenz ωres des Oszillators liegt, so wird die Fourierreihe (2.82) vom entsprechenden Summanden ∗) Die Theorie der Fourierreihen ersetzt immer“ durch Forderungen an die Funktion F (t), ” die ich im folgenden als erfüllt ansehe. 2.7 Antwort auf beliebige Anregung 35 dominiert, da alle anderen Koeffizienten Fm betragsmäßig viel kleiner sind als der zur Resonanz gehörige. Würden Sie übrigens auch brummig reagieren, wenn man Ihnen Mozarts Kleine Nachtmusik über einen Lautsprecher“ vorspielte, der bei 60 Hertz eine ” nur schwach gedämpfte Eigenschwingung aufweist? 2.7 Antwort auf beliebige Anregung Auch bei Vorliegen einer beliebigen nichtperiodischen äußeren Kraft F (t) können wir die Bewegungsgleichung des harmonischen Oszillators, ẍ + 2γ ẋ + ω02 x = F (t)/m , (2.83) lösen durch Superposition der Antworten auf monochromatische Kräfte. Zu diesem Zweck müssen wir zunächst die Kraft F (t) durch ein Fourierintegral F (t) = +∞ Z dΩ iΩt e F (Ω) 2π (2.84) −∞ darstellen. Wir hatten die Antwort x(Ω)eiΩt auf die monochromatische Kraft F (Ω)eiΩt in 2.6 gefunden, x(Ω)eiΩt = F (Ω)/m eiΩt , ω02 − Ω2 + i2γΩ (2.85) wobei der Einschwingvorgang nicht mit aufgeschrieben ist. Mit Hilfe des Superpositionsprinzips erhalten wir die Antwort auf die Überlagerung (2.84) von monochromatischen Kräften als x(t) = +∞ Z −∞ dΩ iΩt F (Ω)/m e . 2π ω02 − Ω2 + i2γΩ (2.86) Zur Auswertung der Lösung (2.86) bei vorgegebener Kraft F (t) muss zunächst die Fouriertransformierte F (Ω) bestimmt und dann das Integral in (2.86) berechnet werden. Ich verzichte hier auf die Darlegung der erforderlichen mathematischen Techniken zugunsten der physikalisch durchsichtigeren Konstruktion einer zu (2.86) äquivalenten Lösung der Bewegungsgleichung (2.83). Denken wir uns unser schwingungsfähiges Teilchen zu einem Anfangszeitpunkt t0 bei x = 0 ruhend und dann einem Kraftstoß ausgesetzt, d. h. einer Kraft F (t0 ), die nur innerhalb einer kurzen Zeitspanne ∆t von t0 bis t0 + ∆t von Null verschieden und innerhalb dieses Intervalls konstant ist. Für das nachfolgende Argument sind von Interesse die Auslenkung x(t0 +∆t) und die Geschwindigkeit ẋ(t0 + ∆t) am Ende des Kraftstoßes. Indem wir x(t) um die Zeit t = t0 in eine Taylorreihe entwickeln, x(t) = x(t0 ) + ẋ(t0 )(t − t0 ) + 1 ẍ(t0 )(t − t0 )2 + . . . , 2 (2.87) 36 2 Schwingungen und hier die zur Zeit t0 gestellten Anfangsbedingungen eintragen, x(t) = 1 ẍ(t0 )(t − t0 )2 + . . . , 2 (2.88) erkennen wir, dass x(t0 + ∆t) von der Ordnung (∆t)2 und die Geschwindigkeit ẋ(t0 + ∆t) von der Ordnung ∆t sind, x(t0 + ∆t) = ẋ(t0 + ∆t) = 1 ẍ(t0 )(∆t)2 + . . . 2 ẍ(t0 )∆t + . . . . (2.89) Die hier eingehende anfängliche Beschleunigung ist aber durch die Schwingungsgleichung (2.83) zu ẍ(t0 ) = F (t0 )/m festgelegt, so dass wir unter Vernachlässigung von Gliedern quadratischer und höherer Ordnung in ∆t am Ende des Kraftstoßes haben x(t0 + ∆t) = ẋ(t0 + ∆t) = 0 F (t0 )∆t . m (2.90) Nach Beendigung des Kraftstoßes schwingt der Oszillator frei. Aus (2.51, 2.53) finden wir das spätere Verhalten (für γ < ω0 ) zu x(t) = F (t0 )∆t −γ(t−t0 −∆t) e sin ω(t − t0 − ∆t) mω für t ≥ t0 + ∆t (2.91) mit ω= q ω02 − γ 2 . (2.92) Da wir bereits Fehler der Ordnung (∆t)2 in Kauf genommen haben, dürfen wir im gewonnenen Ausdruck für x(t) die Zeit t − t0 − ∆t durch t − t0 ersetzen, ohne weitere Genauigkeitsverluste zu erleiden. Nicht zu vergessen ist, dass das Resultat (2.91) gewonnen wurde unter der Bedingung x(t0 ) = ẋ(t0 ) = 0. Für den Fall, dass zu Beginn des Kraftstoßes die Auslenkung x(t0 ) und die Geschwindigkeit ẋ(t0 ) nichtverschwindende Werte haben, zeigt eine geringfügige modifizierte Überlegung, die ich Ihnen zur Übung überlasse, dass sich (2.91) ersetzt durch F (t0 )∆t −γ(t−t0 ) e sin ω(t − t0 ) + . . . . (2.93) mω Das Symbol . . . steht hierin sowohl für Korrekturglieder von höherer als erster Ordnung in ∆t wie für eine von der äußeren Kraft F (t0 ) unabhängige, durch x(t0 ) und ẋ(t0 ) festgelegte freie gedämpfte Schwingung. x(t) = 2.7 Antwort auf beliebige Anregung 37 Wegen der Linearität der Schwingungsgleichung (2.38) kann nun ohne weitere Rechnung auch die Antwort des Oszillators auf eine Folge von n nicht überlappenden Kraftstößen des beschriebenen Typs angegeben werden. Durch Überlagerung der Antworten auf alle dem Zeitpunkt vorausgehenden Kraftstöße erhalten wir für den Zeitraum nach Ende des letzten die Gesamtantwort zur Zeit t x(t) = n−1 X ν=0 F (tν )∆t −γ(t−tν ) e sin ω(t − tν ) . mω (2.94) Dabei dürfen die Kraftstöße untereinander verschiedene Stärken F (tν ) haben, sind aber alle als zeitlich gleich lang angenommen. Etwaige dem Zeitpunkt t nachfolgende äußere Kraftstöße können zur Zeit t noch nicht beantwortet sein und treten daher in (2.94) nicht auf. Ein Blick auf Abbildung 2.8 zeigt, dass sich jede zur Zeit t0 angeschaltete und anschließend vernünftig verlaufende äußere Kraft F (t) durch eine stückweise konstante Treppe“, also eine Folge von n aneinander grenzenden Kraftstößen ” approximieren lässt. Abbildung 2.8 Für große Werte von n = (tn − t0 )/∆t wird die Antwort (2.94) auf die Kraftstoßfolge die Antwort auf die äußere Kraft F (t) gut annähern. Im Grenzfall beliebig feiner Unterteilung der äußeren Kraft in Kraftstöße sollte die exakte Antwort entstehen. Aus (2.94) entsteht für n → ∞ bei ∆t → 0 das Integral x(t) = Zt t0 mit der Antwortfunktion G(t) = dt0 F (t0 )G(t − t0 ) 1 −γt mω e 0 sin ωt (2.95) für t > 0 . (2.96) für t < 0 Beim Aufschreiben der Antwortfunktion habe ich nochmals die oben angesprochene Kausalität zum Ausdruck gebracht: die Antwort G(t − t0 ) auf einen Kraftstoß zur Zeit t0 kann erst nach dem Kraftstoß auftreten. Wegen dieser 38 2 Schwingungen Kausalität und da die äußere Kraft als für t < t0 verschwindend angenommen wurde, kann die Antwort (2.95) auch in der Form +∞ Z x(t) = dt0 G(t − t0 )F (t0 ) (2.97) −∞ notiert werden. Die allgemeine Lösung der Schwingungsgleichung (2.83) erhalten wir, wenn wir auf der rechten Seite von (2.95) eine beliebige freie gedämpfte Schwingung entsprechend der allgemeinen Lösung der zu (2.83) gehörigen homogenen Gleichung hinzufügen. Letztere beschreibt einen von der äußeren Kraft F (t) unabhängigen Einschwingvorgang. Die Antwort (2.95) ist äquivalent zur Lösung (2.86), die wir durch Superposition der Antworten auf monochromatische Kräfte erhalten hatten. Überzeugen wir uns davon, indem wir die Fourierdarstellung (2.84) der Kraft in (2.95) eintragen x(t) = +∞ +∞ Z Z dΩ iΩt0 0 dt e F (Ω)G(t − t0 ) 2π −∞ = −∞ +∞ Z 0 dt0 e−iΩ(t−t ) G(t − t0 ) +∞ Z dΩ F (Ω) eiΩt 2π +∞ Z dΩ F (Ω) G(Ω)eiΩt 2π −∞ −∞ (2.98) −∞ mit +∞ Z G(Ω) = dt e−iΩt G(t) . (2.99) −∞ Das Zeitintegral (2.99) ist aber leicht auszuführen und ergibt G(Ω) = 1 2 (Ω − ω02 + 2iγΩ)−1 . m (2.100) Damit ist (2.98) auf die Form (2.86) gebracht. Halten wir nochmals fest, dass die äußere Kraft F (t) sowohl durch Superposition monochromatischer Kräfte gemäß (2.84) wie durch eine Folge von Kraftstößen dargestellt werden kann. Je nach Darstellung ergibt sich die Antwort x(t) des Oszillators als Überlagerung der Antworten auf monochromatische Störungen bzw. auf Kraftstöße. Wegen der gezeigten Äquivalenz können wir die Wahl der Darstellung immer nach Bequemlichkeit treffen. Mathematisch weniger aufwendig und physikalisch durchsichtiger, also in der Tat bequemer, ist der Gebrauch der Darstellung (2.95). 2.8 Idealisierter Kraftstoß (Deltafunktion) 2.8 39 Idealisierter Kraftstoß (Deltafunktion) Der oben eingeführte Begriff des Kraftstoßes erlaubt eine Idealisierung, die uns im folgenden immer wieder Nutzen bringen wird. Nehmen wir an, ein endlicher Kraftstoß, der in geeigneten Einheiten die Größe 1 habe, werde in verschwindender Zeit ∆t übertragen, d. h. 1 = lim F · ∆t . (2.101) ∆t→0 Es muss dann offenbar F wie 1/∆t nach ∞ gehen (Abbildung 2.9) } Abbildung 2.9 Man schreibt einen solchen zur Zeit t0 erfolgenden Kraftstoß als F (t) = δ(t − t0 ) und versteht unter der Deltafunktion δ(t) die Vorschrift (a,b) ( 1 ε für t0 − ε 2 < t < t0 + ε 2 (a) δ(t − t0 ) = (b) man führe den Grenzwert ε → 0 aus, aber immer erst, nachdem Integrale über t ausgeführt sind. 0 für |t − t0 | > ε/2 (2.102) Lassen Sie mich diese Vorschrift illustrieren, indem ich zunächst das Zeitintegral der Deltafunktion bestimme. Schon ohne Rechnung ist auf Grund der obigen Einführung klar, dass es den Wert 1 haben muss, +²/2 +∞ +∞ Z Z Z 1 dtδ(t) = dt = 1 . dt δ(t − t0 ) = ² −∞ −∞ −²/2 Zur weiteren Illustration betrachten wir das Integral +∞ R −∞ eine beliebige ∗) (2.103) dt δ(t − t0 )f (t) für Funktion f (t). Die folgende kleine Rechnung, die u.a. die ∗) Die Theorie der Distributionen ersetzt beliebige “ durch genaue Forderungen, die ich im ” folgenden stillschweigend als erfüllt ansehe. 40 2 Schwingungen Taylorentwicklung der Funktion f (t) um die Stelle t0 benutzt, vollziehen Sie hoffentlich ohne Mühe nach: +∞ +∞ Z Z dt δ(t − t0 )f (t0 ) = dt δ(t)f (t0 + t) −∞ = −∞ +²/2 Z 1 dt f (t0 + t) = ² −²/2 = +1/2 Z dtf (t0 + ²t) −1/2 +1/2 Z dt[f (t0 ) + ²tf 0 (t0 ) + O(²2 )] = f (t0 ) + O(²) = f (t0 ) , −1/2 also +∞ Z dtf (t)δ(t − t0 ) = f (t0 ) . (2.104) −∞ Beachten Sie, dass die Deltafunktion eine Vorschrift ist, mit Integralen umzugehen und nicht eine gewöhnliche Funktion. Nach einem wohlbekannten elementaren Satz der Integralrechnung kann nämlich eine gewöhnliche Funktion, die überall außer an einem Punkt verschwindet, keine von Null verschiedene Fläche mit der Abszisse einschließen. In erster Anwendung des neu gewonnenen Begriffs der Deltafunktion werfen wir einen Blick zurück auf den einer beliebigen Kraft F (t) ausgesetzten Oszillator. In der Bewegungsgleichung Z 1 1 2 (2.105) ẍ + 2γ ẋ + ω0 x = F (t) = dt0 δ(t − t0 ) F (t0 ) m m betrachten wir die äußere Kraft F (t) gemäß der Identität (2.104) als eine kontinuierliche Folge von deltafunktionsartigen Kraftstößen. Die Antwort auf F (t) ist dann die Superposition von Antworten auf den Einheitskraftstoß δ(t − t 0 ). Letztere sind gerade durch die Antwortfunktion G gegeben, die der folgenden Differentialgleichung genügt. G̈(t, t0 ) + 2γ Ġ(t, t0 ) + ω02 G(t, t0 ) = = 1 δ(t − t0 ) m( 1 für (t − t0 ) < 1 ² m 0 für (t − t0 ) > ² 2 ² 2 . (2.106) Wir hatten in (2.7) gezeigt, dass für hinreichend kleines ² (dort ∆t genannt) die Antwortfunktion die Form G(t, t0 ) = G(t) = G(t − t0 ) ( 1 −γt sin ωt mω e 0 t>0 t<0 (2.107) 2.8 Idealisierter Kraftstoß (Deltafunktion) 41 hat. Die Gesamtantwort des Oszillators ergab sich dann zu +∞ Z x(t) = dt0 G(t − t0 )F (t0 ) . (2.108) −∞ Die obige Definition (2.102) der δ-Funktion macht von einem rechteckigen Kraftstoß Gebrauch. Das ist nicht nötig. Andere Darstellungen sind beliebt und nützlich, z. B. die folgende Gaußdarstellung 2 e−x /² und ² → 0 nach Ausführung von Integralen . δ(x) = √ π² (2.109) Auch hier gilt die wichtige Identität (2.104), wie eine zur obigen ähnliche Rechnung zeigt: +∞ Z 2 e−(x−x0 ) /² √ dx f (x) π² = −∞ +∞ Z 2 e−x /² f (x0 + x) dx √ π² −∞ = +∞ Z √ 2 1 dx √ e−x f (x0 + ²x) π −∞ = +∞ Z 2 ´ √ e−x ³ √ dx f (x0 ) + ²xf 0 (x0 ) + 0(²) π −∞ ³√ ´ ² = f (x0 ) + O = f (x0 ) nach ² → 0 . Noch beliebter als diese Gaußdarstellung ist die Fourierintegraldarstellung δ(x) = +∞ Z dk (ikx−²|k|) e 2π −∞ 1 2π " Z∞ = 1 2π µ = − 1 ix + ² − ix + ² 1 ² = . 2π −x2 − ²2 π x2 + ² 2 = dk e(ix−²)k + 0 +1 −1 + ix − ² ix + ² Z0 −∞ dk e(ix+²)k # ¶ (2.110) Manchmal spart man sich bei dieser Fourierdarstellung auch, ² hinzuschreiben, 42 2 Schwingungen δ(x) = +∞ Z dk ikx e . 2π (2.111) −∞ Gelegentlich werden wir die Darstellung δ(x) = 1 sin(x/²) π x (2.112) benötigen. Der Nachweis der Eigenschaft (2.104) erfolgt ähnlich wie bei den obigen Beispielen. Qualitativen Einblick in den Verlauf der in (2.112) definierten Funktion erhalten wir, wenn wir bei endlichem ² den Grenzübergang x → 0 durchführen; der anschließende Übergang ² → 0 gibt eine Divergenz, δ(0) ∼ 1/π²; andererseits oszilliert (1/x) sin(x/²) als Funktion von x bei x 6= 0 für ² → 0 so schnell um Null herum, dass jedes Integral über x, welches die Stelle x = 0 nicht überstreicht, im Grenzfall ² → 0 verschwindet. Bei künftigen Anwendungen müssen Sie, wie bereits oben betont, immer im Auge behalten, dass die Deltafunktion eine Vorschrift zum Umgang mit Integralen ist und keineswegs eine gewöhnliche Funktion. Allerdings werden Sie feststellen, dass man mit der Deltafunktion weitgehend umgehen kann wie mit einer normalen Funktion mit dem Vorbehalt, dass die üblichen Rechenoperationen nur unter dem Schutz von Integralen Sinn ergeben. 2.9 Zwei gekoppelte harmonische Oszillatoren Ich will Ihnen nun Schwingungen in einem System mit zwei Freiheitsgraden vorstellen. Betrachten wir dazu zwei Teilchen der Massen m1 und m2 , Abbildung 2.10 die, wie in Abbildung 2.10 gezeigt, an drei (masselos gedachte) Federn gekoppelt und längs einer Geraden beweglich sind. Die Teilchen haben kräftefreie Gleichgewichtslagen x10 bzw. x20 und erfahren bei Auslenkung aus denselben um qi = xi − xi0 lineare Rückstellkräfte. Wenn wir der Einfachheit halber allen Kraftkonstanten den gleichen Wert k geben∗) , so lautet die Kraft auf das erste Teilchen K1 = −k(x1 − x10 ) − k(x1 − x10 − x2 + x20 ) = −2kq1 + kq2 (2.113) ∗) Im Fall verschiedener Kraftkonstanten treten Schwebungsphänomene auf, die Sie im Labor anschauen sollten. 2.9 Zwei gekoppelte harmonische Oszillatoren 43 und die auf das zweite K2 = −k(x2 − x20 ) + k(x1 − x10 − x2 + x20 = kq1 − 2kq2 . Zur weiteren Vereinfachung wählen wir beide Massen als gleich m. Wir erhalten dann die Newtonschen Bewegungsgleichungen mq̈1 + 2kq1 − kq2 mq̈2 + 2kq2 − kq1 = = 0 0. (2.114) Diese linearen Differentialgleichungen mit zeitunabhängigen Koeffizienten können mit dem Exponentialansatz ¶ ¶ µ µ a1 q1 (t) eiωt (2.115) = a2 q2 (t) gelöst werden. Sowohl die Frequenz ω als auch die beiden Amplituden a1 und a2 sind dabei offen. Durch Eintragen des Ansatzes in die Bewegungsgleichungen (2.114) erhalten wir für die drei Unbekannten die beiden linearen homogenen Gleichungen (mit ω02 = k/m) (−ω 2 + 2ω02 )a1 −ω02 a1 + 2 (−ω + −ω02 a2 2ω02 )a2 = 0 = 0. (2.116) Nichttriviale Lösungen für die ai können nur auftreten, wenn die Determinante des Gleichungssystems verschwindet, d. h. wenn die Frequenz ω die Säkulargleichung (−ω 2 + 2ω02 )2 − ω04 = 0 (2.117) befriedigt. Letztere ist eine quadratische Gleichung für ω 2 mit den beiden Lösungen ω12 = 3ω02 ω22 = ω02 . (2.118) √ Die Frequenzen ω1 = 3 ω0 und ω2 = ω0 heißen Eigenfrequenzen des Systems der gekoppelten Teilchen. Um die Art der zugehörigen Eigenschwingungen zu erkennen, müssen wir die beiden Amplituden a1a und a2a für a = 1 (zu ω1 ) und a = 2 (zu ω2 ) suchen. Für die Eigenschwingung mit Frequenz ω1 ergibt sich aus (2.116) a11 = −a21 und für die Eigenschwingung mit Frequenz ω2 (2.119) 44 2 Schwingungen a12 = a22 . (2.120) Beachten Sie, dass bei jeder Eigenschwingung nur das Verhältnis der Amplituden a1 /a2 festgelegt ist, die Amplituden a1 und a2 selbst also nur bis auf einen gemeinsamen Faktor, der die Stärke der Anregung der Eigenschwingung angibt; dieser Faktor ist aus der Anfangsbedingung zu bestimmen. Die erste Eigenschwingung lautet, mit beliebig komplexer Amplitude A 1 , ¶ ¶ µ µ ª −1 © q11 A1 eiω1 t + A∗1 e−iω1 t , (2.121) = 1 q21 Da q11 (t) = −q21 (t), können wir diese Eigenschwingung antisymmetrisch nennen; die beiden Massen schwingen im Gegentakt. Die zweite Eigenschwingung, mit beliebig komplexer Amplitude A2 , ¶ ¶ µ µ ª 1 © q12 (2.122) A2 eiω2 t + A∗2 e−iω2 t , = 1 q22 können wir wegen q12 = q22 symmetrisch nennen; die beiden Massen schwingen hier im Takt mit konstantem √ x12 − x22 . Nicht zufällig ist ω1 = 3 ω0 > ω2 = ω0 . Bei der antisymmetrischen Eigenschwingung schwingen die beiden Massen unter Deformation aller Federn, bei der symmetrischen Eigenschwingung hingegen so, dass die mittlere Feder nicht deformiert wird; also sieht jede Masse bei der antisymmetrischen Schwingung eine steifere Umgebung als bei der symmetrischen Schwingung. Je größer aber die Steifheit, desto größer die Frequenz. Die allgemeine Lösung lautet gemäß dem Superpositionsprinzip µ q1 (t) q2 (t) ¶ = A1 µ −1 1 ¶ e iω1 (t) + A2 µ 1 1 ¶ eiω2 t + c.c. . (2.123) Die beiden komplexen Integrationskonstanten A1 und A2 entsprechen vier reellen Parametern und können durch Anfangsbedingungen festgelegt werden. Keineswegs ohne Grund sind die Eigenfrequenzen ω1 und ω2 reell. Der physikalische Grund ist, dass wir keine Reibungskräfte zugelassen und somit ein exponentielles Abklingen von q1 (t) und q2 (t) ausgeschlossen haben. Daher sollte auch die Energie der beiden Teilchen zeitlich erhalten bleiben. Tatsächlich finden wir den Energiesatz ganz ähnlich wie früher bei Systemen mit einem Freiheitsgrad. In (2.114) multiplizieren wir beide Seiten der Bewegungsgleichung des i-ten Teilchens mit der Geschwindigkeit q̇i mq̇1 q̈1 + 2k q̇1 q1 − k q̇1 q2 mq̇2 q̈2 + 2k q̇2 q2 − k q̇2 q1 = 0 = 0. (2.124) Durch Addition der linken Seiten finden wir, dass die Zeitableitung der Größe 2.10 Der mechanische Energiesatz für Systeme vieler Teilchen E= m 2 m 2 q̇ + q̇ + k(q12 + q22 − q1 q2 ) 2 1 2 2 45 (2.125) verschwindet, E selber also zeitlich erhalten bleibt. E heißt die Energie des Systems, und die beiden Bestandteile T = U = m 2 (q̇ + q̇22 ) 2 1 k(q12 + q22 − q1 q2 ) (2.126) sind offenbar sinnvoll als kinetische bzw. potenzielle Energie benannt. Beachten Sie, dass sich die kinetische Energie aus den kinetischen Energien der beiden Teilchen additiv zusammensetzt und dass die potenzielle Energie U quadratisch in den Auslenkungen q1 und q2 ist. Die Kraft auf das i-te Teilchen ergibt sich aus U zu Ki = − ∂U . ∂qi (2.127) Die Kräfte K1 und K2 verschwinden für die Ruhelagen, qi = 0. Die potenzielle Energie U hat für q1 = q2 = 0 ein Minimum, denn U (0, 0) = 0 und U (q1 , q2 ) = 2.10 k(q22 + q22 ¯ √ ¯2 ¯ 1 + i 3 ¯¯ ¯ − q 1 q2 ) = k ¯q1 − q 2 ¯ ≥0. ¯ ¯ 2 (2.128) Der mechanische Energiesatz für Systeme vieler Teilchen N Teilchen in drei Raumdimensionen haben 3N Freiheitsgrade, denen wir die kartesischen Koordinaten x1 , y1 , z1 , x2 , y2 , z2 , . . . , xN , yN , zN zuordnen können. Wir nummerieren die Koordinaten als qν mit ν = 1, 2, . . . , 3N und die Kräfte F~i entsprechend als Fν (z. B. q5 = y2 ). Es seien die Kräfte als partielle Ableitung einer potenziellen Energie darstellbar, Fν (q) = − ∂ U (q) . ∂qν (2.129) Später untersuchen wir, unter welchen Bedingungen sich die Fν so darstellen lassen. Erst zeigen wir, dass bei Gültigkeit von (2.129) immer ein Erhaltungssatz T + U = E = const gilt. Dazu benutzen wir die Newtonschen Bewegungsgleichungen mν q̈ν = Fν (q) = − ∂U (q) ∂qν (2.130) 46 2 Schwingungen Hier multiplizieren wir mit der Geschwindigkeit q̇ν und summieren über ν. Die linke Seite der entstehenden Gleichung, X mν q̇ν q̈ν + X q̇ν ν ν ∂U =0, ∂qν lässt sich wieder als die Zeitableitung der Gesamtenergie schreiben à ! X mν d d 2 q̇ν + U (q) = (T + U ) = 0 . dt 2 dt ν (2.131) (2.132) Im Gegensatz zum Fall eines Teilchens in einer Raumdimension erlaubt dieser Energiesatz natürlich nicht, die Bahnkurven qν (t) alle festzulegen. Unter welchen Bedingungen kann nun die ν-te Kraft Fν (q) dargestellt werden als Fν = −∂U/∂qν mit einer eindeutigen potenziellen Energie U (q)? Notwendig ist die aus Fν = − ∂U , ∂qν ∂U . ∂qµ Fµ = − (2.133) durch Differenziationen entstehende Bedingung ∂Fν ∂Fµ ∂2U = =− . ∂qµ ∂qν ∂qν ∂qµ (2.134) Diese Bedingung ist aber auch hinreichend, wie folgendes Argument zeigt. Betrachten Sie die beiden 3N -Tupel von Koordinaten q10 = x0 , q20 = y0 , qν0 ν 6= 1, 2 für und q1 = x, q2 = y, qν = qν0 für ν 6= 1, 2 Damit U (q) bei festem (3N )-Tupel {qν0 } eine eindeutige Funktion des 3N Tupels {qν } ist, muss gleichgültig sein, auf welchem Weg“ von qν0 nach qν man, ” gegen die Kräfte Fν Arbeit leistend, die potenzielle Energie ändert. Wählen wir insbesondere die beiden in (Abbildung 2.11) gezeigten stückweise achsenparallelen Wege in der q1 − q2 − Ebene. Längs derselben werden die Arbeiten (∆U )Weg1 = − bzw. Zx x0 dq1 F1 (q1 , y0 ) − Zy y0 dq2 F2 (x, q2 ) 2.10 Der mechanische Energiesatz für Systeme vieler Teilchen 47 Abbildung 2.11 (∆U )Weg2 = − Zy y0 dq2 F2 (x0 , q2 ) − Zx dq1 F1 (q1 , y) x0 geleistet. Fragen wir nun nach Bedingungen für das Verschwinden der Differenz (∆U )Weg1 − (∆U )Weg2 = − − Z Z x x0 dq1 (F1 (q1 , y0 ) − F1 (q1 , y)) y y0 dq2 (F2 (x, q2 ) − F2 (x0 , q2 )) (2.135) Sei insbesondere qν so nahe bei qν0 , dass die Kräfte F1 und F2 mit ausreichender Genauigkeit in Taylor-Reihen um x0 , y0 herum entwickelt werden können, Fi (q1 , q2 ) = Fi (x0 , y0 ) + ∂Fi (x0 , y0 ) ∂Fi (x0 , y0 ) (q1 − x0 ) + (q2 − y0 ) + . . . . ∂x0 ∂y0 (2.136) Bis auf Korrekturen dritter Ordnung in den Koordinatendifferenzen ergibt sich nun für die Differenz (2.135) (∆U )Weg1 − (∆U )Weg2 = + − = µ Zx dq1 ∂F1 (q1 , y0 ) (y − y0 ) ∂y0 Zy dq2 ∂F2 (x0 , q2 ) (x − x0 ) ∂x0 x0 y0 ∂F1 (x0 , y0 ) ∂F2 (x0 , y0 ) − ∂y0 ∂x0 ¶ (x−x0 )(y−y0 ) + . . . . (2.137) 48 2 Schwingungen Aus (2.137) ist offenbar, dass die Bedingung (2.134) hinreicht, um die Wegunabhängigkeit von ∆U = U (qν ) − U (qν0 ) zu garantieren. Kräfte, die die Bedingung (2.134) erfüllen, heißen auch wirbelfrei. Sie lassen sich immer durch Ableitungen einer potenziellen Energie darstellen. 2.11 Schwingungen von mehreren Freiheitsgraden Wir verallgemeinern hier das in 2.9 behandelte System zweier Teilchen auf N identische Teilchen, die durch Federn an Ruhelagen xi0 gebunden und längs der Richtung der Federn beweglich sind Abbildung (2.12). Abbildung 2.12 Bei den Auslenkungen qi = xi − xi0 sollen die Teilchen in diesen Auslenkungen lineare Rückstellkräfte erfahren, so dass die potenzielle Energie, U= N 1 X kij qi qj , 2 i,j=1 (2.138) quadratisch in den qi ist. Die hier auftretende Kraftkonstantenmatrix kann offenbar symmetrisch gewählt werden, kij = kji . (2.139) Im übrigen fordern wir von der Matrix kij , dass die potenzielle Energie (2.138) für beliebige Auslenkungen nichtnegativ ist. Wegen U ({0}) = 0 hat dann die potenzielle Energie ein Minimum, wenn jedes Teilchen in seiner kräftefreien Gleichgewichtslage sitzt. Auf das i-te Teilchen wirkt, wenn es aus seiner Gleichgewichtsposition ausgelenkt ist, die Kraft (in x-Richtung, nur eine Raumdimension ist zugelassen!) Ki = − N X ∂U kij qj , =− ∂qi j=1 (2.140) so dass die N Bewegungsgleichungen lauten mq¨i + N X j=1 kij qj = 0 ; (2.141) 2.11 Schwingungen von mehreren Freiheitsgraden 49 dabei ist m die Masse jedes Teilchens. Wegen der Linearität der Bewegungsgleichungen und der zeitlichen Konstanz der Masse und Kraftkonstanten finden wir die Lösung wie immer durch einen Exponentialansatz qi = ai eiωt . (2.142) Die Bewegungsgleichungen geben, da eiωt sich heraushebt, N homogene Gleichungen für die Amplituden ai , −mω 2 ai + N X kij aj = 0 , j=1 oder, mit dem Kronecker Delta, δij = N X j=1 ½ 1 0 i=j i 6= j , (kij − mω 2 δij )aj = 0 . (2.143) (2.144) Den Spezialfall N = 2 (mit kij = ?) hiervon kennen wir aus 2.9. Nichttriviale Lösungen für die Amplituden ai gibt es nur, wenn die Determinante verschwindet, det(kij − mω 2 δij ) = 0 . (2.145) Diese Säkulargleichung ist eine Gleichung N -ter Ordnung für ω 2 mit N Lösungen ωα2 . Die N Lösungen können je nach Beschaffenheit der Matrix kij teilweise übereinstimmen; der Einfachheit halber verlange ich jedoch von den Kraftkonstanten, dass die ωα2 alle verschieden sind. Jedenfalls sind alle ωα2 positiv, denn komplexe Frequenzen ωα würden Widersprüche zum Energieerhaltungssatz bringen. Zur α-ten Eigenfrequenz ±ωα gibt es einen Satz von Amplituden aiα , der aus (2.144) bis auf einen konstanten Faktor bestimmt werden kann; dieser konstante Faktor bestimmt die Stärke der α-ten Eigenschwingung und ist durch Anfangsbedingungen festzulegen. Ohne Einschränkung der Allgemeinheit kann der α-te Satz von Amplituden aiα (der α-te Eigenvektor mit Komponenten aiα ) als reell gewählt und normiert werden durch die Verfügung N X aiα aiα = 1 . (2.146) i=1 Somit sind alle N Eigenvektoren zu reellen Einheitsvektoren geworden. Mit Hilfe der jetzt eindeutig gemachten reellen aiα können wir die α-te Eigenschwingung angeben als qi (t) = aiα (Aα eiωα t + A∗α e−iωα t ) (2.147) 50 2 Schwingungen mit beliebig komplexen Aα . Die allgemeinste Lösung finden wir durch Superposition qi (t) = N X aiα (Aα eiωα t + A∗α e−iωα t ) . (2.148) α=1 Die N komplexen Integrationskonstanten Aα sind durch Anfangsbedingungen festzulegen, z. B. durch die N anfänglichen Geschwindigkeiten q̇i (0) und N anfänglichen Auslenkungen qi (0). Die Bestimmung der Integrationskonstante Aα aus den Anfangsbedingungen wird rechnerisch enorm bequem, wenn wir ausnutzen, dass die N Eigenvektoren aiα orthogonal aufeinander sind gemäß N X aiα aiβ = δαβ = i=1 ½ 1 0 α=β α 6= β . (2.149) Die Orthogonalität folgt aus der Eigenwertgleichung (2.144) durch folgende Betrachtung. Multiplizieren wir die beiden in (2.144) gleichgesetzten Vektoren X kij ajα = mωα2 aiα , (2.150) j skalar mit dem β-ten Eigenvektor aiβ , X aiβ kij ajα = mωα2 X aiβ aiα . (2.151) X aiα aiβ , (2.152) i ij Eine ähnliche Gleichung, X aiα kij ajβ = mωβ2 i ij folgt, wenn (2.150) für den β-ten Eigenvektor aufgeschrieben und mit dem α-ten Eigenvektor skalar multipliziert wird. Subtraktion von (2.151) und (2.152) gibt m(ωβ2 − ωα2 ) X aiα aiβ = i X ij (aiβ kij ajα − aiα kij ajβ ) . Durch Umbenennung der Summationsindizes gemäß i ↔ j im zweiten Summanden und nach Beachtung der Symmetrie kij = kji sehen wir, dass die rechte Seite verschwindet. Also gilt auch (ωβ2 − ωα2 ) X aiα aiβ = 0 . (2.153) i Da die Eigenfrequenzen alle als voneinander verschieden angenommen sind, folgt, dass das Skalarprodukt des α-ten mit dem β-ten Eigenvektor verschwinden muss, also gerade die Orthogonalität (2.149). 2.12 Erzwungene Schwingungen von mehreren Freiheitsgraden 51 Jetzt legen wir die Integrationskonstanten Aα durch die anfänglichen Auslenkungen qi (0) und Geschwindigkeiten q̇i (0) fest. Aus der allgemeinen Form der Lösung (2.147) folgt qi (0) = X aiβ (Aβ + A∗β ) (2.154) β q̇i (0) = X aiβ iωβ (Aβ − A∗β ) . β Multiplizieren wir in beiden Gleichungen skalar mit dem α-ten Eigenvektor α iα , so folgt aus der Orthogonalität (2.149) und der Normierung (2.146) Aα + A∗α X = ajα qj (0) j Aα + A∗α X 1 ajα q̇j (0) iωα j = oder, nach Aα aufgelöst, Aα = X j ajα 1 2 µ i q̇j (0) qj (0) − ωα ¶ . (2.155) Damit lautet die Lösung unseres Anfangswertproblems qi (t) = X α ajα µ ¶ 1X i q̇j (0) eiω at + c. c. . ajα qj (0) − 2 j ωα (2.156) Ein höchst interessanter Spezialfall ist dieser: Sei am Anfang nur ein Teilchen, etwa das k-te, ausgelenkt, mit qk (0) = Q, q̇k (0) = 0, während alle anderen anfänglich in ihren Gleichgewichtslagen ruhen sollen. Zu späteren Zeiten geht die ausgezeichnete Rolle des k-ten Teilchens verloren; alle Teilchen geraten in Bewegung gemäß X qi (t) = Q aiα akα cos ωα t . (2.157) α Wenn die Eigenfrequenzen ωα keine rationalen Verhältnisse zueinander haben, ist die Schwingung i. A. nicht periodisch. 2.12 Erzwungene Schwingungen von mehreren Freiheitsgraden Wir betrachten wieder N gleich kollinear harmonisch schwingende Teilchen wie in 2.11, lassen nun aber auch eine äußere zeitabhängige Kraft Fi (t) auf das i-te Teilchen zu, so dass die Bewegungsgleichungen lauten 52 2 Schwingungen mq̈i + N X kij qj = Fi (t) . (2.158) j=1 Die Antwort auf diese äußeren Kräfte wird am bequemsten mit Hilfe der Amplituden der Eigenschwingung angegeben. Zerlegen wir den Vektor qi (t) nach den in 2.11 eingeführten normierten und untereinander orthogonalen Eigenvektoren aiα der ungestörten Schwingung gemäß qi (t) = X aiα Θα (t) X ajα qj (t) . (2.159) α bzw. Θα (t) = j Dabei ist Θα (t) die Komponente des Vektors qi längs des α-ten Einheitsvektors aiα . Man nennt Θα (t) auch die α-te Normalkoordinate des Systems. Ganz entsprechend kann auch der Vektor Fi (t) zerlegt werden Fi (t) = X aiα Fα (t) (2.160) X αjα Fi (t) . (2.161) α bzw. Fα (t) = j Wenn die Einheitsvektoren aiα explizit bekannt sind, können die Komponenten Fα (t) der äußeren Kräfte längs der Einheitsvektoren aiα aus (2.161) berechnet werden. Tragen wir die Zerlegungen (2.159), (2.160) in die Bewegungsgleichung (2.158) ein, so ergeben sich für die Normalkoordinaten die N untereinander ungekoppelten Bewegungsgleichungen Θ̈β (t) + ωβ2 Θβ (t) = 1 Fβ (t) , m (2.162) deren jede die Bewegung eines harmonischen Oszillators der Eigenfrequenz ω β unter dem Einfluss einer äußeren Kraft Fβ (t) beschreibt. Die Antwort eines harmonischen Oszillators auf eine äußere Kraft ist uns aus 2.7 bekannt. Durch Überlagerung dieser Antworten gemäß (2.159) und (2.160) lässt sich die Antwort von qi (t) auf Fj (t) gewinnen. Die Antwort wird besonders stark ausfallen für solche Fi (t), die große Fourierkomponenten bezüglich einer oder mehrerer Eigenfrequenzen ωβ haben, also in Nähe von Resonanzen liegen. 2.13 Transversale Schwingungen der gespannten Saite 2.13 53 Transversale Schwingungen der gespannten Saite Eine Saite sei zwischen x = 0 und x = l gespannt mit der Spannkraft F und werde seitlich, d. h. in y-Richtung ausgelenkt. Im Gegensatz zu bisher betrachteten schwingungsfähigen Systemen haben wir es jetzt nicht mit diskreten Teilchen zu tun, sondern mit einer kontinuierlichen Saite. Die Zahl N der Freiheitsgrade ist unendlich. Sorgen wir für endliches N , indem wir uns die Saite in N Stücke der Länge ∆x = l/N aufgeteilt denken. Die beiden Randpunkte sind fest eingespannt, während die N − 1 inneren Punkte transversal beweglich sind und in sich die Masse eines Saitenstücks der Länge ∆x vereinigt haben sollen (Abbildung 2.13). Abbildung 2.13 Wenn diese Aufteilung hinreichend fein ist, wird sich das diskrete System nicht erheblich vom kontinuierlichen System unterscheiden. Die Saite sei elastisch. Beim Auslenken aus der Ruhelage yi = 0 ändert sich die Länge von l auf l + ∆l. Die Verlängerung lässt sich durch die Auslenkungen yi wie folgt ausdrücken ∆l = N p X i=1 (∆x)2 + (yi − yi−1 )2 − l . (2.163) Bei der Verlängerung um ∆l wird gegen die Spannkraft die Arbeit F ∆l geleistet, die sich als potenzielle Energie U = F ∆l in der Saite wiederfindet, U = = F à N p X (∆x)2 + (yi − yi−1 )2 − l i=1 ∆xF N X i=1 s 1+ µ yi − yi−1 ∆x ¶2 ! (2.164) − 1 . Wenn die Auslenkung klein ist, so dass die Steigung (yi −yi−1 )/∆x betragsmäßig klein gegen Eins ist für alle i, kann die Wurzel entwickelt werden, 54 2 Schwingungen X µ 1 ¶2 1 U = ∆xF (yi − yi−1 )2 + . . . . 2 ∆x i (2.165) Dies ist eine quadratische Form in den Auslenkungen yi mit Minimum bei yi = 0. Auf das i-te Teilchen“ wirkt jetzt die Kraft (in y-Richtung; bei der ” betrachteten transversalen Schwingung verlassen die Teilchen ihre anfänglichen x-Koordinaten nie) Fi = − ∂U = −∆xF ∂yi µ 1 ∆x ¶2 (2yi − yi−1 − yi+1 ) . (2.166) Die Saite habe die Masse ρ pro Längeneinheit, das i-te Teilchen“ also die ” Masse mi = ρ∆x. Es gehorcht dann der Bewegungsgleichung ∆xp ÿi (t) + ∆xF µ 1 ∆x ¶2 (2yi (t) − yi−1 (t) − yi+1 (t)) = 0 oder nach Division durch die Teilchenmasse ÿ1 (t) + µ F ρ ¶µ 1 ∆x ¶2 (2yi (t) − yi−1 (t) − yi+1 (t)) = 0 . (2.167) Die Lösung dieses Problems haben wir in Abbildung 2.11 kennengelernt. Um sie explizit zu konstruieren, müssten wir die Eigenwerte mωα2 der Kraftkonstantenmatrix kij suchen. Das ist kein schweres Problem, da kij eine sehr einfache Struktur hat: jedes Teilchen wechselwirkt nur mit seinen beiden Nachbarn. Physikalisch neue Einsicht gewinnen wir, wenn wir hier den Grenzwert ∆x → 0 ausführen und mit yi (t) → y(x, t) zur Kontinuumsbeschreibung der schwingenden Saite übergehen. Dazu bedenken wir yi±1 = y(xi ± ∆x) = y(xi ) ± y 0 (xi )∆x + 1 00 y (xi )∆x2 + . . . 2 (2.168) und finden für die Differenz der Auslenkungen im zweiten Term von (2.167) ´ ³ (2.169) 2yi − yi−1 − yi+1 = −(∆x)2 y 00 (xi ) + O (∆x)3 und somit für die Bewegungsgleichung ÿ(xi , t) − (F/p) [y 00 (xi , t) + O(∆x)] = 0 . (2.170) Bis auf Korrekturen von erster Ordnung in ∆x lautet die Bewegungsgleichung, wenn der Index i weggelassen und die Abkürzung c2 = F/ρ eingeführt wird, (2.171) 2.13 Transversale Schwingungen der gespannten Saite µ ∂2 1 ∂2 − 2 2 ∂x c ∂t2 ¶ y(x, t) = 0 . 55 (2.172) Dies ist die so genannte Wellengleichung, hier erhalten aus dem Newtonschen Grundgesetz für diskrete Teilstücke der Saite im Grenzfall ∆l → 0. Bei der Lösung beachten wir die Randbedingung y(0, t) = y(l, t) = 0 (2.173) und gehen im übrigen vor wie in 2.11. Suchen wir Eigenschwingungen. Wir finden sie, da die Wellengleichung linear ist und keine explizit zeit- und ortsabhängigen Koeffizienten enthält, mit dem Exponentialansatz y(x, t) = a(x)eiωt . (2.174) (In 2.11 war der Teilchenindex diskret, hier ist er kontinuierlich.) Für die Amplitude a(x) ergibt sich die Forderung a00 (x) + ω2 a(x) = 0 . c2 (2.175) Statt wie in 2.11 mit einem System algebraischer Gleichungen, haben wir es hier mit einer Differentialgleichung für a(x) zu tun, die, da sie linear ist und konstante Koeffizienten hat, ihrerseits auch mit einem Exponentialansatz gelöst werden kann, a(x) = A eikx . Der Parameter k bestimmt sich dann aus (2.175) zu k = ±ω/c . (2.176) Die Wellengleichung hat also Lösungen der Form y(x, t) = eiωt (A eiωx/c + B e−iωx/c ) (2.177) mit beliebigem ω, A, B . Die Randbedingungen schränken die Beliebigkeit ein. Wir finden mit (2.173) A+B =0 A eiωl/c + Be−iωl/c = 0 . (2.178) Es folgt B = −A und sin(ωl/c) = 0. Letztere Forderung legt die Eigenfrequenzen fest. Nur für 56 2 Schwingungen ω = ωn = nπc/l, n = 1, 2, 3, . . . (2.179) sind die Wellengleichungen und die Randbedingungen zugleich befriedigbar. Zur n-ten Eigenfrequenz gehört der Eigenvektor (beachte, dass der Vektor jetzt kontinuierlich viele, mit x nummerierte Komponenten hat) sin(ωn x/c) = sin(kn x) = an (x) . (2.180) Die in 2.11 erklärte Orthogonalität der Eigenvektoren überträgt sich auch auf die Eigenvektoren (2.180). Das Skalarprodukt zweier Eigenvektoren mit einer kontinuierlichen Gesamtheit von Komponenten wird in nahe liegender Verallgemeinerung des diskreten Falls definiert durch das Integral Zl dx an (x)an (x) . (2.181) 0 Für die Eigenvektoren (2.180) hat das Skalarprodukt den Wert Zl dx sin(kn x) sin(kn0 x) = l δn,n0 . 2 (2.182) 0 Demnach sind die Eigenvektoren auch zu Einheitsvektoren normierbar: q 2 l sin(πnx/l) ist Einheitsvektor. Die allgemeinste Lösung der Wellengleichung, die zugleich die Randbedingung befriedigt, erhalten wir durch Superposition der Eigenschwingungen y(x, t) = ∞ X sin(kn x)(An eiωn t + A∗n e−iωn t ) (2.183) n=1 mit beliebig komplexen Integrationskonstanten An , die durch Anfangsbedingungen festgelegt werden können. Unter Beachtung der Orthogonalität der Eigenvektoren sin(kn x) lassen sich die an wie in 2.11 durch die Anfangswerte y(x, 0) und ẏ(x, 0) angeben. Die allgemeine Lösung (2.183) kann übrigens auch in der Form y(x, t) = f (x − ct) + g(x + ct) aufgeschrieben werden, wobei f und g durch die Anfangsbedingungen festgelegt sind. Aus dieser Neuformulierung lernen Sie, dass c die Bedeutung der Wellengeschwindigkeit (hier Schallgeschwindigkeit) hat. Offenbar beschreibt f (x − ct) eine längs der x-Achse mit der Geschwindigkeit c nach rechts laufende Welle, da die Funktion f (x − ct) ein und denselben Wert hat für alle Koordinaten x und Zeiten t, für die das Argument x − ct konstant ist. Entsprechend beschreibt g(x + ct) eine linkslaufende Welle. Eine grafische Darstellung von Eigenschwingungen finden Sie in Abb. 12.2. Wundern Sie sich nur darüber, dass die Ihnen hier begegnenden Eigenschwingungen im dortigen quantenmechanischen Kontext wieder auftreten. Sie werden 2.14 Theorie der Dämpfung(Modell) 57 noch lernen, dass dabei kein Zufall waltet. 2.14 Theorie der Dämpfung(Modell) Bekanntlich ist die gedämpfte Bewegung eines makroskopischen Systems die Konsequenz der Wechselwirkung desselben mit vielen anderen, mikroskopischen Systemen. Letztere sind mit entsprechend feinen Methoden zwar auch beobachtbar, i. Allg. jedoch nicht sichtbar auf den Längen- und Zeitmaßstäben, auf denen sich ihr mittlerer Effekt auf das makroskopische System manifestiert. Die einfachste, sehr grobschlächtige Abschätzung einer Reibungskraft ist die folgende: Eine Kugel der Masse M mit Radius r bewege sich mit der Geschwindigkeit v durch ein Gas, in dem sich pro Volumeneinheit ρ Atome der Masse m befinden. In der Zeit ∆t durchstreicht die Kugel das Volumen πr 2 v∆t, stößt also gegen ρπr 2 v∆t-Atome. Bei jedem dieser elastischen Stöße erhält das gestoßene Atom, da es sehr viel leichter ist als die Kugel, einen Impuls der Größenordnung mv. Die Kugel erfährt die entgegengesetzt gleiche Impulsänderung. Der einzelne Stoß hat auf die Kugel wegen m/M ≈ 10−23 keinen merklichen Effekt, die Gesamtheit der in ∆t erfolgten Stöße aber führt zur Impulsänderung ∆ρ = −ρπr 2 v∆tmv. Die sekündliche Impulsänderung ∆ρ/∆t entspricht einer Reibungskraft der Größe F = ρπr2 mv 2 ∼ v 2 . (2.184) Die folgende Modellrechnung wird etwas detaillierter sein als die eben vorgestellte grobschlächtige Abschätzung. Zur Vorbereitung gebe ich eine kurze, rein mathematische Überlegung. Betrachten Sie eine Summe vieler oszillierender Exponentialfunktionen S(t) = n X eiων t , (2.185) ν=1 deren Frequenzen ωv keine rationalen Verhältnisse zueinander haben sollen. Dann ist S(t) nicht periodisch. Es seien die Frequenzen ωk so zahlreich und so dicht benachbart, dass die Summe S(t) gut durch ein Integral approximiert werden kann. Die Zahl der ωk im Frequenzintervall ∆ω bei ω sei ρ(ω)∆ω. Dann gilt +∞ Z S(t) ≈ dωρ(ω) eiωt . (2.186) −∞ Die Koordinate zu einem makroskopischen Freiheitsgrad möge durch obige Summe S(t) gegeben sein. Das Auftreten der oszillierenden Terme eiων τ macht deutlich, dass die Bewegung reversibel, d. h. ungedämpft ist. Andererseits kann für sehr große N die Bewegung gedämpft erscheinen, wie wir sehen, wenn wir für die spektrale Dichte ρ(ω) der ων eine Lorentzverteilung nehmen, +∞ Z dωeiωt N S(t) ≈ −∞ γ/π = N eiΩt−γ|t| . (ω − Ω)2 + γ 2 (2.187) 58 2 Schwingungen Nach diesen Vorbemerkungen nun zum angekündigten Modell, das den mikroskopischen Ursprung der Dämpfung der Schwingung eines makroskopischen Oszillators beschreibt. Ein makroskopischer“ Oszillator der Masse M und viele (N À 1) mikro” ” skopische“ Oszillatoren der Masse m ¿ M seien harmonisch an Gleichgewichtslagen q0 = 0 bzw. qν = 0 mit ν = 1, 2, . . . gebunden gemäß der potenziellen Energie U= N N X 1 X 1 k0 q02 + q0 qν . kν qν2 + λ 2 2 ν=1 ν=1 (2.188) Das letzte Glied beschreibt eine Kopplung des makroskopischen Oszillators an seine mikroskopischen Partner. Die Kopplung sei schwach, d. h. λ ¿ k0 , kν . Am Anfang, bei t = 0, sollen die mikroskopischen Oszillatoren alle in ihren Gleichgewichtslagen ruhen, während der makroskopische Oszillator eine endliche Auslenkung und verschwindende Geschwindigkeit habe. Die zugehörigen Bewegungsgleichungen haben die Form q̈0 q̈ν + Ω20 q0 + + ων2 qν + λ M λ m P q0 ν qν =0 =0 (2.189) mit Ω20 = k0 /M und ων2 = kν /m. Die Kraftkonstantenmatrix k0 kν kij = λ/m 0 für für für sonst i=j=0 i = j = ν = 1, 2, . . . N i = 0, j = ν sowie i = ν, j = 0 (2.190) ist so einfach strukturiert, dass die Eigenfrequenzen und Eigenvektoren ohne Mühe explizit angegeben werden können. Mit anderen Worten, man kann die Auslenkung q0 (t) des makroskopischen Oszillators explizit angeben als Funktion der anfänglichen Auslenkungen qi (0) und Geschwindigkeiten q̇i (0). Den für uns interessanten Grenzfall λ/k0 ¿ 1 , λ/kν ¿ 1 , 1/N ¿ 1 (2.191) beschreiben wir jedoch am bequemsten, indem wir gar nicht erst die formal exakte Lösung des Problems suchen, sondern sofort die Kleinheit der angegebenen Parameter benutzen. Die entsprechende Näherungslösung, die ich nun vorstelle, ist vor allem bekannt als die Wigner-Weißkopf Lösung des Problems der natürlichen Linienbreite von Spektrallinien, also eines Problems aus der Quantenelektrodynamik. Wir können die Bewegungsgleichung für die Auslenkung des ν-ten mikroskopischen Oszillators formal auffassen als die einer erzwungenen Schwingung mit der äußeren Kraft −λq0 (t). Die Lösung mit der Anfangsbedingung qν (0) = q̇ν (0) = 0 lautet (s. 2.95 und 2.96 mit γ = 0) 2.14 Theorie der Dämpfung(Modell) λ qν (t) = − m Zt dt0 q0 (t0 ) 0 sin ων (t − t0 ) =0. ων 59 (2.192) Dies setzen wir ein in die Bewegungsgleichung des makroskopischen Oszillators und erhalten q̈0 (t) + Ω20 q0 (t) − λ2 mM Zt dt0 q0 (t0 ) 0 N X sin ων (t − t0 ) =0. ων ν=1 (2.193) Diese Bewegungsgleichung ist insofern etwas komplizierter als die ursprüngliche, als die unbekannte Auslenkung q0 (t) auch unter einem Integral auftritt. Allerdings sind dafür die Auslenkungen der mikroskopischen Oszillatoren völlig eliminiert. Da die Kopplung des makroskopischen Oszillators an die mikroskopischen Oszillatoren schwach ist, wird q0 (t) nur wenig abweichen von der freien Schwingung, die wir früher mit dem Ansatz q0 (t) ∼ e±iΩ0 t gefunden hatten als q0 (t) = q0 (0) cos(Ω0 t) + 1 q̇0 (0) sin(Ω0 t) . Ω0 (2.194) Daher wird jetzt der Ansatz q0 (t) = a(t) eiΩ0 t (2.195) sinnvoll sein mit einer Amplitude a(t), die schwach zeitabhängig ist gemäß |ȧ(t)| ¿ |Ω0 a(t)| . (2.196) Für a(t) ergibt sich mit Hilfe von ¡ ¢ q̈0 (t) = ä(t) + 2iΩ0 ȧ(t) − Ω20 a(t) eiΩ0 t , also q̈0 (t) + Ω20 q0 (t) ≈ (ä + 2iΩ0 ȧ) eiΩ0 t ≈ 2iΩ0 ȧ eiΩ0 t , (2.197) die genäherte Bewegungsgleichung λ2 ȧ(t) = − 4mM Ω0 Zt 0 dt0 a(t−t0 ) i X 1 h 0 0 ei(ων −Ω0 )t − e−i(ων +Ω0 )t . (2.198) ων ν 60 2 Schwingungen Wir sehen deutlich, dass ȧ(t) verschwindet, a(t) also zeitlich konstant wird, wenn die Kopplung ganz abgeschaltet wird. Da ȧ(t) = 0(λ2 ), gilt auch a(t−t0 ) = a(t) + 0(λ2 ) und unter Inkaufnahme eines Fehlers der Ordnung λ4 können wir a(t − t0 ) durch a(t) ersetzen und aus dem Integral herausziehen. Dann ergibt sich ȧ(t) a(t) = = λ2 − 4mM Ω0 Zt dt0 0 i X 1 h 0 0 ei(ων −Ω0 )t − e−i(ων +Ω0 )t ων ν · i(ων −Ω0 )t ¸ N X λ2 e − 1 e−i(ων +Ω0 )t − 1 1 − + . 4mM Ω0 ν=1 ων i(ων − Ω0 ) i(ων + Ω0 ) (2.199) Bei der Ausführung der Frequenzsummen über die mikroskopischen Oszillatoren beachten wir ων ≥ 0. Große Beiträge zur Summe können nur die Oszillatoren machen, die fast oder ganz in Resonanz zum makroskopischen Oszillator sind, d. h. für die ων ≈ Ω0 gilt. Insbesondere kann der zweite Summand vernachlässigt werden. Nun schlachten wir die Größe von N aus und approximieren die Frequenzsumme durch ein Integral. Wenn die Zahl der mikroskopischen Oszillatoren mit Frequenzen im Intervall ∆ω bei ω gerade ρ(ω)∆ω ist, können wir schreiben λ2 ȧ(t) =− a(t) 4mM Ω0 Z∞ 0 dω ρ(ω) ω · 1 − cos(ω − Ω0 )t sin(ω − Ω0 )t +i ω − Ω0 ω − Ω0 ¸ . (2.200) Die rechts stehenden Integrale werden für t À Ω−1 0 zeitunabhängig. Für das erste der beiden sehen wir diese Eigenschaft daraus, dass ¯ sin(ω − Ω0 )t ¯¯ = πδ(ω − Ω0 ) (2.201) ¯ ω − Ω0 ¯ −1 tÀΩ0 genau die Darstellung (2.112) der Deltafunktion ist. Die strenge Begründung der Zeitunabhängigkeit des zweiten Integrals ist mathematisch zu aufwendig, als dass sich die Darstellung hier lohnen würde. Qualitativ lässt sie sich wie folgt einsehen. Für ω 6= Ω0 oszilliert der Cosinus cos(ω − Ω0 )t wegen t → ∞ als Funktion von ω so schnell um Null herum, dass jedes über ihn erstreckte Integral verschwindet, wenn die Stelle ω = Ω0 aus dem Integrationsbereich ausgespart bleibt; anderseits verschwindet 1 − cos(ω − Ω0 )t an der Stelle ω = Ω0 quadratisch, also schneller als der Nenner ω − Ω0 im Integranden; insgesamt hat der Imaginärteil der geschweiften Klammer in (2.200) auf das Integral denselben Effekt wie die Vorschrift, ein beliebig kleines Intervall um die Stelle ω = Ω0 aus dem Integrationsbereich herauszulassen. Aus (2.200) entsteht also für große Zeiten ȧ(t) = −Γ − iδ a(t) (2.202) 2.14 Theorie der Dämpfung(Modell) 61 mit Γ= πλ2 ρ(Ω0 ) 4mM Ω20 (2.203) und λ2 δ= 4mM Ω0 Z∞ 0 ¯ ρ(ω) 1 − cos(ω − Ω0 )t ¯¯ dω ¯ ¯ ω ω − Ω0 . (2.204) tÀΩ−1 0 Die beiden Parameter Γ und δ haben die physikalische Bedeutung einer Dämpfungskonstanten bzw. einer Frequenzverschiebung, wie wir aus der Lösung a(t) = a(0) e−Γt−iδt der Differentialgleichung (2.202) ersehen. Für die Amplitude des makroskopischen Oszillators erhalten wir als Endresultat q0 (t) = a e−Γt+i(Ω0 −δ)t + c.c. . (2.205) Unter dem Einfluss der vielen mikroskopischen Oszillatoren führt der makroskopische Oszillator also eine gedämpfte Schwingung aus. Argwöhnen Sie, die gefundene Dämpfung sei ein Artefakt der näherungsweisen Ersetzung von Frequenzsummen durch Frequenzintegrale wie beim Übergang von (2.185) zu (2.186) oder insbesondere zu (2.187)? Die Skepsis wäre prinzipiell berechtigt, im Fall vieler dicht liegender ων jedoch praktisch gegenstandslos. Für hinreichend viele eng benachbarte ων ist die Summe (2.185) vom Integral (2.186) praktisch nicht zu unterscheiden. Eine genauere Diskussion der Güte derartiger Näherungen stelle ich Ihnen in 21.8 vor. Die hier beschriebene Modellrechnung wird uns mit geringfügigen Modifikationen bei der Diskussion der spontanen Emission von Licht durch angeregte Atome in 13.4 wiederbegegnen. 62 2 Schwingungen Kapitel 3 Nichtrelativistische Bewegung im Gravitationsfeld 3.1 Das 1/r-Potential Zwei Teilchen mit den schweren Massen M und m üben aufeinander eine anziehende Gravitationskraft aus, die in Richtung der Verbindungslinie wirkt und den Betrag F =G mM r2 (3.1) Abbildung 3.1 hat. Legen wir den Ursprung des Koordinatensystems in den Mittelpunkt des Teilchens der Masse M , so lautet die Kraft auf das andere 63 64 3 Nichtrelativistische Bewegung im Gravitationsfeld mM ~x . F~ = −G 2 r r (3.2) Dieses Kraftfeld ist wirbelfrei (s. 2.10), ∂Fν ∂Fµ = ∂xµ ∂xν mit xµ = x, y, z; F µ = F x , Fy , Fz , (3.3) und hat eine potenzielle Energie U (~x), die bei festem Bezugspunkt ~x0 eine eindeutige Funktion der Koordinaten des Beobachtungspunktes“ ~x ist. Wir ” können U (~x) als Wegintegral der Kraft längs eines beliebigen Weges von ~x0 nach ~x berechnen. Da gegen F~ bei Wegen auf der Kugelfläche |~x| = r = const keine Arbeit geleistet wird, ändert sich U (~x) längs solcher Wege nicht. Also kann U nur von |~x| = r abhängen, U (~x) = U (r). Die Änderung von U längs eines Wegstücks dr in radialer Richtung gemäß d~x = dr ~xr beträgt mM dU = −F~ · d~x = G 2 dr . r (3.4) Für endliche Wege längs eines Radialstrahls gilt U (r) − U (r0 ) = Zr r0 dr0 G mM = − GmM r02 µ 1 1 − r r0 ¶ . (3.5) Es ist üblich, den Bezugspunkt r0 ins Unendliche zu legen mit U (∞) = 0; dann haben wir U (r) = − GmM . r (3.6) Abbildung 3.2 Dies ist das sogenannte Keplerpotential (s. Abbildung 3.2). Da alle Massen positiv sind, ist es immer anziehend. Die elektrostatische Wechselwirkung zweier Punktladungen q, Q wird auch durch eine kugelsymmetrische potenzielle Energie, die mit wachsendem r wie 1/r abfällt, beschrieben, das Coulombpotential Uelstat (r) ∼ qQ . r (3.7) 3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential 65 Da elektrische Ladungen verschiedene Vorzeichen haben können, liegt hier bei Ladungen gleichen Vorzeichens Abstoßung und bei Ladungen ungleicher Vorzeichen Anziehung vor. 3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential Ein Teilchen der Masse m bewege sich unter dem Einfluss der potenziellen Energie U =− km . r (3.8) Die Bewegungsgleichung lautet, wegen Fµ = ¨ = m~x ∂U , ∂xµ (3.9) mk ~x . r2 r (3.10) − Das sind die drei Differentialgleichungen für die drei Koordinaten ~x(t) = (x(t), y(t), z(t)). Obwohl es sich um nichtlineare gekoppelte Differentialgleichungen 2. Ordnung handelt, lässt sich die allgemeine Lösung in geschlossener Form angeben. Ein erstes Integral ist der Energiesatz T + U = E = const (3.11) 2 2 2 mit T = m x˙ 2 = m 2 ~ 2 (ẋ + ẏ + ż ) ≥ 0 . Wegen T ≥ 0 muss entlang der Bahn ~x(t) des Teilchens immer gelten U ≤ E. Dieser Erhaltungssatz reicht natürlich nicht aus, die drei Funktionen ~x(t) festzulegen. Um ein weiteres Bewegungsintegral zu finden, multiplizieren wir die Bewegungsgleichung (3.10) vektoriell mit ~x und beachten − mk ~x × ~x = 0 . r2 r (3.12) Die Bewegungsgleichungen geben somit ¨ × ~x = 0 . m~x (3.13) Die linke Seite dieser Identität ist aber eine totale zeitliche Ableitung, denn d ¨, (~x × ~x˙ ) = ~x˙ × ~x˙ +~x × ~x | {z } dt = 0 (3.14) 66 3 Nichtrelativistische Bewegung im Gravitationsfeld so dass d (~x × m~x˙ ) = 0 . dt (3.15) Bei der Bewegung im 1/r Potential bleibt also das Vektorprodukt aus Ortsvektor ~x und Impulsvektor m~x˙ , der Drehimpuls, zeitlich konstant −−→ ~ = ~x × m~x˙ = − L const . (3.16) 1 |~x × ~x˙ | = const . 2 (3.17) Aus diesem Drehimpulserhaltungssatz folgt sofort eine wichtige Eigenschaft der Bahnkurven ~x(t). Zu jedem Zeitpunkt spannen die beiden Vektoren ~x und m~x˙ eine Ebene auf. Die Ebene wird charakterisiert durch ihren Normalenvektor, d. h. einen auf ihr senkrecht stehenden Vektor. Senkrecht auf der Ebene steht ~ Die zeitliche Konstanz von L ~ besagt, dass die Ebene, gerade der Drehimpuls L. ˙ in der ~x und ~x liegen, sich zeitlich nicht ändert. Die Bahnkurve ~x(t) bleibt also immer in einer Ebene. Weiterhin folgt aus der Konstanz des Drehimpulses die Zeitunabhängigkeit seines Betrages, |~x × m~x˙ | und ebenso die Zeitunabhängigkeit der Größe Dieser Erhaltungssatz ist das zweite Keplersche Gesetz, der so genannte Flächensatz: die Verbindungslinie zwischen den beiden Teilchen (bei Kepler Sonne und Planet) überstreicht in gleichen Zeiten ∆t gleiche Flächen, denn bekanntlich ist 1 x × ∆~x| die Fläche des von ~x und ∆~x aufgespannten Dreiecks (s. Abbildung 2 |~ 3.3). Abbildung 3.3 Die Erhaltungssätze von Energie und Drehimpuls reichen aus, die Bahnkurven ~x(t) festzulegen. Wir dürfen die Ebene der Bahnkurve (die Ebene der Erdbahn heißt Ekliptik) zur x-y-Ebene unseres Koordinatensystems machen. Dann ist eine Lösung trivial, z(t) = 0 , (3.18) 3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential 67 und der Drehimpuls hat die Komponenten Lx = 0, Ly = 0, Lz = L . (3.19) Zu bestimmen bleiben x(t) und y(t). Da das Kraftzentrum (im Keplerproblem der Ort der Sonne) der einzige ausgezeichnete Punkt der Bahnebene (im Keplerproblem Ekliptik) ist, und das U (~x) = U (r), liegt es nahe, die Bahnkurve in ebenen Polarkoordinaten x = r cos ϕ y = r sin ϕ (3.20) zu suchen. Die Geschwindigkeiten lassen sich durch r(t) und ϕ(t) und deren Ableitungen ausdrücken gemäß ẋ = ṙ cos ϕ − rϕ̇ sin ϕ ẏ = ṙ sin ϕ + rϕ̇ cos ϕ (3.21) ~x˙ 2 = ẋ2 + ẏ 2 = ṙ2 + r2 ϕ̇2 und entsprechend die z-Komponente des Drehimpulses als Lz = m(xẏ − y ẋ) = mr 2 ϕ̇ . (3.22) Somit lauten die Erhaltungssätze für Energie und Drehimpuls 1 km m(ṙ2 + r2 ϕ̇2 ) − 2 r = E (3.23) mr2 ϕ̇ = L. (3.24) Mit Hilfe des Drehimpulses lässt sich ϕ̇ aus dem Energiesatz eliminieren, woraufhin dieser lautet L2 km 1 mṙ2 + − =E . 2 2 2mr r (3.25) In dieser Form erinnert der Energiesatz an das für einen Freiheitsgrad Bekannte. Die effektive potenzielle Energie Ueff (r) für die Radialkoordinate, Ueff (r) = km L2 , − 2mr2 r (3.26) enthält außer dem 1/r-Term die abstoßende Zentrifugalenergie“ L2 /2mr 2 . ” 68 3 Nichtrelativistische Bewegung im Gravitationsfeld Da 12 mr2 ≥ 0, verläuft die Bahnkurve so, dass immer Ueff (r) ≤ E. Es folgt, dass im Fall der anziehenden Gravitationswechselwirkung (k > 0) die Bahnen negativer Energie und positiver Energie verschiedenen Charakter haben. Wie aus Abbildung 3.4 ersichtlich, liegt für E < 0 Abbildung 3.4 der Abstand des Teilchens vom Zentrum immer zwischen zwei Schranken r min und rmax . Da das Teilchen sich vom Zentrum nie weiter als bis zum Abstand rmax entfernen kann, spricht man auch von gebundenen Bahnen. Das Auftreten der unteren Schranke rmin liegt an der abstoßenden Zentrifugalkraft bzw. -energie, die für kleine Abstände die anziehende Gravitationskraft überwiegt. Letztere Potentialbarriere liegt zwar auch für E ≥ 0 vor, jedoch kann sich das Teilchen nun beliebig weit vom Kraftzentrum entfernen. Ein Teilchen auf solcher Bahn wird gestreut und ist nicht gebunden. 3.3 Die Bahnkurven Wir hatten die Erhaltungssätze für Energie und Drehimpuls geschrieben als L2 km m 2 ṙ + − 2 2 2mr r mr2 ϕ̇ = E (3.27) = L. (3.28) Erstere Gleichung ist eine Differentialgleichung erster Ordnung für die Zeitabängigkeit der Radialkoordinate r(t). Die Lösung t − t0 = Zr r0 q dr0 2E m + 2k r0 − L2 m2 r 02 (3.29) ist mit Hilfe von Integraltafeln auswertbar. Anschließend ergibt sich ϕ(t) durch Integration des Drehimpulssatzes. Interessieren wir uns vorläufig nur für die geometrische Form r(ϕ) der Bahnkurven. Dazu fassen wir r als Funktion von ϕ auf und schreiben 3.3 Die Bahnkurven dr dϕ dr L dr = = . dt dϕ dt dϕ mr2 69 (3.30) Daraus liefert der Energiesatz eine Differentialgleichung für die Bahnkurve r = r(ϕ), µ dr dϕ ¶2 L2 L2 km + − =E . 4 2mr 2mr2 r (3.31) Die Form der Bahnkurve wird unmittelbar ersichtlich, wenn wir vorübergehend u= 1 r (3.32) als abhängige Variable einführen. Die Transformation (3.32) überführt den Energiesatz (3.31) in µ 2¶ 2mE 2km2 du u= (3.33) + u2 − dϕ L2 L2 Diese Beziehung ist aber formgleich mit dem Energiesatz für eine harmonische Schwingung der Frequenz 1 um den Mittelpunkt km2 1 ≡ . 2 L p (3.34) Tatsächlich löst u= 1 1 = [1 + ² cos(ϕ − ϕ0 )] r p (3.35) mit ²= µ 2EL2 1+ 2 3 k m ¶1/2 (3.36) und der beliebigen reellen Integrationskonstanten ϕ0 die Differentialgleichung (3.33). Aus (3.35) erkennen wir die Bahnkurven r = r(ϕ) als ebene Kegelschnitte. Der Parameter ² heißt die Exzentrizität derselben. Im Fall der anziehenden ≤ ≤ Wechselwirkung wird die Bahnkurve je nach ² > 1, d. h. E > 0, qualitativ verschieden verlaufen. Die obige Diskussion kann jetzt präzisiert werden. Für ² < 1, d. h. E < 0, läuft r periodisch in ϕ (nicht nur in der Zeit t, was wir schon in 3.2 gesehen hatten) im Intervall rmin = p p ≤ r ≤ rmax = . 1+² 1−² (3.37) Die Bahnkurve ist geschlossen und hat die Form einer Ellipse (erstes Keplersche Gesetz), wobei das Kraftzentrum Abbildung (3.5) in einem der Brennpunkte liegt. 70 3 Nichtrelativistische Bewegung im Gravitationsfeld Im Grenzfall ² = 0 ist die Ellipse zum Kreis entartet; aus (3.31) ersehen wir, dass der Kreisradius zum Minimum der effektiven potenziellen Energie gehört. } } } } Abbildung 3.5 Für ² > 1 d. h. E > 0, liegt ein Streuzustand vor. Die Bahnkurve ist eine Hyperbel, die das Kraftzentrum umläuft Abbildung (3.6). { { Abbildung 3.6 Weit weg vom Zentrum läuft das Teilchen unter dem Winkel ϕ∞ auf praktisch gerader Bahn ein. Später läuft es asymptotisch wieder auf einer Geraden aus, gestreut um den Winkel (s. Skizze) Θ = 2ϕ∞ − π , (3.38) wobei 1 + ² cos ϕ∞ = 0, also ϕ∞ = 1 π + arcsin . 2 ² (3.39) Für ² = 1, d. h. E = 0, ist die Bahnkurve eine Parabel. Ein so bewegtes Teilchen hat für r → ∞ gerade verschwindende kinetische Energie, d. h. verschwindende Geschwindigkeit. Die Zeitabhängigkeit r(t) lässt sich auch durch elementare Funktionen ausdrücken. Statt hierin Mühe zu investieren, halten wir lieber als allgemeine 3.4 Das Zweikörperproblem 71 Aussage fest, dass die Geschwindigkeit ~v im Perihel den maximalen Betrag hat. Das ist sofort aus dem Energiesatz ersichtlich. Ferner erhalten wir die Umlaufzeit T auf einer Ellipsenbahn aus dem Flächenansatz Keplers, d. h. dem Drehimpulserhaltungssatz (3.17) L 1 = |~x × ~x˙ | = const . 2m 2 (3.40) Nach einem Umlauf ist gerade die Fläche der Ellipse, F = πab überstrichen. Also finden wir durch Integration von t = 0 bis t = T T = πab . L/2m (3.41) Nach bekannten Formeln der analytischen Geometrie findet man für die Halbachsen der Ellipsen a= km p = , 2 1−² 2|E| und somit für die Umlaufzeit T = πkm r b= √ p L =p 2 1−² 2m|E| m = 2πa3/2 2|E|3 r (3.42) 1 . k Dieses Resultat enthält das dritte Keplersche Gesetz: die Quadrate der Umlaufzeit der Planeten sind proportional zu den Kuben der großen Halbachsen ihrer Bahnen. 3.4 Das Zweikörperproblem Wir haben bisher die Bewegung eines Teilchens im Keplerpotential behandelt. Das ist noch nicht genau das Problem der Planetenbahnen. Die Anziehungskraft der Sonne auf einen Planeten ist entgegengesetzt gleich der Anziehungskraft des Planeten auf die Sonne und letztere führt dazu, dass sich auch die Sonne beschleunigt bewegt. Wir haben die beiden (bzw. sechs) Bewegungsgleichungen ¨P + G mP ~x ¨S − G mS ~x mP mS ~xP − ~xS =0 |~xP − ~xS |2 |~xP − ~xS | (3.43) mP mS ~xP − ~xS =0. |~xP − ~xS |2 |~xP − ~xS | (3.44) wobei mP und ~xP Masse und Ortsvektor der Planeten, mS und ~xS die entsprechenden Größen für die Sonne sind. ¨S |/|~x ¨P | = Beachten wir, dass die Beschleunigungen das Betragsverhältnis |~x mP /mS haben. Für Jupiter, den schwersten Planeten, hat dieses Verhältnis einen Wert von etwa 10−3 und für die Erde gar nur von etwa 2 · 10−6 . Wir 72 3 Nichtrelativistische Bewegung im Gravitationsfeld erwarten also, dass bei der Behandlung der Planetenbahnen die Sonne bis auf einen Fehler von ≤ 1% als ruhendes Kraftzentrum angesehen werden kann. Astronomische Beobachtungen sind phantastisch genau. Zum Vergleich der Theorie mit den Messdaten brauchen wir die Planetenbahnen genauer als bis auf einen Fehler von etwa 1%. Sie sind, solange die Wechselwirkung der Planeten untereinander vernachlässigt, also nur das Zweikörpersystem Planet und Sonne behandelt wird, billig exakt zu haben. Wir führen statt der Ortsvektoren ~xP und ~xS Relativkoordinaten ~x = ~xP − ~xS (3.45) ~ = mP ~xP + mS ~xS X mP + m S (3.46) und Schwerpunktskoordinaten ein. Aus den Newtonschen Gleichungen (3.43), (3.44) folgen für Bewegungsglei~ Sie lauten, wenn wir als Abkürzungen chungen für die Koordinaten ~x und X. die Gesamtmasse M = mP + mS (3.47) mP · m S mP + m S (3.48) und die reduzierte Masse m= einführen, ~¨ = 0 MX ¨+G m~x mM ~x =0. |~x|2 |~x| (3.49) (3.50) Die erste Gleichung besagt, dass sich der Schwerpunkt des Zweikörpersystems kräftefrei, also mit konstanter Geschwindigkeit bewegt. Die zweite beschreibt ein Teilchen der Masse m, das sich unter dem Einfluss der von einem fixen Kraftzentrum ausgehenden Gravitationskraft bewegt. Letzteres Problem war in 3.2 und 3.3 gelöst worden. Wir haben m dabei als die reduzierte Masse des Planeten zu interpretieren. Wegen mP ¿ mS weicht die reduzierte Masse nur wenig von der Planetenmasse ab. Kapitel 4 Statische wirbelfreie Felder∗ 4.1 Wirbelfreie Vektorfelder Wirbelfreie Vektorfelder hatten wir schon im Kapitel 2 kennengelernt. Die Wirbelfreiheit bezeichnet die Eigenschaft ∂Vi ∂Vj = , ∂xj ∂xi i, j = 1, 2, 3 bzw. x, y, z. (4.1) Für derartige Felder ist, wie wir gesehen hatten, das Wegintegral Z~x ~ (~x0 ) ≡ −ϕ(~x) d~x0 · V (4.2) ~ x0 für alle zwischen ~x0 und ~x laufenden Wege gleich und somit, bei festgehaltenem Bezugspunkt“ ~x0 , eine eindeutige Funktion der Koordinaten des Beobach” ” tungspunktes“ ~x (s. Abbildung 4.1). Abbildung 4.1 Da ein Wegintegral sein Vorzeichen wechselt, wenn beim Integrieren der Weg in umgekehrter Richtung durchlaufen wird, muss jedes Wegintegral über ein ∗ In diesem Kapitel werden überwiegend drei Raumdimensionen in Rechnung gestellt; ein Punkt wird durch den Ortsvektor ~ x = (x, y, z) = (x1 , x2 , x3 ) beschrieben; ein skala~ (~ res Feld ϕ(~ x) ist eine Zuordnung einer Zahl ϕ(~ x) zum Punkt ~ x; ein Vektorfeld V x) = (Vx (~ x), Vy (~ x), Vz (~ x)) = (V1 , V2 , V3 ) ist eine Zuordnung des Zahlentripels Vx , Vy , Vz zum Punkt ~ x. 73 74 4 Statische wirbelfreie Felder wirbelfreies Feld längs eines beliebigen geschlossenen Weges (Einschränkung: einfach zusammenhängendes Gebiet!) verschwinden, I ~ (x) = 0 . ZL = d~x · V (4.3) L ~ längs des geschlossenen Weges L. Das VerschwinZL heißt die Zirkulation von V den von ZL ist die anschaulichste Manifestation von Wirbelfreiheit (Gegenbeispiel: schauen Sie den Wirbel in der Badewanne an). ~ (~x) durch DiffeAus dem skalaren Wegintegral ϕ(~x) kann das Vektorfeld V renzieren zurückgewonnen werden: Vi = − ∂ϕ , ∂xi kurz ~ = − grad ϕ V oder ~ = −∇ϕ . V (4.4) Als ein Beispiel kennen wir das Gravitationsfeld eines schweren Teilchens der Masse M. Auf ein Probeteilchen der Masse m am Ort ~x (Nullpunkt in M ) wirkt die Gravitationskraft F~ = m~g , ~g = − GM ~x = ~g (~x) r3 (4.5) Abbildung 4.2 Zur Beschreibung des von M am Ort ~x erzeugten Gravitationsfeldes ist ~g , da von der Masse m des Probekörpers unabhängig, besser geeignet als die Gravitationskraft F~ . Wir nennen ~g (~x) die Feldstärke oder kurz das Gravitationsfeld. Zur Gravitationskraft F~ gehört die potenzielle Energie des Probeteilchens U (~x) = mϕ(~x) , ϕ(~x) = ϕ(r) = − GM . r (4.6) Das skalare Feld ϕ(~x) heißt Gravitationspotential. Es ist eine Erfahrungstatsache, dass sich (schwache) Gravitationsfelder, die von verschiedenen Teilchen erzeugt werden, linear superponieren. Also gilt für das von N Teilchen mit den Massen mi erzeugte Gravitationspotential ϕ(~x) = − N X Gmi . |~ x − ~xi | i=1 (4.7) 4.1 Wirbelfreie Vektorfelder 75 Ganz entsprechend erhalten wir das Gravitationspotential, das von einer kontinuierlichen Massenverteilung der Dichte ρ(~x) erzeugt wird. Wir denken uns das mit Masse gefüllte Volumen in N so kleine Teile ∆x∆y∆z zerlegt, dass innerhalb jedes Teiles ρ(~x) als konstant angesehen werden kann. Dann gilt, mit mi = ρ(~x)∆x∆y∆z als der i-ten Teilmasse, ϕ(~x) = − N X Gρ(~xi )∆x∆y∆z |~x − ~xi | i=1 und im Grenzfall beliebig feiner Zerlegung Z Gρ(~x0 ) . ϕ(~x) = − d3 ~x0 |~x − ~x0 | Wir können auch die Feldstärken ~g (~x) superponieren und das Integral Z Gρ(~x0 ) ~x − ~x0 ~g (~x) = d3 ~x0 |~x − ~x0 |2 |~x − ~x0 | (4.8) (4.9) (4.10) für eine gegebene Massenverteilung ausrechnen. Meist ist es jedoch erheblich bequemer, die Feldstärke durch Differenziation aus dem Potential zu gewinnen ~g = −∇ϕ, da sich skalare Volumenintegrale leichter als vektorielle gewinnen lassen. ~ x), das die Als ein zweites Beispiel kennen wir das elektrostatische Feld E(~ Kraft auf ein am Ort ~x befindliches Teilchen der Ladung q gibt gemäß ~ x) . F~ (~x) = q E(~ (4.11) Elektrische Felder werden durch ruhende Ladungen erzeugt. Das von einer Punktladung Q erzeugte Feld ist∗) ¶ µ Q ~x 1 ~ . (4.12) E(~x) = 4π²0 r2 r Abbildung 4.3 Das zugehörige elektrostatische Potential ist das Coulombpotential ¶ µ Q 1 ϕ(x) = . 4π²0 r (4.13) Das elektrostatische Feld vieler Ladungen erhalten wir wieder durch Superposition. Insbesondere lautet das von einer kontinuierlichen Ladungsverteilung der Ladungsdichte ρ(~x) erzeugte elektrostatische Potential ∗) ² 0 = 8, 854 . . . × 10−12 Coulomb/Volt · Meter ist die elektrische Feldkonstante. 76 4 Statische wirbelfreie Felder ϕ(~x) = µ 1 4π²0 ¶Z d3 ~x0 ρ(~x0 ) . |~x − ~x0 | (4.14) Beachten Sie die Vorzeichenkonvention. Die potenzielle Energie der Ladung q im Feld der Ladung Q (und umgekehrt) lautet ¶ µ qQ 1 . (4.15) U (~x) 4π²0 r Sie ist anziehend (U < 0, Topf), wenn q und Q verschiedene Vorzeichen haben und abstoßend (U > 0, Wall) für Ladungen gleichen Vorzeichens. 4.2 Quellen wirbelfreier Felder Gravitationsfelder werden von massiven Teilchen erzeugt, elektrostatische Felder durch geladene Teilchen. Man sagt, Massen und Ladungen sind die Quellen der respektiven Felder. Präzisieren wir diese Redeweise! ~ ein ebenes Flächenelement am Ort ~x, dem Betrag nach so klein, Sei ∆S ~ (~x) als überall auf dem Flächenstück konstant angesehen dass das Vektorfeld V ~ gibt die Normale zum Flächenstück werden kann. Die Richtung des Vektors ∆S ~ durch ∆S ~ bezeichnen wir das Skalarprodukt an. Als Fluss ∆Φ von V ~ (~x) · ∆S ~ . ∆Φ(~x) = V (4.16) ~ durch S ergibt Sei S eine beliebige gekrümmte Fläche. Der Fluss von V ~ zerlegt wird, dass sich, wenn S in so viele kleine gerichtete Flächenstücke ∆S ~ (~x) in jedem als konstant angesehen werden kann, durch jedes als eben und V Summieren der Teilflüsse durch die Flächenstücke zu X ~ (x~i ) · ∆S ~i . φ= V (4.17) i Im Grenzfall beliebig verfeinerter Zerlegung wird der Fluss Φ durch die Fläche S durch das Integral ZZ ~ ·V ~ (~x) φ= dS (4.18) S gegeben. Soll der Fluss durch eine geschlossene Fläche berechnet werden, so wird der Normalenvektor stets als nach außen gerichtet definiert. Wenn der Fluss Φ von ~ durch eine geschlossene Fläche S von Null verschieden ist, so umschließt S V ~ . (Manchmal spricht man von Quellen bei Φ > 0 und von Senken Quellen von V bei Φ < 0.) Betrachten wir den Fluss des von einer Ladung Q erzeugten elektrischen ~ durch die Oberfläche einer Kugel am Ort der Ladung als Mittelpunkt. Feldes E ~ (s. Abbildung 4.4) ist genau wie E ~ radial vom Das Oberflächenelement ∆S Ursprung weg gerichtet und lautet in Kugelkoordinaten ~= ∆S ~x rdΘr sin Θdϕ . r (4.19) 4.2 Quellen wirbelfreier Felder 77 Abbildung 4.4 Der gesuchte Fluss, Φ=r 2 Zπ dΘ sin Θ 0 Z 2π 0 dϕ · µ 1 4π²0 ¶ Q r2 µ ¶2 ~x = Q/²0 , r (4.20) ist bis auf den Faktor 1/²0 gleich der umschlossenen Ladung Q. Dieses Resultat ist unabhängig davon, welche Form die geschlossene Fläche S hat, solange nur die Ladung umschlossen wird. Denn jede solche Fläche ~ zerlegt werden, deren jedes kann in gerichtete, praktisch ebene Teilstücke ∆S vom Ort der Ladung aus gesehen gerade über (oder unter) dem rechteckigen Teilstück der Einheitskugel liegt, welches zwischen ϕ und ϕ + dϕ bzw. Θ und Θ + dΘ aufgespannt ist und die Fläche sin ΘdϕdΘ hat. Ein solches Teilstück hat, wenn es sich im Abstand r von der Ladung befindet, einen Flächenvektor ~ · ~x/r) in radialer Richtung. Also gilt mit Komponente r 2 sin ΘdϕdΘ = (∆S Φ = I = Q/4π²0 ~ ·E ~ = dS Zπ 0 I ~ · ~x/r)Q/r 2 4π²0 (dS sin ΘdΘ Z2π dϕ = Q/²0 . 0 Beim eben gegebenen Argument war stillschweigend angenommen, dass jeder von Q ausgehender Radialstrahl die Oberfläche S nur einmal schneidet. Diese Annahme ist aber auch unnötig. Jedenfalls liegt eine ungerade Zahl solcher Überschneidungen vor, wie Abbildung 4.5) zeigt. Betrachten wir die Flächenstücke, die von Q aus gesehen über einem Rechteck mit Fläche sin ΘdΘdϕ auf der Einheitskugel erscheinen, so sind die respektiven Beiträge zum Oberflächenintegral alle betragsmäßig gleich, 78 4 Statische wirbelfreie Felder Abbildung 4.5 ¯ ¯ ¯ ¯ ¯ ¯Q 2 ¯ Q ~xi ~¯ ¯ ¯ ΘdΘdϕ ¯ r2 ri ∆Si ¯ = ¯ r2 ri sin | {z } ¯ i i dΩ ¯ ¯ ¯ ¯ = QdΩ , ¯ ¯ (4.21) alternieren jedoch im Vorzeichen von einem zum nächsten. Bis auf einen heben sie sich paarweise auf, so dass der gesamte Fluss wieder den Wert Q/²0 hat. Es ist auch keineswegs nötig, dass Q im Ursprung des Koordinatensystems sitzt; noch, dass Q eine einzelne Punktladung P ist; Q kann durchaus die Summe mehrerer Punktladungen darstellen, Q = i qi , die von S umschlossen werden. Jedenfalls gilt: Der Fluss des elektrischen Feldes durch eine geschlossene Fläche S ist gleich dem (1/²0 )-fachen der umschlossenen Ladung. Wenn die Ladung im von S umschlossenen Volumen kontinuierlich verteilt ist, so gilt ZZZ ZZ ~ · E(~ ~ x) = Q/²0 = 1 d3 ~xρ(~x) . (4.22) Φ = ° dS ²0 S Wenn die geschlossene Fläche S keine Ladungen umschließt, so ist der Fluss durch S Null. Außerhalb des von S umschlossenen Gebietes liegende Ladungen ~ durch S nicht bei, wie wir uns nochmals klarmachen tragen zum Fluss von E anhand der zur in Abbildung 4.5 analogen Skizze in Abbildung 4.6: Umgekehrt darf aus dem Verschwinden des Flusses ϕ durch S nicht geschlossen werden, S umschließe keine Quellen des Feldes, also keine Ladungen. Es könnten nämlich im umschlossenen Gebiet genauso viele negative wie positive Ladungen sitzen, so dass das Gebiet insgesamt elektrisch neutral ist. 4.3 Lokale Quellen Der Begriff der Quelle eines Feldes entfaltet seine volle Nützlichkeit erst, ~ durch ihre wenn wir infinitesimal kleine Raumbereiche und den Fluss von E Oberfläche betrachten. Nehmen wir speziell ein achsenparalleles Parallelepiped mit den Kantenlängen ∆x, ∆y, ∆z und berechnen den Fluss durch seine Oberfläche (Abbildung 4.7). 4.3 Lokale Quellen 79 Abbildung 4.6 Abbildung 4.7 Da die Normalvektoren auf den Kantenflächen in Richtung der Koordinatenachsen zeigen, lautet der gesuchte Fluss durch die 6 Kantenflächen Φ = y+∆y Z dη z+∆z Z x+∆x Z x+∆x Z y+∆y Z dζ z + ¡ ¢ dζ − Ex (x, η, ζ) + Ex (x + ∆x, η, ζ) z y + z+∆z Z x dξ x y ¡ ¢ dξ − Ey (ξ, y, ζ) + Ey (ξ, y + ∆y, ζ) ¡ ¢ dη − Ez (ξ, η, z) + Ez (ξ, η, z + ∆z) . (4.23) Durch Taylorentwicklung der Integranden um den Punkt ~x = (x, y, z) sehen wir, dass Φ für kleine Kantenlängen von der Ordnung ∆x∆y∆z ist. Unter Vernachlässigung von Korrekturen höherer Ordnung in den Koordinateninkre- 80 4 Statische wirbelfreie Felder menten haben wir Φ = y+∆y Z dη y = z+∆z Z dζ ∂Ex (x, η, ζ) ∆x + (zykl. Vert.) ∂x z ∂Ex (x, y, z) ∆x ∂x y+∆y Z dη y = ∆x∆y∆z ½ z+∆z Z dζ + (zykl. Vert.) (4.24) z ∂Ex ∂Ey ∂Ez + + ∂x ∂y ∂z ¾ . Die hier auftretende Größe ∂Ey ∂Ez ∂Ex ~ + + = divE ∂x ∂y ∂z (4.25) ~ heißt die Quellstärke oder Divergenz von E. ~ ~ hat, so ist der Fluss Wenn die Divergenz von E am Ort ~x den Wert divE ~ von E durch die Oberfläche eines kleinen Parallelepipeds bei ~x gleich ~ = 1 ρ(~x)∆x∆y∆z . (4.26) Φ = ∆x∆y∆z div E ²0 Wir sehen, dass die Ladungsdichte ρ(~x) bis auf den Faktor 1/²0 die Quellstärke ~ von E ~ ist, divE 1 ρ(~x) . (4.27) ²0 Mit gleicher Begründung finden wir für die Quellstärke div ~g (~x) des Gravitationsfeldes ~g (~x) ~ x) = divE(~ div ~g (~x) = −4π Gρ(~x) , (4.28) wobei ρ(~x) natürlich die Massendichte bedeutet. ~ durch die Oberfläche eines infiUnser Resultat (3.2) über den Fluss von E nitesimalen Volumenelements ∆x∆y∆z gestattet sofort eine Aussage über den ~ durch die Oberfläche S eines endlichen Volumens. Letzteres kann Fluss von E nämlich in infinitesimale Volumina ∆V zerlegt werden, wobei S durch ebene Teilstücke ∆S approximiert wird. Der Fluss durch S ist dann gleich der Summe der Flüsse durch die Oberfläche der Teilvolumina ∆V , denn jede innere Kantenfläche ist Teil der Oberfläche zweier benachbarter Teilvolumina, und die beiden respektiven, jeweils auf die nach außen gerichtete Flächennormale bezogenen Flüsse heben sich gegenseitig auf (vgl. Abbildung 4.8). Es folgt somit der Gaußsche Integralsatz, wenn der Fluss durch die Oberfläche jedes Teilvolumens gemäß (4.24) durch die Quellstärke am Ort des Teilvolumens ausgedrückt wird ZZZ ZZ ~ = °E ~ · dS ~ . d3 x div E (4.29) V S 4.4 Elektrostatisches Potential 81 Abbildung 4.8 Beachten Sie, dass die eben skizzierte Herleitung des Gaußschen Satzes keinen ~ wirbelfrei ist. Der Satz gilt tatsächlich auch für Gebrauch davon macht, dass E Felder mit Wirbeln. 4.4 Elektrostatisches Potential Wirbelfreie Vektorfelder sind durch ihre Quellen und Randbedingungen eindeutig festgelegt. Um diese Behauptung plausibel zu machen, stelle ich zunächst klar, dass die Angabe der Quellen eines Feldes gemäß ~ = divE 1 ρ ²0 (4.30) ~ x) festzulegen: obige Gleichung stellt eine Diffeallein nicht ausreicht, um E(~ rentialgleichung für die drei Unbekannten Ei (~x) dar. Nehmen wir allerdings die ~ hinzu, d. h. stellen das Vektorfeld E ~ als Gradienten eines Wirbelfreiheit von E skalaren Feldes dar mit ~ x) = −∇ϕ(~x) . E(~ (4.31) so erhalten wir für das Potential ϕ(~x) die Differentialgleichung 2. Ordnung div grad ϕ(~x) = ∆ϕ(~x) = − ∆= 1 ρ(~x), ²0 (4.32) ∂2 ∂2 ∂2 + 2+ 2 , 2 ∂x ∂y ∂z die als die Poissonsche Differentialgleichung bekannt ist. Die Poissonsche Gleichung ist bei vorgegebener Ladungsverteilung (bzw. Massenverteilung) eine inhomogene Differentialgleichung. Ihre allgemeine Lösung ergibt sich durch Superposition eines Partikularintegrals der inhomogenen Gleichung mit dem allgemeinen Integral der homogenen Gleichung. Durch Randbedingungen wird eine eindeutige Lösung ϕ(~x) fixiert, aus der sich mit (4.32) ~ eindeutig ergibt. auch das Feld E Ein Partikularintegral der Poissonschen Gleichung kennen wir schon, ϕ(~x) = 1 4π²0 Z V d3 x 0 ρ(~x 0 ) . |~x − ~x 0 | (4.33) 82 4 Statische wirbelfreie Felder Es erfüllt die Randbedingung ϕ = 0 für |~x| → ∞. Wir hatten dieses Integral konstruiert, bevor wir die Feldgleichung ∆ϕ = −4πρ aufgestellt hatten. Nachträglich lernen wir zu verifizieren, dass das Integral die Feldgleichung befriedigt. Wenn speziell eine Punktladung Q bei ~x = 0 vorliegt, also ρ(~x) = Qδ (3) (~x) = Qδ(x)δ(y)δ(z) , (4.34) so gibt obiges Integral gerade das wohlbekannte Coulombpotential 1 Q 1 Q = . 4π²0 |~x| 4π²0 r Erfüllt letzteres wirklich die Poissongleichung, d. h. gilt wirklich ϕ(~x) = (4.35) 1 = − 4πδ (3) (~x) ? (4.36) r Einfaches Nachrechnen zeigt, dass ∆(1/r) = 0 überall außer für r = 0. Denn p für eine nur von r = x2 + y 2 + z 2 abhängige Funktion f (r) gilt ∆ gradf (r) = f 0 (r) ~x r (4.37) und div grad f (r) f 0 f 0 f 0 ~x = ~x · grad + div ~x r r r µ ¶0 ~x f 0 + 3f 0 /r = f 00 (r) + 2f 0 (r)/r = ~x · r r = div und somit ∆ 1r = 0 für r 6= 0. Am Ursprung selbst ist ∆ 1r nicht definiert. Um zu sehen, dass die Singularität am Ursprung von der Art einer Deltafunktion ist, haben wir wie immer (s. 2.8) eine geeignete nichtsinguläre Darstellung zu betrachten. Wählen wir etwa 1 1 =√ 2 r r + ²2 mit dem Vorbehalt, ² letztlich nach Null gehen zu lassen. Dann ist 1 3²2 = − . (r2 + ²2 )1/2 (r2 + ²2 )5/2 Dies über den ganzen Raum integriert gibt ∆ Z 1 d x∆ √ r 2 + ²2 3 = Z∞ 2 r dr −12π dΘ sin Θ 0 0 = Zπ | Z∞ 0 | dx {z 4π Z2π 0 (4.39) dϕ (r2 −3²2 + ²2 )5/2 } x2 = −4π . (1 + x2 )5/2 {z } 1/3 (4.38) (4.40) 4.5 Geladenes Teilchen vor einem Leiter 83 Da das Integral unabhängig von ² ist, ist (4.39) tatsächlich bis auf den Faktor − 4π eine Darstellung der Deltafunktion. Damit ist klargestellt, dass das Coulombpotential (4.35) die Lösung der Poissongleichung für den Fall der punktförmigen Ladungsverteilung (4.34) darstellt. Dann folgt mit ∆ 1 = − 4πδ (3) (~x − ~x 0 ) |~x − ~x 0 | (4.41) auch die Richtigkeit von (4.33). Wir hätten auch andersherum argumentieren können und aus der vorher erwiesenen Gültigkeit des Potentials (4.33) und der Feldgleichung (4.32) folgern können, dass das Coulombpotential 1/r die Feldgleichung mit ρ(~x) = δ (3) (~x) löst. Ich betone, dass die bisher betrachteten Potentiale alle die Randbedingung ϕ(~x) → 0 für |~x| → ∞ erfüllen. 4.5 Geladenes Teilchen vor einem Leiter Abweichungen des Potentials von der Form ϕ(~x) = 1 4π²0 ϕ(~x) → 0 Z für d3 x 0 ρ(~x 0 |~x − ~x 0 | (4.42) |~x| → ∞ werden wichtig, wenn der Abstand des Beobachtungspunktes |~x| von irgendeinem Teil der Quellverteilung ρ(~x) vergleichbar mit dem (nicht sehr klein gegen den) Abstand von irgendeinem anderen Körper ist. Solche anderen Körper sind gegebenenfalls mit zu berücksichtigen entweder, falls sie auch starr vorgegebene Ladungsverteilungen haben, durch Einbeziehung in die Verteilung ρ(~x) oder durch Randbedingungen für ϕ(~x) an ihrer Oberfläche. Letzterer Fall liegt z. B. vor, wenn diese anderen Körper elektrische Leiter darstellen. Da Leiter frei bewegliche Ladungen enthalten, muss, wenn ein zeitunabhängiger Zustand vorliegt, auf ihrer Oberfläche und in ihrem Inneren ϕ(~x) = const gelten. Andernfalls würde ein nichtverschwindendes elektrisches Feld E = −∇ϕ herrschen, welches die Ladungen in beschleunigte Bewegung setzen würde. Bei der Bestimmung des elektrischen Feldes außerhalb elektrischer Leiter ist die Randbedingung ϕ = const für die Leiteroberfläche zu stellen. Als einfachstes nichttriviales Beispiel betrachten wir eine Ladung Q im Abstand a vor einem unendlich ausgedehnten Leiter mit ebener Oberfläche (Abbildung 4.9). Auf der Leiteroberfläche (xy-Ebene) ist ϕ = const; ohne Einschränkung der Allgemeinheit setzen wir ϕ(0, y, z) = 0 . (4.43) Im Halbraum x > 0 ist die Lösung der Poissongleichung darstellbar als ϕ(~x) = 1 Q + ϕhom (~x) , 4π²0 |~x − ~a| (4.44) 84 4 Statische wirbelfreie Felder Abbildung 4.9 wobei ϕhom (~x) eine Lösung der homogenen Gleichung ∆ϕhom = 0 ist. Der Anteil ϕhom (~x) muss seine Quellen also im Leiter haben. Wegen der Symmetrie des Problems liegt es nahe, zu raten ϕhom (~x) = − 1 Q . 4π²0 |~x + ~a| (4.45) Das gesamte Potential ϕ(~x) = 1 4π²0 µ Q Q − |~x − ~a| |~x + ~a| ¶ (4.46) sieht dann so aus, als wäre neben der Ladung Q am Ort ~a eine entgegengesetzt gleiche Ladung im Innern des Leiters am Ort −~a vorhanden. Tatsächlich erfüllt (4.45) im rechten Halbraum die homogene Gleichung ∆ϕ = 0 und die Superposition (4.46) somit die Poissongleichung ∆ϕ(~x) = − 1 Qδ (3) (~x − ~a) . ²0 (4.47) Auch die Randbedingung (4.42) ist offensichtlich erfüllt. Wir haben hier die Methode der Spiegelladungen“ an einem einfachen Bei” spiel kennengelernt. Eine Fülle anderer Randwertaufgaben ist ganz ähnlich lösbar. 4.6 Sphärische Ladungs- bzw. Massenverteilung Die Sonne ist in recht guter Näherung eine sphärische Massenverteilung. (Tatsächlich liegt ein abgeplattetes Rotationsellipsoid vor, jedoch unterscheiden sich polarer und äquatorialer Radius zu wenig.) Sphärische Ladungsverteilungen lassen sich im Labor herstellen. Einfach zu behandeln und illustrativ ist der Fall einer gleichförmig mit Masse erfüllten oder elektrisch geladenen Kugel mit Radius a. Im elektrischen Fall lautet das Potential 4.6 Sphärische Ladungs- bzw. Massenverteilung ϕ(~x) = 1 4π²0 Q 4π 3 3 a Z = 1 4π²0 Q 4π 3 3 a Za 85 d3 x 0 |~x − ~x 0 | 0 02 dr r Zπ dΘ sin Θ 0 0 Z 2π 1 dϕ √ 2 02 r + r − 2rr 0 cos Θ | 0 {z } 2π = 1 3Q 4π²0 2a3 Za dr0 r02 (r + r 0 ) − |r − r 0 | . rr0 (4.48) 0 Für Beobachtungspunkte außerhalb der Kugel, d. h. für r > a ergibt sich, da r > r 0 , ϕ(~x) = 1 Q 4π²0 r für r>a. (4.49) Im Innern der Kugel hingegen ϕ(~x) = = = r Z Za 1 3Q 0 0 0 0 0 dr r 2r + dr r 2r 4π²0 2a3 r r 0 ½ 2 ¾ 1 r 3 2 2 Q + (a − r ) 4π²0 a3 2a3 µ ¶ 3 r2 1 Q − 3 für r ≤ a . 4π²0 2a 2a (4.50) Abbildung 4.10 veranschaulicht die Abhängigkeit des Potentials (4.50) vom Abstand r. Abbildung 4.10 Das zugehörige elektrische Feld lautet 86 4 Statische wirbelfreie Felder ~ E = = −∇ϕ = −ϕ0 (r) ~x r Q ~ x 1 4π²0 r 2 r für r ≥ a Qr ~ x 1 4π²0 a3 r für 0 ≤ r ≤ a . (4.51) Außerhalb der Kugel ergibt sich das bekannte Coulombfeld, als wäre die Gesamtladung Q (bzw. Masse) im Mittelpunkt vereinigt. Unter anderen aus diesem Grund ist es möglich, Sonne und Planeten als punktförmige Teilchen zu behandeln. Dabei werden die kleinen Abweichungen der betreffenden Körper von der Kugelform vernachlässigt. Das Feld innerhalb der Kugel lässt sich schreiben als ~ = E 4πr3 /3 1 ~x 1 Q 4π²0 4πa3 /3 r2 r (4.52) und kann als Coulombfeld der von der Kugel mit Radius r umschlossenen Ladung interpretiert werden. 4.7 Monopole, Dipole, Multipole Außerhalb einer beliebigen nichtsphärischen Ladungs- (bzw. Massen-) Wolke“ ” fällt ϕ(~x) nicht genau wie 1/r ab. Betrachten wir die Abweichungen in großer Entfernung von den Quellen. Zur Auswertung des Potentials (4.14) legen wir den Ursprung des Koordinatensystems zunächst irgendwohin ins Innere des Gebietes, in dem ρ(~x) 6= 0 ist (s. Abbildung 4.11). Abbildung 4.11 In großer Entfernung gilt für alle Quellpunkte ~x 0 die Ungleichung |~x0 | ¿ |~x|, so dass wir entwickeln können 1 1 = |~x − ~x| r " 1 1− 2 µ r02 − 2~x · ~x r2 0 ¶ 3 + 8 µ r02 − 2~x · ~x0 r2 ¶2 ± ... # . (4.53) 4.7 Monopole, Dipole, Multipole 87 Im Integranden entstehen dabei Glieder nullter, erster, zweiter und höherer Ordnung in ~x0 bzw. r 0 . Dieselben geben zum Integral Beiträge entsprechender Ordnung im “Durchmesser” a (größter Abstand zweier Quellpunkte). Es ergibt sich die so genannte Multipolentwicklung des Potentials ϕ(~x) = ϕ(0) (~x) + ϕ(1) (~x) + ϕ(2) (~x) . . . , (4.54) die umso besser durch das niedrigste Glied (oder die paar ersten) repräsentiert wird, je kleiner das Verhältnis a/r ist. In nullter Ordnung entsteht der von der inneren Struktur und der äußeren Gestalt der Ladungswolke unabhängige Coulombterm ϕ(0) (~x) = 1 Q , 4π²0 r (4.55) wobei Q= Z d3 x0 ρ(~x0 ) (4.56) die Gesamtladung der Ladungsverteilung darstellt. Im Falle elektrischer Neutralität der Wolke verschwindet Q und die Entwicklung beginnt frühestens mit dem Glied erster Ordnung, ϕ(1) = 0(a/r 2 ). Beim Gravitationsfeld kann dieser Fall natürlich nicht eintreten, da es keine Teilchen negativer Masse gibt. Das gerade besprochene Coulombglied (auch Monopolterm genannt) wird ausschließlich durch die Gesamtladung Q bestimmt. Bei sphärischen Wolken gibt es bereits das gesamte Potential. Insofern i. A. weitere Glieder ϕ(1) (~x) etc. auftreten, können wir sagen, dass diese die Abweichung von der Kugelsymmetrie beschreiben. Das Glied erster Ordnung lautet ϕ1 (~x) = 1 d~ · ~x , 4π²0 r3 (4.57) wobei der Vektor d~ = Z d3 ~x0 ~x0 ρ(~x0 ) (4.58) das Dipolmoment der Wolke bezüglich des Koordinatenursprungs angibt. Beachten Sie, dass das Dipolpotential ϕ(1) (x) schneller mit wachsendem Abstand abfällt als das Coulombpotential. Im Fall des Gravitationsfeldes und bei elektrostatischen Systemen, die nur Ladungen eines Vorzeichens enthalten, lässt sich das Dipolmoment immer zum Verschwinden bringen, indem der Ursprung des Koordinatensystems in den Massen- bzw. Ladungsschwerpunkt gelegt wird. Wenn wir den Koordinatenursprung um ~x verschieben, so ändert sich die Gesamtladung Q der Wolke offenbar nicht, wohl aber das Dipolmoment gemäß X ~ = d~ − QX ~ . d~ 0 = Qi (~xi − X) (4.59) i Also nicht nur im oben erwähnten Fall von Ladungen gleichen Vorzeichens, sondern für alle Wolken mit endlicher Gesamtladung lässt sich das elektrische Dipolmoment zum Verschwinden bringen, indem der Koordinatenursprung in den Ladungsschwerpunkt gelegt wird. Wir schließen aus (4.59) weiterhin, dass 88 4 Statische wirbelfreie Felder bei elektrisch neutralen Systemen das Dipolmoment unabhängig von der Wahl des Koordinatenursprungs ist. Das Dipolpotential (4.57) lässt sich besonders einfach in Kugelkoordinaten ~ so (r, Θ, Φ) schreiben. Legen wir die z-Achse in Richtung des Dipolmoments d, haben wir ϕ−1 = 1 d cos Θ . 4π²0 r2 (4.60) In der Unabhängigkeit dieses Potentials vom Azimutwinkel Φ zeigt sich die zylindrische Symmetrie des Dipols. Das zugehörige elektrische Feld hat die Komponenten Er = − ∂ϕ ∂r = EΘ = − 1r ∂ϕ ∂Θ 1 − r sin Θ 2d cos Θ 1 4π²0 r3 = 2d cos Θ 1 4π²0 r3 ∂ϕ ∂Φ Änderung des Potentials bei Variation von r mit Φ, Θ = const = Änderung des Potentials bei Variation von rΘ mit r, Φ = const Änderung des Potentials bei Variation von r sin Θϕ mit r, Θ = const (4.61) Hier zeigt sich die erwähnte Zylindersymmetrie im Verschwinden der Azimutalkomponente Eϕ . In der Abbildung 4.12 sind einige Linien konstanten Dipolpotentials in der y − z-Ebene aufgezeichnet. EΦ = =0 = = Abbildung 4.12 Ähnlich wie eine sphärische Ladungswolke hinsichtlich ihres Feldes außerhalb ihrer selbst durch eine Punktladung idealisiert werden kann, hat der mathema” tische Dipol“, den ich gleich konstruieren will, ein Feld, das durch (4.60) bzw. (4.61) exakt wiedergegeben wird. Denken wir uns zwei entgegengesetzt gleiche Punktladungen ±Q im Abstand a. Das Dipolmoment dieser Anordnung hat offenbar den Betrag 4.7 Monopole, Dipole, Multipole d = Qa . 89 (4.62) Wegen der elektrischen Neutralität hat das zugehörige Potential keinen 1/rAnteil, wohl aber Anteile ∼ 1/r n mit n = 2, 3, . . . . Der mathematische Dipol, dessen Potential ausschließlich den 1/r 2 -Term enthält, entsteht im Grenzfall ¾ Q→∞ bei aQ = d = const . (4.63) a→0 Das Glied ϕ(2) (~x) der Multipolentwicklung heißt Quadrupolpotential und lautet Z 3(~x · ~x 0 )2 − r2 r02 1 d3 x0 ρ(~x 0 ) . (4.64) ϕ(2) (~x) = 4π²0 2r5 Es fällt für große r wie 1/r 3 ab. Offenbar lässt es sich schreiben als ϕ(2) (~x) = wobei die Koeffizienten Qij = Qij = 3 1 1 X xi xj Qij , 4π²0 2 i,j=1 r5 Qxx Qxy Qxz Qyx Qyy Qyz = Qji Qzx Qzy Qzz Z d3 x0 (3x0i x0j − δij r02 )ρ(~x) (4.65) (4.66) den symmetrischen Tensor des Quadrupolmoments bilden. Für wichtige Spezialfälle nehmen das Quadrupolmoment Qij und das Quadrupolpotential (4.64) einfache Form an. Wir betrachten insbesondere den Fall von Ladungsverteilungen mit Rotationssymmetrie. Die Symmetrieachse kann als z-Achse gewählt werden. Dann verschwinden alle in (4.64) vorkommenden Integrale, die einen in x0 oder y 0 linearen Integranden haben, z. B. Z Z 3 0 0 0 0 d x ρ(~x ) x z = d3 x0 ρ(~x0 ) x0 y 0 = 0 . (4.67) Ebenfalls wegen der Rotationssymmetrie gilt Z Z 3 0 0 02 d x ρ(~x ) x = d3 x0 ρ(~x0 ) y 02 . (4.68) Es folgt, dass (4.64) sich schreiben lässt als ϕ(2) (~x) = 1 2z 2 − x2 − y 2 (2) Q 4π²0 4r5 mit dem Quadrupolmoment“ ” Z Q(2) = d3 x0 ρ(~x0 ) (2z 02 − x02 − y 02 ) . (4.69) (4.70) Besonders schön sieht das Potential (4.69) für einen rotationssymmetrischen Quadrupol in Polarkoordinaten aus, nämlich 90 4 Statische wirbelfreie Felder 1 Q(2) (3 cos2 Θ − 1) . (4.71) 4π²0 4r3 Wir können leicht eine Ladungsverteilung angeben, die sowohl elektrisch neutral ist als auch kein Dipolmoment aufweist, deren Multipolentwicklung also mit dem Quadrupolglied (4.69) beginnt. Wir haben einfach zwei einander entgegengerichtete Dipole d~ und −d~ im Abstand a kollinear zu legen (s. Abbildung 4.13). ϕ2 (~x) = } Abbildung 4.13 Jeden dieser Dipole denken wir uns punktförmig gemäß ~ = lim bQ . |d| (4.72) b→0 Q→∞ Die zugehörige Ladungsverteilung lautet ρ(~x) = Qδ(x) δ(y) [δ(z) − δ(z − b) − δ(z − b − a) + δ(z − 2b − a)] . Ihr sehen wir sofort an, dass die Gesamtladung und das Dipolmoment bezüglich des Koordinatenursprungs verschwinden. Wegen der Rotationssymmetrie ist das Quadrupolmoment durch den einen Parameter Q(2) Z dx Z dy Z = 2 = 4(b2 + ab)Q . dz z 2 ρ(~x) (4.73) festgelegt. Im Grenzübergang (4.72) entsteht Q(2) = 4ad . (4.74) In diesem Grenzfall beginnt die Entwicklung des Potentials mit dem Quadrupolterm (4.71). Um ein reines Quadrupolfeld zu haben, idealisieren wir weiter gemäß a → 0 und d → ∞ bei ad = const. 4.8 Die Form der Erde Von lokalen Erhebungen wie dem Kahlen Asten oder dem Mt. Everest und Absenkungen wie der oberrheinischen Tiefebene und Death Valley abgesehen 4.8 Die Form der Erde 91 hat die Erde die Form eines an den Polen abgeplatteten Rotationsellipsoids. Der polare Radius c ist um etwa 21,5 km kleiner als der äquatoriale Radius a, die relative Abplattung also 1 a−c = . (4.75) a 300 Infolge der Abplattung ist das Gravitationspotential der Erde nicht exakt gleich dem Keplerpotential. Bezüglich des Erdschwerpunktes verschwindet das Dipolmoment. Also ist der wichtigste Korrekturterm der Quadrupolterm. Nehmen wir die Nord-Süd-Achse als z-Achse, so lautet das Gravitationspotential in großer Entfernung von der Erde ²= GQ(2) GM − (3 cos2 Θ − 1) . (4.76) r 4r3 Für das Quadrupolmoment Q(2) der Erde finden wir leicht eine Abschätzung, wenn wir annehmen, dass die Masse M homogen über das Rotationsellipsoid verteilt ist (tatsächlich nimmt die Dichte zum Mittelpunkt hin zu). Die Dichte ρ lässt sich dann durch die Masse M und das Volumen 4πa2 c/3 des Rotationsellipsoids ausdrücken, ϕ(~x) = − ρ= M . 4πa2 c/3 Zur Berechnung des Integrals (4.69), Z Q(2) = ρ d3 x(2z 2 − x2 − y 2 ) , (4.77) (4.78) über das Erdvolumen mit der Oberfläche x2 y2 z2 + 2 + 2 =1 2 a a c dehnen wir die Integrationsvariablen gemäß x = ξa , y = ηa , z = cζ , woraufhin das Quadrupolmoment (4.78) die Form Z Z Z 3M dξ dη dζ (2c2 ζ 2 − a2 ξ 2 − a2 η 2 ) dQ(2) = 4π annimmt und die Erdoberfläche durch die Gleichung ξ2 + η2 + ζ 2 = 1 (4.79) (4.80) (4.81) (4.82) beschrieben wird. Bezüglich der Koordinaten ξ, η, ζ sieht die Erdoberfläche also wie eine Einheitskugel aus. Aus Symmetriegründen sind die Raumintegrale von ζ 2 , η 2 , ξ 2 über das Volumen der Einheitskugel gleich, so dass sich (4.81) vereinfacht zu Z 3M 2 (c − a2 ) dξdηdζ ζ 2 . Q(2) = 2π Das verbleibende Integral rechnen wir am bequemsten in Kugelkoordinaten aus R und finden d3 xx2 = 4π/15, also 92 4 Statische wirbelfreie Felder 2 4 M (a2 − c2 ) ≈ − M a2 ² . (4.83) 5 5 Tatsächlich muss das Quadrupolmoment kleiner sein, da die Dichte der Erde nach innen zunimmt und somit Volumenelemente mit größerem Abstand vom Mittelpunkt weniger als in (4.83) beitragen. Die Erde ist abgeplattet, weil sie rotiert. In Äquatornähe wirkt auf Volumenelemente des Erdmantels eine größere Zentrifugalkraft als in Polnähe. Über erdgeschichtlich lange Zeiträume musste und muss die Erdoberfläche sich so einstellen, dass Volumenelemente des Erdmantels in guter Näherung kräftefrei sind bezüglich Gravitationskraft, Zentrifugalkraft und Druckkraft seitens benachbarter Volumenelemente. Ein solcher Zustand wird durch plastische Formänderungen erreicht. Tun wir so, als wäre die Erde aus einer extrem viskosen Flüssigkeit gebildet ∗) . Im beschriebenen Gleichgewichtszustand muss die Erdoberfläche eine Äquipotentialfläche darstellen. Ansonsten würde sich die Gestalt der Erde dadurch ändern, dass die Flüssigkeit zu Gebieten niedrigeren Potentials fließt. Vernachlässigen wir die Ortsabhängigkeit der Druckkraft, d. h. der elastischen Energie von Volumenelementen nahe der Erdoberfläche, so setzt sich das Potential zusammen aus dem Gravitationspotential (4.76) und dem Potential der Zentrifugalkraft Q(2) = ϕzentr (~x) = = 1 2 2 ω (x + y 2 ) 2 1 − ω 2 r2 sin2 Θ . 2 − (4.84) (Dieses Potential gibt gerade die Zentrifugalkraft auf ein Volumenelement bei ~x mit Masse m, F~zentr = −∇ϕm = (mω 2 x, mω 2 y, 0) = − m~ ω × (~ ω × ~x).) Insgesamt lautet das Potential also GM GM a2 ² 1 2 2 2 ω r sin Θ − + (3 cos2 Θ − 1) . (4.85) 2 r 5r3 Setzen wir das Potential am Nordpol Θ = 0 gleich dem Potential am Äquator Θ = π/2, so finden wir eine Bestimmungsgleichung für die relative Abplattung ², ϕ=− GM 2GM a2 ² 1 GM GM a2 ² + = − ω 2 a2 − − . 3 c 5c 2 a 5a2 Beachten wir, dass ² ¿ 1 und daher − (4.86) 1 1 a 1 1 = = (1 − ²)−1 ≈ (1 + ²) . (4.87) c a c a a Wenn wir schließlich auch in (4.86) Glieder der Ordnung ²2 vernachlässigen, so finden wir die lineare Gleichung − ∗) Für GM GM 2GM 1 GM GM a − ²+ ² = − ω 2 a2 − − ². a a 5a 2 a 5a (4.88) die Frühgeschichte des Planeten vor der Erstarrung der Erdkruste ist die Annahme sicherlich vernünftig. Bis auf die Effekte der Erosion und der Plattentektonik sollte sich die Form der Erde seither nicht verändert haben. 4.9 Die Energie eines Haufens von Ladungen 93 Die Lösung, ²= 1 5 ω 2 a3 ≈ , 4 GM 230 stimmt bis auf 30% mit der beobachteten Abplattung überein. 4.9 Die Energie eines Haufens von Ladungen Die Energie eines Haufens von Ladungen wird berechnet, indem wir die den Haufen aufbauenden Teilladungen qi alle nacheinander aus dem Unendlichen (wo die wechselseitige potenzielle Energie verschwindet) in ihre Positionen ~x i im Haufen gebracht denken. Die erste Teilladung qi nach ~x1 zu bringen, kostet keine Energie, da alle anderen Ladungen noch im Unendlichen (d. h. nirgends) sitzen. Die zweite, q 2 , nach ~x2 zu bringen, kostet, da q2 im durch q1 erzeugten Feld eine Kraft erfährt, Energie, u. z. q2 ϕ1 (~x2 ) = 1 q1 q2 . 4π²0 |~x1 − ~x2 | (4.89) Beim Heranholen von q3 nach ~x3 ins von q1 und q2 erzeugte Feld vergrößert sich die Energie um ( ) 1 q3 q2 q3 q1 q3 ϕ1 (~x3 ) + q3 ϕ2 (~x3 ) = + . (4.90) 4π²0 |~x3 − ~x1 | |~x3 − ~x2 | Wird schließlich die n-te und letzte Teilladung in ihre Position ~xn geholt, so erhöht sich die gesamte Wechselwirkungsenergie um die Energie der n-ten Teilladung im Feld der n − 1 anderen, also um qn X ϕi (~xn ) = i<n X qi 1 qn |. 4π²0 |~ x − ~xi n i<n (4.91) Die gesamte Wechselwirkungsenergie, die Summe aller aufgelisteten Beiträge, lautet W+ n 1 X X qj qi 1 1X qi qj = . 4π²0 j=1 i<j |~xj − ~xi | 4π²0 2 |~xi − ~xj | (4.92) i6=j Beachten Sie, dass per Konstruktion die Wechselwirkungsenergie keine dia” gonalen“ Glieder mit i = j enthält. Eine Definition von W , die solche Glieder mit einschlösse, wäre höchst unglücklich, denn die Energie einer Punktladung im eigenen Feld, die Selbstenergie“ einer Punktladung, divergiert und hat keinen ” Sinn. Für den Fall einer kontinuierlichen Ladungsverteilung verwenden wir die diskrete Formel (4.92), in der wir qi mit ρ(~x)d3 x und qj mit ρ(~x0 )d3 x0 identifizieren und integrieren 1 1 W = 4π²0 2 Z 3 d x Z d3 x 0 ρ(~x)ρ(~x0 ) . |~x − ~x0 | (4.93) 94 4 Statische wirbelfreie Felder Allerdings unterscheidet sich (4.92) von (4.93) insofern wesentlich, als in (4.93) Beiträge von ~x = ~x0 nicht ausgeschlossen sind, so dass (4.93) auch Selbstenergiebeiträge enthält. Dennoch ist W gemäß (4.93) für kontinuierliche Ladungsverteilung ρ(~x) wohl definiert. Divergente Selbstenergien treten nur bei diskreten Punktladungen auf. (Woran sich zeigt, dass der Begriff der Punktladung, da in manchen Zusammenhängen zu Unsinn führend, eine mit Vorsicht zu behandelnde Idealisierung ist.) Berechnen wir, um ein Beispiel vor Augen zu haben, die Energie eines homogenen kugelförmigen Ladungshaufens, in dessen Innerem die Ladungsdichte Q Q = V R3 p(~x) = (4.94) 4π 3 vorliegt. Aus (4.93) finden wir µ 1 1 W = 4π²0 2 Q V ¶2 Z 3 d x Z d3 x 0 1 . |~x − ~x0 | (4.95) Führen wir zuerst die Integration über ~x0 aus und stellen ~x0 in Kugelkoordinaten dar. Dabei können wir die vorläufig feste Richtung von ~x als die z 0 -Richtung wählen und erhalten W = µ 1 1 4π²0 2 sin Θ 0 Z2π Q V ¶2 Z dΦ0 √ 0 | {z } r2 ZR 3 d x 0 02 dr r + dΘ0 0 0 r02 Zπ 1 − 2rr 0 cos Θ0 2π = = 1 π 4π²0 1 2π 4π²0 µ Q V µ ¶2 Z Q V ¶2 Z d3 x ZR dr0 r02 −1 0 3 d x ( Z+1 dξ p 1 r2 | 1 r | Zr dr r + 1 2 r 2 r0 = 0 02 0 + r02 − 2rr 0 ξ {z } ( 2 {z R2 − 16 ZR r r2 0 0 dr r ) . für r > r0 für r > r0 (4.96) } Nun führen wir das zweite Raumintegral aus und erhalten mit W = 1 3 Q2 4π²0 5 R (4.97) ein Ergebnis, das wir bis auf den numerischen Faktor 3/5 aus einer Dimensionsbetrachtung ohne Rechnung hätten gewinnen können. 4.10 Die Energie eines Ladungshaufens in einem äußeren Feld 95 Die Energie (4.93) eines Ladungshaufens lässt sich auch durch die von den Ladungen erzeugte Feldstärke ausdrücken. Wir gewinnen einen solchen Ausdruck, indem wir (4.93) in der Form Z 1 W = d3 xρ(~x)ϕ(~x) (4.98) 2 schreiben und die Ladungsdichte mit Hilfe der Poissongleichung −ρ(~x)/² 0 = +∆ϕ(~x) eliminieren, Z ²0 W =− d3 xϕ(~x) div grad ϕ(~x) . (4.99) 2 Hierin benutzen wir die Identität div(ϕ grad ϕ) = (grad ϕ) · (grad ϕ) + ϕ div grad ϕ , (4.100) und erhalten W = ²0 2 Z d3 x|E(~x)|2 + ²0 2 Z ~ . d3 x div(ϕE) (4.101) Der zweite Term kann mit Hilfe des Gaußschen Integralsatzes in ein Oberflächenintegral über eine im Unendlichen liegende Kugelfläche verwandelt werden und verschwindet, falls der Ladungshaufen endliche Ausdehnung hat. Be~ achten wir nur, dass für große Entfernung |~x| = r vom Ladungshaufen das Feld E 2 mindestens wie 1/r und das Potential ϕ mindestens wie 1/r abfallen, während das Oberflächenelement auf einer Kugel sich wie |df~| = r 2 sin ΘdΘdΩ verhält. Demnach lautet der gesuchte Ausdruck für die Energie des Ladungshaufens Z ²0 ~ x)|2 . d3 x|E(~ (4.102) W = 2 Das gefundene Resultat legt die Interpretation nahe, dass überall im elektrostatischen Feld Energie mit einer Raumdichte w(~x) = ²0 ~ |E(~x)|2 . 2 (4.103) konzentriert ist. 4.10 Die Energie eines Ladungshaufens in einem äußeren Feld Die Energie eines Ladungshaufens in einem äußeren Feld lautet, da eine Ladung q im Potential ϕ(~x) die potenzielle Energie qϕ(~x) hat, Z W = d3 xρ(~x) ϕ(~x) . (4.104) Wir studieren diese Energie genauer für den Fall, dass das äußere Potential ϕ(~x) über den Ladungshaufen hinweg nur schwach veränderlich ist. Dann lässt sich ϕ(~x) in eine Taylorreihe um einen im Ladungshaufen gelegenen Nullpunkt herum entwickeln 96 4 Statische wirbelfreie Felder ϕ(~x) = ϕ(0) + 3 X i=1 = xi 3 ∂ϕ(0) 1 X ∂ 2 ϕ(0) + xi xj + ... ∂xi 2 i,j=1 ∂xi ∂xj 3 ∂Ej (0) 1 X ~ xi xj + ... ϕ(0) − ~x · E(0) − 2 i,j=1 ∂ xi (4.105) Im dritten Term dürfen wir, da das äußere Feld innerhalb des Ladungshaufens P ∂E (0) ~ keine Quellen hat, also ∇· E(0) = 0 gilt, ungestraft den Term ij 61 r2 δij ∂xj i abziehen und schreiben ∂Ej (0) 1 X ~ + ... (3xi xj − δij r2 ) ϕ(~x) = ϕ(0) − ~x · E(0) − 6 ij ∂xi (4.106) Setzen wir diese Reihe in (4.104) ein, so finden wir die Energie des Ladungshaufens im äußeren Feld ausgedrückt durch die Multipolmomente 1X ∂Ej (0) ~ W = Qϕ(0) − d~ · E(0) − . Qij 6 ij ∂xi (4.107) Sehen Sie, dass Parallelstellung eines Dipols zum äußeren Feld energetisch begünstigt ist gegen alle anderen Orientierungen? Dass das Quadrupolmoment mit dem Feldgradienten wechselwirkt? Im Labor lernen Sie, diese Eigenschaften zur Messung von Dipol- und Quadrupolmomenten auszunutzen. Kapitel 5 Statische Magnetfelder 5.1 ~ x) Das magnetische (Induktions-)Feld B(~ ~ x) ist definierbar und messbar durch die Das magnetische (Induktions-) Feld B(~ Kraft, die eine mit Geschwindigkeit ~v bewegte Ladung q erfährt, ~ + ~v × B) ~ . F~ = q(E (5.1) ~ dt . dq = ρ(~x) ~v (~x) · df (5.2) ρ(~x) ~v (~x) = ~j(~x) (5.3) ~ wir schon beDas ist die wohlbekannte Lorentzkraft, deren Coulombanteil q E sprochen hatten. Aus der Experimentalphysik ist Ihnen ebenfalls bekannt, dass stromdurchflossene Leiter im Magnetfeld eine Kraft erfahren. Überzeugen wir uns davon nochmal mit Hilfe von (5.1). Dazu zunächst eine Vorüberlegung. Betrachten wir einen Ladungshaufen mit der Ladungsdichte ρ(~x), dessen Ladungselemente mit der stationären Geschwindigkeit ~v (~x) durch den Raum driften. Dann strömt ~ im Zeitintervall dt die Ladung durch ein Flächenelement df Die hier auftretende Größe heißt elektrische Stromdichte und ist ein Vektorfeld, das wir hier vorläufig als zeitunabhängig annehmen. Der elektrische Strom I, der durch eine beliebige Fläche F , z. B. durch den Querschnitt eines Drahtes fließt, ist einfach der Fluss der Stromdichte ~j durch F , also Z ~ · ~j(~x) . (5.4) I = df F Das ist die elektrische Ladung, die sekündlich durch F strömt. Zurück zur Lorentzkraft! Da wir uns hier nur für den magnetischen Anteil ~ sei gleich Null. Die Kraft auf eine Ladung qi interessieren, nehmen wir an, E ~ ~ ist Fi = qi~vi × B(~xi ). Haben wir einen Haufen vieler bewegter Punktladungen, so erhalten wir die Gesamtkraft auf alle Punktladungen als 97 98 5 Statische Magnetfelder F~ = X i ~ xi ) , qi~vi × B(~ bzw. für ausgeschmierte Haufen, Z Z 3 ~ ~ ~ x) . F = d xρ(~x)~v (~x) × B(~x) = d3 x~j(~x) × B(~ (5.5) (5.6) Schauen wir insbesondere ein Stück eines dünnen stromdurchflossenen Drahtes mit dem Querschnitt df und der Länge dl an. Wir können das Längenelement ~ ernennen, wenn wir als Richtung die des Drahtstücks nehmen dl zum Vektor dl (Abbildung 5.1). Abbildung 5.1 Insgesamt sei der Querschnitt so klein, dass ~j(~x) darin konstant ist. Dann gilt ~ = I dl ~ , ~j(~x)d3 x = |~j(~x)| df dl wobei I der durch den Draht fließende Strom ist. Für die Kraft auf das Drahtstück haben wir ~ × B(~ ~ x) . dF~ (~x) = I dl (5.7) Die Gesamtkraft auf ein endliches Drahtstück erhalten wir hieraus durch Superposition der Kräfte auf kleine Teilstücke, Z ~ × B(~ ~ x)I . F~ = dl (5.8) Es gilt in der Natur ein Erhaltungssatz für elektrische Ladungen: Die Gesamtladung eines abgeschlossenen Systems bleibt zeitlich konstant. Ladungen gehen nie verloren und werden nie erzeugt. (Dieser Erhaltungssatz steht keineswegs im Widerspruch, vielmehr in schöner Übereinstimmung zu Paarerzeugungsprozessen, bei denen ein γ-Quant mit E > 1MeV in ein ElektronPositronpaar zerfällt: Das γ-Quant ist neutral, das Elektron-Positronpaar auch). Der Ladungserhaltungssatz besagt für unseren Draht, dass der Strom I durch den Querschnitt unabhängig von ~x ist. Die Ladung, die vorne“ durch die ” Querschnittsfläche df in ein Drahtstück pro Sekunde hineinfließt, muss, da Stationarität angenommen, pro Sekunde hinten“ wieder herausfließen. Demnach ” haben wir für die Kraft auf einen dünnen, vom Strom I durchflossenen Draht den Ihnen bekannten Ausdruck 5.2 Das Magnetfeld eines geraden stromdurchflossenen Drahtes F~ = I 5.2 Z ~ × B(~ ~ x) . dl 99 (5.9) Das Magnetfeld eines geraden stromdurchflossenen Drahtes Das Magnetfeld eines geraden stromdurchflossenen Drahtes ist Ihnen ebenfalls ~ hat keine Komponente parallel zum Draht und auch keine wohlbekannt. B radial vom Abbildung 5.2 ~ fällt umgekehrt Draht weg gerichtete (vgl. Abbildung 5.2)). Der Betrag von B proportional zum Abstand vom Draht ab und ist proportional zum Strom I. ~ Führen wir Zylinderkoordinaten ~x = (z, r, ϕ) ein, so lautet B Bz = 0 , Br = 0 , Bϕ = Bϕ (r) = 2I 1 . 2 4π²0 c r (5.10) ~ geschlossene Gemäß einer anschaulichen Redeweise sind die Feldlinien von B Kreise in Ebenen senkrecht zum Draht (also Ebenen z = const) mit Mittelpunkt im Draht. Das eben in Erinnerung gerufene Feld des geraden stromdurchflossenen Drahtes ist für die Beschreibung des magnetostatischen Feldes ein ähnlich bequemer ~ = (1/4π²0 )q~x/r 3 für die BeschreiAusgangspunkt wie das Coulombgesetz E bung des elektrostatischen Feldes. Wir werden lernen, (5.10) zu lesen als: Das statische Magnetfeld hat keine Quellen und hat als Wirbel elektrische Ströme. 5.3 Wirbel ~ x) entlang einer geDie Wirbelstärke alias Zirkulation eines Vektorfeldes B(~ schlossenen Kurve K wird gegeben durch das Linienintegral 100 5 Statische Magnetfelder I K ~ =Z . ~ x) · dl B(~ (5.11) ~ und der Im allgemeinen ist die Zirkulation Z eine Eigenschaft des Feldes B Kurve K. Wenn allerdings Z = 0 für beliebige Kurven K, so kann geschlossen ~ x) keine Wirbel hat. werden, dass das Feld B(~ ~ x) des geraden stromdurchflossenen DrahBetrachten wir das Magnetfeld B(~ tes und berechnen Z für einen Kreis in einer Ebene z = const mit Mittelpunkt ~ parallel zu B ~ = rdϕ, wenn r ~ und |dl| im Draht. Überall längs des Weges ist dl der Radius von K ist und ϕ der Azimutwinkel. Also folgt Z2π Z2π Z = dϕ rBϕ (r) = dϕ r 0 0 1 1 2I = I . 2 4π²0 c r ²0 c2 (5.12) ~ längs des betrachteten Kreises ist also zum Strom I proDie Wirbelstärke von B portional. Dieses Ergebnis wird erst wirklich interessant durch die Feststellung, dass es unabhängig vom Weg K ist, vorausgesetzt, K umschlingt den Draht genau ein Mal. Um letztere Feststellung als richtig zu erweisen, beobachten wir zunächst, dass Z unabhängig vom Radius r des Kreises und der Lage der Ebene z = const ist. Sodann denken wir uns in dieser Ebene den Kreis beliebig deformiert, z. B. so wie in Abbildung (5.3) gezeigt. Abbildung 5.3 Die Teilstückzerlegung des Weges denken wir uns so, dass jedes Wegelement ~ vom Durchstoßpunkt des Drahtes durch die Ebene aus gesehen unter dem dl gleichen Winkelstück dϕ erscheint. Dann ergeben alle Winkelstücke dϕ den gleichen Beitrag zu Z, nämlich rdϕ(1/4π²0 c2 )(2l/r). Das gilt auch für solche ~ (nämlich 3, 5, 7, ..., jedenfalls Winkelstücke, zu denen mehrere Wegstücke dl ungeradzahlig viele) gehören, denn in solchen Fällen alternieren die Beiträge der ~ im Vorzeichen und heben sich nach außen aufeinander folgenden Wegstücke dl bis auf einen paarweise auf. Die Summe aller Beiträge von allen Winkelelementen ist wieder die in (5.12) gegebene Zirkulation. 5.3 Wirbel 101 Schließlich lassen wir noch Deformationen des Weges K in z-Richtung zu. Solche Deformationen können aber den Wert von Z nicht ändern, da ~ keinen Beitrag zum Skalarprodukt dl ~ ·B ~ ϕ Bϕ ~ = (dl) z-Komponenten von dl geben. ~ Mit gleicher Argumentation können wir zeigen, dass die Zirkulation von B um mehrere stromdurchflossene Drähte, wobei jeder vom geschlossenen Weg K genau einmal umschlossen wird, gleich der Summe aller Ströme Ii ist. Dabei sind natürlich die Vorzeichen der Ii als verschieden anzusehen, wenn die respektiven Drähte in verschiedener Richtung von Strom durchflossen werden Z X ~ x) = 1 Z = d~x · B(~ Ii , (5.13) ²0 c2 i K Die hier rechts stehende Summe aller Ströme, die von der geschlossenen Kurve K umschlungen werden, lässt sich auch schreiben als Fluss des Stromdichtefeldes ~j(~x) durch irgendeine offene, von K berandete Fläche F (vgl. Abbildung 5.4), Z X ~ · ~j(~x) . Ii = df (5.14) i F Abbildung 5.4 Da der Strom durch einen Draht (durch die Querschnittsfläche des Drahtes) überall längs des Drahtes gleich ist (Ladungserhaltung und Stationarität), gilt (5.14) für alle von K berandeten offenen Flächen F . ~ längs der geschlosWir schließen, dass die Zirkulation des Magnetfeldes B senen Kurve K proportional zu dem Fluss der elektrischen Stromdichte durch irgendeine von K berandete Fläche F ist, I Z 1 ~ ~ · ~j(~x) . ~ dl · B(~x) = df (5.15) ²0 c2 K F 102 5 Statische Magnetfelder 5.4 Lokale Wirbel ~ längs einer geschlossenen Kurve K gibt erst dann eine Die Wirbelstärke von B eindeutige Auskunft über das Magnetfeld, wenn wir die Kurve K zu einem beliebig kleinen Ring schrumpfen lassen. Bleibt K in engster Nachbarschaft eines Punktes ~x, so wird die Wirbelstärke längs K durch die Stromdichte ~j(~k) am Ort ~x charakterisiert sein. Überlegen wir uns, welche differenziellen Eigenschaften ~ am Ort ~x durch die Stromdichte ~j(~x) festgelegt werden. des Magnetfeldes B Betrachten wir einen Weg K längs eines kleinen Rechtecks. Ohne Beschränkung der Allgemeinheit wählen wir das Koordinatensystem so, dass das Rechteck in einer Ebene z = const liegt (Abbildung 5.5): Abbildung 5.5 ~ längs K lautet Die Zirkulation von B Z = x+∆x Z dξ [Bx (ξ, y, z) − Bx (ξ, y + ∆y, z)] x + y+∆y Z y dη [By (x + ∆x, η, z) − By (x, η, z)] . (5.16) Es seien die Kantenlängen ∆x und ∆y so klein, dass die Taylorreihen Bx (ξ, y + ∆y, z) ∂Bx (ξ, y, z) ∆y + . . . ∂y = Bx (ξ, y, z) + = ∂By (x, η, z) By (x, η, z) + ∆x + . . . ∂x (5.17) By (x + ∆x, η, z) nach den Gliedern erster Ordnung abgebrochen werden können. Dann vereinfacht sich Z zu 5.4 Lokale Wirbel Z = −∆y x+∆x Z ∂Bx (ξ, y, z) dξ + ∆x ∂y x y+∆y Z dη ∂By (x, η, z) , ∂x 103 (5.18) y woraus wir sehen, dass im Grenzfall beliebig kleiner Kantenlängen ∆x, ∆y die Zirkulation von der Ordnung des Produktes ∆x ∆y ist. Unter Vernachlässigung von Gliedern höherer Ordnung können wir (5.18) weiter verschönern zu ¶ µ ∂By (~x) ∂Bx (~x) − . (5.19) Z = ∆x∆y ∂x ∂y In der Klammer steht, was wir künftig die z-Komponente der lokalen Wir~ nennen werden, belstärke oder Rotation von B ~ z= (rotB) ∂By ∂Bx − . ∂x ∂y (5.20) ~ und der Der gesuchte Zusammenhang zwischen der lokalen Wirbelstärke von B Stromdichte ~j ergibt sich, indem wir die Proportionalität der Zirkulation (5.19) mit dem Fluss der elektrischen Stromdichte ~j(~x) durch das Flächenelement beachten. Letzterer Fluss ist, da die Normale des Flächenelements in z-Richtung weist, ∆x∆y jz (~x). Wir haben also ~ z= (rotB) 1 jz . ²0 c2 (5.21) Betrachten wir Flächenstückchen, die in Ebenen y = const bzw. x = const liegen, so erhalten wir durch simple Wiederholung der zu (5.21) führenden Überlegung zwei weitere Gleichungen, die sich von (5.21) nur durch die Ersetzung des Vektorindex z durch y bzw. x unterscheiden. Insgesamt haben wir ~ das als Zusammenhang zwischen der Stromdichte und der Wirbelstärke von B vektorielle Gesetz ~ = rotB 1 ~ j. ²0 c2 (5.22) ~ eines Als Nebenprodukt unserer Überlegungen haben wir die Rotation rot B ~ gewonnen, Vektorfeldes B ~ x (rotB) = ∂By ∂Bz − . ∂y ∂z ~ y (rotB) = ∂Bx ∂Bz − . ∂z ∂x ~ z (rotB) = ∂Bx ∂By − . ∂x ∂y Wir werden manchmal die Schreibweise ~ =∇ ~ ×B ~ rotB (5.23) 104 5 Statische Magnetfelder benutzen, die offenbar sinnvoll ist, denn die vektorielle Multiplikation des Vek” ~ = (∂/∂x, ∂/∂y, ∂/∂z) mit dem Vektor B ~ gibt gerade einen Vektor tors“ ∇ mit den in (5.23) angegebenen Komponenten. Als weiteres Nebenprodukt ernten wir den Stokes’schen Integralsatz der Vek~ längs eines endlichen Weges toranalysis, wenn wir nochmal die Zirkulation von B K und den Fluss der elektrischen Stromdichte durch irgendeine von K berandete offene Fläche F betrachten. Denken wir uns die Fläche F zerlegt in kleine ~ längs K ist gleich Stückchen dFi mit Berandungen Ki . Die Zirkulation von B der Summe der Zirkulationen längs der Ki , da die Wegintegrale längs der inneren Kanten sich paarweise aufheben (s. Abbildung 5.6). Abbildung 5.6 Für jede Teilfläche dFi gilt dann I Zi = Ki ~ = dF~i rotB ~ · dl ~ B und für die Summe, im Grenzfall beliebig feiner Unterteilung, I Z ~ = ~ · rotB ~ · dl ~ . B df K (5.24) (5.25) F ~ längs einer geschlossenen Kurve K ist gleich Die Zirkulation eines Vektorfeldes B ~ dem Fluss der Rotation von B durch irgendeine von K berandete Fläche. 5.5 Magnetische Monopole Magnetische Monopole sind bisher nie zweifelsfrei beobachtet worden. Obwohl die Suche weitergeht und ein abschließendes Urteil nicht möglich ist, bleibt die Erfahrungstatsache, dass magnetische Felder keine Quellen haben, vorläufig unerschüttert. Dem magnetostatischen Feld des stromdurchflossenen Drahtes sehen wir die Quellenfreiheit sofort an: alle Feldlinien sind in sich geschlossene Kreise. Wir schließen 5.6 Die Feldgleichungen ~ x) = 0 . divB(~ 105 (5.26) Sollten eines Tages doch Teilchen mit magnetischer Ladung gefunden werden, so wäre die Theorie des elektromagnetischen Feldes an dieser Stelle abzuändern. 5.6 Die Feldgleichungen Die Feldgleichungen des magnetostatischen Feldes sind die oben gewonnenen ~ Aussagen über Quellen und Wirbel von B, ~ =0 divB ~ = rotB 1 ~ j. ²0 c2 (5.27) (5.28) Hierin sind die Stationarität der Stromverteilung ~j und des von ihr erzeugten ~ enthalten und ebenso der Erhaltungssatz für die elektrische Ladung. Feldes B Nehmen wir, um die Ladungserhaltung zu verifizieren, die Divergenz der in ~ = ∇ · (∇ × B) ~ = 0 folgt die (5.28) gleichgesetzten Vektoren. Wegen div rotB Quellenfreiheit der Stromdichte, div ~j = 0 . (5.29) Tatsächlich ist klar, dass ~j am Ort ~x nur dann eine Quelle haben kann, wenn sich dort die elektrische Ladungsdichte ρ zeitlich ändert, was wir mit der Annahme der Stationarität hier ausgeschlossen haben. Bei vorgegebener Stromverteilung ~j(~x) stellen (5.27) und (5.28) inhomogene Differentialgleichungen für die drei Komponenten Bi (~x) dar, die, zusammen mit ~ eindeutig festlegen. Zur Lösung dieser geeigneten Randbedingungen, das Feld B Differentialgleichungen ist es bequem, das Magnetfeld als die Wirbelstärke eines anderen Vektorfeldes, des so genannten Vektorpotentials, darzustellen, ~ x) = rotA(~ ~ x) . B(~ (5.30) ~ schon eingearbeitet, denn für Diese Darstellung hat die Quellenfreiheit von B ~ ~ beliebiges A gilt div rot A = 0. ~ durch das Vektorpotential A ~ in (5.30) eindeutig Während das Magnetfeld B festgelegt ist, gilt nicht das Umgekehrte! Überzeugen wir uns davon, dass wir ~ den Gradienten eines beliebigen skalaren Feldes hinzufügen können, d. h. von A ~ wählen dürfen statt A ~ 0=A ~ + gradf (~x) , A (5.31) ~ ändert. Der Grund ist einfach, dass ein Gradientenfeld wirohne dass sich B belfrei ist, rot gradf (~x) = 0 . (5.32) ~ 0 = rotA ~=B ~ . rotA (5.33) Es gilt also 106 5 Statische Magnetfelder Ähnlich war’s in der Elektrostatik. Dort durften wir zum elektrostatischen Potential ϕ eine beliebige Konstante hinzufügen, ohne dass sich das elektrische Feld änderte. Die willkürliche additive Konstante in ϕ hatten wir aus Bequemlichkeit meist so festgelegt, dass ϕ(~x → ∞) = 0 ~ indem wir die Eichbedingung (CouHier benützen wir den Spielraum in A, lombeichung) ~=0 divA (5.34) fordern. Die Bequemlichkeit dieser Wahl wird weiter unten sichtbar werden. Die ~ 0 (~x) mit Quellen, Bedingung (5.34) ist immer erfüllbar, denn haben wir ein A so finden wir mit der Eichtransformation“ (5.31) ein skalares Feld f (~x), dessen ” ~ 0 aufhebt und A ~ =A ~ 0 + grad f quellenfrei macht. Gradient die Quellen von A Die Bestimmungsgleichung für f lautet 0 = divA~0 + div gradf . (5.35) Wir erkennen in (5.35) sofort die Poissonsche Differentialgleichung wieder, die wir in der Elektrostatik gelöst haben. Eine Lösung lautet bekanntlich 1 4π f (~x) = Z d3 x 0 ~ 0 (~x 0 ) divA . |~x − ~x 0 | (5.36) ~ durch Angabe des Magnetfeldes B ~ und der Im übrigen ist das Vektorpotential A Eichbedingung (5.34) immer noch nicht eindeutig bestimmt, denn wir können noch Randbedingungen stellen. ~ betrachten wir den Fall eines räumlich Zur Gewöhnung an den Umgang mit A homogenen magnetischen Feldes ~ x) = (0, 0, Bz ) B(~ (5.37) mit Bz = B = const. Das Vektorpotential bestimmen wir aus Bx = 0 = By = 0 = Bz = B = ∂Az ∂y ∂Bz ∂z ∂Ay ∂x − − − ∂Ay ∂z ∂Az ∂x ∂Ax ∂y (5.38) . Mögliche Lösungen sind u. a. (0, xB, 0) (−yB, 0, 0) ¡ 1 ¢ − 2 yB, 12 xB, 0 . Alle genannten Lösungen sind auch quellenfrei. Andere lassen sich leicht finden. Die hier angegebenen haben die schöne Eigenschaft, dass die Komponenten Ai lineare Funktionen der Koordinaten xi sind. Bestimmen wir nun das Vektorpotential aus einer vorgegebenen Stromver~ = rotA ~ und die Wirbel rotB ~ = 1 2 ~j, teilung. Verwenden wir die Definition B ²0 c so haben wir 5.6 Die Feldgleichungen ~= rot rotA 1 ~ j. ²0 c2 107 (5.40) Die kompakte Schreibweise darf uns nicht darüber hinwegtäuschen, dass (5.40) drei gekoppelte Differentialgleichungen für die drei Komponenten von A darstellen. Eine erhebliche Vereinfachung dieser Gleichungen wird erreicht, wenn wir die Eichbedingungen (5.34) und die Vektoridentität ~ = grad divA ~ − ∆A ~ rot rotA (5.41) verwenden. Aus (5.40) entstehen dann drei entkoppelte Gleichungen für die ~ Komponenten von A ~=− ∆A 1 ~ j. ²0 c2 (5.42) Jede der drei Gleichungen (5.42) hat die Form der Poissonschen Differentialgleichung, deren Lösung wir aus der Elektrostatik kennen. Eine Lösung ist ~ x) = A(~ 1 4π²0 c2 Z d3 x 0 ~j(~x 0 ) . |~x − ~x 0 | (5.43) Sie gehorcht der Randbedingung ~ x → ∞) = 0 . A(~ (5.44) Wenn andere Randbedingungen zu befriedigen sind, müssen zu (5.43) noch ge~ = 0 addiert werden. eignete Lösungen der homogenen Gleichung ∆A Nachdem wir in (5.43) das Vektorpotential einer beliebigen Stromverteilung bestimmt haben, können wir durch bloßes Differenzieren auch das zugehörige ~ ausrechnen, Magnetfeld B ~ B ~ x) B(~ Z ~j(~x 0 ) 1 3 0 d x = rot 4π²0 c2 |~x − ~x 0 | Z 1 1 = d3 x0~j(~x 0 ) × grad~x 4π²0 c2 |~x − ~x 0 | Z ~x − ~x 0 1 3 0~ 0 d x j(~ x ) × . = 4π²0 c2 |~x − ~x 0 |3 (5.45) (5.46) Dies ist das Biot-Savartsche-Gesetz, von dem wir den Spezialfall eines geraden Leiters schon oben behandelt hatten. Von Interesse ist auch der Fall eines beliebig gekrümmten Drahtes mit sehr dünnem Querschnitt df , bei dem gilt ~ = I dl ~ . ~j(~x 0 )d3 x0 = |~j(~x 0 )| df dl (5.47) Dabei muss wegen div~j = 0 der Strom I längs des Drahtes überall konstant sein und das Magnetfeld lautet I 0 1 ~ × ~x − ~x ~ dl . (5.48) B(~x) = 4π²0 c2 |~x − ~x 0 |3 108 5 Statische Magnetfelder wobei das Linienintegral längs des geschlossenen Stromkreises im Draht zu berechnen ist. Warum geschlossen? Wegen Ladungserhaltung und Stationarität gilt div ~j = 0, also müssen die Stromlinien von ~j und somit der Draht in sich geschlossen sein. 5.7 Das Fernfeld stationärer Ströme Das Fernfeld stationärer Ströme erhalten wir aus dem Vektorpotential (5.43) mit Hilfe der Taylorentwicklung von |~x − ~x 0 |−1 nach Potenzen von ~x 0 /|~x|. Das Vorgehen ist ganz analog zur Konstruktion der Multipolentwicklung des elektrostatischen Potentials (vgl. Abbildung 5.7). Abbildung 5.7 Wir erhalten, mit r = |~x|, ~ x) = A(~ 1 1 2 4π²0 c r Z µ 2 ¶¸ · a ~x · ~x 0 + 0 d3 x0~j(~x 0 ) 1 + . 2 r r2 (5.49) Der erste Term verschwindet wegen div ~j = 0 für eine Stromverteilung endlicher Ausdehnung. Wir sehen das unter Verwendung der Identität X i ∂ (ji xk ) = jk + xk div ~j = jk . ∂xi (5.50) Integration über den ganzen Raum gibt mit Hilfe des Gaußschen Satzes, wenn ~j(~x)r 3 → 0 für |~x| = r → ∞, Z d3 x~j(~x) = 0 . (5.51) Physikalisch hängt die Abwesenheit eines Gliedes 0-ter Ordnung in a/r in der ~ natürlich damit zusammen, dass die Grundgleichung Multipolentwicklung für A ~ div B = 0 die Existenz magnetischer Monopole verbietet. Erinnern wir uns, dass 5.7 Das Fernfeld stationärer Ströme 109 das Glied 0-ter Ordnung in (a/r) in der Multipolentwicklung des elektrostatischen Potentials gerade der Coulombterm, d. h. das elektrische Monopolglied war. Das erste nicht notwendig verschwindende Glied in der Multipolentwicklung (5.49) ist das Vektorpotential eines magnetischen Dipols, Z 1 1 ~ (1) (~x) = A d3 x0~j(~x 0 )(~x 0 · ~x) . (5.52) 4π²0 c2 r3 Um es in etwas freundlicherer Form aufzuschreiben, definieren wir das magnetische Dipolmoment der Stromverteilung als Z 1 d3 x0 ~x 0 × ~j(~x 0 ) . (5.53) m ~ = 2 Mit Hilfe von m ~ finden wir nach einfacher Umformung ~ A (1) (~x) = − 1 ~x ×m ~ . 2 4π²0 c r3 (5.54) Die zu (5.54) führende Zwischenrechnung benutzt zunächst eine zu (5.50) ähnliche Identität, X i ∂ (ji xk xi ) = xk xi div ~j + jk xl + jl xk = jk xi + jl xk . ∂xi (5.55) Durch Integrieren über den ganzen Raum erhalten wir, falls ~j(~x)r 4 → 0 für |~x| = r → ∞, die Antisymmetrie der ersten Momente der Stromverteilung Z Z d3 x xl jk (~x) = − d3 x xk jl (~x) . (5.56) Nach Ausmultiplizieren des Vektorprodukts in (5.54), A(1) x) x (~ = = 1 1 (ymz − zmy ) 4π²0 c2 r3 ½ Z 1 1 − y d3 x0 [x0 jy (~x 0 ) − y 0 jx (~x 0 )] 8π²0 c2 r3 ¾ Z −z d3 x0 [z 0 jx (~x 0 ) − x0 jz (~x 0 )] , − verwenden wir die Antisymmetrie (5.56) und erhalten A(1) x (x) 1 1 =− 4π²0 c2 r3 µ Z ¶ Z 3 0 0 0 3 0 0 0 y d x y jx (~x ) + z d x z jx (~x ) . Dazu R darf rechts, wieder wegen der Antisymmetrie (5.56) ungestraft x d3 x0 x0 jx (~x 0 ) zugefügt werden, woraufhin (5.52) entsteht. Aus (5.54) folgt, dass die Feldlinien des Vektorpotentials, das von einem magnetischen Dipol erzeugt wird, in Kreisen um die Dipolachse verlaufen (vgl. 110 5 Statische Magnetfelder Abbildung 5.8 Abbildung 5.8). ~ = rot A ~ zu Das magnetische Feld erhalten wir aus B ~ =− B 1 grad 4π²0 c2 µ m ~ · ~x r3 ¶ . (5.57) Die zu (5.57) führende Rechnung ist leicht: · ´ ´¸ ∂Az ∂Ay ∂ ³z 1 y x ∂ ³x Bx = − = my − 3 mx + mx − 3 mz . − ∂y ∂z 4π²0 c2 ∂y r3 r ∂z r3 r Hier verwenden wir 1 Bx = 4π²0 c2 · ∂ ∂x 1 r =− x r3 und schreiben ∂2 1 ∂2 1 my + mz − mx ∂x ∂y r ∂x ∂z r Beachten wir noch ∆ 1 ∂ Bx = 4π²0 c2 ∂x = µ 1 r µ ∂2 ∂2 + ∂y 2 ∂z 2 ¶ 1 r ¸ . = 0 für r 6= 0, so erhalten wir ∂ ∂ ∂ mx + my + mz ∂x ∂y ∂z ¶ 1 1 ∂ =− r 4π²0 c2 ∂x µ m ~ · ~x r3 ¶ , und das ist (5.57). Nun erinnern wir uns an das elektrische Feld eines elektrischen Dipols, ~ = − 1 grad E 4π²0 à ~x · d~ r3 ! (5.58) und freuen uns darüber, dass die Felder des elektrischen und des magnetischen Dipols dieselbe Struktur haben. 5.8 Magnetisches Moment und Drehimpuls 5.8 111 Magnetisches Moment und Drehimpuls Für eine Stromdichte, die von einem Haufen geladener punktförmiger Teilchen getragen wird, gilt X ~j(~x) = qν ~vν δ(~x − ~xν ) . (5.59) ν Dabei nummeriert der Index ν die Teilchen. Das magnetische Moment der Stromverteilung lautet Z X1 1 m ~ = d3 x~x × ~j(~x) = qν ~xν × ~vν . (5.60) 2 2 ν Tragen die Teilchen die Masse Mν , so hat das ν-te Teilchen den Drehimpuls ~ ν = Mν ~xν × ~vν , L (5.61) so dass wir das magnetische Moment (5.60) auch durch die Drehimpulse der Teilchen ausdrücken können, X qν ~ν . L (5.62) m ~ = 2Mν ν Unsere besondere Aufmerksamkeit verdient der Spezialfall, in dem die Teilchen alle identisch (qν = q, Mν = M ) sind, denn dann ist das magnetische Moment proportional zum Gesamtdrehimpuls X ~ = ~ν , L L (5.63) ν nämlich q ~ L. (5.64) 2M Dieses Resultat der klassischen Physik wird uns später auch in der Quan~ der so genannte Bahndrehimpuls ist. tenmechanik wieder begegnen, wobei L Für das den Elektronenspin begleitende magnetische Moment gilt, wie Ihnen schon aus der Elementarphysik bekannt ist, der Zusammenhang (5.64) nicht. ~ als der Drehimpuls des Spins genommen wird, Vielmehr tritt rechts, wenn L der Faktor m ~ = g = 2, 00232 (5.65) hinzu. Wir kommen hierauf in 16. zurück. 5.9 ~ x) Kraft und Drehmoment eines Feldes B(~ auf einen magnetischen Dipol ~ x) erfährt, Die Kraft, die eine Stromverteilung ~j(~x) im eingeprägten Feld B(~ kennen wir schon als Z ~ ~ x) . F = d3 x~j(~x) × B(~ (5.66) 112 5 Statische Magnetfelder ~ sich über die Stromverteilung hinweg nur wenig ändert, Wenn das äußere Feld B lässt sich die Kraft (5.66) durch das magnetische Moment der Verteilung ausdrücken als ~ , F~ = grad(m ~ · B) (5.67) ~ am Ort des magnetischen Moments bzw. am Schwerpunkt der Stromwobei B verteilung zu denken ist. Die Kraft F~ verschwindet nur dann nicht, wenn das magnetische Feld räumlich inhomogen ist und insbesondere am Ort des Moments nichtverschwindende erste Ableitungen hat. Die Kraft wirkt in diejenige ~ parallel zu m Richtung, in der die Komponente von B ~ am stärksten wächst. Die von allgemeinem Ausdruck (5.66) für die Lorentzkraft zu (5.67) führende Rechnung geht aus von der Taylorreihe für die Komponenten Bi des Magnetfeldes um den Mittelpunkt der Stromverteilung, der auch als Ursprung des Koordinatensystems gewählt wird. Bi (~x) = Bi (0) + X ∂Bi (0) xj + . . . . ∂xj j (5.68) Das Glied 0-ter Ordnung in (5.68) gibt keinen Beitrag zur Kraft in (5.66), da das Raumintegral über ~j(~x) verschwindet, s. (5.51). Das Glied erster Ordnung liefert ¸ Z Z 3 · X ∂Bz (0) ∂By (0) 3 3 Fx = d xxi jy (~x) − d xxi jz (~x) . ∂xi ∂xi i=1 Unter Benutzung der Antisymmetrie (5.56) der ersten Momente der Stromverteilung können wir dies umschreiben in die Form ∂Bz Fx = ∂x Z ∂By d xxjy + ∂x 3 Z 3 d xzjx − µ ∂Bz ∂By + ∂z ∂y ¶Z d3 xyjz . Die hier vorkommenden Momente der Stromverteilung sind gerade die Komponenten des magnetischen Dipolmoments, z. B. Z Z 1 mx = d3 x(yjz − zjy ) = d3 x y jz . 2 Beachten wir ´ die Quellenfreiheit des Magnetfeldes, ³ schließlich ∂By ∂Bx ∂Bz = − + ∂x ∂y ∂z , so entsteht genau das Resultat (5.67). ~ auf den Dipol das Ganz analog lässt sich zeigen, dass das äußere Feld B Drehmoment ~ =m ~ M ~ ×B ausübt. äußeren stellung anderen (5.69) Dieses Moment verschwindet bei Parallelstellung des Moments zum Feld. Sie kennen die zu (5.69) äquivalente Aussage, dass die Paralleldes Moments zum äußeren Feld energetisch begünstigt ist gegenüber Orientierungen (s. a. 4.107). Kapitel 6 Das elektromagnetische Feld 6.1 Faradays Induktionsexperiment Beim Spielen mit Stromkreisen und Magneten überzeugt man sich leicht von der Richtigkeit der folgenden von Faraday gewonnenen Feststellung. In einem Stromkreis wird ein zeitlich vorübergehender Strom induziert, wenn a) in einem benachbarten Stromkreis ein Strom ein- oder ausgeschaltet wird, b) ein benachbarter Kreis, in dem ein konstanter Strom aufrechterhalten wird, relativ zum ersten Kreis bewegt wird, c) in der Nähe des Kreises ein Permanentmagnet bewegt wird. Faraday interpretierte diese seine Beobachtung mit Hilfe der Flussregel, die oft auch R Faradays Induktionsgesetz genannt wird. Wenn sich der magnetische ~ ·B ~ durch eine vom Stromkreis aufgespannte Fläche F zeitlich ändert, Fluss F df ~ induziert. Die Flussregel verknüpft so wird im Stromkreis ein elektrisches Feld E H ~ des induzierten ~ · dl den magnetischen Fluss durch F mit dem Linienintegral E elektrischen Feldes längs des Stromkreises, Z I ∂ ~ ·B ~ ~ . ~ df (6.1) dl · E = − ∂t H ~ E ~ die Zirkulation von E ~ längs des StromWir nennen das Linienintegral dl· kreises oder Ringspannung oder manchmal elektromotorische Kraft. Letzterer Name macht besonders sinnfällig, dass als Folge der Induktion im Stromkreis ein Strom in Gang gesetzt wird. Sie wissen sicher aus der Experimentalphysik, dass auf der Flussregel (6.1) die Wirkungsweise von Elektromotoren, Transformatoren, Generatoren, Ampèremeter etc. beruht. Nicht gegenwärtig ist Ihnen vielleicht, dass die Faradaysche Flussregel eines der merkwürdigsten Gesetze der Physik überhaupt ist. In ihr kommen nämlich zwei unabhängige Sachverhalte zu gleich lautendem Ausdruck. Der Fluss des Magnetfeldes durch die vom Stromkreis aufgespannte Fläche kann auf zwei völlig verschiedene Weisen zeitlich geändert werden: 113 114 6 Das elektromagnetische Feld ~ den Ort oder die Gestalt 1. Einmal, indem man im zeitunabhängigen Feld B des Kreises variiert. In diesem Fall ist die Flussregel, wie gleich gezeigt wird, eine Folge der Lorentzkraft auf bewegte Ladungen. 2. Zum anderen, indem man bei räumlich fixiertem und starrem Kreis die ~ zeitlich ändert. In diesem Fall werden wir die magnetische Feldstärke B ~ Flussregel erkennen als die Aussage, dass bei zeitlicher Änderung von B Wirbel des elektrischen Feldes entstehen. Zur Diskussion des Falles (1) betrachten wir einen ebenen Stromkreis, der aus einem starren U -förmigen Leiterstück und einem Querstück besteht Abbildung (6.1). Letzteres liege senkrecht auf den Schenkeln des U und werde mit gleichförmiger Geschwindigkeit v auf den Schenkeln des U bewegt. Senkrecht ~ Der magnetizur Ebene dieses Stromkreises liege ein homogenes Magnetfeld B. sche Fluss durch den Kreis ist BaL(t), seine zeitlich Änderungsrate Bav. Gemäß H ~ = − vBa ~ · dl der Flussregel wird also im Kreis die elektromotorische Kraft E induziert. Dieses Resultate erhalten wir, indem wir die Lorentzkraft auf die ~ Ladungsträger im Kreis betrachten. Die Kraft auf die Einheitsladung ist ~v × B. Die Ladungen im U sind unbewegt, erfahren also keine Kraft. Die Ladungen im Querbalken bewegen sich mit diesem also mit der Geschwindigkeit v, und erfahren daher pro Ladungseinheit die Kraft vB in RichtungRdes Querbalkens. ~ hat den ~ · dl, Das Linienintegral dieser Kraft, die elektromotorische Kraft E Betrag vBa,Rwas genau der von der Flussregel angegebene Wert ist. Das Vor~ ergibt sich auch richtig, wenn die Richtung aller beteiligten ~ · dl zeichen von E Vektoren in Rechnung gestellt wird. Somit haben wir die Flussregel für den Fall (1) als Konsequenz der Lorentzkraft auf bewegte Ladungen im Magnetfeld verstanden. Abbildung 6.1 ~ lautet die FlussIm Fall (2), bei starrem Leiter im zeitlich variablen Feld B, regel I Z Z ∂ ~ ~ ~ · ∂ B ~ ~ ~ , E · dl = − df × B = − df (6.2) ∂t ∂t F F denn bei starrem Kreis kann die Zeitableitung unter das Integral gezogen werden. Mit Hilfe des Stokesschen Satzes der Vektoranalysis können wir die Zir- 6.2 Der Maxwellsche Verschiebungsstrom 115 ~ längs des Kreises als Fluss von rot E ~ durch eine beliebige vom kulation von E Kreis berandete Fläche schreiben. Dann lautet die Flussregel Z Z ~ ~ · ∂ B ~ . ~ (6.3) df · rot E = − df ∂t r F Da die Fläche F beliebig ist, muss auch gelten ~ . ~ =− ∂ B (6.4) rot E ∂t Diese lokale Formulierung der Flussregel, die von Maxwell stammt, nimmt keinen Bezug mehr auf den Stromkreis. Sie besagt, dass die zeitliche Änderungsrate ~ lokale Wirbel des elektrischen Feldes E ~ erzeugt. des magnetischen Feldes B ∂ ~ Bei statischen Verhältnissen verschwindet natürlich ∂t B, und die Maxwell’sche Gleichung (6.4) reduziert sich auf die Feststellung, dass das elektrostatische Feld wirbelfrei ist. 6.2 Der Maxwellsche Verschiebungsstrom Einen wichtigen Beitrag Maxwells zur Theorie der elektromagnetischen Felder, die lokale Formulierung der Flussregel, haben wir eben kennengelernt. Hier wird ein zweiter Beitrag besprochen. Maxwell betrachtete das Grundgesetz der Magnetostatik, welches die Zirku~ längs einer Kurve K mit dem elektrischen Strom durch eine von lation von B K berandete Fläche F verknüpft, schrieb es in lokaler Form auf, ~ = rot B 1 ~ j ²0 c2 (6.5) und wunderte sich. Aus (6.5) folgt doch zwingend, dass die elektrische Strom~ gilt identisch div rot B ~ = 0. Das dichte quellenfrei ist, denn bei beliebigem B aber heißt, dass aus dem durch eine beliebige Fläche F umschlossenen Volumen R H ~ · ~j. In der Tat, keine Ladung herausfließen kann, wegen d3 x div ~j = df stationäre Verhältnisse können nur herrschen, wenn durch F pro Zeiteinheit genauso viel Ladung hinein- wie herausfließt. In zeitabhängigen Situationen ist die Erfahrungstatsache der Ladungserhaltung allgemeiner zu formulieren. Der Nettostrom durch eine beliebige geschlossene Fläche F muss gleich der zeitlichen Änderungsrate der Ladung im von F umschlossenen Volumen V sein Z I ~ · ~j = − d d3 xρ . (6.6) df dt F V Mit Hilfe des Gaußschen Satzes der Vektoranalysis kann der Ladungserhaltungssatz (6.6) als µ ¶ Z ∂ d3 x div~j + ρ =0 (6.7) ∂t V geschrieben werden. Er muss dann auch lokal gelten, da das Volumen V beliebig ist, 116 6 Das elektromagnetische Feld ∂ div~j + ρ=0. ∂t (6.8) ~ = 1 2 ~j verallgemeinerungsbedürftig ist, Maxwell sah, dass das Gesetz rotB ²0 c wenn zeitabhängige Ladungs- und Stromverteilungen zu beschreiben sind. Hier ist die von Maxwell vorgeschlagene Verallgemeinerung, die sich aufs Schönste bewährt hat, ~ =− rot B 1 ∂ ~ 1 ~ j+ 2 E. 2 ²0 c c ∂t (6.9) ~ wird die zeitliche Änderungsrate des elekAls Beitrag zur Wirbelstärke von B trischen Feldes postuliert. Wir sehen sofort, dass die Maxwellsche Gleichung (6.9) den bekannten statischen Grenzfall enthält. Um zu sehen, dass auch der lokale Ladungserhaltungssatz (6.8) befriedigt ist, nehmen wir die Quellstärke beider Seiten in (6.9), ~ =0= div rot B 1 ∂ 1 ~ . div ~j + 2 div E ²0 c2 c ∂t (6.10) Dies ist genau dann der Erhaltungssatz (6.8), wenn wie schon in der Elektrostatik die elektrischen Ladungen als Quellen des elektrischen Feldes auftreten, ~ = ρ/²0 . div E (6.11) Den Maxwellschen Zusatzterm zum Strom in (6.9) bezeichnen wir als den Maxwellschen Verschiebungsstrom. 6.3 Die Maxwellschen Gleichungen Die Maxwellschen Gleichungen für beliebig orts- und zeitabhängige Situationen haben wir inzwischen alle kennengelernt. Fassen wir sie noch einmal zusammen. Die Quellen des elektrischen Feldes sind Ladungen, ~ = ρ/²0 . div E (6.12) Die Wirbel des elektrischen Feldes sind nach der Flussregel durch die zeitliche Änderungsrate des Magnetfeldes gegeben, ~ =− ∂ B ~ . rot E ∂t Das magnetische Feld hat keine Quellen, ~ =0. div B (6.13) (6.14) Die Summe aus elektrischem Strom und Verschiebungsstrom gibt die Wirbel des magnetischen Feldes ~ = rot B 1 ∂ ~ 1 ~ j+ 2 E. ²0 c2 c ∂t (6.15) Die Feldgleichungen (6.12 bis 6.15) implizieren die lokale Ladungserhaltung, 6.4 Der Energieerhaltungssatz 117 ∂ ρ=0. (6.16) div~j + ∂t Sie implizieren nicht, sondern sind zu ergänzen durch einen Ausdruck für die Kraft, die eine Punktladung im Feld erfährt, die Lorentzkraft ~ + ~v × B) ~ . F~ = q(E (6.17) Die lokalen Maxwellschen Gleichungen (6.12 bis 6.15) verknüpfen die ersten ~ und B ~ an einem Raum-Zeit-Punkt. Als zu ihnen Ableitungen der Felder E äquivalent hatten wir integrale Aussagen über das Verhalten des elektromagnetischen Feldes in endlichen Raumbereichen erkannt, die wir im Folgenden auch nochmals zusammenstellen. Die Übersetzung zwischen den lokalen und den integralen Versionen der Maxwellschen Gleichungen erfolgt mit Hilfe des Gaußschen und des Stokesschen Satzes der Vektoranalysis. Der Fluss des elektrischen Feldes durch eine geschlossene Fläche ist gleich dem ²10 -fachen der umschlossenen Ladung Q, I ~ ·E ~ = Q/²0 . df (6.18) Die Zirkulation des elektrischen Feldes längs einer geschlossenen Kurve K ist gleich der negativen zeitlichen Änderungsrate des magnetischen Flusses durch eine beliebige von K berandete Fläche F , I Z ~ ·E ~ ·B ~ =− ∂ ~ . dl df (6.19) ∂t K F Der Fluss des magnetischen Feldes durch jede geschlossene Fläche verschwindet, I ~ ·B ~ =0. df (6.20) Die Zirkulation des magnetischen Feldes längs des Randes einer Fläche setzt sich aus dem elektrischen Strom und dem Verschiebungsstrom (der zeitlichen ~ durch die Fläche zusammen als Änderungsrate des Flusses von E) Z Z I ~ · ~j + 1 ∂ ~ ·E ~ ·B ~ . ~ = 1 df df (6.21) dl ²0 c2 c2 ∂t 6.4 Der Energieerhaltungssatz Die Erfahrungstatsache der Ladungserhaltung hatten wir lokal formuliert mit Hilfe der Begriffe Ladungsdichte und (Ladungs-)Stromdichte, ∂ ρ(~x, t) + div ~j(~x, t) = 0 . (6.22) ∂t Auch für die Energie gilt bekanntlich ein Erhaltungssatz. Bei naivem Vorgehen könnte man die Erwartung hegen, dass sich für das elektromagnetische Feld (wie schon für das elektrostatische Feld in (4.10) eine Energiedichte u(~x, t) ~ x, t), derart, dass ein definieren lässt und zusätzlich eine Energiestromdichte S(~ Erhaltungssatz gleicher Form wie der obige für die Ladung gilt. Wir überzeugen 118 6 Das elektromagnetische Feld uns jedoch leicht davon, dass sich der Energieinhalt des elektromagnetischen Feldes innerhalb eines kleinen Volumens d3 x nicht nur dadurch ändern kann, dass Energie durch die Oberfläche strömt; dass vielmehr das Feld die innerhalb des betrachteten Volumens vorhandenen Ladungen beschleunigen und somit Energie an die Materie abgeben kann. Letztere Arbeitsleistung muss selbstverständlich in die lokale Energiebilanz einbezogen werden. Die im Volumenelement d3 x pro Zeiteinheit an den Ladungen geleistete Arbeit finden wir mit Hilfe der Lorentzkraft ~ + ~v × B) ~ . F~ = d3 xρ(E (6.23) Im Zeitintervall dt ändern die Ladungen ihren Ort um das Wegstück ~dt~v , wobei die Kraft (6.23) die Arbeit ~ = dtd3 x~j · E ~ dtd3 xρ~v · E (6.24) verrichtet. Um diesen Betrag würde sich die Feldenergie ud3 x vermindern, selbst wenn kein Abströmen durch die Oberfläche des betrachteten Volumens ~ stattfände. Vernünftigerweise können wir demnach als lokale um dtd3 x div S Energiebilanz ein Gesetz der Form ∂ ~ = − ~j · E ~ u + div S ∂t (6.25) erwarten. Tatsächlich beinhalten die Maxwellschen Gleichungen einen Energieerhaltungssatz der Form (6.25), wobei als Energiedichte 1 ~ 2 + ² 0 c2 B ~ 2) (²0 E 2 und als Energiestromdichte das Vektorfeld u(~x, t) = ~ x, t) = ²0 c2 E ~ × B ~ S(~ (6.26) (6.27) fungieren. Die folgende kleine Rechnung dient dazu, die Aussagen (6.25, 6.26, 6.27) zu gewinnen. Multiplizieren wir beide Seiten der Maxwellschen Gleichung für die Wirbel des Magnetfeldes, ~ = rotB 1 ∂ ~ 1 ~ j + 2 E, ²0 c2 c ∂t (6.28) ~ und beide Seiten der Flussregel skalar mit dem elektrischen Feld E ~ =− rotE ∂ ~ B ∂t (6.29) ~ Subtraktion der entstehenden beiden Skalare gibt skalar mit B. ~ · rotB ~ − B ~ · rotE ~ = E 1 ~ ~ + ∂ 1 (²0 E ~ 2 + ² 0 c2 B ~ 2) . j · E 2 ²0 c ∂t 2 Benutzen wir auf der linken Seite von Gleichung (6.30) die Identität (6.30) 6.5 Die Wellengleichung für die Potentiale ~ × B) ~ =−E ~ · rotB ~ + B ~ · rotE ~ , div(E 119 (6.31) so entsteht aus (6.30) gerade der Energieerhaltungssatz (6.25) mit der Energiedichte gemäß (6.26) und der Energiestromdichte gemäß (6.27). ~ heißt auch Poynting-Vektor, denn J. H. Poynting Die Energiestromdichte S hat 1884 als erster den Energiesatz für elektromagnetische Feldenergie in lokaler ~ ohne Schaden für die Form aufgeschrieben. Beachten Sie übrigens, dass sich S ~ abändern lässt, da die Energiebilanz (6.25) um ein beliebiges Wirbelfeld rotV ~ = ² 0 c2 E ~ × P~ und S ~ 0=S ~ + rotV ~ dieselben Quellen haben. Felder S 6.5 Die Wellengleichung für die Potentiale Hinter der scheinbaren Kompliziertheit der Maxwellschen Gleichungen verbirgt sich eine verblüffende Einfachheit aller elektromagnetischen Phänomene. Um sie zu durchschauen, schlachten wir unsere Erfahrung mit den statischen Spezialfällen aus. Die Nichtexistenz magnetischer Monopole, divB = 0, haben wir schon früher ~ x, t) gemäß als durch den Ansatz eines Vektorpotentials A(~ ~ = rotA ~ B (6.32) zu befriedigen gelernt. Die nächsteinfache unter den Maxwellschen Gleichungen, da ebenfalls weder Ladungs- noch Stromdichte enthaltend, ist Faradays Fluss∂ ~ ~ ~ regel, ³ rotE = − ´ ∂t B. Sie lässt mit Hilfe des Ansatzes (6.32) für B schreiben als ∂ ~+ ~ = 0. Wir wissen schon, dass sich ein wirbelfreies Vektorfeld als rot E A ∂t Gradient eines skalaren Feldes darstellen lässt. Also können wir die Flussregel erfüllen durch den Ansatz eines skalaren Potentials ϕ(~x, t) gemäß ~ − grad ϕ . ~ =− ∂ A (6.33) E ∂t Mit den Ansätzen (6.32) und (6.33) gehen wir nun in die restlichen Maxwellschen Gleichungen ein. Aus dem Gesetz über die Quellen des elektrischen ~ = ρ/²0 , wird mit Hilfe von (6.33) Feldes, div E ∂ ~ = ρ/²0 div A (6.34) ∂t ~ = und aus dem Ampereschen Gesetz über die Wirbel des Magnetfeldes, rotB 1 ~ 1 ∂ ~ j + E, wird ² 0 c2 c2 ∂t −∆ϕ − 1 ~ 1 ∂2 ~ 1 ∂ j − 2 A − 2 grad ϕ 2 ²0 c c ∂t2 c ∂t bzw. mit der schon früher bewiesenen Identität rot rot = grad div − ∆ ~= rot rotA ¶ µ 1 ~ 1 ∂2 1 ∂2 ~ ~ ~ ϕ . A=− j + grad divA + 2 ∆A − 2 c ∂t2 ²0 c2 c ∂t (6.35) ~ und ϕ Die Bestimmungsgleichungen (6.34) und (6.35) für die Potentiale A ersetzen uns die Maxwellschen Gleichungen. Noch ist die angekündigte verblüffende Einfachheit der elektro-magnetischen Phänomene nicht sichtbar. 120 6 Das elektromagnetische Feld Erinnern wir uns daran, dass die Ansätze (6.32) und (6.33) die Potentiale ~ ~ ϕ zu neuen A und ϕ nicht eindeutig festlegen. In der Tat, wenn wir von A, 0 0 ~ Potentialen A , ϕ übergehen mit Hilfe einer Transformation ~ A 0 ϕ0 ~ + gradΛ = A = ϕ− ∂ Λ, ∂t (6.36) wobei das skalare Feld Λ ganz beliebig sein darf, so ändern sich die Felder ~ und B ~ gar nicht. Die Transformation (6.36) heißt Eichtransformation, die E ~ und B ~ unter Eichtransformationen heißt Eichinvarianz. Invarianz der Felder E ~ und ϕ, indem Wir nutzen die somit klar gestellte Freiheit in der Wahl von A wir fordern ~ + divA 1 ∂ ϕ=0. c2 ∂t (6.37) ~=0 In der Magnetostatik hatten wir die so genannte Coulombeichung divA verwendet. Das könnten wir hier zwar auch tun, jedoch ist die so genannte Lorentzeichung (6.37) bei zeitabhängigen Verhältnissen wesentlich bequemer. Die Bequemlichkeit besteht darin, dass mit Hilfe von (6.37) aus den Bestimmungsgleichungen (6.34) und (6.35) einfachere Gleichungen entstehen, nämlich ~ − ∆A 1 ∂2 ~ A c2 ∂t2 = − ∆ϕ − 1 ∂2 ϕ c2 ∂t2 = − ρ/²0 . 1 ~ j ²0 c2 (6.38) Welche verblüffende Einfachheit der elektromagnetischen Phänomene wird sichtbar? Bei vorgegebenen Ladungs- und Stromverteilungen gehorchen die vier ~ und ϕ ungekoppelten inhomogenen Wellengleichungen. BewegPotentiale A te Ladungen erzeugen elektromagnetische Wellen. Elektromagnetische Wellen breiten sich mit der Geschwindigkeit c aus, also mit Lichtgeschwindigkeit. Die eben formulierten Erkenntnisse sind uns in den Schoß gefallen, nachdem die Lorentzeichung (6.37) eingeführt war. Zur Absicherung sollte noch klar gemacht werden, dass die Lorentzeichung ohne Beschränkung der Allgemeinheit immer gewählt werden kann. Dies Ihnen zur Übung, wobei Ihnen unsere frühere Ausschlachtung der Eichinvarianz der Magnetostatik als Anleitung dienen kann. 6.6 Ebene elektromagnetische Wellen im freien Raum Um zu lernen, wie der schon anschaulich geschilderte Inhalt der Maxwellschen Gleichungen auch quantitativ erschlossen werden kann, betrachten wir zunächst Raumgebiete, die frei von Ladungen sind, so dass ρ = ji = 0. Dort gelten für die Potentiale die homogenen Wellengleichungen 6.6 Ebene elektromagnetische Wellen im freien Raum ¶ 1 ∂2 ~ A = 0 ∆ − 2 c ∂t2 µ ¶ 1 ∂2 ∆ − 2 ϕ = 0. c ∂t2 121 µ (6.39) ~ und B ~ selbst Durch bloßes Differenzieren finden wir, dass hier auch die Felder E Komponente für Komponente diesen Gleichungen gehorchen, µ µ 1 ∂2 ∆ − 2 c ∂t2 1 ∂2 ∆ − 2 c ∂t2 ¶ ¶ ~ E = 0 ~ B = 0. (6.40) Ganz offensichtlich können wir nach Lösungen suchen, die nicht von allen drei Raumkoordinaten x, y, und z, sondern nur von einer, etwa x, abhängen. Solche ~ ~ Felder E(x, t) und B(x, t) beschreiben eine ebene elektromagnetische Welle. Für sie lautet der Prototyp der Wellengleichung µ 1 ∂2 ∂2 − 2 2 ∂x c ∂t2 ¶ f (x, t) = 0 . (6.41) Um sie zu lösen, schreiben wir sie in der Form µ ∂ 1 ∂ − ∂x c ∂t ¶µ ∂ 1 ∂ + ∂x c ∂t ¶ f (x, t) = 0 (6.42) und führen statt x und t die neuen Veränderlichen ξ = x − ct, η = x + ct (6.43) ein. Die Wellengleichung lautet dann ∂2f =0. ∂ξ∂η (6.44) Jetzt drängt sich als allgemeine Lösung auf f (ξ, η) = f1 (ξ) + f2 (η) , (6.45) wobei f1 und f2 ganz beliebige (differenzierbare) Funktionen sind. In den physikalischen Koordinaten finden wir aus (6.45) f (x, t) = f1 (x − ct) + f2 (x + ct) . (6.46) Wir sehen, dass f1 und f2 entlang der x-Achse nach rechts bzw. nach links laufende Wellen darstellen. Die Potentiale für eine beliebige in die positive x-Richtung laufende ebene elektromagnetische Welle lauten 122 6 Das elektromagnetische Feld Ai (x, t) = ϕ(x, t) = Ai (x − ct) = ϕ(x − ct) = Ai (ξ) (6.47) ϕ(ξ) . Die vier Funktionen Ai , ϕ werden durch die Lorentzkonvention dem Zusammenhang ∂Ax 1 ∂ϕ ∂ ∂ 1 + 2 = Ax − ϕ=0. ∂x c ∂t ∂ξ ∂ξ c (6.48) unterworfen. Als ein Integral von (6.48) wählen wir Ax = 1 ϕ. c (6.49) ~ und B ~ in der betrachteten Welle durch DiffeNun finden wir die Felder E renzieren Ex (x − ct) = x − ∂A ∂t − Ey (x − ct) = − Ez (x − ct) ∂ϕ ∂x ∂Ay ∂t z − ∂A ∂t = = 0 = cA0y = cA0z , wobei Ableitungen nach ξ mit einem Strich bezeichnet sind. Auf ähnliche Weise ~ = rot A. ~ Insgesamt haben wir gewinnen wir das Magnetfeld mit Hilfe von B ~ E = c(0, A0y , A0z ) ~ B = (0, −A0z , A0y ) . (6.50) ~ und B ~ der ebenen elektromagnetischen Welle Wir lesen ab, dass die Felder E überall aufeinander orthogonal sind, ~ ·B ~ =0, E (6.51) und überdies beide senkrecht zur Ausbreitungsrichtung, hier der x-Richtung stehen. Daher heißen elektromagnetische Wellen im freien Raum auch transver~ B ~ und der sale Wellen. Besonders einprägsam wird die Dreibeinigkeit von E, Ausbreitungsrichtung durch die Kompaktfassung von (6.50) ~ B = ~ E = ~ + k̂ × A 0 ~ = − ck̂ × (k̂ × A ~0) , − ck̂ × B (6.52) wobei k̂ der Einheitsvektor in Ausbreitungsrichtung ist. Offenbar muss zur ~ und B ~ der ebenen Welle nur das Vektorpotential Bestimmung der Felder E ~ und B ~ in der bekannt sein. Schließlich ist aus (6.52) offensichtlich, dass E ebenen Welle bis auf den Faktor c gleiche Beträge haben, ~ = c|B| ~ . |E| (6.53) 6.7 Die retardierten Potentiale 123 ~ finden wir die nützlichen Für die Energiedichte u und die Energiestromdichte S Relationen u = ²0 ~ 2 ~ 2 ) = ²0 E 2 (E + c 2 B 2 ~ S ~ ×B ~ ² 0 c2 E = = ² 0 c2 B 2 = ²0 cE 2 k̂ = cuk̂ . (6.54) (6.55) Hieraus ist ersichtlich, dass der Energiestrom mit Lichtgeschwindigkeit fließt. Ein wichtiger Spezialfall ebener Wellen ist gegeben, wenn die Felder zeitlich periodisch und darüber hinaus monochromatisch sind. Solche monochromatischen ebenen Wellen werden wir hier in der Form ~ = Re[A ~ 0 e−iω(t−x/c) ] A (6.56) darstellen. Die Größe ω ist dabei die Kreisfrequenz der Welle. Die zugehörige Wellenlänge ist λ = 2πc/ω . (6.57) Wir werden ebene monochromatische Lichtwellen oft durch ihren Wellenvektor ω k̂ (6.58) c charakterisieren; dieser zeigt in die Ausbreitungsrichtung der Welle und gibt mit seinem Betrag die Frequenz. Mit Hilfe des Wellenvektors können wir (6.56) in einer vom Koordinatensystem unabhängigen Form schreiben k̂ = ~ = Re [A ~ 0 ei(~k~x−ωt) ] . A (6.59) Für den Fall der monochromatischen ebenen Wellen wird aus (6.52) ~ B ~ E ~ = Re (+i ~k × A) ¶ µ c2 ~ ~ k×B . = − ω (6.60) Die Energiedichte der betrachteten Welle ist im Mittel über eine zeitliche Periode ~ 6= 0), jedoch transportiert räumlich konstant. Zwar ist der Poynting-Vektor S die monochromatische Welle keine Energie von Ort zu Ort. Dies nachzuweisen, bleibt Ihnen als kleiner Spaß. 6.7 Die retardierten Potentiale Wir suchen nun das elektromagnetische Feld, das von vorgegebenen Ladungshaufen ρ(~x, t) und Stromverteilungen ~j(~x, t) abgestrahlt wird. Dazu haben wir ~ und ϕ die inhomogenen Wellengleichungen für die Potentiale A µ ∆− µ 1 ∂2 c2 ∂t2 1 ∂2 ∆− 2 c ∂t2 ¶ ¶ 1 ~ j ²0 c2 ~ A = − ϕ = − ρ/²0 (6.61) 124 6 Das elektromagnetische Feld zu lösen. Nach schon mehrfach bewährtem Muster versuchen wir, ein spezielles Integral der Gleichung für das skalare Potential ϕ zu konstruieren, indem wir zunächst das ladungserfüllte Volumen in kleine Stückchen d3 x einteilen, deren jedes die Punktladung“ ρ(~x, t)d3 x enthält; sodann suchen wir das von einer ” Punktladung erzeugte Potential und setzen schließlich das Potential des gesamten Ladungshaufens aus den Beiträgen der Stückchen additiv zusammen. Das Potential einer bei ~x = 0 sitzenden Punktladung finden wir aus µ ¶ 1 ∂2 1 ∆− 2 ϕ(~x, t) = − ρ(~x, t) d3 xδ (3) (~x) . (6.62) c ∂t2 ²0 Außerhalb des Ursprungs gilt überall δ (3) (~x) = 0, so dass die Wellengleichung (6.62) homogen wird, ¶ µ 1 ∂2 ϕ=0. (6.63) ∆− 2 c ∂t2 Das skalare Potential ϕ einer Punktladung sollte kugelsymmetrisch sein, also nur von r = |~x| abhängen. Auf Funktionen ϕ(r) wirkt der Laplaceoperator wie 2ϕ0 (r) 1 d2 ~x 0 rϕ(r) , ϕ (r) = + ϕ00 (r) = r r r dr2 so dass sich die Wellengleichung (6.63) vereinfacht zu µ 2 ¶ ∂ 1 ∂2 − rϕ(r, t) = 0 . ∂r2 c2 ∂t2 ∆ϕ(r) = div (6.64) Aus dem letzten ³ ´ Paragrafen wissen wir schon, dass die Gleichung ∂2 1 ∂2 ∂r 2 − c2 ∂t2 f (r, t) = 0 die allgemeine Lösung f (r, t) = f1 (r − ct) + f2 (r + ct) hat. Für das skalare Potential gilt also 1 1 f1 (r − ct) + f2 (r + ct) , (6.65) r r wobei f1 und f2 wieder ganz beliebige Funktionen sind. Der erste Term in (6.65) stellt eine vom Ursprung, also von der Punktladung nach außen laufende Kugelwelle dar, der zweite eine in den Ursprung einlaufende Kugelwelle. Die Abstrahlung von elektromagnetischen Wellen durch die Punktladung sollte allein durch die auslaufende Lösung beschreibbar sein. Daher versuchen wir, mit dem Ansatz f2 = 0 auszukommen. Um f1 (r − ct) festzulegen, schauen wir uns das Feld ϕ in unmittelbarer Umgebung des Ursprungs an. Beachten wir, dass ϕ(r, t) = f1 (r − ct)/r für r → 0 wie 1/r über alle Grenzen wächst, wenn f1 (−ct) nur existiert. Es folgt, dass die Ortsableitungen von ϕ bei Annäherung an den Ursprung schneller wachsen als die Zeitableitungen. In ∂ f1 , der Tat, für r → 0 gilt, mit f10 = ∂r ϕ(r, t) = ∂ϕ ∂ϕ ∼ f1 (−ct)/r 2 , ∼ f10 (ct)/r . (6.66) ∂r ∂t Für hinreichend kleine r können wir also in der Wellengleichung (6.62) die Zeitableitungen gegenüber den Ortsableitungen von ϕ vernachlässigen. Daraufhin wird die Wellengleichung zur Laplaceschen Differentialgleichung 6.7 Die retardierten Potentiale 125 ∆ϕ = − ²10 ρ(0, t)d3 xδ (3) (x). Daher muss die Lösung ϕ(r, t) der Wellengleichung für r → 0 in das aus der Statik bekannte Coulombpotential übergehen, ϕ(r, t) = 1 1 1 1 f1 (r − ct) → f1 (−ct) = ρ(0, t)d3 x . r r 4π²0 r (6.67) Damit aber ist die bisher unbekannte Funktion f1 (r − ct) festgelegt und wir haben als Potential der Punktladung ϕ(~x, t) = 1 1 ρ(0, t − r/c)d3 x . 4π²0 r (6.68) Sitzt die Punktladung nicht am Ursprung des Koordinatensystems sondern am Ort ~x0 , so lautet das Potential ϕ(x, t) = 1 1 ρ(~x 0 , t − |~x − ~x 0 |/c)d3 x0 4π²0 |~x − ~x 0 | (6.69) Durch Superposition erhalten wir das gesuchte Potential des Ladungshaufens zu Z ρ(~x 0 , t − |~x − ~x 0 |/c) 1 d3 x 0 . (6.70) ϕ(~x, t) = 4π²0 |~x − ~x 0 | Dies ist eine Partikularlösung der Wellengleichung für ϕ. Sie erfüllt die Randbedingung ϕ(~x, t) → 0 für |~x| → ∞ . (6.71) Wenn andere Randbedingungen erfüllt werden sollten, so ist zur Partikularlösung eine entsprechende Lösung der homogenen Wellengleichung hinzuzufügen. Wir werden uns mit derartigen Problemen hier nicht beschäftigen. Da die Wellengleichungen für die Komponenten Ai (~x, t) des Vektorpotentials die gleiche Form haben wie die eben gelöste Wellengleichung für das skalare Potential, finden wir ohne weitere Rechnung ~ x, t) = A(~ 1 4π²0 c2 Z d3 x 0 ~j(~x 0 , t − |~x − ~x 0 |/c) . |~x − ~x 0 | (6.72) Die Lösungen (6.70) und (6.72) heißen retardierte Potentiale. Retardiert, weil sich am Beobachtungsort ~x zur Zeit t die an anderen Orten ~x 0 befindlichen Ladungen nicht instantan bemerkbar machen. Vielmehr fungieren als Ursa” chen“ für Wirkungen“ am Ort ~x zur Zeit t die Ladungen bzw. Ströme am Ort ” ~x zur früheren Zeit t0 = t − |~x − ~x 0 |/c. Beachten wir, dass die Zeitspanne |~x − ~x 0 |/c gerade die Laufzeit eines mit Lichtgeschwindigkeit von ~x 0 nach ~x laufenden Signals ist. Wir sehen nochmals deutlich, dass elektromagnetische Wellen sich mit Lichtgeschwindigkeit fortpflanzen. Würdigen Sie das mit (6.70) und (6.72) Erreichte und die verblüffende Einfachheit der elektromagnetischen Phänomene! Für statische Ladungshaufen bzw. stationäre Stromverteilung reduzieren sich die retardierten Potentiale auf die aus der Elektro- bzw. Magnetostatik bekannten Lösungen. Das retardierte skalare Potential ϕ(~x, t) lässt sich charakterisieren als das mit Laufzeiteffekten dekorierte Coulombpotential. 126 6 Das elektromagnetische Feld 6.8 Elektrische Dipolstrahlung Betrachten wir einen Ladungs- und Stromhaufen und berechnen das von ihm erzeugte elektromagnetische Feld in großen Entfernungen, r = |~x| À a (Abbildung 6.2) Abbildung 6.2 Innerhalb eines kleinen Raumbereichs um einen weit vom Haufen entfernten Beobachtungspunkt herum wird das Feld die Form einer ebenen Welle annehmen. Daher muss sich, wie wir oben gesehen hatten, das elektromagnetische Feld dort allein aus dem Vektorpotential gewinnen lassen mit ∂ ~ 1 k̂ × A(~x, t) c ∂t ~ x, t) B(~ = − ~ x, t) E(~ = ~ x, t) , − ck̂ × B(~ (6.73) wobei ~k = ~x/r der Einheitsvektor in Ausbreitungsrichtung ist. Wir müssen also zur Bestimmung des Feldes nur das Integral ~ x, t) A(~ Z = 1 4π²0 c2 ≈ 1 1 2 4π²0 c r d3 x 0 Z ~j(~x 0 , t − |~x − ~x 0 |/c) |~x − ~x 0 | d3 x0 ~j(~x 0 , t − |~x − ~x 0 |/c) (6.74) auswerten. Hier ist schon unter dem Integral 1/|~x −~x 0 | durch 1/r approximiert, es sind also Korrekturen der relativen Ordnung a/r vernachlässigt. Es liegt nahe, das Zeitargument des Stromes ebenfalls so zu vereinfachen, d. h. t − |~x − ~x 0 |/c ≈ t − r/c (6.75) zu schreiben. Diese Näherung ist jedoch nicht mir a ¿ r zu rechtfertigen. Die Zeitabhängigkeit des Stroms muss durchaus nicht so langsam sein, dass ~j sich in der Zeitspanne 6.8 Elektrische Dipolstrahlung |~x − ~x 0 |/c − r/c 127 (6.76) nicht merklich ändert. Vielmehr muss, wenn ω eine für die zeitliche Änderung des Stromes typische Frequenz ist, der Maximalwert der Zeitspanne (6.76), a/c, vernachlässigbar klein sein gegenüber der typischen Periode, 1/ω. Äquivalent dazu ist die Bedingung a¿λ, (6.77) die verlangt, dass die Lineardimensionen des Senders klein sein müssen im Vergleich zur typischen Wellenlänge der Strahlung. Die beschriebene Näherung heißt elektrische Dipolnäherung“ und gibt für ” das Vektorpotential den sehr einfachen Ausdruck Z 1 1 ~ A(~x, t) = d3 x0 ~j(~x 0 , t − r/c) . (6.78) 4π²0 c2 r Wir können das verbleibende Integral durch das elektrische Dipolmoment des Ladungshaufens ausdrücken. Zu diesem Zweck wiederholen wir unter leichter Verallgemeinerung eine schon in der Magnetostatik gemachte Nebenrechnung (s. 5.7) Z d3 x P ∂ (ji xl ) = 0 ∂xi i Z Z 3 ~ = d x(xl div j + jl ) = d3 x(jl − xl ρ̇) und sehen, dass das Volumenintegral der Stromdichte über den Ladungshau~ ist. fen gleich der zeitlichen Änderungsrate des elektrischen Dipolmoments d(t) Somit wird aus dem Vektorpotential ~ x, t) = A(~ 1 1 ∂ ~ d(t − r/c) . 4π²0 c2 r ∂t (6.79) ~ und B ~ ergeben sich hieraus durch Differenzieren, Die Felder E 1 1 ~¨ − r/c) k̂ × d(t 4π²0 c2 cr ~ x, t) B(~ = − ~ x, t) E(~ = 1 1 ~¨ − r/c)] , k̂ × [k̂ × d(t 2 4π²0 c r (6.80) wobei die Zeitableitung mit einem Punkt bezeichnet ist. Beachtenswert an diesen Feldern ist, dass sie mit r → ∞ wie 1/r abfallen, langsamer also, als die statischen Felder. Der 1/r-Abfall garantiert, dass durch jede Kugel um den Dipol ein Energiefluss läuft, der unabhängig ist vom Radius r. Um das einzusehen, bedenken wir nur, dass die Kugeloberfläche wie r 2 wächst ~ = ² 0 c2 E ~ × B ~ wie 1/r 2 abfällt. und die Energiestromdichte S Schauen wir uns die Energiestromdichte genauer an. Da in der ebenen Welle ~ = |B| ~ gilt, haben wir |E| 128 6 Das elektromagnetische Feld ~ = k̂ S 1 1 ~¨ [d(t − r/c)]2 sin2 Θ , (4π)2 ²0 c3 r2 (6.81) wobei Θ der Winkel zwischen der Beobachtungsrichtung k̂ und dem Dipolmoment ist (s. Abbildung 6.3). Beachten Sie, dass die Abstrahlung von Energie rotationssymmetrisch um die Achse des Dipols erfolgt; ferner, dass in Richtung des Dipols gar nicht und quer zum Dipol maximal gestrahlt wird. Abbildung 6.3 ~ Die gesamte pro Sekunde abgestrahlte Energie erhalten wir als Fluss von S durch eine Kugel um den Dipol als Mittelpunkt. Da das Oberflächenelement ~ = k̂r2 sin ΘdΘdϕ überall parallel zur Ausbreitungsrichtung k̂ ist, erhalten df wir sofort I(t) = 2 ~¨ 1 [d(t − r/c)]2 . 4π²0 3c3 (6.82) Nicht alle Ladungshaufen können Dipolstrahlung aussenden. Wenn z. B. der Ladungshaufen aus Teilchen aufgebaut ist, die alle das gleiche Verhältnis von Ladung und Masse haben, so proportional zum OrtsPist das Dipolmoment P e vektor des Schwerpunktes d~ = eν ~xν = m m ~ x ν ν . Wenn nun auf den ν ν Ladungshaufen keine äußeren Kräfte wirken, so bewegt sich der Schwerpunkt mit konstanter Geschwindigkeit. Seine Beschleunigung und somit auch die zweite Zeitableitung des elektrischen Dipolmoments verschwinden dann. Derartige Systeme können zwar auch Energie abstrahlen, jedoch müssen wir, um ihr Strahlungsverhalten zu beschreiben, die Entwicklung von t−|~x −~x 0 |/c| nach Potenzen von a/c über die nullte Ordnung hinaustreiben. Es ergeben sich dann magnetische Dipolstrahlung, Quadrupolstrahlung etc. Kapitel 7 Elektromagnetische Felder in Materie 7.1 Polarisation und Magnetisierung Beim Eindringen in gasförmige, flüssige oder feste Materie tritt ein elektromagnetisches Feld mit allen das Medium aufbauenden geladenen Teilchen in Wechselwirkung. Falls im Spektrum des Feldes Wellenlängen bis hinab zu etwa 1 Å (entsprechend Röntgenstrahlung) vorhanden sind, müssen alle Atomkerne und Elektronen (d. h. sowohl die in Atomen und Molekülen gebundenen wie die ungebundenen) in der Ladungsdichte ρ(~x, t) und in der Stromdichte ~j(~x, t berücksichtigt werden. Wenn jedoch die kürzesten Wellenlängen etwa 1000 Å nicht unterschreiten, können die elektromagnetischen Wellen die atomare Struktur des Mediums nicht auflösen. In diesem für Experimente mit ultraviolettem, sichtbarem und infrarotem Licht wichtigen Fall erlauben die mikroskopischen Ausdrücke für Ladungsund Stromdichte ρ(~x, t) = X ν ~j(~x, t) = X ν qν δ (3) (~x − ~xν (t)) (7.1) qν ~x˙ ν (t)δ (3) (~x − ~xν (t)) (7.2) eine äußerst bequeme Vereinfachung, die ich nun beschreiben will. Trennen wir zunächst in (7.1) die Beiträge ungebundener Punktladungen, ρfrei (~x, t) = frei X ν qν δ (3) (~x − ~xν (t)) , (7.3) von den Beiträgen von Komplexen (Atome, Moleküle oder Elementarzellen in Kristallen), in denen jeweils mehrere Punktladungen gebunden sind. Bezeichnen wir den Ortsvektor des Schwerpunkts des µ-ten derartigen Komplexes mit ~xµ (t) und die diesbezügliche Auslenkung der i-ten Punktladung qνi innerhalb des µ-ten Komplexes mit ξ~µi (t), so lautet die von den Komplexen dargestellte Ladungsdichte 129 130 7 Elektromagnetische Felder in Materie X X Komplexe ρgeb (~x, t) = µ i qµi δ (3) (~x − ~xµ (t) − ξ~µi (t)) . (7.4) Um den Einfluss der Anteile (7.3) und (7.4) der mikroskopischen Ladungsdichte auf eine elektromagnetische Welle der Wellenlänge λ zu untersuchen, müssen wir gemäß (6.34) die räumlichen Fourierkomponenten Z ~ ρ(~k, t) = d3 xe−ik·~x ρ(~x, t) (7.5) mit Wellenzahlen |~k| = 2π/λ (7.6) betrachten, also im Einzelnen ρfrei (~k, t) = frei X ~ qν e−ik·~xν (t) (7.7) ν und X X Komplexe ρgeb (~k, t) = µ ~ ~ qµi e−ik·(~xµ (t)+ξµi (t) . (7.8) i Die angekündigte Vereinfachung beruht darauf, dass die Lineardimensionen von Atomen, Molekülen und Elementarzellen in Kristallen die Größenordnung 1 Å haben, d. h. viel kleiner sind als die angenommene Größenordnung der Wellenlänge λ. In (7.8) dürfen wir daher nach Potenzen von ~k · ξ~µi entwickeln, X Komplexe ρgeb (~k, t) = e −i~ k·~ xµ (t) µ à X i qµi − i~k · X qµi ξµi (t) + . . . i ! . (7.9) Die beiden ersten Glieder dieser Entwicklung sind durch die Ladung qµ und das elektrische Dipolmoment d~µ der Komplexe festgelegt. Unter Vernachlässigung der nachfolgenden Glieder, die offenbar die höheren Multipolmomente der Komplexe enthalten, gewinnen wir für die gesamte Ladungsdichte X µ X Komplexe Komplexe ρ(~k, t) = ρfrei (~k, t) + ~ qµ e−ik·~xµ (t) − i~k · ~ d~µ(t) e−ik·~xµ (t) . (7.10) µ Hier erscheint ρ(~k, t) als zusammengesetzt aus den Fourierkomponenten einer vergröberten Ladungsdichte, X Komplexe ρmakr (~k, t) = ρfrei (~k, t) + µ und des Vektorfeldes der Polarisationsdichte, ~ qµ e−ik·~xµ (t) , (7.11) 7.1 Polarisation und Magnetisierung X 131 Komplexe P~ (~k, t) = ~ d~µ (t)eik·~xµ (t) , (7.12) µ gemäß ρ(~k, t) = ρmakr (~k, t) − i~k · P̃(~k, t) . (7.13) Die gegenüber dem exakten Ausdruck (7.8) erreichte Vereinfachung besteht darin, dass (i) in ρmakr jeder Komplex aneinander gebundener Ladungen selbst als eine strukturlose Punktladung erscheint und (ii) die innere Struktur eines Komplexes nur über das Dipolmoment d~µ (t) in die Polarisationsdichte eingeht. Zu betonen ist, dass die Näherung (7.13) sinnlos wird für Wellenlängen, die nicht sehr groß sind im Vergleich zur Lineardimension der Komplexe. Eine völlig entsprechende Vereinfachung erhalten wir für die Stromdichte (7.2). Die ~k-te Fourierkomponente des Anteils der in Komplexen gebundenen Ladungen lautet exakt X X Komplexe ~jgeb (~k, t) = µ i ³ ´ ~ ~ ˙ qµi ~x˙ µ (t) + ξ~µi (t) e−ik·(~xµ (t)+ξµi (t)) (7.14) und nach Vernachlässigung von Gliedern zweiter und höherer Ordnung in (~k· ξ~µi ) X Komplexe ~jgeb (~k, t) = µ X X µ ~ ˙ d~µ (t)e−ik·~xµ (t) µ Komplexe −i X Komplexe ~ qµ ~x˙ µ (t) e−ik·~xµ (t) + i ´ ´³ ³ ~ ˙ qµi ~x˙ µ (t) + ξ~µi (t) ~k · ξ~µi (t) e−ik·~xµ (t) . (7.15) Den ersten hier auftretenden Term vereinigen wir mit der durch freie Punktladungen getragenen Stromdichte zu einer vergröberten Stromdichte X Komplexe ~jmakr (~k, t) = ~jfrei (~k, t) + ~ qµ ~x˙ µ (t)e−ik·~xµ (t) , (7.16) µ in der jeder Komplex als zu einer Punktladung geschrumpft erscheint. Den zweiten Term in (7.15) eliminieren wir zugunsten der Zeitableitung der Polarisationsdichte ˙ P~ (~k, t) = ³ ´i X h˙ ~ d~µ (t) − id~µ (t) ~k · ~x˙ µ (t) e−ik·~xµ (t) Komplexe (7.17) µ und erhalten für gesamte Stromdichte ~j(~k, t) ˙ = ~jmakr (~k, t) + P~ (~k, t) ³ ´ ³ ´i Komplexe P h~ ~ dµ (t) ~k · ~x˙ µ (t) − ~x˙ µ (t) ~k · d~µ (t) e−ik·~xµ (t) +i µ ³ ´ Komplexe P P ~˙ ~ −i qµi ξµi (t) ~k · ξ~µi (t) e−ik·~xµ (t) . µ i (7.18) 132 7 Elektromagnetische Felder in Materie Wir dürfen das in der Geschwindigkeit ~x˙ µ und im Dipolmoment d~µ antisymmetrische Glied vernachlässigen, da es unter praktisch allen Umständen winzig ˙ ist im Vergleich zu P~ (~k, t). Um uns davon zu überzeugen, bedenken wir, dass die Ausbreitung elektromagnetischer Wellen des Wellenvektors ~k durch die Frequenz ω(~k) = c̃|~k| (7.19) charakterisiert ist. Die in Materie vorliegende Lichtgeschwindigkeit c̃ kann übrigens verschieden sein von der Lichtgeschwindigkeit im Vakuum; c̃ kann sogar vom Wellenvektor ~k abhängen, siehe (7.2 und 7.3). Unter dem Einfluss des elektromagnetischen Feldes wird das Dipolmoment eine erzwungene Bewegung gleicher Frequenz ausführen. Die Zeitableitung des Dipolmoments wird demnach die Größenordnung c̃|~k||d~µ | haben, d. h. etwa um den Faktor c̃/|~x˙ µ | von dem erwähnten in d~µ und ~x˙ µ antisymmetrischen Glied verschieden sein. Letzte˙ res ist also gegen P~ vernachlässigbar, wenn die Geschwindigkeiten |~x˙ µ (t)| klein sind gegenüber der Lichtgeschwindigkeit ~c. Um schließlich das letzte Glied in (7.18) zu untersuchen, vereinfachen wir vorübergehend die Schreibweise, indem wir die die Ladungen nummerierenden Indices weglassen und hochgestellte Indices zur Bezeichnung der Vektorkomponenten einführen. Die i-te Vektorkomponente j i (~k, t) erhält im letzten Glied von (7.18) von einem Komplex einen Beitrag proportional zu X X Ladungen q ξ˙i (t)k j ξ j (t) = X k j j j ( X + Ladungen = i q h ˙i ξ (t)ξ j (t) − ξ˙j (t)ξ i (t) 2 Ladungen X i q h ˙i ξ (t)ξ j (t) + ξ˙j (t)ξ i (t) 2 −(~k × m) ~ i+ X kj j ) d X q i ξ (t)ξ j (t) . dt Ladungen 2 (7.20) Hierin tritt das magnetische Moment m ~ µ des Komplexes auf sowie die Zeitableitung eines in ξ quadratischen Moments der Ladungsverteilung. Da wir Glieder des letzteren Typs in der obigen Entwicklung (7.10) der Ladungsverteilung vernachlässigt hatten, müssen wir sie konsistenterweise auch hier außer Acht lassen. Die zu guter Letzt entstehende Näherung für die gesamte Stromdichte lautet ~ (~k, t), ~j(~k, t) = ~jmakr (~k, t) + P~˙ (~k, t) + i~k × M (7.21) wobei die ~k-te Fourierkomponente der Magnetisierungsdichte als X Komplexe ~ (~k, t) = M µ ~ m ~ µ (t)e−ik·~xµ (t) (7.22) 7.1 Polarisation und Magnetisierung 133 eingeführt wurde. Die Näherungen (7.13) und (7.21) für die Ladungs- bzw. Stromdichte bestehen übrigens eine wichtige Konsistenzprüfung, indem sie den Ladungserhaltungssatz befriedigen. In der Tat gilt für die ~k-te Fourierkomponente von ρ̇(~x, t) + div ~j(~x, t) ρ̇(~k, t) + i~k · ~j(~k, t) = ρ̇makr (~k, t) + i~k · ~jmakr (~k, t) . (7.23) Das Verschwinden der rechten Seite in (7.23) folgt unmittelbar, wenn die Definition (7.10) nach der Zeit differenziert wird. Wir können nun die Maxwellschen Gleichungen für langwellige (λ À Durchmesser aller Komplexe Felder in Materie aufschreiben. Beachten Sie dabei nur, ~ x) die Fourierdass die Wirbelstärke und die Quellstärke eines Vektorfeldes X(~ komponenten ~ ~k) = i~k × X( Z ~ x) d3 xe−ik·~x rotX(~ (7.24) ~ ~k) = i~k × X( Z ~ ~ x) d3 xe−ik·~x divX(~ (7.25) ~ bzw. haben. (Letztere Relation war übrigens schon in (7.23) benutzt worden.) Damit ergeben sich die Feldgleichungen aus (6.12 bis 6.15) zu ³ ´ ~ ~k, t) + P~ (~k, t) i~k · ²0 E( ~ ~k, t) i~k × E( = ρmakr (~k, t) (7.26) = ~˙ ~k, t) B( (7.27) ~ ~k, t) = 0 i~k · B( (7.28) ³ ´ ³ ´ ∂ ~ ~k, t) + P~ (~k, t) . ~ ~k, t) − M ~ (~k, t) ²0 E( i~k × ²0 c2 B( = ~jmakr (~k, t) + ∂t (7.29) ~ ~k, t) und B( ~ ~k, t), die ausschließlich langwellige (im o. g. Sinn) Für Felder E( ~ ~ ~ ~k, t) enthalten, dürfen wir in allen vier GleiFourierkomponenten E(k, t) bzw. B( chungen (7.26 - 7.29) gemäß ~ x, t) = E(~ Z d3 k −i~k·~x ~ ~ e E(k, t) etc. (2π)3 (7.30) die inverse Fouriertransformation ausführen, woraufhin wir die Ortsraumdarstellung der Maxwellschen Gleichungen gewinnen, 134 7 Elektromagnetische Felder in Materie ³ ´ ~ x, t) + P~ (~x, t) div ²0 E(~ ~ x, t) rotE(~ = ρmakr (~x, t) (7.31) = ~˙ x, t) −B(~ (7.32) ~ x, t) = 0 divB(~ (7.33) ³ ´ ³ ´ ∂ ~ x, t) − M ~ (~x, t) ~ x, t) + P~ (~x, t) . rot ²0 c2 B(~ = ~jmakr (~x, t) + ²0 E(~ ∂t (7.34) Letztere Darstellung macht besonders sinnfällig, dass (bei langwelligen Feldern!) die vergröberte Ladungsdichte ρmakr als Quelle für das so genannte elektrische Verschiebungsfeld ~ = ²E ~ + P~ D (7.35) ~ fungiert, während die vergröberte Stromdichte ~jmakr zusammen mit dem aus D ˙~ gebildeten Verschiebungsstrom D die Wirbel der so genannten Magnetfeldstärke ~ = ² 0 c2 B ~ −M ~ H (7.36) angibt. Für eine explizite Beschreibung der elektromagnetischen Phänomene in Materie müssen zunächst die Ladungen ρmakr spezifiziert werden. Die einfachst mögliche Situation liegt vor, wenn keine ungebundenen Ladungen auftreten und die Komplexe gebundener Ladungen (Moleküle, Elementarzellen in Kristallen ...) elektrisch neutral sind; in diesem Fall verschwinden ρmakr und ~jmakr . Zusätzliche Kenntnis ist erforderlich über die elektrischen und magnetischen Dipolmomente der Komplexe gebundener Ladungen, d. h. die Polarisationsdichte ~. P~ und die Magnetisierungsdichte M 7.2 Materialgesetze für Polarisation und Magnetisierung Solange kein elektromagnetisches Feld eingeprägt wird, zeigen die meisten Materialien keine langwellige (λ > 1000 Å) Polarisation und Magnetisierung. Selbst wenn die Atome, Moleküle und/oder gegebenenfalls Elementarzellen in Probekörpern elektrische und/oder magnetische Dipole tragen, so sind diese Dipole bezüglich ihrer Richtungen i. A. unkorreliert und summieren sich daher in Raumbereichen der Lineardimensionen (λ > 1000 Å) zu Null. Ausnahmen, die hier nicht weiter diskutiert werden können, sind Ferroelektrika und Ferromagnetika bei hinreichend tiefen Temperaturen. Beim Eindringen eines langwelligen elektromagnetischen Feldes in Probekörpern können jedoch endliche Werte der Polarisation und der Magnetisierung entstehen. Zum einen sind nämlich etwaige permanente molekulare Dipole bestrebt, sich längs des eingeprägten Feldes zu orientieren. Andererseits tendiert ein eingeprägtes elektrisches Feld dazu, in Komplexen aneinander gebundener Ladungen Dipolmomente zu erzeugen, da es auf Ladungen verschiedenen 7.2 Materialgesetze für Polarisation und Magnetisierung 135 Vorzeichens Kräfte entgegengesetzter Richtung ausübt. Schließlich kann ein zeitabhängiges Magnetfeld Ringspannungen und somit Ringströme erzeugen, die ein magnetisches Moment tragen. Viele so genannte Dielektrika reagieren auf die Anwesenheit eines elektromagnetischen Feldes zwar nicht mit merklicher Magnetisierung, wohl aber mit einer durch das elektrische Feld eindeutig festgelegten Polarisation. Da die durch äußeren Eingriff in dielektrischen Probekörpern erzeugbaren elektrischen Felder i. A. viel schwächer sind als typische innermolekulare Coulombfelder (≈ 108 V /cm), also nur kleine Änderungen der mikroskopischen Ladungskonfigurationen erzeugen können, lässt sich die Polarisation P~ als Potenzreihe im elek~ darstellen. Meist ist sogar nur die lineare Antwort, |P~ | ∼ |E|, ~ trischen Feld E beobachtbar. Da diese Antwort sowohl vom Wellenvektor wie von der Frequenz des eingeprägten Feldes abhängen kann, ist es zweckmäßig, das entsprechende Materialgesetz für die raum-zeitlichen Fouriertransformierten, Z Z ~ P~ (~k, ω) = d3 x dt e−i(k·~x+ωt) P~ (~x, t) (7.37) etc., aufzuschreiben. Das allgemeinste derartige lineare Gesetz lautet X ~ j (~k, ω) . χij (~k, ω)E P~i (~k, ω) = ²0 (7.38) j Die Matrix des Koeffizienten χij wird als der Tensor der linearen elektrischen Suszeptibilität bezeichnet. Nur in isotropen Medien ist dieser Tensor diagonal, ~ also parallel. χij ∼ δij , sind die Vektoren P~ und E Die Suszeptibilität vieler Materialien ist in gewissen Spektralbereichen eine von Frequenz und Wellenvektor unabhängige Konstante. Insbesondere entfällt jede Abhängigkeit von ~k für Substanzen, die räumlich homogen sind auf Längenskalen, bezüglich derer die Polarisation und die Magnetisierung definiert sind (λ À Komplexdurchmesser). Für Felder, deren Fourierkomponenten ausschließlich in solchen Spektralbereichen liegen, darf das lineare Gesetz auch in der raum-zeitlichen lokalen Form X χij Ej (~x, t) (7.39) P~i (~x, t) = ²0 j geschrieben werden. Mit Lasern erzeugte Lichtfelder können so intensiv sein, dass die elektrische Feldstärke nicht mehr winzig ist im Vergleich zu typischen innermolekularen Coulombfeldern. Auf solche Felder reagieren viele Materialien merklich nichtlinear, z. B. wie 136 7 Elektromagnetische Felder in Materie Pi (k,~ω) = ²0 X χij (~k, ω)Ej (~l, ω) j + ²0 XZ 3 0 d k j,l Z dω 0 χijl (~k 0 , ω 0 , ~k − ~k 0 , ω − ω 0 ) Ej (~k 0 , ω 0 )El (~k − ~k 0 , ω − ω 0 ) . (7.40) Der vom Tensor χijl vermittelten Nichtlinearität entspricht eine Fülle interessanter Phänomene (Frequenzmischung, Frequenzverdopplung etc.), deren Untersuchung Gegenstand der nichtlinearen Optik ist. In magnetisierbaren Materialien sind Zusammenhänge zwischen der Magne~ und dem Induktionsfeld B ~ beobachtbar, die den elektrischen Matisierung M terialgesetzen (7.38) und (7.40) ganz analog sind. 7.3 Wellen in linearen Dielektrika Für den einfachen Fall eines linearen, räumlich homogenen und isotropen Dielektrikums mit verschwindender magnetischer Suszeptibilität, ~ ~k, ω), P~ (~k, ω) = ²0 χ(ω)E( ~ (~x, t) = 0 , M (7.41) will ich nun darlegen, wie sich die Ausbreitung elektromagnetischer Wellen modifiziert gegenüber dem Fall der Ausbreitung im Vakuum. Wenn keine freien Ladungen ins Dielektrikum gebracht und alle Komplexe gebundener Ladungen neutral sind, so lauten die Maxwell’schen Gleichungen (7.24 bis 7.27) (nach Fouriertransformation bezüglich der Zeit wie in (7.37)) ~k · E( ~ ~k, ω) = 0 , ~k · B( ~ ~k, ω) = 0 , ~k × E( ~ ~k, ω) = −ω B( ~ ~k, ω) , ~k × B( ~ ~k, ω) = ²(ω) c2 ~ (~k, ω) , ωE (7.42) wobei ²(ω) die Dielektrizitätskonstante ²(ω) ≡ 1 + χ(ω) (7.43) ~ ~k, ω) aus (7.42) erhalten wir bezeichnet. Durch Elimination von B( ³ ´ 2 ~ ~k, ω) = k 2 E( ~ ~k, ω) ²(ω)ω E( ~ ~k, ω) . −~k × ~k × E( (7.44) c2 Ebene monochromatische Wellen im betrachteten Dielektrikum haben also die Dispersionsrelation ck = ω p ²(ω) . (7.45) Der früher besprochene Fall des Vakuums ist hierin als ² = 1 enthalten. Der Faktor n(ω) ≡ p ²(ω) (7.46) 7.4 Modell eines Dielektrikums 137 wird auch Brechungsindex des Dielektrikums genannt. Wie Sie im nächsten Paragrafen sehen werden, können die Suszeptibilität χ und somit die Dielektrizitätskonstante wie der Brechungsindex komplexe Werte annehmen. Um die physikalische Bedeutung von Realteil n0 und Imaginärteil n00 eines komplexen Brechungsindex n = n0 + in00 (7.47) zu erkennen, betrachten wir eine in die positive x-Richtung laufende ebene monochromatische Welle 0 ei(ωt−kx) = eiω(t−xn /c) e+xn 00 ω/c . (7.48) Da sich die Flächen konstanter Phase des in (7.48) auftretenden periodischen Faktors mit der Geschwindigkeit x/t = c/n0 bewegen, heißt c̃(ω) = c/n0 (ω) (7.49) die Phasengeschwindigkeit elektromagnetischer Wellen im Dielektrikum. Offenbar ist c̃ allein durch den Realteil des Brechungsindex festgelegt und hängt über diesen i. A. von der Frequenz der Welle ab. Der nichtperiodische Faktor in (7.48) beschreibt je nach Vorzeichen von n00 eine exponentielle Dämpfung (n00 < 0) oder Verstärkung (n00 > 0) der Welle beim Eindringen ins Dielektrikum. Beide Fälle lassen sich experimentell realisieren. Im Fall der Dämpfung hat die Größe l ≡ c/ω|n00 (ω)| (7.50) offenbar die Bedeutung einer Eindringtiefe. 7.4 Modell eines Dielektrikums Denken wir uns jeden Komplex aneinander gebundener Ladungen repräsentiert durch einen harmonischen Oszillator der Eigenfrequenz ω0 . Bei Auslenkung aus der Ruhelage um ξ~ trete das Dipolmoment d~ = q ξ~ (7.51) auf. Unter dem Einfluss eines monochromatischen elektrischen Feldes führt der Oszillator eine erzwungene Schwingung gemäß der Bewegungsgleichung q ~ −iωt ¨ ¨ E0 e (7.52) ξ~ − 2γ ξ~ + ω02 ξ~ = m aus. Hierin ist m die effektive Masse des Oszillators und γ eine Dämpfungskonstante, die den dissipativen Effekt anderer Freiheitsgrade des Systems auf den Oszillator beschreibt. Im stationären Regime schwingt das Dipolmoment d~ mit der Frequenz ω und der Amplitude d~ = ω02 q 2 /m ~0 . E − ω 2 + i2γω (7.53) 138 7 Elektromagnetische Felder in Materie Wenn die Volumeneinheit im Dielektrikum mit N derartigen Oszillatoren gleichförmig∗) ausgefüllt ist, so gilt für die ~k-ten Fourierkomponenten der Polarisationsdichte und des elektrischen Feldes P~ (~k, t) = N q 2 /m ~ ~k, t) , E( ω02 − ω 2 + i2γω (7.54) solange die Wellenlänge λ = 2π/|~k| groß gegenüber dem mittleren Teilchenabstand (≈ N −1/3 ) ist. Für die Dielektrizitätskonstante folgt aus (7.54) ²(ω) = n(ω)2 = 1 + ω02 N q 2 /m²0 . − ω 2 + i2γω (7.55) Aus (7.55) entnehmen wir zunächst, dass der Imaginärteil n00 (ω) des Brechungsindex stets negativ ist. Eine in das Medium aus harmonischen Oszillatoren eindringende Welle wird also gedämpft. Unser Modell ist nicht geeignet, verstärkende Medien zu beschreiben. Die Dämpfung einfallender Wellen ist offenbar am stärksten für Frequenzen ω nahe der Eigenfrequenz ω0 , d. h. bei Resonanz. Für ω ≈ ω0 zeigt auch der Realteil des Brechungsindex eine für Resonanzphänomene typische starke Frequenzabhängigkeit. Beachten Sie übrigens, dass für ω > ω0 der Realteil n0 kleiner als eins, die Phasengeschwindigkeit also größer als die Lichtgeschwindigkeit im Vakuum ist. 7.5 Ohmsches Gesetz Anders als in Dielektrika treten in elektrischen Leitern stets Ladungen auf, die nicht an Ruheladungen gebunden, sondern über das ganze Volumen des jeweiligen Körpers beweglich sind. Zum Beispiel besteht ein Metall aus beweglichen Leitungselektronen und positiv geladenen Ionen, die elastisch an Gleichgewichtslagen gebunden sind. Ein auf einen Leiter eingeprägtes elektrisches Feld beschleunigt jedes bewegliche geladene Teilchen und bewirkt somit einen elektrischen Strom. Insbesonde~ in einem räumlich re erzeugt ein nicht aus starkes statisches homogenes Feld E homogenen und isotropen Leiter eine Stromdichte, die durch das Ohmsche Gesetz ~ ~j = σ E (7.56) beschrieben wird. Die Materialkonstante σ heißt die elektrische Leitfähigkeit. Eine elementare gaskinetische Modellvorstellung für die beweglichen Ladungen in einem Leiter besagt, dass sich jede dieser Ladungen bei Abwesenheit eines eingeprägten Feldes frei bewegt bis auf gelegentlich Stöße in mittlerem zeitlichen Abstand τ . Bei Stoß ändert sich im Mittel zwar nicht der Betrag der Geschwindigkeit, wohl aber ihre Richtung, u. z. in jeweils beliebiger Weise ohne Bevorzugung irgendeiner Orientierung. Da die mittlere Geschwindigkeit eines ∗) Gleichförmig heißt, dass bei immer feinerer Unterteilung des Gesamtvolumens gleich große Teilvolumina ∆V bis auf vernachlässigbare Schwankungen gleich viele Teilchen enthalten, solange N ∆V À 1. 7.6 Wellen in Leitern 139 Haufens solchermaßen bewegter Teilchen gleich Null ist (s. Abbildung 7.1), verschwinden alle hinreichend langwelligen Fourierkomponenten der Stromdichte und insbesondere die Abbildung 7.1 ~k = 0-Komponente, die einem räumlich homogenen Strom entspricht. Bei Anlegen eines elektrischen Feldes ändert sich die geschilderte Situation nur insofern, als sich die Geschwindigkeit eines beweglichen Teilchens der Masse m und der Ladung q zwischen zwei Stößen um ~ /m ~u = q Eτ (7.57) erhöht. Im Mittel werden alle beweglichen Ladungen mit der Geschwindig~ driften, so dass N die Volumeneinheit gleichförmig keit ~u längs des Feldes E ausfüllende gleiche Ladungen die Stromdichte ~ ~j = N q~u = (N q 2 τ /m)E (7.58) tragen. Aus (7.58) lesen Sie für die Leitfähigkeit des Modells ab σ = N q 2 τ /m . 7.6 (7.59) Wellen in Leitern Der statische Fall (7.56) des Ohmschen Gesetzes verallgemeinert sich für Wellen der Frequenz ω in homogenen und isotropen Leitern zu ~ ~k, ω) . ~j(~k, ω) = σ(ω)E( (7.60) Der Beschreibung der entsprechenden Wellen lege ich die Maxwellschen Gleichungen in der Form ~k · E( ~ ~k, ω) ~k · B( ~ ~k, ω) = 0, = 0, ~k × E( ~ ~k, ω) ~ ~k, ω) i~k × B( = = ~ ~k, ω) − ω B( 1 ² 0 c2 ~ ~k, ω) ~j(~k, ω) + i ω2 E( c (7.61) 140 7 Elektromagnetische Felder in Materie zugrunde. Dabei sind die Polarisierbarkeit und Magnetisierbarkeit aller Komplexe aneinander gebundener Ladungen vernachlässigt sowie elektrische Neutralität des Leiters bezüglich der Längenskala λ = 2π/|~k| angenommen. Nach Eintragen des Ohmschen Gesetzes (7.60) in die Maxwellschen Glei~ ergibt sich ähnlich chungen (7.61) und nach Elimination des Induktionsfeldes B wie in 7.3 1 ~ ~ = 1 (σ(ω)/²0 + iω)E ~ . ~ = i 1 k2 E (7.62) k × (~k × E) ω ω c2 Als Dispersionsrelation elektromagnetischer Wellen in Leitern entnehmen wir hieraus ¶ µ σ(ω) c2 k 2 = ω 2 1 + . (7.63) iω²0 −i Wie im Dielektrikum lässt sich die Abweichung der Dispersionsrelation von der des Vakuums wieder durch einen frequenzabhängigen Brechungsindex n(ω) = µ ¶1/2 σ(ω) 1+ iω²0 (7.64) beschreiben. Daher gilt das in 7.3 über Phasengeschwindigkeit und Eindringtiefe der Welle Dargelegte ohne Änderung auch für Wellen in Leitern. Das in 7.4 beschriebene Modell eines Dielektrikums lässt sich übrigens auch auf Leiter übertragen, indem in (7.52) die Rückstellkraft mω02 ξ, d. h. die Eigenfrequenz ω0 Null gesetzt und die Dämpfungskonstante γ mit der mittleren Stoßzeit mittels 2γ = 1/τ verknüpft wird. Durch Vergleich von (7.55) und (7.64) erhalten wir dann die frequenzabhängige Leitfähigkeit des Modells zu σ(ω) = σ N q 2 τ /m = . 1 + iωτ 1 + iωτ (7.65) Im Grenzfall ωτ → 0 reduziert sich dieses Resultat auf die in (7.59) gegebene statische Leitfähigkeit σ(0) ≡ σ. Kapitel 8 Symmetrien 8.1 Der Raum ist homogen Eine in Essen arbeitende Maschine funktioniert gleichermaßen auf dem Kahlen Asten, vorausgesetzt, alle den Lauf der Maschine beeinflussenden Umweltbedingungen (je nach Gerät verschieden, z. B. Temperatur, Luftdruck, Luftfeuchtigkeit, Luftzusammensetzung, elektrische und magnetische Felder) werden gleich gestellt. Mit gewissem Aufwand an Technik und Geld lassen sich manche Maschinen auch auf dem Mond betreiben. Einschränkend muss notiert werden, dass Großvaters Pendeluhr, auf den Mond gebracht, langsamer als zu Hause ticken würde; die Synchronisierung der Ticks der häuslichen Pendeluhr mit denen des auf dem Mond tickenden Duplikats durch Vergrößerung des Gravitationsfeldes des Mondes um einen Faktor 6 (entsprechend den Radien und Massen von Mond und Erde) ist uns nicht möglich. Kein Punkt im Raum ist vor irgendeinem anderen Punkt ausgezeichnet. Das heißt, was an einem Punkt physikalisch bewirkt werden kann, ist auch anderswo zu bewerkstelligen. Der beschriebene Sachverhalt, eine Erfahrungstatsache, ist zwar umgangssprachlich nur mangelhaft präzisierbar, hat aber in allen Grundgesetzen der Physik einen wichtigen Niederschlag: keines dieser Grundgesetze zeichnet irgendeinen Punkt im Universum aus. Es folgt, dass alle Grundgesetze der Physik, wenn als Gleichungen für ortsabhängige Größen geschrieben, ihre Form nicht ändern, wenn der Koordinatenursprung verschoben wird. Alle Grundgesetze bleiben formgleich bei der Koordinatentransformation ~x0 = ~x + d~ t0 = t , (8.1) die einer zeitunabhängigen Verschiebung des Ursprungs um d~ entspricht. Prüfen wir diese Invarianz am Beispiel des Newtonschen Grundgesetzes F~ = m~a, welches die Beschleunigung ~a eines Teilchens der Masse m mit der auf das Teilchen wirkenden Kraft F~ verknüpft. Die Masse m des Teilchens ist in beiden Koordinatensystemen die gleiche. Da beide Koordinatensysteme parallele Achsen haben, sind die Komponenten des am Ort des Teilchens wirkenden Kraftvektors bezüglich der einander entsprechenden Achsen gleich. Die in den 141 142 8 Symmetrien Abbildung 8.1 beiden Systemen messbaren Beschleunigungen sind ebenfalls gleich, da wegen der Zeitunabhängigkeit von d~ gilt ~ d2 ~x0 d2 ~x0 d2 (~x + d) d2 ~x = = = 2 . 02 2 2 dt dt dt dt Wenn also im Koordinatensystem S das Newtonsche Gesetz F~ = m~a gilt, so ~ 0 . Wie in Essen, gilt es auch mit ungeänderter Form im Koordinatensystem S so auf dem Kahlen Asten. Drücken wir’s vornehmer aus! Die Homogenität des Raumes ist gleichbedeutend mit der Invarianz der Grundgesetze unter Translationen des Koordinatensystems. Dies ist keine nur esoterische Weisheit sondern eine prägnante Zusammenfassung vieler praktischer Erfahrungen. Insbesondere ist die Erfahrung beinhaltet, dass der Gesamtimpuls eines abgeschlossenen Systems (abgeschlossen = keine äußeren Einwirkungen) zeitlich konstant bleibt. Zeigen wir das am Beispiel eines mechanischen Systems, das wir uns als einen Haufen wechselwirkender Teilchen vorstellen können. Die Wechselwirkung der Teilchen im Haufen werden beschrieben mit Hilfe der potenziellen Energie U (~x1 , ~x2 , . . .), die von den Ortsvektoren ~x, aller Teilchen abhängt. Wegen der Homogenität des Raumes ändert sich die potenzielle Energie nicht, wenn zu allen Ortsvektoren ~x, derselbe zeitunabhängige Vektor d~ addiert wird, ~ ~x2 + d, ~ . . .) . U (x~1 , x~2 , . . .) = U (~x1 + d, ~ so Differenzieren wir diese Gleichung nach der i-ten Komponente des Vektors d, erhalten wir unter Benutzung der Kettenregel 8.2 Der Raum ist isotrop 0= ∂ ~ ~x2 + d, ~ . . .) U (~x1 + d, ∂di = X ν = X ν 143 ∂ ~ ~x2 + d, ~ . . .) U (~x1 + d, ∂xνi ∂ U (~x1 , ~x2 , . . .). ∂xνi Nun ist −∂U/∂xνi , gerade die i-te Komponente der auf das ν-te Teilchen wirkenden Kraft und wir erkennen, dass die Summe der Kräfte auf alle Teilchen für einen abgeschlossenen Haufen verschwindet. Wenn das abgeschlossene System insbesondere nur aus zwei Teilchen besteht, so ergibt sich Newtons berühmtes Gesetz actio = reactio. Um auch den Impulserhaltungssatz zu erschließen, schauen wir die Bewegungsgleichung des ν-ten Teilchens an, µ ¶ ∂ ∂ ∂ d2 ~xν = −∇ U = − U, U, U , mν ν dt2 ∂xν1 ∂xν2 ∂xν3 und summieren über alle Teilchen. Da die Summe der Kräfte verschwindet, finden wir − X ν ∇ν U = 0 = Also bleibt die Größe X mν d2 ~xν dxν d X mν = . 2 dt dt ν dt X mν ν P~ = ν d~xν , dt die wir Gesamtimpuls des Haufens nennen, zeitlich konstant, d ~ P =0. dt Nicht nur die Grundgesetze der Mechanik, sondern alle Grundgesetze der Physik sind invariant unter Translationen des Koordinatensystems. Dementsprechend gilt der Impulserhaltungssatz auch allgemeiner als nur für rein mechanische abgeschlossene Systeme (die es streng genommen gar nicht gibt). Betrachten wir etwa einen Haufen geladener Teilchen, die über das von ihnen erzeugte elektromagnetische Feld wechselwirken, ohne dass äußere Einflüsse wirksam wären. Da alle zur Beschreibung dieses Systems einschlägigen Grundgesetze translations-invariant sind, bleibt der Gesamtimpuls des Systems zeitlich konstant. Allerdings tragen nicht nur die Teilchen, sondern auch das von ihnen erzeugte elektromagnetische Feld zum Gesamtimpuls bei. Erinnern Sie sich an den Comptoneffekt! 8.2 Der Raum ist isotrop Die Naturgesetze zeichnen nicht nur keinen Punkt des Universums aus, sondern auch keine Richtung im Raum. Zwar gibt es in vielen physikalischen Systemen eine oder gar mehrere ausgezeichnete Richtungen, aber solche Anisotropien sind stets erzeugt durch Materiekonfigurationen; werden letztere gedreht, so drehen 144 8 Symmetrien sich die ausgezeichneten Richtungen mit, ohne dass sich irgendeine andere Eigenschaft ändert. Denken wir an die Schwerkraft an der Erdoberfläche, die im Labor die von unten nach oben“ weisende Richtung auszeichnet. Die Schwerkraft wird von ” der Erde erzeugt. Dreht man die Erde, so dreht sich die ausgezeichnete Richtung. Die Isotropie des Raumes zeigt sich bei diesem Beispiel darin, dass viele Laborexperimente um 12 Uhr mittags die gleichen Resultate geben wie abends um 6 Uhr. Viele, nicht alle: messen Sie den Wasserpegel an der Atlantikküste und bemerken die durch Sonne und Mond bewirkten zusätzlichen Anisotropien des Gravitationsfeldes an der Erdoberfläche. Also verfeinern wir die Aussage: schwerkraftempfindliche Laborexperimente verlaufen gleich, wenn gleiche Konstellation von Labor, Erdmittelpunkt, Mond und Sonne vorliegt. Die allgemeine und präzise Fassung der geschilderten Erfahrung von der prinzipiellen Gleichberechtigung aller Richtungen besagt, dass alle Grundgesetze invariant sind unter Rotationen des Koordinatensystems. Um diese Aussage für konkrete Gesetze nachprüfen zu können, müssen wir uns überlegen, wie sich die Koordinaten eines Punktes bei Drehung der Koordinatenachsen ändern. Betrachten wir der Einfachheit halber eine reine Rotation (keine Nullpunktverschiebung) um den Winkel ϕ bezüglich der z-Achse. Sie sehen leicht anhand von Abbildung 8.2, dass Abbildung 8.2 x0 = x cos ϕ + y sin ϕ y0 = z0 = −x sin ϕ + y cos ϕ 0 = t bzw. x = y = x0 cos ϕ − y 0 sin ϕ x0 sin ϕ + y 0 cos ϕ z t, wobei letztere Gleichung ausdrückt, dass zwar nicht eine Pendeluhr, wohl aber eine sorgfältig konstruierte Armbanduhr unverändert geht, wenn sie auf den Kopf gestellt wird. Prüfen wir die Rotationsvarianz der Newtonschen Bewegungsgleichheit für ein Teilchen, d2 ~x (8.3) F~ = m 2 . dt Drücken wir die Beschleunigung durch die Koordinaten im gedrehten System aus, so ergibt sich 8.2 Der Raum ist isotrop d2 x dt2 = d2 x 0 d2 y 0 cos ϕ − 0 2 sin ϕ 02 dt dt d2 y dt2 = d2 x 0 d2 y 0 sin ϕ + 0 2 cos ϕ . 02 dt dt 145 (8.4) Die Komponenten der auf das Teilchen wirkenden Kraft F~ erhalten wir durch Projektion des Kraftvektors auf die gedrehten Koordinatenachsen, genau wie sich die Transformationsformel für die Koordinaten durch Projektion des Ortsvektors ~x gewinnen lassen, Fx = Fy = Fx0 cos ϕ − Fy 0 sin ϕ Fx0 sin ϕ + Fy 0 cos ϕ . (8.5) Da die Masse des Teilchens natürlich unabhängig von der Orientierung der Koordinatenachsen ist (ob Sie sich auf eine Waage stellen oder legen, ist für Ihr Gewicht unerheblich), müssen wir nicht zwischen m und m0 unterscheiden. Tragen wir nun die Transformationen (8.4) und (8.5) in die Bewegungsgleichungen (8.3) ein, so finden wir Fx0 cos ϕ − Fy 0 sin ϕ = m d2 y 0 d2 x 0 cos ϕ − m 0 2 sin ϕ 02 dt dt Fx0 sin ϕ − Fy 0 cos ϕ = m d2 x 0 d2 y 0 sin ϕ + m 0 2 cos ϕ . 02 dt dt (8.6) Da diese Gleichungen für beliebige Drehwinkel ϕ gelten, also z. B. für ϕ = π2 und ϕ = 0, ergibt sich als Satz von Bewegungsgleichungen im Koordinatensystem S 0 d2 ~x0 (8.7) F~ 0 = m 0 2 , dt der formgleich ist mit dem Satz (8.3) im System S. Wenn also (8.3) in S gilt, so gilt auch (8.7) in S 0 . Wir können auch so argumentieren: Die Koordinaten x, y, z, die Komponenten Fx , Fy , Fz wie die Komponenten der Beschleunigung bilden jeweils einen Vektor; alle diese Vektoren transformieren sich gleichartig bei Drehung des Koordinatenkreuzes, wie aus (8.2), (8.4), (8.5) ersichtlich. Wenn daher die beiden Vektoren F~ und md2 ~x/dt2 in einem Koordinatensystem übereinstimmen, so auch in einem beliebig zu diesem verdrehten. Haben Sie bisher einen Vektor als eine Größe angesehen, die durch Betrag und Richtung charakterisiert ist und auch durch ihre Komponenten bezüglich eines Achsenkreuzes spezifiziert werden kann? Dann präzisieren wir diese Auffassung jetzt. Ein Zahlentripel, das sich bei Drehung des Koordinatensystems ebenso transformiert wie die Koordinaten x, y, z, ist ein Vektor. Die Bedeutung dieser Begriffsbildung liegt darin, dass die Rotationsinvarianz von Naturgesetzen der Form ~ =V ~, U z. B. F~ = m~a (8.8) 146 8 Symmetrien ~ und V ~ Vektoren sind, die in irgendeinem Koordinatenevident wird. Wenn U system übereinstimmen, so gilt die Gleichheit auch in allen verdrehten Koordinatensystemen. Ein verwandter, Ihnen ebenfalls bekannter Begriff ist der Skalar. Eine Größe ϕ heißt skalar, wenn sie sich bei Drehung des Koordinatensystems gar nicht ändert. Beispiele sind Masse, Ladung, Volumeninhalt, Ladungsdichte etc. Selbstverständlich sind Naturgesetze, die sich als Gleichheit zweier Skalare schreiben lassen, invariant unter Rotationen. So zum Beispiel gilt, dass Ladungen die Quellen des elektrischen Feldes sind, in allen zueinander verdreh~ = ρ/²0 . ten Koordinatensystemen in der Form divE Wir hatten oben eine spezielle Rotation (Drehung um z-Achse um Winkel ϕ) betrachtet. Bei allgemeinen Drehungen mischen sich alle drei räumlichen Koordinaten linear, während gleiche Uhren in zueinander gedrehten Systemen immer mit gleicher Frequenz ticken, x0 = R11 x + R12 y + R13 z y 0 = R21 x + R22 y + R23 z z 0 = R31 x + R32 y + R33 z t0 = t. (8.9) Die neun Koeffizienten Rij der Linearkombination lassen sich, wie Sie gelernt haben oder nachlesen können, stets durch drei Parameter (z. B. Eulersche Winkel) festlegen. Überzeugen wir uns davon, indem wir ausnutzen, dass sich das ~, Längenquadrat eines beliebigen Vektors V ~ 2 = Vx2 + Vy2 + Vz2 , V (8.10) bei beliebiger Drehung des Koordinatensystems nicht ändern kann, also ein Skalar ist. Um die Betrachtung bequem aufschreiben zu können, vereinbaren wir eine Neubenennung der Vektorkomponenten gemäß Vx = V 1 , Vy = V 2 , Vz = V 3 . (8.11) Dann schreibt sich die Transformation (8.9) als xi = 3 X Rij xj (8.12) Vi2 . (8.13) j=1 ~ 2 als und als Längenquadrat V ~2 = V 3 X i=1 ~ 2 offenbar ein Skalar ist, gilt Da V X i 0 Vi 2 = X i Vi2 = X ijk Rij Rik Vj Vk , (8.14) 8.2 Der Raum ist isotrop 147 oder X jk à δjk − X Rij Rik i ! Vj Vk = 0 . (8.15) ~ beliebig ist, folgt Da der Vektor V 3 X Rij Rik = δjk . (8.16) i=1 (Vollziehen Sie den Schluss selbst im Detail nach, indem Sie nacheinander ge~ treffen; beachten Sie die Symmetrie von P Rij Rik unter eignete Wahlen für V i Vertauschung der Indices j und k.) Wir haben in (8.16) sechs unabhängige Gleichungen für die neun Matrixelemente Rij . Es folgt, dass die Drehmatrix R drei freie Parameter enthält. Wenn wir beachten, dass Rij das ji-Element der zu R transponierten Matrix R̃ ist, so können wir (8.16) als die Matrixgleichung R̃R = 1 (8.17) schreiben und folgern, dass die zu R inverse gleich der transponierten Matrix ist, R̃ = R−1 . (8.18) Dieser Zusammenhang liefert uns die Umkehrung der Transformation (8.12) X xi = (8.19) Rji x0j . j Ebenso wie die Translationsvarianz der Grundgesetze hat auch die Rotationsinvarianz viele höchst wichtige und praktische Konsequenzen. Eine davon ist, dass der Gesamtdrehimpuls eines abgeschlossenen Systems eine zeitlich konstante Größe ist. Es lohnt sich, diesen wichtigen Erhaltungssatz für einen abgeschlossenen Haufen wechselwirkender Teilchen zu verifizieren. Wir nutzen aus, dass die potenzielle Energie U (~x1 , ~x2 , . . .) des Haufens ein Skalar sein muss. Für eine beliebige Rotation muss also gelten U (~x1 , ~x2 , . . .) = U (~x01 , ~x02 , . . .), (8.20) wobei ~x0ν = (x0ν1 , x0ν2 , x0ν3 ) = (x0ν , yν0 , zν0 ) das Koordinatentripel des ν-ten Teilchens im gedrehten System bezeichnet. Insbesondere muss die Gleichung (8.20) gelten für eine so genannte differenzielle Rotation, d. h. eine Drehung um einen sehr kleinen Winkel δϕ bezüglich einer beliebigen Achse. Solche differenziellen Rotationen können durch einen Vektor δ ϕ ~ charakterisiert werden, dessen Richtung die Drehachse und dessen Betrag den Drehwinkel δϕ = |δ ϕ ~ | angeben (wobei, so die übliche Konvention, im Sinne einer Rechtsschraube gedreht wird). Offenbar ändern sich bei einer differenziellen Rotation die Komponenten ~ nur wenig. Wir können schreiben eines vorgegebenen Vektors V ~0 =V ~ + δV ~ V (8.21) 148 8 Symmetrien ~ durch folgende einfache Überlegung. Der und finden die kleine Änderung δ V vorgegebene Vektor selbst ändert sich bei der Drehung des Koordinatensystems ~ 0 in (8.21) meint um δ ϕ ~ natürlich nicht (nur seine Koordinaten ändern sich; V das Koordinatentripel des Vektors im gedrehten System). Denken wir uns aber ein Duplikat dieses Vektors, welches vor Ausführung der Drehung des Koordinatendreibeins mit dem vorgegebenen Vektor übereinstimmt, bei der Drehung des Dreibeins zum System S 0 jedoch starr mitgeführt wird. Das Duplikat ist ein vom vorgegebenen Vektor verschiedener Vektor; die Komponenten des Duplikats bezüglich des Systems S 0 sind jedoch numerisch gleich den Komponenten des vorgegebenen Vektors bezüglich des ursprünglichen Koordinatensystems S, da das Duplikat im System S 0 genauso orientiert ist wie der vorgegebene Vektor im System S. Die in S 0 ausgedrückte Differenz zwischen dem mitgeführten Du~ in (8.21). plikat und dem stehengebliebenen Original ist genau die Änderung δ V Wir erhalten sie als die Änderung, die das Duplikat erleiden würde, wenn es, losgelöst vom Dreibein S 0 , um −δ ϕ ~ gedreht, also ins Original zurückrotiert würde. ~ | = |V ~ | sin Θδψ und ferner, dass δ V ~ Ein Blick auf die Abbildung 8.3 enthüllt |δ V senkrecht auf der Abbildung 8.3 ~ aufgespannten Ebene steht, so dass δ V ~×V ~ und δ ψ ~ = δψ ~ bei Drehung von V ~ Wir haben die Drehung des Vektors V ~ = −δ ϕ ~ um δ ψ um δ ψ. ~ in Rechnung zu stellen und finden als explizite Form der Transformation (8.21) ~0 =V ~ +V ~ × δϕ V ~ . (8.22) Ihnen bleibt zur Übung überlassen, diese infinitesimale Rotation des Koordinatensystems in die Form (8.12) zu bringen und die zugehörige Drehmatrix aufzuschreiben. Jetzt können wir uns vollends schnell klarmachen, dass, wie behauptet, der Gesamtdrehimpuls eines abgeschlossenen Teilchenhaufens zeitlich konstant bleibt. Benutzen wir (8.20) für die infinitesimale Rotation (8.22), U ({~xν + ~xν × δ ϕ ~ }) − U ({~xν }) = 0 . (8.23) Entwickeln wir links nach Potenzen von δ ϕ ~ bis zum Glied erster Ordnung, so erhalten wir 8.2 Der Raum ist isotrop X ∂U ({~xν }) v,i ∂xνi (~xν × δ ϕ ~ )i = 0 . 149 (8.24) Erinnern wir uns, dass −∇ν U gerade die auf das ν-te Teilchen wirkende Kraft F~ν ist und beachten die zyklische Invarianz des Spatprodukts gemäß − X ν F~ν · (~xν × δ ϕ ~ ) = +δ ϕ ~· X (~xν × F~ν ) = 0 . (8.25) ν Es erscheint das Skalarprodukt des Drehvektors δ ϕ ~ mit der Summe der Drehmomente ~xν × F ~ν der Kräfte F ~ν . Da der Drehwinkel ganz beliebig orientiert sein darf, schließen wir, dass die Summe der Drehmomente der Kräfte auf alle Teilchen des abgeschlossenen Haufens verschwindet. Das zeitliche Verhalten des Gesamtdrehimpulses finden wir, indem wir die Bewegungsgleichung des ν-ten Teilchens vektoriell mit dem Ortsvektor ~x ν multiplizieren, d2 ~xν = ~xν × F~ν dt2 und nun diese Gleichungen für alle Teilchen additiv zusammenfassen, ~xν × mν X ν ~xν × mν X d d~xν = ~xν × F~ν = 0 . dt dt ν (8.26) (8.27) Wegen ~xν × ~xν = 0 können wir die linke Seite als eine totale Zeitableitung schreiben und finden den Erhaltungssatz ~ d X d~xν dL = =0. ~xν × mν dt ν dt dt (8.28) Die erhaltene Größe ist der Vektor des Gesamtdrehimpulses der Teilchen ~ = L X ν ~xν × mν d~xν . dt (8.29) Die somit vollzogene Herleitung des rein mechanischen Drehimpulserhaltungssatzes beginnt mit der Annahme, dass die Wechselwirkung der Teilchen durch eine potenzielle Energie U ({~xν }) beschreibbar sei und ist somit kritikbedürftig. Anstatt eine allgemeine und abstrakte Kritik zu geben, verweise ich wieder auf das Beispiel eines abgeschlossenen Haufens geladener Teilchen. Die Wechselwirkung solcher Teilchen über das von ihnen selbst erzeugte elektromagnetische Feld kann nicht durch eine potenzielle Energie U ({~xν }) beschrieben werden. Denken wir nur daran, dass das elektromagnetische Feld eines Teilchens sich mit der Lichtgeschwindigkeit ausbreitet. Befindet sich also ein Teilchen zur Zeit t am Ort ~xν , so kann sich dieser Sachverhalt andernorts auf andere Teilchen erst zu späteren Zeitpunkten auswirken. Eine derart retardierte Wechselwirkung zwischen Teilchen kann offenbar nicht durch eine potenzielle Energie U (~x1 (t), ~x2 (t), . . .), in die alle Teilchenkoordinaten zu einer Zeit eingehen, beschrieben werden. Die Ausschlachtung der Rotationsinvarianz der Maxwellschen Gleichungen und der Teilchenbewegungsgleichungen zugleich, die hier nicht vorgenommen 150 8 Symmetrien werden kann, ergibt, dass sowohl die Teilchen wie das von ihnen erzeugte elektromagnetische Feld einen Drehimpuls haben. Erst die Summe beider Beiträge liefert den zeitlich erhaltenen Gesamtdrehimpuls für das abgeschlossene System geladener Teilchen. 8.3 Die Zeit ist homogen Als Leonardo da Vinci (1452 - 1519) Maschinen baute, machte er sich Grundgesetze zunutze (wenn diese auch noch nicht alle formuliert gewesen sein mögen), die heute noch unverändert gelten. Wir haben auch keinen Grund zu der Annahme, dass für künftige Ingenieurgenerationen die Maxwellschen Gleichungen außer Kraft geraten könnten. Mit anderen Worten, in den Grundgesetzen ist kein Zeitpunkt ausgezeichnet, die Grundgesetze sind alle invariant unter Verschiebungen des Zeitnullpunktes t0 = t+τ x0 = x, y 0 = y, z 0 = z . (8.30) Auch diese Symmetrie der Natur bzw. Invarianz der Grundgesetze impliziert einen Erhaltungssatz für abgeschlossene Systeme, den der Energie. Bei einem abgeschlossenen rein mechanischen Teilchenhaufen, bei dem die Wechselwirkungen durch eine potenzielle Energie U ({~xν }) beschreibbar sind, bedeutet die Gleichberechtigung aller Zeitpunkte, dass U nicht explizit von der Zeit abhängt. Allein aus dieser Annahme aber hatten wir in 2.9 gefolgert, dass die mechanische Gesamtenergie E= X 1 mν ~x˙ 2ν + U ({~xν }) 2 ν (8.31) zeitlich erhalten bleibt. Für ein abgeschlossenes System, das aus geladenen Teilchen und ihrem elektromagnetischen Feld besteht, hatten wir in 6.4 den Energieerhaltungssatz hergeleitet. Die für das abgeschlossene System erhaltene Gesamtenergie hat einen rein mechanischen, einen rein elektromagnetischen Anteil sowie einen Wechselwirkungsanteil. Der Nachweis der Konstanz der Gesamtenergie macht wesentlichen Gebrauch von der Tatsache, dass weder die Bewegungsgleichungen der Teilchen noch die Maxwellschen Gleichungen irgendeinen Zeitpunkt auszeichnen. 8.4 Galileiinvarianz Denken wir uns zwei identische Labors, die sich relativ zueinander gleichförmig bewegen. In beiden werde das gleiche Experiment durchgeführt. Nach aller Erfahrung ergeben sich gleiche Messresultate. Ohne Beobachtung der Außenwelt kann in keinem Labor festgestellt werden, ob das Labor ruht oder sich in gleichförmiger Bewegung befindet. Dieser Erfahrungstatsache entspricht eine Invarianz aller Grundgesetze: alle Naturgesetze haben in allen gleichförmig zueinander bewegten Koordinatensystemen die gleiche Form. Das ist das so genannte Relativitätsprinzip. 8.4 Galileiinvarianz 151 Um die erwähnte Invarianz konkreter formulieren zu können, müssen wir uns klarmachen, wie sich die Koordinaten eines Raum-Zeitpunktes in gleichförmig gegeneinander bewegten Koordinatensystemen ineinander umrechnen lassen. Wenn sich das System S vom System S 0 aus gesehen mit der Geschwindigkeit ~u bewegt, so gilt gemäß der Galileitransformation ~x0 = ~x + ~ut t0 = t, (8.32) falls entsprechende Achsen von S und S 0 zueinander parallel sind und die Ursprünge zur Zeit t = t0 = 0 zusammenfallen. Naturgesetze, die bei der Galileitransformation (8.32) ihre Form behalten, heißen galileiinvariant. Bekanntlich entspricht die Galileiinvarianz nur einer näherungsweise gültigen Symmetrie der Natur. Die Galileitransformation (8.32) ist zwar vom Alltag geläufig und daher anschaulich, ist jedoch, wie später auszuführen sein wird, völlig unbrauchbar, wenn die Relativgeschwindigkeit ~u betragsmäßig nicht vernachlässigbar ist gegenüber der Lichtgeschwindigkeit. Die Newtonsche Mechanik für Teilchenhaufen, die über ihre Gravitationsanziehung wechselwirken, ist eine galileiinvariante Theorie. Für das ν-te Teilchen in einem solchen Haufen gilt die Bewegungsgleichung mν X mν mµ (~xµ − ~xν ) d2 ~xν =G . 2 dt |~xµ − ~xν |3 (8.33) µ(6=ν) Da die Teilchenmassen in allen galileischen Koordinatensystemen (d. h. Koordinatensystemen, die durch Galileitransformationen verknüpft sind) gleich sind und da gemäß (8.32) d2 ~xν d2 ~x0ν = , 2 dt dt0 2 ~xµ − ~xν = ~x0µ − ~x0ν , (8.34) folgt aus der Gültigkeit der Bewegungsgleichung mν X mν mµ (~xµ − ~xν ) d2 ~x0ν =G . 2 dt |~xµ − ~xν |3 (8.35) µ(6=ν) Wie behauptet, ändert die Bewegungsgleichung ihre Form nicht unter Galileitransformationen. Die Newtonsche Mechanik ist, ebenso wie die Galileitransformation, nur näherungsweise richtig. Wir wissen heute, dass sie nur gilt, solange die Geschwindigkeit aller Teilchen vernachlässigbar klein ist im Vergleich zur Lichtgeschwindigkeit. Bevor wir zur Besprechung der auch für große Relativgeschwindigkeiten gültigen Koordinatentransformation übergehen, sollen zwei Eigenschaften der Galileitransformation (8.32) besonders hervorgehoben werden. Beachten Sie, was im Alltag selbstverständlich erscheint, dass die Zeitkoordinate in allen Koordinatensystemen die gleiche ist und dass in t0 = t die räumlichen Koordinaten nicht eingehen. Gemäß der Galileitransformation sollte eine gleichförmig bewegte Uhr gleich schnell gehen wie eine ruhende. 152 8 Symmetrien Betrachten wir auch, dass die Galileitransformation das uns geläufige Additionsgesetz für Geschwindigkeiten beinhaltet. Lesen wir (8.32) als Zusammenhang zwischen den Koordinaten ~x(t) und ~x0 (t) eines gleichförmig bewegten Teilchens und differenzieren nach der Zeit. Mit ~v = d~x/dt und ~v 0 = d~x/dt entsteht das Gesetz Abbildung 8.4 welches durch Abbildung 8.4 veranschaulicht ist. Geschwindigkeiten addieren sich wie Vektoren. 8.5 Lorentzinvarianz Während eine bewegte Uhr 10 mal tickt, tickt eine gleich gebaute ruhende Uhr auch 10 mal? Experimente mit Armbanduhren und Schnellzügen legen eine bejahende Antwort nahe. Experimente mit hinreichend schnellen Teilchen erzwingen das Nein: die bewegte Uhr geht langsamer als die ruhende Kopie. Ein lustiges Beispiel geben µ Mesonen, die im äußeren Teil der irdischen Atmosphäre (einige 10 km über der Erdoberfläche) durch dort einfallende kosmische Strahlen erzeugt und dabei mit außerordentlich hohen Geschwindigkeiten ausgestattet werden. Nun sind Muonen instabile Teilchen. Ruhende Muonen zerfallen durchschnittlich nach 2 · 10−6 s. Die Alltagserfahrungen mit D-Zügen und Rennwagen lassen uns erwarten, dass Muonen, welche fast mit Lichtgeschwindigkeit in Richtung Erdoberfläche rasen, im Durchschnitt etwa 3 · 105 (km/sec) · 2 · 10−6 s ≈ 600m weit fliegen, bevor sie zerfallen; demnach sollten durch kosmische Strahlung erzeugte Muonen allenfalls in hoch fliegenden Luftballons, nicht aber an der Erdoberfläche nachweisbar sein. Tatsächlich fallen viele im Bodenlabor ein. Der unten noch ausführlicher zu diskutierende Grund dafür ist dieser: während für die Muonen 2 · 10−6 s vergehen, verstreicht im Bodenlabor, relativ zu dem sich die Muonen schnell bewegen, eine viel längere Zeit (die wir unten berechnen). Die Zeiteinheit mittlere Lebensdauer eines Muons“ ” beträgt ∼ 2 · 10−6 sec für eine mitbewegte Uhr, relativ zu der das Muon ruht, jedoch mehr für die Uhr im Labor. Die für die Beschreibung schnell bewegter Muonen einschlägigen Grundgesetze sind nicht galileiinvariant. Auch die Alltagserfahrung, dass Geschwindigkeiten sich wie Vektoren addieren, wird hinfällig bei Experimenten mit schnellen Teilchen. Ein einleuchtendes und historisch bedeutsames Beispiel gibt das Michelson-Morley Experiment, das wir kurz besprechen wollen. Bezüglich eines mit der Sonne starr verbundenen Koordinatensystems Ss bewegt sich die Erde mit einer Geschwindigkeit von |~u| ≈ 30 km/sec. Durch den Raum reisende Lichtsignale sollten, wenn das Vektoradditionsgesetz für Geschwindigkeiten gilt, im System Ss eine andere Geschwindigkeit haben, als 8.5 Lorentzinvarianz 153 im mit der Erde fest verbundenen System SE . Gilt denn ? ~cS = ~cE + ~u ? (8.36) Es müsste dann, falls in Ss die Lichtgeschwindigkeit richtungsunabhängig ist, auf der Erde eine Anisotropie der Lichtausbreitung feststellbar sein, d. h. eine Abhängigkeit der Lichtgeschwindigkeit |~cE | = ~cs − ~u vom Winkel zwischen ~u und ~cs . Das Michelson-Morley Experiment war darauf angelegt, eine derartige Anisotropie nachzuweisen. Das Resultat war negativ (übrigens zu allen Jahreszeiten). Ein positives Resultat des Michelson-Morley Experiments, d. h. eine Richtungsabhängigkeit des Beitrages der Lichtgeschwindigkeit (oder eine jahreszeitliche Schwankung solcher Anisotropie) für irdische Beobachter hätte das Relativitätsprinzip in Schwierigkeiten gebracht. Warum sollte die Lichtausbreitung im heliozentrischen (oder in irgendeinem galaktischen) Koordinatensystem isotrop sein, nicht aber im geozentrischen Koordinatensystem? Die experimentell gefundene Isotropie der Lichtausbreitung ist im Einklang mit dem Relativitätsprinzip und zeigt, dass das vektorielle Additionsgesetz (1) für Geschwindigkeiten zumindest für Lichtausbreitung nicht richtig sein kann. Erinnern wir uns an den Aufbau des Michelson-Morley Experiments. Auf einem starren Rahmen montiert sind eine Lampe, ein halbdurchlässiger Spiegel H, zwei Spiegel S1 und S2 sowie ein Schirm (Abbildung 8.5). Auf dem Schirm entsteht durch Überlagerung der von S1 und S2 reflektierten Teilstrahlen ein Interferenzmuster. Zunächst ist die Anordnung so orientiert, dass HS2 parallel zur Bahngeschwindigkeit der Erde verläuft. Anschließend wird die Anordnung um 90◦ gedreht, so das H S1 entlang der Erdbahn weist. Eine Anisotropie der Lichtausbreitung auf Grund der Bewegung der Erde im heliozentrischen Bezugssystem müsste sich in einer Verschiebung des Interferenzmusters auf dem Schirm zeigen. (Zur Übung machen Sie sich selbst wieder klar, welche Laufzeitunterschiede für die Phasen der Lichtwelle auftreten müssten, wenn (8.36) gälte.) Tatsächlich ist keine Verschiebung beobachtbar. Zu folgern ist, dass die Lichtgeschwindigkeit in allen gleichförmig zueinander bewegten Bezugssystemen gleich ist. Ebenfalls, dass die Naturgesetze, die die Lichtausbreitung beschreiben, nicht galileiinvariant sein können, denn wir hatten gesehen, dass die Galileitransformation die vektorielle Geschwindigkeitsaddition beinhaltet. Wir werden sehen, dass die Koordinatentransformation zwischen gleichförmig zueinander bewegten Koordinatensystemen eindeutig festgelegt ist durch die Forderungen der Konstanz der Lichtgeschwindigkeit und der Isotropie und Homogenität des Raumes sowie der Homogenität der Zeit in allen diesen Koordinatensystemen. Die resultierende Koordinatentransformation ist die Lorentztransformation. Wir werden uns auch klarmachen, dass die Maxwellsche Elektrodynamik, d. h. die für Lichtausbreitung zuständige Theorie, lorentzinvariant ist; ferner, wie die galileiinvariante Newtonsche Mechanik zu einer lorentzinvarianten Theorie verallgemeinert werden kann. Halten wir fest: in allen Labors“, die gegeneinander verschoben, gekippt ” oder gleichförmig bewegt aber ansonsten identisch sind, bringen gleiche Experimente gleiche Messergebnisse. Insbesondere die Lichtgeschwindigkeit hat in 154 8 Symmetrien Abbildung 8.5 allen solchen Labors denselben Wert. Folglich müssen alle Grundgesetze invariant sein unter den Koordinatentransformationen Translation, Rotation und Lorentztransformation entsprechend konstanter Relativgeschwindigkeit. Kapitel 9 Spezielle Relativitätstheorie 9.1 Die Lorentztransformation der Koordinaten Von einem Punkt ~x1 werde zur Zeit t1 (bezüglich irgendeines Koordinatensystems S) ein Lichtsignal ausgesandt und gelange zur Zeit t2 am Punkt ~x2 an. Da Licht sich mit der endlichen Geschwindigkeit c ausbreitet, gilt zwischen den Koordinaten ~x1 , t1 und ~x2 , t2 der Zusammenhang (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − c2 (t2 − t1 )2 = 0 . (9.1) 0 In einem zu S mit konstanter Geschwindigkeit ~u bewegten System S haben Aussendung und Ankunft des Lichtsignals andere Koordinaten, die wir ~x 01 , t01 bzw. ~x02 , t02 nennen können. Dabei müssen wir insbesondere auch die Möglichkeit zulassen, dass t1 6= t01 ist, d. h. dass die Zeit ihre in der Galileitransformaiton ausgezeichnete Rolle verliert. Da die Lichtgeschwindigkeit bezüglich S 0 den gleichen Wert wie bezüglich S hat, gilt in S 0 auch (x02 − x01 )2 + (y20 − y10 )2 + (z20 − z10 )2 − c2 (t02 − t01 )2 = 0 . (9.2) Um den folgenden Überlegungen eine anschauliche geometrische Interpretation geben zu können, denken wir uns ein vierdimensionales Koordinatensystem mit drei räumlichen Achsen x, y, z und einer zusätzlichen Achse, auf der wir die Zeit auftragen. Einen Punkt im Raum-Zeit-Kontinuum nennen wir ein Ereignis und definieren den Minkowskiabstand τ12 zweier Ereignisse ~x1 , t1 und ~x2 , t2 durch 2 −τ12 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − c2 (t2 − t1 )2 . (9.3) Gemäß dieser Definition haben zwei durch Lichtsignale verbundene Ereignisse den Abstand Null. Aus der Konstanz der Lichtgeschwindigkeit folgt, dass ein in irgendeinem System S verschwindender Abstand auch in allen anderen dazu gleichförmig bewegten Systemen S 0 verschwindet. Dies ist eine starke Forderung an die Koordinatentransformation von S und S 0 . Darüber hinaus muss die gesuchte Lorentztransformation auch nicht verschwindende Abstände invariant lassen, wenn nicht die in S etwa konstatierte Homogenität und Isotropie des Raumes und die Homogenität der Zeit in S 0 verloren sein soll. Um diese weitere Forderung zu begründen, betrachten wir 155 156 9 Spezielle Relativitätstheorie insbesondere zwei infinitesimal benachbarte Ereignisse, deren Koordinaten in S ~x, t und ~x + d~x, t + dt bzw. in S 0 ~x0 , t0 und ~x0 + d~x0 , t0 + dt0 lauten. Die entsprechenden Abstände dτ und dτ 0 müssen, da im gleichen Sinn klein, einander proportional sein dτ 0 = adτ , (9.4) wobei der Proportionalitätsfaktor a wegen der Homogenität von Raum und Zeit nicht von ~x und t nicht von ~x und t abhängen darf. Bleibt zu diskutieren, ob a von der Relativgeschwindigkeit ~u der beiden Systeme S und S 0 abhängen kann. Aus der Isotropie des Raumes können wir sofort folgern, dass jedenfalls die Richtung von ~u nicht in a eingehen darf, so dass allenfalls eine Abhängigkeit vom Betrag |~u| in Frage kommt. Um letztere Möglichkeit zu prüfen, betrachten wir drei Systeme S, S 0 und 00 S . Es mögen sich von S aus gesehen, S 0 mit ~v1 und S 00 mit ~v2 bewegen. Die Relativgeschwindigkeit zwischen S 00 und S 0 heiße ~v12 . Für die Abstände der beiden differenziell benachbarten Ereignisse haben wir die Relationen dτ 0 = a(|~v1 |)dτ dτ 00 = a(|~v2 |)dτ dτ 0 = a(|~v12 |)dτ 00 , (9.5) die nur dann miteinander verträglich sind, wenn gilt a(|~v12 |) = a(|~v1 |) . a(|~v2 |) (9.6) Die linke Seite dieser Gleichung hängt vom Winkel zwischen den Vektoren ~v1 und ~v2 ab, die rechte aber nicht, so dass jede Abhängigkeit des Proportionalitätsfaktors a von irgendeiner Geschwindigkeit auszuschließen ist. Es folgt a = 1 und somit dτ = dτ 0 , (9.7) also die Invarianz differenzieller Abstände unter der gesuchten Lorentztransformation. Da endliche Abstände sich als Summen differenzieller Abstände darstellen lassen, muss die gesuchte Lorentztransformation sogar beliebige Abstände im Raum-Zeit-Kontinuum erhalten. Erinnern wir uns an Altbekanntes aus dem gewöhnlichen (euklidischen) dreidimensionalen Raum. Die einzigen Koordinatentransformationen die den gewöhnlichen (euklidischen) Abstand ¡ ¢1/2 d12 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 (9.8) invariant lassen, sind Translationen und Drehungen. Zwar ist das vierdimensionale Raum-Zeit-Kontinuum kein euklidischer Raum mit vier völlig gleichberechtigten Achsen (wegen des einen Minuszeichens vor dem Zeitquadrat in (9.3)), jedoch legt die Ähnlichkeit des Abstandes (9.3) mit dem gewöhnlichen Abstand (9.8) die Vermutung nahe, dass die den Abstand (9.3) erhaltenden Koordinatentransformationen gerade Translationen und Drehungen“ sind. ” 9.1 Die Lorentztransformation der Koordinaten 157 Translationen sind Transformationen der Form ~ ~x0 = ~x + d, t0 = t + t 0 (9.9) und erhalten offenbar den Abstand (9.3). Das ist gut so, sonst wäre der Homogenität von Zeit und Raum verletzt. Drehungen“ im vierdimensionalen ” Raum-Zeit-Kontinuum sind insbesondere auch rein räumliche Drehungen x0i = 3 X Rij xj , t0 = t, RR̃ = 1 , (9.10) j=1 denn diese lassen, wie wir im letzten Kapitel gelernt haben, den gewöhnlichen räumlichen Abstand d12 (9.8) und somit auch den Minkowskischen Abstand τ12 invariant. Diese rein räumlichen Rotationen haben natürlich nichts mit einer relativen Bewegung von S und S 0 zu tun. Unter den Drehungen“ ohne Analogon im gewöhnlichen Raum muss es sol” che geben, die sich ganz in der x − t-Ebene vollziehen, so dass die Koordinaten y und z sich gar nicht ändern und die Koordinaten x0 , t0 in S 0 mit den entsprechenden in S, also x und t, linear zusammenhängen. Physikalisch müssen solche Drehungen“ einer Relativgeschwindigkeit ~u zwischen S und S 0 entsprechen, die ” parallel zur x- und x0 -Achse verläuft. Setzen wir an ct0 = Ax + Bct x0 = Cx + Dct y0 = y z0 = z . (9.11) Zur Bestimmung der vier Parameter A, B C, D haben wir zunächst die Forderung, dass der Minkowskiabstand des Ereignisses ~x, t vom Ursprung invariant bleiben muss, d. h. 2 2 c 2 t2 − x 2 = c 2 t0 − x 0 . (9.12) Da x0 und t0 beliebig sind, ergeben sich nach Eintragen von (9.11) drei unabhängige Gleichungen, so dass in der Transformation (9.11) ein freier Parameter bleibt. Wir finden leicht AB − CD = 0, A2 − C 2 = −1 B 2 − D2 = 1, wählen den freien Parameter gemäß A = D = sinh ψ, B = C = cosh ψ und erhalten die Drehung“ ” ct0 = ct cosh ψ + x sinh ψ x0 = ct sinh ψ + x cosh ψ . (9.13) Der Drehwinkel“ ψ muss sich durch die Geschwindigkeit u ausdrücken lassen, ” mit der sich S relativ zu S 0 bewegt. Um diesen Zusammenhang zu finden, betrachten wir insbesondere den räumlichen Ursprung von S, der zu allen Zeiten t die Koordinate x = 0 hat. Im System S 0 hat er die Koordinaten ct0 = ct cosh ψ, x0 = ct sinh ψ , 158 9 Spezielle Relativitätstheorie woraus folgt u x0 = tanh ψ = . (9.14) 0 ct c Damit ist die Lorentztransformation voll spezifiziert und lautet für den Fall, dass S sich von S 0 aus gesehen mit der Geschwindigkeit u in x0 -Richtung bewegt, ct + uc x ct0 = p 1 − u2 /c2 x0 = p ut + x 1 − u2 /c2 y0 = y z0 = z . (9.15) Beachten wir, dass die Lorentztransformation (9.15) im Grenzfall kleiner Relativgeschwindigkeiten, d. h. in nullter Ordnung in u/c in die aus dem Alltag bekannte Galileitransformation übergeht. Da für Waldläufer, Schnellzüge und sogar für unerlaubt schnelle Autos das Verhältnis u/c stets klein ist, gilt im Erfahrungsbereich des Alltags die Galileitransformation mit guter Genauigkeit. Für u = c und u > c verliert die Lorentztransformation (9.15) ihren Sinn, da die Nenner verschwinden bzw. imaginär werden. Dem entspricht die Erfahrung, dass die Bewegung von massiven Teilchen mit Licht- und Überlichtgeschwindigkeit nicht möglich ist. 9.2 Relativität der Gleichzeitigkeit In der Galileitransformation war die Zeitkoordinate ausgezeichnet. Wegen t = t 0 ist es beim Umgang mit langsamen Teilchen wie Radfahrern etc. erlaubt und beliebt, von einer absoluten Zeit zu reden. Nicht mehr beim Umgang mit schnellen Teilchen. Es ist eine der erstaunlichsten Konsequenzen der Lorentztransformation, dass zwei Ereignisse, die für einen Beobachter gleichzeitig erscheinen, für einen anderen, relativ zum ersten bewegten Beobachter zu verschiedenen Zeitpunkten stattfinden. Der Beobachter B benutze das System S und registriere zwei gleichzeitige Ereignisse an benachbarten Orten auf der x-Achse, d. h. ∆t = 0 und ∆x 6= 0. Der Beobachter B 0 sehe S mit u in x0 -Richtung fahren und registriert für dieselben Ergebnisse ³ ´ u ∆x u/c 1 ∆t + 2 ∆x = p · 6= 0 . (9.16) ∆t0 = p 2 2 2 2 c c 1 − u /c 1 − u /c Wegen des Faktors u/c sind wir durch Alltagserfahrung nicht an diese Relativität des Begriffs der Gleichzeitigkeit gewöhnt. 9.3 Zeitdilatation Als empirisches Resultat bei schnellen Teilchen hatte ich Ihnen schon vorgestellt, dass schnell bewegte Uhren deutlich langsamer gehen als ruhende. Jetzt können wir’s nachrechnen. 9.3 Zeitdilatation 159 Der Beobachter B schaue auf seine ruhende Uhr. Zwei aufeinander folgende Ticks sind Ereignisse mit den Koordinatendifferenzen ∆~x = 0 und ∆t, wobei ∆t die vom Fabrikanten garantierte, der Uhr eigene Zeiteinheit ist. Der Minkowskiabstand dieser Ticks ist p ∆τ = c2 (∆t)2 − (∆~x)2 = c∆t . (9.17) Wir werden künftig die mit der Einheit ∆t = ∆τ /c multiplizierte laufende Zahl der Ticks der Uhr die Eigenzeit der Uhr nennen. Der Beobachter B 0 sehe die Uhr mit Geschwindigkeit u in die x0 -Richtung fliegen. Er registriert mit Hilfe von Uhren, die längs der x0 -Achse ruhend aufgestellt sind, für das Zeitintervall zwischen zwei Ticks der bewegten Uhr den Wert ∆t0 ; überdies sieht er die Ticks an verschiedenen Orten stattfinden, die um die räumliche Distanz ∆x0 = u∆t0 auseinander liegen. Er gibt den Minkowskiabstand der beiden Ticks an als p p (9.18) ∆τ 0 = c2 (∆t0 )2 − u2 (∆t0 )2 = c∆t0 1 − u2 /c2 . Der Minkowskiabstand zweier Ereignisse ist aber in allen gleichförmig zueinander bewegten Systemen gleich, so dass wir folgern ∆t0 = p ∆t 1 − u2 /c2 . (9.19) Die bewegte Uhr scheint langsamer zu ticken als ihr ruhendes Duplikat. Eine drastische Illustration der Zeitdilatation erfährt ein fiktiver Reisender am Rand einer schnell rotierenden Kreisscheibe (Abbildung 9.1). Vom ruhenden Laborsystem aus gesehen dauert eine Rundreise Tlab , entsprechend der Kreisfrequenz ω = 2π/Tlab . Der Reisende liest auf seiner mitgeführten Uhr als Zeit einer Umdrehung Trot ab. Die nachfolgende Rechnung zeigt Trot < Tlab (Reisen erhält jung). Abbildung 9.1 Bei der Berechnung der Zeit Trot stoßen wir zunächst auf die Schwierigkeit, dass die Bewegung des Reisenden nicht mit konstanter Geschwindigkeit erfolgt, also nicht gleichförmig ist, so dass die Lorentztransformation gar nicht anwendbar scheint. Wir können aber die Kreisbewegung des Reisenden durch eine stückweise gleichförmige Bewegung längs eines Polygonzuges approximieren (Abbildung 9.2). Bezüglich jedes Geradenstücks geben wir mit Hilfe der 160 9 Spezielle Relativitätstheorie Abbildung 9.2 Lorentztransformation den Zusammenhang zwischen der Reisedauer ∆tlab in Laborzeit und der Reisedauer ∆trot der Bordzeit an, ∆tlab = p ∆trot 1− u2 /c2 ≈p ∆trot 1 − ω 2 R2 /c2 (9.20) wobei die Reisegeschwindigkeit als u = ωR approximiert wurde. In den Ecken des Polygons verbringt der Reisende keine Zeit. Also finden wir die Reisezeit für einen Umlauf durch Summieren der Zeiten, die auf den Geradenstücken verbracht werden. Wir denken uns die Polygoneinteilung beliebig verfeinert und erhalten p (9.21) Tlab = Trot / 1 − ω 2 R2 /c2 > Trot . Das gewonnene Resultat verdient eine weitere Bemerkung. Wenn wir unter Berufung auf die Lorentztransformation feststellen, dass eine gleichförmig bewegte Uhr langsamer geht als eine ruhende, so tut sich eine Schwierigkeit auf. Welche der beiden Uhren bewegt sich und geht daher langsamer? Der Beobachter B könnte dem Reisenden B 0 zurufen: Ich ruhe, Du fliegst, ich altere ” leider schneller“. Mit nicht minderem Recht könnte B 0 sich selbst für ruhend halten und B um die höhere Lebenserwartung beneiden. Ein Paradox? Nein, denn die beiden gegeneinander gleichförmig bewegten Beobachter begegnen sich einmal und nie wieder, haben also keine Möglichkeit eines späteren Uhrenvergleichs. Anders die beiden Menschen, deren einer auf der rotierenden Scheibe reist, während der andere im Labor sitzt und mit dem Reisenden nach jedem Umlauf die Uhren vergleichen kann. Kein Zweifel nun, wer hier reist und wer ruht. Der Mitrotierende fühlt Beschleunigungskräfte, der Ruhende nicht. Kein Zweifel, der Ruhende altert schneller. Bei Rundflügen schneller Flugzeuge ist inzwischen auch experimentell verifiziert, dass die auf Borduhren ermittelte Reisedauer kleiner ist als die auf im Ausgangspunkt ruhenden Uhren abgelesene. Für Astronomen wichtig ist das folgende Exempel der Zeitdilatation für bewegte Uhren. Denken wir uns als Uhr“ eine monochromatische Strahlungs” quelle auf einem entfernten Stern. Die Ticks“ dieser Uhr erfolgen, wenn die ” Quelle als ruhend beobachtet wird, im Zeitabstand ∆t = 1/ν. Wenn sich die Quelle jedoch relativ zum Beobachter mit der Geschwindigkeit ~u bewegt, so ist das Zeitintervall ∆t0 zwischen der Emission aufeinander folgender Wellenmaxima durch (9.19) gegeben. Dies ist jedoch nicht die Zeitspanne ∆tobs zwischen den Ankünften aufeinander folgender Wellenmaxima beim Beobachter, denn im 9.4 Längenkontraktion 161 Intervall ∆t0 bewegt sich die Quelle und verändert die Distanz zum Beobachter um ~ur ∆t0 , entsprechend der Komponente ~ur der Geschwindigkeit ~u längs der Verbindungslinie von Beobachter zur Quelle (Abbildung 9.3). Abbildung 9.3 Demnach hat jedes Wellenmaximum einen Weg zum Beobachter zurückzulegen, der um ~ur ∆t0 gegenüber dem Weg des vorangehenden Maximums geändert ist. Die Wellenmaxima sind bei der Ankunft beim Beobachter zeitlich um ∆tobs = ∆t0 + ur 0 1 + ur /c ∆t = p ∆t c 1 − u2 /c2 (9.22) getrennt. Die vom Beobachter registrierte Frequenz νobs = 1/∆tobs des Lichts ist also verschieden von der Frequenz ν = 1/∆t, die er fände, wenn die Quelle ruhte, und es gilt p 1 − u2 /c2 ν. (9.23) νobs = 1 + ur /c Sie prüfen leicht nach, dass diese so genannte Dopplerverschiebung eine Rotverschiebung (νobs < ν) darstellt, wenn sich die Quelle vom Beobachter entfernt, während das Licht einer sich nähernden Quelle blauverschoben ist (νobs > ν). Ich hatte auf die astronomische Bedeutung dieser Dopplerverschiebung hingewiesen. Im Licht vieler Sterne findet man eine Vielfalt von Spektrallinien, aus denen sich oft Spektren bestimmter Atome oder Ionen aussondern lassen. In solchen Fällen besteht die Möglichkeit, einzelne Spektrallinien zu identifizieren und deren Frequenzen νobs zu vergleichen mit den Frequenzen ν der entsprechenden im irdischen Labor erzeugten Linien. Aus dem Verhältnis ν/νobs kann dann die Relativgeschwindigkeit zwischen dem entsprechenden Stern und der Erde bestimmt werden. 9.4 Längenkontraktion Es ist eine weitere unerwartete Konsequenz der Lorentztransformation - und somit eine Eigenschaft der Natur -, dass an ein- und demselben Körper verschiedene Lineardimensionen vermessen werden, je nachdem, ob er in Ruhe oder in Bewegung ist. 162 9 Spezielle Relativitätstheorie Im System S ruhe ein Maßstab der Länge l parallel zur x-Achse. Im achsenparallelen System S 0 bewege sich der Stab mit seinem Ruhesystem mit der Geschwindigkeit u in x0 -Richtung. Im System S 0 sollen zu einem Zeitpunkt t0 die Endpunkte x0links und x0rechts gemessen werden. Mit den Endpunkten xlinks und xrechts im Ruhesystem bestehen die durch die Lorentztransformation gegebenen Zusammenhänge xlinks = p xrechts = p 1 1 − u2 /c2 1 1− u2 /c2 (−ut0 + x0links ) (−ut0 + x0rechts ) . (9.24) Die Länge l = xrechts −xlinks im Ruhesystem des Stabes und die Länge bezüglich des Systems S 0 , l0 = x0rechts − x0links , sind also verknüpft durch p l0 = l 1 − u2 /c2 ≤ l . (9.25) Die größtmögliche Länge hat der Stab in seinem Ruhesystem. Quer zur Bewegungsrichtung (hier der x0 -Richtung) erleidet der Stab keine Kontraktion, da die Lorentztransformation die entsprechenden Koordinaten unverändert lässt. 9.5 Addition von Geschwindigkeiten Wie schon mehrfach angedeutet, addieren sich große ( relativistische“, d. h. ” |~v | 6¿ c) Geschwindigkeiten nicht wie Vektoren. Betrachten wir die gleichförmige Bewegung eines Teilchens von zwei achsenparallelen Systemen S und S 0 aus, wobei S sich bezüglich S 0 in x0 -Richtung mit der Geschwindigkeit u bewegen soll. Bezüglich S (S 0 ) bewegt sich das Teilchen im Zeitintervall ∆t(∆t0 ) um d~x(d~x0 ). Die Lorentztransformation gibt die Zusammenhänge p dt0 = (dt + u dx/c2 )/ 1 − u2 /c2 p dx0 = (u dt + dx)/ 1 − u2 /c2 dy 0 = dy dz 0 = dz . (9.26) Hier finden wir sofort die Relation der Geschwindigkeiten ~v = d~x/dt und ~v 0 = d~x0 /dt0 zu p 1 − u2 /c2 u + vx 0 0 = v , v , vx = y y 1 + uvx /c2 1 + uvx /c2 p 1 − u2 /c2 0 vz = v z . (9.27) 1 + uvx /c2 Dieses Transformationsgesetz reduziert sich für hinreichend kleine Geschwindigkeiten auf das Additionsgesetz für gewöhnliche Vektoren, liefert jedoch drastisch andere Resultate als letzteres, wenn die beteiligten Geschwindigkeiten groß 9.6 Lorentzinvarianz der Maxwellschen Gleichungen 163 werden. Insbesondere lesen wir aus (9.27) wieder ab, dass die Lichtgeschwindigkeit eine nicht überschreitbare Grenzgeschwindigkeit ist. Für ~v = (c, 0, 0) ist auch ~v 0 = (c, 0, 0). 9.6 Lorentzinvarianz der Maxwellschen Gleichungen Wir hatten in 6.5 die Maxwellschen Gleichungen als Wellengleichungen für das ~ und das skalare Potential ϕ geschrieben. Diese Form der Vektorpotential A Maxwell-Gleichung erlaubt einen leichten Nachweis der Lorentzinvarianz der Maxwellschen Elektrodynamik, den ich jetzt führen will. Im Koordinatensystem S lauten die Wellengleichungen der Potentiale ¶ µ 1 ∂2 ~ = −~j/ε0 c2 (9.28) ∆2 − 2 2 A c ∂t ¶ µ 1 ∂2 ∆2 − 2 2 ϕ = −ρ/ε0 , c ∂t wobei ~j die elektrische Stromdichte und ρ die Ladungsdichte sind und die Potentiale der Lorentzkonvention ~+ 1 ∂ϕ=0 div A c2 ∂t (9.29) unterworfen sind. Um zu zeigen, dass im zu S achsenparallelen System S 0 , bezüglich dessen S sich mit der Geschwindigkeit u in x0 -Richtung bewegt, die Gleichungen (9.28) und (9.29) ihre Form behalten, müssen wir die Lorentztransformation der Koordinaten (ct, ~x) eintragen und das Transformationsverhalten ~ sowie der Quellen ρ und ~j finden. der Potentiale ϕ und A Aus der Lorentztransformation ct0 = γ (ct + βx), x0 = γ (βct + x), y 0 = y, z0 = z mit p 1 − u2 /c2 , (9.30) µ ¶ ∂t0 ∂ ∂x0 ∂ ∂ = + erhalten wir zunächst mit Hilfe der Kettenregel ∂t ∂t ∂t0 ∂t ∂x0 β = u/c, γ = 1/ µ ¶ 1 ∂ ∂ 1 ∂ =γ β 0 + c ∂t ∂x c ∂t0 ¶ µ 1 ∂ ∂ ∂ + β =γ ∂x ∂x0 c ∂t0 ∂ ∂ = ∂y ∂y 0 ∂ ∂ = 0 . ∂z ∂z (9.31) 164 9 Spezielle Relativitätstheorie Wir können sofort die Lorentzinvarianz der Lorentzkonvention prüfen, indem wir (9.31) in (9.29) verwenden, ∂ ∂ 1 ∂ ∂ Az + Ay + Ax + 2 ϕ ∂z ∂y ∂x c ∂t µ ¶ µ ¶ ∂ ∂ 1 ∂ 1 ∂ 1 ∂ ∂ = 0 Az + 0 Ay + γ +β ϕ Ax + γ β 0 + 0 0 0 ∂z ∂y ∂x c ∂t ∂x c ∂t c µ µ ¶ ¶ ∂ ∂ 1 1 1 ∂ ∂ γ Ax + βϕ + γ βAx + ϕ . = 0 Az + 0 Ay + ∂z ∂y ∂x0 c c ∂t0 c 0= Wenn wir die transformierten Potentiale wählen gemäß ϕ0 /c = γ(βAx + ϕ/c) A0x = γ(Ax + βϕ/c) (9.32) A0y = Ay A0z = Az , so lautet die Lorentzkonvention in S 0 genauso wie in S, nämlich 0= ∂ 0 ∂ ∂ 0 1 ∂ ~ 0 + 1 ∂ ϕ0 . Az + 0 A0y + A x + 2 0 ϕ0 = ∇ 0 · A 0 0 ∂z ∂y ∂x c ∂t c2 ∂t0 (9.33) ~ Im Vergleich von (9.32) und (9.30) zeigt sich, dass sich das Quadrupel (ϕ/c, A) genauso transformiert wie das Quadrupel der Koordinaten (ct, ~x). Wir werden ~ künftig das Viererpotential des elektromagnetischen Feldes nennen. (ϕ/c, A) Wenden wir uns jetzt den Wellengleichungen (9.28) zu. Den links stehenden Differentialoperator rechnen wir mit der Transformation (9.32) auf die Koordinaten (ct0 , ~x0 ) um, µ ¶2 ∂2 ∂ ∂2 ∂2 1 ∂ ∂2 1 ∂ ∂2 2 + + γ + + − = + β ∂z 2 ∂y 2 ∂x2 c2 ∂t2 ∂x0 c ∂t0 ∂z 0 2 ∂y 0 2 µ ¶2 1 ∂ ∂ − γ2 β 0 + ∂x c ∂t0 µ 2 ¶ ∂2 ∂ 1 ∂2 ∂2 − = 02 + 02 + γ 2 (1 − β 2 ) c2 ∂t0 2 ∂z ∂y ∂x0 2 = ∂2 ∂2 1 ∂ ∂2 + + − 2 02 , 2 2 c ∂t ∂z 0 ∂y 0 ∂x0 2 (9.34) und sehen, dass er beim Übergang von S zu S 0 seine Form beibehält. Um die ~ 0 ) im System S 0 zu erhalten, bilWellengleichungen für die Potentiale (ϕ0 /c, A den wir Linearkombinationen der Gleichungen (9.28) gemäß der Transformation 9.7 Feld einer gleichförmig bewegten Punktladung 165 (9.32) der Potentiale, µ ¶ 1 ∂2 ∇ − 2 0 2 A0z (~x0 , t0 ) = −jz (~x, t)/ε0 c2 c ∂t ¶ µ 1 ∂2 02 ∇ − 2 0 2 A0y (~x0 , t0 ) = −jy (~x, t)/ε0 c2 c ∂t µ ¶ 1 ∂2 02 ∇ − 2 0 2 A0x (~x0 , t0 ) = −γ (jx (~x, t) + βcρ(~x, t)) /ε0 c2 c ∂t µ ¶ µ ¶ 1 ∂2 1 2 ∇0 − 2 0 2 ϕ0 (~x0 , t0 ) = −γ β jx (~x, t) + ρ(~x, t) /ε0 . c ∂t c 02 (9.35) Offensichtlich reproduziert sich die Form der Wellengleichungen (9.28) genau, wenn wir als Transformationsverhalten der Quellen (cρ, ~j) fordern cρ0 (~x0 , t0 ) = γ (βjx (~x, t) + cρ(~x, t)) jx0 (~x0 , t0 ) = γ (jx (~x, t) + βcρ(~x, t)) (9.36) jy0 (~x0 , t0 ) = jy (~x, t) jz0 (~x0 , t0 ) = jz (~x, t) . Hiernach transformieren sich die Quellen (cρ, ~j) ebenso wie das Viererpotential ~ und die Koordinaten (ct, ~x). (ϕ/c, A) Wir haben soeben nachgerechnet, dass die Wellengleichungen (9.28) und die Lorentzkonvention (9.29) in allen gleichförmig zueinander bewegten Bezugssystemen gelten., wenn sie nur in einem System S richtig sind. Damit ist die Lorentzinvarianz der Elektrodynamik erwiesen. Als lehrreiche Übung bleibt Ihnen, das Transformationsverhalten der Felder ~ − grad ϕ ~ =−∂A E ∂t ~ = rot A ~ B aufzustellen. 9.7 Feld einer gleichförmig bewegten Punktladung Die Lorentzinvarianz der Elektrodynamik gestattet häufig, umständliche Rechnungen abzukürzen. Das Feld einer mit konstanter Geschwindigkeit ~u = (u, 0, 0) bewegten Ladung e, z. B. , lässt sich höchst einfach durch Lorentztransformation aus dem bekannten Feld im Ruhesystem S der Ladung gewinnen. In S gilt ϕ= 1 e , 4πε0 r ~=0 A (9.37) 166 9 Spezielle Relativitätstheorie mit r = |~x|. Im Laborsystem S 0 , in welchem sich die Ladung mit u in x0 Richtung bewege, haben wir aus (9.32) ϕ0 (~x0 , t0 ) = γ 1 e , 4πε0 r A0x (~x0 , t0 ) = 1 1 e γβ c 4πε0 r A0y = A0z = 0 (9.38) Um hieraus ϕ0 , und Ax0 als Funktionen der Laborkoordinaten ~x0 , t0 zu erhalten, müssen wir nur rechts die Größe r = (x2 +y 2 +z 2 )1/2 durch ~x0 und t0 ausdrücken. Mit Hilfe der Lorentztransformation (9.30) bzw. deren Umkehrung (die sich durch u → −u ergibt) erhalten wir ϕ0 = = 1 q 4πε0 1 q 4πε0 γe γ 2 (x0 − βct0 )2 + y 0 2 + z 0 2 e (x0 − ut0 )2 + (1 − u2 /c2 )(y 0 2 + z 0 2 ) 1 A0x = β ϕ0 c (9.39) Sie sehen, dass die Äquipotentialflächen von ϕ0 durch (x0 − ut0 )2 + (1 − 2 2 u /c2 )(y 0 + z 0 ) = const > 0 gegeben sind, also die Form von Rotationsellipsoiden haben. Die Symmetrieachse dieser Flächen verläuft natürlich in der Bewegungsrichtung der Ladung. Beachten Sie auch, dass die Ellipsoide in Bewegungsrichtung abgeplattet sind, u. z. um so stärker, je schneller die Ladung fliegt. Im Grenzfall u → 0 gehen die Äquipotentialflächen wieder über in die für die ruhende Ladung charakteristischen Kugeln. Es ist bemerkenswert, wie leicht das Resultat (9.39) hier mit Hilfe der Lorentztransformation erhältlich ist. Sie dürfen, um ein Gefühl für die Ersparnis an Rechenaufwand zu kriegen, für sich einen anderen Weg ausprobieren, etwa die Integration der Wellengleichungen für die Potentiale mit den Quellen 2 ρ = eδ(x − ut)δ(y)δ(z), 9.8 jx = uρ, j y = jz = 0 . (9.40) Lorentzskalare und Lorentzvektoren Spielen wir wieder mit der geometrischen Analogie zwischen gewöhnlichen Drehungen im dreidimensionalen euklidischen Raum und Lorentztransformationen im vierdimensionalen Raum-Zeit-Kontinuum. Drehungen lassen den euklidischen Abstand zweier Raumpunkte ¤1/2 £ d12 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 (9.41) invariant, während Lorentztransformationen den Minkowskiabstand zweier RaumZeit-Punkte ¤1/2 £ (9.42) τ12 = c2 (t2 − t1 )2 − d212 unverändert lassen. Wir hatten d12 wie jede unter Drehungen invariante Größe einen Skalar genannt und entsprechend bezeichnen wir den Minkowskiabstand 9.8 Lorentzskalare und Lorentzvektoren 167 τ12 und jede andere unter Lorentztransformationen invariante Größe als einen ~+ Lorentzskalar. Als weitere Lorentzskalare hatten wir schon die Größen div A 1 ∂ 1 ∂2 2 ϕ und den Wellenoperator ∇ − identifiziert. c2 ∂t c2 ∂t2 Vektoren im dreidimensionalen euklidischen Raum kennen Sie als durch Betrag und Richtung festgelegte Größen. Während Betrag und Richtung eines Vektors bei Drehungen des Koordinatensystems unverändert bleiben, ändert sich doch das Tripel seiner Koordinaten. Wir hatten nachgerade einen Vektor ~ als ein Zahlentripel (Vx , Vy , Vz ) definiert, das sich bei Drehungen des KoordiV natensystems genauso transformiert wie die Koordinaten x, y, z eines Punktes, nämlich Vi0 = 3 X Rij Vj mit RR̃ = 1 . (9.43) j=1 Die Frage liegt nahe, ob es im vierdimensionalen Raum-Zeit-Kontinuum nicht außer dem Koordinatenquadrupel (ct, x, y, z) eines Ereignisses weitere Quadrupel (V 0 , Vx , Vy , Vz ) gibt, die sich unter Lorentztransformationen ebenso verhalten wie das Koordinatenquadrupel, nämlich 0 V 0 = γ(βVx + V 0 ) V 0 x = γ(Vx + βV 0 ) (9.44) V 0 x = Vy V 0 z = Vz wobei wieder β = u/c, γ = (1 − β 2 )−1/2 . Tatsächlich gibt es solche Quadrupel, die wir im Sinne der hier verfolgten Analogie Lorentzvektoren nennen. Zwei wichtige Lorentzvektoren hatten wir im obigen Streifzug durch die Elek~ und das trodynamik ausfindig gemacht, das Quadrupel der Potentiale (ϕ/c, A) Stromdichte-Ladungsdichtequadrupel (cρ, ~j). Weitere Lorentzvektoren werden folgen. Die Wichtigkeit des Begriffs des Lorentzvektors ist ganz analog der Wichtigkeit des Begriffs des Vektors. Sie erinnern sich: stimmen zwei Vektoren in einem Koordinatensystem S überein, so auch in allen anderen zu S verdrehten. Wenn ein Naturgesetz als die Gleichheit zweier Vektoren formuliert werden kann, so gilt dieses Gesetz gleichermaßen in allen zueinander verdrehten Koordinatensystemen; die Isotropie des Raumes ist dann manifest. Genauso ist das Relativitätsprinzip, d. h. die Gleichberechtigung aller gleichförmig zueinander bewegten Koordinatensysteme, manifest, wenn ein Naturgesetz als die Gleichheit zweier Lorentzvektoren geschrieben werden kann; der Grund dafür ist, dass zwei Lorentzvektoren in allen solchen Koordinatensystemen übereinstimmen, wenn sie in irgendeinem gleich sind. Letztere Aussage wirft ein nützliches Verfahren ab zum Prüfen der Lorentzinvarianz von Gleichungsquadrupeln. Die Invarianz ist gesichert, wenn die vier fraglichen Gleichungen als Gleichheit zweier Lorentzvektoren geschrieben werden können. Wir hatten diese Methode beim Nachweis der Lorentzinvarianz der Elektrodynamik bereits angewendet: nachdem sich der Wellenopera∂2 tor ∇2 − c12 ∂t 2 als Lorentzskalar erwiesen hatte, ergaben sich die vier Wellen³ ´ 2 ~ gleichungen als Gleichung zwischen den Lorentzvektoren ∇2 − 12 ∂ 2 (ϕ/c, A) c ∂t 168 9 Spezielle Relativitätstheorie und (cρ, ~j). 9.9 Relativistischer Impuls und Viererimpuls eines Teilchens In der Newtonschen Mechanik hatten wir den Vektor m~v den Impuls eines Teilchens genannt. Der wichtigste Grund für die Beliebtheit dieses Begriffs beim P Umgang mit langsamen Teilchen ist, dass der Newtonsche Gesamtimpuls mν ~vν eines abgeschlossenen Teilchenhaufens zeitlich konstant bleibt. Leider ν entfällt dieser Grund, wie wir sehen werden, bei schnellen Teilchen. Eine weitere PPeinlichkeit wäre in Kauf zu nehmen, wenn wir den Newtonvν auch zur Formulierung der Kinematik und Dynamik schen Impuls ν mν ~ schneller Teilchen verwendeten. Während ¡P P sich ¢unter GalileitransPdiese Größe vν0 = ~u ν mν + ν mν ~vν , gibt die Lorentzformation einfach verhält ν mν ~ transformation ein abstoßend hässliches, nämlich nichtlineares Transformationsgesetz, das Sie aus dem Transformationsgesetz für die Geschwindigkeit (s. 9.5) entnehmen können. Die obigen Betrachtungen legen die Suche nach einer Verallgemeinerung des Newtonschen Impulses nahe. Diese Verallgemeinerung sollte sich (i) für |~v |/c ¿ 1 auf den Newtonschen Impuls reduzieren, und (ii) unter Lorentztransformationen einfach benehmen. Es gibt einen solchen relativistischen Impuls, und wir können ihn leicht finden durch Präzisierung der obigen Kritik am Newtonschen Begriff. Die Forderungen (i) und (ii) sind sicher erfüllt, wenn der relativistische Impuls p~ ³die drei Raumkomponenten eines Lorentzvektors gibt. Nun stellt das ´ dy dz dx Tripel m dt , m dt , m dt im Gegensatz zum Tripel (m dx, m dy, m dz) genau deshalb keinen Teil eines Lorentzvektors dar, weil das im Labor gemessene Zeitinkrement dt kein Lorentzskalar ist. Es gibt aber einen Lorentzskalar, der sich für ein langsames Teilchen auf dt reduziert, u. z. die Eigenzeit des bewegten Teilchens, d. h. die Zeit, die auf einer vom Teilchen mitgeführten Uhr abgelesen werden könnte. In jedem Augenblick lässt sich ein zum Labor gleichförmig bewegtes Koordinatensystem so finden, in dem das Teilchen ruht. In diesem momentanen Ruhesystem gilt für die am Teilchen fixiert gedachte Uhr d~x0 = 0, so dass das auf ihr abgelesene Eigenzeitinkrement dt0 bis auf den Faktor 1c mit dem Inkrement dτ des Minkowskiabstands übereinstimmt. Da dτ ein Lorentzskalar ist, können wir ihn auch leicht durch die Koordinateninkremente des Teilchens im Laborsystem ausdrücken, p p dτ = c2 dt2 − d~x2 = c dt 1 − v 2 /c2 . (9.45) Wenn wir uns die Bahnkurve des Teilchens mit τ anstatt mit der Laborzeit parametrisiert denken, so gilt für die Änderungsrate der Teilchenkoordinaten mit τ dt d~x 1 ~v d~x = =p . (9.46) 2 2 dτ dτ dt 1 − v /c c Bis auf den Faktor 1c stimmt also d~x/dτ für kleine Geschwindigkeit ~v mit ~v überein. Genau wie das Tripel d~x gibt nun das Tripel mc d~x/dτ die ersten drei 9.9 Relativistischer Impuls und Viererimpuls eines Teilchens 169 Komponenten eines Lorentzvektors, da mc wie dτ Lorentzskalare sind. Ansatzweise nehmen wir daher als relativistischen Impuls p~ = mc d~x m~v =p . dτ 1 − v 2 /c2 (9.47) Der zugehörige Lorentzvektor wird auch Viererimpuls genannt und lautet offenbar ! ¶ à µ m~v mc d~x cdt ,p ≡ (E/c, p~) . (9.48) = p , mc mc dτ dτ 1 − v 2 /c2 1 − v 2 /c2 Die zeitartige Komponente E/c = p mc 1 − v 2 /c2 (9.49) hat auch die Dimension eines Impulses, so dass E die Dimension einer Energie hat. Tatsächlich wird E als die relativistische Energie des Teilchens bezeichnet. Die Namensgebung relativistischer Impuls bzw. relativistische Energie für die in (9.47) bzw. (9.49) definierten Größen p~ bzw. E ist zumindest insofern sinnvoll, als sich diese Größen im Newtonschen Grenzfall kleiner Geschwindigkeit auf die entsprechenden Newtonschen Größen reduzieren gemäß p~ → m~v E → mc2 + (9.50) m 2 v + ··· 2 Beachten Sie dabei, dass die Energie eines Teilchens in der Newtonschen Mechanik nur bis auf eine additive Konstante definiert ist. In der relativistischen Mechanik jedoch, und somit in Stoßexperimenten mit schnellen Teilchen, ist die additive Konstante mc2 von großer Bedeutung. Ein ruhendes Teilchen hat nach (9.50) die Ruheenergie E0 = mc2 . (9.51) Sie haben früher schon gelernt, die Relation (9.51) als die von Einstein gefundene Äquivalenz von Masse und Energie zu lesen. Die folgenden Hinweise sollen Sie an einige für die Hochenergiephysik und auch für die Energiepolitik wichtige Anwendungen erinnern. Die Masse eines α-Teilchens ist kleiner als die Summe der Massen seiner Bausteine, d. h. je zweier Protonen und Neutronen. Wir hoffen, uns den so genannten Massendefekt bald in Fusionsreaktoren zunutze machen zu können. Ein Elektron und ein Positron, die mit entgegengesetzt gleichen Geschwindigkeiten aufeinander stoßen, können sich gegenseitig vernichten und als Reaktionsprodukt zwei γ-Quanten hinterlassen. Letztere sind nichts anderes als eine elektromagnetische Welle, die keine Masse, wohl aber Energie (und Impuls) p hat. Jedes der beiden γ-Quanten trägt die Energie mc2 / 1 − v 2 /c2 wobei v die Geschwindigkeit jedes Stoßpartners (lange) vor dem Stoß war. Masse wird also bei dieser Paarvernichtung in Energie verwandelt. Alle bisherige experimentelle Erfahrung zeigt, dass bei Stößen schneller Teilchen die Summe aller relativistischen Impulse (9.47) und auch die Summe aller 170 9 Spezielle Relativitätstheorie relativistischen Energien erhalten bleiben, wobei allerdings der Beitrag von an der Wechselwirkung beteiligten Feldern zu Energie und Impuls mit berücksichtigt werden muss. Im soeben besprochenen Beispiel der Paarvernichtung trägt das elektromagnetische Feld sogar den ganzen Impuls und die ganze Energie des Systems nach der Reaktion. Mit mehr formalem Aufwand, als wir hier treiben können, lässt sich zeigen, dass der gesamte Viererimpuls wechselwirkender Teilchen und Felder, die ein abgeschlossenes System bilden, zeitlich erhalten bleiben muss, wenn Raum und Zeit homogen sind. Ich erinnere nochmals daran, dass wir immerhin die Äquivalenz der Homogenität von Raum und Zeit mit der Erhaltung von Impuls und Energie für abgeschlossene rein mechanische Systeme im Newtonschen Grenzfall vorrechnen konnten. Aus den Ausdrücken (9.47) und (9.49) für p~ und E können wir die Geschwindigkeit ~v eliminieren und so einen Zusammenhang zwischen Energie und Impuls des Teilchens herstellen, E 2 /c2 − p~2 = m2 c2 . (9.52) Dieser Zusammenhang gilt unabhängig vom Koordinatensystem, d. h. beide Seiten der Gleichung sind Lorentzskalare. Man kann sich davon überzeugen, indem man die Lorentztransformation E 0 /c = γ(E/c + βpx ), p0x = γ(βE/c + px ), p0y = py , p0z = pz (9.53) auf der linken Seite von (9.52) einträgt. Die Rechnung erübrigt sich aber, da die linke Seite von (9.52) sich aus den Komponenten des Viererimpulses (E/c, p~) genauso aufbaut wie das Quadrat des Minkowskiabstands aus den Koordinaten (ct, ~x). Sie erinnern sich, dass die Lorentztransformation gerade durch die Forderung der Invarianz des Minkowskiabstands festgelegt war. Unter Verwendung der Lorentztransformation können Sie selber leicht eine ~ und Verallgemeinerung der eben getroffenen Aussagen beweisen. Wenn (A0 , A) ~ zwei beliebige Lorentzvektoren sind – die sich also beide wie (E/c, p~) in (B 0 , B) (9.53) transformieren –, so ist die Verknüpfung ~·B ~ A0 B 0 − A (9.54) ein Lorentzskalar. 9.10 Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld Um die Bewegung von Elektronen, Positronen und anderen geladenen Teilchen in Beschleunigungsanlagen beschreiben zu können, müssen wir die Newtonsche Bewegungsgleichung ersetzen durch eine relativistische Verallgemeinerung. Als empirisches Resultat kennen Sie ´ ³ d ~ + ~v × B ~ p~ = e E dt (9.55) mit p = m~v (1 − v 2 /c2 )−1/2 , wobei e und m die Ladung bzw. Masse des Teil~ und B ~ das elektrische bzw. magnetische Feld. Die chens bezeichnen und E 9.10 Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld 171 Änderung gegenüber der Newtonschen Bewegungsgleichung besteht in der Ersetzung des Newtonschen durch den relativistischen Impuls. Während diese Änderung für langsame Teilchen unerheblich ist, bringt sie die Vergrößerung der Trägheit eines Teilchens mit wachsender Geschwindigkeit zum Ausdruck. p Als Maß für die Trägheit kann offenbar die Größe m/ 1 − v 2 /c2 angesehen werden; da diese Größe mit v → c über alle Grenzen wächst, kann das Teilchen nie Lichtgeschwindigkeit erreichen. Trotz der angedeuteten vernünftigen Eigenschaften in den Grenzfällen v ¿ c und v / c ist keineswegs offensichtlich, dass die Gleichung (9.55) die richtige Bewegungsgleichung darstellt. Um uns dessen zu vergewissern, müssen wir nachweisen, dass (9.55) in allen gleichförmig zueinander bewegten Koordinatensystemen gilt. Zu diesem Zweck zeigen wir nun, dass (9.55) zu einer Gleichung zwischen zwei Lorentzvektoren äquivalent ist. Die linke Seite von (9.55) stellt nicht den räumlichen Teil eines Lorentzvektors dar, u. z. deshalb nicht, weil die Änderung d~ p des relativistischen Impulses p~ auf das Laborzeitinkrement dt statt auf einen Lorentzskalar bezogen ist. Ersetzen wir also, wie schon bei den Betrachtungen des letzten Paragrafen, das Laborzeitinkrement dt durch die Lorentz-invariante Änderung dτ /c der Eigenzeit des Teilchens gemäß p (9.56) dτ = c dt 1 − v 2 /c2 und schreiben (9.55) als ³ ´ e d~ p ~ + ~v × B ~ . = p E dτ c 1 − v 2 /c2 (9.57) Jetzt steht links, wie wir im letzten Paragrafen gezeigt haben, der räumliche Teil eines Lorentzvektors. Die zugehörige zeitartige Komponente dieses Lorentzvektors ist d(E/c)/dτ , also gegeben durch die Änderungsrate der Energie E des Teilchens mit der Eigenzeit desselben. Da die Energie eines Teilchens durch seinen Impuls und seine Masse schon festgelegt ist als p (9.58) E/c = m2 c2 + p~2 , können wir mit Hilfe von (9.59) die Änderungsrate d(E/c)/dτ ausrechnen zu c d~ p e dE/c ~ . ~v · E = p~ · = p 2 dτ E dτ c 1 − v 2 /c2 (9.59) Bei der zum letzten Glied in (9.59) führenden Zwischenrechnung ist beach~ = 0 das magnetische Feld die Energie des tenswert, dass wegen p~ · (~v × B) Teilchens nicht ändert. Ein Magnetfeld bewirkt eine Änderung der Richtung, nicht jedoch des Betrags des Impulses eines Teilchens. Was ist gewonnen, nachdem wir (9.55) zu (9.57) umformuliert und zusätzlich (9.59) aus (9.55) gefolgert haben? Zunächst nur, dass die linken Seiten von d d (9.56) und (9.59), also das Quadrupel ( dτ E/c, dτ p~), einen Lorentzvektor darstellen. Zu zeigen bleibt, dass das Quadrupel der rechten Seiten und somit auch die Viererkraft e ~ , ~v · E (9.60) f0 = p 2 c 1 − v 2 /c2 ´ ³ e ~ + ~v × B ~ f~ = p E 1 − v 2 /c2 172 9 Spezielle Relativitätstheorie sich unter Lorentztransformationen wie ein Lorentzvektor verhält. Dazu ist es ~ und B ~ durch bequem, in den Komponenten des Quadrupels (f 0 , f~) die Felder E ~ die Komponenten des Lorentzvektors (ϕ, A) der Potentiale auszudrücken, ~ =−∂A ~ − ∇ϕ, E ∂t ~ = rot A ~. B (9.61) Ferner nutzen wir aus, dass die Geschwindigkeit ~v des Teilchens in (9.60) nur über die Komponenten des Lorentzvektors à ! c ~v 0 (u , ~u) = p ,p = Vierergeschwindigkeit (9.62) 1 − v 2 /c2 1 − v 2 /c2 eingehen. Letzteres Quadrupel ist zweifellos ein Vierervektor, da es nur um einen Faktor m vom Viererimpuls des Teilchens abweicht. Mit Hilfe von (9.61) und (9.62) schreiben wir nun das Quadrupel (f 0 , f~) in der Form µ ¶ ∂ ~ e 0 ~ ~ f = − u ∇ϕ + A + e~u × rot A c ∂t µ ¶ e ∂ ~ 0 f = − ~u · ∇ϕ + A (9.63) c ∂t bzw. µ µ ¶ · µ ¶ ¶¸ ∂Ax ∂Az ∂Ay ∂Ax e 0 ∂ϕ ∂Ax + e uy − uz + − − fx = − u c ∂x ∂t ∂x ∂y ∂z ∂x usf. Nun ist es leicht, das Verhalten der Viererkraft (f 0 , f~) unter Lorentztransformationen zu studieren. Gehen wir wieder über zu einem System S 0 , bezüglich dessen sich das bisher verwendete S mit Geschwindigkeit u in x0 -Richtung bewegt und dessen Achsen zu denen von S parallel verlaufen. Die Lorentzvektoren ~ transformieren sich dabei wie üblich, (u0 , ~u) und (ϕ/c, A) 0 u0 = γ(u0 − βux0 ), 0 ux = γ(ux0 − βu0 ), uy = uy 0 , uz = u z 0 mit β = u/c, γ = (1 − β 2 )−1/2 (9.64) während wir für das Quadrupel der Ableitungen nach den Koordinaten schon in 9.6 gefunden hatten µ µ ¶ ¶ ∂ ∂ ∂ ∂ ∂ ∂ =γ β =γ +β 0 , +β , ∂ct ∂ct0 ∂x ∂x ∂x0 ∂ct0 ∂ ∂ = , ∂y ∂y 0 ∂ ∂ = 0 . ∂z ∂z Durch bloßes Eintragen von (9.64) und (9.65) in (9.63) finden wir ´ ´ ³ ³ 0 0 f 0 = γ f 0 − βfx0 , fx = γ fx0 − βf 0 , fy = fy0 , fz = fz0 . (9.65) (9.66) 9.11 Bewegung im konstanten elektrischen Feld 173 Das aber ist, genau wie (9.64), das Transformationsverhalten eines Lorentzvektors. Also gilt in allen gleichförmig zueinander bewegten Koordinatensystemen: Die Änderungsrate des Viererimpulses mit der Eigenzeit eines Teilchens ist gleich der auf das Teilchen wirkenden Viererkraft. Mit dieser Formulierung ist, Sie hören’s heraus, Newton Ehre erwiesen, wiewohl wir mehr im Sinn haben als die nur für langsame Teilchen gültige Urform des Gesetzes. Schreiben wir die manifest lorentzinvariante Form der Bewegungsgleichung des Teilchens nochmals auf, d d2 1 (E/c, p~) = cm 2 (ct, ~x) = (f 0 , f~). (9.67) dτ dτ c ³ ´ Das sind, bei gegebener Viererkraft f 0 (~x, t), f~(~x, t) , d. h. bei gegebenen Fel~ x, t) und B(~ ~ x, t), vier Differentialgleichungen zweiter Ordnung für die dern E(~ vier Funktionen x(τ ), y(τ ), z(τ ) und t(τ ). Hat man diese gelöst und eliminiert den Parameter τ , so erhält man die Bahnkurve des Teilchens in Form des zeitabhängigen Ortsvektors ~x(t). In der Praxis ist es meist bequemer, mit der zu (9.67) äquivalenten Form (9.55) der Bewegungsgleichung zu rechnen, ohne erst den invarianten Parameter τ und die Viererkraft einzuführen. 9.11 Bewegung im konstanten elektrischen Feld Als Beispiel untersuchen wir die Bewegung eines geladenen Teilchens in einem ~ das wir uns in x-Richtung denhomogenen zeitabhängigen elektrischen Feld E, ken können. Anfänglich ruhe das Teilchen. Dann wird die Bahnkurve offenbar eine in x-Richtung laufende Gerade sein, die wir als x-Achse wählen können. Als einzige Bewegungsgleichung haben wir d dpx mv p = = eEx . dt dt 1 − v 2 /c2 (9.68) Der Impuls des Teilchens wächst demnach im Laufe der Zeit linear mit t, mv = eEx t. (9.69) px = p 1 − v 2 /c2 Mit ihm wächst die kinetische Energie p p E = c m2 c2 + p~2 = m2 c4 + (ceEx t)2 . (9.70) Im Gegensatz zu Impuls und Energie bleibt die Geschwindigkeit, wie es sein muss, beschränkt. Lösen wir nämlich (9.69) nach der Geschwindigkeit v auf, so ergibt sich v=p ceEx t m2 c 2 + (eEx t)2 <c. (9.71) So lang ein Linearbeschleuniger auch ausgelegt wird, die Teilchengeschwindigkeit bleibt immer unter der Lichtgeschwindigkeit. Schließlich erhalten wir wegen v = dx/dt durch Integration von (9.71) die Bahnkurve c p 2 2 x(t) = m c + (eEx t)2 . (9.72) eEx 174 9 Spezielle Relativitätstheorie Ihnen bleibt als lustige Übung das Studium der Teilchenbahn im homogenen Magnetfeld (s. a. 15.3). 9.12 Eine bequeme Schreibweise ~ oder Vektoren im dreidimensionalen euklidischen Raum bezeichnen wir mit V (Vx , Vy , Vz ) oder (V1 , V2 , V3 ) oder Vi . Vierervektoren im Raum-Zeit-Kontinuum ~ ) = (V 0 , Vx , Vy , Vz ) aufgeschrieben. Die haben wir bisher in der Form (V 0 , V Fortführung der relativistischen Betrachtungen erfordert nun, statt dieser umständlichen eine einfachere Schreibweise einzuführen. Wir nummerieren die Komponenten mit einem hochgestellten griechischen Index, schreiben den Vierervektor als V µ und meinen V 0 = zeitartige Komponente V 1 = V1 = Vx V 2 = V2 = Vy (9.73) V 3 = V3 = Vz Das Quadrupel der Koordinaten (ct, x, y, z), zum Beispiel, werden wir demnach künftig als den Viererortsvektor xµ bezeichnen und schreiben x0 = ct, x1 = x1 = x, x2 = x2 = y, x3 = x3 = z . (9.74) Die raumartigen Indizes dürfen dabei nach Belieben oben oder unten stehen, nicht aber der zeitartige. Es lohnt sich, die Begriffsbildung des Vierervektors zu verfeinern und zu jedem Vierervektor eine kontravariante Version V µ sowie eine kovariante Version Vµ zu zulassen, wobei V 0 = −V0 , V i = Vi für 1 = 1, 2, 3 (9.75) gelten soll. Der Sinn dieser Unterscheidung ist, dass sie den aus V µ gewinnbaren Lorentzskalar schöner zu schreiben erlaubt, −(V 0 )2 + (V 1 )2 + (V 2 )2 + (V 3 )2 = V 0 V0 + V 1 V1 + V 2 V2 + V 3 V3 = 3 X V µ Vµ . (9.76) µ=0 Noch mehr Bequemlichkeit wird erreicht, wenn wir vereinbaren, rechts das Summenzeichen wegzulassen. Diese Summenkonvention impliziert auch Aµ Bµ = A 0 B0 + A 1 B1 + A 2 B2 + A 3 B3 = −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 = −A0 B0 + A1 B1 + A2 B2 + A3 B3 ~·B ~ . = −A0 · B 0 + A (9.77) 9.12 Eine bequeme Schreibweise 175 Auch Aµ Bµ ist, wie oben besprochen, ein Lorentzskalar. Im Folgenden soll also jeder griechische Index, der in einem Produkt zweimal vorkommt, einmal hochgestellt (als kontravarianter Index) und einmal tiefgestellt (als kovarianter Index), über die vier Werte 0, 1, 2, 3 summiert werden. Die neue Schreibweise ermöglicht eine einfache Formulierung der Lorentztransformation α x0 = Λαβ xβ = Λα0 x0 + Λα1 x1 + Λα2 x2 + Λα3 x3 = Λα0 ct + Λα1 x + Λα2 y + Λα3 z . (9.78) Die Matrix Λαβ lautet für unser stets verwendetes Beispiel, bei dem das zu S 0 achsenparallele System S sich mit Geschwindigkeit u in x0 -Richtung bewegt, γ γβ 0 0 γβ γ 0 0 , β = u , γ = (1 − β 2 )−1/2 . Λµν = (9.79) 0 c 0 1 0 0 0 0 1 Dabei zählt der erste Index, hier µ, wie üblich die Zeilen in der Reihenfolge 0, 1, 2, 3 und der zweite, hier ν, die Spalten. Den Lorentzskalar Aµ Bµ schreibt man auch gern unter Benutzung einer Matrix ηαβ (des so genannten Minkowskitensors) als Aµ Bµ = ηµν Aµ B ν , (9.80) wobei ηαβ 1 = −1 0 für α = β = 1, 2, 3 für α=β=0 für α 6= β . (9.81) Der Minkowskitensor erlaubt, die Lorentzinvarianz des Minkowskiabstands oder anderer Größen wie Aµ Bµ , als eine Forderung an die Matrix Λαβ der Lorentztransformation zu schreiben. Aus α α β A0 Bβ0 = ηαβ A0 B 0 = ηαβ Λαµ Λβν Aµ B ν = ηµν Aµ B ν (9.82) folgt, da Aµ und B µ beliebige Lorentzvektoren sind, ηαβ Λαµ Λβν = ηµν . (9.83) Sehen Sie, dass dies gerade die Verallgemeinerung der aus dem euklidischen Raum bekannten Eigenschaft R̃R = 1 der Drehmatrizen auf die Drehmatrizen“ ” Λαβ darstellt? Der Minkowskitensor gestattet offenbar auch, aus einem kontravarianten Vektor Aµ den zugehörigen kovarianten Vektor Aµ zu gewinnen, Aµ = ηµν Aν . (9.84) 176 9 Spezielle Relativitätstheorie Die Umkehrung dieser Beziehung wird vermittelt durch die zu ηµν inverse Matrix. Wir nennen dieselbe η µν und haben ηαν η νβ = ( +1 für α=β 0 für α 6= β . (9.85) Offenbar ist ηµν Element für Element mit der inversen Matrix η µν gleich. Aus (9.84) und (9.85) ergibt sich nun der kontravariante Vektor Aµ als Linearkombination der Komponenten des zugehörigen kovarianten Vektors Aµ Aµ = η µν Aν . (9.86) Wir haben bisher das Verhalten von kontravarianten Vektoren Aµ unter Lorentztransformationen studiert. Kovariante Vektoren transformieren sich anders. Aus (9.78), (9.84) und (9.86) folgt β Bα0 = ηαβ B 0 = ηαβ Λβµ B µ = ηαβ Λβµ η µν Bν , also Bα0 = Λαβ Bβ (9.87) mit Λαβ = ηαν Λνµ η µβ . (9.88) Wir sehen leicht, dass die Matrix Λαβ invers zur Matrix Λβα ist, Λαγ Λαβ = ηαν Λνµ η µγ Λαβ = η µγ ηαν Λνµ Λαβ = η µγ ηµβ = δ γβ . (9.89) Ohne Rechnung können wir die Matrix Λαβ aus Λβα durch Vorzeichenwechsel der Geschwindigkeit β = u/c gewinnen, also (unterscheiden Sie die Geschwindigkeit β = u/c vom gleichbezeichneten Index!) Λαβ γ −γβ = 0 0 −γβ 0 γ 0 0 1 0 0 0 0 . 0 1 (9.90) Die Ableitungen ∂/∂xµ nach den kontravarianten Koordinaten xµ bilden offenbar einen kovarianten Lorentzvektor, denn wir hatten früher schon gezeigt, dass der Wellenoperator ∇2 − 1 ∂2 ∂2 ∂ ∂ µν = η = c2 ∂t2 ∂xµ ∂xµ ∂xµ ∂xν (9.91) ein Lorentzskalar ist. Andererseits hatten wir auch schon das Transformations- 9.12 Eine bequeme Schreibweise verhalten von ∂/∂xµ ausgerechnet und gefunden ¶ µ ∂ ∂ ∂ −β 1 =γ ∂x0 ∂x ∂x0 0 ¶ µ ∂ ∂ ∂ = γ −β 0 + ∂x ∂x1 ∂x0 1 177 (9.92) ∂ ∂ 2 = ∂x2 0 ∂x ∂ ∂ 3 = ∂x3 0 ∂x und das ist gerade das Gesetz (9.87) mit der Matrix (9.90). Neben Lorentzskalaren und -vektoren hatten wir auch, ohne ausdrücklich davon zu reden, Lorentztensoren zweiter Stufe betrachtet, das sind 16-Tupel T µν wie z. B. das direkte Produkt Aµ B ν zweier Lorentzvektoren. Die definierende Eigenschaft des Lorentztensors ist, dass er sich unter Lorentztransformationen verhält wie das Produkt Aµ B ν , nämlich T0 µν = Λµα Λνβ T αβ . (9.93) Sie sollen Indexgymnastik treiben und zeigen, dass T µν Aν ein Lorentzvektor und T µµ = T µν ηνµ ein Lorentzskalar ist. Die eben eingeführte Schreibweise gibt vielen in diesem Kapitel besprochenen Gesetzen eine schön einfache Form. So sind die elektromagnetischen Potentiale ~ und die Ströme j µ = (cρ, ~j) durch die Wellengleichung (s. (9.28)) Aµ = (ϕ/c, A) ∂2 Aµ = −j µ /ε0 c2 ∂xα ∂xα (9.94) verknüpft, vorausgesetzt, die Potentiale sind der Lorentzkonvention (9.29) ∂ µ A =0 ∂xµ (9.95) unterworfen. Und die Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld lautet (s. (9.67)) cm dpµ 1 d2 xµ = = fµ . dτ 2 dτ c (9.96) Die Viererkraft f µ lässt sich durch die Vierergeschwindigkeit uµ = c dxµ dτ und durch die Ableitungen der Potentiale Aµ wie folgt ausdrücken µ ¶ ∂ ν ∂ µ µ f =e A − A uν . ∂xµ ∂xν Der antisymmetrische Tensor F µν = ∂ µ ∂ ν A − A ∂xµ ∂xν (9.97) (9.98) 178 9 Spezielle Relativitätstheorie heißt auch der Feldstärkentensor des elektromagnetischen Feldes. Offenbar gilt 0 Ex /c Ey /c Ez /c −Ex /c 0 Bz −By µν (9.99) F = 0 Bx −Ey /c −Bz −Ez /c By −Bx 0 ~ und B ~ wie die Kompound auf einmal wird klar, dass sich die Feldstärken E nenten eines Lorentztensors transformieren. Haben Sie übrigens für die in 9.6 gestellte Übungsaufgabe zum Transforma~ und B ~ als Lösung erhalten, was Sie nun aus (9.99) tionsverhalten der Felder E und (9.77) einfach abschreiben, Ex0 = Ex , Ey0 = γ(Ey + βcBz ), Ez0 = γ(Ez − βcBy ) Bx0 = Bx , By0 = γ(By − βEz /c), Bz0 = γ(Bz + βEy /c) ? (9.100) Jedenfalls sollten Sie sich jetzt klarmachen, dass ein in einem rein elektrosta~ = 0) bewegtes Teilchen auch ein magnetisches Induktionsfeld tischen Feld (B 0 ~ B 6= 0 spürt. Kapitel 10 Die Bewegung schneller Teilchen im Gravitationsfeld (Einsteins Äquivalenzprinzip) 10.1 Rückblick auf die Newtonsche Theorie Die Bewegung eines langsamen (v ¿ c) Teilchens in einem schwachen (die Bedingung für Schwäche wird später gegeben) Gravitationsfeld wird beschrieben durch das Newtonsche Gesetz m d2 ~x = F~ (~x) , dt2 (10.1) wobei m die träge Masse des Teilchens und F~ (~x) die auf das Teilchen am Ort ~x wirkende Gravitationskraft sind. Rührt die Gravitationskraft von einem anderen Teilchen der schweren Masse M her, welches am Ursprung des Koordinatensystems sitzt, so gilt mM ~x F~ (~x) = −G 2 . |~x| |~x| (10.2) Die Eigenschaft des Teilchens, die die Größe der auf es wirkenden Gravitationskraft bestimmt, seine schwere Masse, stimmt erfahrungsgemäß mit seiner trägen Masse überein. Daher geht in (10.1) und (10.2) dieselbe Masse m ein. Sie wissen, dass obiges F~ (~x sich als Gradient des so genannten Gravitationspotentials ϕ(~x) darstellen lässt gemäß F~ (~x) = −m∇ϕ(~x) ϕ(~x) = − GM . |~x| (10.3) Da sich schwache Gravitationsfelder linear superponieren, haben wir für das Gravitationspotential vieler massiver Teilchen mit Massen mν , die an den Orten 179 180 10 Bewegung schneller Teilchen im Gravitationsfeld ~xν sitzen, ϕ(~x) = − X Gmν . |~x − ~xν | ν (10.4) Als Bewegungsgleichung für einen Planeten im Sonnensystem gilt nach Newton mν X d2 ~xν (t) Gmµ mν = −∇ , ν dt2 |~xν (t) − ~xµ (t)| (10.5) µ(6=ν) wobei die rechts stehende Gravitationskraft sich aus den Beiträgen aller anderen Planeten und der Sonne (und gegebenenfalls anderer nahe gelegener Himmelskörper) zusammensetzt. Einstein war mit der in (10.5) zusammengefassten Theorie nicht einverstanden, u. z. aus drei Gründen: (i) Wegen der nicht gegebenen Lorentzinvarianz kann die Theorie nicht für schnelle Teilchen richtig sein; (ii) ein herausgegriffenes Teilchen erfährt die Gravitationswirkung der anderen instantan, da die ¨µ (t)} zur gleichen Teilchenorte {~xν (t)} zu einer Zeit t die Beschleunigungen {~x Zeit festlegen; gemäß dem Einsteinschen Relativitätsprinzip sollten sich Gravitationswechselwirkungen aber höchstens mit Lichtgeschwindigkeit ausbreiten; (iii) die genaue Analyse der schon von Newton verwendeten Gleichheit von schwerer und träger Masse führt, wie wir sehen werden, zu Widersprüchen zu (10.5). 10.2 Einsteins Äquivalenzprinzip Der Angelpunkt der allgemeinen Relativitätstheorie ist die Gleichheit von schwerer und träger Masse für alle Körper. Genauer, das Verhältnis von schwerer zu träger Masse hat für alle Körper den gleichen Wert. Für Probekörper aus Aluminium und Gold, z. B., fand R. H. Dicke Übereinstimmung dieses Verhältnisses mit einer relativen Genauigkeit von 10−11 . Die Gleichheit von träger und schwerer Masse kann dann durch Wahl der Einheit eingerichtet werden. Wir folgern, mit Einstein, dass im Innern eines frei fallenden Fahrstuhls kein äußeres statisches homogenes Gravitationsfeld festgestellt werden kann, denn Fahrstuhl, Beobachter wie experimentelle Aufbauten im Fahrstuhl reagieren alle gleich auf ein solches Feld. Zur Veranschaulichung betrachten wir N langsame Teilchen, die untereinander paarweise wechselwirken gemäß einer abstandsabhängigen Kraft F~ (~xν − ~xµ ) −−−→ und alle einem äußeren konstanten Gravitationsfeld ~g = −∇ϕ = const ausgesetzt sind. Die Bewegungsgleichungen lauten in irgendeinem Laborsystem S mν X d2 ~xν = mν ~g + F~ (~xν − ~xµ ) . 2 dt (10.6) µ(6=ν) Ein frei im Gravitationsfeld fallender Beobachter benutzt sein Ruhesystem S 0 . Solange der Beobachter langsam ist, gilt als Koordinatentransformation 1 ~x0 = ~x − ~g t2 , 2 t0 = t . (10.7) 10.3 Die Viererkraft im Gravitationsfeld 181 Der frei fallende Beobachter gibt auf Grund seiner Messungen als Bewegungsgleichungen für den Teilchenhaufen an mν X d2 ~x0ν = mν (~g − ~g ) + F~ (~x0ν − ~x0µ ) . 02 dt (10.8) µ(6=ν) Sie lesen ab, dass die Trägheitskraft die Gravitationskraft gerade weghebt und dass der Beobachter im Fahrstuhl keine Gravitationskraft feststellen kann. Sie sehen auch, dass in S und S 0 die gleichen Newtonschen Gesetze gelten. Der einzige Unterschied zwischen beiden Bezugssystemen ist, dass in S ein Gravitationsfeld auftritt, nicht aber in S 0 . Einstein verallgemeinerte diese Folgerung aus mschwer = mträge , die zunächst nur für die Grundgesetze der Newtonschen Mechanik gezogen ist, und erhob zum Prinzip (d. h. zu einer immer wieder in geeigneten neuen Experimenten nachzuprüfenden Hypothese): ein zeitlich und räumlich konstantes Gravitationsfeld ist durch kein Experiment zu unterscheiden von einer zeitlich konstanten Beschleunigung des Bezugssystems. Das Einsteinsche Prinzip von der Äquivalenz von Schwere und Trägheit muss noch präziser formuliert werden. Ein zeitlich nicht konstantes und räumlich nicht homogenes Gravitationsfeld kann nicht überall und immer durch eine Koordinatentransformation exakt eliminiert werden. Immerhin, die Aufhebung eines Gravitationsfeldes wird mit guter Näherung möglich sein für jeden RaumZeit-Bereich, der so klein gewählt ist, dass innerhalb seiner das Gravitationsfeld als räumlich und zeitlich konstant angesehen werden kann. Also: In jedem Raum-Zeitpunkt lässt sich ein lokales frei fallendes Koordinatensystem angeben, so dass in einem hinreichend kleinen Raum-Zeit-Bereich um den betrachteten Punkt die Naturgesetze die Form annehmen, die sie in nicht beschleunigten Bezugssystemen bei Abwesenheit von Gravitation haben. Es gibt ein solches frei fallendes Koordinatensystem, aber nicht nur eins, sondern beliebig viele, die sich relativ zueinander gleichförmig bewegen. Da beliebige Relativgeschwindigkeiten |~u| < c zwischen diesen gleichberechtigten Koordinatensystemen möglich sind, muss der Übergang von einem zum anderen durch die Lorentztransformation bewerkstelligt werden. Es müssen also in den lokalen frei fallenden Koordinatensystemen die Naturgesetze eine Lorentzinvariante Form besitzen. Die Koordinatentransformationen, die wie 2.2 dafür sorgen, dass ein Gravitationsfeld lokal eliminiert wird, sind notwendig nichtlinear. Daher ist die Kunst, mit Gravitationsfeldern umzugehen, die gleiche wie die, nichtlineare Koordinatentransformationen zu hantieren. 10.3 Die Viererkraft im Gravitationsfeld Betrachten wir ein Teilchen an einem Raum-Zeit-Punkt xα unter dem Einfluss eines Gravitationsfeldes. Die Bewegungsgleichung muss Lorentzinvariant sein, d. h. die Form mträge 1 d2 x α = 2 mschwer g α dτ 2 c bzw. d2 x α 1 = 2 gα dτ 2 c (10.9) haben, wobei dτ ein Lorentzskalar ist und g α ein Lorentzvektor. Den Lorentzvektor werden wir die Gravitationsfeldstärke nennen. 182 10 Bewegung schneller Teilchen im Gravitationsfeld Eine, die wichtigste, Eigenschaft von g α kennen wir schon: es gibt an jedem Raum-Zeit-Punkt xα ein frei fallendes Koordinatensystem mit Koordinaten ξ α , bezüglich dessen das Teilchen momentan und lokal (d. h. solange es sich vom herausgegriffenen Raum-Zeit-Punkt nicht zu weit entfernt hat) keine Gravitationskraft erfährt und sich daher (ein kleines Wegstück weit) auf einer Geraden bewegt. In diesem frei fallenden Koordinatensystem lautet die Bewegungsgleichung des Teilchens d2 ξ α =0, dτ 2 (10.10) wobei dτ − c das Inkrement der Eigenzeit des Teilchens ist, ¡ ¢ 2 ³ ´2 ¡ ¢ 2 ¡ ¢ 2 ¡ ¢ 2 ¡ ¢ 2 dτ 2 = −ηαβ dξ α dξ β = dξ 0 − dξ~ = dξ 0 − dξ 1 − dξ 2 − dξ 3 . (10.11) Der Übergang von den Laborkoordinaten xα zu den Koordinaten ξ α im frei fallenden System geschieht durch eine nichtlineare Koordinatentransformation, d. h. die ξ α sind nichtlineare Funktionen der xα . Wir schreiben meistens α ξ α = ξ α (x), zuweilen zur Vermeidung von Missverständnissen auch ξ α = ξX (x), wobei der Index X den Raum-Zeit-Punkt angibt, bezüglich dessen das frei fallende Koordinatensystem errichtet ist. Wohlgemerkt, nur räumlich und zeitlich konstante Gravitationsfelder können durch eine einzige Koordinatentransformation eliminiert werden. Wir lassen aber jetzt beliebig variable Gravitationsfelder zu. Hätten wir die Koordinatentransformation ξ α (x), die das Gravitationsfeld α g lokal eliminiert, explizit vorliegen, so können wir g α leicht rekonstruieren. Tragen wir ξ α (x) in die Bewegungsgleichung (10.10) ein, 0= d dτ µ ∂ξ α dxµ ∂xµ dτ ¶ = ∂ 2 ξ α dxµ dxν ∂ξ α d2 xµ + , µ 2 ∂x dτ ∂xµ ∂xν dτ dτ (10.12) multiplizieren mit ∂xλ /∂ξ α und benutzen die Kettenregel in der Form ∂xλ ∂ξ α = δ λµ , ∂ξ α ∂xµ (10.13) µ ν d2 x λ λ dx dx =0 + Γ µν dτ 2 dτ dτ (10.14) so entsteht mit Γλµν = ∂xλ ∂ 2 ξ α . ∂ξ α ∂xµ ∂xν (10.15) Somit ist das Gravitationsfeld g α durch die Koordinatentransformation ξ(x) ausgedrückt, die das Feld lokal eliminiert, µ ν 1 α α dx dx g = −Γ µν c2 dτ dτ (10.16) 10.3 Die Viererkraft im Gravitationsfeld 183 Das Feld g α ist also durch das so genannte Christoffelsymbol Γαµν und die Vierergeschwindigkeit dxµ /dτ gegeben. Mit (10.14) haben wir die allgemeine Form der Bewegungsgleichung eines Teilchens im Gravitationsfeld gewonnen. Zur Behandlung konkreter Probleme, wie etwa der Bewegung eines Planeten um die Sonne, müssen wir natürlich die Gravitationsfeldstärke g α , d. h. das Christoffelsymbol Γαµν für das Feld der Sonne als Funktion der Koordinaten xα kennen. Bei gegebenem Γλµν (x) können wir im Prinzip die vier Gleichungen (10.14) lösen. Aus den gewonnen Lösungen xα = xα (τ ) lässt sich, falls gewünscht, der Parameter τ eliminieren, so dass nach Beachtung von x0 = ct die Bahnkurve in der üblichen Form ~x = ~x(t) entsteht. Wir werden darauf zurückkommen. Mit Hilfe der Transformation ξ α = ξ α (x) können wir auch das Eigenzeitinkrement des Teilchens durch die Laborkoordinateninkremente dxµ ausdrücken, dτ 2 = −ηαβ dξ α dξ β = −ηαβ ∂ξ α ∂ξ β µ ν dx dx ≡ −gµν dxµ dxν . ∂xµ ∂xν (10.17) Die zur Abkürzung eingeführte Größe gµν = ηαβ ∂ξ α ∂ξ β ∂xµ ∂xν (10.18) heißt metrischer Tensor. Dieser spielt im Weiteren eine wichtige Rolle. Klar ist, dass gµν bei Vorliegen eines Gravitationsfeldes (und somit einer nichtlinearen Transformation ξ α = ξ α (x)) weder konstant noch im allgemeinen diagonal sein wird. Gemäß seiner Definition ist gµν jedoch immer symmetrisch. Wir haben soeben das Christoffelsystem Γαµν (x) und den metrischen Tensor gµν eingeführt mit Hilfe der Koordinatentransformation ξ α = ξ α (x) von den Laborkoordinaten xα zu den Koordinaten ξ α des frei fallenden Systems, bezüglich dessen das beobachtete Teilchen momentan gleichförmig bewegt ist. Das umgekehrte Vorgehen ist auch möglich und lehrreich. Überzeugen wir uns davon, dass wir bei gegebenem Gravitationsfeld, bzw. bei gegebenen Γαµν und gµν immer die Koordinaten ξ α (x) konstruieren können. Dazu multiplizieren wir die Definition (10.15) mit ∂ξ β /∂xλ und erhalten ∂ξ β ∂xλ ∂ 2 ξ α ∂2ξβ ∂ξ β λ = . Γ µν (x) = λ λ α ∂x ∂x ∂ξ ∂xµ ∂xν ∂xµ ∂xν (10.19) Diese Gleichungen können wir, bei gegebenem Γλµν (x), als Differentialgleichungen für die vier Funktionen ξ β (x) lesen. Wir suchen eine Lösung für eine Nachbarschaft von X durch Ansatz einer Potenzreihe in x − X, µ α¶ ∂ξ α α ξ (x) =ξ (X) + (xµ − X µ ) ∂xµ x=X µ 2 α ¶ ∂ ξ 1 + (xµ − X µ )(xν − X ν ) + · · · . (10.20) 2 ∂xµ ∂xν x=X Nach Eintragen des Ansatzes (10.20) in (10.19) finden wir die zweiten Ableitungen als durch Γλµν (x) bestimmt, µ α¶ µ 2 α ¶ ∂ξ ∂ ξ = · Γλµν (x) , (10.21) ∂xµ ∂xν x=X ∂xλ x=X 184 10 Bewegung schneller Teilchen im Gravitationsfeld während ξ α (X) und (∂ξ α /∂xµ )x=X als Integrationskonstanten offen bleiben. Die Beliebigkeit der Matrix (∂ξ α /∂xλ )x=X ist natürlich durch den metrischen Tensor gµν (X) = ηαβ (∂ξ α /∂xµ )x=X (∂ξ β /∂xν )x=X eingeschränkt. Es bleiben, da gµν = gνµ , sechs freie Parameter in der Matrix (∂ξ α /∂xλ )x=X . Das ist gut so, denn das frei fallende Koordinatensystem darf nicht eindeutig festliegen. Hat man eines, so ist jedes dazu verdrehte und gleichförmig bewegte gleichberechtigt. 10.4 Lichtstrahlen im Gravitationsfeld Keine andere wissenschaftliche Entdeckung dieses Jahrhunderts wurde so als Sensation gefeiert wie Einsteins Vorhersage, dass Lichtstrahlen durch starke Gravitationsfelder abgelenkt werden, nach ihrer Bestätigung anlässlich einer Sonnenfinsternis im Jahr 1919 (vgl. Abbildung 10.1. Um den Effekt verstehen und nachrechnen zu lernen, wenden wir wieder das Äquivalenzprinzip an. Letzteres beansprucht Gültigkeit nicht nur für die Bewegung massiver Teilchen im Gravitationsfeld, sondern für den Einfluss der Gravitation auf alle physikalischen Phänomene, insbesondere auch auf Lichtausbreitung. Abbildung 10.1 Bei Abwesenheit von Gravitation sollte ein Lichtstrahl gerade laufen, entsprechend einer ebenen Welle mit dem Phasenfaktor exp i(~k · ξ~ − ωξ 0 /c). Der Wellenvektor ~k und die Frequenz ω haben dabei den Zusammenhang k 2 = ω 2 /c2 . Dieser Zusammenhang, auch Dispersionsrelation für Licht im Vakuum genannt, garantiert, dass ~k · ξ~ − ωξ 0 /c ein Lorentzskalar ist. Wir können den Vierervektor k µ = (k 0 = ω/c, ~k) einführen und den Phasenfaktor der Lichtwelle als exp(ikµ ξ µ ) schreiben. Die Geradlinigkeit des Lichtstrahls lässt sich auch zum Ausdruck bringen, indem wir einen Punkt ξ~ auf einer Wellenfront ins feste Augenmerk nehmen und als dessen Bewegungsgleichung“ notieren ” d2 ξ~ =0. (10.22) (dξ 0 )2 Statt der Zeitkoordinate ξ 0 können wir auch einen anderen mit ihr linear verknüpften Parameter σ zur Beschreibung der Bahn des betrachteten Punktes 10.4 Lichtstrahlen im Gravitationsfeld 185 verwenden, woraufhin die Bewegungsgleichung die etwas symmetrischere Form d2 ξ µ =0 dσ 2 (10.23) annimmt. Im Gravitationsfeld verläuft, wie die erwähnten Beobachtungen bei Sonnenfinsternissen sinnfällig machen, der Lichtstrahl nicht mehr geradlinig. Jedoch gibt es in jedem Punkt in Sonnennähe ein frei fallendes Koordinatensystem, in dem die Gravitation lokal vollständig eliminiert ist, so dass die Bewegungsgleichung (10.23) gilt. Sobald wir für jeden Punkt X im Gravitationsfeld die Koordinatentransformation ξX (x) kennen, die die Laborkoordinaten x mit den frei fallenden Koordinaten verknüpft, können wir aus (10.23) die Bewegungsgleichung des betrachteten Punktes auf einer Wellenfront gewinnen. Die weitere Überlegung und Rechnung ist identisch mit der für massive Teilchen und gibt ν µ d2 x λ λ dx dx + Γ =0. µν dσ 2 dσ dσ (10.24) Diese die Lichtausbreitung im Gravitationsfeld beschreibende Gleichung hat das gleiche Aussehen wie die Bewegungsgleichung eines massiven Teilchens. Natürlich können wir hier den Bahnparameter σ nicht mit der Eigenzeit des betrachteten Punktes auf der Wellenfront identifizieren, denn dieser Punkt bewegt sich mit Lichtgeschwindigkeit und hat somit keine Eigenzeit. Für Lichtausbreitung gilt dτ = 0, sowohl im frei fallenden System wie im Labor. Die Umrechnung läuft wie im letzten Paragrafen und führt zu 0 = −ηαβ dxµ dxν dξ α dξ β = −gµν . dσ dσ dσ dσ (10.25) Statt von einem fiktiven Punkt auf einer Wellenfront werden wir künftig von einem masselosen Teilchen reden, das sich im gravitationsfreien Raum (und somit auch in einem frei fallenden Bezugssystem) geradlinig mit Lichtgeschwindigkeit bewegt. Diese Redeweise macht deutlich, dass der Einfluss des Gravitationsfeldes auf massive und masselose Teilchen der gleiche ist. Sie wissen andererseits, aus quantenmechanischer Vorbildung, dass das in Rede stehende masselose Teilchen, das Photon, keine bloße Fiktion ist, dass vielmehr elektromagnetische Wellen auch in anderer Hinsicht Teilchencharakter zeigen. Die Lichtartigkeitsbedingung (10.25) für eine Photonenbahn xλ ermöglicht die Berechnung der Zeit dt = dx0 /c, die ein Photon benötigt, um den Weg d~x zu durchlaufen. Aus (10.25) folgt∗) unter Beachtung der Symmetrie von gµν g00 c2 dt2 + 2gi0 dxi c dt + gij dxi dxj = 0 (10.26) und hieraus die Laufzeit dt = · ¸ q 1 −gi0 dxi − (gi0 gj0 − gij g00 ) dxi dxj cg00 (10.27) In diesem Ausdruck erscheint das Minuszeichen vor der Wurzel. Das umgekehrte Vorzeichen kommt nicht in Frage, wie wir uns klarmachen am Beispiel einer linearen Koordinatentransformation, für die gilt gµν = ηµν d. h. ∗) Beachte, dass der lateinische Index i die drei Raumkoordinaten zählt, also i = 1, 2, 3. 186 10 Bewegung schneller Teilchen im Gravitationsfeld h √ i c dt = − − d~x2 . Eine wichtige Konsequenz aus (10.25) springt sofort ins Auge. Da im Gravitationsfeld der metrische Tensor gµν koordinatenabhängig und jedenfalls ungleich dem Minkowskitensor ist, gilt nicht mehr c dt = |d~x|, d. h. im Gravitationsfeld weicht die Lichtgeschwindigkeit von c ab. Letzterer Effekt ist uns, ebenso wie die Lichtablenkung durch schwere Massen, aus der Alltagserfahrung nicht geläufig. Der Grund dafür ist die Schwachheit des Gravitationsfeldes der Erde. Selbst das viel stärkere Feld der Sonne bewirkt eine Lichtablenkung um bloße 1, 75 Bogensekunden für Lichtstrahlen, die in unmittelbarer Nähe der Sonnenoberfläche an der Sonne vorbeilaufen (s. 10.12). 10.5 Der metrische Tensor ist das Gravitationsfeld Sie haben eben gelernt, dass das Christoffelsymbol Γλµν die Gravitationskraft und der metrische Tensor gµν das Eigenzeitinkrement von Teilchen festlegen. Jetzt will ich zeigen, dass sich das Christoffelsymbol durch den metrischen Tensor gµν und seine ersten Ableitungen darstellen lässt als Γλµν 1 = g λσ 2 ½ ∂gµσ ∂gνσ ∂gµν + − ∂xν ∂xµ ∂xσ ¾ , (10.28) wobei g µν der zu gµν inverse Tensor ist, g µσ gσν = δ µν . (10.29) Der metrische Tensor spielt also die Rolle eines Potentials für die durch Γλµν (x) bestimmte Gravitationskraft. Jedenfalls genügt die Kenntnis des metrischen Tensors gµν (x), um die Bewegung von Teilchen im Gravitationsfeld vollständig beschreiben zu können. Der obige Zusammenhang zwischen dem Christoffelsymbol Γλµν und dem metrischen Tensor gµν folgt aus dem Äquivalenzprinzip, welches wir zunächst etwas verfeinert formulieren müssen. Am Punkt xα = X α (in Laborkoordinaα ten) seien ξX die Koordinaten des dortigen frei fallenden Systems. Mit Hilfe α α (x) definiert sich der metrische Tensor als = ξX der Transformation ξX gµν (X) = à β α (x) ∂ξX (x) ∂ξX ηαβ µ ∂x ∂xν ! . (10.30) x=X α An einem benachbarten Raum-Zeit-Punkt xα = X 0 hat man, wenn das Gravitationsfeld nicht konstant ist, ein anderes frei fallendes Bezugssystem mit Koorα α dinaten ξX 0 . Für einen mit den ξX fallenden Beobachter erscheint das System α α der ξX 0 , beschleunigt, er konstatiert also ein bei ξX (x = X 0 ) herrschendes Gravitationsfeld gemäß dem metrischen Tensor ! à β α ∂ξX 0 ∂ξX 0 X 0 . (10.31) gµν (ξX (X )) = µ ν ηαβ ∂ξX ∂ξX 0 ξX =ξX (X ) 10.5 Der metrische Tensor ist das Gravitationsfeld 187 Dem in Rede stehenden Beobachter wird nahe liegen, diesen metrischen Tensor α als Funktion seiner Koordinaten ξX zu schreiben; wir könnten auch Laborkoordinaten verwenden. X Offenbar ist gµν (ξX (X)) = ηµν . Wenn wir zur Vereinfachung der Symbolik den Ursprung des bei X frei fallenden Systems so wählen, dass ξX (x = X) = 0, α X (ξX ) so lautet die für kleine ξX gültige Taylorreihe für gµν à ! à ! X X ∂gµν ∂ 2 gµν 1 X α α α gµν (ξX ) = ηµν + ξ + ξX ξX + · · · . (10.32) X α α ∂ξ β ∂ξX 2 ∂ξX X ξX =0 ξX =0 α In dieser Reihe kommt klar zum Ausdruck, dass die ξX zwar am Ort x = X, nicht aber in endlichem Abstand davon ein frei fallendes System bilden. α In hinreichender Entfernung vom Ursprung ξX = 0 bemerkt der mit den ξX fallende Beobachter sehr wohl ein Gravitationsfeld. Wir hatten das Äquivalenzprinzip bisher formuliert als die Forderung, dass α sich durch ein geeignetes frei fallendes System ξX das Gravitationsfeld in einem hinreichend kleinen Raum-Zeit-Bereich um x = X herum eliminieren lassen muss. Wir präzisieren nun das hinreichend“ dahingehend, dass sich die Koor” α X α dinaten ξX so einrichten lassen müssen, dass die ersten Ableitungen (∂gµν /∂ξX ) X bei ξX = 0 verschwinden. Die Abweichung des metrischen Tensors gµν (ξX ) vom α Minkowskitensor ist dann, wie (10.32) zeigt, mindestens quadratisch in ξ X . Erst α α in zweiter Ordnung in ξX wird für den mit dem System der ξX fallenden Beobachter ein Gravitationsfeld bemerkbar. Wir werden gleich sehen, dass erst die hier gegebene Präzisierung des Äquivalenzprinzips sicherstellt, dass ein bei α x = X befindliches Teilchen bezüglich des Systems ξX tatsächlich keine Beschleunigung erfährt. Nach dieser Vorbemerkung finden wir aus einer leichten Rechnung, bei der X wir übrigens gµν als Funktion der Laborkoordinaten nehmen, den oben vorgestellten Zusammenhang zwischen dem Christoffelsymbol und seinem Potenti” al“, dem metrischen Tensor. Unter bloßer Beachtung der Kettenregel können wir umformen wie ! à β α ∂ξX 0 ∂ξX 0 0 ηαβ gµν (X ) = ∂xµ ∂xν x=X 0 ! à µ γ ¶ β α δ ∂ξX ∂ξX ∂ξX 0 ∂ξX 0 ηαβ = , γ δ ∂ξX ∂xµ ∂xν x=X 0 ∂ξX 0 x=X also X gµν (X 0 ) = gγδ (X 0 ) µ γ δ ∂ξX ∂ξX µ ∂x ∂xν ¶ . (10.33) x=X 0 λ Dies differenzieren wir nach X 0 und setzen X = X 0 . Da ³ ´ ¢ ¡ α ¢ ¡ X λ λ X α · ∂ξ /∂X ∂gγδ (X 0 )/∂X 0 = ∂gγδ /∂ξX =0, X X 0 =X ξ=0 X 0 =X gibt der erste Faktor auf der rechten Seite von (10.33) keinen Beitrag zur geX suchten Ableitung und wir erhalten wegen gγδ (X) = ηγδ ¶ µ 2 γ γ δ δ ∂ ξX (x) ∂ξX (x) ∂ξX (x) ∂ 2 ξX (x) ∂gµν . (10.34) = η + γδ ∂X λ ∂xλ ∂xµ ∂xν ∂xµ ∂xν ∂xλ x=X 188 10 Bewegung schneller Teilchen im Gravitationsfeld Die rechte Seite dieser Gleichung lässt sich durch das Christoffelsymbol ausdrücken µ γ γ ¶ δ δ ∂gµν σ ∂ξX ∂ξX σ ∂ξX ∂ξX = ηγδ Γ λµ σ + Γ λν σ ∂X λ ∂x ∂xν ∂x ∂xµ x=X = Γσλµ (X)gσν (X) + Γσλν (X)gσµ (X) . (10.35) Um nach dem Christoffelsymbol auflösen zu können, addieren wir zu dieser Gleichung die nämliche mit µ und λ vertauscht und subtrahieren dieselbe nochmals mit ν und λ vertauscht. Es entsteht, wenn wir die aus den Definitionen folgenden Symmetrien gµν = gνµ und Γλµν = Γλνµ benutzen, ∂gλν ∂gµλ ∂gµν + − = 2Γσλµ gσν . ∂xλ ∂xµ ∂xν (10.36) Nach Multiplikation mit dem zu gµν inversen Tensor g µν entsteht schließlich die eingangs vorgestellte Relation. Ihnen bleibt als kleine Übung, zu zeigen, dass sich der Tensor g µν durch die Transformation ξ = ξ(x) zum frei fallenden Koordinatensystem ausdrücken lässt, g µν = g νµ = 10.6 ∂xν ∂xµ γδ η . ∂ξ γ ∂ξ δ (10.37) Der Newtonsche Grenzfall Für langsame Teilchen in schwachen Gravitationsfeldern muss die Einsteinsche Bewegungsgleichung µ ν d2 x λ λ dx dx = −Γ µν dτ 2 dτ dτ (10.38) in die Newtonsche übergehen. Überzeugen wir uns davon und lernen dabei, wie der metrische Tensor (das Einsteinsche Gravitationspotential“) im Grenzfall ” des schwachen statischen Feldes aussieht. Bei |~v | ¿ c können wir zunächst die räumlichen Komponenten d~x/dτ ≈ ~v /c gegen dx0 /dτ = c dt/dτ ≈ 1 vernachlässigen und erhalten d2 x λ = −Γλ00 dτ 2 µ dct dτ ¶2 . (10.39) Da das Gravitationsfeld als statisch angenommen wurde, verschwinden die Zeitableitungen des metrischen Tensors, µ ¶ 1 λσ ∂g0σ ∂g00 ∂g00 1 λ 2 − . (10.40) Γ 00 = g = − g λi σ 2 ∂ct ∂x 2 ∂xi Bei Abwesenheit des Gravitationsfeldes wäre gµν = ηµν . Im schwachen Feld wird der metrische Tensor nur wenig vom Minkowskitensor abweichen, so dass wir ansetzen können gµν = ηµν + hµν (10.41) 10.6 Der Newtonsche Grenzfall 189 mit |hµν | ¿ |ηµν |. In erster Ordnung in der Störung hµν entsteht aus (10.40) 1 ∂h00 ∂h00 1 , also Γ000 = 0 und Γi 00 = − Γλ00 = − η λi i 2 ∂x 2 ∂xi Tragen wir dies in die Bewegungsgleichung (10-39) ein, so entsteht ¶2 µ d2 ct d2 x i 1 ∂h00 dct und = =0. dτ 2 2 ∂xi dτ dτ 2 (10.42) (10.43) Letztere Gleichung besagt, dass Laborzeit und Eigenzeit linear verknüpft sind, (dct/dτ ) = const. Damit kann aus der ersten Gleichung in (10.43) der Para2 i meter τ leicht eliminiert werden, denn ddτx2 = (const)2 d2 xi /d(ct)2 . Daraufhin erhalten wir c2 ∂h00 d2 x i = dt2 2 ∂xi (10.44) oder d2 ~x c2 = ∇h00 . 2 dt 2 In der Newtonschen Mechanik gilt (10.45) d2 ~x = −∇ϕ , (10.46) dt2 wobei ϕ das Newtonsche Gravitationspotential ist. Die Einsteinsche Bewegungsgleichung reduziert sich also auf die Newtonsche, wenn wir die Korrektur h 00 zur 0−0-Komponente des Minkowskitensors identifizieren als 2 ϕ(~x) + const . (10.47) c2 In beliebig großer Entfernung von allen felderzeugenden Massen muss das Gravitationsfeld beliebig klein werden, d. h. h00 (~x → ∞) → 0. Das Newtonsche Potential hatten wir ebenfalls so definiert, dass es im Unendlichen verschwindet, so dass die Konstante in (10.47) verschwindet. Somit gilt im Newtonschen Grenzfall h00 (~x) = − g00 = −(1 + 2ϕ/c2 ) . (10.48) 2 Um ein Gefühl für die Größe der Korrektur 2ϕ/c in (10.48) zu erhalten, erinnern wir uns an das Newtonsche Potential eines Teilchens mit Masse m, ϕ~x = Gm/|~x|. Sie rechnen leicht aus, nach Aufsuchen der entsprechenden Massen und Radien, ¯ ¯ ¯ 2ϕ ¯ ¯ ¯ ≈ 10−39 an der Oberfläche eines Protons ¯ c2 ¯ ≈ 10−9 auf der Erdoberfläche ≈ 10−6 auf der Sonnenoberfläche ≈ 10−4 auf der Oberfläche eines weißen Zwerges. Offenbar machen wir an der Erdoberfläche keinen großen Fehler, wenn wir das Eigenzeitinkrement eines Teilchens mit dem Minkowskitensor statt mit dem metrischen Tensor ausrechnen. 190 10.7 10 Bewegung schneller Teilchen im Gravitationsfeld Frequenzverschiebung fallender Photonen Eine der schönsten experimentellen Bestätigungen des Äquivalenzprinzips wurde im Jahr 1960 von Pound und Rebka gegeben. Das Messergebnis besteht im Nachweis einer Frequenzvergrößerung ( Blauverschiebung“) von Gammastrah” len, die im Schwerefeld der Erde um etwa 20 m gefallen sind. Hier will ich Ihnen die theoretische Grundlage zur Diskussion dieses Experiments und verwandter Phänomene geben. Betrachten wir eine Uhr, die sich mit beliebiger Geschwindigkeit in einem beliebigen Gravitationsfeld bewegt. Zwischen zwei aufeinander folgenden Ticks vergeht die Eigenzeit ∆t. Das Eigenzeitintervall ∆t ist nicht gleich dem Zuwachs dx0 /c = dt der Laborzeit t = x0 /c, den wir im Labor als Zeitabstand der beiden in Rede stehenden Ticks messen, denn zur Messung der Laborzeit t bzw. x0 verwenden wir i. A. im Labor ruhende Instrumente ( x0 -Anzeiger“). Selbst ” wenn wir die Laborzeit x0 /c ablesen auf einer Uhr, die konstruktionsgleich ist mit der zum Zeitpunkt x0 am Ort ~x beobachteten, so wird das Laborzeitinkrement dx0 /c zwischen den beiden Ticks des Beobachtungsobjekts mit dem Eigenzeitinkrement ∆t nur dann übereinstimmen, wenn sich der x0 -Anzeiger zum Beobachtungszeitpunkt ebenfalls am Ort ~x befindet und dort relativ zur beobachteten Uhr ruht. Vereinbaren wir jedoch, dass der x0 -Anzeiger bei ~x = 0 ruht. Das Laborzeitintervall dt = dx0 /c zwischen zwei aufeinander folgenden Ticks der Uhr bei ~x denken wir uns so gemessen, dass dieselbe anlässlich jedes Ticks einen Lichtblitz zum x0 -Anzeiger schickt; auf letzterem wird dt abgelesen als Zeitabstand der Ankunft zweier aufeinander folgender Lichtblitze. Um den Zusammenhang zwischen ∆t und dt auszurechnen, erinnere ich an die anfängliche Bemerkung, dass ∆t die Zeit ist, die zwischen den Ticks verstreicht bzgl. eines frei fallenden Systems, in dem die Uhr ruht. In einem anderen lokal frei fallenden System, in dem die Uhr sich gleichförmig bewegt, verstreicht dξ 0 und es gilt q 1 −ηαβ dξ α dξ β , (10.49) ∆t = c während sich das im Laborsystem ablaufende Zeitintervall berechnet aus r ∂ξ α ∂ξ β 1p 1 −ηαβ µ ν dxµ dxν = −gµν dxµ dxν . ∆t = (10.50) c ∂x ∂x c Dabei sind wir jetzt weniger an der schon bei Abwesenheit von Gravitation auftretenden Verschiedenheit von ∆t und dt interessiert, die mit einer Relativbewegung von Beobachtungsobjekt und Labor verbunden ist; viel mehr interessiert uns der Einfluss des Gravitationsfeldes auf das Verhältnis ∆t/dt; daher nehmen wir an, dass die beobachtete Uhr relativ zum Labor ruht, so dass d~x = 0. Dann folgt p (10.51) ∆t = −g00 (x) dt . p Man kann den Dilatationsfaktor“ −g00 (x) nicht durch Messungen an ei” nem Raum-Zeit-Punkt x allein festlegen. Denn wenn der x0 -Anzeiger zur Zeit x0 nach ~x gebracht wird, wo sich auch das Beobachtungsobjekt befindet, so 10.7 Frequenzverschiebung fallender Photonen 191 wird er dann und dort vom Gravitationsfeld genauso beeinflusst wie das letztere. Somit kann zwischen beiden Uhren kein Gangunterschied auftreten. Um den Einfluss des Gravitationsfeldes auf den Gang von Uhren nachzuweisen, müssen Uhren an verschiedenen Raum-Zeit-Punkten verglichen werden. Betrachten wir der Einfachheit halber zwei Raumpunkte in einem zeitunabhängigen Gravitationsfeld gµν (~x). Am Ort ~xQ ruhe als Uhr“ eine Lichtquelle, ” die Licht einer Spektrallinie aussendet. Am Ort ~xB wird dieses Licht empfangen und hinsichtlich seiner Frequenz verglichen mit Licht derselben Spektrallinie, das am Ort ~xB selbst erzeugt wird. Der Zeitabstand zwischen der Aussendung aufeinander folgender Wellenmaxima (das seien die Ticks“ der Uhr“) sei dtQ = dx0Q /c; er hängt mit dem ” ” entsprechenden Zeitabstand ∆t bei Abwesenheit des Gravitationsfeldes zusammen gemäß q (10.52) dtQ = ∆t/ −g00 (~xQ ) . Die Reisedauer der Wellenfronten von der Quelle zum Beobachter bei ~xB wird für alle Wellenmaxima gleich groß sein, da sich das Gravitationsfeld zeitlich nicht ändert. Die Zeitspanne zwischen den Ankünften aufeinander folgender Wellenmaxima wird also auch stets gleich bleiben und den durch (10.52) gegebenen Wert haben. Der entsprechende Zeitabstand zwischen den Wellenmaxima einer in ~xB ruhenden Quelle beträgt jedoch p (10.53) dtB = ∆t/ −g00 (~xB ) . Demnach erscheint einunddieselbe Spektrallinie unter verschiedenen Frequenzen, deren Verhältnis durch s νB g00 (~xB ) dtQ = = (10.54) νQ dtB g00 (~xQ ) gegeben ist. Im schwachen Feld, wo g00 (~x) ≈ −1 − 2ϕ(~x)/c2 mit |ϕ|/c2 ¿ 1 gilt, drückt sich die Linienverschiebung durch die Newtonschen Potentiale an den beteiligten Orten aus, s 1 + 2ϕ(~xB )/c2 1 νB ≈ ≈ 1 + [ϕ(~xB ) − ϕ(~xQ )] 2 . (10.55) νQ 1 + 2ϕ(~xQ )/c2 c Als relative Frequenzverschiebung ∆ν/νB = (νQ − νB )/νB erhalten wir somit ∆ν 1 = (ϕ(~xQ ) − ϕ(~xB )) 2 . νB c (10.56) Das ist eine Rotverschiebung, wenn das Feld am Ort der Quelle stärker ist als beim Beobachter, während ein im Gravitationsfeld fallendes Photon offenbar eine Vergrößerung seiner Frequenz, d. h. eine Blauverschiebung erleidet. Das Resultat (10.56) legt wieder die schon benutzte Redeweise vom Photon als einem (masselosen) Teilchen nahe. Wenn ein massives Teilchen im Gravitationsfeld zu tieferem Potential fällt, so vergrößert sich dabei seine kinetische 192 10 Bewegung schneller Teilchen im Gravitationsfeld Energie. Ganz ähnlich ergeht es dem Photon. Der einzige Unterschied zum massiven Teilchen ist, dass das schon mit c fliegende Photon Energie nicht durch Vergrößerung seiner Geschwindigkeit aufnimmt sondern durch Vergrößerung seiner Frequenz. Im Pound-Rebka Experiment entsprach der Potentialunterschied zwischen Quelle und Empfänger einem Höhenunterschied von 22, 6 m, betrug also ∆ϕ/c2 = 9, 81 m s−2 · 22, 6 m/9 · 1016 m2 s−2 ≈ 2, 5 · 10−15 . Wie eine derart winzige Frequenzverschiebung nachgewiesen wurde, ist eine Geschichte für sich, die Sie anderswo ausführlich nachlesen müssen. Jedenfalls ist die Vorhersage des Äquivalenzprinzips durch Experimente dieses Typs inzwischen bis auf ∼ 1% bestätigt. Eine an der Sonnenoberfläche erzeugte Spektrallinie muss dem terrestrischen Beobachter rotverschoben erscheinen, denn das Gravitationspotential am Entstehungsort ist, wie ich schon oben notiert hatte, betragsmäßig wesentlich stärker als das Gravitationspotential an der Erdoberfläche. Die vom Äquivalenzprinzip vorhergesagte relative Linienverschiebung von etwa 2 · 10−6 ist wegen experimenteller Schwierigkeiten bisher nur bis auf eine Genauigkeit von etwa 5% gesichert. 10.8 Nochmal auf die rotierende Scheibe! Schon mit Hilfsmitteln der speziellen Relativitätstheorie hatten wir uns davon überzeugt, dass eine am Rand einer gleichförmig rotierenden Scheibe festgemachte Uhr langsamer geht als ihr im Labor ruhendes Duplikat. Als Umlaufdauer wird auf der mitrotierenden Uhr Trot und auf der Laboruhr Tlab abgelesen und es gilt, wenn ω die Kreisfrequenz der Scheibe ist und R den Abstand der rotierenden Uhr von der Drehachse bezeichnet, Trot = Tlab p 1 − ω 2 R2 /c2 . (10.57) Um Sie an den Umgang mit dem Äquivalenzprinzip zu gewöhnen, will ich dieses Resultat nun nochmals herleiten. Ein auf der rotierenden Scheibe ruhender Reisender mag sich einbilden, die Scheibe sei in Ruhe und die für ihn überall auf der Scheibe feststellbaren Kräfte auf Probeteilchen rührten von einem Gravitationsfeld her. Er wird dieses Feld durch den metrischen Tensor gµν beschreiben und seine Mühe damit haben, gµν (x) durch Messungen festzulegen. Wir haben keinerlei Mühe, den metrischen Tensor auszurechnen mit Hilfe der Koordinatentransformation vom Scheibensystem xα zum System der ξ α , bezüglich dessen wir die Scheibe rotieren sehen. Der Beobachter auf der Scheibe möge sich dazu entschließen, als seinen x0 Anzeiger unseren ξ 0 -Anzeiger zu verwenden. Das wird ihm Unbequemlichkeiten bringen, denn er sieht diese Uhr kreisen (der Bundespostminister dürfte sich sicher nicht erlauben, den Taktgeber des hiesigen Telefonsystems auf dem Mond zu installieren), jedoch kommt uns bei der weiteren Überlegung die Verrücktheit des Scheibenmännchens sehr zupass. Im Übrigen verwende das Scheibenmännchen Zylinderkoordinaten x1 = r, x2 = ϕ, x3 = z, wobei die z-Achse die Symmetrieachse des Systems sei. Wenn wir im Labor kartesische Koordinaten ξ i wählen, so haben wir die Transformation 10.8 Nochmal auf die rotierende Scheibe! 193 ξ 0 = x0 ξ x = r cos(ϕ + ωx0 /c) (10.58) ξ y = r sin(ϕ + ωx0 /c) ξz = z Abbildung 10.2 und können den metrischen Tensor gµν (x) mit Hilfe seiner Definition gµν (x) = ∂ξ α ∂ξ β ηαβ ∂xµ ∂xν (10.59) ∂ξ 0 ∂ξ 0 ∂ξ x ∂ξ x ∂ξ y ∂ξ y ∂ξ z ∂ξ z + + + ∂xµ ∂xν ∂xµ ∂xν ∂xµ ∂xν ∂xµ ∂xν ausrechnen. Das für uns wichtige Element ist g00 . Es lautet =− g00 (r, ϕ, z, x0 ) = −1 + r2 ω2 r2 ω2 sin2 (ϕ + ωx0 /c) + 2 cos2 (ϕ + ωx0 /c) 2 c c = −1 + r 2 ω 2 /c2 . Obwohl wir die anderen hier nicht benötigen, sollten Sie sie zur Gewöhnung an’s Differenzieren und Summieren ausrechnen. Da die am Scheibenrand bei r = R, ϕ = 0, z = 0 festgemachte Uhr für das Scheibenmännchen ruht, drückt er ihr Eigenzeitinkrement ∆t aus als (s. (10.51)) p p ∆t = −g00 (R, 0, 0)dx0 /c = 1 − ω 2 R2 /c2 dx0 /c . (10.60) P Die Summe ∆t = Trot P 0 aller dieser Inkremente für einen Umlauf lesen wir mit und dx = Tlab als das oben schon vorgestellte Resultat (s. (10.51)). Im letzten Kapitel hatte ich das Resultat (10.57) salopp als Reisen erhält ” jung“ formuliert. Jetzt liegt die Interpretation starker Gravitationsfelder als Jungbrunnen nahe. 194 10.9 10 Bewegung schneller Teilchen im Gravitationsfeld Das statische isotrope Gravitationsfeld Obwohl die Sonne leicht abgeplattet ist und um ihre Symmetrieachse rotiert, obwohl also die Massenverteilung der Sonne weder kugelsymmetrisch noch statisch ist, werden wir ihr Gravitationsfeld als statisch und isotrop idealisieren. Der hierdurch entstehende Fehler bei der Berechnung der Licht- und Teilchenbahnen ist bei weitem zu klein, um experimentell nachgewiesen werden zu können. Zur Bestimmung des Gravitationsfeldes einer vorgegebenen Massenverteilung hat man die hier nicht diskutierten Einsteinschen Feldgleichungen zu lösen, ähnlich wie man das Coulombfeld durch Lösung der Maxwellschen Gleichungen findet. Tatsächlich können wir uns auch ohne Benutzung der Feldgleichungen durch elementare Überlegungen hinreichenden Aufschluss über das gesuchte Feld verschaffen. Wir benutzen am besten räumliche Kugelkoordinaten xµ = (ct, r, θ, ϕ), wobei r = 0 das Zentrum der Massenverteilung bedeutet. Den metrischen Tensor gµν können wir dann ablesen aus der allgemeinst möglichen Form des Eigenzeitintervalls dτ 2 = −gµν dxµ dxν . Für letztere dürfen wir, wie leicht einzusehen ist, ansetzen dτ 2 = −g00 (r)c2 dt2 − grr (r2 ) dr2 − r2 (dθ2 + sin2 θdϕ2 ) . (10.61) Wegen der Isotropie und Zeitunabhängigkeit des Feldes hängen nämlich die Koeffizienten g00 und grr nur von r ab. Die Nichtdiagonalelemente g0r , g0θ , g0ϕ , grθ , grϕ , gθϕ müssen alle verschwinden; ein Beitrag zu dτ 2 der Form grϕ dr dϕ, z. B., würde vom Vorzeichen von dϕ abhängen und somit die Richtung θ = 0 auszeichnen, während die Mischglieder g0i dct dxi eine Zeitrichtung auszeichnen würden. Dass das dritte Glied in (10.61) nicht eine weitere freie Funktion von r enthält, sondern gθθ = r2 erscheint, lässt sich immer durch Festlegung der 2 Längeneinheit einrichten; wenn etwa p gθθ = C(r) 6= 2r gegeben ist, so führt die Koordinatentransformation r̃ = C(r) zu gθθ = r̃ , ohne dass sich die Struktur von (10.61) ansonsten ändert. Es ist jedoch nicht möglich, durch weitere Koordinatentransformationen die Zahl der freien Funktionen in dτ 2 unter zwei zu drücken. Von den beiden Koeffizienten g00 (r) und grr (r) wissen wir zunächst nur, dass sie im feldfreien Raum, d. h. insbesondere für r → ∞ die Werte −1 bzw. +1 haben müssen, denn dort ist die Metrik Minkowskisch. Außerdem hatten wir uns davon überzeugt, dass im Newtonschen Grenzfall, d. h. für ein schwaches Feld gilt g00 (r) ≈ −1 − 2ϕ/c2 = −1 + 2M G , c2 r (10.62) wobei M die felderzeugende Masse ist. Der hier auftretende Parameter M G/c2 hat die Dimension einer Länge und heißt Schwarzschildradius der Massenverteilung. Sein Zahlenwert für die Sonne ist MS G/c2 = 1.48 km , (10.63) also sehr klein gegenüber dem Sonnenradius RS = 6.96 × 105 km (10.64) 10.9 Das statische isotrope Gravitationsfeld 195 und erst recht klein gegenüber dem kleinsten Abstand eines Planeten vom Sonnenzentrum. Zum Beispiel beträgt der Aphelabstand des Merkur rM ≈ 4.59 × 107 km ≈ 65RS . (10.65) Die Kleinheit des Schwarzschildradius der Sonne gegen RS ist der Grund der Schwäche des Gravitationsfeldes überall im Sonnensystem. Wenn die relativistische Gravitationstheorie außer der Gravitationskonstanten G keine weiteren Kopplungskonstanten in Rechnung stellen muss – es gibt in der Tat keine empirischen Hinweise auf das Auftreten solcher Kopplungskonstanten –, so ist der Schwarzschildradius der einzige Parameter der Dimension einer Länge, den die Gravitationstheorie für das Feld eines statischen isotropen Sterns der Masse M zur Verfügung stellt. Da die Koeffizienten g00 (r) und grr (r) dimensionslos sind, müssen sie dann vom dimensionslosen Argument M G/c2 r abhängen, d. h. die Form grr = A µ MG c2 r ¶ , g00 = −B µ MG c2 r ¶ (10.66) haben. Überall im Sonnensystem und sogar an der Sonnenoberfläche ist das Argument der Funktionen A und B sehr klein gegen eins, so dass wir A und B sicher durch die Taylorreihen A = 1 + 2γ MG + ··· c2 r MG B = 1 − 2 2 + 2(β − γ) c r µ MG c2 r ¶2 + ··· (10.67) approximieren können. Die Parametrisierung der Entwicklungskoeffizienten durch die noch zu bestimmenden Größen β und γ ist Konventionssache. Aus dem Eigenzeitinkrement (10.61) lesen wir den metrischen Tensor g µν ab. Seine nicht verschwindenden Elemente lauten g00 = −B, gθθ = r2 , grr = A, gϕϕ = r2 sin2 θ . (10.68) Der inverse metrische Tensor ist ebenfalls diagonal und kann ohne Rechnung aus (10.68) entnommen werden g 00 = −1/B, g rr = 1/A, gθθ = r−2 , g ϕϕ = 1/r 2 sin2 θ . (10.69) Zum Aufstellen der Bewegungsgleichung eines Teilchens benötigen wir noch das Christoffelsymbol Γλµν = 1 λσ g 2 µ ∂gσµ ∂gσν ∂gµν + µ − σ xν x x ¶ . (10.70) 196 10 Bewegung schneller Teilchen im Gravitationsfeld Aus (10.68) und (10.69) finden wir die nichtverschwindenden Elemente zu 1 dA r r sin2 θ , Γrθθ = − , Γrϕϕ = − , 2A dr A A 1 = Γθθr = , Γθϕϕ = − sin θ cos θ, r 1 = Γϕϕr = , Γϕθϕ = Γϕϕθ = cot θ, r Γrrr = Γθrθ Γϕrϕ Γ0r0 = Γ00r = Γr00 = 1 dB 2A dr (10.71) 1 dB . 2B dr Wir wenden uns nun der Bewegungsgleichung eines Teilchens zu, wobei wir für die Funktionen A und B die Entwicklungen (10.67) nehmen. Nebenbei sei bemerkt, dass die Einsteinschen Feldgleichungen das exakte Resultat B = A−1 = 1 − 2M G , c2 r (10.72) also β=γ=1 (10.73) zulassen. 10.10 Bewegungsgleichungen im statischen isotropen Feld Wenn wir den Ort eines Teilchens zur Zeit t = x0 /c durch Kugelkoordinaten x1 = r, x2 = θ, x3 = ϕ festlegen, so nehmen die allgemeinen Bewegungsgleichungen µ ν d2 x λ λ dx dx + Γ =0 µν dτ 2 dτ dτ (10.74) im eben gewonnenen statischen isotropen Feld die folgenden Formen an d2 t B 0 (r) dt dr =0 (10.75) + dσ 2 B(r) dσ dσ µ ¶2 µ ¶2 µ ¶2 µ ¶2 d2 r A0 dr r dθ r sin2 θ dϕ B 0 dct + − − + = 0 (10.76) dσ 2 2A dσ A dσ A dσ 2A dσ µ ¶2 dϕ d2 θ 2 dθ dr − sin θ cos θ + =0 (10.77) 2 dσ r dσ dσ dσ dϕ dθ d2 ϕ 2 dϕ dr + 2 cot θ =0. + dσ 2 r dσ dσ dσ dσ (10.78) Dabei bedeutet A0 = dA/dr, B 0 = dB/dr. Die Bahnkurve xµ (σ) ist mit einer Größe σ parametrisiert, die ganz beliebig gewählt werden kann. Für ein massives Teilchen ist dessen Eigenzeit eine nahe liegende und manchmal bequeme Wahl. 10.10 Bewegungsgleichungen im statischen isotropen Feld 197 Trotz der ungewohnten Form sind die Bewegungsgleichungen (10.75-10.78) nicht schwerer zu lösen als ihre in 3 behandelten nichtrelativistischen Vereinfachungen. Letztere, die Newtonschen Gleichungen für das Keplerproblem, sind hier als Grenzfall c → ∞ enthalten, wie Sie nach Eintragen von A und B aus 10.9 sofort sehen. Die folgenden Betrachtungen Schritt für Schritt mit den entsprechenden der Newtonschen Theorie zu vergleichen, sollte für Sie lehrreich und erfreulich sein. Die nichtrelativistischen Bahnkurven im isotropen Feld verlaufen in Ebenen. Ebenso die relativistischen Bahnen, denn die Gleichungen (10.75-10.78) erlauben die Lösungen ϕ = const oder θ = π2 . Wir wählen die Bezugsrichtungen der Winkel so, dass die Bahn in der Ebene θ= π 2 (10.79) liegt. Es bleibt die Aufgabe, die Bahnkurve in den Polarkoordinaten r = r(t) und ϕ = ϕ(t) zu finden. Beim nichtrelativistischen Keplerproblem hatten wir uns dabei der Erhaltungssätze für Drehimpuls und Energie bedient. Auch hier gehen wir so vor. Die Gleichungen (10.75) und (10.78) besagen, dass längs der Bahn die Größen B(dt/dσ) bzw. r 2 dϕ/dσ konstant bleiben. Ohne Verlust an Allgemeinheit setzen wir dσ = B dt , (10.80) denn die auftretende Integrationskonstante lässt sich im Parameter σ absorbieren. Die Konstanz von r 2 dϕ/dσ lässt sich dann ausdrücken als r2 dϕ = l = const . B dt (10.81) Die nichtrelativistische Version (c = ∞ bzw. B = 1) dieses Erhaltungssatzes für ein Teilchen der Masse m hatten wir als Drehimpulserhaltungssatz kennengelernt mit L = lm (10.82) als Betrag des Bahndrehimpulses. In der Form (10.81) gilt der Drehimpulssatz nun sowohl für massive wie für masselose Teilchen, d. h. Lichtbahnen. Auch hier bleibt der Drehimpuls übrigens nach Betrag und Richtung erhalten. Die Drehimpulsrichtung ist durch (10.79) als parallel zur Geraden θ = 0 bestimmt. Um schließlich die relativistische Verallgemeinerung des Newtonschen Energieerhaltungssatzes aufzustellen, verwenden wir die Konstanz des Drehimpulses gemäß (10.79) und (10.81) sowie die Beziehung (10.80) in (10.76) und erhalten d2 r A0 + dτ 2 2A µ dr dσ ¶2 − c2 B 0 l2 + =0. r3 A 2AB 2 (10.83) Nach Multiplikation mit 2A(dr/dσ) entsteht hieraus der gesuchte Erhaltungssatz µ µ ¶2 ¶ l2 dr d c2 + 2− A =0. (10.84) dσ dσ r B 198 10 Bewegung schneller Teilchen im Gravitationsfeld Die gegenüber dem nichtrelativistischen Grenzfall erreichte Verallgemeinerung wird besonders sinnfällig, wenn wir den Parameter σ mit Hilfe von (10.80) zugunsten der Zeit t eliminieren, µ dr dt A 2B 2 µ A B2 ¶2 + l2 c2 − = const ≡ 2e − c2 r2 B (10.85) oder dr dt ¶2 + c2 l2 + 2 2r 2 µ 1− 1 B ¶ =e. (10.86) Die Integrationskonstante ist hier so benannt, dass im Grenzfall c → ∞ aus (10.85) gerade der Newtonsche Energiesatz entsteht mit e = E/m (10.87) als der nichtrelativistischen Energie pro Masseneinheit des bewegten Teilchens. Beachten Sie, dass der Ansatz der Integrationskonstanten in (10.85) gerade die Ruheenergie eines massiven Teilchens als additiven Beitrag zur Energiebilanz längs der Bahn in Rechnung stellt. Schließlich will ich, nachdem der Zusammenhang von (10.86) mit dem Newtonschen Energiesatz für ein massives Teilchen im Keplerpotential hergestellt ist, betonen, dass der relativistische Erhaltungssatz (10.86) auch für masselose Teilchen, insbesondere also Lichtbahnen gilt; dabei wird nur die Interpretation der Integrationskonstanten e gemäß (10.87) hinfällig. Um die Integrationskonstante e für Lichtbahnen zu bestimmen, berücksichtigen wir, dass längs einer Lichtbahn der Minkowskiabstand beliebiger Raum-Zeit-Punkte verschwindet. Aus dτ 2 = +Bc2 dt2 − A dr 2 − r2 (dθ2 + sin2 θ dϕ2 ) = 0 (10.88) folgt mit dθ und dϕ aus (10.79) bzw. (10.81) Bc2 − A µ dr dt ¶2 − B 2 l2 =0 r2 (10.89) und dies ist gerade der Energiesatz (10.85) mit e = c2 /2 . (10.90) Die beiden Differentialgleichungen (10.81) und (10.86) legen die zeitlichen Abläufe der möglichen Teilchenbahnen im statistischen isotropen Gravitationsfeld, d. h. die Funktionen r(t) und ϕ(t) fest. Falls nur die rein räumliche Gestalt der Bahnkurven, d. h. die Funktion r(ϕ) von Interesse ist, kann mit Hilfe von (10.81) die Zeit aus (10.86) eliminiert werden, woraufhin wir erhalten Al2 2r4 µ dr dϕ ¶2 l2 c2 + 2+ 2r 2 µ ¶ 1 1− =e. B (10.91) Diese Differentialgleichung für die Bahnkurve r = r(ϕ) werden wir nun für zwei wichtige Spezialfälle lösen. 10.11 Periheldrehung der Planeten 10.11 199 Periheldrehung der Planeten Die Keplerellipsen sind keine strengen Lösungen der Einsteinschen Bewegungsgleichung eines Planeten im statischen isotropen Feld. Vielmehr gleichen die relativistischen Lösungen r = r(ϕ) Rosetten, die wir uns aus den Keplerellipsen dadurch entstanden denken können, dass die große Ellipsenachse sich bei jedem Umlauf um einen kleinen Winkel δϕ verdreht. Die Abbildung 10.3 übertreibt δϕ. Abbildung 10.3 Wir wollen nun δϕ in niedrigster Ordnung in 1/c2 ausrechnen und tragen dazu die Entwicklungen (10.67) 1/B = 1 + 2 M 2 G2 MG + 2(2 − β − γ) 4 2 + · · · 2 c r c r 1/A = 1 − 2γ MG + ··· c2 r (10.92) in den Energiesatz“ (10.91) ein. Es ergibt sich, mit r 0 = dr/dϕ, ” 2 ¶ · ¸ MG c2 M G M 2 G2 1 − 2γ 2 − 2 + 2(2 − β − γ) 4 2 c r l c2 r c r µ ¶ MG 2e . = 2 1 − 2γ 2 l c r 1 r0 + r4 r2 µ (10.93) Sie sehen hier übrigens, warum die obige Entwicklung für 1/B eine Ordnung weiter getrieben werden muss als die für 1/A. Der Grund besteht im Auftreten des Faktors c2 vor dem Glied [1 − 1/B]. Die Gleichung (10.93) verschönert sich, wenn wir u(ϕ) = 1/r(ϕ) (10.94) 200 10 Bewegung schneller Teilchen im Gravitationsfeld als abhängige Variable einführen, zu µ · ¸ ¶ MG c2 2M G M 2 G2 2 2 u0 + u2 1 − 2γ 2 u − 2 u + 2(2 − β − γ) u c l c2 c4 µ ¶ 2e MG = 2 1 − 2γ 2 u. (10.95) l c Da wir nur an Korrekturen der Ordnung 1/c2 zum Newtonschen Resultat interessiert sind, verzichten wir auf die exakte Lösung von (10.95). Die angemessene Näherungslösung finden wir am schnellsten, indem wir durch Differenzieren nach ϕ eine Differentialgleichung zweiter Ordnung herstellen, ¸ µ ¶ · MG 2e MG M 2 G2 00 1 − γ 2 = 3γ 2 u2 . (10.96) u + 1 − 2(2 − β − γ) 2 2 u − 2 c l l c c In nullter Ordnung in 1/c2 ist dies eine Schwingungsgleichung mit der Lösung uK (ϕ) = MG [1 + ε cos(ϕ − ϕ0 )] = 1/rK (ϕ) , l2 (10.97) wobei ϕ0 und ε als Integrationskonstanten auftreten. Für ε < 1 sind die Lösungen (10.97) gerade die Keplerellipsen. Die Bezugsrichtung für den Winkel ϕ kann immer so gewählt werden, dass ϕ0 = 0 ist. Bis auf das (kleine!) nichtlineare Glied auf der rechten Seite ist (10.96) ebenfalls die Differentialgleichung einer linearen Schwingung, deren Lösungen offenbar lauten µ ¶ MG 2e 1 u0 (ϕ) = 2 1−γ 2 (1 + ε cos ωϕ) l c ω2 mit ω 2 = 1 − 2(2 − β − γ) M 2 G2 . c2 l 2 (10.98) Suchen wir nun die Lösung von (10.96) durch den Ansatz u(ϕ) = u0 (ϕ) + u1 (ϕ) , (10.99) so erhalten wir u1 bis auf Korrekturen der Ordnung 1/c4 aus der Differentialgleichung u001 + ω 2 u1 = 3γ M 3 G3 (1 + ε cos ωϕ)2 . l 4 c2 (10.100) Die Korrektur u1 (ϕ) kann demnach als eine erzwungene Schwingung aufgefasst werden und ist leicht zu finden, · ¸ ω 2 ε2 /2 M 3 G3 cos 2ωϕ . (10.101) u1 (ϕ) = 3γ 2 2 2 (1 + ε2 /2) + εωϕ sin ϕω − l c ω 4 − ω2 Nur der in ϕ lineare Summand ist von Belang, denn er allein wächst mit jeder Umrundung der Sonne, um schließlich, nach hinreichend vielen Umläufen, die Schwelle der Beobachtbarkeit zu erreichen. Wir vernachlässigen die anderen 10.11 Periheldrehung der Planeten 201 Glieder in (10.101). Insgesamt finden wir, unter Inkaufnahme weiterer Fehler der Ordnung 1/c4 µ ¶ 2e 1 MG (1 + ε cos ωϕ) 1−γ 2 u(ϕ) ≈ 2 l c ω2 M 3 G3 ϕ ε sin ωϕ l 4 c2 ω ¸ µ ¶ · 2e 1 M 2 G2 MG ϕ sin ωϕ . 1−γ 2 1 + ε cos ωϕ + ε3γ ≈ 2 l c ω2 c2 l 2 + 3γ (10.102) Die beiden ϕ-abhängigen Glieder lassen sich wegen cos(ϕ3γM 2 G2 /l2 c2 ) ≈ 1 mit Hilfe eines trigonometrischen Additionstheorems zusammenfassen, woraufhin wir erhalten u(ϕ) ∼ 1 + ε cos Ωϕ ∼ 1/r(ϕ) Ω=1− M 2 G2 (2 − β + 2γ) . c2 l 2 (10.103) Wir schließen, dass zwei aufeinander folgende größte Annäherungen (Perihelia) des Planeten an die Sonne durch das Winkelinkrement 2π/Ω 6= 2π getrennt sind. Die Abweichung 2π/Ω − 2π ist die gesuchte Periheldrehung pro Umlauf, δϕ = 2π(−1 + 1/Ω) = 2π M 2 G2 (2 − β + 2γ) + O(1/c4 ) . c2 l 2 (10.104) Da in den astronomischen Tafeln meist nicht der auf die Planetenmasse bezogene Drehimpuls gegeben wird, ist es zweckmäßig, l2 durch die große Halbachse a und die Exzentrizität ε der Keplerellipse auszudrücken. Aus (10.97) finden Sie leicht l2 = a(1 − ε2 )M G und somit δϕ = 6π MG 2 − β + 2γ . 2 −ε ) 3 c2 a(1 (10.105) Unter den Planeten der Sonne hat der erst im Jahr 1949 entdeckte Ikarus die größte Periheldrehung pro Umlauf. Die bis heute akkumulierten astronomischen Daten erlauben die Bestimmung der Periheldrehung aber erst mit einer Genauigkeit von etwa 10%. Viel genauer ist die Periheldrehung des Merkur, δϕM = 43.1100 ± 0.4500 pro Erdjahrhundert , (10.106) bekannt. Tragen wir die Daten MS , aM und εM sowie die Periheldrehung (10.106) in (10.105) ein, so erhalten wir 2 − β + 2γ = 1.00 ± 0.01 . 3 (10.107) Dieses Resultat ist in schönstem Einklang mit den aus den Einsteinschen Feldgleichungen folgenden Werten β = γ = 1. Zur experimentellen Bestimmung von β und γ brauchen wir allerdings neben (10.106) einen weiteren unabhängigen Zusammenhang zwischen diesen Parametern. 202 10 Bewegung schneller Teilchen im Gravitationsfeld 10.12 Lichtablenkung durch die Sonne Zur Berechnung der Bahn eines Lichtstrahls, der, von einem Stern kommend, an der Oberfläche der Sonne vorbei zur Erde läuft, können wir den Energie” satz“ (10.91) oder, besser, die aus ihm gewonnene Differentialgleichung (10.96) verwenden. Dabei müssen wir, wie in 10.10 besprochen, als kinetische Energie ” pro Masse“ des Photons e = c2 /2 (10.108) ansetzen. Ferner ist wichtig, den Drehimpuls pro Masse“ l des Photons als ” proportional zur Lichtgeschwindigkeit c zu erkennen. Dazu müssen wir uns nur klarmachen, dass der Teil des Lichtstrahls, der so weit vor der Sonne verläuft, dass das Feld der Sonne noch vernachlässigbar klein ist, durch die Gerade b = sin ϕ r (10.109) beschrieben wird (Abbildung 10.4). Dabei ist b, der so genannte Stoßparameter, Abbildung 10.4 die kürzeste Entfernung der Geraden von der Sonne. In diesem Raumbereich wandert eine Wellenfront mit der Geschwindigkeit c=− d (r cos ϕ) = −ṙ cos ϕ + ϕ̇r sin ϕ . dt (10.110) Aus letzterer Gleichung und der aus (10.109) durch Differenzieren gewonnenen Identität 0 = ṙ sin ϕ + ϕ̇r cos ϕ (10.111) finden wir rϕ̇ = c sin ϕ = bc/r, also den Drehimpuls pro Masse“ ” r2 ϕ̇ = l = bc . (10.112) Dieser Ausdruck war zu erwarten für ein mit Lichtgeschwindigkeit bewegtes Teilchen“. ” Nach Eintragen der Integrationskonstanten e und l in (10.95) finden wir als Differentialgleichung für die Lichtbahn u(ϕ) = 1/r(ϕ) · ¸ M 2 G2 MG MG u00 + 1 − 2(2 − β − γ) 2 4 u − (1 − γ) 2 2 = 3γ 2 u2 . (10.113) b c b c c 10.12 Lichtablenkung durch die Sonne 203 Da wir nur an der Korrektur niedrigster Ordnung in 1/c2 zur Geraden (10.109) interessiert sind, lassen wir das zu 1/c4 proportionale Glied auf der linken Seite fallen und untersuchen die Gleichung u00 + u = (1 − γ) MG MG + 3γ 2 u2 . b2 c 2 c (10.114) Wegen der Kleinheit der rechts stehenden relativistischen Korrekturglieder (der Schwarzschildradius MS G/c2 der Sonne ist viel kleiner als der kleinstmögliche Wert für den Stoßparameter b, d. h. als der Sonnenradius), verzichten wir wieder auf eine exakte Lösung. Wir begnügen uns mit der Näherung u(ϕ) = 1 sin(ϕ − ϕ0 ) + u1 (ϕ) , b (10.115) wobei u1 (ϕ) die Korrektur der Ordnung 1/c2 zur Lösung nullter Ordnung ist. Letztere statten wir bequemlichkeitshalber mit einer (in (10.109) Null gesetzten) Integrationskonstanten ϕ0 aus und berechnen die Störung aus u00 (ϕ) + u(ϕ) = (1 − γ) MG MG + 3γ 2 2 sin2 (ϕ − ϕ0 ) + O(1/c4 ) . 2 2 b c b c (10.116) Die Lösung dieser Differentialgleichung einer erzwungenen Schwingung finden Sie leicht selbst. Insgesamt ergibt sich u(ϕ) = MG MG 1 2 sin(ϕ − ϕ0 ) + (1 − γ) 2 2 + γ 2 2 [1 + cos(ϕ − ϕ0 )] b b c b c + O(1/c4 ) (10.117) Hieraus berechnen wir schnell den gesuchten Ablenkungswinkel δϕ. Legen wir zunächst die Integrationskonstante ϕ0 so fest, dass der Lichtstrahl mit dem Winkel ϕ = π einläuft, wie das in der Skizze und in (10.109) angenommen ist. Wegen der Kleinheit der relativistischen Effekte wird |ϕ0 | ¿ 1 sein und wir erhalten aus u(π) = 1/r(π) = 0 0= 1 MG ϕ0 + (1 − γ) 2 2 + O(ϕ40 ) . b b c (10.118) Der Strahl läuft aus für ϕ → ϕ∞ und es gilt ebenfalls |ϕ∞ | ¿ 1. Wir finden ϕ∞ aus u(ϕ∞ ) = 1/r(ϕ∞ ) = 0, also ϕ∞ − ϕ0 + (1 − γ) ¡ ¢¤ MG MG£ + γ 2 4 + O (ϕ∞ − ϕ0 ) = 0 . bc2 bc (10.119) Zusammen mit der Bestimmung (10.118) für ϕ0 ergibt sich der Ablenkungswinkel δϕ = |ϕ∞ | = 2(1 + γ) MG . bc2 (10.120) Setzen wir hier den Schwarzschildradius der Sonne, MS G/c2 ≈ 1, 48 km, und für b den Sonnenradius, RS ≈ 6, 95 × 105 km, ein. Dann ergibt sich der Ablenkwinkel für einen Lichtstrahl, der auf dem Weg zur Erde unmittelbar an der Sonnenoberfläche vorbeistreicht, δϕmax = 1, 7500 × 1+γ . 2 (10.121) 204 10 Bewegung schneller Teilchen im Gravitationsfeld Die heute verfügbaren Daten (im optischen Spektralbereich und für Radiowellen) sind verträglich mit der Einsteinschen Vorhersage γ = 1, legen aber den Parameter γ, erst mit etwa 10-prozentiger Genauigkeit fest. Von genaueren Messungen werden Sie mit Sicherheit in naher Zukunft hören und lesen. Insgesamt geben die hier besprochenen experimentellen Befunde (zur Frequenzverschiebung fallender Photonen, zur Periheldrehung und zur Lichtablenkung im Gravitationsfeld) eine schöne Bestätigung des Einsteinschen Äquivalenzprinzips und der weitergehenden Aussagen der Einsteinschen Gravitationstheorie. Kapitel 11 Quanten 11.1 Teilchen sind Wellen Teilchen sind Wellen, und Wellen sind Teilchen. Um den Sinn solchen Verwirrspiels mit Worten klarzulegen, rufen wir uns einige prototypische experimentelle Erfahrungen in Erinnerung. Davisson und Germer ließen, wie in Abbildung 11.1 schematisch dargestellt, einen gut kollimierten Strahl monoenergetischer Elektronen auf eine ebene Oberfläche eines Kristalls einfallen und maßen, bei konstantem einfallenden Elektro- { Abbildung 11.1 nenstrom und konstantem Einfallswinkel ϕ, den Strom der reflektierten Elektronen als Funktion des Impulses der einfallenden Elektronen. Es ergeben sich besonders starke reflektierte Ströme für solche Impulse p, die die Beziehung h 2a sin ϕ = n , p mit n = 1, 2, 3, . . . (11.1) erfüllen, wobei h = 6, 61 × 10−27 erg s = 6.61 × 10−34 J s (11.2) die Plancksche Konstante ist. Die Elektronen verhalten sich dabei wie Wellen der Wellenlänge (de Broglie-Wellenlänge) λ = h/p, 205 (11.3) 206 11 Quanten denn für derartigen Wellen garantiert die Beziehung (11.1) gerade konstruktive Interferenz der an aufeinander folgenden Netzebenen reflektierten Wellenamplituden. Entsprechende Experimente mit Röntgenstrahlen, also elektromagnetischen Wellen, waren vorher schon von von Laue durchgeführt worden. Die bevorzugten Reflexionen sind dabei ebenfalls durch (die aus der Optik bekannte Braggsche Relation) 2a sin ϕ = nλ (11.4) ausgezeichnet. Dass umgekehrt auch elektromagnetische Wellen Teilchencharakter zeigen können, wissen Sie z. B. vom Comptoneffekt. Läuft ein Elektron gegen einen γ-Strahl mit Wellenlänge λ, Frequenz ν = c/λ und Wellenvektor ~k, so kann das Elektron einen Stoß erleiden, bei dem sich die Energie und der Impuls des Elektrons ändern. Unverändert bleiben jedoch Gesamtenergie und Gesamtimpuls von Elektron und elektromagnetischer Welle, wenn dem Stoßpartner des Elektrons, dem Photon, der Impuls |~ p| = h/λ und p~ = h~ k 2π (11.5) und die Energie E = hν = hc/λ (11.6) zugeordnet werden. Bevor wir uns in die Konsequenzen derartiger Experimente vertiefen, dürfen wir uns klarmachen, dass wenigstens im Erfahrungsbereich des Alltags, dem jedes Kind seine Anschauung der Welt abgewinnt, ein Teilchen ein Teilchen bleibt und keine Welle Teilchencharakter vorgaukelt. Um etwa den Wellencharakter einer Kegelkugel nachzuweisen, müsste auf einem Längenmaßstab λ = h/p experimentiert werden. Nun ist der Impuls einer Kegelkugel von der Größenordnung p ≈ 1 kg m/s, und dieser Wert entspricht einer de Broglie Wellenlänge λ ≈ 6, 6 × 10−32 cm. Solch aberwitzig kleine Wellenlängen entziehen sich übrigens nicht nur alltäglichen Beobachtungsmethoden. Sie dürfen nun selber überlegen, ob der Wellencharakter der Erde bei der alljährlichen Umrundung der Sonne nachweisbar ist. Ebenso aufschlussreich ist die Berechnung der typischen Elektronengeschwindigkeit im Davisson Germer Experiment, v ≈ h/ma. Sie beträgt einige tausend Stundenkilometer, wenn als Gitterkonstante a ≈ 10−8 cm angesetzt wird. Wegen der Kleinheit der Elektronenmasse können solche für den Alltag exotisch großen Geschwindigkeiten bequem erreicht werden, indem Elektronen einem elektrischen Feld der Größenordnung 100 V ausgesetzt werden. Im Übrigen beträgt hier die typische Elektronengeschwindigkeit wenige Prozent der Lichtgeschwindigkeit, so dass eine nichtrelativistische Behandlung des Effektes gerade noch gerechtfertigt ist. Überzeugen wir uns davon, dass auch die Elektronenbewegung in der Atomhülle nichtrelativistischen Wellencharakter zeigen muss. Die typische Bindungsenergie eines Elektrons beträgt einige zehn Elektronenvolt, was wieder einer Geschwindigkeit von wenigen tausend Sekundenkilometern und einer de Broglie Wellenlänge λ ≈ h/mv der Größenordnung 10−8 cm entspricht. Diese Wellenlänge stimmt aber gerade mit der Größenordnung des Atomdurchmessers überein. 11.1 Teilchen sind Wellen 207 Die klassischen Begriffe Teilchen“ und Welle“ sind beide zu eng, als dass ei” ” ner allein ausreichen würde zur Beschreibung des Verhaltens mikroskopischer ” Gebilde“, die wir künftig Quanten nennen werden. Das Quant Elektron benimmt sich bei manchen Experimenten, als sei es ein klassisches Teilchen, zeigt aber Welleneigenschaften, wenn es auf Längenskalen beobachtete wird, die mit der de Broglie Wellenlänge vergleichbar sind. Das Quant Photon benimmt sich wie eine Welle bei den klassischen Interferenzexperimenten, jedoch wie ein Teilchen, wenn eine elektromagnetische Welle mit der Frequenz ν auf Energieskalen der Ordnung hν beobachtet wird. Zur Charakterisierung des unterschiedlichen Verhaltens von klassischen Teilchen, klassischen Wellen und Quanten sind die folgenden Karikaturen beliebt und nützlich (Abbildung 11.2). Denken wir uns Wasserwellen einer Wellenlänge λ durch zwei Spalte eines ebenen Schirms geschickt und hinter diesem in einer zu ihm parallelen Ebene registriert. Abbildung 11.2 In der Beobachtungsebene stellen wir ein kontinuierliches Anströmen von Energie fest und schließen aus genauen Messungen, dass die Intensität I quadratisch in der kontinuierlich variablen Wellenamplitude h ist. Messen wir die Intensität als Funktion der Koordinate x quer zur Richtung der Spalte, so finden wir I = I1 = |h1 |2 , falls der untere Spalt verdeckt ist, 2 I = I2 = |h2 | , falls der obere Spalt verdeckt ist, 2 I = I12 = |h1 + h2 | , falls beide Spalte geöffnet sind. Im letzteren Fall werden, da sich die Wellenamplituden additiv verhalten, die für klassische Wellen typischen Interferenzen sichtbar. Denken wir uns nun einen stationären Strom klassischer Teilchen, etwa Schrotkörner, von einem Quellpunkt aus auf eine Blende geschleudert, so re- 208 11 Quanten gistrieren wir auf dem Schirm die Ankunft diskreter Teilchen. Die Zahl der pro Zeiteinheit in einem Zähler bei x anlangenden Teilchen sei I1 (x) und I2 (x), wenn der untere bzw. der obere Spalt verdeckt sind. Dann ergibt sich, wenn beide Spalte geöffnet sind, die Verteilung I12 (x) = I1 (x) + I2 (x), da jedes registrierte Teilchen entweder durch den oberen oder durch den unteren Spalt gelaufen ist. Es addieren sich also hier die Intensitäten und nicht etwa die Wellenamplituden. Bei dieser Karikatur ist natürlich angenommen, dass die Spaltdurchmesser, der Spaltabstand und das räumliche Auflösungsvermögen des in der Schirmebene benutzten Teilchenzählers groß sind gegenüber der de Broglie Wellenlänge der Schrotkörner. Schließlich unterwerfen wir Quanten, etwa Elektronen, entsprechendem Vorgehen. In den Zähler gelangen die Elektronen einzeln, wobei sich ihr Teilchencharakter manifestiert. Jedoch zeigt die Stromverteilung auf der Blende ein Interferenzmuster ähnlich dem der Wasserwellen, wenn beide Spalte geöffnet sind. Offenbar ist die Bewegung der Elektronen hier durch eine Wellenamplitude ψ charakterisiert, die sich additiv aus den Beiträgen von beiden Spalten zusammensetzt. ψ = ψ1 + ψ2 I12 = |ψ1 + ψ2 |2 = I1 + I2 + ψ1 ψ2∗ + ψ1∗ ψ2 . (11.7) Zu schließen ist, dass von einem im Detektor anlangenden Quant nicht gesagt werden kann, durch welchen der beiden Spalte es gekommen ist; zeigt doch das in der Beobachtungsebene nachgewiesene Interferenzmuster, dass eine Welle durch beide Spalte gelaufen ist. Um die merkwürdige Dualität der Quanten weiter zu beleuchten, wiederholen wir das letztere Gedankenexperiment mit Elektronen, stellen aber, um uns des Weges eines Elektrons zu vergewissern, hinter den Spalten eine Lampe auf, die den Durchgang eines Elektrons durch einen Spalt durch einen Lichtblitz anzeigt (ein Photon wird am Elektron gestreut)(Abbildung 11.3). Von jedem Abbildung 11.3 auf dem Schirm auftreffenden Elektron ist nun bekannt, durch welchen Spalt es 11.1 Teilchen sind Wellen 209 gelaufen ist. Die Gesamtheit der Elektronen, die so als durch den oberen (unteren) Spalt laufend erkannt sind, führt auf dem Schirm zu einer Verteilung I1 (x) (bzw. I2 (x)), die vorher bei verdecktem unterem (bzw. oberen) Spalt gefunden wurde. Als Verteilung aller Elektronen, deren Weg identifiziert wurde als oberer oder unterer Weg, ergibt sich I12 = I1 + I2 . Die Interferenzerscheinungen gehen also verloren, wenn wir uns durch Beobachtung vergewissern, ob das Elektron den oberen oder den unteren Spalt passiert. Schließen Sie nicht etwa, das Elektron richte sein Verhalten danach, ob ein neben der Apparatur stehender Mensch Augen und Ohren geöffnet oder verschlossen hält, ob also eine sinnlich Wahrnehmung des Lichtblitzes am Spalt und des Tickens des Zählers am Schirm erfolgt. Gegenüber mancherorts geäußerten Feststellungen einer besonderen Rolle des beobachtendem Subjekts in der Quantenmechanik ist äußerste Vorsicht und Zurückhaltung geboten. Sämtliche hier skizzierten Gedankenexperimente können im Labor automatisiert durchgeführt werden. Die Rolle des Beobachters bleibt darauf beschränkt, dass er die vom Zeichengerät ausgeworfenen Intensitätsverteilungen zur Hand nimmt und über sie nachdenkt. Für die oben angesprochene Lokalisierung eines Elektrons an einem Spalt und den damit verbundenen Verlust der Interferenz ist keineswegs konstitutiv ein subjektiver Wahrnehmungsakt, sondern ausschließlich die Beeinflussung des Elektrons durch das zur Lokalisierung verwendete Licht. Damit nämlich ein Lichtfleck am unteren Spalt räumlich getrennt erscheint von einem Lichtfleck am oberen Spalt, muss, wie Sie aus der Einführung in die Optik wissen, Licht verwendet werden, dessen Wellenlänge λph kleiner ist als der Spaltabstand ∆x. Nun gilt beim Elektron-Photon-Stoß der Impulserhaltungssatz, so dass sich der Impuls des Elektrons beim Stoß um einen Betrag der Größenordnung |∆p| ≈ h/λph & h/∆x (11.8) ändert. Folglich ändert sich auch die de Broglie Wellenlänge λel des Elektrons, u. z. gilt wegen λel ≈ h/p |∆λel | ≈ λ2 λ2 h |∆p| ≈ el & el . 2 p λph ∆x (11.9) Da das Experiment mit ∆x ≈ λel durchgeführt werden muss, damit der Quantencharakter des Elektrons im Interferenzmuster auf dem Schirm sichtbar werden kann, ist klar, dass beim zur Lokalisierung des Elektrons notwendigen Stoß eine relative Änderung ∆λel /λel der de Broglie Wellenlänge der Größenordnung 1 auftritt. Die Monochromasie der Elektronenwelle (d. h. die durch Auswahl der Quelle vor dem Stoß gegebene Konstanz von Impuls und Energie von Elektron zu Elektron) geht also bei der Wechselwirkung mit der zur Lokalisierung geeigneten Lichtwelle (d. h. beim Elektron-Proton-Stoß) völlig verloren. Somit ist das Verschwinden des Interferenzmusters für die lokalisierten Elektronen physikalisch geklärt. Zur weiteren Bestätigung der durchgeführten Überlegung dient eine letzte Variante des obigen Gedankenexperiments. Beleuchten wir ein Elektron links von der Blende mit Licht, dessen Wellenlänge größer ist als der Spaltabstand. Der jetzt bei der Wechselwirkung des Lichts und einem Elektron entstandene Lichtfleck hat eine räumliche Ausdehnung, die größer ist als der Spaltabstand, erlaubt also nicht mehr die Zuordnung des Elektronenweges zu einem der Spalte. 210 11 Quanten Auf dem Schirm sind nun auch für die durch Lichtflecke aufgefallenen Elektronen Interferenzmuster nachweisbar. Das zur Lokalisierung des Elektrons zu langwellige Licht stört die Monochromasie des Elektrons nur so wenig, dass letztere zu konstruktiver Interferenz fähig bleibt. 11.2 Heisenbergs Unschärferelation Das eben Erschlossene erlaubt die bündige Zusammenfassung, dass die Interferenzfähigkeit der Elektronen rechts von den Spalten notwendigerweise zerstört wird durch die Lokalisierung der Elektronen beim einen oder anderen Spalt. Äquivalent ist die folgende, oben auch schon getroffene Feststellung: Bei der Lokalisierung eines Quants mit einer räumlichen Unschärfe ∆x ist unvermeidbar, dass dem Quant die Unschärfe ∆p seines Impulses erteilt wird, die mindestens h/∆x beträgt. ∆p ∆x > h (11.10) Diese Ungleichung, die Heisenbergsche Unschärferelation, ist die prägnanteste aller Formulierungen des Quantencharakters von Teilchen und Wellen. Sie wird uns im Folgenden häufig zur Illustration des Unterschiedes zwischen klassischer Physik und Quantenphysik dienen. Ich stelle gleich eine typische Anwendung vor. Betrachten wir ein Teilchen 2 2 in einem harmonischen Potential V = m 2 ω x . Nehmen wir an, vorbehaltlich späterer Rechtfertigung, dass die Energie sich wie gewohnt aus einem kinetischen und einem potenziellen Beitrag zusammensetzt gemäß E= 1 2 1 p + mω 2 x2 ≥ 0 . 2m 2 (11.11) Nach klassischer Anschauung hat das Teilchen die kleinstmögliche Energie, nämlich E = 0, wenn es am Grund der Potentialmulde, also bei x = 0 ruht. Heisenbergs Ungleichung setzt der räumlichen Lokalisierung ∆x bei x = 0 und Abbildung 11.4 der Schärfe des Ruhens jedoch Grenzen. Bei gegebenem ∆x kann der Impuls 11.3 Die Grundprinzipien der Quantenmechanik 211 nämlich nicht mit Sicherheit kleiner sein als h/∆x, die Energie also nicht mit Sicherheit kleiner als der kleinstmögliche Wert von µ ¶2 1 1 h E= + mω 2 (∆x)2 . (11.12) 2m ∆x 2 Wenn wir diese Größe als Funktion von ∆x minimalisieren, also ∆x aus dE/d(∆x) = 0 festlegen, so finden wir als minimale Unschärfen ∆x und ∆p p √ ∆pmin ≈ mhω (11.13) ∆xmin ≈ h/mω, und somit als Schranke für die Energie Emin ≈ hω . (11.14) Wir werden diese Abschätzung der Grundzustandsenergie des harmonischen Oszillators bald verfeinern. Halten wir zunächst nochmals fest, dass der Grundzustand des quantenmechanischen Oszillators nicht den Zustand der Ruhe im Potentialminimum sein kann. Für makroskopische Oszillatoren sind die Nullpunktschwingungen“ ” gemäß den Unschärfen (11.13) meist unmessbar klein. Für die Schwingung eines H2 -Moleküls hingegen ist, wie Sie durch Einsetzen der entsprechenden Masse und Frequenz leicht finden, die minimale Ortsunschärfe ∆xmin von gleicher Größenordnung die der Moleküldurchmesser und somit so berechenbar wie letzterer. 11.3 Die Grundprinzipien der Quantenmechanik Aus der Erfahrung, dass Elektronen Interferenzerscheinungen zeigen können, hatten wir bereits geschlossen, dass die Bewegung von Quanten durch eine Wellenamplitude charakterisierbar sein muss. Die folgenden Präzisierung des Schlüssel dient uns als Schlüssel zur Entwicklung der Quantenmechanik. Die Wahrscheinlichkeit P eines Ereignisses (z. B. Registrieren eines Teilchens im Zähler am Ort ~x zur Zeit t) ist gegeben durch das Absolutquadrat einer komplexen Zahl ψ, die wir Wellenamplitude oder Wahrscheinlichkeitsamplitude oder auch Wellenfunktion nennen werden P = |ψ|2 . (11.15) Die Wahrscheinlichkeit des Ereignisses ist experimentell zu bestimmen als seine relative Häufigkeit im Vergleich zu anderen möglichen Ereignissen (z. B. Ankunft des Teilchens im Zähler am anderen Ort x~0 ) bei häufiger Wiederholung des Experiments unter identischen Bedingungen. Wenn ein Ereignis auf verschiedene Weisen stattfinden kann (z. B. Ankunft des Teilchens im Zähler nach Durchlaufen eines Doppelspalts), so ist ψ die Summe der Wahrscheinlichkeitsamplituden für die einzelnen Weisen, also etwa ψ =ψ1 + ψ2 P =|ψ1 + ψ2 |2 = |ψ1 |2 + |ψ2 |2 + ψ1∗ ψ2 + ψ1 ψ2∗ . (11.16) 212 11 Quanten Die Superponierbarkeit der Wellenfunktion entspricht der Beobachtbarkeit von Interferenzen. Wenn allerdings durch zusätzliche Eingriffe in den Ablauf des Experiments bei jedem Ereignis festgestellt wird, auf welche der mögliche Weisen es eintritt, so sind in der Wahrscheinlichkeitsverteilung P über die möglichen Ereignisse keine Interferenzen der den verschiedenen Weisen entsprechenden Partialwellen mehr feststellbar. Vielmehr addieren sich dann die Wahrscheinlichkeiten für die einzelnen Weisen also etwa P = P1 + P2 . (11.17) Das Registrieren eines Teilchens zur Zeit t im Zähler am Ort ~x ist ein aber keineswegs der einzige Typ von Ereignis. Ein anderer Typ ist die Messung des Impulses p~ zur Zeit t, wieder ein anderer die Messung der z-Komponente des Drehimpulses Lz eines Teilchens; die entsprechenden Wellenamplituden sind dann Funktionen von p~ und t bzw. Lz und t. Wir werden Situationen kennen lernen, in denen die Mannigfaltigkeit möglicher Ereignisse (d. h. Messwerte) diskret ist. In anderen Fällen (wie etwa bei der Feststellung des Ortes eines Teilchens) sind die möglichen Messwerte kontinuierlich. Die Wellenfunktion ψ wird dann zweckmäßigerweise als Funktion der entsprechenden kontinuierlichen Variablen (also etwa des Ortsvektors ~x) angesetzt und ihr Absolutquadrat (also z. B. |ψ(~x, t)|2 ) als (räumliche) Wahrscheinlichkeitsdichte definiert. Bei einer ortsabhängigen Wahrscheinlichkeitsamplitude ψ(~x, t) bedeutet dann P (~x, t) d3 x = |ψ(~x, t)|2 d3 x (11.18) die Wahrscheinlichkeit, das Teilchen zur Zeit t im Volumenbereich d3 x am Ort ~x zu finden. 11.4 Die Schrödingergleichung Wir haben bereits genug Kenntnisse zusammengetragen, um mit der Berechnung der orts- und zeitabhängigen Wellenfunktion ψ(~x, t) eines Teilchens beginnen zu können. Erinnern wir uns des experimentellen Befundes, dass ein Teilchen des Impulses p~ auch Eigenschaften einer Welle mit dem Wellenvektor ~k = p~ 2π = p~/~ (11.19) h zeigt. Da die Plancksche Konstante h im Folgenden häufig in Verbindung mit dem Faktor 1/2π auftaucht, ist es zweckmäßig, die Größe ~ = h/2π (11.20) einzuführen. Ferner wissen wir, dass die Energie E eines Teilchens mit der Kreisfrequenz ω der entsprechenden Welle gemäß E = ~ω (11.21) zusammenhängt. Ebenfalls experimentell gesichert ist, dass ein Teilchen der Masse m mit dem Impuls p~ stets die Energie E = p~2 /2m hat, E = p~2 /2m = ~ω = (~~k)2 . 2m (11.22) 11.4 Die Schrödingergleichung 213 Durch Energie und Impuls des Teilchens sind also Kreisfrequenz und Wellenvektor der zugehörigen Welle eindeutig festgelegt. Die Wahrscheinlichkeitsamplitude hat dann notwendigerweise die Form einer ebenen monochromatischen Welle, ~ ψ(~x, t) ∼ ei(k·~x−ωt) . (11.23) Es folgt, dass die Wahrscheinlichkeitsdichte |ψ(~x, t)|2 dafür, das Teilchen zur Zeit t am Ort ~x zu finden, orts- und zeitunabhängig ist. Das ist nicht verwunderlich, denn wenn, wie angenommen, der Impuls p~ des Teilchens ohne die geringste Unsicherheit |∆~ p| fest liegt, so ist nach der Heisenbergschen Unschärferelation der Ort des Teilchens völlig ungewiss, |∆~xmin | ≈ ~/|∆~ p| → ∞ für ∆~ p→0. (11.24) Also müssen die Wahrscheinlichkeitsdichte dafür, das Teilchen am Ort ~x bzw. am Ort ~x 6= x~0 zu finden, übereinstimmen. Es ist auch anschaulich klar, dass eine streng monochromatische ebene Welle keinen Anfang und kein Ende haben kann (Abbildung 11.5). Abbildung 11.5 Andererseits kann eine räumlich lokalisierte Welle (Abbildung 11.6) nicht Abbildung 11.6 streng monochromatisch sein. Ein Wellenpaket mit räumlicher Ausdehnung ∆x mag noch eine ungefähre Wellenlänge λ der Trägerwelle aufweisen, wenn λ ¿ ∆x, aber der Wert von λ ist mit einer Unsicherheit ¯ µ ¶¯ ¯ h ¯¯ h (11.25) ∆λmin ≈ ¯¯∆ ≈ 2 ∆p ≈ λ2 /∆x ¯ p p behaftet, wie aus p = h/λ und der Heisenbergschen Unschärferelation (∆p)min ≈ h/∆x folgt. Wird der Zustand eines Teilchens durch ein derartiges Wellenpaket beschrieben, so ist das Teilchen mit einer Genauigkeit ∆x räumlich lokalisiert, denn |ψ(~x)|2 ist nur innerhalb eines Raumbereiches der Lineardimension ∆x 214 11 Quanten merklich von Null verschieden. Das Wellenpaket muss sich dann als Superposition ebener monochromatischer Wellen Z ~ ψ(~x, t) ∼ d3 k ϕ(~k)ei(k·~x−ωt) (11.26) darstellen lassen. dabei kann die wellenvektorabhängige Wahrscheinlichkeitsamplitude ϕ(~k) merklich von Null verschiedene Werte annehmen nur für Wellenvektoren, die vom mittleren Wellenvektor des Pakets nicht mehr als ∆k ≈ 1/∆x abweichen. Wir werden derartige Wellenpakete noch genauer anschauen. Als Wellengleichung für freie Quanten der Masse m bietet sich nun die so genannte Schrödingergleichung i~ ~2 2 ∂ ψ=− ∇ ψ ∂t 2m (11.27) an. Diese Differentialgleichung hat nämlich gerade die ebenen monochromatischen Wellen (11.23) mit der Energie E = p2 /2m gemäß (11.22) als Lösungen. Sie wird, da linear in der Wellenfunktion ψ, auch durch räumlich lokalisierte Wellenpakete der Form (11.26) befriedigt. Die Linearität in ψ ist im Einklang mit der bereits als experimenteller Befund vorgestellten linearen Superponierbarkeit der Wellenamplitude. Sie dürfen nicht glauben, dass (11.27) die einzig mögliche Wellengleichung ist, die mit der de Broglie-Relation p~ = ~~k und E = p2 /2m verträglich ist. Andere, kompliziertere, lassen sich zum Beispiel durch Differenzieren nach t oder den Komponenten des Ortsvektors auf beiden Seiten von (11.27) erzeugen. Jedoch ist (11.27) die einfachste und daher naheliegendste Wellengleichung. Sie hat sich für (langsame, nichtrelativistische!) Teilchen bestens bewährt. Die Schrödingergleichung liest sich besonders plausibel, wenn wir die folgende Korrespondenz zwischen den in ihr auftretenden Differentialoperatoren i~∂/∂t und −i~∇ und der Energie E bzw. dem Impuls p~ des Teilchens einführen i~ ∂ b ≡E ∂t ~ ∇ ≡ p~ˆ i ↔ Energie E ↔ Impuls p~ . (11.28) Mit Hilfe dieser Korrespondenz erkennen wir dir Schrödingergleichung Êψ = (1/2m)(p~ˆ)2 als Verallgemeinerung der Teilcheneigenschaft E = p2 /2m auf eine Eigenschaft der Wellenfunktion ψ(~x, t). Wenn das betrachtete Teilchen nicht frei ist, sondern eine ortsabhängige potenzielle Energie V (~x) hat, so liegt nahe, die klassische Teilcheneigenschaft p ~2 /2m + V (~x) ´= E = const zu verallgemeinern auf die Eigenschaft Êψ = ³ p~ˆ2 /2m + V (~x) ψ der Wellenfunktion ψ(~x, t). Tatsächlich ist ∂ i~ ψ(~x, t) = ∂t ½ ¾ ~2 2 − ∇ + V (~x) ψ(~x, t) 2m (11.29) die Schrödingersche Wellengleichung, die sich zur quantenmechanischen Beschreibung nichtrelativistischer Teilchen der Masse m mit der potenziellen Energie V (~x) als richtig erwiesen hat. 11.5 Normierung der Wellenfunktion 11.5 215 Normierung der Wellenfunktion Ein Teilchen befinde sich irgendwo im Inneren eines (der Einfachheit halber zunächst endlichen) Raumbereichs V . Die Interpretation seiner Wellenfunktion ψ(~x, t) als einer Wahrscheinlichkeitsamplitude verlangt, dass die Gesamtwahrscheinlichkeit, das Teilchen in V zu finden, gleich Eins ist, Z d3 x |ψ(~x, t)|2 = 1 . (11.30) V Die Normierung muss zeitlich erhalten bleiben, solange das Teilchen in V eingesperrt bleibt. Die folgende kleine Rechnung zeigt, dass die Schrödingergleichung mit der zeitlichen Erhaltung der Norm (11.30) verträglich ist. Schreiben wir die Zeitableitung der Norm mit Hilfe der Schrödingergleichung Z Z n o ∂ d3 x |ψ(~x, t)|2 = d3 x ψ̇ψ ∗ + ψ ψ̇ ∗ ∂t V V 1 = i~ ¸ ½ · h2 2 ∗ ∇ +V ψ d x ψ − 2m Z 3 V ¸ ¾ · ~2 2 −ψ − ∇ + V ψ∗ 2m Z © ª i~ = d3 x ψ ∗ ∇2 ψ − ψ∇2 ψ ∗ 2m V i~ = 2m Z d3 x ∇ · {ψ ∗ ∇ψ − ψ∇ψ ∗ } V und benutzen den Gaußschen Satz, um das erhaltene Volumenintegral in ein Flächenintegral über die Oberfläche F von V zu verwandeln, so erhalten wir den Erhaltungssatz Z I ∂ 3 2 d x |ψ(~x, t)| = − df~ · ~j(~x, t) (11.31) ∂t V F mit der Wahrscheinlichkeitsstromdichte ~j(~x, t) ≡ 1 ~ {ψ ∗ ∇ψ − ψ∇ψ ∗ } . 2m i (11.32) Damit die Norm (11.30) zeitlich erhalten bleibt, müssen wir nun fordern, als Randbedingung für die Wellenfunktion ψ(~x, t) auf F , dass der WahrscheinlichH keitsstrom df~ · ~j(~x, t) durch F verschwindet. Durch diese Forderung stellen F wir sicher, dass das Teilchen in V eingesperrt bleibt. 216 11.6 11 Quanten Mittelwerte Für ein Teilchen mit der Wahrscheinlichkeitsdichte |ψ(~x, t)|2 am Ort ~x berechnen sich die Mittelwerte h~xi seiner Ortskoordinaten offenbar als die Integrale Z h~xi = d3 x ~x|ψ(~x, t)|2 , (11.33) die über das ganze (u. U. unendliche) dem Teilchen zugängliche Volumen zu erstrecken sind. Entsprechend gilt für den Mittelwert einer Funktion des Ortsvektors wie z. B. der potenziellen Energie U (~x) Z hU i = d3 x U (~x)|ψ(~x, t)|2 . (11.34) Behalten Sie in Erinnerung, dass derartige Mittelwerte experimentell dadurch zu bestimmen sind, dass der Ort ~x bzw. die potenzielle Energie des Teilchens an vielen identisch präparierten Systemen gemessen und die Resultate anschließend gemittelt werden. Der Mittelwert des Impulses p~ eines Teilchens, welches sich im unendlichen Volumen −∞ < x, y, z < +∞ befindet, kann in entsprechender Weise gewonnen werden, wenn die Wahrscheinlichkeitsamplitude ϕ(~k, t) dafür bekannt ist, dass der Wellenvektor ~k = p~/h zur Zeit t seinen Wert im Intervall (2π)−3 d3 k bei ~k hat. Dabei ist |ϕ(~k, t)|2 d3 k/(2π)3 die Wahrscheinlichkeit, den Wellenvektor in diesem Intervall zu finden, und es gilt h~ pi = ~ Z d3 k ~ ~ k|ψ(k, t)|2 = ~h~ki , (2π)3 (11.35) wobei wir bezüglich aller drei Komponenten von ~k von −∞ bis +∞ zu integrieren haben. Nun legt ϕ(~x, t) als Amplitude dafür, dass das Teilchen sich als die ebene ~ Welle eik·~x erweise, auch die Amplitude ψ(~x, t) für den Aufenthalt des Teilchens am Ort ~x fest gemäß ψ(~x, t) = Z d3 k ~ ϕ(~k, t) eik·~x . (2π)3 (11.36) Diese Darstellung der ortsabhängigen Wellenfunktion als Superposition ebener Wellen verallgemeinert die Wellenpakete für ein freies Teilchen, die wir in 11.4 kennengelernt hatten. Die Theorie der Fouriertransformationen spezifiziert die Bedingungen für die Darstellbarkeit einer Funktion ψ(~x) durch ein Fourierintegral der Form (11.36). Wir nehmen hier alle solchen Bedingungen als erfüllt an und setzen auch stillschweigend stets voraus, dass die uns begegnenden Wellenfunktionen ψ(~x) eindeutig ihre Fouriertransformierten ϕ(~k) festlegen. Bei so durch Annahme gesicherter Eindeutigkeit von ϕ(~k) können wir leicht verifizieren, dass Z ~ ~ ϕ(k, t) = d3 x ψ(~x, t)e−ik·~x (11.37) 11.6 Mittelwerte 217 gerade die Umkehrung der Darstellung (11.36) gibt. Setzen wir nämlich (11.37) in (11.36) ein, so erhalten wir die Identität Z Z d3 k i~k·(~x−x~0 ) ~0 3 0 e ψ(x , t) ψ(~x, t) = d x (2π)3 Z ~ ~0 = d3 x0 δ (3) (~x − x~0 )eik·(~x−x ) ψ(x~0 , t) = ψ(~x, t) , wobei wir die uns von früher bekannte Fourierintegral-Darstellung der Deltafunktion Z d3 k i~k·~x e . (11.38) δ (3) (~x) = (2π)3 benutzt haben. Drücken wir nun in (11.35) die Amplitude ϕ(~k, t) für das Auftreten des Wellenvektors ~k gemäß (11.37) durch die ortsabhängige Wellenfunktion ψ(~x, t) aus, so erhalten wir die Möglichkeit, den Mittelwert des Impulses mit Hilfe der letzteren auszurechnen, nämlich Z Z Z d3 k ~ ~ ~0 3 hpi = ~ k d x ψ(~ x , t) d3 x0 ψ ∗ (x~0 , t)e−ik·(~x−x ) (2π)3 Z Z Z d3 k −i~k·(~x−x~0 ) 3 3 0 ∗ ~0 e . = d x ψ(~x, t) d x ψ (x , t)i~∇ (2π)3 Dabei wirkt der Gradient ∇ auf die ungestrichenen Koordinaten. Nach partieller Integration (die Randterme verschwinden, sonst könnte ψ(~x, t) nicht normierbar sein) und Beachtung der Darstellung (11.38) der Deltafunktion ergibt sich der gesuchte Mittelwert des Impulses zu Z ~ h~ pi = d3 x ψ ∗ (~x, t) ∇ψ(~x, t) . (11.39) i Wir stoßen hier wieder auf die Korrespondenz des Impulses eines Teilchens mit dem Differentialoperator ~i ∇. Die Ubiquität dieser Korrespondenz in der Quantenmechanik macht es zweckmäßig, den Operator µ ¶ ~ ~ ∂ ∂ ∂ p~op = ∇ = , , (11.40) i i ∂x ∂y ∂z als Impulsoperator in der Ortsdarstellung oder, kürzer, als Impulsoperator zu bezeichnen. Ähnlich bequem ist es, den in der Schrödingergleichung auftretenden Differentialoperator ~2 2 ∇ + V (~x) (11.41) 2m kurz der Hamiltonoperator des Teilchens zu nennen, der die Energie des Teilchens repräsentiert. Die mittlere Energie des Teilchens lässt sich offenbar durch das Integral Z hHi = d3 x ψ ∗ (~x, t)Hop ψ(~x, t) (11.42) Hop = p~2op /2m + V (~x) = − berechnen. 218 11.7 11 Quanten Freie Pakete zerfließen Ein freies Wellenpaket vergrößert im Lauf der Zeit seine räumliche Ausdehnung. Diese bei klassischen Teilchen unbekannte Eigenschaft von Quanten will ich hier der Einfachheit der Rechnung halber in einer Raumdimension illustrieren. Die anfängliche Wellenfunktion habe die Gaußsche Form ψ(x, 0) = (πσ)−1/4 e−x 2 /2σ . (11.43) /σ (11.44) Die Wahrscheinlichkeitsdichte |ψ(x, 0)|2 = (πσ)−1/2 e−x 2 ist dann auf Eins normiert, +∞ Z dx |ψ(x, 0)|2 = 1 . (11.45) −∞ Um die Wellenfunktion ψ(x, t) zu späteren Zeiten zu finden, müssen wir die Schrödingergleichung i~ψ̇ = (p2 /2m)ψ mit der Anfangsbedingung (11.43) lösen. Dazu ist es zweckmäßig, das Paket (11.43) als Superposition ebener Wellen darzustellen, ψ(x, 0) = (4πσ) 1/4 +∞ Z dk ikx− σ k2 2 e . 2π (11.46) −∞ Sie prüfen oder schlagen leicht nach, dass das Fourierintegral (11.46) gerade die Gaußfunktion (11.43) ergibt (sogar bei komplexem σ, jedoch muss Re σ > 0 sein). Die zugehörige zeitabhängige Lösung der Schrödingergleichung muss nun lauten ψ(x, t) = (4πσ) 1/4 +∞ Z dk ikx− σ k2 −i hk2 t 2 2m e , 2π (11.47) −∞ denn zur ebenen Welle eikx gehört die Frequenz ω = ~k 2 /2m. Das Wellenzahlintegral (11.47) ist leicht ausgeführt, denn es unterscheidet sich vom anfänglichen, d. h. von (11.46) nur durch σ → σ + i ~t m im Exponenten. Statt (11.43) ergibt sich also s ½ ¾ σ x2 1/4 exp − . (11.48) ψ(x, t) = (πσ) 2(σ + i~t/m) σ + i ~t m √ Uns interessiert besonders der Fall eines reellen σ, denn dann ist σ ein Maß für die anfängliche Ausdehnung des Pakets. Um die Ausdehnung des Pakets zu späteren Zeiten zu studieren, betrachten wir das Absolutquadrat |ψ(x, t)|2 = (πσ(t)) −1/2 −x2 /σ(t) e mit σ(t) = σ + 1 σ µ ~t m ¶2 . (11.49) 11.7 Freie Pakete zerfließen 219 Dies ist wie (11.43) ein Gaußsches Paket, jedoch mit der räumlichen Ausdehnung ½ µ ¶2 ¾1/2 p 1 ~t , (11.50) σ(t) = σ + σ m die im Laufe der Zeit monoton wächst. Nun ist nachgerechnet, dass freie Pakete zerfließen. Niemand hat je einen Fußball zerfließen gesehen, ohne sofort den Fernseher als defekt zu erklären. Der Grund ist aus dem Resultat (11.50) leicht abzulesen. Bis zur Verdoppelung einer anfänglichen Längendimension ∆x des Pakets p √ vergeht die Zeit T , die aus (11.50) mit σ(T ) = 2 σ zu √ (∆x)2 m 3 T = (11.51) ~ folgt. Als normalsichtiger Zuschauer können Sie zwei irgendwo auf dem Fels unmittelbar nebeneinander liegende Bälle als getrennt auflösen, also einen Ball mit der Genauigkeit der Größenordnung ∆x ≈ 10 cm lokalisieren. Mit diesem ∆x und der typischen Masse eines Fußballs finden Sie die Zeit T als bei weitem größer als das Alter des Universums (das wir auf etwa 1010 Jahre schätzen). Wir haben also keinerlei Veranlassung, die Schrödingergleichung zu lösen, wenn es die Bahnen makroskopischer Teilchen zu berechnen gilt. Mikroskopische Wellenpakete zerfließen recht schnell. Für ein auf ∆x ≈ 1 Å = 10−8 cm lokalisiertes Elektron verdoppelt sich die Ausdehnung des Wellenpakets innerhalb von 10−15 Sekunden (s. Abbildung 11.7). Abbildung 11.7 220 11.8 11 Quanten Das Ehrenfestsche Theorem Untersuchen wir die Bewegung von Quanten in äußeren Potentialen U (~x). Eine wichtige Eigenschaft dieser Bewegung kann für beliebiges Potential U (~x) ohne explizite Lösung der Schrödingergleichung gefunden werden. Sie betrifft das zeitliche Verhalten des Mittelwerts h~xi, also des Schwerpunkts des Wellenpakets. Wir werden gleich sehen, dass sich der Schwerpunkt h~xi wie ein klassisches Teilchen bewegt, auf das der Mittelwert der Kraft, also −h∇U (~x)i, wirkt. Um dieses von Ehrenfest erkannte Theorem zu beweisen, differenzieren wir den Mittelwert h~xi nach der Zeit und benutzen für die Zeitableitung der Wellenfunktion ψ(~x, t) die Schrödingergleichung. Z n o d h~xi = d3 x ψ̇ ∗ ~xψ + ψ ∗ ~xψ̇ dt ¸ ½ · Z ~2 2 1 3 ∇ + U ψ∗ d x −~xψ − = i~ 2m · ¸ ¾ ~2 2 ∇ +U ψ + ~xψ ∗ − 2m Z © ª ~ d3 x −~xψ ∗ ∇2 ψ + ~xψ∇2 ψ ∗ . = 2mi Im zweiten Summanden der letzten Zeile integrieren wir nacheinander zweimal partiell. Die dabei auftretenden Randterme müssen verschwinden, da die Normierbarkeit der Wellenfunktion hinreichend schnellen Abfall von ψ für |~x| → ∞ sicherstellt. Es ergibt sich Z © ª d ~ h~xi = d3 x ψ ∗ ∇2 ~x − ~x∇2 ψ . (11.52) dt 2mi Den in der geschweiften Klammer stehenden Differentialoperator vereinfachen wir schnell gemäß (Summenkonvention!) µ ¶ ∂2 ∂2 ∂ ∂ ∂ x = + xi 2 , (11.53) δ + x =2 i ij i 2 ∂xj ∂xj ∂xj ∂xj ∂xj und erhalten 1 d h~xi = dt m Z ~ 1 d3 x ψ ∗ ∇ψ = h~ pi . i m (11.54) Dies ist der klassische nichtrelativistische Zusammenhang zwischen der Ged h~xi und dem Impuls h~ pi. Nochmaliges Differenzieren nach der schwindigkeit dt Zeit liefert Z o n d2 1 d 1 ~ 3 ∗ ∗ ψ̇ ∇ψ + ψ ∇ ψ̇ h~ x i = h~ p i = d x dt2 m dt mi ¸ ½ · Z 1 ~2 2 = ∇ + U ψ∗ d3 x [∇ψ] − m 2m · ¸ ¾ ~2 2 − ψ∗ ∇ − ∇ +U ψ . 2m 11.8 Das Ehrenfestsche Theorem 221 Hier heben sich die beiden von der kinetischen Energie rührenden Summanden gegenseitig weg, wie wir nach zweimaliger partieller Integration eines derselben sehen, und es bleibt m d2 h~xi = dt2 Z d3 x ψ ∗ {U ∇ − ∇U } ψ . (11.55) Ähnlich, wie wir in (11.52) die Differenz der Operatorprodukte“ ∇2 ~x und ~x∇2 ” ausrechnen, haben wir hier die Vertauschungsrelation“ der Operatoren U (~x) ” und ∇ zu bestimmen. Beachten Sie, dass im zweiten Summanden in (11.55) der Differentialoperator ∇ auf die Funktion U (~x)ψ(~x, t) wirkt. Nach der Produktregel der Differenziation gilt ∇U ψ = ψ(∇U ) + U ∇ψ , (11.56) so dass wir für die Beschleunigung des Schwerpunktes des Wellenpaketes erhalten Z d2 (11.57) m 2 h~xi = d3 x |ψ(~x, t)|2 ∇U (~x) . dt Dies ist gerade die Newtonsche Bewegungsgleichung eines Teilchens der Masse m, welches am Ort h~xi der Kraft −h∇U (~x)i ausgesetzt ist, m d2 h~xi = −h∇U (~x)i . dt2 (11.58) Das Ehrenfestsche Theorem gibt natürlich keine Auskunft über die zeitliche Änderung der Form der Wellenfunktion ψ(~x, t) eines Teilchens, insbesondere also nicht darüber, ob und wie schnell ein vorgegebenes Paket ψ(~x, 0) zerfließt. Die Überlegungen des vorigen Paragrafen besagen aber, dass das Zerfließen von Wellenpakete für makroskopische Teilchen selbst über extrem lange Zeitspannen hinweg völlig vernachlässigbar ist. Dieses Resultat und das Ehrenfestsche Theorem zusammen begründen die Möglichkeit, die Bewegung langsamer makroskopischer Teilchen nach Newtons Mechanik zu behandeln. 222 11 Quanten Kapitel 12 Quanten in Kästen 12.1 Eindimensionale Potentialstufe Ein einfaches Beispiel eines nicht überall kräftefreien Teilchens wird gegeben durch das Potential ( 0 für x < 0 V (x) = (12.1) V0 > 0 für x > 0 Wir lassen der Einfachheit halber auch in der Wellenfunktion ψ(x, t) nur eine Raumkoordinate zu. Abbildung 12.1 Bei klassischer Betrachtungsweise konstatieren wir Kräftefreiheit überall außer an der Sprungstelle des Potentials bei x = 0. Ein klassisches Teilchen der Energie E bewegt sich im linken Halbraum mit konstantem Impuls ±pL = √ 2mE; im rechten Halbraum kann es sich nur aufhalten, wenn seine Gesamtenergie E = p2 /2m + V (x) größer ist p als die Potentialstufe V0 , welchenfalls es dort mit konstantem Impuls ±pR = 2m(E − V0 ) läuft; beim Durchdringen der Grenze x = 0 nach rechts erfährt das Teilchen die Kraft −V 0 (x) = −V0 δ(x), die den Impuls pL auf pR herabsetzt. Die Wellenfunktion eines Quants finden wir durch Lösung der Schrödinger223 224 12 Quanten in Kästen gleichung ¸ · ~2 d 2 + V (x) ψ(x, t) . i~ ψ̇(x, t) = − 2m dx2 (12.2) Offenbar lässt sich diese Differentialgleichung durch den Ansatz einer monochromatischen Welle ψ(x, t) = e−iEt/~ u(x) (12.3) lösen. Die Kreisfrequenz dieser Welle ist ω = E/~, also hat die Konstante E die Bedeutung der Energie des Teilchens. Für den zeitunabhängigen Anteil u(x) ergibt sich die Differentialgleichung µ ¶ ~2 d 2 − + V (x) u(x) = Eu(x) , (12.4) 2m dx2 die die eben erschlossene Interpretation von E als Energie nochmals stützt. Von besonderem Interesse ist der Fall einer Teilchenernergie unterhalb der Stufe, d. h. 0 < E < V0 . In beiden Halbräume lässt sich u(x) aus (12.4) durch einen Exponentialansatz finden. Die allgemeinen Lösungen lauten √ ikx −ikx für x < 0 mit ~k = 2mE A e +B e (12.5) u(x) = a e−βx + b e+βx mit ~β = p2m(V − E) für x > 0 . 0 Uns bleibt die Aufgabe, die vier Integrationskonstanten A, B, a, b festzulegen. Ganz sicher müssen wir b=0 verlangen, da sonst die Wellenfunktion für x → +∞ über alle Grenzen wachsen würde und somit nicht mehr als Wahrscheinlichkeitsamplitude eines Teilchens interpretierbar wäre. Weiteren Aufschluss über die verbleibenden Integrationskonstanten erhalten wir, wenn wir (12.4) in unmittelbarer Umgebung der Potentialstufe, d. h. im Intervall −ε ≤ x ≤ +ε betrachten. Da |u(x)|2 als normierbare Wahrscheinlichkeitsdichte hier beschränkt bleiben muss, folgt aus der Schrödingergleichung (12.4), dass die zweite Ableitung, u00 (x), an der Stelle x = 0 einen endlichen Sprung macht, u00 (ε) − u00 (−ε) = ¢ ¢ 2m ¡ 2m ¡ V (ε) − E u(ε) − 2 V (−ε) − E u(−ε) . 2 ~ ~ Die erste Ableitung, u0 (x), läuft also mit einem Knick stetig durch x = 0, so dass u(x) selbst dort ebenfalls stetig ist. Die Argumentation macht übrigens nicht von der stückweisen Konstanz von V (x), sondern nur von der Endlichkeit des Potentialsprunges Gebrauch. Also gilt allgemein: Die Wellenfunktion und ihre erste Ortsableitung verlaufen stetig, wenn das äußere Potential einen endlichen Sprung macht. Die Stetigkeit von u(x) und u0 (x) bei x = 0 verlangt in unserem Beispiel A+B =a 12.1 Eindimensionale Potentialstufe 225 bzw. ik(A − B) = −βa . (12.6) Diese Bedingungen legen zwei der drei Integrationskonstanten fest, und wir erhalten die Wellenfunktion µ ¶ µ ¶ 1 β 1 β 1+i eikx + 1−i e−ikx für x < 0 2 k 2 k −iEt/~ ψ(x, t) = ae e−βx für x > 0 . (12.7) Die verbleibende Konstante a kann schließlich durch eine Normierungsforderung festgelegt werden. Sehen sie, dass ein Quant der Energie E im linken Halbraum den gleichen √ Impuls hat wie das klassische Teilchen gleicher Energie, ±pL = ±~k = 2mE? Dass ψ eine nach rechts einlaufende und eine nach rechts reflektierte Welle enthält? Bemerkenswert ist, dass das Quant im Gegensatz zum klassischen Teilchen in den rechten Halbraum eindringen kann; die Eindringtiefe 1/β der Welle ist umso kleiner, je tiefer die Energie E unter der Kante V0 liegt. Ihnen empfehle ich zur Übung den Nachweis, dass das Quant wie das klassische Teilchen keine negative Energie haben kann; zeigen Sie ebenfalls, dass das Quant der Energie E > V0 im linken und rechten Halbraum die jeweiligen klassischen Werte des Impulses annimmt. Betrachten wir abschließend eine unendlich hohe Potentialstufe, gemäß V0 → ∞ in (12.1). Die Eindringtiefe 1/β der Welle ist dann Null. Die unendlich hohe Potentialbarriere ist für das Quant ebenso undurchdringlich wie für das klassische Teilchen. Aus (12.6) folgern wir, dass a = A + B = 0, so dass die Wellenfunktion zur Wand hin stetig nach Null abfällt (Abbildung 12.2). Die Ableitung u0 (x) hingegen bleibt an der Wand unbestimmt. Abbildung 12.2 226 12.2 12 Quanten in Kästen Eindimensionaler Kasten mit starrem Rand Wenn Wellen in Kästen endlicher Ausdehnung eingesperrt und somit Randbedingungen unterworfen werden, so sind freie Schwingungen nur bei bestimmten Eigenfrequenzen möglich. Denken Sie an Saiten, Pauken und Flöten, insbesondere auch an 2.13. Quanten in endlichen Kästen sollten also nicht mit beliebigen Energien, sondern nur mit diskreten Eigenenergien auftreten können. Zur Bestätigung dieser Erwartung betrachten wir ein Potential ( 0 für − a < x < +a V (X) = ∞ für |x| > a . Die unendlich hohe Potentialbarriere am Kastenrand bei x = ±a ist undurch- Abbildung 12.3 dringlich und erzwingt die Randbedingung ψ(±a, t) = 0 . (12.8) Ein Quant der Masse m bewegt sich im Innern des Kastens kräftefrei. Die Schrödingergleichung ist dort die des freien Teilchens und hat als Lösungen ebene monochromatische Wellen ψ(x, t) = e−iEt/~ (A cos kx + B sin kx) = e−iEt/~ u(x) (12.9) mit dem Impuls ~k = √ 2mE. (12.10) Die Randbedingung (12.8) lässt sich für E ≤ 0 nur durch die triviale Lösung A = B = 0, also ψ(x, t) = 0 erfüllen. Also kann im Kasten kein Teilchen mit verschwindender oder negativer Energie existieren. Für E > 0 finden wir jedoch sofort nichttriviale Lösungen. Aus 0 = A cos ka + B sin ka 0 = A cos ka − B sin ka (12.11) 12.2 Eindimensionaler Kasten mit starrem Rand 227 folgt A cos ka = 0 und B sin ka = 0 , (12.12) also entweder A=0 und sin ka = 0 (12.13) B=0 und cos ka = 0 . (12.14) oder Im ersten Fall (A = 0) haben wir als Eigenschwingungen die in x ungeraden Funktionen un (x) = B sin kn x, kn a = π n, 2 n = 2, 4, 6, . . . (12.15) und im zweiten Fall (B = 0) die geraden Funktionen un (x) = A cos kn x, kn a = π n, 2 n = 1, 3, 5, . . . (12.16) Die zugehörigen Eigenwerte der Energie sind in beiden Fällen durch (12.10) als En = ~2 kn2 ~2 π 2 2 = n , 2m 8ma2 n = 1, 2, 3, . . . (12.17) festgelegt. Die ersten vier En aus der unendlichen Folge von Energieniveaus sind in die Abbildung 12.4 eingetragen. Schematisch aufgesetzt sind dabei die zugehörigen Eigenfunktionen. Beachten und bewahren Sie folgende Eigenarten unseres Ergebnisses: (i) Die Grundzustandsenergie ist (nicht E = 0 sondern!) E1 = ~2 π 2 /8ma2 ; ein auf ∆x ≈ a lokalisiertes Teilchen hat eine Impulsunschärfe von mindestens ∆p ≈ ~/a, also eine kinetische Energie der Ordnung ~2 /ma2 . (ii) Der Grundzustand u1 (x) hat im Innern des Kastens keine Nullstelle; der Zustand un (x) hat im Innern des Kastens n − 1 Nullstellen. (iii) Alle Eigenfunktionen sind gerade oder ungerade; Energieniveaus zu geraden und ungeraden Zuständen wechseln in der Folge En einander ab. (iv) Die Eigenfunktionen liegen nur bis auf einen Normierungsfaktor fest. Dieser kann so gewählt werden, dass Z+a dx un (x)2 = 1 −a gilt. 228 12 Quanten in Kästen Abbildung 12.4 Es ist kein Zufall, dass alle Eigenschwingungen un (x) entweder ungerade (s. 12.15) oder gerade Funktionen sind. Dass keine Eigenfunktion auftritt, die weder gerade noch ungerade ist, legt vielmehr daran, dass das Potential V (x) selbst gerade ist, V (x) = −V (x) , (12.18) wie Sie aus der folgenden Überlegung entnehmen. Bei beliebigem geraden Potential V (x) bleibt die Schrödingergleichung − ~2 00 u (x) + V (x)u(x) = Eu(x) 2m (12.19) unverändert bei der Transformation x → −x. Wenn also u(x) eine Lösung zum Eigenwert E ist, so auch u(−x). Wenn es zum Eigenwert E nur eine Eigenfunktion gibt (bis auf Normierungsfaktor), so ist u(−x) nicht von u(x) linear unabhängig, sondern muss zu u(x) proportional sein, u(x) = εu(−x) = ε2 u(x) . (12.20) Die zweite Gleichung in (12.20) entsteht bei nochmaliger Transformation x → −x. Wir folgern ε = ±1, also dass u(x) entweder gerade oder ungerade sein muss. Die Einschränkung, dass zu einem Eigenwert E nur eine Eigenfunktion 12.3 Potentialtopf endlicher Tiefe 229 u(x) auftreten solle, können wir übrigens allen lassen; eventuell auftretende linear unabhängige u(x) zu einer Energie können immer zu geraden und ungeraden Funktionen linear kombiniert werden. 12.3 Potentialtopf endlicher Tiefe Beim oben diskutierten Potentialtopf unendlicher Tiefe gibt es Eigenschwingungen des Quants nur mit diskreten Eigenfrequenzen bzw. Energien. Dieses Verhalten ist typisch (was ich hier nicht zeige) für Potentiale, die für x → ±∞ (bzw. |~x| → ∞ in zwei oder drei Dimensionen) unbeschränkt wachsen. Eine andere Situation liegt bei einem Potentialtopf endlicher Tiefe vor. Hier laute die potenzielle Energie des Quants V (x) = ( V0 für |x| > a 0 für |x| < a . (12.21) Abbildung 12.5 Ein diesem Potential unterworfenes klassisches Teilchen ist, falls seine Energie E kleiner ist als die√Topftiefe V0 , gebunden im Kasten −a < x < +a und hat dort den Impuls ± 2mE. Falls jedoch E > V0 , so kann sich das√klassische Teilchen überall in −∞ < x < ∞ aufhalten; sein Impuls beträgt ± 2mE, p so lange es in −a < x < a bleibt, und ± 2m(E − V0 ), sobald es sich in den Bereichen |x| > a befindet. Die im Potential (12.21) möglichen Eigenschwingungen des Quants ψ(x, t) = e−iEt/~ u(x) (12.22) finden wir wie in den vorigen Paragrafen durch Zusammenstückeln der freien Wellen aus den Bereichen konstanten Potentials. Durch die beiden Sprungstellen x = ±a müssen u(x) und u0 (x) stetig verlaufen. Zum Aufbau der Lösung erinnern wir uns zunächst daran, dass der Wellenvektor des Quants der Energie E die Werte p ±k = 2mE/~ (12.23) 230 12 Quanten in Kästen und ±iβ = p 2m(E − V0 )/~ (12.24) annimmt bezüglich der Wellen im Bereich |x| < a bzw. |x| > a (letzterer Wellenvektor ist natürlich als inverse Eindringtiefe zu interpretieren, wenn E < V0 ). Ferner beachten wir, dass das Potential gerade in x ist, und folgern, dass wir alle Eigenfunktionen u(x) finden können durch den Ansatz gerader und ungerader Linearkombination der genannten ebenen Wellen. Als Kandidaten gerader Eigenfunktionen mit 0 < E < V0 bieten sich an cos kx für |x| < a −β(x−a) (12.25) u(x) = B · cos kae für x>a cos kae+β(x+a) für x < −a Hier habe ich die für x → ±∞ unbegrenzt wachsenden Lösungen der Schrödingergleichung unter Berufung auf die Wahrscheinlichkeitsinterpretation der Wellenfunktion unterdrückt. Außerdem ist die Stetigkeit von u(x) bei x = ±a bereits berücksichtigt. Da der Wellenvektor k und die Eindringtiefe 1/β gemäß (12.23) und (12.24) durch die Energie E festgelegt sind, treten in (12.25) noch die Energie E und die Normierungskonstante B als freie Parameter auf. Eine Einschränkung für diese beiden Parameter erhalten wir aus der Forderung der Stetigkeit von u0 (x) bei x = ±a, −Bk sin ka = −Bβ cos ka . (12.26) Die Befriedigung dieser Randbedingung durch die Wahl B = 0 ist uninteressant, da dann u(x) trivial wird. Nichttriviale Eigenschwingungen des Quants mit 0 < E < V0 sind nur möglich für Energien, die die Gleichungen (12.23), (12.24) und (12.26) bei B 6= 0 befriedigen, also (ak) tan ak = aβ (12.27) (ak)2 + (aβ)2 = 2mV0 a2 /~2 ≡ ρ2 E= ~2 k 2 . 2m (12.28) (12.29) Die beiden ersten dieser Gleichungen müssen wir daraufhin untersuchen, ob sie (positive!) Lösungen für ak und aβ zulassen. Abbildung 12.6 zeigt Graphen der Funktion ak tan ak = aβ und des Kreises (ak)2 + (aβ)2 = ρ2 . Sie sehen, dass genau ein Schnittpunkt, d. h. eine Eigenenergie E0 0 < E0 < ³ π ´2 2 ~2 2ma2 (12.30) p auftritt, wenn ρ = 2mV0 a2 /~ < π. Wenn die Tiefe des Potentialtopfs zunimmt, so entstehen weitere Schnittpunkte, d. h. Eigenenergien. Ihnen bleibt als eine schöne Übung, die Zahl der auftretenden Eigenwerte in Abhängigkeit von der Topftiefe V0 zu untersuchen und dabei auch ungerade Lösungen u(x) zu berücksichtigen. Mir kam es bei der dargelegten Rechnung 12.3 Potentialtopf endlicher Tiefe 231 Abbildung 12.6 darauf an, Ihnen klarzumachen, dass im Topf gebundene Eigenschwingungen zu Eigenenergien 0 < E < V0 nur für diskrete Werte der Energie auftreten können. Von im Topf gebundenen Eigenschwingungen zu sprechen, ist hier angebracht, da die Lösungen (12.23) für |x| > a, also außerhalb des Kastens, exponentiell abfallen. Folglich sind die gebundenen Zustände auch normierbar +∞ R durch |u(x)|2 = 1. −∞ Ganz anders benehmen sich die Eigenschwingungen mit E > V0 ! Da für diese β nach (12.24) imaginär wird, will ich statt β lieber den Wellenvektor p (12.31) K = 2m(E − V0 )/~ benutzen und gerade Eigenschwingungen mit dem Ansatz cos kx u(x) = B · cos ka [cos K(x − a) + D sin K(x − a)] cos ka [cos K(x + a) − D sin K(x + a)] für |x| < a für x>a für x < −a (12.32) suchen. Beachten Sie, dass jetzt für |x| > a sowohl exp(+iKx) als auch exp(−iKx) zuzulassen sind, da beide Wellen beschränkt bleiben. Es tritt also gegenüber (12.25) eine freie Konstante mehr auf; insgesamt sind B, D und die Energie E zunächst offen. Die Stetigkeit von u0 (x) bei x = ±a gibt die zu (12.26) analoge Forderung −kB sin ka = KBD cos ka oder, da nur B 6= 0 von Interesse, −ka tan ka = DKa , (12.33) Aus (12.23) und (12.31) folgt, dass die Lösungen ka und Ka auch auf der Hyperbel (ka)2 − (Ka)2 = 2mV0 a2 /~2 = ρ2 (12.34) 232 12 Quanten in Kästen liegen müssen. Abbildung 12.7 zeigt, dass für jeden Wert von D unendlich viele Schnittpunkte der durch (12.33) und (12.34) definierten Kurven im ersten Quadranden auftreten. Da der Parameter D keiner weiteren Einschränkung Abbildung 12.7 unterworfen ist, kann die Energie ~2 2 k > V0 (12.35) 2m kontinuierliche Werte annehmen. Ein solches kontinuierliches Spektrum von Energieeigenwerten haben wir schon beim freien Quant kennengelernt. Die zum kontinuierlichen Spektrum gehörigen Eigenzustände (12.32) (sowie die entsprechenden ungeraden Lösungen) fallen für x → ±∞ nicht ab. Sie ähneln insofern den ebenen Wellen e±ikx des überall freien Teilchens. Keine der Lösungen mit E > V0 ist für sich allein im ganzen Raum normierbar im Sinne von +∞ Z dx |ψ(x, t)|2 = 1 . (12.36) E= −∞ Wohl aber lassen sich aus den Lösungen u(x) Wellenpakete +∞ Z ψ(x, t) = dE ϕ(E) e−iEt/~ u(x) (12.37) V0 aufbauen, die zu allen Zeiten die Normierung (12.36) behalten. Halten wir fest: Quanten mit Energien unterhalb des Topfrandes, d. h. mit E < V0 , sind (ähnlich wie klassische Teilchen) im Kasten −a < x < a gebunden; sie sind zu Eigenschwingungen nur mit diskreten Energien fähig. Hingegen können sich Quanten mit Energien oberhalb des Topfrandes, d. h. mit E > V0 , ähnlich wie klassische Teilchen beliebig weit vom Kasten entfernen und Eigenschwingungen mit kontinuierlichem Energiespektrum ausführen. 12.4 Quanten durchdringen Wände Unseren Variationen zum Thema stückweise konstante Potentiale ist eine letzte höchst lehrreiche hinzuzufügen. Sie soll den so genannten Tunneleffekt illustrie- 12.4 Quanten durchdringen Wände 233 ren. Zwei Raumbereiche mit verschwindendem Potential seien durch eine Potentialbarriere getrennt gemäß ( V0 für |x| < 0 V (x) = (12.38) 0 für |x| > d . Ein von links ankommendes klassisches Teilchen der Energie E < V0 stößt bei x = 0 auf eine undurchdringbare Wand und wird reflektiert. Ein Quant hingegen kann die endliche Potentialbarriere durchtunneln“. ” Abbildung 12.8 Die Lösung der Schrödingergleichung mit der mit dem Ansatz ikx e + ρ e−ikx für u(x) = B · C eβx + D e−βx für ik(x−d) τe für Energie E < V0 suchen wir x<0, 0<x<d, (12.39) x>d, wobei der Wellenvektor k und die Eindringtiefe 1/β wieder gegeben sind durch p √ ~β = 2m(V0 − E) . (12.40) ~k = 2mE, Der Ansatz berücksichtigt im Bereich x < 0 eine von links einlaufende und eine nach links reflektierte Welle, sowie für x > d eine von der Barriere durchgelassene nach rechts weiterlaufende Welle. Innerhalb der Wand kann keine der Partikularlösungen e±βx außer Acht gelassen werden, da beide in 0 < x < d beschränkt bleiben. Die vier Integrationskonstanten ρ, C, D und τ lassen sich festlegen durch die Forderung der Stetigkeit von u(x) und u0 (x) an den Sprungstellen des Potentials. Von besonderem Interesse ist die Amplitude τ der durch die Wand gedrungenen Welle, die sich nach leichter aber länglicher Rechnung als £ ¤−1 τ = 2βk 2βk cosh βd − i(k 2 − β 2 ) sinh βd (12.41) ergibt. Ihr Absolutquadrat, die Wahrscheinlichkeit, dass ein von links einfallendes Teilchen die Wand durchdringt, heißt die Durchlässigkeit T (E) der Wand 234 12 Quanten in Kästen und beträgt · p V02 sinh2 2m(V0 − E)d2 /~2 T (E) = |τ | = 1 + 4E(V0 − E) 2 ¸−1 (12.42) Die Durchlässigkeit nimmt monoton zu, wenn E bis V0 wächst. Andererseits fällt T (E) exponentiell auf Null, wenn die Höhe V0 oder die Breite d der Barriere über alle Grenzen steigt, T (E) → 16E(V0 − E) −2√2m(V0 −E)d2 /~2 e . V02 (12.43) Ihnen bleibt als Übung, die so genannte Reflektivität R = |ρ|2 der Wand zu suchen und das Resultat, R = 1 − T , zu interpretieren. Kapitel 13 Harmonisch gebundene Quanten 13.1 Eindimensionaler harmonischer Oszillator Wir greifen hier einen in Kapitel 2. klassisch behandelten Problemkreis auf und betrachten ein durch eine lineare Rückstellkraft an eine Ruhelage gebundenes Teilchen der Masse m. Der Auslenkung x entspricht die potenzielle Energie V (x) = 1 mω 2 x2 , 2 (13.1) wobei ω sich bei der klassischen Behandlung als die Frequenz erwies, mit der das Teilchen um seine Ruhelage schwingt. Zur quantenmechanischen Behandlung haben wir die Schrödingergleichung ¶ µ 1 ~2 d 2 2 2 + mω x ψ(x, t) (13.2) i~ψ̇(x, t) = Hψ(x, t) = − 2m dx2 2 zu lösen. Wir suchen zunächst die Eigenzustände ψ(x, t) = eiEt/~ u(x) (13.3) und Eigenwerte der Energie E aus Hu(x) = Eu(x) . (13.4) Da die potenzielle Energie V (x) des Quants bei Entfernung vom Kraftzentrum unbeschränkt wächst, erwarten wir ein diskretes Spektrum von Eigenenergien mit gebundenen, normierbaren Zuständen gemäß +∞ Z dx |u(x)|2 = 1 . (13.5) −∞ Um die normierbaren Lösungen u(x) der Differentialgleichung (13.4) und die zugehörigen Energien E zu finden, bedienen wir uns eines algebraischen 235 236 13 Harmonisch gebundene Quanten Verfahrens, welches die uns schon mehrfach begegnete Produktregel der Differentialrechnung in der Form d d x−x =1 dx dx (13.6) ausschlachtet. Diese wohlbekannte Identität gibt, nach Multiplikation beider d Seiten mit (~/i), eine Aussage über den Impulsoperator p = ~i dx und die Koordinate x (den Ortsoperator“), ” ~ (13.7) px − xp ≡ [p, x] = . i In Produkten von x und p darf die Reihenfolge der Faktoren also nicht beliebig vertauscht werden. Wir sprechen, eingebürgerten Brauch folgend, von (13.7) als der kanonischen Vertauschungsrelation für Koordinate und Impuls. Für unser Vorhaben ist es zweckmäßig, den Hamiltonoperator 1 H = p2 /2m + mω 2 x2 2 statt durch x und p durch die Linearkombinationen Ãr ! r ¶ µr 1 1 mω mω ~ d i a= √ p =√ x+ √ + , ~ ~ mω dx 2 2 mω~ Ãr ! r µr ¶ 1 1 i d mω mω ~ a† = √ p =√ x− √ x− ~ ~ mω dx 2 2 mω~ (13.8) (13.9) auszudrücken. Für die Operatoren a und a† finden wir aus (13.7) die Vertauschungsrelation [a, a† ] = aa† − a† a = i [p, x] = 1 ~ (13.10) sowie das Produkt ¶ 1 2 i mω 2 x + p − [p, x] ~ m~ω ~ ¶ µ 1 1 1 2 1 p + mω 2 x2 − . = ~ω 2m 2 2 1 a a= 2 † µ Der Hamiltonoperator (13.8) lässt sich somit in der Form (13.11) µ ¶ 1 † H = ~ω a a + 2 (13.11) (13.12) aufschreiben. Seine Eigenfunktionen u(x) und Eigenwerte E sind bekannt, wenn die des Operators a† a gefunden sind. Versuchen wir also, die Eigenwertgleichung a† auλ (x) = λuλ (x) zu lösen. (13.13) 13.1 Eindimensionaler harmonischer Oszillator 237 Von den Eigenwerten λ ist schnell zu sehen, dass sie alle nichtnegativ sind. Wenn wir nämlich (13.13) mit u∗λ (x) multiplizieren und integrieren, +∞ +∞ Z Z ∗ † dx|uλ (x)|2 , dx uλ (x)a auλ (x) = λ (13.14) −∞ −∞ so entsteht rechts ein Integral über das Absolutquadrat der Funktion uλ (x), das nicht negativ sein kann. Auch das links auftretende Integral hat diese Eigenschaft, denn in Ãr ! r +∞ Z 1 mω ~ d ∗ dx uλ (x) √ auλ (x) x− ~ mω dx 2 −∞ können wir durch einmalige partielle Integration die Ableitung d/dx auf u ∗ (x) abwälzen, woraufhin wir erhalten r +∞ +∞ ¶ ¸ µr · Z Z mω ~ d 1 ∗ † x+ u∗λ (x) auλ (x) dx uλ (x)a auλ (x) = dx √ ~ mω dx 2 −∞ −∞ +∞ +∞ Z Z ∗ dx |auλ (x)|2 ≥ 0 . dx (auλ (x)) auλ (x) = = −∞ −∞ (13.15) Es folgt die behauptete Eigenschaft der Eigenwerte, λ≥0. (13.16) Hätten wir eine Lösung uλ (x) der Eigenwertgleichung (13.13) mit Eigenwert λ gefunden, so ergäbe sich mit a† uλ (x) gleich noch eine, u. z. zum Eigenwert λ + 1. Um das zu zeigen, müssen wir nur die Vertauschungsrelation (13.10) bemühen, denn a† a(a† uλ ) = a† (1 + a† a)uλ = a† uλ + a† λuλ = (λ + 1)a† uλ . (13.17) Das gleiche Argument erweist (a† )2 uλ als eine Eigenfunktion von a† a zum Eigenwert λ + 2 und, für beliebige natürliche Zahlen µ, (a† )µ uλ als Eigenfunktion zum Eigenwert (λ + µ). Eine ähnliche Folge von Eigenfunktionen lässt sich aus uλ (x) durch wiederholte Multiplikation mit dem Operator a erzeugen. Mit Hilfe der Vertauschungsrelation (13.10) finden wir nämlich a† a(auλ ) = (aa† − 1)auλ = aλuλ − auλ = (λ − 1)auλ . (13.18) Also ist auλ Eigenfunktion von a† a zum Eigenwert λ − 1 und entsprechend a2 uλ Eigenfunktion zum Eigenwert λ − 2 usf. Die Folge auλ , a2 uλ , a3 uλ , . . . muss abbrechen, d. h. es muss sich beim wiederholten Anwenden des Operators a eine Funktion u0 (x) ergeben mit der Eigenschaft au0 (x) = 0 . (13.19) 238 13 Harmonisch gebundene Quanten Ansonsten würden entgegen der obigen Erkenntnis (13.16) in der Folge von Eigenwerten λ, λ−1, λ−2, . . . negative Eigenwerte auftreten. Durch Multiplikation von (13.19) mit dem Operator a† finden wir a† au0 (x) = 0 (13.20) und schließen, dass der kleinste Eigenwert von a† a gleich Null ist. Damit ist klar, dass der Operator a† a alle nichtnegativen ganzen Zahlen als Eigenwerte hat, a† aun (x) = nun (x), n = 0, 1, 2, . . . . (13.21) Sobald die nullte“ Eigenfunktion u0 (x) bekannt ist, erhalten wir die n-te als ” un (x) = αn (a† )n u0 (x) , (13.22) wobei die Zahl αn als Normierungsfaktor zuzulassen und noch zu bestimmen ist, wenn wir für alle un (x) die Normierung (13.5) fordern. Diese Forderung lautet jetzt +∞ Z £ ¤¡ ¢∗ dx |αn |2 (a† )n u0 (x) (a† )n u0 (x) 1= −∞ ! Ãr r +∞ Z ¤∗ £ † n ¤ 1 mω ~ d £ † n−1 (a ) u0 (x) . = |αn | dx (a ) u0 (x) √ x− ~ mω dx 2 2 −∞ Durch eine partielle Integration wälzen wir den Differentialoperator d/dx auf den linken Faktor im Integranden und erhalten Ãr ! r +∞ · ¸ Z £ ¤∗ 1 mω ~ d 2 † n 1 = |αn | dx √ x+ (a ) u0 (x) (a† )n−1 u0 (x) ~ mω dx 2 −∞ +∞ Z £ ¤£ ¤∗ = |αn | dx aa† (a† )n−1 u0 (x) (a† )n−1 u0 (x) . 2 −∞ Wir benutzen nochmals die Vertauschungsrelation aa† = 1 + a† a und beachten, dass (a† )n−1 u0 (x) Eigenfunktion von a† a mit Eigenwert n − 1 ist. Aus der Normierungsbedingung ergibt sich dann eine Rekursionsformel für |an |2 , +∞ Z dx |(a† )n−1 u0 (x)|2 = |αn |2 n 1 = |αn | n 1 2 −∞ |αn−1 |2 also |αn |2 = 1 |αn−1 |2 . n +∞ Z dx |un−1 (x)|2 , −∞ | {z =1 } (13.23) 13.1 Eindimensionaler harmonischer Oszillator 239 Die Lösung dieser Rekursionsformel bestätigen Sie leicht als |αn |2 = |α0 |2 /n!. Da u0 (x) genau wie alle un (x) gemäß (13.5) normiert sein soll, muss |α0 |2 gelten. Nicht durch die Normierung festgelegt sind die Phasen der Normierungsfaktoren αn . Da nur das Absolutquadrat der Wellenfunktion eine direkte physikalische Bedeutung hat, dürfen wir vereinbaren, dass alle αn reell sein sollen. Demnach lauten die richtig normierten Eigenfunktionen von a† a endlich 1 un (x) = √ (a† )n u0 (x) . n! (13.24) Noch ungeklärt ist allerdings, ob u0 (x) als Eigenfunktion von a† a zum Eigenwert Null existiert und normierbar ist. Wir beantworten die Frage, indem wir u0 (x) konstruieren. Die Differentialgleichung (13.19) lässt sich schreiben als Ãr ! r mω ~ d 1 √ u0 (x) = 0 (13.25) x− ~ mω dx 2 oder mω xdx + du0 /u0 = 0. Hieraus lesen wir als Lösung ab ~ ³ mω ´ x2 . u0 (x) = N exp − 2~ Das Normierungsintegral existiert für diese Gaußfunktion (s. 11.7. Die Normierungskonstante N hat den Betrag |N | = (mω/π~)1/4 und lässt sich als positiv wählen. Es ergibt sich die nullte Eigenfunktion zu h mω i ³ mω ´1/4 exp − u0 (x) = x2 . (13.26) π~ 2~ Ihnen bleibt als Übung zu zeigen, dass die nun explizit konstruierten Eigenfunktionen un (x) für n = 0, 1, 2, . . . abwechselnd gerade und ungerade sind; ferner, dass un (x)/u0 (x) ein Polynom n-ter Ordnung in x ist. Wie schon oben bemerkt, sind die Funktionen un (x) wegen des Zusammenhangs (13.12) zwischen dem Operator a† a und dem Hamiltonoperator H auch Eigenfunktionen zu letzterem. Die zugehörigen Eigenwerte von H sind ¶ µ 1 (13.27) En = ~ω n + 2 Offenbar liegen diese Eigenwerte äquidistant (vgl. Abbildung 13.1). Dem Oszillator lässt sich Energie entlocken und zuführen nur in Einheiten ~ω. Dass die Grundzustandsenergie E0 = 12 ~ω von Null verschieden ist, hatten wir uns schon früher klar gemacht. Nachdem alle Eigenfunktionen und Eigenwerte von H bekannt sind, können wir die allgemeine zeitabhängige Lösung der Schrödingergleichung angeben, X ψ(x, t) = cn e−iEn t/~ un (x) . n Der Koeffizient cn , ist die Wahrscheinlichkeitsamplitude dafür, den Oszillator im n-ten Energieniveau anzutreffen. Die cn sind durch eine Anfangsbedingung für ψ(x, 0) festzulegen. Wie die cn bei vorgegebener anfänglicher Wellenfunktion ψ(x, 0) ausgerechnet werden können, können Sie im folgenden Paragrafen lernen. 240 13 Harmonisch gebundene Quanten Abbildung 13.1 13.2 Die Orthogonalität normierbarer Eigenfunktionen hermitescher Operatoren Für zwei normierbare, d. h. für x → ±∞ hinreichend schnell abfallende Wellenfunktionen ϕ(x) und ψ(x) gilt die Integrationsregel +∞ +∞ · ¸∗ Z Z d d ∗ dx dx ψ (x) ϕ(x) = − ψ(x) ϕ(x) . dx dx (13.28) −∞ −∞ Sie impliziert eine wichtige Identität für den Impulsoperator p = +∞ +∞ Z Z ∗ ∗ dx ψ (x)pϕ(x) = + dx [pψ(x)] ϕ(x) . −∞ ~ d i dx (13.29) −∞ Ohne Änderung des Integrals kann der Impulsoperator von einer der beiden Funktionen ϕ(x) und ψ(x) auf die andere abgewälzt werden. Diese Eigenschaft des Operators p bezüglich des in ϕ und ψ bilinearen Integrals (13.29) heißt Hermitezität. Der Umgang mit Integralen des obigen Typs gestaltet sich bequemer, wenn wir als Skalarprodukt zweier Funktionen ϕ(x) und ψ(x) im Intervall a < x < b 13.2 Die Orthogonalität normierbarer Eigenfunktionen hermitescher Operatoren 241 einführen hψ | ϕi = Zb dx ψ ∗ (x)ϕ(x) . (13.30) a Dabei darf sich das Intervall auch über die ganze reelle Achse erstrecken; in zwei oder drei Dimensionen ist das Skalarprodukt bezüglich eines Bereichs entsprechender Dimension zu definieren. Die Regel (13.28) verknüpft also die Skalard d ϕi und h dx ψ | ϕi, und die Hermitezität des Impulsoperators p produkte hψ | dx lässt sich in der Form hψ | pϕi = hpψ | ϕi (13.31) aufschreiben. Jeder Operator A mit der Eigenschaft hψ | Aϕi = hAψ | ϕi heißt hermitesch. Beispiele sind der Ortsoperator“ x, reelle Zahlen, p2 , der ” Hamiltonoperator H = p2 /2m + V (x) usf. Nicht hermitesch ist nach (13.28) der Differentialoperator d/dx, desgleichen nichtreelle Zahlen. Die im letzten Paragrafen eingeführten Operatoren a und a† hatten wir durch partielles Integrieren als nicht hermitesch erwiesen (ohne das so auszudrücken), hψ | aϕi = ha† ψ | ϕi (13.32) hψ | a† ϕi = haψ | ϕi . Wegen der Eigenschaft (13.32) nennen wir a† den zu a adjungierten Operator und umgekehrt. Selbstadjungiert (= hermitesch) ist jedoch der Operator a † a, denn aus (13.32) folgt hψ | a† aϕi = haψ | aϕi = ha† aψ | ϕi . (13.33) Die Hermitezität eines Operators A hat zwei schöne und wichtige Konsequenzen für seine Eigenfunktionen ψn . Die fraglichen Eigenschaften werden uns erlauben, das am Ende des letzten Paragrafen gestellte Anfangswertproblem zu lösen. Die erste lautet: Die Eigenwerte eines hermiteschen Operators sind reell. Zum Beweis dieser Aussage multiplizieren wir die Eigenwertgleichung Aψn (x) = λn ψn (x) (13.34) hψn | Aψn i = λn hψn | ψn i . (13.35) mit ψn∗ (x) und integrieren, Von letzter Gleichung subtrahieren wir ihre konjugiert komplexe und erhalten (λn − λ∗n ) hψn | ψn i = hψn | Aψn i − hAψn | ψn i . (13.36) Wegen der Hermitezität von A verschwindet die rechte Seite in (13.36). Da hψn | ψn i als Integral über die nichtnegative Funktion |ψn (x)|2 nicht verschwinden kann, folgt die Behauptung λn = λ∗n . (13.37) 242 13 Harmonisch gebundene Quanten Der Hamiltonoperator eines Teilchens mit einer (reellen) potenziellen Energie V (x) ist, wie wir gesehen hatten, hermitesch. Daher sind die Energieeigenwerte stets reell. An diese Eigenschaft der Energieeigenwerte sind wir von den bisher behandelten Beispielen her schon gewöhnt. Die zweite angekündigte Eigenschaft hermitescher Operatoren betrifft ihre Eigenfunktionen: Zu verschiedenen Eigenwerten gehörige normierbare Eigenfunktionen eines hermiteschen Operators sind aufeinander orthogonal. Damit ist gemeint, dass das Skalarprodukt Z hψn | ψm i = dx ψn (x)ψm (x) . (13.38) verschwindet, wenn Aψn = λn ψn (13.39) Aψm = λm ψm (13.40) λn 6= λm . (13.41) und Zum Nachweis dieser Eigenschaft multiplizieren wir beide Seiten von (13.39) ∗ und beide Seiten der zu (13.40) konjugiert komplexen Gleichung mit ϕn mit ψm und integrieren, hψm | Aψn i = λn hψm | ψn i (13.42) hAψm | ψn i = λm hψm | ψn i . (13.43) Wegen der angenommenen Hermitezität des Operators A sind die linken Seiten von (13.42) und (13.43) einander gleich, woraus folgt (λn − λm ) hψm | ψn i = 0 . (13.44) Aus der Verschiedenheit der Eigenwerte λn und λm folgt nun die Orthogonalität der Eigenfunktionen, hψm | ψn i = 0 für λn 6= λm . (13.45) Falls zu einem Eigenwert λn mehrere linear unabhängige Eigenfunktionen auftreten, so sind diese zwar nicht notwendig untereinander orthogonal, können aber (Übung!) durch Bildung geeigneter Linearkombinationen durch einen Satz wechselseitig orthogonaler Funktionen ersetzt werden. Da der Hamiltonoperator H = ~ω(a† a + 1/2) des harmonischen Oszillators (ebenso wie der Operator a† a) hermitesch ist, sind seine im letzten Paragrafen gefundenen Eigenfunktionen untereinander orthogonal. Aus dem gleichen Grund sind untereinander orthogonal die in 11.2 konstruierten Energieeigenfunktionen eines Teilchens im Kasten. Wir können nun das am Ende des letzten Paragrafen gestellte Anfangswertproblem lösen, u. z. nicht nur für den eindimensionalen harmonischen Oszillator, sondern für alle Potentiale V (~x), für die die Gesamtheit der Eigenfunktionen des Hamiltonoperators H = p~2 /2m + V (~x) eine unendliche diskrete 13.3 Die erzwungene Schwingung des harmonischen Oszillators 243 Folge ψn (~x) mit n = 0, 1, 2, . . . bildet (die Verallgemeinerung auf kontinuierliche Spektren soll hier nicht besprochen werden). Die allgemeinste Lösung der Schrödingergleichung i~ψ̇ = Hψ lautet dann nach dem Superpositionsprinzip X ψ(~x, t) = cn e−iEn t/~ ψn (~x) . (13.46) n Wenn die anfängliche Wellenfunktion ψn (~x, 0) gegeben ist, so lassen sich die Koeffizienten cn bestimmen, indem die Gleichung X cn ψn (~x) (13.47) ψ(~x, 0) = n mit ψn∗ (x) multipliziert und integriert wird. Es ergibt sich wegen der Orthogonalität der Energieeigenfunktionen ­ ® cn = ψn | ψ(t = 0) /hψn | ψn i . (13.48) Dieses Resultat verschönert sich natürlich, wenn die Eigenfunktionen ψn auf Eins normiert sind. Die Darstellung der Funktion ψn (x, 0) durch eine unendliche Reihe gemäß (13.47) und (13.48) wirft Konvergenzprobleme auf, auf deren Diskussion ich hier verzichten muss. Ich will nur anmerken, dass die Darstellung (13.47, 13.48) sowie die ihr anhaftende Konvergenzproblematik der Fourierreihenentwicklung sehr ähnlich sind. Im Fall des Teilchens im Kasten mit starren Wänden (s. 12.2) läuft die Darstellung sogar genau auf eine Fourierreihe hinaus. 13.3 Die erzwungene Schwingung des harmonischen Oszillators Denken wir uns einen harmonischen Oszillator einer äußeren Kraft F (t) unterworfen, die zeitabhängig sein, aber nicht von der Auslenkung x des Oszillators abhängen soll. Zur potenziellen Energie tritt dann das Zusatzglied −xF (t), so dass der Hamiltonoperator lautet H(t) = 1 2 1 p + mω 2 x2 − xF (t) . 2m 2 (13.49) Im Gegensatz zu allen bisher betrachteten Fällen weist der Hamiltonoperator (13.49) eine explizite Zeitabhängigkeit auf. Aus diesem Grund kann die Schrödingergleichung · ¸ ~2 ∂ 2 1 2 2 i~ψ̇(x, t) = − + mω x − xF (t) ψ(x, t) (13.50) 2m ∂x2 2 nicht mehr durch einen Separationsansatz der Form f (t)u(x) gelöst werden. Zur Zeit t = 0 befinde sich der Oszillator im ungestörten Grundzustand, so dass die anfängliche Wellenfunktion die Gaußsche Form (13.26) ψ(x, 0) = ³ mω ´1/4 π~ n mω o exp − x2 2~ (13.51) 244 13 Harmonisch gebundene Quanten hat. Da der Hamiltonoperator (13.49) ebenso wie der des freien Oszillators in der Auslenkung x quadratisch ist, liegt die Vermutung nahe, dass die Lösung ψ(x, t) der Schrödingergleichung (13.50) ebenso wie die Anfangsamplitude (13.51) Gaußsch bleibt. Prüfen wir also den Ansatz ½ ¾ ³ mω ´1/4 mω i 2 exp − [x − x̄(t)] − p̄(t)x − iϕ(t) (13.52) ψ(x, t) = π~ 2~ ~ mit zunächst unbekannten Funktionen x̄(t), p̄(t), ϕ(t). Bevor Sie nachrechnen, dass dieser Ansatz bei geeigneter Wahl von x̄(t), p̄(t) und ϕ(t) die Schrödingergleichung befriedigt, sollten Sie ihn durch die folgenden Überlegungen würdigen lernen. Die rechte Seite in (13.52) stellt nicht die allgemeinste Gaußfunktion dar, da der Normierungsfaktor (mω/π~)1/4 und der Koeffizient (mω/2~) des quadratischen Gliedes im Exponenten gegenüber der Anfangsamplitude (13.51) unverändert sind. Diese Einschränkungen garantieren jedoch, falls die Funktionen x̄(t), p̄(t) und ϕ(t) reell sind, die zeitliche Konstanz des Normierungsintegrals +∞ +∞ ½ ¾ Z ³ mω ´1/2 Z mω 2 2 dx|ψ(x, t)| = dx exp − [x − x̄(t)] = 1 . π~ ~2 −∞ (13.53) −∞ Auch besteht zur Änderung des Koeffizienten des quadratischen Gliedes im Exponenten kein Anlass, da dieser Koeffizient beim freien Oszillator durch die Federkonstante mω 2 in der harmonischen Rückstellkraft bestimmt ist und da die Federkonstante durch das Anschalten der äußeren Kraft F (t) nicht verändert wird. Übrigens dürfen die Funktionen x̄(t), p̄(t) ohne Beschränkung der Allgemeinheit als reell angenommen werden, da das in x lineare Glied¡ im Exponenten¢ in (13.52) insgesamt den jedenfalls komplexen Koeffizienten ip̄(t) − mωx̄(t) /~ hat. Die Phase ϕ(t) muss dann auch reell sein, damit die Normierung (13.51) gilt. Der Spezialfall der freien Oszillation ist in (13.52) als x̄ = p̄ = 0, ϕ(t) = E0 t/~ = ωt/2 enthalten. Nach Anschalten der äußeren Kraft beginnt die Energie des Oszillators von der Grundzustandsenergie E0 = ~ω/2 abzuweichen, weshalb die Phase ϕ(t) nicht mehr linear mit der Zeit wachsen kann. Um die Bedeutung der Funktion x̄(t) zu klären, betrachten wir die Wahrscheinlichkeitsdichte |ψ(x, t)|2 = ³ mω ´1/2 π~ n mω o 2 exp − [x − x̄(t)] . ~ (13.54) Wie zur Zeit t = 0 handelt es sich hierbei um eine Gaußsche Verteilung, die allerdings ihr Maximum zur Stelle x = x̄(t) verschoben hat. Offensichtlich gilt auch +∞ Z hxi = dx x|ψ(x, t)|2 = x̄(t) , (13.55) −∞ so dass x̄(t) mit der mittleren Auslenkung des Oszillators zu identifizieren ist. 13.4 Die Umgebung belässt nur den Grundzustand stabil 245 Der Phasenfaktor exp [ip̄(t)x/~] in (13.52) bringt zum Ausdruck, dass der Oszillator nach erzwungener Auslenkung in Bewegung bleibt und einen von Null verschiedenen mittleren Impuls aufweist. In der Tat gilt +∞ +∞ Z Z © ª ∗~ ∂ dx |ψ|2 p̄(t) + imω [x − x̄(t)] = p̄(t) , dx ψ ψ= hpi = i ∂x (13.56) −∞ −∞ woraus wir die noch unbekannte Funktion p̄(t) als den mittleren Impuls des Oszillators erkennen. Jetzt dürfen Sie durch Eintragen des Ansatzes (13.52) in die Schrödingergleichung (13.50) verifizieren, dass in (13.52) die richtige Lösung vorliegt, vorausgesetzt, die Mittelwerte x̄(t) und p̄(t) und die Phase ϕ(t) werden bestimmt aus mẋ(t) = p̄(t) ˙ = −mω 2 x̄(t) + F (t) p̄(t) ~ϕ̇(t) = (13.57) 1 1 1 ~ω + p̄(t)2 − mω 2 x̄(t)2 . 2 2m 2 Die ersten beiden Gleichungen in (13.57) sind, wie nach dem Ehrenfestschen Theorem zu erwarten, formgleich mit der Newtonschen Bewegungsgleichung für die erzwungene Schwingung eines klassischen harmonischen Oszillators. Ihre allgemeine Lösung ist uns aus 2.6 bekannt (die dort auftretende Dämpfungskonstante ist hier gleich Null zu setzen). Da im anfänglich vorliegenden Grundzustand die Mittelwerte von Auslenkung und Impuls verschwinden hxit=0 = hpit=0 = 0 , (13.58) lautet die mittlere Amplitude x̄ = Zt 0 dt0 F (t0 ) 1 sin ω(t − t0 ) . mω (13.59) Die Phase ϕ(t) ergibt sich schließlich aus dem Zeitintegral der rechten Seite der letzten der Gleichungen (13.57). 13.4 Die Umgebung belässt nur den Grundzustand stabil (Spontane Emission) Makroskopische Oszillatoren (Pendel, elektrische Schwingkreise etc.) trifft man stets im Ruhezustand bei verschwindender Auslenkung an, es sei denn, sie unterlägen zusätzlichen äußeren makroskopischen Kräften. Der Grund dafür ist, dass eine etwa anfänglich vorhandene Anregungsenergie des Oszillators im Lauf der Zeit durch Dämpfung dissipiert, d. h. an die Freiheitsgrade der Umgebung abgegeben wird. Wir hatten diesen Effekt durch eine klassische Modellrechnung in 2.13 illustriert. Ähnlich benehmen sich Quantensysteme wie einzelne Oszillatoren oder Atome. Von den mehreren oder vielen Energieniveaus, die man durch Lösung 246 13 Harmonisch gebundene Quanten der Schrödingergleichung für das einzelne System findet, bleibt i. A. nur der Grundzustand streng stabil, wenn eine Wechselwirkung mit der Umgebung“ in ” Rechnung gestellt wird. Praktisch heißt das z. B. , dass ein anfänglich schwingendes Molekül im Lauf der Zeit seine Anregungsenergie abstrahlt und in den Grundzustand übergeht (s. Abbildung 13.2). Als Umgebung fungiert dabei das elektromagnetische Feld. Abbildung 13.2 Zur Illustration dieses Phänomens dient uns eine Modellrechnung, die der in 2.13 vorgestellten eng verwandt ist. Als dissipierende Umgebung verwenden wir wieder einen Haufen harmonischer Oszillatoren, deren Frequenzen ω i (i = 1, 2, . . . , N ) den Bereich 0 ≤ ωi < ∞ so dicht belegen, dass man eine spektrale Dichte ρ(ω) einführen kann; ρ(ω)∆ω ist die Zahl dieser Oszillatoren, mit Frequenzen im kleinen Intervall ∆ω bei ω. Das zu dämpfende Objekt sei ebenfalls ein Oszillator, und dessen Frequenz heiße ω0 . Die Kopplung zwischen dem zu dämpfenden Objekt und der Umgebung nehmen wir der Einfachheit halber wieder als bilinear in den Koordinaten und Impulsen x0 und p0 bzw. xi und pi an. Bequemlichkeitshalber drücken wir den Hamiltonoperator des Systems gleich durch die Erzeugungs-“ und Vernichtungsoperatoren“ a+ ν (ν = 0, 1, 2, . . . , N ) ” ” bzw. aν aus, die beim ν-ten Oszillator die Anregungsenergie um den Betrag ~ων erhöhen (daher Erzeugungsoperator) bzw. erniedrigen (daher Vernichtungsoperator). Die Vertauschungsrelationen sind bezüglich jedes Oszillators die in 13.1 gefundenen (keine Summenkonvention!) + + [aν , a+ ν ] = 1, [aν , aν ] = [aν , aν ] = 0 . (13.60) Wegen dxdν xµ = xµ dxdν bei µ 6= ν ist die Reihenfolge von zu zwei verschiedenen Oszillatoren gehörigen Operatoren vertauschbar, + [aν , a+ µ ] = [aν , aµ ] = [aν , aµ ] = 0 für ν 6= µ . (13.61) tritt jedenfalls die wohl bekannte ungestörte Energie ~ων ¢ ¡Im+Hamiltonoperator aν aν + 12 für jeden der N + 1 Oszillatoren auf. Hinzutreten muss ein Kopplungsglied, das die Wechselwirkung des zentralen Oszillators mit seiner Umgebung beschreibt (s. Abbildung 13.3). Eine einfache und anschauliche,Pder harx0 xi ∼ monischen Feder entsprechende Wahl für das Kopplungsglied wäre i 13.4 Die Umgebung belässt nur den Grundzustand stabil 247 P + (a0 + a+ 0 )(ai + ai ). Der nachfolgenden Rechnung lege ich jedoch bequemlichP + keitshalber die ebenfalls anschauliche Modifikation (a0 a+ i + a0 ai ) zu Grunde. i i Beachten Sie, dass das Glied a0 a+ i die Vernichtung eines Quants im zentralen und die Erzeugung eines anderen im i-ten Oszillator beschreibt; das hermitesch konjugierte Glied a+ 0 ai trägt dem umgekehrten Prozess Rechnung, der Verlagerung eines Quants aus der Umgebung in den zentralen Oszillator. Insgesamt lautet damit der Hamiltonoperator Abbildung 13.3 µ ¶ X µ ¶ X N N 1 1 + + + a a + + H = ~ω0 a+ a + ~ω ~g(a0 a+ i 0 i 0 i i + a0 ai ) . (13.62) 2 2 i=1 i=1 Die im Kopplungsglied auftretende Kopplungskonstante g hat die Dimension einer Frequenz. In einem noch zu spezifizierenden Sinn sei g klein, die Kopplung also schwach, damit die zu erwartenden Dissipationseffekte klein bleiben. Der Anfangszustand des Systems sei der ungestörte Grundzustand u0 (xi ) für alle N Oszillatoren der Umgebung“ und der erste ungestörte Anregungszustand ” u1 (x0 ) des zentralen Oszillators. Die entsprechende Wellenfunktion lautet also Φ(t = 0) = u1 (x0 ) N Y u0 (xi ) . (13.63) i=1 Im Fall verschwindender Kopplung, g = 0, wäre (13.63) ein Eigenzustand des Hamiltonoperators (13.62). Der entsprechende Eigenwert der Energie läge um das Energiequant“ ~ω0 über der Grundzustandsenergie ” N 1X ~ων . (13.64) E0 = 2 ν=0 Bei nichtverschwindender Kopplung ist der Anfangszustand kein Eigenzustand des Hamiltonoperators (13.62) mehr. Wegen aν u0 (xν ) = 0, a+ ν u0 (xν ) = u1 (xν ) und aν u1 (xν ) = u0 (xν ) . (13.65) 248 13 Harmonisch gebundene Quanten gilt vielmehr HΦ(t = 0) = (E0 + ~ω0 )Φ(t = 0) + ~g N N X u1 (xj ) Y j=1 u0 (xj ) ν=0 u0 (xν ) . (13.66) Unter der Wirkung von H entsteht also aus Φ(t = 0) eine Linearkombination von Wellenfunktionen, deren jede genau einen Oszillator als im ungestörten ersten angeregten Zustand und alle anderen Oszillatoren als im ungestörten Grundzustand befindlich beschreibt. Keine einzige dieser Wellenfunktionen ist für sich Eigenfunktion zu H, da à ! à ! u1 (xj ) Y u1 (xj ) Y H u0 (xν ) = (E0 + ~ωj ) u0 (xν ) + ~gΦ(t = 0) . u0 (xj ) ν u0 (xj ) ν (13.67) Aus den beiden Beziehungen (13.66) und (13.67) folgt, dass sich die Schrödingergleichung des Gesamtsystems i~Φ̇(t) = HΦ(t) (13.68) mit der Anfangsbedingung (13.64) lösen lässt durch den einfachen Ansatz Φ(t) = N X cν (t) ν=0 N u1 (xj ) Y u0 (xµ ) . u0 (xj ) µ=0 (13.69) Hierin ist cν (t) die zu bestimmende Wahrscheinlichkeitsamplitude dafür, dass der ν-te Oszillator zur Zeit t ein Energiequant ~ων enthält und alle anderen Oszillatoren im Grundzustand sitzen. Für die N + 1 Unbekannten cν (t) finden wir aus der Schrödingergleichung (13.68) mit Hilfe von (13.66) und (13.67) folgende Bewegungsgleichungen ċ0 (t) = −i(ω0 + E0 /~)c0 (t) − ig N X ci (t) (13.70) i=1 ċi (t) = −igc0 (t) − i(ωi + E0 /~)ci (t) . (13.71) Diese haben wir mit der Anfangsbedingung c0 (0) = 1, ci (0) = 0 (13.72) zu lösen. Die weitere Rechnung verläuft ganz ähnlich wie die in 2.13. Genießen Sie den Vergleich! Da das Schicksal des zentralen Oszillators (die zu erwartende Dämpfung, c0 (t → ∞) → 0) von besonderem Interesse ist, eliminieren wir zunächst die ci (t), indem wir (13.71) formal integrieren, ci (t) = ci (0) e−i(ωi +E0 /~)t − ig | {z } =0 Zt 0 0 dt0 e−i(ωi +E0 /~)t c0 (t − t0 ) , (13.73) 13.4 Die Umgebung belässt nur den Grundzustand stabil 249 und dieses Integral in (13.70) eintragen. Dabei entsteht für c0 (t) die Integrodifferentialgleichung ċ0 (t) = −i(ω0 + E0 /~)c0 (t) − g 2 Zt dt0 X i 0 0 e−i(ωi +E0 /~)t c0 (t − t0 ) . (13.74) Um die Abweichung des Verhaltens von c0 (t) von der freien Schwingung (g = 0) besonders sinnfällig zu machen, benutzen wir die Darstellung ci (t) = e−i(ωi +E0 /~)t c̃0 (t) (13.75) und erhalten für die Amplitude c̃0 (t) c̃˙0 (t) = −g 2 Zt X dt0 i 0 0 ei(ω0 −ωi )t c˜0 (t − t0 ) . (13.76) Offenbar bleibt c0 (t) bei verschwindender Kopplung zeitlich konstant. Versuchen wir, die bei schwacher Kopplung zu erwartende schwache Zeitabhängigkeit durch den Exponentialansatz c̃0 (t) = e−Γt−iδt (13.77) zu erfassen. Die reellen Parameter Γ und δ haben, falls der Ansatz die Bewegungsgleichung (13.76) befriedigt, die physikalische Bedeutung einer Dämpfungskonstanten bzw. einer Frequenzverschiebung. Tragen wir den Ansatz (13.77) in (13.76) ein, so erhalten wir die Kompatibilitätsbedingungen zur Bestimmung von Γ und δ Γ + iδ = g 2 X e{Γ+i(ω0 +δ−ωi )}t − 1 . {Γ + i(ω0 + δ − ωi )} i (13.78) In niedrigster Ordnung in g (auf die wir uns im Grenzfall schwacher Kopplung beschränken dürfen) können wir auf der rechten Seite Γ und δ vernachlässigen. Ferner erlaubt uns die Annahme eines dichten Spektrums von Frequenzen ωi die Ersetzung der Summe über die Umgebungsoszillatoren durch ein Frequenzintegral. Daraufhin verändert sich (13.78) zu Γ + iδ = g 2 Z∞ dω ρ(ω) 0 ei(ω0 −ω)t − 1 i(ω0 − ω) oder, nach Real- und Imaginärteil getrennt, Γ=g 2 Z∞ 0 δ = g2 Z∞ 0 sin(ω0 − ω)t ω0 − ω (13.79) 1 − cos(ω0 − ω)t . ω0 − ω (13.80) dω ρ(ω) dω ρ(ω) 250 13 Harmonisch gebundene Quanten Die gewonnenen Ausdrücke für Γ und δ (und damit der Ansatz (13.77) sind nur sinnvoll, wenn die rechts stehenden Integrale zeitunabhängig sind. Dies ist für große Zeiten, t À ω0−1 , tatsächlich der Fall, wie wir uns schon in 2.13 überlegt hatten. Insbesondere gilt lim t→∞ sin(ω0 − ω)t = πδ(ω − ω0 ) (ω0 − ω) (13.81) und somit Γ = πg 2 ρ(ω0 ) . (13.82) Es nimmt also die Wahrscheinlichkeit dafür, den zentralen Oszillator im ersten angeregten Zustand zu finden, zeitlich exponentiell ab, |c0 (t)|2 = |e−i(ω0 +E0 /~)t e−Γt−iδτ |2 = e−2Γt . (13.83) Also kann 1/2Γ als Lebensdauer des Anfangszustandes interpretiert werden. Nach Ablauf einiger dieser Zeiteinheiten 1/2Γ hat der zentrale Oszillator seine anfängliche Anregungsenergie ~ω0 in die Umgebung emittiert. Damit die Amplitude c0 (t) = e−i(ω0 +δ+E0 /~)t−Γt (13.84) auf Grund der Wechselwirkung mit der Umgebung nur schwach vom ungestörten Verhalten abweicht, müssen (beachten Sie, dass die Phase E0 /~ keine physikalische Bedeutung hat, da sie in allen cν (t) auftritt; sie kann durch Wahl des Energienullpunktes zum Verschwinden gebracht werden) sowohl die Dämpfungskonstante Γ wie die Frequenzverschiebung δ klein gegenüber der ungestörten Eigenfrequenz ω0 sein, Γ, δ0 ¿ ω0 . (13.85) Dies ist die eingangs angekündigte Bedingung für die Schwäche der Kopplung. Die soeben durchgeführte quantenmechanische Betrachtung der Dämpfung ist von recht weitreichender Bedeutung. Eine unmittelbare Anwendung findet sie auf die spontane Emission von infrarotem Licht durch anfänglich angeregt schwingende Moleküle. Die Anwendbarkeit begründet sich darin, dass das elektromagnetische Strahlungsfeld als ein Haufen von Oszillatoren angesehen werden kann. Von spontaner Emission spricht man dabei deshalb, weil das elektromagnetische Feld (die Umgebung) als anfänglich im Grundzustand befindlich angenommen ist und somit zunächst keine elektromagnetische Welle vorhanden ist, die einen Übergang eines angeregt schwingenden Moleküls in den Grundzustand induzieren könnte. Der durch kein äußeres Signal oder anfängliches elektromagnetisches Feld erzwungene, vielmehr spontane Übergang des Moleküls in den Grundzustand der Schwingung manifestiert eine intrinsische Instabilität des angeregten Zustands auf Grund der Ankopplung der Freiheitsgrade des elektromagnetischen Feldes. Mit nur geringen Modifikationen entsteht aus der dargelegten Rechnung die berühmte Wigner-Weißkopf Theorie der spontanen Emission von Licht durch angeregte Atome. In diesem Fall entspricht dem zentralen Oszillator das von 13.4 Die Umgebung belässt nur den Grundzustand stabil 251 einem angeregten Zustand in den Grundzustand springende und dabei strahlende Atom, während die Umgebungsoszillatoren durch die Gesamtheit der monochromatischen Wellen des elektromagnetischen Feldes dargestellt werden. Die Dämpfungskonstante (13.82) gibt dann die Linienbreite der zum atomaren Übergang gehörenden Spektrallinie. 252 13 Harmonisch gebundene Quanten Kapitel 14 Das Wasserstoffatom 14.1 Relativ- und Schwerpunktsbewegung Im Wasserstoffatom bewegt sich ein Elektron der Ladung −e um ein Proton der Ladung +e (e > 0). Wir haben es also mit einem Zweikörperproblem zu tun, dessen Wellenfunktion von den sechs Ortskoordinaten ~xel = (xel , yel , zel ) und ~xp = (xp , yp , zp ) abhängt. Da die Wechselwirkung der beiden Teilchen Coulombsch ist, U = U (~xel − ~xp ) = − 1 e2 , 4πε0 |~xel − ~xp | lautet die zu lösende Schrödingergleichung ¶ µ 1 2 1 e2 1 2 p~ + p~ − Φ, i~Φ̇ = HΦ = 2mel el 2mp p 4πε0 |~xel − ~xp | (14.1) (14.2) wobei p~el = ~ ~ ∇el = (∂/∂xel , ∂/∂yel , ∂/∂zel ) i i p~p = ~ ~ ∇p = (∂/∂xp , ∂/∂yp , ∂/∂zp ) i i und (14.3) die Impulsoperatoren für das Elektron bzw. das Proton sind; mel und mp sind die entsprechenden Massen. Ganz ähnlich wie wir in Kapitel 3.4 das klassische Keplerproblem auf ein Einkörperproblem zurückgeführt haben, können wir bei der vorstehenden quantenmechanischen Aufgabe vorgehen. Führen wir Relativ - und Schwerpunktskoordinaten ein, gemäß ~x = ~xel − ~xp ~ = X 1 (mel ~xel + mp ~xp ) . mel + mp 253 (14.4) 254 14 Das Wasserstoffatom In diesen Koordinaten schreibt sich die Schrödingergleichung · µ 2 ¶ ~2 ∂2 ∂2 ∂ i~Φ̇ = HΦ = − + + 2m ∂x2 ∂y 2 ∂z 2 µ ¸ ¶ ∂2 ∂2 ∂2 ~2 1 e2 + + Φ − − 2M ∂X 2 ∂Y 2 ∂Z 2 4πε0 |~x| (14.5) mit m= mel mp mel + mp M = mel + mp (14.6) als reduzierter Masse und Gesamtmasse des Systems. Da die Wechselwirkungsenergie nur von den Relativkoordinaten abhängt, und da in der kinetischen Energie keine Produkte von Ableitungen nach Relativund Schwerpunktskoordinaten auftreten, lässt sich die Schrödingergleichung (14.5) lösen durch den Ansatz, ~ t) = ψ(~x, t)Ψ(X, ~ t) . Φ(~x, X, (14.7) ~ t) ergeben sich aus (14.5) die Für die Teilwellenfunktionen ψ(~x, t) und Ψ(X, beiden voneinander völlig entkoppelten Schrödingergleichungen · ¸ ~2 2 1 e2 i~ψ̇(~x, t) = − ∇ − ψ(~x, t) mit ∇2 = ∂ 2 /∂x2 + · · · (14.8) 2m 4πε0 |~x| und 2 ~ t) ~ t) = − ~ ∇2 Ψ(X, i~Ψ̇(X, 2M mit ∇2 = ∂ 2 /∂X 2 + · · · (14.9) Letztere Gleichung ist uns wohlbekannt als die Schrödingergleichung eines freien Teilchens der Masse M , während erstere die Bewegung eines Quants der Masse m in einem Coulombfeld mit Zentrum bei ~x = 0 beschreibt. Die Unabhängigkeit der freien Schwerpunktsbewegung von der Relativbewegung ist offenbar Ausdruck der Homogenität des Raumes, in welchem sich das Gesamtsystem befindet: die ursprüngliche Schrödingergleichung (14.2) zeichnet keinen Punkt des Raumes aus; sie bleibt unverändert gegenüber der galileischen Koordinatentransformation ~x0 = ~x + d~ + ~v t. 14.2 Bewegung im Coulombfeld Wegen der Isotropie des Coulombfeldes bezüglich des Zentrums ~x = 0 ist es zweckmäßig, die Schrödingergleichung der Relativbewegung im Wasserstoffatom in Kugelkoordinaten zu behandeln. Die Transformation von diesen zu den kartesischen Koordinaten lautet: x = r cos ϕ sin θ, y = r sin ϕ sin θ, z = r cos θ (14.10) 14.2 Bewegung im Coulombfeld 255 bzw. umgekehrt r= p x2 + y 2 + z 2 , tan ϕ = y/x, tan θ = p x2 + y 2 /z . (14.11) Die Ableitungen nach Kugel- und kartesischen Koordinaten sind verknüpft durch die Kettenregel, also z. B. ∂/∂x = (∂r/∂x)∂/∂r+(∂ϕ/∂x)∂/∂ϕ+(∂θ/∂x)∂/∂θ. Insgesamt gilt ∂ 1 ∂ 1 sin ϕ ∂ ∂ = sin θ cos ϕ + cos θ cos ϕ − ∂x ∂r r ∂θ r sin θ ∂ϕ ∂ 1 ∂ 1 cos ϕ ∂ ∂ = sin θ sin ϕ + cos θ sin ϕ + ∂y ∂r r ∂θ r sin θ ∂ϕ ∂ 1 ∂ ∂ = cos θ − sin θ ∂z ∂r r ∂θ sowie für den Laplaceoperator ∇2 = 1 ∂ 2 ∂ ∂ ∂2 1 ∂ 1 r + sin θ + . r2 ∂r ∂r r2 sin θ ∂θ ∂θ r2 sin2 θ ∂ϕ2 (14.12) Somit schreibt sich die zu untersuchende Schrödingergleichung als i~ψ̇(r, ϕ, θ, t) = Hψ(r, ϕ, θ, t) (14.13) ¶ µ 1 ~2 1 e2 ~2 ∂ 2 ∂ r + L − ψ(r, ϕ, θ, t) = − 2mr2 ∂r ∂r 2mr2 4πε0 r mit der Abkürzung ~ 2 = −~2 L µ 1 ∂ ∂ 1 ∂2 sin θ + sin θ ∂θ ∂θ sin2 θ ∂ϕ2 ¶ . (14.14) Der enorme gegenüber der Formulierung in kartesischen Koordinaten erreich~ 2 die Radialvariable r te Vorteil ist nun offenbar. Da der Differentialoperator L nicht enthält, muss die Lösung der Schrödingergleichung (14.13) mit Hilfe des Produktansatzes ψ = e−iEt/~ R(r)Y (θ, ϕ) (14.15) gelingen. Die winkelabhängige Amplitude Y (θ, ϕ) ist dabei als Eigenfunktion ~ 2 zu wählen gemäß des Operators L ~ 2 Y (θ, ϕ) = ~2 l(l + 1) Y (θ, ϕ) ; L (14.16) ~2 die hier vorgenommene Benennung der noch zu suchenden Eigenwerte von L ist Konventionssache. Für den Radialteil R(r) der Eigenfunktion (14.15) des Hamiltonoperators ergibt sich schließlich die gewöhnliche Differentialgleichung ¶ µ ~2 d 2 d ~2 l(l + 1) ~ 2 1 e2 R, (14.17) ER = − r + L − 2mr2 dr dr 2mr2 4πε0 r 256 14 Das Wasserstoffatom aus der auch die möglichen Energieeigenwerte E festzulegen sind. Unsere in Kapitel 3 gewonnene Erfahrung mit dem klassischen Keplerproblem lässt uns erwarten, dass für negative Energien gebundene Zustände vorliegen, deren Normierungsintegral endlich ist Z∞ 0 dr r 2 Zπ 0 dθ sin θ Z2π 0 dϕ |R(r)Y (θ, ϕ)|2 = hψ | ψi < ∞ . (14.18) Andererseits sollten Eigenfunktionen mit E ≥ 0 ungebundenen Streuzuständen entsprechen, da auch klassische Teilchen mit E ≥ 0 durch die potenzielle Energie U ∼ 1/r nicht an der Flucht in beliebige Entfernung vom Zentrum gehindert werden. Letztere Erwartung erfüllen wir uns sofort, indem wir die Eigenwertgleichung (14.8) für große Abstände vom Zentrum betrachten. Nach Weglassen aller mit r → ∞ abfallenden Glieder vereinfacht sich diese Gleichung zu ~2 d 2 R + ER = 0 2m dr2 (14.19) und hat die Partikularlösungen R = e±ir √ 2mE/~2 . (14.20) Wie erwartet, verhalten sich die Lösungen mit positiven Energien oszillatorisch, fallen also nicht ab mit r → ∞; beliebig große Abstände r behalten eine endliche Wahrscheinlichkeitsamplitude. Wie es für derartige Streuzustände typisch ist, existiert das über den ganzen Raum erstreckte Normierungsintegral nicht. Bei negativer Energie verhält sich eine der beiden asymptotischen Lösungen exponentiell abfallend, entspricht also einem normierbaren gebundenen Zustand, während die andere mit r → ∞ exponentiell wächst. Letztere würde keine Interpretation als Wahrscheinlichkeitsamplitude zulassen und darf nicht auftreten. Das Verbot exponentiellen Anwachsens für r → ∞ ist eine Randbedingung für die Eigenlösungen von (14.17), die sich, wie wir sehen werden, nur für diskrete Werte der Energie im Intervall −∞ < E < 0 befriedigen lässt. Wie bei den früher behandelten Quantensystemen sind also auch hier die diskreten Energieniveaus zu den gebundenen Zuständen durch Randbedingungen festgelegt. 14.3 Der Bahndrehimpuls∗) Die oben konstatierte Separierbarkeit der Schrödingergleichung (14.13) in Kugelkoordinaten, d. h. die Lösbarkeit durch den Produktansatz (14.15), ist keineswegs zufällig, sondern eine Konsequenz der Winkelunabhängigkeit des Coulombpotentials. Beim klassischen Keplerproblem hatte die Isotropie bezüglich des Zentrums, Sie erinnern sich, die zeitliche Erhaltung des Drehimpulses ~ = ~x × p~ L (14.21) ∗) Der nicht an der Konstruktion der Drehimpulseigenwerte und -eigenfunktionen interessierte Leser möge direkt zum Ergebnis springen, das ab (14.71) dargestellt wird. 14.4 Kommutierende Operatoren haben gemeinsame Eigenfunktionen 257 zur Folge. Ich will hier begründen, dass der gleiche Erhaltungssatz in der Quantenmechanik gilt und sich in der genannten Separierbarkeit der Schrödingergleichung manifestiert. ~ = (Lx , Ly , Lz ) durch Klassisch wie quantenmechanisch ist der Vektor L ~ wegen p~ = ~ ∇ (14.21) definiert. Auf ortsabhängige Wellenfunktionen wirkt L i als Differentialoperator. Seine Komponenten lauten µ ¶ µ ¶ ∂ ∂ ~ ∂ ∂ y = i~ sin ϕ Lx = ypz − zpy = −z + cot θ cos ϕ i ∂z ∂y ∂θ ∂ϕ µ ¶ µ ¶ ∂ ∂ ∂ ∂ ~ −x + cot θ sin ϕ z = i~ − cos ϕ Ly = zpx − xpz = i ∂x ∂z ∂θ ∂ϕ µ ¶ ∂ ~ ∂ ~ ∂ −y . (14.22) Lz = xpy − ypx = x = i ∂y ∂z i ∂ϕ ~ finden wir aus (14.22) zu Das Quadrat des Vektors L ¶ µ ∂ 1 ∂2 1 ∂ 2 2 2 2 ~ sin θ + L = Lx + Ly + Lz = −~ sin θ ∂θ ∂θ sin2 ∂ϕ2 (14.23) und erkennen hierin die im letzten Paragrafen verwendete Abkürzung für den winkelabhängigen Anteil des Hamiltonoperators H=− 1 e2 1 ~2 ~2 1 ∂ 2 ∂ r − + L . 2 2m r ∂r ∂r 4πε0 r 2mr2 (14.24) ~ 2 die Radialkoordinate nicht enthält, vertauscht er mit Da der Operator L dem Hamiltonoperator, ~ 2] = 0 . [H, L (14.25) Diese Vertauschbarkeit bliebe sogar erhalten, wenn das Coulombfeld e2 /r in (14.24) durch ein beliebiges Zentralfeld U (r) ersetzt würde, hängt also nur an der Isotropie bezüglich des Zentrums. Überzeugen wir uns nun davon, dass das Verschwinden des Kommutators (14.25) einen Erhaltungssatz für das Quadrat des Drehimpulses darstellt. Dabei hilft der folgende kleine mathematische Exkurs. 14.4 Kommutierende Operatoren haben gemeinsame Eigenfunktionen Seien A und B zwei Operatoren. Damit ϕ eine gemeinsame Eigenfunktion ist, muss gelten Aϕ = aϕ, Bϕ = bϕ , (14.26) wobei a und b die respektiven Eigenwerte sind. Multiplizieren wir die erste dieser Gleichungen mit B und die zweite mit A, so erhalten wir als Differenz (AB − BA)ϕ = (ab − ba)ϕ = 0 . (14.27) 258 14 Das Wasserstoffatom Hieraus darf noch nicht geschlossen werden, dass A und B kommutieren. Wenn jedoch alle Eigenfunktionen von A und B gemeinsame Eigenfunktionen sind, also die Eigenschaft (14.27) haben, so folgt [A, B] = 0 . (14.28) Die Argumentation kann auch umgekehrt geführt werden, d. h. das Verschwinden des Kommutators impliziert, dass A und B alle Eigenfunktionen gemeinsam haben. In etwas anschaulicherer Formulierung lautet die eben gewonnene Erkenntnis: Kommutierende Observable sind zugleich scharf messbar. Scharf ist eine physikalische Größe (das ist eine Observable“) A bezüglich ihrer Eigenzustände. ” Liegen nämlich Systeme im Zustand ϕ vor, der Eigenzustand von A mit Eigenwert a ist, so hat die Observable in diesen Systemen genau den Wert a; bei Messung an im Zustand ϕ präparierten Systemen ergibt sich für die fragliche Observable immer nur der Wert a. Wenn ϕ sogar Eigenzustand von zwei Observablen A und B ist, so ergeben Messungen an in ϕ präparierten Systemen eben immer nur die respektiven Eigenwerte als Messwerte dieser Observablen. Unscharf ist dagegen eine Observable A bezüglich jedes Zustandes, der nicht einer ihrer Eigenzustände ist. Schauen wir etwa eine Linearkombination zweier normierter Eigenzustände ϕ und ϕ0 von A mit Eigenwerten a und a0 an, ψ = cϕ + c0 ϕ0 mit |c|2 + |c0 |2 = 1 . (14.29) Dann sind |c|2 und |c0 |2 die Wahrscheinlichkeiten dafür, dass wir bei Messung von A an Systemen mit der Wellenfunktion ψ den Wert a bzw. a0 finden. Offenbar ist die Unschärfe von A bei Zuständen der Form (14.29) am größten für |c|2 = |c0 |2 = 1/2. Ein beliebtes, Ihnen aus der Experimentalphysik bekanntes Maß für die Schärfe einer Observablen bezüglich einer Wellenfunktion ψ ist die so genannte Streuung ¡ ¢1/2 Str(A) = hψ | A2 ψi − hψ | Aψi2 . (14.30) Für hermitesche Operatoren ist die Streuung reell und nicht negativ, denn es gilt mit A = A+ und hAi = hψ | Aψi = hAi∗ ­ ­ ® 2 2 ® {Str(A)} = ψ | (A − hAi) ψ = (A − hAi) ψ | (A − hAi) ψ ≥ 0 . (14.31) Den kleinstmöglichen Wert Null kann die Streuung gemäß (14.31) übrigens nur annehmen, wenn der nichtnegative Integrand im Integral h(A − hAi) ψ | (A − hAi) ψi verschwindet, d. h. wenn Aψ = hAiψ (14.32) gilt, also ψ eine Eigenfunktion von A ist. Als Übung bleibt Ihnen, die Streuung von A bezüglich des Zustands (14.29) auszurechnen. Sie finden leicht 2 {Str(A)} = |c|2 (1 − |c|2 )(a − a0 )2 (14.33) und bestätigen hieraus, dass die Streuung für |c|2 = 1/2 maximal ist, während sie für |c|2 = 0 und für |c|2 = 1 verschwindet. 14.5 Die Eigenwerte des Bahndrehimpulses 259 Jetzt können Sie verstehen, dass die Vertauschbarkeit eines Operators A (wie ~ 2 ) mit dem Hamiltonoperator, [H, A] = 0, der des Bahndrehimpulsquadrats L zeitlichen Erhaltung von A entspricht. Der zeitabhängige Zustand ψ(t) des fraglichen Systems lässt sich nämlich als Überlagerung von Energieeigenzuständen ψn darstellen. X cn e−iEn t/~ ψn . (14.34) ψ(t) = n Der entsprechende Erwartungswert von A ergibt sich dann, da die ψn wegen [H, A] = 0 auch Eigenzustände von A sind, zu hAi(t) = = X n,m X n cn c∗m e−i(En −Em )t/~ an hψm | ψn i |cn |2 an hψn | ψn i , (14.35) d. h. als zeitunabhängig. Ebenso zeitunabhängig bleiben die Streuung von A und die Erwartungswerte beliebiger Potenzen Aν . Gleichermaßen einsehbar wird der Zusammenhang zwischen der Separierbarkeit der Schrödingergleichung (14.13) und der Erhaltung des Bahndrehimpulsquadrats für die Bewegung im Coulombfeld. Die Separierbarkeit von (14.13) ~ 2 gemeinsame Eigenfunktiodurch den Ansatz (14.15) bedeutet, dass H und L ~ 2 ist im Verschwinden des nen haben. Dies und die zeitliche Erhaltung von L 2 ~ Kommutators [H, L ] begründet. Vergessen Sie nicht den physikalischen Grund ~ 2 ] = 0, die Isotropie des Coulombpotentials. für [H, L 14.5 Die Eigenwerte des Bahndrehimpulses Anders als die Komponenten des Impulses p~ = ~i ∇ kommutieren die Kompo~ = ~x × p~ nicht untereinander. Vielmehr folgt nenten des Bahndrehimpulses L aus [pi , xj ] = ~i δij [Lx , Ly ] = [ypz − zpy , zpx − xpz ] = [ypz , zpx ] + [zpy , xpz ] = ypx [pz , z] + xpy [z, pz ] = ~ (ypx − xpy ) i = i~Lz . (14.36) Ganz ähnlich finden Sie die anderen Kommutatoren. Insgesamt gilt [Lx , Ly ] = i~Lz ; [Ly , Lz ] = i~Lx ; [Lz , Lx ] = i~Ly (14.37) Beachtenswert ist, dass sich alle diese Relationen aus einer derselben ergeben durch zyklische Permutation der Vektorindizes. Diese Verwandtschaft besteht nicht zufällig; sie entspricht der Gleichberechtigung der Benennungen der 1-, 2und 3-Achsen eines rechtssinnigen rechtwinkligen Dreibeins mit Koordinaten in der Reihenfolge xyz, yzx und zxy. Wir schließen aus den Vertauschungsregeln (14.37), dass verschiedene Komponenten des Drehimpulses nicht zugleich scharf sein können. Wohl aber kann 260 14 Das Wasserstoffatom ~ mit dem Quadrat des Drehimpulses zugleich scharf jede Komponente von L sein, denn es gilt ~ 2 ] = [Lx , L2y ] + [Lx , L2z ] = i~(Ly Lz + Lz Ly ) − i~(Lz Ly + Ly Lz ) = 0 [Lx , L und insgesamt ~ 2 ] = [Ly , L ~ 2 ] = [Lz , L ~ 2] = 0 . [Lx , L (14.38) ~ 2 und, sagen wir, Suchen wir also die gemeinsamen Eigenfunktionen von L der z-Komponente Lz . Zweckmäßigerweise benutzen wir dabei Kugelkoordina~ allein durch die ten, denn bezüglich dieser hatten wir in 14.3 die Operatoren L Winkel θ und ϕ ausdrücken können. Demnach hängen auch die gesuchten Eigenfunktionen Y (θ, ϕ) nur von diesen Winkeln ab und nicht von der Radialkoordinate r. Allgemeinem Brauch entsprechend benennen wir die Eigenfunktionen und Eigenwerte wie folgt ~ 2 Ylm (θ, ϕ) = ~2 l(l + 1)Ylm (θ, ϕ) L Lz Ylm (θ, ϕ) = ~mYlm (θ, ϕ) . (14.39) Die Eigenwerte ~2 l(l + 1) und ~m sind reell, denn alle Komponenten Li und somit auch das Quadrat des Drehimpulses sind hermitesche Operatoren. Am einfachsten sehen wir das am Ausdruck (14.22) für die z-Komponente Lz = ~ ∂ . i ∂ϕ (14.40) Im Skalarprodukt zweier Wellenfunktionen Φ(r, θ, ϕ) und Ψ(r, θ, ϕ) wirkt Lz wie hΦ | Lz Ψi = Z∞ = Z∞ dr r 2 0 dr r 0 + Z∞ 0 2 Zπ 0 Z2π Zπ Z2π dθ sin θ dr r ~ ∂ Ψ(r, θ, ϕ) i ∂ϕ 0 dθ sin θ 0 0 2 dϕ Φ∗ (r, θ, ϕ) Zπ 0 dϕ µ ~ ∂ Φ(r, θ, ϕ) i ∂ϕ ¶∗ Ψ(r, θ, ϕ) µ ~ Φ∗ (r, θ, 2π) Ψ(r, θ, 2π) dθ sin θ i ∗ − Φ (r, θ, 0) Ψ(r, θ, 0) ¶ . (14.41) Da als Wellenfunktionen nur solche Funktionen Φ und Ψ zugelassen sind, die einem Raumpunkt ~x genau eine Wahrscheinlichkeitsdichte |Φ(~x)|2 bzw. |Ψ(~x)|2 zuweisen, haben in Kugelkoordinaten die erlaubten Wellenfunktionen entweder alle die Periodizität Φ(r, θ, ϕ) = Φ(r, θ, ϕ + 2π) (14.42) 14.5 Die Eigenwerte des Bahndrehimpulses 261 oder alle die Eigenschaft†) Φ(r, θ, ϕ+2π) = −Φ(r, θ, ϕ). Jedenfalls verschwinden die beiden Randterme in (14.41), und es folgt die Hermitezität von Lz , hΦ | Lz Ψi = hLz Φ | Ψi . (14.43) Da im vorliegenden Problem die z-Richtung nur durch ihren Namen vor der xund der y-Richtung ausgezeichnet ist, müssen auch Lx und Ly hermitesch sein. ~ 2. Ohne Rechnung ergibt sich dann auch die Hermitezität von L 2 2 ~ Die Eigenwerte von L und Lz , ~ l(l+1) bzw. ~m, sind nun als reell erkannt. Vom Eigenwert ~2 l(l + 1) sehen wir überdies schnell, dass er nicht negativ sein kann. Mit einer beliebigen Wellenfunktion Φ(~x) gilt nämlich wegen Li = L+ i ~ 2 Φi = hΦ | L2x Φi + hΦ | L2y Φi + hΦ | L2z Φi = hLx Φ | Lx Φi + · · · . hΦ | L (14.44) ~ 2 Φi für Als Summe von Integralen über nichtnegative Integranden kann hΦ | L keine Wahl von Φ negativ sein. Insbesondere auch nicht für Wellenfunktionen, deren Winkelanteil eine Eigenfunktion Ylm (θ, ϕ) ist. Ohne Beschränkung der Allgemeinheit kann also l als positiv angesehen werden. Zur weiteren Festlegung der Eigenwerte l und m sowie der Eigenfunktionen Ylm bedienen wir uns der Vertauschungsrelationen (14.37) und (14.38). Ihr Verständnis der folgenden Argumentation wird sicher befördert, wenn Sie die Analogie zu unserer Konstruktion der Energieeigenfunktionen des harmonischen Oszillators in 12.1 betrachten. Bequemlichkeitshalber führen wir zunächst die zueinander adjungierten Operatoren ½ ¾ ∂ ∂ ±iϕ L± = Lx ± iLy = ~ e ± (14.45) + i cot θ ∂θ ∂ϕ ein, die sich als den Erzeugungs- und Vernichtungsoperatoren a+ bzw. a beim Oszillator analog erweisen werden. Aus (14.37) und (14.38) ergeben sich für L± die Vertauschungsrelationen [Lz , L± ] = ±~L± , [L+ , L− ] = 2~Lz und ~ 2 , L± ] = 0 . [L (14.46) Ferner folgen aus (14.37) die Identitäten ~ 2 − Lz (Lz + ~) L− L+ = L ~ 2 − Lz (Lz − ~), L+ L− = L (14.47) die wir sofort ausschlachten. Offenbar kommutiert L− L+ ebenso wie L+ L− mit ~ 2 und Lz . Also haben beide Operatoren die Funktionen Ylm als EigenfunktioL nen, u. z. gilt £ ¤ L− L+ Ylm = ~2 l(l + 1) − m(m + 1) Ylm = ~2 (l − m)(l + m + 1)Ylm (14.48) †) Wir werden im nächsten Paragrafen letzteren Fall als unphysikalisch ausschließen können. 262 14 Das Wasserstoffatom und £ ¤ L+ L− Ylm = ~2 l(l + 1) − m(m − 1) Ylm = ~2 (l + m)(l − m + 1)Ylm . (14.49) Die hier auftretenden Eigenwerte können nicht negativ sein, denn da L+ und L− zueinander adjungiert sind, haben wir für eine beliebige Wellenfunktion Φ(r, θ, m) die Ungleichungen hΦ | L− L+ Φi = hL+ Φ | L+ Φi ≥ 0 und hΦ | L+ L− Φi = hL− Φ | L− Φi ≥ 0. Durch die Eigenschaften (l − m)(l + m + 1) ≥ 0 und (l + m)(l − m + 1) ≥ 0 (14.50) sind die möglichen Werte von m bei festem l eingeschränkt auf den Bereich −l ≤ m ≤ +l . (14.51) (Erinnern Sie sich an den harmonischen Oszillator? Wir hatten in 13.1 argumentiert, dass a+ a nichtnegative Eigenwerte hat, weil a und a+ zueinander adjungiert sind.) Nun überzeugen wir uns davon, dass mit Ylm auch L± Ylm Eigenfunktionen ~ 2 und Lz sind und zwar zu den respektiven Eigenwerten ~2 l(l + 1) und von L ~(m ± 1). Dazu müssen wir nur die Kommutatoren (14.46) bemühen: ~ 2 L± Ylm = L± L ~ 2 Ylm = ~2 l(l + 1)L± Ylm L Lz L± Ylm = ±~L± Ylm + L± Lz Ylm = ~(m ± 1)L± Ylm . (14.52) Durch mehrfache Multiplikation mit L+ und L− entstehen weitere Eigenfunktionen, Lz (L± )p Ylm = ~(m ± p)(L± )p Ylm mit p = 1, 2, 3, . . . (14.53) Beide so konstruierten Folgen müssen nach endlich vielen Gliedern abbrechen, damit der Eigenwert von Lz nicht das Intervall (14.51) verlässt. Beim wiederholten Anwenden von L+ bzw. L− müssen schließlich Funktionen Yl,max bzw. Yl,min entstehen mit den Eigenschaften L+ Yl,max = 0 (14.54) L− Yl,min = 0 . (14.55) und Wenn wir (14.54) mit L− multiplizieren und (14.55) mit L+ , so sehen wir nach Vergleich mit (14.48) bzw. (14.49), dass der größte Eigenwert von Lz durch max = +l (14.56) min = −l (14.57) und der kleinste durch gegeben ist. 14.6 Die Eigenfunktionen des Bahndrehimpulses 263 Über die möglichen Werte von l erhalten wir auch Aufschluss. Ausgehend von Yl,−l muss nämlich in einer ganzen Zahl p von Schritten mit (L+ )p Yl,−l eine Eigenfunktion von Lz mit dem größtmöglichen Eigenwert erreicht werden. Es gilt offenbar −l + p = l oder p = 2l mit p = 1, 2, 3, . . .. Zunächst scheinen dabei sowohl ganzzahlige wie halbzahlige Werte für l (und somit auch für m) erlaubt. Der Fall halbzahliger Werte für l und m wird sich jedoch gleich als unphysikalisch erweisen. (Zwar existieren in der Natur auch halbzahlige Drehimpulse, jedoch handelt es dabei nicht um Bahndrehimpulse, sondern um den noch zu diskutierenden Spin von Fermiteilchen wie Elektron, Proton etc.) 14.6 Die Eigenfunktionen des Bahndrehimpulses Die im letzten Paragrafen gewonnenen Eigenschaften der Eigenwerte l und m sowie der Eigenfunktionen Ylm beruhen ganz auf den Vertauschungsrelationen (14.37) und (14.38). Noch haben wir keinen Gebrauch davon gemacht, dass die ~ 2 Differentialoperatoren bezüglich der Winkel θ und ϕ sind. Letztere Li und L Tatsache machen wir uns jetzt zunutze, wenn wir die gesuchten Drehimpulseigenfunktionen Ylm (θ, ϕ) explizit konstruieren. Die ϕ-Abhängigkeit gewinnen wir aus (14.39) und (14.40), d. h. aus ~ ∂ Ylm (θ, ϕ) = ~mYlm (θ, ϕ) , i ∂ϕ (14.58) Ylm (θ, ϕ) ∼ eimϕ . (14.59) sofort als Die θ-Abhängigkeit besorgen wir uns zunächst für den Fall m = −l, d. h. für ~ 2 = ~2 l(l + 1) kleinstmögliche z-Komponente, Lz = −~l. Die die bei festem L Funktion Yl,−l = e−ilϕ fl (θ) gehorcht der Bedingung (14.55), also ¶ µ µ ¶ ∂ ∂ ∂ −ilϕ −ilϕ e fl (θ) = e − − + i cot θ + l cot θ fl (θ) = 0 . (14.60) ∂θ ∂ϕ ∂θ Als Lösung verifizieren Sie sofort fl (θ) = sinl θ. Insgesamt erhalten wir somit Yl,−l (θ, ϕ) = cl e−ilϕ sinl θ , (14.61) wobei cl eine durch Normierung festzulegende Integrationskonstante ist. Der Betrag von cl ergibt sich aus |cl | 2 Z2π 0 dϕ Zπ 0 © ª dθ sin θ sin2l θ = |cl |2 4π l!2l /(2l + 1)! = 1 . Für die beliebige Phase von cl hat sich die Konvention cl /|cl | = (−1)l eingebürgert. Damit ist p (2l + 1)! (14.62) cl = (−1)l √ 4π2l l! 264 14 Das Wasserstoffatom bestimmt. Schließlich finden wir gemäß (14.53) die Eigenfunktion Ylm (θ, ϕ) durch (l + m)-malige Multiplikation von Yl,−l mit dem Operator L+ , · µ ¶¸l+m ∂ ∂ e−ilϕ sinl θ . (14.63) Ylm (θ, ϕ) ∼ cl eiϕ + i cot ∂θ ∂ϕ Jetzt endlich können wir halbzahlige Werte für l und m ausschließen, indem wir nachrechnen, dass die explizit vorliegenden Eigenfunktionen für halbzahliges l gar nicht die aus (14.54) folgende Bedingung (L+ )2l+1 Yl,−l ∼ L+ Yl,l = 0 (14.64) erfüllen. Die Rechnung verläuft am einfachsten im Fall l = 1/2: µ ¶ ∂ ∂ 1/2 2 −iϕ/2 iϕ (L+ ) e sin θ = L+ ~e + i cot e−iϕ/2 sin1/2 θ ∂θ ∂ϕ ¶ µ 1 ∂ iϕ/2 + cot θ sin1/2 θ = L+ ~e ∂θ 2 = L+ ~eiϕ/2 cos θ sin−1/2 θ µ ¶ ∂ ∂ = ~2 eiϕ eiϕ/2 cos θ sin−1/2 θ + i cot θ ∂θ ∂ϕ µ ¶ ∂ 1 = ~2 ei3ϕ/2 − cot θ cos θ sin−1/2 θ ∂θ 2 = −~2 ei3ϕ/2 sin−3/2 θ 6= 0 . Für größere halbzahlige Werte von l führt die entsprechende Rechnung auch zum Widerspruch zu (14.64); sie vorzuführen, wäre ein unfreundlicher Akt, da sie länglich ist. Zu mehr Freude werden wir gleich Anlass haben, wenn wir die aus (14.63) bei halbzahligem l und m entstehenden Funktionen als nicht normierbar erkennen. Alle zulässigen Drehimpulseigenfunktionen Ylm (θ, ϕ) müssen normierbar sein durch die Forderung hYlm | Ylm i = Zπ 0 dθ sin θ Z2π 0 dϕ |Ylm (θ, ϕ)|2 = 1 , (14.65) 2 damit |Ylm | sin θ dθ dϕ als Wahrscheinlichkeitsverteilung für die Winkel θ und ϕ interpretierbar ist. Für die halbzahligen Werte l = 3/2, 5/2, . . . führt (14.63) jedoch zu divergierenden Normierungsintegralen. Am einfachsten sehen wir das, wenn wir für derartige l die Yll (θ, ϕ) in der Nähe von θ = 0 betrachten, wo sinl θ ≈ θ l und cot θ ≈ 1/θ gilt; es folgt für L+ Yl,−l ¶ µ i ∂ ∂ iϕ e−i/ϕ θl ∼ 2le−i(l−1)ϕ θl−1 (14.66) + L+ Yl,−l ∼ e ∂θ θ ∂ϕ und entsprechend (L+ )2 Yl,−l ∼ 22 l(l − 1)e−i(l−2)ϕ θl−2 (14.67) 14.6 Die Eigenfunktionen des Bahndrehimpulses 265 und so weiter. Bei halbzahligem l entsteht schließlich in Yll , als führender Term Yll ∼ (L+ )2 Yl,−l ∼ l(l − 1) . . . (−l + 1)(−l)eilϕ θ−l . (14.68) Im Skalarprodukt (14.65) verhält sich der Integrand in der Nähe von θ = 0 dann wie θ −2l+1 , so dass das Integral für l = 3/2, 5/2 etc. jedenfalls divergiert. Bei ganzzahligen Werten von l (und somit m) kann das eben beschriebene Unglück nicht passieren. Beachten Sie, dass die rechte Seite in (14.68) für jedes ganze l verschwindet. Die in (14.63) angegebenen Ylm sind außer für m = −l noch nicht auf Eins normiert. Um diese Normierung für alle m = −l, −l + 1, . . . , +l zu erreichen, benutzen wir ein einfaches Rekursionsargument. Stellen wir uns vor, Ylm sei schon so normiert und setzen an Yl,m+1 = cm L+ Ylm . (14.69) Die Konstante cm wählen wir so, dass auch Yl,m+1 gemäß (14.65) normiert ist. Für den Betrag von cm entsteht sofort die Forderung 1 = |cm |2 hL+ Ylm | L+ Ylm i = |cm |2 hYlm | L− L+ Ylm i = |cm |2 ~2 (l − m)(l + m + 1)hYlm | Ylm i = |cm |2 ~2 (l − m)(l + m + 1) , wobei ich (14.48) benutzt habe. Die Phase von cm bleibt dabei offen; es ist üblich, sie so festzusetzen, dass alle cm reell und positiv sind. Dann gilt p (14.70) L+ Ylm = ~ (l − m)(l + m + 1)Yl,m+1 und (14.63) kann präzisiert werden zu Ylm s p (2l + 1)! (l − m)! = (−1) √ l (l + m)!(2l)! 4π2 l! · µ ¶¸l+m ∂ ∂ · eiϕ e−ilϕ sinl θ . + i cot θ ∂θ ∂ϕ l (14.71) Die so bestimmten Ylm sind unter der Bezeichnung Kugelflächenfunktionen bekannt. Geschafft! Die Argumentation war ärgerlich langwierig, das Resultat ist aber einfach: Die Eigenwerte ~2 l(l + 1) des Drehimpulsquadrats sind durch die natürlichen Zahlen l = 0, 1, 2, . . . (14.72) festgelegt. Bei festem l, d. h. festem Drehimpulsquadrat, kann die z-Komponente Lz die (2l + 1) verschiedenen Eigenwerte ~m mit m = 0, ±1, ±2, . . . , ±l (14.73) 266 14 Das Wasserstoffatom annehmen. Die ersten paar Kugelflächenfunktionen Ylm lauten 1 Y00 = √ 4π r 3 Y10 = cos θ , 4π r 5 (3 cos2 θ − 1) , Y2,0 = 16π r 15 sin2 θ e±2iϕ . Y2,±2 = 32π (14.74) Y1,±1 = ± Y2,±1 = ± r r 3 ±iϕ e sin θ , 8π 15 sin θ cos θ e±iϕ , 8π Eine anschauliche graphische Darstellung ihrer θ-Abhängigkeit ergibt sich, wenn wir auf einen Radialstrahl in Richtung θ bezüglich der z-Achse |Ylm |2 auftragen (Abbildung 14.1): Abbildung 14.1 14.7 Das Radialproblem beim Coulombfeld Wir hatten uns klar gemacht, dass wir die Eigenfunktionen und Eigenwerte des Hamiltonoperators H=− 1 ~2 ~2 1 ∂ 2 ∂ 1 e2 r + L − 2m r2 ∂r ∂r 2mr2 4πε0 r (14.75) 14.7 Das Radialproblem beim Coulombfeld 267 durch den Produktansatz Φ(r, θ, ϕ) = R(r)Ylm (θ, ϕ) (14.76) erhalten. Zu bestimmen bleibt der Radialteil R(r) der Wellenfunktion aus µ 2 ¶ 2mE d 2 d l(l + 1) 1 2me2 R(r) = − 2 R(r) . + − + (14.77) 2 2 2 dr r dr r 4πε0 ~ r ~ Wir hatten ebenfalls gesehen, dass gebundene Zustände nur für negative Energien auftreten und für große r exponentiell abfallen ´ ³ p für r→∞. (14.78) R(r) ∼ exp −r −2mE/~2 Die Differentialgleichung (14.77) verschönert sich, wenn wir statt r die dimensionslose Variable p ρ = 2r −2mE/~2 (14.79) verwenden, zu · 2 d d2 + + 2 dρ ρ dρ µ λ l(l + 1) 1 − − ρ ρ2 4 ¶¸ R=0, (14.80) worin der zu bestimmende Energieeigenwert sich in dem dimensionslosen Parameter λ= 1 e2 p −m/2E 4πε0 ~ (14.81) versteckt hat. Da nun das asymptotische Verhalten für ρ → ∞ durch R → exp(−ρ/2) charakterisiert ist, liegt es nahe, die Amplitude R durch den Ansatz R = f (ρ) e−ρ/2 zu suchen. Für f (ρ) entsteht aus (14.80) die Differentialgleichung ¶ · ¸ µ λ − 1 l(l + 1) 2 − 1 f 0 (ρ) + − f (ρ) = 0 . f 00 (ρ) + ρ ρ ρ2 (14.82) (14.83) Wenn wir versuchen, diese Gleichung durch eine Potenzreihe zu befriedigen, X f (ρ) = Cν ρν , (14.84) ν so finden wir die Koeffizienten Cν durch (14.83) der folgenden Rekursionsformel unterworfen Cν = ν−λ Cν−1 . ν(ν + 1) − l(l + 1) (14.85) Eine Lösung, die zu einer normierbaren Amplitude R führt, ergibt sich durch folgende Überlegung. Ein Verschwinden des Nenners auf der rechten Seite ist ausgeschlossen für Reihen (14.84), die nur Glieder mit ν > l enthalten, also mit dem Glied xl 268 14 Das Wasserstoffatom beginnen. Im übrigen kann die Rekursionsformel (14.85) insofern Schrecken einflößen, als sie sich für ν → ∞ vereinfacht zu Cν ≈ Cν−1 /ν; sie lässt also eine Lösung zu, die sich für große ν wie Cν → 1/ν! verhält. Da die Glieder hoher Ordnung in ν das Verhalten der Reihe (14.84) für großePρ dominieren, ρν /ν! = e+ρ ; verhält sich die entsprechende Reihe asymptotisch wie f (ρ) → ν ein solches f (ρ) führt nach (14.82) zu einer nicht normierbaren Amplitude R und ist daher zu verwerfen. Nichts Besseres dürfen wir erwarten! Nur für spezielle Werte der Energie E, d. h. auch des Parameters λ können mit der Randbedingung der Normierbarkeit verträgliche Lösungen R entstehen. In der Tat, genau wenn λ ganzzahlig ist gemäß λ = n = l + 1, l + 2, l + 3, . . . (14.86) erlaubt (14.85) die endliche Folge endlicher Koeffizienten Cl , Cl+1 , . . . , Cn−1 , (14.87) während Cn und somit auch alle Cν mit ν > n verschwinden. Die zugehörige Radialamplitude Rnl = e−ρ/2 n−1 X cν ρν (14.88) ν=l ist offensichtlich normierbar. Das diskrete Spektrum der Energieeigenwerte ist durch (14.86) und (14.81) gegeben als Enl = − µ 1 4πε0 ¶2 me4 1 2~2 n2 (14.89) mit n = l + 1, l + 2, . . . und l = 0, 1, 2, . . .. Diese Energieniveaus sind in Abbildung 14.2 eingetragen. Die Darstellung macht sinnfällig, dass zur festen Drehimpulsquantenzahl l die Folge Enl mit den Hauptquantenzahlen n = l + 1, l + 2, . . . gehört, während bei festem n die Drehimpulsquantenzahlen l = 0, 1, . . . , n − 1 möglich sind. Das Bild erinnert Sie auch an die aus der Spektroskopie stammende Bezeichnung der l = 0, 1, 2, 3, . . .Zustände durch die Symbole s, p, d, f , . . .. Die niedrigste Energie, die Grundzustandsenergie, ist E10 = − µ 1 4πε0 ¶2 me4 ≈ −13, 6 eV . 2~2 (14.90) Um ein H-Atom aus dem Grundzustand heraus zu ionisieren, muss also mindestens eine Energie von 13, 6 eV aufgebracht werden. Beachten (und begründen) Sie den hier zu Tage tretenden Unterschied zur klassischen Bewegung im Coulombfeld; dort ergibt sich die niedrigste Energie E = −∞, wenn das Teilchen im Kraftzentrum ruht. Alle Energieniveaus des H-Atoms außer dem Grundzustandsniveau sind entartet. Bei fester Hauptquantenzahl n hängt Enl nämlich gar nicht mehr von 14.7 Das Radialproblem beim Coulombfeld 269 Abbildung 14.2 der Drehimpulsquantenzahl l ab. Zudem kann bei festem n und l die Orien” tierungsquantenzahl“ m noch die 2l + 1 verschiedenen Werte m = 0, ±1, . . . , ±l annehmen. Die Tatsache, dass die Energieniveaus Enl von m unabhängig sind, dass also alle Werte der z-Komponente des Drehimpulses energetisch gleichberechtigt sind, ist natürlich Ausdruck der Isotropie des Coulombpotentials. Die Zahl der unabhängigen Energieeigenfunktionen, die zum selben Eigenwert der Energie gehören, heißt Entartungsgrad des entsprechenden Niveaus. Da die Energiewerte zu den Wasserstoffeigenfunktionen Rnl (r)Ylm (θ, ϕ) (14.91) nur von der Hauptquantenzahl n abhängen, hat jedes dieser Niveaus den Entartungsgrad n−1 X (2l + 1) = n2 . (14.92) l=0 Unsere Resultate für die Energieeigenfunktionen des H-Atoms erlauben uns, nach der Größe des Wasserstoffatoms zu fragen. Nach (14.79), (14.92) und (14.89) fällt die Aufenthaltswahrscheinlichkeit |Rnl |2 als Funktion von der Radialkoordinate exponentiell ab auf dem Längenmaßstab anl = p 4πε0 ~2 ~2 /2m(−Enl ) = n. me2 (14.93) Diese Abklinglängen sind ganze Vielfache des so genannten Bohrschen Radius a = 4πε0 ~2 /me2 ≈ 0, 5 × 10−10 m = 0, 5 Å . (14.94) Der Durchmesser“ eines H-Atoms im Grundzustand hat also die Größenord” nung eines Angströms. 270 14 Das Wasserstoffatom Die ersten paar Radialamplituden des H-Atoms lauten, nach Normierung gemäß Z∞ 0 dr r 2 |Rnl |2 = 1 , (14.95) R10 = 2a−3/2 e−r/a ³ r ´ −r/2a e R20 = (2a)−3/2 2 − a r R21 = 3−1/2 (2a)−3/2 e−r/2a a ¶ µ r2 r −4 −l/2 −5/2 R30 = 3 · 3 a 54 − 36 + 4 2 e−r/3a a a ³ ´ r r R31 = 3−4 · 6−1/2 a−5/2 4 6− e−r/3a a a R32 = 3−4 · 30−1/2 a−5/2 4 (14.96) r2 −r/3a e . a2 Die zu verschwindendem Bahndrehimpuls l = 0 gehörigen unter ihnen sind in Abbildung 14.3 aufgezeichnet. Abbildung 14.3 14.8 Auswahlregeln Sie erinnern sich: Stabil, d. h. beliebig langlebig kann nur der Grundzustand eines Systems sein. Das Wasserstoffatom macht keine Ausnahme. Selbst wenn keine anderen Atome bei Stößen und auch kein von außen eingestrahltes elektromagnetisches Feld einem anfänglich angeregten H-Atom die Anregungsenergie abnehmen, wird der angeregte Zustand i. A. nicht beliebig lange erhalten bleiben; vielmehr wird das Atom i. A. unter Aussendung eines Lichtquants spontan in den Grundzustand zurückkehren. Die anfängliche atomare Anregungsenergie ∆E wird nach der Emission als 14.8 Die Auswahlregeln 271 Energie des Photons auftreten. Entsprechend ∆E = ~ω (14.97) gehört zu jeder Energiedifferenz ∆E zweier Niveaus eine charakteristische Frequenz ω. Sie wissen, dass diese Erklärung der Spektrallinien des H-Atoms einer der ersten großen Triumphe der Quantentheorie war. Nicht zu allen Paaren von Energieniveaus Enl , En0 l0 des Wasserstoffatoms werden Spektrallinien beobachtet. Erlaubt“, d. h. unter Laborbedingungen ” im infraroten bis ultravioletten Spektralbereich leicht beobachtbar sind nur Übergänge zwischen Zuständen Rnl Ylm und Rn0 l0 Yl0 m0 , bei denen sich die Bahndrehimpulsquantenzahl l und die Orientierungsquantenzahl m ändern gemäß den Auswahlregeln ∆l = ±1 und ∆m = 0 oder ± 1 . (14.98) Ich kann die Auswahlregeln hier nicht durch eine Rechnung begründen und auch nicht klarmachen, dass die entsprechenden Übergänge zu elektrischer Dipolstrahlung führen. Wohl aber will ich bemerken, dass in den Auswahlregeln (14.98) u. a. die Tatsache zum Ausdruck kommt, dass das abgestrahlte Photon einen Eigendrehimpuls, Spin genannt, der Größe J~2 = ~2 j(j + 1) mit j = 1 hat. Wie jeder quantenmechanische Drehimpuls kann die z-Komponente J z des Photonenspins nur die Werte (in Einheiten ~) −j, . . . , +j, d. h. −1, 0, +1 annehmen‡) . Der Gesamtdrehimpuls von Atom und elektromagnetischem Feld bleibt stets erhalten. Es muss sich bei der Emission eines Photons der Drehimpuls des Atoms genau um den Betrag ändern, den das abgestrahlte Photon fortträgt. Neben der gerade besprochenen Isotropie des Raums kommt in den Auswahlregeln noch eine weitere Symmetrie der Wechselwirkung zwischen geladenen Teilchen und dem elektromagnetischen Feld zum Ausdruck. Es handelt sich um die so genannte Paritätsinvarianz, die Sie sich wohl besser unter der Bezeichnung Spiegelsymmetrie merken. Sie besagt, dass zu jedem in der Natur vorkommenden elektromagnetischen Strahlungsprozess auch der räumlich gespiegelte Prozess auftritt. Diese Spiegelsymmetrie gilt übrigens auch für die Gravitation. Überzeugen Sie sich davon, dass z. B. die Newtonschen Bewegungsgleichungen (10.5) für einen Haufen gravitierender Teilchen invariant sind unter der Ersetzung jedes Ortsvektors ~xν durch −~xν . Verfallen Sie aber nicht dem Irrglauben, die bei Gravitation und Elektromagnetismus gegebene Spiegelsymmetrie sei eine selbstverständliche Eigenschaft der Natur. Beim β-Zerfall, also bei der schwachen Wechselwirkung, gilt die Spiegelsymmetrie nicht. Da ich nicht vorrechne, dass die Auswahlregeln (14.98) aus der Erfahrungstatsache folgen, dass die elektromagnetischen Wechselwirkung weder eine Raumrichtung auszeichnet, noch die Welt von ihrem Spiegelbild zu unterscheiden gestattet, kann ich ebenfalls nur berichten die Präzisierung, dass die Auswahlregeln (14.98) nur für die elektrische Dipolstrahlung gelten. In Spektralbereichen, in denen die Wellenlänge nicht sehr groß ist gegen den Atomdurchmesser, wird elektrische und magnetische Multipolstrahlung wichtig, für die andere Auswahlregeln gelten. Die Verletzung der Auswahlregeln (14.98) in solchen Prozessen ‡) Mit Hilfe der Eichinvarianz der Elektrodynamik lässt sich zeigen, dass dem Photon der Eigenwert Jz = 0 verboten ist. 272 14 Das Wasserstoffatom bedeutet übrigens nicht eine Verletzung der Isotropie und der Paritätsinvarianz der elektromagnetischen Wechselwirkung. Vielmehr macht sich bemerkbar, dass das abgestrahlte Photon dem Atom Drehimpuls entziehen kann sowohl vermöge seines Spins als auch in Form von Bahndrehimpuls. 14.9 Verwandte Zweikörpersysteme Ohne neue Rechnung können wir die für das H-Atom gewonnenen Resultate auf mehrere andere Systeme übertragen. Deuterium und Tritium unterscheiden sich vom Wasserstoff dadurch, dass die Atomkerne außer einem Proton zusätzlich ein bzw. zwei Neutronen enthalten. Die respektiven Kernmassen mD und mT sind etwa doppelt bzw. dreimal so groß wie die des H-Atoms. Die Kernmassen gehen in die Energieniveaus E nl nur über die reduzierte Masse der Relativbewegung ein. Wegen der Linearität der Energieniveaus (14.89) in m beträgt die relative Isotopenverschiebung der Energieniveaus ¯ ¯ ¯ δEnl ¯ δm ¯ ¯ (14.99) ¯ Enl ¯ = m , wobei δm die Änderung der reduzierten Masse von einem Isotop des Wasserstoffs zum anderen darstellt. Die Verschiebung (14.99) ist zwar klein (. 10−3 ), aber durchaus nachweisbar. Beim einfach ionisierten Helium oder doppelt ionisierten Lithium liegt auch die Isotopenverschiebung (14.99) vor. Eine gewichtigere Änderung des Energieniveauschemas rührt jedoch von der Erhöhung der Kernladung um den Faktor Z = 2 bzw. Z = 3 her. Die Energieniveaus (14.89) sinken dementsprechend tiefer, u. z. gemäß e2 → Ze2 auf Enl = − 1 Z 2 me4 1 . 4πε0 2~2 n2 (14.100) Offenbar ist das Elektron umso stärker gebunden, je größer die Kernladungszahl Z ist. Die Spektren der neutralen Alkaliatome Li, Na, K, Rb, Cs, Fr weisen eine gewisse Ähnlichkeit zum Wasserstoffspektrum auf. Der Grund dafür ist, dass in diesen Atomen ein Elektron, das so genannte Leuchtelektron, sehr viel schwächer gebunden ist als alle anderen; dem Leuchtelektron erscheint der Rest des Atoms dann als eine (fast) starre, kugelsymmetrische und einfach positiv geladene Einheit. Gewisse Anregungszustände in Halbleitern, die so genannten Exzitonen, zeigen Energieniveaus mit wasserstoffähnlicher Anordnung. Eine einfache Modellvorstellung für das Exziton besagt, dass ein aus seinem Normalzustand gehobenes Elektron an seinem ursprünglichen Ort ein effektiv positiv geladenes Loch“ ” hinterlässt. Sowohl das Loch wie das Elektron sind im Halbleiter beweglich. Beiden kann eine effektive Masse zugeschrieben werden, die allerdings von einem Halbleiter zum anderen verschieden ist und oft stark von der Masse des freien Elektrons abweicht. Wasserstoffähnliche Bindungszustände der beiden Teil” chen“ entstehen, wenn ihre Wechselwirkung von der Coulombschen Anziehung dominiert wird. Das Exziton ist übrigens nicht stabil. Nach einer mittleren Lebensdauer, die von Halbleiter zu Halbleiter verschieden ist, kehrt das Elektron 14.9 Verwandte Zweikörpersysteme 273 in seinen Normalzustand zurück. Dabei füllt es das von ihm selbst gerissene Loch, woraufhin das Exziton vernichtet ist. Die Anregungsenergie geht dabei i. A. in Licht oder/und Schall über. Für die Elementarteilchenphysik von hervorragendem Interesse ist das Positronium, in dem ein Elektron und ein Positron aneinander gebunden sind. Das Positron ist bis auf das Vorzeichen seiner elektrischen Ladung mit dem Elektron identisch und wird daher auch als das Antiteilchen des Elektrons bezeichnet. Das Positronium kann daher als eine leichtere Version des H-Atoms angesehen werden. Verschieden ist allerdings die reduzierte Masse der beiden Zweikörpersysteme. Beim Positronium beträgt sie m= mel · mel 1 = mel , mel + mel 2 (14.101) ist also nur etwa halb so groß wie beim Wasserstoff. Gemäß (14.94) hat das Positronium eine gegenüber dem H-Atom verdoppelte Ausdehnung, während die Energieniveaus ihre Beträge um den Faktor 1/2 verkleinern. Um zu prüfen, ob eine nichtrelativistische Behandlung des Positroniums möglich ist, schätzen wir die Geschwindigkeit der Relativbewegung mit der Unschärferelation ab. Die räumliche Lokalisierung auf apos = 2aH bedingt eine Impulsunschärfe ∆p ≈ ~/2aH ; nach Division durch die reduzierte Masse mpos ≈ 1 2 mH ergibt sich die Geschwindigkeitsunschärfe ∆v ≈ ~/mpos apos ≈ ~/mH aH . Genau wie beim H-Atom beträgt die typische Geschwindigkeit also einige tausend km/s, so dass die nichtrelativistische Behandlung im einen wie im anderen Fall gerade noch angemessen erscheint. Tatsächlich sind sowohl beim H-Atom wie beim Positronium relativistische Effekte trotz ihrer Kleinheit durchaus messbar. Einige dieser Effekte hängen damit zusammen, dass das Elektron, das Proton und das Positron außer den drei klassischen Freiheitsgraden, die den Ort eines Teilchens festlegen, noch einen zusätzlichen inneren Freiheitsgrad, den Spin, haben. Über diesen Spin wird später noch zu reden sein. Hier will ich eine andere und drastischere relativistische Eigenschaft des Positroniums erwähnen, seine Instabilität. Einige 10−6 s nach der Erzeugung ist kaum ein Positronium mehr intakt. Die Bestandteile, das Elektron und das Positron, vernichten sich gegenseitig und hinterlassen als Spur z. B. elektromagnetische Wellen. Da die Ruheenergie mel c2 des Elektrons und des Positrons je etwa 0, 5 MeV beträgt, tragen die beim Zerstrahlen des Positroniums in elektromagnetische Wellen entstehenden Photonen zusammen eine Energie von mindestens 1 MeV. Derart energiereiche Photonen sind Sie gewohnt, γ-Quanten zu nennen. Die derzeit meistdiskutierten wasserstoffähnlichen Zweikörpersysteme sind zwei kürzlich entdeckte Mesonen, das Charmonium (auch ψ-Meson oder J genannt, 1974 entdeckt) und das Bottomium (auch Y-Meson genannt, 1977 entdeckt). Viele Eigenschaften dieser Mesonen können erklärt werden durch die Annahme, dass beide aus je zwei Teilchen, so genannten Quarks, zusammengesetzt sind. Insbesondere stellt man sich unter dem Charmonium einen Bindungszustand des so genannten charmanten Quarks c und seines Antiteilchens c̄ vor. Beide Teilchen sind elektrisch geladen, u. z. betragen die Ladungen in Einheiten der Elektronenladung ec = −2/3 und ec̄ = +2/3 . (14.102) 274 14 Das Wasserstoffatom Die respektiven Massen sind nicht genau bekannt; indirekte Schlüsse legen jedoch nahe, dass das charmante Quark mehr als doppelt so schwer ist wie ein Proton mc c2 = mc̄ c2 ≈ 2 GeV (14.103) (wobei c2 = Quadrat der Lichtgeschwindigkeit). Sehr genau bekannt ist die Masse des Charmoniums, m2ψ = 3, 097 GeV . (14.104) Beachten Sie, dass das Charmonium deutlich leichter ist als zwei charmante Quarks. Der Massendefekt mψ − 2mc gibt bis auf den Faktor c2 die Bindungsenergie des ψ-Mesons. (Derartige Massendefekte sind ihnen aus der Kernphysik bekannt; die Masse des α-Teilchens ist kleiner als die Gesamtmasse je zweier freien Protonen und Neutronen; Sie erinnern sich, dass sich im Massendefekt die Einsteinsche Äquivalenz von Masse und Energie zeigt?) Die Verwandtschaft des ψ-Mesons mit dem Wasserstoffatom (für das YMeson gilt Ähnliches) besteht darin, dass die Bindung des charmanten Quarks c an sein Antiteilchen c̄ nichtrelativistisch, also durch Lösung einer Schrödingergleichung behandelt werden kann. Die in Rechnung zu stellende Wechselwirkungsenergie V (~xc , ~xc̄ ) ist zwar nicht genau bekannt, jedoch stellt sich heraus, dass V (~xc , ~xc̄ ) = V (r) = − α + βr, r r = |~xc − ~xc̄ | (14.105) die beobachteten Anregungsenergien des Charmoniums für geeignete Wahlen der positiven Parameter α und β vernünftig wiedergibt. Der erste Term in V , −α/r, enthält zwar die elektrostatische Anziehung der beiden Quarks; jedoch stellt diese nur eine völlig unerhebliche Korrektur an der starken Wechselwirkung dar, die den überwältigenden Beitrag zum Parameter α macht. Der zweite Term in V , βr, bringt den experimentellen Befund zum Ausdruck, dass Quarks bisher trotz angestrengter Suche nie als freie Teilchen beobachtet worden sind. Möglicherweise können Quarks gar nicht isoliert existieren. Jedenfalls verbietet der mit dem Abstand r unbegrenzt wachsende Anteil des Potentials (14.105), dass das fragliche Zweikörpersystem sich in seine beiden Bestandteile auflöst. Dass das ψ-Meson tatsächlich ein nichtrelativistischer Bindungszustand sein sollte, können wir uns durch die folgende Größenordnungsabschätzung für die Geschwindigkeit der Relativbewegung der beiden Quarks klarmachen. Die Lineardimension des Charmoniums sollte wie die aller stark wechselwirkenden beobachtbaren Teilchen (Proton, Neutron, andere Mesonen . . . ) die Größenordnung aψ ≈ 10−13 cm haben. Die Unschärferelation gibt dann als einen typischen Impuls pψ ≈ ~/aψ . Mit der Masse mψ aus (14.104) erhalten wir als typische Geschwindigkeit vψ /c ≈ ~c . 0, 1 , amψ c2 (14.106) also einen Wert, der die nichtrelativistische Behandlung der Relativbewegung der beiden Quarks gerade noch als nicht unsinnig erscheinen lässt. Kapitel 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen 15.1 Die Schrödingergleichung Für den Moment ohne Begründung, jedoch mit dem Versprechen, diese bald nachzuholen, stelle ich Ihnen hier die Schrödingergleichung eines Teilchens mit der Masse m und der Ladung q bei Anwesenheit eines beliebigen elektromagnetischen Feldes vor, i~ψ̇(~x, t) = Hψ(~x, t) ´2 1 ³ ~ x, t) + qϕ(~x, t) . p~ − q A(~ H= 2m (15.1) (15.2) ~ und ϕ das Vektorpotential bzw. das skalare Potential, die das Dabei sind A ~ und das Magnetfeld B ~ festlegen gemäß elektrische Feld E ~ − grad ϕ ~ =−∂A E ∂t ~ = rot A ~. B (15.3) Der Teilchenimpuls p~ ist wie bisher mit dem Differentialoperator p~ = (~/i)∇ zu identifizieren. Einen wichtigen Spezialfall haben wir im letzten Kapitel besprochen. Das elektrostatische Feld eines Atomkerns der Ladung e kann beschrieben werden durch ~ = 0, A ϕ= 1 e . 4πε0 r (15.4) Für q = −e mit e = Elementarladung entsteht dann aus (15.3) der Hamiltonoperator für die Bewegung des Elektrons im Wasserstoffatom. 275 276 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen Im Folgenden werden wir uns mit dem Einfluss eines räumlich und zeitlich ~ auf die Teilchenbewegung beschäftigen. Ein solches konstanten Magnetfeldes B Feld kann durch das Vektorpotential ~ × ~x ~ = 1B A 2 (15.5) festgelegt werden, wie Sie mit Hilfe von (15.3) leicht nachrechnen. Für diesen Fall lässt sich der Hamiltonoperator (15.2) in einer physikalisch durchsichtigeren Form aufschreiben. Beachten wir zu diesem Zweck, dass für das Vektorpotential (15.5) gilt 1 ∂(By z − Bz y) ∂Ax = = 0, ∂x 2 ∂x ∂Ay ∂Az = =0. ∂y ∂z (15.6) Es folgt, dass beim Ausmultiplizieren des Quadrats in (15.2) die Operatorpro~ · p~ und p~ · A ~ gleichgesetzt werden können, dukte A ¶ µ µ ¶ ~ = ~ ∂ Ax + ∂ Ay + ∂ Az = ~ ∂Ax + · · · p~ · A i ∂x ∂y ∂z i ∂x µ ¶ ∂ ~ ~ · p~ . Ax + + ··· = A (15.7) i ∂x Somit entsteht H= q2 ~ 2 q ~ p~2 + qϕ − A · p~ + A . 2m m 2m (15.8) ~ Mit Hilfe der zyklischen Invarianz des Spatprodukts, (B × ~x)~ p = (~x × p~) · B, erhalten wir schließlich H= ´2 p~2 q ~ ~ q2 ³ ~ + qϕ − L·B+ B × ~x . 2m 2m 8m (15.9) q ~ L. 2m (15.10) ~ enthaltende Term in (15.9) erlaubt eine anschauDer den Bahndrehimpuls L liche Deutung. Aus der klassischen Elektrodynamik (siehe 5. (5.64)) ist uns der ~ und dem magnetischen Moment Zusammenhang zwischen dem Drehimpuls L m ~ eines Ladungshaufens mit Masse m und Ladung q bekannt, m ~ = ~ klassisch die Einstellenergie eines magnetischen Ferner wissen wir, dass −m ~ ·B ~ angibt. Im quantenmechanischen Moments m ~ im konstanten Magnetfeld B ~ ~ Operatoren, jedoch bleibt der Kontext werden zwarL und somit m ~ wie −m ~ ·B ~ des Hamilfrühere Zusammenhang (15.10) erhalten, und der Anteil −m ~ ·B tonoperators bringt nach wie vor zum Ausdruck, dass die Parallelstellung des magnetischen Moments zum konstanten Magnetfeld energetisch bevorzugt ist ~ gegenüber allen anderen Orientierungen von m ~ zu B. Übrigens sind in vielen Experimenten mit Atomen in Magnetfeldern die Ma~ quadratische Effekte nicht beobachtet werden gnetfelder so klein, dass in B können. In solchen Fällen kann der letzte Term im Hamiltonoperator (15.9) 15.2 Die klassische Hamiltonfunktion 277 vernachlässigt werden. Machen Sie sich den Spaß, die Größenordnung des Magnetfeldes auszurechnen, für welche der letzte Term in (15.9) vergleichbar wird ~ ·B ~ mit der Einstellenergie (q/2mc)L Vor der Diskussion von Anwendungen will ich nun, wie versprochen, begründen, dass die Wechselwirkung von Ladungen mit elektromagnetischen Feldern durch den Hamiltonoperator (15.2) richtig beschrieben wird. Ein Exkurs in die klassische Physik wird dabei helfen. 15.2 Die klassische Hamiltonfunktion Ein klassisches Teilchen, das sich in einer Raumdimension bewegt und am Ort x die potenzielle Energie U (x) hat, gehorcht der Newtonschen Bewegungsgleichung mẍ = − dU (x) . dx (15.11) Diese Differentialgleichung zweiter Ordnung in der Zeit lässt sich ersetzen durch zwei Differentialgleichungen erster Ordnung für die Ortskoordinate x und den Impuls p, nämlich ẋ = 1 p, m ṗ = − dU . dx (15.12) Wir verschönern nun das Aussehen der letzteren Gleichungen, wenn wir in der 2 Energie E = m 2 ẋ + U (x) = E(ẋ, x) des Teilchens die Geschwindigkeit zu Gunsten des Impulses eliminieren, E(ẋ, x) → H(p, x) = 1 2 p + U (x) . 2m (15.13) Die so gewonnene Hamiltonfunktion H(p, x) hat offenbar die partiellen Ableitungen ∂H/∂x = dU/dx und ∂H/∂p = p/m und erlaubt daher, die Bewegungsgleichungen (15.12) in der Form ẋ = ∂H , ∂p ṗ = − ∂H ∂x (15.14) zu schreiben. Dies sind die so genannten Hamiltonschen Gleichungen. Für ein Teilchen, das sich in drei Raumdimensionen bewegen kann und die potenzielle Energie U (~x) hat, lautet die Hamiltonfunktion offensichtlich H= 1 2 p~ + U (~x) , 2m (15.15) während die Hamiltonschen Gleichungen (15.14) sich verallgemeinern zu ẋi = ∂H , ∂pi p˙i = − ∂H . ∂xi (15.16) Beachten Sie, dass der Übergang zur Quantenmechanik nun formal dadurch vollzogen werden kann, dass der klassische Impuls p~ in der Hamiltonfunktion durch den Differentialoperator (~/i)∇ ersetzt wird; die Hamiltonfunktion verwandelt sich dabei in den uns längst bekannten Hamiltonoperator. 278 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen Wenden wir uns nun einem klassischen geladenen Teilchen im elektromagnetischen Feld zu. Es erfährt dort die Lorentzkraft ´ ³ ~ + ~v × B ~ . (15.17) F~ = q E Zur Vorbereitung des Übergangs zur Quantenmechanik suchen wir zunächst eine Hamiltonfunktion H(~ p, ~x, t), die die Newtonsche Bewegungsgleichung ´ ³ ¨=q E ~ + ~v × B ~ (15.18) m~x als Hamiltonsche Gleichungen der Form (15.16) zu schreiben erlaubt. Da die Lorentzkraft (15.17) sich i. A. nicht als Gradient eines skalaren Feldes schreiben lässt (das geht nur im rein elektrostatischen Feld), kann die gesuchte Hamiltonfunktion nicht die Form (15.15) haben. Wir können jedoch leicht verifizieren, dass H= 1 ~ 2 + qϕ (~ p − q A) 2m (15.19) die gestellte Aufgabe löst, wenn das elektrische und das magnetische Feld wie ~ und ϕ festgelegt werden als üblich durch die Potentiale A ~ ~ = −∇ϕ − ∂ A E ∂t (15.20) ~ = rot A ~. B (15.21) Die zu (15.19) gehörigen Hamiltonschen Gleichungen lauten ẋi = 1 ∂H = (pi − qAi ) ∂pi m ṗi = − ∂H q ∂Aj ∂ϕ = + (pj − qAj ) −q ∂xi m ∂xi ∂xi = q ẋj (15.22) (15.23) ∂ϕ ∂Aj −q . ∂xi ∂xi Beachten Sie, dass ich Ihnen in (15.23) durch Verwendung von (15.22) sowie der Summenkonvention Bequemlichkeit verschafft habe. Bevor ich den Nachweis der Äquivalenz dieser Hamiltonschen Gleichungen zu der Newtonschen Gleichung (15.18) führe, ist eine Erläuterung am Platze. Sie dürfen den in der Hamiltonfunktion (15.19) und den Hamiltonschen Gleichungen (15.22) und (15.23) auftretenden Vektor p~ als ein Tripel von Hilfsgrößen ansehen, das zu nichts anderem nützt, als zur Überführung der Newtonschen Bewegungsgleichung (15.18) in ein System von Differentialgleichungen erster Ordnung in der Zeit. Ich will Ihnen diese Ansicht sogar nahe legen. Als Name für das fragliche Tripel p~ hat sich kanonischer Impuls eingebürgert. Wenn Sie diese Bezeichnung übernehmen und sich sogar der üblichen Schlamperei anschließen, das Epitheton kanonisch zu unterdrücken, so dürfen Sie doch nie vergessen, dass der kanonische Impuls eines geladenen Teilchens im elektromagnetischen Feld nicht gleich dem Produkt aus Masse und Geschwindigkeit des Teilchens ist. Vielmehr ist der Zusammenhang zwischen Geschwindigkeit und 15.2 Die klassische Hamiltonfunktion 279 kanonischem Impuls durch (15.22) gegeben; nur im Spezialfall verschwindenden Vektorpotentials reduziert derselbe sich auf p~ = m~v . Die vorstehende Erläuterung erschließt eine schöne Einsicht. Der erste Summand in der Hamiltonfunktion (15.19) stellt offenbar gerade die kinetische Energie 21 m~v 2 des Teilchens dar. In (15.19) kommt also insbesondere die altbekannte Tatsache zum Ausdruck, dass im rein magnetostatischen Feld, das durch ϕ = 0 beschrieben werden kann, die Energie eines geladenen Teilchens konstant bleibt. Da nämlich der magnetische Anteil der Lorentzkraft senkrecht auf der Teilchengeschwindigkeit steht, kann das Magnetfeld nur die Richtung von ~v ändern, nicht aber den Betrag der Geschwindigkeit und ebenso wenig die Energie E = 21 m~v 2 . Zum Nachweis der Äquivalenz der Hamiltonschen Gleichungen (15.22, 15.23) mit der Newtonschen Gleichung (15.18) differenzieren wir (15.22) nach der Zeit und eliminieren die rechts entstehende Zeitableitung des kanonischen Impulses mit Hilfe von (15.23). Wir finden dann mẍi = q ẋj ∂ϕ d ∂Aj −q − q Ai . ∂xi ∂xi dt (15.24) d d Beim Ausführen der Zeitableitung dt Ai = dt Ai (~x(t), t) müssen wir beachten, dass sich das Vektorpotential i. A. an einem festen Ort ~x zeitlich ändert; am Ort ~x(t) des Teilchens ist Ai (~x(t), t) zusätzlich zeitabhängig, wenn sich das Teilchen bewegt, wenn also ~x(t) sich zeitlich ändert. Schreiben wir ¯ ¯ ¯ ∂Ai (~x, t) ¯¯ d ∂ ¯ + ẋj Ai (~x(t), t) = Ai (~x, t)¯ dt ∂t ∂xj ¯~x=~x(t) ~ x=~ x(t) schlampig aber schön d dt Ai mẍi = −q µ = ∂ ∂t Ai (15.25) i + ẋj ∂A ∂xj , so ergibt sich aus (15.24) ∂ϕ ∂ − Ai ∂xi ∂t ¶ − q ẋj µ ∂Ai ∂Aj − ∂xj ∂xi ¶ . (15.26) Dies aber ist genau die Newtonsche Gleichung; der erste der beiden Summanden auf der rechten Seite ist nach (15.20) der elektrische Teil der Lorentzkraft; den zweiten Summanden erkennen wir als den magnetischen Anteil der Lorentzkraft, wenn wir bedenken µ ¶ ¶ µ ∂Ax ∂Ay ∂Ax ∂Az ~ ~ − vz (~v × B)x = (~v × rot A)x = vy − − ∂x ∂y ∂z ∂x µ µ µ ¶ ¶ ¶ ∂Ax ∂Ax ∂Ay ∂Ax ∂Az ∂Ax − − − = vx + vy + vz ∂x ∂x ∂x ∂y ∂x ∂z µ ¶ ∂Aj ∂Ax = vj − . (15.27) ∂x ∂xj Nachdem wir nun die klassische Hamiltonfunktion H(~ p, ~x, t) eines geladenen Teilchens im elektromagnetischen Feld gefunden haben, gewinnen wir den quantenmechanischen Hamiltonoperator, indem wir den kanonischen Impuls p~ durch den Differentialoperator (~/i)∇ ersetzen. Damit ist das Versprechen der Begründung des Hamiltonoperators (15.2) eingelöst. 280 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen 15.3 Klassische (nichtrelativistische) Bewegung im konstanten Magnetfeld Bevor wir das eben Gelernte auf die Quantenmechanik eines geladenen Teilchens im konstanten Magnetfeld anwenden, will ich Sie, zur Vorbereitung, an Altbekanntes erinnern: Ein klassisches geladenes Teilchen bewegt sich auf einer Spi~ B| ~ 2 ralbahn längs des Magnetfeldes; die Geschwindigkeitskomponente (~v · B)/| ~ längs des Feldes B bleibt konstant. In einem Koordinatensystem, bezüglich ~ = 0, vollführt das Teilchen eine gleichförmige Kreisbewegung in eidessen ~v · B ~ ner zu B senkrechten Ebene. Der Radius und die Mittelpunktskoordinaten der Kreisbahn hängen davon ab, wo und wie schnell das Teilchen in das Magnetfeld eingeschossen wird. Die Umlauffrequenz, die so genannte Zyklotronfrequenz, ω= ~ q |B| m (15.28) ist jedoch von den Anfangsbedingungen unabhängig, jedenfalls für nichtrelativistische Teilchen. Die eben getroffenen Aussagen über die Teilchenbahn im konstanten Magnetfeld sind ohne Rechnung aus der Bewegungsgleichung ¨ = q~x˙ × B ~ m~x (15.29) ~ wirkt, bleibt das Teilzu gewinnen. Da die Lorentzkraft senkrecht zum Feld B ~ chen längs B unbeschleunigt; da die Lorentzkraft auch senkrecht zur Teilchengeschwindigkeit ist, kann sie den Betrag von ~x˙ nicht ändern; folglich muss die Teilchenbahn, wenn sie in einer Ebene liegt, ein Kreis sein; dieser Kreis muss gleichförmig umlaufen werden, da der Betrag der Beschleunigung ¨| = |~x ~ |q| · |B| |~x˙ | = ω|~x˙ | m (15.30) ebenfalls zeitlich konstant bleibt (vgl. Abbildung 15.1). Abbildung 15.1 Sie werden die spätere quantenmechanische Behandlung des Problems mehr genießen, wenn wir das soeben ohne Rechnung Erkannte auch durch Lösung der 15.3 Klassische (nichtrelativistische) Bewegung im konstanten Magnetfeld 281 Hamiltonschen Gleichungen ẋi = ∂H , ∂pi ṗi = − ∂H , ∂xi H= 1 ~ 2 + qϕ (~ p − q A) 2m (15.31) erarbeiten. Dabei will ich die Richtung des Magnetfeldes als z-Richtung wählen, ~ = (0, 0, B) B (15.32) und die Potentiale durch Ax = −By, A y = Az = ϕ = 0 (15.33) festlegen. Letztere Wahl weicht zwar von der in 15.1 benutzten (s. (15.1)) ab, ist aber so gut wie diese, da sie das Magnetfeld (15.32) auch eindeutig festlegt. Sie wissen doch noch, dass die klassische Elektrodynamik eichinvariant ist, d. h. ~ x, t) und B(~ ~ x, t) eine ganze Klasse dass zu einem festen Paar von Feldern E(~ ~ gleichberechtigter Potentiale A und ϕ gehört (s.(6.36)). An der speziellen Eichung (15.33) haben wir insofern gleich Freude, als die entstehende Hamiltonfunktion H= 1 2 1 (px + qBy)2 + (p + p2z ) 2m 2m y (15.34) von den Koordinaten x und z unabhängig ist. Nach den Hamiltonschen Gleichungen bleiben somit die entsprechenden Komponenten des kanonischen Impulses zeitlich konstant ṗx = − ∂H =0 ∂x =⇒ px (t) = px (0) , (15.35) ṗz = − ∂H =0 ∂z =⇒ pz (t) = pz (0) . (15.36) Die restlichen vier Hamiltonschen Gleichungen lauten ṗz = − ∂H = −ωpx − mω 2 y ∂y (15.37) ẋ = ∂H 1 = px + ωy ∂px m (15.38) ẏ = 1 ∂H = py ∂py m (15.39) ż = ∂H 1 = pz . ∂pz m (15.40) Mit der zeitlichen Erhaltung von pz folgt aus (15.40) sofort, dass die Teilchenbewegung in z-Richtung gleichförmig verläuft z(t) = z(0) + ż(0)t . (15.41) Beachten Sie, dass die Bewegung in x-Richtung trotz der Erhaltung von px gemäß (15.38) komplizierter ist. In (15.38) kommt zum Ausdruck, dass der 282 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen kanonische Impuls i. A. nicht mit dem Produkt aus Masse und Geschwindigkeit übereinstimmt. Zur Diskussion der Bewegung in y-Richtung differenzieren wir (15.39) nach der Zeit und eliminieren mit (15.37) den kanonischen Impuls py , woraufhin wir die Bewegungsgleichung ÿ + ω 2 y = − ω px (0) m (15.42) erhalten. Diese beschreibt eine harmonische Schwingung mit der Frequenz ω um die Ruhelage y0 = −px (0)/mω . (15.43) Wenn wir die in der Lösung auftretenden Integrationskonstanten durch die Anfangslage y(0) und die Anfangsgeschwindigkeit ẏ(0) festlegen, beschreibt sich die Schwingung durch y(t) − y0 = (y(0) − y0 ) cos ωt + ẏ(0) sin ωt ω (15.44) Schließlich erhalten wir die Zeitabhängigkeit von x, indem wir in die Hamiltonschen Gleichung (15.38) die Lösung (15.44) eintragen und über die Zeit integrieren. Es ergibt sich die harmonische Schwingung x(t) − x0 = (y(0) − y0 ) sin ωt − ẏ(0) cos ωt ω (15.45) um den Mittelpunkt x0 = x(0) + ẏ(0) . ω (15.46) Offenbar liegen x(t) und y(t) auf einem Kreis in der x − y-Ebene. Sie sehen nun, wie der Radius £ ¤1/2 (y(0) − y0 )2 + ẏ(0)2 /ω 2 (15.47) und die Mittelpunktskoordinaten x0 und y0 von den Anfangsdaten abhängen. 15.4 Geladenes Quant im konstanten Magnetfeld Wir lösen nun die quantenmechanische Version des gerade besprochenen Problems. Der Hamiltonoperator 1 2 1 (px + qBy)2 + (p + p2z ) 2m 2m y 1 1 2 = (px + p2y + p2z ) + ωypx + mω 2 y 2 2m 2 H= (15.48) unterscheidet sich in der Form nicht von der klassischen Hamiltonfunktion (15.34), jedoch hat er in der Schrödingergleichung i~ψ̇ = Hψ (15.49) 15.4 Geladenes Quant im konstanten Magnetfeld 283 wegen p~ = (~/i)∇ die Bedeutung eines Differentialoperators. Da die Koordinaten x und z in H nicht vorkommen, kommutieren die Kom∂ ∂ ponenten px = (~/i) ∂x und pz = (~/i) ∂z des Impulsoperators mit H, [px , H] = [pz , H] = 0 . (15.50) Die im letzten Paragrafen gefundenen Erhaltungssätze (15.35) und (15.36) gelten also auch für die Quantenmechanik. Die Lösungen der Schrödingergleichung (15.49) können wir daher aus gemeinsamen Eigenfunktionen der Operatoren px , pz und H aufbauen. Da die Eigenfunktionen der Impulsoperatoren bekanntlich ebene Wellen sind, können wir für die Eigenlösungen von (15.49) das Produkt ψ(x, y, z, t) = eiEt/~ eikx x eikz z ψ(y) (15.51) ansetzen. Dabei sind ~kx , ~kx und E die respektiven Eigenwerte von px , pz und H. Für die Amplitude ψ(y) liefert (15.49) die gewöhnliche Differentialgleichung ¸ · 2 ~2 d 2 ~ω 1 ~ 2 2 2 2 (k + kz ) − + kx y + mω y ψ(y) = Eψ(y) . (15.52) 2m x 2m dy 2 ~ωkx y 2 Die Bewegung des Quants in y-Richtung hat wie die des entsprechenden klassischen Teilchens den Charakter einer harmonischen Schwingung der Frequenz ω um die Ruhelage y0 = −~kx /mω , (15.53) denn die Nullpunktverschiebung y 0 = y − y0 (15.54) lässt aus (15.52) die wohlbekannte Schrödingergleichung des harmonischen Oszillators entstehen ¸ µ ¶ · ~2 kz2 1 ~2 d 2 2 02 0 ψ(y 0 ) . (15.55) + mω y ψ(y ) = E − − 2m dy 0 2 2 2m Diese Differentialgleichung hat, wie wir wissen, normierbare Lösungen ψ(y 0 ) nur für diskrete Werte des Parameters E − ~2 kz2 /2m, u. z. gilt µ ¶ 1 E − ~2 kz2 /2m = ~ω n + mit n = 0, 1, 2, . . . . (15.56) 2 Die Energie des Quants im konstanten Magnetfeld ¶ µ 1 2 2 2 , En (kz ) = ~ kz /2m + ~ω n + 2 (15.57) hat also neben dem kontinuierlichen Anteil ~2 kz2 /2m einen diskreten Teil. Ersterer entspricht der freien Bewegung des Quants längs des Magnetfeldes, zweiterer ~ der gebundenen harmonischen Bewegung quer zu B. Der Eigenwert ~kx des Impulses px bestimmt wie (bei der klassischen Bewegung) die Gleichgewichtskoordinate y0 , geht jedoch nicht in die Energie ein. Folglich ist jeder Energieeigenwert En (kz2 ) unendlichfach entartet. Die Überlegungen dieses Paragrafen finden wichtige Anwendungen in der Festkörper- und insbesondere der Metallphysik. Der diskrete Anteil der Energie (15.57) ist dort unter der Bezeichnung Landauniveaus bekannt; er ist für viele magnetische Eigenschaften von Metallen bei tiefen Temperaturen verantwortlich. Schmökern Sie mal in den Festkörperbüchern. 284 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen 15.5 Eichinvarianz ~ und ϕ im Hamiltonoperator Das Auftreten der elektromagnetischen Potentiale A eines geladenen Teilchen muss uns zu ernster Beunruhigung Anlass geben, da die Potentiale selbst gar nicht messbar sind. Sie können sogar in gewissem Umfang beliebig verändert werden, ohne dass sich die messbaren Felder ~ = −A ~˙ − ∇ϕ E ~ = rot A ~ B (15.58) ~ invariant unter der Eichtransformation der ändern. Offenbar bleiben E und B Potentiale ~→A ~0 = A ~ + ∇χ A ϕ → ϕ0 = ϕ − χ̇ , (15.59) wobei χ(~x, t) ein beliebiges reelles skalares Feld sein darf. Von solchen Eichtransformationen unberührt bleibt übrigens auch die klassische Bewegungsgleichung eines geladenen Teilchens, ´ ³ ¨=q E ~ + ~v × B ~ , (15.60) m~x ~ und B ~ eindeutig festlegt. Die klassida die Lorentzkraft sich durch die Felder E sche Theorie der elektromagnetischen Wechselwirkung zwischen Ladungen und Feldern ist also, Sie wussten’s schon längst, eichinvariant. Ist aber auch die in 15.1 und 15.3 gegebene Quantentheorie für ein geladenes Teilchen im klassischen elektromagnetischen Feld eichinvariant? Anders gefragt, sind die in (15.4) berechneten Energiewerte En (kz ) objektive Eigenschaften des ~ und des geladenen Teilchens oder vielmehr nur Ausfluss unserer Magnetfeldes B ~ und ϕ? Letzterer Verdacht ist nicht leicht Willkür bei der Wahl der Potentiale A ~ und ϕ nach (15.59) umvon der Hand zu weisen, denn wenn die Potentiale A geeicht werden, ändert sich das Aussehen des Hamiltonoperators. Überzeugen ~ × ~x, ϕ = 0 und dann ~ = 1B Sie sich davon, indem Sie einmal die Eichung A 2 ~ = (−By, 0, 0), ϕ = 0 verwenden, um ein konstantes Magnetfeld die Eichung A ~ = (0, 0, B) zu repräsentieren. B Um die Abhängigkeit beobachtbarer Größen von der Eichung der Potentiale zu verhüten, müssen wir fordern, dass sich die Wellenfunktion ψ(~x, t) des Teilchens bei einer Eichtransformation (15.59) so ändert, dass die umgeeichte Schrödingergleichung " # ¶2 µ 1 ∂ 0 ~ 0 0 ~ i~ ψ (~x, t) = ∇ − qA + qϕ ψ 0 (~x, t) = H 0 ψ 0 (~x, t) (15.61) ∂t 2m i äquivalent ist zu der ursprünglichen, " # ¶2 µ 1 ~ ∂ ~ + qϕ ψ(~x, t) = Hψ(~x, t) . ∇ − qA i~ ψ(~x, t) = ∂t 2m i (15.62) 15.5 Eichinvarianz 285 Diese Forderung ist leicht erfüllt! Mit Hilfe der Produktregel der Differenziation bestätigen Sie leicht die Identitäten · ¸ ¶ µ ~ ~ iqχ/~ iqχ/~ ~ ~ ∇ − q A − q(∇χ) e =e ∇ − qA (15.63) i i µ ¶ ∂ iqχ/~ ∂ iqχ/~ i~ e i~ − q χ̇ =e (15.64) ∂t ∂t und lesen ab, dass ψ 0 (~x, t) = eiqχ/~ ψ(~x, t) (15.65) die Gleichung (15.61) befriedigt, wenn ψ(~x, t) eine Lösung von (15.62) ist. Nun beachten Sie, dass die Eichtransformation (15.65) mit reellem χ sich in der Multiplikation der Wellenfunktion ψ mit einem Phasenfaktor erschöpft. Eichinvariant ist also jedenfalls die Wahrscheinlichkeitsdichte für den Aufenthalt des Teilchens am Ort ~x zur Zeit t, |ψ 0 |2 = |ψ|2 . (15.66) Eichinvariant sind wegen (15.63) auch die Erwartungswerte von Funktionen des ~ Geschwindigkeitsoperators, (~ p − q A)/m, insbesondere also der kinetischen Energie, denn für eine beliebige Wellenfunktion ψ(~x, t) gilt Z Z ∗ ~ 0 )n ψ 0 = d3 x e−iqχ/~ ψ ∗ e+iqχ/~ (~ ~ nψ d3 x ψ 0 (~ p − qA p − q A) = Z ~ nψ d3 x ψ ∗ (~ p − q A) mit n = 1, 2, 3, . . . . (15.67) Auch die Eigenwerte des Hamiltonoperators sind, falls es überhaupt solche gibt, eichinvariant. Bedenken Sie nur, dass zeitunabhängige Eigenfunktionen und Eigenwerte gemäß HψE = EψE (15.68) nur existieren können, wenn H selbst zeitunabhängig ist, insbesondere müssen ~ und ϕ zeitunabhängig sein. Wird nun eiauch die in H eingehenden Potentiale A ne beliebige Eichtransformation mit einer auch zeitabhängigen Funktion χ(~x, t) ~ 0 und ϕ0 sowie die Wellenfunktion durchgeführt, so werden die Potentiale A 0 ψE (~x, t) = eiEt/~ eiqχ(~x,t)/~ ψE (~x) 0 ψE (15.69) 0 Eigenfunktion von H nicht im Sinn der zeitabhängig. Dementsprechend ist Gleichung (15.68), sondern im Sinn der Schrödingergleichung (15.61). Es gilt nämlich wegen (15.63) und (15.64) 0 H 0 ψ 0 = (E − χ̇) ψE ∂ 0 0 ψ = (E − χ̇) ψE . (15.70) ∂t E Unabhängig von der Eichung bleiben offensichtlich die möglichen Werte des Parameters E, d. h. die Energieeigenwerte. Die Beunruhigung, die ich Ihnen eingangs nahe gelegt habe, ist nun ausgeräumt. Alle physikalischen Aussagen der Quantentheorie für geladene Teilchen sind von der Eichung der elektromagnetischen Potentiale unabhängig. i~ 286 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen 15.6 Zeemaneffekt beim Wasserstoffatom (ohne Spin) Bei Anwesenheit eines konstanten Magnetfeldes ~ = (0, 0, B) B (15.71) und eines elektrischen Coulombfeldes können wir die elektromagnetischen Potentiale als ~ × ~x, ~ = −1B A 2 ϕ= 1 e 4πε0 r (15.72) wählen. Den Hamiltonoperator für die Relativbewegung im Wasserstoffatom, H= 2 1 ~ 2− 1 e , (~ p + eA) 2m 4πε0 r (15.73) hatten wir schon in15.1 für die Potentiale (15.72) schon zu H= 1 e2 e ~ ~ 1 2 p~ − + L·B 2m 4πε0 r 2m (15.74) ~ quadratische Teil vernachlässigt wurde. Drücken vereinfacht, wobei der in B ~ wir hier die Einstellenergie des magnetischen Dipolmoments im Magnetfeld B durch das Bohrsche Magneton µB = ~e 2m (15.75) aus und bezeichnen den Hamiltonoperator des Wasserstoffatoms im magnetfeldfreien Raum, p~2 /2m − e2 /r4πε0 , mit H0 , so lautet der hier zu untersuchende Operator 1 H = H 0 + µ B B Lz . ~ (15.76) Die Eigenfunktionen und Eigenwerte des Hamiltonoperators (15.74) erhalten wir ohne Mühe aus denen des ungestörten Operators H0 . Da nämlich, wie wir schon aus 14.5 wissen, die z-Komponente Lz des Bahndrehimpulses mit H0 vertauscht, sind die Eigenfunktionen zu H0 , H0 ψnlm = Enl ψnlm , (15.77) auch Eigenfunktionen zu H, Hψnlm = (Enl + µB Bm)ψnlm , m = 0, ±1, ±2, . . . , ±l . (15.78) Es haben also die (2l + 1) zu festem n und l gehörigen Eigenfunktionen ψnlm ~ zerstört die Isotropie des nicht mehr die gleichen Energien. Das Magnetfeld B Raumes und hebt die energetische Gleichberechtigung aller Einstellungen des 15.6 Zeemaneffekt beim Wasserstoffatom (ohne Spin) 287 Bahndrehimpulses auf. Die Aufhebung der Orientierungsentartung und die zu ~ proportionale Aufspaltung B Enl → Enlm = Enl + µB Bm (15.79) heißt normaler Zeemaneffekt. Für die niedrigsten Niveaus des H-Atoms mit den Drehimpulsquantenzahlen l = 0 und l = 1 lässt das Resultat (15.79) die in Abbildung 15.2 gezeigten Aufspaltungen erwarten: Abbildung 15.2 Insbesondere sollte das Grundzustandsniveau, da nach unserer bisherigen Erkenntnis nicht entartet, vom Magnetfeld unbeeinflusst bleiben und nicht aufspalten. Tatsächlich wird beim Wasserstoffatom ein komplizierteres Verhalten der Energieniveaus beobachtet (anomaler Zeemaneffekt). Schon das Grundzustandsniveau spaltet im Magnetfeld zwei Niveaus auf. Die Erklärung dieses Phänomens besprechen wir im folgenden Kapitel. 288 15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen Kapitel 16 Spin 16.1 Der Spin des Elektrons Gelegentlich habe ich schon angedeutet, dass der Zustand eines Elektrons nicht vollständig charakterisiert ist durch Angabe der Wahrscheinlichkeitsamplitude für den Aufenthalt beim Ort ~x. Wie viele andere Teilchen (Proton, Neutron, Muon, die Neutrinos etc.) hat das Elektron einen zusätzlichen Freiheitsgrad, den so genannten Spin. In diesem Freiheitsgrad offenbart sich ein wichtiger Unterschied des Quants Elektron von der klassischen Fiktion eines punktförmigen Teilchens. Die Bezeichnung Spin bringt zum Ausdruck, dass der fragliche Freiheitsgrad Drehimpulseigenschaften hat (denken Sie ans Spinnrad oder an to spin, was so viel heißt wie sich drehen). Der Drehimpulscharakter des Elektronenspins zeigt sich besonders sinnfällig beim anomalen Zeemaneffekt. Ein Magnetfeld sollte die (2j + 1)-fache Entartung eines Energieniveaus mit Drehimpulsquantenzahl j aufheben. Für das Grundzustandsniveau des Wasserstoffs ergibt sich eine zweifache Aufspaltung. Identifizieren wir 2 = 2j + 1 , (16.1) so folgt, dass die Drehimpulsquantenzahl j = 1/2 vorliegt. Jedoch kann der fragliche Drehimpuls nichts mit der Bahnbewegung des Elektrons zu tun haben, denn die Bahndrehimpulsquantenzahl l kann bekanntlich nur ganzzahlige Werte annehmen und außerdem ist die Grundzustandswellenfunktion ψ100 (r) zweifelsohne kugelsymmetrisch, d. h. hat die Bahndrehimpulsquantenzahl l = 0. Ein zweites berühmtes Experiment, in dem sich das Elektron als mit einem Spin ausgestattet erweist, ist der Stern-Gerlach-Versuch. Entsprechend dem skizzierten Schema wird in derartigen Versuchen ein Strahl von Atomen durch ein quer zum Strahl laufendes räumlich inhomogenes Magnetfeld geschickt und anschließend auf einem Schirm registriert (Abbildung 16.1). Für Atome mit der Drehimpulsquantenzahl j erwarten wir dabei folgendes Verhalten. Relativ ~ x) hat der Drehimpuls (2j +1) energetisch verschiedene Einzum Magnetfeld B(~ stellmöglichkeiten; diese sollten, wenn viele Atome im Strahl laufen, alle gleich häufig vorkommen, sofern nur die Quelle des Strahls keine Orientierung bevorzugt. Das mit dem Drehimpuls verbundene magnetische Moment m ~ hat dann ebenfalls (2j + 1) verschiedene Komponenten in Feldrichtung. Nach 5.9 erfah289 290 16 Spin Abbildung 16.1 ~ x) im inhomogenen Magnetfeld ren Atome mit verschiedenen Werten von m ~ · B(~ verschiedene Kräfte, ³ ´ ~ x) . F~ = grad m ~ · B(~ (16.2) Es sollte also der Atomstrahl in (2j + 1) verschiedene untereinander gleich intensive Teilstrahlen aufspalten. Für wasserstoffähnliche Atome, bei denen ein Leuchtelektron eine räumliche kugelsymmetrische Wellenfunktion ohne Bahndrehimpuls besitzt (z. B. Li), wird eine Aufspaltung in zwei Teilstrahlen beobachtet. Wieder wird mit 2j + 1 = 2 auf die Drehimpulsquantenzahl j = 1/2 geschlossen. Um den Zustand eines Elektrons vollständig zu spezifizieren, müssen wir die beiden Einstellmöglichkeiten des Spins bezüglich einer beliebig wählbaren Richtung (etwa der z-Richtung) berücksichtigen und zwei Wahrscheinlichkeitsamplituden ψ± (~x, t) angeben. Die Funktionen ψ+ (~x, t) und ψ− (~x, t) sind die Amplituden dafür, das Elektron zur Zeit t beim Ort ~x mit der Spinkomponente +~/2 bzw. −~/2 längs der Bezugsrichtung zu finden. Es ist zweckmäßig, den Zustand des Elektrons durch den zweikomponentigen Zustandsvektor à ! ! à ! à 0 1 ψ+ (~x, t) (16.3) + ψ− (~x, t) = ψ+ (~x, t) ψ(~x, t) = 1 0 ψ− (~x, t) zu beschreiben. Die beiden hier auftretenden zweikomponentigen Einheitsvektoren und à ! à ! 1 0 χ+ = und χ− = (16.4) 0 1 geben, für sich allein, keine Auskunft über den Ort des Elektrons, wohl aber erschöpfende Auskunft über die Spinkomponente längs der Bezugsrichtung: sie beträgt +~/2 für χ+ und −~/2 für χ− . Wie jedem Drehimpuls ist dem Spin ein Operatortripel zugeordnet, das wir mit ~ = (Sx , Sy , Sz ) S (16.5) 16.1 Der Spin des Elektrons 291 bezeichnen. Die Komponenten Si müssen die Drehimpulsvertauschungsrelationen [Sx , Sy ] = i~Sz , [Sy , Sz ] = i~Sx , [Sz , Sx ] = i~Sy (16.6) und ~ 2 , Si ] = 0 [S (16.7) ~ 2 liegt beim Elektron fest als befriedigen. Der Eigenwert des Spinquadrats S 2 2 ~ j(j + 1) = 3~ /4. Es müssen also die Vektoren (16.4) beide Eigenvektoren zu ~ 2 sein, S ~ 2 χ ± = 3 ~2 χ ± . (16.8) S 4 Wenn wir ohne Verlust an Allgemeinheit die Bezugsrichtung, längs derer die Vektoren (16.4) die Spinkomponente festlegen, als die z-Richtung wählen, so müssen diese Vektoren die 2j + 1 = 2 Eigenvektoren von Sz sein, à ! à ! à ! à ! 0 1 ~ 0 ~ 1 und Sz . (16.9) Sz =− =+ 2 0 2 1 1 0 ~ 2 und Sz , die den VertauschungsSie erinnern sich doch, dass Operatoren S relationen (16.6) und (16.7) genügen, Eigenwerte ~2 j(j + 1) bzw. ~m mit m = −j, −j + 1, . . . haben, wobei j ganz- oder halbzahlig sein darf. Wir hatten in 14.6 aus der Zusatzforderung, dass die Bahndrehimpulseigenfunktionen die Winkelabhängigkeit der räumlichen Wellenfunktion geben muss, geschlossen, dass beim Bahndrehimpuls nur ganzzahlige Werte der Quantenzahlen j und m möglich sind. Im Spin des Elektrons haben wir nun einen Drehimpuls kennengelernt, dessen Eigenwerte durch j = 12 und m = ± 21 festgelegt sind. Wir können aus 14.5 alle Überlegungen übernehmen, die auf den Drehimpulsvertauschungsrelationen aufbauen. Insbesondere wissen wir schon, dass wir die beiden Operatoren S± = Sx ± iSy (16.10) benutzen können, um aus einem Eigenvektor von Sz alle anderen, d. h. hier den zweiten zu konstruieren. Wegen [Sz , S± ] = ±~S± (16.11) muss z. B. S+ χ− ein Eigenvektor von Sz mit Eigenwert (− 21 + 1)~ = + 21 ~ sein (vgl. (14.52)), der dann bis auf einen Normierungsfaktor mit χ+ übereinstimmen muss, à ! à ! 1 1 S+ . (16.12) = const 0 0 Den Normierungsfaktor hatten wir in (14.70) für beliebige Werte von j und m schon festgelegt. Mit j = 1/2, m = −1/2 ergibt sich const = ~, also à ! à ! 1 1 . (16.13) =~ S+ 0 0 292 16 Spin Ebenso ist schon erwiesen, dass der Operator S− den Eigenvektor von Sz zum Eigenwert +~/2 überführt in einen Eigenvektor von Sz zum Eigenwert −~/2. Die frühere Normierungsbedingung und Phasenkonvention legen fest à ! à ! 0 0 S− (16.14) =~ 1 1 Insofern die Spinoperatoren auf zweikomponentige Vektoren wirken, müssen sie sich durch 2 × 2-Matrizen darstellen lassen. Tatsächlich folgt aus (16.9) à ! 0 ~ 1 Sz = , (16.15) 2 0 −1 aus (16.13) S+ = ~ à 0 1 0 0 S− = ~ à 0 0 1 0 ! (16.16) und aus (16.14) ! . Für Sx und Sy erhalten wir schließlich aus (16.10) die Matrizen à ! à ! ~ 0 −i ~ 0 1 und Sy = . Sx = 2 1 0 2 i 0 (16.17) (16.18) Dass alles schön zusammenpasst, sehen wir, wenn wir aus (16.15) und (16.18) ~ 2 = S 2 + S 2 + S 2 erstellen; die Matrix für S x y z (à à ! à ! ! à !) 1 0 1 0 1 0 1 0 1 3 ~ 2 = ~2 + . (16.19) S + = ~2 4 4 0 1 0 1 0 1 0 1 ~ 2 auf die Spinvektoren (16.4) wie das (3~2 /4)-fache Wie es sein muss, wirkt S der Einheitsmatrix. 16.2 Das magnetische Moment von Teilchen mit Spin Wir hatten uns klar gemacht, dass Teilchen mit der Ladung q, der Masse m und ~ ein magnetisches Moment dem Bahndrehimpuls L m ~ Bahn = q ~ L 2m (16.20) tragen. Den Betrachtungen des letzten Paragrafen lag andererseits die Auffassung zugrunde, dass der Spin ähnlich wie der Bahndrehimpuls zum magnetischen Moment beitragen muss. Tatsächlich besteht der experimentelle Befund 16.3 Der anomale Zeemaneffekt beim H-Atom 1 2 (also Elektron, Muon, Proton, q ~ S, 2m (16.21) für alle bekannten geladenen Teilchen mit Spin . . .) m ~ Spin = g 293 wobei der numerische Faktor g von Teilchen zu Teilchen verschieden ist. Für das Elektron hat g einen nahe bei 2 liegenden Wert, der in der Quantenelektrodynamik berechnet werden kann als Potenzreihe in der Sommerfeldschen Feinstrukturkonstanten α= 1 e2 1 ≈ . 4πε0 ~c 137 (16.22) Die Berechnung des Gliedes erster Ordnung in 1 gel = 2 + α + O(α2 ) = 2, 00232 2 (16.23) durch J. Schwinger (1949) war einer der ersten Triumphe der modernen Quantenelektrodynamik. Beim Proton gilt empirisch gproton ≈ 5, 59. Beachten Sie, dass das magnetische Moment des Protons sehr viel kleiner ist als das des Elektrons, da die Protonenmasse die Elektronenmasse um einen Faktor der Größenordnung 2000 überwiegt. Demgemäß kann sich im Stern-Gerlach-Versuch mit Wasserstoffatomen der Protonenspin gegenüber dem Elektronenspin kaum bemerkbar machen. Im Auftreten des Faktors g im Spinbeitrag zum magnetischen Moment zeigt sich, wie oben schon in der Halbzahligkeit der Spinquantenzahlen des Elektrons, die nichtklassische Natur des Spins. Eine wichtige Konsequenz ist, dass der Gesamtdrehimpuls ~ +S ~ J~ = L (16.24) nicht notwendig parallel zum gesamten magnetischen Moment m ~ = q ~ ~ (L + g S) 2m (16.25) des Teilchens ist. 16.3 Der anomale Zeemaneffekt beim H-Atom Diskutieren wir nun das Verhalten des H-Atoms im konstanten Magnetfeld unter Berücksichtigung des Elektronenspins. Der in Rechnung zu stellende Hamiltonoperator (e = Elementarladung) H= 2 1 ~ 2 − 1 e + ge B ~ ·S ~ (~ p + eA) 2m 4πε0 r 2m (16.26) unterscheidet sich nur um die Einstellenergie des magnetischen Moments des ~ Elektronenspins im Feld B, ~ ·S ~ = gµB 1 B ~ ·S ~ ~ = ge B m ~ spin · B 2m ~ (16.27) 294 16 Spin von dem in 15.6 behandelten∗) . Wählen wir wieder ~ = (0, 0, B) B ~ = 1B ~ × ~x , A 2 (16.28) ~ quadratischen Teil des Hamiltonoperators und vernachlässigen den in B H= 1 e2 1 1 2 p~ − + µB B (Lz + gSz ) . 2m 4πε0 r ~ (16.29) Das Aufsuchen der Eigenfunktionen und Eigenwerte dieses Hamiltonoperators bereitet keinerlei Schwierigkeit, wenn wir nur beachten, dass die Spinoperatoren Si , da auf einen inneren Freiheitsgrad des Elektrons wirkend, mit allen auf die Ortskoordinaten wirkenden Operatoren wie pi , Li und xi kommutieren. Insbesondere gilt ~ 2 ] = [Sz , H] = 0 , [Sz , Lz ] = [Sz , L (16.30) ~ 2 und H gemeinsame Eigenfunktionen haben. so dass die Operatoren Sz , Lz , L ~ 2 und zum spinunabhängigen Nun sind uns sowohl die Eigenfunktionen zu Lz , L Teil von H bekannt als Rnl (r) Ylm (θ, ϕ) , wie auch die Eigenvektoren von Sz , à ! 1 und χ+ = 0 χ− = (16.31) à ! 0 1 , (16.32) so dass wir die Eigenlösungen Ψ von HΨ = EΨ (16.33) durch bloßes Zusammensetzen finden, Ψnlm,± = Rnl (r) Ylm (θ, ϕ) χ± . Die zugehörigen Eigenwerte der Energie lauten ³ g´ Enlm,± = Enl + µB B m ± , 2 (16.34) (16.35) wobei wie üblich n = 1, 2, 3, . . ., l = 0, 1, . . . , n − 1 und m = 0, ±1, . . . , ±l . Abbildung 16.2 zeigt die entsprechende Niveauaufspaltung für die niedrigsten Niveaus des H-Atoms: Sie lesen ab, dass nun die Aufspaltung der Grundzustandsenergie in zwei Niveaus richtig wiedergegeben ist. Die p-Niveaus spalten streng genommen in 6 Unterniveaus auf, jedoch bleibt wegen g ≈ 2 ein Niveau praktisch doppelt entartet. ∗) Nachdem die reduzierte Masse m nun im Bohrschen Magneton absorbiert ist, kann im Folgenden der Buchstabe m wieder zur Bezeichnung der Orientierungsquantenzahl des Bahndrehimpulses verwendet werden. 16.3 Der anomale Zeemaneffekt beim H-Atom Abbildung 16.2 295 296 16 Spin Kapitel 17 Grundbegriffe der Statistik 17.1 Wahrscheinlichkeit von Ereignissen Die statistische Behandlung eines Systems (Würfel, Lotto, mit Gas gefüllter Behälter, . . .) erfordert zur mathematischen Grundlegung wie zur experimentellen Verifizierung eine vielfache Reproduktion des Systems bei gleichbleibender Präparationsvorschrift. Statistische Aussagen besagen i. A. nichts über das Verhalten eines einzelnen Systems, sondern beziehen sich auf Gesamtheiten (Ensembles) vieler gleichartig präparierter Systeme. In einer Gesamtheit von N Systemen hat ein Ereignis i die relative Häufigkeit Ni /N , wenn es bei genau Ni der N Systeme auftritt. Im Grenzfall einer großen Gesamtheit nennen wir diese relative Häufigkeit auch die Wahrscheinlichkeit wi des Ereignisses i, Ni . N →∞ N wi = lim (17.1) Sie verdeutlichen sich die Natur von Wahrscheinlichkeitsaussagen leicht am Beispiel eines ungezinkten Würfels. Der Ausgang eines einzelnen Wurfes lässt sich nicht vorhersagen. Unter einer großen Anzahl von Würfen erwarten Sie jedoch die Fünf auf der oberen Fläche mit der relativen Häufigkeit 1/6. Sie finden diese Erwartung im Spiel mit um so größerer Genauigkeit erfüllt, je öfter Sie insgesamt würfeln. Seien i und j zwei sich gegenseitig ausschließende Ereignisse, die im Ensemble mit den Wahrscheinlichkeiten wi bzw. wj auftreten. Dann hat die Wahrscheinlichkeit, an einem System entweder das Ereignis i oder das Ereignis j zu finden, den Wert wi∪j = wi + wj . (entweder-oder-Regel) (17.2) Zum Beispiel finden Sie beim Würfeln entweder die Eins oder die Fünf mit der Wahrscheinlichkeit w = 1/6 + 1/6 = 1/3. Wenn i und j zwei verschiedene Eigenschaften eines Systems sind, die unabhängig voneinander auftreten können und einzeln mit den Wahrscheinlichkeiten wi bzw. wj realisiert sind, so stellen sie sich zusammen mit der Wahrscheinlichkeit wi∩j = wi · wj (sowohl-als-auch-Regel) 297 (17.3) 298 17 Grundbegriffe der Statistik ein. Würfeln Sie etwa mit einem roten und einem blauen Würfel zugleich, so ergibt sich für das Ereignispaar rote Fünf und blaue Drei die Wahrscheinlichkeit w = 1/36 und für das Ereignispaar fünf und drei w = 1/18. 17.2 Diskrete eindimensionale Zufallsbewegung Auf einem linearen Gitter äquidistanter Punkte hüpfe ein Teilchen mit den Wahrscheinlichkeiten p und (1 − p) zum rechten bzw. zum linken Nachbarplatz. Aufeinander folgende Sprünge seien voneinander unabhängig. Berechnen wir die Wahrscheinlichkeit dafür, dass das Teilchen von insgesamt N Sprüngen genau n nach rechts, also N − n nach links macht. Mit der gleichen Wahrscheinlichkeit finden Sie (i) beim N -maligen Wurf einer Münze n mal Wappen, (ii) unter N Spin- 21 Systemen n Spins in die positive z-Richtung ( nach oben“) und N − n ” in die entgegengesetzte Richtung ( nach unten“) orientiert, (iii) n von N freien ” Atomen in der linken Hälfte des ihnen zugänglichen Gesamtvolumens, etc. Schauen wir auf das Beispiel der Spins. Nach der sowohl-als-auch Regel (17.3) zeigen n ganz bestimmte Spins nach oben und alle anderen nach unten mit der Wahrscheinlichkeit pn (1 − p)N −n . Irgendeiner (statt ein bestimmter) der insgesamt möglichen N !/n!(N − n)! Sätze von n aus N Spins ist gemäß (17.2) nach oben orientiert mit der Wahrscheinlichkeit (entweder-oder) µ ¶ N! n N −n N n N −n = p (1 − p) WN (n) = p (1 − p) . (17.4) n!(N − n)! n Diese so genannte Binomialverteilung ist in Abbildung 17.1 für den Fall p = 1/2, N = 20 aufgemalt. 0.1 0 10 20 Abbildung 17.1 Der binomische Lehrsatz, N X n N −n p q n=0 µ ¶ N = (p + q)N , n (17.5) lässt Sie sofort erkennen, dass die Verteilung (17.4) richtig normiert ist, N X n=0 WN (n) = 1 . (17.6) 17.3 Die Binomialverteilung für große N 299 Er hilft auch bei der Berechnung der so genannten Momente, d. h. der Mittelwerte von ganzzahligen Potenzen der Zufallsvariablen n, " " µ ¶# µ ¶# X X µ ∂ ¶ν N N pn q N −n hnν i = nν pn q N −n = p ∂p n n n n q=1−p q=1−p ¶ν ¸ ·µ ∂ . = p (p + q)N ∂p q=1−p (17.7) Wir folgern für die ersten beiden Momente hni = N p, hn2 i = N 2 p2 + N p(1 − p) (17.8) und somit für die mittlere quadratische Schwankung h(∆n)2 i ≡ hn2 i − hni2 = N p(1 − p) . (17.9) Bemerkenswerterweise wächst h(∆n)2 i nur linear mit N , während sowohl hn i wie hni2 in N quadratisch sind. Die relative Streuung von n, r 1−p 1 p 1 2 Str(n) ≡ , (17.10) h(∆n) i = hni hni Np √ geht daher für N → ∞ nach Null wie 1/ N . Offenbar konzentriert sich die Binomialverteilung WN (n) umso schärfer um den Mittelwert hni , je größer N ist. Für’s Münzenwerfen ziehen Sie die Folgerung, dass (i) Zahl und Wappen im Mittel über viele Serien von je N Würfen gleich oft erscheinen und (ii) relativ große Differenzen der Zahlen der beiden Ereignisse umso seltener auftreten, je größer N ist. Zurück zum hüpfenden Teilchen! Nach N Schritten der Schrittlänge (Gitterkonstante) a hat es sich zum Ausgangspunkt um die Strecke x = na − (N − n)a entfernt, im Mittel über viele Beobachtungen also um 2 hxi = (2hni − N )a = N a(2p − 1) . (17.11) Bei gleicher Wahrscheinlichkeit für beide Hüpfrichtungen, also für p = 21 , kommt das Teilchen im Mittel nicht vom Fleck. Seine Lokalisierbarkeit nimmt mit wachsendem N jedoch ab, da die Streuung seiner Entfernung vom Ausgangspunkt, √ £­ ®¤1/2 (17.12) Str(x) = (x − hxi)2 =a N mit N anwächst. 17.3 Die Binomialverteilung für große N Wir hatten schon gesehen, dass die Binomialverteilung (17.4) bei großen Werten von N nur für solche Werte der Zufallsvariablen n deutlich von Null verschieden sein kann, die relativ nahe beim Mittelwert hni = N p liegen. Es lohnt sich, diese Erkenntnis zu vertiefen und den Verlauf von WN (n) für n nahe beim Maximum im Grenzfall N → ∞ genauer zu studieren. 300 17 Grundbegriffe der Statistik Für die zur Debatte stehenden Werte von n und N können alle in (17.4) auftretenden Fakultäten mit der Stirlingschen Formel √ ν! ≈ 2πνν ν e−ν (17.13) approximiert werden. Daraufhin nimmt die Binomialverteilung die Form WN (n) = · N 2πn(N − n) ¸1/2 NN ³ p ´n µ 1 − p ¶N −n n N −n (17.14) an. Zur weiteren Vereinfachung für n ≈ hni = N p beachten wir, dass die rechte Seite von (17.14) auch für nichtganzzahlige Werte von n definiert ist. Sie hat, als Funktion der reellen Variablen n, ein Maximum an der Stelle n̂ = pN = hni . (17.15) Der Wert des Maximums lässt sich durch die in (17.9) gegebene mittlere quadratische Schwankung von n ausdrücken, Ŵ = [2πp(1 − p)N ] −1/2 £ ¤−1/2 = 2πh(∆n)2 i . (17.16) Wir wissen bereits, dass das Maximum der Verteilung von n scharf ausgeprägt ist, d. h. dass WN (n) schon bei relativ kleiner Entfernung der Variablen n von n̂ stark abgefallen ist. Daher können wir eine sinnvolle Vereinfachung von (17.14) nicht etwa durch eine nach wenigen Gliedern abgebrochene Taylorreihe der rechten Seite um die Stelle n = n̂ erhalten. Beachten wir aber, dass ln WN (n) sehr viel weniger empfindlich von n abhängt als WN (n) selbst. Die Taylorreihe · ¸ 1 d2 ln WN (n) (n − n̂)2 + · · · ln WN = ln Ŵ + 2 dn2 n=n̂ = ln Ŵ − 1 (n − hni)2 + · · · 2h(∆n)2 i (17.17) gibt also eine nicht offensichtlich unsinnige Näherung ab. Tatsächlich lässt sich leicht zeigen, dass der Abbruch der Reihe nach dem Glied zweiter Ordnung im Bereich [N p(1 − p)]1/2 ¿ n − hni ¿ N p(1 − p), also jedenfalls nahe bei n = hni, eine sehr gute Approximation liefert, wenn N p(1 − p) À 1. Die entsprechende Wahrscheinlichkeitsverteilung, £ ¤−1/2 £ ¤ WN (n) = 2πh(∆n)2 i exp −(n − hni)2 /2h(∆n)2 i , (17.18) eine Gaußfunktion der Zufallsvariablen n, ist in Abbildung 17.2 für kontinuierlich variables n zusammen mit der Binomialverteilung (17.4) für den Fall N = 50, p = 1/2 aufgemalt. 17.4 Eindimensionale Diffusion Wenn eine Zufallsvariable x ein Kontinuum von Werten annehmen kann, etwa −∞ < x < +∞, so ist es nicht mehr sinnvoll, nach der Wahrscheinlichkeit dafür zu fragen, dass x genau einen bestimmten Wert annimmt. Sie wissen von 17.4 Eindimensionale Diffusion 301 0.1 0 25 50 Abbildung 17.2 unserer Behandlung der Quantentheorie (s. 11.3), dass bei kontinuierlichen Zufallsprozessen die Wahrscheinlichkeit W (x)∆x für das Auffinden der Variablen im Intervall ∆x beim Wert x benutzt werden muss. Die Funktion W (x) heißt Wahrscheinlichkeitsdichte. Die Normierung +∞ Z dx W (x) = 1 (17.19) −∞ bedeutet dann, dass die Variable mit Sicherheit irgendeinen Wert im Intervall −∞ < x < +∞ annimmt. Mittelwerte berechnen sich nach der Vorschrift +∞ Z dx xν W (x) . hx i = ν (17.20) −∞ Kontinuierliche Zufallsvariable treten oft auf als Idealisierung diskreter Variabler. Wenn wir zum Beispiel das hüpfende Teilchen aus 17.2 und 17.3 auf einem Längenmaßstab betrachten, der sehr viel größer ist als die Gitterkonstante a, so lässt sich die Teilchenkoordinate x = na − (N − n)a (17.21) als kontinuierlich ansehen. Wenn wir darüber hinaus annehmen, dass die Sprünge des Teilchens im zeitlichen Abstand τ erfolgen und der Zeitmaßstab der Beobachtung sehr viel größer als τ ist, so können wir auch die Zeit t = Nτ (17.22) als kontinuierlich betrachten. Aus der diskreten Gaußverteilung (17.18) erhalten wir eine Wahrscheinlichkeitsdichte für die kontinuierliche Variable x, indem wir das Inkrement ∆n = 1 mit Hilfe von (17.21) in ein Inkrement ∆x überführen und im Übrigen die diskreten Größen n und N durch x und t ersetzen, µ ¶ x t ∆x WN (n) = WN (n)∆n = WN + ≡ W (x, t)∆x . (17.23) 2a 2τ 2a 302 17 Grundbegriffe der Statistik Die gesuchte Wahrscheinlichkeitsdichte ist wie ihr diskretes Analogon eine Gaußfunktion. Sie lautet im Fall p = 1/2 ¶ µ 1 x2 , (17.24) W (x, t) = √ exp − 2Dt 2πDt wobei die so genannte Diffusionskonstante D = a2 /τ (17.25) eingeführt wurde. Die Gaußverteilung (17.24) ist für alle Zeiten t > 0 auf Eins normiert, +∞ µ ¶ Z x2 1 exp − =1. dx √ 2Dt 2πDt (17.26) −∞ Da diese Normierung auch für t → 0 erhalten bleibt, während ( 0 für x 6= 0 , W (x, t) −−−→ t→0 ∞ für x = 0 (17.27) schließen wir, dass (17.24) anfänglich eine Deltafunktion darstellt, W (x, 0) = δ(x) . (17.28) Diese Anfangsverteilung impliziert die Kontinuumsversion der Anfangsbedingung, dass das Teilchen zur Zeit t = 0 bei x = 0 scharf lokalisiert ist. Zu späteren Zeiten wird die Lokalisierung immer diffuser, da die Breite der Verteilung (17.24) mit t wächst, h(∆x)2 i = Dt . (17.29) Für t → ∞ schließlich strebt W (x, t) überall nach Null. Dabei bleibt allerdings gemäß (17.26) die Normierung gewahrt, denn das Teilchen kann sich zwar beliebig weit vom Ausgangspunkt entfernen, nicht aber zur Gänze verloren gehen. Durch Differenzieren überzeugen Sie sich leicht davon, dass die Verteilung (17.24) eine Lösung der Diffusionsgleichung 1 ∂2 ∂ W (x, t) = D 2 W (x, t) ∂t 2 ∂x (17.30) darstellt. Beachten Sie auch, dass diese Diffusionsgleichung der Schrödingergleichung eines freien Teilchens in einer Raumdimension sehr ähnlich sieht. Formal kann (17.30) in die Schrödingergleichung überführt werden durch die Transformation t → it/~, D → ~2 /m. Die Differentialgleichung (17.30) tritt in vielen verschiedenen Zusammenhängen auf. In der Theorie der Wärmeleitung wird sie benutzt zur Beschreibung der Orts- und Zeitabhängigkeit der Temperatur beim Wärmetransport. Eine Lösung der Form (17.24) beschreibt das allmähliche Zerfließen einer anfänglichen lokalen Erhitzung in einem wärmeleitenden Körper. Der Konzentrationsausgleich in einem anfänglich inhomogenen Gemisch ineinander lösbarer Flüssigkeiten folgt, wenn keine Strömungen auftreten, der drei-dimensionalen Verallgemeinerung (∂ 2 /∂x2 → ∇2 ) von (17.30). Die Brownsche Bewegung und die Wanderung von Fremdatomen Fehlstellen in Kristallen sind andere Anwendungsbeispiele. 17.5 Der Zentrale Grenzwertsatz 17.5 303 Der Zentrale Grenzwertsatz Eine Zufallsgröße x, die sich additiv aus N unabhängigen, gleichartigen Zufallsgrößen zusammensetzt, ist im Grenzfall√N → ∞ Gaußsch verteilt. Die relative Streuung von x ist von der Ordnung 1/ N . Der soeben formulierte zentrale Grenzwertsatz ist für das Verständnis von Vielteilchensystemen von außerordentlicher Bedeutung. Makroskopische“ Ge” genstände aus dem Alltagsbereich enthalten etwa 1023 (ein Liter Gas) bis 1026 (1 kg feste Materie) Moleküle. Derartige Körper können wir uns in viele (sagen wir 1014 ) winzige Stücke zerteilt denken, deren jedes immer noch viele (im gewählten Beispiel 109 bis 1012 ) Teilchen enthält. Wenn im betrachteten Körper bezüglich makroskopischer Messungen räumliche und zeitliche Homogenität herrscht, sind die Stücke normalerweise in guter Näherung unabhängig voneinander. Die Unabhängigkeit rührt daher, dass die Wechselwirkung von Molekülen (die typische Reichweite beträgt einige Å) aus benachbarten Stücken nur in engster Nachbarschaft der gemeinsamen Oberfläche stattfindet, während die typische Lineardimension der Stücke im gewählten Beispiel 104 Å beträgt. Viele physikalische Größen (wie die Gesamtenergie die Magnetisierung, die elektrische Polarisation) können dann aufgefasst werden als Summen der unabhängigen Beiträge der Teilstücke des betrachteten Körpers. Der zentrale Grenzwertsatz besagt, dass die relativen statistischen Schwankungen derartiger p additiver Variabler winzig (im gewählten Beispiel Str(x)/ hx2 i ≈ 10−7 ) und Gaußsch verteilt sind. Dabei wird keine Annahme gemacht über die statistischen Eigenschaften des Beitrags eines der Teilstücke des Körpers zu x; insbesondere können diese Beiträge relativ große Schwankungen aufweisen. Selbst wenn die Energie eines Teilstücks nur mit großer relativer Unschärfe bekannt ist, hat die Gesamtenergie des Körpers nur eine winzige Unschärfe. Der zentrale Grenzwertsatz lässt uns also verstehen, warum jeder additiven physikalischen Größe für einen makroskopischen Körper (z. B. Nährwert eines Pakets Haferflocken) normalerweise ein Zahlenwert statt einer Wahrscheinlichkeitsverteilung zugeordnet werden kann. Die wesentliche Voraussetzung für die Anwendbarkeit des zentralen Grenzwertsatzes ist die Unabhängigkeit der N Einzelbeiträge zu x. Sie ist bei zeitlich stationären und räumlich homogenen makroskopischen Systemen zwar nicht immer, aber normalerweise erfüllt. Eine wichtige Ausnahme betrifft Körper in so genannten kritischen Zuständen bei Phasenübergängen wie dem Übergang vom flüssigen zum gasförmigen Zustand. Für einen derartigen Körper können additive Observable riesige Fluktuationen zeigen, d. h. mit ihren Mittelwerten vergleichbare Streuungen haben. Solche kritischen Fluktuationen sind auch nicht durch Gaußsche Wahrscheinlichkeitsverteilungen charakterisierbar. Sie gehen Hand in Hand damit, dass fiktive Teilstücke über die ganze Lineardimension des Systems hinweg korreliert, d. h. nicht unabhängig voneinander sind. Die folgende, lehrreiche Rechnung beweist den zentralen Grenzwertsatz. Bezeichnen wir die Einzelbeiträge zu x mit xi und betrachten der Einfachheit halber die xi als kontinuierliche Variable im Intervall −∞ < xi < +∞. Wegen der angenommenen Gleichartigkeit haben alle xi für sich allein die gleiche Wahrscheinlichkeitsdichte w(xi ). Die Wahrscheinlichkeitsdichte für das Auffinden des ersten Beitrags bei xi , des zweiten bei x2 , etc. ist nach der sowohlals-auch-Regel (17.3) durch das Produkt w(x1 )w(x2 ) · · · w(xN ) gegeben. Die entweder-oder-Regel (17.2) gibt dann die Wahrscheinlichkeit für das Auffinden 304 17 Grundbegriffe der Statistik der Summe aller N Beiträge zwischen x und x + ∆x als das Integral Z Z Z dx1 dx2 · · · dxN w(x1 )w(x2 ) · · · w(xN ) . {z } | P x≤ (17.31) xi ≤x+∆x i Nach Wechsel der Integrationsvariablen ξ1 = x1 +x2 +· · ·+xN , ξ2 = x2 , ξ3 = x3 etc. schreiben wir dieses Integral in der Form x+∆x Z x +∞ +∞ Z Z dξ1 dξ2 · · · dξN w(ξ1 − ξ2 · · · − ξN )w(ξ2 ) · · · w(ξN ) . −∞ (17.32) −∞ Für hinreichend kleines ∆x ist die in Rede stehende Wahrscheinlichkeit proportional zu ∆x und definiert durch +∞ +∞ Z Z ∆x dξ2 · · · dξN w(x − ξ2 · · · − ξN )w(ξ2 ) . . . w(ξN ) ≡ W (x)∆x −∞ (17.33) −∞ die Wahrscheinlichkeitsdichte W (x) für die additive Zufallsvariable x. Um zu zeigen, dass W (x) für N → ∞ in eine Gaußverteilung übergeht, schreiben wir die Definition (17.33) in der symmetrischeren und leichter ausschlachtbaren Form +∞ +∞ +∞ Z Z Z W (x) = dξ1 dξ2 · · · dξN δ(x − ξ1 − ξ2 · · · − ξN )w(ξ1 )w(ξ2 ) · · · w(ξN ) −∞ −∞ −∞ (17.34) und verwenden hierin die Fourierdarstellung (2.111) der Deltafunktion, δ(x − X +∞ Z ξi ) = i P dk ik(x− i e 2π ξi ) . (17.35) −∞ Damit erhalten wir W (x) = +∞ Z dk ikx e Q(k)N . 2π (17.36) −∞ wobei Q(k) die Fouriertransformierte der Einzelwahrscheinlichkeit w(ξ) ist Q(k) = +∞ Z dξ e−ikξ w(ξ). (17.37) −∞ Offenbar hat die Funktion Q(k) die Momente der Verteilung w(ξ) als ihre Ableitungen bei k = 0, i ν · dν Q(k) dk ν ¸ k=0 +∞ Z = dξ ξ ν w(ξ) = hξ ν i . −∞ (17.38) 17.5 Der Zentrale Grenzwertsatz 305 Insbesondere gibt das nullte Moment das Normierungsintegral, +∞ Z Q(0) = dξ w(ξ) = 1 . (17.39) −∞ Wir können uns leicht davon überzeugen, dass |Q(k)| den Wert Q(0) = 1 für kein k überschreiten kann. Da der Betrag einer Summe nie größer ist als die Summe der Beträge der Summanden, gilt Z Z |Q(k)| ≤ dx |e−ikx w(x)| = dx w(x) = Q(0) = 1 . (17.40) Tatsächlich wird |Q(k)| für wachsendes |k| umso schneller abfallen, je langsamer w(ξ) mit wachsendem |ξ| abfällt (blättern Sie zurück zu 11.7, um ein Beispiel zu haben). Zur anschaulichen Begründung der getroffenen Aussage vergegenwärtigen wir uns, dass die Exponentialfunktion exp(−ikx) in (17.37) als Funktion von x umso schneller oszilliert, je größer |k| ist; für hinreichend großes |k| wird w(x) auf dem Längenmaßstab 1/|k| kaum noch variieren, das Integral (17.37) also nur noch wenig von Null abweichen kann. Wegen (17.40) und da Q(k) für wachsendes |k| abfällt, wird die Potenz Q(k)N bei großem N extrem schnell abfallen. Zur näherungsweisen Berechnung des Integrals (17.36) suchen wir nun eine Approximation für Q(k)N , die diesem extrem schnellen Abfall vom Maximalwert Eins auf Null Rechnung trägt. Wie bei einer ähnlichen Fragestellung in 17.3 verwenden wir die Taylorreihe von ln Q(k)N um die Stelle k = 0, ¶ µ 1 2 2 N (17.41) ln Q(k) = N ln Q(k) = N ln 1 − ihξik − hξ ik · · · . 2 Mit Hilfe der Entwicklung ln(1 + x) = x − x2 /2 + . . . erhalten wir aus (5.11) µ ¶ 1 ln Q(k)N = −ihξik − h(∆ξ)2 ik 2 + · · · , 2 also Q(k) N µ 1 ≈ exp −iN hξik − N h(∆ξ)2 ik 2 2 ¶ . (17.42) In dieser für große N vernünftigen Approximation wird Q(k)N nur durch die ersten beiden Momente der Einzelwahrscheinlichkeit w(ξ) festgelegt. Nach Eintragen der Näherung (17.42) in das Integral (17.36) ergibt sich für die gesuchte Wahrscheinlichkeitsdichte der additiven Variablen x die Gaußfunktion (s. 11.7 für das Integral) W (x) = p mit dem ersten Moment 1 2πh(∆x)2 i £ ¤ exp −(x − hxi)2 /2h(∆x)2 i hxi = N hξi (17.43) (17.44) 306 17 Grundbegriffe der Statistik und der mittleren quadratischen Schwankung h(∆x)2 i = N h(∆ξ)2 i . (17.45) Wie eingangs angekündigt, verschwindet die relative Streuung für N → ∞ wie £ ¤1/2 1 Str(x)/hxi = N h(∆ξ)2 i /N hξi ∼ √ . N (17.46) Kapitel 18 Statistische Behandlung von Vielteilchensystemen 18.1 Ensembles Die Wellenfunktion ψ(~x1 , ~x2 , . . . , ~xN , t) eines Haufens von N gleichen Teilchen hat wie die Wellenfunktion eines einzelnen Teilchens die Bedeutung einer Wahrscheinlichkeitsamplitude. Ihr Absolutquadrat gibt die Wahrscheinlichkeitsdichte dafür an, ein Teilchen in einem Volumenelement d3 x1 beim Ort ~x1 zu finden, ein zweites in einem Volumenelement d3 x2 bei ~x2 etc. Die Wahrscheinlichkeitsinterpretation ist allerdings wie im Fall eines einzelnen Teilchens nur möglich, wenn ψ normiert ist gemäß Z Z Z hψ | ψi ≡ d3 x1 d3 x2 · · · d3 xN |ψ(~x1 , ~x2 , . . . , ~xN , t)|2 = 1 . (18.1) Entsprechend der Bedeutung von ψ berechnet sich der Erwartungswert einer ~ x1 , . . . , ~xN , p~1 , . . . , p~N ) als das Integral (s. 11.6) Observablen A(~ Z Z 3 hAi ≡ hψ | Aψi = d x1 · · · d3 xN ψ ∗ Aψ . (18.2) Falls die Wellenfunktion ψ nicht Eigenfunktion des Operators A ist, so werden sich bei Messung der Observablen A an einem Ensemble von durch ψ repräsentierten Systemen verschiedene Messwerte ergeben. Das Mittel der Messergebnisse hat den Wert (18.2). Als ein Maß für die typische Schwankung der Messwerte um den Mittelwert können wir die Streuung ¡ ¢1/2 ¡ ¢1/2 Str(A) = hA2 i − hAi2 = hψ | A2 ψi − hψ | Aψi2 (18.3) benutzen. Ein Ensemble von Systemen, die alle in ein und demselben Zustand präpariert wurden, ist nicht die allgemeinst mögliche Gesamtheit. Wir werden künftig stets zulassen, dass zu einem Ensemble Systeme in verschiedenen Zuständen ψν , ν = 1, 2, . . ., gehören, wobei ein beliebig aus dem Ensemble herausgegriffenes System mit Wahrscheinlichkeit wν im Zustand ψν sitzt. Der Erwartungswert 307 308 18 Statistische Behandlung von Vielteilchensystemen der Observablen A (die keine explizite Zeitabhängigkeit haben soll), hAi = X ν wν hψν | Aψν i , (18.4) entsteht dann als statistisches Mittel der quantenmechanischen Erwartungswerte bezüglich der Zustände ψν . Derart zusammengesetzte Ensembles werden auch Zustandsgemische genannt. Bei dem einfachen Ensemble, das einer einzigen Wellenfunktion entspricht, sprechen wir auch von einem reinen Zustand. 18.2 Stationäre Ensembles Im Allgemeinen sind Erwartungswerte wie (18.4) zeitabhängig, da die Wellenfunktionen ψν sich entsprechend der Schrödingergleichung i~ ∂ ψν = Hψν ∂t (18.5) zeitlich entwickeln. Der Hamiltonoperator H = T + V für N Teilchen enthält die kinetische Energie T T = N N X X ~2 ∇2i 1 2 p~ = − , 2mi 2mi i=1 i=1 (18.6) wobei ∇i = (∂/∂xi , ∂/∂yi , ∂/∂zi ) der Nablaoperator bezüglich der Koordinaten des iten Teilchens ist. Hinzu kommt im Allgemeinen eine potenzielle Energie V (~x1 , ~x2 , . . . , ~xN ). Wenn die letztere Wechselwirkungen zwischen den Teilchen beschreibt, so ist sie im Gegensatz zu T nicht additiv bezüglich der Beiträge der einzelnen Teilchen. Die Schrödingergleichung (18.5) erlaubt, die zeitliche Änderungsrate des Erwartungswerts (18.4) zu berechnen Z Z i h X d wν d3 x1 · · · d3 xN ψ̇ν∗ Aψν + ψν∗ Aψ˙ν hAi = dt ν Z Z X ¤ i£ 3 = (18.7) wν d x1 · · · d3 xN (Hψν∗ )Aψν − ψν∗ AHψν . ~ ν Wenn V impulsunabhängig, d. h. kein Differentialoperator und darüber hinaus reell ist, können wir schreiben µ ¶ Z Z X d i 3 3 hAi = wν d x 1 . . . d x N dt ~ ν ¤ £ · (T ψν∗ )Aψν − ψν∗ AT ψν + ψν∗ (V A − AV )ψν . Im ersten Term der eckigen Klammer können wir die Differentialoperatoren in (∇2i ψν∗ )Aψν durch zweimalige partielle Integration nach rechts abwälzen“; ” da hierbei für normierbare Wellenfunktionen ψν keine Randterme entstehen, 18.2 Stationäre Ensembles erhalten wir schließlich µ ¶ Z Z X i d wν d3 x 1 . . . d3 x N hAi = (HA − AH)ψν dt ~ ν µ ¶ Z Z X i 3 3 ∗ = [H, A]ψν . w ν d x 1 . . . d x N ψν ~ ν 309 (18.8) Die Änderungsrate des Erwartungswerts hAi verschwindet offensichtlich, falls [H, A] = 0, d. h. falls die Observable A eine Erhaltungsgröße ist (s. 14.4). Aber auch im Fall [H, A] 6= 0 kann der Erwartungswert hAi zeitlich konstant bleiben. Ist nämlich das betrachtete Ensemble ein Gemisch von Energieeigenzuständen, Hψν = Eν ψν , (18.9) so ersehen Sie schon aus (18.7) das Verschwinden der Änderungsrate dhAi/dt. Da für Gemische von Energieeigenzuständen die Erwartungswerte beliebiger Observabler zeitlich konstant bleiben, werden diese Gemische füglich als stationär bezeichnet. Der folgenden Behandlung von Vielteilchensystemen im thermischen Gleichgewicht werden stets stationäre Gemische zugrunde gelegt. Von besonderem Interesse für die Beschreibung von Vielteilchensystemen sind Erwartungswert und Streuung der Energie. Bei stationären Ensembles gilt X X w ν Eν . (18.10) wν hψν | Hψν i = hHi = ν ν Sie können im nächsten Paragrafen lernen, dass die Energieniveaus in Vielteilchensystemen außerordentlich dicht aufeinander folgen. Summen über Energiezustände wie in (18.10) können daher durch Integrale genähert werden. Dazu muss die Zahl Ω(E)∆E der Zustände ψν bekannt sein, deren Energieniveaus im Intervall zwischen E und E + ∆E liegen, und ferner muss wν durch w(Eν ) ersetzt werden. Der Erwartungswert (18.10) der Energie nimmt dann die Form hHi = Z∞ dE Ω(E) w(E) E (18.11) E0 an, wobei E0 die Grundzustandsenergie des Systems bezeichnet. Im vorstehenden Ausdruck für die mittlere Energie erkennen Sie übrigens das Produkt Ω(E)∆E als Wahrscheinlichkeitsdichte der Energie. Die Streuung der Energie erhalten wir durch eine entsprechende Überlegung als 1/2 ∞ Z 2 2 . (18.12) Str(H) = dE Ω(E) w(E) (E − hHi ) E0 Die Energie eines makroskopischen Systems ist im Sinne der Betrachtungen von 17.5 eine additive Größe. Nach dem zentralen Grenzwertsatz müssen wir also erwarten, dass die Streuung (18.12) i. A. sehr klein ist gegenüber dem Mittelwert (18.11). Um diese Erwartung durch Berechnen der Integrale in (18.11, 18.12) überprüfen zu können, müssen wir uns die Zustandsdichte Ω(E) sowie die Wahrscheinlichkeit w(E) für stationäre Vielteilchensysteme zur Verfügung stellen. 310 18 Statistische Behandlung von Vielteilchensystemen 18.3 Die Energieabhängigkeit der Zustandsdichte Die Abzählung der Energiezustände ψν mit Energien Eν innerhalb eines Intervalls zwischen E und E +∆E erfordert im Prinzip die Kenntnis aller Eigenwerte des Hamiltonoperators (und ihren Entartungsgrad). Diese Kenntnis ist für Vielteilchensysteme nicht leicht zu erlangen. Ohne große Mühe machen wir uns aber klar, dass die Zustandsdichte eines Systems vieler Teilchen extrem stark von der Energie abhängt. Denken wir uns ein System von N Teilchen durch einen glatten Schnitt halbiert. Bei Teilchenzahlen der Größenordnung 1023 stellt die Wechselwirkung der Hälften einen vernachlässigbaren Teil der Gesamtenergie dar. Zudem können wir die Hälften als statistisch unabhängig ansehen. Da sich jede der Hälften vom Gesamtsystem nur durch Volumen, Teilchenzahl und Energie unterscheidet, wird die Zustandsdichte für alle drei Systeme dieselbe Funktion der respektiven Energien, Teilchenzahlen und Volumina sein∗) Wegen der Unabhängigkeit der Untersysteme gilt für die Zahl Ω(E, N, V )∆E der Zustände des Gesamtsystems mit Energien im Intervall ∆E bei E ¶ X µE N V ∆E − e, − n, Ω(E, N, V )∆E = Ω 2 2 2 e,n ¶ E N V ∆E + e, + n, 2 2 2 · µ ¶ ¸2 E N V , , ≈ Ω ∆E . 2 2 2 ·Ω µ (18.13) Die Summe im zweiten Glied der Gleichungskette erstreckt sich über alle möglichen Verteilungen der Gesamtenergie E und der Gesamtteilchenzahl N auf die beiden Untersysteme. Wir dürfen diese Summe durch den Summanden entsprechend halbierter Energie und halbierter Teilchenzahl approximieren, denn wenn Ω(E, N, V ) schon bei kleinem Zuwachs von E extrem stark wächst, was wir gleich zeigen werden, so hat das Produkt Ω(E/2 − e, N/2 − n, V /2) · Ω(E/2 + e, N/2 + n, V /2) ein extrem scharf ausgeprägtes Maximum bei e = n = 0. Anstatt das ursprüngliche System zu halbieren, können wir es auch in n makroskopisch gleiche Teile zerlegen. Dann gilt statt (18.13) mit gleicher Begründung ¶ ¸n · µ E N V , , ∆E . (18.14) Ω(E, N, V )∆E ≈ Ω n n n Die Näherung (18.14) bleibt bei wachsendem n gut, solange jedes Untersystem noch viele Teilchen enthält und die Gesamtenergie additiv in den Beiträgen der Untersysteme bleibt; bei N = 1023 ist das normalerweise bei mindestens n ≈ 1014 der Fall. Wenn der mittlere Teilchenabstand wie bei verdünnten Gasen größer ist als die Reichweite der Wechselwirkungskräfte zwischen den Teilchen, gilt (18.14) sogar bis zu Werten von n in der Größenordnung der Gesamtteilchenzahl N . ∗) Es lässt sich zeigen, dass Ω von der Form der Berandung des Systems nicht abhängt. 18.4 Das mikrokanonische Ensemble 311 Aus (18.14) gewinnen wir durch Differenzieren die relative Änderung der Zustandsdichte bei kleiner relativer Änderung der Energie, δΩ(E, N, V ) δΩ(E/n, N/n, V /n) =n , Ω(E, N, V ) Ω(E/n, N/n, V /n) (18.15) als das n-fache der entsprechenden relativen Änderung bei einem von n Untersystemen. Mag die relative Änderung von Ω(E/n, N/n, V /n) für das kleinstmögliche Untersystem auch winzig sein, sagen wir 10−6 , so wird Ω(E, N, V ) doch um den riesigen Faktor n · 10−6 wachsen. Bei vielen Systemen wird das schnelle Anwachsen der Zustandsdichte Ω mit der Energie außer in Nachbarschaft der Grundzustandsenergie durch ein Potenzgesetz mindestens qualitativ richtig beschrieben, Ω(E, N, V ) = E aN A(N, V ) , (18.16) wobei der Exponent aN eine sehr große Zahl ist, deren Größenordnung sogar der der Teilchenzahl N nahe kommen kann. Für hinreichend verdünnte Gase, bei denen (18.14) und (18.15) bis n ≈ N gelten, ist a von der Größenordnung Eins. Prüfen Sie Ihr Verständnis der vorstehenden Diskussion, indem Sie sich davon überzeugen, dass Ω(E, N, V ) auch empfindlich vom Volumen V abhängt, u. z. stark wächst bei Volumenvergrößerung. Wenn wir wie hier und in der Folge die Niveaudichte Ω(E, N, V ) als Funktion der Energie E, desr Teilchenzahl N und des Volumens V ansehen†) , dann ist stillschweigend angenommen, dass nur eine Teilchensorte (z.B. Wassermoleküle) und nur eine Phase (gasförmig, flüssig oder fest) vorliegen. Von diesen drei Variablen muss die Niveaudichte sicher abhängen: vom Volumen V , weil am Rand des Systemvolumens Randbedingungen für die Wellenfunktion erfüllt sein müssen, so dass auch die Energieniveaus En (V ) vom Volumen abhängen; von der Teilchenzahl N , weil jedes Teilchen zur Gesamtenergie (also zu jedem Energieniveau des Gesamtsystems) beiträgt und schließlich wie oben beschrieben auch von der Energie E. 18.4 Das mikrokanonische Ensemble Ich erinnere nochmals an eine in 17.5 gegebene Erläuterung des zentralen Grenzwertsatzes. Ein räumlich homogenes und zeitlich stationäres System vieler, etwa N = 1023 , Teilchen können wir uns in viele, z. B. n = 1014 Stücke zerlegt denken, die mit glatten Oberflächen aneinander grenzen und deren jedes immer noch viele, im Beispiel 109 , Teilchen enthält. Normalerweise (immer, außer in kritischen Systemen) sind solche Teilstücke in guter Näherung unabhängig voneinander. Die Energie des Systems ist additiv in den Beiträgen seiner Teilstücke, hHi ∼ n, und die relative Streuung der Energie, Str(H)/hHi ∼ n−1/2 , ist winzig, zumeist sogar erheblich kleiner als die relative Unsicherheit der experimentellen Bestimmung der Gesamtenergie. Derart kleine Streuungen verdienen durchaus, vernachlässigt zu werden. Die entsprechende Näherung für die in (18.11) auftretende Wahrscheinlichkeit Ω(E) †) Der Kürze halber wird die Niveaudichte im Folgenden zuweilen als Ω(E) notiert, womit die Abhängigkeit von V und N keineswegs negiert ist 312 18 Statistische Behandlung von Vielteilchensystemen w(E) dE dafür, die Energie des Systems im infinitesimalen Intervall zwischen E und E + dE zu finden, lautet Ω(E) w(E) dE = δ(E − Ē)dE . (18.17) Die Deltafunktion verbietet gerade das Auftreten von Energien außerhalb eines infinitesimalen Intervalls um den Mittelwert hHi = Z∞ dE δ(E − Ē)E = Ē . (18.18) E0 Alle höheren Momente ergeben sich als Potenzen des Mittelwerts, ν hH i = Z∞ dE δ(E − Ē)E ν = Ē ν . (18.19) E0 und insbesondere verschwindet die Streuung der Energie. Das so definierte stationäre Ensemble von Systemen heißt aus historischen Gründen mikrokanonisch. Neben der absoluten Schärfe der Energie hat das mikrokanonische Ensemble eine weitere bemerkenswerte Eigenschaft. Um dieselbe klarzulegen, fassen wir vorübergehend wieder die Diskretheit der Energieniveaus ins Auge und fragen nach der Wahrscheinlichkeit, im Ensemble irgendeinen der insgesamt Ω(E)∆E Energieeigenzustände ψn mit einem Energieeigenwert En im kleinen aber endlichen Intervall ∆E bei E anzutreffen. Die gefragte Wahrscheinlichkeit beträgt für das mikrokanonische Ensemble 1 für Ē ≤ En ≤ Ē + ∆E Ω( Ē)∆E (18.20) w(En ) = 0 sonst. Im Grenzfall infinitesimaler Dicke ∆E der Energieschale“ stimmt (18.20) mit ” (18.17) überein. Sie rechnen leicht nach, dass die Relationen (18.19) bis auf Korrekturen der Ordnung ∆E/Ē auch für die diskrete Version (18.20) von (18.17) richtig bleiben. Ganz ohne Rechnung lesen Sie aus (18.20) ab, dass das mikrokanonische Ensemble jedem der Ω(E)∆E Zustände mit Energie innerhalb der erlaubten Energieschale die gleiche Wahrscheinlichkeit zuweist. Per Konstruktion ist gesichert, dass das mikrokanonische Ensemble das statistische Verhalten der Energie eines Vielteilchensystems (nämlich die Kleinheit ihrer Schwankungen) angemessen beschreibt. Ganz unklar ist jedoch zunächst, ob auch die statistischen Eigenschaften anderer makroskopischer Observabler (Gesamtimpuls, Gesamtdrehimpuls, ggf. Magnetisierung, elektrische Polarisation etc.) richtig wiedergegeben werden. Für alle Variablen, die im gleichen Sinn wie die Energie additiv sind (oder sogar additiv in den Beträgen der einzelnen Teilchen), sichert der zentrale Grenzwertsatz Streuungen, die zur Wurzel aus der Teilchenzahl N proportional sind, Streuungen also, die auf zu N proportionalen Maßstäben als winzig erscheinen. Diese Eigenschaft jedes Vielteilchensystems kann im mikrokanonischen Ensemble nicht verfälscht sein, da die Schärfen der Energie und anderer additiver Observablen nicht im Widerspruch zueinander stehen. 18.5 Das kanonische Ensemble 313 Keineswegs ist durch den Grenzwertsatz jedoch garantiert, dass das mikrokanonische Ensemble auch die richtigen Mittelwerte der genannten Variablen liefert. Der Mittelwert des Gesamtimpulses von N Teilchen etwa verschwindet im mikrokanonischen Ensemble, denn nach dem Ehrenfestschen Theorem 11.8 gilt N X i=1 h~ pi i = X i mi d h~xi i , dt (18.21) und nach den Überlegungen von 18.2 ist der Erwartungswert von h~xi i in jedem stationären Ensemble zeitunabhängig. Also eignet sich das Ensemble (18.17) nur zur Beschreibung von Systemen mit verschwindendem Gesamtimpuls, nicht aber, zum Beispiel, zur Behandlung von stationären Strömungen durch Rohre. Wenn der Mittelwert einer additiven Observablen eines Vielteilchensystems im Ensemble (18.17) verschwindet, in einer zu beschreibenden Realisierung des Systems aber nicht, so enthält (18.17) zu viele Zustände. Zum Beispiel lässt (18.17) zu jedem Wert des Gesamtimpulses mit gleicher Häufigkeit den entgegengesetzt gleichen zu, während in einem insgesamt translatorisch bewegten oder strömenden System Impulse einer bestimmten Richtung bevorzugt sind. Um in derartigen Fällen die Zahl der Zustände angemessen zu reduzieren, kann statt (18.17) ein verallgemeinertes mikrokanonisches Ensemble benutzt werden mit der Wahrscheinlichkeitsdichte ¯ w(E, ξ) Ω(E, ξ) = δ(E − Ē) δ(ξ − ξ) (18.22) dafür, dass die Energie und die weitere(n) unabhängig vorgebbare(n) additive(n) Variable(n) Werte bei E bzw. ξ annehmen. Ferromagnete, Supraleiter und suprafluides Helium sind weitere Beispiele von Systemen, bei denen die Verallgemeinerung (18.22) angebracht ist. Offensichtlich ist die Beschreibung eines Vielteilchensystems durch das mikrokanonische Ensemble von mikroskopischem Standpunkt aus extrem unvollständig, da nur die Energie oder neben ihr nur wenige weitere Observable spezifiziert werden. Hinsichtlich makroskopischer Observabler von Systemen im thermischen Gleichgewicht ist diese Beschreibung jedoch, wie Sie am Beispiel der idealen Gase in 20. sehen werden, erschöpfend. Im Übrigen ist Ihnen aus der elementaren phänomenologischen Thermodynamik schon bekannt, dass das thermische Gleichgewicht eines Gases von N Teilchen hinsichtlich makroskopischer Beobachtungen (von Druck, Temperatur, Energie etc.) eindeutig festgelegt ist nach Vorgabe zweier Größen wie etwa des Volumens V und der Gesamtenergie E. Die letzteren beiden Größen bestimmen aber gerade die Niveaudichte und somit das mikrokanonische Ensemble. 18.5 Das kanonische Ensemble Die mikrokanonische Besetzungswahrscheinlichkeit (18.20) für ein Energieniveau Eν ist nicht die einzig mögliche Wahl für w(Eν ), die die Kleinheit der Energieschwankungen in einer Gesamtheit von Vielteilchensystemen richtig wiedergibt. Ich will Ihnen hier eine andere Wahl vorstellen, die sich für viele Rechnungen sogar als bequemer handhabbar erweist. 314 18 Statistische Behandlung von Vielteilchensystemen Betrachten wir ein stationäres Vielteilchensystem und denken es uns durch einen glatten Schnitt in zwei Stücke zerlegt, deren jedes immer noch viele Teilchen enthalten soll. Die Wechselwirkung der beiden Stücke macht normalerweise einen vernachlässigbaren Beitrag zur Gesamtenergie E, so dass letztere durch die Summe der Energien der beiden Teile approximiert werden kann, E = E1 + E2 . (18.23) Zugleich werden die beiden Teile in guter Näherung statistisch unabhängig sein. Die Wahrscheinlichkeit, die Gesamtenergie beim Wert E zu finden, wird nach der sowohl-als-auch-Regel (17.3) durch das Produkt der Wahrscheinlichkeiten, die Energien der Teile bei E1 bzw. E2 zu finden, gegeben sein, w(E) = w(E1 ) · w(E2 ) . (18.24) Da die beiden Teilsysteme von gleicher Natur sind wie ihre Vereinigung, tritt in (18.24) einunddieselbe Funktion w(x) mit drei verschiedenen Argumenten auf. Die beiden Relationen (18.23, 18.24) legen die Funktion w(E) fest als die Exponentialfunktion w(E) = 1 −βE e . Z (18.25) Dabei sind Z und β zwei offene Parameter, deren Bedeutung später klarzustellen sein wird. Durch Einsetzen prüfen Sie leicht nach, dass (18.25) eine Lösung der Gleichungen (18.23, 18.24) darstellt. Die Eindeutigkeit der Lösung (18.25) ist auch schnell erwiesen. Differenzieren wir nämlich beide Seiten von (18.24) nach E1 , so erhalten wir w 0 (E1 + E2 ) = w0 (E1 )w(E2 ). Für E1 = 0 entsteht die Differentialgleichung w 0 (E2 ) = w0 (0)w(E2 ), deren Lösung bekanntlich die Form (18.25) hat. Sie erkennen auf der rechten Seite von (18.25) den Boltzmannfaktor und erinnern sich an die Maxwellsche Geschwindigkeitsverteilung, die barometrische Höhenformel und andere Beispiele exponentieller Energieverteilungen. Ebenfalls bekannt ist Ihnen, dass der Parameter 1/β zur absoluten Temperatur proportional ist. Die folgenden Überlegungen machen jedoch von derlei Vorkenntnissen keinen Gebrauch. Damit (18.25) tatsächlich eine Wahrscheinlichkeit w(En ) definiert, muss die Summe über alle Energieeigenzustände den Wert Eins haben X w(En ) = Z −1 n X e−βEn = 1 . (18.26) n Diese Forderung definiert den Normierungsfaktor Z, die so genannte Zustandssumme, Z= X n e −βEn ≈ Z∞ dE Ω(E, N, V )e−βE = Z(β, N, V ) . (18.27) E0 Für die hier betrachteten Systeme ist, wie vorstehend symbolisch angedeutet, die kanonische Zustanssumme eine Funktion der Variablen β, N, V . Sobald Z 18.5 Das kanonische Ensemble 315 bekannt ist, sind alle Momente der Energieverteilung durch Differenziation nach dem Parameter β zugänglich, ν hH i = Z −1 X ∂ν Z = Z −1 Enν e−βEn ≈ Z −1 (−1) ν ∂β n ν Z∞ dE E ν Ω(E) e−βE . E0 (18.28) Die Differentiation nach β ist eine partielle; die beiden anderen Variablen Volumen und Teilchenzahl sind als konstant anzusehen. Die offenbare Verschiedenheit der kanonischen Verteilung (18.25) und der mikrokanonischen Verteilung w(E) = 1 δ(E − Ē) Ω(E) (18.29) muss Sie beunruhigen! Beide sollen die makroskopischen Eigenschaften von Vielteilchensystemen im thermischen Gleichgewicht beschreiben, beide sind konstruiert unter Berufung auf die Additivität der Energie bezüglich der Beiträge hinreichend großer Teilsysteme, aber irgendeine Ähnlichkeit zwischen der mikrokanonischen Deltafunktion und der kanonischen Exponentialfunktion ist zunächst nicht zu erkennen. Trotz des drastisch verschiedenen Aussehens sind die Verteilungen (18.17) und (18.25) äquivalent. Die Äquivalenz ist ohne Rechnung unschwer dem zentralen Grenzwertsatz zu entnehmen. Die Additivität der Energie bezüglich vieler hinreichend großer Untersysteme und die statistische Unabhängigkeit derartiger Untersysteme führen einerseits zwingend zur kanonischen Verteilung (18.25) und bedingen andererseits nach dem Grenzwertsatz eine winzige relative Streuung der Gesamtenergie. Die Schärfe der Energie ist aber gerade eines der beiden wesentlichen Charakteristika des mikrokanonischen Ensembles. Das andere Charakteristikum, die Gleichheit der Besetzungswahrscheinlichkeiten aller Zustände einer Energie bzw. mit Energien innerhalb einer dünnen Energieschale“, ist ” dem kanonischen Ensemble ebenfalls eigen, denn die Verteilung (18.25) hängt wie (18.17) neben der Energie von keinen anderen Quantenzahlen ab. Wir können die Kleinheit der Energieschwankungen im kanonischen Ensemble auch durch Berechnung der Erwartungswerte hH ν i gemäß (18.28) illustrieren. Dazu verwenden wir die Zustandsdichte (18.16), die das für makroskopische Systeme typische starke Anwachsen von Ω(E) mit der Energie qualitativ richtig beschreibt, Ω(E, N, V ) = A(N, V )E aN . (18.30) Der Einfachheit halber denken wir uns für den Exponenten aN zunächst nur ganzzahlige Werte zugelassen. Damit wird die Integration in (18.28) zu einer elementaren Aufgabe mit der Lösung (der Einfachheit halber wird der Energienullpunkt so gewählt, dass E0 = 0) hH ν i = Z −1 Aβ −(aN +ν+1) (aN + ν)! . (18.31) Insbesondere erhalten wir für ν = 0 die Zustandssumme Z = Aβ −(aN +1) (aN )! (18.32) 316 18 Statistische Behandlung von Vielteilchensystemen und schließlich, nach Elimination von Z aus (18.31), hH ν i = β −ν (aN + ν)(aN + ν − 1) · · · (aN + 1) . (18.33) Dieses Resultat lässt sich auch für nicht ganzzahlige Werte von aN gewinnen. Von (18.33) gelangen wir sofort zum angestrebten Ziel, der relativen Streuung der Energie, √ Str(H)/hHi = (aN + 1)−1/2 ∼ 1/ N , (18.34) deren Winzigkeit nun auch nachgerechnet ist. Um etwaige Beunruhigung über die Verschiedenheit der Besetzungswahrscheinlichkeit w(Eν ) im kanonischen und mikrokanonischen Ensemble vollends auszuräumen, sollten Sie noch einen Blick auf das letzte Glied in (18.28) werfen. Sie erkennen, dass das Produkt aus Zustandsdichte und Boltzmannfaktor und nicht letzterer allein die Wahrscheinlichkeitsdichte für das Auffinden der Energie beim Wert E angibt. Da Ω(E) stark mit E wächst, hat das Produkt Ω(E)e−βE ein scharf ausgeprägtes Maximum nahe beim Mittelwert hHi (s. Abbildung 18.1). Abbildung 18.1 Ich hatte schon in 18.4 darauf hingewiesen, dass bei manchen Vielteilchensystemen neben der Energie eine oder mehrere weitere Variable spezifiziert werden müssen. Die entsprechende Verallgemeinerung der kanonischen Verteilung (18.25) lautet, falls die unabhängig vorgebbare(n) Variable(n) ξ ebenso wie die Energie additiv sind, w(E, ξ) = Z −1 e−β(E−ϕξ) , (18.35) wobei als zusätzlicher Parameter die Größe ϕ auftritt. Die Begründung von (18.35) läuft völlig parallel der Begründung von (18.25) und ist Ihnen zur Übung anempfohlen. Das kanonische Ensemble wird oft auch für kleine Systeme mit wenigen Freiheitsgraden verwendet. Die (zuweilen unausgesprochene) Rechtfertigung dafür besteht stets darin, dass das betreffende kleine System als in schwacher Wechselwirkung mit einer großen Umgebung befindlich angesehen werden kann. Als Beispiel eines kleinen Systems betrachten wir einen harmonischen Oszillator im Gleichgewicht mit einer Umgebung, die so schwach ankoppelt, dass ihr Einfluss auf die Energieniveaus vernachlässigbar ist. Die Energieeigenwerte 18.6 Das großkanonische Ensemble µ 1 En = ~ω n + 2 ¶ , n = 0, 1, 2, . . . 317 (18.36) sind Ihnen aus 13.1 bekannt. Die Zustandssumme (18.27) wird hier zu einer geometrischen Reihe, Z= ∞ X e−β~ω(n+ 2 ) = 1 n=0 1 e−β~ω/2 = . −β~ω 1−e 2 sinh(β~ω/2) (18.37) Durch Differenzieren gemäß (18.28) erhalten wir hieraus die mittlere Energie hHi = ~ω β~ω coth 2 2 (18.38) β~ω ~ω / sinh . 2 2 (18.39) und die Streuung Str(H) = Sie sollten diese Resultate in den Grenzfällen β → 0 (große Temperaturen) und β → ∞ (kleine Temperaturen) untersuchen. Überzeugen Sie sich auch davon, daß sich die mittlere Energie gemäß (18.38) schreiben lässt als µ 1 hHi = ~ω nth + 2 ¶ , nth = 1 , eβ~ω − 1 wobei nth die thermisch gemittelte Zahl der Anregungsquanten ist; die letztere Form der mittleren Energie und die Interpretation von nth werden durch Vergleich mit (18.36) nahegelegt. Nach diesem kleinen Exkurs zu einem “kleinen” System kehren wir zum Hauptthema der Vielteichensysteme zurück mit der Bemerkung, dass bei Benutzung des kanonischen Ensembles naheliegt, die mittlere Energie hHi = Ē(β, N, V ) als Funktion der Teichenzahl N , des Volumens sowie des Parameters β (der sich wie bereits erwähnt als ein Maß für die Temperatur herausstellen wird) anzusehen. 18.6 Das großkanonische Ensemble Im mikrokanonischen wie im kanonischen Ensemble sind nur Systeme mit einundderselben Zahl von Teilchen zugelassen. Dies ist eine manchmal lästige Beschränkung. Insbesondere ist es experimentell unmöglich, ein makroskopisches System vielfach zu reproduzieren unter genauer Beibehaltung der Teilchenzahl N . Jedenfalls ist die Beschränkung auf fixes N bei N À 1 völlig unnötig. Da nämlich die Teilchenzahl wie die Energie additiv ist bezüglich der Beiträge von Teilsystemen, sichert der zentrale Grenzwertsatz die Vernachlässigbarkeit der Streuung von N . Wir können also ohne weiteres statt der bisher besprochenen Ensembles das so genannte großkanonische Ensemble benutzen, bei dem die Teilchenzahl genau wie die Energie zwar nicht absolut scharf fixiert ist, jedoch 318 18 Statistische Behandlung von Vielteilchensystemen nur vernachlässigbare Schwankungen aufweist. In diesem großkanonischen Ensemble haben Systeme mit Energieeigenwert Eν und Teilchenzahl N die relative Häufigkeit −1 −β(Eν −µN ) w(Eν , N ) = ZG e . (18.40) Dabei hängen die Energieeigenwerte Eν = Eν (N, V ) über Randbedingungen am Rand des Systems vom Volumen V sowie auch von der Teilchenzahl N ab. Die großkanonische Zustandssumme ZG ist durch die Wahrscheinlichkeitsinterpretation für w(Eν , N ) festgelegt, ZG = ∞ X X e−β(Eν −µN ) = ZG (β, V, µ) . (18.41) N =0 ν Das so genannte chemische Potential µ und der Parameter β können nach Vorgabe der mittleren Energie und der mittleren Teilchenzahl hN i fixiert werden. Offenbar gilt ¶ µ ∂ ln ZG (18.42) −hHi + µhN i = ∂β µ,V ¶ µ ∂ ln ZG , (18.43) βhN i = ∂µ β,V wobei die Differenziation in (18.42) bei konstantem chemischen Potential µ und die in (18.43) bei konstantem β auszuführen ist; das Volumen V ist beidemal als konstant anzusehen. Wir hatten am Ende des letzten Paragraphen erkannt, daß bei Benutzung des kanonischen Ensembles naheliegt, die mittlere Energie hHi = Ē(β, N, V ) als Funktion der Variablen β, N, V anzusehen. Ebenso natürlich ist es, bei Benutzung des großkanonischen Ensembles die Variablen β, µ, V zu benutzen und hHi = Ē(β, µ, V ) zu schreiben. Der mittleren Energie ist es gleichgültig, als Funktion welcher drei Variabler sie angesehen wird, und der Übergang von einem Satz wie β, N, V zu einem anderen wie β, µ, V ist nichts als eine Variablentransformation. Mit derartigen Variablentransformationen muss man in der Thermodynamik oft spielen. Ein derartiges Spiel liefert uns übrigens die mittlere Energie als ¶ µ ∂ ln ZG hHi = − , (18.44) ∂β z,V also etwas direkter als über 18.42 und 18.43. Kapitel 19 Thermodynamische Variable 19.1 Entropie Der hier vorzustellende Begriff der Entropie ist in der phänomenologischen Thermodynamik seit seiner Einführung durch Rudolf Clausius (1865) von zentraler Bedeutung und hat auch bei der Grundlegung des statistischen Verständnisses der Thermodynamik durch Ludwig Boltzmann eine Schlüsselrolle gespielt. Wir definieren die Entropie eines Vielteilchensystems im thermischen Gleichgewicht als X S = −kB w(Eν ) ln w(Eν ) . (19.1) ν Die hier per Konvention auftretende Boltzmannkonstante, kB = 1, 38062 × 10−23 J = 1, 38062 × 10−16 erg , (19.2) weist der Entropie die Dimension einer Energie zu. Da die Besetzungswahrscheinlichkeiten w(Eν ) alle zwischen Null und Eins liegen, gilt sicher S≥0. (19.3) Die so definierte Entropie könnte keine brauchbare thermodynamische Variable sein, wenn sie in den verschiedenen Gleichgewichtsensembles verschiedene Werte annähme. Nun hat die Summe in (19.1) für das mikrokanonische Ensemble (18.20) den Wert h i S = kB ln Ω(Ē, N, V )∆E = Smikro (Ē, V, N ) (19.4) während Sie für das kanonische Ensemble (18.25) leicht S = kB β Ē + kB ln Z = Skan (β, V, N ), Ē = hHi (19.5) finden. Wir müssen uns eilends von der Gleichheit der rechten Seiten in (19.4) und (19.5) überzeugen. Die Gleichheit muß übrigens bestehen ungeachtet der 319 320 19 Thermodynamische Variable schon mehrfach angesprochenen Tatsache, daß beim mikrokanonischen Vorgehen die Variablen Ē, N, V als die natürlichen erscheinen, während im kanonischen Fall die mittlere Energie Ē durch β ersetzt ist. Übrigens spricht man von Ē und β oft als von einem konjugierten Paar. Nun zum Bewies der Gleichheit Smikro = Skan . Dazu betrachten wir die kanonische Zustandssumme Z∞ X −βEn Z= ≈ dE Ω(E)e−βE e (19.6) n E0 und erinnern uns der in 18.5 gewonnenen Erkenntnis, dass das Produkt der Zustandsdichte Ω(E) mit dem Boltzmannfaktor ein extrem scharfes Maximum bei E = Ē aufweist. Da die Breite der Funktion Ω(E) exp(−βE) unterhalb des Maximums in etwa der Streuung der Energie gleich ist, kann die Zustandssumme durch die Näherung Z ≈ Ω(Ē) e−β Ē Str(H) (19.7) nicht um Größenordnungen verfälscht werden. Tragen wir die entsprechende Näherung für in Z in (19.5) ein, so erhalten wir h i S ≈ kB ln Ω(Ē) Str(H) . (19.8) Der Unterschied dieses Resultats zu (19.4) ist sicher vernachlässigbar: da ln Ω(Ē) ∝ N , während ln Str(H) ∝ ln N und die Dicke ∆E der Energieschale allerhöchstens ∝ N sind, ist der relative Unterschied der in (19.4) und (19.8) gegebenen Größen von der Ordnung (ln N )/N . Werten wir schließlich die Definition (19.1) der Entropie im großkanonischen Ensemble (18., (18.40)) aus, so ergibt sich S = kB ln ZG + kB β Ē − kB βµN̄ = Sgroß (β, µ, V ). (19.9) Die Übereinstimmung der so berechneten Entropie mit der aus den beiden anderen Ensembles gewonnenen für Vielteilchensysteme liegt daran, dass die Teilchenzahl ebenso wie die Energie im großkanonischen Ensemble nur winzige Schwankungen aufweist. Der Nachweis der Übereinstimmung verläuft ganz ähnlich wie der oben dargestellte Nachweis der Äquivalenz von (19.4) und (19.5) und bleibt Ihnen zur Übung überlassen. Würdigen Sie im Übrigen die Tatsache, dass die großkanonisch berechntete Entropie als Funktion der Variablen β, µ, V erscheint; gegenüber dem kanonischen Fall ist die Teilchenzahl durch das zu ihr konjugierte chemische Potential ersetzt. Aus der Definition (19.1) folgt unmittelbar, dass die Entropie additiv ist in den Beiträgen unabhängiger Untersysteme. Benennen wir nämlich die Energieniveaus zweier unabhängiger Untersysteme mit Eν1 und Eµ2 , die entsprechenden Besetzungswahrscheinlichkeiten mit w1 (Eν1 ) und w2 (Eµ2 ), so haben wir als sowohl-als-auch-Wahrscheinlichkeit das Produkt w(Eν1 , Eµ2 ) = w1 (Eν1 ) w2 (Eµ2 ) (19.10) und somit für die Gesamtentropie die Summe # " X X 1 2 1 2 S = −kB w1 (Eν ) ln w1 (Eν ) + w2 (Eµ ) ln w2 (Eµ ) = S1 + S2 . (19.11) ν µ 19.1 Entropie 321 Ludwigs Boltzmann’s Pioniertat bestand unter anderem darin, die vorher im phänomenologischen Kontext gebräuchliche Entropie eines thermischen Gleichgewichtszustands mit der Wahrscheinlichkeit dafür zu verknüpfen, in einem Ensemble makroskopisch identischer Systeme irgendeine der vielen Orts- und Impulskonfigurationen zu finden, die mit den makroskopisch feststellbaren Eigenschaften des Systems verträglich sind. Boltzmann’s Überlegungen bleiben weitgehend unberührt davon, dass wir heute die mikroskopische Dynamik quantenmechanisch statt klassisch beschreiben und von Energieniveaus statt von Ortsund Impulskonfigurationen sprechen. Der Zusammenhang zwischen Entropie und Wahrscheinlichkeit ist am unmittelbarsten aus der mikrokanonischen Form (19.4) ersichtlich, da 1/Ω(Ē)∆E gerade die Wahrscheinlichkeit darstellt, eines der Ω(Ē)∆E Energieniveaus innerhalb der Schale ∆E bei Ē besetzt anzutreffen. Die Bedeutung der Entropie für die phänomenologische Thermodynamik fußt auf einer Extremaleigenschaft. Die Definition (19.1) verlangt, dass die Besetzungswahrscheinlichkeiten einem Gleichgewichtsensemble entsprechen. Formal können wir auch eine Nichtgleichgewichtsentropie S 0 definieren, indem wir (19.1) für Nichtgleichgewichtsbesetzungen wν verwenden, X wν ln wν . (19.12) S 0 = −kB ν 0 Diese Nichtgleichgewichtsentropie S kann nie größer sein als die Gleichgewichtsentropie desselben Systems, S0 ≤ S . (19.13) Wir beweisen die außerordentlich wichtige Ungleichung (19.13), indem wir zunächst die Besetzungswahrscheinlichkeit wν als variable Parameter ansehen und S 0 bezüglich derselben extremalisieren. Bei jeder Variation der wν muss natürlich die Normierung X wν = 1 (19.14) ν gewahrt bleiben; unverändert bleiben soll auch die Gesamtenergie des Systems. Die Extremalisierung von S 0 unter den beiden Nebenbedingungen konstanter Normierung und Energie kann dadurch erfolgen, dass wir zwei Lagrangemultiplikatoren kB β und kB (ln Z − 1) einführen∗) , die Funktion X X wν (19.15) wν Eν − kB (ln Z − 1) S 0 − kB β ν ν ohne Nebenbedingungen extremalisieren und die beiden Parameter Z und β zuletzt durch die Forderungen (19.14) und X Ē = w ν Eν (19.16) ν festlegen. Bei infinitesimaler Änderung der wν darf sich die in (19.15) gegebene Funktion nicht ändern, da sie einen Extremalwert annehmen soll, X δwν (ln wν + βEν + ln Z) = 0 . (19.17) −kB ν ∗) Die Benennung dieser Lagrangemultiplikatoren mag unnötig kompliziert aussehen, wird sich aber im Ergebnis (19.18) als zweckmäßig herausstellen 322 19 Thermodynamische Variable Wegen der Unabhängigkeit der δwν muss die Klammer für jedes ν verschwinden, und es folgt wν = Z −1 e−βEν . (19.18) Wir schließen, dass bei Vorgabe der mittleren Energie durch (19.16) die Größe S 0 genau dann den Extremalwert S annimmt, wenn die Besetzungsverteilung der Energieniveaus die des kanonischen Gleichgewichtsensembles ist. Der Parameter β erscheint hier in der Rolle eines Lagrangemultiplikators, der die mittlere Energie festlegt. Anstatt mit Hilfe eines Lagrangemultiplikators können wir die Gesamtenergie auch dadurch vorgeben, dass wir nur solche wν als von Null verschieden zulassen, die zu Energieniveaus Eν innerhalb einer Schale der Dicke ∆E bei Ē gehören. Die Extremalisierung von S 0 mit der Nebenbedingung (19.14) führt dann zu der Forderung −kB Schale X δwν (ln wν + ln Z) = 0 , (19.19) ν also genau zur mikrokanonischen Verteilung wν = 1/Z = const. Die mikrokanonische Zustandssumme“ ist natürlich gleich der Zahl Ω(Ē)∆E der Energie” eigenzustände mit Energien innerhalb der Schale. Nachdem wir uns davon überzeugt haben, dass der im thermischen Gleichgewicht vorliegende Extremalwert der Größe S 0 gleich der Entropie S ist, müssen wir zur Vervollständigung des Beweises der Ungleichung (19.13) noch zeigen, dass das Extremum von S 0 ein Maximum ist. Das aber ist einfach, denn zweimaliges Differenzieren nach einem wµ in (19.12) gibt ∂2S0 = −kB /wµ < 0 . ∂wµ2 19.2 (19.20) Temperatur In einer ersten Nutzung der soeben erklärten Extremaleigenschaft der Entropie denken wir uns zwei zunächst getrennte abgeschlossene Vielteilchensysteme; beide seien für sich im Gleichgewicht. Die respektiven Energien und Entropien seien e1 und e2 bzw. S1 (e1 ) und S2 (e2 ). Sodann denken wir uns die zwei Systeme in Kontakt gebracht derart, dass die Gesamtenergie und die äußeren Parameter (insbesondere die beiden Volumina und Teichenzahlen) konstant bleiben, Energieaustausch zwischen den beiden Systemen jedoch möglich wird. Ein Kontakt der geschilderten Art heißt thermischer Kontakt und die gegebenenfalls ausgetauschte Energie heißt Wärme. Zwar i. A. nicht zu Beginn des Kontakts, aber erfahrungsgemäß doch nach hinreichend langer Zeit wird das vereinigte System im thermischen Gleichgewicht sein. Die vorher getrennten Teile werden die Energie Ē1 , Ē2 mit der Summe Ē = Ē1 + Ē2 = e1 + e2 (19.21) und die Entropien S1 (Ē1 ), S2 (Ē2 ) haben. Die Gesamtentropie des vereinigten Systems zu Beginn des Kontakts, S 0 = S1 (e1 ) + S2 (Ē − e1 ) , (19.22) 19.2 Temperatur 323 und die schließlich erreichte Gleichgewichtsentropie S 0 = S1 (Ē1 ) + S2 (Ē − Ē1 ) (19.23) S0 ≤ S . (19.24) erfüllen die Ungleichung Darüber hinaus erreicht S 0 als Funktion von e1 im Gleichgewicht, also für e1 = Ē1 , ihren Maximalwert S, und es gilt die Gleichgewichtsbedingung ¸ · ∂S1 (Ē1 ) ∂S2 (Ē2 ) δe1 = 0 , (19.25) δS 0 (Ē1 ) = − ∂ Ē1 ∂ Ē2 also ∂S1 (Ē1 ) ∂S2 (Ē2 ) = . ∂ Ē1 ∂ Ē2 (19.26) Das Inverse der hier auftretenden Größe ∂S 1 ≡ ∂E T (19.27) nennen wir die absolute Temperatur. Zwei Systeme in thermischem Kontakt können nach (19.26) nur bei Gleichheit ihrer Temperaturen im Gleichgewicht sein. Stimmen die Temperaturen T1 und T2 zweier Systeme bei Herstellung thermischen Kontakts nicht überein, so fließt Wärme vom wärmeren System (dem mit der höheren Temperatur) zum kälteren, bis die Temperaturen angeglichen sind. Die Richtigkeit dieser Ihnen auch aus dem Alltag geläufigen Aussage folgt aus der Ungleichung (19.13). Bilden wir nämlich die Differenz S −S 0 aus (19.22) und (19.23), der Einfachheit halber für den Fall infinitesimaler Abweichung vom Gleichgewicht, so entsteht die Ungleichung ∂S20 (e2 ) ∂S10 (e1 ) (Ē1 − e1 ) + (Ē2 − e2 ) > 0 . ∂e1 ∂e2 (19.28) Da anfänglich jedes Teilsystem für sich im Gleichgewicht sein soll, bedeutet (19.28) ¶ µ 1 1 − (Ē1 − e1 ) > 0 . (19.29) T1 T2 Sie lesen ab, dass das erste Teilsystem Wärme aufnimmt, Ē1 − e1 > 0, falls es anfänglich kälter ist als das zweite, T1 < T2 . Sie können nun den schon erwähnten Zusammenhang des Parameters β, der im kanonischen Ensemble die mittlere Energie fixiert, mit der absoluten Temperatur T erkennen. Differenzieren wir den kanonischen Ausdruck (19.5), also S(β, N, V ) = kB β Ē + kB ln Z, für die Entropie nach der mittleren Energie, so ergibt sich 1 ∂S = kB β , = T ∂ Ē 324 19 Thermodynamische Variable also β = 1/kB T . (19.30) Doch halt! Die vorstehende partielle Ableitung bedarf eines Kommentars! Die kanonische Form der Entropie erscheint als Funktion von β, N, V . Beim partiellen Differenzieren nach der Energie Ē sind Teilchenzahl N und Volumen V konstant zu halten; die Variable β ist dann als Funktion der Energie Ē anzusehen, so dass gilt ∂S 1 = T ∂ Ē (19.31) = kB β + kB Ē ∂β ∂ ln Z + kB . ∂ Ē ∂ Ē (19.32) Jedoch heben sich die beiden letzten Terme in vorstehender Gleichung auf, wegen ∂ ln Z/∂ Ē = (∂ ln Z/∂β)(∂β/∂ Ē) = −Ē(∂β/∂ Ē), so dass die kavaliersartig schnelle Rechnung im vorstehenden Absatz doch nicht falsch war! Für den Grenzfall beliebig großer Temperatur entnehmen wir (19.30) und der kanonischen Besetzungsverteilung w(Eν ) = Z −1 e−βEν , (19.33) dass die Besetzungswahrscheinlichkeiten für alle Energieniveaus gleich werden. Hingegen ist für den Grenzfall T → 0 ersichtlich, dass nur das niedrigste Energieniveau besetzt ist; thermisches Gleichgewicht am absoluten Nullpunkt der Temperatur bedeutet für jedes System sicheren Aufenthalt im Grundzustand. Es folgt, sofern der Grundzustand nicht entartet ist, dass die Entropie am absoluten Nullpunkt verschwindet, S→0 für T →0. (19.34) Dieses Resultat ist als dritter Hauptsatz der Thermodynamik bekannt. Einen ebenfalls aufschlussreichen Zusammenhang zwischen der absoluten Temperatur, der mittleren Energie Ē und der Niveaudichte Ω(Ēν ) erhalten wir, wenn wir in (19.27) den mikrokanonischen Ausdruck (19.4) für die Entropie benutzen, 1 ∂ ln Ω(Ē)∆E = kB . T ∂ Ē (19.35) Da für Vielteilchensysteme ein starkes Anwachsen der Niveaudichte bei zunehmender Energie typisch ist, können wir folgern, dass solche Systeme keine negativen Temperaturen annehmen können, T ≥0. (19.36) Insofern das Anwachsen der Niveaudichte mit der Energie qualitativ durch Ω(Ē) = A Ē aN (19.37) beschrieben werden kann (wobei a für hinreichend verdünnte Gase von der Größenordnung Eins ist), dürfen wir aus (19.35) schließen, dass die absolute Temperatur über die Relation Ē = aN kB T (19.38) 19.3 Druck 325 die Größenordnung der mittleren Energie pro Freiheitsgrad eines Vielteilchensystems misst. Eine weitere, historische Bemerkung ist am Platze. Wir haben durch Einführung der Boltzmannkonstanten in (19.1) der Entropie die Dimension einer Energie zugewiesen. Als Konsequenz dieser Konvention wird die Temperatur zu einer dimensionslosen Variablen. Der Zahlenwert der Boltzmannkonstanten geht übrigens zurück auf eine (inzwischen überholte) Definition der Temperaturskala, bei der dem Schmelz- und dem Siedepunkt von H2 O unter gewissen Normalbedingungen“ die Temperatur 0◦ Celsius bzw. 100◦ Celsius zugeschrie” ben werden. Diese Celsius’sche Temperatur T (c) ist mit der in Grad Kelvin angegebenen absoluten Temperatur verknüpft durch die Übereinkunft, dass Temperaturdifferenzen in beiden Skalen numerisch gleich sind und dass 0◦ Celsius der absoluten Temperatur 273, 15◦ Kelvin entspricht, T = T (c) + 273, 15 . (19.39) Mit den beschriebenen Konventionen für Dimensionen und Einheiten wäre völlig gleichwertig eine Übereinkunft, die Temperatur mit der Dimension einer Energie auszustatten und somit die Entropie als dimensionslose Variable zu definieren. Wegen des innigen Zusammenhangs von Entropie und Wahrscheinlichkeit und weil die Temperatur gemäß (19.38) ein grobes Maß für die mittlere Energie darstellt, wäre eine derartige Konvention sogar recht naheliegend. Aber einer kleinen Zweckmäßigkeit wegen verwerfen wir nicht schnöde eine liebe Tradition. 19.3 Druck In Gefäßen eingesperrte Systeme üben i. A. Kräfte auf die Gefäßwände aus. Die Kraft pro Flächeneinheit der Gefäßwand wird als Druck bezeichnet. Sie kennen die elementare gaskinetische Vorstellung, die den Druck eines Gases erklärt als den Impulsübertrag auf das Gefäß bei der unaufhörlichen Folge von Stößen der Teilchen im Gas gegen die Wand. Hier will ich Ihnen die allgemeine quantenstatistische Methode zur Berechnung des Drucks eines Systems im thermischen Gleichgewicht erklären. Liegt das fragliche System in einem Energieeigenzustand ψν mit der Energie Eν vor, so bezeichnen wir als seinen Druck die Größe pν = − ∂Eν . ∂V (19.40) Dieser Druck könnte im Prinzip gemessen werden über die infinitesimale Änderung der Energie Eν (V ) bei sehr langsamer Änderung des Volumens um dV ; die Volumenänderung hätte so langsam zu erfolgen, dass das System den Energieeigenzustand zur laufenden“ Energie Eν (V ) nicht verlässt. Die experimentelle ” Vorgabe der Energie eines Vielteilchensystems bedeutet allerdings i. A. nicht die Präparation genau eines Energieeigenzustandes, vielmehr die Herstellung eines Gemisches, in dem der Zustand ψν mit der relativen Häufigkeit w(Eν ) auftritt. Der Druck ist dann als statistisches Mittel über die pν zu berechnen, p=− X ν w(Eν ) ∂Eν . ∂V (19.41) 326 19 Thermodynamische Variable Die Auswertung der Summe (19.41) gestaltet sich besonders einfach, wenn die kanonische Zustandssumme Z∞ X −βEν (19.42) ≈ dE Ω(E, V ) e−βE e Z(T, V ) = ν E0 als Funktion der Temperatur und des Volumens schon bekannt ist, denn für das kanonische Ensemble gilt µ ¶ X ∂Z ∂Eν = β −1 Z −1 p = −Z −1 , (19.43) e−βEν ∂V ∂V T ν also βp = µ ∂ ln Z ∂V ¶ . (19.44) T Hier soll der Index T an der rechten Seite andeuten, dass die Differenziation nach dem Volumen bei konstanter Temperatur erfolgen muss. Die Relation (19.44) gibt den Druck als Funktion von Temperatur und Volumen (sowie ggf. weiterer äußerer Parameter, die jedoch bei den von uns zu behandelnden Systemen nicht auftreten). Sie wird die Zustandsgleichung des Systems genannt. Statt der kanonischen Zustandssumme Z können wir in (19.44) mit Hilfe von (19.5) die Entropie S und die mittlere Energie Ē einführen, ·µ ¶ µ ¶ ¸ ∂S 1 ∂ Ē p=T . (19.45) − ∂V T T ∂V T Beachten Sie, dass die Entropie in (19.45) als Funktion des Volumens und der beim Differenzieren nach V konstant zu haltenden Temperatur anzusehen ist. Tatsächlich ist es üblich, S als Funktion von V und der mittleren Energie Ē anzugeben. Die Identität µ µ µ ¶ ¶ µ ¶ µ ¶ ¶ µ ¶ ∂S ∂S ∂S ∂ Ē 1 ∂ Ē ∂S(Ē, V ) = = + + ∂V ∂V Ē ∂V Ē T ∂V T ∂ Ē V ∂V T T (19.46) erlaubt, diesem Brauch zu folgen und die Zustandsgleichung (19.45) zu µ ¶ ∂S p=T (19.47) ∂V Ē zu vereinfachen. Verwenden wir in (19.47) den mikrokanonischen Ausdruck (19.4) für die Entropie, so erscheint der Druck als durch die Niveaudichte Ω(E, V ) gegeben, p = kB T ∂ ln Ω(Ē, V ) . ∂V (19.48) Schließlich können wir den Druck auch mit Hilfe des großkanonischen Ensembles berechnen, d. h. durch die großkanonische Zustandssumme XX ZG (T, V, µ) = e−β(Eν −µN ) (19.49) N ν 19.4 Chemisches Potential 327 ausdrücken. Eine Nebenrechnung, die zu der in (19.43) ausgeführten völlig parallel läuft, ¶ µ X ∂Eν ∂ZG −1 −1 p = −ZG e−β(Eν −µN ) , (19.50) = β −1 ZG ∂V ∂V T,µ N,ν gibt statt (19.44) βp = µ ∂ ln ZG ∂V ¶ . (19.51) T,µ Hieraus ergibt sich p als Funktion von V , T und des chemischen Potentials µ. Die letztere Größe kann gemäß µ ¶ ∂ ln ZG N̄ = kB T (19.52) ∂µ T,V zugunsten der mittleren Teilchenzahl aus der Zustandsgleichung eliminiert werden. Ihnen sollte hinlänglich klar sein, dass die drei Formen (19.44, kanonisch), ((19.48), mikrokanonisch) und ((19.51), großkanonisch) der Zustandsgleichung für Vielteilchensysteme miteinander äquivalent sind. Die Freiheit, beim Aufstellen der Zustandsgleichung von Vielteilchen systemen irgendeines der drei Ensembles benutzen zu dürfen, wird uns im folgenden viel unerfreuliche Rechenarbeit zu sparen erlauben. 19.4 Chemisches Potential Das chemische Potential µ war uns in 18.6 bei der Einführung des großkanonischen Ensembles als ein Parameter begegnet, mit dessen Hilfe die mittlere Teilchenzahl im Ensemble festgelegt wird. In genau diesen Hilfsdienst werden wir µ im nächsten Kapitel stellen. Hier will ich Ihnen erläutern, dass das chemische Potential auch eine eigene physikalische Bedeutung hat. Wenn bei festem Volumen (und sonstigen äußeren Parametern) sowie konstanter Entropie die Teilchenzahl geändert wird, so ändert sich die Energie gemäß ¶ µ ∂ Ē =µ. (19.53) ∂N S,V Zum Beweis dieser Eigenschaft des chemischen Potentials greifen wir auf den großkanonischen Ausdruck für die Entropie (19.9) zurück und schreiben denselben in differenzieller Form, dS = kB d(ln ZG ) + 1 1 1 (−Ē + µN ) dT + dĒ − (N̄ dµ + µ dN̄ ) . (19.54) T2 T T Nun ist die großkanonische Zustandssumme definiert als eine Funktion der Variablen T , V (über die Energiewerte) und µ. Ihr allgemeines Differential lautet also µ ¶ ¶ ¶ µ µ ∂ ln ZG ∂ ln ZG ∂ ln ZG d ln ZG = dT + dV + dµ . (19.55) ∂T ∂V ∂µ V,µ T,µ T,V 328 19 Thermodynamische Variable Die hier auftretenden Koeffizienten von dV und dµ hatten wir in (19.51) bzw. (19.52) bereits als βp bzw. β N̄ identifiziert, während sich der Koeffizient von dT aus (18.42) als (Ē − µN̄ )/kB T 2 ergibt. Damit erhalten wir für das Entropiedifferential (19.54) den Ausdruck T dS = dĒ + pdV − µdN̄ , (19.56) aus dem Sie die Relation (19.53) sowie die analoge Eigenschaft des Drucks µ ¶ ∂ Ē p=− (19.57) ∂V S,N entnehmen. Zwischen dem chemischen Potential und dem Druck besteht insofern eine Analogie, als beide Größen die isentropische (dS = 0) Antwort der mittleren Energie auf die differenzielle Änderung eines äußeren Parameters, nämlich Teilchenzahl bzw. Volumen, angeben. (Man spricht auch von generalisierten Kräften; die äußeren Parameter wären dann als generalisierte Koordinaten zu bezeichnen.) Dementsprechend gilt für das chemische Potential auch eine zu unserer Definition des Druckes (19.41) analoge Relation, µ= X ν,N w(EνN ) ∂EνN . ∂N (19.58) Zum Beweis von (19.58) verwenden wir das großkanonische Ensemble. Die rechte Seite erlaubt dann folgende Umformung µ ¶X ∞ 1 ∂ X −βEνN 1 X −β(EνN −µN ) ∂EνN e =− . eβµN e ZG ∂N βZG ∂N ν ν,N Hierin ist P ν N =0 exp(−βEνN ) ≡ Z(N ) die kanonische Zustandssumme bei fixer Teilchenzahl N . Die Ableitung dieser Größe nach N können wir approximieren als ¤ 1 £ ∂ Z(N ) ≈ Z(N ) − Z(N − δN ) , ∂N δN (19.59) wobei δN irgendeine im Vergleich zur mittleren Teilchenzahl N̄ winzige Zahl sein darf. Die rechte Seite von (19.58) nimmt dann folgende Form an − µ 1 βZG ¶ ∞ ¤ 1 X −βµN £ e Z(N ) − Z(N − δN ) δN N =0 " # ¶ µ X 1 1 βµN ZG − =− e Z(N − δN ) βZG δN N ≈− 1 1 (1 − eβµδN ) . β δN (19.60) Das letzte Glied in der Gleichungskette (19.60) entsteht nach Einführung der neuen Summationsvariablen N 0 = (N − δN ) in exzellenter Näherung, da die 19.4 Chemisches Potential 329 Teilchenzahlsumme im vorletzten Glied erhebliche Beiträge nur für Werte von N in Nähe der mittleren Teilchenzahl N̄ erhält. Im Grenzübergang δN → 0 ergibt sich schließlich in (19.60) das chemische Potential µ. Nachdem nun die enge Verwandtschaft von Druck und chemischem Potential ausführlich gewürdigt worden ist, verdient auch ein kleiner Unterschied Aufmerksamkeit, das negative Vorzeichen in der Definition des Drucks. Es sorgt dafür, dass Systeme im Gleichgewicht einen positiven Druck haben. Warum wäre im Umgang mit großen Systemen mit negativem Druck äußerste Vorsicht geboten? 330 19 Thermodynamische Variable Kapitel 20 Ideale Gase 20.1 Ununterscheidbarkeit identischer Teilchen Beim Beobachten der Bewegung mehrerer identischer klassischer Teilchen (z. B. Billardkugeln) kann man immer, jedenfalls im Prinzip, die einzelnen Teilchen unterscheiden: jedes der im übrigen gleichen Teilchen durchläuft seine eigene Bahnkurve und kann an derselben jederzeit identifiziert werden. Bei Quanten hingegen ist diese Unterscheidungsmöglichkeit nicht gegeben, da wegen des Wellencharakters der Bewegung von einer Bahnkurve gar nicht gesprochen werden kann. Tatsächlich sind identische Quanten (wie die 47 Elektronen in der Hülle eines Silberatoms, die Natriumatome in einem Salzkorn, die beiden Wasserstoffatome in einem Wasserstoffmolekül . . .) auf keine Weise voneinander unterscheidbar. Ich will Ihnen hier einige der drastischen Konsequenzen der Ununterscheidbarkeit identischer Quanten vorstellen. Betrachten wir zunächst zwei identische Teilchen, die durch die Wellenfunktion Φ(~x1 , ~x2 ) beschrieben werden. Das Absolutquadrat |Φ(~x1 , ~x2 )|2 gibt die Wahrscheinlichkeitsdichte dafür, eines der Teilchen bei ~x1 und das andere bei ~x2 zu finden. Die Ununterscheidbarkeit der beiden Teilchen macht die Frage, welches von ihnen bei ~x1 angefunden wird, unbeantwortbar. Dementsprechend muss die Wahrscheinlichkeitsdichte |Φ(~x1 , ~x2 )|2 symmetrisch unter Vertauschung der Koordinatentripel ~x1 und ~x2 sein, |Φ(~x1 , ~x2 )|2 = |Φ(~x2 , ~x1 )|2 . (20.1) Ein etwaiger Unterschied |Φ(~x1 , ~x2 )|2 von |Φ(~x2 , ~x1 )|2 würde nämlich bedeuten, dass zwei verschiedene und verschieden wahrscheinliche Ereignisse des Typs ein ” Teilchen wird bei ~x1 , das andere bei ~x2 registriert“ möglich sind und somit eine Unterscheidbarkeit der beiden Teilchen begründen. Die Symmetrie der Wahrscheinlichkeitsdichte erzwingt, dass die Wellenfunktion Φ(~x1 , ~x2 ) entweder symmetrisch oder antisymmetrisch ist, Φ(~x1 , ~x2 ) = ±Φ(~x2 , ~x1 ) . (20.2) Beide Möglichkeiten kommen in der Natur vor. Die Erfahrung lehrt, dass die Wellenfunktionen identischer Fermiteilchen (d. h. Teilchen mit halbzahligem Spin wie Elektronen, Protonen, Neutronen etc.) ausnahmslos antisymmetrisch 331 332 20 Ideale Gase sind, während die Koordinaten identischer Boseteilchen (Teilchen mit ganzzahligem Spin wie α-Teilchen, π-Mesonen etc.) stets symmetrisch in der Wellenfunktion auftreten. Diese Eigenart von Bosonen und Fermionen ist nicht nur bei Zweiteilchensystemen gegeben. Liegen N identische Teilchen vor, so gilt Φ(~x1 . . . ~xi . . . ~xj . . . ~xN ) = ( +Φ(~x1 . . . ~xj . . . ~xi . . . ~xN ) für Bosonen −Φ(~x1 . . . ~xj . . . ~xi . . . ~xN ) für Fermionen (20.3) bezüglich aller N (N − 1)/2 Paare von Koordinatentripeln. Zur weiteren Erläuterung des Prinzips der Ununterscheidbarkeit betrachten wir zwei freie und nicht wechselwirkende identische Teilchen. Der Hamiltonoperator ist rein kinetischer Natur, H= 1 2 (~ p + p~22 ) . 2m 1 (20.4) Die Schrödingergleichung i~Φ̇(~x1 , ~x2 , t) = HΦ(~x1 , ~x2 , t) (20.5) kann durch den Separationsansatz ψ(~x1 , t)ϕ(~x2 , t) gelöst werden, wobei sich die Einteilchenwellenfunktionen ψ(~x, t) und ϕ(~x, t) als ebene Wellen exp(i~k · ~x − iE~k t/~) und E~k = ~2 k 2 /2m (oder Linearkombinationen solcher ebener Wellen) erweisen. Allerdings kommen in der Natur keine Zustände vor, die das Produkt ψ(~x1 )ϕ(~x2 ) als Wellenfunktion hätten. Wohl aber entspricht das symmetrisierte Produkt £ ¤ ΦS (~x1 , ~x2 , t) = N ψ(~x1 , t)ϕ(~x2 , t) + ψ(~x2 , t)ϕ(~x1 , t) (20.6) einem möglichen Zustand zweier identischer Bosonen und das antisymmetrisierte Produkt £ ¤ ΦA (~x1 , ~x2 , t) = N ψ(~x1 , t)ϕ(~x2 , t) − ψ(~x2 , t)ϕ(~x1 , t) (20.7) einem möglichen Zustand zweier identischer Fermionen. Der in (20.6) und (20.7) auftretende Normierungsfaktor N garantiert, dass die Zweiteilchenwellenfunktionen auf Eins normiert sind, wenn die Einteilchenwellenfunktionen diese Eigenschaft haben, Z Z Z Z 2 2 2 d3 x1 d3 x2 |ΦA,S (~x1 , ~x2 , t)| = d3 x1 |ψ(~x1 , t)| = d3 x2 |ϕ(~x1 , t)| = 1 . (20.8) √ Insbesondere hat der Normierungsfaktor den Wert N = 1/ 2, falls die beiden Einteilchenwellenfunktionen orthogonal sind. Aus (20.7) erkennen Sie, dass zwei identische Fermionen nicht in einunddemselben Einteilchenzustand sitzen können: für ψ = ϕ verschwindet das antisymmetrisierte Produkt ΦA Diese Konsequenz der Ununterscheidbarkeit identischer Quanten ist als das Pauliprinzip bekannt. Für Bosonen besteht hingegen kein Verbot der Mehrfachbesetzung eines Einteilchenzustandes. 20.1 Ununterscheidbarkeit identischer Teilchen 333 Sie sollten sich überlegen, dass aus drei normierten Einteilchenwellenfunktionen ϕ(~x), ψ(~x) und χ(~x) nur die folgenden (normierten) Dreiteilchenwellenfunktionen 1 £ ΦSA (~x1 , ~x2 , ~x3 ) = √ ϕ(~x1 )ψ(~x2 )χ(~x3 ) ± ϕ(~x1 )ψ(~x3 )χ(~x2 ) 6 ± ϕ(~x2 )ψ(~x1 )χ(~x3 ) + ϕ(~x2 )ψ(~x3 )χ(~x1 ) ¤ ±ϕ(~x3 )ψ(~x2 )χ(~x1 ) + ϕ(~x3 )ψ(~x1 )χ(~x2 ) (20.9) gebildet werden können. Lesen sie wieder ab, dass ΦA verschwindet, wenn zwei oder gar alle drei Einteilchenwellenfunktionen übereinstimmen, während in ΦS Doppel- oder gar Dreifachbesetzung √ eines Einteilchenzustandes durchaus erlaubt ist. (Der Normierungsfaktor 1/ 6 ist allerdings nur für normierte und wechselseitig orthogonale ϕ, ψ, χ richtig; suchen Sie den Normierungsfaktor für die bei Bosonen möglichen Mehrfachbesetzungen ϕ = ψ ⊥ χ und ϕ = ψ = χ.) Sie werden im Folgenden lernen, dass die verschiedene Besetzbarkeit von Einteilchenzuständen durch identische Fermionen (höchstens einfach) und Bosonen (keine Beschränkung) sich makroskopisch manifestiert in verschiedenem Tieftemperaturverhalten von Gasen aus identischen Fermi- und Boseteilchen. Denken wir uns nochmals zwei Identische Quanten ohne Wechselwirkung. ~ verschiedenen Orten lokalisiert, bezüglich dieser Sie seien an um den Vektor X Orte jedoch jedes für sich durch dieselbe Einteilchenwellenfunktion ψ beschrieben. Als gemeinsame Zweiteilchenwellenfunktion kommt nun nicht das Produkt ~ in Frage, sondern für Bosonen das symmetrisierte und für Ferψ(~x1 )ψ(~x2 − X) mionen das antisymmetrisierte Produkt i 1 h ~ ± ψ(~x1 − X)ψ(~ ~ x2 ) . (20.10) ΦSA (~x1 , ~x2 ) = √ ψ(~x1 )ψ(~x2 − X) 2 Die entsprechende Wahrscheinlichkeitsdichte dafür, beide Teilchen am gleichen Ort ~x zu finden, |Φ(~x, ~x)|2 , verschwindet offenbar für Fermionen (Pauliprinzip!) während sie für Bosonen das Doppelte des Wertes beträgt, den sie für unter~ hätte. scheidbare Teilchen, d. h. Φ = ψ(~x1 )ψ(~x2 − X), Noch eine andere Erkenntnis ziehen wir aus (20.10). Sie müssen nicht ein auf Ihrer Nasenspitze sitzendes Proton und ein anderes im Barte Ihres Großvaters durch eine Wellenfunktion beschreiben, die antisymmetrisch unter Vertauschung der respektiven Koordinatentripel ist. Ist nämlich die Wellenfunktion ψ(~x) in (20.10) auf Eins normiert, so muss sie für hinreichend großes |~x| nach Null gehen. Sei etwa |ψ(~x)|2 für |~x| > R auf vernachlässigbar kleine Werte abgefallen. Falls ~ den Radius“ R des in der Zweiteilchenwellenfunktion (20.10) der Abstand |X| ” Wellenpakets ψ überschreitet, ~ ÀR, |X| (20.11) so können nie beide Summanden in (20.10) zugleich merklich von Null verschieden sein. Statt durch (20.10) können die beiden Teilchen dann durch das Produkt ~ Φ(~x1 , ~x2 ) = ψ(~x1 )ψ(~x2 − X) (20.12) beschrieben werden, u. z. unabhängig davon, ob es sich um Bosonen oder Fermionen handelt. 334 20 Ideale Gase Die soeben vorgestellte Überlegung erlaubt uns eine Abschätzung der Temperatur, unterhalb derer in einem idealen Gas identischer Teilchen die quantenmechanische Ununterscheidbarkeit derselben merklich wird, oberhalb derer sich demnach auch Bose- und Fermigase gleich verhalten. Sie wissen bereits (s. 19.2), dass die Größenordnung der mittleren Energie pro Teilchen eines Gases durch die Temperatur T festgelegt ist über E ≈ kB T . Diese Energie ist beim idealen Gas rein kinetisch, so √ dass der Betrag des mittleren Impulses eines Teilchens von der Ordnung p ≈ mkB T ist. Die zugehörige Wellenlänge ~/p, die thermische de Broglie Wellenlänge p λth = 2π~2 /mkB T , (20.13) gibt die Größenordnung der prinzipiellen Grenze für die Lineardimension, mit der wir uns die Teilchen des Gases räumlich lokalisiert denken dürfen. Wenn der mittlere Teilchenabstand l ≈ (V /N )1/3 viel größer ist als die typische Ortsunschärfe (20.13) eines Teilchens, l À λth , (20.14) so können Quanteneffekte wie die Ununterscheidbarkeit identischer Teilchen vernachlässigt werden. Dieser klassische Grenzfall wird für hinreichende Verdünnung und/oder genügend hohe Temperaturen erreicht. Aus der Gleichung l = λth erhalten Sie die Temperatur, unterhalb welcher sich Quanteneffekte, also auch der Unterschied zwischen Bosonen und Fermionen deutlich bemerkbar machen. 20.2 Thermische Photonen (Plancksches Strahlungsgesetz) Wir betrachten das elektromagnetische Feld im Innern eines Hohlraumes. Die Atome in den Wänden, die den Hohlraum umschließen, emittieren und absorbieren fortwährend elektromagnetische Strahlung und wechselwirken auch untereinander. Die Wände und das elektromagnetische Feld seien miteinander im thermischen Gleichgewicht. ~ x, t) im Hohlraum lässt sich als Superposition von Das elektrische Feld E(~ ebenen monochromatischen transversalen Wellen ~ x, t) = ê ei(~k·~x−ω~k t) E(~ (20.15) darstellen, wobei die Frequenz ω~k und der Wellenvektor ~k durch die Dispersionsrelation ω~k = c|~k| (20.16) verknüpft sind (s. 6.6). Der Einheitsvektor ê in (20.15) gibt die Polarisationsrichtung der Schwingung. Wegen der Transversalität der elektromagnetischen Welle steht ê senkrecht zur Ausbreitungsrichtung ê · ~k = 0 . (20.17) 20.2 Thermische Photonen 335 Zu jedem Wellenvektor ~k gibt es demnach zwei unabhängige Wahlen für die Orientierung des Einheitsvektors ê. Die klassische Elektrodynamik erlaubt für jede der unabhängigen Wahlen (20.15) eine beliebige komplexe Amplitude. Zur Behandlung der thermischen Eigenschaften des Strahlungsfeldes müssen wir jedoch den Quantencharakter des Feldes berücksichtigen und dazu jede der unabhängigen Schwingungen exp(−iω~k t) als einen harmonischen Oszillator ansehen, der Energie nur in der diskreten Einheit ~ω~k abgeben und aufnehmen kann. Die Energieeigenwerte eines solchen Oszillators kennen Sie aus 13.1 als µ ¶ 1 ε~k,ê = ~ω~k n~k,ê + , (20.18) 2 wobei die Zahl der Quanten (hier Photonen) im Oszillator mit dem Wellenvektor ~k und der Polarisationsrichtung ê alle ganzzahligen Werte annehmen kann, n~kê = 0, 1, 2, . . . . (20.19) Die Gesamtenergie des Strahlungsfeldes erhalten wir durch Summation der Beiträge aller unabhängigen Wellen als X E({n~k,ê }) = n~k,ê ~ω~k + E0 . (20.20) ~ k,ê Die Grundzustandsenergie E0 = X ~ω~k /2 . (20.21) ~ k,ê will ich im Folgenden durch Neuwahl des Energienullpunktes zum Verschwinden gebracht denken. Die Form (20.20) der Gesamtenergie legt nahe, Photonen als Teilchen anzusehen. Indem Sie sich dieser Vorstellung hingeben, dürfen Sie jedoch nicht außer Acht lassen, dass die Gesamtzahl der Photonen X (20.22) N= n~k,ê ~ k,ê nicht fixiert ist, da die Beiträge n~k,ê der einzelnen Oszillatoren ganz unabhängig voneinander sind. Im Übrigen ist diesen Teilchen Bosonencharakter zuzuweisen, da gemäß (20.19) beliebig viele (anstatt höchstens eines) Teilchen der Sorte ~k, ê vorkommen dürfen. Um uns die thermischen Eigenschaften des Photonengases zu erschließen, verwenden wir das kanonische Ensemble und berechnen zunächst die Zustandssumme X Z= e−βE({n~k,ê }) . (20.23) {n~k,ê =0,1,2,...} Hierin ist für jeden der durch ~k und ê nummerierten Oszillatoren über alle möglichen Besetzungszahlen zu summieren. Nach Eintragen von (20.20) und 336 20 Ideale Gase (20.16) können wir Z als das Produkt Y Z= Z~k,ê (20.24) ~ k,ê Z~k,ê = ∞ X n~k,ê =0 ³ ´ ~ −1 e−β~ω~k n~k,ê = 1 − e−β~c|k| schreiben. Da der Faktor Z~k,ê die Zustandssumme für den Oszillator mit Wellenvektor ~k und Polarisationsrichtung ê, für die beiden bei festem ~k möglichen unabhängigen Richtungen ê den gleichen Wert hat, ergibt sich für die Zustandssumme Y¡ ~ ¢−2 Z= 1 − e−β~c|k| , (20.25) ~ k oder ln Z = − 2 X ~ k ¡ ~ ¢ ln 1 − e−β~c|k| . (20.26) Das Produkt in (20.25) und die Summe in (20.26) laufen nur noch über alle erlaubten Werte des Wellenvektors. Welche Werte der Wellenvektor ~k annehmen darf, hängt (wie immer bei in Kästen eingesperrten Wellen) von den Randbedingungen an der inneren Oberfläche des Hohlraumes und auch von der Form des Hohlraums ab. Universelle, d. h. von der Form des Hohlraums unabhängige Aussagen können wir nur gewinnen für den Spektralbereich, in dem alle Wellenlängen λ = 2π/|~k| klein sind gegenüber allen Lineardimensionen des Hohlraums. Für diesen Spektralbereich ist plausibel (und lässt sich zeigen), dass die erlaubten Wellenvektoren bei Änderung der Randbedingungen unverändert bleiben. Wir nutzen die entsprechende Freiheit, denken uns den Hohlraum als von der Form eines Würfels mit der Kantenlänge L und unterwerfen die ebenen Wellen (20.15) periodischen Randbedingungen ~ + L, y, z) = E(x, ~ ~ ~ E(x y + L, z) = E(x, y, z + L) = E(x, y, z) . (20.27) Für die erlaubten Wellenvektoren erhalten wir somit die Bedingungen eikx L = eiky L = eikz L = 1 . Die drei Komponenten von ~k haben also alle ganzzahligen Vielfachen von (2π/L) als erlaubte Werte, kx = 2π nx , L nx = 0, 1, 2, . . . . (20.28) Die Gültigkeit dieses Resultats ist allerdings beschränkt auf den Spektralbereich λ = 2π/|~k| ¿ L, d. h. ¢1 2π 2π ¡ 2 nx + n2y + n2z 2 À . |~k| = L L (20.29) 20.2 Thermische Photonen 337 Die Differenz zweier benachbarter Werte einer Wellenvektorkomponente beträgt nach (20.28) ∆k = 2π . L (20.30) Nach (20.29) ist diese Differenz sehr klein gegenüber allen durch (20.28) richtig angegebenen erlaubten Wellenzahlen |~k|. Bei derart dicht liegenden Wellenvektoren können Wellenvektorsummen wie die in (20.26) durch Integrale ersetzt werden. Unter Beachtung von (20.30) gewinnen wir die Ersetzungsvorschrift µ ¶3 X Z X L V −→ ∆kx ∆ky ∆kz −→ d3 k . (20.31) 2π (2π)3 kx ,ky ,kz kx ,ky ,kz Für den Logarithmus der Zustandssumme erhalten wir nun das Integral Z ³ ´ V 3 −β~c|~ k| d k ln 1 − e , (20.32) ln Z = −2 (2π)3 das wir wegen der Isotropie des Integranden am bequemsten in Kugelkoordinaten ausführen. Dabei gibt die Winkelintegration den Faktor Zπ dθ sin θ 0 Zπ dϕ = 4π . (20.33) 0 Die Integration über den Betrag des Wellenvektors ist von einer unteren Grenze kmin À L1 entsprechend dem Gültigkeitsbereich (20.29) unserer Wellenvektorbestimmung bis ins Unendliche zu erstrecken, 1 ln Z = − 2 V π Z∞ kmin ¡ ¢ dk k 2 ln 1 − e−β~ck . (20.34) Wir werden weiter unten sehen, dass die untere Integrationsgrenze kmin für hinreichend hohe Temperaturen, kB T À ~ c V −1/3 , (20.35) ohne merklichen Fehler für das Integral nach Null verschoben werden darf, 1 ln Z = − 2 V π Z∞ 0 ¡ ¢ dk k 2 ln 1 − e−β~ck . (20.36) Nach Übergang zu der dimensionslosen Integrationsvariablen x = β~ck erhalten wir Z∞ ¡ ¢ 1 V dx x2 ln 1 − e−x ln Z = − 3 2 (β~c) π 0 und schließlich, mit Hilfe einer Integraltafel, ln Z = π2 V . 45 (β~c)3 (20.37) 338 20 Ideale Gase Jetzt sind uns alle thermischen Eigenschaften des Photonengases unmittelbar zugänglich. Nach (18.28) gilt für die mittlere Energie ¶ µ π2 V ∂ ln Z = Ē = − (kB T )4 . (20.38) ∂β 15 (~c)3 V Dieses Resultat können Sie lesen als das Produkt der mittleren thermischen Energie pro Freiheitsgrad (Größenordnung kB T ) und der Zahl der im Volumen V verfügbaren Freiheitsgrade des Feldes, deren Größenordnung mit Hilfe der thermischen Wellenlänge λmax = 2πc/ωmax (siehe weiter unten für die Frequenz maximaler Strahlungsintensität ωmax ) als V /λ3max ∝ V (kB T /~c)3 geschätzt werden kann. Für den Druck, den Sie sich übrigens durch Stöße der Photonen gegen die Kastenwand anschaulich machen können, erhalten wir gemäß (19.44) ¶ µ 1 Ē π2 1 ∂ ln Z (kB T )4 = . (20.39) = p = kB T 3 ∂V 45 (~c) 3 V T Bemerkenswerterweise ändert sich der Photonendruck bei isothermer (T = const) Kompression nicht, da p bei T = const nicht vom Volumen V abhängt. Von Interesse ist auch die durch ¶ µ ∂ Ē (20.40) CV = ∂T V definierte Wärmekapazität bei konstantem Volumen, die wir aus (20.38) zu CV = 4π 2 V k4 T 3 15 (~c)3 B (20.41) erhalten. Um schließlich die Verteilung der Gesamtenergie über die Strahlungsfrequenzen zu studieren, gehen wir zurück zum Integral (20.36) und ersetzen dort die Wellenzahl k durch die Frequenz ω = ck als Integrationsvariable. Durch Differenzieren nach β gemäß (18.28) gewinnen wir die mittlere Energie in der Form V~ 1 Ē = 3 2 c π Z∞ 3 dω ω (e 0 β~ω − 1) −1 ≡V Z∞ dω u(ω) 0 und lesen für die so genannte spektrale Energiedichte u(ω) das von Max Planck im Jahr 1900 gefundene Plancksche Strahlungsgesetz ab u(ω) = 1 ~ω 3 /c3 . π 2 eβ~ω − 1 (20.42) Die in Abbildung 20.1 gezeigte spektrale Energiedichte fällt exponentiell nach Null für ω → ∞, verschwindet wie ω 2 für ω → 0 und hat ein Maximum bei der Frequenz ωmax = 2, 82kB T /~ . (20.43) Dieser lineare Zusammenhang zwischen der Frequenz maximaler Strahlungsintensität und der Temperatur ist als das Wiensche Verschiebungsgesetz bekannt. 20.2 Thermische Photonen 339 Abbildung 20.1 Sie können jetzt die Bedingung (20.35) für die Ersetzbarkeit der unteren Integrationsgrenze kmin in (20.34) durch Null verstehen. Genau dann, wenn die zu ωmax gehörige Wellenzahl kmax = ωmax /c groß ist gegenüber der inversen Lineardimension V −1/3 des Hohlraums, so dass gilt V −1/3 ¿ kmin ¿ kmax = 2, 82kB T /~c , (20.44) erhält das Integral (20.36) einen vernachlässigbaren Beitrag aus dem Integrationsintervall 0 ≤ k ≤ kmin , ist also mit (20.34) praktisch gleich. Das Plancksche Strahlungsgesetz kann experimentell verifiziert werden. Wenn durch die Wand eines Hohlraums ein kleines Loch gebohrt und die sekündlich pro Flächeneinheit des Lochs ins Frequenzintervall ∆ω bei der Frequenz ω nach außen gestrahlte Energie cu(ω)∆w gemessen wird. Alle hier für das Photonengas gewonnenen Resultate sind von wesentlich quantenmechanischer Natur. Wenn Sie versuchen, durch den formalen Grenzübergang ~ → 0 Quanteneffekte zu eliminieren, so erhalten Sie weder für die Energie, noch für den Druck und die Wärmekapazität wohldefinierte klassische Grenzwerte sondern jeweils unsinnige Divergenzen. Lediglich der langwellige (β~ω ¿ 1) Teil der spektralen Strahlungsdichte (20.42) hat einen sinnvollen klassischen Grenzwert, u(ω) = 1 kB T ω 2 /c3 , π2 (20.45) der als das Rayleigh-Jeanssche Gesetz schon vor 1900 bekannt war, sowohl empirisch wie auf Grund klassischer statistischer Überlegungen. Die dem RayleighJeansschen Gesetz für ω → ∞ eigene Ultraviolettkatastrophe u(ω) → ∞ wird im Planckschen Gesetz durch den für große Frequenzen auftretenden exponentiellen Abschneidefaktor e−β~ω verhindert. Max Planck benutzte bei der Konstruktion seiner Strahlungsformel (20.42) die von ihm selbst zunächst ungeliebte ad hoc Annahme, dass das Strahlungsfeld bei der Frequenz ω Energie nur in diskreten Portionen ~ω abgeben und aufnehmen könne. Die Annahme und ihre erste Konsequenz (20.42) markieren den Beginn der Quantenphysik. 340 20.3 20 Ideale Gase Thermische Phononen in Festkörpern Wenn N Atome einen festen Körper bilden, so ist i. A. jedes einzelne an eine Gleichgewichtslage gebunden, um die herum es Schwingungen ausführen kann. Bei hinreichend kleinen Schwingungsamplituden sind die einzelnen Rückstellkräfte in guter Näherung linear in den Auslenkungen, so dass die Bewegung der N Atome durch das Modell von 3N harmonischen Oszillatoren repräsentiert werden kann. Zur gesamten Schwingungsenergie trägt der i-te Oszillator in quantenmechanischer Behandlung einen der Werte εi = ~ωi (ni + 1/2), ni = 0, 1, 2, . . . bei. Die möglichen Werte der Gesamtenergie lauten also X ~ωi (ni + 1/2) . E({ni }) = (20.46) (20.47) i Das Energiequantum ~ωi , das so genannte Phonon, kann wie das Photon als Teilchen aufgefasst werden. Allerdings müssen wir wieder berücksichtigen, dass die Gesamtzahl dieser Teilchen, X ni , (20.48) N = i nicht festliegt, da die ni ganz unabhängig voneinander sind. Wie Photonen haben auch Phononen Bosecharakter, da die ni beliebige ganzzahlige Werte annehmen dürfen. Um uns die thermischen Eigenschaften des Phononengases zu erschließen, berechnen wir die kanonische Zustandssumme. Wie beim Photonengas ergibt sie sich aus X ln Z = − (20.49) ln(1 − e−β~ωi ) , i wobei die Grundzustandsenergie P i ~ωi /2 wieder unterdrückt ist. Die in (20.49) auftretende Summe lässt sich durch ein Frequenzintegral approximieren, da die Phononenfrequenzen bei makroskopischen Festkörpern sehr dicht liegen. Führen wir eine spektrale Dichte ρ(ω) so ein, dass die Zahl der zwischen ω und ω + dω liegenden Eigenfrequenzen 3N ρ(ω) dω beträgt. Damit ρ(ω) die Gesamtzahl 3N die Schwingungen richtig wiedergibt, muss gelten Z∞ dω ρ(ω) = 1 . (20.50) 0 Für die Zustandssumme erhalten wir nun die Kontinuumsnäherung ln Z = −3N Z∞ 0 dω ρ(ω) ln(1 − e−β~ω ) . (20.51) Die weitere Auswertung von Z gestaltet sich besonders einfach für tiefe Temperaturen, bei denen entsprechend ~ωi . kB T nur niederfrequente Schwingungen angeregt sind. Solche Schwingungen sind Ihnen als Schallwellen bekannt, 20.3 Thermische Phononen in Festkörpern 341 deren Wellenlängen λi = 2πc/ωi den mittleren Atomabstand im Festkörper (≈ 1 Å = 10−10 m) um mindestens einige Größenordnungen überschreiten. Bezüglich derart langwelliger Schwingungen bleibt die atomistische Struktur unerheblich und der Festkörper verhält sich wie ein elastisches Kontinuum. Die Abzählung der elastischen Schwingungen mit Frequenzen zwischen ω und ω + dω erfolgt ganz ähnlich wie die Abzählung der elektromagnetischen Schwingungen, die wir im letzten Paragrafen vorgenommen haben. Als wesentlicher Unterschied ist nur zu beachten, dass das elastische Kontinuum auch räumlich und zeitlich periodische Dichteschwankungen (Kompressionswellen) durchführen kann. Kompressionswellen werden auch als longitudinale Wellen bezeichnet, weil bei ebenen monochromatischen Kompressionswellen die Auslenkung eines Massenelements aus der Gleichgewichtslage stets parallel zum Wellenvektor verläuft. Langwellige Kompressionswellen in elastischen Kontinua sind erfahrungsgemäß durch die Dispersionsrelation ω(~k) = cl |~k| (20.52) gekennzeichnet, wobei cl die so genannte longitudinale Schallgeschwindigkeit ist. Wie im elektromagnetischen Feld treten auch im elastischen Kontinuum für jeden Wellenvektor ~k zwei unabhängige transversale Wellen (hier Scherwellen genannt) auf, bei denen die Auslenkung eines Massenelements aus der Gleichgewichtslage senkrecht zu ~k steht. Niederfrequente Scherwellen haben die Dispersionsrelation ω(~k) = ct |~k| . (20.53) Die hier auftretende Schallgeschwindigkeit ct ist i. A. von cl verschieden. Sowohl (20.52) wie (20.53) sind formgleich mit der Dispersionsrelation elektromagnetischer Wellen. Wir nehmen nun wie in 20.2 an, dass die räumliche Ausdehnung des Systems so groß ist, dass die genaue Art der Randbedingungen an der Oberfläche für die Abzählung der Eigenfrequenzen im interessanten Teil des Spektrums unerheblich bleibt. Aus (20.34) können wir dann die Zahl der Wellen im Frequenzintervall dω bei ω als V ω 2 dω/π 2 c3 ablesen für den Fall, dass zu einem Wellenvektor zwei unabhängige Wellen gehören. Im Fall von Schallwellen müssen wir für jeden Wellenvektor eine longitudinale und zwei transversale Schwingungen berücksichtigen und als spektrale Dichte ¶ µ 2 1 V ω2 (20.54) + 3N ρ(ω) = 2π 2 c3t c3l in Rechnung stellen. Das Phononenspektrum kann durch (20.54) nur für solche Wellenlängen gut wiedergegeben werden, die groß gegenüber dem mittleren Atomabstand a sind, also für ω ¿ c/a , (20.55) wobei c für ct oder cl steht. Bei der Verwendung der spektralen Dichte (20.54) zur Berechnung der Zustandssumme gemäß (20.51), V ln Z = − 2 2π µ 2 1 + 3 c3t cl ¶ Z∞ 0 dω ω 2 ln(1 − e−β~ω ) , (20.56) 342 20 Ideale Gase wird, da die Frequenzintegration bis zu unendlich großen Frequenzen läuft, der Gültigkeitsbereich (20.55) von (20.54) verlassen. Für hinreichend tiefe Temperaturen, kB T ¿ ~c/a , (20.57) entsteht dadurch jedoch kein merklicher Fehler, da der Integrand in (20.56) für ~ω > kB T mit wachsendem ω exponentiell abfällt, das Integral also seine dominierenden Beiträge aus dem Intervall 0 ≤ ~ω . kB T bezieht. Wie im 20.2 aus (20.36) erhalten wir nun aus (20.56) die Energie, die Wärmekapazität und den Druck des Phononengases zu µ ¶ ¶ µ π2 V 2 1 ∂ ln Z = + 3 (kB T )4 , (20.58) Ē = − ∂β 30 ~3 c3t cl V ¶ µ ¶ µ 2π 2 V 2 1 ∂ Ē 4 3 T (20.59) = + 3 kB CV = ∂T V 15 ~3 c3t cl bzw. p = kB T µ ∂ ln Z ∂V ¶ T π2 1 = 90 ~3 µ 1 2 + 3 c3t cl ¶ (kB T )4 = Ē . 3V (20.60) Die Proportionalität der Wärmekapazität zur dritten Potenz der Temperatur ist für elektrisch nicht leitende Festkörper im Grenzfall (20.57) empirisch gut bestätigt. Wir schließen aus diesem Befund, dass das thermische Tieftemperaturverhalten solcher Substanzen durch Phononen dominiert ist. Für kristalline Festkörper, bei denen Atome nur einer Sorte auf Gitterplätzen angeordnet sind ( einatomige“ Kristalle), erlauben die Überlegungen dieses Pa” ragrafen auch qualitative Aussagen über das Hochtemperaturverhalten der Phononen. Das Phononenspektrum entnehmen wir dem so genannten Debyemodell, in welchem das Phononenspektrum (20.54) als für alle Frequenzen gültig angesehen wird bis hinaus zu einer Grenzfrequenz, der Debyefrequenz ωD . Für Frequenzen ω > ωD wird ρ(ω) Null gesetzt. Dementsprechend wird die Debyefrequenz aus der Normierungsforderung 3N ZωD dω ρ(ω) = 3N (20.61) 0 zu ωD = ½ V 18π 2 N µ 2 1 + 3 3 ct cl ¶¾−1/3 (20.62) bestimmt. Die zugehörigen Debye-Wellenlängen sind also von der Größenordnung des mittleren Teilchenabstands. Der Erwartungswert der Gesamtenergie der Phononen ergibt sich dann als Ē = − µ ∂ ln Z ∂β ¶ V 3~ = 3N 3 ωD ZωD 0 dω ω3 . eβ~ω − 1 (20.63) 20.4 Das ideale Bosegas 343 Nach Übergang zur dimensionslosen Integrationsvariablen y = β~ω können wir die Energie Ē durch die Debyefunktion D(x) = 3 x3 Zx 0 dy y 3 /(ey − 1) ausdrücken, Ē = 3N kB T D µ ~ωD kB T ¶ . (20.64) (20.65) Dieses Resultat reduziert sich für tiefe Temperaturen wegen D(x) → π 4 /5x3 für x → ∞ auf das sehr viel universellere (alle festen Substanzen!) Ergebnis (20.58). Im Grenzfall hoher Temperaturen vereinfacht sich (20.65) wegen D(x) → 1 für x → 0 (vgl. Abbildung 20.2) zu Ē → 3N kB T für kB T À ~ωD . (20.66) Den Grenzfall (20.66) dürfen wir auch als klassischen Grenzfall bezeichnen, Abbildung 20.2 da der Hochtemperaturwert der Energie aus (20.65) auch durch den formalen Übergang ~ → 0 gewonnen werden kann. Für den Phononenbeitrag zur Wärmekapazität des einatomigen“ Kristalls erhalten wir aus (20.66) das em” pirisch gut gesicherte Dulong-Petit-Gesetz µ ¶ ∂ Ē CV = → 3N kB für kB T À ~ωD . (20.67) ∂T V Auf mehratomige“ Kristalle sind (20.66) und (20.67) nicht anwendbar, da ” in diesen Systemen neben den hier in Rechnung gestellten Schwingungen (den akustischen Phononen) weitere Schwingungen (so genannte optische Phononen) auftreten. Die Frequenzen optischer Phononen liegen meist sämtlich oberhalb ωD . Daher beeinflussen optische Phononen zwar nicht das thermische Tieftemperaturverhalten (kB T < ~ωD ), wohl aber die thermischen Eigenschaften für hohe Temperaturen (kB T > ~ωD ). 20.4 Das ideale Bosegas Denken wir uns N identische wechselwirkungsfreie Boseteilchen (der Einfachheit halber mit Spin Null) in einem würfelförmigen Kasten der Kantenlänge 344 20 Ideale Gase L = V 1/3 eingesperrt und nehmen periodische Randbedingungen für die N Teilchenwellenfunktion ψ(~x1 , ~x2 , . . . , ~xN ) an. Die Schrödingergleichung kann durch einen Separationsansatz gelöst werden, der für jedes Teilchen eine ebene Welle exp(i~k · ~x) in Rechnung stellt. Die möglichen Impulse ~~k eines Teilchens sind dann durch die Randbedingung eikx L = eiky L = eikz L = 1 (20.68) auf Tripel (~kx , ~ky , ~kz ) ganzzahliger Vielfacher von ~2π/L festgelegt, kx L/2π = 0, ±1, ±2, . . . , y . (20.69) Die entsprechenden Einteilchenenergien lauten ε~k = ~2~k 2 . 2m (20.70) Die möglichen Gesamtenergien sowie die Gesamtteilchenzahl lassen sich durch X E({n~k }) = (20.71) n~k ε~k ~ k bzw. N= X n~k (20.72) ~ k ausdrücken, wobei der Zahl n~k der Teilchen mit Impuls ~k alle nichtnegativen ganzzahligen Werte offenstehen. Die Erschließung der thermischen Eigenschaften des idealen Bosegases über die kanonische Zustandssumme Z(N, V, T ) = P Nebenbedingung n~k ε~k −β X e (20.73) ~ k {n~k =0,1,2,...} ist hier viel schwieriger als beim Photonen- und beim Phononengas, da die Besetzungszahlen n~k nicht unabhängig voneinander sind, sondern der Nebenbedingung (20.72) scharfer Gesamtzahl der Teilchen genügen. Wesentlich leichter zu berechnen ist die großkanonische Zustandssumme (s. 18.6) ZG (µ, V, T ) = ∞ X eβµN Z(N, V, T ) N =0 = ∞ X N =0 Nebenbedingung X {n~k } exp −β X ~ k n~k (ε~k − µ) . (20.74) Die hier auftretende Kombination der Summen über die durch (20.72) eingeschränkten Besetzungszahlen n~k mit der Summe über alle möglichen Gesamtteilchenzahlen N ist äquivalent mit uneingeschränkten Summationen über alle n~k ; 20.4 Das ideale Bosegas 345 die wir wie beim Photonengas auf geometrische Reihen zurückführen können, ∞ Y X X X ¡ ¢ exp −βn~k (ε~k − µ) n~k (ε~k − µ) = exp −β ZG (µ, V, T ) = = Y ~ k " ~ k ~ k {n~k } ¡ 1 − exp −β(ε~k − µ) ¢ #−1 n~k =0 . (20.75) Zu beachten ist, dass die geometrischen Reihen in (20.75) nur dann konvergieren, wenn gilt £ ¤ exp −β(ε~k − µ) < 1 und insbesondere, für ~k = 0, z ≡ eβµ < 1 ⇐⇒ µ < 0 . (20.76) Wir folgern, dass das chemische Potential µ beim idealen Bosegas keine positiven Werte annehmen kann. Gemäß 19.3 erhalten wir den Druck und die mittlere Teilchenzahl aus der großkanonischen Zustandssumme zu βp = ¡ ∂ ln ZG ¢ ∂ X =− ln(1 − ze−βε~k ) T,µ ∂V ∂V (20.77) ~ k bzw. N̄ = µ ∂ ln ZG ∂βµ ¶ = T,V X ~ k z e−βε~k . 1 − z e−βε~k (20.78) Die mittlere Gesamtzahl der Teilchen N̄ stellt sich dabei dar als Summe der Mittelwerte n̄~k der Besetzungszahlen n~k für die Einteilchenenergieniveaus ε~k mit n̄~k = z e−βε~k 1 . = β(ε −µ) ~ k 1 − z e−βε~k e −1 (20.79) Die Zustandsgleichung des idealen Bosegases erhalten wir schließlich durch Elimination des chemischen Potentials µ bzw. des Parameters z aus (20.77) und (20.78). Zur weiteren Auswertung von (20.77) und (20.78) idealisieren wir das betrachtete Vielteilchensystem, indem wir die mittlere Gesamtzahl der Teilchen und das Volumen über alle Grenzen wachsen lassen, die Anzahldichte der Teilchen aber konstant halten. In diesem so genannten thermodynamischen Limes, N̄ → ∞, V → ∞, N̄ /V = ρ = const , (20.80) bilden gemäß (20.69) die möglichen Impulse ~~k und somit die Energieeigenwerte ε~k Kontinua, so dass wir die Impulssummen in (20.77) und (20.78) gemäß 346 20 Ideale Gase (20.31) durch Integrale ersetzen können. Andererseits werden wir gleich sehen, dass in diesem Grenzfall ein Überschreiten des Verbots (20.76) möglich wird. Ich verschiebe die Diskussion der dann auftretenden Singularität auf den nächsten Paragrafen und beschränke die hiesigen Rechnungen ausdrücklich auf den Bereich µ < 0. Wenn die erwähnten Wellenvektorintegrale in Kugelkoordinatendarstellung für ~k durchgeführt werden und statt |~k| die dimensionslose Integrationsvariable x = βε~k eingeführt wird, so entsteht aus (20.77) und (20.78) βp = 1 g(z) λ3 1 N̄ = 3 zg 0 (z) , V λ (20.81) (20.82) wobei zur Vereinfachung der Schreibweise die thermische de Broglie Wellenlänge p λ = 2π~2 /mkB T (20.83) und die Funktion 2 g(z) = − √ π Z∞ dx √ 0 x ln(1 − ze−x ) (20.84) benutzt sind. Für die nachfolgende Überlegung sind die im Bereich 0 ≤ z ≤ 1 gültigen Taylorreihen g(z) = ∞ X z l /l5/2 l=1 zg 0 (z) = ∞ X z l /l3/2 (20.85) g(1) = 1, 342 . . . (20.86) l=1 und die Zahlenwerte g 0 (1) = 2, 612 . . . , von Bedeutung. Abbildung 20.3 zeigt den Verlauf der Funktion zg 0 (z). Beachten Sie den vertikalen Anstieg für z → 1. Sie entnehmen dem skizzierten Verlauf von zg 0 (z) und der Gleichung (20.82), dass die Bedingung (20.76) erfüllt bleibt für ρλ3 < g 0 (1) = 2, 612 . . . , (20.87) d. h. wenn das Gas so verdünnt oder die Temperatur so hoch ist, dass der mittlere Atomabstand ρ−1/3 größer ist als die mit g 0 (1)−1/3 = 0, 726 . . . multiplizierte thermische de Broglie Wellenlänge. In diesem Bereich, in dem allein die hier gegebene Betrachtung richtig ist, heißt das Bosegas nicht entartet. Die Gewinnung der Zustandsgleichung durch Elimination von z aus (20.81) und (20.82) ist nun auf numerischem Wege vorzunehmen. Eine einfache geschlossene Form der Zustandsgleichung ergibt sich allerdings im klassischen Grenzfall λ → 0, den Sie sich formal als ~ → 0 oder physikalisch 20.4 Das ideale Bosegas 347 Abbildung 20.3 als Grenzfall hoher Temperaturen vorstellen können. Da für λ → 0 die rechten Seiten in (20.81) und (20.82) zweifellos endlich bleiben müssen, sind die Funktionen g(z) und zg 0 (z) zum Verschwinden gezwungen. Den Taylorreihen (20.85) entnehmen Sie aber, dass dann auch z nach Null gehen muss. Wegen g(z) = z + · · · , zg 0 (z) = z + · · · (20.88) werden die rechten Seiten in (20.81) und (20.82) dann einander gleich. Die Elimination von z wird trivial und ergibt die Ihnen wohlbekannte Zustandsgleichung des klassischen idealen Gases pV = N̄ kB T . (20.89) Abweichungen vom klassischen Verhalten werden wichtig, wenn der mittlere Teilchenabstand nicht mehr um Größenordnungen größer ist als die thermische de Broglie Wellenlänge. Solche Abweichungen sind sämtlich Quanteneffekte, die von der in 20.1 besprochenen Nichtunterscheidbarkeit identischer Teilchen herrühren. Von Interesse ist auch die kalorische Zustandsgleichung des nicht entarteten Bosegases. Wir erhalten sie aus der großkanonischen Zustandssumme durch Berechnung der mittleren Energie ¶ µ 3 kB T V ∂ ln ZG = g(z) . (20.90) Ē = − ∂β 2 λ3 V,z Unter Verwendung von (20.81) entsteht hieraus 3 Ē = p. V 2 (20.91) Im klassischen Grenzfall ρ−1/3 À λ dürfen wir die Zustandsgleichung (20.89) benutzen und finden die Energie pro Teilchen als 3 kB T . (20.92) 2 Wegen der angenommenen Abwesenheit jeder Wechselwirkung zwischen den Teilchen und der Vernachlässigung von Quanteneffekten hängt die Energie Ē/N̄ hier nicht vom mittleren Teilchenabstand ρ−1/3 ab. Ē/N̄ = 348 20.5 20 Ideale Gase Bose-Einstein-Kondensation Im letzten Paragrafen musste der Fall hoher Dichte und/oder niedriger Temperatur entsprechend n̄ 3 λ ≥ g 0 (1) = 2, 612 . . . V (20.93) ausdrücklich ausgeschlossen werden, u. z. nicht etwa weil er physikalisch unsinnig wäre, sondern weil die dort gegebene Rechnung versagt. Den Grund des Versagens erkennen Sie durch nochmaliges Ansehen von (20.82) und des Graphen der Funktion zg 0 (z). Für ρλ3 → g 0 (1) gehen z nach 1 und das chemische Potential µ nach Null. Im Logarithmus der Zustandssumme gemäß (20.75) ln ZG = − X ~ k ln(1 − ze−βε~k ) , (20.94) wächst daher der Summand zu verschwindendem Wellenvektor wie − ln(1 − z) über alle Grenzen. Andererseits wird dieser Summand beim Übergang zum Integral gemäß X ~ k V → (2π)3 Z V d k= 4π (2π)3 3 Z∞ dk k 2 (20.95) 0 durch den im Integrationselement d3 k auftretenden Faktor k 2 komplett unterdrückt. Um den Grenzfall z → 1 mit behandeln zu können, müssen wir vor dem Übergang (20.95) zum Integral den Summanden mit ~k = 0 in (20.94) isolieren, denn für Werte von z hinreichend nahe bei 1 wird dieser Summand größer als der Rest der Summe, der wie in 20.4 durch ein Integral ersetzt werden kann, ln ZG = − ln(1 − z) + V g(z) λ3 (20.96) Für den Druck ergibt sich hieraus unverändert (20.81), da beim Differenzieren nach dem Volumen Temperatur und chemisches Potential, also auch der Parameter z = eβµ konstant zu halten sind, βp = 1 g(z) , λ3 (20.97) während die mittlere Teilchendichte sich gegenüber (20.82) genau entsprechend der mittleren Besetzungsdichte des Einteilchengrundzustands, N̄0 1 z ≡ ρ0 = . V V 1−z (20.98) erhöht auf N̄ 1 = ρ = ρ0 + 3 zg 0 (z) . V λ (20.99) 20.5 Bose-Einstein-Kondensation 349 Im thermodynamischen Limes ist die Raumdichte der Teilchen mit verschwindendem Impuls nur dann von Null verschieden, wenn der Parameter z gleich Eins ist. Sie sehen das nach Auflösen von (20.98) nach z, z= ρ0 V →1 ρ0 V + 1 ρ0 6= 0 . für (20.100) Solange also im thermodynamischen Limes z < 1 bleibt, gelten unverändert alle Resultate von Kapitel 20.4. Insbesondere ist dann die Dichte ρ gemäß (20.87) beschränkt. Überschreitet dagegen die Dichte ρ den Wert g 0 (1)/λ3 um ρ0 = ρ − 1 0 g (1) , λ3 (20.101) so hat der Parameter z für alle Temperaturen und Dichten im Bereich (20.93) den konstanten Wert 1. Wir sprechen dann vom entarteten Bosegas. Der Übergang von verschwindendem zu endlichem ρ0 heißt Bose-Einstein Kondensation. Er erfolgt, wie Sie aus (20.101) ersehen, bei beliebig vorgegebener Temperatur für die kritische“ Dichte ” ¶3/2 µ mkB 0 3 0 T 3/2 (20.102) ρBEK (T ) = g (1)/λ = g (1) 2π~2 und bei beliebig vorgegebener Dichte an der kritischen“ Temperatur ” µ ¶ 2π~2 ρ2/3 . (20.103) TBEK (ρ) = g 0 (1)−2/3 mkB Für den Bruchteil der in den Einteilchenzustand niedrigster Energie kon” densierten“ Atome folgt aus (20.101, 20.102, 20.103) ρBEK =1− ρ0 /ρ = 1 − ρ µ T TBEK ¶3/2 . (20.104) Insbesondere sind am absoluten Nullpunkt der Temperatur alle Teilchen kon” densiert“. Dieser Sachverhalt ist auch unmittelbar einsichtig, denn der Grundzustand eines Systems aus N wechselwirkungsfreien identischen Bosonen ist offenbar der Zustand, für den jedes Teilchen im Einteilchenzustand niedrigster Energie sitzt (Abbildung 20.4). Weitere Einsicht in die Kondensation gewinnen wir durch Diskussion des Zusammenhangs zwischen Druck und Dichte bei konstanter Temperatur, der so genannten Isothermen. Aus (20.97) und (20.100) folgern wir, dass der Druck längs der Isothermen für ρ ≥ ρBEK von der Dichte unabhängig ist (s. Abbildung 20.5). Für ρ < ρBEK nimmt der Druck monoton mit fallender Dichte ab, da gemäß (20.85) sowohl g(z) wie zg 0 (z) monoton abfallen, während z von 1 nach 0 geht. Insbesondere geht p → 0 für ρ → 0 (s. a. obige Diskussion des klassischen Grenzfalls). Bei ρ = ρBEK verläuft die Isotherme stetig. Unter Benutzung von (20.81) und (20.82) überzeugen Sie sich auch leicht von der Stetigkeit der Ableitung (∂p/∂ρ)T bei ρ = ρBEK Für ρ < ρBEK gilt nämlich µ ¶ µ ¶ kB T d ∂z ∂p = 3 g 0 (z) = kB T g 0 (z)/ (zg 0 (z)) , (20.105) ∂ρ T λ ∂ρ T dz 350 20 Ideale Gase Abbildung 20.4 Abbildung 20.5 und aus ∞ X zl d (zg 0 (z)) = →∞ dz l1/2 l=1 für z→1 (20.106) folgt µ ∂p ∂ρ ¶ T →0 für z → 1, d. h. für ρ → ρBEK . (20.107) Wenn Sie aus der nebenstehenden Skizze die Druckabhängigkeit des Volumens 1/ρ pro Teilchen ablesen, so konstatieren Sie, dass das System p > kB T g(1)/λ3 ein verschwindendes Volumen einnimmt. Dieses unphysikalische Verhalten liegt daran, dass die Teilchen durch keinerlei Kräfte an beliebiger Annäherung zueinander gehindert werden und somit auch als punktförmig vorgestellt werden können. Bei Verkleinerung des Druckes springt die Dichte bei p = kB T g(1)/λ3 unstetig auf den Wert g 0 (1)/λ3 . Derartige unstetige Dichteänderungen auf Isothermen sind Ihnen aus anderem Zusammenhang bekannt, u. z. etwa vom Übergang einer Substanz aus der flüssigen in die gasförmige Phase. Sie können die 20.5 Bose-Einstein-Kondensation 351 Bose-Einstein Kondensation auch als einen Phasenübergang auffassen, bei dem das nichtentartete Bosegas in ein ausdehnungsloses Kondensat übergeht. Eine andere interessante Singularität tritt bei der Bose-Einstein Kondensation in der Wärmekapazität CV = (∂ Ē/∂T )V auf. Wir erhalten sie aus der mittleren Energie 3 kB T g(z) für T > TBEK µ ¶ 2 λ3 1 ∂ ln ZG = (20.108) Ē/V = − V ∂β V,z 3 kB T g(1) für T < TBEK 2 λ3 zu CV /V = 15 9 d kB λ−3 g(z) − kB ρg 0 (z)/ (zg 0 (z)) 4 dz 4 15 kB λ−3 g(1) 4 für T > TBEK (20.109) für T < TBEK . d Wegen der schon in (20.106) erwähnten Eigenschaft dz (zg 0 (z)) → ∞ für z läuft die Wärmekapazität stetig durch T = TBEK . Ihre Ableitung (∂CV /∂T )V macht jedoch einen endlichen Sprung an der Kondensationstemperatur, so dass C V selbst dort eine Spitze aufweist (Abbildung 20.6). Beachten Sie auch, dass die Wärmekapazität für T < TBEK wie T 3/2 mit T → 0 verschwindet, also langsamer als die Wärmekapazität des Photonen und des Phononengases. Abbildung 20.6 Kein reales System verhält sich strikt wie ein ideales Bosegas. Zwar ist die Wechselwirkung der Teilchen in realen Bosegasen bei hinreichend hohen Temperaturen und/oder geringen Dichten vernachlässigbar, jedoch sind in diesem Grenzfall Quanteneffekte meist völlig unwichtig. Jedoch stellt z. B. der Phasenübergang vom flüssigen zum suprafluiden Zustand in 4 He bei der Temperatur Tλ = 2, 17 ◦ K einen der Bose-Einstein Kondensation des idealen Bosegases verwandten Quanteneffekt dar. Der Quantencharakter des Übergangs ist aus der 352 20 Ideale Gase Tatsache ersichtlich, dass die thermische de Broglie Wellenlänge für Heliumatome bei T = Tλ etwa 6 Å beträgt und somit größer ist als der mittlere Atomabstand. Andererseits ist der mittlere Abstand der He Atome vergleichbar mit der Reichweite der interatomaren Wechselwirkung, so dass letztere keinesfalls vernachlässigbar ist. In gasförmigem atomaren Wasserstoff, bei dem die Elektronenspins der einzelnen Atome durch ein starkes Magnetfeld alle parallel orientiert sind (spinpolarisierter atomarer Wasserstoff ), wird ein Übergang zu einer suprafluiden Phase erwartet und derzeit experimentell gesucht. Bei einer Anzahldichte entsprechend einem mittleren Atomabstand von etwa 20 Å sollte die Übergangstemperatur bei etwa 70 ◦ mK liegen. Da die Wechselwirkung von H-Atomen mit parallelen Elektronenspins schwach ist und eine Reichweite von wenig mehr als 1 Å hat, sollte die interatomare Wechselwirkung auf den erwarteten Übergang nur mäßigen Einfluss haben, der Übergang selbst also eng verwandt sein mit der Bose-Einstein Kondensation des idealen Bosegases. 20.6 Das ideale Fermigas Wegen des Pauliprinzips unterscheidet sich das Tieftemperaturverhalten des idealen Fermigases radikal von dem des idealen Bosegases. Schon im bei T = 0 vorliegenden Grundzustand zeigt sich eine drastische Verschiedenheit. Während N identische Bosonen als Grundzustand den N -fach besetzten Einteilchengrundzustand haben, dürfen keine zwei Fermionen in ein und demselben Einteilchenzustand sitzen. Zu bedenken ist allerdings, dass alle Fermionen einen (halbzahligen) Spin tragen. Bei festem Impuls ~~k kann ein Fermion mit Spin s in (2s + 1) verschiedenen Spinzuständen vorliegen, die sich durch die Orientierung des Spins relativ zu einer beliebigen Richtung unterscheiden. Ein Einteilchenzustand mit Impuls ~~k und Energie εk = ~2~k 2 /2m kann also durch identische Fermionen bis zu (2s + 1)-fach besetzt sein. Der Grundzustand von N identischen freien Fermionen entsteht gemäß dem Pauliprinzip durch sukzessive Auffüllung der niedrigsten Einteilchenniveaus. Das höchste so besetzte Einteilchenniveau, die so genannte Fermienergie εF ≡ ergibt sich aus N = (2s + 1) X ~ k wobei θ(x) die Sprungfunktion θ(x) = 1 0 ~2 kF2 , 2m (20.110) θ(εF − ~2~k 2 /2m) , (20.111) für x>0 für x<0 bezeichnet. Die Wellenvektorsumme in (20.111) kann durch ein Integral approximiert werden, V N = (2s + 1) 4π (2π)3 ZkF 0 dk k 2 , 20.6 Das ideale Fermigas 353 wonach sich die Wellenzahl kF als Funktion der Teilchendichte aus N (2s + 1) (2s + 1) 3 =ρ= kF = (2mεF /~2 )3/2 2 V 6π 6π 2 (20.112) ergibt. Die Grundzustandsenergie des N -Teilchensystems berechnet sich als Summe der N niedrigsten Einteilchenenergien, E0 = (2s + 1) X ~ k V 4π ε~k θ(εF − ε~k ) = (2s + 1) (2π)3 ZkF dk k 2 ε~k . (20.113) 0 Mit Hilfe von (20.111) und (20.112) erhalten wir das einfache Resultat E0 = 3 εF N 5 (20.114) und hieraus für den Druck p0 = − µ ∂E0 ∂V ¶ = N 2 N 2 E0 εF = . 5 V 3 V (20.115) Im Gegensatz zum idealen Bosegas zeigt das Fermigas beim absoluten Nullpunkt einen endlichen Druck, muss also durch ein Gefäß an der Verflüchtigung gehindert werden. Der physikalische Grund hierfür ist im Pauliprinzip zu sehen: das Verbot beliebiger Annäherung identischer Fermionen manifestiert sich in einer Zunahme der Energie des Gases bei Verkleinerung des Volumens. Der soeben charkterisierte Grundzustand des idealen Fermigases wird oft als Fermisee bezeichnet. Er ist charakterisiert durch voll besetzte Einteilchenniveaus bis hinauf zur Fermienergie und leere Niveaus darüber. Der scharfe Übergang von besetzt zu unbesetzt drückt sich in den Ausdrücken (20.111) für die Teilchenzahl N und (20.113) für die Grundzustandsenergie E0 in der Sprungfunktion θ(εF − ε~k ) aus. Bei endlichen Temperaturen, denen wir uns jetzt zuwenden, wird dieser scharfe Übergang auf der thermischen Energieskala kB T ausgeschmiert. Zur Behandlung des idealen Fermigases bei endlichen Temperaturen berechnen wir wie im Bosefall die großkanonische Zustandssumme X X ZG (µ, V, T ) = exp −β n~k,m (ε~k − µ) (20.116) {n~k,m } = +s Y Y ~ k m=−s = Y ~ k 1 X ~ km 1 X n~k,m =0 n~k,m =0 e−β(ε~k −µ) 2s+1 e−β(ε~k −µ) . Vorstehend wurden die Besetzungszahlen n~km eingeführt für Einteilchenzustände zu festem Wellenvektor ~k und fester Spinorientierungsquantenzahl m. Letztere 354 20 Ideale Gase hat für Spin-s Teilchen die 2s + 1 möglichen Werte m = −s, −s + 1, . . . , s. Bei festem ~k und m darf die Besetzungszahl n~km nur die Werte n~km = 0 oder 1 (20.117) annehmen. Die Summationsvorschriften für die Besetzungszahlen n~km und die Spinorientierungsquantenzahl m sind in den letzten beiden Gliedern von (20.116) schon berücksichtigt. Die Zustandssumme (20.116) kann somit gemäß X ¡ ¡ ¢¢ ln ZG = (2s + 1) ln 1 + exp −β(ε~k − µ) (20.118) ~ k vereinfacht werden. Dabei ist wichtig, daß die Einteilchenenergien ε~k = ~2~k 2 /2m nicht von der Spinorientierung abhängen (Wir setzen Abwesenheit eines Magnetfeldes voraus!). Durch Differenziation nach dem chemischen Potential erhalten wir die mittlere Teilchenzahl als Summe der mittleren Zahl von Teilchen mit Impuls ~~k und Spinorientierung m, X X N̄ = n̄~km = (2s + 1) (20.119) n̄~km , ~ km n̄~km = ~ k 1 £ ¤ . exp β(ε~k − µ) + 1 (20.120) Ab hier beschränken wir uns einfachheitshalber auf Spin- 12 Teilchen, setzen also 2s + 1 = 2; bitte prüfen Sie Ihr Verständnis der nachfolgenden Argumentation, indem Sie den Faktor 2s + 1 im Rest des Paragraphen restaurieren. Den Druck als Funktion der Temperatur und des chemischen Potentials berechnen wir wie üblich durch Differenziation von ln ZG nach dem Volumen ¶ µ ¢¢ ¡ ∂ ln ZG ∂ X ¡ (20.121) ln 1 + exp −β(ε~k − µ) . βp = =2 ∂V ∂V β,µ ~ k Die Wellenvektorsummen in (20.119) und (20.121) können im thermodynamischen Limes ebenso wie die entsprechenden Summen im Bosefall durch Integrale ersetzt werden. Dabei entstehen die zu (20.81),(20.82) und (20.84) analogen Resultate V f (z) , λ3 2 βp = 3 f (z) , λ ln ZG = 2 2 N̄ = ρ = 3 zf 0 (z) , V λ (20.122) (20.123) (20.124) in denen wieder die thermische de Broglie Wellenlänge (20.83) und der Parameter z = eβµ (20.125) 20.6 Das ideale Fermigas 355 verwendet sind und die gegenüber (20.84) modifizierte Funktion 2 f (z) = √ π Z∞ dx √ x ln(1 + z e−x ) = ∞ X (−1)l+1 l5/2 l=1 0 zl (20.126) eingeführt wurde. Notieren wir auch gleich die mittlere Energie, die wir am einfachsten aus der großkanonischen Zustandssumme mit der Identität (18.44), also Ē = hHi = −(∂ ln ZG /∂β)z,V , erhalten. Mit Hilfe von (20.122) und ∂λ−3 /∂β = − 23 β −1 λ−3 erhalten wir Ē = 3 3 V f (z)kB T = pV . λ3 2 (20.127) Zur Zustandsgleichung, die den Druck als Funktion der Temperatur und des Volumens bei fester Teilchenzahl N̄ angibt, gelangen wir, in dem wir aus (20.123) und (20.124) den Parameter z eliminieren. Wie beim Bosegas führt diese Elimination nur in den Grenzfällen T → 0 und T → ∞ zu einer durch einfache analytische Ausdrücke darstellbaren Zustandsgleichung. Für hohe Temperaturen entsteht wieder der klassische Grenzfall λ→0 (20.128) mit der Konsequenz f (z) → zf 0 (z) → z. Da dann die rechten Seiten in (20.123) und (20.124) übereinstimmen, ergibt sich wieder die wohlbekannte Zustandsgleichung des klassischen idealen Gases pV = N̄ kB T . (20.129) Um den Fall tiefer Temperaturen zu untersuchen, richten wir unser Augenmerk zunächst auf die in (20.124) auftretende Funktion 2 zf (z) = √ π 0 Z∞ dx 0 √ x , 1 x e +1 z (20.130) die sich nach partieller Integration und mit (20.125) auch in der Form 4 zf (z) = √ 3 π 0 Z∞ dx x 3/2 ex−βµ 1 = √ x−βµ 2 (e + 1) 3 π 0 Z∞ 0 dx µ x3/2 x − βµ cosh 2 ¶2 (20.131) schreiben lässt. Unter der sogleich zu rechtfertigenden Annahme, dass das chemische Potential des idealen Fermigases (im Gegensatz zu dem des idealen Bosegases!) im Grenzfall T → 0 positiv ist und dass gilt βµ À 1 , (20.132) lässt sich das Integral (20.131) leicht approximieren. Der Faktor [cosh(x − βµ)/2] im Integranden hat ein Maximum bei x = βµ und fällt links und rechts davon −2 356 20 Ideale Gase auf dem Maßstab 1 ¿ βµ exponentiell ab. In einem Intervall der Länge ∆x & 1, innerhalb dessen dieser Faktor merklich von Null verschieden ist, beträgt die relative Änderung des anderen Faktors, x3/2 , im Integranden von (20.131) µ ¶ 3 ∆x 1 3/2 3/2 ∆(x )/x = ¿1. (20.133) =O 2 x βµ Es muss sich demnach eine brauchbare Approximation des Integrals (20.131) ergeben, wenn wir x3/2 durch die Taylorreihe 3 3 x3/2 = (βµ)3/2 + (βµ)1/2 (x − βµ) + (βµ)−1/2 (x − βµ)2 + · · · 2 8 (20.134) ersetzen. In einem weiteren Approximationsschritt verschieben wir die untere Integrationsgrenze in (20.131) nach −∞. Wegen des exponentiellen Abfalls des Integranden und wegen (20.132) ist der dabei entstehende Fehler mit der relativen Größenordnung exp(−βµ) völlig unerheblich. Wir erhalten nach Ausführen der verbleibenden elementaren Glied-für-Glied Integration ¸ · π2 4 −1/2 3/2 0 (βµ) + ··· . (20.135) zf (z) = √ (βµ) + 8 3 π Nach Eintragen dieser Tieftemperaturentwicklung in (20.124) ergibt sich # " µ ¶2 π 2 kB T 8 3/2 3 + ··· (20.136) 1+ ρλ = √ (βµ) 8 µ 3 π und hieraus insbesondere das chemische Potential bei T = 0 als der Fermienergie εF gleich, µ|T =0 = ~2 (3π 2 ρ)3/2 = εF . 2m (20.137) Damit ist die Ausnahme (20.132) gerechtfertigt, solange die thermische Energie klein ist gegenüber der Fermienergie, kB T ¿ εF . Durch Umkehrung der Reihe (20.136) gewinnen wir das chemische Potential µ als Funktion von Temperatur und Dichte, # " ¶2 µ π 2 kB T + ··· . (20.138) µ = εF 1 − 12 εF Die mittlere Gesamtenergie und die Wärmekapazität bei tiefen Temperaturen (kB T ¿ εF ) folgen aus einer ganz analogen Rechnung, die hier nicht vorgeführt wird, zu # " ¶2 µ 3 5π 2 kB T Ē = εF N̄ 1 + + ··· (20.139) 5 12 εF und somit CV = µ ∂ Ē ∂T ¶ V = π2 N̄ kB 2 µ kB T + ··· εF ¶ . (20.140) 20.6 Das ideale Fermigas 357 Beachten Sie, dass die Wärmekapazität hier als Funktion der Temperatur mit T → 0 viel langsamer abfällt als beim idealen Bosegas. Aus diesem Grund verläuft die Wärmekapazität von Metallen, deren Leitungselektronen in guter Näherung ein ideales Fermigas darstellen, linear mit T , wenn die Temperatur soweit abgesenkt wird, dass der Leitungselektronenbeitrag den Phononenbeitrag dominiert. Die Resultate (20.139) und (20.140) erlauben eine einfache qualitative Erläuterung. Bei niedrigen Temperaturen unterscheidet sich die mittlere Besetzungszahl (20.120) von der bei T = 0 vorliegenden Stufenfunktion n̄~km |T =0 = θ(µ − ε~k ) = θ(εF − ε~k ) (20.141) dadurch, dass einige Teilchen von Niveaus εk < εF zu Niveaus oberhalb der Fermienergie angeregt sind. Die Besetzungsverschiebungen sind beschränkt auf einen Energiebereich der ungefähren Größe kB T um εF herum, so dass die Zahl der gegenüber dem ungestörten Fermisee“ verschobenen Teilchen die ” Größenordnung N̄ (kB T /εF ) hat. Die Energieänderung relativ zum Grundzustand muss also die Größenordnung kB T N̄ (kB T /εF ) haben, d. h. quadratisch in T sein. Dementsprechend muss die Wärmekapazität proportional zur Temperatur verlaufen. Zu guter Letzt notieren wir die Zustandsgleichung. Verwenden wir das für alle Temperaturen gültige Resultat Ē = 23 pV aus (20.127) sowie die Tieftemperaturentwicklung (20.139) der Energie, so ergibt sich " # µ ¶2 5π 2 kB T 2 N̄ εF 1 + + ··· . (20.142) p= 5V 12 εF Der Zuwachs des Druckes gegenüber seinem Wert am absoluten Nullpunkt (siehe (20.115)) ist auf die Vergrößerung der mittleren Energie der gegen die Wände stoßenden Teilchen zurückzuführen. 358 20 Ideale Gase Kapitel 21 Begründung der Thermodynamik makroskopischer Systeme 21.1 Arbeit und Wärme bei Zustandsänderungen Ein von seiner Umgebung völlig isoliertes System hat erfahrungsgemäß eine zeitlich konstante Energie. Lassen wir jedoch ein System Arbeit verrichten (z. B. das Benzin-Luft-Gemisch in der Brennkammer eines Motors im Takt nach der Zündung) oder bringen es in thermischen Kontakt mit einem anderen System (z. B. die Wärmflasche im Bett), so ändert sich im Laufe der Zeit sein Zustand, und auch seine Energie ist zeitlicher Änderung unterworfen. Zeitliche Zustandsänderungen, fortan Prozesse genannt, können i. A. nicht mit den hier zur Verfügung gestellten Hilfsmitteln beschrieben werden, da während des zeitlichen Ablaufs i. A. kein Gleichgewicht herrscht. Eine wichtige Ausnahme stellen quasistatische Prozesse dar, deren Dauer lang ist im Vergleich zu allen das betreffende System charakterisierenden Relaxationszeiten. Bei solchen Prozessen liegt zu jedem Zeitpunkt thermisches Gleichgewicht vor, u. z. entsprechend den momentanen Werten der Energie und der äußeren Parameter. Im Folgenden wird überwiegend von quasistatischen Prozessen die Rede sein. Betrachten wir einen Prozess, der ein System von einem anfänglichen Zustand der Energie Ei zu einem Endzustand der Energie Ef führt. Wenn wir die am System geleistete Arbeit mit A (A < 0, falls das System Arbeit abgibt) und die zugeführte Wärme mit Q bezeichnen, so lautet die Energiebilanz ∆E = Ef − Ei = A + Q . (21.1) Unter der am System geleisteten Arbeit verstehen wir die Energiezufuhr bei Änderung makroskopisch kontrollierbarer äußerer Parameter gegen die entsprechenden generalisierten Kräfte (z. B. Volumenverkleinerung gegen den Druck; Teilchenzahlvergrößerung gegen“ das chemische Potential; Ihnen anderweitig ” bekannt sind magnetische und elektrische Arbeitsleistungen). Hingegen nennen 359 360 21 Begründung der Thermodynamik makroskopischer Systeme wir Wärmezufuhr eine Energiezunahme bei konstanten äußeren Parametern; die Energieeinspeisung erfolgt dann direkt in die mikroskopischen Freiheitsgrade des Systems. Die zu Anfang und am Ende des Prozesses vorliegenden Energien Ei bzw. Ef sind durch die respektiven Zustände eindeutig festgelegt. Nicht so die im Verlauf des Prozesses als Arbeit A und Wärme Q zugeführten Energieposten für sich! Zwischen zwei Zuständen mit Energien Ei , und Ef sind viele Prozesse, auch quasistatische, denkbar und realisierbar, die sich bei fester Summe A + Q unter anderem durch die Werte der Größen A und Q unterscheiden. Im Gegensatz zur Energie sind A und Q einzeln keine eindeutigen Funktionen des Zustandes. Vielmehr charakterisieren diese Größen Prozesse. Bei differenziellen Zustandsänderungen schreiben wir die Energiebilanz (21.1) dE =6 dA+ 6 dQ , (21.2) wobei die Querstriche an den infinitesimalen Inkrementen von A und Q sinnfällig machen sollen, dass weder 6 dA noch 6 dQ für sich allein Differentiale eindeutiger Zustandsfunktionen sind. Beispiele differenzieller Arbeitsleistungen sind differenzielle Volumenänderungen und Änderungen der Teilchenzahl, 6 dA = −p dV + µ dN̄ . 21.2 (21.3) Erster Hauptsatz Der im letzten Paragrafen diskutierte Energieerhaltungssatz (21.1) heißt auch erster Hauptsatz der Thermodynamik. Wegen seiner überragenden Bedeutung will ich ihn hier in drei offensichtlich äquivalenten Formulierungen nochmals vorstellen. (i) Ein Energiezuwachs eines Systems muss von der Umgebung aufgebracht werden, sei es durch Arbeitsleistung gegen generalisierte Kräfte bei Änderung makroskopisch kontrollierbarer äußerer Parameter, sei es ohne Änderung letzterer bei thermischem Kontakt, d. h. durch Einspeisung von Energie an mikroskopische Freiheitsgrade. (ii) In abgeschlossenen Systemen, d. h. bei thermischer Isolation (6 dQ = 0) und konstanten äußeren Parametern (6 dA = 0), können nur Vorgänge ablaufen, die die Energie konstant lassen. (iii) Es gibt kein perpetuum mobile erster Art, d. h. keine Maschine kann im Dauerbetrieb Arbeit leisten, ohne dass ihr von außen Energie zugeführt wird. 21.3 Entropieänderungen bei Zustandsänderungen Betrachten wir einen quasistatischen Prozess, der durch eine stetige Folge von Gleichgewichtszuständen führt. In einem differenziellen Teilprozess ändern sich die Energie und äußere Parameter wie das Volumen und die Teilchenzahl gemäß Ē, V, N̄ → Ē + dĒ, V + dV, N̄ + dN̄ . (21.4) 21.4 Zweiter Hauptsatz 361 Die zugehörige Entropieänderung ist, da bei der betrachteten quasistatischen Folge von Zuständen die Entropie jederzeit eine eindeutige Funktion des Zustands ist, gerade das in (19.56) gefundene Entropiedifferential dS = 1 (dĒ + p dV − µ dN̄ ) . T (21.5) Lösen wir diese Identität nach dem Energiedifferential auf, so finden wir wieder den ersten Hauptsatz, dĒ = T dS − p dV + µ dN̄ . (21.6) mit dem Arbeitsanteil 6 dA = −p dV + µ dN̄ und, als neuem Resultat, den Ausdruck 6 dQ = T dS (21.7) für die differenzielle Wärmezufuhr. Sie erkennen aus (21.7), dass quasistatische Prozesse in thermisch isolierten Systemen (6 dQ = 0) isentropisch, d. h. mit dS = 0, verlaufen. Weiterhin bemerkenswert ist, dass (21.7) eine Verknüpfung eines totalen Differentials (der Entropie) mit einer differenziellen Größe (6 dQ) gibt, die kein totales Differential ist. In dS =6 dQ/T spielt 1/T die Rolle eines integrierenden Faktors“ ∗) ” Anders als bei quasistatischen Prozessen muss die Entropie bei der Relaxation von Nichtgleichgewichtszuständen ins Gleichgewicht zunehmen, denn die Entropie nimmt bekanntlich 19.1 im Gleichgewicht ihren Maximalwert an. Es folgt, dass die Entropie eines abgeschlossenen Systems niemals abnehmen kann. Sie sollten die gerade getroffenen Aussagen durchdenken im Hinblick auf u. a. folgende Beispiele: (i) Ein schwingendes Pendel kommt auf Grund von Luftund Lagerreibung allmählich zur Ruhe; (ii) ein Gas verteilt sich nach plötzlicher Gefäßvergrößerung nach einiger Zeit gleichförmig über das vergrößerte Volumen; (iii) zwei sich berührende, verschieden warme Körper gleichen ihre Temperaturen an. 21.4 Zweiter Hauptsatz Die Ausführungen des letzten Paragrafen beinhalten den zweiten Hauptsatz.der Thermodynamik. Die folgenden drei Formulierungen dieses Gesetzes verdienen, obschon äquivalent miteinander, jeweils gesonderte Würdigung. (i) In einem abgeschlossenen System können nur Prozesse mit dS ≥ 0 ablaufen. Diese oben durch die bekannte Extremaleigenschaft der Entropie begründete Aussage bringt u. a. die Erfahrungstatsache zum Ausdruck, dass alle in der Natur spontan ablaufenden Relaxationsprozesse irreversibel sind. Wir werden hierauf in 21.8 zurückkommen. ∗) Im Fall zweier unabhängiger Variablen x und y ist die Größe 6 dG = A(x, y) dx + B(x, y) dy genau dann ein totales Differential einer Funktion G(x, y), wenn die Integralitätsbedingungen ∂A/∂y = ∂B/∂x erfüllt ist. Andernfalls ist es zuweilen möglich, einen integrierenden Faktor f (x, y) zu finden, sodass dF = f (x, y)6 dG ein totales Differential ist, d. h. so dass ∂(f A)/∂y = ∂(f B)/∂x gilt. Die Funktion F (x, y) lässt sich aus ihrem Differential durch ein wegunabhängiges Wegintegral in der x − y-Ebene gewinnen. S.a. 2.10. 362 21 Begründung der Thermodynamik makroskopischer Systeme (ii) Es gibt keine Maschine, die nichts anderes bewirkt, als im periodischen Betrieb Arbeit zu leisten und den entsprechenden Energiebedarf aus einem Wärmebad zu decken (perpetuum mobile zweiter Art). Wir werden diese von Lord Kelvin stammende Formulierung im nächsten Paragrafen auf (i) zurückführen. Die Vorstellung, ein Dampfer könne über’s Meer fahren und die dazu erforderliche Energie nur dem Wärmevorrat des Meeres abzapfen, wird offenbar durch den zweiten Hauptsatz ins Reich der Träume verwiesen. (iii) Es gibt keinen perfekten“ Kühlapparat, der, periodisch arbeitend, nichts ” anderes bewirkt, als einem System Wärme zu entziehen und sie einem anderen System bei höherer Temperatur zuzuführen. Dem Beweis dieser Clausiusschen Formulierung ist 21.6 gewidmet. 21.5 Unmöglichkeit des perpetuum mobile zweiter Art Abbildung 21.1 zeigt ein fiktives perpetuum mobile zweiter Art. Während einer Arbeitsperiode wird dem Wärmebad die Wärme Q entzogen und der Maschine zugeführt, während die Maschine die Arbeit A abgibt. Die Arbeit könnte an einem Freiheitsgrad eines externen Objekts verrichtet werden (z. B. Heben eines Gewichts), ohne dass andere Freiheitsgrade und insbesondere die Entropie des Objekts beeinflusst würden. Abbildung 21.1 Der beschriebene fiktive Vorgang wäre mit dem ersten Hauptsatz, d. h. der Energiebilanz der Maschine pro Periode ∆E = 0 = Q + (−A) (21.8) verträglich. Ziehen wir aber die Entropiebilanz für das aus Bad, Maschine und Objekt gebildete abgeschlossene Gesamtsystem. Weder das Objekt (per obiger Vereinbarung) noch die Maschine (wegen der Periodizität) ändern in einer Periode ihre Entropie, so dass die gesamte Entropieänderung allein vom Wärmebad gestellt wird. Sie beträgt, da das Wärmebad während der endlichen Wärmeaufnahme −Q < 0 seine Temperatur nie ändert, ∆S = −Q/T < 0. Die 21.5 Unmöglichkeit des perpetuum mobile zweiter Art 363 Verletzung des zweiten Hauptsatzes, nach dem die Entropie eines abgeschlossenen Systems nicht abnehmen kann, ist offenbar. Das perpetuum mobile zweiter Art hätte, da die in einem Zyklus aufgenommene Wärme restlos in Arbeit umsetzend, den Wirkungsgrad η= A =1. Q (21.9) Realisierbare Wärmekraftmaschinen haben nach dem zweiten Hauptsatz stets Abbildung 21.2 einen kleineren Wirkungsgrad η < 1. Abbildung 21.2 zeigt das Wirkungsschema solcher mit den Hauptsätzen verträglichen Maschinen. Während einer Periode entnimmt die Maschine einem Wärmebad der Temperatur T1 die Wärme Q1 und leistet am Objekt die Arbeit A. Das Verdikt des zweiten Hauptsatzes wird vermieden, indem die Maschine an ein zweites, kälteres Wärmebad koppelt, an das sie pro Zyklus die Wärme Q2 abführt. Die Energiebilanz der Maschine und die Entropiebilanz des Gesamtsystems lauten Q1 = A + Q 2 (21.10) bzw. ∆S = − Q2 Q1 + , T1 T2 (21.11) und die Forderung ∆S > 0 ist jetzt befriedigt, wenn die Wärmeaufnahme des kälteren Bades nur hinreichend groß ist. 364 21 Begründung der Thermodynamik makroskopischer Systeme Der Wirkungsgrad der gerade beschriebenen Maschine beträgt η= Q2 A =1− . Q1 Q1 (21.12) Aus (21.11) und dem zweiten Hauptsatz, ∆S ≥ 0, folgern wir Q2 /Q1 > T2 /T1 und erhalten für den Wirkungsgrad die Ungleichung η ≤ 1 − T2 /T1 < 1 . (21.13) Der maximale mit dem zweiten Hauptsatz verträgliche Wirkungsgrad, ηmax = 1 − T2 /T1 , (21.14) entspricht einer quasistatisch arbeitenden Maschine, bei der die Entropiebilanz des Gesamtsystems pro Periode ∆S = 0 lautet (s. 21.7). 21.6 Unmöglichkeit des perfekten Kühlapparats Reale Kühlapparate entziehen nach dem in Abbildung 21.3 gezeigten Schema pro Zyklus unter Aufwand der Arbeit A einem System (hier zum Wärmebad idealisiert) mit Temperatur T2 die Wärme Q2 und geben an ein wärmeres System (hier zum Wärmebad mit T1 > T2 idealisiert) die Wärme Q1 ab. Die beiden Hauptsätze verlangen Q1 = Q 2 + A (21.15) und ∆S = Q2 Q1 − ≥0, T1 T2 (21.16) wobei das Gleichheitszeichen im zweiten Glied der Kette (21.16) nur für quasistatische Arbeitsweise gelten kann. Ohne Aufwand an Arbeit kann kein solcher Apparat funktionieren, denn mit A = 0, d. h. Q1 = Q2 , entsteht aus (21.16) die Forderung Q1 (1/T1 − 1/T2 ) ≥ 0, die bei T1 > T2 nicht erfüllbar ist. Damit ist auch die Clausiussche Version des zweiten Hauptsatzes bewiesen. 21.7 Die Carnotmaschine Das einfachste Modell einer Wärmekraftmaschine ist die so genannte Carnotmaschine. Als Arbeitssubstanz fungiert ein klassisches ideales Gas. Eine Periode, die quasistatisch durchlaufen wird, ist in der p − V -Ebene und in der S − T Ebene in den Abbildungen 21.4 und 21.5 dargestellt. Wie aus den Diagrammen ersichtlich besteht eine Periode aus den vier folgenden Schritten. Von a nach b erfolgt eine isotherme Kompression, während derer die Maschine an ein Wärmebad der Temperatur T2 Wärme abgibt. Die anschließende Kompression von b nach c geschieht unter thermischer Isolation, also isentropisch. Hierbei nimmt die Maschine Energie in Form von Arbeit auf 21.7 Die Carnotmaschine 365 Abbildung 21.3 und die Temperatur erhöht sich zum Wert T1 . Während der letzten beiden Schritte leistet die Maschine Arbeit, zunächst von c nach d bei isothermer Expansion und gleichzeitiger Wärmeaufnahme aus einem Bad der Temperatur T1 und schließlich, von d nach a, bei isentropischer Expansion und Abkühlung zur Ausgangstemperatur T2 . Bezeichnen wir die im Schritt c d von der Maschine aufgenommene Wärme mit Q1 , die im Schritt a b an das kältere Bad abgeführte Wärme mit Q2 , sowie die während der Periode insgesamt abgegebene Arbeit mit A, so lautet die Energiebilanz pro Periode A = Q 1 − Q2 . (21.17) Wenn der Prozess, wie angenommen, quasistatisch geführt wird, so ändert sich die Gesamtentropie der beiden Bäder und der Maschine nicht. ∆S = 0 = − Q2 Q1 + . T1 T2 (21.18) Der Wirkungsgrad der Carnotmaschine folgt aus (21.17) und (21.18) zu η =1− T2 , T1 (21.19) hat also den maximalen mit den Hauptsätzen verträglichen Wert. Zur Berechnung der pro Periode geleisteten Arbeit müssen wir die vier Kurvenstücke in der p − V -Ebene durch Gleichungen charakterisieren. Für die Isothermen a b und c d liefert die Zustandsgleichung des idealen Gases direkt pV = N kB T2 bzw. pV = N kB T1 . 366 21 Begründung der Thermodynamik makroskopischer Systeme Abbildung 21.4 Abbildung 21.5 Um die Gleichung der Isentropen (auch Adiabaten genannt) zu gewinnen, benutzen wir das Entropiedifferential (19.56), das längs der Isentropen verschwinden muss, T dS = 0 = dĒ + p dV . (21.20) Die mittlere Energie des klassischen idealen Gases lautet Ē = 3 3 N kB T = pV , 2 2 (21.21) dĒ = 3 (p dV + V dp) . 2 (21.22) ihr Differential also Aus (21.20) und (21.22) folgt als Differentialgleichung der Isentropen dp 5 dV + =0. 3 V p (21.23) Die gesuchte Isentropengleichung ist also pV 5/3 = const (21.24) 21.8 Relaxation ins Gleichgewicht 367 oder, in der V − T -Darstellung, T V 2/3 = const. (21.25) Wir berechnen nun die pro Periode von der Maschine abgegebene Arbeit als das Wegintegral in der p − V -Ebene A= ZVb p dV + ZVc p dV + ZVd ZVa p dV + Va Vb Vc Vd (T =T2 ) (S=S2 ) (T =T1 ) (S=S1 ) p dV . (21.26) Offenbar kann A auch geometrisch als die von der Kurve a b c d in der p − V Ebene umschlossene Fläche gedeutet werden. Die Beiträge der beiden Isentropen heben sich gegenseitig auf, denn der Betrag des Stücks b c ZVc Vb p dV = 5/3 p b Vb ZVc 3 5/3 −2/3 − Vc−2/3 ) V −5/3 dV = pb Vb (Vb 2 Vb (S=S2 ) h i 3 N kB T2 1 − (Vb /Vc )2/3 2 3 3 = N kB T2 (1 − T1 /T2 ) = N kB (T2 − T1 ) 2 2 = ist allein durch die Temperaturdifferenz der beiden Bäder bestimmt und somit entgegengesetzt gleich dem Betrag des Stücks d a. Die Anteile der Isothermen ergeben schließlich A = N k B T2 ZVb Va = N kB T2 ln dV + N k B T1 V ZVd dV V Vc Vd Vb + N kB T1 ln . Va Vc Aus der Isentropengleichung (21.25) folgt aber Vb /Vc = (T1 /T2 )−3/2 = Va /Vd , so dass wir die abgegebene Arbeit als A = N kB (T1 − T2 ) ln(Vd /Vc ) (21.27) erhalten. Ihnen bleibt zur Übung, die im Schritt c d aufgenommene Wärme Q1 und die Abwärme Q2 auszurechnen. 21.8 Relaxation ins Gleichgewicht Der zweite Hauptsatz zeichnet hinsichtlich der Bewegung makroskopischer Systeme eine Zeitrichtung aus, indem er die zeitliche Abnahme der Entropie eines 368 21 Begründung der Thermodynamik makroskopischer Systeme abgeschlossenen Systems verbietet. Im Übrigen lehrt schon die Alltagserfahrung, dass die Relaxation eines makroskopischen Systems ins Gleichgewicht ein irreversibler Vorgang ist, dessen zeitliche Umkehrung niemals spontan auftritt. Vom mikroskopischen Standpunkt aus kann und muss uns der zweite Hauptsatz ebenso wie die Irreversibilität von Relaxationsprozessen anstößig erscheinen. Die für die mikroskopische Dynamik eines N -Teilchensystems zuständige Schrödingergleichung besitzt nämlich (ebenso wie die bei klassischen Behandlung zuständigen Newtonschen Gleichungen) eine Symmetrie, die Zeitumkehrinvarianz, derzufolge zu jeder beliebigen Lösung eine andere Lösung angegeben werden kann, die den gleichen physikalischen Vorgang in zeitlich umgekehrtem Ablauf beschreibt. Um uns der Zeitumkehrinvarianz der Schrödingergleichung i~ψ̇ ({~x}, t) = Hψ ({~x}, t) (21.28) zu vergewissern, betrachten wir Teilchen, die über Zweikörperkräfte (z. B. Coulombsch) wechselwirken entsprechend dem Hamiltonoperator H= N X p~2ν 1X V (~xν − ~xµ ) . + 2mν 2 ν=0 (21.29) ν6=µ Offensichtlich bleibt die Schrödingergleichung unverändert unter der Transformation t → −t, ~xν → ~xν , p~ν → −~ pν , ψ → ψ∗ , (21.30) wenn die potenzielle Energie V (~xν − ~xµ ) reell ist. Mit ψ({~x}, t) ist also auch ψ ∗ ({~x}, t) Lösung von (21.28). Die respektiven Wahrscheinlichkeitsdichten |ψ({~x}, t)|2 und |ψ ∗ ({~x}, −t)|2 = |ψ({~x}, −t)|2 beschreiben Vorgänge, die bei Zeitumkehr ineinander übergehen. Auf die Zeitumkehrinvarianz der Schrödingergleichung gründet sich der so genannte Umkehreinwand gegen den zweiten Hauptsatz: zugleich mit der Relaxation ins Gleichgewicht muss auch der umgekehrte Prozess eine Lösung der mikroskopischen Bewegungsgleichung sein. Dieser Einwand ist zweifellos im Prinzip berechtigt. Allerdings suggeriert er unangebrachterweise eine Unverträglichkeit der Bewegungsgleichung mit der Erfahrungstatsache der Irreversibilität. Mit dem Nachweis der Existenz einer Lösung der Schrödingergleichung ist nämlich keine Auskunft über die praktische Realisierbarkeit der Lösung gewonnen. Um eine Lösung der Schrödingergleichung eines Vielteilchensystems zu realisieren, die wie die Umkehrung einer Relaxation ins Gleichgewicht aussieht, müssen durch experimentelle Präparation ganz bestimmte Anfangsbedingungen gewährleistet werden. Nun können im Labor nur einige wenige Parameter eines Vielteilchensystems mit gewünschten Anfangsbedingungen versehen werden. Dass dabei alle anderen (womöglich 1023 ) Koordinaten genau so beeinflusst werden, dass sich eine Antirelaxation“ anschließt, ist, wie ich gleich zeigen werde, ” grenzenlos unwahrscheinlich. Erfahrungsgemäß führt eine makroskopische Observable A(t) nach ihrer Relaxation zum Gleichgewichtswert Ā nur winzige Fluktuationen aus (auf die Ausnahme kritischer Systeme war schon des öfteren hingewiesen worden). Allerdings lässt sich unter sehr allgemeinen Annahmen an die Wechselwirkung 21.8 Relaxation ins Gleichgewicht 369 V (~xν − ~xµ ) zeigen, dass A(t) jedem Anfangswert A(0) irgendwann wieder beliebig nahe kommen muss. Hierauf gründet sich der so genannte Wiederkehreinwand gegen die Verträglichkeit makroskopischer Irreversibilität mit den zeitumkehrinvarianten mikroskopischen Bewegungsgleichungen. Auch dieser Wiederkehreinwand ist zwar im Prinzip berechtigt, jedoch praktisch irrelevant. Wir werden uns nämlich gleich davon überzeugen, dass die mittlere Wiederkehrzeit großer Auslenkungen makroskopischer Observabler aus ihren Gleichgewichtswerten unbeobachtbar groß ist. Betrachten wir in Anlehnung an die verwandten Diskussionen in 2.14 und 13.4 die folgende Summe periodischer Funktionen S(t) = N X eiων t , (21.31) ν=1 die zur Zeit t = 0 den Wert S(0) = N hat. Wir können uns S(t) als Lösung eines reversiblen Problems (z. B. gekoppelte Schwingungen) vorstellen. Nun seien die Zahl N der eingehenden Schwingungen so groß und die Frequenzen ων so dicht benachbart, dass in jedem experimentell auflösbaren Frequenzintervall ∆ω viele ων liegen, etwa gemäß der spektralen Dichte (Lorentzverteilung der Breite γ) ρ(ω) = N γ/π . ω2 + γ 2 (21.32) Dann kann die Summe (21.31) durch ein Integral approximiert werden, und wir erhalten für t > 0 S(t) ≈ Z∞ dω ρ(ω) eiωt = N e−γt . (21.33) −∞ Der resultierende irreversible Abfall von S(t) auf Null ist dem Wiederkehreinwand wie dem Umkehreinwand ausgesetzt. Überzeugen wir uns davon, dass der Wiederkehreinwand gegenstandslos ist, indem wir die mittlere Wiederkehrzeit T einer großen Fluktuation |S(t)| = O(N ) abschätzen. Eine derartige Fluktuation stellt sich ein, wenn die N Phasen ων t alle zugleich in einem kleinen Intervall ∆ϕ ¿ 2π liegen. Da die Phasen alle unabhängig voneinander sind, gilt für die Wahrscheinlichkeit einer Phasenkoinzidenz während einer mittleren Koinzidenzzeit τ τ = T µ ∆ϕ 2π ¶N . (21.34) Zur Berechnung der mittleren Koinzidenzzeit betrachten wir zunächst zwei Glieder aus der Summe (21.31), etwa eiω1 t und eiω2 t . Die erste Phase liege in ∆ϕ im Zeitintervall 0 ≤ t ≤ t1 = ∆ϕ/ω1 . Koinzidenz beider Phasen in A tritt nur ein, wenn die zweite Phase ihren Durchlauf durch ∆ϕ beendet zu einer Zeit t0 , die kleiner ist als t1 + t2 , wobei t2 = ∆ϕ/ω2 . Nehmen wir an, t2 sei kleiner als 370 21 Begründung der Thermodynamik makroskopischer Systeme t1 . Die Koinzidenz beider Phasen in ∆ϕ besteht dann für die Zeit τ (t0 ) = t2 + t 1 − t 0 t2 t0 0 für t1 ≤ t0 ≤ t1 + t2 für t2 ≤ t0 ≤ t1 für 0 ≤ t 0 ≤ t2 (21.35) sonst. Da alle Endpunkte t0 gleichberechtigt sind, erhalten wir die mittlere Koinzidenzzeit zu τ12 = tZ 1 +t2 dt0 0 t1 t2 τ (t0 ) = , t1 + t 2 t1 + t 2 1/τ12 = 1/t1 + 1/t2 = (ω1 + ω2 )/∆ϕ . (21.36) Ohne weitere Rechnung erhalten wir als ein Maß für die Koinzidenz dreier Phasen in ∆ϕ die mittlere Überlappzeit von τ12 und τ13 = ∆ϕ/ω3 , d. h. 1/τ123 = l/τ12 + 1/t3 = (ω1 + ω2 + ω3 )/∆ϕ. Für die mittlere Koinzidenzzeit aller N Phasen erhalten wir so eine Abschätzung durch die mittlere Frequenz ω̄ N 1/τ = 1 X N ων = ω̄ . ∆ϕ ν=1 ∆ϕ (21.37) Damit ergibt sich die gesuchte mittlere Wiederkehrzeit, ∆ϕ T = N ω̄ µ 2π ∆ϕ ¶N . (21.38) Selbst für so große mittlere Frequenzen, wie sie für sichtbares Licht typisch sind, ω̄ ≈ 1015 s−1 , und die bescheidenen Forderungen ∆ϕ/2π = 1/10, N = 100 ergibt sich aus (21.38) eine Wiederkehrzeit (T ≈ 1086 s), die bedeutend größer ist als das Alter des Universums (≈ 1010 Jahre). Damit ist der Wiederkehreinwand als für makroskopische Systeme irrelevant erwiesen. Der Umkehreinwand erledigt sich auch sofort. Damit die Summe S(t) zur Zeit t einen Betrag der Ordnung N hat, nachdem zur früheren Zeit t0 ein sehr viel kleinerer Wert vorlag, muss zur Zeit t0 die Phase ων t0 in einem kleinen Intervall ∆ϕ um den Wert ων (t0 −t) liegen. Die entsprechend gezielte Präparation aller Phasen durch makroskopischen Eingriff ist i. Allg. unmöglich (es gibt die Ausnahmen des Spin- und Photonenechos). Die Wahrscheinlichkeit, bei ungezieltem Eingriff die Phasen alle richtig festzulegen, hat den für große N völlig vernachlässigbaren Wert (∆ϕ/2π)N . Der zweite Hauptsatz stellt, wie die vorangegangene Diskussion und auch schon seine Begründung in 21.4 zeigen, eine statistische Aussage über das Verhalten von Ensembles makroskopisch gleich präparierter Systeme dar. Ausnahmen im Einzelfall sind denkbar, allerdings grenzenlos unwahrscheinlich. Die Relaxation makroskopischer Systeme ins Gleichgewicht ist eine Illusion, der wir uns ungestraft hingeben dürfen. Abbildungsverzeichnis 1.1 1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 16 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 25 26 29 30 32 33 37 39 42 47 48 53 3.1 3.2 3.3 3.4 3.5 3.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 64 66 68 70 70 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 74 75 77 78 79 79 81 84 85 86 88 90 371 372 ABBILDUNGSVERZEICHNIS 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 . . . . . . . . . . . . . . . . 6.1 6.2 6.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 7.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 8.1 8.2 8.3 8.4 8.5 . . . . . 9.1 9.2 9.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 10.1 10.2 10.3 10.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 193 199 202 11.1 11.2 11.3 11.4 11.5 11.6 11.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 207 208 210 213 213 219 12.1 12.2 12.3 12.4 12.5 12.6 12.7 12.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 225 226 228 229 231 232 233 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 99 100 101 102 104 108 110 142 144 148 152 154 13.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 13.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 13.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 ABBILDUNGSVERZEICHNIS 373 14.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 14.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 14.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 15.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 15.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 16.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 16.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 17.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 17.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 18.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 20.1 20.2 20.3 20.4 20.5 20.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 343 347 350 350 351 21.1 21.2 21.3 21.4 21.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362 363 365 366 366