EINF¨UHRUNG IN DIE THEORETISCHE PHYSIK

Werbung
EINFÜHRUNG IN DIE
THEORETISCHE PHYSIK
FRITZ HAAKE
2
Vorwort
Das 1982 erschienene Buch ist längst vergriffen. Der Nachfolger des damaligen Verlages ist an einer Neuauflage nicht interessiert. Der Anregung von
Lesern und Kollegen folgend mache ich den Text nun frei zugänglich. Damit
wird Wechselwirkung mit Nutzern möglich. Mir mitgeteilte Druckfehler und
Unstimmigkeiten werde ich laufend korrigieren. Auch Anregungen zu größeren
Änderungen und Anpassung an inzwischen veränderte Bedürfnisse der Lehrerausbildung sind mir willkommen.
Essen, Oktober 2002
Fritz Haake
3
4
Inhaltsverzeichnis
Inhaltsverzeichnis
5
1 Masse
1.1 Freie Teilchen . . . . . . . . . . . .
1.2 Träge Teilchen . . . . . . . . . . .
1.3 Ein Beispiel: konstante Kraft . . .
1.4 Das Galileische Relativitätsprinzip
1.5 Schwere Teilchen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
11
12
13
15
2 Schwingungen
2.1 Der harmonische Oszillator . . . . . . . . . . . . . . . . . .
2.2 Der Energieeigensatz . . . . . . . . . . . . . . . . . . . . . .
2.3 Der Energiesatz für beliebige konservative Kräfte . . . . . .
2.4 Der gedämpfte harmonische Oszillator . . . . . . . . . . . .
2.5 Resonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Antwort auf beliebige periodische Anregung (Fourierreihen)
2.7 Antwort auf beliebige Anregung . . . . . . . . . . . . . . . .
2.8 Idealisierter Kraftstoß (Deltafunktion) . . . . . . . . . . . .
2.9 Zwei gekoppelte harmonische Oszillatoren . . . . . . . . . .
2.10 Der mechanische Energiesatz für Systeme vieler Teilchen . .
2.11 Schwingungen von mehreren Freiheitsgraden . . . . . . . . .
2.12 Erzwungene Schwingungen von mehreren Freiheitsgraden .
2.13 Transversale Schwingungen der gespannten Saite . . . . . .
2.14 Theorie der Dämpfung(Modell) . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
19
19
21
23
26
29
33
35
39
42
45
48
51
53
57
3 Nichtrelativistische Bewegung im Gravitationsfeld
3.1 Das 1/r-Potential . . . . . . . . . . . . . . . . . . . . .
3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential
3.3 Die Bahnkurven . . . . . . . . . . . . . . . . . . . . .
3.4 Das Zweikörperproblem . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
63
65
68
71
4 Statische wirbelfreie Felder
4.1 Wirbelfreie Vektorfelder . . . . . . . . . . .
4.2 Quellen wirbelfreier Felder . . . . . . . . . .
4.3 Lokale Quellen . . . . . . . . . . . . . . . .
4.4 Elektrostatisches Potential . . . . . . . . . .
4.5 Geladenes Teilchen vor einem Leiter . . . .
4.6 Sphärische Ladungs- bzw. Massenverteilung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
76
78
81
83
84
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
INHALTSVERZEICHNIS
4.7
4.8
4.9
4.10
Monopole, Dipole, Multipole . . . . . . . . . . . . . . .
Die Form der Erde . . . . . . . . . . . . . . . . . . . . .
Die Energie eines Haufens von Ladungen . . . . . . . . .
Die Energie eines Ladungshaufens in einem äußeren Feld
.
.
.
.
86
90
93
95
5 Statische Magnetfelder
~ x) . . . . . . . . . . . . . .
5.1 Das magnetische (Induktions-)Feld B(~
5.2 Das Magnetfeld eines geraden stromdurchflossenen Drahtes . . .
5.3 Wirbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Lokale Wirbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5 Magnetische Monopole . . . . . . . . . . . . . . . . . . . . . . . .
5.6 Die Feldgleichungen . . . . . . . . . . . . . . . . . . . . . . . . .
5.7 Das Fernfeld stationärer Ströme . . . . . . . . . . . . . . . . . . .
5.8 Magnetisches Moment und Drehimpuls . . . . . . . . . . . . . . .
~ x) auf einen magnetischen
5.9 Kraft und Drehmoment eines Feldes B(~
Dipol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
97
99
99
102
104
105
108
111
6 Das
6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8
elektromagnetische Feld
Faradays Induktionsexperiment . . . . . . . . . .
Der Maxwellsche Verschiebungsstrom . . . . . . .
Die Maxwellschen Gleichungen . . . . . . . . . .
Der Energieerhaltungssatz . . . . . . . . . . . . .
Die Wellengleichung für die Potentiale . . . . . .
Ebene elektromagnetische Wellen im freien Raum
Die retardierten Potentiale . . . . . . . . . . . . .
Elektrische Dipolstrahlung . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
111
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
113
115
116
117
119
120
123
126
7 Elektromagnetische Felder in Materie
7.1 Polarisation und Magnetisierung . . . . . . . . . . .
7.2 Materialgesetze für Polarisation und Magnetisierung
7.3 Wellen in linearen Dielektrika . . . . . . . . . . . . .
7.4 Modell eines Dielektrikums . . . . . . . . . . . . . .
7.5 Ohmsches Gesetz . . . . . . . . . . . . . . . . . . . .
7.6 Wellen in Leitern . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
129
129
134
136
137
138
139
8 Symmetrien
8.1 Der Raum ist homogen .
8.2 Der Raum ist isotrop . .
8.3 Die Zeit ist homogen . .
8.4 Galileiinvarianz . . . . .
8.5 Lorentzinvarianz . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
141
141
143
150
150
152
9 Spezielle Relativitätstheorie
9.1 Die Lorentztransformation der Koordinaten . .
9.2 Relativität der Gleichzeitigkeit . . . . . . . . .
9.3 Zeitdilatation . . . . . . . . . . . . . . . . . . .
9.4 Längenkontraktion . . . . . . . . . . . . . . . .
9.5 Addition von Geschwindigkeiten . . . . . . . .
9.6 Lorentzinvarianz der Maxwellschen Gleichungen
9.7 Feld einer gleichförmig bewegten Punktladung .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
155
155
158
158
161
162
163
165
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
7
9.8 Lorentzskalare und Lorentzvektoren . . . . . . . . . . . . . . . .
9.9 Relativistischer Impuls und Viererimpuls eines Teilchens . . . . .
9.10 Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.11 Bewegung im konstanten elektrischen Feld . . . . . . . . . . . . .
9.12 Eine bequeme Schreibweise . . . . . . . . . . . . . . . . . . . . .
166
168
170
173
174
10 Bewegung schneller Teilchen im Gravitationsfeld
10.1 Rückblick auf die Newtonsche Theorie . . . . . . .
10.2 Einsteins Äquivalenzprinzip . . . . . . . . . . . . .
10.3 Die Viererkraft im Gravitationsfeld . . . . . . . . .
10.4 Lichtstrahlen im Gravitationsfeld . . . . . . . . . .
10.5 Der metrische Tensor ist das Gravitationsfeld . . .
10.6 Der Newtonsche Grenzfall . . . . . . . . . . . . . .
10.7 Frequenzverschiebung fallender Photonen . . . . .
10.8 Nochmal auf die rotierende Scheibe! . . . . . . . .
10.9 Das statische isotrope Gravitationsfeld . . . . . . .
10.10Bewegungsgleichungen im statischen isotropen Feld
10.11Periheldrehung der Planeten . . . . . . . . . . . . .
10.12Lichtablenkung durch die Sonne . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
179
179
180
181
184
186
188
190
192
194
196
199
202
11 Quanten
11.1 Teilchen sind Wellen . . . . . . . . . . . . .
11.2 Heisenbergs Unschärferelation . . . . . . . .
11.3 Die Grundprinzipien der Quantenmechanik
11.4 Die Schrödingergleichung . . . . . . . . . .
11.5 Normierung der Wellenfunktion . . . . . . .
11.6 Mittelwerte . . . . . . . . . . . . . . . . . .
11.7 Freie Pakete zerfließen . . . . . . . . . . . .
11.8 Das Ehrenfestsche Theorem . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
205
205
210
211
212
215
216
218
220
12 Quanten in Kästen
12.1 Eindimensionale Potentialstufe . . . . . . .
12.2 Eindimensionaler Kasten mit starrem Rand
12.3 Potentialtopf endlicher Tiefe . . . . . . . . .
12.4 Quanten durchdringen Wände . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
223
223
226
229
232
13 Harmonisch gebundene Quanten
13.1 Eindimensionaler harmonischer Oszillator . . . . . . . . . . . . .
13.2 Die Orthogonalität normierbarer Eigenfunktionen hermitescher
Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.3 Die erzwungene Schwingung des harmonischen Oszillators . . . .
13.4 Die Umgebung belässt nur den Grundzustand stabil . . . . . . .
235
235
14 Das
14.1
14.2
14.3
14.4
14.5
253
253
254
256
257
259
Wasserstoffatom
Relativ- und Schwerpunktsbewegung . . . . . .
Bewegung im Coulombfeld . . . . . . . . . . . .
Der Bahndrehimpuls . . . . . . . . . . . . . . .
Kommutierende Operatoren haben gemeinsame
Die Eigenwerte des Bahndrehimpulses . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
Eigenfunktionen
. . . . . . . . . .
240
243
245
8
INHALTSVERZEICHNIS
14.6
14.7
14.8
14.9
Die Eigenfunktionen des Bahndrehimpulses
Das Radialproblem beim Coulombfeld . . .
Die Auswahlregeln . . . . . . . . . . . . . .
Verwandte Zweikörpersysteme . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
263
266
270
272
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen
275
15.1 Die Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . 275
15.2 Die klassische Hamiltonfunktion . . . . . . . . . . . . . . . . . . . 277
15.3 Klassische (nichtrelativistische) Bewegung im konstanten Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
15.4 Geladenes Quant im konstanten Magnetfeld . . . . . . . . . . . . 282
15.5 Eichinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
15.6 Zeemaneffekt beim Wasserstoffatom (ohne Spin) . . . . . . . . . 286
16 Spin
16.1 Der Spin des Elektrons . . . . . . . . . . . . . . . . . . . . . . . .
16.2 Das magnetische Moment von Teilchen mit Spin . . . . . . . . .
16.3 Der anomale Zeemaneffekt beim H-Atom . . . . . . . . . . . . .
289
289
292
293
17 Grundbegriffe der Statistik
17.1 Wahrscheinlichkeit von Ereignissen . . . .
17.2 Diskrete eindimensionale Zufallsbewegung
17.3 Die Binomialverteilung für große N . . . .
17.4 Eindimensionale Diffusion . . . . . . . . .
17.5 Der Zentrale Grenzwertsatz . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
297
297
298
299
300
303
18 Statistische Behandlung von Vielteilchensystemen
18.1 Ensembles . . . . . . . . . . . . . . . . . . . . . . . .
18.2 Stationäre Ensembles . . . . . . . . . . . . . . . . . .
18.3 Die Energieabhängigkeit der Zustandsdichte . . . . .
18.4 Das mikrokanonische Ensemble . . . . . . . . . . . .
18.5 Das kanonische Ensemble . . . . . . . . . . . . . . .
18.6 Das großkanonische Ensemble . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
307
307
308
310
311
313
317
19 Thermodynamische Variable
19.1 Entropie . . . . . . . . . . .
19.2 Temperatur . . . . . . . . .
19.3 Druck . . . . . . . . . . . .
19.4 Chemisches Potential . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
319
319
322
325
327
.
.
.
.
.
.
331
331
334
340
343
348
352
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20 Ideale Gase
20.1 Ununterscheidbarkeit identischer Teilchen
20.2 Thermische Photonen . . . . . . . . . . .
20.3 Thermische Phononen in Festkörpern . . .
20.4 Das ideale Bosegas . . . . . . . . . . . . .
20.5 Bose-Einstein-Kondensation . . . . . . . .
20.6 Das ideale Fermigas . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
21 Begründung der Thermodynamik makroskopischer
21.1 Arbeit und Wärme bei Zustandsänderungen . . . . .
21.2 Erster Hauptsatz . . . . . . . . . . . . . . . . . . . .
21.3 Entropieänderungen bei Zustandsänderungen . . . .
21.4 Zweiter Hauptsatz . . . . . . . . . . . . . . . . . . .
21.5 Unmöglichkeit des perpetuum mobile zweiter Art . .
21.6 Unmöglichkeit des perfekten Kühlapparats . . . . . .
21.7 Die Carnotmaschine . . . . . . . . . . . . . . . . . .
21.8 Relaxation ins Gleichgewicht . . . . . . . . . . . . .
Abbildungsverzeichnis
Systeme
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
9
.
.
.
.
.
.
.
.
359
359
360
360
361
362
364
364
367
371
10
INHALTSVERZEICHNIS
Kapitel 1
Masse
1.1
Freie Teilchen
Das freie Teilchen ist eine nützliche Idealisierung. Seine Freiheit ist eine
Freiheit von Kräften. Beispiele für näherungsweise freie Teilchen kennen Sie
vom Luftkissentisch und aus der Raumfahrt.
Das freie Teilchen ändert im Lauf der Zeit seine Geschwindigkeit nicht. Es
bewegt sich geradlinig und legt in gleichen Zeitabschnitten ∆t gleiche Wegstücke
∆~x = (∆x, ∆y, ∆z) zurück, so dass für seine Geschwindigkeit gilt
~v = (vx , vy , vz ) =
µ
∆x ∆y ∆z
,
,
∆t ∆t ∆t
¶
−−−→
= const .
(1.1)
Wenn ein Teilchen in einem Bezugssystem S frei ist, so auch in jedem anderen, S 0 , das sich relativ zu S gleichförmig und geradlinig bewegt. Alle diese
Systeme heißen Inertialsysteme. Es ist gleichgültig, welches Inertialsysteme zur
Beschreibung der Bewegung des freien Teilchens benutzt wird. Beispielsweise
kann ein Ruhesystem gewählt werden, d. h. ein Koordinatensystem, bezüglich
−−−→
dessen das Teilchen unbewegt ruht. Jedenfalls gilt ~v = const in allen Inertialsystemen.
Wenn sich zwei Teilchen mit gleichförmiger Geschwindigkeit ~v1 und ~v2 bewegen, so lässt sich aus Prinzip nicht entscheiden, welches von beiden ruht und
welches in Bewegung ist. Im Ruhesystem eines der beiden bewegt sich das
andere.
1.2
Träge Teilchen
~
Um die Geschwindigkeit
eines Teilchens zu ändern, bedarf es einer Kraft K.
p
2
2
2
Zur Änderung |∆~v | = (∆vx ) + (∆vy ) + (∆vz ) in der Zeitspanne ∆t ist eine
um so größere Kraft vonnöten, je träger ein Teilchen ist. Für hinreichend kleine
Zeitspannen ∆t und Geschwindigkeitsänderungen ∆~v ergibt sich im Experiment
die Proportionalität
∆~v
~ .
∼K
∆t
11
(1.2)
12
1 Masse
Der Proportionalitätsfaktor heißt die träge Masse m des Teilchens. Je größer
sie ist, desto träger ist das Teilchen. Für alle Teilchen gilt
m≥0,
(1.3)
da erfahrungsgemäß die Änderungsrate der Geschwindigkeit ∆~v ∆t und die
~ gleichgerichtet sind.
Kraft K
Anstatt das Gesetz (1.2) für endliche aber hinreichend kleine Differenzen ∆t
und ∆~v zu formulieren, führt man den Differentialquotienten
lim
∆t→0
d~v
∆~v
=
=
∆t
dt
µ
dvx dvy dvz
,
,
dt
dt
dt
¶
(1.4)
ein und nennt den Grenzwert d~v /dt der Änderung der Geschwindigkeit im beliebig kleinen Zeitintervall die Beschleunigung des Teilchens. Mit Hilfe dieses
Begriffes schreibt sich das Gesetz (1.2) in der wohlbekannten Form
~ = m d~v .
K
dt
(1.5)
Sie kennen (1.5) als eines der Newtonschen Grundgesetze der Mechanik. Es
erlaubt, sobald die auf das Teilchen wirkende Kraft als Funktion der Koordinaten des Teilchens bekannt ist, die Berechnung der möglichen Bahnkurven
~x(t) = (x(t), y(t), z(t)).
1.3
Ein Beispiel: konstante Kraft
Ich erinnere Sie an den einfachsten Fall einer nicht gleichförmigen Bewegung: Ein Teilchen ist einer räumlich und zeitlich konstanten Kraft ausgesetzt.
Beispiele solcher Kräfte sind - mit guter Näherung - die Schwerkraft nahe der
Erdoberfläche und die elektrische Kraft, die ein geladenes Teilchen zwischen den
parallelen Platten eines ebenen Plattenkondensators erfährt.
Zur Beschreibung der Bahnkurve wählen wir das Koordinatensystem so, dass
~ = (0, 0, K). Dann lautet das Grundgesetz (1.5)
K
dvx
= 0,
dt
dvy
=0,
dt
dvz
1
=
K .
dt
m
(1.6)
Die beiden ersten dieser Gleichungen besagen, dass die x- und y-Komponenten
der Geschwindigkeit sich zeitlich nicht ändern, d. h. vx (t) = vx (0) = const
und vy (t) = vy (0) = const. Es lässt sich dann übrigens immer ein Koordinatensystem angeben, in dem vx = vy = 0 ist. Die letzte der drei Gleichungen
besagt, dass die Beschleunigung des Teilchens in z-Richtung zeitlich konstant
ist. Demnach gilt für die Geschwindigkeit
vz (t) =
1
Kt + vz (0) ,
m
(1.7)
1.4 Das Galileische Relativitätsprinzip
13
wobei die Integrationskonstante vz (0) die Bedeutung der anfänglichen Geschwindigkeit in z-Richtung hat. Die drei Lösungen der Gleichungen (1.6) lassen sich
zu der Vektorgleichung
~v (t) = ~v (0) +
1 ~
Kt
m
(1.8)
zusammenfassen.
Wenn wir beachten, dass die Geschwindigkeit des Teilchens die zeitliche
Änderung der Ortskoordinaten gibt,
µ
¶
∆~x
d~x
dx dy dz
~v = lim
=
=
,
,
,
(1.9)
∆t→0 ∆t
dt
dt dt dt
so können wir (1.8) als Differentialgleichungen für den Ortsvektor ~x = (x, y, z)
auffassen,
dx
= vx (0),
dt
dy
= vy (0),
dt
dz
1
= vz (0) + Kt .
dt
m
(1.10)
Durch Integration über die Zeit erhalten wir die Bestimmungsgleichungen der
Bahnkurve
x(t) = vx (0)t + x(0)
y(t) = vy (0)t + y(0)
1
Kt2 + vz (0)t + z(0) ,
z(t) =
2m
(1.11)
die sich wieder zu einer Vektorgleichung vereinigen lassen,
~x(t) = ~x(0) + ~v (0)t +
1 ~ 2
Kt .
2m
(1.12)
Die drei Integrationskonstanten x(0), y(0), z(0) haben offensichtlich die Bedeutung der anfänglichen Koordinaten des Teilchens. Insgesamt treten in der
Bahnkurve (1.11) sechs Integrationskonstanten auf, die drei anfänglichen Geschwindigkeitskomponenten neben den drei anfänglichen Koordinaten. Die Zahl
der Integrationskonstanten erklärt sich dadurch, dass jede der drei Bewegungsgleichungen (1.6) zweimal integriert werden musste, damit die Lösung (1.11)
entstand.
1.4
Das Galileische Relativitätsprinzip
Über das freie Teilchen hatte ich gesagt, es sei gleichgültig, von welchem
Inertialsystem aus seine Bewegung beschrieben wird; in allen Inertialsystemen
−−−→
~ wirkt, so gilt zwar in keinem
gilt ~v = const. Wenn auf ein Teilchen eine Kraft K
−−−→
~
Koordinatensystem, bezüglich dessen K 6= 0 konstatiert wird, ~v = const. Ich
14
1 Masse
zeige aber jetzt, zunächst für den eben betrachteten Spezialfall einer konstanten Kraft, dass zur Beschreibung der Bewegung immer noch alle gleichförmig
zueinander bewegten Koordinatensysteme gleichberechtigt sind.
Führen wir insbesondere ein Koordinatensystem S 0 ein, dessen Ursprung im
bisher benutzten Koordinatensystem S die Koordinaten
~x0 (t) = ~x(0) + ~v (0)t
(1.13)
hat und dessen Achsen zu den entsprechenden von S parallel liegen. S 0 ist
ein anfängliches Ruhesystem des Teilchens. Der Ursprung von S 0 bewegt sich
relativ zu S gleichförmig mit ~v (0); zur Zeit t = 0 liegt er bei ~x(0), wo dann auch
gemäß (1.12) das betrachtete Teilchen sitzt. Wenn die Uhren im S 0 genauso
laufen wie in K, was für hinreichend kleine Relativitätsgeschwindigkeit ~v (0)
eine Erfahrungstatsache ist, so misst der das Koordinatensystem S 0 benutzende
Beobachter für die Koordinaten des Teilchen
x0 (t) = 0,
y 0 (t) = 0,
z 0 (t) =
1
Kt2
2m
(1.14)
bzw. in Vektorform
~x0 (t) =
1 ~ 2
Kt .
2m
(1.15)
Zwischen den Koordinaten des Teilchens in S und S 0 besteht der Zusammenhang
~x = ~x0 + ~x(0) + ~v (0)t,
t = t0 ,
(1.16)
der als Galileitransformation bezeichnet wird.
Es ist wie gesagt gleichgültig, ob die Bewegung des Teilchens unter dem
~ im Koordinatensystem S oder im Koordinatensystem S 0
Einfluss der Kraft K
beschrieben wird. Zwar ändert sich unter der Galileitransformation (1.16) die
Bahnkurve, und zwar von (1.12) zu (1.15); gleich bleibt jedoch in S und S 0 (und
~ = md2 ~x/dt2 . Denn wir erhalten
allen Inertialsystemen) das Grundgesetz K
durch zweimaliges Differenzieren nach der Zeit aus (1.15)
Ã
!
~ 2
d2 ~x0
d2 Kt
~
m 02 = m 2
=K
dt
dt
2m
und aus (1.12)
d2 ~x
d2
m 2 =m 2
dt
dt
Ã
~ 2
Kt
+ ~v (0)t + ~x(0)
2m
!
~ ,
=K
also in beiden Fällen dieselbe Differentialgleichung.
−−−→
~ = const
Was ich hier am Beispiel des speziellen Kraftgesetzes K
vorgeführt
~ = K(~
~ x) richtig: Das Grundgesetz
habe, ist auch für andere Kraftgesetze K
~ = md~v /dt gilt in gleicher Form in allen Inertialsystemen, d. h. allen KoK
ordinatensystemen, die durch die Galileitransformation (1.16)verknüpft sind.
1.5 Schwere Teilchen
15
Der Grund für die Invarianz (Unveränderlichkeit) des Grundgesetzes unter der
Galileitransformation ergibt sich aus folgender Überlegung: einerseits ist die Beschleunigung eines Teilchens in allen Inertialsystemen gleich. Wenn wir nämlich
in (1.16)~x und ~x0 als zeitabhängige Ortsvektoren eines Teilchens ansehen, so gilt
d2 ~x
d2 ~x0
d2
d2 ~x0
=
+ 2 (~x(0) + ~v (0)t) =
.
2
2
dt
dt
dt
dt2
Andererseits sind Größe und Richtung der an einem Punkt im Raum auf das
~ x) unabhängig davon, ob wir den Raumpunkt mit
Teilchen wirkenden Kraft K(~
Koordinaten bezüglich S oder bezüglich S 0 versehen.
Die Invarianz des Grundgesetzes unter der Galileitransformation (1.16)ist eine wichtige Symmetrieeigenschaft des Grundgesetzes (1.5). Sie beinhaltet auch
das wohlbekannte Additionsgesetz für Geschwindigkeiten. Hat ein Teilchen im
System S 0 zu einem bestimmten Zeitpunkt die Geschwindigkeit ~v 0 und bewegt
sich S 0 relativ zu S gleichförmig mit ~u, so hat das Teilchen in S die Geschwindigkeit
~v = ~v 0 + ~u .
Abbildung 1.1
Empirisch ist das soeben besprochene Additionstheorem für Geschwindigkeiten genau wie das Newtonsche Grundgesetz schön abgesichert. Allerdings
nur für Teilchen- und Relativgeschwindigkeiten, die allesamt klein gegenüber
der Lichtgeschwindigkeit c ≈ 300 000 km/s sind. Sobald Geschwindigkeiten im
Spiel sind, die betragsmäßig auch nur einige Prozent von c betragen, werden sowohl das Vektoradditionsgesetz für Geschwindigkeiten wie auch das Newtonsche
Grundgesetz unrichtig. Die dann an ihre Stelle tretenden Gesetze besprechen
wir im Kapitel 9. Vorläufig beschränken wir uns auf den nichtrelativistischen“
”
Newtonschen Grenzfall |~v |/c ¿ 1.
1.5
Schwere Teilchen
Die Wanderer und Bergsteiger unter Ihnen kennen den Unterschied zwischen
leichten und schweren Rucksäcken. Verschiedene Teilchen erfahren an der Erdoberfläche eine verschiedene Schwerkraft. Im durch die Abbildung 1.5 beschriebenen Gedankenexperiment lässt sich die Schwere“ eines Körpers quantitativ
”
erfassen.
Je schwerer ein an einer Feder aufgehängter Körper ist, desto weiter dehnt sich
dieselbe aus. Nach geeigneter Eichung der Feder kann der Betrag der auf einen
16
1 Masse
Abbildung 1.2
aufgehängten Körper wirkenden Schwerkraft aus der Verlängerung ∆z der Feder
abgelesen werden.
Die Schwerkraft, die ein Probekörper an der Erdoberfläche erfährt, ist stets
zum Erdmittelpunkt hin gerichtet. Ihre Richtung ändert sich, wenn der fragliche Probekörper auf der Erdoberfläche bewegt wird. Folglich ist die Schwerkraft
nicht eine Eigenschaft des Probekörpers allein, sondern eine gemeinsame Eigenschaft desselben und der ihn anziehenden Erde.
Um die Schwere eines Probekörpers als richtungsunabhängige Eigenschaft
seiner selbst zu charakterisieren, wird der Begriff der schweren Masse eingeführt
durch
~ schwer | .
mschwer ∼ |K
(1.17)
~ schwer | in Newton
Wenn die schwere Masse in kg und die Schwerkraft |K
−2
(1 N = 1 kg · m · s ) gemessen werden, so ergibt sich der Proportionalitätsfaktor
~ schwer |/mschwer
g = |K
(1.18)
aus Messungen an der Erdoberfläche zu
g = 9, 81 m·s−2 .
(1.19)
Allerdings verkleinert sich der Proportionalitätsfaktor für wachsende Entfernung
vom Erdmittelpunkt.
Sie haben die Anziehungskraft zwischen zwei Teilchen mit den schweren
Massen mschwer und Mschwer im Labor gemessen und das berühmte Newtonsche
Gravitationsgesetz gefunden. Dieses besagt:
- Die beiden Teilchen ziehen sich gegenseitig an.
- Die beiden Anziehungskräfte sind betragsmäßig gleich (actio = reactio)
und einander entgegengerichtet; ihre Richtungen sind parallel zur Verbindungslinie der (Schwerpunkte der) Teilchen.
1.5 Schwere Teilchen
17
- Der Betrag der Gravitationskraft ist proportional zu den beiden schweren
Massen,
~ ∼ mschwer
|K
und
~ ∼ Mschwer
|K|
- Mit wachsender Entfernung r der beiden Teilchen nimmt der Betrag der
Gravitationskraft ab, u. z. umgekehrt proportional zum Quadrat der Entfernung,
~ ∼
|K|
1
.
r2
Insgesamt lässt sich der Betrag der Gravitationskraft ausdrücken als
~ =G
|K|
mschwer Mschwer
,
r2
(1.20)
wobei
G = 6, 67 × 10−11 N m2 kg−2
(1.21)
die so genannte Gravitationskonstante ist.
Jeder Körper ist zugleich träge und schwer. Die Trägheit wird quantifiziert
durch die träge Masse, die Schwere durch die Masse. Warum tragen beide
Größen den Namen Masse? Die Antwort begründet sich in einem Messergebnis,
das zuerst von Galilei (1564 - 1642) gefunden und seither immer wieder mit
wachsender Genauigkeit nachgeprüft wurde: Das Verhältnis von schwerer Masse
und träger Masse ist für alle Teilchen gleich. Der Zahlenwert des Verhältnisses
hängt von der Wahl der Einheiten ab, hat also keine physikalische Bedeutung.
Es ist üblich, sowohl mschwer als auch mträge in kg zu messen. Dann gilt
mschwer = mträge
(1.22)
und daher heißen beide Größen Masse. Meistens spricht man undifferenziert von
der Masse eines Körpers, ohne besonders hervorzuheben, ob jeweils die Trägheit
oder die Schwere des Körpers zur Debatte steht.
Die Gleichheit von schwerer und träger Masse ist, nach unserem heutigen Verständnis der Materie, von fundamentalerer Bedeutung als die beiden
~ = md~v /dt und K = GmM/r 2 . Ersteres gilt nur
Newtonschen Gesetze K
näherungsweise für Teilchen mit v ¿ c, letzteres nur näherungsweise für Teilchen mit hinreichend kleinen Massen in hinreichend großen Entfernungen voneinander. Der Planet Merkur merkt im Perihel (Punkt kleinsten Abstands zur
Sonne) seiner Bahn eine Abweichung der Anziehungskraft der Sonne von diesem Gesetz. Einstein folgerte aus mschwer = mträge eine Gravitationstheorie, die
allgemeine Relativitätstheorie, die genauer ist als das Newtonsche Gesetz.
18
1 Masse
Kapitel 2
Schwingungen
2.1
Der harmonische Oszillator
Betrachten wir ein Teilchen der Masse m, das längs einer Geraden beweglich
und durch eine harmonische Rückstellkraft an eine Gleichgewichtslage gebunden
ist. Wenn wir die Auslenkung des Teilchens aus der Gleichgewichtslage mit der
Koordinate x parametrisieren, so kommt die Harmonizität der Rückstellkraft
zum Ausdruck in der Linearität der Kraft
K = −kx
(2.1)
in der Auslenkung x. Der Proportionalitätsfaktor k wird zuweilen als Kraftkonstante bezeichnet und ist als positiv definiert. Das Minuszeichen im Kraftgesetz
(2.1) zeigt somit an, dass die Kraft der Auslenkung stets entgegenwirkt und
tatsächlich eine Rückstellkraft ist.
~ = md~v /dt
Für das in Rede stehende Teilchen gibt das Newtonsche Gesetz K
als Bewegungsgleichung die so genannte Schwingungsgleichung
m
d2 x
= −kx ,
dt2
(2.2)
aus der wir nun die Bahnkurve x(t) gewinnen wollen. Mit Hilfe von
ω 2 = k/m
(2.3)
und d2 x/dt2 = ẍ bringen wir die Bewegungsgleichung (2.2) zunächst in die
schönere Form
ẍ + ω 2 x = 0 .
(2.4)
Eine Lösung der Differentialgleichung (2.4) lässt sich sofort angeben,
x(t) = 0 .
19
(2.5)
20
2 Schwingungen
Sie entspricht dem Ruhezustand des Teilchens in der Gleichgewichtslage und
heißt die triviale Lösung. Es muss zwei linear unabhängige nichttriviale Lösungen
geben, da die Differentialgleichung (2.4) von zweiter Ordnung ist. Ein mögliches
Paar solcher Lösungen ist sin ωt und cos ωt. Wegen der Linearität der Bewegungsgleichung gilt das Superpositionsprinzip. Die allgemeinste Lösung ergibt
sich daher als die Schwingung
x(t) = a cos ωt + b sin ωt .
(2.6)
Die beiden Integrationskonstanten a und b können durch Anfangsbedingungen festgelegt werden, z. B. durch die anfängliche Auslenkung x(0) und die
anfängliche Geschwindigkeit ẋ(0). Dann entsteht aus (2.6)
x(t) = x(0) cos ωt +
1
ẋ(0) sin ωt.
ω
(2.7)
Wir können auch die Additionstheoreme für Sinus und Kosinus benutzen
und schreiben
x(t) = xmax cos(ωt − ϕ)
(2.8)
und die beiden Integrationskonstanten xmax , ϕ durch x(0) und ẋ(0) ausdrücken.
Dabei finden wir für die Amplitude xmax der Schwingung
xmax =
p
x(0)2 + (ẋ(0)/ω)2
(2.9)
und für die Phase ϕ
tan ϕ = ẋ(0)/ωx(0) .
(2.10)
Es ist für viele, vor allem rechnerische Zwecke bequem, statt mit cos ωt
und sin ωt mit Exponentialfunktionen zu arbeiten. Setzen wir zur Lösung der
Gleichung (2.4) an
x(t) = eλt ,
(2.11)
so erhalten wir aus (2.4) die Forderung
(λ2 + ω 2 ) eλt = 0 .
(2.12)
Der Ansatz (2.11) führt offenbar zu Lösungen für λ = ±iω. Diese lauten e±iωt ,
oder linear kombiniert,
x(t) = A e−iωt + B e−iωt .
(2.13)
2.2 Der Energieeigensatz
21
Die beiden Integrationskonstanten A und B lassen sich wieder durch x(0) und
ẋ(0) ausdrücken
x(t)
=
=
µ
µ
¶
¶
1
i
i
1
x(0) − ẋ(0) e iωt +
x(0) + ẋ(0) e−iωt
2
ω
2
ω
¶
µ
i
1
(2.14)
x(0) − ẋ(0) e iωt + c.c. .
2
ω
Offensichtlich gilt A = B ∗ , und das muss auch so sein, damit x(t) reell bleibt.
Mit Hilfe von
eiα = cos α + i sin α
(2.15)
lässt sich die Lösung (2.14) wieder auf die Form (2.7) oder (2.8) zurückführen.
2.2
Der Energieeigensatz
Anstatt Lösungen der Schwingungsgleichung zu raten oder durch Exponentialansätze zu suchen, können wir sie auch durch zweimaliges Integrieren konstruieren. Dabei finden wir nicht nur die bekannten Lösungen, sondern auch,
nach einer Integration, einen der wichtigsten Sätze der Physik, den Energieerhaltungssatz.
Multiplizieren wir nämlich beide Seiten der Schwingungsgleichung (2.2) mit
der Geschwindigkeit ẋ, so lässt sich die entstehende Gleichung,
mẋẍ + k ẋx = 0 ,
als das Verschwinden einer totalen Zeitableitung schreiben,
¶
µ
1
1
d
2
2
mẋ + kx = 0 .
dt 2
2
(2.16)
(2.17)
Folglich bleibt die Größe
1
1
mẋ2 + kx2 = E ≥ 0 ,
2
2
(2.18)
die Energie des Oszillators, zeitlich konstant. Sie besteht aus zwei nichtnegativen additiven Anteilen, der kinetischen Energie
T =
m 2
ẋ
2
(2.19)
U=
k 2
x .
2
(2.20)
und der potenziellen Energie
22
2 Schwingungen
Wenn U zunimmt, d. h. wenn die Auslenkung |x| wächst, muss T abnehmen,
d. h. die Geschwindigkeit |ẋ| sich verkleinern, U ist maximal, Umax = E, wenn
T = 0, d. h. wenn das Teilchen ruht. Ein solcher Momentanzustand liegt immer
in den Umkehrpunkten
±x = xmax =
p
2E/k
(2.21)
vor. Dagegen hat die Geschwindigkeit den Maximalwert
±ẋ = ẋmax =
p
2E/m
(2.22)
jedesmal, wenn das Teilchen die Gleichgewichtslage bei x = 0 durchläuft, denn
dort hat die potenzielle Energie den kleinstmöglichen Wert U = 0 Abbildung
(2.1).
Die potenzielle Energie lässt sich durch die Kraft ausdrücken und umgekehrt.
Sie verifizieren leicht, dass die Kraft der negativen Ableitung der potenziellen
Energie gleich ist,
d
K = −kx = −
dx
µ
k 2
x
2
¶
=−
d
U ,
dx
Abbildung 2.1
und die potenzielle Energie dem negativen Integral über die Kraft,
(2.23)
2.3 Der Energiesatz für beliebige konservative Kräfte
U =+
Zx
1
dx kx = kx2 = −
2
0
0
0
Zx
dx0 K(x0 ) .
23
(2.24)
0
Man sagt auch, dass beim Vergrößern von x gegen die Kraft K Arbeit geleistet
wird. Dabei wird die Arbeit als potenzielle Energie gespeichert.
Die Begriffsbildungen Energie, kinetische Energie und potenzielle Energie
werden wir später vertiefen. Vorläufig konzentrieren wir uns auf die Aufgabe,
die Bahnkurve x(t) des Oszillators zu konstruieren. Zu diesem Zweck lösen wir
den Energiesatz (2.18) nach der Geschwindigkeit auf,
s
µ
¶
2
k 2
dx
ẋ(t) =
,
(2.25)
E− x =
m
2
dt
und integrieren. Wir erhalten
x(t)
Z
x(0)
q
dx
2
m
¡
E−
k
2
x2
¢=
Zt
dt = t ,
(2.26)
0
wobei jetzt x(0) als zweite Integrationskonstante neben E auftritt. Gleichfalls
möglich und sogar ein wenig bequemer
p ist es, statt der anfänglichen Auslenkung
x(0) die größte Amplitude, xmax = 2E/k, als Integrationskonstante zu wählen
und einen der (∞ vielen) Zeitpunkte,
an denen x = +xmax vorliegt, als tmax zu
p
bezeichnen. Mit Hilfe von ω = k/m erhalten wir dann statt (2.26)
x(t)
Z
+xmax
p
dx
x2max
− x2
= ω(t − tmax ) .
(2.27)
Das links stehende Integral hat den Wert − arccos (x(t)/xmax ). Damit ist die
aus 2.1 bekannte Lösung
x(t) = xmax cos ω(t − tmax )
(2.28)
wiedergefunden. Diesmal, wohlgemerkt, nicht durch gescheites Raten sondern
durch direkte Integration der Bewegungsgleichung.
2.3
Der Energiesatz für beliebige konservative
Kräfte
Beim Integrieren der Bewegungsgleichung mẍ+kx = 0 zum Energiesatz E =
mẋ/2 + kx2 /2 war gar nicht wesentlich, dass die Kraft linear in x ist; vielmehr
nur, dass K = K(x) nur von x abhängt und nicht etwa auch von ẋ, ẍ etc.
Kräfte, die eindeutige Funktionen einer Koordinate x sind, heißen konservativ
(konservativ = erhaltend; Energieerhaltung). Wirkt eine beliebige derartige
Kraft auf ein Teilchen, so lautet die Newtonsche Bewegungsgleichung
24
2 Schwingungen
mẍ − K(x) = 0 .
(2.29)
Durch Multiplikation mit der Geschwindigkeit ẋ entsteht hieraus
mẋẍ − ẋK(x) = 0 .
(2.30)
Schreiben wir die Kraft als negative Ableitung einer Funktion U (x)
K(x) = −
d
U (x) = −U 0 (x) ,
dx
(2.31)
so lässt sich (2.30) offenbar wieder als der Erhaltungssatz
d
dt
µ
1
mẋ2 + U (x)
2
¶
=0
(2.32)
oder
1
mẋ2 + U (x) = const = E
2
(2.33)
schreiben. Dabei ist U (x) die potenzielle und T = 21 mẋ2 wieder die kinetische
Energie.
Wie schon beim harmonischen Oszillator erlaubt der Energiesatz (2.33) vor
jeder weiteren Rechnung qualitative Einblicke in den Ablauf der Bewegung des
Teilchens. Wenn etwa die potenzielle Energie den in Abbildung 2.2 skizzierten
Verlauf hat, so gilt für die Energie
E ≥ Umin ,
(2.34)
da die kinetische Energie nicht negativ sein kann. Durch den Wert der Energie
sind zwei Umkehrpunkte x1 (e) und x2 (E) festgelegt, in denen das Teilchen
momentan ruht und die die Aufenthaltsmöglichkeit des Teilchens einschränken,
x1 (E) ≤ x ≤ x2 (E) .
(2.35)
Die Teilchenkoordinate schwingt dann zwischen den beiden Umkehrpunkten hin
und her. Allerdings verläuft die Schwingung nicht harmonisch, d. h. sinusoder kosinusförmig mit einer Frequenz ω, es sei denn, U (x) habe genau die
Form einer quadratischen Parabel. Man spricht von einer nichtlinearen oder
anharmonischen Schwingung.
Die Berechnung der Bahnkurve x(t) kann für die nichtlineare Schwingung
bis auf eine Quadratur genauso durchgeführt werden wie für die harmonische
Schwingung. Durch Auflösen des Energiesatzes (2.33) nach der Geschwindigkeit
erhalten wir wieder (2.25), also
2.3 Der Energiesatz für beliebige konservative Kräfte
25
Abbildung 2.2
dx
=±
dt
r
2
(E − U (x))
m
(2.36)
und hieraus durch Integration nach der Zeit
t=±
r
m
2
Z
dx (E − U (x))
−1/2
+ const .
(2.37)
Zur Gewinnung der Bahnkurve ist nur die eine in (2.37) offene Quadratur auszuführen.
Für die Dauer einer Schwingung ergibt sich aus (2.37) das Resultat
T
=
=
r
√
x
Z2
m
2 
2m
x1
Zx2
x1
dx(E − U (x))−1/2 −
dx (E − U (x))
−1/2
.
Zx1
x2
dx (E − U (x))
−1/2



(2.38)
Im allgemeinen wird die Dauer einer nichtlinearen Schwingung von der Energie
E abhängen. Als kleine Übung bleibt Ihnen, durch Ausführen des Integrals
in (2.38) für den p
Fall der harmonischen Bindung, U = kx2 /2, das altbekannte
Resultat T = 2π m/k = 2π/ω zu gewinnen. Beachten Sie, dass T in diesem
Spezialfall von der Energie E der Schwingung (u. somit auch von der Schwingungsamplitude) unabhängig ist.
26
2 Schwingungen
Die eben gegebene Diskussion lässt sich leicht verallgemeinern auf potenzielle
Energien U (x), die komplizierter verlaufen als in Abbildung 2.2 veranschaulicht.
Ein interessanter Fall ist in Abbildung 2.3 dargestellt.
Abbildung 2.3
Wenn die Energie des Teilchens wie in der Skizze eingetragen im Intervall
U2 < E < U 4
(2.39)
liegt, so kann sich das Teilchen wegen E = T + U ≥ U im Bereich
x1 ≤ x ≤ x 3
(2.40)
aufhalten und dort eine nichtlineare Schwingung der oben beschriebenen Art
ausführen; es kann sich aber auch im nach rechts unbegrenzten Intervall
x5 ≤ x < ∞
(2.41)
befinden und wird sich dann für t → ∞ ins Unendliche verflüchtigen.
Zur Übung bleibt Ihnen die qualitative Diskussion der Teilchenbahn in den
Fällen E > U4 , E = U4 , E ≤ U2 . Im übrigen sollten Sie auch bei Ihrer nächsten
Fahrt auf der Achterbahn an den Energiesatz denken.
2.4
Der gedämpfte harmonische Oszillator
Nicht alle Kräfte sind konservativ. Als ein Beispiel einer nichtkonservativen
Kraft betrachten wir die in der Teilchengeschwindigkeit lineare Reibungskraft
~ = −α~x˙ ,
K
α>0.
(2.42)
Derartige Reibungskräfte wirken z. B. auf makroskopische Körper, die sich durch
viskose Flüssigkeiten bewegen.
2.4 Der gedämpfte harmonische Oszillator
27
Zur Illustration behandeln wir hier den Einfluss der Reibung auf die eindimensionale harmonische Schwingung. Wenn wir neben einer linearen Rückstellkraft auch die Reibungskraft (2.41) in Rechnung stellen, so finden wir als Newtonsche Bewegungsgleichung eines Teilchens der Masse m
mẍ + αẋ + kx = 0 .
(2.43)
Da nun die gesamte auf das Teilchen wirkende Kraft geschwindigkeitsabhängig
ist, gilt der Energiesatz in der bisherigen Form nicht mehr. Anfänglich im
Oszillator steckende Energie geht demselben im Laufe der Zeit verloren: ein
gedämpft schwingendes Pendel kommt nach einer Weile zur Ruhe. Sie wissen,
dass die Oszillatorenergie in Wärme verwandelt wird, d. h. sich in ungeordneter
Bewegung der Teilchen im reibenden Medium wiederfindet. Wir werden diesen
Dissipationsprozess in 2.13 im Einzelnen diskutieren.
Da die Bewegungsgleichung (2.43) linear ist, lässt sie sich ebenso wie die des
ungedämpften harmonischen Oszillators in 2.1 durch den Exponentialansatz
x(t) = eλt
(2.44)
lösen. Für den Parameter λ erhalten wir aus (2.43) die Forderung (die Säkulargleichung)
mλ2 + αλ + k = 0 ,
die durch die beiden Werte (die Eigenwerte)
)
(
r³
α ´2
k
α
±
−
λ± = −
2m
2m
m
(2.45)
(2.46)
befriedigt wird. Bequemlichkeitshalber führen wir wieder die Frequenz der ungedämpften Schwingung
r
k
(2.47)
ω0 =
m
ein und zusätzlich die so genannte Dämpfungskonstante
γ=
α
.
2m
Damit schreiben sich die beiden Eigenwerte
q
λ± = −γ ± γ 2 − ω02 .
(2.48)
(2.49)
Die beiden gefundenen Lösungen (2.44) mit (2.49) der Bewegungsgleichung
(2.43) ergeben nach Superposition die allgemeine Lösung
√ 2 2
√ 2 2
(2.50)
x(t) = Ae−(γ− γ −ω0 )t + Be−(γ+ γ −ω0 )t .
28
2 Schwingungen
Die beiden Integrationskonstanten A und B können ähnlich wie in 2.1 durch Anfangsbedingungen festgelegt, also etwa durch die anfängliche Auslenkung x(0)
und die anfängliche Geschwindigkeit ẋ(0) wie folgt ausgedrückt werden
A
=
B
=
·
µ
¶¸ . q
ẋ(0) + x(0) γ +
−
2 γ 2 − ω02
·
µ
¶¸ . q
q
2
2
−ẋ(0) − x(0) γ − γ − ω0
2 γ 2 − ω02 .
q
γ2
ω02
(2.51)
Der gedämpfte Oszillator verhält sich qualitativ verschieden, je nachdem ob die
Dämpfungskonstante γ kleiner, gleich oder größer ist als die Frequenz∗) ω0 der
ungedämpften Schwingung. Im Fall schwacher Dämpfung, γ < ω0 , werden λ±
komplex, d. h. in
q
q
γ 2 − ω02 = i ω02 − γ 2 ≡ iω
(2.52)
ist dann ω eine reelle Frequenz. Die Lösung (2.50) beschreibt eine gedämpfte
Schwingung,
x(t) = (A e+iωt + B e−iωt )e−γt .
(2.53)
Beachten Sie, dass der oszillatorische Faktor in (2.53) harmonisch schwingt
mit der Frequenz ω, die von der Eigenfrequenz ω0 bei Abwesenheit von Dämpfung
verschieden ist. Die Benennung des Parameters γ als Dämpfungskonstante rührt
genau daher, dass die Lösung (2.53) zeitlich exponentiell abklingt, u. z. auf einer
Zeitskala 1/γ. Die Zeit 1/γ wird auch als Abklingzeit bezeichnet.
Im so genannten Fall der Überdämpfung, γ > ω0 , sind beide Eigenwerte
λ± reell. Nach hinreichend langer Zeit wird die Lösung (2.50) dabei wegen
|λ− | < |λ+ | dominiert durch den ersten Summanden,
√ 2 2
(2.54)
x(t) → A e−(γ− λ −ω0 )t .
Bei starker Überdämpfung, γ À ω0 , lässt sich λ− durch wenige Glieder einer
Potenzreihe in (ω0 /γ) approximieren,
−λ−
µ
¶
q
γ 1 − 1 − ω02 /γ 2
¶
µ
1 ω02
.
.
.
≈ γ 1−1+
2 γ2
=
≈
ω02 /2γ .
(2.55)
Da nun 1/|λ− | die Bedeutung einer Abklingzeit hat, sehen wir interessanterweise
dieselbe mit wachsendem γ wachsen.
∗) Frequenz
bedeutet hier immer das 2π-fache der inversen Schwingungsdauer
2.5 Resonanz
29
Im Fall der kritischen Dämpfung, γ = ω0 fallen die beiden Eigenwerte λ+
und λ− zusammen. Der Exponentialansatz (2.44) ergibt somit nur eine Lösung
der Bewegungsgleichung. Eine zweite, linear unabhängige muss existieren, da
(2.43) eine Differentialgleichung zweiter Ordnung ist. Wir verifizieren sie leicht
als te−γt und können die allgemeine Lösung dann wieder durch Superposition
der beiden Partikularlösungen angeben als
x(t) = (a + bt)e−γt .
(2.56)
Beim Bau von Messinstrumenten mit schwingungsfähigen Zeigern wird oft
die kritische Dämpfung eingestellt, um zu erreichen, dass der Zeiger schnellstmöglich auf zeitliche Änderung der zu messenden Größe antwortet. Wir hatten
oben (s. (2.55)) gesehen, dass die Abklingzeit des Oszillators im Grenzfall großer
Dämpfung mit γ wächst wie 2γ/ω02 ; im Grenzfall kleiner Dämpfung beträgt aber
gemäß (2.53) die Abklingzeit 1/γ und wächst zu großen Werten mit γ → 0; die
kleinstmögliche Abklingzeit ergibt sich gerade für γ = ω0 . Abbildung 2.4 zeigt
das Produkt der Abklingzeit τ mit der Frequenz ω0 als Funktion von γ/ω0 und
macht das Argument sinnfälliger.
Abbildung 2.4
2.5
Resonanz
Manchmal finden Sie im Wald morsche Bäume, die sich von Hand fällen
lassen. Mit gleichmäßigem Drücken oder Ziehen gelingt es zwar nicht, wohl
aber mit rhythmischem Drücken und Ziehen im Takt einer Eigenfrequenz“ des
”
Baumes.
Um die Theorie dieses Resonanzphänomens abzuhandeln, berücksichtigen wir
in der Bewegungsgleichung des Oszillators neben der Rückstell- und der Reibungskraft eine äußere zeitlich periodische monochromatische Kraft gemäß
mẍ + 2mλẋ + mω02 x = F (t) = F1 cos ω1 t .
(2.57)
Aus Bequemlichkeit lösen wir diese Gleichung in komplexer Form, d. h. suchen zunächst die Lösung ξ(t) der Differentialgleichung
30
2 Schwingungen
Abbildung 2.5
mξ¨ + 2mγ ξ˙ + mω02 ξ = F1 eiω1 t
(2.58)
und nehmen von der Lösung den Realteil. Dieser löst die ursprüngliche Gleichung (2.57), denn (2.58) lautet
µ
¶³
´
d2
d
2
m 2 + 2mγ
Re ξ(t) + i Im ξ(t) = F1 cos ω1 t + iF1 sin ω1 t ,
+ mω0
dt
dt
(2.59)
und die Gleichheit zweier komplexer Zahlen ist gegeben bei Gleichheit ist gegeben bei Gleichheit der Real- und Imaginärteile. Es lohnt sich, komplex zu
rechnen, da Exponentialfunktionen einfachere Differentialregeln haben als Sinus und Kosinus.
Gleichung (2.58) ist eine inhomogene lineare Differentialgleichung, deren allgemeine Lösung sich durch Superposition einer beliebigen Partikularlösung der
inhomogenen Gleichung mit der allgemeinen Lösung der zugehörigen homogenen Gleichung ergibt. Eine Partikularlösung der inhomogenen Gleichung finden
wir durch den Exponentialansatz
x(t) = a1 ei(ω1 t−ϕ1 )
(2.60)
mit der reellen Amplitude a1 und der Phase ϕ1 . Dieser Ansatz liegt nahe, denn
wenn Sie mit der Frequenz ω1 am Baum rütteln, so sollte er auch mit dieser
Frequenz schwingen. Tragen wir den Ansatz in die Bewegungsgleichung (2.58)
ein, so erhalten wir die Forderung
(−mω12 + i2mγω1 + mω02 ) a1 ei(ω1 t−ϕ1 ) = F1 eiω1 t
(2.61)
Offenbar lässt sich diese Forderung erfüllen, wenn die komplexe Amplitude
a1 e−iϕ1 zu
a1 e−iϕ1 =
F1 /m
ω02 − ω12 + i2γω1
(2.62)
2.5 Resonanz
31
gewählt wird. Hiermit sind die Phase ϕ1 und die reelle Amplitude a1 festgelegt
als
und
a1 = a1 (ω1 ) = p
F1 /m
(ω02
− ω12 )2 + 4γ 2 ω12
tan ϕ1 = tan ϕ1 (ω1 ) =
2γω1
.
ω02 − ω12
(2.63)
(2.64)
Die allgemeine Lösung von (2.58) lautet nun, mit zwei beliebigen reellen Integrationskonstanten a und ϕ,
ξ(t) = ae−iϕ e(iω−γ)t + a1 e−iϕ1 eiω1 t ,
(2.65)
denn der erste Summand ist genau die im letzten Paragrafen diskutierte allgemeine Lösung der homogenen Schwingungsgleichung mit
q
ω = ω02 − γ 2 .
(2.66)
Der Realteil x(t) = Reξ(t) ist die gesuchte allgemeine Lösung von (2.57). Er
hat die Form
x(t) = a cos(ωt − ϕ)e−γt + a1 cos(ω1 t − ϕ1 ) .
(2.67)
Beachten Sie, dass die hier additiv auftretende freie gedämpfte Schwingung
nach hinreichend langer Zeit abgeklungen ist, während die erzwungene Schwingung der äußeren periodischen Einwirkung unentwegt folgt. Diese andauernde
erzwungene Schwingung will ich Ihnen noch in Einzelheiten erläutern.
Die Amplitude a1 = a1 (ω1 ) ist proportional zu F1 /m, d. h. um so größer,
je weniger träge das schwingende Teilchen und je größer die Amplitude der
erzwungenen Kraft F1 sind. Sie können letzteres Resultat als die Feststellung
lesen, dass sich mit Bulldozern fast jeder Baum umreißen (ω1 = 0) lässt. Einen
größeren morschen Baum merklich aus der Ruhestellung auszulenken oder ihn
gar zu fällen, gelingt Ihnen aus eigener Kraft i. Allg. jedoch nur, wenn Sie die
Frequenzabhängigkeit der Amplitude a1 (ω1 ) ausnutzen. Diskutieren wir diese
Abhängigkeit für den Fall schwacher Dämpfung γ ¿ ω0 .
Die maximale Antwort a1 (ω1 ) des Oszillators stellt sich bei festen Werten von
γ und ω0 für diejenige Frequenz ω1 der äußeren Störung ein, bei der da1 /dω1 = 0
und d2 a1 /dω12 < 0 ist. Aus (2.63) finden wir diese Resonanzfrequenz zu
ωres = (ω02 − 2γ 2 )1/2 ≈ ω0 − γ 2 /ω0 .
(2.68)
Ebenso wie die Eigenfrequenz (2.66) der freien ungedämpften Schwingung liegt
die Resonanzfrequenz ωres nahe der Eigenfrequenz ω0 des freien konservativen
Oszillators,
<
ωres ≈ ω0 − γ 2 /ω0 ∼ ω ≈ ω0 − γ 2 /2ω0 <
∼ ω0 ,
(2.69)
32
2 Schwingungen
falls die Dämpfung im Sinne von γ ¿ ω0 sehr schwach ist. An der Resonanzfrequenz hat die Schwingungsamplitude den Wert
a1,max =
F1
,
2mωγ
(2.70)
der für kleine Dämpfung sehr groß sein kann; so groß, dass die Resonanzkatastrophe eintritt und der Baum aus den Wurzeln gerissen wird; jedenfalls viel
größer als die Antwort auf eine statische äußere Störung
a1 (ω1 = 0) =
F1
.
mω02
(2.71)
Um ein Maß für die Schärfe der Resonanz zu erhalten, können
√ wir nach
den Frequenzen fragen, für die die Amplitude a1 (ω1 ) auf das (1/ √2)-fache des
Maximums (2.70) abgefallen ist. Die Forderung a1 (ω) = a1,max / 2 führt auf
eine quadratische Gleichung mit den Wurzeln
ω2
=
≈
ω02 − 2γ 2 ± 2γω0
ω02 (1
± 2γ/ω0 ) ,
q
1 − γ 2 /ω02
(2.72)
also
ω ≈ ω0 ± γ .
(2.73)
Die Breite der Resonanzkurve“ a1 = a1 (ω1 ) ist also im betrachteten Grenzfall
”
proportional zur Dämpfungskonstanten und somit klein im Vergleich zur Resonanzfrequenz selbst. Die Abbildung 2.6 zeigt den Verlauf der Resonanzkurve.
Abbildung 2.6
2.6 Antwort auf beliebige periodische Anregung (Fourierreihen)
33
Für die Phase ϕ1 zwischen der äußeren Kraft und der Antwort des Oszillators
finden wir aus (2.64) für Frequenzen weit unterhalb der Resonanz den kleinen
Wert
ϕ1 ≈
π
2γω1
¿
ω02 − ω12
2
für
ω0 − ω1 À γ ;
(2.74)
also schwingt der Oszillator dabei praktisch in Phase mit der äußeren Kraft. Für
ω1 = ω0 ist die Phase ϕ1 auf den Wert π/2 angewachsen und für Frequenzen
weit oberhalb der Resonanz schwingt der Oszillator praktisch im Gegentakt zur
äußeren Kraft, d. h. es gilt
ϕ1 <
∼π
für
ω1 − ω0 À γ
(2.75)
Die Abbildung 2.7 macht deutlich, dass sich der Phasensprung von Null nach π
innerhalb eines Frequenzintervalls der Größenordnung γ vollzieht. Für die Beobachtung dieses Phasensprungs sowie der vorher besprochenen Resonanzphänomene
im Labor (lieber doch nicht im Wald!) wünsche ich Ihnen viel Spaß.
Abbildung 2.7
2.6
Antwort auf beliebige periodische Anregung
(Fourierreihen)
Im letzten Paragrafen hatten wir nur monochromatische äußere Störungen
betrachtet. Jetzt will ich die Untersuchung ausdehnen auf Kräfte, die zwar
zeitlich periodisch sind mit der Periode τ gemäß
F (t) = F (t + τ )
(2.76)
die aber nicht notwendig monochromatisch schwingen wie ei2πt/τ . Die Antwort
x(t) des Oszillators auf derartige äußere Kräfte finden wir leicht, wenn wir nur
34
2 Schwingungen
beachten, dass sich eine Funktion f (t) mit der Periodizität (2.76) immer ∗) durch
eine Summe monochromatischer Funktionen, die Fourierreihe
X
F (t) =
Fn einΩt ,
Ω=
n=0,±1,±2,...
2π
τ
(2.77)
mit geeigneten Koeffizienten Fn darstellen lässt. Die Fourierkoeffizienten Fn
sind durch die Funktion F (t) eindeutig festgelegt. Um sie zu konstruieren,
multiplizieren wir beide Seiten von (2.77) mit eimΩt , integrieren über die Zeit
von 0 bis τ und beachten die für ganzzahlige m und n gültige Regel
1
τ
Zτ
dt ei(n−m)Ωt = δnm =
0
½
1
0
für
für
n=m
n 6= m .
(2.78)
Es ergibt sich
Fm
1
=
τ
Zτ
dt e−imΩt F (t) .
(2.79)
0
Nach den Überlegungen des 2.5 ruft eine auf den Oszillator einwirkende Kraft
Fn einΩt die Antwort
x(t) =
m(ω02
Fn einΩt
− n2 Ω2 + i2γnΩ)
(2.80)
hervor. Wegen der Linearität der Schwingungsgleichung
m(ẍ + 2γ ẋ + ω02 x) = F (t)
(2.81)
lässt sich die Lösung derselben bei Vorliegen der äußeren Kraft (2.77) durch
Superposition der Antworten (2.80) auf die monochromatischen Bestandteile
Fn einΩt konstruieren. Sie lautet also, unter Einschluss des Einschwingungsvorgangs,
x(t) =
X
Fn 2
(ω0 − n2 Ω2 + i2γnΩ)−1 einΩt + a cos(ωt − ϕ)e−γt (2.82)
m
n=0,±1,±2,...
mit ω = (ω02 − γ 2 )1/2 . Bis auf den zeitlich abklingenden Einschwingungsvorgang
ist diese Lösung offenbar auch periodisch mit der Periode τ = 2π/Ω.
Zu einer gegebenen periodischen äußeren Kraft F (t) sind nur die Fourierkoeffizienten Fn aus (2.79) zu bestimmen, damit die allgemeine Lösung (2.82)
der Schwingungsgleichung (2.81) explizit angegeben werden kann. Wenn eine
(und nur eine!) der Frequenzen nΩ nahe bei der Resonanzfrequenz ωres des Oszillators liegt, so wird die Fourierreihe (2.82) vom entsprechenden Summanden
∗) Die Theorie der Fourierreihen ersetzt immer“ durch Forderungen an die Funktion F (t),
”
die ich im folgenden als erfüllt ansehe.
2.7 Antwort auf beliebige Anregung
35
dominiert, da alle anderen Koeffizienten Fm betragsmäßig viel kleiner sind als
der zur Resonanz gehörige.
Würden Sie übrigens auch brummig reagieren, wenn man Ihnen Mozarts
Kleine Nachtmusik über einen Lautsprecher“ vorspielte, der bei 60 Hertz eine
”
nur schwach gedämpfte Eigenschwingung aufweist?
2.7
Antwort auf beliebige Anregung
Auch bei Vorliegen einer beliebigen nichtperiodischen äußeren Kraft F (t)
können wir die Bewegungsgleichung des harmonischen Oszillators,
ẍ + 2γ ẋ + ω02 x = F (t)/m ,
(2.83)
lösen durch Superposition der Antworten auf monochromatische Kräfte. Zu
diesem Zweck müssen wir zunächst die Kraft F (t) durch ein Fourierintegral
F (t) =
+∞
Z
dΩ iΩt
e F (Ω)
2π
(2.84)
−∞
darstellen. Wir hatten die Antwort x(Ω)eiΩt auf die monochromatische Kraft
F (Ω)eiΩt in 2.6 gefunden,
x(Ω)eiΩt =
F (Ω)/m
eiΩt ,
ω02 − Ω2 + i2γΩ
(2.85)
wobei der Einschwingvorgang nicht mit aufgeschrieben ist. Mit Hilfe des Superpositionsprinzips erhalten wir die Antwort auf die Überlagerung (2.84) von
monochromatischen Kräften als
x(t) =
+∞
Z
−∞
dΩ iΩt
F (Ω)/m
e
.
2π
ω02 − Ω2 + i2γΩ
(2.86)
Zur Auswertung der Lösung (2.86) bei vorgegebener Kraft F (t) muss zunächst
die Fouriertransformierte F (Ω) bestimmt und dann das Integral in (2.86) berechnet werden. Ich verzichte hier auf die Darlegung der erforderlichen mathematischen Techniken zugunsten der physikalisch durchsichtigeren Konstruktion
einer zu (2.86) äquivalenten Lösung der Bewegungsgleichung (2.83).
Denken wir uns unser schwingungsfähiges Teilchen zu einem Anfangszeitpunkt t0 bei x = 0 ruhend und dann einem Kraftstoß ausgesetzt, d. h. einer Kraft
F (t0 ), die nur innerhalb einer kurzen Zeitspanne ∆t von t0 bis t0 + ∆t von Null
verschieden und innerhalb dieses Intervalls konstant ist. Für das nachfolgende
Argument sind von Interesse die Auslenkung x(t0 +∆t) und die Geschwindigkeit
ẋ(t0 + ∆t) am Ende des Kraftstoßes.
Indem wir x(t) um die Zeit t = t0 in eine Taylorreihe entwickeln,
x(t) = x(t0 ) + ẋ(t0 )(t − t0 ) +
1
ẍ(t0 )(t − t0 )2 + . . . ,
2
(2.87)
36
2 Schwingungen
und hier die zur Zeit t0 gestellten Anfangsbedingungen eintragen,
x(t) =
1
ẍ(t0 )(t − t0 )2 + . . . ,
2
(2.88)
erkennen wir, dass x(t0 + ∆t) von der Ordnung (∆t)2 und die Geschwindigkeit
ẋ(t0 + ∆t) von der Ordnung ∆t sind,
x(t0 + ∆t)
=
ẋ(t0 + ∆t)
=
1
ẍ(t0 )(∆t)2 + . . .
2
ẍ(t0 )∆t + . . . .
(2.89)
Die hier eingehende anfängliche Beschleunigung ist aber durch die Schwingungsgleichung (2.83) zu ẍ(t0 ) = F (t0 )/m festgelegt, so dass wir unter Vernachlässigung von Gliedern quadratischer und höherer Ordnung in ∆t am Ende
des Kraftstoßes haben
x(t0 + ∆t)
=
ẋ(t0 + ∆t)
=
0
F (t0 )∆t
.
m
(2.90)
Nach Beendigung des Kraftstoßes schwingt der Oszillator frei. Aus (2.51,
2.53) finden wir das spätere Verhalten (für γ < ω0 ) zu
x(t) =
F (t0 )∆t −γ(t−t0 −∆t)
e
sin ω(t − t0 − ∆t)
mω
für
t ≥ t0 + ∆t
(2.91)
mit
ω=
q
ω02 − γ 2 .
(2.92)
Da wir bereits Fehler der Ordnung (∆t)2 in Kauf genommen haben, dürfen wir
im gewonnenen Ausdruck für x(t) die Zeit t − t0 − ∆t durch t − t0 ersetzen, ohne
weitere Genauigkeitsverluste zu erleiden.
Nicht zu vergessen ist, dass das Resultat (2.91) gewonnen wurde unter der
Bedingung x(t0 ) = ẋ(t0 ) = 0. Für den Fall, dass zu Beginn des Kraftstoßes
die Auslenkung x(t0 ) und die Geschwindigkeit ẋ(t0 ) nichtverschwindende Werte
haben, zeigt eine geringfügige modifizierte Überlegung, die ich Ihnen zur Übung
überlasse, dass sich (2.91) ersetzt durch
F (t0 )∆t −γ(t−t0 )
e
sin ω(t − t0 ) + . . . .
(2.93)
mω
Das Symbol . . . steht hierin sowohl für Korrekturglieder von höherer als
erster Ordnung in ∆t wie für eine von der äußeren Kraft F (t0 ) unabhängige,
durch x(t0 ) und ẋ(t0 ) festgelegte freie gedämpfte Schwingung.
x(t) =
2.7 Antwort auf beliebige Anregung
37
Wegen der Linearität der Schwingungsgleichung (2.38) kann nun ohne weitere Rechnung auch die Antwort des Oszillators auf eine Folge von n nicht
überlappenden Kraftstößen des beschriebenen Typs angegeben werden. Durch
Überlagerung der Antworten auf alle dem Zeitpunkt vorausgehenden Kraftstöße
erhalten wir für den Zeitraum nach Ende des letzten die Gesamtantwort zur
Zeit t
x(t) =
n−1
X
ν=0
F (tν )∆t −γ(t−tν )
e
sin ω(t − tν ) .
mω
(2.94)
Dabei dürfen die Kraftstöße untereinander verschiedene Stärken F (tν ) haben,
sind aber alle als zeitlich gleich lang angenommen. Etwaige dem Zeitpunkt t
nachfolgende äußere Kraftstöße können zur Zeit t noch nicht beantwortet sein
und treten daher in (2.94) nicht auf.
Ein Blick auf Abbildung 2.8 zeigt, dass sich jede zur Zeit t0 angeschaltete
und anschließend vernünftig verlaufende äußere Kraft F (t) durch eine stückweise
konstante Treppe“, also eine Folge von n aneinander grenzenden Kraftstößen
”
approximieren lässt.
Abbildung 2.8
Für große Werte von n = (tn − t0 )/∆t wird die Antwort (2.94) auf die Kraftstoßfolge die Antwort auf die äußere Kraft F (t) gut annähern. Im Grenzfall
beliebig feiner Unterteilung der äußeren Kraft in Kraftstöße sollte die exakte
Antwort entstehen. Aus (2.94) entsteht für n → ∞ bei ∆t → 0 das Integral
x(t) =
Zt
t0
mit der Antwortfunktion


G(t) =

dt0 F (t0 )G(t − t0 )
1 −γt
mω e
0
sin ωt
(2.95)
für t > 0
.
(2.96)
für t < 0
Beim Aufschreiben der Antwortfunktion habe ich nochmals die oben angesprochene Kausalität zum Ausdruck gebracht: die Antwort G(t − t0 ) auf einen
Kraftstoß zur Zeit t0 kann erst nach dem Kraftstoß auftreten. Wegen dieser
38
2 Schwingungen
Kausalität und da die äußere Kraft als für t < t0 verschwindend angenommen
wurde, kann die Antwort (2.95) auch in der Form
+∞
Z
x(t) =
dt0 G(t − t0 )F (t0 )
(2.97)
−∞
notiert werden.
Die allgemeine Lösung der Schwingungsgleichung (2.83) erhalten wir, wenn
wir auf der rechten Seite von (2.95) eine beliebige freie gedämpfte Schwingung
entsprechend der allgemeinen Lösung der zu (2.83) gehörigen homogenen Gleichung hinzufügen. Letztere beschreibt einen von der äußeren Kraft F (t) unabhängigen Einschwingvorgang.
Die Antwort (2.95) ist äquivalent zur Lösung (2.86), die wir durch Superposition der Antworten auf monochromatische Kräfte erhalten hatten. Überzeugen
wir uns davon, indem wir die Fourierdarstellung (2.84) der Kraft in (2.95) eintragen
x(t)
=
+∞
+∞
Z
Z
dΩ iΩt0
0
dt
e F (Ω)G(t − t0 )
2π
−∞
=
−∞
+∞
Z
0
dt0 e−iΩ(t−t ) G(t − t0 )
+∞
Z
dΩ
F (Ω) eiΩt
2π
+∞
Z
dΩ
F (Ω) G(Ω)eiΩt
2π
−∞
−∞
(2.98)
−∞
mit
+∞
Z
G(Ω) =
dt e−iΩt G(t) .
(2.99)
−∞
Das Zeitintegral (2.99) ist aber leicht auszuführen und ergibt
G(Ω) =
1 2
(Ω − ω02 + 2iγΩ)−1 .
m
(2.100)
Damit ist (2.98) auf die Form (2.86) gebracht.
Halten wir nochmals fest, dass die äußere Kraft F (t) sowohl durch Superposition monochromatischer Kräfte gemäß (2.84) wie durch eine Folge von
Kraftstößen dargestellt werden kann. Je nach Darstellung ergibt sich die Antwort x(t) des Oszillators als Überlagerung der Antworten auf monochromatische
Störungen bzw. auf Kraftstöße. Wegen der gezeigten Äquivalenz können wir die
Wahl der Darstellung immer nach Bequemlichkeit treffen. Mathematisch weniger aufwendig und physikalisch durchsichtiger, also in der Tat bequemer, ist der
Gebrauch der Darstellung (2.95).
2.8 Idealisierter Kraftstoß (Deltafunktion)
2.8
39
Idealisierter Kraftstoß (Deltafunktion)
Der oben eingeführte Begriff des Kraftstoßes erlaubt eine Idealisierung, die
uns im folgenden immer wieder Nutzen bringen wird. Nehmen wir an, ein
endlicher Kraftstoß, der in geeigneten Einheiten die Größe 1 habe, werde in
verschwindender Zeit ∆t übertragen, d. h.
1 = lim F · ∆t .
(2.101)
∆t→0
Es muss dann offenbar F wie 1/∆t nach ∞ gehen (Abbildung 2.9)
}
Abbildung 2.9
Man schreibt einen solchen zur Zeit t0 erfolgenden Kraftstoß als F (t) = δ(t − t0 )
und versteht unter der Deltafunktion δ(t) die Vorschrift (a,b)
(
1
ε
für t0 −
ε
2
< t < t0 +
ε
2
(a)
δ(t − t0 ) =
(b)
man führe den Grenzwert ε → 0 aus, aber immer
erst, nachdem Integrale über t ausgeführt sind.
0
für |t − t0 | > ε/2
(2.102)
Lassen Sie mich diese Vorschrift illustrieren, indem ich zunächst das Zeitintegral der Deltafunktion bestimme. Schon ohne Rechnung ist auf Grund der
obigen Einführung klar, dass es den Wert 1 haben muss,
+²/2
+∞
+∞
Z
Z
Z
1
dtδ(t) =
dt = 1 .
dt δ(t − t0 ) =
²
−∞
−∞
−²/2
Zur weiteren Illustration betrachten wir das Integral
+∞
R
−∞
eine beliebige
∗)
(2.103)
dt δ(t − t0 )f (t) für
Funktion f (t). Die folgende kleine Rechnung, die u.a. die
∗) Die Theorie der Distributionen ersetzt beliebige “ durch genaue Forderungen, die ich im
”
folgenden stillschweigend als erfüllt ansehe.
40
2 Schwingungen
Taylorentwicklung der Funktion f (t) um die Stelle t0 benutzt, vollziehen Sie
hoffentlich ohne Mühe nach:
+∞
+∞
Z
Z
dt δ(t − t0 )f (t0 ) =
dt δ(t)f (t0 + t)
−∞
=
−∞
+²/2
Z
1
dt f (t0 + t) =
²
−²/2
=
+1/2
Z
dtf (t0 + ²t)
−1/2
+1/2
Z
dt[f (t0 ) + ²tf 0 (t0 ) + O(²2 )] = f (t0 ) + O(²) = f (t0 ) ,
−1/2
also
+∞
Z
dtf (t)δ(t − t0 ) = f (t0 ) .
(2.104)
−∞
Beachten Sie, dass die Deltafunktion eine Vorschrift ist, mit Integralen umzugehen und nicht eine gewöhnliche Funktion. Nach einem wohlbekannten elementaren Satz der Integralrechnung kann nämlich eine gewöhnliche Funktion, die
überall außer an einem Punkt verschwindet, keine von Null verschiedene Fläche
mit der Abszisse einschließen.
In erster Anwendung des neu gewonnenen Begriffs der Deltafunktion werfen
wir einen Blick zurück auf den einer beliebigen Kraft F (t) ausgesetzten Oszillator. In der Bewegungsgleichung
Z
1
1
2
(2.105)
ẍ + 2γ ẋ + ω0 x = F (t) = dt0 δ(t − t0 ) F (t0 )
m
m
betrachten wir die äußere Kraft F (t) gemäß der Identität (2.104) als eine kontinuierliche Folge von deltafunktionsartigen Kraftstößen. Die Antwort auf F (t)
ist dann die Superposition von Antworten auf den Einheitskraftstoß δ(t − t 0 ).
Letztere sind gerade durch die Antwortfunktion G gegeben, die der folgenden
Differentialgleichung genügt.
G̈(t, t0 ) + 2γ Ġ(t, t0 ) + ω02 G(t, t0 )
=
=
1
δ(t − t0 )
m(
1
für (t − t0 ) <
1
²
m
0 für (t − t0 ) >
²
2
²
2
.
(2.106)
Wir hatten in (2.7) gezeigt, dass für hinreichend kleines ² (dort ∆t genannt)
die Antwortfunktion die Form
G(t, t0 )
=
G(t)
=
G(t − t0 )
( 1
−γt
sin ωt
mω e
0
t>0
t<0
(2.107)
2.8 Idealisierter Kraftstoß (Deltafunktion)
41
hat. Die Gesamtantwort des Oszillators ergab sich dann zu
+∞
Z
x(t) =
dt0 G(t − t0 )F (t0 ) .
(2.108)
−∞
Die obige Definition (2.102) der δ-Funktion macht von einem rechteckigen
Kraftstoß Gebrauch. Das ist nicht nötig. Andere Darstellungen sind beliebt
und nützlich, z. B. die folgende Gaußdarstellung
2
e−x /²
und ² → 0 nach Ausführung von Integralen .
δ(x) = √
π²
(2.109)
Auch hier gilt die wichtige Identität (2.104), wie eine zur obigen ähnliche Rechnung zeigt:
+∞
Z
2
e−(x−x0 ) /²
√
dx
f (x)
π²
=
−∞
+∞
Z
2
e−x /²
f (x0 + x)
dx √
π²
−∞
=
+∞
Z
√
2
1
dx √ e−x f (x0 + ²x)
π
−∞
=
+∞
Z
2
´
√
e−x ³
√
dx
f (x0 ) + ²xf 0 (x0 ) + 0(²)
π
−∞
³√ ´
²
=
f (x0 ) + O
=
f (x0 ) nach ² → 0 .
Noch beliebter als diese Gaußdarstellung ist die Fourierintegraldarstellung
δ(x)
=
+∞
Z
dk (ikx−²|k|)
e
2π
−∞
1
2π
" Z∞
=
1
2π
µ
=
−
1 ix + ² − ix + ²
1
²
=
.
2π
−x2 − ²2
π x2 + ² 2
=
dk e(ix−²)k +
0
+1
−1
+
ix − ² ix + ²
Z0
−∞
dk e(ix+²)k
#
¶
(2.110)
Manchmal spart man sich bei dieser Fourierdarstellung auch, ² hinzuschreiben,
42
2 Schwingungen
δ(x) =
+∞
Z
dk ikx
e
.
2π
(2.111)
−∞
Gelegentlich werden wir die Darstellung
δ(x) =
1 sin(x/²)
π
x
(2.112)
benötigen. Der Nachweis der Eigenschaft (2.104) erfolgt ähnlich wie bei den
obigen Beispielen. Qualitativen Einblick in den Verlauf der in (2.112) definierten
Funktion erhalten wir, wenn wir bei endlichem ² den Grenzübergang x → 0
durchführen; der anschließende Übergang ² → 0 gibt eine Divergenz, δ(0) ∼
1/π²; andererseits oszilliert (1/x) sin(x/²) als Funktion von x bei x 6= 0 für
² → 0 so schnell um Null herum, dass jedes Integral über x, welches die Stelle
x = 0 nicht überstreicht, im Grenzfall ² → 0 verschwindet.
Bei künftigen Anwendungen müssen Sie, wie bereits oben betont, immer im
Auge behalten, dass die Deltafunktion eine Vorschrift zum Umgang mit Integralen ist und keineswegs eine gewöhnliche Funktion. Allerdings werden Sie
feststellen, dass man mit der Deltafunktion weitgehend umgehen kann wie mit
einer normalen Funktion mit dem Vorbehalt, dass die üblichen Rechenoperationen nur unter dem Schutz von Integralen Sinn ergeben.
2.9
Zwei gekoppelte harmonische Oszillatoren
Ich will Ihnen nun Schwingungen in einem System mit zwei Freiheitsgraden
vorstellen. Betrachten wir dazu zwei Teilchen der Massen m1 und m2 ,
Abbildung 2.10
die, wie in Abbildung 2.10 gezeigt, an drei (masselos gedachte) Federn gekoppelt und längs einer Geraden beweglich sind. Die Teilchen haben kräftefreie
Gleichgewichtslagen x10 bzw. x20 und erfahren bei Auslenkung aus denselben
um qi = xi − xi0 lineare Rückstellkräfte. Wenn wir der Einfachheit halber allen
Kraftkonstanten den gleichen Wert k geben∗) , so lautet die Kraft auf das erste
Teilchen
K1 = −k(x1 − x10 ) − k(x1 − x10 − x2 + x20 ) = −2kq1 + kq2
(2.113)
∗) Im Fall verschiedener Kraftkonstanten treten Schwebungsphänomene auf, die Sie im Labor
anschauen sollten.
2.9 Zwei gekoppelte harmonische Oszillatoren
43
und die auf das zweite
K2 = −k(x2 − x20 ) + k(x1 − x10 − x2 + x20 = kq1 − 2kq2 .
Zur weiteren Vereinfachung wählen wir beide Massen als gleich m. Wir erhalten
dann die Newtonschen Bewegungsgleichungen
mq̈1 + 2kq1 − kq2
mq̈2 + 2kq2 − kq1
=
=
0
0.
(2.114)
Diese linearen Differentialgleichungen mit zeitunabhängigen Koeffizienten können
mit dem Exponentialansatz
¶
¶ µ
µ
a1
q1 (t)
eiωt
(2.115)
=
a2
q2 (t)
gelöst werden. Sowohl die Frequenz ω als auch die beiden Amplituden a1 und
a2 sind dabei offen. Durch Eintragen des Ansatzes in die Bewegungsgleichungen
(2.114) erhalten wir für die drei Unbekannten die beiden linearen homogenen
Gleichungen (mit ω02 = k/m)
(−ω 2 + 2ω02 )a1
−ω02 a1
+
2
(−ω +
−ω02 a2
2ω02 )a2
=
0
=
0.
(2.116)
Nichttriviale Lösungen für die ai können nur auftreten, wenn die Determinante
des Gleichungssystems verschwindet, d. h. wenn die Frequenz ω die Säkulargleichung
(−ω 2 + 2ω02 )2 − ω04 = 0
(2.117)
befriedigt. Letztere ist eine quadratische Gleichung für ω 2 mit den beiden
Lösungen
ω12
=
3ω02
ω22
=
ω02 .
(2.118)
√
Die Frequenzen ω1 = 3 ω0 und ω2 = ω0 heißen Eigenfrequenzen des Systems
der gekoppelten Teilchen. Um die Art der zugehörigen Eigenschwingungen zu
erkennen, müssen wir die beiden Amplituden a1a und a2a für a = 1 (zu ω1 ) und
a = 2 (zu ω2 ) suchen.
Für die Eigenschwingung mit Frequenz ω1 ergibt sich aus (2.116)
a11 = −a21
und für die Eigenschwingung mit Frequenz ω2
(2.119)
44
2 Schwingungen
a12 = a22 .
(2.120)
Beachten Sie, dass bei jeder Eigenschwingung nur das Verhältnis der Amplituden a1 /a2 festgelegt ist, die Amplituden a1 und a2 selbst also nur bis auf einen
gemeinsamen Faktor, der die Stärke der Anregung der Eigenschwingung angibt;
dieser Faktor ist aus der Anfangsbedingung zu bestimmen.
Die erste Eigenschwingung lautet, mit beliebig komplexer Amplitude A 1 ,
¶
¶ µ
µ
ª
−1 ©
q11
A1 eiω1 t + A∗1 e−iω1 t ,
(2.121)
=
1
q21
Da q11 (t) = −q21 (t), können wir diese Eigenschwingung antisymmetrisch nennen; die beiden Massen schwingen im Gegentakt. Die zweite Eigenschwingung,
mit beliebig komplexer Amplitude A2 ,
¶
¶ µ
µ
ª
1 ©
q12
(2.122)
A2 eiω2 t + A∗2 e−iω2 t ,
=
1
q22
können wir wegen q12 = q22 symmetrisch nennen; die beiden Massen schwingen
hier im Takt mit konstantem
√ x12 − x22 .
Nicht zufällig ist ω1 = 3 ω0 > ω2 = ω0 . Bei der antisymmetrischen Eigenschwingung schwingen die beiden Massen unter Deformation aller Federn, bei
der symmetrischen Eigenschwingung hingegen so, dass die mittlere Feder nicht
deformiert wird; also sieht jede Masse bei der antisymmetrischen Schwingung
eine steifere Umgebung als bei der symmetrischen Schwingung. Je größer aber
die Steifheit, desto größer die Frequenz.
Die allgemeine Lösung lautet gemäß dem Superpositionsprinzip
µ
q1 (t)
q2 (t)
¶
= A1
µ
−1
1
¶
e
iω1 (t)
+ A2
µ
1
1
¶
eiω2 t + c.c. .
(2.123)
Die beiden komplexen Integrationskonstanten A1 und A2 entsprechen vier reellen Parametern und können durch Anfangsbedingungen festgelegt werden.
Keineswegs ohne Grund sind die Eigenfrequenzen ω1 und ω2 reell. Der physikalische Grund ist, dass wir keine Reibungskräfte zugelassen und somit ein
exponentielles Abklingen von q1 (t) und q2 (t) ausgeschlossen haben. Daher sollte auch die Energie der beiden Teilchen zeitlich erhalten bleiben. Tatsächlich
finden wir den Energiesatz ganz ähnlich wie früher bei Systemen mit einem Freiheitsgrad. In (2.114) multiplizieren wir beide Seiten der Bewegungsgleichung des
i-ten Teilchens mit der Geschwindigkeit q̇i
mq̇1 q̈1 + 2k q̇1 q1 − k q̇1 q2
mq̇2 q̈2 + 2k q̇2 q2 − k q̇2 q1
=
0
=
0.
(2.124)
Durch Addition der linken Seiten finden wir, dass die Zeitableitung der Größe
2.10 Der mechanische Energiesatz für Systeme vieler Teilchen
E=
m 2 m 2
q̇ +
q̇ + k(q12 + q22 − q1 q2 )
2 1
2 2
45
(2.125)
verschwindet, E selber also zeitlich erhalten bleibt. E heißt die Energie des
Systems, und die beiden Bestandteile
T
=
U
=
m 2
(q̇ + q̇22 )
2 1
k(q12 + q22 − q1 q2 )
(2.126)
sind offenbar sinnvoll als kinetische bzw. potenzielle Energie benannt.
Beachten Sie, dass sich die kinetische Energie aus den kinetischen Energien
der beiden Teilchen additiv zusammensetzt und dass die potenzielle Energie U
quadratisch in den Auslenkungen q1 und q2 ist. Die Kraft auf das i-te Teilchen
ergibt sich aus U zu
Ki = −
∂U
.
∂qi
(2.127)
Die Kräfte K1 und K2 verschwinden für die Ruhelagen, qi = 0. Die potenzielle
Energie U hat für q1 = q2 = 0 ein Minimum, denn U (0, 0) = 0 und
U (q1 , q2 ) =
2.10
k(q22
+
q22
¯
√ ¯2
¯
1 + i 3 ¯¯
¯
− q 1 q2 ) = k ¯q1 − q 2
¯ ≥0.
¯
¯
2
(2.128)
Der mechanische Energiesatz für Systeme
vieler Teilchen
N Teilchen in drei Raumdimensionen haben 3N Freiheitsgrade, denen wir die
kartesischen Koordinaten x1 , y1 , z1 , x2 , y2 , z2 , . . . , xN , yN , zN zuordnen können.
Wir nummerieren die Koordinaten als qν mit ν = 1, 2, . . . , 3N und die Kräfte
F~i entsprechend als Fν (z. B. q5 = y2 ).
Es seien die Kräfte als partielle Ableitung einer potenziellen Energie darstellbar,
Fν (q) = −
∂
U (q) .
∂qν
(2.129)
Später untersuchen wir, unter welchen Bedingungen sich die Fν so darstellen lassen. Erst zeigen wir, dass bei Gültigkeit von (2.129) immer ein Erhaltungssatz
T + U = E = const gilt. Dazu benutzen wir die Newtonschen Bewegungsgleichungen
mν q̈ν = Fν (q) = −
∂U (q)
∂qν
(2.130)
46
2 Schwingungen
Hier multiplizieren wir mit der Geschwindigkeit q̇ν und summieren über ν. Die
linke Seite der entstehenden Gleichung,
X
mν q̇ν q̈ν +
X
q̇ν
ν
ν
∂U
=0,
∂qν
lässt sich wieder als die Zeitableitung der Gesamtenergie schreiben
Ã
!
X mν
d
d
2
q̇ν + U (q) =
(T + U ) = 0 .
dt
2
dt
ν
(2.131)
(2.132)
Im Gegensatz zum Fall eines Teilchens in einer Raumdimension erlaubt dieser Energiesatz natürlich nicht, die Bahnkurven qν (t) alle festzulegen.
Unter welchen Bedingungen kann nun die ν-te Kraft Fν (q) dargestellt werden
als Fν = −∂U/∂qν mit einer eindeutigen potenziellen Energie U (q)? Notwendig
ist die aus
Fν = −
∂U
,
∂qν
∂U
.
∂qµ
Fµ = −
(2.133)
durch Differenziationen entstehende Bedingung
∂Fν
∂Fµ
∂2U
=
=−
.
∂qµ
∂qν
∂qν ∂qµ
(2.134)
Diese Bedingung ist aber auch hinreichend, wie folgendes Argument zeigt. Betrachten Sie die beiden 3N -Tupel von Koordinaten
q10 = x0 , q20 = y0 , qν0
ν 6= 1, 2
für
und
q1 = x, q2 = y, qν = qν0
für
ν 6= 1, 2
Damit U (q) bei festem (3N )-Tupel {qν0 } eine eindeutige Funktion des 3N Tupels {qν } ist, muss gleichgültig sein, auf welchem Weg“ von qν0 nach qν man,
”
gegen die Kräfte Fν Arbeit leistend, die potenzielle Energie ändert. Wählen wir
insbesondere die beiden in (Abbildung 2.11) gezeigten stückweise achsenparallelen Wege in der q1 − q2 − Ebene.
Längs derselben werden die Arbeiten
(∆U )Weg1 = −
bzw.
Zx
x0
dq1 F1 (q1 , y0 ) −
Zy
y0
dq2 F2 (x, q2 )
2.10 Der mechanische Energiesatz für Systeme vieler Teilchen
47
Abbildung 2.11
(∆U )Weg2 = −
Zy
y0
dq2 F2 (x0 , q2 ) −
Zx
dq1 F1 (q1 , y)
x0
geleistet. Fragen wir nun nach Bedingungen für das Verschwinden der Differenz
(∆U )Weg1 − (∆U )Weg2
=
−
−
Z
Z
x
x0
dq1 (F1 (q1 , y0 ) − F1 (q1 , y))
y
y0
dq2 (F2 (x, q2 ) − F2 (x0 , q2 )) (2.135)
Sei insbesondere qν so nahe bei qν0 , dass die Kräfte F1 und F2 mit ausreichender
Genauigkeit in Taylor-Reihen um x0 , y0 herum entwickelt werden können,
Fi (q1 , q2 ) = Fi (x0 , y0 ) +
∂Fi (x0 , y0 )
∂Fi (x0 , y0 )
(q1 − x0 ) +
(q2 − y0 ) + . . . .
∂x0
∂y0
(2.136)
Bis auf Korrekturen dritter Ordnung in den Koordinatendifferenzen ergibt sich
nun für die Differenz (2.135)
(∆U )Weg1 − (∆U )Weg2 = +
−
=
µ
Zx
dq1
∂F1 (q1 , y0 )
(y − y0 )
∂y0
Zy
dq2
∂F2 (x0 , q2 )
(x − x0 )
∂x0
x0
y0
∂F1 (x0 , y0 )
∂F2 (x0 , y0 )
−
∂y0
∂x0
¶
(x−x0 )(y−y0 ) + . . . .
(2.137)
48
2 Schwingungen
Aus (2.137) ist offenbar, dass die Bedingung (2.134) hinreicht, um die Wegunabhängigkeit von ∆U = U (qν ) − U (qν0 ) zu garantieren.
Kräfte, die die Bedingung (2.134) erfüllen, heißen auch wirbelfrei. Sie lassen
sich immer durch Ableitungen einer potenziellen Energie darstellen.
2.11
Schwingungen von mehreren Freiheitsgraden
Wir verallgemeinern hier das in 2.9 behandelte System zweier Teilchen auf
N identische Teilchen, die durch Federn an Ruhelagen xi0 gebunden und längs
der Richtung der Federn beweglich sind Abbildung (2.12).
Abbildung 2.12
Bei den Auslenkungen qi = xi − xi0 sollen die Teilchen in diesen Auslenkungen
lineare Rückstellkräfte erfahren, so dass die potenzielle Energie,
U=
N
1 X
kij qi qj ,
2 i,j=1
(2.138)
quadratisch in den qi ist. Die hier auftretende Kraftkonstantenmatrix kann
offenbar symmetrisch gewählt werden,
kij = kji .
(2.139)
Im übrigen fordern wir von der Matrix kij , dass die potenzielle Energie (2.138)
für beliebige Auslenkungen nichtnegativ ist. Wegen U ({0}) = 0 hat dann die
potenzielle Energie ein Minimum, wenn jedes Teilchen in seiner kräftefreien
Gleichgewichtslage sitzt.
Auf das i-te Teilchen wirkt, wenn es aus seiner Gleichgewichtsposition ausgelenkt ist, die Kraft (in x-Richtung, nur eine Raumdimension ist zugelassen!)
Ki = −
N
X
∂U
kij qj ,
=−
∂qi
j=1
(2.140)
so dass die N Bewegungsgleichungen lauten
mq¨i +
N
X
j=1
kij qj = 0 ;
(2.141)
2.11 Schwingungen von mehreren Freiheitsgraden
49
dabei ist m die Masse jedes Teilchens. Wegen der Linearität der Bewegungsgleichungen und der zeitlichen Konstanz der Masse und Kraftkonstanten finden
wir die Lösung wie immer durch einen Exponentialansatz
qi = ai eiωt .
(2.142)
Die Bewegungsgleichungen geben, da eiωt sich heraushebt, N homogene Gleichungen für die Amplituden ai ,
−mω 2 ai +
N
X
kij aj = 0 ,
j=1
oder, mit dem Kronecker Delta,
δij =
N
X
j=1
½
1
0
i=j
i 6= j ,
(kij − mω 2 δij )aj = 0 .
(2.143)
(2.144)
Den Spezialfall N = 2 (mit kij = ?) hiervon kennen wir aus 2.9. Nichttriviale Lösungen für die Amplituden ai gibt es nur, wenn die Determinante
verschwindet,
det(kij − mω 2 δij ) = 0 .
(2.145)
Diese Säkulargleichung ist eine Gleichung N -ter Ordnung für ω 2 mit N Lösungen
ωα2 . Die N Lösungen können je nach Beschaffenheit der Matrix kij teilweise übereinstimmen; der Einfachheit halber verlange ich jedoch von den Kraftkonstanten, dass die ωα2 alle verschieden sind. Jedenfalls sind alle ωα2 positiv,
denn komplexe Frequenzen ωα würden Widersprüche zum Energieerhaltungssatz bringen.
Zur α-ten Eigenfrequenz ±ωα gibt es einen Satz von Amplituden aiα , der
aus (2.144) bis auf einen konstanten Faktor bestimmt werden kann; dieser konstante Faktor bestimmt die Stärke der α-ten Eigenschwingung und ist durch
Anfangsbedingungen festzulegen. Ohne Einschränkung der Allgemeinheit kann
der α-te Satz von Amplituden aiα (der α-te Eigenvektor mit Komponenten aiα )
als reell gewählt und normiert werden durch die Verfügung
N
X
aiα aiα = 1 .
(2.146)
i=1
Somit sind alle N Eigenvektoren zu reellen Einheitsvektoren geworden.
Mit Hilfe der jetzt eindeutig gemachten reellen aiα können wir die α-te Eigenschwingung angeben als
qi (t) = aiα (Aα eiωα t + A∗α e−iωα t )
(2.147)
50
2 Schwingungen
mit beliebig komplexen Aα . Die allgemeinste Lösung finden wir durch Superposition
qi (t) =
N
X
aiα (Aα eiωα t + A∗α e−iωα t ) .
(2.148)
α=1
Die N komplexen Integrationskonstanten Aα sind durch Anfangsbedingungen
festzulegen, z. B. durch die N anfänglichen Geschwindigkeiten q̇i (0) und N
anfänglichen Auslenkungen qi (0).
Die Bestimmung der Integrationskonstante Aα aus den Anfangsbedingungen
wird rechnerisch enorm bequem, wenn wir ausnutzen, dass die N Eigenvektoren
aiα orthogonal aufeinander sind gemäß
N
X
aiα aiβ = δαβ =
i=1
½
1
0
α=β
α 6= β .
(2.149)
Die Orthogonalität folgt aus der Eigenwertgleichung (2.144) durch folgende Betrachtung. Multiplizieren wir die beiden in (2.144) gleichgesetzten Vektoren
X
kij ajα = mωα2 aiα ,
(2.150)
j
skalar mit dem β-ten Eigenvektor aiβ ,
X
aiβ kij ajα = mωα2
X
aiβ aiα .
(2.151)
X
aiα aiβ ,
(2.152)
i
ij
Eine ähnliche Gleichung,
X
aiα kij ajβ = mωβ2
i
ij
folgt, wenn (2.150) für den β-ten Eigenvektor aufgeschrieben und mit dem α-ten
Eigenvektor skalar multipliziert wird. Subtraktion von (2.151) und (2.152) gibt
m(ωβ2 − ωα2 )
X
aiα aiβ =
i
X
ij
(aiβ kij ajα − aiα kij ajβ ) .
Durch Umbenennung der Summationsindizes gemäß i ↔ j im zweiten Summanden und nach Beachtung der Symmetrie kij = kji sehen wir, dass die rechte
Seite verschwindet. Also gilt auch
(ωβ2 − ωα2 )
X
aiα aiβ = 0 .
(2.153)
i
Da die Eigenfrequenzen alle als voneinander verschieden angenommen sind,
folgt, dass das Skalarprodukt des α-ten mit dem β-ten Eigenvektor verschwinden
muss, also gerade die Orthogonalität (2.149).
2.12 Erzwungene Schwingungen von mehreren Freiheitsgraden
51
Jetzt legen wir die Integrationskonstanten Aα durch die anfänglichen Auslenkungen qi (0) und Geschwindigkeiten q̇i (0) fest. Aus der allgemeinen Form
der Lösung (2.147) folgt
qi (0)
=
X
aiβ (Aβ + A∗β )
(2.154)
β
q̇i (0)
=
X
aiβ iωβ (Aβ − A∗β ) .
β
Multiplizieren wir in beiden Gleichungen skalar mit dem α-ten Eigenvektor α iα ,
so folgt aus der Orthogonalität (2.149) und der Normierung (2.146)
Aα + A∗α
X
=
ajα qj (0)
j
Aα + A∗α
X 1
ajα q̇j (0)
iωα
j
=
oder, nach Aα aufgelöst,
Aα =
X
j
ajα
1
2
µ
i
q̇j (0)
qj (0) −
ωα
¶
.
(2.155)
Damit lautet die Lösung unseres Anfangswertproblems
qi (t) =
X
α
ajα
µ
¶
1X
i
q̇j (0) eiω at + c. c. .
ajα qj (0) −
2 j
ωα
(2.156)
Ein höchst interessanter Spezialfall ist dieser: Sei am Anfang nur ein Teilchen, etwa das k-te, ausgelenkt, mit qk (0) = Q, q̇k (0) = 0, während alle anderen
anfänglich in ihren Gleichgewichtslagen ruhen sollen. Zu späteren Zeiten geht
die ausgezeichnete Rolle des k-ten Teilchens verloren; alle Teilchen geraten in
Bewegung gemäß
X
qi (t) = Q
aiα akα cos ωα t .
(2.157)
α
Wenn die Eigenfrequenzen ωα keine rationalen Verhältnisse zueinander haben,
ist die Schwingung i. A. nicht periodisch.
2.12
Erzwungene Schwingungen von mehreren
Freiheitsgraden
Wir betrachten wieder N gleich kollinear harmonisch schwingende Teilchen
wie in 2.11, lassen nun aber auch eine äußere zeitabhängige Kraft Fi (t) auf das
i-te Teilchen zu, so dass die Bewegungsgleichungen lauten
52
2 Schwingungen
mq̈i +
N
X
kij qj = Fi (t) .
(2.158)
j=1
Die Antwort auf diese äußeren Kräfte wird am bequemsten mit Hilfe der
Amplituden der Eigenschwingung angegeben. Zerlegen wir den Vektor qi (t)
nach den in 2.11 eingeführten normierten und untereinander orthogonalen Eigenvektoren aiα der ungestörten Schwingung gemäß
qi (t) =
X
aiα Θα (t)
X
ajα qj (t) .
(2.159)
α
bzw.
Θα (t) =
j
Dabei ist Θα (t) die Komponente des Vektors qi längs des α-ten Einheitsvektors
aiα . Man nennt Θα (t) auch die α-te Normalkoordinate des Systems. Ganz
entsprechend kann auch der Vektor Fi (t) zerlegt werden
Fi (t) =
X
aiα Fα (t)
(2.160)
X
αjα Fi (t) .
(2.161)
α
bzw.
Fα (t) =
j
Wenn die Einheitsvektoren aiα explizit bekannt sind, können die Komponenten
Fα (t) der äußeren Kräfte längs der Einheitsvektoren aiα aus (2.161) berechnet
werden.
Tragen wir die Zerlegungen (2.159), (2.160) in die Bewegungsgleichung (2.158)
ein, so ergeben sich für die Normalkoordinaten die N untereinander ungekoppelten Bewegungsgleichungen
Θ̈β (t) + ωβ2 Θβ (t) =
1
Fβ (t) ,
m
(2.162)
deren jede die Bewegung eines harmonischen Oszillators der Eigenfrequenz ω β
unter dem Einfluss einer äußeren Kraft Fβ (t) beschreibt. Die Antwort eines
harmonischen Oszillators auf eine äußere Kraft ist uns aus 2.7 bekannt. Durch
Überlagerung dieser Antworten gemäß (2.159) und (2.160) lässt sich die Antwort von qi (t) auf Fj (t) gewinnen. Die Antwort wird besonders stark ausfallen
für solche Fi (t), die große Fourierkomponenten bezüglich einer oder mehrerer
Eigenfrequenzen ωβ haben, also in Nähe von Resonanzen liegen.
2.13 Transversale Schwingungen der gespannten Saite
2.13
53
Transversale Schwingungen der gespannten
Saite
Eine Saite sei zwischen x = 0 und x = l gespannt mit der Spannkraft F und
werde seitlich, d. h. in y-Richtung ausgelenkt.
Im Gegensatz zu bisher betrachteten schwingungsfähigen Systemen haben
wir es jetzt nicht mit diskreten Teilchen zu tun, sondern mit einer kontinuierlichen Saite. Die Zahl N der Freiheitsgrade ist unendlich. Sorgen wir für endliches
N , indem wir uns die Saite in N Stücke der Länge ∆x = l/N aufgeteilt denken. Die beiden Randpunkte sind fest eingespannt, während die N − 1 inneren
Punkte transversal beweglich sind und in sich die Masse eines Saitenstücks der
Länge ∆x vereinigt haben sollen (Abbildung 2.13).
Abbildung 2.13
Wenn diese Aufteilung hinreichend fein ist, wird sich das diskrete System nicht
erheblich vom kontinuierlichen System unterscheiden.
Die Saite sei elastisch. Beim Auslenken aus der Ruhelage yi = 0 ändert sich
die Länge von l auf l + ∆l. Die Verlängerung lässt sich durch die Auslenkungen
yi wie folgt ausdrücken
∆l =
N p
X
i=1
(∆x)2 + (yi − yi−1 )2 − l .
(2.163)
Bei der Verlängerung um ∆l wird gegen die Spannkraft die Arbeit F ∆l geleistet,
die sich als potenzielle Energie U = F ∆l in der Saite wiederfindet,
U
=
=
F
Ã
N p
X
(∆x)2 + (yi − yi−1 )2 − l
i=1
∆xF
N
X
i=1
s

1+
µ
yi − yi−1
∆x
¶2
!
(2.164)

− 1 .
Wenn die Auslenkung klein ist, so dass die Steigung (yi −yi−1 )/∆x betragsmäßig
klein gegen Eins ist für alle i, kann die Wurzel entwickelt werden,
54
2 Schwingungen
X µ 1 ¶2
1
U = ∆xF
(yi − yi−1 )2 + . . . .
2
∆x
i
(2.165)
Dies ist eine quadratische Form in den Auslenkungen yi mit Minimum bei
yi = 0. Auf das i-te Teilchen“ wirkt jetzt die Kraft (in y-Richtung; bei der
”
betrachteten transversalen Schwingung verlassen die Teilchen ihre anfänglichen
x-Koordinaten nie)
Fi = −
∂U
= −∆xF
∂yi
µ
1
∆x
¶2
(2yi − yi−1 − yi+1 ) .
(2.166)
Die Saite habe die Masse ρ pro Längeneinheit, das i-te Teilchen“ also die
”
Masse mi = ρ∆x. Es gehorcht dann der Bewegungsgleichung
∆xp ÿi (t) + ∆xF
µ
1
∆x
¶2
(2yi (t) − yi−1 (t) − yi+1 (t)) = 0
oder nach Division durch die Teilchenmasse
ÿ1 (t) +
µ
F
ρ
¶µ
1
∆x
¶2
(2yi (t) − yi−1 (t) − yi+1 (t)) = 0 .
(2.167)
Die Lösung dieses Problems haben wir in Abbildung 2.11 kennengelernt. Um
sie explizit zu konstruieren, müssten wir die Eigenwerte mωα2 der Kraftkonstantenmatrix kij suchen. Das ist kein schweres Problem, da kij eine sehr einfache
Struktur hat: jedes Teilchen wechselwirkt nur mit seinen beiden Nachbarn.
Physikalisch neue Einsicht gewinnen wir, wenn wir hier den Grenzwert ∆x →
0 ausführen und mit yi (t) → y(x, t) zur Kontinuumsbeschreibung der schwingenden Saite übergehen. Dazu bedenken wir
yi±1 = y(xi ± ∆x) = y(xi ) ± y 0 (xi )∆x +
1 00
y (xi )∆x2 + . . .
2
(2.168)
und finden für die Differenz der Auslenkungen im zweiten Term von (2.167)
´
³
(2.169)
2yi − yi−1 − yi+1 = −(∆x)2 y 00 (xi ) + O (∆x)3
und somit für die Bewegungsgleichung
ÿ(xi , t) − (F/p) [y 00 (xi , t) + O(∆x)] = 0 .
(2.170)
Bis auf Korrekturen von erster Ordnung in ∆x lautet die Bewegungsgleichung,
wenn der Index i weggelassen und die Abkürzung
c2 = F/ρ
eingeführt wird,
(2.171)
2.13 Transversale Schwingungen der gespannten Saite
µ
∂2
1 ∂2
− 2
2
∂x
c ∂t2
¶
y(x, t) = 0 .
55
(2.172)
Dies ist die so genannte Wellengleichung, hier erhalten aus dem Newtonschen
Grundgesetz für diskrete Teilstücke der Saite im Grenzfall ∆l → 0. Bei der
Lösung beachten wir die Randbedingung
y(0, t) = y(l, t) = 0
(2.173)
und gehen im übrigen vor wie in 2.11.
Suchen wir Eigenschwingungen. Wir finden sie, da die Wellengleichung linear
ist und keine explizit zeit- und ortsabhängigen Koeffizienten enthält, mit dem
Exponentialansatz
y(x, t) = a(x)eiωt .
(2.174)
(In 2.11 war der Teilchenindex diskret, hier ist er kontinuierlich.) Für die Amplitude a(x) ergibt sich die Forderung
a00 (x) +
ω2
a(x) = 0 .
c2
(2.175)
Statt wie in 2.11 mit einem System algebraischer Gleichungen, haben wir es
hier mit einer Differentialgleichung für a(x) zu tun, die, da sie linear ist und
konstante Koeffizienten hat, ihrerseits auch mit einem Exponentialansatz gelöst
werden kann,
a(x) = A eikx .
Der Parameter k bestimmt sich dann aus (2.175) zu
k = ±ω/c .
(2.176)
Die Wellengleichung hat also Lösungen der Form
y(x, t) = eiωt (A eiωx/c + B e−iωx/c )
(2.177)
mit beliebigem ω, A, B .
Die Randbedingungen schränken die Beliebigkeit ein. Wir finden mit (2.173)
A+B =0
A eiωl/c + Be−iωl/c = 0 .
(2.178)
Es folgt B = −A und sin(ωl/c) = 0. Letztere Forderung legt die Eigenfrequenzen fest. Nur für
56
2 Schwingungen
ω = ωn = nπc/l,
n = 1, 2, 3, . . .
(2.179)
sind die Wellengleichungen und die Randbedingungen zugleich befriedigbar. Zur
n-ten Eigenfrequenz gehört der Eigenvektor (beachte, dass der Vektor jetzt kontinuierlich viele, mit x nummerierte Komponenten hat)
sin(ωn x/c) = sin(kn x) = an (x) .
(2.180)
Die in 2.11 erklärte Orthogonalität der Eigenvektoren überträgt sich auch auf
die Eigenvektoren (2.180). Das Skalarprodukt zweier Eigenvektoren mit einer
kontinuierlichen Gesamtheit von Komponenten wird in nahe liegender Verallgemeinerung des diskreten Falls definiert durch das Integral
Zl
dx an (x)an (x) .
(2.181)
0
Für die Eigenvektoren (2.180) hat das Skalarprodukt den Wert
Zl
dx sin(kn x) sin(kn0 x) =
l
δn,n0 .
2
(2.182)
0
Demnach
sind die Eigenvektoren auch zu Einheitsvektoren normierbar:
q
2
l sin(πnx/l) ist Einheitsvektor.
Die allgemeinste Lösung der Wellengleichung, die zugleich die Randbedingung befriedigt, erhalten wir durch Superposition der Eigenschwingungen
y(x, t) =
∞
X
sin(kn x)(An eiωn t + A∗n e−iωn t )
(2.183)
n=1
mit beliebig komplexen Integrationskonstanten An , die durch Anfangsbedingungen festgelegt werden können. Unter Beachtung der Orthogonalität der Eigenvektoren sin(kn x) lassen sich die an wie in 2.11 durch die Anfangswerte y(x, 0)
und ẏ(x, 0) angeben.
Die allgemeine Lösung (2.183) kann übrigens auch in der Form
y(x, t) = f (x − ct) + g(x + ct)
aufgeschrieben werden, wobei f und g durch die Anfangsbedingungen festgelegt
sind. Aus dieser Neuformulierung lernen Sie, dass c die Bedeutung der Wellengeschwindigkeit (hier Schallgeschwindigkeit) hat. Offenbar beschreibt f (x − ct)
eine längs der x-Achse mit der Geschwindigkeit c nach rechts laufende Welle,
da die Funktion f (x − ct) ein und denselben Wert hat für alle Koordinaten x
und Zeiten t, für die das Argument x − ct konstant ist. Entsprechend beschreibt
g(x + ct) eine linkslaufende Welle.
Eine grafische Darstellung von Eigenschwingungen finden Sie in Abb. 12.2.
Wundern Sie sich nur darüber, dass die Ihnen hier begegnenden Eigenschwingungen im dortigen quantenmechanischen Kontext wieder auftreten. Sie werden
2.14 Theorie der Dämpfung(Modell)
57
noch lernen, dass dabei kein Zufall waltet.
2.14
Theorie der Dämpfung(Modell)
Bekanntlich ist die gedämpfte Bewegung eines makroskopischen Systems die
Konsequenz der Wechselwirkung desselben mit vielen anderen, mikroskopischen
Systemen. Letztere sind mit entsprechend feinen Methoden zwar auch beobachtbar, i. Allg. jedoch nicht sichtbar auf den Längen- und Zeitmaßstäben, auf denen
sich ihr mittlerer Effekt auf das makroskopische System manifestiert.
Die einfachste, sehr grobschlächtige Abschätzung einer Reibungskraft ist die
folgende: Eine Kugel der Masse M mit Radius r bewege sich mit der Geschwindigkeit v durch ein Gas, in dem sich pro Volumeneinheit ρ Atome der Masse m befinden. In der Zeit ∆t durchstreicht die Kugel das Volumen πr 2 v∆t,
stößt also gegen ρπr 2 v∆t-Atome. Bei jedem dieser elastischen Stöße erhält
das gestoßene Atom, da es sehr viel leichter ist als die Kugel, einen Impuls
der Größenordnung mv. Die Kugel erfährt die entgegengesetzt gleiche Impulsänderung. Der einzelne Stoß hat auf die Kugel wegen m/M ≈ 10−23 keinen
merklichen Effekt, die Gesamtheit der in ∆t erfolgten Stöße aber führt zur Impulsänderung ∆ρ = −ρπr 2 v∆tmv. Die sekündliche Impulsänderung ∆ρ/∆t
entspricht einer Reibungskraft der Größe
F = ρπr2 mv 2 ∼ v 2 .
(2.184)
Die folgende Modellrechnung wird etwas detaillierter sein als die eben vorgestellte grobschlächtige Abschätzung. Zur Vorbereitung gebe ich eine kurze, rein
mathematische Überlegung. Betrachten Sie eine Summe vieler oszillierender
Exponentialfunktionen
S(t) =
n
X
eiων t ,
(2.185)
ν=1
deren Frequenzen ωv keine rationalen Verhältnisse zueinander haben sollen.
Dann ist S(t) nicht periodisch. Es seien die Frequenzen ωk so zahlreich und
so dicht benachbart, dass die Summe S(t) gut durch ein Integral approximiert
werden kann. Die Zahl der ωk im Frequenzintervall ∆ω bei ω sei ρ(ω)∆ω. Dann
gilt
+∞
Z
S(t) ≈
dωρ(ω) eiωt .
(2.186)
−∞
Die Koordinate zu einem makroskopischen Freiheitsgrad möge durch obige Summe S(t) gegeben sein. Das Auftreten der oszillierenden Terme eiων τ macht deutlich, dass die Bewegung reversibel, d. h. ungedämpft ist. Andererseits kann für
sehr große N die Bewegung gedämpft erscheinen, wie wir sehen, wenn wir für
die spektrale Dichte ρ(ω) der ων eine Lorentzverteilung nehmen,
+∞
Z
dωeiωt N
S(t) ≈
−∞
γ/π
= N eiΩt−γ|t| .
(ω − Ω)2 + γ 2
(2.187)
58
2 Schwingungen
Nach diesen Vorbemerkungen nun zum angekündigten Modell, das den mikroskopischen Ursprung der Dämpfung der Schwingung eines makroskopischen Oszillators beschreibt.
Ein makroskopischer“ Oszillator der Masse M und viele (N À 1) mikro”
”
skopische“ Oszillatoren der Masse m ¿ M seien harmonisch an Gleichgewichtslagen q0 = 0 bzw. qν = 0 mit ν = 1, 2, . . . gebunden gemäß der potenziellen
Energie
U=
N
N
X
1 X
1
k0 q02 +
q0 qν .
kν qν2 + λ
2
2 ν=1
ν=1
(2.188)
Das letzte Glied beschreibt eine Kopplung des makroskopischen Oszillators an
seine mikroskopischen Partner. Die Kopplung sei schwach, d. h. λ ¿ k0 , kν .
Am Anfang, bei t = 0, sollen die mikroskopischen Oszillatoren alle in ihren
Gleichgewichtslagen ruhen, während der makroskopische Oszillator eine endliche
Auslenkung und verschwindende Geschwindigkeit habe.
Die zugehörigen Bewegungsgleichungen haben die Form
q̈0
q̈ν
+
Ω20 q0
+
+
ων2 qν
+
λ
M
λ
m
P
q0
ν
qν
=0
=0
(2.189)
mit Ω20 = k0 /M und ων2 = kν /m.
Die Kraftkonstantenmatrix

k0



kν
kij =
λ/m



0
für
für
für
sonst
i=j=0
i = j = ν = 1, 2, . . . N
i = 0, j = ν sowie i = ν, j = 0
(2.190)
ist so einfach strukturiert, dass die Eigenfrequenzen und Eigenvektoren ohne
Mühe explizit angegeben werden können. Mit anderen Worten, man kann die
Auslenkung q0 (t) des makroskopischen Oszillators explizit angeben als Funktion
der anfänglichen Auslenkungen qi (0) und Geschwindigkeiten q̇i (0).
Den für uns interessanten Grenzfall
λ/k0 ¿ 1 ,
λ/kν ¿ 1 ,
1/N ¿ 1
(2.191)
beschreiben wir jedoch am bequemsten, indem wir gar nicht erst die formal
exakte Lösung des Problems suchen, sondern sofort die Kleinheit der angegebenen Parameter benutzen. Die entsprechende Näherungslösung, die ich nun
vorstelle, ist vor allem bekannt als die Wigner-Weißkopf Lösung des Problems
der natürlichen Linienbreite von Spektrallinien, also eines Problems aus der
Quantenelektrodynamik.
Wir können die Bewegungsgleichung für die Auslenkung des ν-ten mikroskopischen Oszillators formal auffassen als die einer erzwungenen Schwingung
mit der äußeren Kraft −λq0 (t). Die Lösung mit der Anfangsbedingung qν (0) =
q̇ν (0) = 0 lautet (s. 2.95 und 2.96 mit γ = 0)
2.14 Theorie der Dämpfung(Modell)
λ
qν (t) = −
m
Zt
dt0 q0 (t0 )
0
sin ων (t − t0 )
=0.
ων
59
(2.192)
Dies setzen wir ein in die Bewegungsgleichung des makroskopischen Oszillators
und erhalten
q̈0 (t) + Ω20 q0 (t) −
λ2
mM
Zt
dt0 q0 (t0 )
0
N
X
sin ων (t − t0 )
=0.
ων
ν=1
(2.193)
Diese Bewegungsgleichung ist insofern etwas komplizierter als die ursprüngliche,
als die unbekannte Auslenkung q0 (t) auch unter einem Integral auftritt. Allerdings sind dafür die Auslenkungen der mikroskopischen Oszillatoren völlig
eliminiert.
Da die Kopplung des makroskopischen Oszillators an die mikroskopischen
Oszillatoren schwach ist, wird q0 (t) nur wenig abweichen von der freien Schwingung, die wir früher mit dem Ansatz q0 (t) ∼ e±iΩ0 t gefunden hatten als
q0 (t) = q0 (0) cos(Ω0 t) +
1
q̇0 (0) sin(Ω0 t) .
Ω0
(2.194)
Daher wird jetzt der Ansatz
q0 (t) = a(t) eiΩ0 t
(2.195)
sinnvoll sein mit einer Amplitude a(t), die schwach zeitabhängig ist gemäß
|ȧ(t)| ¿ |Ω0 a(t)| .
(2.196)
Für a(t) ergibt sich mit Hilfe von
¡
¢
q̈0 (t) = ä(t) + 2iΩ0 ȧ(t) − Ω20 a(t) eiΩ0 t ,
also
q̈0 (t) + Ω20 q0 (t)
≈
(ä + 2iΩ0 ȧ) eiΩ0 t
≈
2iΩ0 ȧ eiΩ0 t ,
(2.197)
die genäherte Bewegungsgleichung
λ2
ȧ(t) = −
4mM Ω0
Zt
0
dt0 a(t−t0 )
i
X 1 h
0
0
ei(ων −Ω0 )t − e−i(ων +Ω0 )t . (2.198)
ων
ν
60
2 Schwingungen
Wir sehen deutlich, dass ȧ(t) verschwindet, a(t) also zeitlich konstant wird,
wenn die Kopplung ganz abgeschaltet wird. Da ȧ(t) = 0(λ2 ), gilt auch a(t−t0 ) =
a(t) + 0(λ2 ) und unter Inkaufnahme eines Fehlers der Ordnung λ4 können wir
a(t − t0 ) durch a(t) ersetzen und aus dem Integral herausziehen. Dann ergibt
sich
ȧ(t)
a(t)
=
=
λ2
−
4mM Ω0
Zt
dt0
0
i
X 1 h
0
0
ei(ων −Ω0 )t − e−i(ων +Ω0 )t
ων
ν
· i(ων −Ω0 )t
¸
N
X
λ2
e
− 1 e−i(ων +Ω0 )t − 1
1
−
+
.
4mM Ω0 ν=1 ων
i(ων − Ω0 )
i(ων + Ω0 )
(2.199)
Bei der Ausführung der Frequenzsummen über die mikroskopischen Oszillatoren beachten wir ων ≥ 0. Große Beiträge zur Summe können nur die Oszillatoren machen, die fast oder ganz in Resonanz zum makroskopischen Oszillator
sind, d. h. für die ων ≈ Ω0 gilt. Insbesondere kann der zweite Summand vernachlässigt werden. Nun schlachten wir die Größe von N aus und approximieren
die Frequenzsumme durch ein Integral. Wenn die Zahl der mikroskopischen Oszillatoren mit Frequenzen im Intervall ∆ω bei ω gerade ρ(ω)∆ω ist, können wir
schreiben
λ2
ȧ(t)
=−
a(t)
4mM Ω0
Z∞
0
dω
ρ(ω)
ω
·
1 − cos(ω − Ω0 )t
sin(ω − Ω0 )t
+i
ω − Ω0
ω − Ω0
¸
. (2.200)
Die rechts stehenden Integrale werden für t À Ω−1
0 zeitunabhängig. Für das
erste der beiden sehen wir diese Eigenschaft daraus, dass
¯
sin(ω − Ω0 )t ¯¯
= πδ(ω − Ω0 )
(2.201)
¯
ω − Ω0 ¯
−1
tÀΩ0
genau die Darstellung (2.112) der Deltafunktion ist. Die strenge Begründung
der Zeitunabhängigkeit des zweiten Integrals ist mathematisch zu aufwendig,
als dass sich die Darstellung hier lohnen würde. Qualitativ lässt sie sich wie
folgt einsehen. Für ω 6= Ω0 oszilliert der Cosinus cos(ω − Ω0 )t wegen t → ∞
als Funktion von ω so schnell um Null herum, dass jedes über ihn erstreckte
Integral verschwindet, wenn die Stelle ω = Ω0 aus dem Integrationsbereich
ausgespart bleibt; anderseits verschwindet 1 − cos(ω − Ω0 )t an der Stelle ω = Ω0
quadratisch, also schneller als der Nenner ω − Ω0 im Integranden; insgesamt hat
der Imaginärteil der geschweiften Klammer in (2.200) auf das Integral denselben
Effekt wie die Vorschrift, ein beliebig kleines Intervall um die Stelle ω = Ω0 aus
dem Integrationsbereich herauszulassen.
Aus (2.200) entsteht also für große Zeiten
ȧ(t)
= −Γ − iδ
a(t)
(2.202)
2.14 Theorie der Dämpfung(Modell)
61
mit
Γ=
πλ2
ρ(Ω0 )
4mM Ω20
(2.203)
und
λ2
δ=
4mM Ω0
Z∞
0
¯
ρ(ω) 1 − cos(ω − Ω0 )t ¯¯
dω
¯
¯
ω
ω − Ω0
.
(2.204)
tÀΩ−1
0
Die beiden Parameter Γ und δ haben die physikalische Bedeutung einer Dämpfungskonstanten bzw. einer Frequenzverschiebung, wie wir aus der Lösung
a(t) = a(0) e−Γt−iδt
der Differentialgleichung (2.202) ersehen. Für die Amplitude des makroskopischen Oszillators erhalten wir als Endresultat
q0 (t) = a e−Γt+i(Ω0 −δ)t + c.c. .
(2.205)
Unter dem Einfluss der vielen mikroskopischen Oszillatoren führt der makroskopische Oszillator also eine gedämpfte Schwingung aus.
Argwöhnen Sie, die gefundene Dämpfung sei ein Artefakt der näherungsweisen
Ersetzung von Frequenzsummen durch Frequenzintegrale wie beim Übergang
von (2.185) zu (2.186) oder insbesondere zu (2.187)? Die Skepsis wäre prinzipiell berechtigt, im Fall vieler dicht liegender ων jedoch praktisch gegenstandslos.
Für hinreichend viele eng benachbarte ων ist die Summe (2.185) vom Integral
(2.186) praktisch nicht zu unterscheiden. Eine genauere Diskussion der Güte
derartiger Näherungen stelle ich Ihnen in 21.8 vor.
Die hier beschriebene Modellrechnung wird uns mit geringfügigen Modifikationen bei der Diskussion der spontanen Emission von Licht durch angeregte
Atome in 13.4 wiederbegegnen.
62
2 Schwingungen
Kapitel 3
Nichtrelativistische
Bewegung im
Gravitationsfeld
3.1
Das 1/r-Potential
Zwei Teilchen mit den schweren Massen M und m üben aufeinander eine
anziehende Gravitationskraft aus, die in Richtung der Verbindungslinie wirkt
und den Betrag
F =G
mM
r2
(3.1)
Abbildung 3.1
hat. Legen wir den Ursprung des Koordinatensystems in den Mittelpunkt des
Teilchens der Masse M , so lautet die Kraft auf das andere
63
64
3 Nichtrelativistische Bewegung im Gravitationsfeld
mM ~x
.
F~ = −G 2
r
r
(3.2)
Dieses Kraftfeld ist wirbelfrei (s. 2.10),
∂Fν
∂Fµ
=
∂xµ
∂xν
mit
xµ = x, y, z;
F µ = F x , Fy , Fz ,
(3.3)
und hat eine potenzielle Energie U (~x), die bei festem Bezugspunkt ~x0 eine
eindeutige Funktion der Koordinaten des Beobachtungspunktes“ ~x ist. Wir
”
können U (~x) als Wegintegral der Kraft längs eines beliebigen Weges von ~x0
nach ~x berechnen. Da gegen F~ bei Wegen auf der Kugelfläche |~x| = r = const
keine Arbeit geleistet wird, ändert sich U (~x) längs solcher Wege nicht. Also
kann U nur von |~x| = r abhängen, U (~x) = U (r). Die Änderung von U längs
eines Wegstücks dr in radialer Richtung gemäß d~x = dr ~xr beträgt
mM
dU = −F~ · d~x = G 2 dr .
r
(3.4)
Für endliche Wege längs eines Radialstrahls gilt
U (r) − U (r0 ) =
Zr
r0
dr0 G
mM
= − GmM
r02
µ
1
1
−
r
r0
¶
.
(3.5)
Es ist üblich, den Bezugspunkt r0 ins Unendliche zu legen mit U (∞) = 0; dann
haben wir
U (r) = −
GmM
.
r
(3.6)
Abbildung 3.2
Dies ist das sogenannte Keplerpotential (s. Abbildung 3.2). Da alle Massen
positiv sind, ist es immer anziehend.
Die elektrostatische Wechselwirkung zweier Punktladungen q, Q wird auch
durch eine kugelsymmetrische potenzielle Energie, die mit wachsendem r wie
1/r abfällt, beschrieben, das Coulombpotential
Uelstat (r) ∼
qQ
.
r
(3.7)
3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential
65
Da elektrische Ladungen verschiedene Vorzeichen haben können, liegt hier bei
Ladungen gleichen Vorzeichens Abstoßung und bei Ladungen ungleicher Vorzeichen Anziehung vor.
3.2
Die Erhaltungssätze bei Bewegungen im
1/r-Potential
Ein Teilchen der Masse m bewege sich unter dem Einfluss der potenziellen
Energie
U =−
km
.
r
(3.8)
Die Bewegungsgleichung lautet, wegen
Fµ
=
¨ =
m~x
∂U
,
∂xµ
(3.9)
mk ~x
.
r2 r
(3.10)
−
Das sind die drei Differentialgleichungen für die drei Koordinaten
~x(t) = (x(t), y(t), z(t)). Obwohl es sich um nichtlineare gekoppelte Differentialgleichungen 2. Ordnung handelt, lässt sich die allgemeine Lösung in geschlossener Form angeben.
Ein erstes Integral ist der Energiesatz
T + U = E = const
(3.11)
2
2
2
mit T = m
x˙ 2 = m
2 ~
2 (ẋ + ẏ + ż ) ≥ 0 . Wegen T ≥ 0 muss entlang der Bahn
~x(t) des Teilchens immer gelten U ≤ E. Dieser Erhaltungssatz reicht natürlich
nicht aus, die drei Funktionen ~x(t) festzulegen.
Um ein weiteres Bewegungsintegral zu finden, multiplizieren wir die Bewegungsgleichung (3.10) vektoriell mit ~x und beachten
−
mk ~x
× ~x = 0 .
r2 r
(3.12)
Die Bewegungsgleichungen geben somit
¨ × ~x = 0 .
m~x
(3.13)
Die linke Seite dieser Identität ist aber eine totale zeitliche Ableitung, denn
d
¨,
(~x × ~x˙ ) = ~x˙ × ~x˙ +~x × ~x
| {z }
dt
= 0
(3.14)
66
3 Nichtrelativistische Bewegung im Gravitationsfeld
so dass
d
(~x × m~x˙ ) = 0 .
dt
(3.15)
Bei der Bewegung im 1/r Potential bleibt also das Vektorprodukt aus Ortsvektor
~x und Impulsvektor m~x˙ , der Drehimpuls, zeitlich konstant
−−→
~ = ~x × m~x˙ = −
L
const .
(3.16)
1
|~x × ~x˙ | = const .
2
(3.17)
Aus diesem Drehimpulserhaltungssatz folgt sofort eine wichtige Eigenschaft
der Bahnkurven ~x(t). Zu jedem Zeitpunkt spannen die beiden Vektoren ~x und
m~x˙ eine Ebene auf. Die Ebene wird charakterisiert durch ihren Normalenvektor,
d. h. einen auf ihr senkrecht stehenden Vektor. Senkrecht auf der Ebene steht
~ Die zeitliche Konstanz von L
~ besagt, dass die Ebene,
gerade der Drehimpuls L.
˙
in der ~x und ~x liegen, sich zeitlich nicht ändert. Die Bahnkurve ~x(t) bleibt also
immer in einer Ebene.
Weiterhin folgt aus der Konstanz des Drehimpulses die Zeitunabhängigkeit
seines Betrages, |~x × m~x˙ | und ebenso die Zeitunabhängigkeit der Größe
Dieser Erhaltungssatz ist das zweite Keplersche Gesetz, der so genannte Flächensatz:
die Verbindungslinie zwischen den beiden Teilchen (bei Kepler Sonne und Planet) überstreicht in gleichen Zeiten ∆t gleiche Flächen, denn bekanntlich ist
1
x × ∆~x| die Fläche des von ~x und ∆~x aufgespannten Dreiecks (s. Abbildung
2 |~
3.3).
Abbildung 3.3
Die Erhaltungssätze von Energie und Drehimpuls reichen aus, die Bahnkurven ~x(t) festzulegen. Wir dürfen die Ebene der Bahnkurve (die Ebene der
Erdbahn heißt Ekliptik) zur x-y-Ebene unseres Koordinatensystems machen.
Dann ist eine Lösung trivial,
z(t) = 0 ,
(3.18)
3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential
67
und der Drehimpuls hat die Komponenten
Lx = 0,
Ly = 0,
Lz = L .
(3.19)
Zu bestimmen bleiben x(t) und y(t). Da das Kraftzentrum (im Keplerproblem der Ort der Sonne) der einzige ausgezeichnete Punkt der Bahnebene (im
Keplerproblem Ekliptik) ist, und das U (~x) = U (r), liegt es nahe, die Bahnkurve
in ebenen Polarkoordinaten
x = r cos ϕ
y = r sin ϕ
(3.20)
zu suchen. Die Geschwindigkeiten lassen sich durch r(t) und ϕ(t) und deren
Ableitungen ausdrücken gemäß
ẋ = ṙ cos ϕ − rϕ̇ sin ϕ
ẏ = ṙ sin ϕ + rϕ̇ cos ϕ
(3.21)
~x˙ 2 = ẋ2 + ẏ 2 = ṙ2 + r2 ϕ̇2
und entsprechend die z-Komponente des Drehimpulses als
Lz = m(xẏ − y ẋ) = mr 2 ϕ̇ .
(3.22)
Somit lauten die Erhaltungssätze für Energie und Drehimpuls
1
km
m(ṙ2 + r2 ϕ̇2 ) −
2
r
=
E
(3.23)
mr2 ϕ̇
=
L.
(3.24)
Mit Hilfe des Drehimpulses lässt sich ϕ̇ aus dem Energiesatz eliminieren, woraufhin dieser lautet
L2
km
1
mṙ2 +
−
=E .
2
2
2mr
r
(3.25)
In dieser Form erinnert der Energiesatz an das für einen Freiheitsgrad Bekannte.
Die effektive potenzielle Energie Ueff (r) für die Radialkoordinate,
Ueff (r) =
km
L2
,
−
2mr2
r
(3.26)
enthält außer dem 1/r-Term die abstoßende Zentrifugalenergie“ L2 /2mr 2 .
”
68
3 Nichtrelativistische Bewegung im Gravitationsfeld
Da 12 mr2 ≥ 0, verläuft die Bahnkurve so, dass immer Ueff (r) ≤ E. Es folgt,
dass im Fall der anziehenden Gravitationswechselwirkung (k > 0) die Bahnen
negativer Energie und positiver Energie verschiedenen Charakter haben. Wie
aus Abbildung 3.4 ersichtlich, liegt für E < 0
Abbildung 3.4
der Abstand des Teilchens vom Zentrum immer zwischen zwei Schranken r min
und rmax . Da das Teilchen sich vom Zentrum nie weiter als bis zum Abstand
rmax entfernen kann, spricht man auch von gebundenen Bahnen. Das Auftreten der unteren Schranke rmin liegt an der abstoßenden Zentrifugalkraft bzw.
-energie, die für kleine Abstände die anziehende Gravitationskraft überwiegt.
Letztere Potentialbarriere liegt zwar auch für E ≥ 0 vor, jedoch kann sich das
Teilchen nun beliebig weit vom Kraftzentrum entfernen. Ein Teilchen auf solcher Bahn wird gestreut und ist nicht gebunden.
3.3
Die Bahnkurven
Wir hatten die Erhaltungssätze für Energie und Drehimpuls geschrieben als
L2
km
m 2
ṙ +
−
2
2
2mr
r
mr2 ϕ̇
= E
(3.27)
= L.
(3.28)
Erstere Gleichung ist eine Differentialgleichung erster Ordnung für die Zeitabängigkeit der Radialkoordinate r(t). Die Lösung
t − t0 =
Zr
r0
q
dr0
2E
m
+
2k
r0
−
L2
m2 r 02
(3.29)
ist mit Hilfe von Integraltafeln auswertbar. Anschließend ergibt sich ϕ(t) durch
Integration des Drehimpulssatzes.
Interessieren wir uns vorläufig nur für die geometrische Form r(ϕ) der Bahnkurven. Dazu fassen wir r als Funktion von ϕ auf und schreiben
3.3 Die Bahnkurven
dr dϕ
dr L
dr
=
=
.
dt
dϕ dt
dϕ mr2
69
(3.30)
Daraus liefert der Energiesatz eine Differentialgleichung für die Bahnkurve r =
r(ϕ),
µ
dr
dϕ
¶2
L2
L2
km
+
−
=E .
4
2mr
2mr2
r
(3.31)
Die Form der Bahnkurve wird unmittelbar ersichtlich, wenn wir vorübergehend
u=
1
r
(3.32)
als abhängige Variable einführen. Die Transformation (3.32) überführt den
Energiesatz (3.31) in
µ 2¶
2mE
2km2
du
u=
(3.33)
+ u2 −
dϕ
L2
L2
Diese Beziehung ist aber formgleich mit dem Energiesatz für eine harmonische
Schwingung der Frequenz 1 um den Mittelpunkt
km2
1
≡ .
2
L
p
(3.34)
Tatsächlich löst
u=
1
1
= [1 + ² cos(ϕ − ϕ0 )]
r
p
(3.35)
mit
²=
µ
2EL2
1+ 2 3
k m
¶1/2
(3.36)
und der beliebigen reellen Integrationskonstanten ϕ0 die Differentialgleichung
(3.33).
Aus (3.35) erkennen wir die Bahnkurven r = r(ϕ) als ebene Kegelschnitte.
Der Parameter ² heißt die Exzentrizität derselben. Im Fall der anziehenden
≤
≤
Wechselwirkung wird die Bahnkurve je nach ² > 1, d. h. E > 0, qualitativ
verschieden verlaufen. Die obige Diskussion kann jetzt präzisiert werden.
Für ² < 1, d. h. E < 0, läuft r periodisch in ϕ (nicht nur in der Zeit t, was
wir schon in 3.2 gesehen hatten) im Intervall
rmin =
p
p
≤ r ≤ rmax =
.
1+²
1−²
(3.37)
Die Bahnkurve ist geschlossen und hat die Form einer Ellipse (erstes Keplersche
Gesetz), wobei das Kraftzentrum Abbildung (3.5) in einem der Brennpunkte
liegt.
70
3 Nichtrelativistische Bewegung im Gravitationsfeld
Im Grenzfall ² = 0 ist die Ellipse zum Kreis entartet; aus (3.31) ersehen wir,
dass der Kreisradius zum Minimum der effektiven potenziellen Energie gehört.
}
}
}
}
Abbildung 3.5
Für ² > 1 d. h. E > 0, liegt ein Streuzustand vor. Die Bahnkurve ist eine
Hyperbel, die das Kraftzentrum umläuft Abbildung (3.6).
{
{
Abbildung 3.6
Weit weg vom Zentrum läuft das Teilchen unter dem Winkel ϕ∞ auf praktisch
gerader Bahn ein. Später läuft es asymptotisch wieder auf einer Geraden aus,
gestreut um den Winkel (s. Skizze)
Θ = 2ϕ∞ − π ,
(3.38)
wobei 1 + ² cos ϕ∞ = 0, also
ϕ∞ =
1
π
+ arcsin
.
2
²
(3.39)
Für ² = 1, d. h. E = 0, ist die Bahnkurve eine Parabel. Ein so bewegtes Teilchen hat für r → ∞ gerade verschwindende kinetische Energie, d. h.
verschwindende Geschwindigkeit.
Die Zeitabhängigkeit r(t) lässt sich auch durch elementare Funktionen ausdrücken. Statt hierin Mühe zu investieren, halten wir lieber als allgemeine
3.4 Das Zweikörperproblem
71
Aussage fest, dass die Geschwindigkeit ~v im Perihel den maximalen Betrag hat.
Das ist sofort aus dem Energiesatz ersichtlich.
Ferner erhalten wir die Umlaufzeit T auf einer Ellipsenbahn aus dem Flächenansatz
Keplers, d. h. dem Drehimpulserhaltungssatz (3.17)
L
1
= |~x × ~x˙ | = const .
2m
2
(3.40)
Nach einem Umlauf ist gerade die Fläche der Ellipse, F = πab überstrichen.
Also finden wir durch Integration von t = 0 bis t = T
T =
πab
.
L/2m
(3.41)
Nach bekannten Formeln der analytischen Geometrie findet man für die Halbachsen der Ellipsen
a=
km
p
=
,
2
1−²
2|E|
und somit für die Umlaufzeit
T = πkm
r
b= √
p
L
=p
2
1−²
2m|E|
m
= 2πa3/2
2|E|3
r
(3.42)
1
.
k
Dieses Resultat enthält das dritte Keplersche Gesetz: die Quadrate der Umlaufzeit der Planeten sind proportional zu den Kuben der großen Halbachsen ihrer
Bahnen.
3.4
Das Zweikörperproblem
Wir haben bisher die Bewegung eines Teilchens im Keplerpotential behandelt.
Das ist noch nicht genau das Problem der Planetenbahnen. Die Anziehungskraft
der Sonne auf einen Planeten ist entgegengesetzt gleich der Anziehungskraft
des Planeten auf die Sonne und letztere führt dazu, dass sich auch die Sonne
beschleunigt bewegt. Wir haben die beiden (bzw. sechs) Bewegungsgleichungen
¨P + G
mP ~x
¨S − G
mS ~x
mP mS
~xP − ~xS
=0
|~xP − ~xS |2 |~xP − ~xS |
(3.43)
mP mS
~xP − ~xS
=0.
|~xP − ~xS |2 |~xP − ~xS |
(3.44)
wobei mP und ~xP Masse und Ortsvektor der Planeten, mS und ~xS die entsprechenden Größen für die Sonne sind.
¨S |/|~x
¨P | =
Beachten wir, dass die Beschleunigungen das Betragsverhältnis |~x
mP /mS haben. Für Jupiter, den schwersten Planeten, hat dieses Verhältnis
einen Wert von etwa 10−3 und für die Erde gar nur von etwa 2 · 10−6 . Wir
72
3 Nichtrelativistische Bewegung im Gravitationsfeld
erwarten also, dass bei der Behandlung der Planetenbahnen die Sonne bis auf
einen Fehler von ≤ 1% als ruhendes Kraftzentrum angesehen werden kann.
Astronomische Beobachtungen sind phantastisch genau. Zum Vergleich der
Theorie mit den Messdaten brauchen wir die Planetenbahnen genauer als bis auf
einen Fehler von etwa 1%. Sie sind, solange die Wechselwirkung der Planeten
untereinander vernachlässigt, also nur das Zweikörpersystem Planet und Sonne
behandelt wird, billig exakt zu haben. Wir führen statt der Ortsvektoren ~xP
und ~xS Relativkoordinaten
~x = ~xP − ~xS
(3.45)
~ = mP ~xP + mS ~xS
X
mP + m S
(3.46)
und Schwerpunktskoordinaten
ein. Aus den Newtonschen Gleichungen (3.43), (3.44) folgen für Bewegungsglei~ Sie lauten, wenn wir als Abkürzungen
chungen für die Koordinaten ~x und X.
die Gesamtmasse
M = mP + mS
(3.47)
mP · m S
mP + m S
(3.48)
und die reduzierte Masse
m=
einführen,
~¨ = 0
MX
¨+G
m~x
mM ~x
=0.
|~x|2 |~x|
(3.49)
(3.50)
Die erste Gleichung besagt, dass sich der Schwerpunkt des Zweikörpersystems
kräftefrei, also mit konstanter Geschwindigkeit bewegt. Die zweite beschreibt
ein Teilchen der Masse m, das sich unter dem Einfluss der von einem fixen
Kraftzentrum ausgehenden Gravitationskraft bewegt. Letzteres Problem war
in 3.2 und 3.3 gelöst worden. Wir haben m dabei als die reduzierte Masse des
Planeten zu interpretieren. Wegen mP ¿ mS weicht die reduzierte Masse nur
wenig von der Planetenmasse ab.
Kapitel 4
Statische wirbelfreie Felder∗
4.1
Wirbelfreie Vektorfelder
Wirbelfreie Vektorfelder hatten wir schon im Kapitel 2 kennengelernt. Die
Wirbelfreiheit bezeichnet die Eigenschaft
∂Vi
∂Vj
=
,
∂xj
∂xi
i, j = 1, 2, 3
bzw. x, y, z.
(4.1)
Für derartige Felder ist, wie wir gesehen hatten, das Wegintegral
Z~x
~ (~x0 ) ≡ −ϕ(~x)
d~x0 · V
(4.2)
~
x0
für alle zwischen ~x0 und ~x laufenden Wege gleich und somit, bei festgehaltenem
Bezugspunkt“ ~x0 , eine eindeutige Funktion der Koordinaten des Beobach”
”
tungspunktes“ ~x (s. Abbildung 4.1).
Abbildung 4.1
Da ein Wegintegral sein Vorzeichen wechselt, wenn beim Integrieren der Weg
in umgekehrter Richtung durchlaufen wird, muss jedes Wegintegral über ein
∗ In diesem Kapitel werden überwiegend drei Raumdimensionen in Rechnung gestellt;
ein Punkt wird durch den Ortsvektor ~
x = (x, y, z) = (x1 , x2 , x3 ) beschrieben; ein skala~ (~
res Feld ϕ(~
x) ist eine Zuordnung einer Zahl ϕ(~
x) zum Punkt ~
x; ein Vektorfeld V
x) =
(Vx (~
x), Vy (~
x), Vz (~
x)) = (V1 , V2 , V3 ) ist eine Zuordnung des Zahlentripels Vx , Vy , Vz zum
Punkt ~
x.
73
74
4 Statische wirbelfreie Felder
wirbelfreies Feld längs eines beliebigen geschlossenen Weges (Einschränkung:
einfach zusammenhängendes Gebiet!) verschwinden,
I
~ (x) = 0 .
ZL = d~x · V
(4.3)
L
~ längs des geschlossenen Weges L. Das VerschwinZL heißt die Zirkulation von V
den von ZL ist die anschaulichste Manifestation von Wirbelfreiheit (Gegenbeispiel: schauen Sie den Wirbel in der Badewanne an).
~ (~x) durch DiffeAus dem skalaren Wegintegral ϕ(~x) kann das Vektorfeld V
renzieren zurückgewonnen werden:
Vi = −
∂ϕ
,
∂xi
kurz
~ = − grad ϕ
V
oder
~ = −∇ϕ .
V
(4.4)
Als ein Beispiel kennen wir das Gravitationsfeld eines schweren Teilchens
der Masse M. Auf ein Probeteilchen der Masse m am Ort ~x (Nullpunkt in M )
wirkt die Gravitationskraft
F~
= m~g ,
~g
= − GM
~x
= ~g (~x)
r3
(4.5)
Abbildung 4.2
Zur Beschreibung des von M am Ort ~x erzeugten Gravitationsfeldes ist ~g , da
von der Masse m des Probekörpers unabhängig, besser geeignet als die Gravitationskraft F~ . Wir nennen ~g (~x) die Feldstärke oder kurz das Gravitationsfeld.
Zur Gravitationskraft F~ gehört die potenzielle Energie des Probeteilchens
U (~x)
=
mϕ(~x) ,
ϕ(~x)
=
ϕ(r) = −
GM
.
r
(4.6)
Das skalare Feld ϕ(~x) heißt Gravitationspotential.
Es ist eine Erfahrungstatsache, dass sich (schwache) Gravitationsfelder, die
von verschiedenen Teilchen erzeugt werden, linear superponieren. Also gilt für
das von N Teilchen mit den Massen mi erzeugte Gravitationspotential
ϕ(~x) = −
N
X
Gmi
.
|~
x
− ~xi |
i=1
(4.7)
4.1 Wirbelfreie Vektorfelder
75
Ganz entsprechend erhalten wir das Gravitationspotential, das von einer kontinuierlichen Massenverteilung der Dichte ρ(~x) erzeugt wird. Wir denken uns
das mit Masse gefüllte Volumen in N so kleine Teile ∆x∆y∆z zerlegt, dass
innerhalb jedes Teiles ρ(~x) als konstant angesehen werden kann. Dann gilt, mit
mi = ρ(~x)∆x∆y∆z als der i-ten Teilmasse,
ϕ(~x) = −
N
X
Gρ(~xi )∆x∆y∆z
|~x − ~xi |
i=1
und im Grenzfall beliebig feiner Zerlegung
Z
Gρ(~x0 )
.
ϕ(~x) = − d3 ~x0
|~x − ~x0 |
Wir können auch die Feldstärken ~g (~x) superponieren und das Integral
Z
Gρ(~x0 ) ~x − ~x0
~g (~x) = d3 ~x0
|~x − ~x0 |2 |~x − ~x0 |
(4.8)
(4.9)
(4.10)
für eine gegebene Massenverteilung ausrechnen. Meist ist es jedoch erheblich
bequemer, die Feldstärke durch Differenziation aus dem Potential zu gewinnen
~g = −∇ϕ, da sich skalare Volumenintegrale leichter als vektorielle gewinnen
lassen.
~ x), das die
Als ein zweites Beispiel kennen wir das elektrostatische Feld E(~
Kraft auf ein am Ort ~x befindliches Teilchen der Ladung q gibt gemäß
~ x) .
F~ (~x) = q E(~
(4.11)
Elektrische Felder werden durch ruhende Ladungen erzeugt. Das von einer
Punktladung Q erzeugte Feld ist∗)
¶
µ
Q ~x
1
~
.
(4.12)
E(~x) =
4π²0
r2 r
Abbildung 4.3
Das zugehörige elektrostatische Potential ist das Coulombpotential
¶
µ
Q
1
ϕ(x) =
.
4π²0
r
(4.13)
Das elektrostatische Feld vieler Ladungen erhalten wir wieder durch Superposition. Insbesondere lautet das von einer kontinuierlichen Ladungsverteilung der
Ladungsdichte ρ(~x) erzeugte elektrostatische Potential
∗) ²
0
= 8, 854 . . . × 10−12 Coulomb/Volt · Meter ist die elektrische Feldkonstante.
76
4 Statische wirbelfreie Felder
ϕ(~x) =
µ
1
4π²0
¶Z
d3 ~x0
ρ(~x0 )
.
|~x − ~x0 |
(4.14)
Beachten Sie die Vorzeichenkonvention. Die potenzielle Energie der Ladung
q im Feld der Ladung Q (und umgekehrt) lautet
¶
µ
qQ
1
.
(4.15)
U (~x)
4π²0
r
Sie ist anziehend (U < 0, Topf), wenn q und Q verschiedene Vorzeichen haben
und abstoßend (U > 0, Wall) für Ladungen gleichen Vorzeichens.
4.2
Quellen wirbelfreier Felder
Gravitationsfelder werden von massiven Teilchen erzeugt, elektrostatische
Felder durch geladene Teilchen. Man sagt, Massen und Ladungen sind die
Quellen der respektiven Felder. Präzisieren wir diese Redeweise!
~ ein ebenes Flächenelement am Ort ~x, dem Betrag nach so klein,
Sei ∆S
~ (~x) als überall auf dem Flächenstück konstant angesehen
dass das Vektorfeld V
~ gibt die Normale zum Flächenstück
werden kann. Die Richtung des Vektors ∆S
~ durch ∆S
~ bezeichnen wir das Skalarprodukt
an. Als Fluss ∆Φ von V
~ (~x) · ∆S
~ .
∆Φ(~x) = V
(4.16)
~ durch S ergibt
Sei S eine beliebige gekrümmte Fläche. Der Fluss von V
~ zerlegt wird, dass
sich, wenn S in so viele kleine gerichtete Flächenstücke ∆S
~ (~x) in jedem als konstant angesehen werden kann, durch
jedes als eben und V
Summieren der Teilflüsse durch die Flächenstücke zu
X
~ (x~i ) · ∆S
~i .
φ=
V
(4.17)
i
Im Grenzfall beliebig verfeinerter Zerlegung wird der Fluss Φ durch die Fläche
S durch das Integral
ZZ
~ ·V
~ (~x)
φ=
dS
(4.18)
S
gegeben.
Soll der Fluss durch eine geschlossene Fläche berechnet werden, so wird der
Normalenvektor stets als nach außen gerichtet definiert. Wenn der Fluss Φ von
~ durch eine geschlossene Fläche S von Null verschieden ist, so umschließt S
V
~ . (Manchmal spricht man von Quellen bei Φ > 0 und von Senken
Quellen von V
bei Φ < 0.)
Betrachten wir den Fluss des von einer Ladung Q erzeugten elektrischen
~ durch die Oberfläche einer Kugel am Ort der Ladung als Mittelpunkt.
Feldes E
~ (s. Abbildung 4.4) ist genau wie E
~ radial vom
Das Oberflächenelement ∆S
Ursprung weg gerichtet und lautet in Kugelkoordinaten
~=
∆S
~x
rdΘr sin Θdϕ .
r
(4.19)
4.2 Quellen wirbelfreier Felder
77
Abbildung 4.4
Der gesuchte Fluss,
Φ=r
2
Zπ
dΘ sin Θ
0
Z
2π
0
dϕ ·
µ
1
4π²0
¶
Q
r2
µ ¶2
~x
= Q/²0 ,
r
(4.20)
ist bis auf den Faktor 1/²0 gleich der umschlossenen Ladung Q.
Dieses Resultat ist unabhängig davon, welche Form die geschlossene Fläche
S hat, solange nur die Ladung umschlossen wird. Denn jede solche Fläche
~ zerlegt werden, deren jedes
kann in gerichtete, praktisch ebene Teilstücke ∆S
vom Ort der Ladung aus gesehen gerade über (oder unter) dem rechteckigen
Teilstück der Einheitskugel liegt, welches zwischen ϕ und ϕ + dϕ bzw. Θ und
Θ + dΘ aufgespannt ist und die Fläche sin ΘdϕdΘ hat. Ein solches Teilstück
hat, wenn es sich im Abstand r von der Ladung befindet, einen Flächenvektor
~ · ~x/r) in radialer Richtung. Also gilt
mit Komponente r 2 sin ΘdϕdΘ = (∆S
Φ
=
I
=
Q/4π²0
~ ·E
~ =
dS
Zπ
0
I
~ · ~x/r)Q/r 2 4π²0
(dS
sin ΘdΘ
Z2π
dϕ = Q/²0 .
0
Beim eben gegebenen Argument war stillschweigend angenommen, dass jeder von Q ausgehender Radialstrahl die Oberfläche S nur einmal schneidet.
Diese Annahme ist aber auch unnötig. Jedenfalls liegt eine ungerade Zahl solcher Überschneidungen vor, wie Abbildung 4.5) zeigt.
Betrachten wir die Flächenstücke, die von Q aus gesehen über einem Rechteck
mit Fläche sin ΘdΘdϕ auf der Einheitskugel erscheinen, so sind die respektiven
Beiträge zum Oberflächenintegral alle betragsmäßig gleich,
78
4 Statische wirbelfreie Felder
Abbildung 4.5
¯
¯ ¯
¯
¯ ¯Q 2
¯ Q ~xi
~¯ ¯
¯
ΘdΘdϕ
¯ r2 ri ∆Si ¯ = ¯ r2 ri sin
| {z }
¯ i
i
dΩ
¯
¯
¯
¯ = QdΩ ,
¯
¯
(4.21)
alternieren jedoch im Vorzeichen von einem zum nächsten. Bis auf einen heben
sie sich paarweise auf, so dass der gesamte Fluss wieder den Wert Q/²0 hat.
Es ist auch keineswegs nötig, dass Q im Ursprung des Koordinatensystems
sitzt; noch, dass Q eine einzelne Punktladung
P ist; Q kann durchaus die Summe
mehrerer Punktladungen darstellen, Q = i qi , die von S umschlossen werden.
Jedenfalls gilt: Der Fluss des elektrischen Feldes durch eine geschlossene Fläche
S ist gleich dem (1/²0 )-fachen der umschlossenen Ladung. Wenn die Ladung im
von S umschlossenen Volumen kontinuierlich verteilt ist, so gilt
ZZZ
ZZ
~ · E(~
~ x) = Q/²0 = 1
d3 ~xρ(~x) .
(4.22)
Φ = ° dS
²0
S
Wenn die geschlossene Fläche S keine Ladungen umschließt, so ist der Fluss
durch S Null. Außerhalb des von S umschlossenen Gebietes liegende Ladungen
~ durch S nicht bei, wie wir uns nochmals klarmachen
tragen zum Fluss von E
anhand der zur in Abbildung 4.5 analogen Skizze in Abbildung 4.6:
Umgekehrt darf aus dem Verschwinden des Flusses ϕ durch S nicht geschlossen werden, S umschließe keine Quellen des Feldes, also keine Ladungen. Es
könnten nämlich im umschlossenen Gebiet genauso viele negative wie positive
Ladungen sitzen, so dass das Gebiet insgesamt elektrisch neutral ist.
4.3
Lokale Quellen
Der Begriff der Quelle eines Feldes entfaltet seine volle Nützlichkeit erst,
~ durch ihre
wenn wir infinitesimal kleine Raumbereiche und den Fluss von E
Oberfläche betrachten. Nehmen wir speziell ein achsenparalleles Parallelepiped mit den Kantenlängen ∆x, ∆y, ∆z und berechnen den Fluss durch seine
Oberfläche (Abbildung 4.7).
4.3 Lokale Quellen
79
Abbildung 4.6
Abbildung 4.7
Da die Normalvektoren auf den Kantenflächen in Richtung der Koordinatenachsen zeigen, lautet der gesuchte Fluss durch die 6 Kantenflächen
Φ
=
y+∆y
Z
dη
z+∆z
Z
x+∆x
Z
x+∆x
Z
y+∆y
Z
dζ
z
+
¡
¢
dζ − Ex (x, η, ζ) + Ex (x + ∆x, η, ζ)
z
y
+
z+∆z
Z
x
dξ
x
y
¡
¢
dξ − Ey (ξ, y, ζ) + Ey (ξ, y + ∆y, ζ)
¡
¢
dη − Ez (ξ, η, z) + Ez (ξ, η, z + ∆z) .
(4.23)
Durch Taylorentwicklung der Integranden um den Punkt ~x = (x, y, z) sehen
wir, dass Φ für kleine Kantenlängen von der Ordnung ∆x∆y∆z ist. Unter
Vernachlässigung von Korrekturen höherer Ordnung in den Koordinateninkre-
80
4 Statische wirbelfreie Felder
menten haben wir
Φ
=
y+∆y
Z
dη
y
=
z+∆z
Z
dζ
∂Ex (x, η, ζ)
∆x + (zykl. Vert.)
∂x
z
∂Ex (x, y, z)
∆x
∂x
y+∆y
Z
dη
y
=
∆x∆y∆z
½
z+∆z
Z
dζ + (zykl. Vert.)
(4.24)
z
∂Ex
∂Ey
∂Ez
+
+
∂x
∂y
∂z
¾
.
Die hier auftretende Größe
∂Ey
∂Ez
∂Ex
~
+
+
= divE
∂x
∂y
∂z
(4.25)
~
heißt die Quellstärke oder Divergenz von E.
~
~ hat, so ist der Fluss
Wenn die Divergenz von E am Ort ~x den Wert divE
~
von E durch die Oberfläche eines kleinen Parallelepipeds bei ~x gleich
~ = 1 ρ(~x)∆x∆y∆z .
(4.26)
Φ = ∆x∆y∆z div E
²0
Wir sehen, dass die Ladungsdichte ρ(~x) bis auf den Faktor 1/²0 die Quellstärke
~ von E
~ ist,
divE
1
ρ(~x) .
(4.27)
²0
Mit gleicher Begründung finden wir für die Quellstärke div ~g (~x) des Gravitationsfeldes ~g (~x)
~ x) =
divE(~
div ~g (~x) = −4π Gρ(~x) ,
(4.28)
wobei ρ(~x) natürlich die Massendichte bedeutet.
~ durch die Oberfläche eines infiUnser Resultat (3.2) über den Fluss von E
nitesimalen Volumenelements ∆x∆y∆z gestattet sofort eine Aussage über den
~ durch die Oberfläche S eines endlichen Volumens. Letzteres kann
Fluss von E
nämlich in infinitesimale Volumina ∆V zerlegt werden, wobei S durch ebene
Teilstücke ∆S approximiert wird. Der Fluss durch S ist dann gleich der Summe
der Flüsse durch die Oberfläche der Teilvolumina ∆V , denn jede innere Kantenfläche ist Teil der Oberfläche zweier benachbarter Teilvolumina, und die beiden
respektiven, jeweils auf die nach außen gerichtete Flächennormale bezogenen
Flüsse heben sich gegenseitig auf (vgl. Abbildung 4.8).
Es folgt somit der Gaußsche Integralsatz, wenn der Fluss durch die Oberfläche jedes Teilvolumens gemäß (4.24) durch die Quellstärke am Ort des Teilvolumens ausgedrückt wird
ZZZ
ZZ
~ = °E
~ · dS
~ .
d3 x div E
(4.29)
V
S
4.4 Elektrostatisches Potential
81
Abbildung 4.8
Beachten Sie, dass die eben skizzierte Herleitung des Gaußschen Satzes keinen
~ wirbelfrei ist. Der Satz gilt tatsächlich auch für
Gebrauch davon macht, dass E
Felder mit Wirbeln.
4.4
Elektrostatisches Potential
Wirbelfreie Vektorfelder sind durch ihre Quellen und Randbedingungen eindeutig
festgelegt. Um diese Behauptung plausibel zu machen, stelle ich zunächst klar,
dass die Angabe der Quellen eines Feldes gemäß
~ =
divE
1
ρ
²0
(4.30)
~ x) festzulegen: obige Gleichung stellt eine Diffeallein nicht ausreicht, um E(~
rentialgleichung für die drei Unbekannten Ei (~x) dar. Nehmen wir allerdings die
~ hinzu, d. h. stellen das Vektorfeld E
~ als Gradienten eines
Wirbelfreiheit von E
skalaren Feldes dar mit
~ x) = −∇ϕ(~x) .
E(~
(4.31)
so erhalten wir für das Potential ϕ(~x) die Differentialgleichung 2. Ordnung
div grad ϕ(~x) = ∆ϕ(~x) = −
∆=
1
ρ(~x),
²0
(4.32)
∂2
∂2
∂2
+ 2+ 2 ,
2
∂x
∂y
∂z
die als die Poissonsche Differentialgleichung bekannt ist.
Die Poissonsche Gleichung ist bei vorgegebener Ladungsverteilung (bzw.
Massenverteilung) eine inhomogene Differentialgleichung. Ihre allgemeine Lösung
ergibt sich durch Superposition eines Partikularintegrals der inhomogenen Gleichung mit dem allgemeinen Integral der homogenen Gleichung. Durch Randbedingungen wird eine eindeutige Lösung ϕ(~x) fixiert, aus der sich mit (4.32)
~ eindeutig ergibt.
auch das Feld E
Ein Partikularintegral der Poissonschen Gleichung kennen wir schon,
ϕ(~x) =
1
4π²0
Z
V
d3 x 0
ρ(~x 0 )
.
|~x − ~x 0 |
(4.33)
82
4 Statische wirbelfreie Felder
Es erfüllt die Randbedingung ϕ = 0 für |~x| → ∞. Wir hatten dieses Integral konstruiert, bevor wir die Feldgleichung ∆ϕ = −4πρ aufgestellt hatten.
Nachträglich lernen wir zu verifizieren, dass das Integral die Feldgleichung befriedigt.
Wenn speziell eine Punktladung Q bei ~x = 0 vorliegt, also
ρ(~x) = Qδ (3) (~x) = Qδ(x)δ(y)δ(z) ,
(4.34)
so gibt obiges Integral gerade das wohlbekannte Coulombpotential
1 Q
1 Q
=
.
4π²0 |~x|
4π²0 r
Erfüllt letzteres wirklich die Poissongleichung, d. h. gilt wirklich
ϕ(~x) =
(4.35)
1
= − 4πδ (3) (~x) ?
(4.36)
r
Einfaches Nachrechnen
zeigt, dass ∆(1/r) = 0 überall außer für r = 0. Denn
p
für eine nur von r = x2 + y 2 + z 2 abhängige Funktion f (r) gilt
∆
gradf (r) = f 0 (r)
~x
r
(4.37)
und
div grad f (r)
f 0
f 0
f 0
~x = ~x · grad
+
div ~x
r
r
r
µ ¶0
~x f 0
+ 3f 0 /r = f 00 (r) + 2f 0 (r)/r
= ~x ·
r
r
=
div
und somit ∆ 1r = 0 für r 6= 0. Am Ursprung selbst ist ∆ 1r nicht definiert. Um
zu sehen, dass die Singularität am Ursprung von der Art einer Deltafunktion
ist, haben wir wie immer (s. 2.8) eine geeignete nichtsinguläre Darstellung zu
betrachten. Wählen wir etwa
1
1
=√
2
r
r + ²2
mit dem Vorbehalt, ² letztlich nach Null gehen zu lassen. Dann ist
1
3²2
=
−
.
(r2 + ²2 )1/2
(r2 + ²2 )5/2
Dies über den ganzen Raum integriert gibt
∆
Z
1
d x∆ √
r 2 + ²2
3
=
Z∞
2
r dr
−12π
dΘ sin Θ
0
0
=
Zπ
|
Z∞
0
|
dx
{z
4π
Z2π
0
(4.39)
dϕ
(r2
−3²2
+ ²2 )5/2
}
x2
= −4π .
(1 + x2 )5/2
{z
}
1/3
(4.38)
(4.40)
4.5 Geladenes Teilchen vor einem Leiter
83
Da das Integral unabhängig von ² ist, ist (4.39) tatsächlich bis auf den Faktor
− 4π eine Darstellung der Deltafunktion. Damit ist klargestellt, dass das Coulombpotential (4.35) die Lösung der Poissongleichung für den Fall der punktförmigen
Ladungsverteilung (4.34) darstellt. Dann folgt mit
∆
1
= − 4πδ (3) (~x − ~x 0 )
|~x − ~x 0 |
(4.41)
auch die Richtigkeit von (4.33).
Wir hätten auch andersherum argumentieren können und aus der vorher
erwiesenen Gültigkeit des Potentials (4.33) und der Feldgleichung (4.32) folgern
können, dass das Coulombpotential 1/r die Feldgleichung mit ρ(~x) = δ (3) (~x)
löst.
Ich betone, dass die bisher betrachteten Potentiale alle die Randbedingung
ϕ(~x) → 0 für |~x| → ∞ erfüllen.
4.5
Geladenes Teilchen vor einem Leiter
Abweichungen des Potentials von der Form
ϕ(~x) =
1
4π²0
ϕ(~x) → 0
Z
für
d3 x 0
ρ(~x 0
|~x − ~x 0 |
(4.42)
|~x| → ∞
werden wichtig, wenn der Abstand des Beobachtungspunktes |~x| von irgendeinem Teil der Quellverteilung ρ(~x) vergleichbar mit dem (nicht sehr klein gegen
den) Abstand von irgendeinem anderen Körper ist. Solche anderen Körper sind
gegebenenfalls mit zu berücksichtigen entweder, falls sie auch starr vorgegebene Ladungsverteilungen haben, durch Einbeziehung in die Verteilung ρ(~x) oder
durch Randbedingungen für ϕ(~x) an ihrer Oberfläche.
Letzterer Fall liegt z. B. vor, wenn diese anderen Körper elektrische Leiter darstellen. Da Leiter frei bewegliche Ladungen enthalten, muss, wenn ein
zeitunabhängiger Zustand vorliegt, auf ihrer Oberfläche und in ihrem Inneren
ϕ(~x) = const gelten. Andernfalls würde ein nichtverschwindendes elektrisches
Feld E = −∇ϕ herrschen, welches die Ladungen in beschleunigte Bewegung setzen würde. Bei der Bestimmung des elektrischen Feldes außerhalb elektrischer
Leiter ist die Randbedingung ϕ = const für die Leiteroberfläche zu stellen.
Als einfachstes nichttriviales Beispiel betrachten wir eine Ladung Q im Abstand a vor einem unendlich ausgedehnten Leiter mit ebener Oberfläche (Abbildung 4.9).
Auf der Leiteroberfläche (xy-Ebene) ist ϕ = const; ohne Einschränkung der
Allgemeinheit setzen wir
ϕ(0, y, z) = 0 .
(4.43)
Im Halbraum x > 0 ist die Lösung der Poissongleichung darstellbar als
ϕ(~x) =
1
Q
+ ϕhom (~x) ,
4π²0 |~x − ~a|
(4.44)
84
4 Statische wirbelfreie Felder
Abbildung 4.9
wobei ϕhom (~x) eine Lösung der homogenen Gleichung ∆ϕhom = 0 ist. Der
Anteil ϕhom (~x) muss seine Quellen also im Leiter haben.
Wegen der Symmetrie des Problems liegt es nahe, zu raten
ϕhom (~x) = −
1
Q
.
4π²0 |~x + ~a|
(4.45)
Das gesamte Potential
ϕ(~x) =
1
4π²0
µ
Q
Q
−
|~x − ~a| |~x + ~a|
¶
(4.46)
sieht dann so aus, als wäre neben der Ladung Q am Ort ~a eine entgegengesetzt
gleiche Ladung im Innern des Leiters am Ort −~a vorhanden.
Tatsächlich erfüllt (4.45) im rechten Halbraum die homogene Gleichung
∆ϕ = 0 und die Superposition (4.46) somit die Poissongleichung
∆ϕ(~x) = −
1
Qδ (3) (~x − ~a) .
²0
(4.47)
Auch die Randbedingung (4.42) ist offensichtlich erfüllt.
Wir haben hier die Methode der Spiegelladungen“ an einem einfachen Bei”
spiel kennengelernt. Eine Fülle anderer Randwertaufgaben ist ganz ähnlich
lösbar.
4.6
Sphärische Ladungs- bzw. Massenverteilung
Die Sonne ist in recht guter Näherung eine sphärische Massenverteilung. (Tatsächlich liegt ein abgeplattetes Rotationsellipsoid vor, jedoch unterscheiden sich
polarer und äquatorialer Radius zu wenig.) Sphärische Ladungsverteilungen
lassen sich im Labor herstellen.
Einfach zu behandeln und illustrativ ist der Fall einer gleichförmig mit Masse
erfüllten oder elektrisch geladenen Kugel mit Radius a. Im elektrischen Fall
lautet das Potential
4.6 Sphärische Ladungs- bzw. Massenverteilung
ϕ(~x)
=
1
4π²0
Q
4π 3
3 a
Z
=
1
4π²0
Q
4π 3
3 a
Za
85
d3 x 0
|~x − ~x 0 |
0 02
dr r
Zπ
dΘ sin Θ
0
0
Z
2π
1
dϕ √
2
02
r + r − 2rr 0 cos Θ
| 0 {z }
2π
=
1 3Q
4π²0 2a3
Za
dr0 r02
(r + r 0 ) − |r − r 0 |
.
rr0
(4.48)
0
Für Beobachtungspunkte außerhalb der Kugel, d. h. für r > a ergibt sich,
da r > r 0 ,
ϕ(~x) =
1 Q
4π²0 r
für
r>a.
(4.49)
Im Innern der Kugel hingegen
ϕ(~x)
=
=
=

 r
Z
Za


1
3Q
0 0 0
0 0
dr
r
2r
+
dr
r
2r

4π²0 2a3 r 
r
0
½ 2
¾
1
r
3
2
2
Q
+
(a
−
r
)
4π²0
a3
2a3
µ
¶
3
r2
1
Q
− 3
für r ≤ a .
4π²0
2a 2a
(4.50)
Abbildung 4.10 veranschaulicht die Abhängigkeit des Potentials (4.50) vom Abstand r.
Abbildung 4.10
Das zugehörige elektrische Feld lautet
86
4 Statische wirbelfreie Felder
~
E
=
=
−∇ϕ = −ϕ0 (r)



~x
r
Q ~
x
1
4π²0 r 2 r
für r ≥ a
Qr ~
x
1
4π²0 a3 r
für 0 ≤ r ≤ a
.
(4.51)
Außerhalb der Kugel ergibt sich das bekannte Coulombfeld, als wäre die
Gesamtladung Q (bzw. Masse) im Mittelpunkt vereinigt. Unter anderen aus
diesem Grund ist es möglich, Sonne und Planeten als punktförmige Teilchen zu
behandeln. Dabei werden die kleinen Abweichungen der betreffenden Körper
von der Kugelform vernachlässigt. Das Feld innerhalb der Kugel lässt sich
schreiben als
~ =
E
4πr3 /3 1 ~x
1
Q
4π²0
4πa3 /3 r2 r
(4.52)
und kann als Coulombfeld der von der Kugel mit Radius r umschlossenen Ladung interpretiert werden.
4.7
Monopole, Dipole, Multipole
Außerhalb einer beliebigen nichtsphärischen Ladungs- (bzw. Massen-) Wolke“
”
fällt ϕ(~x) nicht genau wie 1/r ab. Betrachten wir die Abweichungen in großer
Entfernung von den Quellen. Zur Auswertung des Potentials (4.14) legen wir
den Ursprung des Koordinatensystems zunächst irgendwohin ins Innere des Gebietes, in dem ρ(~x) 6= 0 ist (s. Abbildung 4.11).
Abbildung 4.11
In großer Entfernung gilt für alle Quellpunkte ~x 0 die Ungleichung |~x0 | ¿ |~x|,
so dass wir entwickeln können
1
1
=
|~x − ~x|
r
"
1
1−
2
µ
r02 − 2~x · ~x
r2
0
¶
3
+
8
µ
r02 − 2~x · ~x0
r2
¶2
± ...
#
.
(4.53)
4.7 Monopole, Dipole, Multipole
87
Im Integranden entstehen dabei Glieder nullter, erster, zweiter und höherer
Ordnung in ~x0 bzw. r 0 . Dieselben geben zum Integral Beiträge entsprechender
Ordnung im “Durchmesser” a (größter Abstand zweier Quellpunkte). Es ergibt
sich die so genannte Multipolentwicklung des Potentials
ϕ(~x) = ϕ(0) (~x) + ϕ(1) (~x) + ϕ(2) (~x) . . . ,
(4.54)
die umso besser durch das niedrigste Glied (oder die paar ersten) repräsentiert
wird, je kleiner das Verhältnis a/r ist.
In nullter Ordnung entsteht der von der inneren Struktur und der äußeren
Gestalt der Ladungswolke unabhängige Coulombterm
ϕ(0) (~x) =
1 Q
,
4π²0 r
(4.55)
wobei
Q=
Z
d3 x0 ρ(~x0 )
(4.56)
die Gesamtladung der Ladungsverteilung darstellt. Im Falle elektrischer Neutralität der Wolke verschwindet Q und die Entwicklung beginnt frühestens mit
dem Glied erster Ordnung, ϕ(1) = 0(a/r 2 ). Beim Gravitationsfeld kann dieser
Fall natürlich nicht eintreten, da es keine Teilchen negativer Masse gibt.
Das gerade besprochene Coulombglied (auch Monopolterm genannt) wird
ausschließlich durch die Gesamtladung Q bestimmt. Bei sphärischen Wolken
gibt es bereits das gesamte Potential. Insofern i. A. weitere Glieder ϕ(1) (~x) etc.
auftreten, können wir sagen, dass diese die Abweichung von der Kugelsymmetrie
beschreiben.
Das Glied erster Ordnung lautet
ϕ1 (~x) =
1 d~ · ~x
,
4π²0 r3
(4.57)
wobei der Vektor
d~ =
Z
d3 ~x0 ~x0 ρ(~x0 )
(4.58)
das Dipolmoment der Wolke bezüglich des Koordinatenursprungs angibt. Beachten Sie, dass das Dipolpotential ϕ(1) (x) schneller mit wachsendem Abstand
abfällt als das Coulombpotential. Im Fall des Gravitationsfeldes und bei elektrostatischen Systemen, die nur Ladungen eines Vorzeichens enthalten, lässt sich
das Dipolmoment immer zum Verschwinden bringen, indem der Ursprung des
Koordinatensystems in den Massen- bzw. Ladungsschwerpunkt gelegt wird.
Wenn wir den Koordinatenursprung um ~x verschieben, so ändert sich die
Gesamtladung Q der Wolke offenbar nicht, wohl aber das Dipolmoment gemäß
X
~ = d~ − QX
~ .
d~ 0 =
Qi (~xi − X)
(4.59)
i
Also nicht nur im oben erwähnten Fall von Ladungen gleichen Vorzeichens,
sondern für alle Wolken mit endlicher Gesamtladung lässt sich das elektrische
Dipolmoment zum Verschwinden bringen, indem der Koordinatenursprung in
den Ladungsschwerpunkt gelegt wird. Wir schließen aus (4.59) weiterhin, dass
88
4 Statische wirbelfreie Felder
bei elektrisch neutralen Systemen das Dipolmoment unabhängig von der Wahl
des Koordinatenursprungs ist.
Das Dipolpotential (4.57) lässt sich besonders einfach in Kugelkoordinaten
~ so
(r, Θ, Φ) schreiben. Legen wir die z-Achse in Richtung des Dipolmoments d,
haben wir
ϕ−1 =
1 d cos Θ
.
4π²0
r2
(4.60)
In der Unabhängigkeit dieses Potentials vom Azimutwinkel Φ zeigt sich die
zylindrische Symmetrie des Dipols. Das zugehörige elektrische Feld hat die
Komponenten
Er
=
− ∂ϕ
∂r =
EΘ
=
− 1r
∂ϕ
∂Θ
1
− r sin
Θ
2d cos Θ
1
4π²0
r3
=
2d cos Θ
1
4π²0
r3
∂ϕ
∂Φ
Änderung des Potentials bei Variation
von r mit Φ, Θ = const
=
Änderung des Potentials bei Variation
von rΘ mit r, Φ = const
Änderung des Potentials bei Variation
von r sin Θϕ mit r, Θ = const
(4.61)
Hier zeigt sich die erwähnte Zylindersymmetrie im Verschwinden der Azimutalkomponente Eϕ . In der Abbildung 4.12 sind einige Linien konstanten Dipolpotentials in der y − z-Ebene aufgezeichnet.
EΦ
=
=0
=
=
Abbildung 4.12
Ähnlich wie eine sphärische Ladungswolke hinsichtlich ihres Feldes außerhalb
ihrer selbst durch eine Punktladung idealisiert werden kann, hat der mathema”
tische Dipol“, den ich gleich konstruieren will, ein Feld, das durch (4.60) bzw.
(4.61) exakt wiedergegeben wird. Denken wir uns zwei entgegengesetzt gleiche
Punktladungen ±Q im Abstand a. Das Dipolmoment dieser Anordnung hat
offenbar den Betrag
4.7 Monopole, Dipole, Multipole
d = Qa .
89
(4.62)
Wegen der elektrischen Neutralität hat das zugehörige Potential keinen 1/rAnteil, wohl aber Anteile ∼ 1/r n mit n = 2, 3, . . . . Der mathematische Dipol,
dessen Potential ausschließlich den 1/r 2 -Term enthält, entsteht im Grenzfall
¾
Q→∞
bei aQ = d = const .
(4.63)
a→0
Das Glied ϕ(2) (~x) der Multipolentwicklung heißt Quadrupolpotential und lautet
Z
3(~x · ~x 0 )2 − r2 r02
1
d3 x0 ρ(~x 0 )
.
(4.64)
ϕ(2) (~x) =
4π²0
2r5
Es fällt für große r wie 1/r 3 ab. Offenbar lässt es sich schreiben als
ϕ(2) (~x) =
wobei die Koeffizienten
Qij
=
Qij
=
3
1 1 X
xi xj
Qij
,
4π²0 2 i,j=1
r5

Qxx
Qxy
Qxz
 Qyx
Qyy
Qyz  = Qji
Qzx
Qzy
Qzz
Z
d3 x0 (3x0i x0j − δij r02 )ρ(~x)

(4.65)
(4.66)
den symmetrischen Tensor des Quadrupolmoments bilden.
Für wichtige Spezialfälle nehmen das Quadrupolmoment Qij und das Quadrupolpotential (4.64) einfache Form an. Wir betrachten insbesondere den Fall
von Ladungsverteilungen mit Rotationssymmetrie. Die Symmetrieachse kann
als z-Achse gewählt werden. Dann verschwinden alle in (4.64) vorkommenden
Integrale, die einen in x0 oder y 0 linearen Integranden haben, z. B.
Z
Z
3 0
0
0 0
d x ρ(~x ) x z = d3 x0 ρ(~x0 ) x0 y 0 = 0 .
(4.67)
Ebenfalls wegen der Rotationssymmetrie gilt
Z
Z
3 0
0
02
d x ρ(~x ) x = d3 x0 ρ(~x0 ) y 02 .
(4.68)
Es folgt, dass (4.64) sich schreiben lässt als
ϕ(2) (~x) =
1 2z 2 − x2 − y 2 (2)
Q
4π²0
4r5
mit dem Quadrupolmoment“
”
Z
Q(2) = d3 x0 ρ(~x0 ) (2z 02 − x02 − y 02 ) .
(4.69)
(4.70)
Besonders schön sieht das Potential (4.69) für einen rotationssymmetrischen
Quadrupol in Polarkoordinaten aus, nämlich
90
4 Statische wirbelfreie Felder
1 Q(2)
(3 cos2 Θ − 1) .
(4.71)
4π²0 4r3
Wir können leicht eine Ladungsverteilung angeben, die sowohl elektrisch neutral ist als auch kein Dipolmoment aufweist, deren Multipolentwicklung also mit
dem Quadrupolglied (4.69) beginnt. Wir haben einfach zwei einander entgegengerichtete Dipole d~ und −d~ im Abstand a kollinear zu legen (s. Abbildung 4.13).
ϕ2 (~x) =
}
Abbildung 4.13
Jeden dieser Dipole denken wir uns punktförmig gemäß
~ = lim bQ .
|d|
(4.72)
b→0
Q→∞
Die zugehörige Ladungsverteilung lautet
ρ(~x) = Qδ(x) δ(y) [δ(z) − δ(z − b) − δ(z − b − a) + δ(z − 2b − a)] .
Ihr sehen wir sofort an, dass die Gesamtladung und das Dipolmoment bezüglich
des Koordinatenursprungs verschwinden. Wegen der Rotationssymmetrie ist
das Quadrupolmoment durch den einen Parameter
Q(2)
Z
dx
Z
dy
Z
=
2
=
4(b2 + ab)Q .
dz z 2 ρ(~x)
(4.73)
festgelegt. Im Grenzübergang (4.72) entsteht
Q(2) = 4ad .
(4.74)
In diesem Grenzfall beginnt die Entwicklung des Potentials mit dem Quadrupolterm (4.71). Um ein reines Quadrupolfeld zu haben, idealisieren wir weiter
gemäß a → 0 und d → ∞ bei ad = const.
4.8
Die Form der Erde
Von lokalen Erhebungen wie dem Kahlen Asten oder dem Mt. Everest und
Absenkungen wie der oberrheinischen Tiefebene und Death Valley abgesehen
4.8 Die Form der Erde
91
hat die Erde die Form eines an den Polen abgeplatteten Rotationsellipsoids.
Der polare Radius c ist um etwa 21,5 km kleiner als der äquatoriale Radius a,
die relative Abplattung also
1
a−c
=
.
(4.75)
a
300
Infolge der Abplattung ist das Gravitationspotential der Erde nicht exakt gleich
dem Keplerpotential. Bezüglich des Erdschwerpunktes verschwindet das Dipolmoment. Also ist der wichtigste Korrekturterm der Quadrupolterm. Nehmen wir die Nord-Süd-Achse als z-Achse, so lautet das Gravitationspotential in
großer Entfernung von der Erde
²=
GQ(2)
GM
−
(3 cos2 Θ − 1) .
(4.76)
r
4r3
Für das Quadrupolmoment Q(2) der Erde finden wir leicht eine Abschätzung,
wenn wir annehmen, dass die Masse M homogen über das Rotationsellipsoid
verteilt ist (tatsächlich nimmt die Dichte zum Mittelpunkt hin zu). Die Dichte
ρ lässt sich dann durch die Masse M und das Volumen 4πa2 c/3 des Rotationsellipsoids ausdrücken,
ϕ(~x) = −
ρ=
M
.
4πa2 c/3
Zur Berechnung des Integrals (4.69),
Z
Q(2) = ρ d3 x(2z 2 − x2 − y 2 ) ,
(4.77)
(4.78)
über das Erdvolumen mit der Oberfläche
x2
y2
z2
+ 2 + 2 =1
2
a
a
c
dehnen wir die Integrationsvariablen gemäß
x = ξa ,
y = ηa ,
z = cζ ,
woraufhin das Quadrupolmoment (4.78) die Form
Z
Z
Z
3M
dξ dη dζ (2c2 ζ 2 − a2 ξ 2 − a2 η 2 )
dQ(2) =
4π
annimmt und die Erdoberfläche durch die Gleichung
ξ2 + η2 + ζ 2 = 1
(4.79)
(4.80)
(4.81)
(4.82)
beschrieben wird. Bezüglich der Koordinaten ξ, η, ζ sieht die Erdoberfläche also
wie eine Einheitskugel aus. Aus Symmetriegründen sind die Raumintegrale
von ζ 2 , η 2 , ξ 2 über das Volumen der Einheitskugel gleich, so dass sich (4.81)
vereinfacht zu
Z
3M 2
(c − a2 ) dξdηdζ ζ 2 .
Q(2) =
2π
Das verbleibende
Integral rechnen wir am bequemsten in Kugelkoordinaten aus
R
und finden d3 xx2 = 4π/15, also
92
4 Statische wirbelfreie Felder
2
4
M (a2 − c2 ) ≈ − M a2 ² .
(4.83)
5
5
Tatsächlich muss das Quadrupolmoment kleiner sein, da die Dichte der Erde
nach innen zunimmt und somit Volumenelemente mit größerem Abstand vom
Mittelpunkt weniger als in (4.83) beitragen.
Die Erde ist abgeplattet, weil sie rotiert. In Äquatornähe wirkt auf Volumenelemente des Erdmantels eine größere Zentrifugalkraft als in Polnähe. Über
erdgeschichtlich lange Zeiträume musste und muss die Erdoberfläche sich so einstellen, dass Volumenelemente des Erdmantels in guter Näherung kräftefrei sind
bezüglich Gravitationskraft, Zentrifugalkraft und Druckkraft seitens benachbarter Volumenelemente. Ein solcher Zustand wird durch plastische Formänderungen
erreicht. Tun wir so, als wäre die Erde aus einer extrem viskosen Flüssigkeit
gebildet ∗) . Im beschriebenen Gleichgewichtszustand muss die Erdoberfläche
eine Äquipotentialfläche darstellen. Ansonsten würde sich die Gestalt der Erde
dadurch ändern, dass die Flüssigkeit zu Gebieten niedrigeren Potentials fließt.
Vernachlässigen wir die Ortsabhängigkeit der Druckkraft, d. h. der elastischen Energie von Volumenelementen nahe der Erdoberfläche, so setzt sich das
Potential zusammen aus dem Gravitationspotential (4.76) und dem Potential
der Zentrifugalkraft
Q(2) =
ϕzentr (~x)
=
=
1 2 2
ω (x + y 2 )
2
1
− ω 2 r2 sin2 Θ .
2
−
(4.84)
(Dieses Potential gibt gerade die Zentrifugalkraft auf ein Volumenelement bei
~x mit Masse m, F~zentr = −∇ϕm = (mω 2 x, mω 2 y, 0) = − m~
ω × (~
ω × ~x).)
Insgesamt lautet das Potential also
GM
GM a2 ²
1 2 2 2
ω r sin Θ −
+
(3 cos2 Θ − 1) .
(4.85)
2
r
5r3
Setzen wir das Potential am Nordpol Θ = 0 gleich dem Potential am Äquator
Θ = π/2, so finden wir eine Bestimmungsgleichung für die relative Abplattung
²,
ϕ=−
GM
2GM a2 ²
1
GM
GM a2 ²
+
= − ω 2 a2 −
−
.
3
c
5c
2
a
5a2
Beachten wir, dass ² ¿ 1 und daher
−
(4.86)
1
1 a
1
1
=
= (1 − ²)−1 ≈ (1 + ²) .
(4.87)
c
a c
a
a
Wenn wir schließlich auch in (4.86) Glieder der Ordnung ²2 vernachlässigen, so
finden wir die lineare Gleichung
−
∗) Für
GM
GM
2GM
1
GM
GM a
−
²+
² = − ω 2 a2 −
−
².
a
a
5a
2
a
5a
(4.88)
die Frühgeschichte des Planeten vor der Erstarrung der Erdkruste ist die Annahme
sicherlich vernünftig. Bis auf die Effekte der Erosion und der Plattentektonik sollte sich die
Form der Erde seither nicht verändert haben.
4.9 Die Energie eines Haufens von Ladungen
93
Die Lösung,
²=
1
5 ω 2 a3
≈
,
4 GM
230
stimmt bis auf 30% mit der beobachteten Abplattung überein.
4.9
Die Energie eines Haufens von Ladungen
Die Energie eines Haufens von Ladungen wird berechnet, indem wir die den
Haufen aufbauenden Teilladungen qi alle nacheinander aus dem Unendlichen
(wo die wechselseitige potenzielle Energie verschwindet) in ihre Positionen ~x i
im Haufen gebracht denken.
Die erste Teilladung qi nach ~x1 zu bringen, kostet keine Energie, da alle
anderen Ladungen noch im Unendlichen (d. h. nirgends) sitzen. Die zweite, q 2 ,
nach ~x2 zu bringen, kostet, da q2 im durch q1 erzeugten Feld eine Kraft erfährt,
Energie, u. z.
q2 ϕ1 (~x2 ) =
1
q1 q2
.
4π²0 |~x1 − ~x2 |
(4.89)
Beim Heranholen von q3 nach ~x3 ins von q1 und q2 erzeugte Feld vergrößert sich
die Energie um
(
)
1
q3 q2
q3 q1
q3 ϕ1 (~x3 ) + q3 ϕ2 (~x3 ) =
+
.
(4.90)
4π²0 |~x3 − ~x1 | |~x3 − ~x2 |
Wird schließlich die n-te und letzte Teilladung in ihre Position ~xn geholt, so
erhöht sich die gesamte Wechselwirkungsenergie um die Energie der n-ten Teilladung im Feld der n − 1 anderen, also um
qn
X
ϕi (~xn ) =
i<n
X
qi
1
qn
|.
4π²0
|~
x
− ~xi
n
i<n
(4.91)
Die gesamte Wechselwirkungsenergie, die Summe aller aufgelisteten Beiträge,
lautet
W+
n
1 X X qj qi
1 1X
qi qj
=
.
4π²0 j=1 i<j |~xj − ~xi |
4π²0 2
|~xi − ~xj |
(4.92)
i6=j
Beachten Sie, dass per Konstruktion die Wechselwirkungsenergie keine dia”
gonalen“ Glieder mit i = j enthält. Eine Definition von W , die solche Glieder
mit einschlösse, wäre höchst unglücklich, denn die Energie einer Punktladung im
eigenen Feld, die Selbstenergie“ einer Punktladung, divergiert und hat keinen
”
Sinn.
Für den Fall einer kontinuierlichen Ladungsverteilung verwenden wir die diskrete Formel (4.92), in der wir qi mit ρ(~x)d3 x und qj mit ρ(~x0 )d3 x0 identifizieren
und integrieren
1 1
W =
4π²0 2
Z
3
d x
Z
d3 x 0
ρ(~x)ρ(~x0 )
.
|~x − ~x0 |
(4.93)
94
4 Statische wirbelfreie Felder
Allerdings unterscheidet sich (4.92) von (4.93) insofern wesentlich, als in (4.93)
Beiträge von ~x = ~x0 nicht ausgeschlossen sind, so dass (4.93) auch Selbstenergiebeiträge enthält. Dennoch ist W gemäß (4.93) für kontinuierliche Ladungsverteilung ρ(~x) wohl definiert. Divergente Selbstenergien treten nur bei diskreten
Punktladungen auf. (Woran sich zeigt, dass der Begriff der Punktladung, da
in manchen Zusammenhängen zu Unsinn führend, eine mit Vorsicht zu behandelnde Idealisierung ist.)
Berechnen wir, um ein Beispiel vor Augen zu haben, die Energie eines homogenen kugelförmigen Ladungshaufens, in dessen Innerem die Ladungsdichte
Q
Q
=
V
R3
p(~x) =
(4.94)
4π
3
vorliegt. Aus (4.93) finden wir
µ
1 1
W =
4π²0 2
Q
V
¶2 Z
3
d x
Z
d3 x 0
1
.
|~x − ~x0 |
(4.95)
Führen wir zuerst die Integration über ~x0 aus und stellen ~x0 in Kugelkoordinaten
dar. Dabei können wir die vorläufig feste Richtung von ~x als die z 0 -Richtung
wählen und erhalten
W
=
µ
1 1
4π²0 2
sin Θ
0
Z2π
Q
V
¶2 Z
dΦ0 √
0
| {z }
r2
ZR
3
d x
0 02
dr r
+
dΘ0
0
0
r02
Zπ
1
− 2rr 0 cos Θ0
2π
=
=
1
π
4π²0
1
2π
4π²0
µ
Q
V
µ
¶2 Z
Q
V
¶2 Z
d3 x
ZR
dr0 r02
−1
0
3
d x
(
Z+1
dξ p
1
r2
|
1
r
|
Zr
dr r +
1
2
r
2
r0
=
0 02
0
+ r02 − 2rr 0 ξ
{z
}
( 2
{z
R2 − 16
ZR
r
r2
0 0
dr r
)
.
für
r > r0
für
r > r0
(4.96)
}
Nun führen wir das zweite Raumintegral aus und erhalten mit
W =
1 3 Q2
4π²0 5 R
(4.97)
ein Ergebnis, das wir bis auf den numerischen Faktor 3/5 aus einer Dimensionsbetrachtung ohne Rechnung hätten gewinnen können.
4.10 Die Energie eines Ladungshaufens in einem äußeren Feld
95
Die Energie (4.93) eines Ladungshaufens lässt sich auch durch die von den
Ladungen erzeugte Feldstärke ausdrücken. Wir gewinnen einen solchen Ausdruck, indem wir (4.93) in der Form
Z
1
W =
d3 xρ(~x)ϕ(~x)
(4.98)
2
schreiben und die Ladungsdichte mit Hilfe der Poissongleichung −ρ(~x)/² 0 =
+∆ϕ(~x) eliminieren,
Z
²0
W =−
d3 xϕ(~x) div grad ϕ(~x) .
(4.99)
2
Hierin benutzen wir die Identität
div(ϕ grad ϕ) = (grad ϕ) · (grad ϕ) + ϕ div grad ϕ ,
(4.100)
und erhalten
W =
²0
2
Z
d3 x|E(~x)|2 +
²0
2
Z
~ .
d3 x div(ϕE)
(4.101)
Der zweite Term kann mit Hilfe des Gaußschen Integralsatzes in ein Oberflächenintegral über eine im Unendlichen liegende Kugelfläche verwandelt werden und verschwindet, falls der Ladungshaufen endliche Ausdehnung hat. Be~
achten wir nur, dass für große Entfernung |~x| = r vom Ladungshaufen das Feld E
2
mindestens wie 1/r und das Potential ϕ mindestens wie 1/r abfallen, während
das Oberflächenelement auf einer Kugel sich wie |df~| = r 2 sin ΘdΘdΩ verhält.
Demnach lautet der gesuchte Ausdruck für die Energie des Ladungshaufens
Z
²0
~ x)|2 .
d3 x|E(~
(4.102)
W =
2
Das gefundene Resultat legt die Interpretation nahe, dass überall im elektrostatischen Feld Energie mit einer Raumdichte
w(~x) =
²0 ~
|E(~x)|2 .
2
(4.103)
konzentriert ist.
4.10
Die Energie eines Ladungshaufens in einem
äußeren Feld
Die Energie eines Ladungshaufens in einem äußeren Feld lautet, da eine Ladung
q im Potential ϕ(~x) die potenzielle Energie qϕ(~x) hat,
Z
W = d3 xρ(~x) ϕ(~x) .
(4.104)
Wir studieren diese Energie genauer für den Fall, dass das äußere Potential
ϕ(~x) über den Ladungshaufen hinweg nur schwach veränderlich ist. Dann lässt
sich ϕ(~x) in eine Taylorreihe um einen im Ladungshaufen gelegenen Nullpunkt
herum entwickeln
96
4 Statische wirbelfreie Felder
ϕ(~x)
=
ϕ(0) +
3
X
i=1
=
xi
3
∂ϕ(0) 1 X
∂ 2 ϕ(0)
+
xi xj
+ ...
∂xi
2 i,j=1
∂xi ∂xj
3
∂Ej (0)
1 X
~
xi xj
+ ...
ϕ(0) − ~x · E(0) −
2 i,j=1
∂ xi
(4.105)
Im dritten Term dürfen wir, da das äußere Feld innerhalb des Ladungshaufens
P
∂E (0)
~
keine Quellen hat, also ∇· E(0)
= 0 gilt, ungestraft den Term ij 61 r2 δij ∂xj i
abziehen und schreiben
∂Ej (0)
1 X
~
+ ...
(3xi xj − δij r2 )
ϕ(~x) = ϕ(0) − ~x · E(0)
−
6 ij
∂xi
(4.106)
Setzen wir diese Reihe in (4.104) ein, so finden wir die Energie des Ladungshaufens im äußeren Feld ausgedrückt durch die Multipolmomente
1X
∂Ej (0)
~
W = Qϕ(0) − d~ · E(0)
−
.
Qij
6 ij
∂xi
(4.107)
Sehen Sie, dass Parallelstellung eines Dipols zum äußeren Feld energetisch
begünstigt ist gegen alle anderen Orientierungen? Dass das Quadrupolmoment
mit dem Feldgradienten wechselwirkt? Im Labor lernen Sie, diese Eigenschaften
zur Messung von Dipol- und Quadrupolmomenten auszunutzen.
Kapitel 5
Statische Magnetfelder
5.1
~ x)
Das magnetische (Induktions-)Feld B(~
~ x) ist definierbar und messbar durch die
Das magnetische (Induktions-) Feld B(~
Kraft, die eine mit Geschwindigkeit ~v bewegte Ladung q erfährt,
~ + ~v × B)
~ .
F~ = q(E
(5.1)
~ dt .
dq = ρ(~x) ~v (~x) · df
(5.2)
ρ(~x) ~v (~x) = ~j(~x)
(5.3)
~ wir schon beDas ist die wohlbekannte Lorentzkraft, deren Coulombanteil q E
sprochen hatten.
Aus der Experimentalphysik ist Ihnen ebenfalls bekannt, dass stromdurchflossene Leiter im Magnetfeld eine Kraft erfahren. Überzeugen wir uns davon
nochmal mit Hilfe von (5.1). Dazu zunächst eine Vorüberlegung. Betrachten
wir einen Ladungshaufen mit der Ladungsdichte ρ(~x), dessen Ladungselemente
mit der stationären Geschwindigkeit ~v (~x) durch den Raum driften. Dann strömt
~ im Zeitintervall dt die Ladung
durch ein Flächenelement df
Die hier auftretende Größe
heißt elektrische Stromdichte und ist ein Vektorfeld, das wir hier vorläufig als
zeitunabhängig annehmen.
Der elektrische Strom I, der durch eine beliebige Fläche F , z. B. durch den
Querschnitt eines Drahtes fließt, ist einfach der Fluss der Stromdichte ~j durch
F , also
Z
~ · ~j(~x) .
(5.4)
I = df
F
Das ist die elektrische Ladung, die sekündlich durch F strömt.
Zurück zur Lorentzkraft! Da wir uns hier nur für den magnetischen Anteil
~ sei gleich Null. Die Kraft auf eine Ladung qi
interessieren, nehmen wir an, E
~
~
ist Fi = qi~vi × B(~xi ). Haben wir einen Haufen vieler bewegter Punktladungen,
so erhalten wir die Gesamtkraft auf alle Punktladungen als
97
98
5 Statische Magnetfelder
F~ =
X
i
~ xi ) ,
qi~vi × B(~
bzw. für ausgeschmierte Haufen,
Z
Z
3
~
~
~ x) .
F = d xρ(~x)~v (~x) × B(~x) = d3 x~j(~x) × B(~
(5.5)
(5.6)
Schauen wir insbesondere ein Stück eines dünnen stromdurchflossenen Drahtes mit dem Querschnitt df und der Länge dl an. Wir können das Längenelement
~ ernennen, wenn wir als Richtung die des Drahtstücks nehmen
dl zum Vektor dl
(Abbildung 5.1).
Abbildung 5.1
Insgesamt sei der Querschnitt so klein, dass ~j(~x) darin konstant ist. Dann gilt
~ = I dl
~ ,
~j(~x)d3 x = |~j(~x)| df dl
wobei I der durch den Draht fließende Strom ist. Für die Kraft auf das Drahtstück
haben wir
~ × B(~
~ x) .
dF~ (~x) = I dl
(5.7)
Die Gesamtkraft auf ein endliches Drahtstück erhalten wir hieraus durch Superposition der Kräfte auf kleine Teilstücke,
Z
~ × B(~
~ x)I .
F~ = dl
(5.8)
Es gilt in der Natur ein Erhaltungssatz für elektrische Ladungen: Die Gesamtladung eines abgeschlossenen Systems bleibt zeitlich konstant. Ladungen gehen nie verloren und werden nie erzeugt. (Dieser Erhaltungssatz steht
keineswegs im Widerspruch, vielmehr in schöner Übereinstimmung zu Paarerzeugungsprozessen, bei denen ein γ-Quant mit E > 1MeV in ein ElektronPositronpaar zerfällt: Das γ-Quant ist neutral, das Elektron-Positronpaar auch).
Der Ladungserhaltungssatz besagt für unseren Draht, dass der Strom I durch
den Querschnitt unabhängig von ~x ist. Die Ladung, die vorne“ durch die
”
Querschnittsfläche df in ein Drahtstück pro Sekunde hineinfließt, muss, da Stationarität angenommen, pro Sekunde hinten“ wieder herausfließen. Demnach
”
haben wir für die Kraft auf einen dünnen, vom Strom I durchflossenen Draht
den Ihnen bekannten Ausdruck
5.2 Das Magnetfeld eines geraden stromdurchflossenen Drahtes
F~ = I
5.2
Z
~ × B(~
~ x) .
dl
99
(5.9)
Das Magnetfeld eines geraden stromdurchflossenen Drahtes
Das Magnetfeld eines geraden stromdurchflossenen Drahtes ist Ihnen ebenfalls
~ hat keine Komponente parallel zum Draht und auch keine
wohlbekannt. B
radial vom
Abbildung 5.2
~ fällt umgekehrt
Draht weg gerichtete (vgl. Abbildung 5.2)). Der Betrag von B
proportional zum Abstand vom Draht ab und ist proportional zum Strom I.
~
Führen wir Zylinderkoordinaten ~x = (z, r, ϕ) ein, so lautet B
Bz = 0 ,
Br = 0 , Bϕ = Bϕ (r) =
2I
1
.
2
4π²0 c r
(5.10)
~ geschlossene
Gemäß einer anschaulichen Redeweise sind die Feldlinien von B
Kreise in Ebenen senkrecht zum Draht (also Ebenen z = const) mit Mittelpunkt
im Draht.
Das eben in Erinnerung gerufene Feld des geraden stromdurchflossenen Drahtes ist für die Beschreibung des magnetostatischen Feldes ein ähnlich bequemer
~ = (1/4π²0 )q~x/r 3 für die BeschreiAusgangspunkt wie das Coulombgesetz E
bung des elektrostatischen Feldes. Wir werden lernen, (5.10) zu lesen als: Das
statische Magnetfeld hat keine Quellen und hat als Wirbel elektrische Ströme.
5.3
Wirbel
~ x) entlang einer geDie Wirbelstärke alias Zirkulation eines Vektorfeldes B(~
schlossenen Kurve K wird gegeben durch das Linienintegral
100
5 Statische Magnetfelder
I
K
~ =Z .
~ x) · dl
B(~
(5.11)
~ und der
Im allgemeinen ist die Zirkulation Z eine Eigenschaft des Feldes B
Kurve K. Wenn allerdings Z = 0 für beliebige Kurven K, so kann geschlossen
~ x) keine Wirbel hat.
werden, dass das Feld B(~
~ x) des geraden stromdurchflossenen DrahBetrachten wir das Magnetfeld B(~
tes und berechnen Z für einen Kreis in einer Ebene z = const mit Mittelpunkt
~ parallel zu B
~ = rdϕ, wenn r
~ und |dl|
im Draht. Überall längs des Weges ist dl
der Radius von K ist und ϕ der Azimutwinkel. Also folgt
Z2π
Z2π
Z = dϕ rBϕ (r) = dϕ r
0
0
1
1
2I
=
I .
2
4π²0 c r
²0 c2
(5.12)
~ längs des betrachteten Kreises ist also zum Strom I proDie Wirbelstärke von B
portional. Dieses Ergebnis wird erst wirklich interessant durch die Feststellung,
dass es unabhängig vom Weg K ist, vorausgesetzt, K umschlingt den Draht
genau ein Mal.
Um letztere Feststellung als richtig zu erweisen, beobachten wir zunächst,
dass Z unabhängig vom Radius r des Kreises und der Lage der Ebene z = const
ist. Sodann denken wir uns in dieser Ebene den Kreis beliebig deformiert, z. B.
so wie in Abbildung (5.3) gezeigt.
Abbildung 5.3
Die Teilstückzerlegung des Weges denken wir uns so, dass jedes Wegelement
~ vom Durchstoßpunkt des Drahtes durch die Ebene aus gesehen unter dem
dl
gleichen Winkelstück dϕ erscheint. Dann ergeben alle Winkelstücke dϕ den
gleichen Beitrag zu Z, nämlich rdϕ(1/4π²0 c2 )(2l/r). Das gilt auch für solche
~ (nämlich 3, 5, 7, ..., jedenfalls
Winkelstücke, zu denen mehrere Wegstücke dl
ungeradzahlig viele) gehören, denn in solchen Fällen alternieren die Beiträge der
~ im Vorzeichen und heben sich
nach außen aufeinander folgenden Wegstücke dl
bis auf einen paarweise auf. Die Summe aller Beiträge von allen Winkelelementen ist wieder die in (5.12) gegebene Zirkulation.
5.3 Wirbel
101
Schließlich lassen wir noch Deformationen des Weges K in z-Richtung zu.
Solche Deformationen können aber den Wert von Z nicht ändern, da
~ keinen Beitrag zum Skalarprodukt dl
~ ·B
~ ϕ Bϕ
~ = (dl)
z-Komponenten von dl
geben.
~
Mit gleicher Argumentation können wir zeigen, dass die Zirkulation von B
um mehrere stromdurchflossene Drähte, wobei jeder vom geschlossenen Weg K
genau einmal umschlossen wird, gleich der Summe aller Ströme Ii ist. Dabei sind
natürlich die Vorzeichen der Ii als verschieden anzusehen, wenn die respektiven
Drähte in verschiedener Richtung von Strom durchflossen werden
Z
X
~ x) = 1
Z = d~x · B(~
Ii ,
(5.13)
²0 c2 i
K
Die hier rechts stehende Summe aller Ströme, die von der geschlossenen Kurve K umschlungen werden, lässt sich auch schreiben als Fluss des Stromdichtefeldes ~j(~x) durch irgendeine offene, von K berandete Fläche F (vgl. Abbildung
5.4),
Z
X
~ · ~j(~x) .
Ii = df
(5.14)
i
F
Abbildung 5.4
Da der Strom durch einen Draht (durch die Querschnittsfläche des Drahtes)
überall längs des Drahtes gleich ist (Ladungserhaltung und Stationarität), gilt
(5.14) für alle von K berandeten offenen Flächen F .
~ längs der geschlosWir schließen, dass die Zirkulation des Magnetfeldes B
senen Kurve K proportional zu dem Fluss der elektrischen Stromdichte durch
irgendeine von K berandete Fläche F ist,
I
Z
1
~
~ · ~j(~x) .
~
dl · B(~x) =
df
(5.15)
²0 c2
K
F
102
5 Statische Magnetfelder
5.4
Lokale Wirbel
~ längs einer geschlossenen Kurve K gibt erst dann eine
Die Wirbelstärke von B
eindeutige Auskunft über das Magnetfeld, wenn wir die Kurve K zu einem beliebig kleinen Ring schrumpfen lassen. Bleibt K in engster Nachbarschaft eines
Punktes ~x, so wird die Wirbelstärke längs K durch die Stromdichte ~j(~k) am Ort
~x charakterisiert sein. Überlegen wir uns, welche differenziellen Eigenschaften
~ am Ort ~x durch die Stromdichte ~j(~x) festgelegt werden.
des Magnetfeldes B
Betrachten wir einen Weg K längs eines kleinen Rechtecks. Ohne
Beschränkung der Allgemeinheit wählen wir das Koordinatensystem so, dass
das Rechteck in einer Ebene z = const liegt (Abbildung 5.5):
Abbildung 5.5
~ längs K lautet
Die Zirkulation von B
Z
=
x+∆x
Z
dξ [Bx (ξ, y, z) − Bx (ξ, y + ∆y, z)]
x
+
y+∆y
Z
y
dη [By (x + ∆x, η, z) − By (x, η, z)] .
(5.16)
Es seien die Kantenlängen ∆x und ∆y so klein, dass die Taylorreihen
Bx (ξ, y + ∆y, z)
∂Bx (ξ, y, z)
∆y + . . .
∂y
=
Bx (ξ, y, z) +
=
∂By (x, η, z)
By (x, η, z) +
∆x + . . .
∂x
(5.17)
By (x + ∆x, η, z)
nach den Gliedern erster Ordnung abgebrochen werden können. Dann vereinfacht sich Z zu
5.4 Lokale Wirbel
Z = −∆y
x+∆x
Z
∂Bx (ξ, y, z)
dξ
+ ∆x
∂y
x
y+∆y
Z
dη
∂By (x, η, z)
,
∂x
103
(5.18)
y
woraus wir sehen, dass im Grenzfall beliebig kleiner Kantenlängen ∆x, ∆y die
Zirkulation von der Ordnung des Produktes ∆x ∆y ist. Unter Vernachlässigung
von Gliedern höherer Ordnung können wir (5.18) weiter verschönern zu
¶
µ
∂By (~x) ∂Bx (~x)
−
.
(5.19)
Z = ∆x∆y
∂x
∂y
In der Klammer steht, was wir künftig die z-Komponente der lokalen Wir~ nennen werden,
belstärke oder Rotation von B
~ z=
(rotB)
∂By
∂Bx
−
.
∂x
∂y
(5.20)
~ und der
Der gesuchte Zusammenhang zwischen der lokalen Wirbelstärke von B
Stromdichte ~j ergibt sich, indem wir die Proportionalität der Zirkulation (5.19)
mit dem Fluss der elektrischen Stromdichte ~j(~x) durch das Flächenelement beachten. Letzterer Fluss ist, da die Normale des Flächenelements in z-Richtung
weist, ∆x∆y jz (~x). Wir haben also
~ z=
(rotB)
1
jz .
²0 c2
(5.21)
Betrachten wir Flächenstückchen, die in Ebenen y = const bzw. x = const
liegen, so erhalten wir durch simple Wiederholung der zu (5.21) führenden
Überlegung zwei weitere Gleichungen, die sich von (5.21) nur durch die Ersetzung des Vektorindex z durch y bzw. x unterscheiden. Insgesamt haben wir
~ das
als Zusammenhang zwischen der Stromdichte und der Wirbelstärke von B
vektorielle Gesetz
~ =
rotB
1 ~
j.
²0 c2
(5.22)
~ eines
Als Nebenprodukt unserer Überlegungen haben wir die Rotation rot B
~ gewonnen,
Vektorfeldes B
~ x
(rotB)
=
∂By
∂Bz
−
.
∂y
∂z
~ y
(rotB)
=
∂Bx
∂Bz
−
.
∂z
∂x
~ z
(rotB)
=
∂Bx
∂By
−
.
∂x
∂y
Wir werden manchmal die Schreibweise
~ =∇
~ ×B
~
rotB
(5.23)
104
5 Statische Magnetfelder
benutzen, die offenbar sinnvoll ist, denn die vektorielle Multiplikation des Vek”
~ = (∂/∂x, ∂/∂y, ∂/∂z) mit dem Vektor B
~ gibt gerade einen Vektor
tors“ ∇
mit
den in (5.23) angegebenen Komponenten.
Als weiteres Nebenprodukt ernten wir den Stokes’schen Integralsatz der Vek~ längs eines endlichen Weges
toranalysis, wenn wir nochmal die Zirkulation von B
K und den Fluss der elektrischen Stromdichte durch irgendeine von K berandete offene Fläche F betrachten. Denken wir uns die Fläche F zerlegt in kleine
~ längs K ist gleich
Stückchen dFi mit Berandungen Ki . Die Zirkulation von B
der Summe der Zirkulationen längs der Ki , da die Wegintegrale längs der inneren Kanten sich paarweise aufheben (s. Abbildung 5.6).
Abbildung 5.6
Für jede Teilfläche dFi gilt dann
I
Zi =
Ki
~ = dF~i rotB
~ · dl
~
B
und für die Summe, im Grenzfall beliebig feiner Unterteilung,
I
Z
~ =
~ · rotB
~ · dl
~ .
B
df
K
(5.24)
(5.25)
F
~ längs einer geschlossenen Kurve K ist gleich
Die Zirkulation eines Vektorfeldes B
~
dem Fluss der Rotation von B durch irgendeine von K berandete Fläche.
5.5
Magnetische Monopole
Magnetische Monopole sind bisher nie zweifelsfrei beobachtet worden. Obwohl
die Suche weitergeht und ein abschließendes Urteil nicht möglich ist, bleibt
die Erfahrungstatsache, dass magnetische Felder keine Quellen haben, vorläufig
unerschüttert.
Dem magnetostatischen Feld des stromdurchflossenen Drahtes sehen wir die
Quellenfreiheit sofort an: alle Feldlinien sind in sich geschlossene Kreise. Wir
schließen
5.6 Die Feldgleichungen
~ x) = 0 .
divB(~
105
(5.26)
Sollten eines Tages doch Teilchen mit magnetischer Ladung gefunden werden,
so wäre die Theorie des elektromagnetischen Feldes an dieser Stelle abzuändern.
5.6
Die Feldgleichungen
Die Feldgleichungen des magnetostatischen Feldes sind die oben gewonnenen
~
Aussagen über Quellen und Wirbel von B,
~ =0
divB
~ =
rotB
1 ~
j.
²0 c2
(5.27)
(5.28)
Hierin sind die Stationarität der Stromverteilung ~j und des von ihr erzeugten
~ enthalten und ebenso der Erhaltungssatz für die elektrische Ladung.
Feldes B
Nehmen wir, um die Ladungserhaltung zu verifizieren, die Divergenz der in
~ = ∇ · (∇ × B)
~ = 0 folgt die
(5.28) gleichgesetzten Vektoren. Wegen div rotB
Quellenfreiheit der Stromdichte,
div ~j = 0 .
(5.29)
Tatsächlich ist klar, dass ~j am Ort ~x nur dann eine Quelle haben kann, wenn sich
dort die elektrische Ladungsdichte ρ zeitlich ändert, was wir mit der Annahme
der Stationarität hier ausgeschlossen haben.
Bei vorgegebener Stromverteilung ~j(~x) stellen (5.27) und (5.28) inhomogene
Differentialgleichungen für die drei Komponenten Bi (~x) dar, die, zusammen mit
~ eindeutig festlegen. Zur Lösung dieser
geeigneten Randbedingungen, das Feld B
Differentialgleichungen ist es bequem, das Magnetfeld als die Wirbelstärke eines
anderen Vektorfeldes, des so genannten Vektorpotentials, darzustellen,
~ x) = rotA(~
~ x) .
B(~
(5.30)
~ schon eingearbeitet, denn für
Diese Darstellung hat die Quellenfreiheit von B
~
~
beliebiges A gilt div rot A = 0.
~ durch das Vektorpotential A
~ in (5.30) eindeutig
Während das Magnetfeld B
festgelegt ist, gilt nicht das Umgekehrte! Überzeugen wir uns davon, dass wir
~ den Gradienten eines beliebigen skalaren Feldes hinzufügen können, d. h.
von A
~ wählen dürfen
statt A
~ 0=A
~ + gradf (~x) ,
A
(5.31)
~ ändert. Der Grund ist einfach, dass ein Gradientenfeld wirohne dass sich B
belfrei ist,
rot gradf (~x) = 0 .
(5.32)
~ 0 = rotA
~=B
~ .
rotA
(5.33)
Es gilt also
106
5 Statische Magnetfelder
Ähnlich war’s in der Elektrostatik. Dort durften wir zum elektrostatischen
Potential ϕ eine beliebige Konstante hinzufügen, ohne dass sich das elektrische
Feld änderte. Die willkürliche additive Konstante in ϕ hatten wir aus Bequemlichkeit meist so festgelegt, dass
ϕ(~x → ∞) = 0
~ indem wir die Eichbedingung (CouHier benützen wir den Spielraum in A,
lombeichung)
~=0
divA
(5.34)
fordern. Die Bequemlichkeit dieser Wahl wird weiter unten sichtbar werden. Die
~ 0 (~x) mit Quellen,
Bedingung (5.34) ist immer erfüllbar, denn haben wir ein A
so finden wir mit der Eichtransformation“ (5.31) ein skalares Feld f (~x), dessen
”
~ 0 aufhebt und A
~ =A
~ 0 + grad f quellenfrei macht.
Gradient die Quellen von A
Die Bestimmungsgleichung für f lautet
0 = divA~0 + div gradf .
(5.35)
Wir erkennen in (5.35) sofort die Poissonsche Differentialgleichung wieder, die
wir in der Elektrostatik gelöst haben. Eine Lösung lautet bekanntlich
1
4π
f (~x) =
Z
d3 x 0
~ 0 (~x 0 )
divA
.
|~x − ~x 0 |
(5.36)
~ durch Angabe des Magnetfeldes B
~ und der
Im übrigen ist das Vektorpotential A
Eichbedingung (5.34) immer noch nicht eindeutig bestimmt, denn wir können
noch Randbedingungen stellen.
~ betrachten wir den Fall eines räumlich
Zur Gewöhnung an den Umgang mit A
homogenen magnetischen Feldes
~ x) = (0, 0, Bz )
B(~
(5.37)
mit Bz = B = const. Das Vektorpotential bestimmen wir aus
Bx
=
0
=
By
=
0
=
Bz
=
B
=
∂Az
∂y
∂Bz
∂z
∂Ay
∂x
−
−
−
∂Ay
∂z
∂Az
∂x
∂Ax
∂y
(5.38)
.
Mögliche Lösungen sind u. a.
(0, xB, 0)
(−yB, 0, 0)
¡ 1
¢
− 2 yB, 12 xB, 0 .
Alle genannten Lösungen sind auch quellenfrei. Andere lassen sich leicht finden.
Die hier angegebenen haben die schöne Eigenschaft, dass die Komponenten Ai
lineare Funktionen der Koordinaten xi sind.
Bestimmen wir nun das Vektorpotential aus einer vorgegebenen Stromver~ = rotA
~ und die Wirbel rotB
~ = 1 2 ~j,
teilung. Verwenden wir die Definition B
²0 c
so haben wir
5.6 Die Feldgleichungen
~=
rot rotA
1 ~
j.
²0 c2
107
(5.40)
Die kompakte Schreibweise darf uns nicht darüber hinwegtäuschen, dass (5.40)
drei gekoppelte Differentialgleichungen für die drei Komponenten von A darstellen. Eine erhebliche Vereinfachung dieser Gleichungen wird erreicht, wenn
wir die Eichbedingungen (5.34) und die Vektoridentität
~ = grad divA
~ − ∆A
~
rot rotA
(5.41)
verwenden. Aus (5.40) entstehen dann drei entkoppelte Gleichungen für die
~
Komponenten von A
~=−
∆A
1 ~
j.
²0 c2
(5.42)
Jede der drei Gleichungen (5.42) hat die Form der Poissonschen Differentialgleichung, deren Lösung wir aus der Elektrostatik kennen. Eine Lösung ist
~ x) =
A(~
1
4π²0 c2
Z
d3 x 0
~j(~x 0 )
.
|~x − ~x 0 |
(5.43)
Sie gehorcht der Randbedingung
~ x → ∞) = 0 .
A(~
(5.44)
Wenn andere Randbedingungen zu befriedigen sind, müssen zu (5.43) noch ge~ = 0 addiert werden.
eignete Lösungen der homogenen Gleichung ∆A
Nachdem wir in (5.43) das Vektorpotential einer beliebigen Stromverteilung
bestimmt haben, können wir durch bloßes Differenzieren auch das zugehörige
~ ausrechnen,
Magnetfeld B
~
B
~ x)
B(~
Z
~j(~x 0 )
1
3 0
d
x
= rot
4π²0 c2
|~x − ~x 0 |
Z
1
1
=
d3 x0~j(~x 0 ) × grad~x
4π²0 c2
|~x − ~x 0 |
Z
~x − ~x 0
1
3 0~
0
d
x
j(~
x
)
×
.
=
4π²0 c2
|~x − ~x 0 |3
(5.45)
(5.46)
Dies ist das Biot-Savartsche-Gesetz, von dem wir den Spezialfall eines geraden Leiters schon oben behandelt hatten. Von Interesse ist auch der Fall eines
beliebig gekrümmten Drahtes mit sehr dünnem Querschnitt df , bei dem gilt
~ = I dl
~ .
~j(~x 0 )d3 x0 = |~j(~x 0 )| df dl
(5.47)
Dabei muss wegen div~j = 0 der Strom I längs des Drahtes überall konstant sein
und das Magnetfeld lautet
I
0
1
~ × ~x − ~x
~
dl
.
(5.48)
B(~x) =
4π²0 c2
|~x − ~x 0 |3
108
5 Statische Magnetfelder
wobei das Linienintegral längs des geschlossenen Stromkreises im Draht zu berechnen ist. Warum geschlossen? Wegen Ladungserhaltung und Stationarität
gilt div ~j = 0, also müssen die Stromlinien von ~j und somit der Draht in sich
geschlossen sein.
5.7
Das Fernfeld stationärer Ströme
Das Fernfeld stationärer Ströme erhalten wir aus dem Vektorpotential (5.43)
mit Hilfe der Taylorentwicklung von |~x − ~x 0 |−1 nach Potenzen von ~x 0 /|~x|. Das
Vorgehen ist ganz analog zur Konstruktion der Multipolentwicklung des elektrostatischen Potentials (vgl. Abbildung 5.7).
Abbildung 5.7
Wir erhalten, mit r = |~x|,
~ x) =
A(~
1
1
2
4π²0 c r
Z
µ 2 ¶¸
·
a
~x · ~x 0
+
0
d3 x0~j(~x 0 ) 1 +
.
2
r
r2
(5.49)
Der erste Term verschwindet wegen div ~j = 0 für eine Stromverteilung endlicher Ausdehnung. Wir sehen das unter Verwendung der Identität
X
i
∂
(ji xk ) = jk + xk div ~j = jk .
∂xi
(5.50)
Integration über den ganzen Raum gibt mit Hilfe des Gaußschen Satzes, wenn
~j(~x)r 3 → 0 für |~x| = r → ∞,
Z
d3 x~j(~x) = 0 .
(5.51)
Physikalisch hängt die Abwesenheit eines Gliedes 0-ter Ordnung in a/r in der
~ natürlich damit zusammen, dass die Grundgleichung
Multipolentwicklung für A
~
div B = 0 die Existenz magnetischer Monopole verbietet. Erinnern wir uns, dass
5.7 Das Fernfeld stationärer Ströme
109
das Glied 0-ter Ordnung in (a/r) in der Multipolentwicklung des elektrostatischen Potentials gerade der Coulombterm, d. h. das elektrische Monopolglied
war.
Das erste nicht notwendig verschwindende Glied in der Multipolentwicklung
(5.49) ist das Vektorpotential eines magnetischen Dipols,
Z
1
1
~ (1) (~x) =
A
d3 x0~j(~x 0 )(~x 0 · ~x) .
(5.52)
4π²0 c2 r3
Um es in etwas freundlicherer Form aufzuschreiben, definieren wir das magnetische Dipolmoment der Stromverteilung als
Z
1
d3 x0 ~x 0 × ~j(~x 0 ) .
(5.53)
m
~ =
2
Mit Hilfe von m
~ finden wir nach einfacher Umformung
~
A
(1)
(~x) = −
1
~x
×m
~ .
2
4π²0 c r3
(5.54)
Die zu (5.54) führende Zwischenrechnung benutzt zunächst eine zu (5.50) ähnliche
Identität,
X
i
∂
(ji xk xi ) = xk xi div ~j + jk xl + jl xk = jk xi + jl xk .
∂xi
(5.55)
Durch Integrieren über den ganzen Raum erhalten wir, falls ~j(~x)r 4 → 0 für
|~x| = r → ∞, die Antisymmetrie der ersten Momente der Stromverteilung
Z
Z
d3 x xl jk (~x) = − d3 x xk jl (~x) .
(5.56)
Nach Ausmultiplizieren des Vektorprodukts in (5.54),
A(1)
x)
x (~
=
=
1
1
(ymz − zmy )
4π²0 c2 r3
½ Z
1
1
−
y d3 x0 [x0 jy (~x 0 ) − y 0 jx (~x 0 )]
8π²0 c2 r3
¾
Z
−z d3 x0 [z 0 jx (~x 0 ) − x0 jz (~x 0 )] ,
−
verwenden wir die Antisymmetrie (5.56) und erhalten
A(1)
x (x)
1
1
=−
4π²0 c2 r3
µ Z
¶
Z
3 0 0
0
3 0 0
0
y d x y jx (~x ) + z d x z jx (~x ) .
Dazu
R darf rechts, wieder wegen der Antisymmetrie (5.56) ungestraft
x d3 x0 x0 jx (~x 0 ) zugefügt werden, woraufhin (5.52) entsteht.
Aus (5.54) folgt, dass die Feldlinien des Vektorpotentials, das von einem
magnetischen Dipol erzeugt wird, in Kreisen um die Dipolachse verlaufen (vgl.
110
5 Statische Magnetfelder
Abbildung 5.8
Abbildung 5.8).
~ = rot A
~ zu
Das magnetische Feld erhalten wir aus B
~ =−
B
1
grad
4π²0 c2
µ
m
~ · ~x
r3
¶
.
(5.57)
Die zu (5.57) führende Rechnung ist leicht:
·
´
´¸
∂Az ∂Ay
∂ ³z
1
y
x
∂ ³x
Bx =
−
=
my − 3 mx +
mx − 3 mz
.
−
∂y
∂z
4π²0 c2
∂y r3
r
∂z r3
r
Hier verwenden wir
1
Bx =
4π²0 c2
·
∂
∂x
1
r
=−
x
r3
und schreiben
∂2 1
∂2 1
my
+ mz
− mx
∂x ∂y r
∂x ∂z r
Beachten wir noch ∆
1
∂
Bx =
4π²0 c2 ∂x
=
µ
1
r
µ
∂2
∂2
+
∂y 2
∂z 2
¶
1
r
¸
.
= 0 für r 6= 0, so erhalten wir
∂
∂
∂
mx
+ my
+ mz
∂x
∂y
∂z
¶
1
1
∂
=−
r
4π²0 c2 ∂x
µ
m
~ · ~x
r3
¶
,
und das ist (5.57).
Nun erinnern wir uns an das elektrische Feld eines elektrischen Dipols,
~ = − 1 grad
E
4π²0
Ã
~x · d~
r3
!
(5.58)
und freuen uns darüber, dass die Felder des elektrischen und des magnetischen
Dipols dieselbe Struktur haben.
5.8 Magnetisches Moment und Drehimpuls
5.8
111
Magnetisches Moment und Drehimpuls
Für eine Stromdichte, die von einem Haufen geladener punktförmiger Teilchen
getragen wird, gilt
X
~j(~x) =
qν ~vν δ(~x − ~xν ) .
(5.59)
ν
Dabei nummeriert der Index ν die Teilchen. Das magnetische Moment der
Stromverteilung lautet
Z
X1
1
m
~ =
d3 x~x × ~j(~x) =
qν ~xν × ~vν .
(5.60)
2
2
ν
Tragen die Teilchen die Masse Mν , so hat das ν-te Teilchen den Drehimpuls
~ ν = Mν ~xν × ~vν ,
L
(5.61)
so dass wir das magnetische Moment (5.60) auch durch die Drehimpulse der
Teilchen ausdrücken können,
X qν
~ν .
L
(5.62)
m
~ =
2Mν
ν
Unsere besondere Aufmerksamkeit verdient der Spezialfall, in dem die Teilchen alle identisch (qν = q, Mν = M ) sind, denn dann ist das magnetische
Moment proportional zum Gesamtdrehimpuls
X
~ =
~ν ,
L
L
(5.63)
ν
nämlich
q ~
L.
(5.64)
2M
Dieses Resultat der klassischen Physik wird uns später auch in der Quan~ der so genannte Bahndrehimpuls ist.
tenmechanik wieder begegnen, wobei L
Für das den Elektronenspin begleitende magnetische Moment gilt, wie Ihnen
schon aus der Elementarphysik bekannt ist, der Zusammenhang (5.64) nicht.
~ als der Drehimpuls des Spins genommen wird,
Vielmehr tritt rechts, wenn L
der Faktor
m
~ =
g = 2, 00232
(5.65)
hinzu. Wir kommen hierauf in 16. zurück.
5.9
~ x)
Kraft und Drehmoment eines Feldes B(~
auf einen magnetischen Dipol
~ x) erfährt,
Die Kraft, die eine Stromverteilung ~j(~x) im eingeprägten Feld B(~
kennen wir schon als
Z
~
~ x) .
F = d3 x~j(~x) × B(~
(5.66)
112
5 Statische Magnetfelder
~ sich über die Stromverteilung hinweg nur wenig ändert,
Wenn das äußere Feld B
lässt sich die Kraft (5.66) durch das magnetische Moment der Verteilung ausdrücken als
~ ,
F~ = grad(m
~ · B)
(5.67)
~ am Ort des magnetischen Moments bzw. am Schwerpunkt der Stromwobei B
verteilung zu denken ist. Die Kraft F~ verschwindet nur dann nicht, wenn das
magnetische Feld räumlich inhomogen ist und insbesondere am Ort des Moments nichtverschwindende erste Ableitungen hat. Die Kraft wirkt in diejenige
~ parallel zu m
Richtung, in der die Komponente von B
~ am stärksten wächst.
Die von allgemeinem Ausdruck (5.66) für die Lorentzkraft zu (5.67) führende
Rechnung geht aus von der Taylorreihe für die Komponenten Bi des Magnetfeldes um den Mittelpunkt der Stromverteilung, der auch als Ursprung des Koordinatensystems gewählt wird.
Bi (~x) = Bi (0) +
X ∂Bi (0)
xj + . . . .
∂xj
j
(5.68)
Das Glied 0-ter Ordnung in (5.68) gibt keinen Beitrag zur Kraft in (5.66), da
das Raumintegral über ~j(~x) verschwindet, s. (5.51). Das Glied erster Ordnung
liefert
¸
Z
Z
3 ·
X
∂Bz (0)
∂By (0)
3
3
Fx =
d xxi jy (~x) −
d xxi jz (~x) .
∂xi
∂xi
i=1
Unter Benutzung der Antisymmetrie (5.56) der ersten Momente der Stromverteilung können wir dies umschreiben in die Form
∂Bz
Fx =
∂x
Z
∂By
d xxjy +
∂x
3
Z
3
d xzjx −
µ
∂Bz
∂By
+
∂z
∂y
¶Z
d3 xyjz .
Die hier vorkommenden Momente der Stromverteilung sind gerade die Komponenten des magnetischen Dipolmoments, z. B.
Z
Z
1
mx =
d3 x(yjz − zjy ) = d3 x y jz .
2
Beachten wir
´ die Quellenfreiheit des Magnetfeldes,
³ schließlich
∂By
∂Bx
∂Bz
=
−
+
∂x
∂y
∂z , so entsteht genau das Resultat (5.67).
~ auf den Dipol das
Ganz analog lässt sich zeigen, dass das äußere Feld B
Drehmoment
~ =m
~
M
~ ×B
ausübt.
äußeren
stellung
anderen
(5.69)
Dieses Moment verschwindet bei Parallelstellung des Moments zum
Feld. Sie kennen die zu (5.69) äquivalente Aussage, dass die Paralleldes Moments zum äußeren Feld energetisch begünstigt ist gegenüber
Orientierungen (s. a. 4.107).
Kapitel 6
Das elektromagnetische
Feld
6.1
Faradays Induktionsexperiment
Beim Spielen mit Stromkreisen und Magneten überzeugt man sich leicht von
der Richtigkeit der folgenden von Faraday gewonnenen Feststellung. In einem
Stromkreis wird ein zeitlich vorübergehender Strom induziert, wenn
a) in einem benachbarten Stromkreis ein Strom ein- oder ausgeschaltet wird,
b) ein benachbarter Kreis, in dem ein konstanter Strom aufrechterhalten
wird, relativ zum ersten Kreis bewegt wird,
c) in der Nähe des Kreises ein Permanentmagnet bewegt wird.
Faraday interpretierte diese seine Beobachtung mit Hilfe der Flussregel, die
oft auch
R Faradays Induktionsgesetz genannt wird. Wenn sich der magnetische
~ ·B
~ durch eine vom Stromkreis aufgespannte Fläche F zeitlich ändert,
Fluss F df
~ induziert. Die Flussregel verknüpft
so wird im Stromkreis ein elektrisches Feld E
H
~ des induzierten
~ · dl
den magnetischen Fluss durch F mit dem Linienintegral E
elektrischen Feldes längs des Stromkreises,
Z
I
∂
~ ·B
~
~ .
~
df
(6.1)
dl · E = −
∂t
H
~ E
~ die Zirkulation von E
~ längs des StromWir nennen das Linienintegral dl·
kreises oder Ringspannung oder manchmal elektromotorische Kraft. Letzterer
Name macht besonders sinnfällig, dass als Folge der Induktion im Stromkreis
ein Strom in Gang gesetzt wird.
Sie wissen sicher aus der Experimentalphysik, dass auf der Flussregel (6.1)
die Wirkungsweise von Elektromotoren, Transformatoren, Generatoren, Ampèremeter etc. beruht. Nicht gegenwärtig ist Ihnen vielleicht, dass die Faradaysche
Flussregel eines der merkwürdigsten Gesetze der Physik überhaupt ist. In ihr
kommen nämlich zwei unabhängige Sachverhalte zu gleich lautendem Ausdruck.
Der Fluss des Magnetfeldes durch die vom Stromkreis aufgespannte Fläche kann
auf zwei völlig verschiedene Weisen zeitlich geändert werden:
113
114
6 Das elektromagnetische Feld
~ den Ort oder die Gestalt
1. Einmal, indem man im zeitunabhängigen Feld B
des Kreises variiert. In diesem Fall ist die Flussregel, wie gleich gezeigt
wird, eine Folge der Lorentzkraft auf bewegte Ladungen.
2. Zum anderen, indem man bei räumlich fixiertem und starrem Kreis die
~ zeitlich ändert. In diesem Fall werden wir die
magnetische Feldstärke B
~
Flussregel erkennen als die Aussage, dass bei zeitlicher Änderung von B
Wirbel des elektrischen Feldes entstehen.
Zur Diskussion des Falles (1) betrachten wir einen ebenen Stromkreis, der
aus einem starren U -förmigen Leiterstück und einem Querstück besteht Abbildung (6.1). Letzteres liege senkrecht auf den Schenkeln des U und werde mit
gleichförmiger Geschwindigkeit v auf den Schenkeln des U bewegt. Senkrecht
~ Der magnetizur Ebene dieses Stromkreises liege ein homogenes Magnetfeld B.
sche Fluss durch den Kreis ist BaL(t), seine zeitlich Änderungsrate Bav. Gemäß
H
~ = − vBa
~ · dl
der Flussregel wird also im Kreis die elektromotorische Kraft E
induziert. Dieses Resultate erhalten wir, indem wir die Lorentzkraft auf die
~
Ladungsträger im Kreis betrachten. Die Kraft auf die Einheitsladung ist ~v × B.
Die Ladungen im U sind unbewegt, erfahren also keine Kraft. Die Ladungen
im Querbalken bewegen sich mit diesem also mit der Geschwindigkeit v, und
erfahren daher pro Ladungseinheit die Kraft vB in RichtungRdes Querbalkens.
~ hat den
~ · dl,
Das Linienintegral dieser Kraft, die elektromotorische Kraft E
Betrag vBa,Rwas genau der von der Flussregel angegebene Wert ist. Das Vor~ ergibt sich auch richtig, wenn die Richtung aller beteiligten
~ · dl
zeichen von E
Vektoren in Rechnung gestellt wird. Somit haben wir die Flussregel für den
Fall (1) als Konsequenz der Lorentzkraft auf bewegte Ladungen im Magnetfeld
verstanden.
Abbildung 6.1
~ lautet die FlussIm Fall (2), bei starrem Leiter im zeitlich variablen Feld B,
regel
I
Z
Z
∂
~
~
~ · ∂ B
~
~
~ ,
E · dl = −
df × B = − df
(6.2)
∂t
∂t
F
F
denn bei starrem Kreis kann die Zeitableitung unter das Integral gezogen werden. Mit Hilfe des Stokesschen Satzes der Vektoranalysis können wir die Zir-
6.2 Der Maxwellsche Verschiebungsstrom
115
~ längs des Kreises als Fluss von rot E
~ durch eine beliebige vom
kulation von E
Kreis berandete Fläche schreiben. Dann lautet die Flussregel
Z
Z
~
~ · ∂ B
~ .
~
(6.3)
df · rot E = − df
∂t
r
F
Da die Fläche F beliebig ist, muss auch gelten
~ .
~ =− ∂ B
(6.4)
rot E
∂t
Diese lokale Formulierung der Flussregel, die von Maxwell stammt, nimmt
keinen Bezug mehr auf den Stromkreis. Sie besagt, dass die zeitliche Änderungsrate
~ lokale Wirbel des elektrischen Feldes E
~ erzeugt.
des magnetischen Feldes B
∂ ~
Bei statischen Verhältnissen verschwindet natürlich ∂t
B, und die Maxwell’sche
Gleichung (6.4) reduziert sich auf die Feststellung, dass das elektrostatische Feld
wirbelfrei ist.
6.2
Der Maxwellsche Verschiebungsstrom
Einen wichtigen Beitrag Maxwells zur Theorie der elektromagnetischen Felder,
die lokale Formulierung der Flussregel, haben wir eben kennengelernt. Hier wird
ein zweiter Beitrag besprochen.
Maxwell betrachtete das Grundgesetz der Magnetostatik, welches die Zirku~ längs einer Kurve K mit dem elektrischen Strom durch eine von
lation von B
K berandete Fläche F verknüpft, schrieb es in lokaler Form auf,
~ =
rot B
1 ~
j
²0 c2
(6.5)
und wunderte sich. Aus (6.5) folgt doch zwingend, dass die elektrische Strom~ gilt identisch div rot B
~ = 0. Das
dichte quellenfrei ist, denn bei beliebigem B
aber heißt, dass aus dem durch eine beliebige
Fläche
F
umschlossenen
Volumen
R
H
~ · ~j. In der Tat,
keine Ladung herausfließen kann, wegen d3 x div ~j = df
stationäre Verhältnisse können nur herrschen, wenn durch F pro Zeiteinheit
genauso viel Ladung hinein- wie herausfließt.
In zeitabhängigen Situationen ist die Erfahrungstatsache der Ladungserhaltung allgemeiner zu formulieren. Der Nettostrom durch eine beliebige geschlossene Fläche F muss gleich der zeitlichen Änderungsrate der Ladung im von F
umschlossenen Volumen V sein
Z
I
~ · ~j = − d
d3 xρ .
(6.6)
df
dt
F
V
Mit Hilfe des Gaußschen Satzes der Vektoranalysis kann der Ladungserhaltungssatz (6.6) als
µ
¶
Z
∂
d3 x div~j +
ρ =0
(6.7)
∂t
V
geschrieben werden. Er muss dann auch lokal gelten, da das Volumen V beliebig
ist,
116
6 Das elektromagnetische Feld
∂
div~j +
ρ=0.
∂t
(6.8)
~ = 1 2 ~j verallgemeinerungsbedürftig ist,
Maxwell sah, dass das Gesetz rotB
²0 c
wenn zeitabhängige Ladungs- und Stromverteilungen zu beschreiben sind. Hier
ist die von Maxwell vorgeschlagene Verallgemeinerung, die sich aufs Schönste
bewährt hat,
~ =−
rot B
1 ∂ ~
1 ~
j+ 2
E.
2
²0 c
c ∂t
(6.9)
~ wird die zeitliche Änderungsrate des elekAls Beitrag zur Wirbelstärke von B
trischen Feldes postuliert.
Wir sehen sofort, dass die Maxwellsche Gleichung (6.9) den bekannten statischen Grenzfall enthält. Um zu sehen, dass auch der lokale Ladungserhaltungssatz (6.8) befriedigt ist, nehmen wir die Quellstärke beider Seiten in (6.9),
~ =0=
div rot B
1 ∂
1
~ .
div ~j + 2
div E
²0 c2
c ∂t
(6.10)
Dies ist genau dann der Erhaltungssatz (6.8), wenn wie schon in der Elektrostatik die elektrischen Ladungen als Quellen des elektrischen Feldes auftreten,
~ = ρ/²0 .
div E
(6.11)
Den Maxwellschen Zusatzterm zum Strom in (6.9) bezeichnen wir als den
Maxwellschen Verschiebungsstrom.
6.3
Die Maxwellschen Gleichungen
Die Maxwellschen Gleichungen für beliebig orts- und zeitabhängige Situationen
haben wir inzwischen alle kennengelernt. Fassen wir sie noch einmal zusammen.
Die Quellen des elektrischen Feldes sind Ladungen,
~ = ρ/²0 .
div E
(6.12)
Die Wirbel des elektrischen Feldes sind nach der Flussregel durch die zeitliche
Änderungsrate des Magnetfeldes gegeben,
~ =− ∂ B
~ .
rot E
∂t
Das magnetische Feld hat keine Quellen,
~ =0.
div B
(6.13)
(6.14)
Die Summe aus elektrischem Strom und Verschiebungsstrom gibt die Wirbel
des magnetischen Feldes
~ =
rot B
1 ∂ ~
1 ~
j+ 2
E.
²0 c2
c ∂t
(6.15)
Die Feldgleichungen (6.12 bis 6.15) implizieren die lokale Ladungserhaltung,
6.4 Der Energieerhaltungssatz
117
∂
ρ=0.
(6.16)
div~j +
∂t
Sie implizieren nicht, sondern sind zu ergänzen durch einen Ausdruck für die
Kraft, die eine Punktladung im Feld erfährt, die Lorentzkraft
~ + ~v × B)
~ .
F~ = q(E
(6.17)
Die lokalen Maxwellschen Gleichungen (6.12 bis 6.15) verknüpfen die ersten
~ und B
~ an einem Raum-Zeit-Punkt. Als zu ihnen
Ableitungen der Felder E
äquivalent hatten wir integrale Aussagen über das Verhalten des elektromagnetischen Feldes in endlichen Raumbereichen erkannt, die wir im Folgenden
auch nochmals zusammenstellen. Die Übersetzung zwischen den lokalen und
den integralen Versionen der Maxwellschen Gleichungen erfolgt mit Hilfe des
Gaußschen und des Stokesschen Satzes der Vektoranalysis.
Der Fluss des elektrischen Feldes durch eine geschlossene Fläche ist gleich
dem ²10 -fachen der umschlossenen Ladung Q,
I
~ ·E
~ = Q/²0 .
df
(6.18)
Die Zirkulation des elektrischen Feldes längs einer geschlossenen Kurve K ist
gleich der negativen zeitlichen Änderungsrate des magnetischen Flusses durch
eine beliebige von K berandete Fläche F ,
I
Z
~ ·E
~ ·B
~ =− ∂
~ .
dl
df
(6.19)
∂t
K
F
Der Fluss des magnetischen Feldes durch jede geschlossene Fläche verschwindet,
I
~ ·B
~ =0.
df
(6.20)
Die Zirkulation des magnetischen Feldes längs des Randes einer Fläche setzt
sich aus dem elektrischen Strom und dem Verschiebungsstrom (der zeitlichen
~ durch die Fläche zusammen als
Änderungsrate des Flusses von E)
Z
Z
I
~ · ~j + 1 ∂
~ ·E
~ ·B
~ .
~ = 1
df
df
(6.21)
dl
²0 c2
c2 ∂t
6.4
Der Energieerhaltungssatz
Die Erfahrungstatsache der Ladungserhaltung hatten wir lokal formuliert mit
Hilfe der Begriffe Ladungsdichte und (Ladungs-)Stromdichte,
∂
ρ(~x, t) + div ~j(~x, t) = 0 .
(6.22)
∂t
Auch für die Energie gilt bekanntlich ein Erhaltungssatz. Bei naivem Vorgehen könnte man die Erwartung hegen, dass sich für das elektromagnetische
Feld (wie schon für das elektrostatische Feld in (4.10) eine Energiedichte u(~x, t)
~ x, t), derart, dass ein
definieren lässt und zusätzlich eine Energiestromdichte S(~
Erhaltungssatz gleicher Form wie der obige für die Ladung gilt. Wir überzeugen
118
6 Das elektromagnetische Feld
uns jedoch leicht davon, dass sich der Energieinhalt des elektromagnetischen Feldes innerhalb eines kleinen Volumens d3 x nicht nur dadurch ändern kann, dass
Energie durch die Oberfläche strömt; dass vielmehr das Feld die innerhalb des
betrachteten Volumens vorhandenen Ladungen beschleunigen und somit Energie
an die Materie abgeben kann. Letztere Arbeitsleistung muss selbstverständlich
in die lokale Energiebilanz einbezogen werden.
Die im Volumenelement d3 x pro Zeiteinheit an den Ladungen geleistete Arbeit finden wir mit Hilfe der Lorentzkraft
~ + ~v × B)
~ .
F~ = d3 xρ(E
(6.23)
Im Zeitintervall dt ändern die Ladungen ihren Ort um das Wegstück ~dt~v ,
wobei die Kraft (6.23) die Arbeit
~ = dtd3 x~j · E
~
dtd3 xρ~v · E
(6.24)
verrichtet. Um diesen Betrag würde sich die Feldenergie ud3 x vermindern,
selbst wenn kein Abströmen durch die Oberfläche des betrachteten Volumens
~ stattfände. Vernünftigerweise können wir demnach als lokale
um dtd3 x div S
Energiebilanz ein Gesetz der Form
∂
~ = − ~j · E
~
u + div S
∂t
(6.25)
erwarten.
Tatsächlich beinhalten die Maxwellschen Gleichungen einen Energieerhaltungssatz der Form (6.25), wobei als Energiedichte
1
~ 2 + ² 0 c2 B
~ 2)
(²0 E
2
und als Energiestromdichte das Vektorfeld
u(~x, t) =
~ x, t) = ²0 c2 E
~ × B
~
S(~
(6.26)
(6.27)
fungieren. Die folgende kleine Rechnung dient dazu, die Aussagen (6.25, 6.26,
6.27) zu gewinnen.
Multiplizieren wir beide Seiten der Maxwellschen Gleichung für die Wirbel
des Magnetfeldes,
~ =
rotB
1 ∂ ~
1 ~
j + 2
E,
²0 c2
c ∂t
(6.28)
~ und beide Seiten der Flussregel
skalar mit dem elektrischen Feld E
~ =−
rotE
∂ ~
B
∂t
(6.29)
~ Subtraktion der entstehenden beiden Skalare gibt
skalar mit B.
~ · rotB
~ − B
~ · rotE
~ =
E
1 ~
~ + ∂ 1 (²0 E
~ 2 + ² 0 c2 B
~ 2) .
j · E
2
²0 c
∂t 2
Benutzen wir auf der linken Seite von Gleichung (6.30) die Identität
(6.30)
6.5 Die Wellengleichung für die Potentiale
~ × B)
~ =−E
~ · rotB
~ + B
~ · rotE
~ ,
div(E
119
(6.31)
so entsteht aus (6.30) gerade der Energieerhaltungssatz (6.25) mit der Energiedichte gemäß (6.26) und der Energiestromdichte gemäß (6.27).
~ heißt auch Poynting-Vektor, denn J. H. Poynting
Die Energiestromdichte S
hat 1884 als erster den Energiesatz für elektromagnetische Feldenergie in lokaler
~ ohne Schaden für die
Form aufgeschrieben. Beachten Sie übrigens, dass sich S
~ abändern lässt, da die
Energiebilanz (6.25) um ein beliebiges Wirbelfeld rotV
~ = ² 0 c2 E
~ × P~ und S
~ 0=S
~ + rotV
~ dieselben Quellen haben.
Felder S
6.5
Die Wellengleichung für die Potentiale
Hinter der scheinbaren Kompliziertheit der Maxwellschen Gleichungen verbirgt
sich eine verblüffende Einfachheit aller elektromagnetischen Phänomene. Um
sie zu durchschauen, schlachten wir unsere Erfahrung mit den statischen Spezialfällen aus.
Die Nichtexistenz magnetischer Monopole, divB = 0, haben wir schon früher
~ x, t) gemäß
als durch den Ansatz eines Vektorpotentials A(~
~ = rotA
~
B
(6.32)
zu befriedigen gelernt. Die nächsteinfache unter den Maxwellschen Gleichungen,
da ebenfalls weder Ladungs- noch Stromdichte enthaltend, ist Faradays Fluss∂ ~
~
~
regel,
³ rotE = −
´ ∂t B. Sie lässt mit Hilfe des Ansatzes (6.32) für B schreiben als
∂
~+
~ = 0. Wir wissen schon, dass sich ein wirbelfreies Vektorfeld als
rot E
A
∂t
Gradient eines skalaren Feldes darstellen lässt. Also können wir die Flussregel
erfüllen durch den Ansatz eines skalaren Potentials ϕ(~x, t) gemäß
~ − grad ϕ .
~ =− ∂ A
(6.33)
E
∂t
Mit den Ansätzen (6.32) und (6.33) gehen wir nun in die restlichen Maxwellschen Gleichungen ein. Aus dem Gesetz über die Quellen des elektrischen
~ = ρ/²0 , wird mit Hilfe von (6.33)
Feldes, div E
∂
~ = ρ/²0
div A
(6.34)
∂t
~ =
und aus dem Ampereschen Gesetz über die Wirbel des Magnetfeldes, rotB
1 ~
1 ∂ ~
j
+
E,
wird
² 0 c2
c2 ∂t
−∆ϕ −
1 ~
1 ∂2 ~
1 ∂
j − 2
A − 2
grad ϕ
2
²0 c
c ∂t2
c ∂t
bzw. mit der schon früher bewiesenen Identität rot rot = grad div − ∆
~=
rot rotA
¶
µ
1 ~
1 ∂2
1 ∂2 ~
~
~
ϕ .
A=−
j + grad divA + 2
∆A − 2
c ∂t2
²0 c2
c ∂t
(6.35)
~ und ϕ
Die Bestimmungsgleichungen (6.34) und (6.35) für die Potentiale A
ersetzen uns die Maxwellschen Gleichungen. Noch ist die angekündigte verblüffende Einfachheit der elektro-magnetischen Phänomene nicht sichtbar.
120
6 Das elektromagnetische Feld
Erinnern wir uns daran, dass die Ansätze (6.32) und (6.33) die Potentiale
~
~ ϕ zu neuen
A und ϕ nicht eindeutig festlegen. In der Tat, wenn wir von A,
0
0
~
Potentialen A , ϕ übergehen mit Hilfe einer Transformation
~
A
0
ϕ0
~ + gradΛ
= A
= ϕ−
∂
Λ,
∂t
(6.36)
wobei das skalare Feld Λ ganz beliebig sein darf, so ändern sich die Felder
~ und B
~ gar nicht. Die Transformation (6.36) heißt Eichtransformation, die
E
~ und B
~ unter Eichtransformationen heißt Eichinvarianz.
Invarianz der Felder E
~ und ϕ, indem
Wir nutzen die somit klar gestellte Freiheit in der Wahl von A
wir fordern
~ +
divA
1 ∂
ϕ=0.
c2 ∂t
(6.37)
~=0
In der Magnetostatik hatten wir die so genannte Coulombeichung divA
verwendet. Das könnten wir hier zwar auch tun, jedoch ist die so genannte
Lorentzeichung (6.37) bei zeitabhängigen Verhältnissen wesentlich bequemer.
Die Bequemlichkeit besteht darin, dass mit Hilfe von (6.37) aus den Bestimmungsgleichungen (6.34) und (6.35) einfachere Gleichungen entstehen, nämlich
~ −
∆A
1 ∂2 ~
A
c2 ∂t2
=
−
∆ϕ −
1 ∂2
ϕ
c2 ∂t2
=
− ρ/²0 .
1 ~
j
²0 c2
(6.38)
Welche verblüffende Einfachheit der elektromagnetischen Phänomene wird
sichtbar? Bei vorgegebenen Ladungs- und Stromverteilungen gehorchen die vier
~ und ϕ ungekoppelten inhomogenen Wellengleichungen. BewegPotentiale A
te Ladungen erzeugen elektromagnetische Wellen. Elektromagnetische Wellen
breiten sich mit der Geschwindigkeit c aus, also mit Lichtgeschwindigkeit.
Die eben formulierten Erkenntnisse sind uns in den Schoß gefallen, nachdem
die Lorentzeichung (6.37) eingeführt war. Zur Absicherung sollte noch klar
gemacht werden, dass die Lorentzeichung ohne Beschränkung der Allgemeinheit
immer gewählt werden kann. Dies Ihnen zur Übung, wobei Ihnen unsere frühere
Ausschlachtung der Eichinvarianz der Magnetostatik als Anleitung dienen kann.
6.6
Ebene elektromagnetische Wellen im freien
Raum
Um zu lernen, wie der schon anschaulich geschilderte Inhalt der Maxwellschen
Gleichungen auch quantitativ erschlossen werden kann, betrachten wir zunächst
Raumgebiete, die frei von Ladungen sind, so dass ρ = ji = 0. Dort gelten für
die Potentiale die homogenen Wellengleichungen
6.6 Ebene elektromagnetische Wellen im freien Raum
¶
1 ∂2 ~
A = 0
∆ − 2
c ∂t2
µ
¶
1 ∂2
∆ − 2
ϕ = 0.
c ∂t2
121
µ
(6.39)
~ und B
~ selbst
Durch bloßes Differenzieren finden wir, dass hier auch die Felder E
Komponente für Komponente diesen Gleichungen gehorchen,
µ
µ
1 ∂2
∆ − 2
c ∂t2
1 ∂2
∆ − 2
c ∂t2
¶
¶
~
E
=
0
~
B
=
0.
(6.40)
Ganz offensichtlich können wir nach Lösungen suchen, die nicht von allen drei
Raumkoordinaten x, y, und z, sondern nur von einer, etwa x, abhängen. Solche
~
~
Felder E(x,
t) und B(x,
t) beschreiben eine ebene elektromagnetische Welle. Für
sie lautet der Prototyp der Wellengleichung
µ
1 ∂2
∂2
− 2
2
∂x
c ∂t2
¶
f (x, t) = 0 .
(6.41)
Um sie zu lösen, schreiben wir sie in der Form
µ
∂
1 ∂
−
∂x
c ∂t
¶µ
∂
1 ∂
+
∂x
c ∂t
¶
f (x, t) = 0
(6.42)
und führen statt x und t die neuen Veränderlichen
ξ = x − ct,
η = x + ct
(6.43)
ein. Die Wellengleichung lautet dann
∂2f
=0.
∂ξ∂η
(6.44)
Jetzt drängt sich als allgemeine Lösung auf
f (ξ, η) = f1 (ξ) + f2 (η) ,
(6.45)
wobei f1 und f2 ganz beliebige (differenzierbare) Funktionen sind. In den physikalischen Koordinaten finden wir aus (6.45)
f (x, t) = f1 (x − ct) + f2 (x + ct) .
(6.46)
Wir sehen, dass f1 und f2 entlang der x-Achse nach rechts bzw. nach links
laufende Wellen darstellen.
Die Potentiale für eine beliebige in die positive x-Richtung laufende ebene
elektromagnetische Welle lauten
122
6 Das elektromagnetische Feld
Ai (x, t)
=
ϕ(x, t)
=
Ai (x − ct)
=
ϕ(x − ct)
=
Ai (ξ)
(6.47)
ϕ(ξ) .
Die vier Funktionen Ai , ϕ werden durch die Lorentzkonvention dem Zusammenhang
∂Ax
1 ∂ϕ
∂
∂ 1
+ 2
=
Ax −
ϕ=0.
∂x
c ∂t
∂ξ
∂ξ c
(6.48)
unterworfen. Als ein Integral von (6.48) wählen wir
Ax =
1
ϕ.
c
(6.49)
~ und B
~ in der betrachteten Welle durch DiffeNun finden wir die Felder E
renzieren
Ex (x − ct)
=
x
− ∂A
∂t −
Ey (x − ct)
=
−
Ez (x − ct)
∂ϕ
∂x
∂Ay
∂t
z
− ∂A
∂t
=
=
0
=
cA0y
=
cA0z ,
wobei Ableitungen nach ξ mit einem Strich bezeichnet sind. Auf ähnliche Weise
~ = rot A.
~ Insgesamt haben wir
gewinnen wir das Magnetfeld mit Hilfe von B
~
E
=
c(0, A0y , A0z )
~
B
=
(0, −A0z , A0y ) .
(6.50)
~ und B
~ der ebenen elektromagnetischen Welle
Wir lesen ab, dass die Felder E
überall aufeinander orthogonal sind,
~ ·B
~ =0,
E
(6.51)
und überdies beide senkrecht zur Ausbreitungsrichtung, hier der x-Richtung
stehen. Daher heißen elektromagnetische Wellen im freien Raum auch transver~ B
~ und der
sale Wellen. Besonders einprägsam wird die Dreibeinigkeit von E,
Ausbreitungsrichtung durch die Kompaktfassung von (6.50)
~
B
=
~
E
=
~
+ k̂ × A
0
~ = − ck̂ × (k̂ × A
~0) ,
− ck̂ × B
(6.52)
wobei k̂ der Einheitsvektor in Ausbreitungsrichtung ist. Offenbar muss zur
~ und B
~ der ebenen Welle nur das Vektorpotential
Bestimmung der Felder E
~ und B
~ in der
bekannt sein. Schließlich ist aus (6.52) offensichtlich, dass E
ebenen Welle bis auf den Faktor c gleiche Beträge haben,
~ = c|B|
~ .
|E|
(6.53)
6.7 Die retardierten Potentiale
123
~ finden wir die nützlichen
Für die Energiedichte u und die Energiestromdichte S
Relationen
u =
²0 ~ 2
~ 2 ) = ²0 E 2
(E + c 2 B
2
~
S
~ ×B
~
² 0 c2 E
=
= ² 0 c2 B 2
= ²0 cE 2 k̂ = cuk̂ .
(6.54)
(6.55)
Hieraus ist ersichtlich, dass der Energiestrom mit Lichtgeschwindigkeit fließt.
Ein wichtiger Spezialfall ebener Wellen ist gegeben, wenn die Felder zeitlich
periodisch und darüber hinaus monochromatisch sind. Solche monochromatischen ebenen Wellen werden wir hier in der Form
~ = Re[A
~ 0 e−iω(t−x/c) ]
A
(6.56)
darstellen. Die Größe ω ist dabei die Kreisfrequenz der Welle. Die zugehörige
Wellenlänge ist
λ = 2πc/ω .
(6.57)
Wir werden ebene monochromatische Lichtwellen oft durch ihren Wellenvektor
ω
k̂
(6.58)
c
charakterisieren; dieser zeigt in die Ausbreitungsrichtung der Welle und gibt mit
seinem Betrag die Frequenz. Mit Hilfe des Wellenvektors können wir (6.56) in
einer vom Koordinatensystem unabhängigen Form schreiben
k̂ =
~ = Re [A
~ 0 ei(~k~x−ωt) ] .
A
(6.59)
Für den Fall der monochromatischen ebenen Wellen wird aus (6.52)
~
B
~
E
~
= Re (+i ~k × A)
¶
µ
c2 ~ ~
k×B .
=
−
ω
(6.60)
Die Energiedichte der betrachteten Welle ist im Mittel über eine zeitliche Periode
~ 6= 0), jedoch transportiert
räumlich konstant. Zwar ist der Poynting-Vektor S
die monochromatische Welle keine Energie von Ort zu Ort. Dies nachzuweisen,
bleibt Ihnen als kleiner Spaß.
6.7
Die retardierten Potentiale
Wir suchen nun das elektromagnetische Feld, das von vorgegebenen Ladungshaufen ρ(~x, t) und Stromverteilungen ~j(~x, t) abgestrahlt wird. Dazu haben wir
~ und ϕ
die inhomogenen Wellengleichungen für die Potentiale A
µ
∆−
µ
1 ∂2
c2 ∂t2
1 ∂2
∆− 2
c ∂t2
¶
¶
1 ~
j
²0 c2
~
A
= −
ϕ
= − ρ/²0
(6.61)
124
6 Das elektromagnetische Feld
zu lösen. Nach schon mehrfach bewährtem Muster versuchen wir, ein spezielles
Integral der Gleichung für das skalare Potential ϕ zu konstruieren, indem wir
zunächst das ladungserfüllte Volumen in kleine Stückchen d3 x einteilen, deren
jedes die Punktladung“ ρ(~x, t)d3 x enthält; sodann suchen wir das von einer
”
Punktladung erzeugte Potential und setzen schließlich das Potential des gesamten Ladungshaufens aus den Beiträgen der Stückchen additiv zusammen.
Das Potential einer bei ~x = 0 sitzenden Punktladung finden wir aus
µ
¶
1 ∂2
1
∆− 2
ϕ(~x, t) = −
ρ(~x, t) d3 xδ (3) (~x) .
(6.62)
c ∂t2
²0
Außerhalb des Ursprungs gilt überall δ (3) (~x) = 0, so dass die Wellengleichung
(6.62) homogen wird,
¶
µ
1 ∂2
ϕ=0.
(6.63)
∆− 2
c ∂t2
Das skalare Potential ϕ einer Punktladung sollte kugelsymmetrisch sein, also
nur von r = |~x| abhängen. Auf Funktionen ϕ(r) wirkt der Laplaceoperator wie
2ϕ0 (r)
1 d2
~x 0
rϕ(r) ,
ϕ (r) =
+ ϕ00 (r) =
r
r
r dr2
so dass sich die Wellengleichung (6.63) vereinfacht zu
µ 2
¶
∂
1 ∂2
−
rϕ(r, t) = 0 .
∂r2
c2 ∂t2
∆ϕ(r) = div
(6.64)
Aus dem letzten
³
´ Paragrafen wissen wir schon, dass die Gleichung
∂2
1 ∂2
∂r 2 − c2 ∂t2 f (r, t) = 0 die allgemeine Lösung f (r, t) = f1 (r − ct) + f2 (r + ct)
hat. Für das skalare Potential gilt also
1
1
f1 (r − ct) +
f2 (r + ct) ,
(6.65)
r
r
wobei f1 und f2 wieder ganz beliebige Funktionen sind.
Der erste Term in (6.65) stellt eine vom Ursprung, also von der Punktladung
nach außen laufende Kugelwelle dar, der zweite eine in den Ursprung einlaufende
Kugelwelle. Die Abstrahlung von elektromagnetischen Wellen durch die Punktladung sollte allein durch die auslaufende Lösung beschreibbar sein. Daher
versuchen wir, mit dem Ansatz f2 = 0 auszukommen. Um f1 (r − ct) festzulegen, schauen wir uns das Feld ϕ in unmittelbarer Umgebung des Ursprungs
an.
Beachten wir, dass ϕ(r, t) = f1 (r − ct)/r für r → 0 wie 1/r über alle Grenzen
wächst, wenn f1 (−ct) nur existiert. Es folgt, dass die Ortsableitungen von ϕ
bei Annäherung an den Ursprung schneller wachsen als die Zeitableitungen. In
∂
f1 ,
der Tat, für r → 0 gilt, mit f10 = ∂r
ϕ(r, t) =
∂ϕ
∂ϕ
∼ f1 (−ct)/r 2 ,
∼ f10 (ct)/r .
(6.66)
∂r
∂t
Für hinreichend kleine r können wir also in der Wellengleichung (6.62) die Zeitableitungen gegenüber den Ortsableitungen von ϕ vernachlässigen. Daraufhin
wird die Wellengleichung zur Laplaceschen Differentialgleichung
6.7 Die retardierten Potentiale
125
∆ϕ = − ²10 ρ(0, t)d3 xδ (3) (x). Daher muss die Lösung ϕ(r, t) der Wellengleichung
für r → 0 in das aus der Statik bekannte Coulombpotential übergehen,
ϕ(r, t) =
1
1 1
1
f1 (r − ct) →
f1 (−ct) =
ρ(0, t)d3 x .
r
r
4π²0 r
(6.67)
Damit aber ist die bisher unbekannte Funktion f1 (r − ct) festgelegt und wir
haben als Potential der Punktladung
ϕ(~x, t) =
1 1
ρ(0, t − r/c)d3 x .
4π²0 r
(6.68)
Sitzt die Punktladung nicht am Ursprung des Koordinatensystems sondern
am Ort ~x0 , so lautet das Potential
ϕ(x, t) =
1
1
ρ(~x 0 , t − |~x − ~x 0 |/c)d3 x0
4π²0 |~x − ~x 0 |
(6.69)
Durch Superposition erhalten wir das gesuchte Potential des Ladungshaufens
zu
Z
ρ(~x 0 , t − |~x − ~x 0 |/c)
1
d3 x 0
.
(6.70)
ϕ(~x, t) =
4π²0
|~x − ~x 0 |
Dies ist eine Partikularlösung der Wellengleichung für ϕ. Sie erfüllt die
Randbedingung
ϕ(~x, t) → 0
für
|~x| → ∞ .
(6.71)
Wenn andere Randbedingungen erfüllt werden sollten, so ist zur Partikularlösung
eine entsprechende Lösung der homogenen Wellengleichung hinzuzufügen. Wir
werden uns mit derartigen Problemen hier nicht beschäftigen.
Da die Wellengleichungen für die Komponenten Ai (~x, t) des Vektorpotentials
die gleiche Form haben wie die eben gelöste Wellengleichung für das skalare
Potential, finden wir ohne weitere Rechnung
~ x, t) =
A(~
1
4π²0 c2
Z
d3 x 0
~j(~x 0 , t − |~x − ~x 0 |/c)
.
|~x − ~x 0 |
(6.72)
Die Lösungen (6.70) und (6.72) heißen retardierte Potentiale. Retardiert,
weil sich am Beobachtungsort ~x zur Zeit t die an anderen Orten ~x 0 befindlichen
Ladungen nicht instantan bemerkbar machen. Vielmehr fungieren als Ursa”
chen“ für Wirkungen“ am Ort ~x zur Zeit t die Ladungen bzw. Ströme am Ort
”
~x zur früheren Zeit t0 = t − |~x − ~x 0 |/c. Beachten wir, dass die Zeitspanne
|~x − ~x 0 |/c gerade die Laufzeit eines mit Lichtgeschwindigkeit von ~x 0 nach ~x
laufenden Signals ist. Wir sehen nochmals deutlich, dass elektromagnetische
Wellen sich mit Lichtgeschwindigkeit fortpflanzen.
Würdigen Sie das mit (6.70) und (6.72) Erreichte und die verblüffende Einfachheit der elektromagnetischen Phänomene! Für statische Ladungshaufen
bzw. stationäre Stromverteilung reduzieren sich die retardierten Potentiale auf
die aus der Elektro- bzw. Magnetostatik bekannten Lösungen. Das retardierte
skalare Potential ϕ(~x, t) lässt sich charakterisieren als das mit Laufzeiteffekten
dekorierte Coulombpotential.
126
6 Das elektromagnetische Feld
6.8
Elektrische Dipolstrahlung
Betrachten wir einen Ladungs- und Stromhaufen und berechnen das von ihm
erzeugte elektromagnetische Feld in großen Entfernungen, r = |~x| À a (Abbildung 6.2)
Abbildung 6.2
Innerhalb eines kleinen Raumbereichs um einen weit vom Haufen entfernten
Beobachtungspunkt herum wird das Feld die Form einer ebenen Welle annehmen. Daher muss sich, wie wir oben gesehen hatten, das elektromagnetische
Feld dort allein aus dem Vektorpotential gewinnen lassen mit
∂ ~
1
k̂ ×
A(~x, t)
c
∂t
~ x, t)
B(~
=
−
~ x, t)
E(~
=
~ x, t) ,
− ck̂ × B(~
(6.73)
wobei ~k = ~x/r der Einheitsvektor in Ausbreitungsrichtung ist.
Wir müssen also zur Bestimmung des Feldes nur das Integral
~ x, t)
A(~
Z
=
1
4π²0 c2
≈
1
1
2
4π²0 c r
d3 x 0
Z
~j(~x 0 , t − |~x − ~x 0 |/c)
|~x − ~x 0 |
d3 x0 ~j(~x 0 , t − |~x − ~x 0 |/c)
(6.74)
auswerten. Hier ist schon unter dem Integral 1/|~x −~x 0 | durch 1/r approximiert,
es sind also Korrekturen der relativen Ordnung a/r vernachlässigt. Es liegt
nahe, das Zeitargument des Stromes ebenfalls so zu vereinfachen, d. h.
t − |~x − ~x 0 |/c ≈ t − r/c
(6.75)
zu schreiben. Diese Näherung ist jedoch nicht mir a ¿ r zu rechtfertigen. Die
Zeitabhängigkeit des Stroms muss durchaus nicht so langsam sein, dass ~j sich
in der Zeitspanne
6.8 Elektrische Dipolstrahlung
|~x − ~x 0 |/c − r/c
127
(6.76)
nicht merklich ändert. Vielmehr muss, wenn ω eine für die zeitliche Änderung
des Stromes typische Frequenz ist, der Maximalwert der Zeitspanne (6.76), a/c,
vernachlässigbar klein sein gegenüber der typischen Periode, 1/ω. Äquivalent
dazu ist die Bedingung
a¿λ,
(6.77)
die verlangt, dass die Lineardimensionen des Senders klein sein müssen im Vergleich zur typischen Wellenlänge der Strahlung.
Die beschriebene Näherung heißt elektrische Dipolnäherung“ und gibt für
”
das Vektorpotential den sehr einfachen Ausdruck
Z
1
1
~
A(~x, t) =
d3 x0 ~j(~x 0 , t − r/c) .
(6.78)
4π²0 c2 r
Wir können das verbleibende Integral durch das elektrische Dipolmoment des
Ladungshaufens ausdrücken. Zu diesem Zweck wiederholen wir unter leichter
Verallgemeinerung eine schon in der Magnetostatik gemachte Nebenrechnung
(s. 5.7)
Z
d3 x
P
∂
(ji xl ) = 0
∂xi
i
Z
Z
3
~
=
d x(xl div j + jl ) = d3 x(jl − xl ρ̇)
und sehen, dass das Volumenintegral der Stromdichte über den Ladungshau~ ist.
fen gleich der zeitlichen Änderungsrate des elektrischen Dipolmoments d(t)
Somit wird aus dem Vektorpotential
~ x, t) =
A(~
1
1 ∂ ~
d(t − r/c) .
4π²0 c2 r ∂t
(6.79)
~ und B
~ ergeben sich hieraus durch Differenzieren,
Die Felder E
1
1
~¨ − r/c)
k̂ × d(t
4π²0 c2 cr
~ x, t)
B(~
=
−
~ x, t)
E(~
=
1
1
~¨ − r/c)] ,
k̂ × [k̂ × d(t
2
4π²0 c r
(6.80)
wobei die Zeitableitung mit einem Punkt bezeichnet ist.
Beachtenswert an diesen Feldern ist, dass sie mit r → ∞ wie 1/r abfallen,
langsamer also, als die statischen Felder. Der 1/r-Abfall garantiert, dass durch
jede Kugel um den Dipol ein Energiefluss läuft, der unabhängig ist vom Radius
r. Um das einzusehen, bedenken wir nur, dass die Kugeloberfläche wie r 2 wächst
~ = ² 0 c2 E
~ × B
~ wie 1/r 2 abfällt.
und die Energiestromdichte S
Schauen wir uns die Energiestromdichte genauer an. Da in der ebenen Welle
~ = |B|
~ gilt, haben wir
|E|
128
6 Das elektromagnetische Feld
~ = k̂
S
1
1 ~¨
[d(t − r/c)]2 sin2 Θ ,
(4π)2 ²0 c3 r2
(6.81)
wobei Θ der Winkel zwischen der Beobachtungsrichtung k̂ und dem Dipolmoment ist (s. Abbildung 6.3). Beachten Sie, dass die Abstrahlung von Energie
rotationssymmetrisch um die Achse des Dipols erfolgt; ferner, dass in Richtung
des Dipols gar nicht und quer zum Dipol maximal gestrahlt wird.
Abbildung 6.3
~
Die gesamte pro Sekunde abgestrahlte Energie erhalten wir als Fluss von S
durch eine Kugel um den Dipol als Mittelpunkt. Da das Oberflächenelement
~ = k̂r2 sin ΘdΘdϕ überall parallel zur Ausbreitungsrichtung k̂ ist, erhalten
df
wir sofort
I(t) =
2 ~¨
1
[d(t − r/c)]2 .
4π²0 3c3
(6.82)
Nicht alle Ladungshaufen können Dipolstrahlung aussenden. Wenn z. B.
der Ladungshaufen aus Teilchen aufgebaut ist, die alle das gleiche Verhältnis
von Ladung und Masse haben, so
proportional zum OrtsPist das Dipolmoment
P
e
vektor des Schwerpunktes d~ =
eν ~xν = m
m
~
x
ν ν . Wenn nun auf den
ν
ν
Ladungshaufen keine äußeren Kräfte wirken, so bewegt sich der Schwerpunkt
mit konstanter Geschwindigkeit. Seine Beschleunigung und somit auch die zweite Zeitableitung des elektrischen Dipolmoments verschwinden dann. Derartige
Systeme können zwar auch Energie abstrahlen, jedoch müssen wir, um ihr Strahlungsverhalten zu beschreiben, die Entwicklung von t−|~x −~x 0 |/c| nach Potenzen
von a/c über die nullte Ordnung hinaustreiben. Es ergeben sich dann magnetische Dipolstrahlung, Quadrupolstrahlung etc.
Kapitel 7
Elektromagnetische Felder
in Materie
7.1
Polarisation und Magnetisierung
Beim Eindringen in gasförmige, flüssige oder feste Materie tritt ein elektromagnetisches Feld mit allen das Medium aufbauenden geladenen Teilchen in
Wechselwirkung. Falls im Spektrum des Feldes Wellenlängen bis hinab zu etwa
1 Å (entsprechend Röntgenstrahlung) vorhanden sind, müssen alle Atomkerne
und Elektronen (d. h. sowohl die in Atomen und Molekülen gebundenen wie
die ungebundenen) in der Ladungsdichte ρ(~x, t) und in der Stromdichte ~j(~x, t
berücksichtigt werden.
Wenn jedoch die kürzesten Wellenlängen etwa 1000 Å nicht unterschreiten,
können die elektromagnetischen Wellen die atomare Struktur des Mediums nicht
auflösen. In diesem für Experimente mit ultraviolettem, sichtbarem und infrarotem Licht wichtigen Fall erlauben die mikroskopischen Ausdrücke für Ladungsund Stromdichte
ρ(~x, t)
=
X
ν
~j(~x, t)
=
X
ν
qν δ (3) (~x − ~xν (t))
(7.1)
qν ~x˙ ν (t)δ (3) (~x − ~xν (t))
(7.2)
eine äußerst bequeme Vereinfachung, die ich nun beschreiben will.
Trennen wir zunächst in (7.1) die Beiträge ungebundener Punktladungen,
ρfrei (~x, t) =
frei
X
ν
qν δ (3) (~x − ~xν (t)) ,
(7.3)
von den Beiträgen von Komplexen (Atome, Moleküle oder Elementarzellen in
Kristallen), in denen jeweils mehrere Punktladungen gebunden sind. Bezeichnen wir den Ortsvektor des Schwerpunkts des µ-ten derartigen Komplexes mit
~xµ (t) und die diesbezügliche Auslenkung der i-ten Punktladung qνi innerhalb
des µ-ten Komplexes mit ξ~µi (t), so lautet die von den Komplexen dargestellte
Ladungsdichte
129
130
7 Elektromagnetische Felder in Materie
X X
Komplexe
ρgeb (~x, t) =
µ
i
qµi δ (3) (~x − ~xµ (t) − ξ~µi (t)) .
(7.4)
Um den Einfluss der Anteile (7.3) und (7.4) der mikroskopischen Ladungsdichte
auf eine elektromagnetische Welle der Wellenlänge λ zu untersuchen, müssen
wir gemäß (6.34) die räumlichen Fourierkomponenten
Z
~
ρ(~k, t) = d3 xe−ik·~x ρ(~x, t)
(7.5)
mit Wellenzahlen
|~k| = 2π/λ
(7.6)
betrachten, also im Einzelnen
ρfrei (~k, t) =
frei
X
~
qν e−ik·~xν (t)
(7.7)
ν
und
X X
Komplexe
ρgeb (~k, t) =
µ
~
~
qµi e−ik·(~xµ (t)+ξµi (t) .
(7.8)
i
Die angekündigte Vereinfachung beruht darauf, dass die Lineardimensionen
von Atomen, Molekülen und Elementarzellen in Kristallen die Größenordnung
1 Å haben, d. h. viel kleiner sind als die angenommene Größenordnung der
Wellenlänge λ. In (7.8) dürfen wir daher nach Potenzen von ~k · ξ~µi entwickeln,
X
Komplexe
ρgeb (~k, t) =
e
−i~
k·~
xµ (t)
µ
Ã
X
i
qµi − i~k ·
X
qµi ξµi (t) + . . .
i
!
.
(7.9)
Die beiden ersten Glieder dieser Entwicklung sind durch die Ladung qµ und das
elektrische Dipolmoment d~µ der Komplexe festgelegt. Unter Vernachlässigung
der nachfolgenden Glieder, die offenbar die höheren Multipolmomente der Komplexe enthalten, gewinnen wir für die gesamte Ladungsdichte
X
µ
X
Komplexe
Komplexe
ρ(~k, t) = ρfrei (~k, t) +
~
qµ e−ik·~xµ (t) − i~k ·
~
d~µ(t) e−ik·~xµ (t) .
(7.10)
µ
Hier erscheint ρ(~k, t) als zusammengesetzt aus den Fourierkomponenten einer
vergröberten Ladungsdichte,
X
Komplexe
ρmakr (~k, t) = ρfrei (~k, t) +
µ
und des Vektorfeldes der Polarisationsdichte,
~
qµ e−ik·~xµ (t) ,
(7.11)
7.1 Polarisation und Magnetisierung
X
131
Komplexe
P~ (~k, t) =
~
d~µ (t)eik·~xµ (t) ,
(7.12)
µ
gemäß
ρ(~k, t) = ρmakr (~k, t) − i~k · P̃(~k, t) .
(7.13)
Die gegenüber dem exakten Ausdruck (7.8) erreichte Vereinfachung besteht darin, dass (i) in ρmakr jeder Komplex aneinander gebundener Ladungen selbst als
eine strukturlose Punktladung erscheint und (ii) die innere Struktur eines Komplexes nur über das Dipolmoment d~µ (t) in die Polarisationsdichte eingeht. Zu
betonen ist, dass die Näherung (7.13) sinnlos wird für Wellenlängen, die nicht
sehr groß sind im Vergleich zur Lineardimension der Komplexe.
Eine völlig entsprechende Vereinfachung erhalten wir für die Stromdichte
(7.2). Die ~k-te Fourierkomponente des Anteils der in Komplexen gebundenen
Ladungen lautet exakt
X X
Komplexe
~jgeb (~k, t) =
µ
i
³
´ ~
~
˙
qµi ~x˙ µ (t) + ξ~µi (t) e−ik·(~xµ (t)+ξµi (t))
(7.14)
und nach Vernachlässigung von Gliedern zweiter und höherer Ordnung in (~k· ξ~µi )
X
Komplexe
~jgeb (~k, t) =
µ
X X
µ
~
˙
d~µ (t)e−ik·~xµ (t)
µ
Komplexe
−i
X
Komplexe
~
qµ ~x˙ µ (t) e−ik·~xµ (t) +
i
´
´³
³
~
˙
qµi ~x˙ µ (t) + ξ~µi (t) ~k · ξ~µi (t) e−ik·~xµ (t) .
(7.15)
Den ersten hier auftretenden Term vereinigen wir mit der durch freie Punktladungen getragenen Stromdichte zu einer vergröberten Stromdichte
X
Komplexe
~jmakr (~k, t) = ~jfrei (~k, t) +
~
qµ ~x˙ µ (t)e−ik·~xµ (t) ,
(7.16)
µ
in der jeder Komplex als zu einer Punktladung geschrumpft erscheint. Den
zweiten Term in (7.15) eliminieren wir zugunsten der Zeitableitung der Polarisationsdichte
˙
P~ (~k, t) =
³
´i
X h˙
~
d~µ (t) − id~µ (t) ~k · ~x˙ µ (t) e−ik·~xµ (t)
Komplexe
(7.17)
µ
und erhalten für gesamte Stromdichte
~j(~k, t)
˙
= ~jmakr (~k, t) + P~ (~k, t)
³
´
³
´i
Komplexe
P h~
~
dµ (t) ~k · ~x˙ µ (t) − ~x˙ µ (t) ~k · d~µ (t) e−ik·~xµ (t)
+i
µ
³
´
Komplexe
P P ~˙
~
−i
qµi ξµi (t) ~k · ξ~µi (t) e−ik·~xµ (t) .
µ
i
(7.18)
132
7 Elektromagnetische Felder in Materie
Wir dürfen das in der Geschwindigkeit ~x˙ µ und im Dipolmoment d~µ antisymmetrische Glied vernachlässigen, da es unter praktisch allen Umständen winzig
˙
ist im Vergleich zu P~ (~k, t). Um uns davon zu überzeugen, bedenken wir, dass
die Ausbreitung elektromagnetischer Wellen des Wellenvektors ~k durch die Frequenz
ω(~k) = c̃|~k|
(7.19)
charakterisiert ist. Die in Materie vorliegende Lichtgeschwindigkeit c̃ kann
übrigens verschieden sein von der Lichtgeschwindigkeit im Vakuum; c̃ kann sogar vom Wellenvektor ~k abhängen, siehe (7.2 und 7.3). Unter dem Einfluss des
elektromagnetischen Feldes wird das Dipolmoment eine erzwungene Bewegung
gleicher Frequenz ausführen. Die Zeitableitung des Dipolmoments wird demnach die Größenordnung c̃|~k||d~µ | haben, d. h. etwa um den Faktor c̃/|~x˙ µ | von
dem erwähnten in d~µ und ~x˙ µ antisymmetrischen Glied verschieden sein. Letzte˙
res ist also gegen P~ vernachlässigbar, wenn die Geschwindigkeiten |~x˙ µ (t)| klein
sind gegenüber der Lichtgeschwindigkeit ~c.
Um schließlich das letzte Glied in (7.18) zu untersuchen, vereinfachen wir
vorübergehend die Schreibweise, indem wir die die Ladungen nummerierenden
Indices weglassen und hochgestellte Indices zur Bezeichnung der Vektorkomponenten einführen. Die i-te Vektorkomponente j i (~k, t) erhält im letzten Glied
von (7.18) von einem Komplex einen Beitrag proportional zu
X X
Ladungen
q ξ˙i (t)k j ξ j (t)
=
X
k
j
j
j
(
X
+
Ladungen
=
i
q h ˙i
ξ (t)ξ j (t) − ξ˙j (t)ξ i (t)
2
Ladungen
X
i
q h ˙i
ξ (t)ξ j (t) + ξ˙j (t)ξ i (t)
2
−(~k × m)
~ i+
X
kj
j
)
d X q i
ξ (t)ξ j (t) .
dt Ladungen 2
(7.20)
Hierin tritt das magnetische Moment m
~ µ des Komplexes auf sowie die Zeitableitung eines in ξ quadratischen Moments der Ladungsverteilung. Da wir Glieder
des letzteren Typs in der obigen Entwicklung (7.10) der Ladungsverteilung vernachlässigt hatten, müssen wir sie konsistenterweise auch hier außer Acht lassen.
Die zu guter Letzt entstehende Näherung für die gesamte Stromdichte lautet
~ (~k, t),
~j(~k, t) = ~jmakr (~k, t) + P~˙ (~k, t) + i~k × M
(7.21)
wobei die ~k-te Fourierkomponente der Magnetisierungsdichte als
X
Komplexe
~ (~k, t) =
M
µ
~
m
~ µ (t)e−ik·~xµ (t)
(7.22)
7.1 Polarisation und Magnetisierung
133
eingeführt wurde.
Die Näherungen (7.13) und (7.21) für die Ladungs- bzw. Stromdichte bestehen übrigens eine wichtige Konsistenzprüfung, indem sie den Ladungserhaltungssatz befriedigen. In der Tat gilt für die ~k-te Fourierkomponente von
ρ̇(~x, t) + div ~j(~x, t)
ρ̇(~k, t) + i~k · ~j(~k, t) = ρ̇makr (~k, t) + i~k · ~jmakr (~k, t) .
(7.23)
Das Verschwinden der rechten Seite in (7.23) folgt unmittelbar, wenn die Definition (7.10) nach der Zeit differenziert wird.
Wir können nun die Maxwellschen Gleichungen für langwellige (λ À Durchmesser aller Komplexe Felder in Materie aufschreiben. Beachten Sie dabei nur,
~ x) die Fourierdass die Wirbelstärke und die Quellstärke eines Vektorfeldes X(~
komponenten
~ ~k) =
i~k × X(
Z
~ x)
d3 xe−ik·~x rotX(~
(7.24)
~ ~k) =
i~k × X(
Z
~
~ x)
d3 xe−ik·~x divX(~
(7.25)
~
bzw.
haben. (Letztere Relation war übrigens schon in (7.23) benutzt worden.) Damit
ergeben sich die Feldgleichungen aus (6.12 bis 6.15) zu
³
´
~ ~k, t) + P~ (~k, t)
i~k · ²0 E(
~ ~k, t)
i~k × E(
=
ρmakr (~k, t)
(7.26)
=
~˙ ~k, t)
B(
(7.27)
~ ~k, t) = 0
i~k · B(
(7.28)
³
´
³
´
∂
~ ~k, t) + P~ (~k, t) .
~ ~k, t) − M
~ (~k, t)
²0 E(
i~k × ²0 c2 B(
= ~jmakr (~k, t) +
∂t
(7.29)
~ ~k, t) und B(
~ ~k, t), die ausschließlich langwellige (im o. g. Sinn)
Für Felder E(
~
~
~ ~k, t) enthalten, dürfen wir in allen vier GleiFourierkomponenten E(k, t) bzw. B(
chungen (7.26 - 7.29) gemäß
~ x, t) =
E(~
Z
d3 k −i~k·~x ~ ~
e
E(k, t) etc.
(2π)3
(7.30)
die inverse Fouriertransformation ausführen, woraufhin wir die Ortsraumdarstellung der Maxwellschen Gleichungen gewinnen,
134
7 Elektromagnetische Felder in Materie
³
´
~ x, t) + P~ (~x, t)
div ²0 E(~
~ x, t)
rotE(~
=
ρmakr (~x, t)
(7.31)
=
~˙ x, t)
−B(~
(7.32)
~ x, t) = 0
divB(~
(7.33)
³
´
³
´
∂
~ x, t) − M
~ (~x, t)
~ x, t) + P~ (~x, t) .
rot ²0 c2 B(~
= ~jmakr (~x, t) +
²0 E(~
∂t
(7.34)
Letztere Darstellung macht besonders sinnfällig, dass (bei langwelligen Feldern!) die vergröberte Ladungsdichte ρmakr als Quelle für das so genannte
elektrische Verschiebungsfeld
~ = ²E
~ + P~
D
(7.35)
~
fungiert, während die vergröberte Stromdichte ~jmakr zusammen mit dem aus D
˙~
gebildeten Verschiebungsstrom D die Wirbel der so genannten Magnetfeldstärke
~ = ² 0 c2 B
~ −M
~
H
(7.36)
angibt.
Für eine explizite Beschreibung der elektromagnetischen Phänomene in Materie müssen zunächst die Ladungen ρmakr spezifiziert werden. Die einfachst
mögliche Situation liegt vor, wenn keine ungebundenen Ladungen auftreten
und die Komplexe gebundener Ladungen (Moleküle, Elementarzellen in Kristallen ...) elektrisch neutral sind; in diesem Fall verschwinden ρmakr und ~jmakr .
Zusätzliche Kenntnis ist erforderlich über die elektrischen und magnetischen Dipolmomente der Komplexe gebundener Ladungen, d. h. die Polarisationsdichte
~.
P~ und die Magnetisierungsdichte M
7.2
Materialgesetze für Polarisation und Magnetisierung
Solange kein elektromagnetisches Feld eingeprägt wird, zeigen die meisten Materialien keine langwellige (λ > 1000 Å) Polarisation und Magnetisierung. Selbst
wenn die Atome, Moleküle und/oder gegebenenfalls Elementarzellen in Probekörpern elektrische und/oder magnetische Dipole tragen, so sind diese Dipole bezüglich ihrer Richtungen i. A. unkorreliert und summieren sich daher in
Raumbereichen der Lineardimensionen (λ > 1000 Å) zu Null. Ausnahmen, die
hier nicht weiter diskutiert werden können, sind Ferroelektrika und Ferromagnetika bei hinreichend tiefen Temperaturen.
Beim Eindringen eines langwelligen elektromagnetischen Feldes in Probekörpern können jedoch endliche Werte der Polarisation und der Magnetisierung
entstehen. Zum einen sind nämlich etwaige permanente molekulare Dipole bestrebt, sich längs des eingeprägten Feldes zu orientieren. Andererseits tendiert
ein eingeprägtes elektrisches Feld dazu, in Komplexen aneinander gebundener Ladungen Dipolmomente zu erzeugen, da es auf Ladungen verschiedenen
7.2 Materialgesetze für Polarisation und Magnetisierung
135
Vorzeichens Kräfte entgegengesetzter Richtung ausübt. Schließlich kann ein
zeitabhängiges Magnetfeld Ringspannungen und somit Ringströme erzeugen,
die ein magnetisches Moment tragen.
Viele so genannte Dielektrika reagieren auf die Anwesenheit eines elektromagnetischen Feldes zwar nicht mit merklicher Magnetisierung, wohl aber mit
einer durch das elektrische Feld eindeutig festgelegten Polarisation. Da die
durch äußeren Eingriff in dielektrischen Probekörpern erzeugbaren elektrischen
Felder i. A. viel schwächer sind als typische innermolekulare Coulombfelder
(≈ 108 V /cm), also nur kleine Änderungen der mikroskopischen Ladungskonfigurationen erzeugen können, lässt sich die Polarisation P~ als Potenzreihe im elek~ darstellen. Meist ist sogar nur die lineare Antwort, |P~ | ∼ |E|,
~
trischen Feld E
beobachtbar. Da diese Antwort sowohl vom Wellenvektor wie von der Frequenz
des eingeprägten Feldes abhängen kann, ist es zweckmäßig, das entsprechende
Materialgesetz für die raum-zeitlichen Fouriertransformierten,
Z
Z
~
P~ (~k, ω) = d3 x dt e−i(k·~x+ωt) P~ (~x, t)
(7.37)
etc., aufzuschreiben.
Das allgemeinste derartige lineare Gesetz lautet
X
~ j (~k, ω) .
χij (~k, ω)E
P~i (~k, ω) = ²0
(7.38)
j
Die Matrix des Koeffizienten χij wird als der Tensor der linearen elektrischen
Suszeptibilität bezeichnet. Nur in isotropen Medien ist dieser Tensor diagonal,
~ also parallel.
χij ∼ δij , sind die Vektoren P~ und E
Die Suszeptibilität vieler Materialien ist in gewissen Spektralbereichen eine
von Frequenz und Wellenvektor unabhängige Konstante. Insbesondere entfällt
jede Abhängigkeit von ~k für Substanzen, die räumlich homogen sind auf Längenskalen, bezüglich derer die Polarisation und die Magnetisierung definiert sind
(λ À Komplexdurchmesser). Für Felder, deren Fourierkomponenten ausschließlich in solchen Spektralbereichen liegen, darf das lineare Gesetz auch in der
raum-zeitlichen lokalen Form
X
χij Ej (~x, t)
(7.39)
P~i (~x, t) = ²0
j
geschrieben werden.
Mit Lasern erzeugte Lichtfelder können so intensiv sein, dass die elektrische
Feldstärke nicht mehr winzig ist im Vergleich zu typischen innermolekularen
Coulombfeldern. Auf solche Felder reagieren viele Materialien merklich nichtlinear, z. B. wie
136
7 Elektromagnetische Felder in Materie
Pi (k,~ω)
= ²0
X
χij (~k, ω)Ej (~l, ω)
j
+ ²0
XZ
3 0
d k
j,l
Z
dω 0 χijl (~k 0 , ω 0 , ~k − ~k 0 , ω − ω 0 )
Ej (~k 0 , ω 0 )El (~k − ~k 0 , ω − ω 0 ) .
(7.40)
Der vom Tensor χijl vermittelten Nichtlinearität entspricht eine Fülle interessanter Phänomene (Frequenzmischung, Frequenzverdopplung etc.), deren Untersuchung Gegenstand der nichtlinearen Optik ist.
In magnetisierbaren Materialien sind Zusammenhänge zwischen der Magne~ und dem Induktionsfeld B
~ beobachtbar, die den elektrischen Matisierung M
terialgesetzen (7.38) und (7.40) ganz analog sind.
7.3
Wellen in linearen Dielektrika
Für den einfachen Fall eines linearen, räumlich homogenen und isotropen Dielektrikums mit verschwindender magnetischer Suszeptibilität,
~ ~k, ω),
P~ (~k, ω) = ²0 χ(ω)E(
~ (~x, t) = 0 ,
M
(7.41)
will ich nun darlegen, wie sich die Ausbreitung elektromagnetischer Wellen modifiziert gegenüber dem Fall der Ausbreitung im Vakuum.
Wenn keine freien Ladungen ins Dielektrikum gebracht und alle Komplexe
gebundener Ladungen neutral sind, so lauten die Maxwell’schen Gleichungen
(7.24 bis 7.27) (nach Fouriertransformation bezüglich der Zeit wie in (7.37))
~k · E(
~ ~k, ω) = 0 ,
~k · B(
~ ~k, ω) = 0 ,
~k × E(
~ ~k, ω) = −ω B(
~ ~k, ω) ,
~k × B(
~ ~k, ω) =
²(ω)
c2
~ (~k, ω) ,
ωE
(7.42)
wobei ²(ω) die Dielektrizitätskonstante
²(ω) ≡ 1 + χ(ω)
(7.43)
~ ~k, ω) aus (7.42) erhalten wir
bezeichnet. Durch Elimination von B(
³
´
2
~ ~k, ω) = k 2 E(
~ ~k, ω) ²(ω)ω E(
~ ~k, ω) .
−~k × ~k × E(
(7.44)
c2
Ebene monochromatische Wellen im betrachteten Dielektrikum haben also die
Dispersionsrelation
ck = ω
p
²(ω) .
(7.45)
Der früher besprochene Fall des Vakuums ist hierin als ² = 1 enthalten. Der
Faktor
n(ω) ≡
p
²(ω)
(7.46)
7.4 Modell eines Dielektrikums
137
wird auch Brechungsindex des Dielektrikums genannt.
Wie Sie im nächsten Paragrafen sehen werden, können die Suszeptibilität χ
und somit die Dielektrizitätskonstante wie der Brechungsindex komplexe Werte
annehmen. Um die physikalische Bedeutung von Realteil n0 und Imaginärteil
n00 eines komplexen Brechungsindex
n = n0 + in00
(7.47)
zu erkennen, betrachten wir eine in die positive x-Richtung laufende ebene monochromatische Welle
0
ei(ωt−kx) = eiω(t−xn /c) e+xn
00
ω/c
.
(7.48)
Da sich die Flächen konstanter Phase des in (7.48) auftretenden periodischen
Faktors mit der Geschwindigkeit x/t = c/n0 bewegen, heißt
c̃(ω) = c/n0 (ω)
(7.49)
die Phasengeschwindigkeit elektromagnetischer Wellen im Dielektrikum. Offenbar ist c̃ allein durch den Realteil des Brechungsindex festgelegt und hängt über
diesen i. A. von der Frequenz der Welle ab.
Der nichtperiodische Faktor in (7.48) beschreibt je nach Vorzeichen von n00
eine exponentielle Dämpfung (n00 < 0) oder Verstärkung (n00 > 0) der Welle
beim Eindringen ins Dielektrikum. Beide Fälle lassen sich experimentell realisieren. Im Fall der Dämpfung hat die Größe
l ≡ c/ω|n00 (ω)|
(7.50)
offenbar die Bedeutung einer Eindringtiefe.
7.4
Modell eines Dielektrikums
Denken wir uns jeden Komplex aneinander gebundener Ladungen repräsentiert
durch einen harmonischen Oszillator der Eigenfrequenz ω0 . Bei Auslenkung aus
der Ruhelage um ξ~ trete das Dipolmoment
d~ = q ξ~
(7.51)
auf.
Unter dem Einfluss eines monochromatischen elektrischen Feldes führt der
Oszillator eine erzwungene Schwingung gemäß der Bewegungsgleichung
q ~ −iωt
¨
¨
E0 e
(7.52)
ξ~ − 2γ ξ~ + ω02 ξ~ =
m
aus. Hierin ist m die effektive Masse des Oszillators und γ eine Dämpfungskonstante,
die den dissipativen Effekt anderer Freiheitsgrade des Systems auf den Oszillator beschreibt. Im stationären Regime schwingt das Dipolmoment d~ mit der
Frequenz ω und der Amplitude
d~ =
ω02
q 2 /m
~0 .
E
− ω 2 + i2γω
(7.53)
138
7 Elektromagnetische Felder in Materie
Wenn die Volumeneinheit im Dielektrikum mit N derartigen Oszillatoren
gleichförmig∗) ausgefüllt ist, so gilt für die ~k-ten Fourierkomponenten der Polarisationsdichte und des elektrischen Feldes
P~ (~k, t) =
N q 2 /m
~ ~k, t) ,
E(
ω02 − ω 2 + i2γω
(7.54)
solange die Wellenlänge λ = 2π/|~k| groß gegenüber dem mittleren Teilchenabstand (≈ N −1/3 ) ist. Für die Dielektrizitätskonstante folgt aus (7.54)
²(ω) = n(ω)2 = 1 +
ω02
N q 2 /m²0
.
− ω 2 + i2γω
(7.55)
Aus (7.55) entnehmen wir zunächst, dass der Imaginärteil n00 (ω) des Brechungsindex stets negativ ist. Eine in das Medium aus harmonischen Oszillatoren eindringende Welle wird also gedämpft. Unser Modell ist nicht geeignet,
verstärkende Medien zu beschreiben. Die Dämpfung einfallender Wellen ist offenbar am stärksten für Frequenzen ω nahe der Eigenfrequenz ω0 , d. h. bei
Resonanz.
Für ω ≈ ω0 zeigt auch der Realteil des Brechungsindex eine für Resonanzphänomene typische starke Frequenzabhängigkeit. Beachten Sie übrigens,
dass für ω > ω0 der Realteil n0 kleiner als eins, die Phasengeschwindigkeit also
größer als die Lichtgeschwindigkeit im Vakuum ist.
7.5
Ohmsches Gesetz
Anders als in Dielektrika treten in elektrischen Leitern stets Ladungen auf, die
nicht an Ruheladungen gebunden, sondern über das ganze Volumen des jeweiligen Körpers beweglich sind. Zum Beispiel besteht ein Metall aus beweglichen
Leitungselektronen und positiv geladenen Ionen, die elastisch an Gleichgewichtslagen gebunden sind.
Ein auf einen Leiter eingeprägtes elektrisches Feld beschleunigt jedes bewegliche geladene Teilchen und bewirkt somit einen elektrischen Strom. Insbesonde~ in einem räumlich
re erzeugt ein nicht aus starkes statisches homogenes Feld E
homogenen und isotropen Leiter eine Stromdichte, die durch das Ohmsche Gesetz
~
~j = σ E
(7.56)
beschrieben wird. Die Materialkonstante σ heißt die elektrische Leitfähigkeit.
Eine elementare gaskinetische Modellvorstellung für die beweglichen Ladungen in einem Leiter besagt, dass sich jede dieser Ladungen bei Abwesenheit
eines eingeprägten Feldes frei bewegt bis auf gelegentlich Stöße in mittlerem
zeitlichen Abstand τ . Bei Stoß ändert sich im Mittel zwar nicht der Betrag der
Geschwindigkeit, wohl aber ihre Richtung, u. z. in jeweils beliebiger Weise ohne
Bevorzugung irgendeiner Orientierung. Da die mittlere Geschwindigkeit eines
∗) Gleichförmig heißt, dass bei immer feinerer Unterteilung des Gesamtvolumens gleich große
Teilvolumina ∆V bis auf vernachlässigbare Schwankungen gleich viele Teilchen enthalten,
solange N ∆V À 1.
7.6 Wellen in Leitern
139
Haufens solchermaßen bewegter Teilchen gleich Null ist (s. Abbildung 7.1), verschwinden alle hinreichend langwelligen Fourierkomponenten der Stromdichte
und insbesondere die
Abbildung 7.1
~k = 0-Komponente, die einem räumlich homogenen Strom entspricht. Bei Anlegen eines elektrischen Feldes ändert sich die geschilderte Situation nur insofern,
als sich die Geschwindigkeit eines beweglichen Teilchens der Masse m und der
Ladung q zwischen zwei Stößen um
~ /m
~u = q Eτ
(7.57)
erhöht. Im Mittel werden alle beweglichen Ladungen mit der Geschwindig~ driften, so dass N die Volumeneinheit gleichförmig
keit ~u längs des Feldes E
ausfüllende gleiche Ladungen die Stromdichte
~
~j = N q~u = (N q 2 τ /m)E
(7.58)
tragen. Aus (7.58) lesen Sie für die Leitfähigkeit des Modells ab
σ = N q 2 τ /m .
7.6
(7.59)
Wellen in Leitern
Der statische Fall (7.56) des Ohmschen Gesetzes verallgemeinert sich für Wellen
der Frequenz ω in homogenen und isotropen Leitern zu
~ ~k, ω) .
~j(~k, ω) = σ(ω)E(
(7.60)
Der Beschreibung der entsprechenden Wellen lege ich die Maxwellschen Gleichungen in der Form
~k · E(
~ ~k, ω)
~k · B(
~ ~k, ω)
=
0,
=
0,
~k × E(
~ ~k, ω)
~ ~k, ω)
i~k × B(
=
=
~ ~k, ω)
− ω B(
1
² 0 c2
~ ~k, ω)
~j(~k, ω) + i ω2 E(
c
(7.61)
140
7 Elektromagnetische Felder in Materie
zugrunde. Dabei sind die Polarisierbarkeit und Magnetisierbarkeit aller Komplexe aneinander gebundener Ladungen vernachlässigt sowie elektrische Neutralität
des Leiters bezüglich der Längenskala λ = 2π/|~k| angenommen.
Nach Eintragen des Ohmschen Gesetzes (7.60) in die Maxwellschen Glei~ ergibt sich ähnlich
chungen (7.61) und nach Elimination des Induktionsfeldes B
wie in 7.3
1 ~
~ = 1 (σ(ω)/²0 + iω)E
~ .
~ = i 1 k2 E
(7.62)
k × (~k × E)
ω
ω
c2
Als Dispersionsrelation elektromagnetischer Wellen in Leitern entnehmen wir
hieraus
¶
µ
σ(ω)
c2 k 2 = ω 2 1 +
.
(7.63)
iω²0
−i
Wie im Dielektrikum lässt sich die Abweichung der Dispersionsrelation von der
des Vakuums wieder durch einen frequenzabhängigen Brechungsindex
n(ω) =
µ
¶1/2
σ(ω)
1+
iω²0
(7.64)
beschreiben. Daher gilt das in 7.3 über Phasengeschwindigkeit und Eindringtiefe
der Welle Dargelegte ohne Änderung auch für Wellen in Leitern.
Das in 7.4 beschriebene Modell eines Dielektrikums lässt sich übrigens auch
auf Leiter übertragen, indem in (7.52) die Rückstellkraft mω02 ξ, d. h. die Eigenfrequenz ω0 Null gesetzt und die Dämpfungskonstante γ mit der mittleren
Stoßzeit mittels 2γ = 1/τ verknüpft wird. Durch Vergleich von (7.55) und (7.64)
erhalten wir dann die frequenzabhängige Leitfähigkeit des Modells zu
σ(ω) =
σ
N q 2 τ /m
=
.
1 + iωτ
1 + iωτ
(7.65)
Im Grenzfall ωτ → 0 reduziert sich dieses Resultat auf die in (7.59) gegebene
statische Leitfähigkeit σ(0) ≡ σ.
Kapitel 8
Symmetrien
8.1
Der Raum ist homogen
Eine in Essen arbeitende Maschine funktioniert gleichermaßen auf dem Kahlen
Asten, vorausgesetzt, alle den Lauf der Maschine beeinflussenden Umweltbedingungen (je nach Gerät verschieden, z. B. Temperatur, Luftdruck, Luftfeuchtigkeit, Luftzusammensetzung, elektrische und magnetische Felder) werden gleich
gestellt. Mit gewissem Aufwand an Technik und Geld lassen sich manche Maschinen auch auf dem Mond betreiben. Einschränkend muss notiert werden,
dass Großvaters Pendeluhr, auf den Mond gebracht, langsamer als zu Hause ticken würde; die Synchronisierung der Ticks der häuslichen Pendeluhr mit denen
des auf dem Mond tickenden Duplikats durch Vergrößerung des Gravitationsfeldes des Mondes um einen Faktor 6 (entsprechend den Radien und Massen von
Mond und Erde) ist uns nicht möglich.
Kein Punkt im Raum ist vor irgendeinem anderen Punkt ausgezeichnet. Das
heißt, was an einem Punkt physikalisch bewirkt werden kann, ist auch anderswo
zu bewerkstelligen. Der beschriebene Sachverhalt, eine Erfahrungstatsache, ist
zwar umgangssprachlich nur mangelhaft präzisierbar, hat aber in allen Grundgesetzen der Physik einen wichtigen Niederschlag: keines dieser Grundgesetze
zeichnet irgendeinen Punkt im Universum aus.
Es folgt, dass alle Grundgesetze der Physik, wenn als Gleichungen für ortsabhängige Größen geschrieben, ihre Form nicht ändern, wenn der Koordinatenursprung verschoben wird. Alle Grundgesetze bleiben formgleich bei der
Koordinatentransformation
~x0 = ~x + d~
t0 = t ,
(8.1)
die einer zeitunabhängigen Verschiebung des Ursprungs um d~ entspricht.
Prüfen wir diese Invarianz am Beispiel des Newtonschen Grundgesetzes F~ =
m~a, welches die Beschleunigung ~a eines Teilchens der Masse m mit der auf
das Teilchen wirkenden Kraft F~ verknüpft. Die Masse m des Teilchens ist in
beiden Koordinatensystemen die gleiche. Da beide Koordinatensysteme parallele Achsen haben, sind die Komponenten des am Ort des Teilchens wirkenden
Kraftvektors bezüglich der einander entsprechenden Achsen gleich. Die in den
141
142
8 Symmetrien
Abbildung 8.1
beiden Systemen messbaren Beschleunigungen sind ebenfalls gleich, da wegen
der Zeitunabhängigkeit von d~ gilt
~
d2 ~x0
d2 ~x0
d2 (~x + d)
d2 ~x
=
=
= 2 .
02
2
2
dt
dt
dt
dt
Wenn also im Koordinatensystem S das Newtonsche Gesetz F~ = m~a gilt, so
~ 0 . Wie in Essen,
gilt es auch mit ungeänderter Form im Koordinatensystem S
so auf dem Kahlen Asten.
Drücken wir’s vornehmer aus! Die Homogenität des Raumes ist gleichbedeutend mit der Invarianz der Grundgesetze unter Translationen des Koordinatensystems. Dies ist keine nur esoterische Weisheit sondern eine prägnante Zusammenfassung vieler praktischer Erfahrungen. Insbesondere ist die Erfahrung
beinhaltet, dass der Gesamtimpuls eines abgeschlossenen Systems (abgeschlossen = keine äußeren Einwirkungen) zeitlich konstant bleibt. Zeigen wir das am
Beispiel eines mechanischen Systems, das wir uns als einen Haufen wechselwirkender Teilchen vorstellen können.
Die Wechselwirkung der Teilchen im Haufen werden beschrieben mit Hilfe
der potenziellen Energie U (~x1 , ~x2 , . . .), die von den Ortsvektoren ~x, aller Teilchen abhängt. Wegen der Homogenität des Raumes ändert sich die potenzielle
Energie nicht, wenn zu allen Ortsvektoren ~x, derselbe zeitunabhängige Vektor
d~ addiert wird,
~ ~x2 + d,
~ . . .) .
U (x~1 , x~2 , . . .) = U (~x1 + d,
~ so
Differenzieren wir diese Gleichung nach der i-ten Komponente des Vektors d,
erhalten wir unter Benutzung der Kettenregel
8.2 Der Raum ist isotrop
0=
∂
~ ~x2 + d,
~ . . .)
U (~x1 + d,
∂di
=
X
ν
=
X
ν
143
∂
~ ~x2 + d,
~ . . .)
U (~x1 + d,
∂xνi
∂
U (~x1 , ~x2 , . . .).
∂xνi
Nun ist −∂U/∂xνi , gerade die i-te Komponente der auf das ν-te Teilchen wirkenden Kraft und wir erkennen, dass die Summe der Kräfte auf alle Teilchen für
einen abgeschlossenen Haufen verschwindet. Wenn das abgeschlossene System
insbesondere nur aus zwei Teilchen besteht, so ergibt sich Newtons berühmtes
Gesetz actio = reactio. Um auch den Impulserhaltungssatz zu erschließen,
schauen wir die Bewegungsgleichung des ν-ten Teilchens an,
µ
¶
∂
∂
∂
d2 ~xν
=
−∇
U
=
−
U,
U,
U
,
mν
ν
dt2
∂xν1
∂xν2
∂xν3
und summieren über alle Teilchen. Da die Summe der Kräfte verschwindet,
finden wir
−
X
ν
∇ν U = 0 =
Also bleibt die Größe
X
mν
d2 ~xν
dxν
d X
mν
=
.
2
dt
dt ν
dt
X
mν
ν
P~ =
ν
d~xν
,
dt
die wir Gesamtimpuls des Haufens nennen, zeitlich konstant,
d ~
P =0.
dt
Nicht nur die Grundgesetze der Mechanik, sondern alle Grundgesetze der
Physik sind invariant unter Translationen des Koordinatensystems. Dementsprechend gilt der Impulserhaltungssatz auch allgemeiner als nur für rein mechanische abgeschlossene Systeme (die es streng genommen gar nicht gibt). Betrachten wir etwa einen Haufen geladener Teilchen, die über das von ihnen erzeugte elektromagnetische Feld wechselwirken, ohne dass äußere Einflüsse wirksam wären. Da alle zur Beschreibung dieses Systems einschlägigen Grundgesetze
translations-invariant sind, bleibt der Gesamtimpuls des Systems zeitlich konstant. Allerdings tragen nicht nur die Teilchen, sondern auch das von ihnen
erzeugte elektromagnetische Feld zum Gesamtimpuls bei. Erinnern Sie sich an
den Comptoneffekt!
8.2
Der Raum ist isotrop
Die Naturgesetze zeichnen nicht nur keinen Punkt des Universums aus, sondern
auch keine Richtung im Raum. Zwar gibt es in vielen physikalischen Systemen
eine oder gar mehrere ausgezeichnete Richtungen, aber solche Anisotropien sind
stets erzeugt durch Materiekonfigurationen; werden letztere gedreht, so drehen
144
8 Symmetrien
sich die ausgezeichneten Richtungen mit, ohne dass sich irgendeine andere Eigenschaft ändert.
Denken wir an die Schwerkraft an der Erdoberfläche, die im Labor die von
unten nach oben“ weisende Richtung auszeichnet. Die Schwerkraft wird von
”
der Erde erzeugt. Dreht man die Erde, so dreht sich die ausgezeichnete Richtung. Die Isotropie des Raumes zeigt sich bei diesem Beispiel darin, dass viele
Laborexperimente um 12 Uhr mittags die gleichen Resultate geben wie abends
um 6 Uhr. Viele, nicht alle: messen Sie den Wasserpegel an der Atlantikküste
und bemerken die durch Sonne und Mond bewirkten zusätzlichen Anisotropien
des Gravitationsfeldes an der Erdoberfläche. Also verfeinern wir die Aussage:
schwerkraftempfindliche Laborexperimente verlaufen gleich, wenn gleiche Konstellation von Labor, Erdmittelpunkt, Mond und Sonne vorliegt.
Die allgemeine und präzise Fassung der geschilderten Erfahrung von der
prinzipiellen Gleichberechtigung aller Richtungen besagt, dass alle Grundgesetze
invariant sind unter Rotationen des Koordinatensystems. Um diese Aussage für
konkrete Gesetze nachprüfen zu können, müssen wir uns überlegen, wie sich die
Koordinaten eines Punktes bei Drehung der Koordinatenachsen ändern.
Betrachten wir der Einfachheit halber eine reine Rotation (keine Nullpunktverschiebung) um den Winkel ϕ bezüglich der z-Achse. Sie sehen leicht anhand
von Abbildung 8.2, dass
Abbildung 8.2
x0
=
x cos ϕ + y sin ϕ
y0
=
z0
=
−x sin ϕ + y cos ϕ
0
=
t
bzw.
x
=
y
=
x0 cos ϕ − y 0 sin ϕ
x0 sin ϕ + y 0 cos ϕ
z
t,
wobei letztere Gleichung ausdrückt, dass zwar nicht eine Pendeluhr, wohl aber
eine sorgfältig konstruierte Armbanduhr unverändert geht, wenn sie auf den
Kopf gestellt wird.
Prüfen wir die Rotationsvarianz der Newtonschen Bewegungsgleichheit für
ein Teilchen,
d2 ~x
(8.3)
F~ = m 2 .
dt
Drücken wir die Beschleunigung durch die Koordinaten im gedrehten System
aus, so ergibt sich
8.2 Der Raum ist isotrop
d2 x
dt2
=
d2 x 0
d2 y 0
cos ϕ − 0 2 sin ϕ
02
dt
dt
d2 y
dt2
=
d2 x 0
d2 y 0
sin ϕ + 0 2 cos ϕ .
02
dt
dt
145
(8.4)
Die Komponenten der auf das Teilchen wirkenden Kraft F~ erhalten wir durch
Projektion des Kraftvektors auf die gedrehten Koordinatenachsen, genau wie
sich die Transformationsformel für die Koordinaten durch Projektion des Ortsvektors ~x gewinnen lassen,
Fx
=
Fy
=
Fx0 cos ϕ − Fy 0 sin ϕ
Fx0 sin ϕ + Fy 0 cos ϕ .
(8.5)
Da die Masse des Teilchens natürlich unabhängig von der Orientierung der Koordinatenachsen ist (ob Sie sich auf eine Waage stellen oder legen, ist für Ihr
Gewicht unerheblich), müssen wir nicht zwischen m und m0 unterscheiden. Tragen wir nun die Transformationen (8.4) und (8.5) in die Bewegungsgleichungen
(8.3) ein, so finden wir
Fx0 cos ϕ − Fy 0 sin ϕ
= m
d2 y 0
d2 x 0
cos ϕ − m 0 2 sin ϕ
02
dt
dt
Fx0 sin ϕ − Fy 0 cos ϕ
= m
d2 x 0
d2 y 0
sin ϕ + m 0 2 cos ϕ .
02
dt
dt
(8.6)
Da diese Gleichungen für beliebige Drehwinkel ϕ gelten, also z. B. für ϕ = π2 und
ϕ = 0, ergibt sich als Satz von Bewegungsgleichungen im Koordinatensystem S 0
d2 ~x0
(8.7)
F~ 0 = m 0 2 ,
dt
der formgleich ist mit dem Satz (8.3) im System S. Wenn also (8.3) in S gilt,
so gilt auch (8.7) in S 0 .
Wir können auch so argumentieren: Die Koordinaten x, y, z, die Komponenten Fx , Fy , Fz wie die Komponenten der Beschleunigung bilden jeweils
einen Vektor; alle diese Vektoren transformieren sich gleichartig bei Drehung des
Koordinatenkreuzes, wie aus (8.2), (8.4), (8.5) ersichtlich. Wenn daher die beiden Vektoren F~ und md2 ~x/dt2 in einem Koordinatensystem übereinstimmen,
so auch in einem beliebig zu diesem verdrehten.
Haben Sie bisher einen Vektor als eine Größe angesehen, die durch Betrag
und Richtung charakterisiert ist und auch durch ihre Komponenten bezüglich
eines Achsenkreuzes spezifiziert werden kann? Dann präzisieren wir diese Auffassung jetzt. Ein Zahlentripel, das sich bei Drehung des Koordinatensystems
ebenso transformiert wie die Koordinaten x, y, z, ist ein Vektor. Die Bedeutung
dieser Begriffsbildung liegt darin, dass die Rotationsinvarianz von Naturgesetzen
der Form
~ =V
~,
U
z. B.
F~ = m~a
(8.8)
146
8 Symmetrien
~ und V
~ Vektoren sind, die in irgendeinem Koordinatenevident wird. Wenn U
system übereinstimmen, so gilt die Gleichheit auch in allen verdrehten Koordinatensystemen.
Ein verwandter, Ihnen ebenfalls bekannter Begriff ist der Skalar. Eine
Größe ϕ heißt skalar, wenn sie sich bei Drehung des Koordinatensystems gar
nicht ändert. Beispiele sind Masse, Ladung, Volumeninhalt, Ladungsdichte
etc. Selbstverständlich sind Naturgesetze, die sich als Gleichheit zweier Skalare schreiben lassen, invariant unter Rotationen. So zum Beispiel gilt, dass
Ladungen die Quellen des elektrischen Feldes sind, in allen zueinander verdreh~ = ρ/²0 .
ten Koordinatensystemen in der Form divE
Wir hatten oben eine spezielle Rotation (Drehung um z-Achse um Winkel
ϕ) betrachtet. Bei allgemeinen Drehungen mischen sich alle drei räumlichen
Koordinaten linear, während gleiche Uhren in zueinander gedrehten Systemen
immer mit gleicher Frequenz ticken,
x0
=
R11 x + R12 y + R13 z
y
0
=
R21 x + R22 y + R23 z
z
0
=
R31 x + R32 y + R33 z
t0
=
t.
(8.9)
Die neun Koeffizienten Rij der Linearkombination lassen sich, wie Sie gelernt
haben oder nachlesen können, stets durch drei Parameter (z. B. Eulersche Winkel) festlegen. Überzeugen wir uns davon, indem wir ausnutzen, dass sich das
~,
Längenquadrat eines beliebigen Vektors V
~ 2 = Vx2 + Vy2 + Vz2 ,
V
(8.10)
bei beliebiger Drehung des Koordinatensystems nicht ändern kann, also ein
Skalar ist.
Um die Betrachtung bequem aufschreiben zu können, vereinbaren wir eine
Neubenennung der Vektorkomponenten gemäß
Vx = V 1 ,
Vy = V 2 ,
Vz = V 3 .
(8.11)
Dann schreibt sich die Transformation (8.9) als
xi =
3
X
Rij xj
(8.12)
Vi2 .
(8.13)
j=1
~ 2 als
und als Längenquadrat V
~2 =
V
3
X
i=1
~ 2 offenbar ein Skalar ist, gilt
Da V
X
i
0
Vi 2 =
X
i
Vi2 =
X
ijk
Rij Rik Vj Vk ,
(8.14)
8.2 Der Raum ist isotrop
147
oder
X
jk
Ã
δjk −
X
Rij Rik
i
!
Vj Vk = 0 .
(8.15)
~ beliebig ist, folgt
Da der Vektor V
3
X
Rij Rik = δjk .
(8.16)
i=1
(Vollziehen Sie den Schluss selbst im Detail nach, indem Sie nacheinander ge~ treffen; beachten Sie die Symmetrie von P Rij Rik unter
eignete Wahlen für V
i
Vertauschung der Indices j und k.)
Wir haben in (8.16) sechs unabhängige Gleichungen für die neun Matrixelemente Rij . Es folgt, dass die Drehmatrix R drei freie Parameter enthält.
Wenn wir beachten, dass Rij das ji-Element der zu R transponierten Matrix
R̃ ist, so können wir (8.16) als die Matrixgleichung
R̃R = 1
(8.17)
schreiben und folgern, dass die zu R inverse gleich der transponierten Matrix
ist,
R̃ = R−1 .
(8.18)
Dieser Zusammenhang liefert uns die Umkehrung der Transformation (8.12)
X
xi =
(8.19)
Rji x0j .
j
Ebenso wie die Translationsvarianz der Grundgesetze hat auch die Rotationsinvarianz viele höchst wichtige und praktische Konsequenzen. Eine davon ist, dass der Gesamtdrehimpuls eines abgeschlossenen Systems eine zeitlich
konstante Größe ist. Es lohnt sich, diesen wichtigen Erhaltungssatz für einen
abgeschlossenen Haufen wechselwirkender Teilchen zu verifizieren.
Wir nutzen aus, dass die potenzielle Energie U (~x1 , ~x2 , . . .) des Haufens ein
Skalar sein muss. Für eine beliebige Rotation muss also gelten
U (~x1 , ~x2 , . . .) = U (~x01 , ~x02 , . . .),
(8.20)
wobei ~x0ν = (x0ν1 , x0ν2 , x0ν3 ) = (x0ν , yν0 , zν0 ) das Koordinatentripel des ν-ten Teilchens im gedrehten System bezeichnet. Insbesondere muss die Gleichung (8.20)
gelten für eine so genannte differenzielle Rotation, d. h. eine Drehung um einen
sehr kleinen Winkel δϕ bezüglich einer beliebigen Achse. Solche differenziellen Rotationen können durch einen Vektor δ ϕ
~ charakterisiert werden, dessen
Richtung die Drehachse und dessen Betrag den Drehwinkel δϕ = |δ ϕ
~ | angeben
(wobei, so die übliche Konvention, im Sinne einer Rechtsschraube gedreht wird).
Offenbar ändern sich bei einer differenziellen Rotation die Komponenten
~ nur wenig. Wir können schreiben
eines vorgegebenen Vektors V
~0 =V
~ + δV
~
V
(8.21)
148
8 Symmetrien
~ durch folgende einfache Überlegung. Der
und finden die kleine Änderung δ V
vorgegebene Vektor selbst ändert sich bei der Drehung des Koordinatensystems
~ 0 in (8.21) meint
um δ ϕ
~ natürlich nicht (nur seine Koordinaten ändern sich; V
das Koordinatentripel des Vektors im gedrehten System). Denken wir uns aber
ein Duplikat dieses Vektors, welches vor Ausführung der Drehung des Koordinatendreibeins mit dem vorgegebenen Vektor übereinstimmt, bei der Drehung
des Dreibeins zum System S 0 jedoch starr mitgeführt wird. Das Duplikat ist ein
vom vorgegebenen Vektor verschiedener Vektor; die Komponenten des Duplikats bezüglich des Systems S 0 sind jedoch numerisch gleich den Komponenten
des vorgegebenen Vektors bezüglich des ursprünglichen Koordinatensystems S,
da das Duplikat im System S 0 genauso orientiert ist wie der vorgegebene Vektor
im System S. Die in S 0 ausgedrückte Differenz zwischen dem mitgeführten Du~ in (8.21).
plikat und dem stehengebliebenen Original ist genau die Änderung δ V
Wir erhalten sie als die Änderung, die das Duplikat erleiden würde, wenn es, losgelöst vom Dreibein S 0 , um −δ ϕ
~ gedreht, also ins Original zurückrotiert würde.
~ | = |V
~ | sin Θδψ und ferner, dass δ V
~
Ein Blick auf die Abbildung 8.3 enthüllt |δ V
senkrecht auf der
Abbildung 8.3
~ aufgespannten Ebene steht, so dass δ V
~×V
~ und δ ψ
~ = δψ
~ bei Drehung
von V
~ Wir haben die Drehung des Vektors V
~ = −δ ϕ
~ um δ ψ
um δ ψ.
~ in Rechnung zu
stellen und finden als explizite Form der Transformation (8.21)
~0 =V
~ +V
~ × δϕ
V
~ .
(8.22)
Ihnen bleibt zur Übung überlassen, diese infinitesimale Rotation des Koordinatensystems in die Form (8.12) zu bringen und die zugehörige Drehmatrix
aufzuschreiben.
Jetzt können wir uns vollends schnell klarmachen, dass, wie behauptet,
der Gesamtdrehimpuls eines abgeschlossenen Teilchenhaufens zeitlich konstant
bleibt. Benutzen wir (8.20) für die infinitesimale Rotation (8.22),
U ({~xν + ~xν × δ ϕ
~ }) − U ({~xν }) = 0 .
(8.23)
Entwickeln wir links nach Potenzen von δ ϕ
~ bis zum Glied erster Ordnung, so
erhalten wir
8.2 Der Raum ist isotrop
X ∂U ({~xν })
v,i
∂xνi
(~xν × δ ϕ
~ )i = 0 .
149
(8.24)
Erinnern wir uns, dass −∇ν U gerade die auf das ν-te Teilchen wirkende Kraft
F~ν ist und beachten die zyklische Invarianz des Spatprodukts gemäß
−
X
ν
F~ν · (~xν × δ ϕ
~ ) = +δ ϕ
~·
X
(~xν × F~ν ) = 0 .
(8.25)
ν
Es erscheint das Skalarprodukt des Drehvektors δ ϕ
~ mit der Summe der Drehmomente ~xν × F ~ν der Kräfte F ~ν . Da der Drehwinkel ganz beliebig orientiert
sein darf, schließen wir, dass die Summe der Drehmomente der Kräfte auf alle
Teilchen des abgeschlossenen Haufens verschwindet.
Das zeitliche Verhalten des Gesamtdrehimpulses finden wir, indem wir die
Bewegungsgleichung des ν-ten Teilchens vektoriell mit dem Ortsvektor ~x ν multiplizieren,
d2 ~xν
= ~xν × F~ν
dt2
und nun diese Gleichungen für alle Teilchen additiv zusammenfassen,
~xν × mν
X
ν
~xν × mν
X
d d~xν
=
~xν × F~ν = 0 .
dt dt
ν
(8.26)
(8.27)
Wegen ~xν × ~xν = 0 können wir die linke Seite als eine totale Zeitableitung
schreiben und finden den Erhaltungssatz
~
d X
d~xν
dL
=
=0.
~xν × mν
dt ν
dt
dt
(8.28)
Die erhaltene Größe ist der Vektor des Gesamtdrehimpulses der Teilchen
~ =
L
X
ν
~xν × mν
d~xν
.
dt
(8.29)
Die somit vollzogene Herleitung des rein mechanischen Drehimpulserhaltungssatzes beginnt mit der Annahme, dass die Wechselwirkung der Teilchen
durch eine potenzielle Energie U ({~xν }) beschreibbar sei und ist somit kritikbedürftig. Anstatt eine allgemeine und abstrakte Kritik zu geben, verweise ich
wieder auf das Beispiel eines abgeschlossenen Haufens geladener Teilchen. Die
Wechselwirkung solcher Teilchen über das von ihnen selbst erzeugte elektromagnetische Feld kann nicht durch eine potenzielle Energie U ({~xν }) beschrieben
werden. Denken wir nur daran, dass das elektromagnetische Feld eines Teilchens
sich mit der Lichtgeschwindigkeit ausbreitet. Befindet sich also ein Teilchen zur
Zeit t am Ort ~xν , so kann sich dieser Sachverhalt andernorts auf andere Teilchen erst zu späteren Zeitpunkten auswirken. Eine derart retardierte Wechselwirkung zwischen Teilchen kann offenbar nicht durch eine potenzielle Energie
U (~x1 (t), ~x2 (t), . . .), in die alle Teilchenkoordinaten zu einer Zeit eingehen, beschrieben werden.
Die Ausschlachtung der Rotationsinvarianz der Maxwellschen Gleichungen
und der Teilchenbewegungsgleichungen zugleich, die hier nicht vorgenommen
150
8 Symmetrien
werden kann, ergibt, dass sowohl die Teilchen wie das von ihnen erzeugte elektromagnetische Feld einen Drehimpuls haben. Erst die Summe beider Beiträge
liefert den zeitlich erhaltenen Gesamtdrehimpuls für das abgeschlossene System
geladener Teilchen.
8.3
Die Zeit ist homogen
Als Leonardo da Vinci (1452 - 1519) Maschinen baute, machte er sich Grundgesetze zunutze (wenn diese auch noch nicht alle formuliert gewesen sein mögen),
die heute noch unverändert gelten. Wir haben auch keinen Grund zu der Annahme, dass für künftige Ingenieurgenerationen die Maxwellschen Gleichungen
außer Kraft geraten könnten. Mit anderen Worten, in den Grundgesetzen ist
kein Zeitpunkt ausgezeichnet, die Grundgesetze sind alle invariant unter Verschiebungen des Zeitnullpunktes
t0
=
t+τ
x0
=
x, y 0 = y, z 0 = z .
(8.30)
Auch diese Symmetrie der Natur bzw. Invarianz der Grundgesetze impliziert
einen Erhaltungssatz für abgeschlossene Systeme, den der Energie.
Bei einem abgeschlossenen rein mechanischen Teilchenhaufen, bei dem die
Wechselwirkungen durch eine potenzielle Energie U ({~xν }) beschreibbar sind,
bedeutet die Gleichberechtigung aller Zeitpunkte, dass U nicht explizit von der
Zeit abhängt. Allein aus dieser Annahme aber hatten wir in 2.9 gefolgert, dass
die mechanische Gesamtenergie
E=
X 1
mν ~x˙ 2ν + U ({~xν })
2
ν
(8.31)
zeitlich erhalten bleibt.
Für ein abgeschlossenes System, das aus geladenen Teilchen und ihrem elektromagnetischen Feld besteht, hatten wir in 6.4 den Energieerhaltungssatz hergeleitet. Die für das abgeschlossene System erhaltene Gesamtenergie hat einen
rein mechanischen, einen rein elektromagnetischen Anteil sowie einen Wechselwirkungsanteil. Der Nachweis der Konstanz der Gesamtenergie macht wesentlichen Gebrauch von der Tatsache, dass weder die Bewegungsgleichungen der
Teilchen noch die Maxwellschen Gleichungen irgendeinen Zeitpunkt auszeichnen.
8.4
Galileiinvarianz
Denken wir uns zwei identische Labors, die sich relativ zueinander gleichförmig
bewegen. In beiden werde das gleiche Experiment durchgeführt. Nach aller
Erfahrung ergeben sich gleiche Messresultate. Ohne Beobachtung der Außenwelt kann in keinem Labor festgestellt werden, ob das Labor ruht oder sich in
gleichförmiger Bewegung befindet.
Dieser Erfahrungstatsache entspricht eine Invarianz aller Grundgesetze: alle
Naturgesetze haben in allen gleichförmig zueinander bewegten Koordinatensystemen die gleiche Form. Das ist das so genannte Relativitätsprinzip.
8.4 Galileiinvarianz
151
Um die erwähnte Invarianz konkreter formulieren zu können, müssen wir uns
klarmachen, wie sich die Koordinaten eines Raum-Zeitpunktes in gleichförmig
gegeneinander bewegten Koordinatensystemen ineinander umrechnen lassen.
Wenn sich das System S vom System S 0 aus gesehen mit der Geschwindigkeit
~u bewegt, so gilt gemäß der Galileitransformation
~x0
= ~x + ~ut
t0
=
t,
(8.32)
falls entsprechende Achsen von S und S 0 zueinander parallel sind und die Ursprünge zur Zeit t = t0 = 0 zusammenfallen. Naturgesetze, die bei der Galileitransformation (8.32) ihre Form behalten, heißen galileiinvariant.
Bekanntlich entspricht die Galileiinvarianz nur einer näherungsweise gültigen
Symmetrie der Natur. Die Galileitransformation (8.32) ist zwar vom Alltag
geläufig und daher anschaulich, ist jedoch, wie später auszuführen sein wird,
völlig unbrauchbar, wenn die Relativgeschwindigkeit ~u betragsmäßig nicht vernachlässigbar ist gegenüber der Lichtgeschwindigkeit.
Die Newtonsche Mechanik für Teilchenhaufen, die über ihre Gravitationsanziehung wechselwirken, ist eine galileiinvariante Theorie. Für das ν-te Teilchen
in einem solchen Haufen gilt die Bewegungsgleichung
mν
X mν mµ (~xµ − ~xν )
d2 ~xν
=G
.
2
dt
|~xµ − ~xν |3
(8.33)
µ(6=ν)
Da die Teilchenmassen in allen galileischen Koordinatensystemen (d. h. Koordinatensystemen, die durch Galileitransformationen verknüpft sind) gleich sind
und da gemäß (8.32)
d2 ~xν
d2 ~x0ν
=
,
2
dt
dt0 2
~xµ − ~xν = ~x0µ − ~x0ν ,
(8.34)
folgt aus der Gültigkeit der Bewegungsgleichung
mν
X mν mµ (~xµ − ~xν )
d2 ~x0ν
=G
.
2
dt
|~xµ − ~xν |3
(8.35)
µ(6=ν)
Wie behauptet, ändert die Bewegungsgleichung ihre Form nicht unter Galileitransformationen.
Die Newtonsche Mechanik ist, ebenso wie die Galileitransformation, nur
näherungsweise richtig. Wir wissen heute, dass sie nur gilt, solange die Geschwindigkeit aller Teilchen vernachlässigbar klein ist im Vergleich zur Lichtgeschwindigkeit.
Bevor wir zur Besprechung der auch für große Relativgeschwindigkeiten
gültigen Koordinatentransformation übergehen, sollen zwei Eigenschaften der
Galileitransformation (8.32) besonders hervorgehoben werden. Beachten Sie,
was im Alltag selbstverständlich erscheint, dass die Zeitkoordinate in allen Koordinatensystemen die gleiche ist und dass in t0 = t die räumlichen Koordinaten
nicht eingehen. Gemäß der Galileitransformation sollte eine gleichförmig bewegte Uhr gleich schnell gehen wie eine ruhende.
152
8 Symmetrien
Betrachten wir auch, dass die Galileitransformation das uns geläufige Additionsgesetz für Geschwindigkeiten beinhaltet. Lesen wir (8.32) als Zusammenhang
zwischen den Koordinaten ~x(t) und ~x0 (t) eines gleichförmig bewegten Teilchens
und differenzieren nach der Zeit. Mit ~v = d~x/dt und ~v 0 = d~x/dt entsteht das
Gesetz
Abbildung 8.4
welches durch Abbildung 8.4 veranschaulicht ist. Geschwindigkeiten addieren
sich wie Vektoren.
8.5
Lorentzinvarianz
Während eine bewegte Uhr 10 mal tickt, tickt eine gleich gebaute ruhende Uhr
auch 10 mal? Experimente mit Armbanduhren und Schnellzügen legen eine
bejahende Antwort nahe. Experimente mit hinreichend schnellen Teilchen erzwingen das Nein: die bewegte Uhr geht langsamer als die ruhende Kopie.
Ein lustiges Beispiel geben µ Mesonen, die im äußeren Teil der irdischen
Atmosphäre (einige 10 km über der Erdoberfläche) durch dort einfallende kosmische Strahlen erzeugt und dabei mit außerordentlich hohen Geschwindigkeiten ausgestattet werden. Nun sind Muonen instabile Teilchen. Ruhende
Muonen zerfallen durchschnittlich nach 2 · 10−6 s. Die Alltagserfahrungen mit
D-Zügen und Rennwagen lassen uns erwarten, dass Muonen, welche fast mit
Lichtgeschwindigkeit in Richtung Erdoberfläche rasen, im Durchschnitt etwa
3 · 105 (km/sec) · 2 · 10−6 s ≈ 600m weit fliegen, bevor sie zerfallen; demnach
sollten durch kosmische Strahlung erzeugte Muonen allenfalls in hoch fliegenden
Luftballons, nicht aber an der Erdoberfläche nachweisbar sein. Tatsächlich fallen
viele im Bodenlabor ein. Der unten noch ausführlicher zu diskutierende Grund
dafür ist dieser: während für die Muonen 2 · 10−6 s vergehen, verstreicht im Bodenlabor, relativ zu dem sich die Muonen schnell bewegen, eine viel längere Zeit
(die wir unten berechnen). Die Zeiteinheit mittlere Lebensdauer eines Muons“
”
beträgt ∼ 2 · 10−6 sec für eine mitbewegte Uhr, relativ zu der das Muon ruht,
jedoch mehr für die Uhr im Labor. Die für die Beschreibung schnell bewegter
Muonen einschlägigen Grundgesetze sind nicht galileiinvariant.
Auch die Alltagserfahrung, dass Geschwindigkeiten sich wie Vektoren addieren, wird hinfällig bei Experimenten mit schnellen Teilchen. Ein einleuchtendes
und historisch bedeutsames Beispiel gibt das Michelson-Morley Experiment, das
wir kurz besprechen wollen.
Bezüglich eines mit der Sonne starr verbundenen Koordinatensystems Ss
bewegt sich die Erde mit einer Geschwindigkeit von |~u| ≈ 30 km/sec. Durch
den Raum reisende Lichtsignale sollten, wenn das Vektoradditionsgesetz für
Geschwindigkeiten gilt, im System Ss eine andere Geschwindigkeit haben, als
8.5 Lorentzinvarianz
153
im mit der Erde fest verbundenen System SE . Gilt denn
?
~cS = ~cE + ~u ?
(8.36)
Es müsste dann, falls in Ss die Lichtgeschwindigkeit richtungsunabhängig ist,
auf der Erde eine Anisotropie der Lichtausbreitung feststellbar sein, d. h. eine Abhängigkeit der Lichtgeschwindigkeit |~cE | = ~cs − ~u vom Winkel zwischen
~u und ~cs . Das Michelson-Morley Experiment war darauf angelegt, eine derartige Anisotropie nachzuweisen. Das Resultat war negativ (übrigens zu allen
Jahreszeiten).
Ein positives Resultat des Michelson-Morley Experiments, d. h. eine Richtungsabhängigkeit des Beitrages der Lichtgeschwindigkeit (oder eine jahreszeitliche Schwankung solcher Anisotropie) für irdische Beobachter hätte das Relativitätsprinzip in Schwierigkeiten gebracht. Warum sollte die Lichtausbreitung im
heliozentrischen (oder in irgendeinem galaktischen) Koordinatensystem isotrop
sein, nicht aber im geozentrischen Koordinatensystem? Die experimentell gefundene Isotropie der Lichtausbreitung ist im Einklang mit dem Relativitätsprinzip
und zeigt, dass das vektorielle Additionsgesetz (1) für Geschwindigkeiten zumindest für Lichtausbreitung nicht richtig sein kann.
Erinnern wir uns an den Aufbau des Michelson-Morley Experiments. Auf
einem starren Rahmen montiert sind eine Lampe, ein halbdurchlässiger Spiegel
H, zwei Spiegel S1 und S2 sowie ein Schirm (Abbildung 8.5). Auf dem Schirm
entsteht durch Überlagerung der von S1 und S2 reflektierten Teilstrahlen ein
Interferenzmuster. Zunächst ist die Anordnung so orientiert, dass HS2 parallel
zur Bahngeschwindigkeit der Erde verläuft. Anschließend wird die Anordnung
um 90◦ gedreht, so das H S1 entlang der Erdbahn weist. Eine Anisotropie der
Lichtausbreitung auf Grund der Bewegung der Erde im heliozentrischen Bezugssystem müsste sich in einer Verschiebung des Interferenzmusters auf dem
Schirm zeigen. (Zur Übung machen Sie sich selbst wieder klar, welche Laufzeitunterschiede für die Phasen der Lichtwelle auftreten müssten, wenn (8.36)
gälte.) Tatsächlich ist keine Verschiebung beobachtbar.
Zu folgern ist, dass die Lichtgeschwindigkeit in allen gleichförmig zueinander bewegten Bezugssystemen gleich ist. Ebenfalls, dass die Naturgesetze, die
die Lichtausbreitung beschreiben, nicht galileiinvariant sein können, denn wir
hatten gesehen, dass die Galileitransformation die vektorielle Geschwindigkeitsaddition beinhaltet.
Wir werden sehen, dass die Koordinatentransformation zwischen gleichförmig
zueinander bewegten Koordinatensystemen eindeutig festgelegt ist durch die
Forderungen der Konstanz der Lichtgeschwindigkeit und der Isotropie und Homogenität des Raumes sowie der Homogenität der Zeit in allen diesen Koordinatensystemen. Die resultierende Koordinatentransformation ist die Lorentztransformation.
Wir werden uns auch klarmachen, dass die Maxwellsche Elektrodynamik,
d. h. die für Lichtausbreitung zuständige Theorie, lorentzinvariant ist; ferner,
wie die galileiinvariante Newtonsche Mechanik zu einer lorentzinvarianten Theorie verallgemeinert werden kann.
Halten wir fest: in allen Labors“, die gegeneinander verschoben, gekippt
”
oder gleichförmig bewegt aber ansonsten identisch sind, bringen gleiche Experimente gleiche Messergebnisse. Insbesondere die Lichtgeschwindigkeit hat in
154
8 Symmetrien
Abbildung 8.5
allen solchen Labors denselben Wert. Folglich müssen alle Grundgesetze invariant sein unter den Koordinatentransformationen Translation, Rotation und
Lorentztransformation entsprechend konstanter Relativgeschwindigkeit.
Kapitel 9
Spezielle Relativitätstheorie
9.1
Die Lorentztransformation der Koordinaten
Von einem Punkt ~x1 werde zur Zeit t1 (bezüglich irgendeines Koordinatensystems S) ein Lichtsignal ausgesandt und gelange zur Zeit t2 am Punkt ~x2 an.
Da Licht sich mit der endlichen Geschwindigkeit c ausbreitet, gilt zwischen den
Koordinaten ~x1 , t1 und ~x2 , t2 der Zusammenhang
(x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − c2 (t2 − t1 )2 = 0 .
(9.1)
0
In einem zu S mit konstanter Geschwindigkeit ~u bewegten System S haben
Aussendung und Ankunft des Lichtsignals andere Koordinaten, die wir ~x 01 , t01
bzw. ~x02 , t02 nennen können. Dabei müssen wir insbesondere auch die Möglichkeit
zulassen, dass t1 6= t01 ist, d. h. dass die Zeit ihre in der Galileitransformaiton
ausgezeichnete Rolle verliert. Da die Lichtgeschwindigkeit bezüglich S 0 den
gleichen Wert wie bezüglich S hat, gilt in S 0 auch
(x02 − x01 )2 + (y20 − y10 )2 + (z20 − z10 )2 − c2 (t02 − t01 )2 = 0 .
(9.2)
Um den folgenden Überlegungen eine anschauliche geometrische Interpretation geben zu können, denken wir uns ein vierdimensionales Koordinatensystem
mit drei räumlichen Achsen x, y, z und einer zusätzlichen Achse, auf der wir die
Zeit auftragen. Einen Punkt im Raum-Zeit-Kontinuum nennen wir ein Ereignis und definieren den Minkowskiabstand τ12 zweier Ereignisse ~x1 , t1 und ~x2 , t2
durch
2
−τ12
= (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − c2 (t2 − t1 )2 .
(9.3)
Gemäß dieser Definition haben zwei durch Lichtsignale verbundene Ereignisse den Abstand Null. Aus der Konstanz der Lichtgeschwindigkeit folgt, dass ein
in irgendeinem System S verschwindender Abstand auch in allen anderen dazu
gleichförmig bewegten Systemen S 0 verschwindet. Dies ist eine starke Forderung
an die Koordinatentransformation von S und S 0 .
Darüber hinaus muss die gesuchte Lorentztransformation auch nicht verschwindende Abstände invariant lassen, wenn nicht die in S etwa konstatierte
Homogenität und Isotropie des Raumes und die Homogenität der Zeit in S 0
verloren sein soll. Um diese weitere Forderung zu begründen, betrachten wir
155
156
9 Spezielle Relativitätstheorie
insbesondere zwei infinitesimal benachbarte Ereignisse, deren Koordinaten in
S ~x, t und ~x + d~x, t + dt bzw. in S 0 ~x0 , t0 und ~x0 + d~x0 , t0 + dt0 lauten. Die entsprechenden Abstände dτ und dτ 0 müssen, da im gleichen Sinn klein, einander
proportional sein
dτ 0 = adτ ,
(9.4)
wobei der Proportionalitätsfaktor a wegen der Homogenität von Raum und Zeit
nicht von ~x und t nicht von ~x und t abhängen darf. Bleibt zu diskutieren, ob
a von der Relativgeschwindigkeit ~u der beiden Systeme S und S 0 abhängen
kann. Aus der Isotropie des Raumes können wir sofort folgern, dass jedenfalls
die Richtung von ~u nicht in a eingehen darf, so dass allenfalls eine Abhängigkeit
vom Betrag |~u| in Frage kommt.
Um letztere Möglichkeit zu prüfen, betrachten wir drei Systeme S, S 0 und
00
S . Es mögen sich von S aus gesehen, S 0 mit ~v1 und S 00 mit ~v2 bewegen. Die
Relativgeschwindigkeit zwischen S 00 und S 0 heiße ~v12 . Für die Abstände der
beiden differenziell benachbarten Ereignisse haben wir die Relationen
dτ 0
=
a(|~v1 |)dτ
dτ 00
=
a(|~v2 |)dτ
dτ 0
=
a(|~v12 |)dτ 00 ,
(9.5)
die nur dann miteinander verträglich sind, wenn gilt
a(|~v12 |) =
a(|~v1 |)
.
a(|~v2 |)
(9.6)
Die linke Seite dieser Gleichung hängt vom Winkel zwischen den Vektoren ~v1
und ~v2 ab, die rechte aber nicht, so dass jede Abhängigkeit des Proportionalitätsfaktors a von irgendeiner Geschwindigkeit auszuschließen ist. Es folgt a = 1
und somit
dτ = dτ 0 ,
(9.7)
also die Invarianz differenzieller Abstände unter der gesuchten Lorentztransformation. Da endliche Abstände sich als Summen differenzieller Abstände darstellen lassen, muss die gesuchte Lorentztransformation sogar beliebige Abstände
im Raum-Zeit-Kontinuum erhalten.
Erinnern wir uns an Altbekanntes aus dem gewöhnlichen (euklidischen)
dreidimensionalen Raum. Die einzigen Koordinatentransformationen die den
gewöhnlichen (euklidischen) Abstand
¡
¢1/2
d12 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2
(9.8)
invariant lassen, sind Translationen und Drehungen. Zwar ist das vierdimensionale Raum-Zeit-Kontinuum kein euklidischer Raum mit vier völlig gleichberechtigten Achsen (wegen des einen Minuszeichens vor dem Zeitquadrat in (9.3)),
jedoch legt die Ähnlichkeit des Abstandes (9.3) mit dem gewöhnlichen Abstand
(9.8) die Vermutung nahe, dass die den Abstand (9.3) erhaltenden Koordinatentransformationen gerade Translationen und Drehungen“ sind.
”
9.1 Die Lorentztransformation der Koordinaten
157
Translationen sind Transformationen der Form
~
~x0 = ~x + d,
t0 = t + t 0
(9.9)
und erhalten offenbar den Abstand (9.3). Das ist gut so, sonst wäre der Homogenität von Zeit und Raum verletzt. Drehungen“ im vierdimensionalen
”
Raum-Zeit-Kontinuum sind insbesondere auch rein räumliche Drehungen
x0i =
3
X
Rij xj ,
t0 = t,
RR̃ = 1 ,
(9.10)
j=1
denn diese lassen, wie wir im letzten Kapitel gelernt haben, den gewöhnlichen
räumlichen Abstand d12 (9.8) und somit auch den Minkowskischen Abstand τ12
invariant. Diese rein räumlichen Rotationen haben natürlich nichts mit einer
relativen Bewegung von S und S 0 zu tun.
Unter den Drehungen“ ohne Analogon im gewöhnlichen Raum muss es sol”
che geben, die sich ganz in der x − t-Ebene vollziehen, so dass die Koordinaten
y und z sich gar nicht ändern und die Koordinaten x0 , t0 in S 0 mit den entsprechenden in S, also x und t, linear zusammenhängen. Physikalisch müssen solche
Drehungen“ einer Relativgeschwindigkeit ~u zwischen S und S 0 entsprechen, die
”
parallel zur x- und x0 -Achse verläuft. Setzen wir an
ct0 = Ax + Bct
x0 = Cx + Dct
y0 = y
z0 = z .
(9.11)
Zur Bestimmung der vier Parameter A, B C, D haben wir zunächst die Forderung, dass der Minkowskiabstand des Ereignisses ~x, t vom Ursprung invariant
bleiben muss, d. h.
2
2
c 2 t2 − x 2 = c 2 t0 − x 0 .
(9.12)
Da x0 und t0 beliebig sind, ergeben sich nach Eintragen von (9.11) drei unabhängige Gleichungen, so dass in der Transformation (9.11) ein freier Parameter bleibt. Wir finden leicht AB − CD = 0, A2 − C 2 = −1 B 2 − D2 = 1, wählen
den freien Parameter gemäß A = D = sinh ψ, B = C = cosh ψ und erhalten die
Drehung“
”
ct0 = ct cosh ψ + x sinh ψ
x0 = ct sinh ψ + x cosh ψ .
(9.13)
Der Drehwinkel“ ψ muss sich durch die Geschwindigkeit u ausdrücken lassen,
”
mit der sich S relativ zu S 0 bewegt. Um diesen Zusammenhang zu finden,
betrachten wir insbesondere den räumlichen Ursprung von S, der zu allen Zeiten
t die Koordinate x = 0 hat. Im System S 0 hat er die Koordinaten
ct0 = ct cosh ψ,
x0 = ct sinh ψ ,
158
9 Spezielle Relativitätstheorie
woraus folgt
u
x0
= tanh ψ = .
(9.14)
0
ct
c
Damit ist die Lorentztransformation voll spezifiziert und lautet für den Fall, dass
S sich von S 0 aus gesehen mit der Geschwindigkeit u in x0 -Richtung bewegt,
ct + uc x
ct0 = p
1 − u2 /c2
x0 = p
ut + x
1 − u2 /c2
y0 = y
z0 = z .
(9.15)
Beachten wir, dass die Lorentztransformation (9.15) im Grenzfall kleiner
Relativgeschwindigkeiten, d. h. in nullter Ordnung in u/c in die aus dem Alltag
bekannte Galileitransformation übergeht. Da für Waldläufer, Schnellzüge und
sogar für unerlaubt schnelle Autos das Verhältnis u/c stets klein ist, gilt im
Erfahrungsbereich des Alltags die Galileitransformation mit guter Genauigkeit.
Für u = c und u > c verliert die Lorentztransformation (9.15) ihren Sinn, da
die Nenner verschwinden bzw. imaginär werden. Dem entspricht die Erfahrung,
dass die Bewegung von massiven Teilchen mit Licht- und Überlichtgeschwindigkeit nicht möglich ist.
9.2
Relativität der Gleichzeitigkeit
In der Galileitransformation war die Zeitkoordinate ausgezeichnet. Wegen t = t 0
ist es beim Umgang mit langsamen Teilchen wie Radfahrern etc. erlaubt und beliebt, von einer absoluten Zeit zu reden. Nicht mehr beim Umgang mit schnellen
Teilchen. Es ist eine der erstaunlichsten Konsequenzen der Lorentztransformation, dass zwei Ereignisse, die für einen Beobachter gleichzeitig erscheinen, für
einen anderen, relativ zum ersten bewegten Beobachter zu verschiedenen Zeitpunkten stattfinden.
Der Beobachter B benutze das System S und registriere zwei gleichzeitige
Ereignisse an benachbarten Orten auf der x-Achse, d. h. ∆t = 0 und ∆x 6=
0. Der Beobachter B 0 sehe S mit u in x0 -Richtung fahren und registriert für
dieselben Ergebnisse
³
´
u
∆x
u/c
1
∆t + 2 ∆x = p
·
6= 0 .
(9.16)
∆t0 = p
2
2
2
2
c
c
1 − u /c
1 − u /c
Wegen des Faktors u/c sind wir durch Alltagserfahrung nicht an diese Relativität
des Begriffs der Gleichzeitigkeit gewöhnt.
9.3
Zeitdilatation
Als empirisches Resultat bei schnellen Teilchen hatte ich Ihnen schon vorgestellt,
dass schnell bewegte Uhren deutlich langsamer gehen als ruhende. Jetzt können
wir’s nachrechnen.
9.3 Zeitdilatation
159
Der Beobachter B schaue auf seine ruhende Uhr. Zwei aufeinander folgende
Ticks sind Ereignisse mit den Koordinatendifferenzen ∆~x = 0 und ∆t, wobei
∆t die vom Fabrikanten garantierte, der Uhr eigene Zeiteinheit ist. Der Minkowskiabstand dieser Ticks ist
p
∆τ = c2 (∆t)2 − (∆~x)2 = c∆t .
(9.17)
Wir werden künftig die mit der Einheit ∆t = ∆τ /c multiplizierte laufende Zahl
der Ticks der Uhr die Eigenzeit der Uhr nennen.
Der Beobachter B 0 sehe die Uhr mit Geschwindigkeit u in die x0 -Richtung
fliegen. Er registriert mit Hilfe von Uhren, die längs der x0 -Achse ruhend aufgestellt sind, für das Zeitintervall zwischen zwei Ticks der bewegten Uhr den Wert
∆t0 ; überdies sieht er die Ticks an verschiedenen Orten stattfinden, die um die
räumliche Distanz ∆x0 = u∆t0 auseinander liegen. Er gibt den Minkowskiabstand der beiden Ticks an als
p
p
(9.18)
∆τ 0 = c2 (∆t0 )2 − u2 (∆t0 )2 = c∆t0 1 − u2 /c2 .
Der Minkowskiabstand zweier Ereignisse ist aber in allen gleichförmig zueinander bewegten Systemen gleich, so dass wir folgern
∆t0 = p
∆t
1 − u2 /c2
.
(9.19)
Die bewegte Uhr scheint langsamer zu ticken als ihr ruhendes Duplikat.
Eine drastische Illustration der Zeitdilatation erfährt ein fiktiver Reisender
am Rand einer schnell rotierenden Kreisscheibe (Abbildung 9.1). Vom ruhenden
Laborsystem aus gesehen dauert eine Rundreise Tlab , entsprechend der Kreisfrequenz ω = 2π/Tlab . Der Reisende liest auf seiner mitgeführten Uhr als Zeit
einer Umdrehung Trot ab. Die nachfolgende Rechnung zeigt Trot < Tlab (Reisen
erhält jung).
Abbildung 9.1
Bei der Berechnung der Zeit Trot stoßen wir zunächst auf die Schwierigkeit, dass die Bewegung des Reisenden nicht mit konstanter Geschwindigkeit
erfolgt, also nicht gleichförmig ist, so dass die Lorentztransformation gar nicht
anwendbar scheint. Wir können aber die Kreisbewegung des Reisenden durch
eine stückweise gleichförmige Bewegung längs eines Polygonzuges approximieren (Abbildung 9.2). Bezüglich jedes Geradenstücks geben wir mit Hilfe der
160
9 Spezielle Relativitätstheorie
Abbildung 9.2
Lorentztransformation den Zusammenhang zwischen der Reisedauer ∆tlab in
Laborzeit und der Reisedauer ∆trot der Bordzeit an,
∆tlab = p
∆trot
1−
u2 /c2
≈p
∆trot
1 − ω 2 R2 /c2
(9.20)
wobei die Reisegeschwindigkeit als u = ωR approximiert wurde. In den Ecken
des Polygons verbringt der Reisende keine Zeit. Also finden wir die Reisezeit
für einen Umlauf durch Summieren der Zeiten, die auf den Geradenstücken
verbracht werden. Wir denken uns die Polygoneinteilung beliebig verfeinert
und erhalten
p
(9.21)
Tlab = Trot / 1 − ω 2 R2 /c2 > Trot .
Das gewonnene Resultat verdient eine weitere Bemerkung. Wenn wir unter
Berufung auf die Lorentztransformation feststellen, dass eine gleichförmig bewegte Uhr langsamer geht als eine ruhende, so tut sich eine Schwierigkeit auf.
Welche der beiden Uhren bewegt sich und geht daher langsamer? Der Beobachter B könnte dem Reisenden B 0 zurufen: Ich ruhe, Du fliegst, ich altere
”
leider schneller“. Mit nicht minderem Recht könnte B 0 sich selbst für ruhend
halten und B um die höhere Lebenserwartung beneiden. Ein Paradox? Nein,
denn die beiden gegeneinander gleichförmig bewegten Beobachter begegnen sich
einmal und nie wieder, haben also keine Möglichkeit eines späteren Uhrenvergleichs. Anders die beiden Menschen, deren einer auf der rotierenden Scheibe
reist, während der andere im Labor sitzt und mit dem Reisenden nach jedem
Umlauf die Uhren vergleichen kann. Kein Zweifel nun, wer hier reist und wer
ruht. Der Mitrotierende fühlt Beschleunigungskräfte, der Ruhende nicht. Kein
Zweifel, der Ruhende altert schneller.
Bei Rundflügen schneller Flugzeuge ist inzwischen auch experimentell verifiziert, dass die auf Borduhren ermittelte Reisedauer kleiner ist als die auf im
Ausgangspunkt ruhenden Uhren abgelesene.
Für Astronomen wichtig ist das folgende Exempel der Zeitdilatation für
bewegte Uhren. Denken wir uns als Uhr“ eine monochromatische Strahlungs”
quelle auf einem entfernten Stern. Die Ticks“ dieser Uhr erfolgen, wenn die
”
Quelle als ruhend beobachtet wird, im Zeitabstand ∆t = 1/ν. Wenn sich die
Quelle jedoch relativ zum Beobachter mit der Geschwindigkeit ~u bewegt, so ist
das Zeitintervall ∆t0 zwischen der Emission aufeinander folgender Wellenmaxima durch (9.19) gegeben. Dies ist jedoch nicht die Zeitspanne ∆tobs zwischen
den Ankünften aufeinander folgender Wellenmaxima beim Beobachter, denn im
9.4 Längenkontraktion
161
Intervall ∆t0 bewegt sich die Quelle und verändert die Distanz zum Beobachter
um ~ur ∆t0 , entsprechend der Komponente ~ur der Geschwindigkeit ~u längs der
Verbindungslinie von Beobachter zur Quelle (Abbildung 9.3).
Abbildung 9.3
Demnach hat jedes Wellenmaximum einen Weg zum Beobachter zurückzulegen, der um ~ur ∆t0 gegenüber dem Weg des vorangehenden Maximums geändert
ist. Die Wellenmaxima sind bei der Ankunft beim Beobachter zeitlich um
∆tobs = ∆t0 +
ur 0
1 + ur /c
∆t = p
∆t
c
1 − u2 /c2
(9.22)
getrennt. Die vom Beobachter registrierte Frequenz νobs = 1/∆tobs des Lichts
ist also verschieden von der Frequenz ν = 1/∆t, die er fände, wenn die Quelle
ruhte, und es gilt
p
1 − u2 /c2
ν.
(9.23)
νobs =
1 + ur /c
Sie prüfen leicht nach, dass diese so genannte Dopplerverschiebung eine Rotverschiebung (νobs < ν) darstellt, wenn sich die Quelle vom Beobachter entfernt,
während das Licht einer sich nähernden Quelle blauverschoben ist (νobs > ν).
Ich hatte auf die astronomische Bedeutung dieser Dopplerverschiebung hingewiesen. Im Licht vieler Sterne findet man eine Vielfalt von Spektrallinien, aus
denen sich oft Spektren bestimmter Atome oder Ionen aussondern lassen. In
solchen Fällen besteht die Möglichkeit, einzelne Spektrallinien zu identifizieren
und deren Frequenzen νobs zu vergleichen mit den Frequenzen ν der entsprechenden im irdischen Labor erzeugten Linien. Aus dem Verhältnis ν/νobs kann
dann die Relativgeschwindigkeit zwischen dem entsprechenden Stern und der
Erde bestimmt werden.
9.4
Längenkontraktion
Es ist eine weitere unerwartete Konsequenz der Lorentztransformation - und
somit eine Eigenschaft der Natur -, dass an ein- und demselben Körper verschiedene Lineardimensionen vermessen werden, je nachdem, ob er in Ruhe oder in
Bewegung ist.
162
9 Spezielle Relativitätstheorie
Im System S ruhe ein Maßstab der Länge l parallel zur x-Achse. Im achsenparallelen System S 0 bewege sich der Stab mit seinem Ruhesystem mit der
Geschwindigkeit u in x0 -Richtung. Im System S 0 sollen zu einem Zeitpunkt t0 die
Endpunkte x0links und x0rechts gemessen werden. Mit den Endpunkten xlinks und
xrechts im Ruhesystem bestehen die durch die Lorentztransformation gegebenen
Zusammenhänge
xlinks = p
xrechts = p
1
1 − u2 /c2
1
1−
u2 /c2
(−ut0 + x0links )
(−ut0 + x0rechts ) .
(9.24)
Die Länge l = xrechts −xlinks im Ruhesystem des Stabes und die Länge bezüglich
des Systems S 0 , l0 = x0rechts − x0links , sind also verknüpft durch
p
l0 = l 1 − u2 /c2 ≤ l .
(9.25)
Die größtmögliche Länge hat der Stab in seinem Ruhesystem.
Quer zur Bewegungsrichtung (hier der x0 -Richtung) erleidet der Stab keine Kontraktion, da die Lorentztransformation die entsprechenden Koordinaten
unverändert lässt.
9.5
Addition von Geschwindigkeiten
Wie schon mehrfach angedeutet, addieren sich große ( relativistische“, d. h.
”
|~v | 6¿ c) Geschwindigkeiten nicht wie Vektoren.
Betrachten wir die gleichförmige Bewegung eines Teilchens von zwei achsenparallelen Systemen S und S 0 aus, wobei S sich bezüglich S 0 in x0 -Richtung
mit der Geschwindigkeit u bewegen soll. Bezüglich S (S 0 ) bewegt sich das Teilchen im Zeitintervall ∆t(∆t0 ) um d~x(d~x0 ). Die Lorentztransformation gibt die
Zusammenhänge
p
dt0 = (dt + u dx/c2 )/ 1 − u2 /c2
p
dx0 = (u dt + dx)/ 1 − u2 /c2
dy 0 = dy
dz 0 = dz .
(9.26)
Hier finden wir sofort die Relation der Geschwindigkeiten ~v = d~x/dt und ~v 0 =
d~x0 /dt0 zu
p
1 − u2 /c2
u + vx
0
0
=
v
,
v
,
vx =
y
y
1 + uvx /c2
1 + uvx /c2
p
1 − u2 /c2
0
vz = v z
.
(9.27)
1 + uvx /c2
Dieses Transformationsgesetz reduziert sich für hinreichend kleine Geschwindigkeiten auf das Additionsgesetz für gewöhnliche Vektoren, liefert jedoch drastisch andere Resultate als letzteres, wenn die beteiligten Geschwindigkeiten groß
9.6 Lorentzinvarianz der Maxwellschen Gleichungen
163
werden. Insbesondere lesen wir aus (9.27) wieder ab, dass die Lichtgeschwindigkeit eine nicht überschreitbare Grenzgeschwindigkeit ist. Für ~v = (c, 0, 0) ist
auch ~v 0 = (c, 0, 0).
9.6
Lorentzinvarianz der Maxwellschen Gleichungen
Wir hatten in 6.5 die Maxwellschen Gleichungen als Wellengleichungen für das
~ und das skalare Potential ϕ geschrieben. Diese Form der
Vektorpotential A
Maxwell-Gleichung erlaubt einen leichten Nachweis der Lorentzinvarianz der
Maxwellschen Elektrodynamik, den ich jetzt führen will.
Im Koordinatensystem S lauten die Wellengleichungen der Potentiale
¶
µ
1 ∂2 ~
= −~j/ε0 c2
(9.28)
∆2 − 2 2 A
c ∂t
¶
µ
1 ∂2
∆2 − 2 2 ϕ = −ρ/ε0 ,
c ∂t
wobei ~j die elektrische Stromdichte und ρ die Ladungsdichte sind und die Potentiale der Lorentzkonvention
~+ 1 ∂ϕ=0
div A
c2 ∂t
(9.29)
unterworfen sind. Um zu zeigen, dass im zu S achsenparallelen System S 0 ,
bezüglich dessen S sich mit der Geschwindigkeit u in x0 -Richtung bewegt, die
Gleichungen (9.28) und (9.29) ihre Form behalten, müssen wir die Lorentztransformation der Koordinaten (ct, ~x) eintragen und das Transformationsverhalten
~ sowie der Quellen ρ und ~j finden.
der Potentiale ϕ und A
Aus der Lorentztransformation
ct0 = γ (ct + βx),
x0 = γ (βct + x),
y 0 = y,
z0 = z
mit
p
1 − u2 /c2 ,
(9.30)
µ
¶
∂t0 ∂
∂x0 ∂
∂
=
+
erhalten wir zunächst mit Hilfe der Kettenregel
∂t
∂t ∂t0
∂t ∂x0
β = u/c,
γ = 1/
µ
¶
1 ∂
∂
1 ∂
=γ β 0 +
c ∂t
∂x
c ∂t0
¶
µ
1 ∂
∂
∂
+
β
=γ
∂x
∂x0
c ∂t0
∂
∂
=
∂y
∂y 0
∂
∂
= 0 .
∂z
∂z
(9.31)
164
9 Spezielle Relativitätstheorie
Wir können sofort die Lorentzinvarianz der Lorentzkonvention prüfen, indem
wir (9.31) in (9.29) verwenden,
∂
∂
1 ∂
∂
Az +
Ay +
Ax + 2 ϕ
∂z
∂y
∂x
c ∂t
µ
¶
µ
¶
∂
∂
1
∂
1 ∂
1 ∂
∂
= 0 Az + 0 Ay + γ
+β
ϕ
Ax + γ β 0 +
0
0
0
∂z
∂y
∂x
c ∂t
∂x
c ∂t c
µ
µ
¶
¶
∂
∂
1
1
1 ∂
∂
γ Ax + βϕ +
γ βAx + ϕ .
= 0 Az + 0 Ay +
∂z
∂y
∂x0
c
c ∂t0
c
0=
Wenn wir die transformierten Potentiale wählen gemäß
ϕ0 /c = γ(βAx + ϕ/c)
A0x = γ(Ax + βϕ/c)
(9.32)
A0y = Ay
A0z = Az ,
so lautet die Lorentzkonvention in S 0 genauso wie in S, nämlich
0=
∂ 0
∂
∂ 0
1 ∂
~ 0 + 1 ∂ ϕ0 .
Az + 0 A0y +
A x + 2 0 ϕ0 = ∇ 0 · A
0
0
∂z
∂y
∂x
c ∂t
c2 ∂t0
(9.33)
~
Im Vergleich von (9.32) und (9.30) zeigt sich, dass sich das Quadrupel (ϕ/c, A)
genauso transformiert wie das Quadrupel der Koordinaten (ct, ~x). Wir werden
~ künftig das Viererpotential des elektromagnetischen Feldes nennen.
(ϕ/c, A)
Wenden wir uns jetzt den Wellengleichungen (9.28) zu. Den links stehenden
Differentialoperator rechnen wir mit der Transformation (9.32) auf die Koordinaten (ct0 , ~x0 ) um,
µ
¶2
∂2
∂
∂2
∂2
1 ∂
∂2
1 ∂
∂2
2
+
+
γ
+
+
−
=
+
β
∂z 2
∂y 2
∂x2
c2 ∂t2
∂x0
c ∂t0
∂z 0 2
∂y 0 2
µ
¶2
1 ∂
∂
− γ2 β 0 +
∂x
c ∂t0
µ 2
¶
∂2
∂
1 ∂2
∂2
−
= 02 + 02 +
γ 2 (1 − β 2 )
c2 ∂t0 2
∂z
∂y
∂x0 2
=
∂2
∂2
1 ∂
∂2
+
+
− 2 02 ,
2
2
c ∂t
∂z 0
∂y 0
∂x0 2
(9.34)
und sehen, dass er beim Übergang von S zu S 0 seine Form beibehält. Um die
~ 0 ) im System S 0 zu erhalten, bilWellengleichungen für die Potentiale (ϕ0 /c, A
den wir Linearkombinationen der Gleichungen (9.28) gemäß der Transformation
9.7 Feld einer gleichförmig bewegten Punktladung
165
(9.32) der Potentiale,
µ
¶
1 ∂2
∇ − 2 0 2 A0z (~x0 , t0 ) = −jz (~x, t)/ε0 c2
c ∂t
¶
µ
1 ∂2
02
∇ − 2 0 2 A0y (~x0 , t0 ) = −jy (~x, t)/ε0 c2
c ∂t
µ
¶
1 ∂2
02
∇ − 2 0 2 A0x (~x0 , t0 ) = −γ (jx (~x, t) + βcρ(~x, t)) /ε0 c2
c ∂t
µ
¶
µ
¶
1 ∂2
1
2
∇0 − 2 0 2 ϕ0 (~x0 , t0 ) = −γ β jx (~x, t) + ρ(~x, t) /ε0 .
c ∂t
c
02
(9.35)
Offensichtlich reproduziert sich die Form der Wellengleichungen (9.28) genau,
wenn wir als Transformationsverhalten der Quellen (cρ, ~j) fordern
cρ0 (~x0 , t0 ) = γ (βjx (~x, t) + cρ(~x, t))
jx0 (~x0 , t0 ) = γ (jx (~x, t) + βcρ(~x, t))
(9.36)
jy0 (~x0 , t0 ) = jy (~x, t)
jz0 (~x0 , t0 ) = jz (~x, t) .
Hiernach transformieren sich die Quellen (cρ, ~j) ebenso wie das Viererpotential
~ und die Koordinaten (ct, ~x).
(ϕ/c, A)
Wir haben soeben nachgerechnet, dass die Wellengleichungen (9.28) und die
Lorentzkonvention (9.29) in allen gleichförmig zueinander bewegten Bezugssystemen gelten., wenn sie nur in einem System S richtig sind. Damit ist die
Lorentzinvarianz der Elektrodynamik erwiesen.
Als lehrreiche Übung bleibt Ihnen, das Transformationsverhalten der Felder
~ − grad ϕ
~ =−∂A
E
∂t
~ = rot A
~
B
aufzustellen.
9.7
Feld einer gleichförmig bewegten Punktladung
Die Lorentzinvarianz der Elektrodynamik gestattet häufig, umständliche Rechnungen abzukürzen. Das Feld einer mit konstanter Geschwindigkeit ~u = (u, 0, 0)
bewegten Ladung e, z. B. , lässt sich höchst einfach durch Lorentztransformation aus dem bekannten Feld im Ruhesystem S der Ladung gewinnen. In S
gilt
ϕ=
1 e
,
4πε0 r
~=0
A
(9.37)
166
9 Spezielle Relativitätstheorie
mit r = |~x|. Im Laborsystem S 0 , in welchem sich die Ladung mit u in x0 Richtung bewege, haben wir aus (9.32)
ϕ0 (~x0 , t0 ) = γ
1 e
,
4πε0 r
A0x (~x0 , t0 ) =
1
1 e
γβ
c 4πε0 r
A0y = A0z = 0
(9.38)
Um hieraus ϕ0 , und Ax0 als Funktionen der Laborkoordinaten ~x0 , t0 zu erhalten,
müssen wir nur rechts die Größe r = (x2 +y 2 +z 2 )1/2 durch ~x0 und t0 ausdrücken.
Mit Hilfe der Lorentztransformation (9.30) bzw. deren Umkehrung (die sich
durch u → −u ergibt) erhalten wir
ϕ0 =
=
1
q
4πε0
1
q
4πε0
γe
γ 2 (x0 − βct0 )2 + y 0 2 + z 0 2
e
(x0 − ut0 )2 + (1 − u2 /c2 )(y 0 2 + z 0 2 )
1
A0x = β ϕ0
c
(9.39)
Sie sehen, dass die Äquipotentialflächen von ϕ0 durch (x0 − ut0 )2 + (1 −
2
2
u /c2 )(y 0 + z 0 ) = const > 0 gegeben sind, also die Form von Rotationsellipsoiden haben. Die Symmetrieachse dieser Flächen verläuft natürlich in der
Bewegungsrichtung der Ladung. Beachten Sie auch, dass die Ellipsoide in Bewegungsrichtung abgeplattet sind, u. z. um so stärker, je schneller die Ladung
fliegt. Im Grenzfall u → 0 gehen die Äquipotentialflächen wieder über in die
für die ruhende Ladung charakteristischen Kugeln.
Es ist bemerkenswert, wie leicht das Resultat (9.39) hier mit Hilfe der Lorentztransformation erhältlich ist. Sie dürfen, um ein Gefühl für die Ersparnis
an Rechenaufwand zu kriegen, für sich einen anderen Weg ausprobieren, etwa
die Integration der Wellengleichungen für die Potentiale mit den Quellen
2
ρ = eδ(x − ut)δ(y)δ(z),
9.8
jx = uρ,
j y = jz = 0 .
(9.40)
Lorentzskalare und Lorentzvektoren
Spielen wir wieder mit der geometrischen Analogie zwischen gewöhnlichen Drehungen im dreidimensionalen euklidischen Raum und Lorentztransformationen
im vierdimensionalen Raum-Zeit-Kontinuum. Drehungen lassen den euklidischen Abstand zweier Raumpunkte
¤1/2
£
d12 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2
(9.41)
invariant, während Lorentztransformationen den Minkowskiabstand zweier RaumZeit-Punkte
¤1/2
£
(9.42)
τ12 = c2 (t2 − t1 )2 − d212
unverändert lassen. Wir hatten d12 wie jede unter Drehungen invariante Größe
einen Skalar genannt und entsprechend bezeichnen wir den Minkowskiabstand
9.8 Lorentzskalare und Lorentzvektoren
167
τ12 und jede andere unter Lorentztransformationen invariante Größe als einen
~+
Lorentzskalar. Als weitere Lorentzskalare hatten wir schon die Größen div A
1 ∂
1 ∂2
2
ϕ
und
den
Wellenoperator
∇
−
identifiziert.
c2 ∂t
c2 ∂t2
Vektoren im dreidimensionalen euklidischen Raum kennen Sie als durch Betrag und Richtung festgelegte Größen. Während Betrag und Richtung eines
Vektors bei Drehungen des Koordinatensystems unverändert bleiben, ändert
sich doch das Tripel seiner Koordinaten. Wir hatten nachgerade einen Vektor
~ als ein Zahlentripel (Vx , Vy , Vz ) definiert, das sich bei Drehungen des KoordiV
natensystems genauso transformiert wie die Koordinaten x, y, z eines Punktes,
nämlich
Vi0 =
3
X
Rij Vj
mit
RR̃ = 1 .
(9.43)
j=1
Die Frage liegt nahe, ob es im vierdimensionalen Raum-Zeit-Kontinuum
nicht außer dem Koordinatenquadrupel (ct, x, y, z) eines Ereignisses weitere
Quadrupel (V 0 , Vx , Vy , Vz ) gibt, die sich unter Lorentztransformationen ebenso
verhalten wie das Koordinatenquadrupel, nämlich
0
V 0 = γ(βVx + V 0 )
V 0 x = γ(Vx + βV 0 )
(9.44)
V 0 x = Vy
V 0 z = Vz
wobei wieder β = u/c, γ = (1 − β 2 )−1/2 . Tatsächlich gibt es solche Quadrupel, die wir im Sinne der hier verfolgten Analogie Lorentzvektoren nennen.
Zwei wichtige Lorentzvektoren hatten wir im obigen Streifzug durch die Elek~ und das
trodynamik ausfindig gemacht, das Quadrupel der Potentiale (ϕ/c, A)
Stromdichte-Ladungsdichtequadrupel (cρ, ~j). Weitere Lorentzvektoren werden
folgen.
Die Wichtigkeit des Begriffs des Lorentzvektors ist ganz analog der Wichtigkeit des Begriffs des Vektors. Sie erinnern sich: stimmen zwei Vektoren in
einem Koordinatensystem S überein, so auch in allen anderen zu S verdrehten. Wenn ein Naturgesetz als die Gleichheit zweier Vektoren formuliert werden
kann, so gilt dieses Gesetz gleichermaßen in allen zueinander verdrehten Koordinatensystemen; die Isotropie des Raumes ist dann manifest. Genauso ist das
Relativitätsprinzip, d. h. die Gleichberechtigung aller gleichförmig zueinander
bewegten Koordinatensysteme, manifest, wenn ein Naturgesetz als die Gleichheit zweier Lorentzvektoren geschrieben werden kann; der Grund dafür ist, dass
zwei Lorentzvektoren in allen solchen Koordinatensystemen übereinstimmen,
wenn sie in irgendeinem gleich sind.
Letztere Aussage wirft ein nützliches Verfahren ab zum Prüfen der Lorentzinvarianz von Gleichungsquadrupeln. Die Invarianz ist gesichert, wenn die
vier fraglichen Gleichungen als Gleichheit zweier Lorentzvektoren geschrieben
werden können. Wir hatten diese Methode beim Nachweis der Lorentzinvarianz der Elektrodynamik bereits angewendet: nachdem sich der Wellenopera∂2
tor ∇2 − c12 ∂t
2 als Lorentzskalar erwiesen hatte, ergaben sich die vier Wellen³
´
2
~
gleichungen als Gleichung zwischen den Lorentzvektoren ∇2 − 12 ∂ 2 (ϕ/c, A)
c ∂t
168
9 Spezielle Relativitätstheorie
und (cρ, ~j).
9.9
Relativistischer Impuls und Viererimpuls eines Teilchens
In der Newtonschen Mechanik hatten wir den Vektor m~v den Impuls eines
Teilchens genannt. Der wichtigste Grund für die Beliebtheit dieses Begriffs
beim
P Umgang mit langsamen Teilchen ist, dass der Newtonsche Gesamtimpuls
mν ~vν eines abgeschlossenen Teilchenhaufens zeitlich konstant bleibt. Leider
ν
entfällt dieser Grund, wie wir sehen werden, bei schnellen Teilchen.
Eine weitere
PPeinlichkeit wäre in Kauf zu nehmen, wenn wir den Newtonvν auch zur Formulierung der Kinematik und Dynamik
schen Impuls
ν mν ~
schneller Teilchen verwendeten.
Während
¡P
P sich ¢unter GalileitransPdiese Größe
vν0 = ~u ν mν + ν mν ~vν , gibt die Lorentzformation einfach verhält
ν mν ~
transformation ein abstoßend hässliches, nämlich nichtlineares Transformationsgesetz, das Sie aus dem Transformationsgesetz für die Geschwindigkeit (s. 9.5)
entnehmen können.
Die obigen Betrachtungen legen die Suche nach einer Verallgemeinerung
des Newtonschen Impulses nahe. Diese Verallgemeinerung sollte sich (i) für
|~v |/c ¿ 1 auf den Newtonschen Impuls reduzieren, und (ii) unter Lorentztransformationen einfach benehmen. Es gibt einen solchen relativistischen Impuls,
und wir können ihn leicht finden durch Präzisierung der obigen Kritik am Newtonschen Begriff.
Die Forderungen (i) und (ii) sind sicher erfüllt, wenn der relativistische Impuls p~ ³die drei Raumkomponenten
eines Lorentzvektors gibt. Nun stellt das
´
dy
dz
dx
Tripel m dt , m dt , m dt im Gegensatz zum Tripel (m dx, m dy, m dz) genau
deshalb keinen Teil eines Lorentzvektors dar, weil das im Labor gemessene Zeitinkrement dt kein Lorentzskalar ist. Es gibt aber einen Lorentzskalar, der sich
für ein langsames Teilchen auf dt reduziert, u. z. die Eigenzeit des bewegten
Teilchens, d. h. die Zeit, die auf einer vom Teilchen mitgeführten Uhr abgelesen
werden könnte.
In jedem Augenblick lässt sich ein zum Labor gleichförmig bewegtes Koordinatensystem so finden, in dem das Teilchen ruht. In diesem momentanen
Ruhesystem gilt für die am Teilchen fixiert gedachte Uhr d~x0 = 0, so dass das
auf ihr abgelesene Eigenzeitinkrement dt0 bis auf den Faktor 1c mit dem Inkrement dτ des Minkowskiabstands übereinstimmt. Da dτ ein Lorentzskalar ist,
können wir ihn auch leicht durch die Koordinateninkremente des Teilchens im
Laborsystem ausdrücken,
p
p
dτ = c2 dt2 − d~x2 = c dt 1 − v 2 /c2 .
(9.45)
Wenn wir uns die Bahnkurve des Teilchens mit τ anstatt mit der Laborzeit
parametrisiert denken, so gilt für die Änderungsrate der Teilchenkoordinaten
mit τ
dt d~x
1
~v
d~x
=
=p
.
(9.46)
2
2
dτ
dτ dt
1 − v /c c
Bis auf den Faktor 1c stimmt also d~x/dτ für kleine Geschwindigkeit ~v mit ~v
überein. Genau wie das Tripel d~x gibt nun das Tripel mc d~x/dτ die ersten drei
9.9 Relativistischer Impuls und Viererimpuls eines Teilchens
169
Komponenten eines Lorentzvektors, da mc wie dτ Lorentzskalare sind. Ansatzweise nehmen wir daher als relativistischen Impuls
p~ = mc
d~x
m~v
=p
.
dτ
1 − v 2 /c2
(9.47)
Der zugehörige Lorentzvektor wird auch Viererimpuls genannt und lautet offenbar
!
¶ Ã
µ
m~v
mc
d~x
cdt
,p
≡ (E/c, p~) .
(9.48)
= p
, mc
mc
dτ
dτ
1 − v 2 /c2
1 − v 2 /c2
Die zeitartige Komponente
E/c = p
mc
1 − v 2 /c2
(9.49)
hat auch die Dimension eines Impulses, so dass E die Dimension einer Energie
hat. Tatsächlich wird E als die relativistische Energie des Teilchens bezeichnet.
Die Namensgebung relativistischer Impuls bzw. relativistische Energie für die
in (9.47) bzw. (9.49) definierten Größen p~ bzw. E ist zumindest insofern sinnvoll,
als sich diese Größen im Newtonschen Grenzfall kleiner Geschwindigkeit auf die
entsprechenden Newtonschen Größen reduzieren gemäß
p~ → m~v
E → mc2 +
(9.50)
m 2
v + ···
2
Beachten Sie dabei, dass die Energie eines Teilchens in der Newtonschen Mechanik nur bis auf eine additive Konstante definiert ist. In der relativistischen
Mechanik jedoch, und somit in Stoßexperimenten mit schnellen Teilchen, ist die
additive Konstante mc2 von großer Bedeutung. Ein ruhendes Teilchen hat nach
(9.50) die Ruheenergie
E0 = mc2 .
(9.51)
Sie haben früher schon gelernt, die Relation (9.51) als die von Einstein gefundene Äquivalenz von Masse und Energie zu lesen. Die folgenden Hinweise
sollen Sie an einige für die Hochenergiephysik und auch für die Energiepolitik
wichtige Anwendungen erinnern.
Die Masse eines α-Teilchens ist kleiner als die Summe der Massen seiner
Bausteine, d. h. je zweier Protonen und Neutronen. Wir hoffen, uns den so
genannten Massendefekt bald in Fusionsreaktoren zunutze machen zu können.
Ein Elektron und ein Positron, die mit entgegengesetzt gleichen Geschwindigkeiten aufeinander stoßen, können sich gegenseitig vernichten und als Reaktionsprodukt zwei γ-Quanten hinterlassen. Letztere sind nichts anderes als
eine elektromagnetische Welle, die keine Masse, wohl aber Energie
(und Impuls)
p
hat. Jedes der beiden γ-Quanten trägt die Energie mc2 / 1 − v 2 /c2 wobei v
die Geschwindigkeit jedes Stoßpartners (lange) vor dem Stoß war. Masse wird
also bei dieser Paarvernichtung in Energie verwandelt.
Alle bisherige experimentelle Erfahrung zeigt, dass bei Stößen schneller Teilchen die Summe aller relativistischen Impulse (9.47) und auch die Summe aller
170
9 Spezielle Relativitätstheorie
relativistischen Energien erhalten bleiben, wobei allerdings der Beitrag von an
der Wechselwirkung beteiligten Feldern zu Energie und Impuls mit berücksichtigt werden muss. Im soeben besprochenen Beispiel der Paarvernichtung trägt
das elektromagnetische Feld sogar den ganzen Impuls und die ganze Energie des
Systems nach der Reaktion. Mit mehr formalem Aufwand, als wir hier treiben
können, lässt sich zeigen, dass der gesamte Viererimpuls wechselwirkender Teilchen und Felder, die ein abgeschlossenes System bilden, zeitlich erhalten bleiben
muss, wenn Raum und Zeit homogen sind. Ich erinnere nochmals daran, dass
wir immerhin die Äquivalenz der Homogenität von Raum und Zeit mit der Erhaltung von Impuls und Energie für abgeschlossene rein mechanische Systeme
im Newtonschen Grenzfall vorrechnen konnten.
Aus den Ausdrücken (9.47) und (9.49) für p~ und E können wir die Geschwindigkeit ~v eliminieren und so einen Zusammenhang zwischen Energie und Impuls
des Teilchens herstellen,
E 2 /c2 − p~2 = m2 c2 .
(9.52)
Dieser Zusammenhang gilt unabhängig vom Koordinatensystem, d. h. beide
Seiten der Gleichung sind Lorentzskalare. Man kann sich davon überzeugen,
indem man die Lorentztransformation
E 0 /c = γ(E/c + βpx ),
p0x = γ(βE/c + px ),
p0y = py ,
p0z = pz
(9.53)
auf der linken Seite von (9.52) einträgt. Die Rechnung erübrigt sich aber, da
die linke Seite von (9.52) sich aus den Komponenten des Viererimpulses (E/c, p~)
genauso aufbaut wie das Quadrat des Minkowskiabstands aus den Koordinaten
(ct, ~x). Sie erinnern sich, dass die Lorentztransformation gerade durch die Forderung der Invarianz des Minkowskiabstands festgelegt war.
Unter Verwendung der Lorentztransformation können Sie selber leicht eine
~ und
Verallgemeinerung der eben getroffenen Aussagen beweisen. Wenn (A0 , A)
~ zwei beliebige Lorentzvektoren sind – die sich also beide wie (E/c, p~) in
(B 0 , B)
(9.53) transformieren –, so ist die Verknüpfung
~·B
~
A0 B 0 − A
(9.54)
ein Lorentzskalar.
9.10
Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld
Um die Bewegung von Elektronen, Positronen und anderen geladenen Teilchen
in Beschleunigungsanlagen beschreiben zu können, müssen wir die Newtonsche
Bewegungsgleichung ersetzen durch eine relativistische Verallgemeinerung. Als
empirisches Resultat kennen Sie
´
³
d
~ + ~v × B
~
p~ = e E
dt
(9.55)
mit p = m~v (1 − v 2 /c2 )−1/2 , wobei e und m die Ladung bzw. Masse des Teil~ und B
~ das elektrische bzw. magnetische Feld. Die
chens bezeichnen und E
9.10 Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen
Feld
171
Änderung gegenüber der Newtonschen Bewegungsgleichung besteht in der Ersetzung des Newtonschen durch den relativistischen Impuls. Während diese
Änderung für langsame Teilchen unerheblich ist, bringt sie die Vergrößerung
der Trägheit eines Teilchens mit wachsender Geschwindigkeit
zum Ausdruck.
p
Als Maß für die Trägheit kann offenbar die Größe m/ 1 − v 2 /c2 angesehen
werden; da diese Größe mit v → c über alle Grenzen wächst, kann das Teilchen
nie Lichtgeschwindigkeit erreichen.
Trotz der angedeuteten vernünftigen Eigenschaften in den Grenzfällen v ¿ c
und v / c ist keineswegs offensichtlich, dass die Gleichung (9.55) die richtige Bewegungsgleichung darstellt. Um uns dessen zu vergewissern, müssen wir
nachweisen, dass (9.55) in allen gleichförmig zueinander bewegten Koordinatensystemen gilt. Zu diesem Zweck zeigen wir nun, dass (9.55) zu einer Gleichung
zwischen zwei Lorentzvektoren äquivalent ist.
Die linke Seite von (9.55) stellt nicht den räumlichen Teil eines Lorentzvektors dar, u. z. deshalb nicht, weil die Änderung d~
p des relativistischen Impulses
p~ auf das Laborzeitinkrement dt statt auf einen Lorentzskalar bezogen ist. Ersetzen wir also, wie schon bei den Betrachtungen des letzten Paragrafen, das
Laborzeitinkrement dt durch die Lorentz-invariante Änderung dτ /c der Eigenzeit des Teilchens gemäß
p
(9.56)
dτ = c dt 1 − v 2 /c2
und schreiben (9.55) als
³
´
e
d~
p
~ + ~v × B
~ .
= p
E
dτ
c 1 − v 2 /c2
(9.57)
Jetzt steht links, wie wir im letzten Paragrafen gezeigt haben, der räumliche
Teil eines Lorentzvektors. Die zugehörige zeitartige Komponente dieses Lorentzvektors ist d(E/c)/dτ , also gegeben durch die Änderungsrate der Energie
E des Teilchens mit der Eigenzeit desselben. Da die Energie eines Teilchens
durch seinen Impuls und seine Masse schon festgelegt ist als
p
(9.58)
E/c = m2 c2 + p~2 ,
können wir mit Hilfe von (9.59) die Änderungsrate d(E/c)/dτ ausrechnen zu
c
d~
p
e
dE/c
~ .
~v · E
= p~ ·
= p
2
dτ
E
dτ
c 1 − v 2 /c2
(9.59)
Bei der zum letzten Glied in (9.59) führenden Zwischenrechnung ist beach~ = 0 das magnetische Feld die Energie des
tenswert, dass wegen p~ · (~v × B)
Teilchens nicht ändert. Ein Magnetfeld bewirkt eine Änderung der Richtung,
nicht jedoch des Betrags des Impulses eines Teilchens.
Was ist gewonnen, nachdem wir (9.55) zu (9.57) umformuliert und zusätzlich
(9.59) aus (9.55) gefolgert haben? Zunächst nur, dass die linken Seiten von
d
d
(9.56) und (9.59), also das Quadrupel ( dτ
E/c, dτ
p~), einen Lorentzvektor darstellen. Zu zeigen bleibt, dass das Quadrupel der rechten Seiten und somit auch
die Viererkraft
e
~ ,
~v · E
(9.60)
f0 = p
2
c 1 − v 2 /c2
´
³
e
~ + ~v × B
~
f~ = p
E
1 − v 2 /c2
172
9 Spezielle Relativitätstheorie
sich unter Lorentztransformationen wie ein Lorentzvektor verhält. Dazu ist es
~ und B
~ durch
bequem, in den Komponenten des Quadrupels (f 0 , f~) die Felder E
~
die Komponenten des Lorentzvektors (ϕ, A) der Potentiale auszudrücken,
~ =−∂A
~ − ∇ϕ,
E
∂t
~ = rot A
~.
B
(9.61)
Ferner nutzen wir aus, dass die Geschwindigkeit ~v des Teilchens in (9.60) nur
über die Komponenten des Lorentzvektors
Ã
!
c
~v
0
(u , ~u) = p
,p
= Vierergeschwindigkeit
(9.62)
1 − v 2 /c2
1 − v 2 /c2
eingehen. Letzteres Quadrupel ist zweifellos ein Vierervektor, da es nur um
einen Faktor m vom Viererimpuls des Teilchens abweicht. Mit Hilfe von (9.61)
und (9.62) schreiben wir nun das Quadrupel (f 0 , f~) in der Form
µ
¶
∂ ~
e 0
~
~
f = − u ∇ϕ + A + e~u × rot A
c
∂t
µ
¶
e
∂ ~
0
f = − ~u · ∇ϕ + A
(9.63)
c
∂t
bzw.
µ
µ
¶
· µ
¶
¶¸
∂Ax
∂Az
∂Ay
∂Ax
e 0 ∂ϕ ∂Ax
+ e uy
− uz
+
−
−
fx = − u
c
∂x
∂t
∂x
∂y
∂z
∂x
usf.
Nun ist es leicht, das Verhalten der Viererkraft (f 0 , f~) unter Lorentztransformationen zu studieren. Gehen wir wieder über zu einem System S 0 , bezüglich
dessen sich das bisher verwendete S mit Geschwindigkeit u in x0 -Richtung bewegt und dessen Achsen zu denen von S parallel verlaufen. Die Lorentzvektoren
~ transformieren sich dabei wie üblich,
(u0 , ~u) und (ϕ/c, A)
0
u0 = γ(u0 − βux0 ),
0
ux = γ(ux0 − βu0 ),
uy = uy 0 ,
uz = u z 0
mit
β = u/c,
γ = (1 − β 2 )−1/2
(9.64)
während wir für das Quadrupel der Ableitungen nach den Koordinaten schon
in 9.6 gefunden hatten
µ
µ
¶
¶
∂
∂
∂
∂
∂
∂
=γ β
=γ
+β 0 ,
+β
,
∂ct
∂ct0
∂x
∂x
∂x0
∂ct0
∂
∂
=
,
∂y
∂y 0
∂
∂
= 0 .
∂z
∂z
Durch bloßes Eintragen von (9.64) und (9.65) in (9.63) finden wir
´
´
³
³ 0
0
f 0 = γ f 0 − βfx0 , fx = γ fx0 − βf 0 , fy = fy0 , fz = fz0 .
(9.65)
(9.66)
9.11 Bewegung im konstanten elektrischen Feld
173
Das aber ist, genau wie (9.64), das Transformationsverhalten eines Lorentzvektors.
Also gilt in allen gleichförmig zueinander bewegten Koordinatensystemen:
Die Änderungsrate des Viererimpulses mit der Eigenzeit eines Teilchens ist
gleich der auf das Teilchen wirkenden Viererkraft. Mit dieser Formulierung
ist, Sie hören’s heraus, Newton Ehre erwiesen, wiewohl wir mehr im Sinn haben
als die nur für langsame Teilchen gültige Urform des Gesetzes.
Schreiben wir die manifest lorentzinvariante Form der Bewegungsgleichung
des Teilchens nochmals auf,
d
d2
1
(E/c, p~) = cm 2 (ct, ~x) = (f 0 , f~).
(9.67)
dτ
dτ
c
³
´
Das sind, bei gegebener Viererkraft f 0 (~x, t), f~(~x, t) , d. h. bei gegebenen Fel~ x, t) und B(~
~ x, t), vier Differentialgleichungen zweiter Ordnung für die
dern E(~
vier Funktionen x(τ ), y(τ ), z(τ ) und t(τ ). Hat man diese gelöst und eliminiert den Parameter τ , so erhält man die Bahnkurve des Teilchens in Form des
zeitabhängigen Ortsvektors ~x(t). In der Praxis ist es meist bequemer, mit der
zu (9.67) äquivalenten Form (9.55) der Bewegungsgleichung zu rechnen, ohne
erst den invarianten Parameter τ und die Viererkraft einzuführen.
9.11
Bewegung im konstanten elektrischen Feld
Als Beispiel untersuchen wir die Bewegung eines geladenen Teilchens in einem
~ das wir uns in x-Richtung denhomogenen zeitabhängigen elektrischen Feld E,
ken können. Anfänglich ruhe das Teilchen. Dann wird die Bahnkurve offenbar
eine in x-Richtung laufende Gerade sein, die wir als x-Achse wählen können.
Als einzige Bewegungsgleichung haben wir
d
dpx
mv
p
=
= eEx .
dt
dt 1 − v 2 /c2
(9.68)
Der Impuls des Teilchens wächst demnach im Laufe der Zeit linear mit t,
mv
= eEx t.
(9.69)
px = p
1 − v 2 /c2
Mit ihm wächst die kinetische Energie
p
p
E = c m2 c2 + p~2 = m2 c4 + (ceEx t)2 .
(9.70)
Im Gegensatz zu Impuls und Energie bleibt die Geschwindigkeit, wie es sein
muss, beschränkt. Lösen wir nämlich (9.69) nach der Geschwindigkeit v auf, so
ergibt sich
v=p
ceEx t
m2 c 2
+ (eEx t)2
<c.
(9.71)
So lang ein Linearbeschleuniger auch ausgelegt wird, die Teilchengeschwindigkeit bleibt immer unter der Lichtgeschwindigkeit. Schließlich erhalten wir wegen
v = dx/dt durch Integration von (9.71) die Bahnkurve
c p 2 2
x(t) =
m c + (eEx t)2 .
(9.72)
eEx
174
9 Spezielle Relativitätstheorie
Ihnen bleibt als lustige Übung das Studium der Teilchenbahn im homogenen
Magnetfeld (s. a. 15.3).
9.12
Eine bequeme Schreibweise
~ oder
Vektoren im dreidimensionalen euklidischen Raum bezeichnen wir mit V
(Vx , Vy , Vz ) oder (V1 , V2 , V3 ) oder Vi . Vierervektoren im Raum-Zeit-Kontinuum
~ ) = (V 0 , Vx , Vy , Vz ) aufgeschrieben. Die
haben wir bisher in der Form (V 0 , V
Fortführung der relativistischen Betrachtungen erfordert nun, statt dieser umständlichen eine einfachere Schreibweise einzuführen. Wir nummerieren die
Komponenten mit einem hochgestellten griechischen Index, schreiben den Vierervektor als V µ und meinen
V 0 = zeitartige Komponente
V 1 = V1 = Vx
V 2 = V2 = Vy
(9.73)
V 3 = V3 = Vz
Das Quadrupel der Koordinaten (ct, x, y, z), zum Beispiel, werden wir demnach
künftig als den Viererortsvektor xµ bezeichnen und schreiben
x0 = ct,
x1 = x1 = x,
x2 = x2 = y, x3 = x3 = z .
(9.74)
Die raumartigen Indizes dürfen dabei nach Belieben oben oder unten stehen,
nicht aber der zeitartige.
Es lohnt sich, die Begriffsbildung des Vierervektors zu verfeinern und zu jedem Vierervektor eine kontravariante Version V µ sowie eine kovariante Version
Vµ zu zulassen, wobei
V 0 = −V0 ,
V i = Vi für 1 = 1, 2, 3
(9.75)
gelten soll. Der Sinn dieser Unterscheidung ist, dass sie den aus V µ gewinnbaren
Lorentzskalar schöner zu schreiben erlaubt,
−(V 0 )2 + (V 1 )2 + (V 2 )2 + (V 3 )2 = V 0 V0 + V 1 V1 + V 2 V2 + V 3 V3
=
3
X
V µ Vµ .
(9.76)
µ=0
Noch mehr Bequemlichkeit wird erreicht, wenn wir vereinbaren, rechts das Summenzeichen wegzulassen. Diese Summenkonvention impliziert auch
Aµ Bµ = A 0 B0 + A 1 B1 + A 2 B2 + A 3 B3
= −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3
= −A0 B0 + A1 B1 + A2 B2 + A3 B3
~·B
~ .
= −A0 · B 0 + A
(9.77)
9.12 Eine bequeme Schreibweise
175
Auch Aµ Bµ ist, wie oben besprochen, ein Lorentzskalar. Im Folgenden soll
also jeder griechische Index, der in einem Produkt zweimal vorkommt, einmal
hochgestellt (als kontravarianter Index) und einmal tiefgestellt (als kovarianter
Index), über die vier Werte 0, 1, 2, 3 summiert werden.
Die neue Schreibweise ermöglicht eine einfache Formulierung der Lorentztransformation
α
x0 = Λαβ xβ = Λα0 x0 + Λα1 x1 + Λα2 x2 + Λα3 x3
= Λα0 ct + Λα1 x + Λα2 y + Λα3 z .
(9.78)
Die Matrix Λαβ lautet für unser stets verwendetes Beispiel, bei dem das zu S 0
achsenparallele System S sich mit Geschwindigkeit u in x0 -Richtung bewegt,


γ γβ 0 0


γβ γ 0 0
 , β = u , γ = (1 − β 2 )−1/2 .
Λµν = 
(9.79)

0
c
0
1
0


0
0 0 1
Dabei zählt der erste Index, hier µ, wie üblich die Zeilen in der Reihenfolge 0,
1, 2, 3 und der zweite, hier ν, die Spalten.
Den Lorentzskalar Aµ Bµ schreibt man auch gern unter Benutzung einer
Matrix ηαβ (des so genannten Minkowskitensors) als
Aµ Bµ = ηµν Aµ B ν ,
(9.80)
wobei
ηαβ

1



= −1



0
für
α = β = 1, 2, 3
für
α=β=0
für
α 6= β .
(9.81)
Der Minkowskitensor erlaubt, die Lorentzinvarianz des Minkowskiabstands oder
anderer Größen wie Aµ Bµ , als eine Forderung an die Matrix Λαβ der Lorentztransformation zu schreiben. Aus
α
α
β
A0 Bβ0 = ηαβ A0 B 0 = ηαβ Λαµ Λβν Aµ B ν = ηµν Aµ B ν
(9.82)
folgt, da Aµ und B µ beliebige Lorentzvektoren sind,
ηαβ Λαµ Λβν = ηµν .
(9.83)
Sehen Sie, dass dies gerade die Verallgemeinerung der aus dem euklidischen
Raum bekannten Eigenschaft R̃R = 1 der Drehmatrizen auf die Drehmatrizen“
”
Λαβ darstellt?
Der Minkowskitensor gestattet offenbar auch, aus einem kontravarianten
Vektor Aµ den zugehörigen kovarianten Vektor Aµ zu gewinnen,
Aµ = ηµν Aν .
(9.84)
176
9 Spezielle Relativitätstheorie
Die Umkehrung dieser Beziehung wird vermittelt durch die zu ηµν inverse Matrix. Wir nennen dieselbe η µν und haben
ηαν η
νβ
=
(
+1
für
α=β
0
für
α 6= β .
(9.85)
Offenbar ist ηµν Element für Element mit der inversen Matrix η µν gleich. Aus
(9.84) und (9.85) ergibt sich nun der kontravariante Vektor Aµ als Linearkombination der Komponenten des zugehörigen kovarianten Vektors Aµ
Aµ = η µν Aν .
(9.86)
Wir haben bisher das Verhalten von kontravarianten Vektoren Aµ unter Lorentztransformationen studiert. Kovariante Vektoren transformieren sich anders.
Aus (9.78), (9.84) und (9.86) folgt
β
Bα0 = ηαβ B 0 = ηαβ Λβµ B µ = ηαβ Λβµ η µν Bν , also
Bα0 = Λαβ Bβ
(9.87)
mit
Λαβ = ηαν Λνµ η µβ .
(9.88)
Wir sehen leicht, dass die Matrix Λαβ invers zur Matrix Λβα ist,
Λαγ Λαβ = ηαν Λνµ η µγ Λαβ = η µγ ηαν Λνµ Λαβ = η µγ ηµβ = δ γβ .
(9.89)
Ohne Rechnung können wir die Matrix Λαβ aus Λβα durch Vorzeichenwechsel der
Geschwindigkeit β = u/c gewinnen, also (unterscheiden Sie die Geschwindigkeit
β = u/c vom gleichbezeichneten Index!)
Λαβ

γ

−γβ
=
 0

0
−γβ
0
γ
0
0
1
0
0
0


0
 .
0

1
(9.90)
Die Ableitungen ∂/∂xµ nach den kontravarianten Koordinaten xµ bilden
offenbar einen kovarianten Lorentzvektor, denn wir hatten früher schon gezeigt,
dass der Wellenoperator
∇2 −
1 ∂2
∂2
∂ ∂
µν
=
η
=
c2 ∂t2
∂xµ ∂xµ
∂xµ ∂xν
(9.91)
ein Lorentzskalar ist. Andererseits hatten wir auch schon das Transformations-
9.12 Eine bequeme Schreibweise
verhalten von ∂/∂xµ ausgerechnet und gefunden
¶
µ
∂
∂
∂
−β 1
=γ
∂x0
∂x
∂x0 0
¶
µ
∂
∂
∂
= γ −β 0 +
∂x
∂x1
∂x0 1
177
(9.92)
∂
∂
2 = ∂x2
0
∂x
∂
∂
3 = ∂x3
0
∂x
und das ist gerade das Gesetz (9.87) mit der Matrix (9.90).
Neben Lorentzskalaren und -vektoren hatten wir auch, ohne ausdrücklich
davon zu reden, Lorentztensoren zweiter Stufe betrachtet, das sind 16-Tupel T µν
wie z. B. das direkte Produkt Aµ B ν zweier Lorentzvektoren. Die definierende
Eigenschaft des Lorentztensors ist, dass er sich unter Lorentztransformationen
verhält wie das Produkt Aµ B ν , nämlich
T0
µν
= Λµα Λνβ T αβ .
(9.93)
Sie sollen Indexgymnastik treiben und zeigen, dass T µν Aν ein Lorentzvektor
und T µµ = T µν ηνµ ein Lorentzskalar ist.
Die eben eingeführte Schreibweise gibt vielen in diesem Kapitel besprochenen
Gesetzen eine schön einfache Form. So sind die elektromagnetischen Potentiale
~ und die Ströme j µ = (cρ, ~j) durch die Wellengleichung (s. (9.28))
Aµ = (ϕ/c, A)
∂2
Aµ = −j µ /ε0 c2
∂xα ∂xα
(9.94)
verknüpft, vorausgesetzt, die Potentiale sind der Lorentzkonvention (9.29)
∂ µ
A =0
∂xµ
(9.95)
unterworfen. Und die Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld lautet (s. (9.67))
cm
dpµ
1
d2 xµ
=
= fµ .
dτ 2
dτ
c
(9.96)
Die Viererkraft f µ lässt sich durch die Vierergeschwindigkeit
uµ = c
dxµ
dτ
und durch die Ableitungen der Potentiale Aµ wie folgt ausdrücken
µ
¶
∂ ν
∂ µ
µ
f =e
A −
A uν .
∂xµ
∂xν
Der antisymmetrische Tensor
F µν =
∂ µ
∂ ν
A −
A
∂xµ
∂xν
(9.97)
(9.98)
178
9 Spezielle Relativitätstheorie
heißt auch der Feldstärkentensor des elektromagnetischen Feldes. Offenbar gilt


0
Ex /c Ey /c Ez /c


−Ex /c
0
Bz
−By 
µν


(9.99)
F =
0
Bx 

−Ey /c −Bz
−Ez /c By
−Bx
0
~ und B
~ wie die Kompound auf einmal wird klar, dass sich die Feldstärken E
nenten eines Lorentztensors transformieren.
Haben Sie übrigens für die in 9.6 gestellte Übungsaufgabe zum Transforma~ und B
~ als Lösung erhalten, was Sie nun aus (9.99)
tionsverhalten der Felder E
und (9.77) einfach abschreiben,
Ex0 = Ex ,
Ey0 = γ(Ey + βcBz ),
Ez0 = γ(Ez − βcBy )
Bx0 = Bx ,
By0 = γ(By − βEz /c),
Bz0 = γ(Bz + βEy /c) ?
(9.100)
Jedenfalls sollten Sie sich jetzt klarmachen, dass ein in einem rein elektrosta~ = 0) bewegtes Teilchen auch ein magnetisches Induktionsfeld
tischen Feld (B
0
~
B 6= 0 spürt.
Kapitel 10
Die Bewegung schneller
Teilchen im
Gravitationsfeld (Einsteins
Äquivalenzprinzip)
10.1
Rückblick auf die Newtonsche Theorie
Die Bewegung eines langsamen (v ¿ c) Teilchens in einem schwachen (die Bedingung für Schwäche wird später gegeben) Gravitationsfeld wird beschrieben
durch das Newtonsche Gesetz
m
d2 ~x
= F~ (~x) ,
dt2
(10.1)
wobei m die träge Masse des Teilchens und F~ (~x) die auf das Teilchen am Ort
~x wirkende Gravitationskraft sind. Rührt die Gravitationskraft von einem anderen Teilchen der schweren Masse M her, welches am Ursprung des Koordinatensystems sitzt, so gilt
mM ~x
F~ (~x) = −G 2
.
|~x| |~x|
(10.2)
Die Eigenschaft des Teilchens, die die Größe der auf es wirkenden Gravitationskraft bestimmt, seine schwere Masse, stimmt erfahrungsgemäß mit seiner trägen
Masse überein. Daher geht in (10.1) und (10.2) dieselbe Masse m ein.
Sie wissen, dass obiges F~ (~x sich als Gradient des so genannten Gravitationspotentials ϕ(~x) darstellen lässt gemäß
F~ (~x) = −m∇ϕ(~x)
ϕ(~x) = −
GM
.
|~x|
(10.3)
Da sich schwache Gravitationsfelder linear superponieren, haben wir für das
Gravitationspotential vieler massiver Teilchen mit Massen mν , die an den Orten
179
180
10 Bewegung schneller Teilchen im Gravitationsfeld
~xν sitzen,
ϕ(~x) = −
X Gmν
.
|~x − ~xν |
ν
(10.4)
Als Bewegungsgleichung für einen Planeten im Sonnensystem gilt nach Newton
mν
X
d2 ~xν (t)
Gmµ mν
=
−∇
,
ν
dt2
|~xν (t) − ~xµ (t)|
(10.5)
µ(6=ν)
wobei die rechts stehende Gravitationskraft sich aus den Beiträgen aller anderen Planeten und der Sonne (und gegebenenfalls anderer nahe gelegener Himmelskörper) zusammensetzt.
Einstein war mit der in (10.5) zusammengefassten Theorie nicht einverstanden, u. z. aus drei Gründen: (i) Wegen der nicht gegebenen Lorentzinvarianz
kann die Theorie nicht für schnelle Teilchen richtig sein; (ii) ein herausgegriffenes Teilchen erfährt die Gravitationswirkung der anderen instantan, da die
¨µ (t)} zur gleichen
Teilchenorte {~xν (t)} zu einer Zeit t die Beschleunigungen {~x
Zeit festlegen; gemäß dem Einsteinschen Relativitätsprinzip sollten sich Gravitationswechselwirkungen aber höchstens mit Lichtgeschwindigkeit ausbreiten; (iii)
die genaue Analyse der schon von Newton verwendeten Gleichheit von schwerer
und träger Masse führt, wie wir sehen werden, zu Widersprüchen zu (10.5).
10.2
Einsteins Äquivalenzprinzip
Der Angelpunkt der allgemeinen Relativitätstheorie ist die Gleichheit von schwerer und träger Masse für alle Körper. Genauer, das Verhältnis von schwerer zu
träger Masse hat für alle Körper den gleichen Wert. Für Probekörper aus Aluminium und Gold, z. B., fand R. H. Dicke Übereinstimmung dieses Verhältnisses
mit einer relativen Genauigkeit von 10−11 . Die Gleichheit von träger und schwerer Masse kann dann durch Wahl der Einheit eingerichtet werden.
Wir folgern, mit Einstein, dass im Innern eines frei fallenden Fahrstuhls kein
äußeres statisches homogenes Gravitationsfeld festgestellt werden kann, denn
Fahrstuhl, Beobachter wie experimentelle Aufbauten im Fahrstuhl reagieren
alle gleich auf ein solches Feld.
Zur Veranschaulichung betrachten wir N langsame Teilchen, die untereinander paarweise wechselwirken gemäß einer abstandsabhängigen Kraft F~ (~xν − ~xµ )
−−−→
und alle einem äußeren konstanten Gravitationsfeld ~g = −∇ϕ = const ausgesetzt sind. Die Bewegungsgleichungen lauten in irgendeinem Laborsystem S
mν
X
d2 ~xν
= mν ~g +
F~ (~xν − ~xµ ) .
2
dt
(10.6)
µ(6=ν)
Ein frei im Gravitationsfeld fallender Beobachter benutzt sein Ruhesystem S 0 .
Solange der Beobachter langsam ist, gilt als Koordinatentransformation
1
~x0 = ~x − ~g t2 ,
2
t0 = t .
(10.7)
10.3 Die Viererkraft im Gravitationsfeld
181
Der frei fallende Beobachter gibt auf Grund seiner Messungen als Bewegungsgleichungen für den Teilchenhaufen an
mν
X
d2 ~x0ν
= mν (~g − ~g ) +
F~ (~x0ν − ~x0µ ) .
02
dt
(10.8)
µ(6=ν)
Sie lesen ab, dass die Trägheitskraft die Gravitationskraft gerade weghebt und
dass der Beobachter im Fahrstuhl keine Gravitationskraft feststellen kann. Sie
sehen auch, dass in S und S 0 die gleichen Newtonschen Gesetze gelten. Der
einzige Unterschied zwischen beiden Bezugssystemen ist, dass in S ein Gravitationsfeld auftritt, nicht aber in S 0 .
Einstein verallgemeinerte diese Folgerung aus mschwer = mträge , die zunächst
nur für die Grundgesetze der Newtonschen Mechanik gezogen ist, und erhob zum
Prinzip (d. h. zu einer immer wieder in geeigneten neuen Experimenten nachzuprüfenden Hypothese): ein zeitlich und räumlich konstantes Gravitationsfeld
ist durch kein Experiment zu unterscheiden von einer zeitlich konstanten Beschleunigung des Bezugssystems.
Das Einsteinsche Prinzip von der Äquivalenz von Schwere und Trägheit muss
noch präziser formuliert werden. Ein zeitlich nicht konstantes und räumlich
nicht homogenes Gravitationsfeld kann nicht überall und immer durch eine Koordinatentransformation exakt eliminiert werden. Immerhin, die Aufhebung
eines Gravitationsfeldes wird mit guter Näherung möglich sein für jeden RaumZeit-Bereich, der so klein gewählt ist, dass innerhalb seiner das Gravitationsfeld
als räumlich und zeitlich konstant angesehen werden kann. Also: In jedem
Raum-Zeitpunkt lässt sich ein lokales frei fallendes Koordinatensystem angeben,
so dass in einem hinreichend kleinen Raum-Zeit-Bereich um den betrachteten
Punkt die Naturgesetze die Form annehmen, die sie in nicht beschleunigten Bezugssystemen bei Abwesenheit von Gravitation haben. Es gibt ein solches frei
fallendes Koordinatensystem, aber nicht nur eins, sondern beliebig viele, die sich
relativ zueinander gleichförmig bewegen. Da beliebige Relativgeschwindigkeiten
|~u| < c zwischen diesen gleichberechtigten Koordinatensystemen möglich sind,
muss der Übergang von einem zum anderen durch die Lorentztransformation
bewerkstelligt werden. Es müssen also in den lokalen frei fallenden Koordinatensystemen die Naturgesetze eine Lorentzinvariante Form besitzen.
Die Koordinatentransformationen, die wie 2.2 dafür sorgen, dass ein Gravitationsfeld lokal eliminiert wird, sind notwendig nichtlinear. Daher ist die
Kunst, mit Gravitationsfeldern umzugehen, die gleiche wie die, nichtlineare Koordinatentransformationen zu hantieren.
10.3
Die Viererkraft im Gravitationsfeld
Betrachten wir ein Teilchen an einem Raum-Zeit-Punkt xα unter dem Einfluss
eines Gravitationsfeldes. Die Bewegungsgleichung muss Lorentzinvariant sein,
d. h. die Form
mträge
1
d2 x α
= 2 mschwer g α
dτ 2
c
bzw.
d2 x α
1
= 2 gα
dτ 2
c
(10.9)
haben, wobei dτ ein Lorentzskalar ist und g α ein Lorentzvektor. Den Lorentzvektor werden wir die Gravitationsfeldstärke nennen.
182
10 Bewegung schneller Teilchen im Gravitationsfeld
Eine, die wichtigste, Eigenschaft von g α kennen wir schon: es gibt an jedem
Raum-Zeit-Punkt xα ein frei fallendes Koordinatensystem mit Koordinaten ξ α ,
bezüglich dessen das Teilchen momentan und lokal (d. h. solange es sich vom
herausgegriffenen Raum-Zeit-Punkt nicht zu weit entfernt hat) keine Gravitationskraft erfährt und sich daher (ein kleines Wegstück weit) auf einer Geraden
bewegt. In diesem frei fallenden Koordinatensystem lautet die Bewegungsgleichung des Teilchens
d2 ξ α
=0,
dτ 2
(10.10)
wobei dτ − c das Inkrement der Eigenzeit des Teilchens ist,
¡ ¢ 2 ³ ´2 ¡ ¢ 2 ¡ ¢ 2 ¡ ¢ 2 ¡ ¢ 2
dτ 2 = −ηαβ dξ α dξ β = dξ 0 − dξ~ = dξ 0 − dξ 1 − dξ 2 − dξ 3 .
(10.11)
Der Übergang von den Laborkoordinaten xα zu den Koordinaten ξ α im
frei fallenden System geschieht durch eine nichtlineare Koordinatentransformation, d. h. die ξ α sind nichtlineare Funktionen der xα . Wir schreiben meistens
α
ξ α = ξ α (x), zuweilen zur Vermeidung von Missverständnissen auch ξ α = ξX
(x),
wobei der Index X den Raum-Zeit-Punkt angibt, bezüglich dessen das frei fallende Koordinatensystem errichtet ist. Wohlgemerkt, nur räumlich und zeitlich
konstante Gravitationsfelder können durch eine einzige Koordinatentransformation eliminiert werden. Wir lassen aber jetzt beliebig variable Gravitationsfelder
zu.
Hätten wir die Koordinatentransformation ξ α (x), die das Gravitationsfeld
α
g lokal eliminiert, explizit vorliegen, so können wir g α leicht rekonstruieren.
Tragen wir ξ α (x) in die Bewegungsgleichung (10.10) ein,
0=
d
dτ
µ
∂ξ α dxµ
∂xµ dτ
¶
=
∂ 2 ξ α dxµ dxν
∂ξ α d2 xµ
+
,
µ
2
∂x dτ
∂xµ ∂xν dτ dτ
(10.12)
multiplizieren mit ∂xλ /∂ξ α und benutzen die Kettenregel in der Form
∂xλ ∂ξ α
= δ λµ ,
∂ξ α ∂xµ
(10.13)
µ
ν
d2 x λ
λ dx dx
=0
+
Γ
µν
dτ 2
dτ dτ
(10.14)
so entsteht
mit
Γλµν =
∂xλ ∂ 2 ξ α
.
∂ξ α ∂xµ ∂xν
(10.15)
Somit ist das Gravitationsfeld g α durch die Koordinatentransformation ξ(x)
ausgedrückt, die das Feld lokal eliminiert,
µ
ν
1 α
α dx dx
g
=
−Γ
µν
c2
dτ dτ
(10.16)
10.3 Die Viererkraft im Gravitationsfeld
183
Das Feld g α ist also durch das so genannte Christoffelsymbol Γαµν und die Vierergeschwindigkeit dxµ /dτ gegeben.
Mit (10.14) haben wir die allgemeine Form der Bewegungsgleichung eines
Teilchens im Gravitationsfeld gewonnen. Zur Behandlung konkreter Probleme,
wie etwa der Bewegung eines Planeten um die Sonne, müssen wir natürlich
die Gravitationsfeldstärke g α , d. h. das Christoffelsymbol Γαµν für das Feld der
Sonne als Funktion der Koordinaten xα kennen. Bei gegebenem Γλµν (x) können
wir im Prinzip die vier Gleichungen (10.14) lösen. Aus den gewonnen Lösungen
xα = xα (τ ) lässt sich, falls gewünscht, der Parameter τ eliminieren, so dass nach
Beachtung von x0 = ct die Bahnkurve in der üblichen Form ~x = ~x(t) entsteht.
Wir werden darauf zurückkommen.
Mit Hilfe der Transformation ξ α = ξ α (x) können wir auch das Eigenzeitinkrement des Teilchens durch die Laborkoordinateninkremente dxµ ausdrücken,
dτ 2 = −ηαβ dξ α dξ β = −ηαβ
∂ξ α ∂ξ β µ ν
dx dx ≡ −gµν dxµ dxν .
∂xµ ∂xν
(10.17)
Die zur Abkürzung eingeführte Größe
gµν = ηαβ
∂ξ α ∂ξ β
∂xµ ∂xν
(10.18)
heißt metrischer Tensor. Dieser spielt im Weiteren eine wichtige Rolle. Klar ist,
dass gµν bei Vorliegen eines Gravitationsfeldes (und somit einer nichtlinearen
Transformation ξ α = ξ α (x)) weder konstant noch im allgemeinen diagonal sein
wird. Gemäß seiner Definition ist gµν jedoch immer symmetrisch.
Wir haben soeben das Christoffelsystem Γαµν (x) und den metrischen Tensor gµν eingeführt mit Hilfe der Koordinatentransformation ξ α = ξ α (x) von
den Laborkoordinaten xα zu den Koordinaten ξ α des frei fallenden Systems,
bezüglich dessen das beobachtete Teilchen momentan gleichförmig bewegt ist.
Das umgekehrte Vorgehen ist auch möglich und lehrreich. Überzeugen wir uns
davon, dass wir bei gegebenem Gravitationsfeld, bzw. bei gegebenen Γαµν und
gµν immer die Koordinaten ξ α (x) konstruieren können. Dazu multiplizieren wir
die Definition (10.15) mit ∂ξ β /∂xλ und erhalten
∂ξ β ∂xλ ∂ 2 ξ α
∂2ξβ
∂ξ β λ
=
.
Γ µν (x) =
λ
λ
α
∂x
∂x ∂ξ ∂xµ ∂xν
∂xµ ∂xν
(10.19)
Diese Gleichungen können wir, bei gegebenem Γλµν (x), als Differentialgleichungen für die vier Funktionen ξ β (x) lesen. Wir suchen eine Lösung für eine Nachbarschaft von X durch Ansatz einer Potenzreihe in x − X,
µ α¶
∂ξ
α
α
ξ (x) =ξ (X) +
(xµ − X µ )
∂xµ x=X
µ 2 α ¶
∂ ξ
1
+
(xµ − X µ )(xν − X ν ) + · · · .
(10.20)
2 ∂xµ ∂xν x=X
Nach Eintragen des Ansatzes (10.20) in (10.19) finden wir die zweiten Ableitungen als durch Γλµν (x) bestimmt,
µ α¶
µ 2 α ¶
∂ξ
∂ ξ
=
· Γλµν (x) ,
(10.21)
∂xµ ∂xν x=X
∂xλ x=X
184
10 Bewegung schneller Teilchen im Gravitationsfeld
während ξ α (X) und (∂ξ α /∂xµ )x=X als Integrationskonstanten offen bleiben.
Die Beliebigkeit der Matrix (∂ξ α /∂xλ )x=X ist natürlich durch den metrischen
Tensor
gµν (X) = ηαβ (∂ξ α /∂xµ )x=X (∂ξ β /∂xν )x=X
eingeschränkt. Es bleiben, da gµν = gνµ , sechs freie Parameter in der Matrix (∂ξ α /∂xλ )x=X . Das ist gut so, denn das frei fallende Koordinatensystem
darf nicht eindeutig festliegen. Hat man eines, so ist jedes dazu verdrehte und
gleichförmig bewegte gleichberechtigt.
10.4
Lichtstrahlen im Gravitationsfeld
Keine andere wissenschaftliche Entdeckung dieses Jahrhunderts wurde so als
Sensation gefeiert wie Einsteins Vorhersage, dass Lichtstrahlen durch starke
Gravitationsfelder abgelenkt werden, nach ihrer Bestätigung anlässlich einer
Sonnenfinsternis im Jahr 1919 (vgl. Abbildung 10.1. Um den Effekt verstehen und nachrechnen zu lernen, wenden wir wieder das Äquivalenzprinzip an.
Letzteres beansprucht Gültigkeit nicht nur für die Bewegung massiver Teilchen
im Gravitationsfeld, sondern für den Einfluss der Gravitation auf alle physikalischen Phänomene, insbesondere auch auf Lichtausbreitung.
Abbildung 10.1
Bei Abwesenheit von Gravitation sollte ein Lichtstrahl gerade laufen, entsprechend einer ebenen Welle mit dem Phasenfaktor exp i(~k · ξ~ − ωξ 0 /c). Der
Wellenvektor ~k und die Frequenz ω haben dabei den Zusammenhang k 2 = ω 2 /c2 .
Dieser Zusammenhang, auch Dispersionsrelation für Licht im Vakuum genannt,
garantiert, dass ~k · ξ~ − ωξ 0 /c ein Lorentzskalar ist. Wir können den Vierervektor k µ = (k 0 = ω/c, ~k) einführen und den Phasenfaktor der Lichtwelle als
exp(ikµ ξ µ ) schreiben. Die Geradlinigkeit des Lichtstrahls lässt sich auch zum
Ausdruck bringen, indem wir einen Punkt ξ~ auf einer Wellenfront ins feste Augenmerk nehmen und als dessen Bewegungsgleichung“ notieren
”
d2 ξ~
=0.
(10.22)
(dξ 0 )2
Statt der Zeitkoordinate ξ 0 können wir auch einen anderen mit ihr linear verknüpften Parameter σ zur Beschreibung der Bahn des betrachteten Punktes
10.4 Lichtstrahlen im Gravitationsfeld
185
verwenden, woraufhin die Bewegungsgleichung die etwas symmetrischere Form
d2 ξ µ
=0
dσ 2
(10.23)
annimmt.
Im Gravitationsfeld verläuft, wie die erwähnten Beobachtungen bei Sonnenfinsternissen sinnfällig machen, der Lichtstrahl nicht mehr geradlinig. Jedoch
gibt es in jedem Punkt in Sonnennähe ein frei fallendes Koordinatensystem,
in dem die Gravitation lokal vollständig eliminiert ist, so dass die Bewegungsgleichung (10.23) gilt. Sobald wir für jeden Punkt X im Gravitationsfeld die
Koordinatentransformation ξX (x) kennen, die die Laborkoordinaten x mit den
frei fallenden Koordinaten verknüpft, können wir aus (10.23) die Bewegungsgleichung des betrachteten Punktes auf einer Wellenfront gewinnen. Die weitere
Überlegung und Rechnung ist identisch mit der für massive Teilchen und gibt
ν
µ
d2 x λ
λ dx dx
+
Γ
=0.
µν
dσ 2
dσ dσ
(10.24)
Diese die Lichtausbreitung im Gravitationsfeld beschreibende Gleichung hat
das gleiche Aussehen wie die Bewegungsgleichung eines massiven Teilchens.
Natürlich können wir hier den Bahnparameter σ nicht mit der Eigenzeit des
betrachteten Punktes auf der Wellenfront identifizieren, denn dieser Punkt bewegt sich mit Lichtgeschwindigkeit und hat somit keine Eigenzeit. Für Lichtausbreitung gilt dτ = 0, sowohl im frei fallenden System wie im Labor. Die
Umrechnung läuft wie im letzten Paragrafen und führt zu
0 = −ηαβ
dxµ dxν
dξ α dξ β
= −gµν
.
dσ dσ
dσ dσ
(10.25)
Statt von einem fiktiven Punkt auf einer Wellenfront werden wir künftig von einem masselosen Teilchen reden, das sich im gravitationsfreien Raum (und somit
auch in einem frei fallenden Bezugssystem) geradlinig mit Lichtgeschwindigkeit
bewegt. Diese Redeweise macht deutlich, dass der Einfluss des Gravitationsfeldes auf massive und masselose Teilchen der gleiche ist. Sie wissen andererseits, aus quantenmechanischer Vorbildung, dass das in Rede stehende masselose
Teilchen, das Photon, keine bloße Fiktion ist, dass vielmehr elektromagnetische
Wellen auch in anderer Hinsicht Teilchencharakter zeigen.
Die Lichtartigkeitsbedingung (10.25) für eine Photonenbahn xλ ermöglicht
die Berechnung der Zeit dt = dx0 /c, die ein Photon benötigt, um den Weg d~x
zu durchlaufen. Aus (10.25) folgt∗) unter Beachtung der Symmetrie von gµν
g00 c2 dt2 + 2gi0 dxi c dt + gij dxi dxj = 0
(10.26)
und hieraus die Laufzeit
dt =
·
¸
q
1
−gi0 dxi − (gi0 gj0 − gij g00 ) dxi dxj
cg00
(10.27)
In diesem Ausdruck erscheint das Minuszeichen vor der Wurzel. Das umgekehrte Vorzeichen kommt nicht in Frage, wie wir uns klarmachen am Beispiel einer linearen Koordinatentransformation, für die gilt gµν = ηµν d. h.
∗) Beachte,
dass der lateinische Index i die drei Raumkoordinaten zählt, also i = 1, 2, 3.
186
10 Bewegung schneller Teilchen im Gravitationsfeld
h √
i
c dt = − − d~x2 . Eine wichtige Konsequenz aus (10.25) springt sofort ins
Auge. Da im Gravitationsfeld der metrische Tensor gµν koordinatenabhängig
und jedenfalls ungleich dem Minkowskitensor ist, gilt nicht mehr c dt = |d~x|,
d. h. im Gravitationsfeld weicht die Lichtgeschwindigkeit von c ab.
Letzterer Effekt ist uns, ebenso wie die Lichtablenkung durch schwere Massen, aus der Alltagserfahrung nicht geläufig. Der Grund dafür ist die Schwachheit des Gravitationsfeldes der Erde. Selbst das viel stärkere Feld der Sonne
bewirkt eine Lichtablenkung um bloße 1, 75 Bogensekunden für Lichtstrahlen,
die in unmittelbarer Nähe der Sonnenoberfläche an der Sonne vorbeilaufen (s.
10.12).
10.5
Der metrische Tensor ist das Gravitationsfeld
Sie haben eben gelernt, dass das Christoffelsymbol Γλµν die Gravitationskraft
und der metrische Tensor gµν das Eigenzeitinkrement von Teilchen festlegen.
Jetzt will ich zeigen, dass sich das Christoffelsymbol durch den metrischen Tensor gµν und seine ersten Ableitungen darstellen lässt als
Γλµν
1
= g λσ
2
½
∂gµσ
∂gνσ
∂gµν
+
−
∂xν
∂xµ
∂xσ
¾
,
(10.28)
wobei g µν der zu gµν inverse Tensor ist,
g µσ gσν = δ µν .
(10.29)
Der metrische Tensor spielt also die Rolle eines Potentials für die durch Γλµν (x)
bestimmte Gravitationskraft. Jedenfalls genügt die Kenntnis des metrischen
Tensors gµν (x), um die Bewegung von Teilchen im Gravitationsfeld vollständig
beschreiben zu können.
Der obige Zusammenhang zwischen dem Christoffelsymbol Γλµν und dem
metrischen Tensor gµν folgt aus dem Äquivalenzprinzip, welches wir zunächst
etwas verfeinert formulieren müssen. Am Punkt xα = X α (in Laborkoordinaα
ten) seien ξX
die Koordinaten des dortigen frei fallenden Systems. Mit Hilfe
α
α
(x) definiert sich der metrische Tensor als
= ξX
der Transformation ξX
gµν (X) =
Ã
β
α
(x)
∂ξX
(x) ∂ξX
ηαβ
µ
∂x
∂xν
!
.
(10.30)
x=X
α
An einem benachbarten Raum-Zeit-Punkt xα = X 0 hat man, wenn das Gravitationsfeld nicht konstant ist, ein anderes frei fallendes Bezugssystem mit Koorα
α
dinaten ξX
0 . Für einen mit den ξX fallenden Beobachter erscheint das System
α
α
der ξX 0 , beschleunigt, er konstatiert also ein bei ξX
(x = X 0 ) herrschendes Gravitationsfeld gemäß dem metrischen Tensor
!
Ã
β
α
∂ξX
0 ∂ξX 0
X
0
.
(10.31)
gµν (ξX (X )) =
µ
ν ηαβ
∂ξX
∂ξX
0
ξX =ξX (X )
10.5 Der metrische Tensor ist das Gravitationsfeld
187
Dem in Rede stehenden Beobachter wird nahe liegen, diesen metrischen Tensor
α
als Funktion seiner Koordinaten ξX
zu schreiben; wir könnten auch Laborkoordinaten verwenden.
X
Offenbar ist gµν
(ξX (X)) = ηµν . Wenn wir zur Vereinfachung der Symbolik
den Ursprung des bei X frei fallenden Systems so wählen, dass ξX (x = X) = 0,
α
X
(ξX )
so lautet die für kleine ξX
gültige Taylorreihe für gµν
Ã
!
Ã
!
X
X
∂gµν
∂ 2 gµν
1
X
α
α α
gµν
(ξX ) = ηµν +
ξ
+
ξX
ξX + · · · . (10.32)
X
α
α ∂ξ β
∂ξX
2 ∂ξX
X
ξX =0
ξX =0
α
In dieser Reihe kommt klar zum Ausdruck, dass die ξX
zwar am Ort x =
X, nicht aber in endlichem Abstand davon ein frei fallendes System bilden.
α
In hinreichender Entfernung vom Ursprung ξX = 0 bemerkt der mit den ξX
fallende Beobachter sehr wohl ein Gravitationsfeld.
Wir hatten das Äquivalenzprinzip bisher formuliert als die Forderung, dass
α
sich durch ein geeignetes frei fallendes System ξX
das Gravitationsfeld in einem
hinreichend kleinen Raum-Zeit-Bereich um x = X herum eliminieren lassen
muss. Wir präzisieren nun das hinreichend“ dahingehend, dass sich die Koor”
α
X
α
dinaten ξX
so einrichten lassen müssen, dass die ersten Ableitungen (∂gµν
/∂ξX
)
X
bei ξX = 0 verschwinden. Die Abweichung des metrischen Tensors gµν (ξX ) vom
α
Minkowskitensor ist dann, wie (10.32) zeigt, mindestens quadratisch in ξ X
. Erst
α
α
in zweiter Ordnung in ξX wird für den mit dem System der ξX fallenden Beobachter ein Gravitationsfeld bemerkbar. Wir werden gleich sehen, dass erst
die hier gegebene Präzisierung des Äquivalenzprinzips sicherstellt, dass ein bei
α
x = X befindliches Teilchen bezüglich des Systems ξX
tatsächlich keine Beschleunigung erfährt.
Nach dieser Vorbemerkung finden wir aus einer leichten Rechnung, bei der
X
wir übrigens gµν
als Funktion der Laborkoordinaten nehmen, den oben vorgestellten Zusammenhang zwischen dem Christoffelsymbol und seinem Potenti”
al“, dem metrischen Tensor. Unter bloßer Beachtung der Kettenregel können
wir umformen wie
!
Ã
β
α
∂ξX
0 ∂ξX 0
0
ηαβ
gµν (X ) =
∂xµ ∂xν
x=X 0
!
Ã
µ γ
¶
β
α
δ
∂ξX ∂ξX
∂ξX
0 ∂ξX 0
ηαβ
=
,
γ
δ
∂ξX
∂xµ ∂xν x=X 0
∂ξX
0
x=X
also
X
gµν (X 0 ) = gγδ
(X 0 )
µ
γ
δ
∂ξX
∂ξX
µ
∂x ∂xν
¶
.
(10.33)
x=X 0
λ
Dies differenzieren wir nach X 0 und setzen X = X 0 . Da
³
´
¢
¡ α
¢
¡ X
λ
λ
X
α
·
∂ξ
/∂X
∂gγδ
(X 0 )/∂X 0
= ∂gγδ
/∂ξX
=0,
X
X 0 =X
ξ=0
X 0 =X
gibt der erste Faktor auf der rechten Seite von (10.33) keinen Beitrag zur geX
suchten Ableitung und wir erhalten wegen gγδ
(X) = ηγδ
¶
µ 2 γ
γ
δ
δ
∂ ξX (x) ∂ξX
(x) ∂ξX (x) ∂ 2 ξX
(x)
∂gµν
.
(10.34)
=
η
+
γδ
∂X λ
∂xλ ∂xµ ∂xν
∂xµ ∂xν ∂xλ x=X
188
10 Bewegung schneller Teilchen im Gravitationsfeld
Die rechte Seite dieser Gleichung lässt sich durch das Christoffelsymbol ausdrücken
µ
γ
γ ¶
δ
δ
∂gµν
σ ∂ξX ∂ξX
σ ∂ξX ∂ξX
= ηγδ Γ λµ σ
+ Γ λν σ
∂X λ
∂x ∂xν
∂x ∂xµ x=X
= Γσλµ (X)gσν (X) + Γσλν (X)gσµ (X) .
(10.35)
Um nach dem Christoffelsymbol auflösen zu können, addieren wir zu dieser
Gleichung die nämliche mit µ und λ vertauscht und subtrahieren dieselbe nochmals mit ν und λ vertauscht. Es entsteht, wenn wir die aus den Definitionen
folgenden Symmetrien gµν = gνµ und Γλµν = Γλνµ benutzen,
∂gλν
∂gµλ
∂gµν
+
−
= 2Γσλµ gσν .
∂xλ
∂xµ
∂xν
(10.36)
Nach Multiplikation mit dem zu gµν inversen Tensor g µν entsteht schließlich die
eingangs vorgestellte Relation.
Ihnen bleibt als kleine Übung, zu zeigen, dass sich der Tensor g µν durch
die Transformation ξ = ξ(x) zum frei fallenden Koordinatensystem ausdrücken
lässt,
g µν = g νµ =
10.6
∂xν ∂xµ γδ
η .
∂ξ γ ∂ξ δ
(10.37)
Der Newtonsche Grenzfall
Für langsame Teilchen in schwachen Gravitationsfeldern muss die Einsteinsche
Bewegungsgleichung
µ
ν
d2 x λ
λ dx dx
=
−Γ
µν
dτ 2
dτ dτ
(10.38)
in die Newtonsche übergehen. Überzeugen wir uns davon und lernen dabei, wie
der metrische Tensor (das Einsteinsche Gravitationspotential“) im Grenzfall
”
des schwachen statischen Feldes aussieht.
Bei |~v | ¿ c können wir zunächst die räumlichen Komponenten d~x/dτ ≈ ~v /c
gegen dx0 /dτ = c dt/dτ ≈ 1 vernachlässigen und erhalten
d2 x λ
= −Γλ00
dτ 2
µ
dct
dτ
¶2
.
(10.39)
Da das Gravitationsfeld als statisch angenommen wurde, verschwinden die Zeitableitungen des metrischen Tensors,
µ
¶
1 λσ
∂g0σ
∂g00
∂g00
1
λ
2
−
.
(10.40)
Γ 00 = g
= − g λi
σ
2
∂ct
∂x
2
∂xi
Bei Abwesenheit des Gravitationsfeldes wäre gµν = ηµν . Im schwachen Feld
wird der metrische Tensor nur wenig vom Minkowskitensor abweichen, so dass
wir ansetzen können
gµν = ηµν + hµν
(10.41)
10.6 Der Newtonsche Grenzfall
189
mit |hµν | ¿ |ηµν |. In erster Ordnung in der Störung hµν entsteht aus (10.40)
1 ∂h00
∂h00
1
, also Γ000 = 0 und Γi 00 = −
Γλ00 = − η λi
i
2
∂x
2 ∂xi
Tragen wir dies in die Bewegungsgleichung (10-39) ein, so entsteht
¶2
µ
d2 ct
d2 x i
1 ∂h00 dct
und
=
=0.
dτ 2
2 ∂xi
dτ
dτ 2
(10.42)
(10.43)
Letztere Gleichung besagt, dass Laborzeit und Eigenzeit linear verknüpft sind,
(dct/dτ ) = const. Damit kann aus der ersten Gleichung in (10.43) der Para2 i
meter τ leicht eliminiert werden, denn ddτx2 = (const)2 d2 xi /d(ct)2 . Daraufhin
erhalten wir
c2 ∂h00
d2 x i
=
dt2
2 ∂xi
(10.44)
oder
d2 ~x
c2
= ∇h00 .
2
dt
2
In der Newtonschen Mechanik gilt
(10.45)
d2 ~x
= −∇ϕ ,
(10.46)
dt2
wobei ϕ das Newtonsche Gravitationspotential ist. Die Einsteinsche Bewegungsgleichung reduziert sich also auf die Newtonsche, wenn wir die Korrektur h 00
zur 0−0-Komponente des Minkowskitensors identifizieren als
2
ϕ(~x) + const .
(10.47)
c2
In beliebig großer Entfernung von allen felderzeugenden Massen muss das Gravitationsfeld beliebig klein werden, d. h. h00 (~x → ∞) → 0. Das Newtonsche
Potential hatten wir ebenfalls so definiert, dass es im Unendlichen verschwindet, so dass die Konstante in (10.47) verschwindet. Somit gilt im Newtonschen
Grenzfall
h00 (~x) = −
g00 = −(1 + 2ϕ/c2 ) .
(10.48)
2
Um ein Gefühl für die Größe der Korrektur 2ϕ/c in (10.48) zu erhalten, erinnern wir uns an das Newtonsche Potential eines Teilchens mit Masse m,
ϕ~x = Gm/|~x|. Sie rechnen leicht aus, nach Aufsuchen der entsprechenden
Massen und Radien,
¯ ¯
¯ 2ϕ ¯
¯ ¯ ≈ 10−39 an der Oberfläche eines Protons
¯ c2 ¯
≈ 10−9
auf der Erdoberfläche
≈ 10−6
auf der Sonnenoberfläche
≈ 10−4
auf der Oberfläche eines weißen Zwerges.
Offenbar machen wir an der Erdoberfläche keinen großen Fehler, wenn wir das
Eigenzeitinkrement eines Teilchens mit dem Minkowskitensor statt mit dem
metrischen Tensor ausrechnen.
190
10.7
10 Bewegung schneller Teilchen im Gravitationsfeld
Frequenzverschiebung fallender Photonen
Eine der schönsten experimentellen Bestätigungen des Äquivalenzprinzips wurde im Jahr 1960 von Pound und Rebka gegeben. Das Messergebnis besteht im
Nachweis einer Frequenzvergrößerung ( Blauverschiebung“) von Gammastrah”
len, die im Schwerefeld der Erde um etwa 20 m gefallen sind. Hier will ich Ihnen
die theoretische Grundlage zur Diskussion dieses Experiments und verwandter
Phänomene geben.
Betrachten wir eine Uhr, die sich mit beliebiger Geschwindigkeit in einem
beliebigen Gravitationsfeld bewegt. Zwischen zwei aufeinander folgenden Ticks
vergeht die Eigenzeit ∆t. Das Eigenzeitintervall ∆t ist nicht gleich dem Zuwachs dx0 /c = dt der Laborzeit t = x0 /c, den wir im Labor als Zeitabstand der
beiden in Rede stehenden Ticks messen, denn zur Messung der Laborzeit t bzw.
x0 verwenden wir i. A. im Labor ruhende Instrumente ( x0 -Anzeiger“). Selbst
”
wenn wir die Laborzeit x0 /c ablesen auf einer Uhr, die konstruktionsgleich ist
mit der zum Zeitpunkt x0 am Ort ~x beobachteten, so wird das Laborzeitinkrement dx0 /c zwischen den beiden Ticks des Beobachtungsobjekts mit dem
Eigenzeitinkrement ∆t nur dann übereinstimmen, wenn sich der x0 -Anzeiger
zum Beobachtungszeitpunkt ebenfalls am Ort ~x befindet und dort relativ zur
beobachteten Uhr ruht.
Vereinbaren wir jedoch, dass der x0 -Anzeiger bei ~x = 0 ruht. Das Laborzeitintervall dt = dx0 /c zwischen zwei aufeinander folgenden Ticks der Uhr bei ~x
denken wir uns so gemessen, dass dieselbe anlässlich jedes Ticks einen Lichtblitz
zum x0 -Anzeiger schickt; auf letzterem wird dt abgelesen als Zeitabstand der
Ankunft zweier aufeinander folgender Lichtblitze.
Um den Zusammenhang zwischen ∆t und dt auszurechnen, erinnere ich an
die anfängliche Bemerkung, dass ∆t die Zeit ist, die zwischen den Ticks verstreicht bzgl. eines frei fallenden Systems, in dem die Uhr ruht. In einem
anderen lokal frei fallenden System, in dem die Uhr sich gleichförmig bewegt,
verstreicht dξ 0 und es gilt
q
1
−ηαβ dξ α dξ β ,
(10.49)
∆t =
c
während sich das im Laborsystem ablaufende Zeitintervall berechnet aus
r
∂ξ α ∂ξ β
1p
1
−ηαβ µ ν dxµ dxν =
−gµν dxµ dxν .
∆t =
(10.50)
c
∂x ∂x
c
Dabei sind wir jetzt weniger an der schon bei Abwesenheit von Gravitation auftretenden Verschiedenheit von ∆t und dt interessiert, die mit einer Relativbewegung von Beobachtungsobjekt und Labor verbunden ist; viel mehr interessiert
uns der Einfluss des Gravitationsfeldes auf das Verhältnis ∆t/dt; daher nehmen
wir an, dass die beobachtete Uhr relativ zum Labor ruht, so dass d~x = 0. Dann
folgt
p
(10.51)
∆t = −g00 (x) dt .
p
Man kann den Dilatationsfaktor“ −g00 (x) nicht durch Messungen an ei”
nem Raum-Zeit-Punkt x allein festlegen. Denn wenn der x0 -Anzeiger zur Zeit
x0 nach ~x gebracht wird, wo sich auch das Beobachtungsobjekt befindet, so
10.7 Frequenzverschiebung fallender Photonen
191
wird er dann und dort vom Gravitationsfeld genauso beeinflusst wie das letztere. Somit kann zwischen beiden Uhren kein Gangunterschied auftreten. Um den
Einfluss des Gravitationsfeldes auf den Gang von Uhren nachzuweisen, müssen
Uhren an verschiedenen Raum-Zeit-Punkten verglichen werden.
Betrachten wir der Einfachheit halber zwei Raumpunkte in einem zeitunabhängigen Gravitationsfeld gµν (~x). Am Ort ~xQ ruhe als Uhr“ eine Lichtquelle,
”
die Licht einer Spektrallinie aussendet. Am Ort ~xB wird dieses Licht empfangen
und hinsichtlich seiner Frequenz verglichen mit Licht derselben Spektrallinie, das
am Ort ~xB selbst erzeugt wird.
Der Zeitabstand zwischen der Aussendung aufeinander folgender Wellenmaxima (das seien die Ticks“ der Uhr“) sei dtQ = dx0Q /c; er hängt mit dem
”
”
entsprechenden Zeitabstand ∆t bei Abwesenheit des Gravitationsfeldes zusammen gemäß
q
(10.52)
dtQ = ∆t/ −g00 (~xQ ) .
Die Reisedauer der Wellenfronten von der Quelle zum Beobachter bei ~xB wird
für alle Wellenmaxima gleich groß sein, da sich das Gravitationsfeld zeitlich nicht
ändert. Die Zeitspanne zwischen den Ankünften aufeinander folgender Wellenmaxima wird also auch stets gleich bleiben und den durch (10.52) gegebenen
Wert haben. Der entsprechende Zeitabstand zwischen den Wellenmaxima einer
in ~xB ruhenden Quelle beträgt jedoch
p
(10.53)
dtB = ∆t/ −g00 (~xB ) .
Demnach erscheint einunddieselbe Spektrallinie unter verschiedenen Frequenzen, deren Verhältnis durch
s
νB
g00 (~xB )
dtQ
=
=
(10.54)
νQ
dtB
g00 (~xQ )
gegeben ist.
Im schwachen Feld, wo g00 (~x) ≈ −1 − 2ϕ(~x)/c2 mit |ϕ|/c2 ¿ 1 gilt, drückt
sich die Linienverschiebung durch die Newtonschen Potentiale an den beteiligten
Orten aus,
s
1 + 2ϕ(~xB )/c2
1
νB
≈
≈ 1 + [ϕ(~xB ) − ϕ(~xQ )] 2 .
(10.55)
νQ
1 + 2ϕ(~xQ )/c2
c
Als relative Frequenzverschiebung ∆ν/νB = (νQ − νB )/νB erhalten wir somit
∆ν
1
= (ϕ(~xQ ) − ϕ(~xB )) 2 .
νB
c
(10.56)
Das ist eine Rotverschiebung, wenn das Feld am Ort der Quelle stärker ist als
beim Beobachter, während ein im Gravitationsfeld fallendes Photon offenbar
eine Vergrößerung seiner Frequenz, d. h. eine Blauverschiebung erleidet.
Das Resultat (10.56) legt wieder die schon benutzte Redeweise vom Photon
als einem (masselosen) Teilchen nahe. Wenn ein massives Teilchen im Gravitationsfeld zu tieferem Potential fällt, so vergrößert sich dabei seine kinetische
192
10 Bewegung schneller Teilchen im Gravitationsfeld
Energie. Ganz ähnlich ergeht es dem Photon. Der einzige Unterschied zum massiven Teilchen ist, dass das schon mit c fliegende Photon Energie nicht durch
Vergrößerung seiner Geschwindigkeit aufnimmt sondern durch Vergrößerung seiner Frequenz.
Im Pound-Rebka Experiment entsprach der Potentialunterschied zwischen
Quelle und Empfänger einem Höhenunterschied von 22, 6 m, betrug also ∆ϕ/c2
= 9, 81 m s−2 · 22, 6 m/9 · 1016 m2 s−2 ≈ 2, 5 · 10−15 . Wie eine derart winzige Frequenzverschiebung nachgewiesen wurde, ist eine Geschichte für sich, die
Sie anderswo ausführlich nachlesen müssen. Jedenfalls ist die Vorhersage des
Äquivalenzprinzips durch Experimente dieses Typs inzwischen bis auf ∼ 1%
bestätigt.
Eine an der Sonnenoberfläche erzeugte Spektrallinie muss dem terrestrischen Beobachter rotverschoben erscheinen, denn das Gravitationspotential am
Entstehungsort ist, wie ich schon oben notiert hatte, betragsmäßig wesentlich
stärker als das Gravitationspotential an der Erdoberfläche. Die vom Äquivalenzprinzip vorhergesagte relative Linienverschiebung von etwa 2 · 10−6 ist wegen
experimenteller Schwierigkeiten bisher nur bis auf eine Genauigkeit von etwa
5% gesichert.
10.8
Nochmal auf die rotierende Scheibe!
Schon mit Hilfsmitteln der speziellen Relativitätstheorie hatten wir uns davon
überzeugt, dass eine am Rand einer gleichförmig rotierenden Scheibe festgemachte Uhr langsamer geht als ihr im Labor ruhendes Duplikat. Als Umlaufdauer wird auf der mitrotierenden Uhr Trot und auf der Laboruhr Tlab abgelesen
und es gilt, wenn ω die Kreisfrequenz der Scheibe ist und R den Abstand der
rotierenden Uhr von der Drehachse bezeichnet,
Trot = Tlab
p
1 − ω 2 R2 /c2 .
(10.57)
Um Sie an den Umgang mit dem Äquivalenzprinzip zu gewöhnen, will ich dieses
Resultat nun nochmals herleiten.
Ein auf der rotierenden Scheibe ruhender Reisender mag sich einbilden, die
Scheibe sei in Ruhe und die für ihn überall auf der Scheibe feststellbaren Kräfte
auf Probeteilchen rührten von einem Gravitationsfeld her. Er wird dieses Feld
durch den metrischen Tensor gµν beschreiben und seine Mühe damit haben,
gµν (x) durch Messungen festzulegen. Wir haben keinerlei Mühe, den metrischen
Tensor auszurechnen mit Hilfe der Koordinatentransformation vom Scheibensystem xα zum System der ξ α , bezüglich dessen wir die Scheibe rotieren sehen.
Der Beobachter auf der Scheibe möge sich dazu entschließen, als seinen x0 Anzeiger unseren ξ 0 -Anzeiger zu verwenden. Das wird ihm Unbequemlichkeiten
bringen, denn er sieht diese Uhr kreisen (der Bundespostminister dürfte sich
sicher nicht erlauben, den Taktgeber des hiesigen Telefonsystems auf dem Mond
zu installieren), jedoch kommt uns bei der weiteren Überlegung die Verrücktheit
des Scheibenmännchens sehr zupass. Im Übrigen verwende das Scheibenmännchen Zylinderkoordinaten x1 = r, x2 = ϕ, x3 = z, wobei die z-Achse die
Symmetrieachse des Systems sei. Wenn wir im Labor kartesische Koordinaten
ξ i wählen, so haben wir die Transformation
10.8 Nochmal auf die rotierende Scheibe!
193
ξ 0 = x0
ξ x = r cos(ϕ + ωx0 /c)
(10.58)
ξ y = r sin(ϕ + ωx0 /c)
ξz = z
Abbildung 10.2
und können den metrischen Tensor gµν (x) mit Hilfe seiner Definition
gµν (x) =
∂ξ α ∂ξ β
ηαβ
∂xµ ∂xν
(10.59)
∂ξ 0 ∂ξ 0
∂ξ x ∂ξ x
∂ξ y ∂ξ y
∂ξ z ∂ξ z
+
+
+
∂xµ ∂xν
∂xµ ∂xν
∂xµ ∂xν
∂xµ ∂xν
ausrechnen. Das für uns wichtige Element ist g00 . Es lautet
=−
g00 (r, ϕ, z, x0 ) = −1 +
r2 ω2
r2 ω2
sin2 (ϕ + ωx0 /c) + 2 cos2 (ϕ + ωx0 /c)
2
c
c
= −1 + r 2 ω 2 /c2 .
Obwohl wir die anderen hier nicht benötigen, sollten Sie sie zur Gewöhnung an’s
Differenzieren und Summieren ausrechnen.
Da die am Scheibenrand bei r = R, ϕ = 0, z = 0 festgemachte Uhr für
das Scheibenmännchen ruht, drückt er ihr Eigenzeitinkrement ∆t aus als (s.
(10.51))
p
p
∆t = −g00 (R, 0, 0)dx0 /c = 1 − ω 2 R2 /c2 dx0 /c .
(10.60)
P
Die Summe
∆t = Trot
P 0 aller dieser Inkremente für einen Umlauf lesen wir mit
und
dx = Tlab als das oben schon vorgestellte Resultat (s. (10.51)).
Im letzten Kapitel hatte ich das Resultat (10.57) salopp als Reisen erhält
”
jung“ formuliert. Jetzt liegt die Interpretation starker Gravitationsfelder als
Jungbrunnen nahe.
194
10.9
10 Bewegung schneller Teilchen im Gravitationsfeld
Das statische isotrope Gravitationsfeld
Obwohl die Sonne leicht abgeplattet ist und um ihre Symmetrieachse rotiert, obwohl also die Massenverteilung der Sonne weder kugelsymmetrisch noch statisch
ist, werden wir ihr Gravitationsfeld als statisch und isotrop idealisieren. Der
hierdurch entstehende Fehler bei der Berechnung der Licht- und Teilchenbahnen ist bei weitem zu klein, um experimentell nachgewiesen werden zu können.
Zur Bestimmung des Gravitationsfeldes einer vorgegebenen Massenverteilung hat man die hier nicht diskutierten Einsteinschen Feldgleichungen zu lösen,
ähnlich wie man das Coulombfeld durch Lösung der Maxwellschen Gleichungen
findet. Tatsächlich können wir uns auch ohne Benutzung der Feldgleichungen durch elementare Überlegungen hinreichenden Aufschluss über das gesuchte
Feld verschaffen.
Wir benutzen am besten räumliche Kugelkoordinaten xµ = (ct, r, θ, ϕ), wobei r = 0 das Zentrum der Massenverteilung bedeutet. Den metrischen Tensor
gµν können wir dann ablesen aus der allgemeinst möglichen Form des Eigenzeitintervalls dτ 2 = −gµν dxµ dxν . Für letztere dürfen wir, wie leicht einzusehen
ist, ansetzen
dτ 2 = −g00 (r)c2 dt2 − grr (r2 ) dr2 − r2 (dθ2 + sin2 θdϕ2 ) .
(10.61)
Wegen der Isotropie und Zeitunabhängigkeit des Feldes hängen nämlich die Koeffizienten g00 und grr nur von r ab. Die Nichtdiagonalelemente g0r , g0θ , g0ϕ ,
grθ , grϕ , gθϕ müssen alle verschwinden; ein Beitrag zu dτ 2 der Form grϕ dr dϕ,
z. B., würde vom Vorzeichen von dϕ abhängen und somit die Richtung θ = 0
auszeichnen, während die Mischglieder g0i dct dxi eine Zeitrichtung auszeichnen
würden. Dass das dritte Glied in (10.61) nicht eine weitere freie Funktion von
r enthält, sondern gθθ = r2 erscheint, lässt sich immer durch Festlegung der
2
Längeneinheit einrichten; wenn etwa
p gθθ = C(r) 6= 2r gegeben ist, so führt die
Koordinatentransformation r̃ = C(r) zu gθθ = r̃ , ohne dass sich die Struktur von (10.61) ansonsten ändert. Es ist jedoch nicht möglich, durch weitere
Koordinatentransformationen die Zahl der freien Funktionen in dτ 2 unter zwei
zu drücken.
Von den beiden Koeffizienten g00 (r) und grr (r) wissen wir zunächst nur, dass
sie im feldfreien Raum, d. h. insbesondere für r → ∞ die Werte −1 bzw. +1
haben müssen, denn dort ist die Metrik Minkowskisch. Außerdem hatten wir
uns davon überzeugt, dass im Newtonschen Grenzfall, d. h. für ein schwaches
Feld gilt
g00 (r) ≈ −1 − 2ϕ/c2 = −1 +
2M G
,
c2 r
(10.62)
wobei M die felderzeugende Masse ist. Der hier auftretende Parameter M G/c2
hat die Dimension einer Länge und heißt Schwarzschildradius der Massenverteilung. Sein Zahlenwert für die Sonne ist
MS G/c2 = 1.48 km ,
(10.63)
also sehr klein gegenüber dem Sonnenradius
RS = 6.96 × 105 km
(10.64)
10.9 Das statische isotrope Gravitationsfeld
195
und erst recht klein gegenüber dem kleinsten Abstand eines Planeten vom Sonnenzentrum. Zum Beispiel beträgt der Aphelabstand des Merkur
rM ≈ 4.59 × 107 km ≈ 65RS .
(10.65)
Die Kleinheit des Schwarzschildradius der Sonne gegen RS ist der Grund der
Schwäche des Gravitationsfeldes überall im Sonnensystem.
Wenn die relativistische Gravitationstheorie außer der Gravitationskonstanten G keine weiteren Kopplungskonstanten in Rechnung stellen muss – es gibt
in der Tat keine empirischen Hinweise auf das Auftreten solcher Kopplungskonstanten –, so ist der Schwarzschildradius der einzige Parameter der Dimension
einer Länge, den die Gravitationstheorie für das Feld eines statischen isotropen
Sterns der Masse M zur Verfügung stellt. Da die Koeffizienten g00 (r) und grr (r)
dimensionslos sind, müssen sie dann vom dimensionslosen Argument M G/c2 r
abhängen, d. h. die Form
grr = A
µ
MG
c2 r
¶
,
g00 = −B
µ
MG
c2 r
¶
(10.66)
haben. Überall im Sonnensystem und sogar an der Sonnenoberfläche ist das
Argument der Funktionen A und B sehr klein gegen eins, so dass wir A und B
sicher durch die Taylorreihen
A = 1 + 2γ
MG
+ ···
c2 r
MG
B = 1 − 2 2 + 2(β − γ)
c r
µ
MG
c2 r
¶2
+ ···
(10.67)
approximieren können. Die Parametrisierung der Entwicklungskoeffizienten durch
die noch zu bestimmenden Größen β und γ ist Konventionssache.
Aus dem Eigenzeitinkrement (10.61) lesen wir den metrischen Tensor g µν
ab. Seine nicht verschwindenden Elemente lauten
g00 = −B,
gθθ = r2 ,
grr = A,
gϕϕ = r2 sin2 θ .
(10.68)
Der inverse metrische Tensor ist ebenfalls diagonal und kann ohne Rechnung
aus (10.68) entnommen werden
g 00 = −1/B,
g rr = 1/A,
gθθ = r−2 ,
g ϕϕ = 1/r 2 sin2 θ .
(10.69)
Zum Aufstellen der Bewegungsgleichung eines Teilchens benötigen wir noch das
Christoffelsymbol
Γλµν =
1 λσ
g
2
µ
∂gσµ
∂gσν
∂gµν
+ µ − σ
xν
x
x
¶
.
(10.70)
196
10 Bewegung schneller Teilchen im Gravitationsfeld
Aus (10.68) und (10.69) finden wir die nichtverschwindenden Elemente zu
1 dA
r
r sin2 θ
, Γrθθ = − , Γrϕϕ = −
,
2A dr
A
A
1
= Γθθr = , Γθϕϕ = − sin θ cos θ,
r
1
= Γϕϕr = , Γϕθϕ = Γϕϕθ = cot θ,
r
Γrrr =
Γθrθ
Γϕrϕ
Γ0r0 = Γ00r =
Γr00 =
1 dB
2A dr
(10.71)
1 dB
.
2B dr
Wir wenden uns nun der Bewegungsgleichung eines Teilchens zu, wobei wir
für die Funktionen A und B die Entwicklungen (10.67) nehmen. Nebenbei sei
bemerkt, dass die Einsteinschen Feldgleichungen das exakte Resultat
B = A−1 = 1 −
2M G
,
c2 r
(10.72)
also
β=γ=1
(10.73)
zulassen.
10.10
Bewegungsgleichungen im statischen isotropen Feld
Wenn wir den Ort eines Teilchens zur Zeit t = x0 /c durch Kugelkoordinaten
x1 = r, x2 = θ, x3 = ϕ festlegen, so nehmen die allgemeinen Bewegungsgleichungen
µ
ν
d2 x λ
λ dx dx
+
Γ
=0
µν
dτ 2
dτ dτ
(10.74)
im eben gewonnenen statischen isotropen Feld die folgenden Formen an
d2 t
B 0 (r) dt dr
=0
(10.75)
+
dσ 2
B(r) dσ dσ
µ ¶2
µ ¶2
µ ¶2
µ
¶2
d2 r
A0 dr
r dθ
r sin2 θ dϕ
B 0 dct
+
−
−
+
= 0 (10.76)
dσ 2
2A dσ
A dσ
A
dσ
2A dσ
µ ¶2
dϕ
d2 θ
2 dθ dr
−
sin
θ
cos
θ
+
=0
(10.77)
2
dσ
r dσ dσ
dσ
dϕ dθ
d2 ϕ 2 dϕ dr
+ 2 cot θ
=0.
+
dσ 2
r dσ dσ
dσ dσ
(10.78)
Dabei bedeutet A0 = dA/dr, B 0 = dB/dr. Die Bahnkurve xµ (σ) ist mit einer
Größe σ parametrisiert, die ganz beliebig gewählt werden kann. Für ein massives
Teilchen ist dessen Eigenzeit eine nahe liegende und manchmal bequeme Wahl.
10.10 Bewegungsgleichungen im statischen isotropen Feld
197
Trotz der ungewohnten Form sind die Bewegungsgleichungen (10.75-10.78)
nicht schwerer zu lösen als ihre in 3 behandelten nichtrelativistischen Vereinfachungen. Letztere, die Newtonschen Gleichungen für das Keplerproblem, sind
hier als Grenzfall c → ∞ enthalten, wie Sie nach Eintragen von A und B aus
10.9 sofort sehen. Die folgenden Betrachtungen Schritt für Schritt mit den entsprechenden der Newtonschen Theorie zu vergleichen, sollte für Sie lehrreich
und erfreulich sein.
Die nichtrelativistischen Bahnkurven im isotropen Feld verlaufen in Ebenen.
Ebenso die relativistischen Bahnen, denn die Gleichungen (10.75-10.78) erlauben
die Lösungen ϕ = const oder θ = π2 . Wir wählen die Bezugsrichtungen der
Winkel so, dass die Bahn in der Ebene
θ=
π
2
(10.79)
liegt. Es bleibt die Aufgabe, die Bahnkurve in den Polarkoordinaten r = r(t)
und ϕ = ϕ(t) zu finden. Beim nichtrelativistischen Keplerproblem hatten wir
uns dabei der Erhaltungssätze für Drehimpuls und Energie bedient. Auch hier
gehen wir so vor.
Die Gleichungen (10.75) und (10.78) besagen, dass längs der Bahn die Größen
B(dt/dσ) bzw. r 2 dϕ/dσ konstant bleiben. Ohne Verlust an Allgemeinheit setzen wir
dσ = B dt ,
(10.80)
denn die auftretende Integrationskonstante lässt sich im Parameter σ absorbieren. Die Konstanz von r 2 dϕ/dσ lässt sich dann ausdrücken als
r2 dϕ
= l = const .
B dt
(10.81)
Die nichtrelativistische Version (c = ∞ bzw. B = 1) dieses Erhaltungssatzes
für ein Teilchen der Masse m hatten wir als Drehimpulserhaltungssatz kennengelernt mit
L = lm
(10.82)
als Betrag des Bahndrehimpulses. In der Form (10.81) gilt der Drehimpulssatz
nun sowohl für massive wie für masselose Teilchen, d. h. Lichtbahnen. Auch
hier bleibt der Drehimpuls übrigens nach Betrag und Richtung erhalten. Die
Drehimpulsrichtung ist durch (10.79) als parallel zur Geraden θ = 0 bestimmt.
Um schließlich die relativistische Verallgemeinerung des Newtonschen Energieerhaltungssatzes aufzustellen, verwenden wir die Konstanz des Drehimpulses
gemäß (10.79) und (10.81) sowie die Beziehung (10.80) in (10.76) und erhalten
d2 r
A0
+
dτ 2
2A
µ
dr
dσ
¶2
−
c2 B 0
l2
+
=0.
r3 A 2AB 2
(10.83)
Nach Multiplikation mit 2A(dr/dσ) entsteht hieraus der gesuchte Erhaltungssatz
µ µ ¶2
¶
l2
dr
d
c2
+ 2−
A
=0.
(10.84)
dσ
dσ
r
B
198
10 Bewegung schneller Teilchen im Gravitationsfeld
Die gegenüber dem nichtrelativistischen Grenzfall erreichte Verallgemeinerung
wird besonders sinnfällig, wenn wir den Parameter σ mit Hilfe von (10.80) zugunsten der Zeit t eliminieren,
µ
dr
dt
A
2B 2
µ
A
B2
¶2
+
l2
c2
−
= const ≡ 2e − c2
r2
B
(10.85)
oder
dr
dt
¶2
+
c2
l2
+
2
2r
2
µ
1−
1
B
¶
=e.
(10.86)
Die Integrationskonstante ist hier so benannt, dass im Grenzfall c → ∞ aus
(10.85) gerade der Newtonsche Energiesatz entsteht mit
e = E/m
(10.87)
als der nichtrelativistischen Energie pro Masseneinheit des bewegten Teilchens.
Beachten Sie, dass der Ansatz der Integrationskonstanten in (10.85) gerade die
Ruheenergie eines massiven Teilchens als additiven Beitrag zur Energiebilanz
längs der Bahn in Rechnung stellt.
Schließlich will ich, nachdem der Zusammenhang von (10.86) mit dem Newtonschen Energiesatz für ein massives Teilchen im Keplerpotential hergestellt
ist, betonen, dass der relativistische Erhaltungssatz (10.86) auch für masselose
Teilchen, insbesondere also Lichtbahnen gilt; dabei wird nur die Interpretation
der Integrationskonstanten e gemäß (10.87) hinfällig. Um die Integrationskonstante e für Lichtbahnen zu bestimmen, berücksichtigen wir, dass längs einer
Lichtbahn der Minkowskiabstand beliebiger Raum-Zeit-Punkte verschwindet.
Aus
dτ 2 = +Bc2 dt2 − A dr 2 − r2 (dθ2 + sin2 θ dϕ2 ) = 0
(10.88)
folgt mit dθ und dϕ aus (10.79) bzw. (10.81)
Bc2 − A
µ
dr
dt
¶2
−
B 2 l2
=0
r2
(10.89)
und dies ist gerade der Energiesatz (10.85) mit
e = c2 /2 .
(10.90)
Die beiden Differentialgleichungen (10.81) und (10.86) legen die zeitlichen
Abläufe der möglichen Teilchenbahnen im statistischen isotropen Gravitationsfeld, d. h. die Funktionen r(t) und ϕ(t) fest. Falls nur die rein räumliche Gestalt
der Bahnkurven, d. h. die Funktion r(ϕ) von Interesse ist, kann mit Hilfe von
(10.81) die Zeit aus (10.86) eliminiert werden, woraufhin wir erhalten
Al2
2r4
µ
dr
dϕ
¶2
l2
c2
+ 2+
2r
2
µ
¶
1
1−
=e.
B
(10.91)
Diese Differentialgleichung für die Bahnkurve r = r(ϕ) werden wir nun für zwei
wichtige Spezialfälle lösen.
10.11 Periheldrehung der Planeten
10.11
199
Periheldrehung der Planeten
Die Keplerellipsen sind keine strengen Lösungen der Einsteinschen Bewegungsgleichung eines Planeten im statischen isotropen Feld. Vielmehr gleichen die
relativistischen Lösungen r = r(ϕ) Rosetten, die wir uns aus den Keplerellipsen
dadurch entstanden denken können, dass die große Ellipsenachse sich bei jedem
Umlauf um einen kleinen Winkel δϕ verdreht. Die Abbildung 10.3 übertreibt
δϕ.
Abbildung 10.3
Wir wollen nun δϕ in niedrigster Ordnung in 1/c2 ausrechnen und tragen
dazu die Entwicklungen (10.67)
1/B = 1 + 2
M 2 G2
MG
+ 2(2 − β − γ) 4 2 + · · ·
2
c r
c r
1/A = 1 − 2γ
MG
+ ···
c2 r
(10.92)
in den Energiesatz“ (10.91) ein. Es ergibt sich, mit r 0 = dr/dϕ,
”
2
¶
·
¸
MG
c2 M G
M 2 G2
1 − 2γ 2
− 2
+ 2(2 − β − γ) 4 2
c r
l
c2 r
c r
µ
¶
MG
2e
.
= 2 1 − 2γ 2
l
c r
1
r0
+
r4 r2
µ
(10.93)
Sie sehen hier übrigens, warum die obige Entwicklung für 1/B eine Ordnung
weiter getrieben werden muss als die für 1/A. Der Grund besteht im Auftreten
des Faktors c2 vor dem Glied [1 − 1/B]. Die Gleichung (10.93) verschönert sich,
wenn wir
u(ϕ) = 1/r(ϕ)
(10.94)
200
10 Bewegung schneller Teilchen im Gravitationsfeld
als abhängige Variable einführen, zu
µ
·
¸
¶
MG
c2 2M G
M 2 G2 2
2
u0 + u2 1 − 2γ 2 u − 2
u
+
2(2
−
β
−
γ)
u
c
l
c2
c4
µ
¶
2e
MG
= 2 1 − 2γ 2
u.
(10.95)
l
c
Da wir nur an Korrekturen der Ordnung 1/c2 zum Newtonschen Resultat interessiert sind, verzichten wir auf die exakte Lösung von (10.95). Die angemessene
Näherungslösung finden wir am schnellsten, indem wir durch Differenzieren nach
ϕ eine Differentialgleichung zweiter Ordnung herstellen,
¸
µ
¶
·
MG
2e
MG
M 2 G2
00
1 − γ 2 = 3γ 2 u2 . (10.96)
u + 1 − 2(2 − β − γ) 2 2 u − 2
c l
l
c
c
In nullter Ordnung in 1/c2 ist dies eine Schwingungsgleichung mit der Lösung
uK (ϕ) =
MG
[1 + ε cos(ϕ − ϕ0 )] = 1/rK (ϕ) ,
l2
(10.97)
wobei ϕ0 und ε als Integrationskonstanten auftreten. Für ε < 1 sind die Lösungen (10.97) gerade die Keplerellipsen. Die Bezugsrichtung für den Winkel ϕ
kann immer so gewählt werden, dass ϕ0 = 0 ist.
Bis auf das (kleine!) nichtlineare Glied auf der rechten Seite ist (10.96)
ebenfalls die Differentialgleichung einer linearen Schwingung, deren Lösungen
offenbar lauten
µ
¶
MG
2e 1
u0 (ϕ) = 2
1−γ 2
(1 + ε cos ωϕ)
l
c
ω2
mit
ω 2 = 1 − 2(2 − β − γ)
M 2 G2
.
c2 l 2
(10.98)
Suchen wir nun die Lösung von (10.96) durch den Ansatz
u(ϕ) = u0 (ϕ) + u1 (ϕ) ,
(10.99)
so erhalten wir u1 bis auf Korrekturen der Ordnung 1/c4 aus der Differentialgleichung
u001 + ω 2 u1 = 3γ
M 3 G3
(1 + ε cos ωϕ)2 .
l 4 c2
(10.100)
Die Korrektur u1 (ϕ) kann demnach als eine erzwungene Schwingung aufgefasst
werden und ist leicht zu finden,
·
¸
ω 2 ε2 /2
M 3 G3
cos
2ωϕ
.
(10.101)
u1 (ϕ) = 3γ 2 2 2 (1 + ε2 /2) + εωϕ sin ϕω −
l c ω
4 − ω2
Nur der in ϕ lineare Summand ist von Belang, denn er allein wächst mit jeder
Umrundung der Sonne, um schließlich, nach hinreichend vielen Umläufen, die
Schwelle der Beobachtbarkeit zu erreichen. Wir vernachlässigen die anderen
10.11 Periheldrehung der Planeten
201
Glieder in (10.101). Insgesamt finden wir, unter Inkaufnahme weiterer Fehler
der Ordnung 1/c4
µ
¶
2e 1
MG
(1 + ε cos ωϕ)
1−γ 2
u(ϕ) ≈ 2
l
c
ω2
M 3 G3 ϕ
ε sin ωϕ
l 4 c2 ω
¸
µ
¶
·
2e 1
M 2 G2
MG
ϕ
sin
ωϕ
.
1−γ 2
1
+
ε
cos
ωϕ
+
ε3γ
≈ 2
l
c
ω2
c2 l 2
+ 3γ
(10.102)
Die beiden ϕ-abhängigen Glieder lassen sich wegen cos(ϕ3γM 2 G2 /l2 c2 ) ≈ 1 mit
Hilfe eines trigonometrischen Additionstheorems zusammenfassen, woraufhin
wir erhalten
u(ϕ) ∼ 1 + ε cos Ωϕ ∼ 1/r(ϕ)
Ω=1−
M 2 G2
(2 − β + 2γ) .
c2 l 2
(10.103)
Wir schließen, dass zwei aufeinander folgende größte Annäherungen (Perihelia)
des Planeten an die Sonne durch das Winkelinkrement 2π/Ω 6= 2π getrennt
sind. Die Abweichung 2π/Ω − 2π ist die gesuchte Periheldrehung pro Umlauf,
δϕ = 2π(−1 + 1/Ω) = 2π
M 2 G2
(2 − β + 2γ) + O(1/c4 ) .
c2 l 2
(10.104)
Da in den astronomischen Tafeln meist nicht der auf die Planetenmasse bezogene Drehimpuls gegeben wird, ist es zweckmäßig, l2 durch die große Halbachse
a und die Exzentrizität ε der Keplerellipse auszudrücken. Aus (10.97) finden
Sie leicht l2 = a(1 − ε2 )M G und somit
δϕ = 6π
MG
2 − β + 2γ
.
2
−ε )
3
c2 a(1
(10.105)
Unter den Planeten der Sonne hat der erst im Jahr 1949 entdeckte Ikarus
die größte Periheldrehung pro Umlauf. Die bis heute akkumulierten astronomischen Daten erlauben die Bestimmung der Periheldrehung aber erst mit einer
Genauigkeit von etwa 10%. Viel genauer ist die Periheldrehung des Merkur,
δϕM = 43.1100 ± 0.4500
pro Erdjahrhundert ,
(10.106)
bekannt. Tragen wir die Daten MS , aM und εM sowie die Periheldrehung
(10.106) in (10.105) ein, so erhalten wir
2 − β + 2γ
= 1.00 ± 0.01 .
3
(10.107)
Dieses Resultat ist in schönstem Einklang mit den aus den Einsteinschen
Feldgleichungen folgenden Werten β = γ = 1. Zur experimentellen Bestimmung von β und γ brauchen wir allerdings neben (10.106) einen weiteren unabhängigen Zusammenhang zwischen diesen Parametern.
202
10 Bewegung schneller Teilchen im Gravitationsfeld
10.12
Lichtablenkung durch die Sonne
Zur Berechnung der Bahn eines Lichtstrahls, der, von einem Stern kommend,
an der Oberfläche der Sonne vorbei zur Erde läuft, können wir den Energie”
satz“ (10.91) oder, besser, die aus ihm gewonnene Differentialgleichung (10.96)
verwenden. Dabei müssen wir, wie in 10.10 besprochen, als kinetische Energie
”
pro Masse“ des Photons
e = c2 /2
(10.108)
ansetzen. Ferner ist wichtig, den Drehimpuls pro Masse“ l des Photons als
”
proportional zur Lichtgeschwindigkeit c zu erkennen. Dazu müssen wir uns nur
klarmachen, dass der Teil des Lichtstrahls, der so weit vor der Sonne verläuft,
dass das Feld der Sonne noch vernachlässigbar klein ist, durch die Gerade
b
= sin ϕ
r
(10.109)
beschrieben wird (Abbildung 10.4). Dabei ist b, der so genannte Stoßparameter,
Abbildung 10.4
die kürzeste Entfernung der Geraden von der Sonne. In diesem Raumbereich
wandert eine Wellenfront mit der Geschwindigkeit
c=−
d
(r cos ϕ) = −ṙ cos ϕ + ϕ̇r sin ϕ .
dt
(10.110)
Aus letzterer Gleichung und der aus (10.109) durch Differenzieren gewonnenen
Identität
0 = ṙ sin ϕ + ϕ̇r cos ϕ
(10.111)
finden wir rϕ̇ = c sin ϕ = bc/r, also den Drehimpuls pro Masse“
”
r2 ϕ̇ = l = bc .
(10.112)
Dieser Ausdruck war zu erwarten für ein mit Lichtgeschwindigkeit bewegtes
Teilchen“.
”
Nach Eintragen der Integrationskonstanten e und l in (10.95) finden wir als
Differentialgleichung für die Lichtbahn u(ϕ) = 1/r(ϕ)
·
¸
M 2 G2
MG
MG
u00 + 1 − 2(2 − β − γ) 2 4 u − (1 − γ) 2 2 = 3γ 2 u2 .
(10.113)
b c
b c
c
10.12 Lichtablenkung durch die Sonne
203
Da wir nur an der Korrektur niedrigster Ordnung in 1/c2 zur Geraden (10.109)
interessiert sind, lassen wir das zu 1/c4 proportionale Glied auf der linken Seite
fallen und untersuchen die Gleichung
u00 + u = (1 − γ)
MG
MG
+ 3γ 2 u2 .
b2 c 2
c
(10.114)
Wegen der Kleinheit der rechts stehenden relativistischen Korrekturglieder (der
Schwarzschildradius MS G/c2 der Sonne ist viel kleiner als der kleinstmögliche
Wert für den Stoßparameter b, d. h. als der Sonnenradius), verzichten wir wieder
auf eine exakte Lösung. Wir begnügen uns mit der Näherung
u(ϕ) =
1
sin(ϕ − ϕ0 ) + u1 (ϕ) ,
b
(10.115)
wobei u1 (ϕ) die Korrektur der Ordnung 1/c2 zur Lösung nullter Ordnung ist.
Letztere statten wir bequemlichkeitshalber mit einer (in (10.109) Null gesetzten)
Integrationskonstanten ϕ0 aus und berechnen die Störung aus
u00 (ϕ) + u(ϕ) = (1 − γ)
MG
MG
+ 3γ 2 2 sin2 (ϕ − ϕ0 ) + O(1/c4 ) .
2
2
b c
b c
(10.116)
Die Lösung dieser Differentialgleichung einer erzwungenen Schwingung finden
Sie leicht selbst. Insgesamt ergibt sich
u(ϕ) =
MG
MG
1
2
sin(ϕ − ϕ0 ) + (1 − γ) 2 2 + γ 2 2 [1 + cos(ϕ − ϕ0 )]
b
b c
b c
+ O(1/c4 )
(10.117)
Hieraus berechnen wir schnell den gesuchten Ablenkungswinkel δϕ. Legen wir
zunächst die Integrationskonstante ϕ0 so fest, dass der Lichtstrahl mit dem
Winkel ϕ = π einläuft, wie das in der Skizze und in (10.109) angenommen ist.
Wegen der Kleinheit der relativistischen Effekte wird |ϕ0 | ¿ 1 sein und wir
erhalten aus u(π) = 1/r(π) = 0
0=
1
MG
ϕ0 + (1 − γ) 2 2 + O(ϕ40 ) .
b
b c
(10.118)
Der Strahl läuft aus für ϕ → ϕ∞ und es gilt ebenfalls |ϕ∞ | ¿ 1. Wir finden
ϕ∞ aus u(ϕ∞ ) = 1/r(ϕ∞ ) = 0, also
ϕ∞ − ϕ0 + (1 − γ)
¡
¢¤
MG
MG£
+ γ 2 4 + O (ϕ∞ − ϕ0 ) = 0 .
bc2
bc
(10.119)
Zusammen mit der Bestimmung (10.118) für ϕ0 ergibt sich der Ablenkungswinkel
δϕ = |ϕ∞ | = 2(1 + γ)
MG
.
bc2
(10.120)
Setzen wir hier den Schwarzschildradius der Sonne, MS G/c2 ≈ 1, 48 km,
und für b den Sonnenradius, RS ≈ 6, 95 × 105 km, ein. Dann ergibt sich der
Ablenkwinkel für einen Lichtstrahl, der auf dem Weg zur Erde unmittelbar an
der Sonnenoberfläche vorbeistreicht,
δϕmax = 1, 7500 ×
1+γ
.
2
(10.121)
204
10 Bewegung schneller Teilchen im Gravitationsfeld
Die heute verfügbaren Daten (im optischen Spektralbereich und für Radiowellen) sind verträglich mit der Einsteinschen Vorhersage γ = 1, legen aber den
Parameter γ, erst mit etwa 10-prozentiger Genauigkeit fest. Von genaueren
Messungen werden Sie mit Sicherheit in naher Zukunft hören und lesen.
Insgesamt geben die hier besprochenen experimentellen Befunde (zur Frequenzverschiebung fallender Photonen, zur Periheldrehung und zur Lichtablenkung im Gravitationsfeld) eine schöne Bestätigung des Einsteinschen Äquivalenzprinzips und der weitergehenden Aussagen der Einsteinschen Gravitationstheorie.
Kapitel 11
Quanten
11.1
Teilchen sind Wellen
Teilchen sind Wellen, und Wellen sind Teilchen. Um den Sinn solchen Verwirrspiels mit Worten klarzulegen, rufen wir uns einige prototypische experimentelle
Erfahrungen in Erinnerung.
Davisson und Germer ließen, wie in Abbildung 11.1 schematisch dargestellt,
einen gut kollimierten Strahl monoenergetischer Elektronen auf eine ebene Oberfläche eines Kristalls einfallen und maßen, bei konstantem einfallenden Elektro-
{
Abbildung 11.1
nenstrom und konstantem Einfallswinkel ϕ, den Strom der reflektierten Elektronen als Funktion des Impulses der einfallenden Elektronen. Es ergeben sich
besonders starke reflektierte Ströme für solche Impulse p, die die Beziehung
h
2a sin ϕ = n ,
p
mit n = 1, 2, 3, . . .
(11.1)
erfüllen, wobei
h = 6, 61 × 10−27 erg s = 6.61 × 10−34 J s
(11.2)
die Plancksche Konstante ist. Die Elektronen verhalten sich dabei wie Wellen
der Wellenlänge (de Broglie-Wellenlänge)
λ = h/p,
205
(11.3)
206
11 Quanten
denn für derartigen Wellen garantiert die Beziehung (11.1) gerade konstruktive
Interferenz der an aufeinander folgenden Netzebenen reflektierten Wellenamplituden. Entsprechende Experimente mit Röntgenstrahlen, also elektromagnetischen Wellen, waren vorher schon von von Laue durchgeführt worden. Die
bevorzugten Reflexionen sind dabei ebenfalls durch (die aus der Optik bekannte
Braggsche Relation)
2a sin ϕ = nλ
(11.4)
ausgezeichnet.
Dass umgekehrt auch elektromagnetische Wellen Teilchencharakter zeigen
können, wissen Sie z. B. vom Comptoneffekt. Läuft ein Elektron gegen einen
γ-Strahl mit Wellenlänge λ, Frequenz ν = c/λ und Wellenvektor ~k, so kann
das Elektron einen Stoß erleiden, bei dem sich die Energie und der Impuls des
Elektrons ändern. Unverändert bleiben jedoch Gesamtenergie und Gesamtimpuls von Elektron und elektromagnetischer Welle, wenn dem Stoßpartner des
Elektrons, dem Photon, der Impuls
|~
p| = h/λ
und p~ =
h~
k
2π
(11.5)
und die Energie
E = hν = hc/λ
(11.6)
zugeordnet werden.
Bevor wir uns in die Konsequenzen derartiger Experimente vertiefen, dürfen
wir uns klarmachen, dass wenigstens im Erfahrungsbereich des Alltags, dem
jedes Kind seine Anschauung der Welt abgewinnt, ein Teilchen ein Teilchen
bleibt und keine Welle Teilchencharakter vorgaukelt. Um etwa den Wellencharakter einer Kegelkugel nachzuweisen, müsste auf einem Längenmaßstab
λ = h/p experimentiert werden. Nun ist der Impuls einer Kegelkugel von der
Größenordnung p ≈ 1 kg m/s, und dieser Wert entspricht einer de Broglie Wellenlänge λ ≈ 6, 6 × 10−32 cm. Solch aberwitzig kleine Wellenlängen entziehen
sich übrigens nicht nur alltäglichen Beobachtungsmethoden. Sie dürfen nun selber überlegen, ob der Wellencharakter der Erde bei der alljährlichen Umrundung
der Sonne nachweisbar ist.
Ebenso aufschlussreich ist die Berechnung der typischen Elektronengeschwindigkeit im Davisson Germer Experiment, v ≈ h/ma. Sie beträgt einige tausend
Stundenkilometer, wenn als Gitterkonstante a ≈ 10−8 cm angesetzt wird. Wegen der Kleinheit der Elektronenmasse können solche für den Alltag exotisch
großen Geschwindigkeiten bequem erreicht werden, indem Elektronen einem
elektrischen Feld der Größenordnung 100 V ausgesetzt werden. Im Übrigen beträgt hier die typische Elektronengeschwindigkeit wenige Prozent der Lichtgeschwindigkeit, so dass eine nichtrelativistische Behandlung des Effektes gerade
noch gerechtfertigt ist.
Überzeugen wir uns davon, dass auch die Elektronenbewegung in der Atomhülle nichtrelativistischen Wellencharakter zeigen muss. Die typische Bindungsenergie eines Elektrons beträgt einige zehn Elektronenvolt, was wieder einer
Geschwindigkeit von wenigen tausend Sekundenkilometern und einer de Broglie
Wellenlänge λ ≈ h/mv der Größenordnung 10−8 cm entspricht. Diese Wellenlänge stimmt aber gerade mit der Größenordnung des Atomdurchmessers
überein.
11.1 Teilchen sind Wellen
207
Die klassischen Begriffe Teilchen“ und Welle“ sind beide zu eng, als dass ei”
”
ner allein ausreichen würde zur Beschreibung des Verhaltens mikroskopischer
”
Gebilde“, die wir künftig Quanten nennen werden. Das Quant Elektron benimmt sich bei manchen Experimenten, als sei es ein klassisches Teilchen, zeigt
aber Welleneigenschaften, wenn es auf Längenskalen beobachtete wird, die mit
der de Broglie Wellenlänge vergleichbar sind. Das Quant Photon benimmt sich
wie eine Welle bei den klassischen Interferenzexperimenten, jedoch wie ein Teilchen, wenn eine elektromagnetische Welle mit der Frequenz ν auf Energieskalen
der Ordnung hν beobachtet wird.
Zur Charakterisierung des unterschiedlichen Verhaltens von klassischen Teilchen, klassischen Wellen und Quanten sind die folgenden Karikaturen beliebt
und nützlich (Abbildung 11.2).
Denken wir uns Wasserwellen einer Wellenlänge λ durch zwei Spalte eines
ebenen Schirms geschickt und hinter diesem in einer zu ihm parallelen Ebene
registriert.
Abbildung 11.2
In der Beobachtungsebene stellen wir ein kontinuierliches Anströmen von
Energie fest und schließen aus genauen Messungen, dass die Intensität I quadratisch in der kontinuierlich variablen Wellenamplitude h ist. Messen wir die
Intensität als Funktion der Koordinate x quer zur Richtung der Spalte, so finden
wir
I = I1 = |h1 |2 ,
falls der untere Spalt verdeckt ist,
2
I = I2 = |h2 | ,
falls der obere Spalt verdeckt ist,
2
I = I12 = |h1 + h2 | ,
falls beide Spalte geöffnet sind.
Im letzteren Fall werden, da sich die Wellenamplituden additiv verhalten, die
für klassische Wellen typischen Interferenzen sichtbar.
Denken wir uns nun einen stationären Strom klassischer Teilchen, etwa
Schrotkörner, von einem Quellpunkt aus auf eine Blende geschleudert, so re-
208
11 Quanten
gistrieren wir auf dem Schirm die Ankunft diskreter Teilchen. Die Zahl der pro
Zeiteinheit in einem Zähler bei x anlangenden Teilchen sei I1 (x) und I2 (x), wenn
der untere bzw. der obere Spalt verdeckt sind. Dann ergibt sich, wenn beide
Spalte geöffnet sind, die Verteilung I12 (x) = I1 (x) + I2 (x), da jedes registrierte
Teilchen entweder durch den oberen oder durch den unteren Spalt gelaufen ist.
Es addieren sich also hier die Intensitäten und nicht etwa die Wellenamplituden.
Bei dieser Karikatur ist natürlich angenommen, dass die Spaltdurchmesser, der
Spaltabstand und das räumliche Auflösungsvermögen des in der Schirmebene
benutzten Teilchenzählers groß sind gegenüber der de Broglie Wellenlänge der
Schrotkörner.
Schließlich unterwerfen wir Quanten, etwa Elektronen, entsprechendem Vorgehen. In den Zähler gelangen die Elektronen einzeln, wobei sich ihr Teilchencharakter manifestiert. Jedoch zeigt die Stromverteilung auf der Blende ein
Interferenzmuster ähnlich dem der Wasserwellen, wenn beide Spalte geöffnet
sind. Offenbar ist die Bewegung der Elektronen hier durch eine Wellenamplitude ψ charakterisiert, die sich additiv aus den Beiträgen von beiden Spalten
zusammensetzt.
ψ = ψ1 + ψ2
I12 = |ψ1 + ψ2 |2 = I1 + I2 + ψ1 ψ2∗ + ψ1∗ ψ2 .
(11.7)
Zu schließen ist, dass von einem im Detektor anlangenden Quant nicht gesagt
werden kann, durch welchen der beiden Spalte es gekommen ist; zeigt doch das in
der Beobachtungsebene nachgewiesene Interferenzmuster, dass eine Welle durch
beide Spalte gelaufen ist.
Um die merkwürdige Dualität der Quanten weiter zu beleuchten, wiederholen wir das letztere Gedankenexperiment mit Elektronen, stellen aber, um
uns des Weges eines Elektrons zu vergewissern, hinter den Spalten eine Lampe
auf, die den Durchgang eines Elektrons durch einen Spalt durch einen Lichtblitz
anzeigt (ein Photon wird am Elektron gestreut)(Abbildung 11.3). Von jedem
Abbildung 11.3
auf dem Schirm auftreffenden Elektron ist nun bekannt, durch welchen Spalt es
11.1 Teilchen sind Wellen
209
gelaufen ist. Die Gesamtheit der Elektronen, die so als durch den oberen (unteren) Spalt laufend erkannt sind, führt auf dem Schirm zu einer Verteilung I1 (x)
(bzw. I2 (x)), die vorher bei verdecktem unterem (bzw. oberen) Spalt gefunden
wurde. Als Verteilung aller Elektronen, deren Weg identifiziert wurde als oberer
oder unterer Weg, ergibt sich I12 = I1 + I2 . Die Interferenzerscheinungen gehen
also verloren, wenn wir uns durch Beobachtung vergewissern, ob das Elektron
den oberen oder den unteren Spalt passiert.
Schließen Sie nicht etwa, das Elektron richte sein Verhalten danach, ob ein
neben der Apparatur stehender Mensch Augen und Ohren geöffnet oder verschlossen hält, ob also eine sinnlich Wahrnehmung des Lichtblitzes am Spalt und
des Tickens des Zählers am Schirm erfolgt. Gegenüber mancherorts geäußerten
Feststellungen einer besonderen Rolle des beobachtendem Subjekts in der Quantenmechanik ist äußerste Vorsicht und Zurückhaltung geboten. Sämtliche hier
skizzierten Gedankenexperimente können im Labor automatisiert durchgeführt
werden. Die Rolle des Beobachters bleibt darauf beschränkt, dass er die vom
Zeichengerät ausgeworfenen Intensitätsverteilungen zur Hand nimmt und über
sie nachdenkt.
Für die oben angesprochene Lokalisierung eines Elektrons an einem Spalt
und den damit verbundenen Verlust der Interferenz ist keineswegs konstitutiv
ein subjektiver Wahrnehmungsakt, sondern ausschließlich die Beeinflussung des
Elektrons durch das zur Lokalisierung verwendete Licht. Damit nämlich ein
Lichtfleck am unteren Spalt räumlich getrennt erscheint von einem Lichtfleck
am oberen Spalt, muss, wie Sie aus der Einführung in die Optik wissen, Licht
verwendet werden, dessen Wellenlänge λph kleiner ist als der Spaltabstand ∆x.
Nun gilt beim Elektron-Photon-Stoß der Impulserhaltungssatz, so dass sich der
Impuls des Elektrons beim Stoß um einen Betrag der Größenordnung
|∆p| ≈ h/λph & h/∆x
(11.8)
ändert. Folglich ändert sich auch die de Broglie Wellenlänge λel des Elektrons,
u. z. gilt wegen λel ≈ h/p
|∆λel | ≈
λ2
λ2
h
|∆p| ≈ el & el .
2
p
λph
∆x
(11.9)
Da das Experiment mit ∆x ≈ λel durchgeführt werden muss, damit der Quantencharakter des Elektrons im Interferenzmuster auf dem Schirm sichtbar werden kann, ist klar, dass beim zur Lokalisierung des Elektrons notwendigen Stoß
eine relative Änderung ∆λel /λel der de Broglie Wellenlänge der Größenordnung 1
auftritt. Die Monochromasie der Elektronenwelle (d. h. die durch Auswahl der
Quelle vor dem Stoß gegebene Konstanz von Impuls und Energie von Elektron
zu Elektron) geht also bei der Wechselwirkung mit der zur Lokalisierung geeigneten Lichtwelle (d. h. beim Elektron-Proton-Stoß) völlig verloren. Somit ist
das Verschwinden des Interferenzmusters für die lokalisierten Elektronen physikalisch geklärt.
Zur weiteren Bestätigung der durchgeführten Überlegung dient eine letzte
Variante des obigen Gedankenexperiments. Beleuchten wir ein Elektron links
von der Blende mit Licht, dessen Wellenlänge größer ist als der Spaltabstand.
Der jetzt bei der Wechselwirkung des Lichts und einem Elektron entstandene
Lichtfleck hat eine räumliche Ausdehnung, die größer ist als der Spaltabstand,
erlaubt also nicht mehr die Zuordnung des Elektronenweges zu einem der Spalte.
210
11 Quanten
Auf dem Schirm sind nun auch für die durch Lichtflecke aufgefallenen Elektronen
Interferenzmuster nachweisbar. Das zur Lokalisierung des Elektrons zu langwellige Licht stört die Monochromasie des Elektrons nur so wenig, dass letztere zu
konstruktiver Interferenz fähig bleibt.
11.2
Heisenbergs Unschärferelation
Das eben Erschlossene erlaubt die bündige Zusammenfassung, dass die Interferenzfähigkeit der Elektronen rechts von den Spalten notwendigerweise zerstört
wird durch die Lokalisierung der Elektronen beim einen oder anderen Spalt.
Äquivalent ist die folgende, oben auch schon getroffene Feststellung: Bei der Lokalisierung eines Quants mit einer räumlichen Unschärfe ∆x ist unvermeidbar,
dass dem Quant die Unschärfe ∆p seines Impulses erteilt wird, die mindestens
h/∆x beträgt.
∆p ∆x > h
(11.10)
Diese Ungleichung, die Heisenbergsche Unschärferelation, ist die prägnanteste
aller Formulierungen des Quantencharakters von Teilchen und Wellen. Sie wird
uns im Folgenden häufig zur Illustration des Unterschiedes zwischen klassischer
Physik und Quantenphysik dienen.
Ich stelle gleich eine typische Anwendung vor. Betrachten wir ein Teilchen
2 2
in einem harmonischen Potential V = m
2 ω x . Nehmen wir an, vorbehaltlich
späterer Rechtfertigung, dass die Energie sich wie gewohnt aus einem kinetischen
und einem potenziellen Beitrag zusammensetzt gemäß
E=
1 2 1
p + mω 2 x2 ≥ 0 .
2m
2
(11.11)
Nach klassischer Anschauung hat das Teilchen die kleinstmögliche Energie,
nämlich E = 0, wenn es am Grund der Potentialmulde, also bei x = 0 ruht.
Heisenbergs Ungleichung setzt der räumlichen Lokalisierung ∆x bei x = 0 und
Abbildung 11.4
der Schärfe des Ruhens jedoch Grenzen. Bei gegebenem ∆x kann der Impuls
11.3 Die Grundprinzipien der Quantenmechanik
211
nämlich nicht mit Sicherheit kleiner sein als h/∆x, die Energie also nicht mit
Sicherheit kleiner als der kleinstmögliche Wert von
µ
¶2
1
1
h
E=
+ mω 2 (∆x)2 .
(11.12)
2m ∆x
2
Wenn wir diese Größe als Funktion von ∆x minimalisieren, also ∆x aus dE/d(∆x)
= 0 festlegen, so finden wir als minimale Unschärfen ∆x und ∆p
p
√
∆pmin ≈ mhω
(11.13)
∆xmin ≈ h/mω,
und somit als Schranke für die Energie
Emin ≈ hω .
(11.14)
Wir werden diese Abschätzung der Grundzustandsenergie des harmonischen Oszillators bald verfeinern.
Halten wir zunächst nochmals fest, dass der Grundzustand des quantenmechanischen Oszillators nicht den Zustand der Ruhe im Potentialminimum
sein kann. Für makroskopische Oszillatoren sind die Nullpunktschwingungen“
”
gemäß den Unschärfen (11.13) meist unmessbar klein. Für die Schwingung
eines H2 -Moleküls hingegen ist, wie Sie durch Einsetzen der entsprechenden
Masse und Frequenz leicht finden, die minimale Ortsunschärfe ∆xmin von gleicher Größenordnung die der Moleküldurchmesser und somit so berechenbar wie
letzterer.
11.3
Die Grundprinzipien der Quantenmechanik
Aus der Erfahrung, dass Elektronen Interferenzerscheinungen zeigen können,
hatten wir bereits geschlossen, dass die Bewegung von Quanten durch eine
Wellenamplitude charakterisierbar sein muss. Die folgenden Präzisierung des
Schlüssel dient uns als Schlüssel zur Entwicklung der Quantenmechanik.
Die Wahrscheinlichkeit P eines Ereignisses (z. B. Registrieren eines Teilchens
im Zähler am Ort ~x zur Zeit t) ist gegeben durch das Absolutquadrat einer
komplexen Zahl ψ, die wir Wellenamplitude oder Wahrscheinlichkeitsamplitude
oder auch Wellenfunktion nennen werden
P = |ψ|2 .
(11.15)
Die Wahrscheinlichkeit des Ereignisses ist experimentell zu bestimmen als seine
relative Häufigkeit im Vergleich zu anderen möglichen Ereignissen (z. B. Ankunft
des Teilchens im Zähler am anderen Ort x~0 ) bei häufiger Wiederholung des
Experiments unter identischen Bedingungen.
Wenn ein Ereignis auf verschiedene Weisen stattfinden kann (z. B. Ankunft
des Teilchens im Zähler nach Durchlaufen eines Doppelspalts), so ist ψ die
Summe der Wahrscheinlichkeitsamplituden für die einzelnen Weisen, also etwa
ψ =ψ1 + ψ2
P =|ψ1 + ψ2 |2 = |ψ1 |2 + |ψ2 |2 + ψ1∗ ψ2 + ψ1 ψ2∗ .
(11.16)
212
11 Quanten
Die Superponierbarkeit der Wellenfunktion entspricht der Beobachtbarkeit von
Interferenzen.
Wenn allerdings durch zusätzliche Eingriffe in den Ablauf des Experiments
bei jedem Ereignis festgestellt wird, auf welche der mögliche Weisen es eintritt,
so sind in der Wahrscheinlichkeitsverteilung P über die möglichen Ereignisse
keine Interferenzen der den verschiedenen Weisen entsprechenden Partialwellen
mehr feststellbar. Vielmehr addieren sich dann die Wahrscheinlichkeiten für die
einzelnen Weisen also etwa
P = P1 + P2 .
(11.17)
Das Registrieren eines Teilchens zur Zeit t im Zähler am Ort ~x ist ein aber
keineswegs der einzige Typ von Ereignis. Ein anderer Typ ist die Messung des
Impulses p~ zur Zeit t, wieder ein anderer die Messung der z-Komponente des
Drehimpulses Lz eines Teilchens; die entsprechenden Wellenamplituden sind
dann Funktionen von p~ und t bzw. Lz und t. Wir werden Situationen kennen
lernen, in denen die Mannigfaltigkeit möglicher Ereignisse (d. h. Messwerte)
diskret ist. In anderen Fällen (wie etwa bei der Feststellung des Ortes eines
Teilchens) sind die möglichen Messwerte kontinuierlich. Die Wellenfunktion ψ
wird dann zweckmäßigerweise als Funktion der entsprechenden kontinuierlichen
Variablen (also etwa des Ortsvektors ~x) angesetzt und ihr Absolutquadrat (also
z. B. |ψ(~x, t)|2 ) als (räumliche) Wahrscheinlichkeitsdichte definiert. Bei einer
ortsabhängigen Wahrscheinlichkeitsamplitude ψ(~x, t) bedeutet dann
P (~x, t) d3 x = |ψ(~x, t)|2 d3 x
(11.18)
die Wahrscheinlichkeit, das Teilchen zur Zeit t im Volumenbereich d3 x am Ort ~x
zu finden.
11.4
Die Schrödingergleichung
Wir haben bereits genug Kenntnisse zusammengetragen, um mit der Berechnung der orts- und zeitabhängigen Wellenfunktion ψ(~x, t) eines Teilchens beginnen zu können.
Erinnern wir uns des experimentellen Befundes, dass ein Teilchen des Impulses p~ auch Eigenschaften einer Welle mit dem Wellenvektor
~k = p~ 2π = p~/~
(11.19)
h
zeigt. Da die Plancksche Konstante h im Folgenden häufig in Verbindung mit
dem Faktor 1/2π auftaucht, ist es zweckmäßig, die Größe
~ = h/2π
(11.20)
einzuführen. Ferner wissen wir, dass die Energie E eines Teilchens mit der
Kreisfrequenz ω der entsprechenden Welle gemäß
E = ~ω
(11.21)
zusammenhängt. Ebenfalls experimentell gesichert ist, dass ein Teilchen der
Masse m mit dem Impuls p~ stets die Energie E = p~2 /2m hat,
E = p~2 /2m = ~ω =
(~~k)2
.
2m
(11.22)
11.4 Die Schrödingergleichung
213
Durch Energie und Impuls des Teilchens sind also Kreisfrequenz und Wellenvektor der zugehörigen Welle eindeutig festgelegt. Die Wahrscheinlichkeitsamplitude hat dann notwendigerweise die Form einer ebenen monochromatischen
Welle,
~
ψ(~x, t) ∼ ei(k·~x−ωt) .
(11.23)
Es folgt, dass die Wahrscheinlichkeitsdichte |ψ(~x, t)|2 dafür, das Teilchen zur
Zeit t am Ort ~x zu finden, orts- und zeitunabhängig ist. Das ist nicht verwunderlich, denn wenn, wie angenommen, der Impuls p~ des Teilchens ohne die geringste
Unsicherheit |∆~
p| fest liegt, so ist nach der Heisenbergschen Unschärferelation
der Ort des Teilchens völlig ungewiss,
|∆~xmin | ≈ ~/|∆~
p| → ∞
für
∆~
p→0.
(11.24)
Also müssen die Wahrscheinlichkeitsdichte dafür, das Teilchen am Ort ~x bzw.
am Ort ~x 6= x~0 zu finden, übereinstimmen.
Es ist auch anschaulich klar, dass eine streng monochromatische ebene Welle
keinen Anfang und kein Ende haben kann (Abbildung 11.5).
Abbildung 11.5
Andererseits kann eine räumlich lokalisierte Welle (Abbildung 11.6) nicht
Abbildung 11.6
streng monochromatisch sein. Ein Wellenpaket mit räumlicher Ausdehnung
∆x mag noch eine ungefähre Wellenlänge λ der Trägerwelle aufweisen, wenn
λ ¿ ∆x, aber der Wert von λ ist mit einer Unsicherheit
¯ µ ¶¯
¯
h ¯¯
h
(11.25)
∆λmin ≈ ¯¯∆
≈ 2 ∆p ≈ λ2 /∆x
¯
p
p
behaftet, wie aus p = h/λ und der Heisenbergschen Unschärferelation (∆p)min ≈
h/∆x folgt. Wird der Zustand eines Teilchens durch ein derartiges Wellenpaket
beschrieben, so ist das Teilchen mit einer Genauigkeit ∆x räumlich lokalisiert,
denn |ψ(~x)|2 ist nur innerhalb eines Raumbereiches der Lineardimension ∆x
214
11 Quanten
merklich von Null verschieden. Das Wellenpaket muss sich dann als Superposition ebener monochromatischer Wellen
Z
~
ψ(~x, t) ∼ d3 k ϕ(~k)ei(k·~x−ωt)
(11.26)
darstellen lassen. dabei kann die wellenvektorabhängige Wahrscheinlichkeitsamplitude ϕ(~k) merklich von Null verschiedene Werte annehmen nur für Wellenvektoren, die vom mittleren Wellenvektor des Pakets nicht mehr als ∆k ≈ 1/∆x
abweichen. Wir werden derartige Wellenpakete noch genauer anschauen.
Als Wellengleichung für freie Quanten der Masse m bietet sich nun die so
genannte Schrödingergleichung
i~
~2 2
∂
ψ=−
∇ ψ
∂t
2m
(11.27)
an. Diese Differentialgleichung hat nämlich gerade die ebenen monochromatischen Wellen (11.23) mit der Energie E = p2 /2m gemäß (11.22) als Lösungen.
Sie wird, da linear in der Wellenfunktion ψ, auch durch räumlich lokalisierte
Wellenpakete der Form (11.26) befriedigt. Die Linearität in ψ ist im Einklang
mit der bereits als experimenteller Befund vorgestellten linearen Superponierbarkeit der Wellenamplitude.
Sie dürfen nicht glauben, dass (11.27) die einzig mögliche Wellengleichung
ist, die mit der de Broglie-Relation p~ = ~~k und E = p2 /2m verträglich ist.
Andere, kompliziertere, lassen sich zum Beispiel durch Differenzieren nach t
oder den Komponenten des Ortsvektors auf beiden Seiten von (11.27) erzeugen.
Jedoch ist (11.27) die einfachste und daher naheliegendste Wellengleichung. Sie
hat sich für (langsame, nichtrelativistische!) Teilchen bestens bewährt.
Die Schrödingergleichung liest sich besonders plausibel, wenn wir die folgende Korrespondenz zwischen den in ihr auftretenden Differentialoperatoren
i~∂/∂t und −i~∇ und der Energie E bzw. dem Impuls p~ des Teilchens einführen
i~
∂
b
≡E
∂t
~
∇ ≡ p~ˆ
i
↔
Energie E
↔
Impuls p~ .
(11.28)
Mit Hilfe dieser Korrespondenz erkennen wir dir Schrödingergleichung Êψ =
(1/2m)(p~ˆ)2 als Verallgemeinerung der Teilcheneigenschaft E = p2 /2m auf eine
Eigenschaft der Wellenfunktion ψ(~x, t).
Wenn das betrachtete Teilchen nicht frei ist, sondern eine ortsabhängige
potenzielle Energie V (~x) hat, so liegt nahe, die klassische Teilcheneigenschaft
p
~2 /2m + V (~x) ´= E = const zu verallgemeinern auf die Eigenschaft Êψ =
³
p~ˆ2 /2m + V (~x) ψ der Wellenfunktion ψ(~x, t). Tatsächlich ist
∂
i~ ψ(~x, t) =
∂t
½
¾
~2 2
−
∇ + V (~x) ψ(~x, t)
2m
(11.29)
die Schrödingersche Wellengleichung, die sich zur quantenmechanischen Beschreibung nichtrelativistischer Teilchen der Masse m mit der potenziellen Energie V (~x) als richtig erwiesen hat.
11.5 Normierung der Wellenfunktion
11.5
215
Normierung der Wellenfunktion
Ein Teilchen befinde sich irgendwo im Inneren eines (der Einfachheit halber
zunächst endlichen) Raumbereichs V . Die Interpretation seiner Wellenfunktion
ψ(~x, t) als einer Wahrscheinlichkeitsamplitude verlangt, dass die Gesamtwahrscheinlichkeit, das Teilchen in V zu finden, gleich Eins ist,
Z
d3 x |ψ(~x, t)|2 = 1 .
(11.30)
V
Die Normierung muss zeitlich erhalten bleiben, solange das Teilchen in V eingesperrt bleibt.
Die folgende kleine Rechnung zeigt, dass die Schrödingergleichung mit der
zeitlichen Erhaltung der Norm (11.30) verträglich ist. Schreiben wir die Zeitableitung der Norm mit Hilfe der Schrödingergleichung
Z
Z
n
o
∂
d3 x |ψ(~x, t)|2 = d3 x ψ̇ψ ∗ + ψ ψ̇ ∗
∂t
V
V
1
=
i~
¸
½ ·
h2 2
∗
∇ +V ψ
d x ψ −
2m
Z
3
V
¸ ¾
·
~2 2
−ψ −
∇ + V ψ∗
2m
Z
©
ª
i~
=
d3 x ψ ∗ ∇2 ψ − ψ∇2 ψ ∗
2m
V
i~
=
2m
Z
d3 x ∇ · {ψ ∗ ∇ψ − ψ∇ψ ∗ }
V
und benutzen den Gaußschen Satz, um das erhaltene Volumenintegral in ein
Flächenintegral über die Oberfläche F von V zu verwandeln, so erhalten wir
den Erhaltungssatz
Z
I
∂
3
2
d x |ψ(~x, t)| = − df~ · ~j(~x, t)
(11.31)
∂t
V
F
mit der Wahrscheinlichkeitsstromdichte
~j(~x, t) ≡ 1 ~ {ψ ∗ ∇ψ − ψ∇ψ ∗ } .
2m i
(11.32)
Damit die Norm (11.30) zeitlich erhalten bleibt, müssen wir nun fordern, als
Randbedingung für die Wellenfunktion ψ(~x, t) auf F , dass der WahrscheinlichH
keitsstrom df~ · ~j(~x, t) durch F verschwindet. Durch diese Forderung stellen
F
wir sicher, dass das Teilchen in V eingesperrt bleibt.
216
11.6
11 Quanten
Mittelwerte
Für ein Teilchen mit der Wahrscheinlichkeitsdichte |ψ(~x, t)|2 am Ort ~x berechnen
sich die Mittelwerte h~xi seiner Ortskoordinaten offenbar als die Integrale
Z
h~xi = d3 x ~x|ψ(~x, t)|2 ,
(11.33)
die über das ganze (u. U. unendliche) dem Teilchen zugängliche Volumen zu
erstrecken sind. Entsprechend gilt für den Mittelwert einer Funktion des Ortsvektors wie z. B. der potenziellen Energie U (~x)
Z
hU i = d3 x U (~x)|ψ(~x, t)|2 .
(11.34)
Behalten Sie in Erinnerung, dass derartige Mittelwerte experimentell dadurch
zu bestimmen sind, dass der Ort ~x bzw. die potenzielle Energie des Teilchens an
vielen identisch präparierten Systemen gemessen und die Resultate anschließend
gemittelt werden.
Der Mittelwert des Impulses p~ eines Teilchens, welches sich im unendlichen
Volumen −∞ < x, y, z < +∞ befindet, kann in entsprechender Weise gewonnen
werden, wenn die Wahrscheinlichkeitsamplitude ϕ(~k, t) dafür bekannt ist, dass
der Wellenvektor ~k = p~/h zur Zeit t seinen Wert im Intervall (2π)−3 d3 k bei ~k
hat. Dabei ist |ϕ(~k, t)|2 d3 k/(2π)3 die Wahrscheinlichkeit, den Wellenvektor in
diesem Intervall zu finden, und es gilt
h~
pi = ~
Z
d3 k ~ ~
k|ψ(k, t)|2 = ~h~ki ,
(2π)3
(11.35)
wobei wir bezüglich aller drei Komponenten von ~k von −∞ bis +∞ zu integrieren haben.
Nun legt ϕ(~x, t) als Amplitude dafür, dass das Teilchen sich als die ebene
~
Welle eik·~x erweise, auch die Amplitude ψ(~x, t) für den Aufenthalt des Teilchens
am Ort ~x fest gemäß
ψ(~x, t) =
Z
d3 k
~
ϕ(~k, t) eik·~x .
(2π)3
(11.36)
Diese Darstellung der ortsabhängigen Wellenfunktion als Superposition ebener
Wellen verallgemeinert die Wellenpakete für ein freies Teilchen, die wir in 11.4
kennengelernt hatten. Die Theorie der Fouriertransformationen spezifiziert die
Bedingungen für die Darstellbarkeit einer Funktion ψ(~x) durch ein Fourierintegral der Form (11.36). Wir nehmen hier alle solchen Bedingungen als erfüllt
an und setzen auch stillschweigend stets voraus, dass die uns begegnenden Wellenfunktionen ψ(~x) eindeutig ihre Fouriertransformierten ϕ(~k) festlegen. Bei so
durch Annahme gesicherter Eindeutigkeit von ϕ(~k) können wir leicht verifizieren, dass
Z
~
~
ϕ(k, t) = d3 x ψ(~x, t)e−ik·~x
(11.37)
11.6 Mittelwerte
217
gerade die Umkehrung der Darstellung (11.36) gibt. Setzen wir nämlich (11.37)
in (11.36) ein, so erhalten wir die Identität
Z
Z
d3 k i~k·(~x−x~0 ) ~0
3 0
e
ψ(x , t)
ψ(~x, t) = d x
(2π)3
Z
~
~0
= d3 x0 δ (3) (~x − x~0 )eik·(~x−x ) ψ(x~0 , t)
= ψ(~x, t) ,
wobei wir die uns von früher bekannte Fourierintegral-Darstellung der Deltafunktion
Z
d3 k i~k·~x
e
.
(11.38)
δ (3) (~x) =
(2π)3
benutzt haben.
Drücken wir nun in (11.35) die Amplitude ϕ(~k, t) für das Auftreten des
Wellenvektors ~k gemäß (11.37) durch die ortsabhängige Wellenfunktion ψ(~x, t)
aus, so erhalten wir die Möglichkeit, den Mittelwert des Impulses mit Hilfe der
letzteren auszurechnen, nämlich
Z
Z
Z
d3 k ~
~
~0
3
hpi =
~
k
d
x
ψ(~
x
,
t)
d3 x0 ψ ∗ (x~0 , t)e−ik·(~x−x )
(2π)3
Z
Z
Z
d3 k −i~k·(~x−x~0 )
3
3 0
∗ ~0
e
.
= d x ψ(~x, t) d x ψ (x , t)i~∇
(2π)3
Dabei wirkt der Gradient ∇ auf die ungestrichenen Koordinaten. Nach partieller
Integration (die Randterme verschwinden, sonst könnte ψ(~x, t) nicht normierbar
sein) und Beachtung der Darstellung (11.38) der Deltafunktion ergibt sich der
gesuchte Mittelwert des Impulses zu
Z
~
h~
pi = d3 x ψ ∗ (~x, t) ∇ψ(~x, t) .
(11.39)
i
Wir stoßen hier wieder auf die Korrespondenz des Impulses eines Teilchens
mit dem Differentialoperator ~i ∇. Die Ubiquität dieser Korrespondenz in der
Quantenmechanik macht es zweckmäßig, den Operator
µ
¶
~
~ ∂ ∂ ∂
p~op = ∇ =
,
,
(11.40)
i
i ∂x ∂y ∂z
als Impulsoperator in der Ortsdarstellung oder, kürzer, als Impulsoperator zu
bezeichnen. Ähnlich bequem ist es, den in der Schrödingergleichung auftretenden Differentialoperator
~2 2
∇ + V (~x)
(11.41)
2m
kurz der Hamiltonoperator des Teilchens zu nennen, der die Energie des Teilchens repräsentiert. Die mittlere Energie des Teilchens lässt sich offenbar durch
das Integral
Z
hHi = d3 x ψ ∗ (~x, t)Hop ψ(~x, t)
(11.42)
Hop = p~2op /2m + V (~x) = −
berechnen.
218
11.7
11 Quanten
Freie Pakete zerfließen
Ein freies Wellenpaket vergrößert im Lauf der Zeit seine räumliche Ausdehnung.
Diese bei klassischen Teilchen unbekannte Eigenschaft von Quanten will ich hier
der Einfachheit der Rechnung halber in einer Raumdimension illustrieren.
Die anfängliche Wellenfunktion habe die Gaußsche Form
ψ(x, 0) = (πσ)−1/4 e−x
2
/2σ
.
(11.43)
/σ
(11.44)
Die Wahrscheinlichkeitsdichte
|ψ(x, 0)|2 = (πσ)−1/2 e−x
2
ist dann auf Eins normiert,
+∞
Z
dx |ψ(x, 0)|2 = 1 .
(11.45)
−∞
Um die Wellenfunktion ψ(x, t) zu späteren Zeiten zu finden, müssen wir die
Schrödingergleichung i~ψ̇ = (p2 /2m)ψ mit der Anfangsbedingung (11.43) lösen.
Dazu ist es zweckmäßig, das Paket (11.43) als Superposition ebener Wellen
darzustellen,
ψ(x, 0) = (4πσ)
1/4
+∞
Z
dk ikx− σ k2
2
e
.
2π
(11.46)
−∞
Sie prüfen oder schlagen leicht nach, dass das Fourierintegral (11.46) gerade die
Gaußfunktion (11.43) ergibt (sogar bei komplexem σ, jedoch muss Re σ > 0
sein). Die zugehörige zeitabhängige Lösung der Schrödingergleichung muss nun
lauten
ψ(x, t) = (4πσ)
1/4
+∞
Z
dk ikx− σ k2 −i hk2 t
2
2m
e
,
2π
(11.47)
−∞
denn zur ebenen Welle eikx gehört die Frequenz ω = ~k 2 /2m. Das Wellenzahlintegral (11.47) ist leicht ausgeführt, denn es unterscheidet sich vom anfänglichen,
d. h. von (11.46) nur durch σ → σ + i ~t
m im Exponenten. Statt (11.43) ergibt
sich also
s
½
¾
σ
x2
1/4
exp −
.
(11.48)
ψ(x, t) = (πσ)
2(σ + i~t/m)
σ + i ~t
m
√
Uns interessiert besonders der Fall eines reellen σ, denn dann ist σ ein Maß
für die anfängliche Ausdehnung des Pakets. Um die Ausdehnung des Pakets zu
späteren Zeiten zu studieren, betrachten wir das Absolutquadrat
|ψ(x, t)|2 = (πσ(t))
−1/2 −x2 /σ(t)
e
mit
σ(t) = σ +
1
σ
µ
~t
m
¶2
.
(11.49)
11.7 Freie Pakete zerfließen
219
Dies ist wie (11.43) ein Gaußsches Paket, jedoch mit der räumlichen Ausdehnung
½
µ ¶2 ¾1/2
p
1 ~t
,
(11.50)
σ(t) = σ +
σ m
die im Laufe der Zeit monoton wächst. Nun ist nachgerechnet, dass freie Pakete
zerfließen.
Niemand hat je einen Fußball zerfließen gesehen, ohne sofort den Fernseher
als defekt zu erklären. Der Grund ist aus dem Resultat (11.50) leicht abzulesen. Bis zur Verdoppelung einer anfänglichen
Längendimension
∆x des Pakets
p
√
vergeht die Zeit T , die aus (11.50) mit σ(T ) = 2 σ zu
√
(∆x)2 m 3
T =
(11.51)
~
folgt. Als normalsichtiger Zuschauer können Sie zwei irgendwo auf dem Fels
unmittelbar nebeneinander liegende Bälle als getrennt auflösen, also einen Ball
mit der Genauigkeit der Größenordnung ∆x ≈ 10 cm lokalisieren. Mit diesem
∆x und der typischen Masse eines Fußballs finden Sie die Zeit T als bei weitem
größer als das Alter des Universums (das wir auf etwa 1010 Jahre schätzen). Wir
haben also keinerlei Veranlassung, die Schrödingergleichung zu lösen, wenn es
die Bahnen makroskopischer Teilchen zu berechnen gilt. Mikroskopische Wellenpakete zerfließen recht schnell. Für ein auf ∆x ≈ 1 Å = 10−8 cm lokalisiertes Elektron verdoppelt sich die Ausdehnung des Wellenpakets innerhalb von
10−15 Sekunden (s. Abbildung 11.7).
Abbildung 11.7
220
11.8
11 Quanten
Das Ehrenfestsche Theorem
Untersuchen wir die Bewegung von Quanten in äußeren Potentialen U (~x). Eine
wichtige Eigenschaft dieser Bewegung kann für beliebiges Potential U (~x) ohne
explizite Lösung der Schrödingergleichung gefunden werden. Sie betrifft das
zeitliche Verhalten des Mittelwerts h~xi, also des Schwerpunkts des Wellenpakets.
Wir werden gleich sehen, dass sich der Schwerpunkt h~xi wie ein klassisches
Teilchen bewegt, auf das der Mittelwert der Kraft, also −h∇U (~x)i, wirkt.
Um dieses von Ehrenfest erkannte Theorem zu beweisen, differenzieren wir
den Mittelwert h~xi nach der Zeit und benutzen für die Zeitableitung der Wellenfunktion ψ(~x, t) die Schrödingergleichung.
Z
n
o
d
h~xi = d3 x ψ̇ ∗ ~xψ + ψ ∗ ~xψ̇
dt
¸
½
·
Z
~2 2
1
3
∇ + U ψ∗
d x −~xψ −
=
i~
2m
·
¸ ¾
~2 2
∇ +U ψ
+ ~xψ ∗ −
2m
Z
©
ª
~
d3 x −~xψ ∗ ∇2 ψ + ~xψ∇2 ψ ∗ .
=
2mi
Im zweiten Summanden der letzten Zeile integrieren wir nacheinander zweimal
partiell. Die dabei auftretenden Randterme müssen verschwinden, da die Normierbarkeit der Wellenfunktion hinreichend schnellen Abfall von ψ für |~x| → ∞
sicherstellt. Es ergibt sich
Z
©
ª
d
~
h~xi =
d3 x ψ ∗ ∇2 ~x − ~x∇2 ψ .
(11.52)
dt
2mi
Den in der geschweiften Klammer stehenden Differentialoperator vereinfachen
wir schnell gemäß (Summenkonvention!)
µ
¶
∂2
∂2
∂
∂
∂
x
=
+ xi 2 ,
(11.53)
δ
+
x
=2
i
ij
i
2
∂xj
∂xj
∂xj
∂xj
∂xj
und erhalten
1
d
h~xi =
dt
m
Z
~
1
d3 x ψ ∗ ∇ψ = h~
pi .
i
m
(11.54)
Dies ist der klassische nichtrelativistische Zusammenhang zwischen der Ged
h~xi und dem Impuls h~
pi. Nochmaliges Differenzieren nach der
schwindigkeit dt
Zeit liefert
Z
o
n
d2
1 d
1 ~
3
∗
∗
ψ̇
∇ψ
+
ψ
∇
ψ̇
h~
x
i
=
h~
p
i
=
d
x
dt2
m dt
mi
¸
½
·
Z
1
~2 2
=
∇ + U ψ∗
d3 x [∇ψ] −
m
2m
·
¸ ¾
~2 2
− ψ∗ ∇ −
∇ +U ψ .
2m
11.8 Das Ehrenfestsche Theorem
221
Hier heben sich die beiden von der kinetischen Energie rührenden Summanden
gegenseitig weg, wie wir nach zweimaliger partieller Integration eines derselben
sehen, und es bleibt
m
d2
h~xi =
dt2
Z
d3 x ψ ∗ {U ∇ − ∇U } ψ .
(11.55)
Ähnlich, wie wir in (11.52) die Differenz der Operatorprodukte“ ∇2 ~x und ~x∇2
”
ausrechnen, haben wir hier die Vertauschungsrelation“ der Operatoren U (~x)
”
und ∇ zu bestimmen. Beachten Sie, dass im zweiten Summanden in (11.55) der
Differentialoperator ∇ auf die Funktion U (~x)ψ(~x, t) wirkt. Nach der Produktregel der Differenziation gilt
∇U ψ = ψ(∇U ) + U ∇ψ ,
(11.56)
so dass wir für die Beschleunigung des Schwerpunktes des Wellenpaketes erhalten
Z
d2
(11.57)
m 2 h~xi = d3 x |ψ(~x, t)|2 ∇U (~x) .
dt
Dies ist gerade die Newtonsche Bewegungsgleichung eines Teilchens der Masse
m, welches am Ort h~xi der Kraft −h∇U (~x)i ausgesetzt ist,
m
d2
h~xi = −h∇U (~x)i .
dt2
(11.58)
Das Ehrenfestsche Theorem gibt natürlich keine Auskunft über die zeitliche
Änderung der Form der Wellenfunktion ψ(~x, t) eines Teilchens, insbesondere also nicht darüber, ob und wie schnell ein vorgegebenes Paket ψ(~x, 0) zerfließt.
Die Überlegungen des vorigen Paragrafen besagen aber, dass das Zerfließen von
Wellenpakete für makroskopische Teilchen selbst über extrem lange Zeitspannen hinweg völlig vernachlässigbar ist. Dieses Resultat und das Ehrenfestsche
Theorem zusammen begründen die Möglichkeit, die Bewegung langsamer makroskopischer Teilchen nach Newtons Mechanik zu behandeln.
222
11 Quanten
Kapitel 12
Quanten in Kästen
12.1
Eindimensionale Potentialstufe
Ein einfaches Beispiel eines nicht überall kräftefreien Teilchens wird gegeben
durch das Potential
(
0
für x < 0
V (x) =
(12.1)
V0 > 0 für x > 0
Wir lassen der Einfachheit halber auch in der Wellenfunktion ψ(x, t) nur eine
Raumkoordinate zu.
Abbildung 12.1
Bei klassischer Betrachtungsweise konstatieren wir Kräftefreiheit überall außer an der Sprungstelle des Potentials bei x = 0. Ein klassisches Teilchen der
Energie E bewegt sich im linken Halbraum mit konstantem Impuls ±pL =
√
2mE; im rechten Halbraum kann es sich nur aufhalten, wenn seine Gesamtenergie E = p2 /2m + V (x) größer ist p
als die Potentialstufe V0 , welchenfalls es
dort mit konstantem Impuls ±pR = 2m(E − V0 ) läuft; beim Durchdringen
der Grenze x = 0 nach rechts erfährt das Teilchen die Kraft −V 0 (x) = −V0 δ(x),
die den Impuls pL auf pR herabsetzt.
Die Wellenfunktion eines Quants finden wir durch Lösung der Schrödinger223
224
12 Quanten in Kästen
gleichung
¸
·
~2 d 2
+
V
(x)
ψ(x, t) .
i~ ψ̇(x, t) = −
2m dx2
(12.2)
Offenbar lässt sich diese Differentialgleichung durch den Ansatz einer monochromatischen Welle
ψ(x, t) = e−iEt/~ u(x)
(12.3)
lösen. Die Kreisfrequenz dieser Welle ist ω = E/~, also hat die Konstante E die
Bedeutung der Energie des Teilchens. Für den zeitunabhängigen Anteil u(x)
ergibt sich die Differentialgleichung
µ
¶
~2 d 2
−
+ V (x) u(x) = Eu(x) ,
(12.4)
2m dx2
die die eben erschlossene Interpretation von E als Energie nochmals stützt.
Von besonderem Interesse ist der Fall einer Teilchenernergie unterhalb der
Stufe, d. h. 0 < E < V0 . In beiden Halbräume lässt sich u(x) aus (12.4) durch
einen Exponentialansatz finden. Die allgemeinen Lösungen lauten

√
ikx
−ikx

für x < 0
mit ~k = 2mE
 A e +B e
(12.5)
u(x) =

 a e−βx + b e+βx mit ~β = p2m(V − E) für x > 0 .
0
Uns bleibt die Aufgabe, die vier Integrationskonstanten A, B, a, b festzulegen.
Ganz sicher müssen wir
b=0
verlangen, da sonst die Wellenfunktion für x → +∞ über alle Grenzen wachsen
würde und somit nicht mehr als Wahrscheinlichkeitsamplitude eines Teilchens
interpretierbar wäre.
Weiteren Aufschluss über die verbleibenden Integrationskonstanten erhalten
wir, wenn wir (12.4) in unmittelbarer Umgebung der Potentialstufe, d. h. im
Intervall −ε ≤ x ≤ +ε betrachten. Da |u(x)|2 als normierbare Wahrscheinlichkeitsdichte hier beschränkt bleiben muss, folgt aus der Schrödingergleichung (12.4),
dass die zweite Ableitung, u00 (x), an der Stelle x = 0 einen endlichen Sprung
macht,
u00 (ε) − u00 (−ε) =
¢
¢
2m ¡
2m ¡
V (ε) − E u(ε) − 2 V (−ε) − E u(−ε) .
2
~
~
Die erste Ableitung, u0 (x), läuft also mit einem Knick stetig durch x = 0, so dass
u(x) selbst dort ebenfalls stetig ist. Die Argumentation macht übrigens nicht
von der stückweisen Konstanz von V (x), sondern nur von der Endlichkeit des
Potentialsprunges Gebrauch. Also gilt allgemein: Die Wellenfunktion und ihre
erste Ortsableitung verlaufen stetig, wenn das äußere Potential einen endlichen
Sprung macht.
Die Stetigkeit von u(x) und u0 (x) bei x = 0 verlangt in unserem Beispiel
A+B =a
12.1 Eindimensionale Potentialstufe
225
bzw.
ik(A − B) = −βa .
(12.6)
Diese Bedingungen legen zwei der drei Integrationskonstanten fest, und wir
erhalten die Wellenfunktion
 µ
¶
µ
¶
1
β
1
β


1+i
eikx +
1−i
e−ikx
für x < 0

2
k
2
k
−iEt/~
ψ(x, t) = ae


e−βx
für x > 0 .
(12.7)
Die verbleibende Konstante a kann schließlich durch eine Normierungsforderung
festgelegt werden.
Sehen sie, dass ein Quant der Energie E im linken Halbraum den gleichen
√
Impuls hat wie das klassische Teilchen gleicher Energie, ±pL = ±~k = 2mE?
Dass ψ eine nach rechts einlaufende und eine nach rechts reflektierte Welle
enthält? Bemerkenswert ist, dass das Quant im Gegensatz zum klassischen
Teilchen in den rechten Halbraum eindringen kann; die Eindringtiefe 1/β der
Welle ist umso kleiner, je tiefer die Energie E unter der Kante V0 liegt.
Ihnen empfehle ich zur Übung den Nachweis, dass das Quant wie das klassische Teilchen keine negative Energie haben kann; zeigen Sie ebenfalls, dass
das Quant der Energie E > V0 im linken und rechten Halbraum die jeweiligen
klassischen Werte des Impulses annimmt.
Betrachten wir abschließend eine unendlich hohe Potentialstufe, gemäß V0 →
∞ in (12.1). Die Eindringtiefe 1/β der Welle ist dann Null. Die unendlich
hohe Potentialbarriere ist für das Quant ebenso undurchdringlich wie für das
klassische Teilchen. Aus (12.6) folgern wir, dass a = A + B = 0, so dass die
Wellenfunktion zur Wand hin stetig nach Null abfällt (Abbildung 12.2). Die
Ableitung u0 (x) hingegen bleibt an der Wand unbestimmt.
Abbildung 12.2
226
12.2
12 Quanten in Kästen
Eindimensionaler Kasten mit starrem Rand
Wenn Wellen in Kästen endlicher Ausdehnung eingesperrt und somit Randbedingungen unterworfen werden, so sind freie Schwingungen nur bei bestimmten
Eigenfrequenzen möglich. Denken Sie an Saiten, Pauken und Flöten, insbesondere auch an 2.13. Quanten in endlichen Kästen sollten also nicht mit beliebigen
Energien, sondern nur mit diskreten Eigenenergien auftreten können.
Zur Bestätigung dieser Erwartung betrachten wir ein Potential
(
0
für
− a < x < +a
V (X) =
∞
für
|x| > a .
Die unendlich hohe Potentialbarriere am Kastenrand bei x = ±a ist undurch-
Abbildung 12.3
dringlich und erzwingt die Randbedingung
ψ(±a, t) = 0 .
(12.8)
Ein Quant der Masse m bewegt sich im Innern des Kastens kräftefrei. Die
Schrödingergleichung ist dort die des freien Teilchens und hat als Lösungen
ebene monochromatische Wellen
ψ(x, t) = e−iEt/~ (A cos kx + B sin kx) = e−iEt/~ u(x)
(12.9)
mit dem Impuls
~k =
√
2mE.
(12.10)
Die Randbedingung (12.8) lässt sich für E ≤ 0 nur durch die triviale Lösung
A = B = 0, also ψ(x, t) = 0 erfüllen. Also kann im Kasten kein Teilchen mit
verschwindender oder negativer Energie existieren. Für E > 0 finden wir jedoch
sofort nichttriviale Lösungen. Aus
0 = A cos ka + B sin ka
0 = A cos ka − B sin ka
(12.11)
12.2 Eindimensionaler Kasten mit starrem Rand
227
folgt
A cos ka = 0
und
B sin ka = 0 ,
(12.12)
also entweder
A=0
und
sin ka = 0
(12.13)
B=0
und
cos ka = 0 .
(12.14)
oder
Im ersten Fall (A = 0) haben wir als Eigenschwingungen die in x ungeraden
Funktionen
un (x) = B sin kn x,
kn a =
π
n,
2
n = 2, 4, 6, . . .
(12.15)
und im zweiten Fall (B = 0) die geraden Funktionen
un (x) = A cos kn x,
kn a =
π
n,
2
n = 1, 3, 5, . . .
(12.16)
Die zugehörigen Eigenwerte der Energie sind in beiden Fällen durch (12.10) als
En =
~2 kn2
~2 π 2 2
=
n ,
2m
8ma2
n = 1, 2, 3, . . .
(12.17)
festgelegt.
Die ersten vier En aus der unendlichen Folge von Energieniveaus sind in die
Abbildung 12.4 eingetragen. Schematisch aufgesetzt sind dabei die zugehörigen
Eigenfunktionen. Beachten und bewahren Sie folgende Eigenarten unseres Ergebnisses:
(i) Die Grundzustandsenergie ist (nicht E = 0 sondern!) E1 = ~2 π 2 /8ma2 ;
ein auf ∆x ≈ a lokalisiertes Teilchen hat eine Impulsunschärfe von mindestens ∆p ≈ ~/a, also eine kinetische Energie der Ordnung ~2 /ma2 .
(ii) Der Grundzustand u1 (x) hat im Innern des Kastens keine Nullstelle; der
Zustand un (x) hat im Innern des Kastens n − 1 Nullstellen.
(iii) Alle Eigenfunktionen sind gerade oder ungerade; Energieniveaus zu geraden und ungeraden Zuständen wechseln in der Folge En einander ab.
(iv) Die Eigenfunktionen liegen nur bis auf einen Normierungsfaktor fest. Dieser kann so gewählt werden, dass
Z+a
dx un (x)2 = 1
−a
gilt.
228
12 Quanten in Kästen
Abbildung 12.4
Es ist kein Zufall, dass alle Eigenschwingungen un (x) entweder ungerade
(s. 12.15) oder gerade Funktionen sind. Dass keine Eigenfunktion auftritt, die
weder gerade noch ungerade ist, legt vielmehr daran, dass das Potential V (x)
selbst gerade ist,
V (x) = −V (x) ,
(12.18)
wie Sie aus der folgenden Überlegung entnehmen.
Bei beliebigem geraden Potential V (x) bleibt die Schrödingergleichung
−
~2 00
u (x) + V (x)u(x) = Eu(x)
2m
(12.19)
unverändert bei der Transformation x → −x. Wenn also u(x) eine Lösung
zum Eigenwert E ist, so auch u(−x). Wenn es zum Eigenwert E nur eine
Eigenfunktion gibt (bis auf Normierungsfaktor), so ist u(−x) nicht von u(x)
linear unabhängig, sondern muss zu u(x) proportional sein,
u(x) = εu(−x) = ε2 u(x) .
(12.20)
Die zweite Gleichung in (12.20) entsteht bei nochmaliger Transformation x →
−x. Wir folgern ε = ±1, also dass u(x) entweder gerade oder ungerade sein
muss. Die Einschränkung, dass zu einem Eigenwert E nur eine Eigenfunktion
12.3 Potentialtopf endlicher Tiefe
229
u(x) auftreten solle, können wir übrigens allen lassen; eventuell auftretende linear unabhängige u(x) zu einer Energie können immer zu geraden und ungeraden
Funktionen linear kombiniert werden.
12.3
Potentialtopf endlicher Tiefe
Beim oben diskutierten Potentialtopf unendlicher Tiefe gibt es Eigenschwingungen des Quants nur mit diskreten Eigenfrequenzen bzw. Energien. Dieses
Verhalten ist typisch (was ich hier nicht zeige) für Potentiale, die für x → ±∞
(bzw. |~x| → ∞ in zwei oder drei Dimensionen) unbeschränkt wachsen. Eine
andere Situation liegt bei einem Potentialtopf endlicher Tiefe vor. Hier laute
die potenzielle Energie des Quants
V (x) =
(
V0
für
|x| > a
0
für
|x| < a .
(12.21)
Abbildung 12.5
Ein diesem Potential unterworfenes klassisches Teilchen ist, falls seine Energie E kleiner ist als die√Topftiefe V0 , gebunden im Kasten −a < x < +a und
hat dort den Impuls ± 2mE. Falls jedoch E > V0 , so kann sich das√klassische Teilchen überall in −∞ < x < ∞ aufhalten;
sein Impuls beträgt ± 2mE,
p
so lange es in −a < x < a bleibt, und ± 2m(E − V0 ), sobald es sich in den
Bereichen |x| > a befindet.
Die im Potential (12.21) möglichen Eigenschwingungen des Quants
ψ(x, t) = e−iEt/~ u(x)
(12.22)
finden wir wie in den vorigen Paragrafen durch Zusammenstückeln der freien
Wellen aus den Bereichen konstanten Potentials. Durch die beiden Sprungstellen
x = ±a müssen u(x) und u0 (x) stetig verlaufen. Zum Aufbau der Lösung
erinnern wir uns zunächst daran, dass der Wellenvektor des Quants der Energie
E die Werte
p
±k = 2mE/~
(12.23)
230
12 Quanten in Kästen
und
±iβ =
p
2m(E − V0 )/~
(12.24)
annimmt bezüglich der Wellen im Bereich |x| < a bzw. |x| > a (letzterer
Wellenvektor ist natürlich als inverse Eindringtiefe zu interpretieren, wenn E <
V0 ). Ferner beachten wir, dass das Potential gerade in x ist, und folgern, dass
wir alle Eigenfunktionen u(x) finden können durch den Ansatz gerader und
ungerader Linearkombination der genannten ebenen Wellen.
Als Kandidaten gerader Eigenfunktionen mit 0 < E < V0 bieten sich an

cos kx
für
|x| < a



−β(x−a)
(12.25)
u(x) = B · cos kae
für
x>a



cos kae+β(x+a)
für
x < −a
Hier habe ich die für x → ±∞ unbegrenzt wachsenden Lösungen der Schrödingergleichung unter Berufung auf die Wahrscheinlichkeitsinterpretation der
Wellenfunktion unterdrückt. Außerdem ist die Stetigkeit von u(x) bei x = ±a
bereits berücksichtigt. Da der Wellenvektor k und die Eindringtiefe 1/β gemäß
(12.23) und (12.24) durch die Energie E festgelegt sind, treten in (12.25) noch
die Energie E und die Normierungskonstante B als freie Parameter auf. Eine
Einschränkung für diese beiden Parameter erhalten wir aus der Forderung der
Stetigkeit von u0 (x) bei x = ±a,
−Bk sin ka = −Bβ cos ka .
(12.26)
Die Befriedigung dieser Randbedingung durch die Wahl B = 0 ist uninteressant, da dann u(x) trivial wird. Nichttriviale Eigenschwingungen des Quants
mit 0 < E < V0 sind nur möglich für Energien, die die Gleichungen (12.23),
(12.24) und (12.26) bei B 6= 0 befriedigen, also
(ak) tan ak = aβ
(12.27)
(ak)2 + (aβ)2 = 2mV0 a2 /~2 ≡ ρ2
E=
~2 k 2
.
2m
(12.28)
(12.29)
Die beiden ersten dieser Gleichungen müssen wir daraufhin untersuchen, ob sie
(positive!) Lösungen für ak und aβ zulassen. Abbildung 12.6 zeigt Graphen der
Funktion ak tan ak = aβ und des Kreises (ak)2 + (aβ)2 = ρ2 . Sie sehen, dass
genau ein Schnittpunkt, d. h. eine Eigenenergie E0
0 < E0 <
³ π ´2
2
~2
2ma2
(12.30)
p
auftritt, wenn ρ = 2mV0 a2 /~ < π. Wenn die Tiefe des Potentialtopfs zunimmt, so entstehen weitere Schnittpunkte, d. h. Eigenenergien.
Ihnen bleibt als eine schöne Übung, die Zahl der auftretenden Eigenwerte
in Abhängigkeit von der Topftiefe V0 zu untersuchen und dabei auch ungerade
Lösungen u(x) zu berücksichtigen. Mir kam es bei der dargelegten Rechnung
12.3 Potentialtopf endlicher Tiefe
231
Abbildung 12.6
darauf an, Ihnen klarzumachen, dass im Topf gebundene Eigenschwingungen
zu Eigenenergien 0 < E < V0 nur für diskrete Werte der Energie auftreten
können. Von im Topf gebundenen Eigenschwingungen zu sprechen, ist hier
angebracht, da die Lösungen (12.23) für |x| > a, also außerhalb des Kastens,
exponentiell abfallen. Folglich sind die gebundenen Zustände auch normierbar
+∞
R
durch
|u(x)|2 = 1.
−∞
Ganz anders benehmen sich die Eigenschwingungen mit E > V0 ! Da für
diese β nach (12.24) imaginär wird, will ich statt β lieber den Wellenvektor
p
(12.31)
K = 2m(E − V0 )/~
benutzen und gerade Eigenschwingungen mit dem Ansatz

cos kx



u(x) = B · cos ka [cos K(x − a) + D sin K(x − a)]



cos ka [cos K(x + a) − D sin K(x + a)]
für
|x| < a
für
x>a
für
x < −a
(12.32)
suchen. Beachten Sie, dass jetzt für |x| > a sowohl exp(+iKx) als auch exp(−iKx)
zuzulassen sind, da beide Wellen beschränkt bleiben. Es tritt also gegenüber
(12.25) eine freie Konstante mehr auf; insgesamt sind B, D und die Energie E
zunächst offen. Die Stetigkeit von u0 (x) bei x = ±a gibt die zu (12.26) analoge
Forderung −kB sin ka = KBD cos ka oder, da nur B 6= 0 von Interesse,
−ka tan ka = DKa ,
(12.33)
Aus (12.23) und (12.31) folgt, dass die Lösungen ka und Ka auch auf der
Hyperbel
(ka)2 − (Ka)2 = 2mV0 a2 /~2 = ρ2
(12.34)
232
12 Quanten in Kästen
liegen müssen. Abbildung 12.7 zeigt, dass für jeden Wert von D unendlich
viele Schnittpunkte der durch (12.33) und (12.34) definierten Kurven im ersten
Quadranden auftreten. Da der Parameter D keiner weiteren Einschränkung
Abbildung 12.7
unterworfen ist, kann die Energie
~2 2
k > V0
(12.35)
2m
kontinuierliche Werte annehmen. Ein solches kontinuierliches Spektrum von
Energieeigenwerten haben wir schon beim freien Quant kennengelernt.
Die zum kontinuierlichen Spektrum gehörigen Eigenzustände (12.32) (sowie
die entsprechenden ungeraden Lösungen) fallen für x → ±∞ nicht ab. Sie
ähneln insofern den ebenen Wellen e±ikx des überall freien Teilchens. Keine der
Lösungen mit E > V0 ist für sich allein im ganzen Raum normierbar im Sinne
von
+∞
Z
dx |ψ(x, t)|2 = 1 .
(12.36)
E=
−∞
Wohl aber lassen sich aus den Lösungen u(x) Wellenpakete
+∞
Z
ψ(x, t) =
dE ϕ(E) e−iEt/~ u(x)
(12.37)
V0
aufbauen, die zu allen Zeiten die Normierung (12.36) behalten.
Halten wir fest: Quanten mit Energien unterhalb des Topfrandes, d. h. mit
E < V0 , sind (ähnlich wie klassische Teilchen) im Kasten −a < x < a gebunden;
sie sind zu Eigenschwingungen nur mit diskreten Energien fähig. Hingegen
können sich Quanten mit Energien oberhalb des Topfrandes, d. h. mit E >
V0 , ähnlich wie klassische Teilchen beliebig weit vom Kasten entfernen und
Eigenschwingungen mit kontinuierlichem Energiespektrum ausführen.
12.4
Quanten durchdringen Wände
Unseren Variationen zum Thema stückweise konstante Potentiale ist eine letzte
höchst lehrreiche hinzuzufügen. Sie soll den so genannten Tunneleffekt illustrie-
12.4 Quanten durchdringen Wände
233
ren.
Zwei Raumbereiche mit verschwindendem Potential seien durch eine Potentialbarriere getrennt gemäß
(
V0
für
|x| < 0
V (x) =
(12.38)
0
für
|x| > d .
Ein von links ankommendes klassisches Teilchen der Energie E < V0 stößt bei
x = 0 auf eine undurchdringbare Wand und wird reflektiert. Ein Quant hingegen
kann die endliche Potentialbarriere durchtunneln“.
”
Abbildung 12.8
Die Lösung der Schrödingergleichung mit der
mit dem Ansatz
 ikx
e + ρ e−ikx
für



u(x) = B · C eβx + D e−βx
für


 ik(x−d)
τe
für
Energie E < V0 suchen wir
x<0,
0<x<d,
(12.39)
x>d,
wobei der Wellenvektor k und die Eindringtiefe 1/β wieder gegeben sind durch
p
√
~β = 2m(V0 − E) .
(12.40)
~k = 2mE,
Der Ansatz berücksichtigt im Bereich x < 0 eine von links einlaufende und eine
nach links reflektierte Welle, sowie für x > d eine von der Barriere durchgelassene nach rechts weiterlaufende Welle. Innerhalb der Wand kann keine der
Partikularlösungen e±βx außer Acht gelassen werden, da beide in 0 < x < d
beschränkt bleiben.
Die vier Integrationskonstanten ρ, C, D und τ lassen sich festlegen durch die
Forderung der Stetigkeit von u(x) und u0 (x) an den Sprungstellen des Potentials.
Von besonderem Interesse ist die Amplitude τ der durch die Wand gedrungenen
Welle, die sich nach leichter aber länglicher Rechnung als
£
¤−1
τ = 2βk 2βk cosh βd − i(k 2 − β 2 ) sinh βd
(12.41)
ergibt. Ihr Absolutquadrat, die Wahrscheinlichkeit, dass ein von links einfallendes Teilchen die Wand durchdringt, heißt die Durchlässigkeit T (E) der Wand
234
12 Quanten in Kästen
und beträgt
·
p
V02
sinh2 2m(V0 − E)d2 /~2
T (E) = |τ | = 1 +
4E(V0 − E)
2
¸−1
(12.42)
Die Durchlässigkeit nimmt monoton zu, wenn E bis V0 wächst. Andererseits
fällt T (E) exponentiell auf Null, wenn die Höhe V0 oder die Breite d der Barriere
über alle Grenzen steigt,
T (E) →
16E(V0 − E) −2√2m(V0 −E)d2 /~2
e
.
V02
(12.43)
Ihnen bleibt als Übung, die so genannte Reflektivität R = |ρ|2 der Wand zu
suchen und das Resultat, R = 1 − T , zu interpretieren.
Kapitel 13
Harmonisch gebundene
Quanten
13.1
Eindimensionaler harmonischer Oszillator
Wir greifen hier einen in Kapitel 2. klassisch behandelten Problemkreis auf und
betrachten ein durch eine lineare Rückstellkraft an eine Ruhelage gebundenes
Teilchen der Masse m. Der Auslenkung x entspricht die potenzielle Energie
V (x) =
1
mω 2 x2 ,
2
(13.1)
wobei ω sich bei der klassischen Behandlung als die Frequenz erwies, mit der
das Teilchen um seine Ruhelage schwingt.
Zur quantenmechanischen Behandlung haben wir die Schrödingergleichung
¶
µ
1
~2 d 2
2 2
+
mω
x
ψ(x, t)
(13.2)
i~ψ̇(x, t) = Hψ(x, t) = −
2m dx2
2
zu lösen. Wir suchen zunächst die Eigenzustände
ψ(x, t) = eiEt/~ u(x)
(13.3)
und Eigenwerte der Energie E aus
Hu(x) = Eu(x) .
(13.4)
Da die potenzielle Energie V (x) des Quants bei Entfernung vom Kraftzentrum
unbeschränkt wächst, erwarten wir ein diskretes Spektrum von Eigenenergien
mit gebundenen, normierbaren Zuständen gemäß
+∞
Z
dx |u(x)|2 = 1 .
(13.5)
−∞
Um die normierbaren Lösungen u(x) der Differentialgleichung (13.4) und
die zugehörigen Energien E zu finden, bedienen wir uns eines algebraischen
235
236
13 Harmonisch gebundene Quanten
Verfahrens, welches die uns schon mehrfach begegnete Produktregel der Differentialrechnung in der Form
d
d
x−x
=1
dx
dx
(13.6)
ausschlachtet. Diese wohlbekannte Identität gibt, nach Multiplikation beider
d
Seiten mit (~/i), eine Aussage über den Impulsoperator p = ~i dx
und die Koordinate x (den Ortsoperator“),
”
~
(13.7)
px − xp ≡ [p, x] = .
i
In Produkten von x und p darf die Reihenfolge der Faktoren also nicht beliebig
vertauscht werden. Wir sprechen, eingebürgerten Brauch folgend, von (13.7) als
der kanonischen Vertauschungsrelation für Koordinate und Impuls.
Für unser Vorhaben ist es zweckmäßig, den Hamiltonoperator
1
H = p2 /2m + mω 2 x2
2
statt durch x und p durch die Linearkombinationen
Ãr
!
r
¶
µr
1
1
mω
mω
~ d
i
a= √
p =√
x+ √
+
,
~
~
mω dx
2
2
mω~
Ãr
!
r
µr
¶
1
1
i
d
mω
mω
~
a† = √
p =√
x− √
x−
~
~
mω dx
2
2
mω~
(13.8)
(13.9)
auszudrücken. Für die Operatoren a und a† finden wir aus (13.7) die Vertauschungsrelation
[a, a† ] = aa† − a† a =
i
[p, x] = 1
~
(13.10)
sowie das Produkt
¶
1 2
i
mω 2
x +
p − [p, x]
~
m~ω
~
¶
µ
1
1
1 2 1
p + mω 2 x2 − .
=
~ω 2m
2
2
1
a a=
2
†
µ
Der Hamiltonoperator (13.8) lässt sich somit in der Form (13.11)
µ
¶
1
†
H = ~ω a a +
2
(13.11)
(13.12)
aufschreiben. Seine Eigenfunktionen u(x) und Eigenwerte E sind bekannt, wenn
die des Operators a† a gefunden sind. Versuchen wir also, die Eigenwertgleichung
a† auλ (x) = λuλ (x)
zu lösen.
(13.13)
13.1 Eindimensionaler harmonischer Oszillator
237
Von den Eigenwerten λ ist schnell zu sehen, dass sie alle nichtnegativ sind.
Wenn wir nämlich (13.13) mit u∗λ (x) multiplizieren und integrieren,
+∞
+∞
Z
Z
∗
†
dx|uλ (x)|2 ,
dx uλ (x)a auλ (x) = λ
(13.14)
−∞
−∞
so entsteht rechts ein Integral über das Absolutquadrat der Funktion uλ (x), das
nicht negativ sein kann. Auch das links auftretende Integral hat diese Eigenschaft, denn in
Ãr
!
r
+∞
Z
1
mω
~ d
∗
dx uλ (x) √
auλ (x)
x−
~
mω dx
2
−∞
können wir durch einmalige partielle Integration die Ableitung d/dx auf u ∗ (x)
abwälzen, woraufhin wir erhalten
r
+∞
+∞
¶
¸
µr
·
Z
Z
mω
~ d
1
∗
†
x+
u∗λ (x) auλ (x)
dx uλ (x)a auλ (x) =
dx √
~
mω dx
2
−∞
−∞
+∞
+∞
Z
Z
∗
dx |auλ (x)|2 ≥ 0 .
dx (auλ (x)) auλ (x) =
=
−∞
−∞
(13.15)
Es folgt die behauptete Eigenschaft der Eigenwerte,
λ≥0.
(13.16)
Hätten wir eine Lösung uλ (x) der Eigenwertgleichung (13.13) mit Eigenwert
λ gefunden, so ergäbe sich mit a† uλ (x) gleich noch eine, u. z. zum Eigenwert
λ + 1. Um das zu zeigen, müssen wir nur die Vertauschungsrelation (13.10)
bemühen, denn
a† a(a† uλ ) = a† (1 + a† a)uλ = a† uλ + a† λuλ = (λ + 1)a† uλ .
(13.17)
Das gleiche Argument erweist (a† )2 uλ als eine Eigenfunktion von a† a zum Eigenwert λ + 2 und, für beliebige natürliche Zahlen µ, (a† )µ uλ als Eigenfunktion
zum Eigenwert (λ + µ).
Eine ähnliche Folge von Eigenfunktionen lässt sich aus uλ (x) durch wiederholte Multiplikation mit dem Operator a erzeugen. Mit Hilfe der Vertauschungsrelation (13.10) finden wir nämlich
a† a(auλ ) = (aa† − 1)auλ = aλuλ − auλ = (λ − 1)auλ .
(13.18)
Also ist auλ Eigenfunktion von a† a zum Eigenwert λ − 1 und entsprechend a2 uλ
Eigenfunktion zum Eigenwert λ − 2 usf.
Die Folge auλ , a2 uλ , a3 uλ , . . . muss abbrechen, d. h. es muss sich beim wiederholten Anwenden des Operators a eine Funktion u0 (x) ergeben mit der Eigenschaft
au0 (x) = 0 .
(13.19)
238
13 Harmonisch gebundene Quanten
Ansonsten würden entgegen der obigen Erkenntnis (13.16) in der Folge von Eigenwerten λ, λ−1, λ−2, . . . negative Eigenwerte auftreten. Durch Multiplikation
von (13.19) mit dem Operator a† finden wir
a† au0 (x) = 0
(13.20)
und schließen, dass der kleinste Eigenwert von a† a gleich Null ist.
Damit ist klar, dass der Operator a† a alle nichtnegativen ganzen Zahlen als
Eigenwerte hat,
a† aun (x) = nun (x),
n = 0, 1, 2, . . . .
(13.21)
Sobald die nullte“ Eigenfunktion u0 (x) bekannt ist, erhalten wir die n-te als
”
un (x) = αn (a† )n u0 (x) ,
(13.22)
wobei die Zahl αn als Normierungsfaktor zuzulassen und noch zu bestimmen
ist, wenn wir für alle un (x) die Normierung (13.5) fordern. Diese Forderung
lautet jetzt
+∞
Z
£
¤¡
¢∗
dx |αn |2 (a† )n u0 (x) (a† )n u0 (x)
1=
−∞
!
Ãr
r
+∞
Z
¤∗
£ † n
¤ 1
mω
~ d £ † n−1
(a )
u0 (x) .
= |αn |
dx (a ) u0 (x) √
x−
~
mω dx
2
2
−∞
Durch eine partielle Integration wälzen wir den Differentialoperator d/dx auf
den linken Faktor im Integranden und erhalten
Ãr
!
r
+∞
·
¸
Z
£
¤∗
1
mω
~
d
2
† n
1 = |αn |
dx √
x+
(a ) u0 (x) (a† )n−1 u0 (x)
~
mω
dx
2
−∞
+∞
Z
£
¤£
¤∗
= |αn |
dx aa† (a† )n−1 u0 (x) (a† )n−1 u0 (x) .
2
−∞
Wir benutzen nochmals die Vertauschungsrelation aa† = 1 + a† a und beachten,
dass (a† )n−1 u0 (x) Eigenfunktion von a† a mit Eigenwert n − 1 ist. Aus der
Normierungsbedingung ergibt sich dann eine Rekursionsformel für |an |2 ,
+∞
Z
dx |(a† )n−1 u0 (x)|2 = |αn |2 n
1 = |αn | n
1
2
−∞
|αn−1 |2
also
|αn |2 =
1
|αn−1 |2 .
n
+∞
Z
dx |un−1 (x)|2 ,
−∞
|
{z
=1
}
(13.23)
13.1 Eindimensionaler harmonischer Oszillator
239
Die Lösung dieser Rekursionsformel bestätigen Sie leicht als |αn |2 = |α0 |2 /n!.
Da u0 (x) genau wie alle un (x) gemäß (13.5) normiert sein soll, muss |α0 |2 gelten.
Nicht durch die Normierung festgelegt sind die Phasen der Normierungsfaktoren
αn . Da nur das Absolutquadrat der Wellenfunktion eine direkte physikalische
Bedeutung hat, dürfen wir vereinbaren, dass alle αn reell sein sollen. Demnach
lauten die richtig normierten Eigenfunktionen von a† a endlich
1
un (x) = √ (a† )n u0 (x) .
n!
(13.24)
Noch ungeklärt ist allerdings, ob u0 (x) als Eigenfunktion von a† a zum Eigenwert Null existiert und normierbar ist. Wir beantworten die Frage, indem
wir u0 (x) konstruieren. Die Differentialgleichung (13.19) lässt sich schreiben als
Ãr
!
r
mω
~ d
1
√
u0 (x) = 0
(13.25)
x−
~
mω dx
2
oder
mω
xdx + du0 /u0 = 0. Hieraus lesen wir als Lösung ab
~
³ mω ´
x2 .
u0 (x) = N exp −
2~
Das Normierungsintegral existiert für diese Gaußfunktion (s. 11.7. Die Normierungskonstante N hat den Betrag |N | = (mω/π~)1/4 und lässt sich als positiv
wählen. Es ergibt sich die nullte Eigenfunktion zu
h mω i
³ mω ´1/4
exp −
u0 (x) =
x2 .
(13.26)
π~
2~
Ihnen bleibt als Übung zu zeigen, dass die nun explizit konstruierten Eigenfunktionen un (x) für n = 0, 1, 2, . . . abwechselnd gerade und ungerade sind; ferner,
dass un (x)/u0 (x) ein Polynom n-ter Ordnung in x ist.
Wie schon oben bemerkt, sind die Funktionen un (x) wegen des Zusammenhangs (13.12) zwischen dem Operator a† a und dem Hamiltonoperator H auch
Eigenfunktionen zu letzterem. Die zugehörigen Eigenwerte von H sind
¶
µ
1
(13.27)
En = ~ω n +
2
Offenbar liegen diese Eigenwerte äquidistant (vgl. Abbildung 13.1). Dem
Oszillator lässt sich Energie entlocken und zuführen nur in Einheiten ~ω. Dass
die Grundzustandsenergie E0 = 12 ~ω von Null verschieden ist, hatten wir uns
schon früher klar gemacht.
Nachdem alle Eigenfunktionen und Eigenwerte von H bekannt sind, können
wir die allgemeine zeitabhängige Lösung der Schrödingergleichung angeben,
X
ψ(x, t) =
cn e−iEn t/~ un (x) .
n
Der Koeffizient cn , ist die Wahrscheinlichkeitsamplitude dafür, den Oszillator im
n-ten Energieniveau anzutreffen. Die cn sind durch eine Anfangsbedingung für
ψ(x, 0) festzulegen. Wie die cn bei vorgegebener anfänglicher Wellenfunktion
ψ(x, 0) ausgerechnet werden können, können Sie im folgenden Paragrafen lernen.
240
13 Harmonisch gebundene Quanten
Abbildung 13.1
13.2
Die Orthogonalität normierbarer Eigenfunktionen hermitescher Operatoren
Für zwei normierbare, d. h. für x → ±∞ hinreichend schnell abfallende Wellenfunktionen ϕ(x) und ψ(x) gilt die Integrationsregel
+∞
+∞
·
¸∗
Z
Z
d
d
∗
dx
dx ψ (x) ϕ(x) = −
ψ(x) ϕ(x) .
dx
dx
(13.28)
−∞
−∞
Sie impliziert eine wichtige Identität für den Impulsoperator p =
+∞
+∞
Z
Z
∗
∗
dx ψ (x)pϕ(x) = +
dx [pψ(x)] ϕ(x) .
−∞
~ d
i dx
(13.29)
−∞
Ohne Änderung des Integrals kann der Impulsoperator von einer der beiden
Funktionen ϕ(x) und ψ(x) auf die andere abgewälzt werden. Diese Eigenschaft
des Operators p bezüglich des in ϕ und ψ bilinearen Integrals (13.29) heißt
Hermitezität.
Der Umgang mit Integralen des obigen Typs gestaltet sich bequemer, wenn
wir als Skalarprodukt zweier Funktionen ϕ(x) und ψ(x) im Intervall a < x < b
13.2 Die Orthogonalität normierbarer Eigenfunktionen hermitescher
Operatoren
241
einführen
hψ | ϕi =
Zb
dx ψ ∗ (x)ϕ(x) .
(13.30)
a
Dabei darf sich das Intervall auch über die ganze reelle Achse erstrecken; in zwei
oder drei Dimensionen ist das Skalarprodukt bezüglich eines Bereichs entsprechender Dimension zu definieren. Die Regel (13.28) verknüpft also die Skalard
d
ϕi und h dx
ψ | ϕi, und die Hermitezität des Impulsoperators p
produkte hψ | dx
lässt sich in der Form
hψ | pϕi = hpψ | ϕi
(13.31)
aufschreiben. Jeder Operator A mit der Eigenschaft
hψ | Aϕi = hAψ | ϕi
heißt hermitesch. Beispiele sind der Ortsoperator“ x, reelle Zahlen, p2 , der
”
Hamiltonoperator H = p2 /2m + V (x) usf. Nicht hermitesch ist nach (13.28)
der Differentialoperator d/dx, desgleichen nichtreelle Zahlen.
Die im letzten Paragrafen eingeführten Operatoren a und a† hatten wir durch
partielles Integrieren als nicht hermitesch erwiesen (ohne das so auszudrücken),
hψ | aϕi = ha† ψ | ϕi
(13.32)
hψ | a† ϕi = haψ | ϕi .
Wegen der Eigenschaft (13.32) nennen wir a† den zu a adjungierten Operator
und umgekehrt. Selbstadjungiert (= hermitesch) ist jedoch der Operator a † a,
denn aus (13.32) folgt
hψ | a† aϕi = haψ | aϕi = ha† aψ | ϕi .
(13.33)
Die Hermitezität eines Operators A hat zwei schöne und wichtige Konsequenzen für seine Eigenfunktionen ψn . Die fraglichen Eigenschaften werden uns
erlauben, das am Ende des letzten Paragrafen gestellte Anfangswertproblem zu
lösen. Die erste lautet: Die Eigenwerte eines hermiteschen Operators sind reell.
Zum Beweis dieser Aussage multiplizieren wir die Eigenwertgleichung
Aψn (x) = λn ψn (x)
(13.34)
hψn | Aψn i = λn hψn | ψn i .
(13.35)
mit ψn∗ (x) und integrieren,
Von letzter Gleichung subtrahieren wir ihre konjugiert komplexe und erhalten
(λn − λ∗n ) hψn | ψn i = hψn | Aψn i − hAψn | ψn i .
(13.36)
Wegen der Hermitezität von A verschwindet die rechte Seite in (13.36). Da
hψn | ψn i als Integral über die nichtnegative Funktion |ψn (x)|2 nicht verschwinden kann, folgt die Behauptung
λn = λ∗n .
(13.37)
242
13 Harmonisch gebundene Quanten
Der Hamiltonoperator eines Teilchens mit einer (reellen) potenziellen Energie V (x) ist, wie wir gesehen hatten, hermitesch. Daher sind die Energieeigenwerte stets reell. An diese Eigenschaft der Energieeigenwerte sind wir von den
bisher behandelten Beispielen her schon gewöhnt.
Die zweite angekündigte Eigenschaft hermitescher Operatoren betrifft ihre
Eigenfunktionen: Zu verschiedenen Eigenwerten gehörige normierbare Eigenfunktionen eines hermiteschen Operators sind aufeinander orthogonal. Damit
ist gemeint, dass das Skalarprodukt
Z
hψn | ψm i = dx ψn (x)ψm (x) .
(13.38)
verschwindet, wenn
Aψn = λn ψn
(13.39)
Aψm = λm ψm
(13.40)
λn 6= λm .
(13.41)
und
Zum Nachweis dieser Eigenschaft multiplizieren wir beide Seiten von (13.39)
∗
und beide Seiten der zu (13.40) konjugiert komplexen Gleichung mit ϕn
mit ψm
und integrieren,
hψm | Aψn i = λn hψm | ψn i
(13.42)
hAψm | ψn i = λm hψm | ψn i .
(13.43)
Wegen der angenommenen Hermitezität des Operators A sind die linken Seiten
von (13.42) und (13.43) einander gleich, woraus folgt
(λn − λm ) hψm | ψn i = 0 .
(13.44)
Aus der Verschiedenheit der Eigenwerte λn und λm folgt nun die Orthogonalität der Eigenfunktionen,
hψm | ψn i = 0
für
λn 6= λm .
(13.45)
Falls zu einem Eigenwert λn mehrere linear unabhängige Eigenfunktionen
auftreten, so sind diese zwar nicht notwendig untereinander orthogonal, können
aber (Übung!) durch Bildung geeigneter Linearkombinationen durch einen Satz
wechselseitig orthogonaler Funktionen ersetzt werden.
Da der Hamiltonoperator H = ~ω(a† a + 1/2) des harmonischen Oszillators
(ebenso wie der Operator a† a) hermitesch ist, sind seine im letzten Paragrafen gefundenen Eigenfunktionen untereinander orthogonal. Aus dem gleichen
Grund sind untereinander orthogonal die in 11.2 konstruierten Energieeigenfunktionen eines Teilchens im Kasten.
Wir können nun das am Ende des letzten Paragrafen gestellte Anfangswertproblem lösen, u. z. nicht nur für den eindimensionalen harmonischen Oszillator, sondern für alle Potentiale V (~x), für die die Gesamtheit der Eigenfunktionen des Hamiltonoperators H = p~2 /2m + V (~x) eine unendliche diskrete
13.3 Die erzwungene Schwingung des harmonischen Oszillators
243
Folge ψn (~x) mit n = 0, 1, 2, . . . bildet (die Verallgemeinerung auf kontinuierliche Spektren soll hier nicht besprochen werden). Die allgemeinste Lösung der
Schrödingergleichung i~ψ̇ = Hψ lautet dann nach dem Superpositionsprinzip
X
ψ(~x, t) =
cn e−iEn t/~ ψn (~x) .
(13.46)
n
Wenn die anfängliche Wellenfunktion ψn (~x, 0) gegeben ist, so lassen sich die
Koeffizienten cn bestimmen, indem die Gleichung
X
cn ψn (~x)
(13.47)
ψ(~x, 0) =
n
mit ψn∗ (x) multipliziert und integriert wird. Es ergibt sich wegen der Orthogonalität der Energieeigenfunktionen
­
®
cn = ψn | ψ(t = 0) /hψn | ψn i .
(13.48)
Dieses Resultat verschönert sich natürlich, wenn die Eigenfunktionen ψn auf
Eins normiert sind.
Die Darstellung der Funktion ψn (x, 0) durch eine unendliche Reihe gemäß
(13.47) und (13.48) wirft Konvergenzprobleme auf, auf deren Diskussion ich
hier verzichten muss. Ich will nur anmerken, dass die Darstellung (13.47, 13.48)
sowie die ihr anhaftende Konvergenzproblematik der Fourierreihenentwicklung
sehr ähnlich sind. Im Fall des Teilchens im Kasten mit starren Wänden (s. 12.2)
läuft die Darstellung sogar genau auf eine Fourierreihe hinaus.
13.3
Die erzwungene Schwingung des harmonischen Oszillators
Denken wir uns einen harmonischen Oszillator einer äußeren Kraft F (t) unterworfen, die zeitabhängig sein, aber nicht von der Auslenkung x des Oszillators
abhängen soll. Zur potenziellen Energie tritt dann das Zusatzglied −xF (t), so
dass der Hamiltonoperator lautet
H(t) =
1 2 1
p + mω 2 x2 − xF (t) .
2m
2
(13.49)
Im Gegensatz zu allen bisher betrachteten Fällen weist der Hamiltonoperator (13.49) eine explizite Zeitabhängigkeit auf. Aus diesem Grund kann die
Schrödingergleichung
·
¸
~2 ∂ 2
1
2 2
i~ψ̇(x, t) = −
+
mω
x
−
xF
(t)
ψ(x, t)
(13.50)
2m ∂x2
2
nicht mehr durch einen Separationsansatz der Form f (t)u(x) gelöst werden.
Zur Zeit t = 0 befinde sich der Oszillator im ungestörten Grundzustand, so
dass die anfängliche Wellenfunktion die Gaußsche Form (13.26)
ψ(x, 0) =
³ mω ´1/4
π~
n mω o
exp −
x2
2~
(13.51)
244
13 Harmonisch gebundene Quanten
hat. Da der Hamiltonoperator (13.49) ebenso wie der des freien Oszillators in der
Auslenkung x quadratisch ist, liegt die Vermutung nahe, dass die Lösung ψ(x, t)
der Schrödingergleichung (13.50) ebenso wie die Anfangsamplitude (13.51) Gaußsch
bleibt. Prüfen wir also den Ansatz
½
¾
³ mω ´1/4
mω
i
2
exp −
[x − x̄(t)] − p̄(t)x − iϕ(t)
(13.52)
ψ(x, t) =
π~
2~
~
mit zunächst unbekannten Funktionen x̄(t), p̄(t), ϕ(t). Bevor Sie nachrechnen,
dass dieser Ansatz bei geeigneter Wahl von x̄(t), p̄(t) und ϕ(t) die Schrödingergleichung befriedigt, sollten Sie ihn durch die folgenden Überlegungen würdigen
lernen.
Die rechte Seite in (13.52) stellt nicht die allgemeinste Gaußfunktion dar,
da der Normierungsfaktor (mω/π~)1/4 und der Koeffizient (mω/2~) des quadratischen Gliedes im Exponenten gegenüber der Anfangsamplitude (13.51) unverändert sind. Diese Einschränkungen garantieren jedoch, falls die Funktionen
x̄(t), p̄(t) und ϕ(t) reell sind, die zeitliche Konstanz des Normierungsintegrals
+∞
+∞
½
¾
Z
³ mω ´1/2 Z
mω
2
2
dx|ψ(x, t)| =
dx exp −
[x − x̄(t)] = 1 .
π~
~2
−∞
(13.53)
−∞
Auch besteht zur Änderung des Koeffizienten des quadratischen Gliedes im Exponenten kein Anlass, da dieser Koeffizient beim freien Oszillator durch die
Federkonstante mω 2 in der harmonischen Rückstellkraft bestimmt ist und da
die Federkonstante durch das Anschalten der äußeren Kraft F (t) nicht verändert
wird.
Übrigens dürfen die Funktionen x̄(t), p̄(t) ohne Beschränkung der Allgemeinheit als reell angenommen werden, da das in x lineare Glied¡ im Exponenten¢ in
(13.52) insgesamt den jedenfalls komplexen Koeffizienten ip̄(t) − mωx̄(t) /~
hat. Die Phase ϕ(t) muss dann auch reell sein, damit die Normierung (13.51)
gilt.
Der Spezialfall der freien Oszillation ist in (13.52) als x̄ = p̄ = 0, ϕ(t) =
E0 t/~ = ωt/2 enthalten. Nach Anschalten der äußeren Kraft beginnt die Energie des Oszillators von der Grundzustandsenergie E0 = ~ω/2 abzuweichen, weshalb die Phase ϕ(t) nicht mehr linear mit der Zeit wachsen kann.
Um die Bedeutung der Funktion x̄(t) zu klären, betrachten wir die Wahrscheinlichkeitsdichte
|ψ(x, t)|2 =
³ mω ´1/2
π~
n mω
o
2
exp −
[x − x̄(t)]
.
~
(13.54)
Wie zur Zeit t = 0 handelt es sich hierbei um eine Gaußsche Verteilung, die
allerdings ihr Maximum zur Stelle x = x̄(t) verschoben hat. Offensichtlich gilt
auch
+∞
Z
hxi =
dx x|ψ(x, t)|2 = x̄(t) ,
(13.55)
−∞
so dass x̄(t) mit der mittleren Auslenkung des Oszillators zu identifizieren ist.
13.4 Die Umgebung belässt nur den Grundzustand stabil
245
Der Phasenfaktor exp [ip̄(t)x/~] in (13.52) bringt zum Ausdruck, dass der
Oszillator nach erzwungener Auslenkung in Bewegung bleibt und einen von
Null verschiedenen mittleren Impuls aufweist. In der Tat gilt
+∞
+∞
Z
Z
©
ª
∗~ ∂
dx |ψ|2 p̄(t) + imω [x − x̄(t)] = p̄(t) ,
dx ψ
ψ=
hpi =
i ∂x
(13.56)
−∞
−∞
woraus wir die noch unbekannte Funktion p̄(t) als den mittleren Impuls des
Oszillators erkennen.
Jetzt dürfen Sie durch Eintragen des Ansatzes (13.52) in die Schrödingergleichung (13.50) verifizieren, dass in (13.52) die richtige Lösung vorliegt, vorausgesetzt, die Mittelwerte x̄(t) und p̄(t) und die Phase ϕ(t) werden bestimmt
aus
mẋ(t) = p̄(t)
˙ = −mω 2 x̄(t) + F (t)
p̄(t)
~ϕ̇(t) =
(13.57)
1
1
1
~ω +
p̄(t)2 − mω 2 x̄(t)2 .
2
2m
2
Die ersten beiden Gleichungen in (13.57) sind, wie nach dem Ehrenfestschen
Theorem zu erwarten, formgleich mit der Newtonschen Bewegungsgleichung für
die erzwungene Schwingung eines klassischen harmonischen Oszillators. Ihre
allgemeine Lösung ist uns aus 2.6 bekannt (die dort auftretende Dämpfungskonstante ist hier gleich Null zu setzen). Da im anfänglich vorliegenden Grundzustand die Mittelwerte von Auslenkung und Impuls verschwinden
hxit=0 = hpit=0 = 0 ,
(13.58)
lautet die mittlere Amplitude
x̄ =
Zt
0
dt0 F (t0 )
1
sin ω(t − t0 ) .
mω
(13.59)
Die Phase ϕ(t) ergibt sich schließlich aus dem Zeitintegral der rechten Seite der
letzten der Gleichungen (13.57).
13.4
Die Umgebung belässt nur den
Grundzustand stabil (Spontane Emission)
Makroskopische Oszillatoren (Pendel, elektrische Schwingkreise etc.) trifft man
stets im Ruhezustand bei verschwindender Auslenkung an, es sei denn, sie unterlägen zusätzlichen äußeren makroskopischen Kräften. Der Grund dafür ist,
dass eine etwa anfänglich vorhandene Anregungsenergie des Oszillators im Lauf
der Zeit durch Dämpfung dissipiert, d. h. an die Freiheitsgrade der Umgebung
abgegeben wird. Wir hatten diesen Effekt durch eine klassische Modellrechnung
in 2.13 illustriert.
Ähnlich benehmen sich Quantensysteme wie einzelne Oszillatoren oder Atome. Von den mehreren oder vielen Energieniveaus, die man durch Lösung
246
13 Harmonisch gebundene Quanten
der Schrödingergleichung für das einzelne System findet, bleibt i. A. nur der
Grundzustand streng stabil, wenn eine Wechselwirkung mit der Umgebung“ in
”
Rechnung gestellt wird. Praktisch heißt das z. B. , dass ein anfänglich schwingendes Molekül im Lauf der Zeit seine Anregungsenergie abstrahlt und in den
Grundzustand übergeht (s. Abbildung 13.2). Als Umgebung fungiert dabei das
elektromagnetische Feld.
Abbildung 13.2
Zur Illustration dieses Phänomens dient uns eine Modellrechnung, die der
in 2.13 vorgestellten eng verwandt ist. Als dissipierende Umgebung verwenden wir wieder einen Haufen harmonischer Oszillatoren, deren Frequenzen ω i
(i = 1, 2, . . . , N ) den Bereich 0 ≤ ωi < ∞ so dicht belegen, dass man eine
spektrale Dichte ρ(ω) einführen kann; ρ(ω)∆ω ist die Zahl dieser Oszillatoren,
mit Frequenzen im kleinen Intervall ∆ω bei ω. Das zu dämpfende Objekt sei
ebenfalls ein Oszillator, und dessen Frequenz heiße ω0 . Die Kopplung zwischen
dem zu dämpfenden Objekt und der Umgebung nehmen wir der Einfachheit
halber wieder als bilinear in den Koordinaten und Impulsen x0 und p0 bzw. xi
und pi an.
Bequemlichkeitshalber drücken wir den Hamiltonoperator des Systems gleich
durch die Erzeugungs-“ und Vernichtungsoperatoren“ a+
ν (ν = 0, 1, 2, . . . , N )
”
”
bzw. aν aus, die beim ν-ten Oszillator die Anregungsenergie um den Betrag ~ων
erhöhen (daher Erzeugungsoperator) bzw. erniedrigen (daher Vernichtungsoperator). Die Vertauschungsrelationen sind bezüglich jedes Oszillators die in 13.1
gefundenen (keine Summenkonvention!)
+ +
[aν , a+
ν ] = 1, [aν , aν ] = [aν , aν ] = 0 .
(13.60)
Wegen dxdν xµ = xµ dxdν bei µ 6= ν ist die Reihenfolge von zu zwei verschiedenen
Oszillatoren gehörigen Operatoren vertauschbar,
+
[aν , a+
µ ] = [aν , aµ ] = [aν , aµ ] = 0
für
ν 6= µ .
(13.61)
tritt jedenfalls die wohl bekannte ungestörte Energie ~ων
¢
¡Im+Hamiltonoperator
aν aν + 12 für jeden der N + 1 Oszillatoren auf. Hinzutreten muss ein Kopplungsglied, das die Wechselwirkung des zentralen Oszillators mit seiner Umgebung beschreibt (s. Abbildung 13.3). Eine einfache und anschauliche,Pder harx0 xi ∼
monischen Feder entsprechende Wahl für das Kopplungsglied wäre
i
13.4 Die Umgebung belässt nur den Grundzustand stabil
247
P
+
(a0 + a+
0 )(ai + ai ). Der nachfolgenden Rechnung lege ich jedoch bequemlichP
+
keitshalber die ebenfalls anschauliche Modifikation (a0 a+
i + a0 ai ) zu Grunde.
i
i
Beachten Sie, dass das Glied a0 a+
i die Vernichtung eines Quants im zentralen
und die Erzeugung eines anderen im i-ten Oszillator beschreibt; das hermitesch
konjugierte Glied a+
0 ai trägt dem umgekehrten Prozess Rechnung, der Verlagerung eines Quants aus der Umgebung in den zentralen Oszillator. Insgesamt
lautet damit der Hamiltonoperator
Abbildung 13.3
µ
¶ X
µ
¶ X
N
N
1
1
+
+
+
a
a
+
+
H = ~ω0 a+
a
+
~ω
~g(a0 a+
i
0
i
0
i
i + a0 ai ) . (13.62)
2
2
i=1
i=1
Die im Kopplungsglied auftretende Kopplungskonstante g hat die Dimension
einer Frequenz. In einem noch zu spezifizierenden Sinn sei g klein, die Kopplung
also schwach, damit die zu erwartenden Dissipationseffekte klein bleiben.
Der Anfangszustand des Systems sei der ungestörte Grundzustand u0 (xi ) für
alle N Oszillatoren der Umgebung“ und der erste ungestörte Anregungszustand
”
u1 (x0 ) des zentralen Oszillators. Die entsprechende Wellenfunktion lautet also
Φ(t = 0) = u1 (x0 )
N
Y
u0 (xi ) .
(13.63)
i=1
Im Fall verschwindender Kopplung, g = 0, wäre (13.63) ein Eigenzustand des
Hamiltonoperators (13.62). Der entsprechende Eigenwert der Energie läge um
das Energiequant“ ~ω0 über der Grundzustandsenergie
”
N
1X
~ων .
(13.64)
E0 =
2 ν=0
Bei nichtverschwindender Kopplung ist der Anfangszustand kein Eigenzustand
des Hamiltonoperators (13.62) mehr. Wegen
aν u0 (xν ) = 0, a+
ν u0 (xν ) = u1 (xν ) und aν u1 (xν ) = u0 (xν ) .
(13.65)
248
13 Harmonisch gebundene Quanten
gilt vielmehr
HΦ(t = 0) = (E0 + ~ω0 )Φ(t = 0) + ~g
N
N
X
u1 (xj ) Y
j=1
u0 (xj ) ν=0
u0 (xν ) .
(13.66)
Unter der Wirkung von H entsteht also aus Φ(t = 0) eine Linearkombination
von Wellenfunktionen, deren jede genau einen Oszillator als im ungestörten
ersten angeregten Zustand und alle anderen Oszillatoren als im ungestörten
Grundzustand befindlich beschreibt. Keine einzige dieser Wellenfunktionen ist
für sich Eigenfunktion zu H, da
Ã
!
Ã
!
u1 (xj ) Y
u1 (xj ) Y
H
u0 (xν ) = (E0 + ~ωj )
u0 (xν ) + ~gΦ(t = 0) .
u0 (xj ) ν
u0 (xj ) ν
(13.67)
Aus den beiden Beziehungen (13.66) und (13.67) folgt, dass sich die Schrödingergleichung des Gesamtsystems
i~Φ̇(t) = HΦ(t)
(13.68)
mit der Anfangsbedingung (13.64) lösen lässt durch den einfachen Ansatz
Φ(t) =
N
X
cν (t)
ν=0
N
u1 (xj ) Y
u0 (xµ ) .
u0 (xj ) µ=0
(13.69)
Hierin ist cν (t) die zu bestimmende Wahrscheinlichkeitsamplitude dafür, dass
der ν-te Oszillator zur Zeit t ein Energiequant ~ων enthält und alle anderen Oszillatoren im Grundzustand sitzen. Für die N + 1 Unbekannten cν (t) finden wir
aus der Schrödingergleichung (13.68) mit Hilfe von (13.66) und (13.67) folgende
Bewegungsgleichungen
ċ0 (t) = −i(ω0 + E0 /~)c0 (t) − ig
N
X
ci (t)
(13.70)
i=1
ċi (t) = −igc0 (t) − i(ωi + E0 /~)ci (t) .
(13.71)
Diese haben wir mit der Anfangsbedingung
c0 (0) = 1,
ci (0) = 0
(13.72)
zu lösen.
Die weitere Rechnung verläuft ganz ähnlich wie die in 2.13. Genießen Sie
den Vergleich! Da das Schicksal des zentralen Oszillators (die zu erwartende
Dämpfung, c0 (t → ∞) → 0) von besonderem Interesse ist, eliminieren wir
zunächst die ci (t), indem wir (13.71) formal integrieren,
ci (t) = ci (0) e−i(ωi +E0 /~)t − ig
| {z }
=0
Zt
0
0
dt0 e−i(ωi +E0 /~)t c0 (t − t0 ) ,
(13.73)
13.4 Die Umgebung belässt nur den Grundzustand stabil
249
und dieses Integral in (13.70) eintragen. Dabei entsteht für c0 (t) die Integrodifferentialgleichung
ċ0 (t) = −i(ω0 + E0 /~)c0 (t) − g
2
Zt
dt0
X
i
0
0
e−i(ωi +E0 /~)t c0 (t − t0 ) .
(13.74)
Um die Abweichung des Verhaltens von c0 (t) von der freien Schwingung (g = 0)
besonders sinnfällig zu machen, benutzen wir die Darstellung
ci (t) = e−i(ωi +E0 /~)t c̃0 (t)
(13.75)
und erhalten für die Amplitude c̃0 (t)
c̃˙0 (t) = −g 2
Zt
X
dt0
i
0
0
ei(ω0 −ωi )t c˜0 (t − t0 ) .
(13.76)
Offenbar bleibt c0 (t) bei verschwindender Kopplung zeitlich konstant. Versuchen wir, die bei schwacher Kopplung zu erwartende schwache Zeitabhängigkeit
durch den Exponentialansatz
c̃0 (t) = e−Γt−iδt
(13.77)
zu erfassen. Die reellen Parameter Γ und δ haben, falls der Ansatz die Bewegungsgleichung (13.76) befriedigt, die physikalische Bedeutung einer Dämpfungskonstanten bzw. einer Frequenzverschiebung.
Tragen wir den Ansatz
(13.77) in (13.76) ein, so erhalten wir die Kompatibilitätsbedingungen zur Bestimmung von Γ und δ
Γ + iδ = g 2
X e{Γ+i(ω0 +δ−ωi )}t − 1
.
{Γ + i(ω0 + δ − ωi )}
i
(13.78)
In niedrigster Ordnung in g (auf die wir uns im Grenzfall schwacher Kopplung beschränken dürfen) können wir auf der rechten Seite Γ und δ vernachlässigen. Ferner erlaubt uns die Annahme eines dichten Spektrums von Frequenzen
ωi die Ersetzung der Summe über die Umgebungsoszillatoren durch ein Frequenzintegral. Daraufhin verändert sich (13.78) zu
Γ + iδ = g
2
Z∞
dω ρ(ω)
0
ei(ω0 −ω)t − 1
i(ω0 − ω)
oder, nach Real- und Imaginärteil getrennt,
Γ=g
2
Z∞
0
δ = g2
Z∞
0
sin(ω0 − ω)t
ω0 − ω
(13.79)
1 − cos(ω0 − ω)t
.
ω0 − ω
(13.80)
dω ρ(ω)
dω ρ(ω)
250
13 Harmonisch gebundene Quanten
Die gewonnenen Ausdrücke für Γ und δ (und damit der Ansatz (13.77) sind
nur sinnvoll, wenn die rechts stehenden Integrale zeitunabhängig sind. Dies
ist für große Zeiten, t À ω0−1 , tatsächlich der Fall, wie wir uns schon in 2.13
überlegt hatten. Insbesondere gilt
lim
t→∞
sin(ω0 − ω)t
= πδ(ω − ω0 )
(ω0 − ω)
(13.81)
und somit
Γ = πg 2 ρ(ω0 ) .
(13.82)
Es nimmt also die Wahrscheinlichkeit dafür, den zentralen Oszillator im
ersten angeregten Zustand zu finden, zeitlich exponentiell ab,
|c0 (t)|2 = |e−i(ω0 +E0 /~)t e−Γt−iδτ |2 = e−2Γt .
(13.83)
Also kann 1/2Γ als Lebensdauer des Anfangszustandes interpretiert werden.
Nach Ablauf einiger dieser Zeiteinheiten 1/2Γ hat der zentrale Oszillator seine
anfängliche Anregungsenergie ~ω0 in die Umgebung emittiert.
Damit die Amplitude
c0 (t) = e−i(ω0 +δ+E0 /~)t−Γt
(13.84)
auf Grund der Wechselwirkung mit der Umgebung nur schwach vom ungestörten
Verhalten abweicht, müssen (beachten Sie, dass die Phase E0 /~ keine physikalische Bedeutung hat, da sie in allen cν (t) auftritt; sie kann durch Wahl des
Energienullpunktes zum Verschwinden gebracht werden) sowohl die Dämpfungskonstante Γ wie die Frequenzverschiebung δ klein gegenüber der ungestörten
Eigenfrequenz ω0 sein,
Γ, δ0 ¿ ω0 .
(13.85)
Dies ist die eingangs angekündigte Bedingung für die Schwäche der Kopplung.
Die soeben durchgeführte quantenmechanische Betrachtung der Dämpfung
ist von recht weitreichender Bedeutung. Eine unmittelbare Anwendung findet
sie auf die spontane Emission von infrarotem Licht durch anfänglich angeregt
schwingende Moleküle. Die Anwendbarkeit begründet sich darin, dass das elektromagnetische Strahlungsfeld als ein Haufen von Oszillatoren angesehen werden
kann. Von spontaner Emission spricht man dabei deshalb, weil das elektromagnetische Feld (die Umgebung) als anfänglich im Grundzustand befindlich angenommen ist und somit zunächst keine elektromagnetische Welle vorhanden ist,
die einen Übergang eines angeregt schwingenden Moleküls in den Grundzustand
induzieren könnte. Der durch kein äußeres Signal oder anfängliches elektromagnetisches Feld erzwungene, vielmehr spontane Übergang des Moleküls in den
Grundzustand der Schwingung manifestiert eine intrinsische Instabilität des angeregten Zustands auf Grund der Ankopplung der Freiheitsgrade des elektromagnetischen Feldes.
Mit nur geringen Modifikationen entsteht aus der dargelegten Rechnung die
berühmte Wigner-Weißkopf Theorie der spontanen Emission von Licht durch
angeregte Atome. In diesem Fall entspricht dem zentralen Oszillator das von
13.4 Die Umgebung belässt nur den Grundzustand stabil
251
einem angeregten Zustand in den Grundzustand springende und dabei strahlende Atom, während die Umgebungsoszillatoren durch die Gesamtheit der
monochromatischen Wellen des elektromagnetischen Feldes dargestellt werden.
Die Dämpfungskonstante (13.82) gibt dann die Linienbreite der zum atomaren
Übergang gehörenden Spektrallinie.
252
13 Harmonisch gebundene Quanten
Kapitel 14
Das Wasserstoffatom
14.1
Relativ- und Schwerpunktsbewegung
Im Wasserstoffatom bewegt sich ein Elektron der Ladung −e um ein Proton
der Ladung +e (e > 0). Wir haben es also mit einem Zweikörperproblem zu
tun, dessen Wellenfunktion von den sechs Ortskoordinaten ~xel = (xel , yel , zel )
und ~xp = (xp , yp , zp ) abhängt. Da die Wechselwirkung der beiden Teilchen
Coulombsch ist,
U = U (~xel − ~xp ) = −
1
e2
,
4πε0 |~xel − ~xp |
lautet die zu lösende Schrödingergleichung
¶
µ
1 2
1
e2
1 2
p~ +
p~ −
Φ,
i~Φ̇ = HΦ =
2mel el 2mp p 4πε0 |~xel − ~xp |
(14.1)
(14.2)
wobei
p~el =
~
~
∇el = (∂/∂xel , ∂/∂yel , ∂/∂zel )
i
i
p~p =
~
~
∇p = (∂/∂xp , ∂/∂yp , ∂/∂zp )
i
i
und
(14.3)
die Impulsoperatoren für das Elektron bzw. das Proton sind; mel und mp sind
die entsprechenden Massen.
Ganz ähnlich wie wir in Kapitel 3.4 das klassische Keplerproblem auf ein
Einkörperproblem zurückgeführt haben, können wir bei der vorstehenden quantenmechanischen Aufgabe vorgehen. Führen wir Relativ - und Schwerpunktskoordinaten ein, gemäß
~x = ~xel − ~xp
~ =
X
1
(mel ~xel + mp ~xp ) .
mel + mp
253
(14.4)
254
14 Das Wasserstoffatom
In diesen Koordinaten schreibt sich die Schrödingergleichung
·
µ 2
¶
~2
∂2
∂2
∂
i~Φ̇ = HΦ = −
+
+
2m ∂x2
∂y 2
∂z 2
µ
¸
¶
∂2
∂2
∂2
~2
1 e2
+
+
Φ
−
−
2M ∂X 2
∂Y 2
∂Z 2
4πε0 |~x|
(14.5)
mit
m=
mel mp
mel + mp
M = mel + mp
(14.6)
als reduzierter Masse und Gesamtmasse des Systems.
Da die Wechselwirkungsenergie nur von den Relativkoordinaten abhängt,
und da in der kinetischen Energie keine Produkte von Ableitungen nach Relativund Schwerpunktskoordinaten auftreten, lässt sich die Schrödingergleichung
(14.5) lösen durch den Ansatz,
~ t) = ψ(~x, t)Ψ(X,
~ t) .
Φ(~x, X,
(14.7)
~ t) ergeben sich aus (14.5) die
Für die Teilwellenfunktionen ψ(~x, t) und Ψ(X,
beiden voneinander völlig entkoppelten Schrödingergleichungen
·
¸
~2 2
1 e2
i~ψ̇(~x, t) = −
∇ −
ψ(~x, t) mit ∇2 = ∂ 2 /∂x2 + · · · (14.8)
2m
4πε0 |~x|
und
2
~ t)
~ t) = − ~ ∇2 Ψ(X,
i~Ψ̇(X,
2M
mit
∇2 = ∂ 2 /∂X 2 + · · ·
(14.9)
Letztere Gleichung ist uns wohlbekannt als die Schrödingergleichung eines
freien Teilchens der Masse M , während erstere die Bewegung eines Quants der
Masse m in einem Coulombfeld mit Zentrum bei ~x = 0 beschreibt. Die Unabhängigkeit der freien Schwerpunktsbewegung von der Relativbewegung ist
offenbar Ausdruck der Homogenität des Raumes, in welchem sich das Gesamtsystem befindet: die ursprüngliche Schrödingergleichung (14.2) zeichnet keinen
Punkt des Raumes aus; sie bleibt unverändert gegenüber der galileischen Koordinatentransformation ~x0 = ~x + d~ + ~v t.
14.2
Bewegung im Coulombfeld
Wegen der Isotropie des Coulombfeldes bezüglich des Zentrums ~x = 0 ist es
zweckmäßig, die Schrödingergleichung der Relativbewegung im Wasserstoffatom in Kugelkoordinaten zu behandeln. Die Transformation von diesen zu den
kartesischen Koordinaten lautet:
x = r cos ϕ sin θ,
y = r sin ϕ sin θ,
z = r cos θ
(14.10)
14.2 Bewegung im Coulombfeld
255
bzw. umgekehrt
r=
p
x2 + y 2 + z 2 ,
tan ϕ = y/x,
tan θ =
p
x2 + y 2 /z .
(14.11)
Die Ableitungen nach Kugel- und kartesischen Koordinaten sind verknüpft durch
die Kettenregel, also z. B. ∂/∂x = (∂r/∂x)∂/∂r+(∂ϕ/∂x)∂/∂ϕ+(∂θ/∂x)∂/∂θ.
Insgesamt gilt
∂
1
∂
1 sin ϕ ∂
∂
= sin θ cos ϕ
+ cos θ cos ϕ
−
∂x
∂r
r
∂θ
r sin θ ∂ϕ
∂
1
∂
1 cos ϕ ∂
∂
= sin θ sin ϕ
+ cos θ sin ϕ
+
∂y
∂r
r
∂θ
r sin θ ∂ϕ
∂
1
∂
∂
= cos θ
− sin θ
∂z
∂r
r
∂θ
sowie für den Laplaceoperator
∇2 =
1 ∂ 2 ∂
∂
∂2
1
∂
1
r
+
sin
θ
+
.
r2 ∂r ∂r r2 sin θ ∂θ
∂θ r2 sin2 θ ∂ϕ2
(14.12)
Somit schreibt sich die zu untersuchende Schrödingergleichung als
i~ψ̇(r, ϕ, θ, t) = Hψ(r, ϕ, θ, t)
(14.13)
¶
µ
1 ~2
1 e2
~2 ∂ 2 ∂
r
+
L
−
ψ(r, ϕ, θ, t)
= −
2mr2 ∂r ∂r 2mr2
4πε0 r
mit der Abkürzung
~ 2 = −~2
L
µ
1 ∂
∂
1 ∂2
sin θ
+
sin θ ∂θ
∂θ sin2 θ ∂ϕ2
¶
.
(14.14)
Der enorme gegenüber der Formulierung in kartesischen Koordinaten erreich~ 2 die Radialvariable r
te Vorteil ist nun offenbar. Da der Differentialoperator L
nicht enthält, muss die Lösung der Schrödingergleichung (14.13) mit Hilfe des
Produktansatzes
ψ = e−iEt/~ R(r)Y (θ, ϕ)
(14.15)
gelingen. Die winkelabhängige Amplitude Y (θ, ϕ) ist dabei als Eigenfunktion
~ 2 zu wählen gemäß
des Operators L
~ 2 Y (θ, ϕ) = ~2 l(l + 1) Y (θ, ϕ) ;
L
(14.16)
~2
die hier vorgenommene Benennung der noch zu suchenden Eigenwerte von L
ist Konventionssache. Für den Radialteil R(r) der Eigenfunktion (14.15) des
Hamiltonoperators ergibt sich schließlich die gewöhnliche Differentialgleichung
¶
µ
~2 d 2 d
~2 l(l + 1) ~ 2
1 e2
R,
(14.17)
ER = −
r
+
L
−
2mr2 dr dr
2mr2
4πε0 r
256
14 Das Wasserstoffatom
aus der auch die möglichen Energieeigenwerte E festzulegen sind.
Unsere in Kapitel 3 gewonnene Erfahrung mit dem klassischen Keplerproblem lässt uns erwarten, dass für negative Energien gebundene Zustände vorliegen, deren Normierungsintegral endlich ist
Z∞
0
dr r
2
Zπ
0
dθ sin θ
Z2π
0
dϕ |R(r)Y (θ, ϕ)|2 = hψ | ψi < ∞ .
(14.18)
Andererseits sollten Eigenfunktionen mit E ≥ 0 ungebundenen Streuzuständen
entsprechen, da auch klassische Teilchen mit E ≥ 0 durch die potenzielle Energie
U ∼ 1/r nicht an der Flucht in beliebige Entfernung vom Zentrum gehindert
werden.
Letztere Erwartung erfüllen wir uns sofort, indem wir die Eigenwertgleichung
(14.8) für große Abstände vom Zentrum betrachten. Nach Weglassen aller mit
r → ∞ abfallenden Glieder vereinfacht sich diese Gleichung zu
~2 d 2 R
+ ER = 0
2m dr2
(14.19)
und hat die Partikularlösungen
R = e±ir
√
2mE/~2
.
(14.20)
Wie erwartet, verhalten sich die Lösungen mit positiven Energien oszillatorisch,
fallen also nicht ab mit r → ∞; beliebig große Abstände r behalten eine endliche
Wahrscheinlichkeitsamplitude. Wie es für derartige Streuzustände typisch ist,
existiert das über den ganzen Raum erstreckte Normierungsintegral nicht.
Bei negativer Energie verhält sich eine der beiden asymptotischen Lösungen
exponentiell abfallend, entspricht also einem normierbaren gebundenen Zustand,
während die andere mit r → ∞ exponentiell wächst. Letztere würde keine Interpretation als Wahrscheinlichkeitsamplitude zulassen und darf nicht auftreten.
Das Verbot exponentiellen Anwachsens für r → ∞ ist eine Randbedingung für
die Eigenlösungen von (14.17), die sich, wie wir sehen werden, nur für diskrete
Werte der Energie im Intervall −∞ < E < 0 befriedigen lässt. Wie bei den
früher behandelten Quantensystemen sind also auch hier die diskreten Energieniveaus zu den gebundenen Zuständen durch Randbedingungen festgelegt.
14.3
Der Bahndrehimpuls∗)
Die oben konstatierte Separierbarkeit der Schrödingergleichung (14.13) in Kugelkoordinaten, d. h. die Lösbarkeit durch den Produktansatz (14.15), ist keineswegs zufällig, sondern eine Konsequenz der Winkelunabhängigkeit des Coulombpotentials. Beim klassischen Keplerproblem hatte die Isotropie bezüglich
des Zentrums, Sie erinnern sich, die zeitliche Erhaltung des Drehimpulses
~ = ~x × p~
L
(14.21)
∗) Der nicht an der Konstruktion der Drehimpulseigenwerte und -eigenfunktionen interessierte Leser möge direkt zum Ergebnis springen, das ab (14.71) dargestellt wird.
14.4 Kommutierende Operatoren haben gemeinsame Eigenfunktionen
257
zur Folge. Ich will hier begründen, dass der gleiche Erhaltungssatz in der Quantenmechanik gilt und sich in der genannten Separierbarkeit der Schrödingergleichung manifestiert.
~ = (Lx , Ly , Lz ) durch
Klassisch wie quantenmechanisch ist der Vektor L
~ wegen p~ = ~ ∇
(14.21) definiert. Auf ortsabhängige Wellenfunktionen wirkt L
i
als Differentialoperator. Seine Komponenten lauten
µ
¶
µ
¶
∂
∂
~
∂
∂
y
= i~ sin ϕ
Lx = ypz − zpy =
−z
+ cot θ cos ϕ
i
∂z
∂y
∂θ
∂ϕ
µ
¶
µ
¶
∂
∂
∂
∂
~
−x
+ cot θ sin ϕ
z
= i~ − cos ϕ
Ly = zpx − xpz =
i
∂x
∂z
∂θ
∂ϕ
µ
¶
∂
~
∂
~ ∂
−y
.
(14.22)
Lz = xpy − ypx =
x
=
i
∂y
∂z
i ∂ϕ
~ finden wir aus (14.22) zu
Das Quadrat des Vektors L
¶
µ
∂
1 ∂2
1 ∂
2
2
2
2
~
sin θ
+
L = Lx + Ly + Lz = −~
sin θ ∂θ
∂θ sin2 ∂ϕ2
(14.23)
und erkennen hierin die im letzten Paragrafen verwendete Abkürzung für den
winkelabhängigen Anteil des Hamiltonoperators
H=−
1 e2
1 ~2
~2 1 ∂ 2 ∂
r
−
+
L .
2
2m r ∂r ∂r 4πε0 r
2mr2
(14.24)
~ 2 die Radialkoordinate nicht enthält, vertauscht er mit
Da der Operator L
dem Hamiltonoperator,
~ 2] = 0 .
[H, L
(14.25)
Diese Vertauschbarkeit bliebe sogar erhalten, wenn das Coulombfeld e2 /r in
(14.24) durch ein beliebiges Zentralfeld U (r) ersetzt würde, hängt also nur an
der Isotropie bezüglich des Zentrums. Überzeugen wir uns nun davon, dass
das Verschwinden des Kommutators (14.25) einen Erhaltungssatz für das Quadrat des Drehimpulses darstellt. Dabei hilft der folgende kleine mathematische
Exkurs.
14.4
Kommutierende Operatoren haben gemeinsame Eigenfunktionen
Seien A und B zwei Operatoren. Damit ϕ eine gemeinsame Eigenfunktion ist,
muss gelten
Aϕ = aϕ,
Bϕ = bϕ ,
(14.26)
wobei a und b die respektiven Eigenwerte sind. Multiplizieren wir die erste
dieser Gleichungen mit B und die zweite mit A, so erhalten wir als Differenz
(AB − BA)ϕ = (ab − ba)ϕ = 0 .
(14.27)
258
14 Das Wasserstoffatom
Hieraus darf noch nicht geschlossen werden, dass A und B kommutieren. Wenn
jedoch alle Eigenfunktionen von A und B gemeinsame Eigenfunktionen sind,
also die Eigenschaft (14.27) haben, so folgt
[A, B] = 0 .
(14.28)
Die Argumentation kann auch umgekehrt geführt werden, d. h. das Verschwinden des Kommutators impliziert, dass A und B alle Eigenfunktionen gemeinsam
haben.
In etwas anschaulicherer Formulierung lautet die eben gewonnene Erkenntnis: Kommutierende Observable sind zugleich scharf messbar. Scharf ist eine
physikalische Größe (das ist eine Observable“) A bezüglich ihrer Eigenzustände.
”
Liegen nämlich Systeme im Zustand ϕ vor, der Eigenzustand von A mit Eigenwert a ist, so hat die Observable in diesen Systemen genau den Wert a; bei
Messung an im Zustand ϕ präparierten Systemen ergibt sich für die fragliche
Observable immer nur der Wert a. Wenn ϕ sogar Eigenzustand von zwei Observablen A und B ist, so ergeben Messungen an in ϕ präparierten Systemen
eben immer nur die respektiven Eigenwerte als Messwerte dieser Observablen.
Unscharf ist dagegen eine Observable A bezüglich jedes Zustandes, der nicht
einer ihrer Eigenzustände ist. Schauen wir etwa eine Linearkombination zweier
normierter Eigenzustände ϕ und ϕ0 von A mit Eigenwerten a und a0 an,
ψ = cϕ + c0 ϕ0
mit
|c|2 + |c0 |2 = 1 .
(14.29)
Dann sind |c|2 und |c0 |2 die Wahrscheinlichkeiten dafür, dass wir bei Messung
von A an Systemen mit der Wellenfunktion ψ den Wert a bzw. a0 finden.
Offenbar ist die Unschärfe von A bei Zuständen der Form (14.29) am größten
für |c|2 = |c0 |2 = 1/2.
Ein beliebtes, Ihnen aus der Experimentalphysik bekanntes Maß für die
Schärfe einer Observablen bezüglich einer Wellenfunktion ψ ist die so genannte
Streuung
¡
¢1/2
Str(A) = hψ | A2 ψi − hψ | Aψi2
.
(14.30)
Für hermitesche Operatoren ist die Streuung reell und nicht negativ, denn es
gilt mit A = A+ und hAi = hψ | Aψi = hAi∗
­
­
®
2
2 ®
{Str(A)} = ψ | (A − hAi) ψ = (A − hAi) ψ | (A − hAi) ψ ≥ 0 . (14.31)
Den kleinstmöglichen Wert Null kann die Streuung gemäß (14.31) übrigens nur
annehmen, wenn der nichtnegative Integrand im Integral h(A − hAi) ψ | (A − hAi) ψi
verschwindet, d. h. wenn
Aψ = hAiψ
(14.32)
gilt, also ψ eine Eigenfunktion von A ist.
Als Übung bleibt Ihnen, die Streuung von A bezüglich des Zustands (14.29)
auszurechnen. Sie finden leicht
2
{Str(A)} = |c|2 (1 − |c|2 )(a − a0 )2
(14.33)
und bestätigen hieraus, dass die Streuung für |c|2 = 1/2 maximal ist, während
sie für |c|2 = 0 und für |c|2 = 1 verschwindet.
14.5 Die Eigenwerte des Bahndrehimpulses
259
Jetzt können Sie verstehen, dass die Vertauschbarkeit eines Operators A (wie
~ 2 ) mit dem Hamiltonoperator, [H, A] = 0, der
des Bahndrehimpulsquadrats L
zeitlichen Erhaltung von A entspricht. Der zeitabhängige Zustand ψ(t) des fraglichen Systems lässt sich nämlich als Überlagerung von Energieeigenzuständen
ψn darstellen.
X
cn e−iEn t/~ ψn .
(14.34)
ψ(t) =
n
Der entsprechende Erwartungswert von A ergibt sich dann, da die ψn wegen
[H, A] = 0 auch Eigenzustände von A sind, zu
hAi(t) =
=
X
n,m
X
n
cn c∗m e−i(En −Em )t/~ an hψm | ψn i
|cn |2 an hψn | ψn i ,
(14.35)
d. h. als zeitunabhängig. Ebenso zeitunabhängig bleiben die Streuung von A
und die Erwartungswerte beliebiger Potenzen Aν .
Gleichermaßen einsehbar wird der Zusammenhang zwischen der Separierbarkeit der Schrödingergleichung (14.13) und der Erhaltung des Bahndrehimpulsquadrats für die Bewegung im Coulombfeld. Die Separierbarkeit von (14.13)
~ 2 gemeinsame Eigenfunktiodurch den Ansatz (14.15) bedeutet, dass H und L
~ 2 ist im Verschwinden des
nen haben. Dies und die zeitliche Erhaltung von L
2
~
Kommutators [H, L ] begründet. Vergessen Sie nicht den physikalischen Grund
~ 2 ] = 0, die Isotropie des Coulombpotentials.
für [H, L
14.5
Die Eigenwerte des Bahndrehimpulses
Anders als die Komponenten des Impulses p~ = ~i ∇ kommutieren die Kompo~ = ~x × p~ nicht untereinander. Vielmehr folgt
nenten des Bahndrehimpulses L
aus [pi , xj ] = ~i δij
[Lx , Ly ] = [ypz − zpy , zpx − xpz ] = [ypz , zpx ] + [zpy , xpz ]
= ypx [pz , z] + xpy [z, pz ] =
~
(ypx − xpy )
i
= i~Lz .
(14.36)
Ganz ähnlich finden Sie die anderen Kommutatoren. Insgesamt gilt
[Lx , Ly ] = i~Lz ;
[Ly , Lz ] = i~Lx ;
[Lz , Lx ] = i~Ly
(14.37)
Beachtenswert ist, dass sich alle diese Relationen aus einer derselben ergeben
durch zyklische Permutation der Vektorindizes. Diese Verwandtschaft besteht
nicht zufällig; sie entspricht der Gleichberechtigung der Benennungen der 1-, 2und 3-Achsen eines rechtssinnigen rechtwinkligen Dreibeins mit Koordinaten in
der Reihenfolge xyz, yzx und zxy.
Wir schließen aus den Vertauschungsregeln (14.37), dass verschiedene Komponenten des Drehimpulses nicht zugleich scharf sein können. Wohl aber kann
260
14 Das Wasserstoffatom
~ mit dem Quadrat des Drehimpulses zugleich scharf
jede Komponente von L
sein, denn es gilt
~ 2 ] = [Lx , L2y ] + [Lx , L2z ] = i~(Ly Lz + Lz Ly ) − i~(Lz Ly + Ly Lz ) = 0
[Lx , L
und insgesamt
~ 2 ] = [Ly , L
~ 2 ] = [Lz , L
~ 2] = 0 .
[Lx , L
(14.38)
~ 2 und, sagen wir,
Suchen wir also die gemeinsamen Eigenfunktionen von L
der z-Komponente Lz . Zweckmäßigerweise benutzen wir dabei Kugelkoordina~ allein durch die
ten, denn bezüglich dieser hatten wir in 14.3 die Operatoren L
Winkel θ und ϕ ausdrücken können. Demnach hängen auch die gesuchten Eigenfunktionen Y (θ, ϕ) nur von diesen Winkeln ab und nicht von der Radialkoordinate r. Allgemeinem Brauch entsprechend benennen wir die Eigenfunktionen
und Eigenwerte wie folgt
~ 2 Ylm (θ, ϕ) = ~2 l(l + 1)Ylm (θ, ϕ)
L
Lz Ylm (θ, ϕ) = ~mYlm (θ, ϕ) .
(14.39)
Die Eigenwerte ~2 l(l + 1) und ~m sind reell, denn alle Komponenten Li und
somit auch das Quadrat des Drehimpulses sind hermitesche Operatoren. Am
einfachsten sehen wir das am Ausdruck (14.22) für die z-Komponente
Lz =
~ ∂
.
i ∂ϕ
(14.40)
Im Skalarprodukt zweier Wellenfunktionen Φ(r, θ, ϕ) und Ψ(r, θ, ϕ) wirkt Lz wie
hΦ | Lz Ψi =
Z∞
=
Z∞
dr r
2
0
dr r
0
+
Z∞
0
2
Zπ
0
Z2π
Zπ
Z2π
dθ sin θ
dr r
~ ∂
Ψ(r, θ, ϕ)
i ∂ϕ
0
dθ sin θ
0
0
2
dϕ Φ∗ (r, θ, ϕ)
Zπ
0
dϕ
µ
~ ∂
Φ(r, θ, ϕ)
i ∂ϕ
¶∗
Ψ(r, θ, ϕ)
µ
~
Φ∗ (r, θ, 2π) Ψ(r, θ, 2π)
dθ sin θ
i
∗
− Φ (r, θ, 0) Ψ(r, θ, 0)
¶
.
(14.41)
Da als Wellenfunktionen nur solche Funktionen Φ und Ψ zugelassen sind, die
einem Raumpunkt ~x genau eine Wahrscheinlichkeitsdichte |Φ(~x)|2 bzw. |Ψ(~x)|2
zuweisen, haben in Kugelkoordinaten die erlaubten Wellenfunktionen entweder
alle die Periodizität
Φ(r, θ, ϕ) = Φ(r, θ, ϕ + 2π)
(14.42)
14.5 Die Eigenwerte des Bahndrehimpulses
261
oder alle die Eigenschaft†) Φ(r, θ, ϕ+2π) = −Φ(r, θ, ϕ). Jedenfalls verschwinden
die beiden Randterme in (14.41), und es folgt die Hermitezität von Lz ,
hΦ | Lz Ψi = hLz Φ | Ψi .
(14.43)
Da im vorliegenden Problem die z-Richtung nur durch ihren Namen vor der xund der y-Richtung ausgezeichnet ist, müssen auch Lx und Ly hermitesch sein.
~ 2.
Ohne Rechnung ergibt sich dann auch die Hermitezität von L
2
2
~
Die Eigenwerte von L und Lz , ~ l(l+1) bzw. ~m, sind nun als reell erkannt.
Vom Eigenwert ~2 l(l + 1) sehen wir überdies schnell, dass er nicht negativ sein
kann. Mit einer beliebigen Wellenfunktion Φ(~x) gilt nämlich wegen Li = L+
i
~ 2 Φi = hΦ | L2x Φi + hΦ | L2y Φi + hΦ | L2z Φi = hLx Φ | Lx Φi + · · · .
hΦ | L
(14.44)
~ 2 Φi für
Als Summe von Integralen über nichtnegative Integranden kann hΦ | L
keine Wahl von Φ negativ sein. Insbesondere auch nicht für Wellenfunktionen,
deren Winkelanteil eine Eigenfunktion Ylm (θ, ϕ) ist. Ohne Beschränkung der
Allgemeinheit kann also l als positiv angesehen werden.
Zur weiteren Festlegung der Eigenwerte l und m sowie der Eigenfunktionen
Ylm bedienen wir uns der Vertauschungsrelationen (14.37) und (14.38). Ihr
Verständnis der folgenden Argumentation wird sicher befördert, wenn Sie die
Analogie zu unserer Konstruktion der Energieeigenfunktionen des harmonischen
Oszillators in 12.1 betrachten.
Bequemlichkeitshalber führen wir zunächst die zueinander adjungierten Operatoren
½
¾
∂
∂
±iϕ
L± = Lx ± iLy = ~ e
±
(14.45)
+ i cot θ
∂θ
∂ϕ
ein, die sich als den Erzeugungs- und Vernichtungsoperatoren a+ bzw. a beim
Oszillator analog erweisen werden. Aus (14.37) und (14.38) ergeben sich für L±
die Vertauschungsrelationen
[Lz , L± ] = ±~L± ,
[L+ , L− ] = 2~Lz
und
~ 2 , L± ] = 0 .
[L
(14.46)
Ferner folgen aus (14.37) die Identitäten
~ 2 − Lz (Lz + ~)
L− L+ = L
~ 2 − Lz (Lz − ~),
L+ L− = L
(14.47)
die wir sofort ausschlachten. Offenbar kommutiert L− L+ ebenso wie L+ L− mit
~ 2 und Lz . Also haben beide Operatoren die Funktionen Ylm als EigenfunktioL
nen, u. z. gilt
£
¤
L− L+ Ylm = ~2 l(l + 1) − m(m + 1) Ylm = ~2 (l − m)(l + m + 1)Ylm (14.48)
†) Wir
werden im nächsten Paragrafen letzteren Fall als unphysikalisch ausschließen können.
262
14 Das Wasserstoffatom
und
£
¤
L+ L− Ylm = ~2 l(l + 1) − m(m − 1) Ylm = ~2 (l + m)(l − m + 1)Ylm . (14.49)
Die hier auftretenden Eigenwerte können nicht negativ sein, denn da L+ und
L− zueinander adjungiert sind, haben wir für eine beliebige Wellenfunktion
Φ(r, θ, m) die Ungleichungen hΦ | L− L+ Φi = hL+ Φ | L+ Φi ≥ 0 und hΦ | L+ L− Φi
= hL− Φ | L− Φi ≥ 0. Durch die Eigenschaften
(l − m)(l + m + 1) ≥ 0
und
(l + m)(l − m + 1) ≥ 0
(14.50)
sind die möglichen Werte von m bei festem l eingeschränkt auf den Bereich
−l ≤ m ≤ +l .
(14.51)
(Erinnern Sie sich an den harmonischen Oszillator? Wir hatten in 13.1 argumentiert, dass a+ a nichtnegative Eigenwerte hat, weil a und a+ zueinander
adjungiert sind.)
Nun überzeugen wir uns davon, dass mit Ylm auch L± Ylm Eigenfunktionen
~ 2 und Lz sind und zwar zu den respektiven Eigenwerten ~2 l(l + 1) und
von L
~(m ± 1). Dazu müssen wir nur die Kommutatoren (14.46) bemühen:
~ 2 L± Ylm = L± L
~ 2 Ylm = ~2 l(l + 1)L± Ylm
L
Lz L± Ylm = ±~L± Ylm + L± Lz Ylm = ~(m ± 1)L± Ylm .
(14.52)
Durch mehrfache Multiplikation mit L+ und L− entstehen weitere Eigenfunktionen,
Lz (L± )p Ylm = ~(m ± p)(L± )p Ylm
mit
p = 1, 2, 3, . . .
(14.53)
Beide so konstruierten Folgen müssen nach endlich vielen Gliedern abbrechen, damit der Eigenwert von Lz nicht das Intervall (14.51) verlässt. Beim
wiederholten Anwenden von L+ bzw. L− müssen schließlich Funktionen Yl,max
bzw. Yl,min entstehen mit den Eigenschaften
L+ Yl,max = 0
(14.54)
L− Yl,min = 0 .
(14.55)
und
Wenn wir (14.54) mit L− multiplizieren und (14.55) mit L+ , so sehen wir nach
Vergleich mit (14.48) bzw. (14.49), dass der größte Eigenwert von Lz durch
max = +l
(14.56)
min = −l
(14.57)
und der kleinste durch
gegeben ist.
14.6 Die Eigenfunktionen des Bahndrehimpulses
263
Über die möglichen Werte von l erhalten wir auch Aufschluss. Ausgehend
von Yl,−l muss nämlich in einer ganzen Zahl p von Schritten mit (L+ )p Yl,−l eine
Eigenfunktion von Lz mit dem größtmöglichen Eigenwert erreicht werden. Es
gilt offenbar −l + p = l oder p = 2l mit p = 1, 2, 3, . . .. Zunächst scheinen dabei
sowohl ganzzahlige wie halbzahlige Werte für l (und somit auch für m) erlaubt.
Der Fall halbzahliger Werte für l und m wird sich jedoch gleich als unphysikalisch erweisen. (Zwar existieren in der Natur auch halbzahlige Drehimpulse,
jedoch handelt es dabei nicht um Bahndrehimpulse, sondern um den noch zu
diskutierenden Spin von Fermiteilchen wie Elektron, Proton etc.)
14.6
Die Eigenfunktionen des Bahndrehimpulses
Die im letzten Paragrafen gewonnenen Eigenschaften der Eigenwerte l und m
sowie der Eigenfunktionen Ylm beruhen ganz auf den Vertauschungsrelationen
(14.37) und (14.38). Noch haben wir keinen Gebrauch davon gemacht, dass die
~ 2 Differentialoperatoren bezüglich der Winkel θ und ϕ sind. Letztere
Li und L
Tatsache machen wir uns jetzt zunutze, wenn wir die gesuchten Drehimpulseigenfunktionen Ylm (θ, ϕ) explizit konstruieren. Die ϕ-Abhängigkeit gewinnen
wir aus (14.39) und (14.40), d. h. aus
~ ∂
Ylm (θ, ϕ) = ~mYlm (θ, ϕ) ,
i ∂ϕ
(14.58)
Ylm (θ, ϕ) ∼ eimϕ .
(14.59)
sofort als
Die θ-Abhängigkeit besorgen wir uns zunächst für den Fall m = −l, d. h. für
~ 2 = ~2 l(l + 1) kleinstmögliche z-Komponente, Lz = −~l. Die
die bei festem L
Funktion Yl,−l = e−ilϕ fl (θ) gehorcht der Bedingung (14.55), also
¶
µ
µ
¶
∂
∂
∂
−ilϕ
−ilϕ
e
fl (θ) = e
−
−
+ i cot θ
+ l cot θ fl (θ) = 0 . (14.60)
∂θ
∂ϕ
∂θ
Als Lösung verifizieren Sie sofort fl (θ) = sinl θ. Insgesamt erhalten wir somit
Yl,−l (θ, ϕ) = cl e−ilϕ sinl θ ,
(14.61)
wobei cl eine durch Normierung festzulegende Integrationskonstante ist. Der
Betrag von cl ergibt sich aus
|cl |
2
Z2π
0
dϕ
Zπ
0
© ª
dθ sin θ sin2l θ = |cl |2 4π l!2l /(2l + 1)! = 1 .
Für die beliebige Phase von cl hat sich die Konvention cl /|cl | = (−1)l eingebürgert. Damit ist
p
(2l + 1)!
(14.62)
cl = (−1)l √
4π2l l!
264
14 Das Wasserstoffatom
bestimmt.
Schließlich finden wir gemäß (14.53) die Eigenfunktion Ylm (θ, ϕ) durch (l +
m)-malige Multiplikation von Yl,−l mit dem Operator L+ ,
· µ
¶¸l+m
∂
∂
e−ilϕ sinl θ .
(14.63)
Ylm (θ, ϕ) ∼ cl eiϕ
+ i cot
∂θ
∂ϕ
Jetzt endlich können wir halbzahlige Werte für l und m ausschließen, indem
wir nachrechnen, dass die explizit vorliegenden Eigenfunktionen für halbzahliges
l gar nicht die aus (14.54) folgende Bedingung
(L+ )2l+1 Yl,−l ∼ L+ Yl,l = 0
(14.64)
erfüllen. Die Rechnung verläuft am einfachsten im Fall l = 1/2:
µ
¶
∂
∂
1/2
2 −iϕ/2
iϕ
(L+ ) e
sin θ = L+ ~e
+ i cot
e−iϕ/2 sin1/2 θ
∂θ
∂ϕ
¶
µ
1
∂
iϕ/2
+ cot θ sin1/2 θ
= L+ ~e
∂θ 2
= L+ ~eiϕ/2 cos θ sin−1/2 θ
µ
¶
∂
∂
= ~2 eiϕ
eiϕ/2 cos θ sin−1/2 θ
+ i cot θ
∂θ
∂ϕ
µ
¶
∂
1
= ~2 ei3ϕ/2
− cot θ cos θ sin−1/2 θ
∂θ 2
= −~2 ei3ϕ/2 sin−3/2 θ 6= 0 .
Für größere halbzahlige Werte von l führt die entsprechende Rechnung auch
zum Widerspruch zu (14.64); sie vorzuführen, wäre ein unfreundlicher Akt, da
sie länglich ist. Zu mehr Freude werden wir gleich Anlass haben, wenn wir
die aus (14.63) bei halbzahligem l und m entstehenden Funktionen als nicht
normierbar erkennen.
Alle zulässigen Drehimpulseigenfunktionen Ylm (θ, ϕ) müssen normierbar sein
durch die Forderung
hYlm | Ylm i =
Zπ
0
dθ sin θ
Z2π
0
dϕ |Ylm (θ, ϕ)|2 = 1 ,
(14.65)
2
damit |Ylm | sin θ dθ dϕ als Wahrscheinlichkeitsverteilung für die Winkel θ und
ϕ interpretierbar ist. Für die halbzahligen Werte l = 3/2, 5/2, . . . führt (14.63)
jedoch zu divergierenden Normierungsintegralen. Am einfachsten sehen wir das,
wenn wir für derartige l die Yll (θ, ϕ) in der Nähe von θ = 0 betrachten, wo
sinl θ ≈ θ l und cot θ ≈ 1/θ gilt; es folgt für L+ Yl,−l
¶
µ
i ∂
∂
iϕ
e−i/ϕ θl ∼ 2le−i(l−1)ϕ θl−1
(14.66)
+
L+ Yl,−l ∼ e
∂θ θ ∂ϕ
und entsprechend
(L+ )2 Yl,−l ∼ 22 l(l − 1)e−i(l−2)ϕ θl−2
(14.67)
14.6 Die Eigenfunktionen des Bahndrehimpulses
265
und so weiter. Bei halbzahligem l entsteht schließlich in Yll , als führender Term
Yll ∼ (L+ )2 Yl,−l ∼ l(l − 1) . . . (−l + 1)(−l)eilϕ θ−l .
(14.68)
Im Skalarprodukt (14.65) verhält sich der Integrand in der Nähe von θ = 0 dann
wie θ −2l+1 , so dass das Integral für l = 3/2, 5/2 etc. jedenfalls divergiert. Bei
ganzzahligen Werten von l (und somit m) kann das eben beschriebene Unglück
nicht passieren. Beachten Sie, dass die rechte Seite in (14.68) für jedes ganze l
verschwindet.
Die in (14.63) angegebenen Ylm sind außer für m = −l noch nicht auf Eins
normiert. Um diese Normierung für alle m = −l, −l + 1, . . . , +l zu erreichen,
benutzen wir ein einfaches Rekursionsargument. Stellen wir uns vor, Ylm sei
schon so normiert und setzen an
Yl,m+1 = cm L+ Ylm .
(14.69)
Die Konstante cm wählen wir so, dass auch Yl,m+1 gemäß (14.65) normiert ist.
Für den Betrag von cm entsteht sofort die Forderung
1 = |cm |2 hL+ Ylm | L+ Ylm i
= |cm |2 hYlm | L− L+ Ylm i
= |cm |2 ~2 (l − m)(l + m + 1)hYlm | Ylm i
= |cm |2 ~2 (l − m)(l + m + 1) ,
wobei ich (14.48) benutzt habe. Die Phase von cm bleibt dabei offen; es ist
üblich, sie so festzusetzen, dass alle cm reell und positiv sind. Dann gilt
p
(14.70)
L+ Ylm = ~ (l − m)(l + m + 1)Yl,m+1
und (14.63) kann präzisiert werden zu
Ylm
s
p
(2l + 1)!
(l − m)!
= (−1) √
l
(l + m)!(2l)!
4π2 l!
· µ
¶¸l+m
∂
∂
· eiϕ
e−ilϕ sinl θ .
+ i cot θ
∂θ
∂ϕ
l
(14.71)
Die so bestimmten Ylm sind unter der Bezeichnung Kugelflächenfunktionen bekannt.
Geschafft! Die Argumentation war ärgerlich langwierig, das Resultat ist
aber einfach: Die Eigenwerte ~2 l(l + 1) des Drehimpulsquadrats sind durch die
natürlichen Zahlen
l = 0, 1, 2, . . .
(14.72)
festgelegt. Bei festem l, d. h. festem Drehimpulsquadrat, kann die z-Komponente
Lz die (2l + 1) verschiedenen Eigenwerte ~m mit
m = 0, ±1, ±2, . . . , ±l
(14.73)
266
14 Das Wasserstoffatom
annehmen.
Die ersten paar Kugelflächenfunktionen Ylm lauten
1
Y00 = √
4π
r
3
Y10 =
cos θ ,
4π
r
5
(3 cos2 θ − 1) ,
Y2,0 =
16π
r
15
sin2 θ e±2iϕ .
Y2,±2 =
32π
(14.74)
Y1,±1 = ±
Y2,±1 = ±
r
r
3 ±iϕ
e
sin θ ,
8π
15
sin θ cos θ e±iϕ ,
8π
Eine anschauliche graphische Darstellung ihrer θ-Abhängigkeit ergibt sich, wenn
wir auf einen Radialstrahl in Richtung θ bezüglich der z-Achse |Ylm |2 auftragen
(Abbildung 14.1):
Abbildung 14.1
14.7
Das Radialproblem beim Coulombfeld
Wir hatten uns klar gemacht, dass wir die Eigenfunktionen und Eigenwerte des
Hamiltonoperators
H=−
1 ~2
~2 1 ∂ 2 ∂
1 e2
r
+
L
−
2m r2 ∂r ∂r 2mr2
4πε0 r
(14.75)
14.7 Das Radialproblem beim Coulombfeld
267
durch den Produktansatz
Φ(r, θ, ϕ) = R(r)Ylm (θ, ϕ)
(14.76)
erhalten. Zu bestimmen bleibt der Radialteil R(r) der Wellenfunktion aus
µ 2
¶
2mE
d
2 d
l(l + 1)
1 2me2
R(r) = − 2 R(r) .
+
−
+
(14.77)
2
2
2
dr
r dr
r
4πε0 ~ r
~
Wir hatten ebenfalls gesehen, dass gebundene Zustände nur für negative Energien auftreten und für große r exponentiell abfallen
´
³ p
für
r→∞.
(14.78)
R(r) ∼ exp −r −2mE/~2
Die Differentialgleichung (14.77) verschönert sich, wenn wir statt r die dimensionslose Variable
p
ρ = 2r −2mE/~2
(14.79)
verwenden, zu
·
2 d
d2
+
+
2
dρ
ρ dρ
µ
λ l(l + 1) 1
−
−
ρ
ρ2
4
¶¸
R=0,
(14.80)
worin der zu bestimmende Energieeigenwert sich in dem dimensionslosen Parameter
λ=
1 e2 p
−m/2E
4πε0 ~
(14.81)
versteckt hat. Da nun das asymptotische Verhalten für ρ → ∞ durch R →
exp(−ρ/2) charakterisiert ist, liegt es nahe, die Amplitude R durch den Ansatz
R = f (ρ) e−ρ/2
zu suchen. Für f (ρ) entsteht aus (14.80) die Differentialgleichung
¶
·
¸
µ
λ − 1 l(l + 1)
2
− 1 f 0 (ρ) +
−
f (ρ) = 0 .
f 00 (ρ) +
ρ
ρ
ρ2
(14.82)
(14.83)
Wenn wir versuchen, diese Gleichung durch eine Potenzreihe zu befriedigen,
X
f (ρ) =
Cν ρν ,
(14.84)
ν
so finden wir die Koeffizienten Cν durch (14.83) der folgenden Rekursionsformel
unterworfen
Cν =
ν−λ
Cν−1 .
ν(ν + 1) − l(l + 1)
(14.85)
Eine Lösung, die zu einer normierbaren Amplitude R führt, ergibt sich durch
folgende Überlegung.
Ein Verschwinden des Nenners auf der rechten Seite ist ausgeschlossen für
Reihen (14.84), die nur Glieder mit ν > l enthalten, also mit dem Glied xl
268
14 Das Wasserstoffatom
beginnen. Im übrigen kann die Rekursionsformel (14.85) insofern Schrecken
einflößen, als sie sich für ν → ∞ vereinfacht zu Cν ≈ Cν−1 /ν; sie lässt also
eine Lösung zu, die sich für große ν wie Cν → 1/ν! verhält. Da die Glieder
hoher Ordnung in ν das Verhalten der Reihe (14.84) für großePρ dominieren,
ρν /ν! = e+ρ ;
verhält sich die entsprechende Reihe asymptotisch wie f (ρ) →
ν
ein solches f (ρ) führt nach (14.82) zu einer nicht normierbaren Amplitude R
und ist daher zu verwerfen.
Nichts Besseres dürfen wir erwarten! Nur für spezielle Werte der Energie E,
d. h. auch des Parameters λ können mit der Randbedingung der Normierbarkeit
verträgliche Lösungen R entstehen. In der Tat, genau wenn λ ganzzahlig ist
gemäß
λ = n = l + 1, l + 2, l + 3, . . .
(14.86)
erlaubt (14.85) die endliche Folge endlicher Koeffizienten
Cl , Cl+1 , . . . , Cn−1 ,
(14.87)
während Cn und somit auch alle Cν mit ν > n verschwinden. Die zugehörige
Radialamplitude
Rnl = e−ρ/2
n−1
X
cν ρν
(14.88)
ν=l
ist offensichtlich normierbar.
Das diskrete Spektrum der Energieeigenwerte ist durch (14.86) und (14.81)
gegeben als
Enl = −
µ
1
4πε0
¶2
me4 1
2~2 n2
(14.89)
mit n = l + 1, l + 2, . . . und l = 0, 1, 2, . . ..
Diese Energieniveaus sind in Abbildung 14.2 eingetragen. Die Darstellung
macht sinnfällig, dass zur festen Drehimpulsquantenzahl l die Folge Enl mit
den Hauptquantenzahlen n = l + 1, l + 2, . . . gehört, während bei festem n die
Drehimpulsquantenzahlen l = 0, 1, . . . , n − 1 möglich sind. Das Bild erinnert Sie
auch an die aus der Spektroskopie stammende Bezeichnung der l = 0, 1, 2, 3, . . .Zustände durch die Symbole s, p, d, f , . . ..
Die niedrigste Energie, die Grundzustandsenergie, ist
E10 = −
µ
1
4πε0
¶2
me4
≈ −13, 6 eV .
2~2
(14.90)
Um ein H-Atom aus dem Grundzustand heraus zu ionisieren, muss also mindestens eine Energie von 13, 6 eV aufgebracht werden. Beachten (und begründen)
Sie den hier zu Tage tretenden Unterschied zur klassischen Bewegung im Coulombfeld; dort ergibt sich die niedrigste Energie E = −∞, wenn das Teilchen
im Kraftzentrum ruht.
Alle Energieniveaus des H-Atoms außer dem Grundzustandsniveau sind entartet. Bei fester Hauptquantenzahl n hängt Enl nämlich gar nicht mehr von
14.7 Das Radialproblem beim Coulombfeld
269
Abbildung 14.2
der Drehimpulsquantenzahl l ab. Zudem kann bei festem n und l die Orien”
tierungsquantenzahl“ m noch die 2l + 1 verschiedenen Werte m = 0, ±1, . . . , ±l
annehmen. Die Tatsache, dass die Energieniveaus Enl von m unabhängig sind,
dass also alle Werte der z-Komponente des Drehimpulses energetisch gleichberechtigt sind, ist natürlich Ausdruck der Isotropie des Coulombpotentials.
Die Zahl der unabhängigen Energieeigenfunktionen, die zum selben Eigenwert der Energie gehören, heißt Entartungsgrad des entsprechenden Niveaus.
Da die Energiewerte zu den Wasserstoffeigenfunktionen
Rnl (r)Ylm (θ, ϕ)
(14.91)
nur von der Hauptquantenzahl n abhängen, hat jedes dieser Niveaus den Entartungsgrad
n−1
X
(2l + 1) = n2 .
(14.92)
l=0
Unsere Resultate für die Energieeigenfunktionen des H-Atoms erlauben uns,
nach der Größe des Wasserstoffatoms zu fragen. Nach (14.79), (14.92) und
(14.89) fällt die Aufenthaltswahrscheinlichkeit |Rnl |2 als Funktion von der Radialkoordinate exponentiell ab auf dem Längenmaßstab
anl =
p
4πε0 ~2
~2 /2m(−Enl ) =
n.
me2
(14.93)
Diese Abklinglängen sind ganze Vielfache des so genannten Bohrschen Radius
a = 4πε0 ~2 /me2 ≈ 0, 5 × 10−10 m = 0, 5 Å .
(14.94)
Der Durchmesser“ eines H-Atoms im Grundzustand hat also die Größenord”
nung eines Angströms.
270
14 Das Wasserstoffatom
Die ersten paar Radialamplituden des H-Atoms lauten, nach Normierung
gemäß
Z∞
0
dr r 2 |Rnl |2 = 1 ,
(14.95)
R10 = 2a−3/2 e−r/a
³
r ´ −r/2a
e
R20 = (2a)−3/2 2 −
a
r
R21 = 3−1/2 (2a)−3/2 e−r/2a
a
¶
µ
r2
r
−4
−l/2 −5/2
R30 = 3 · 3
a
54 − 36 + 4 2 e−r/3a
a
a
³
´
r
r
R31 = 3−4 · 6−1/2 a−5/2 4
6−
e−r/3a
a
a
R32 = 3−4 · 30−1/2 a−5/2 4
(14.96)
r2 −r/3a
e
.
a2
Die zu verschwindendem Bahndrehimpuls l = 0 gehörigen unter ihnen sind in
Abbildung 14.3 aufgezeichnet.
Abbildung 14.3
14.8
Auswahlregeln
Sie erinnern sich: Stabil, d. h. beliebig langlebig kann nur der Grundzustand
eines Systems sein. Das Wasserstoffatom macht keine Ausnahme. Selbst wenn
keine anderen Atome bei Stößen und auch kein von außen eingestrahltes elektromagnetisches Feld einem anfänglich angeregten H-Atom die Anregungsenergie
abnehmen, wird der angeregte Zustand i. A. nicht beliebig lange erhalten bleiben; vielmehr wird das Atom i. A. unter Aussendung eines Lichtquants spontan
in den Grundzustand zurückkehren.
Die anfängliche atomare Anregungsenergie ∆E wird nach der Emission als
14.8 Die Auswahlregeln
271
Energie des Photons auftreten. Entsprechend
∆E = ~ω
(14.97)
gehört zu jeder Energiedifferenz ∆E zweier Niveaus eine charakteristische Frequenz ω. Sie wissen, dass diese Erklärung der Spektrallinien des H-Atoms einer
der ersten großen Triumphe der Quantentheorie war.
Nicht zu allen Paaren von Energieniveaus Enl , En0 l0 des Wasserstoffatoms
werden Spektrallinien beobachtet. Erlaubt“, d. h. unter Laborbedingungen
”
im infraroten bis ultravioletten Spektralbereich leicht beobachtbar sind nur
Übergänge zwischen Zuständen Rnl Ylm und Rn0 l0 Yl0 m0 , bei denen sich die Bahndrehimpulsquantenzahl l und die Orientierungsquantenzahl m ändern gemäß
den Auswahlregeln
∆l = ±1
und
∆m = 0 oder ± 1 .
(14.98)
Ich kann die Auswahlregeln hier nicht durch eine Rechnung begründen und
auch nicht klarmachen, dass die entsprechenden Übergänge zu elektrischer Dipolstrahlung führen. Wohl aber will ich bemerken, dass in den Auswahlregeln
(14.98) u. a. die Tatsache zum Ausdruck kommt, dass das abgestrahlte Photon
einen Eigendrehimpuls, Spin genannt, der Größe J~2 = ~2 j(j + 1) mit j = 1
hat. Wie jeder quantenmechanische Drehimpuls kann die z-Komponente J z des
Photonenspins nur die Werte (in Einheiten ~) −j, . . . , +j, d. h. −1, 0, +1 annehmen‡) . Der Gesamtdrehimpuls von Atom und elektromagnetischem Feld bleibt
stets erhalten. Es muss sich bei der Emission eines Photons der Drehimpuls des
Atoms genau um den Betrag ändern, den das abgestrahlte Photon fortträgt.
Neben der gerade besprochenen Isotropie des Raums kommt in den Auswahlregeln noch eine weitere Symmetrie der Wechselwirkung zwischen geladenen Teilchen und dem elektromagnetischen Feld zum Ausdruck. Es handelt
sich um die so genannte Paritätsinvarianz, die Sie sich wohl besser unter der
Bezeichnung Spiegelsymmetrie merken. Sie besagt, dass zu jedem in der Natur vorkommenden elektromagnetischen Strahlungsprozess auch der räumlich
gespiegelte Prozess auftritt.
Diese Spiegelsymmetrie gilt übrigens auch für die Gravitation. Überzeugen
Sie sich davon, dass z. B. die Newtonschen Bewegungsgleichungen (10.5) für
einen Haufen gravitierender Teilchen invariant sind unter der Ersetzung jedes
Ortsvektors ~xν durch −~xν . Verfallen Sie aber nicht dem Irrglauben, die bei
Gravitation und Elektromagnetismus gegebene Spiegelsymmetrie sei eine selbstverständliche Eigenschaft der Natur. Beim β-Zerfall, also bei der schwachen
Wechselwirkung, gilt die Spiegelsymmetrie nicht.
Da ich nicht vorrechne, dass die Auswahlregeln (14.98) aus der Erfahrungstatsache folgen, dass die elektromagnetischen Wechselwirkung weder eine Raumrichtung auszeichnet, noch die Welt von ihrem Spiegelbild zu unterscheiden gestattet, kann ich ebenfalls nur berichten die Präzisierung, dass die Auswahlregeln (14.98) nur für die elektrische Dipolstrahlung gelten. In Spektralbereichen,
in denen die Wellenlänge nicht sehr groß ist gegen den Atomdurchmesser, wird
elektrische und magnetische Multipolstrahlung wichtig, für die andere Auswahlregeln gelten. Die Verletzung der Auswahlregeln (14.98) in solchen Prozessen
‡) Mit Hilfe der Eichinvarianz der Elektrodynamik lässt sich zeigen, dass dem Photon der
Eigenwert Jz = 0 verboten ist.
272
14 Das Wasserstoffatom
bedeutet übrigens nicht eine Verletzung der Isotropie und der Paritätsinvarianz
der elektromagnetischen Wechselwirkung. Vielmehr macht sich bemerkbar, dass
das abgestrahlte Photon dem Atom Drehimpuls entziehen kann sowohl vermöge
seines Spins als auch in Form von Bahndrehimpuls.
14.9
Verwandte Zweikörpersysteme
Ohne neue Rechnung können wir die für das H-Atom gewonnenen Resultate auf
mehrere andere Systeme übertragen.
Deuterium und Tritium unterscheiden sich vom Wasserstoff dadurch, dass
die Atomkerne außer einem Proton zusätzlich ein bzw. zwei Neutronen enthalten. Die respektiven Kernmassen mD und mT sind etwa doppelt bzw. dreimal
so groß wie die des H-Atoms. Die Kernmassen gehen in die Energieniveaus E nl
nur über die reduzierte Masse der Relativbewegung ein. Wegen der Linearität
der Energieniveaus (14.89) in m beträgt die relative Isotopenverschiebung der
Energieniveaus
¯
¯
¯ δEnl ¯ δm
¯
¯
(14.99)
¯ Enl ¯ = m ,
wobei δm die Änderung der reduzierten Masse von einem Isotop des Wasserstoffs
zum anderen darstellt. Die Verschiebung (14.99) ist zwar klein (. 10−3 ), aber
durchaus nachweisbar.
Beim einfach ionisierten Helium oder doppelt ionisierten Lithium liegt auch
die Isotopenverschiebung (14.99) vor. Eine gewichtigere Änderung des Energieniveauschemas rührt jedoch von der Erhöhung der Kernladung um den Faktor
Z = 2 bzw. Z = 3 her. Die Energieniveaus (14.89) sinken dementsprechend
tiefer, u. z. gemäß e2 → Ze2 auf
Enl = −
1 Z 2 me4 1
.
4πε0 2~2 n2
(14.100)
Offenbar ist das Elektron umso stärker gebunden, je größer die Kernladungszahl
Z ist.
Die Spektren der neutralen Alkaliatome Li, Na, K, Rb, Cs, Fr weisen eine gewisse Ähnlichkeit zum Wasserstoffspektrum auf. Der Grund dafür ist,
dass in diesen Atomen ein Elektron, das so genannte Leuchtelektron, sehr viel
schwächer gebunden ist als alle anderen; dem Leuchtelektron erscheint der Rest
des Atoms dann als eine (fast) starre, kugelsymmetrische und einfach positiv
geladene Einheit.
Gewisse Anregungszustände in Halbleitern, die so genannten Exzitonen, zeigen Energieniveaus mit wasserstoffähnlicher Anordnung. Eine einfache Modellvorstellung für das Exziton besagt, dass ein aus seinem Normalzustand gehobenes Elektron an seinem ursprünglichen Ort ein effektiv positiv geladenes Loch“
”
hinterlässt. Sowohl das Loch wie das Elektron sind im Halbleiter beweglich. Beiden kann eine effektive Masse zugeschrieben werden, die allerdings von einem
Halbleiter zum anderen verschieden ist und oft stark von der Masse des freien
Elektrons abweicht. Wasserstoffähnliche Bindungszustände der beiden Teil”
chen“ entstehen, wenn ihre Wechselwirkung von der Coulombschen Anziehung
dominiert wird. Das Exziton ist übrigens nicht stabil. Nach einer mittleren Lebensdauer, die von Halbleiter zu Halbleiter verschieden ist, kehrt das Elektron
14.9 Verwandte Zweikörpersysteme
273
in seinen Normalzustand zurück. Dabei füllt es das von ihm selbst gerissene
Loch, woraufhin das Exziton vernichtet ist. Die Anregungsenergie geht dabei
i. A. in Licht oder/und Schall über.
Für die Elementarteilchenphysik von hervorragendem Interesse ist das Positronium, in dem ein Elektron und ein Positron aneinander gebunden sind.
Das Positron ist bis auf das Vorzeichen seiner elektrischen Ladung mit dem
Elektron identisch und wird daher auch als das Antiteilchen des Elektrons bezeichnet. Das Positronium kann daher als eine leichtere Version des H-Atoms
angesehen werden. Verschieden ist allerdings die reduzierte Masse der beiden
Zweikörpersysteme. Beim Positronium beträgt sie
m=
mel · mel
1
= mel ,
mel + mel
2
(14.101)
ist also nur etwa halb so groß wie beim Wasserstoff. Gemäß (14.94) hat das
Positronium eine gegenüber dem H-Atom verdoppelte Ausdehnung, während
die Energieniveaus ihre Beträge um den Faktor 1/2 verkleinern.
Um zu prüfen, ob eine nichtrelativistische Behandlung des Positroniums
möglich ist, schätzen wir die Geschwindigkeit der Relativbewegung mit der
Unschärferelation ab. Die räumliche Lokalisierung auf apos = 2aH bedingt eine
Impulsunschärfe ∆p ≈ ~/2aH ; nach Division durch die reduzierte Masse mpos ≈
1
2 mH ergibt sich die Geschwindigkeitsunschärfe ∆v ≈ ~/mpos apos ≈ ~/mH aH .
Genau wie beim H-Atom beträgt die typische Geschwindigkeit also einige tausend km/s, so dass die nichtrelativistische Behandlung im einen wie im anderen
Fall gerade noch angemessen erscheint.
Tatsächlich sind sowohl beim H-Atom wie beim Positronium relativistische
Effekte trotz ihrer Kleinheit durchaus messbar. Einige dieser Effekte hängen damit zusammen, dass das Elektron, das Proton und das Positron außer den drei
klassischen Freiheitsgraden, die den Ort eines Teilchens festlegen, noch einen
zusätzlichen inneren Freiheitsgrad, den Spin, haben. Über diesen Spin wird
später noch zu reden sein. Hier will ich eine andere und drastischere relativistische Eigenschaft des Positroniums erwähnen, seine Instabilität. Einige 10−6 s
nach der Erzeugung ist kaum ein Positronium mehr intakt. Die Bestandteile,
das Elektron und das Positron, vernichten sich gegenseitig und hinterlassen als
Spur z. B. elektromagnetische Wellen. Da die Ruheenergie mel c2 des Elektrons
und des Positrons je etwa 0, 5 MeV beträgt, tragen die beim Zerstrahlen des
Positroniums in elektromagnetische Wellen entstehenden Photonen zusammen
eine Energie von mindestens 1 MeV. Derart energiereiche Photonen sind Sie
gewohnt, γ-Quanten zu nennen.
Die derzeit meistdiskutierten wasserstoffähnlichen Zweikörpersysteme sind
zwei kürzlich entdeckte Mesonen, das Charmonium (auch ψ-Meson oder J genannt, 1974 entdeckt) und das Bottomium (auch Y-Meson genannt, 1977 entdeckt). Viele Eigenschaften dieser Mesonen können erklärt werden durch die
Annahme, dass beide aus je zwei Teilchen, so genannten Quarks, zusammengesetzt sind.
Insbesondere stellt man sich unter dem Charmonium einen Bindungszustand
des so genannten charmanten Quarks c und seines Antiteilchens c̄ vor. Beide
Teilchen sind elektrisch geladen, u. z. betragen die Ladungen in Einheiten der
Elektronenladung
ec = −2/3
und
ec̄ = +2/3 .
(14.102)
274
14 Das Wasserstoffatom
Die respektiven Massen sind nicht genau bekannt; indirekte Schlüsse legen jedoch nahe, dass das charmante Quark mehr als doppelt so schwer ist wie ein
Proton
mc c2 = mc̄ c2 ≈ 2 GeV
(14.103)
(wobei c2 = Quadrat der Lichtgeschwindigkeit). Sehr genau bekannt ist die
Masse des Charmoniums,
m2ψ = 3, 097 GeV .
(14.104)
Beachten Sie, dass das Charmonium deutlich leichter ist als zwei charmante
Quarks. Der Massendefekt mψ − 2mc gibt bis auf den Faktor c2 die Bindungsenergie des ψ-Mesons. (Derartige Massendefekte sind ihnen aus der Kernphysik
bekannt; die Masse des α-Teilchens ist kleiner als die Gesamtmasse je zweier
freien Protonen und Neutronen; Sie erinnern sich, dass sich im Massendefekt
die Einsteinsche Äquivalenz von Masse und Energie zeigt?)
Die Verwandtschaft des ψ-Mesons mit dem Wasserstoffatom (für das YMeson gilt Ähnliches) besteht darin, dass die Bindung des charmanten Quarks
c an sein Antiteilchen c̄ nichtrelativistisch, also durch Lösung einer Schrödingergleichung behandelt werden kann. Die in Rechnung zu stellende Wechselwirkungsenergie V (~xc , ~xc̄ ) ist zwar nicht genau bekannt, jedoch stellt sich heraus,
dass
V (~xc , ~xc̄ ) = V (r) = −
α
+ βr,
r
r = |~xc − ~xc̄ |
(14.105)
die beobachteten Anregungsenergien des Charmoniums für geeignete Wahlen
der positiven Parameter α und β vernünftig wiedergibt. Der erste Term in V ,
−α/r, enthält zwar die elektrostatische Anziehung der beiden Quarks; jedoch
stellt diese nur eine völlig unerhebliche Korrektur an der starken Wechselwirkung
dar, die den überwältigenden Beitrag zum Parameter α macht. Der zweite
Term in V , βr, bringt den experimentellen Befund zum Ausdruck, dass Quarks
bisher trotz angestrengter Suche nie als freie Teilchen beobachtet worden sind.
Möglicherweise können Quarks gar nicht isoliert existieren. Jedenfalls verbietet
der mit dem Abstand r unbegrenzt wachsende Anteil des Potentials (14.105),
dass das fragliche Zweikörpersystem sich in seine beiden Bestandteile auflöst.
Dass das ψ-Meson tatsächlich ein nichtrelativistischer Bindungszustand sein
sollte, können wir uns durch die folgende Größenordnungsabschätzung für die
Geschwindigkeit der Relativbewegung der beiden Quarks klarmachen. Die Lineardimension des Charmoniums sollte wie die aller stark wechselwirkenden
beobachtbaren Teilchen (Proton, Neutron, andere Mesonen . . . ) die Größenordnung aψ ≈ 10−13 cm haben. Die Unschärferelation gibt dann als einen typischen
Impuls pψ ≈ ~/aψ . Mit der Masse mψ aus (14.104) erhalten wir als typische
Geschwindigkeit
vψ /c ≈
~c
. 0, 1 ,
amψ c2
(14.106)
also einen Wert, der die nichtrelativistische Behandlung der Relativbewegung
der beiden Quarks gerade noch als nicht unsinnig erscheinen lässt.
Kapitel 15
Der Einfluss
elektromagnetischer Felder
auf die Quantenmechanik
geladener Teilchen
15.1
Die Schrödingergleichung
Für den Moment ohne Begründung, jedoch mit dem Versprechen, diese bald
nachzuholen, stelle ich Ihnen hier die Schrödingergleichung eines Teilchens mit
der Masse m und der Ladung q bei Anwesenheit eines beliebigen elektromagnetischen Feldes vor,
i~ψ̇(~x, t) = Hψ(~x, t)
´2
1 ³
~ x, t) + qϕ(~x, t) .
p~ − q A(~
H=
2m
(15.1)
(15.2)
~ und ϕ das Vektorpotential bzw. das skalare Potential, die das
Dabei sind A
~ und das Magnetfeld B
~ festlegen gemäß
elektrische Feld E
~ − grad ϕ
~ =−∂A
E
∂t
~ = rot A
~.
B
(15.3)
Der Teilchenimpuls p~ ist wie bisher mit dem Differentialoperator p~ = (~/i)∇ zu
identifizieren.
Einen wichtigen Spezialfall haben wir im letzten Kapitel besprochen. Das
elektrostatische Feld eines Atomkerns der Ladung e kann beschrieben werden
durch
~ = 0,
A
ϕ=
1 e
.
4πε0 r
(15.4)
Für q = −e mit e = Elementarladung entsteht dann aus (15.3) der Hamiltonoperator für die Bewegung des Elektrons im Wasserstoffatom.
275
276
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
Im Folgenden werden wir uns mit dem Einfluss eines räumlich und zeitlich
~ auf die Teilchenbewegung beschäftigen. Ein solches
konstanten Magnetfeldes B
Feld kann durch das Vektorpotential
~ × ~x
~ = 1B
A
2
(15.5)
festgelegt werden, wie Sie mit Hilfe von (15.3) leicht nachrechnen. Für diesen
Fall lässt sich der Hamiltonoperator (15.2) in einer physikalisch durchsichtigeren
Form aufschreiben. Beachten wir zu diesem Zweck, dass für das Vektorpotential
(15.5) gilt
1 ∂(By z − Bz y)
∂Ax
=
= 0,
∂x
2
∂x
∂Ay
∂Az
=
=0.
∂y
∂z
(15.6)
Es folgt, dass beim Ausmultiplizieren des Quadrats in (15.2) die Operatorpro~ · p~ und p~ · A
~ gleichgesetzt werden können,
dukte A
¶
µ
µ
¶
~ = ~ ∂ Ax + ∂ Ay + ∂ Az = ~ ∂Ax + · · ·
p~ · A
i ∂x
∂y
∂z
i
∂x
µ
¶
∂
~
~ · p~ .
Ax
+
+ ··· = A
(15.7)
i
∂x
Somit entsteht
H=
q2 ~ 2
q ~
p~2
+ qϕ − A
· p~ +
A .
2m
m
2m
(15.8)
~
Mit Hilfe der zyklischen Invarianz des Spatprodukts, (B × ~x)~
p = (~x × p~) · B,
erhalten wir schließlich
H=
´2
p~2
q ~ ~
q2 ³ ~
+ qϕ −
L·B+
B × ~x
.
2m
2m
8m
(15.9)
q ~
L.
2m
(15.10)
~ enthaltende Term in (15.9) erlaubt eine anschauDer den Bahndrehimpuls L
liche Deutung. Aus der klassischen Elektrodynamik (siehe 5. (5.64)) ist uns der
~ und dem magnetischen Moment
Zusammenhang zwischen dem Drehimpuls L
m
~ eines Ladungshaufens mit Masse m und Ladung q bekannt,
m
~ =
~ klassisch die Einstellenergie eines magnetischen
Ferner wissen wir, dass −m
~ ·B
~ angibt. Im quantenmechanischen
Moments m
~ im konstanten Magnetfeld B
~
~ Operatoren, jedoch bleibt der
Kontext werden zwarL und somit m
~ wie −m
~ ·B
~ des Hamilfrühere Zusammenhang (15.10) erhalten, und der Anteil −m
~ ·B
tonoperators bringt nach wie vor zum Ausdruck, dass die Parallelstellung des
magnetischen Moments zum konstanten Magnetfeld energetisch bevorzugt ist
~
gegenüber allen anderen Orientierungen von m
~ zu B.
Übrigens sind in vielen Experimenten mit Atomen in Magnetfeldern die Ma~ quadratische Effekte nicht beobachtet werden
gnetfelder so klein, dass in B
können. In solchen Fällen kann der letzte Term im Hamiltonoperator (15.9)
15.2 Die klassische Hamiltonfunktion
277
vernachlässigt werden. Machen Sie sich den Spaß, die Größenordnung des Magnetfeldes auszurechnen, für welche der letzte Term in (15.9) vergleichbar wird
~ ·B
~
mit der Einstellenergie (q/2mc)L
Vor der Diskussion von Anwendungen will ich nun, wie versprochen, begründen, dass die Wechselwirkung von Ladungen mit elektromagnetischen Feldern durch den Hamiltonoperator (15.2) richtig beschrieben wird. Ein Exkurs
in die klassische Physik wird dabei helfen.
15.2
Die klassische Hamiltonfunktion
Ein klassisches Teilchen, das sich in einer Raumdimension bewegt und am Ort
x die potenzielle Energie U (x) hat, gehorcht der Newtonschen Bewegungsgleichung
mẍ = −
dU (x)
.
dx
(15.11)
Diese Differentialgleichung zweiter Ordnung in der Zeit lässt sich ersetzen durch
zwei Differentialgleichungen erster Ordnung für die Ortskoordinate x und den
Impuls p, nämlich
ẋ =
1
p,
m
ṗ = −
dU
.
dx
(15.12)
Wir verschönern nun das Aussehen der letzteren Gleichungen, wenn wir in der
2
Energie E = m
2 ẋ + U (x) = E(ẋ, x) des Teilchens die Geschwindigkeit zu Gunsten des Impulses eliminieren,
E(ẋ, x) → H(p, x) =
1 2
p + U (x) .
2m
(15.13)
Die so gewonnene Hamiltonfunktion H(p, x) hat offenbar die partiellen Ableitungen ∂H/∂x = dU/dx und ∂H/∂p = p/m und erlaubt daher, die Bewegungsgleichungen (15.12) in der Form
ẋ =
∂H
,
∂p
ṗ = −
∂H
∂x
(15.14)
zu schreiben. Dies sind die so genannten Hamiltonschen Gleichungen.
Für ein Teilchen, das sich in drei Raumdimensionen bewegen kann und die
potenzielle Energie U (~x) hat, lautet die Hamiltonfunktion offensichtlich
H=
1 2
p~ + U (~x) ,
2m
(15.15)
während die Hamiltonschen Gleichungen (15.14) sich verallgemeinern zu
ẋi =
∂H
,
∂pi
p˙i = −
∂H
.
∂xi
(15.16)
Beachten Sie, dass der Übergang zur Quantenmechanik nun formal dadurch vollzogen werden kann, dass der klassische Impuls p~ in der Hamiltonfunktion durch
den Differentialoperator (~/i)∇ ersetzt wird; die Hamiltonfunktion verwandelt
sich dabei in den uns längst bekannten Hamiltonoperator.
278
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
Wenden wir uns nun einem klassischen geladenen Teilchen im elektromagnetischen Feld zu. Es erfährt dort die Lorentzkraft
´
³
~ + ~v × B
~ .
(15.17)
F~ = q E
Zur Vorbereitung des Übergangs zur Quantenmechanik suchen wir zunächst eine
Hamiltonfunktion H(~
p, ~x, t), die die Newtonsche Bewegungsgleichung
´
³
¨=q E
~ + ~v × B
~
(15.18)
m~x
als Hamiltonsche Gleichungen der Form (15.16) zu schreiben erlaubt. Da die
Lorentzkraft (15.17) sich i. A. nicht als Gradient eines skalaren Feldes schreiben
lässt (das geht nur im rein elektrostatischen Feld), kann die gesuchte Hamiltonfunktion nicht die Form (15.15) haben. Wir können jedoch leicht verifizieren,
dass
H=
1
~ 2 + qϕ
(~
p − q A)
2m
(15.19)
die gestellte Aufgabe löst, wenn das elektrische und das magnetische Feld wie
~ und ϕ festgelegt werden als
üblich durch die Potentiale A
~
~ = −∇ϕ − ∂ A
E
∂t
(15.20)
~ = rot A
~.
B
(15.21)
Die zu (15.19) gehörigen Hamiltonschen Gleichungen lauten
ẋi =
1
∂H
= (pi − qAi )
∂pi
m
ṗi = −
∂H
q
∂Aj
∂ϕ
= + (pj − qAj )
−q
∂xi
m
∂xi
∂xi
= q ẋj
(15.22)
(15.23)
∂ϕ
∂Aj
−q
.
∂xi
∂xi
Beachten Sie, dass ich Ihnen in (15.23) durch Verwendung von (15.22) sowie der
Summenkonvention Bequemlichkeit verschafft habe. Bevor ich den Nachweis der
Äquivalenz dieser Hamiltonschen Gleichungen zu der Newtonschen Gleichung
(15.18) führe, ist eine Erläuterung am Platze.
Sie dürfen den in der Hamiltonfunktion (15.19) und den Hamiltonschen Gleichungen (15.22) und (15.23) auftretenden Vektor p~ als ein Tripel von Hilfsgrößen
ansehen, das zu nichts anderem nützt, als zur Überführung der Newtonschen
Bewegungsgleichung (15.18) in ein System von Differentialgleichungen erster
Ordnung in der Zeit. Ich will Ihnen diese Ansicht sogar nahe legen. Als Name für das fragliche Tripel p~ hat sich kanonischer Impuls eingebürgert. Wenn
Sie diese Bezeichnung übernehmen und sich sogar der üblichen Schlamperei
anschließen, das Epitheton kanonisch zu unterdrücken, so dürfen Sie doch nie
vergessen, dass der kanonische Impuls eines geladenen Teilchens im elektromagnetischen Feld nicht gleich dem Produkt aus Masse und Geschwindigkeit des
Teilchens ist. Vielmehr ist der Zusammenhang zwischen Geschwindigkeit und
15.2 Die klassische Hamiltonfunktion
279
kanonischem Impuls durch (15.22) gegeben; nur im Spezialfall verschwindenden
Vektorpotentials reduziert derselbe sich auf p~ = m~v .
Die vorstehende Erläuterung erschließt eine schöne Einsicht. Der erste Summand in der Hamiltonfunktion (15.19) stellt offenbar gerade die kinetische Energie 21 m~v 2 des Teilchens dar. In (15.19) kommt also insbesondere die altbekannte
Tatsache zum Ausdruck, dass im rein magnetostatischen Feld, das durch ϕ = 0
beschrieben werden kann, die Energie eines geladenen Teilchens konstant bleibt.
Da nämlich der magnetische Anteil der Lorentzkraft senkrecht auf der Teilchengeschwindigkeit steht, kann das Magnetfeld nur die Richtung von ~v ändern, nicht
aber den Betrag der Geschwindigkeit und ebenso wenig die Energie E = 21 m~v 2 .
Zum Nachweis der Äquivalenz der Hamiltonschen Gleichungen (15.22, 15.23)
mit der Newtonschen Gleichung (15.18) differenzieren wir (15.22) nach der Zeit
und eliminieren die rechts entstehende Zeitableitung des kanonischen Impulses
mit Hilfe von (15.23). Wir finden dann
mẍi = q ẋj
∂ϕ
d
∂Aj
−q
− q Ai .
∂xi
∂xi
dt
(15.24)
d
d
Beim Ausführen der Zeitableitung dt
Ai = dt
Ai (~x(t), t) müssen wir beachten,
dass sich das Vektorpotential i. A. an einem festen Ort ~x zeitlich ändert; am Ort
~x(t) des Teilchens ist Ai (~x(t), t) zusätzlich zeitabhängig, wenn sich das Teilchen
bewegt, wenn also ~x(t) sich zeitlich ändert. Schreiben wir
¯
¯
¯
∂Ai (~x, t) ¯¯
d
∂
¯
+ ẋj
Ai (~x(t), t) = Ai (~x, t)¯
dt
∂t
∂xj ¯~x=~x(t)
~
x=~
x(t)
schlampig aber schön
d
dt Ai
mẍi = −q
µ
=
∂
∂t Ai
(15.25)
i
+ ẋj ∂A
∂xj , so ergibt sich aus (15.24)
∂ϕ
∂
− Ai
∂xi
∂t
¶
− q ẋj
µ
∂Ai
∂Aj
−
∂xj
∂xi
¶
.
(15.26)
Dies aber ist genau die Newtonsche Gleichung; der erste der beiden Summanden
auf der rechten Seite ist nach (15.20) der elektrische Teil der Lorentzkraft; den
zweiten Summanden erkennen wir als den magnetischen Anteil der Lorentzkraft,
wenn wir bedenken
µ
¶
¶
µ
∂Ax
∂Ay
∂Ax
∂Az
~
~
− vz
(~v × B)x = (~v × rot A)x = vy
−
−
∂x
∂y
∂z
∂x
µ
µ
µ
¶
¶
¶
∂Ax
∂Ax
∂Ay
∂Ax
∂Az
∂Ax
−
−
−
= vx
+ vy
+ vz
∂x
∂x
∂x
∂y
∂x
∂z
µ
¶
∂Aj
∂Ax
= vj
−
.
(15.27)
∂x
∂xj
Nachdem wir nun die klassische Hamiltonfunktion H(~
p, ~x, t) eines geladenen Teilchens im elektromagnetischen Feld gefunden haben, gewinnen wir den
quantenmechanischen Hamiltonoperator, indem wir den kanonischen Impuls p~
durch den Differentialoperator (~/i)∇ ersetzen. Damit ist das Versprechen der
Begründung des Hamiltonoperators (15.2) eingelöst.
280
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
15.3
Klassische (nichtrelativistische) Bewegung
im konstanten Magnetfeld
Bevor wir das eben Gelernte auf die Quantenmechanik eines geladenen Teilchens
im konstanten Magnetfeld anwenden, will ich Sie, zur Vorbereitung, an Altbekanntes erinnern: Ein klassisches geladenes Teilchen bewegt sich auf einer Spi~ B|
~ 2
ralbahn längs des Magnetfeldes; die Geschwindigkeitskomponente (~v · B)/|
~
längs des Feldes B bleibt konstant. In einem Koordinatensystem, bezüglich
~ = 0, vollführt das Teilchen eine gleichförmige Kreisbewegung in eidessen ~v · B
~
ner zu B senkrechten Ebene. Der Radius und die Mittelpunktskoordinaten der
Kreisbahn hängen davon ab, wo und wie schnell das Teilchen in das Magnetfeld
eingeschossen wird. Die Umlauffrequenz, die so genannte Zyklotronfrequenz,
ω=
~
q |B|
m
(15.28)
ist jedoch von den Anfangsbedingungen unabhängig, jedenfalls für nichtrelativistische Teilchen.
Die eben getroffenen Aussagen über die Teilchenbahn im konstanten Magnetfeld sind ohne Rechnung aus der Bewegungsgleichung
¨ = q~x˙ × B
~
m~x
(15.29)
~ wirkt, bleibt das Teilzu gewinnen. Da die Lorentzkraft senkrecht zum Feld B
~
chen längs B unbeschleunigt; da die Lorentzkraft auch senkrecht zur Teilchengeschwindigkeit ist, kann sie den Betrag von ~x˙ nicht ändern; folglich muss die
Teilchenbahn, wenn sie in einer Ebene liegt, ein Kreis sein; dieser Kreis muss
gleichförmig umlaufen werden, da der Betrag der Beschleunigung
¨| =
|~x
~
|q| · |B|
|~x˙ | = ω|~x˙ |
m
(15.30)
ebenfalls zeitlich konstant bleibt (vgl. Abbildung 15.1).
Abbildung 15.1
Sie werden die spätere quantenmechanische Behandlung des Problems mehr
genießen, wenn wir das soeben ohne Rechnung Erkannte auch durch Lösung der
15.3 Klassische (nichtrelativistische) Bewegung im konstanten Magnetfeld
281
Hamiltonschen Gleichungen
ẋi =
∂H
,
∂pi
ṗi = −
∂H
,
∂xi
H=
1
~ 2 + qϕ
(~
p − q A)
2m
(15.31)
erarbeiten. Dabei will ich die Richtung des Magnetfeldes als z-Richtung wählen,
~ = (0, 0, B)
B
(15.32)
und die Potentiale durch
Ax = −By,
A y = Az = ϕ = 0
(15.33)
festlegen. Letztere Wahl weicht zwar von der in 15.1 benutzten (s. (15.1)) ab,
ist aber so gut wie diese, da sie das Magnetfeld (15.32) auch eindeutig festlegt.
Sie wissen doch noch, dass die klassische Elektrodynamik eichinvariant ist, d. h.
~ x, t) und B(~
~ x, t) eine ganze Klasse
dass zu einem festen Paar von Feldern E(~
~
gleichberechtigter Potentiale A und ϕ gehört (s.(6.36)).
An der speziellen Eichung (15.33) haben wir insofern gleich Freude, als die
entstehende Hamiltonfunktion
H=
1 2
1
(px + qBy)2 +
(p + p2z )
2m
2m y
(15.34)
von den Koordinaten x und z unabhängig ist. Nach den Hamiltonschen Gleichungen bleiben somit die entsprechenden Komponenten des kanonischen Impulses zeitlich konstant
ṗx = −
∂H
=0
∂x
=⇒
px (t) = px (0) ,
(15.35)
ṗz = −
∂H
=0
∂z
=⇒
pz (t) = pz (0) .
(15.36)
Die restlichen vier Hamiltonschen Gleichungen lauten
ṗz = −
∂H
= −ωpx − mω 2 y
∂y
(15.37)
ẋ =
∂H
1
= px + ωy
∂px
m
(15.38)
ẏ =
1
∂H
= py
∂py
m
(15.39)
ż =
∂H
1
= pz .
∂pz
m
(15.40)
Mit der zeitlichen Erhaltung von pz folgt aus (15.40) sofort, dass die Teilchenbewegung in z-Richtung gleichförmig verläuft
z(t) = z(0) + ż(0)t .
(15.41)
Beachten Sie, dass die Bewegung in x-Richtung trotz der Erhaltung von px
gemäß (15.38) komplizierter ist. In (15.38) kommt zum Ausdruck, dass der
282
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
kanonische Impuls i. A. nicht mit dem Produkt aus Masse und Geschwindigkeit
übereinstimmt.
Zur Diskussion der Bewegung in y-Richtung differenzieren wir (15.39) nach
der Zeit und eliminieren mit (15.37) den kanonischen Impuls py , woraufhin wir
die Bewegungsgleichung
ÿ + ω 2 y = −
ω
px (0)
m
(15.42)
erhalten. Diese beschreibt eine harmonische Schwingung mit der Frequenz ω
um die Ruhelage
y0 = −px (0)/mω .
(15.43)
Wenn wir die in der Lösung auftretenden Integrationskonstanten durch die Anfangslage y(0) und die Anfangsgeschwindigkeit ẏ(0) festlegen, beschreibt sich
die Schwingung durch
y(t) − y0 = (y(0) − y0 ) cos ωt +
ẏ(0)
sin ωt
ω
(15.44)
Schließlich erhalten wir die Zeitabhängigkeit von x, indem wir in die Hamiltonschen Gleichung (15.38) die Lösung (15.44) eintragen und über die Zeit integrieren. Es ergibt sich die harmonische Schwingung
x(t) − x0 = (y(0) − y0 ) sin ωt −
ẏ(0)
cos ωt
ω
(15.45)
um den Mittelpunkt
x0 = x(0) +
ẏ(0)
.
ω
(15.46)
Offenbar liegen x(t) und y(t) auf einem Kreis in der x − y-Ebene. Sie sehen
nun, wie der Radius
£
¤1/2
(y(0) − y0 )2 + ẏ(0)2 /ω 2
(15.47)
und die Mittelpunktskoordinaten x0 und y0 von den Anfangsdaten abhängen.
15.4
Geladenes Quant im konstanten Magnetfeld
Wir lösen nun die quantenmechanische Version des gerade besprochenen Problems. Der Hamiltonoperator
1 2
1
(px + qBy)2 +
(p + p2z )
2m
2m y
1
1 2
=
(px + p2y + p2z ) + ωypx + mω 2 y 2
2m
2
H=
(15.48)
unterscheidet sich in der Form nicht von der klassischen Hamiltonfunktion (15.34),
jedoch hat er in der Schrödingergleichung
i~ψ̇ = Hψ
(15.49)
15.4 Geladenes Quant im konstanten Magnetfeld
283
wegen p~ = (~/i)∇ die Bedeutung eines Differentialoperators.
Da die Koordinaten x und z in H nicht vorkommen, kommutieren die Kom∂
∂
ponenten px = (~/i) ∂x
und pz = (~/i) ∂z
des Impulsoperators mit H,
[px , H] = [pz , H] = 0 .
(15.50)
Die im letzten Paragrafen gefundenen Erhaltungssätze (15.35) und (15.36) gelten also auch für die Quantenmechanik. Die Lösungen der Schrödingergleichung
(15.49) können wir daher aus gemeinsamen Eigenfunktionen der Operatoren px ,
pz und H aufbauen. Da die Eigenfunktionen der Impulsoperatoren bekanntlich
ebene Wellen sind, können wir für die Eigenlösungen von (15.49) das Produkt
ψ(x, y, z, t) = eiEt/~ eikx x eikz z ψ(y)
(15.51)
ansetzen. Dabei sind ~kx , ~kx und E die respektiven Eigenwerte von px , pz und
H. Für die Amplitude ψ(y) liefert (15.49) die gewöhnliche Differentialgleichung
¸
· 2
~2 d 2
~ω
1
~
2
2
2 2
(k + kz ) −
+
kx y + mω y ψ(y) = Eψ(y) . (15.52)
2m x
2m dy 2
~ωkx y
2
Die Bewegung des Quants in y-Richtung hat wie die des entsprechenden klassischen Teilchens den Charakter einer harmonischen Schwingung der Frequenz
ω um die Ruhelage
y0 = −~kx /mω ,
(15.53)
denn die Nullpunktverschiebung
y 0 = y − y0
(15.54)
lässt aus (15.52) die wohlbekannte Schrödingergleichung des harmonischen Oszillators entstehen
¸
µ
¶
·
~2 kz2
1
~2 d 2
2 02
0
ψ(y 0 ) .
(15.55)
+ mω y ψ(y ) = E −
−
2m dy 0 2
2
2m
Diese Differentialgleichung hat, wie wir wissen, normierbare Lösungen ψ(y 0 ) nur
für diskrete Werte des Parameters E − ~2 kz2 /2m, u. z. gilt
µ
¶
1
E − ~2 kz2 /2m = ~ω n +
mit
n = 0, 1, 2, . . . .
(15.56)
2
Die Energie des Quants im konstanten Magnetfeld
¶
µ
1
2
2 2
,
En (kz ) = ~ kz /2m + ~ω n +
2
(15.57)
hat also neben dem kontinuierlichen Anteil ~2 kz2 /2m einen diskreten Teil. Ersterer entspricht der freien Bewegung des Quants längs des Magnetfeldes, zweiterer
~
der gebundenen harmonischen Bewegung quer zu B.
Der Eigenwert ~kx des Impulses px bestimmt wie (bei der klassischen Bewegung) die Gleichgewichtskoordinate y0 , geht jedoch nicht in die Energie ein.
Folglich ist jeder Energieeigenwert En (kz2 ) unendlichfach entartet.
Die Überlegungen dieses Paragrafen finden wichtige Anwendungen in der
Festkörper- und insbesondere der Metallphysik. Der diskrete Anteil der Energie
(15.57) ist dort unter der Bezeichnung Landauniveaus bekannt; er ist für viele
magnetische Eigenschaften von Metallen bei tiefen Temperaturen verantwortlich. Schmökern Sie mal in den Festkörperbüchern.
284
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
15.5
Eichinvarianz
~ und ϕ im Hamiltonoperator
Das Auftreten der elektromagnetischen Potentiale A
eines geladenen Teilchen muss uns zu ernster Beunruhigung Anlass geben, da die
Potentiale selbst gar nicht messbar sind. Sie können sogar in gewissem Umfang
beliebig verändert werden, ohne dass sich die messbaren Felder
~ = −A
~˙ − ∇ϕ
E
~ = rot A
~
B
(15.58)
~ invariant unter der Eichtransformation der
ändern. Offenbar bleiben E und B
Potentiale
~→A
~0 = A
~ + ∇χ
A
ϕ → ϕ0 = ϕ − χ̇ ,
(15.59)
wobei χ(~x, t) ein beliebiges reelles skalares Feld sein darf. Von solchen Eichtransformationen unberührt bleibt übrigens auch die klassische Bewegungsgleichung
eines geladenen Teilchens,
´
³
¨=q E
~ + ~v × B
~ ,
(15.60)
m~x
~ und B
~ eindeutig festlegt. Die klassida die Lorentzkraft sich durch die Felder E
sche Theorie der elektromagnetischen Wechselwirkung zwischen Ladungen und
Feldern ist also, Sie wussten’s schon längst, eichinvariant.
Ist aber auch die in 15.1 und 15.3 gegebene Quantentheorie für ein geladenes
Teilchen im klassischen elektromagnetischen Feld eichinvariant? Anders gefragt,
sind die in (15.4) berechneten Energiewerte En (kz ) objektive Eigenschaften des
~ und des geladenen Teilchens oder vielmehr nur Ausfluss unserer
Magnetfeldes B
~ und ϕ? Letzterer Verdacht ist nicht leicht
Willkür bei der Wahl der Potentiale A
~ und ϕ nach (15.59) umvon der Hand zu weisen, denn wenn die Potentiale A
geeicht werden, ändert sich das Aussehen des Hamiltonoperators. Überzeugen
~ × ~x, ϕ = 0 und dann
~ = 1B
Sie sich davon, indem Sie einmal die Eichung A
2
~ = (−By, 0, 0), ϕ = 0 verwenden, um ein konstantes Magnetfeld
die Eichung A
~ = (0, 0, B) zu repräsentieren.
B
Um die Abhängigkeit beobachtbarer Größen von der Eichung der Potentiale zu verhüten, müssen wir fordern, dass sich die Wellenfunktion ψ(~x, t) des
Teilchens bei einer Eichtransformation (15.59) so ändert, dass die umgeeichte
Schrödingergleichung
"
#
¶2
µ
1
∂ 0
~
0
0
~
i~ ψ (~x, t) =
∇ − qA
+ qϕ ψ 0 (~x, t) = H 0 ψ 0 (~x, t)
(15.61)
∂t
2m i
äquivalent ist zu der ursprünglichen,
"
#
¶2
µ
1
~
∂
~ + qϕ ψ(~x, t) = Hψ(~x, t) .
∇ − qA
i~ ψ(~x, t) =
∂t
2m i
(15.62)
15.5 Eichinvarianz
285
Diese Forderung ist leicht erfüllt! Mit Hilfe der Produktregel der Differenziation
bestätigen Sie leicht die Identitäten
·
¸
¶
µ
~
~
iqχ/~
iqχ/~
~
~
∇ − q A − q(∇χ) e
=e
∇ − qA
(15.63)
i
i
µ
¶
∂ iqχ/~
∂
iqχ/~
i~ e
i~ − q χ̇
=e
(15.64)
∂t
∂t
und lesen ab, dass
ψ 0 (~x, t) = eiqχ/~ ψ(~x, t)
(15.65)
die Gleichung (15.61) befriedigt, wenn ψ(~x, t) eine Lösung von (15.62) ist.
Nun beachten Sie, dass die Eichtransformation (15.65) mit reellem χ sich
in der Multiplikation der Wellenfunktion ψ mit einem Phasenfaktor erschöpft.
Eichinvariant ist also jedenfalls die Wahrscheinlichkeitsdichte für den Aufenthalt
des Teilchens am Ort ~x zur Zeit t,
|ψ 0 |2 = |ψ|2 .
(15.66)
Eichinvariant sind wegen (15.63) auch die Erwartungswerte von Funktionen des
~
Geschwindigkeitsoperators, (~
p − q A)/m,
insbesondere also der kinetischen Energie, denn für eine beliebige Wellenfunktion ψ(~x, t) gilt
Z
Z
∗
~ 0 )n ψ 0 = d3 x e−iqχ/~ ψ ∗ e+iqχ/~ (~
~ nψ
d3 x ψ 0 (~
p − qA
p − q A)
=
Z
~ nψ
d3 x ψ ∗ (~
p − q A)
mit
n = 1, 2, 3, . . . .
(15.67)
Auch die Eigenwerte des Hamiltonoperators sind, falls es überhaupt solche
gibt, eichinvariant. Bedenken Sie nur, dass zeitunabhängige Eigenfunktionen
und Eigenwerte gemäß
HψE = EψE
(15.68)
nur existieren können, wenn H selbst zeitunabhängig ist, insbesondere müssen
~ und ϕ zeitunabhängig sein. Wird nun eiauch die in H eingehenden Potentiale A
ne beliebige Eichtransformation mit einer auch zeitabhängigen Funktion χ(~x, t)
~ 0 und ϕ0 sowie die Wellenfunktion
durchgeführt, so werden die Potentiale A
0
ψE
(~x, t) = eiEt/~ eiqχ(~x,t)/~ ψE (~x)
0
ψE
(15.69)
0
Eigenfunktion von H nicht im Sinn der
zeitabhängig. Dementsprechend ist
Gleichung (15.68), sondern im Sinn der Schrödingergleichung (15.61). Es gilt
nämlich wegen (15.63) und (15.64)
0
H 0 ψ 0 = (E − χ̇) ψE
∂ 0
0
ψ = (E − χ̇) ψE
.
(15.70)
∂t E
Unabhängig von der Eichung bleiben offensichtlich die möglichen Werte des
Parameters E, d. h. die Energieeigenwerte.
Die Beunruhigung, die ich Ihnen eingangs nahe gelegt habe, ist nun ausgeräumt. Alle physikalischen Aussagen der Quantentheorie für geladene Teilchen sind von der Eichung der elektromagnetischen Potentiale unabhängig.
i~
286
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
15.6
Zeemaneffekt beim Wasserstoffatom (ohne
Spin)
Bei Anwesenheit eines konstanten Magnetfeldes
~ = (0, 0, B)
B
(15.71)
und eines elektrischen Coulombfeldes können wir die elektromagnetischen Potentiale als
~ × ~x,
~ = −1B
A
2
ϕ=
1 e
4πε0 r
(15.72)
wählen. Den Hamiltonoperator für die Relativbewegung im Wasserstoffatom,
H=
2
1
~ 2− 1 e ,
(~
p + eA)
2m
4πε0 r
(15.73)
hatten wir schon in15.1 für die Potentiale (15.72) schon zu
H=
1 e2
e ~ ~
1 2
p~ −
+
L·B
2m
4πε0 r
2m
(15.74)
~ quadratische Teil vernachlässigt wurde. Drücken
vereinfacht, wobei der in B
~
wir hier die Einstellenergie des magnetischen Dipolmoments im Magnetfeld B
durch das Bohrsche Magneton
µB =
~e
2m
(15.75)
aus und bezeichnen den Hamiltonoperator des Wasserstoffatoms im magnetfeldfreien Raum, p~2 /2m − e2 /r4πε0 , mit H0 , so lautet der hier zu untersuchende
Operator
1
H = H 0 + µ B B Lz .
~
(15.76)
Die Eigenfunktionen und Eigenwerte des Hamiltonoperators (15.74) erhalten
wir ohne Mühe aus denen des ungestörten Operators H0 . Da nämlich, wie wir
schon aus 14.5 wissen, die z-Komponente Lz des Bahndrehimpulses mit H0
vertauscht, sind die Eigenfunktionen zu H0 ,
H0 ψnlm = Enl ψnlm ,
(15.77)
auch Eigenfunktionen zu H,
Hψnlm = (Enl + µB Bm)ψnlm ,
m = 0, ±1, ±2, . . . , ±l .
(15.78)
Es haben also die (2l + 1) zu festem n und l gehörigen Eigenfunktionen ψnlm
~ zerstört die Isotropie des
nicht mehr die gleichen Energien. Das Magnetfeld B
Raumes und hebt die energetische Gleichberechtigung aller Einstellungen des
15.6 Zeemaneffekt beim Wasserstoffatom (ohne Spin)
287
Bahndrehimpulses auf. Die Aufhebung der Orientierungsentartung und die zu
~ proportionale Aufspaltung
B
Enl → Enlm = Enl + µB Bm
(15.79)
heißt normaler Zeemaneffekt.
Für die niedrigsten Niveaus des H-Atoms mit den Drehimpulsquantenzahlen
l = 0 und l = 1 lässt das Resultat (15.79) die in Abbildung 15.2 gezeigten
Aufspaltungen erwarten:
Abbildung 15.2
Insbesondere sollte das Grundzustandsniveau, da nach unserer bisherigen Erkenntnis nicht entartet, vom Magnetfeld unbeeinflusst bleiben und nicht aufspalten.
Tatsächlich wird beim Wasserstoffatom ein komplizierteres Verhalten der
Energieniveaus beobachtet (anomaler Zeemaneffekt). Schon das Grundzustandsniveau spaltet im Magnetfeld zwei Niveaus auf. Die Erklärung dieses Phänomens
besprechen wir im folgenden Kapitel.
288
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
Kapitel 16
Spin
16.1
Der Spin des Elektrons
Gelegentlich habe ich schon angedeutet, dass der Zustand eines Elektrons nicht
vollständig charakterisiert ist durch Angabe der Wahrscheinlichkeitsamplitude
für den Aufenthalt beim Ort ~x. Wie viele andere Teilchen (Proton, Neutron,
Muon, die Neutrinos etc.) hat das Elektron einen zusätzlichen Freiheitsgrad,
den so genannten Spin. In diesem Freiheitsgrad offenbart sich ein wichtiger Unterschied des Quants Elektron von der klassischen Fiktion eines punktförmigen
Teilchens. Die Bezeichnung Spin bringt zum Ausdruck, dass der fragliche Freiheitsgrad Drehimpulseigenschaften hat (denken Sie ans Spinnrad oder an to
spin, was so viel heißt wie sich drehen).
Der Drehimpulscharakter des Elektronenspins zeigt sich besonders sinnfällig
beim anomalen Zeemaneffekt. Ein Magnetfeld sollte die (2j + 1)-fache Entartung eines Energieniveaus mit Drehimpulsquantenzahl j aufheben. Für das
Grundzustandsniveau des Wasserstoffs ergibt sich eine zweifache Aufspaltung.
Identifizieren wir
2 = 2j + 1 ,
(16.1)
so folgt, dass die Drehimpulsquantenzahl j = 1/2 vorliegt. Jedoch kann der
fragliche Drehimpuls nichts mit der Bahnbewegung des Elektrons zu tun haben, denn die Bahndrehimpulsquantenzahl l kann bekanntlich nur ganzzahlige
Werte annehmen und außerdem ist die Grundzustandswellenfunktion ψ100 (r)
zweifelsohne kugelsymmetrisch, d. h. hat die Bahndrehimpulsquantenzahl l = 0.
Ein zweites berühmtes Experiment, in dem sich das Elektron als mit einem
Spin ausgestattet erweist, ist der Stern-Gerlach-Versuch. Entsprechend dem
skizzierten Schema wird in derartigen Versuchen ein Strahl von Atomen durch
ein quer zum Strahl laufendes räumlich inhomogenes Magnetfeld geschickt und
anschließend auf einem Schirm registriert (Abbildung 16.1). Für Atome mit
der Drehimpulsquantenzahl j erwarten wir dabei folgendes Verhalten. Relativ
~ x) hat der Drehimpuls (2j +1) energetisch verschiedene Einzum Magnetfeld B(~
stellmöglichkeiten; diese sollten, wenn viele Atome im Strahl laufen, alle gleich
häufig vorkommen, sofern nur die Quelle des Strahls keine Orientierung bevorzugt. Das mit dem Drehimpuls verbundene magnetische Moment m
~ hat dann
ebenfalls (2j + 1) verschiedene Komponenten in Feldrichtung. Nach 5.9 erfah289
290
16 Spin
Abbildung 16.1
~ x) im inhomogenen Magnetfeld
ren Atome mit verschiedenen Werten von m
~ · B(~
verschiedene Kräfte,
³
´
~ x) .
F~ = grad m
~ · B(~
(16.2)
Es sollte also der Atomstrahl in (2j + 1) verschiedene untereinander gleich intensive Teilstrahlen aufspalten. Für wasserstoffähnliche Atome, bei denen ein
Leuchtelektron eine räumliche kugelsymmetrische Wellenfunktion ohne Bahndrehimpuls besitzt (z. B. Li), wird eine Aufspaltung in zwei Teilstrahlen beobachtet. Wieder wird mit 2j + 1 = 2 auf die Drehimpulsquantenzahl j = 1/2
geschlossen.
Um den Zustand eines Elektrons vollständig zu spezifizieren, müssen wir
die beiden Einstellmöglichkeiten des Spins bezüglich einer beliebig wählbaren
Richtung (etwa der z-Richtung) berücksichtigen und zwei Wahrscheinlichkeitsamplituden ψ± (~x, t) angeben. Die Funktionen ψ+ (~x, t) und ψ− (~x, t) sind die
Amplituden dafür, das Elektron zur Zeit t beim Ort ~x mit der Spinkomponente
+~/2 bzw. −~/2 längs der Bezugsrichtung zu finden.
Es ist zweckmäßig, den Zustand des Elektrons durch den zweikomponentigen
Zustandsvektor
à !
!
à !
Ã
0
1
ψ+ (~x, t)
(16.3)
+ ψ− (~x, t)
= ψ+ (~x, t)
ψ(~x, t) =
1
0
ψ− (~x, t)
zu beschreiben. Die beiden hier auftretenden zweikomponentigen Einheitsvektoren und
à !
à !
1
0
χ+ =
und
χ− =
(16.4)
0
1
geben, für sich allein, keine Auskunft über den Ort des Elektrons, wohl aber
erschöpfende Auskunft über die Spinkomponente längs der Bezugsrichtung: sie
beträgt +~/2 für χ+ und −~/2 für χ− .
Wie jedem Drehimpuls ist dem Spin ein Operatortripel zugeordnet, das wir
mit
~ = (Sx , Sy , Sz )
S
(16.5)
16.1 Der Spin des Elektrons
291
bezeichnen. Die Komponenten Si müssen die Drehimpulsvertauschungsrelationen
[Sx , Sy ] = i~Sz ,
[Sy , Sz ] = i~Sx ,
[Sz , Sx ] = i~Sy
(16.6)
und
~ 2 , Si ] = 0
[S
(16.7)
~ 2 liegt beim Elektron fest als
befriedigen. Der Eigenwert des Spinquadrats S
2
2
~ j(j + 1) = 3~ /4. Es müssen also die Vektoren (16.4) beide Eigenvektoren zu
~ 2 sein,
S
~ 2 χ ± = 3 ~2 χ ± .
(16.8)
S
4
Wenn wir ohne Verlust an Allgemeinheit die Bezugsrichtung, längs derer die
Vektoren (16.4) die Spinkomponente festlegen, als die z-Richtung wählen, so
müssen diese Vektoren die 2j + 1 = 2 Eigenvektoren von Sz sein,
à !
à !
à !
à !
0
1
~ 0
~ 1
und
Sz
.
(16.9)
Sz
=−
=+
2 0
2 1
1
0
~ 2 und Sz , die den VertauschungsSie erinnern sich doch, dass Operatoren S
relationen (16.6) und (16.7) genügen, Eigenwerte ~2 j(j + 1) bzw. ~m mit
m = −j, −j + 1, . . . haben, wobei j ganz- oder halbzahlig sein darf. Wir hatten in 14.6 aus der Zusatzforderung, dass die Bahndrehimpulseigenfunktionen
die Winkelabhängigkeit der räumlichen Wellenfunktion geben muss, geschlossen, dass beim Bahndrehimpuls nur ganzzahlige Werte der Quantenzahlen j
und m möglich sind. Im Spin des Elektrons haben wir nun einen Drehimpuls
kennengelernt, dessen Eigenwerte durch j = 12 und m = ± 21 festgelegt sind.
Wir können aus 14.5 alle Überlegungen übernehmen, die auf den Drehimpulsvertauschungsrelationen aufbauen. Insbesondere wissen wir schon, dass wir
die beiden Operatoren
S± = Sx ± iSy
(16.10)
benutzen können, um aus einem Eigenvektor von Sz alle anderen, d. h. hier den
zweiten zu konstruieren. Wegen
[Sz , S± ] = ±~S±
(16.11)
muss z. B. S+ χ− ein Eigenvektor von Sz mit Eigenwert (− 21 + 1)~ = + 21 ~ sein
(vgl. (14.52)), der dann bis auf einen Normierungsfaktor mit χ+ übereinstimmen
muss,
à !
à !
1
1
S+
.
(16.12)
= const
0
0
Den Normierungsfaktor hatten wir in (14.70) für beliebige Werte von j und m
schon festgelegt. Mit j = 1/2, m = −1/2 ergibt sich const = ~, also
à !
à !
1
1
.
(16.13)
=~
S+
0
0
292
16 Spin
Ebenso ist schon erwiesen, dass der Operator S− den Eigenvektor von Sz zum
Eigenwert +~/2 überführt in einen Eigenvektor von Sz zum Eigenwert −~/2.
Die frühere Normierungsbedingung und Phasenkonvention legen fest
à !
à !
0
0
S−
(16.14)
=~
1
1
Insofern die Spinoperatoren auf zweikomponentige Vektoren wirken, müssen
sie sich durch 2 × 2-Matrizen darstellen lassen. Tatsächlich folgt aus (16.9)
Ã
!
0
~ 1
Sz =
,
(16.15)
2 0 −1
aus (16.13)
S+ = ~
Ã
0
1
0
0
S− = ~
Ã
0
0
1
0
!
(16.16)
und aus (16.14)
!
.
Für Sx und Sy erhalten wir schließlich aus (16.10) die Matrizen
Ã
!
Ã
!
~ 0 −i
~ 0 1
und
Sy =
.
Sx =
2 1 0
2 i
0
(16.17)
(16.18)
Dass alles schön zusammenpasst, sehen wir, wenn wir aus (16.15) und (16.18)
~ 2 = S 2 + S 2 + S 2 erstellen;
die Matrix für S
x
y
z
(Ã
Ã
! Ã
!
! Ã
!)
1
0
1
0
1
0
1
0
1
3
~ 2 = ~2
+
.
(16.19)
S
+
= ~2
4
4
0 1
0 1
0 1
0 1
~ 2 auf die Spinvektoren (16.4) wie das (3~2 /4)-fache
Wie es sein muss, wirkt S
der Einheitsmatrix.
16.2
Das magnetische Moment von Teilchen mit
Spin
Wir hatten uns klar gemacht, dass Teilchen mit der Ladung q, der Masse m und
~ ein magnetisches Moment
dem Bahndrehimpuls L
m
~ Bahn =
q ~
L
2m
(16.20)
tragen. Den Betrachtungen des letzten Paragrafen lag andererseits die Auffassung zugrunde, dass der Spin ähnlich wie der Bahndrehimpuls zum magnetischen Moment beitragen muss. Tatsächlich besteht der experimentelle Befund
16.3 Der anomale Zeemaneffekt beim H-Atom
1
2
(also Elektron, Muon, Proton,
q ~
S,
2m
(16.21)
für alle bekannten geladenen Teilchen mit Spin
. . .)
m
~ Spin = g
293
wobei der numerische Faktor g von Teilchen zu Teilchen verschieden ist. Für
das Elektron hat g einen nahe bei 2 liegenden Wert, der in der Quantenelektrodynamik berechnet werden kann als Potenzreihe in der Sommerfeldschen
Feinstrukturkonstanten
α=
1 e2
1
≈
.
4πε0 ~c
137
(16.22)
Die Berechnung des Gliedes erster Ordnung in
1
gel = 2 + α + O(α2 ) = 2, 00232
2
(16.23)
durch J. Schwinger (1949) war einer der ersten Triumphe der modernen Quantenelektrodynamik.
Beim Proton gilt empirisch gproton ≈ 5, 59. Beachten Sie, dass das magnetische Moment des Protons sehr viel kleiner ist als das des Elektrons, da die
Protonenmasse die Elektronenmasse um einen Faktor der Größenordnung 2000
überwiegt. Demgemäß kann sich im Stern-Gerlach-Versuch mit Wasserstoffatomen der Protonenspin gegenüber dem Elektronenspin kaum bemerkbar machen.
Im Auftreten des Faktors g im Spinbeitrag zum magnetischen Moment zeigt
sich, wie oben schon in der Halbzahligkeit der Spinquantenzahlen des Elektrons,
die nichtklassische Natur des Spins. Eine wichtige Konsequenz ist, dass der
Gesamtdrehimpuls
~ +S
~
J~ = L
(16.24)
nicht notwendig parallel zum gesamten magnetischen Moment
m
~ =
q ~
~
(L + g S)
2m
(16.25)
des Teilchens ist.
16.3
Der anomale Zeemaneffekt beim H-Atom
Diskutieren wir nun das Verhalten des H-Atoms im konstanten Magnetfeld unter
Berücksichtigung des Elektronenspins. Der in Rechnung zu stellende Hamiltonoperator (e = Elementarladung)
H=
2
1
~ 2 − 1 e + ge B
~ ·S
~
(~
p + eA)
2m
4πε0 r
2m
(16.26)
unterscheidet sich nur um die Einstellenergie des magnetischen Moments des
~
Elektronenspins im Feld B,
~ ·S
~ = gµB 1 B
~ ·S
~
~ = ge B
m
~ spin · B
2m
~
(16.27)
294
16 Spin
von dem in 15.6 behandelten∗) . Wählen wir wieder
~ = (0, 0, B)
B
~ = 1B
~ × ~x ,
A
2
(16.28)
~ quadratischen Teil des Hamiltonoperators
und vernachlässigen den in B
H=
1 e2
1
1 2
p~ −
+ µB B (Lz + gSz ) .
2m
4πε0 r
~
(16.29)
Das Aufsuchen der Eigenfunktionen und Eigenwerte dieses Hamiltonoperators bereitet keinerlei Schwierigkeit, wenn wir nur beachten, dass die Spinoperatoren Si , da auf einen inneren Freiheitsgrad des Elektrons wirkend, mit allen
auf die Ortskoordinaten wirkenden Operatoren wie pi , Li und xi kommutieren.
Insbesondere gilt
~ 2 ] = [Sz , H] = 0 ,
[Sz , Lz ] = [Sz , L
(16.30)
~ 2 und H gemeinsame Eigenfunktionen haben.
so dass die Operatoren Sz , Lz , L
~ 2 und zum spinunabhängigen
Nun sind uns sowohl die Eigenfunktionen zu Lz , L
Teil von H bekannt als
Rnl (r) Ylm (θ, ϕ) ,
wie auch die Eigenvektoren von Sz ,
à !
1
und
χ+ =
0
χ− =
(16.31)
à !
0
1
,
(16.32)
so dass wir die Eigenlösungen Ψ von
HΨ = EΨ
(16.33)
durch bloßes Zusammensetzen finden,
Ψnlm,± = Rnl (r) Ylm (θ, ϕ) χ± .
Die zugehörigen Eigenwerte der Energie lauten
³
g´
Enlm,± = Enl + µB B m ±
,
2
(16.34)
(16.35)
wobei wie üblich n = 1, 2, 3, . . ., l = 0, 1, . . . , n − 1 und m = 0, ±1, . . . , ±l .
Abbildung 16.2 zeigt die entsprechende Niveauaufspaltung für die niedrigsten Niveaus des H-Atoms:
Sie lesen ab, dass nun die Aufspaltung der Grundzustandsenergie in zwei Niveaus richtig wiedergegeben ist. Die p-Niveaus spalten streng genommen in
6 Unterniveaus auf, jedoch bleibt wegen g ≈ 2 ein Niveau praktisch doppelt
entartet.
∗) Nachdem die reduzierte Masse m nun im Bohrschen Magneton absorbiert ist, kann im
Folgenden der Buchstabe m wieder zur Bezeichnung der Orientierungsquantenzahl des Bahndrehimpulses verwendet werden.
16.3 Der anomale Zeemaneffekt beim H-Atom
Abbildung 16.2
295
296
16 Spin
Kapitel 17
Grundbegriffe der Statistik
17.1
Wahrscheinlichkeit von Ereignissen
Die statistische Behandlung eines Systems (Würfel, Lotto, mit Gas gefüllter
Behälter, . . .) erfordert zur mathematischen Grundlegung wie zur experimentellen Verifizierung eine vielfache Reproduktion des Systems bei gleichbleibender Präparationsvorschrift. Statistische Aussagen besagen i. A. nichts über das
Verhalten eines einzelnen Systems, sondern beziehen sich auf Gesamtheiten (Ensembles) vieler gleichartig präparierter Systeme.
In einer Gesamtheit von N Systemen hat ein Ereignis i die relative Häufigkeit
Ni /N , wenn es bei genau Ni der N Systeme auftritt. Im Grenzfall einer großen
Gesamtheit nennen wir diese relative Häufigkeit auch die Wahrscheinlichkeit wi
des Ereignisses i,
Ni
.
N →∞ N
wi = lim
(17.1)
Sie verdeutlichen sich die Natur von Wahrscheinlichkeitsaussagen leicht am
Beispiel eines ungezinkten Würfels. Der Ausgang eines einzelnen Wurfes lässt
sich nicht vorhersagen. Unter einer großen Anzahl von Würfen erwarten Sie
jedoch die Fünf auf der oberen Fläche mit der relativen Häufigkeit 1/6. Sie
finden diese Erwartung im Spiel mit um so größerer Genauigkeit erfüllt, je öfter
Sie insgesamt würfeln.
Seien i und j zwei sich gegenseitig ausschließende Ereignisse, die im Ensemble
mit den Wahrscheinlichkeiten wi bzw. wj auftreten. Dann hat die Wahrscheinlichkeit, an einem System entweder das Ereignis i oder das Ereignis j zu finden,
den Wert
wi∪j = wi + wj .
(entweder-oder-Regel)
(17.2)
Zum Beispiel finden Sie beim Würfeln entweder die Eins oder die Fünf mit der
Wahrscheinlichkeit w = 1/6 + 1/6 = 1/3.
Wenn i und j zwei verschiedene Eigenschaften eines Systems sind, die unabhängig voneinander auftreten können und einzeln mit den Wahrscheinlichkeiten wi bzw. wj realisiert sind, so stellen sie sich zusammen mit der Wahrscheinlichkeit
wi∩j = wi · wj
(sowohl-als-auch-Regel)
297
(17.3)
298
17 Grundbegriffe der Statistik
ein. Würfeln Sie etwa mit einem roten und einem blauen Würfel zugleich, so
ergibt sich für das Ereignispaar rote Fünf und blaue Drei die Wahrscheinlichkeit
w = 1/36 und für das Ereignispaar fünf und drei w = 1/18.
17.2
Diskrete eindimensionale Zufallsbewegung
Auf einem linearen Gitter äquidistanter Punkte hüpfe ein Teilchen mit den
Wahrscheinlichkeiten p und (1 − p) zum rechten bzw. zum linken Nachbarplatz.
Aufeinander folgende Sprünge seien voneinander unabhängig. Berechnen wir die
Wahrscheinlichkeit dafür, dass das Teilchen von insgesamt N Sprüngen genau n
nach rechts, also N − n nach links macht. Mit der gleichen Wahrscheinlichkeit
finden Sie (i) beim N -maligen Wurf einer Münze n mal Wappen, (ii) unter N
Spin- 21 Systemen n Spins in die positive z-Richtung ( nach oben“) und N − n
”
in die entgegengesetzte Richtung ( nach unten“) orientiert, (iii) n von N freien
”
Atomen in der linken Hälfte des ihnen zugänglichen Gesamtvolumens, etc.
Schauen wir auf das Beispiel der Spins. Nach der sowohl-als-auch Regel
(17.3) zeigen n ganz bestimmte Spins nach oben und alle anderen nach unten
mit der Wahrscheinlichkeit pn (1 − p)N −n . Irgendeiner (statt ein bestimmter)
der insgesamt möglichen N !/n!(N − n)! Sätze von n aus N Spins ist gemäß
(17.2) nach oben orientiert mit der Wahrscheinlichkeit (entweder-oder)
µ ¶
N!
n
N −n N
n
N −n
= p (1 − p)
WN (n) = p (1 − p)
.
(17.4)
n!(N − n)!
n
Diese so genannte Binomialverteilung ist in Abbildung 17.1 für den Fall p = 1/2,
N = 20 aufgemalt.
0.1
0
10
20
Abbildung 17.1
Der binomische Lehrsatz,
N
X
n N −n
p q
n=0
µ ¶
N
= (p + q)N ,
n
(17.5)
lässt Sie sofort erkennen, dass die Verteilung (17.4) richtig normiert ist,
N
X
n=0
WN (n) = 1 .
(17.6)
17.3 Die Binomialverteilung für große N
299
Er hilft auch bei der Berechnung der so genannten Momente, d. h. der Mittelwerte von ganzzahligen Potenzen der Zufallsvariablen n,
"
"
µ ¶#
µ ¶#
X
X µ ∂ ¶ν
N
N
pn q N −n
hnν i =
nν pn q N −n
=
p
∂p
n
n
n
n
q=1−p
q=1−p
¶ν
¸
·µ
∂
.
=
p
(p + q)N
∂p
q=1−p
(17.7)
Wir folgern für die ersten beiden Momente
hni = N p,
hn2 i = N 2 p2 + N p(1 − p)
(17.8)
und somit für die mittlere quadratische Schwankung
h(∆n)2 i ≡ hn2 i − hni2 = N p(1 − p) .
(17.9)
Bemerkenswerterweise wächst h(∆n)2 i nur linear mit N , während sowohl
hn i wie hni2 in N quadratisch sind. Die relative Streuung von n,
r
1−p
1 p
1
2
Str(n) ≡
,
(17.10)
h(∆n) i =
hni
hni
Np
√
geht daher für N → ∞ nach Null wie 1/ N . Offenbar konzentriert sich die
Binomialverteilung WN (n) umso schärfer um den Mittelwert hni , je größer N
ist. Für’s Münzenwerfen ziehen Sie die Folgerung, dass (i) Zahl und Wappen im
Mittel über viele Serien von je N Würfen gleich oft erscheinen und (ii) relativ
große Differenzen der Zahlen der beiden Ereignisse umso seltener auftreten, je
größer N ist.
Zurück zum hüpfenden Teilchen! Nach N Schritten der Schrittlänge (Gitterkonstante) a hat es sich zum Ausgangspunkt um die Strecke x = na − (N − n)a
entfernt, im Mittel über viele Beobachtungen also um
2
hxi = (2hni − N )a = N a(2p − 1) .
(17.11)
Bei gleicher Wahrscheinlichkeit für beide Hüpfrichtungen, also für p = 21 ,
kommt das Teilchen im Mittel nicht vom Fleck. Seine Lokalisierbarkeit nimmt
mit wachsendem N jedoch ab, da die Streuung seiner Entfernung vom Ausgangspunkt,
√
£­
®¤1/2
(17.12)
Str(x) = (x − hxi)2
=a N
mit N anwächst.
17.3
Die Binomialverteilung für große N
Wir hatten schon gesehen, dass die Binomialverteilung (17.4) bei großen Werten
von N nur für solche Werte der Zufallsvariablen n deutlich von Null verschieden
sein kann, die relativ nahe beim Mittelwert hni = N p liegen. Es lohnt sich, diese
Erkenntnis zu vertiefen und den Verlauf von WN (n) für n nahe beim Maximum
im Grenzfall N → ∞ genauer zu studieren.
300
17 Grundbegriffe der Statistik
Für die zur Debatte stehenden Werte von n und N können alle in (17.4)
auftretenden Fakultäten mit der Stirlingschen Formel
√
ν! ≈ 2πνν ν e−ν
(17.13)
approximiert werden. Daraufhin nimmt die Binomialverteilung die Form
WN (n) =
·
N
2πn(N − n)
¸1/2
NN
³ p ´n µ 1 − p ¶N −n
n
N −n
(17.14)
an. Zur weiteren Vereinfachung für n ≈ hni = N p beachten wir, dass die rechte
Seite von (17.14) auch für nichtganzzahlige Werte von n definiert ist. Sie hat,
als Funktion der reellen Variablen n, ein Maximum an der Stelle
n̂ = pN = hni .
(17.15)
Der Wert des Maximums lässt sich durch die in (17.9) gegebene mittlere quadratische Schwankung von n ausdrücken,
Ŵ = [2πp(1 − p)N ]
−1/2
£
¤−1/2
= 2πh(∆n)2 i
.
(17.16)
Wir wissen bereits, dass das Maximum der Verteilung von n scharf ausgeprägt ist, d. h. dass WN (n) schon bei relativ kleiner Entfernung der Variablen
n von n̂ stark abgefallen ist. Daher können wir eine sinnvolle Vereinfachung
von (17.14) nicht etwa durch eine nach wenigen Gliedern abgebrochene Taylorreihe der rechten Seite um die Stelle n = n̂ erhalten. Beachten wir aber, dass
ln WN (n) sehr viel weniger empfindlich von n abhängt als WN (n) selbst. Die
Taylorreihe
·
¸
1 d2 ln WN (n)
(n − n̂)2 + · · ·
ln WN = ln Ŵ +
2
dn2
n=n̂
= ln Ŵ −
1
(n − hni)2 + · · ·
2h(∆n)2 i
(17.17)
gibt also eine nicht offensichtlich unsinnige Näherung ab. Tatsächlich lässt sich
leicht zeigen, dass der Abbruch der Reihe nach dem Glied zweiter Ordnung im
Bereich [N p(1 − p)]1/2 ¿ n − hni ¿ N p(1 − p), also jedenfalls nahe bei n = hni,
eine sehr gute Approximation liefert, wenn N p(1 − p) À 1. Die entsprechende
Wahrscheinlichkeitsverteilung,
£
¤−1/2
£
¤
WN (n) = 2πh(∆n)2 i
exp −(n − hni)2 /2h(∆n)2 i ,
(17.18)
eine Gaußfunktion der Zufallsvariablen n, ist in Abbildung 17.2 für kontinuierlich variables n zusammen mit der Binomialverteilung (17.4) für den Fall
N = 50, p = 1/2 aufgemalt.
17.4
Eindimensionale Diffusion
Wenn eine Zufallsvariable x ein Kontinuum von Werten annehmen kann, etwa
−∞ < x < +∞, so ist es nicht mehr sinnvoll, nach der Wahrscheinlichkeit
dafür zu fragen, dass x genau einen bestimmten Wert annimmt. Sie wissen von
17.4 Eindimensionale Diffusion
301
0.1
0
25
50
Abbildung 17.2
unserer Behandlung der Quantentheorie (s. 11.3), dass bei kontinuierlichen Zufallsprozessen die Wahrscheinlichkeit W (x)∆x für das Auffinden der Variablen
im Intervall ∆x beim Wert x benutzt werden muss. Die Funktion W (x) heißt
Wahrscheinlichkeitsdichte. Die Normierung
+∞
Z
dx W (x) = 1
(17.19)
−∞
bedeutet dann, dass die Variable mit Sicherheit irgendeinen Wert im Intervall
−∞ < x < +∞ annimmt. Mittelwerte berechnen sich nach der Vorschrift
+∞
Z
dx xν W (x) .
hx i =
ν
(17.20)
−∞
Kontinuierliche Zufallsvariable treten oft auf als Idealisierung diskreter Variabler. Wenn wir zum Beispiel das hüpfende Teilchen aus 17.2 und 17.3 auf
einem Längenmaßstab betrachten, der sehr viel größer ist als die Gitterkonstante
a, so lässt sich die Teilchenkoordinate
x = na − (N − n)a
(17.21)
als kontinuierlich ansehen. Wenn wir darüber hinaus annehmen, dass die Sprünge des Teilchens im zeitlichen Abstand τ erfolgen und der Zeitmaßstab der
Beobachtung sehr viel größer als τ ist, so können wir auch die Zeit
t = Nτ
(17.22)
als kontinuierlich betrachten. Aus der diskreten Gaußverteilung (17.18) erhalten
wir eine Wahrscheinlichkeitsdichte für die kontinuierliche Variable x, indem wir
das Inkrement ∆n = 1 mit Hilfe von (17.21) in ein Inkrement ∆x überführen
und im Übrigen die diskreten Größen n und N durch x und t ersetzen,
µ
¶
x
t ∆x
WN (n) = WN (n)∆n = WN
+
≡ W (x, t)∆x .
(17.23)
2a 2τ 2a
302
17 Grundbegriffe der Statistik
Die gesuchte Wahrscheinlichkeitsdichte ist wie ihr diskretes Analogon eine Gaußfunktion. Sie lautet im Fall p = 1/2
¶
µ
1
x2
,
(17.24)
W (x, t) = √
exp −
2Dt
2πDt
wobei die so genannte Diffusionskonstante
D = a2 /τ
(17.25)
eingeführt wurde.
Die Gaußverteilung (17.24) ist für alle Zeiten t > 0 auf Eins normiert,
+∞
µ
¶
Z
x2
1
exp −
=1.
dx √
2Dt
2πDt
(17.26)
−∞
Da diese Normierung auch für t → 0 erhalten bleibt, während
(
0
für x 6= 0 ,
W (x, t) −−−→
t→0
∞ für x = 0
(17.27)
schließen wir, dass (17.24) anfänglich eine Deltafunktion darstellt,
W (x, 0) = δ(x) .
(17.28)
Diese Anfangsverteilung impliziert die Kontinuumsversion der Anfangsbedingung, dass das Teilchen zur Zeit t = 0 bei x = 0 scharf lokalisiert ist. Zu
späteren Zeiten wird die Lokalisierung immer diffuser, da die Breite der Verteilung (17.24) mit t wächst,
h(∆x)2 i = Dt .
(17.29)
Für t → ∞ schließlich strebt W (x, t) überall nach Null. Dabei bleibt allerdings
gemäß (17.26) die Normierung gewahrt, denn das Teilchen kann sich zwar beliebig weit vom Ausgangspunkt entfernen, nicht aber zur Gänze verloren gehen.
Durch Differenzieren überzeugen Sie sich leicht davon, dass die Verteilung
(17.24) eine Lösung der Diffusionsgleichung
1 ∂2
∂
W (x, t) = D 2 W (x, t)
∂t
2 ∂x
(17.30)
darstellt. Beachten Sie auch, dass diese Diffusionsgleichung der Schrödingergleichung eines freien Teilchens in einer Raumdimension sehr ähnlich sieht. Formal
kann (17.30) in die Schrödingergleichung überführt werden durch die Transformation t → it/~, D → ~2 /m.
Die Differentialgleichung (17.30) tritt in vielen verschiedenen Zusammenhängen auf. In der Theorie der Wärmeleitung wird sie benutzt zur Beschreibung
der Orts- und Zeitabhängigkeit der Temperatur beim Wärmetransport. Eine
Lösung der Form (17.24) beschreibt das allmähliche Zerfließen einer anfänglichen
lokalen Erhitzung in einem wärmeleitenden Körper. Der Konzentrationsausgleich in einem anfänglich inhomogenen Gemisch ineinander lösbarer Flüssigkeiten
folgt, wenn keine Strömungen auftreten, der drei-dimensionalen Verallgemeinerung (∂ 2 /∂x2 → ∇2 ) von (17.30). Die Brownsche Bewegung und die Wanderung
von Fremdatomen Fehlstellen in Kristallen sind andere Anwendungsbeispiele.
17.5 Der Zentrale Grenzwertsatz
17.5
303
Der Zentrale Grenzwertsatz
Eine Zufallsgröße x, die sich additiv aus N unabhängigen, gleichartigen Zufallsgrößen zusammensetzt, ist im Grenzfall√N → ∞ Gaußsch verteilt. Die relative
Streuung von x ist von der Ordnung 1/ N .
Der soeben formulierte zentrale Grenzwertsatz ist für das Verständnis von
Vielteilchensystemen von außerordentlicher Bedeutung. Makroskopische“ Ge”
genstände aus dem Alltagsbereich enthalten etwa 1023 (ein Liter Gas) bis 1026
(1 kg feste Materie) Moleküle. Derartige Körper können wir uns in viele (sagen wir 1014 ) winzige Stücke zerteilt denken, deren jedes immer noch viele (im gewählten Beispiel 109 bis 1012 ) Teilchen enthält. Wenn im betrachteten Körper bezüglich makroskopischer Messungen räumliche und zeitliche
Homogenität herrscht, sind die Stücke normalerweise in guter Näherung unabhängig voneinander. Die Unabhängigkeit rührt daher, dass die Wechselwirkung von Molekülen (die typische Reichweite beträgt einige Å) aus benachbarten
Stücken nur in engster Nachbarschaft der gemeinsamen Oberfläche stattfindet,
während die typische Lineardimension der Stücke im gewählten Beispiel 104 Å
beträgt. Viele physikalische Größen (wie die Gesamtenergie die Magnetisierung,
die elektrische Polarisation) können dann aufgefasst werden als Summen der
unabhängigen Beiträge der Teilstücke des betrachteten Körpers. Der zentrale
Grenzwertsatz besagt, dass die relativen statistischen Schwankungen
derartiger
p
additiver Variabler winzig (im gewählten Beispiel Str(x)/ hx2 i ≈ 10−7 ) und
Gaußsch verteilt sind. Dabei wird keine Annahme gemacht über die statistischen
Eigenschaften des Beitrags eines der Teilstücke des Körpers zu x; insbesondere
können diese Beiträge relativ große Schwankungen aufweisen. Selbst wenn die
Energie eines Teilstücks nur mit großer relativer Unschärfe bekannt ist, hat die
Gesamtenergie des Körpers nur eine winzige Unschärfe. Der zentrale Grenzwertsatz lässt uns also verstehen, warum jeder additiven physikalischen Größe für
einen makroskopischen Körper (z. B. Nährwert eines Pakets Haferflocken) normalerweise ein Zahlenwert statt einer Wahrscheinlichkeitsverteilung zugeordnet
werden kann.
Die wesentliche Voraussetzung für die Anwendbarkeit des zentralen Grenzwertsatzes ist die Unabhängigkeit der N Einzelbeiträge zu x. Sie ist bei zeitlich
stationären und räumlich homogenen makroskopischen Systemen zwar nicht immer, aber normalerweise erfüllt. Eine wichtige Ausnahme betrifft Körper in so
genannten kritischen Zuständen bei Phasenübergängen wie dem Übergang vom
flüssigen zum gasförmigen Zustand. Für einen derartigen Körper können additive Observable riesige Fluktuationen zeigen, d. h. mit ihren Mittelwerten vergleichbare Streuungen haben. Solche kritischen Fluktuationen sind auch nicht
durch Gaußsche Wahrscheinlichkeitsverteilungen charakterisierbar. Sie gehen
Hand in Hand damit, dass fiktive Teilstücke über die ganze Lineardimension
des Systems hinweg korreliert, d. h. nicht unabhängig voneinander sind.
Die folgende, lehrreiche Rechnung beweist den zentralen Grenzwertsatz. Bezeichnen wir die Einzelbeiträge zu x mit xi und betrachten der Einfachheit
halber die xi als kontinuierliche Variable im Intervall −∞ < xi < +∞. Wegen der angenommenen Gleichartigkeit haben alle xi für sich allein die gleiche
Wahrscheinlichkeitsdichte w(xi ). Die Wahrscheinlichkeitsdichte für das Auffinden des ersten Beitrags bei xi , des zweiten bei x2 , etc. ist nach der sowohlals-auch-Regel (17.3) durch das Produkt w(x1 )w(x2 ) · · · w(xN ) gegeben. Die
entweder-oder-Regel (17.2) gibt dann die Wahrscheinlichkeit für das Auffinden
304
17 Grundbegriffe der Statistik
der Summe aller N Beiträge zwischen x und x + ∆x als das Integral
Z
Z
Z
dx1 dx2 · · · dxN w(x1 )w(x2 ) · · · w(xN ) .
{z
}
|
P
x≤
(17.31)
xi ≤x+∆x
i
Nach Wechsel der Integrationsvariablen ξ1 = x1 +x2 +· · ·+xN , ξ2 = x2 , ξ3 = x3
etc. schreiben wir dieses Integral in der Form
x+∆x
Z
x
+∞
+∞
Z
Z
dξ1
dξ2 · · ·
dξN w(ξ1 − ξ2 · · · − ξN )w(ξ2 ) · · · w(ξN ) .
−∞
(17.32)
−∞
Für hinreichend kleines ∆x ist die in Rede stehende Wahrscheinlichkeit proportional zu ∆x und definiert durch
+∞
+∞
Z
Z
∆x
dξ2 · · ·
dξN w(x − ξ2 · · · − ξN )w(ξ2 ) . . . w(ξN ) ≡ W (x)∆x
−∞
(17.33)
−∞
die Wahrscheinlichkeitsdichte W (x) für die additive Zufallsvariable x.
Um zu zeigen, dass W (x) für N → ∞ in eine Gaußverteilung übergeht,
schreiben wir die Definition (17.33) in der symmetrischeren und leichter ausschlachtbaren Form
+∞
+∞
+∞
Z
Z
Z
W (x) =
dξ1
dξ2 · · ·
dξN δ(x − ξ1 − ξ2 · · · − ξN )w(ξ1 )w(ξ2 ) · · · w(ξN )
−∞
−∞
−∞
(17.34)
und verwenden hierin die Fourierdarstellung (2.111) der Deltafunktion,
δ(x −
X
+∞
Z
ξi ) =
i
P
dk ik(x− i
e
2π
ξi )
.
(17.35)
−∞
Damit erhalten wir
W (x) =
+∞
Z
dk ikx
e Q(k)N .
2π
(17.36)
−∞
wobei Q(k) die Fouriertransformierte der Einzelwahrscheinlichkeit w(ξ) ist
Q(k) =
+∞
Z
dξ e−ikξ w(ξ).
(17.37)
−∞
Offenbar hat die Funktion Q(k) die Momente der Verteilung w(ξ) als ihre
Ableitungen bei k = 0,
i
ν
·
dν Q(k)
dk ν
¸
k=0
+∞
Z
=
dξ ξ ν w(ξ) = hξ ν i .
−∞
(17.38)
17.5 Der Zentrale Grenzwertsatz
305
Insbesondere gibt das nullte Moment das Normierungsintegral,
+∞
Z
Q(0) =
dξ w(ξ) = 1 .
(17.39)
−∞
Wir können uns leicht davon überzeugen, dass |Q(k)| den Wert Q(0) = 1 für
kein k überschreiten kann. Da der Betrag einer Summe nie größer ist als die
Summe der Beträge der Summanden, gilt
Z
Z
|Q(k)| ≤ dx |e−ikx w(x)| = dx w(x) = Q(0) = 1 .
(17.40)
Tatsächlich wird |Q(k)| für wachsendes |k| umso schneller abfallen, je langsamer w(ξ) mit wachsendem |ξ| abfällt (blättern Sie zurück zu 11.7, um ein
Beispiel zu haben). Zur anschaulichen Begründung der getroffenen Aussage
vergegenwärtigen wir uns, dass die Exponentialfunktion exp(−ikx) in (17.37)
als Funktion von x umso schneller oszilliert, je größer |k| ist; für hinreichend
großes |k| wird w(x) auf dem Längenmaßstab 1/|k| kaum noch variieren, das
Integral (17.37) also nur noch wenig von Null abweichen kann.
Wegen (17.40) und da Q(k) für wachsendes |k| abfällt, wird die Potenz Q(k)N
bei großem N extrem schnell abfallen. Zur näherungsweisen Berechnung des
Integrals (17.36) suchen wir nun eine Approximation für Q(k)N , die diesem
extrem schnellen Abfall vom Maximalwert Eins auf Null Rechnung trägt. Wie
bei einer ähnlichen Fragestellung in 17.3 verwenden wir die Taylorreihe von
ln Q(k)N um die Stelle k = 0,
¶
µ
1 2 2
N
(17.41)
ln Q(k) = N ln Q(k) = N ln 1 − ihξik − hξ ik · · · .
2
Mit Hilfe der Entwicklung ln(1 + x) = x − x2 /2 + . . . erhalten wir aus (5.11)
µ
¶
1
ln Q(k)N = −ihξik − h(∆ξ)2 ik 2 + · · · ,
2
also
Q(k)
N
µ
1
≈ exp −iN hξik − N h(∆ξ)2 ik 2
2
¶
.
(17.42)
In dieser für große N vernünftigen Approximation wird Q(k)N nur durch die
ersten beiden Momente der Einzelwahrscheinlichkeit w(ξ) festgelegt.
Nach Eintragen der Näherung (17.42) in das Integral (17.36) ergibt sich für
die gesuchte Wahrscheinlichkeitsdichte der additiven Variablen x die Gaußfunktion (s. 11.7 für das Integral)
W (x) = p
mit dem ersten Moment
1
2πh(∆x)2 i
£
¤
exp −(x − hxi)2 /2h(∆x)2 i
hxi = N hξi
(17.43)
(17.44)
306
17 Grundbegriffe der Statistik
und der mittleren quadratischen Schwankung
h(∆x)2 i = N h(∆ξ)2 i .
(17.45)
Wie eingangs angekündigt, verschwindet die relative Streuung für N → ∞ wie
£
¤1/2
1
Str(x)/hxi = N h(∆ξ)2 i
/N hξi ∼ √ .
N
(17.46)
Kapitel 18
Statistische Behandlung
von Vielteilchensystemen
18.1
Ensembles
Die Wellenfunktion ψ(~x1 , ~x2 , . . . , ~xN , t) eines Haufens von N gleichen Teilchen
hat wie die Wellenfunktion eines einzelnen Teilchens die Bedeutung einer Wahrscheinlichkeitsamplitude. Ihr Absolutquadrat gibt die Wahrscheinlichkeitsdichte
dafür an, ein Teilchen in einem Volumenelement d3 x1 beim Ort ~x1 zu finden,
ein zweites in einem Volumenelement d3 x2 bei ~x2 etc. Die Wahrscheinlichkeitsinterpretation ist allerdings wie im Fall eines einzelnen Teilchens nur möglich,
wenn ψ normiert ist gemäß
Z
Z
Z
hψ | ψi ≡ d3 x1 d3 x2 · · · d3 xN |ψ(~x1 , ~x2 , . . . , ~xN , t)|2 = 1 .
(18.1)
Entsprechend der Bedeutung von ψ berechnet sich der Erwartungswert einer
~ x1 , . . . , ~xN , p~1 , . . . , p~N ) als das Integral (s. 11.6)
Observablen A(~
Z
Z
3
hAi ≡ hψ | Aψi = d x1 · · · d3 xN ψ ∗ Aψ .
(18.2)
Falls die Wellenfunktion ψ nicht Eigenfunktion des Operators A ist, so werden sich bei Messung der Observablen A an einem Ensemble von durch ψ repräsentierten Systemen verschiedene Messwerte ergeben. Das Mittel der Messergebnisse hat den Wert (18.2). Als ein Maß für die typische Schwankung der
Messwerte um den Mittelwert können wir die Streuung
¡
¢1/2 ¡
¢1/2
Str(A) = hA2 i − hAi2
= hψ | A2 ψi − hψ | Aψi2
(18.3)
benutzen.
Ein Ensemble von Systemen, die alle in ein und demselben Zustand präpariert wurden, ist nicht die allgemeinst mögliche Gesamtheit. Wir werden künftig
stets zulassen, dass zu einem Ensemble Systeme in verschiedenen Zuständen ψν ,
ν = 1, 2, . . ., gehören, wobei ein beliebig aus dem Ensemble herausgegriffenes
System mit Wahrscheinlichkeit wν im Zustand ψν sitzt. Der Erwartungswert
307
308
18 Statistische Behandlung von Vielteilchensystemen
der Observablen A (die keine explizite Zeitabhängigkeit haben soll),
hAi =
X
ν
wν hψν | Aψν i ,
(18.4)
entsteht dann als statistisches Mittel der quantenmechanischen Erwartungswerte bezüglich der Zustände ψν . Derart zusammengesetzte Ensembles werden
auch Zustandsgemische genannt. Bei dem einfachen Ensemble, das einer einzigen Wellenfunktion entspricht, sprechen wir auch von einem reinen Zustand.
18.2
Stationäre Ensembles
Im Allgemeinen sind Erwartungswerte wie (18.4) zeitabhängig, da die Wellenfunktionen ψν sich entsprechend der Schrödingergleichung
i~
∂
ψν = Hψν
∂t
(18.5)
zeitlich entwickeln. Der Hamiltonoperator H = T + V für N Teilchen enthält
die kinetische Energie T
T =
N
N
X
X
~2 ∇2i
1 2
p~ = −
,
2mi
2mi
i=1
i=1
(18.6)
wobei ∇i = (∂/∂xi , ∂/∂yi , ∂/∂zi ) der Nablaoperator bezüglich der Koordinaten
des iten Teilchens ist. Hinzu kommt im Allgemeinen eine potenzielle Energie
V (~x1 , ~x2 , . . . , ~xN ). Wenn die letztere Wechselwirkungen zwischen den Teilchen
beschreibt, so ist sie im Gegensatz zu T nicht additiv bezüglich der Beiträge der
einzelnen Teilchen.
Die Schrödingergleichung (18.5) erlaubt, die zeitliche Änderungsrate des Erwartungswerts (18.4) zu berechnen
Z
Z
i
h
X
d
wν d3 x1 · · · d3 xN ψ̇ν∗ Aψν + ψν∗ Aψ˙ν
hAi =
dt
ν
Z
Z
X
¤
i£
3
=
(18.7)
wν d x1 · · · d3 xN (Hψν∗ )Aψν − ψν∗ AHψν .
~
ν
Wenn V impulsunabhängig, d. h. kein Differentialoperator und darüber hinaus
reell ist, können wir schreiben
µ ¶
Z
Z
X
d
i
3
3
hAi =
wν d x 1 . . . d x N
dt
~
ν
¤
£
· (T ψν∗ )Aψν − ψν∗ AT ψν + ψν∗ (V A − AV )ψν .
Im ersten Term der eckigen Klammer können wir die Differentialoperatoren
in (∇2i ψν∗ )Aψν durch zweimalige partielle Integration nach rechts abwälzen“;
”
da hierbei für normierbare Wellenfunktionen ψν keine Randterme entstehen,
18.2 Stationäre Ensembles
erhalten wir schließlich
µ ¶
Z
Z
X
i
d
wν d3 x 1 . . . d3 x N
hAi =
(HA − AH)ψν
dt
~
ν
µ ¶
Z
Z
X
i
3
3
∗
=
[H, A]ψν .
w ν d x 1 . . . d x N ψν
~
ν
309
(18.8)
Die Änderungsrate des Erwartungswerts hAi verschwindet offensichtlich, falls
[H, A] = 0, d. h. falls die Observable A eine Erhaltungsgröße ist (s. 14.4). Aber
auch im Fall [H, A] 6= 0 kann der Erwartungswert hAi zeitlich konstant bleiben.
Ist nämlich das betrachtete Ensemble ein Gemisch von Energieeigenzuständen,
Hψν = Eν ψν ,
(18.9)
so ersehen Sie schon aus (18.7) das Verschwinden der Änderungsrate dhAi/dt.
Da für Gemische von Energieeigenzuständen die Erwartungswerte beliebiger Observabler zeitlich konstant bleiben, werden diese Gemische füglich als stationär
bezeichnet. Der folgenden Behandlung von Vielteilchensystemen im thermischen Gleichgewicht werden stets stationäre Gemische zugrunde gelegt.
Von besonderem Interesse für die Beschreibung von Vielteilchensystemen
sind Erwartungswert und Streuung der Energie. Bei stationären Ensembles gilt
X
X
w ν Eν .
(18.10)
wν hψν | Hψν i =
hHi =
ν
ν
Sie können im nächsten Paragrafen lernen, dass die Energieniveaus in Vielteilchensystemen außerordentlich dicht aufeinander folgen. Summen über Energiezustände wie in (18.10) können daher durch Integrale genähert werden. Dazu
muss die Zahl Ω(E)∆E der Zustände ψν bekannt sein, deren Energieniveaus
im Intervall zwischen E und E + ∆E liegen, und ferner muss wν durch w(Eν )
ersetzt werden. Der Erwartungswert (18.10) der Energie nimmt dann die Form
hHi =
Z∞
dE Ω(E) w(E) E
(18.11)
E0
an, wobei E0 die Grundzustandsenergie des Systems bezeichnet. Im vorstehenden Ausdruck für die mittlere Energie erkennen Sie übrigens das Produkt
Ω(E)∆E als Wahrscheinlichkeitsdichte der Energie. Die Streuung der Energie
erhalten wir durch eine entsprechende Überlegung als
1/2
∞
Z
2
2
.
(18.12)
Str(H) =  dE Ω(E) w(E) (E − hHi )
E0
Die Energie eines makroskopischen Systems ist im Sinne der Betrachtungen
von 17.5 eine additive Größe. Nach dem zentralen Grenzwertsatz müssen wir
also erwarten, dass die Streuung (18.12) i. A. sehr klein ist gegenüber dem Mittelwert (18.11). Um diese Erwartung durch Berechnen der Integrale in (18.11,
18.12) überprüfen zu können, müssen wir uns die Zustandsdichte Ω(E) sowie
die Wahrscheinlichkeit w(E) für stationäre Vielteilchensysteme zur Verfügung
stellen.
310
18 Statistische Behandlung von Vielteilchensystemen
18.3
Die Energieabhängigkeit der Zustandsdichte
Die Abzählung der Energiezustände ψν mit Energien Eν innerhalb eines Intervalls zwischen E und E +∆E erfordert im Prinzip die Kenntnis aller Eigenwerte
des Hamiltonoperators (und ihren Entartungsgrad). Diese Kenntnis ist für Vielteilchensysteme nicht leicht zu erlangen. Ohne große Mühe machen wir uns aber
klar, dass die Zustandsdichte eines Systems vieler Teilchen extrem stark von der
Energie abhängt.
Denken wir uns ein System von N Teilchen durch einen glatten Schnitt halbiert. Bei Teilchenzahlen der Größenordnung 1023 stellt die Wechselwirkung der
Hälften einen vernachlässigbaren Teil der Gesamtenergie dar. Zudem können
wir die Hälften als statistisch unabhängig ansehen. Da sich jede der Hälften
vom Gesamtsystem nur durch Volumen, Teilchenzahl und Energie unterscheidet,
wird die Zustandsdichte für alle drei Systeme dieselbe Funktion der respektiven
Energien, Teilchenzahlen und Volumina sein∗) Wegen der Unabhängigkeit der
Untersysteme gilt für die Zahl Ω(E, N, V )∆E der Zustände des Gesamtsystems
mit Energien im Intervall ∆E bei E
¶
X µE
N
V
∆E
− e,
− n,
Ω(E, N, V )∆E =
Ω
2
2
2
e,n
¶
E
N
V
∆E
+ e,
+ n,
2
2
2
· µ
¶
¸2
E N V
, ,
≈ Ω
∆E
.
2 2 2
·Ω
µ
(18.13)
Die Summe im zweiten Glied der Gleichungskette erstreckt sich über alle möglichen Verteilungen der Gesamtenergie E und der Gesamtteilchenzahl N auf die
beiden Untersysteme. Wir dürfen diese Summe durch den Summanden entsprechend halbierter Energie und halbierter Teilchenzahl approximieren, denn wenn
Ω(E, N, V ) schon bei kleinem Zuwachs von E extrem stark wächst, was wir
gleich zeigen werden, so hat das Produkt Ω(E/2 − e, N/2 − n, V /2) · Ω(E/2 +
e, N/2 + n, V /2) ein extrem scharf ausgeprägtes Maximum bei e = n = 0.
Anstatt das ursprüngliche System zu halbieren, können wir es auch in n
makroskopisch gleiche Teile zerlegen. Dann gilt statt (18.13) mit gleicher Begründung
¶
¸n
· µ
E N V
, ,
∆E
.
(18.14)
Ω(E, N, V )∆E ≈ Ω
n n n
Die Näherung (18.14) bleibt bei wachsendem n gut, solange jedes Untersystem
noch viele Teilchen enthält und die Gesamtenergie additiv in den Beiträgen
der Untersysteme bleibt; bei N = 1023 ist das normalerweise bei mindestens
n ≈ 1014 der Fall. Wenn der mittlere Teilchenabstand wie bei verdünnten
Gasen größer ist als die Reichweite der Wechselwirkungskräfte zwischen den
Teilchen, gilt (18.14) sogar bis zu Werten von n in der Größenordnung der
Gesamtteilchenzahl N .
∗) Es
lässt sich zeigen, dass Ω von der Form der Berandung des Systems nicht abhängt.
18.4 Das mikrokanonische Ensemble
311
Aus (18.14) gewinnen wir durch Differenzieren die relative Änderung der
Zustandsdichte bei kleiner relativer Änderung der Energie,
δΩ(E, N, V )
δΩ(E/n, N/n, V /n)
=n
,
Ω(E, N, V )
Ω(E/n, N/n, V /n)
(18.15)
als das n-fache der entsprechenden relativen Änderung bei einem von n Untersystemen. Mag die relative Änderung von Ω(E/n, N/n, V /n) für das kleinstmögliche Untersystem auch winzig sein, sagen wir 10−6 , so wird Ω(E, N, V )
doch um den riesigen Faktor n · 10−6 wachsen.
Bei vielen Systemen wird das schnelle Anwachsen der Zustandsdichte Ω mit
der Energie außer in Nachbarschaft der Grundzustandsenergie durch ein Potenzgesetz mindestens qualitativ richtig beschrieben,
Ω(E, N, V ) = E aN A(N, V ) ,
(18.16)
wobei der Exponent aN eine sehr große Zahl ist, deren Größenordnung sogar
der der Teilchenzahl N nahe kommen kann. Für hinreichend verdünnte Gase,
bei denen (18.14) und (18.15) bis n ≈ N gelten, ist a von der Größenordnung
Eins.
Prüfen Sie Ihr Verständnis der vorstehenden Diskussion, indem Sie sich davon überzeugen, dass Ω(E, N, V ) auch empfindlich vom Volumen V abhängt,
u. z. stark wächst bei Volumenvergrößerung.
Wenn wir wie hier und in der Folge die Niveaudichte Ω(E, N, V ) als Funktion der Energie E, desr Teilchenzahl N und des Volumens V ansehen†) , dann
ist stillschweigend angenommen, dass nur eine Teilchensorte (z.B. Wassermoleküle) und nur eine Phase (gasförmig, flüssig oder fest) vorliegen. Von diesen
drei Variablen muss die Niveaudichte sicher abhängen: vom Volumen V , weil
am Rand des Systemvolumens Randbedingungen für die Wellenfunktion erfüllt
sein müssen, so dass auch die Energieniveaus En (V ) vom Volumen abhängen;
von der Teilchenzahl N , weil jedes Teilchen zur Gesamtenergie (also zu jedem
Energieniveau des Gesamtsystems) beiträgt und schließlich wie oben beschrieben auch von der Energie E.
18.4
Das mikrokanonische Ensemble
Ich erinnere nochmals an eine in 17.5 gegebene Erläuterung des zentralen Grenzwertsatzes. Ein räumlich homogenes und zeitlich stationäres System vieler, etwa
N = 1023 , Teilchen können wir uns in viele, z. B. n = 1014 Stücke zerlegt denken, die mit glatten Oberflächen aneinander grenzen und deren jedes immer
noch viele, im Beispiel 109 , Teilchen enthält. Normalerweise (immer, außer in
kritischen Systemen) sind solche Teilstücke in guter Näherung unabhängig voneinander. Die Energie des Systems ist additiv in den Beiträgen seiner Teilstücke,
hHi ∼ n, und die relative Streuung der Energie, Str(H)/hHi ∼ n−1/2 , ist winzig,
zumeist sogar erheblich kleiner als die relative Unsicherheit der experimentellen
Bestimmung der Gesamtenergie.
Derart kleine Streuungen verdienen durchaus, vernachlässigt zu werden. Die
entsprechende Näherung für die in (18.11) auftretende Wahrscheinlichkeit Ω(E)
†) Der Kürze halber wird die Niveaudichte im Folgenden zuweilen als Ω(E) notiert, womit
die Abhängigkeit von V und N keineswegs negiert ist
312
18 Statistische Behandlung von Vielteilchensystemen
w(E) dE dafür, die Energie des Systems im infinitesimalen Intervall zwischen
E und E + dE zu finden, lautet
Ω(E) w(E) dE = δ(E − Ē)dE .
(18.17)
Die Deltafunktion verbietet gerade das Auftreten von Energien außerhalb eines
infinitesimalen Intervalls um den Mittelwert
hHi =
Z∞
dE δ(E − Ē)E = Ē .
(18.18)
E0
Alle höheren Momente ergeben sich als Potenzen des Mittelwerts,
ν
hH i =
Z∞
dE δ(E − Ē)E ν = Ē ν .
(18.19)
E0
und insbesondere verschwindet die Streuung der Energie. Das so definierte stationäre Ensemble von Systemen heißt aus historischen Gründen mikrokanonisch.
Neben der absoluten Schärfe der Energie hat das mikrokanonische Ensemble
eine weitere bemerkenswerte Eigenschaft. Um dieselbe klarzulegen, fassen wir
vorübergehend wieder die Diskretheit der Energieniveaus ins Auge und fragen
nach der Wahrscheinlichkeit, im Ensemble irgendeinen der insgesamt Ω(E)∆E
Energieeigenzustände ψn mit einem Energieeigenwert En im kleinen aber endlichen Intervall ∆E bei E anzutreffen. Die gefragte Wahrscheinlichkeit beträgt
für das mikrokanonische Ensemble

1

für Ē ≤ En ≤ Ē + ∆E

Ω(
Ē)∆E
(18.20)
w(En ) =


0
sonst.
Im Grenzfall infinitesimaler Dicke ∆E der Energieschale“ stimmt (18.20) mit
”
(18.17) überein. Sie rechnen leicht nach, dass die Relationen (18.19) bis auf Korrekturen der Ordnung ∆E/Ē auch für die diskrete Version (18.20) von (18.17)
richtig bleiben. Ganz ohne Rechnung lesen Sie aus (18.20) ab, dass das mikrokanonische Ensemble jedem der Ω(E)∆E Zustände mit Energie innerhalb der
erlaubten Energieschale die gleiche Wahrscheinlichkeit zuweist.
Per Konstruktion ist gesichert, dass das mikrokanonische Ensemble das statistische Verhalten der Energie eines Vielteilchensystems (nämlich die Kleinheit
ihrer Schwankungen) angemessen beschreibt. Ganz unklar ist jedoch zunächst,
ob auch die statistischen Eigenschaften anderer makroskopischer Observabler
(Gesamtimpuls, Gesamtdrehimpuls, ggf. Magnetisierung, elektrische Polarisation etc.) richtig wiedergegeben werden.
Für alle Variablen, die im gleichen Sinn wie die Energie additiv sind (oder
sogar additiv in den Beträgen der einzelnen Teilchen), sichert der zentrale Grenzwertsatz Streuungen, die zur Wurzel aus der Teilchenzahl N proportional sind,
Streuungen also, die auf zu N proportionalen Maßstäben als winzig erscheinen.
Diese Eigenschaft jedes Vielteilchensystems kann im mikrokanonischen Ensemble nicht verfälscht sein, da die Schärfen der Energie und anderer additiver
Observablen nicht im Widerspruch zueinander stehen.
18.5 Das kanonische Ensemble
313
Keineswegs ist durch den Grenzwertsatz jedoch garantiert, dass das mikrokanonische Ensemble auch die richtigen Mittelwerte der genannten Variablen
liefert. Der Mittelwert des Gesamtimpulses von N Teilchen etwa verschwindet
im mikrokanonischen Ensemble, denn nach dem Ehrenfestschen Theorem 11.8
gilt
N
X
i=1
h~
pi i =
X
i
mi
d
h~xi i ,
dt
(18.21)
und nach den Überlegungen von 18.2 ist der Erwartungswert von h~xi i in jedem
stationären Ensemble zeitunabhängig. Also eignet sich das Ensemble (18.17)
nur zur Beschreibung von Systemen mit verschwindendem Gesamtimpuls, nicht
aber, zum Beispiel, zur Behandlung von stationären Strömungen durch Rohre. Wenn der Mittelwert einer additiven Observablen eines Vielteilchensystems
im Ensemble (18.17) verschwindet, in einer zu beschreibenden Realisierung des
Systems aber nicht, so enthält (18.17) zu viele Zustände. Zum Beispiel lässt
(18.17) zu jedem Wert des Gesamtimpulses mit gleicher Häufigkeit den entgegengesetzt gleichen zu, während in einem insgesamt translatorisch bewegten
oder strömenden System Impulse einer bestimmten Richtung bevorzugt sind.
Um in derartigen Fällen die Zahl der Zustände angemessen zu reduzieren, kann
statt (18.17) ein verallgemeinertes mikrokanonisches Ensemble benutzt werden
mit der Wahrscheinlichkeitsdichte
¯
w(E, ξ) Ω(E, ξ) = δ(E − Ē) δ(ξ − ξ)
(18.22)
dafür, dass die Energie und die weitere(n) unabhängig vorgebbare(n) additive(n) Variable(n) Werte bei E bzw. ξ annehmen. Ferromagnete, Supraleiter
und suprafluides Helium sind weitere Beispiele von Systemen, bei denen die
Verallgemeinerung (18.22) angebracht ist.
Offensichtlich ist die Beschreibung eines Vielteilchensystems durch das mikrokanonische Ensemble von mikroskopischem Standpunkt aus extrem unvollständig, da nur die Energie oder neben ihr nur wenige weitere Observable spezifiziert werden. Hinsichtlich makroskopischer Observabler von Systemen im thermischen Gleichgewicht ist diese Beschreibung jedoch, wie Sie am Beispiel der
idealen Gase in 20. sehen werden, erschöpfend. Im Übrigen ist Ihnen aus der elementaren phänomenologischen Thermodynamik schon bekannt, dass das thermische Gleichgewicht eines Gases von N Teilchen hinsichtlich makroskopischer
Beobachtungen (von Druck, Temperatur, Energie etc.) eindeutig festgelegt ist
nach Vorgabe zweier Größen wie etwa des Volumens V und der Gesamtenergie
E. Die letzteren beiden Größen bestimmen aber gerade die Niveaudichte und
somit das mikrokanonische Ensemble.
18.5
Das kanonische Ensemble
Die mikrokanonische Besetzungswahrscheinlichkeit (18.20) für ein Energieniveau
Eν ist nicht die einzig mögliche Wahl für w(Eν ), die die Kleinheit der Energieschwankungen in einer Gesamtheit von Vielteilchensystemen richtig wiedergibt.
Ich will Ihnen hier eine andere Wahl vorstellen, die sich für viele Rechnungen
sogar als bequemer handhabbar erweist.
314
18 Statistische Behandlung von Vielteilchensystemen
Betrachten wir ein stationäres Vielteilchensystem und denken es uns durch
einen glatten Schnitt in zwei Stücke zerlegt, deren jedes immer noch viele Teilchen enthalten soll. Die Wechselwirkung der beiden Stücke macht normalerweise
einen vernachlässigbaren Beitrag zur Gesamtenergie E, so dass letztere durch
die Summe der Energien der beiden Teile approximiert werden kann,
E = E1 + E2 .
(18.23)
Zugleich werden die beiden Teile in guter Näherung statistisch unabhängig sein.
Die Wahrscheinlichkeit, die Gesamtenergie beim Wert E zu finden, wird nach
der sowohl-als-auch-Regel (17.3) durch das Produkt der Wahrscheinlichkeiten,
die Energien der Teile bei E1 bzw. E2 zu finden, gegeben sein,
w(E) = w(E1 ) · w(E2 ) .
(18.24)
Da die beiden Teilsysteme von gleicher Natur sind wie ihre Vereinigung, tritt in
(18.24) einunddieselbe Funktion w(x) mit drei verschiedenen Argumenten auf.
Die beiden Relationen (18.23, 18.24) legen die Funktion w(E) fest als die
Exponentialfunktion
w(E) =
1 −βE
e
.
Z
(18.25)
Dabei sind Z und β zwei offene Parameter, deren Bedeutung später klarzustellen
sein wird. Durch Einsetzen prüfen Sie leicht nach, dass (18.25) eine Lösung der
Gleichungen (18.23, 18.24) darstellt. Die Eindeutigkeit der Lösung (18.25) ist
auch schnell erwiesen. Differenzieren wir nämlich beide Seiten von (18.24) nach
E1 , so erhalten wir w 0 (E1 + E2 ) = w0 (E1 )w(E2 ). Für E1 = 0 entsteht die
Differentialgleichung w 0 (E2 ) = w0 (0)w(E2 ), deren Lösung bekanntlich die Form
(18.25) hat.
Sie erkennen auf der rechten Seite von (18.25) den Boltzmannfaktor und erinnern sich an die Maxwellsche Geschwindigkeitsverteilung, die barometrische
Höhenformel und andere Beispiele exponentieller Energieverteilungen. Ebenfalls
bekannt ist Ihnen, dass der Parameter 1/β zur absoluten Temperatur proportional ist. Die folgenden Überlegungen machen jedoch von derlei Vorkenntnissen
keinen Gebrauch.
Damit (18.25) tatsächlich eine Wahrscheinlichkeit w(En ) definiert, muss die
Summe über alle Energieeigenzustände den Wert Eins haben
X
w(En ) = Z −1
n
X
e−βEn = 1 .
(18.26)
n
Diese Forderung definiert den Normierungsfaktor Z, die so genannte Zustandssumme,
Z=
X
n
e
−βEn
≈
Z∞
dE Ω(E, N, V )e−βE = Z(β, N, V ) .
(18.27)
E0
Für die hier betrachteten Systeme ist, wie vorstehend symbolisch angedeutet,
die kanonische Zustanssumme eine Funktion der Variablen β, N, V . Sobald Z
18.5 Das kanonische Ensemble
315
bekannt ist, sind alle Momente der Energieverteilung durch Differenziation nach
dem Parameter β zugänglich,
ν
hH i = Z
−1
X
∂ν Z
= Z −1
Enν e−βEn ≈ Z −1
(−1)
ν
∂β
n
ν
Z∞
dE E ν Ω(E) e−βE .
E0
(18.28)
Die Differentiation nach β ist eine partielle; die beiden anderen Variablen Volumen und Teilchenzahl sind als konstant anzusehen.
Die offenbare Verschiedenheit der kanonischen Verteilung (18.25) und der
mikrokanonischen Verteilung
w(E) =
1
δ(E − Ē)
Ω(E)
(18.29)
muss Sie beunruhigen! Beide sollen die makroskopischen Eigenschaften von Vielteilchensystemen im thermischen Gleichgewicht beschreiben, beide sind konstruiert unter Berufung auf die Additivität der Energie bezüglich der Beiträge hinreichend großer Teilsysteme, aber irgendeine Ähnlichkeit zwischen der mikrokanonischen Deltafunktion und der kanonischen Exponentialfunktion ist zunächst
nicht zu erkennen.
Trotz des drastisch verschiedenen Aussehens sind die Verteilungen (18.17)
und (18.25) äquivalent. Die Äquivalenz ist ohne Rechnung unschwer dem zentralen Grenzwertsatz zu entnehmen. Die Additivität der Energie bezüglich vieler
hinreichend großer Untersysteme und die statistische Unabhängigkeit derartiger
Untersysteme führen einerseits zwingend zur kanonischen Verteilung (18.25) und
bedingen andererseits nach dem Grenzwertsatz eine winzige relative Streuung
der Gesamtenergie. Die Schärfe der Energie ist aber gerade eines der beiden wesentlichen Charakteristika des mikrokanonischen Ensembles. Das andere Charakteristikum, die Gleichheit der Besetzungswahrscheinlichkeiten aller Zustände
einer Energie bzw. mit Energien innerhalb einer dünnen Energieschale“, ist
”
dem kanonischen Ensemble ebenfalls eigen, denn die Verteilung (18.25) hängt
wie (18.17) neben der Energie von keinen anderen Quantenzahlen ab.
Wir können die Kleinheit der Energieschwankungen im kanonischen Ensemble auch durch Berechnung der Erwartungswerte hH ν i gemäß (18.28) illustrieren. Dazu verwenden wir die Zustandsdichte (18.16), die das für makroskopische
Systeme typische starke Anwachsen von Ω(E) mit der Energie qualitativ richtig
beschreibt,
Ω(E, N, V ) = A(N, V )E aN .
(18.30)
Der Einfachheit halber denken wir uns für den Exponenten aN zunächst nur
ganzzahlige Werte zugelassen. Damit wird die Integration in (18.28) zu einer
elementaren Aufgabe mit der Lösung (der Einfachheit halber wird der Energienullpunkt so gewählt, dass E0 = 0)
hH ν i = Z −1 Aβ −(aN +ν+1) (aN + ν)! .
(18.31)
Insbesondere erhalten wir für ν = 0 die Zustandssumme
Z = Aβ −(aN +1) (aN )!
(18.32)
316
18 Statistische Behandlung von Vielteilchensystemen
und schließlich, nach Elimination von Z aus (18.31),
hH ν i = β −ν (aN + ν)(aN + ν − 1) · · · (aN + 1) .
(18.33)
Dieses Resultat lässt sich auch für nicht ganzzahlige Werte von aN gewinnen.
Von (18.33) gelangen wir sofort zum angestrebten Ziel, der relativen Streuung
der Energie,
√
Str(H)/hHi = (aN + 1)−1/2 ∼ 1/ N ,
(18.34)
deren Winzigkeit nun auch nachgerechnet ist.
Um etwaige Beunruhigung über die Verschiedenheit der Besetzungswahrscheinlichkeit w(Eν ) im kanonischen und mikrokanonischen Ensemble vollends
auszuräumen, sollten Sie noch einen Blick auf das letzte Glied in (18.28) werfen.
Sie erkennen, dass das Produkt aus Zustandsdichte und Boltzmannfaktor und
nicht letzterer allein die Wahrscheinlichkeitsdichte für das Auffinden der Energie
beim Wert E angibt. Da Ω(E) stark mit E wächst, hat das Produkt Ω(E)e−βE
ein scharf ausgeprägtes Maximum nahe beim Mittelwert hHi (s. Abbildung
18.1).
Abbildung 18.1
Ich hatte schon in 18.4 darauf hingewiesen, dass bei manchen Vielteilchensystemen neben der Energie eine oder mehrere weitere Variable spezifiziert werden müssen. Die entsprechende Verallgemeinerung der kanonischen Verteilung
(18.25) lautet, falls die unabhängig vorgebbare(n) Variable(n) ξ ebenso wie die
Energie additiv sind,
w(E, ξ) = Z −1 e−β(E−ϕξ) ,
(18.35)
wobei als zusätzlicher Parameter die Größe ϕ auftritt. Die Begründung von
(18.35) läuft völlig parallel der Begründung von (18.25) und ist Ihnen zur Übung
anempfohlen.
Das kanonische Ensemble wird oft auch für kleine Systeme mit wenigen Freiheitsgraden verwendet. Die (zuweilen unausgesprochene) Rechtfertigung dafür
besteht stets darin, dass das betreffende kleine System als in schwacher Wechselwirkung mit einer großen Umgebung befindlich angesehen werden kann.
Als Beispiel eines kleinen Systems betrachten wir einen harmonischen Oszillator im Gleichgewicht mit einer Umgebung, die so schwach ankoppelt, dass ihr
Einfluss auf die Energieniveaus vernachlässigbar ist. Die Energieeigenwerte
18.6 Das großkanonische Ensemble
µ
1
En = ~ω n +
2
¶
,
n = 0, 1, 2, . . .
317
(18.36)
sind Ihnen aus 13.1 bekannt. Die Zustandssumme (18.27) wird hier zu einer
geometrischen Reihe,
Z=
∞
X
e−β~ω(n+ 2 ) =
1
n=0
1
e−β~ω/2
=
.
−β~ω
1−e
2 sinh(β~ω/2)
(18.37)
Durch Differenzieren gemäß (18.28) erhalten wir hieraus die mittlere Energie
hHi =
~ω
β~ω
coth
2
2
(18.38)
β~ω
~ω
/ sinh
.
2
2
(18.39)
und die Streuung
Str(H) =
Sie sollten diese Resultate in den Grenzfällen β → 0 (große Temperaturen) und
β → ∞ (kleine Temperaturen) untersuchen. Überzeugen Sie sich auch davon,
daß sich die mittlere Energie gemäß (18.38) schreiben lässt als
µ
1
hHi = ~ω nth +
2
¶
,
nth =
1
,
eβ~ω − 1
wobei nth die thermisch gemittelte Zahl der Anregungsquanten ist; die letztere Form der mittleren Energie und die Interpretation von nth werden durch
Vergleich mit (18.36) nahegelegt.
Nach diesem kleinen Exkurs zu einem “kleinen” System kehren wir zum
Hauptthema der Vielteichensysteme zurück mit der Bemerkung, dass bei Benutzung des kanonischen Ensembles naheliegt, die mittlere Energie hHi = Ē(β, N, V )
als Funktion der Teichenzahl N , des Volumens sowie des Parameters β (der sich
wie bereits erwähnt als ein Maß für die Temperatur herausstellen wird) anzusehen.
18.6
Das großkanonische Ensemble
Im mikrokanonischen wie im kanonischen Ensemble sind nur Systeme mit einundderselben Zahl von Teilchen zugelassen. Dies ist eine manchmal lästige Beschränkung. Insbesondere ist es experimentell unmöglich, ein makroskopisches
System vielfach zu reproduzieren unter genauer Beibehaltung der Teilchenzahl
N . Jedenfalls ist die Beschränkung auf fixes N bei N À 1 völlig unnötig. Da
nämlich die Teilchenzahl wie die Energie additiv ist bezüglich der Beiträge von
Teilsystemen, sichert der zentrale Grenzwertsatz die Vernachlässigbarkeit der
Streuung von N . Wir können also ohne weiteres statt der bisher besprochenen
Ensembles das so genannte großkanonische Ensemble benutzen, bei dem die
Teilchenzahl genau wie die Energie zwar nicht absolut scharf fixiert ist, jedoch
318
18 Statistische Behandlung von Vielteilchensystemen
nur vernachlässigbare Schwankungen aufweist. In diesem großkanonischen Ensemble haben Systeme mit Energieeigenwert Eν und Teilchenzahl N die relative
Häufigkeit
−1 −β(Eν −µN )
w(Eν , N ) = ZG
e
.
(18.40)
Dabei hängen die Energieeigenwerte Eν = Eν (N, V ) über Randbedingungen am
Rand des Systems vom Volumen V sowie auch von der Teilchenzahl N ab. Die
großkanonische Zustandssumme ZG ist durch die Wahrscheinlichkeitsinterpretation für w(Eν , N ) festgelegt,
ZG =
∞ X
X
e−β(Eν −µN ) = ZG (β, V, µ) .
(18.41)
N =0 ν
Das so genannte chemische Potential µ und der Parameter β können nach Vorgabe der mittleren Energie und der mittleren Teilchenzahl hN i fixiert werden.
Offenbar gilt
¶
µ
∂ ln ZG
(18.42)
−hHi + µhN i =
∂β
µ,V
¶
µ
∂ ln ZG
,
(18.43)
βhN i =
∂µ
β,V
wobei die Differenziation in (18.42) bei konstantem chemischen Potential µ und
die in (18.43) bei konstantem β auszuführen ist; das Volumen V ist beidemal
als konstant anzusehen.
Wir hatten am Ende des letzten Paragraphen erkannt, daß bei Benutzung
des kanonischen Ensembles naheliegt, die mittlere Energie hHi = Ē(β, N, V )
als Funktion der Variablen β, N, V anzusehen. Ebenso natürlich ist es, bei
Benutzung des großkanonischen Ensembles die Variablen β, µ, V zu benutzen
und hHi = Ē(β, µ, V ) zu schreiben. Der mittleren Energie ist es gleichgültig,
als Funktion welcher drei Variabler sie angesehen wird, und der Übergang von
einem Satz wie β, N, V zu einem anderen wie β, µ, V ist nichts als eine Variablentransformation. Mit derartigen Variablentransformationen muss man in
der Thermodynamik oft spielen. Ein derartiges Spiel liefert uns übrigens die
mittlere Energie als
¶
µ
∂ ln ZG
hHi = −
,
(18.44)
∂β
z,V
also etwas direkter als über 18.42 und 18.43.
Kapitel 19
Thermodynamische
Variable
19.1
Entropie
Der hier vorzustellende Begriff der Entropie ist in der phänomenologischen Thermodynamik seit seiner Einführung durch Rudolf Clausius (1865) von zentraler
Bedeutung und hat auch bei der Grundlegung des statistischen Verständnisses
der Thermodynamik durch Ludwig Boltzmann eine Schlüsselrolle gespielt. Wir
definieren die Entropie eines Vielteilchensystems im thermischen Gleichgewicht
als
X
S = −kB
w(Eν ) ln w(Eν ) .
(19.1)
ν
Die hier per Konvention auftretende Boltzmannkonstante,
kB = 1, 38062 × 10−23 J = 1, 38062 × 10−16 erg ,
(19.2)
weist der Entropie die Dimension einer Energie zu. Da die Besetzungswahrscheinlichkeiten w(Eν ) alle zwischen Null und Eins liegen, gilt sicher
S≥0.
(19.3)
Die so definierte Entropie könnte keine brauchbare thermodynamische Variable sein, wenn sie in den verschiedenen Gleichgewichtsensembles verschiedene
Werte annähme. Nun hat die Summe in (19.1) für das mikrokanonische Ensemble (18.20) den Wert
h
i
S = kB ln Ω(Ē, N, V )∆E = Smikro (Ē, V, N )
(19.4)
während Sie für das kanonische Ensemble (18.25) leicht
S = kB β Ē + kB ln Z = Skan (β, V, N ),
Ē = hHi
(19.5)
finden. Wir müssen uns eilends von der Gleichheit der rechten Seiten in (19.4)
und (19.5) überzeugen. Die Gleichheit muß übrigens bestehen ungeachtet der
319
320
19 Thermodynamische Variable
schon mehrfach angesprochenen Tatsache, daß beim mikrokanonischen Vorgehen
die Variablen Ē, N, V als die natürlichen erscheinen, während im kanonischen
Fall die mittlere Energie Ē durch β ersetzt ist. Übrigens spricht man von Ē
und β oft als von einem konjugierten Paar. Nun zum Bewies der Gleichheit
Smikro = Skan .
Dazu betrachten wir die kanonische Zustandssumme
Z∞
X
−βEn
Z=
≈ dE Ω(E)e−βE
e
(19.6)
n
E0
und erinnern uns der in 18.5 gewonnenen Erkenntnis, dass das Produkt der
Zustandsdichte Ω(E) mit dem Boltzmannfaktor ein extrem scharfes Maximum
bei E = Ē aufweist. Da die Breite der Funktion Ω(E) exp(−βE) unterhalb des
Maximums in etwa der Streuung der Energie gleich ist, kann die Zustandssumme
durch die Näherung
Z ≈ Ω(Ē) e−β Ē Str(H)
(19.7)
nicht um Größenordnungen verfälscht werden. Tragen wir die entsprechende
Näherung für in Z in (19.5) ein, so erhalten wir
h
i
S ≈ kB ln Ω(Ē) Str(H) .
(19.8)
Der Unterschied dieses Resultats zu (19.4) ist sicher vernachlässigbar: da ln Ω(Ē)
∝ N , während ln Str(H) ∝ ln N und die Dicke ∆E der Energieschale allerhöchstens ∝ N sind, ist der relative Unterschied der in (19.4) und (19.8) gegebenen
Größen von der Ordnung (ln N )/N . Werten wir schließlich die Definition (19.1)
der Entropie im großkanonischen Ensemble (18., (18.40)) aus, so ergibt sich
S = kB ln ZG + kB β Ē − kB βµN̄ = Sgroß (β, µ, V ).
(19.9)
Die Übereinstimmung der so berechneten Entropie mit der aus den beiden
anderen Ensembles gewonnenen für Vielteilchensysteme liegt daran, dass die
Teilchenzahl ebenso wie die Energie im großkanonischen Ensemble nur winzige Schwankungen aufweist. Der Nachweis der Übereinstimmung verläuft ganz
ähnlich wie der oben dargestellte Nachweis der Äquivalenz von (19.4) und (19.5)
und bleibt Ihnen zur Übung überlassen. Würdigen Sie im Übrigen die Tatsache,
dass die großkanonisch berechntete Entropie als Funktion der Variablen β, µ, V
erscheint; gegenüber dem kanonischen Fall ist die Teilchenzahl durch das zu ihr
konjugierte chemische Potential ersetzt.
Aus der Definition (19.1) folgt unmittelbar, dass die Entropie additiv ist in
den Beiträgen unabhängiger Untersysteme. Benennen wir nämlich die Energieniveaus zweier unabhängiger Untersysteme mit Eν1 und Eµ2 , die entsprechenden Besetzungswahrscheinlichkeiten mit w1 (Eν1 ) und w2 (Eµ2 ), so haben wir als
sowohl-als-auch-Wahrscheinlichkeit das Produkt
w(Eν1 , Eµ2 ) = w1 (Eν1 ) w2 (Eµ2 )
(19.10)
und somit für die Gesamtentropie die Summe
#
"
X
X
1
2
1
2
S = −kB
w1 (Eν ) ln w1 (Eν ) +
w2 (Eµ ) ln w2 (Eµ ) = S1 + S2 . (19.11)
ν
µ
19.1 Entropie
321
Ludwigs Boltzmann’s Pioniertat bestand unter anderem darin, die vorher im
phänomenologischen Kontext gebräuchliche Entropie eines thermischen Gleichgewichtszustands mit der Wahrscheinlichkeit dafür zu verknüpfen, in einem Ensemble makroskopisch identischer Systeme irgendeine der vielen Orts- und Impulskonfigurationen zu finden, die mit den makroskopisch feststellbaren Eigenschaften des Systems verträglich sind. Boltzmann’s Überlegungen bleiben weitgehend unberührt davon, dass wir heute die mikroskopische Dynamik quantenmechanisch statt klassisch beschreiben und von Energieniveaus statt von Ortsund Impulskonfigurationen sprechen. Der Zusammenhang zwischen Entropie
und Wahrscheinlichkeit ist am unmittelbarsten aus der mikrokanonischen Form
(19.4) ersichtlich, da 1/Ω(Ē)∆E gerade die Wahrscheinlichkeit darstellt, eines
der Ω(Ē)∆E Energieniveaus innerhalb der Schale ∆E bei Ē besetzt anzutreffen.
Die Bedeutung der Entropie für die phänomenologische Thermodynamik
fußt auf einer Extremaleigenschaft. Die Definition (19.1) verlangt, dass die Besetzungswahrscheinlichkeiten einem Gleichgewichtsensemble entsprechen. Formal können wir auch eine Nichtgleichgewichtsentropie S 0 definieren, indem wir
(19.1) für Nichtgleichgewichtsbesetzungen wν verwenden,
X
wν ln wν .
(19.12)
S 0 = −kB
ν
0
Diese Nichtgleichgewichtsentropie S kann nie größer sein als die Gleichgewichtsentropie desselben Systems,
S0 ≤ S .
(19.13)
Wir beweisen die außerordentlich wichtige Ungleichung (19.13), indem wir
zunächst die Besetzungswahrscheinlichkeit wν als variable Parameter ansehen
und S 0 bezüglich derselben extremalisieren. Bei jeder Variation der wν muss
natürlich die Normierung
X
wν = 1
(19.14)
ν
gewahrt bleiben; unverändert bleiben soll auch die Gesamtenergie des Systems.
Die Extremalisierung von S 0 unter den beiden Nebenbedingungen konstanter
Normierung und Energie kann dadurch erfolgen, dass wir zwei Lagrangemultiplikatoren kB β und kB (ln Z − 1) einführen∗) , die Funktion
X
X
wν
(19.15)
wν Eν − kB (ln Z − 1)
S 0 − kB β
ν
ν
ohne Nebenbedingungen extremalisieren und die beiden Parameter Z und β
zuletzt durch die Forderungen (19.14) und
X
Ē =
w ν Eν
(19.16)
ν
festlegen. Bei infinitesimaler Änderung der wν darf sich die in (19.15) gegebene
Funktion nicht ändern, da sie einen Extremalwert annehmen soll,
X
δwν (ln wν + βEν + ln Z) = 0 .
(19.17)
−kB
ν
∗) Die Benennung dieser Lagrangemultiplikatoren mag unnötig kompliziert aussehen, wird
sich aber im Ergebnis (19.18) als zweckmäßig herausstellen
322
19 Thermodynamische Variable
Wegen der Unabhängigkeit der δwν muss die Klammer für jedes ν verschwinden,
und es folgt
wν = Z −1 e−βEν .
(19.18)
Wir schließen, dass bei Vorgabe der mittleren Energie durch (19.16) die Größe
S 0 genau dann den Extremalwert S annimmt, wenn die Besetzungsverteilung
der Energieniveaus die des kanonischen Gleichgewichtsensembles ist. Der Parameter β erscheint hier in der Rolle eines Lagrangemultiplikators, der die mittlere
Energie festlegt.
Anstatt mit Hilfe eines Lagrangemultiplikators können wir die Gesamtenergie auch dadurch vorgeben, dass wir nur solche wν als von Null verschieden
zulassen, die zu Energieniveaus Eν innerhalb einer Schale der Dicke ∆E bei Ē
gehören. Die Extremalisierung von S 0 mit der Nebenbedingung (19.14) führt
dann zu der Forderung
−kB
Schale
X
δwν (ln wν + ln Z) = 0 ,
(19.19)
ν
also genau zur mikrokanonischen Verteilung wν = 1/Z = const. Die mikrokanonische Zustandssumme“ ist natürlich gleich der Zahl Ω(Ē)∆E der Energie”
eigenzustände mit Energien innerhalb der Schale.
Nachdem wir uns davon überzeugt haben, dass der im thermischen Gleichgewicht vorliegende Extremalwert der Größe S 0 gleich der Entropie S ist, müssen
wir zur Vervollständigung des Beweises der Ungleichung (19.13) noch zeigen,
dass das Extremum von S 0 ein Maximum ist. Das aber ist einfach, denn zweimaliges Differenzieren nach einem wµ in (19.12) gibt
∂2S0
= −kB /wµ < 0 .
∂wµ2
19.2
(19.20)
Temperatur
In einer ersten Nutzung der soeben erklärten Extremaleigenschaft der Entropie denken wir uns zwei zunächst getrennte abgeschlossene Vielteilchensysteme;
beide seien für sich im Gleichgewicht. Die respektiven Energien und Entropien
seien e1 und e2 bzw. S1 (e1 ) und S2 (e2 ). Sodann denken wir uns die zwei Systeme in Kontakt gebracht derart, dass die Gesamtenergie und die äußeren Parameter (insbesondere die beiden Volumina und Teichenzahlen) konstant bleiben,
Energieaustausch zwischen den beiden Systemen jedoch möglich wird.
Ein Kontakt der geschilderten Art heißt thermischer Kontakt und die gegebenenfalls ausgetauschte Energie heißt Wärme. Zwar i. A. nicht zu Beginn des
Kontakts, aber erfahrungsgemäß doch nach hinreichend langer Zeit wird das
vereinigte System im thermischen Gleichgewicht sein. Die vorher getrennten
Teile werden die Energie Ē1 , Ē2 mit der Summe
Ē = Ē1 + Ē2 = e1 + e2
(19.21)
und die Entropien S1 (Ē1 ), S2 (Ē2 ) haben. Die Gesamtentropie des vereinigten
Systems zu Beginn des Kontakts,
S 0 = S1 (e1 ) + S2 (Ē − e1 ) ,
(19.22)
19.2 Temperatur
323
und die schließlich erreichte Gleichgewichtsentropie
S 0 = S1 (Ē1 ) + S2 (Ē − Ē1 )
(19.23)
S0 ≤ S .
(19.24)
erfüllen die Ungleichung
Darüber hinaus erreicht S 0 als Funktion von e1 im Gleichgewicht, also für e1 =
Ē1 , ihren Maximalwert S, und es gilt die Gleichgewichtsbedingung
¸
·
∂S1 (Ē1 ) ∂S2 (Ē2 )
δe1 = 0 ,
(19.25)
δS 0 (Ē1 ) =
−
∂ Ē1
∂ Ē2
also
∂S1 (Ē1 )
∂S2 (Ē2 )
=
.
∂ Ē1
∂ Ē2
(19.26)
Das Inverse der hier auftretenden Größe
∂S
1
≡
∂E
T
(19.27)
nennen wir die absolute Temperatur. Zwei Systeme in thermischem Kontakt
können nach (19.26) nur bei Gleichheit ihrer Temperaturen im Gleichgewicht
sein.
Stimmen die Temperaturen T1 und T2 zweier Systeme bei Herstellung thermischen Kontakts nicht überein, so fließt Wärme vom wärmeren System (dem
mit der höheren Temperatur) zum kälteren, bis die Temperaturen angeglichen
sind. Die Richtigkeit dieser Ihnen auch aus dem Alltag geläufigen Aussage folgt
aus der Ungleichung (19.13). Bilden wir nämlich die Differenz S −S 0 aus (19.22)
und (19.23), der Einfachheit halber für den Fall infinitesimaler Abweichung vom
Gleichgewicht, so entsteht die Ungleichung
∂S20 (e2 )
∂S10 (e1 )
(Ē1 − e1 ) +
(Ē2 − e2 ) > 0 .
∂e1
∂e2
(19.28)
Da anfänglich jedes Teilsystem für sich im Gleichgewicht sein soll, bedeutet
(19.28)
¶
µ
1
1
−
(Ē1 − e1 ) > 0 .
(19.29)
T1
T2
Sie lesen ab, dass das erste Teilsystem Wärme aufnimmt, Ē1 − e1 > 0, falls es
anfänglich kälter ist als das zweite, T1 < T2 .
Sie können nun den schon erwähnten Zusammenhang des Parameters β,
der im kanonischen Ensemble die mittlere Energie fixiert, mit der absoluten
Temperatur T erkennen. Differenzieren wir den kanonischen Ausdruck (19.5),
also S(β, N, V ) = kB β Ē + kB ln Z, für die Entropie nach der mittleren Energie,
so ergibt sich
1
∂S
= kB β ,
=
T
∂ Ē
324
19 Thermodynamische Variable
also
β = 1/kB T .
(19.30)
Doch halt! Die vorstehende partielle Ableitung bedarf eines Kommentars!
Die kanonische Form der Entropie erscheint als Funktion von β, N, V . Beim
partiellen Differenzieren nach der Energie Ē sind Teilchenzahl N und Volumen
V konstant zu halten; die Variable β ist dann als Funktion der Energie Ē anzusehen, so dass gilt
∂S
1
=
T
∂ Ē
(19.31)
= kB β + kB Ē
∂β
∂ ln Z
+ kB
.
∂ Ē
∂ Ē
(19.32)
Jedoch heben sich die beiden letzten Terme in vorstehender Gleichung auf, wegen ∂ ln Z/∂ Ē = (∂ ln Z/∂β)(∂β/∂ Ē) = −Ē(∂β/∂ Ē), so dass die kavaliersartig
schnelle Rechnung im vorstehenden Absatz doch nicht falsch war!
Für den Grenzfall beliebig großer Temperatur entnehmen wir (19.30) und
der kanonischen Besetzungsverteilung
w(Eν ) = Z −1 e−βEν ,
(19.33)
dass die Besetzungswahrscheinlichkeiten für alle Energieniveaus gleich werden.
Hingegen ist für den Grenzfall T → 0 ersichtlich, dass nur das niedrigste Energieniveau besetzt ist; thermisches Gleichgewicht am absoluten Nullpunkt der
Temperatur bedeutet für jedes System sicheren Aufenthalt im Grundzustand.
Es folgt, sofern der Grundzustand nicht entartet ist, dass die Entropie am absoluten Nullpunkt verschwindet,
S→0
für
T →0.
(19.34)
Dieses Resultat ist als dritter Hauptsatz der Thermodynamik bekannt.
Einen ebenfalls aufschlussreichen Zusammenhang zwischen der absoluten
Temperatur, der mittleren Energie Ē und der Niveaudichte Ω(Ēν ) erhalten wir,
wenn wir in (19.27) den mikrokanonischen Ausdruck (19.4) für die Entropie
benutzen,
1
∂ ln Ω(Ē)∆E
= kB
.
T
∂ Ē
(19.35)
Da für Vielteilchensysteme ein starkes Anwachsen der Niveaudichte bei zunehmender Energie typisch ist, können wir folgern, dass solche Systeme keine negativen Temperaturen annehmen können,
T ≥0.
(19.36)
Insofern das Anwachsen der Niveaudichte mit der Energie qualitativ durch
Ω(Ē) = A Ē aN
(19.37)
beschrieben werden kann (wobei a für hinreichend verdünnte Gase von der
Größenordnung Eins ist), dürfen wir aus (19.35) schließen, dass die absolute
Temperatur über die Relation
Ē = aN kB T
(19.38)
19.3 Druck
325
die Größenordnung der mittleren Energie pro Freiheitsgrad eines Vielteilchensystems misst.
Eine weitere, historische Bemerkung ist am Platze. Wir haben durch Einführung der Boltzmannkonstanten in (19.1) der Entropie die Dimension einer
Energie zugewiesen. Als Konsequenz dieser Konvention wird die Temperatur
zu einer dimensionslosen Variablen. Der Zahlenwert der Boltzmannkonstanten
geht übrigens zurück auf eine (inzwischen überholte) Definition der Temperaturskala, bei der dem Schmelz- und dem Siedepunkt von H2 O unter gewissen
Normalbedingungen“ die Temperatur 0◦ Celsius bzw. 100◦ Celsius zugeschrie”
ben werden. Diese Celsius’sche Temperatur T (c) ist mit der in Grad Kelvin angegebenen absoluten Temperatur verknüpft durch die Übereinkunft, dass Temperaturdifferenzen in beiden Skalen numerisch gleich sind und dass 0◦ Celsius
der absoluten Temperatur 273, 15◦ Kelvin entspricht,
T = T (c) + 273, 15 .
(19.39)
Mit den beschriebenen Konventionen für Dimensionen und Einheiten wäre völlig
gleichwertig eine Übereinkunft, die Temperatur mit der Dimension einer Energie
auszustatten und somit die Entropie als dimensionslose Variable zu definieren.
Wegen des innigen Zusammenhangs von Entropie und Wahrscheinlichkeit und
weil die Temperatur gemäß (19.38) ein grobes Maß für die mittlere Energie
darstellt, wäre eine derartige Konvention sogar recht naheliegend. Aber einer
kleinen Zweckmäßigkeit wegen verwerfen wir nicht schnöde eine liebe Tradition.
19.3
Druck
In Gefäßen eingesperrte Systeme üben i. A. Kräfte auf die Gefäßwände aus. Die
Kraft pro Flächeneinheit der Gefäßwand wird als Druck bezeichnet. Sie kennen
die elementare gaskinetische Vorstellung, die den Druck eines Gases erklärt als
den Impulsübertrag auf das Gefäß bei der unaufhörlichen Folge von Stößen der
Teilchen im Gas gegen die Wand. Hier will ich Ihnen die allgemeine quantenstatistische Methode zur Berechnung des Drucks eines Systems im thermischen
Gleichgewicht erklären.
Liegt das fragliche System in einem Energieeigenzustand ψν mit der Energie
Eν vor, so bezeichnen wir als seinen Druck die Größe
pν = −
∂Eν
.
∂V
(19.40)
Dieser Druck könnte im Prinzip gemessen werden über die infinitesimale Änderung der Energie Eν (V ) bei sehr langsamer Änderung des Volumens um dV ; die
Volumenänderung hätte so langsam zu erfolgen, dass das System den Energieeigenzustand zur laufenden“ Energie Eν (V ) nicht verlässt. Die experimentelle
”
Vorgabe der Energie eines Vielteilchensystems bedeutet allerdings i. A. nicht die
Präparation genau eines Energieeigenzustandes, vielmehr die Herstellung eines
Gemisches, in dem der Zustand ψν mit der relativen Häufigkeit w(Eν ) auftritt.
Der Druck ist dann als statistisches Mittel über die pν zu berechnen,
p=−
X
ν
w(Eν )
∂Eν
.
∂V
(19.41)
326
19 Thermodynamische Variable
Die Auswertung der Summe (19.41) gestaltet sich besonders einfach, wenn
die kanonische Zustandssumme
Z∞
X
−βEν
(19.42)
≈ dE Ω(E, V ) e−βE
e
Z(T, V ) =
ν
E0
als Funktion der Temperatur und des Volumens schon bekannt ist, denn für das
kanonische Ensemble gilt
µ
¶
X
∂Z
∂Eν
= β −1 Z −1
p = −Z −1
,
(19.43)
e−βEν
∂V
∂V T
ν
also
βp =
µ
∂ ln Z
∂V
¶
.
(19.44)
T
Hier soll der Index T an der rechten Seite andeuten, dass die Differenziation nach
dem Volumen bei konstanter Temperatur erfolgen muss. Die Relation (19.44)
gibt den Druck als Funktion von Temperatur und Volumen (sowie ggf. weiterer
äußerer Parameter, die jedoch bei den von uns zu behandelnden Systemen nicht
auftreten). Sie wird die Zustandsgleichung des Systems genannt.
Statt der kanonischen Zustandssumme Z können wir in (19.44) mit Hilfe
von (19.5) die Entropie S und die mittlere Energie Ē einführen,
·µ
¶
µ
¶ ¸
∂S
1 ∂ Ē
p=T
.
(19.45)
−
∂V T
T ∂V T
Beachten Sie, dass die Entropie in (19.45) als Funktion des Volumens und der
beim Differenzieren nach V konstant zu haltenden Temperatur anzusehen ist.
Tatsächlich ist es üblich, S als Funktion von V und der mittleren Energie Ē
anzugeben. Die Identität
µ
µ
µ
¶
¶
µ
¶ µ
¶
¶
µ
¶
∂S
∂S
∂S
∂ Ē
1 ∂ Ē
∂S(Ē, V )
=
=
+
+
∂V
∂V Ē
∂V Ē T ∂V T
∂ Ē V ∂V T
T
(19.46)
erlaubt, diesem Brauch zu folgen und die Zustandsgleichung (19.45) zu
µ
¶
∂S
p=T
(19.47)
∂V Ē
zu vereinfachen.
Verwenden wir in (19.47) den mikrokanonischen Ausdruck (19.4) für die
Entropie, so erscheint der Druck als durch die Niveaudichte Ω(E, V ) gegeben,
p = kB T
∂ ln Ω(Ē, V )
.
∂V
(19.48)
Schließlich können wir den Druck auch mit Hilfe des großkanonischen Ensembles
berechnen, d. h. durch die großkanonische Zustandssumme
XX
ZG (T, V, µ) =
e−β(Eν −µN )
(19.49)
N
ν
19.4 Chemisches Potential
327
ausdrücken. Eine Nebenrechnung, die zu der in (19.43) ausgeführten völlig
parallel läuft,
¶
µ
X
∂Eν
∂ZG
−1
−1
p = −ZG
e−β(Eν −µN )
,
(19.50)
= β −1 ZG
∂V
∂V T,µ
N,ν
gibt statt (19.44)
βp =
µ
∂ ln ZG
∂V
¶
.
(19.51)
T,µ
Hieraus ergibt sich p als Funktion von V , T und des chemischen Potentials µ.
Die letztere Größe kann gemäß
µ
¶
∂ ln ZG
N̄ = kB T
(19.52)
∂µ
T,V
zugunsten der mittleren Teilchenzahl aus der Zustandsgleichung eliminiert werden.
Ihnen sollte hinlänglich klar sein, dass die drei Formen (19.44, kanonisch),
((19.48), mikrokanonisch) und ((19.51), großkanonisch) der Zustandsgleichung
für Vielteilchensysteme miteinander äquivalent sind. Die Freiheit, beim Aufstellen der Zustandsgleichung von Vielteilchen systemen irgendeines der drei
Ensembles benutzen zu dürfen, wird uns im folgenden viel unerfreuliche Rechenarbeit zu sparen erlauben.
19.4
Chemisches Potential
Das chemische Potential µ war uns in 18.6 bei der Einführung des großkanonischen Ensembles als ein Parameter begegnet, mit dessen Hilfe die mittlere
Teilchenzahl im Ensemble festgelegt wird. In genau diesen Hilfsdienst werden
wir µ im nächsten Kapitel stellen. Hier will ich Ihnen erläutern, dass das chemische Potential auch eine eigene physikalische Bedeutung hat.
Wenn bei festem Volumen (und sonstigen äußeren Parametern) sowie konstanter Entropie die Teilchenzahl geändert wird, so ändert sich die Energie
gemäß
¶
µ
∂ Ē
=µ.
(19.53)
∂N S,V
Zum Beweis dieser Eigenschaft des chemischen Potentials greifen wir auf den
großkanonischen Ausdruck für die Entropie (19.9) zurück und schreiben denselben in differenzieller Form,
dS = kB d(ln ZG ) +
1
1
1
(−Ē + µN ) dT + dĒ − (N̄ dµ + µ dN̄ ) . (19.54)
T2
T
T
Nun ist die großkanonische Zustandssumme definiert als eine Funktion der Variablen T , V (über die Energiewerte) und µ. Ihr allgemeines Differential lautet
also
µ
¶
¶
¶
µ
µ
∂ ln ZG
∂ ln ZG
∂ ln ZG
d ln ZG =
dT +
dV +
dµ . (19.55)
∂T
∂V
∂µ
V,µ
T,µ
T,V
328
19 Thermodynamische Variable
Die hier auftretenden Koeffizienten von dV und dµ hatten wir in (19.51) bzw.
(19.52) bereits als βp bzw. β N̄ identifiziert, während sich der Koeffizient von
dT aus (18.42) als (Ē − µN̄ )/kB T 2 ergibt. Damit erhalten wir für das Entropiedifferential (19.54) den Ausdruck
T dS = dĒ + pdV − µdN̄ ,
(19.56)
aus dem Sie die Relation (19.53) sowie die analoge Eigenschaft des Drucks
µ
¶
∂ Ē
p=−
(19.57)
∂V S,N
entnehmen.
Zwischen dem chemischen Potential und dem Druck besteht insofern eine
Analogie, als beide Größen die isentropische (dS = 0) Antwort der mittleren Energie auf die differenzielle Änderung eines äußeren Parameters, nämlich
Teilchenzahl bzw. Volumen, angeben. (Man spricht auch von generalisierten
Kräften; die äußeren Parameter wären dann als generalisierte Koordinaten zu
bezeichnen.) Dementsprechend gilt für das chemische Potential auch eine zu
unserer Definition des Druckes (19.41) analoge Relation,
µ=
X
ν,N
w(EνN )
∂EνN
.
∂N
(19.58)
Zum Beweis von (19.58) verwenden wir das großkanonische Ensemble. Die
rechte Seite erlaubt dann folgende Umformung
µ
¶X
∞
1
∂ X −βEνN
1 X −β(EνN −µN ) ∂EνN
e
=−
.
eβµN
e
ZG
∂N
βZG
∂N ν
ν,N
Hierin ist
P
ν
N =0
exp(−βEνN ) ≡ Z(N ) die kanonische Zustandssumme bei fixer
Teilchenzahl N . Die Ableitung dieser Größe nach N können wir approximieren
als
¤
1 £
∂
Z(N ) ≈
Z(N ) − Z(N − δN ) ,
∂N
δN
(19.59)
wobei δN irgendeine im Vergleich zur mittleren Teilchenzahl N̄ winzige Zahl
sein darf. Die rechte Seite von (19.58) nimmt dann folgende Form an
−
µ
1
βZG
¶
∞
¤
1 X −βµN £
e
Z(N ) − Z(N − δN )
δN
N =0
"
#
¶
µ
X
1
1
βµN
ZG −
=−
e
Z(N − δN )
βZG δN
N
≈−
1 1
(1 − eβµδN ) .
β δN
(19.60)
Das letzte Glied in der Gleichungskette (19.60) entsteht nach Einführung der
neuen Summationsvariablen N 0 = (N − δN ) in exzellenter Näherung, da die
19.4 Chemisches Potential
329
Teilchenzahlsumme im vorletzten Glied erhebliche Beiträge nur für Werte von
N in Nähe der mittleren Teilchenzahl N̄ erhält. Im Grenzübergang δN → 0
ergibt sich schließlich in (19.60) das chemische Potential µ.
Nachdem nun die enge Verwandtschaft von Druck und chemischem Potential ausführlich gewürdigt worden ist, verdient auch ein kleiner Unterschied Aufmerksamkeit, das negative Vorzeichen in der Definition des Drucks. Es sorgt
dafür, dass Systeme im Gleichgewicht einen positiven Druck haben. Warum
wäre im Umgang mit großen Systemen mit negativem Druck äußerste Vorsicht
geboten?
330
19 Thermodynamische Variable
Kapitel 20
Ideale Gase
20.1
Ununterscheidbarkeit identischer Teilchen
Beim Beobachten der Bewegung mehrerer identischer klassischer Teilchen (z. B.
Billardkugeln) kann man immer, jedenfalls im Prinzip, die einzelnen Teilchen
unterscheiden: jedes der im übrigen gleichen Teilchen durchläuft seine eigene
Bahnkurve und kann an derselben jederzeit identifiziert werden. Bei Quanten
hingegen ist diese Unterscheidungsmöglichkeit nicht gegeben, da wegen des Wellencharakters der Bewegung von einer Bahnkurve gar nicht gesprochen werden
kann. Tatsächlich sind identische Quanten (wie die 47 Elektronen in der Hülle
eines Silberatoms, die Natriumatome in einem Salzkorn, die beiden Wasserstoffatome in einem Wasserstoffmolekül . . .) auf keine Weise voneinander unterscheidbar. Ich will Ihnen hier einige der drastischen Konsequenzen der Ununterscheidbarkeit identischer Quanten vorstellen.
Betrachten wir zunächst zwei identische Teilchen, die durch die Wellenfunktion Φ(~x1 , ~x2 ) beschrieben werden. Das Absolutquadrat |Φ(~x1 , ~x2 )|2 gibt die
Wahrscheinlichkeitsdichte dafür, eines der Teilchen bei ~x1 und das andere bei
~x2 zu finden. Die Ununterscheidbarkeit der beiden Teilchen macht die Frage, welches von ihnen bei ~x1 angefunden wird, unbeantwortbar. Dementsprechend muss die Wahrscheinlichkeitsdichte |Φ(~x1 , ~x2 )|2 symmetrisch unter Vertauschung der Koordinatentripel ~x1 und ~x2 sein,
|Φ(~x1 , ~x2 )|2 = |Φ(~x2 , ~x1 )|2 .
(20.1)
Ein etwaiger Unterschied |Φ(~x1 , ~x2 )|2 von |Φ(~x2 , ~x1 )|2 würde nämlich bedeuten,
dass zwei verschiedene und verschieden wahrscheinliche Ereignisse des Typs ein
”
Teilchen wird bei ~x1 , das andere bei ~x2 registriert“ möglich sind und somit eine
Unterscheidbarkeit der beiden Teilchen begründen.
Die Symmetrie der Wahrscheinlichkeitsdichte erzwingt, dass die Wellenfunktion Φ(~x1 , ~x2 ) entweder symmetrisch oder antisymmetrisch ist,
Φ(~x1 , ~x2 ) = ±Φ(~x2 , ~x1 ) .
(20.2)
Beide Möglichkeiten kommen in der Natur vor. Die Erfahrung lehrt, dass
die Wellenfunktionen identischer Fermiteilchen (d. h. Teilchen mit halbzahligem
Spin wie Elektronen, Protonen, Neutronen etc.) ausnahmslos antisymmetrisch
331
332
20 Ideale Gase
sind, während die Koordinaten identischer Boseteilchen (Teilchen mit ganzzahligem Spin wie α-Teilchen, π-Mesonen etc.) stets symmetrisch in der Wellenfunktion auftreten. Diese Eigenart von Bosonen und Fermionen ist nicht nur
bei Zweiteilchensystemen gegeben. Liegen N identische Teilchen vor, so gilt
Φ(~x1 . . . ~xi . . . ~xj . . . ~xN ) =
(
+Φ(~x1 . . . ~xj . . . ~xi . . . ~xN )
für Bosonen
−Φ(~x1 . . . ~xj . . . ~xi . . . ~xN )
für Fermionen
(20.3)
bezüglich aller N (N − 1)/2 Paare von Koordinatentripeln.
Zur weiteren Erläuterung des Prinzips der Ununterscheidbarkeit betrachten
wir zwei freie und nicht wechselwirkende identische Teilchen. Der Hamiltonoperator ist rein kinetischer Natur,
H=
1 2
(~
p + p~22 ) .
2m 1
(20.4)
Die Schrödingergleichung
i~Φ̇(~x1 , ~x2 , t) = HΦ(~x1 , ~x2 , t)
(20.5)
kann durch den Separationsansatz ψ(~x1 , t)ϕ(~x2 , t) gelöst werden, wobei sich die
Einteilchenwellenfunktionen ψ(~x, t) und ϕ(~x, t) als ebene Wellen exp(i~k · ~x −
iE~k t/~) und E~k = ~2 k 2 /2m (oder Linearkombinationen solcher ebener Wellen)
erweisen. Allerdings kommen in der Natur keine Zustände vor, die das Produkt
ψ(~x1 )ϕ(~x2 ) als Wellenfunktion hätten. Wohl aber entspricht das symmetrisierte
Produkt
£
¤
ΦS (~x1 , ~x2 , t) = N ψ(~x1 , t)ϕ(~x2 , t) + ψ(~x2 , t)ϕ(~x1 , t)
(20.6)
einem möglichen Zustand zweier identischer Bosonen und das antisymmetrisierte Produkt
£
¤
ΦA (~x1 , ~x2 , t) = N ψ(~x1 , t)ϕ(~x2 , t) − ψ(~x2 , t)ϕ(~x1 , t)
(20.7)
einem möglichen Zustand zweier identischer Fermionen. Der in (20.6) und (20.7)
auftretende Normierungsfaktor N garantiert, dass die Zweiteilchenwellenfunktionen auf Eins normiert sind, wenn die Einteilchenwellenfunktionen diese Eigenschaft haben,
Z
Z
Z
Z
2
2
2
d3 x1 d3 x2 |ΦA,S (~x1 , ~x2 , t)| = d3 x1 |ψ(~x1 , t)| = d3 x2 |ϕ(~x1 , t)| = 1 .
(20.8)
√
Insbesondere hat der Normierungsfaktor den Wert N = 1/ 2, falls die beiden
Einteilchenwellenfunktionen orthogonal sind.
Aus (20.7) erkennen Sie, dass zwei identische Fermionen nicht in einunddemselben Einteilchenzustand sitzen können: für ψ = ϕ verschwindet das antisymmetrisierte Produkt ΦA Diese Konsequenz der Ununterscheidbarkeit identischer
Quanten ist als das Pauliprinzip bekannt. Für Bosonen besteht hingegen kein
Verbot der Mehrfachbesetzung eines Einteilchenzustandes.
20.1 Ununterscheidbarkeit identischer Teilchen
333
Sie sollten sich überlegen, dass aus drei normierten Einteilchenwellenfunktionen ϕ(~x), ψ(~x) und χ(~x) nur die folgenden (normierten) Dreiteilchenwellenfunktionen
1 £
ΦSA (~x1 , ~x2 , ~x3 ) = √ ϕ(~x1 )ψ(~x2 )χ(~x3 ) ± ϕ(~x1 )ψ(~x3 )χ(~x2 )
6
± ϕ(~x2 )ψ(~x1 )χ(~x3 ) + ϕ(~x2 )ψ(~x3 )χ(~x1 )
¤
±ϕ(~x3 )ψ(~x2 )χ(~x1 ) + ϕ(~x3 )ψ(~x1 )χ(~x2 )
(20.9)
gebildet werden können. Lesen sie wieder ab, dass ΦA verschwindet, wenn
zwei oder gar alle drei Einteilchenwellenfunktionen übereinstimmen, während
in ΦS Doppel- oder gar Dreifachbesetzung
√ eines Einteilchenzustandes durchaus
erlaubt ist. (Der Normierungsfaktor 1/ 6 ist allerdings nur für normierte und
wechselseitig orthogonale ϕ, ψ, χ richtig; suchen Sie den Normierungsfaktor für
die bei Bosonen möglichen Mehrfachbesetzungen ϕ = ψ ⊥ χ und ϕ = ψ = χ.)
Sie werden im Folgenden lernen, dass die verschiedene Besetzbarkeit von Einteilchenzuständen durch identische Fermionen (höchstens einfach) und Bosonen
(keine Beschränkung) sich makroskopisch manifestiert in verschiedenem Tieftemperaturverhalten von Gasen aus identischen Fermi- und Boseteilchen.
Denken wir uns nochmals zwei Identische Quanten ohne Wechselwirkung.
~ verschiedenen Orten lokalisiert, bezüglich dieser
Sie seien an um den Vektor X
Orte jedoch jedes für sich durch dieselbe Einteilchenwellenfunktion ψ beschrieben. Als gemeinsame Zweiteilchenwellenfunktion kommt nun nicht das Produkt
~ in Frage, sondern für Bosonen das symmetrisierte und für Ferψ(~x1 )ψ(~x2 − X)
mionen das antisymmetrisierte Produkt
i
1 h
~ ± ψ(~x1 − X)ψ(~
~
x2 ) .
(20.10)
ΦSA (~x1 , ~x2 ) = √ ψ(~x1 )ψ(~x2 − X)
2
Die entsprechende Wahrscheinlichkeitsdichte dafür, beide Teilchen am gleichen
Ort ~x zu finden, |Φ(~x, ~x)|2 , verschwindet offenbar für Fermionen (Pauliprinzip!)
während sie für Bosonen das Doppelte des Wertes beträgt, den sie für unter~ hätte.
scheidbare Teilchen, d. h. Φ = ψ(~x1 )ψ(~x2 − X),
Noch eine andere Erkenntnis ziehen wir aus (20.10). Sie müssen nicht ein auf
Ihrer Nasenspitze sitzendes Proton und ein anderes im Barte Ihres Großvaters
durch eine Wellenfunktion beschreiben, die antisymmetrisch unter Vertauschung
der respektiven Koordinatentripel ist. Ist nämlich die Wellenfunktion ψ(~x) in
(20.10) auf Eins normiert, so muss sie für hinreichend großes |~x| nach Null gehen.
Sei etwa |ψ(~x)|2 für |~x| > R auf vernachlässigbar kleine Werte abgefallen. Falls
~ den Radius“ R des
in der Zweiteilchenwellenfunktion (20.10) der Abstand |X|
”
Wellenpakets ψ überschreitet,
~ ÀR,
|X|
(20.11)
so können nie beide Summanden in (20.10) zugleich merklich von Null verschieden sein. Statt durch (20.10) können die beiden Teilchen dann durch das
Produkt
~
Φ(~x1 , ~x2 ) = ψ(~x1 )ψ(~x2 − X)
(20.12)
beschrieben werden, u. z. unabhängig davon, ob es sich um Bosonen oder Fermionen handelt.
334
20 Ideale Gase
Die soeben vorgestellte Überlegung erlaubt uns eine Abschätzung der Temperatur, unterhalb derer in einem idealen Gas identischer Teilchen die quantenmechanische Ununterscheidbarkeit derselben merklich wird, oberhalb derer
sich demnach auch Bose- und Fermigase gleich verhalten. Sie wissen bereits (s.
19.2), dass die Größenordnung der mittleren Energie pro Teilchen eines Gases
durch die Temperatur T festgelegt ist über E ≈ kB T . Diese Energie ist beim
idealen Gas rein kinetisch, so √
dass der Betrag des mittleren Impulses eines Teilchens von der Ordnung p ≈ mkB T ist. Die zugehörige Wellenlänge ~/p, die
thermische de Broglie Wellenlänge
p
λth = 2π~2 /mkB T ,
(20.13)
gibt die Größenordnung der prinzipiellen Grenze für die Lineardimension, mit
der wir uns die Teilchen des Gases räumlich lokalisiert denken dürfen. Wenn
der mittlere Teilchenabstand l ≈ (V /N )1/3 viel größer ist als die typische Ortsunschärfe (20.13) eines Teilchens,
l À λth ,
(20.14)
so können Quanteneffekte wie die Ununterscheidbarkeit identischer Teilchen
vernachlässigt werden. Dieser klassische Grenzfall wird für hinreichende Verdünnung und/oder genügend hohe Temperaturen erreicht. Aus der Gleichung
l = λth erhalten Sie die Temperatur, unterhalb welcher sich Quanteneffekte, also auch der Unterschied zwischen Bosonen und Fermionen deutlich bemerkbar
machen.
20.2
Thermische Photonen
(Plancksches Strahlungsgesetz)
Wir betrachten das elektromagnetische Feld im Innern eines Hohlraumes. Die
Atome in den Wänden, die den Hohlraum umschließen, emittieren und absorbieren fortwährend elektromagnetische Strahlung und wechselwirken auch untereinander. Die Wände und das elektromagnetische Feld seien miteinander im
thermischen Gleichgewicht.
~ x, t) im Hohlraum lässt sich als Superposition von
Das elektrische Feld E(~
ebenen monochromatischen transversalen Wellen
~ x, t) = ê ei(~k·~x−ω~k t)
E(~
(20.15)
darstellen, wobei die Frequenz ω~k und der Wellenvektor ~k durch die Dispersionsrelation
ω~k = c|~k|
(20.16)
verknüpft sind (s. 6.6). Der Einheitsvektor ê in (20.15) gibt die Polarisationsrichtung der Schwingung. Wegen der Transversalität der elektromagnetischen
Welle steht ê senkrecht zur Ausbreitungsrichtung
ê · ~k = 0 .
(20.17)
20.2 Thermische Photonen
335
Zu jedem Wellenvektor ~k gibt es demnach zwei unabhängige Wahlen für die
Orientierung des Einheitsvektors ê.
Die klassische Elektrodynamik erlaubt für jede der unabhängigen Wahlen
(20.15) eine beliebige komplexe Amplitude. Zur Behandlung der thermischen
Eigenschaften des Strahlungsfeldes müssen wir jedoch den Quantencharakter des
Feldes berücksichtigen und dazu jede der unabhängigen Schwingungen exp(−iω~k t)
als einen harmonischen Oszillator ansehen, der Energie nur in der diskreten
Einheit ~ω~k abgeben und aufnehmen kann. Die Energieeigenwerte eines solchen
Oszillators kennen Sie aus 13.1 als
µ
¶
1
ε~k,ê = ~ω~k n~k,ê +
,
(20.18)
2
wobei die Zahl der Quanten (hier Photonen) im Oszillator mit dem Wellenvektor
~k und der Polarisationsrichtung ê alle ganzzahligen Werte annehmen kann,
n~kê = 0, 1, 2, . . . .
(20.19)
Die Gesamtenergie des Strahlungsfeldes erhalten wir durch Summation der Beiträge aller unabhängigen Wellen als
X
E({n~k,ê }) =
n~k,ê ~ω~k + E0 .
(20.20)
~
k,ê
Die Grundzustandsenergie
E0 =
X
~ω~k /2 .
(20.21)
~
k,ê
will ich im Folgenden durch Neuwahl des Energienullpunktes zum Verschwinden
gebracht denken.
Die Form (20.20) der Gesamtenergie legt nahe, Photonen als Teilchen anzusehen. Indem Sie sich dieser Vorstellung hingeben, dürfen Sie jedoch nicht
außer Acht lassen, dass die Gesamtzahl der Photonen
X
(20.22)
N=
n~k,ê
~
k,ê
nicht fixiert ist, da die Beiträge n~k,ê der einzelnen Oszillatoren ganz unabhängig
voneinander sind. Im Übrigen ist diesen Teilchen Bosonencharakter zuzuweisen,
da gemäß (20.19) beliebig viele (anstatt höchstens eines) Teilchen der Sorte ~k, ê
vorkommen dürfen.
Um uns die thermischen Eigenschaften des Photonengases zu erschließen,
verwenden wir das kanonische Ensemble und berechnen zunächst die Zustandssumme
X
Z=
e−βE({n~k,ê }) .
(20.23)
{n~k,ê =0,1,2,...}
Hierin ist für jeden der durch ~k und ê nummerierten Oszillatoren über alle
möglichen Besetzungszahlen zu summieren. Nach Eintragen von (20.20) und
336
20 Ideale Gase
(20.16) können wir Z als das Produkt
Y
Z=
Z~k,ê
(20.24)
~
k,ê
Z~k,ê =
∞
X
n~k,ê =0
³
´
~ −1
e−β~ω~k n~k,ê = 1 − e−β~c|k|
schreiben. Da der Faktor Z~k,ê die Zustandssumme für den Oszillator mit Wellenvektor ~k und Polarisationsrichtung ê, für die beiden bei festem ~k möglichen
unabhängigen Richtungen ê den gleichen Wert hat, ergibt sich für die Zustandssumme
Y¡
~ ¢−2
Z=
1 − e−β~c|k|
,
(20.25)
~
k
oder
ln Z = − 2
X
~
k
¡
~ ¢
ln 1 − e−β~c|k| .
(20.26)
Das Produkt in (20.25) und die Summe in (20.26) laufen nur noch über alle
erlaubten Werte des Wellenvektors.
Welche Werte der Wellenvektor ~k annehmen darf, hängt (wie immer bei in
Kästen eingesperrten Wellen) von den Randbedingungen an der inneren Oberfläche des Hohlraumes und auch von der Form des Hohlraums ab. Universelle,
d. h. von der Form des Hohlraums unabhängige Aussagen können wir nur gewinnen für den Spektralbereich, in dem alle Wellenlängen λ = 2π/|~k| klein
sind gegenüber allen Lineardimensionen des Hohlraums. Für diesen Spektralbereich ist plausibel (und lässt sich zeigen), dass die erlaubten Wellenvektoren
bei Änderung der Randbedingungen unverändert bleiben. Wir nutzen die entsprechende Freiheit, denken uns den Hohlraum als von der Form eines Würfels
mit der Kantenlänge L und unterwerfen die ebenen Wellen (20.15) periodischen
Randbedingungen
~ + L, y, z) = E(x,
~
~
~
E(x
y + L, z) = E(x,
y, z + L) = E(x,
y, z) .
(20.27)
Für die erlaubten Wellenvektoren erhalten wir somit die Bedingungen
eikx L = eiky L = eikz L = 1 .
Die drei Komponenten von ~k haben also alle ganzzahligen Vielfachen von (2π/L)
als erlaubte Werte,
kx =
2π
nx ,
L
nx = 0, 1, 2, . . . .
(20.28)
Die Gültigkeit dieses Resultats ist allerdings beschränkt auf den Spektralbereich
λ = 2π/|~k| ¿ L, d. h.
¢1
2π
2π ¡ 2
nx + n2y + n2z 2 À
.
|~k| =
L
L
(20.29)
20.2 Thermische Photonen
337
Die Differenz zweier benachbarter Werte einer Wellenvektorkomponente beträgt nach (20.28)
∆k =
2π
.
L
(20.30)
Nach (20.29) ist diese Differenz sehr klein gegenüber allen durch (20.28) richtig
angegebenen erlaubten Wellenzahlen |~k|. Bei derart dicht liegenden Wellenvektoren können Wellenvektorsummen wie die in (20.26) durch Integrale ersetzt
werden. Unter Beachtung von (20.30) gewinnen wir die Ersetzungsvorschrift
µ ¶3 X
Z
X
L
V
−→
∆kx ∆ky ∆kz −→
d3 k .
(20.31)
2π
(2π)3
kx ,ky ,kz
kx ,ky ,kz
Für den Logarithmus der Zustandssumme erhalten wir nun das Integral
Z
³
´
V
3
−β~c|~
k|
d
k
ln
1
−
e
,
(20.32)
ln Z = −2
(2π)3
das wir wegen der Isotropie des Integranden am bequemsten in Kugelkoordinaten ausführen. Dabei gibt die Winkelintegration den Faktor
Zπ
dθ sin θ
0
Zπ
dϕ = 4π .
(20.33)
0
Die Integration über den Betrag des Wellenvektors ist von einer unteren Grenze
kmin À L1 entsprechend dem Gültigkeitsbereich (20.29) unserer Wellenvektorbestimmung bis ins Unendliche zu erstrecken,
1
ln Z = − 2 V
π
Z∞
kmin
¡
¢
dk k 2 ln 1 − e−β~ck .
(20.34)
Wir werden weiter unten sehen, dass die untere Integrationsgrenze kmin für
hinreichend hohe Temperaturen,
kB T À ~ c V −1/3 ,
(20.35)
ohne merklichen Fehler für das Integral nach Null verschoben werden darf,
1
ln Z = − 2 V
π
Z∞
0
¡
¢
dk k 2 ln 1 − e−β~ck .
(20.36)
Nach Übergang zu der dimensionslosen Integrationsvariablen x = β~ck erhalten
wir
Z∞
¡
¢
1
V
dx x2 ln 1 − e−x
ln Z = −
3
2
(β~c) π
0
und schließlich, mit Hilfe einer Integraltafel,
ln Z =
π2 V
.
45 (β~c)3
(20.37)
338
20 Ideale Gase
Jetzt sind uns alle thermischen Eigenschaften des Photonengases unmittelbar zugänglich. Nach (18.28) gilt für die mittlere Energie
¶
µ
π2 V
∂ ln Z
=
Ē = −
(kB T )4 .
(20.38)
∂β
15 (~c)3
V
Dieses Resultat können Sie lesen als das Produkt der mittleren thermischen
Energie pro Freiheitsgrad (Größenordnung kB T ) und der Zahl der im Volumen
V verfügbaren Freiheitsgrade des Feldes, deren Größenordnung mit Hilfe der
thermischen Wellenlänge λmax = 2πc/ωmax (siehe weiter unten für die Frequenz
maximaler Strahlungsintensität ωmax ) als V /λ3max ∝ V (kB T /~c)3 geschätzt werden kann.
Für den Druck, den Sie sich übrigens durch Stöße der Photonen gegen die
Kastenwand anschaulich machen können, erhalten wir gemäß (19.44)
¶
µ
1 Ē
π2 1
∂ ln Z
(kB T )4 =
.
(20.39)
=
p = kB T
3
∂V
45
(~c)
3
V
T
Bemerkenswerterweise ändert sich der Photonendruck bei isothermer (T = const)
Kompression nicht, da p bei T = const nicht vom Volumen V abhängt. Von
Interesse ist auch die durch
¶
µ
∂ Ē
(20.40)
CV =
∂T V
definierte Wärmekapazität bei konstantem Volumen, die wir aus (20.38) zu
CV =
4π 2 V
k4 T 3
15 (~c)3 B
(20.41)
erhalten.
Um schließlich die Verteilung der Gesamtenergie über die Strahlungsfrequenzen zu studieren, gehen wir zurück zum Integral (20.36) und ersetzen dort die
Wellenzahl k durch die Frequenz ω = ck als Integrationsvariable. Durch Differenzieren nach β gemäß (18.28) gewinnen wir die mittlere Energie in der Form
V~ 1
Ē = 3 2
c π
Z∞
3
dω ω (e
0
β~ω
− 1)
−1
≡V
Z∞
dω u(ω)
0
und lesen für die so genannte spektrale Energiedichte u(ω) das von Max Planck
im Jahr 1900 gefundene Plancksche Strahlungsgesetz ab
u(ω) =
1 ~ω 3 /c3
.
π 2 eβ~ω − 1
(20.42)
Die in Abbildung 20.1 gezeigte spektrale Energiedichte fällt exponentiell nach
Null für ω → ∞, verschwindet wie ω 2 für ω → 0 und hat ein Maximum bei der
Frequenz
ωmax = 2, 82kB T /~ .
(20.43)
Dieser lineare Zusammenhang zwischen der Frequenz maximaler Strahlungsintensität und der Temperatur ist als das Wiensche Verschiebungsgesetz bekannt.
20.2 Thermische Photonen
339
Abbildung 20.1
Sie können jetzt die Bedingung (20.35) für die Ersetzbarkeit der unteren
Integrationsgrenze kmin in (20.34) durch Null verstehen. Genau dann, wenn die
zu ωmax gehörige Wellenzahl kmax = ωmax /c groß ist gegenüber der inversen
Lineardimension V −1/3 des Hohlraums, so dass gilt
V −1/3 ¿ kmin ¿ kmax = 2, 82kB T /~c ,
(20.44)
erhält das Integral (20.36) einen vernachlässigbaren Beitrag aus dem Integrationsintervall 0 ≤ k ≤ kmin , ist also mit (20.34) praktisch gleich.
Das Plancksche Strahlungsgesetz kann experimentell verifiziert werden. Wenn
durch die Wand eines Hohlraums ein kleines Loch gebohrt und die sekündlich
pro Flächeneinheit des Lochs ins Frequenzintervall ∆ω bei der Frequenz ω nach
außen gestrahlte Energie cu(ω)∆w gemessen wird.
Alle hier für das Photonengas gewonnenen Resultate sind von wesentlich
quantenmechanischer Natur. Wenn Sie versuchen, durch den formalen Grenzübergang ~ → 0 Quanteneffekte zu eliminieren, so erhalten Sie weder für die
Energie, noch für den Druck und die Wärmekapazität wohldefinierte klassische
Grenzwerte sondern jeweils unsinnige Divergenzen. Lediglich der langwellige
(β~ω ¿ 1) Teil der spektralen Strahlungsdichte (20.42) hat einen sinnvollen
klassischen Grenzwert,
u(ω) =
1
kB T ω 2 /c3 ,
π2
(20.45)
der als das Rayleigh-Jeanssche Gesetz schon vor 1900 bekannt war, sowohl empirisch wie auf Grund klassischer statistischer Überlegungen. Die dem RayleighJeansschen Gesetz für ω → ∞ eigene Ultraviolettkatastrophe u(ω) → ∞ wird im
Planckschen Gesetz durch den für große Frequenzen auftretenden exponentiellen
Abschneidefaktor e−β~ω verhindert.
Max Planck benutzte bei der Konstruktion seiner Strahlungsformel (20.42)
die von ihm selbst zunächst ungeliebte ad hoc Annahme, dass das Strahlungsfeld bei der Frequenz ω Energie nur in diskreten Portionen ~ω abgeben und
aufnehmen könne. Die Annahme und ihre erste Konsequenz (20.42) markieren
den Beginn der Quantenphysik.
340
20.3
20 Ideale Gase
Thermische Phononen in Festkörpern
Wenn N Atome einen festen Körper bilden, so ist i. A. jedes einzelne an eine
Gleichgewichtslage gebunden, um die herum es Schwingungen ausführen kann.
Bei hinreichend kleinen Schwingungsamplituden sind die einzelnen Rückstellkräfte in guter Näherung linear in den Auslenkungen, so dass die Bewegung der
N Atome durch das Modell von 3N harmonischen Oszillatoren repräsentiert
werden kann. Zur gesamten Schwingungsenergie trägt der i-te Oszillator in
quantenmechanischer Behandlung einen der Werte
εi = ~ωi (ni + 1/2),
ni = 0, 1, 2, . . .
bei. Die möglichen Werte der Gesamtenergie lauten also
X
~ωi (ni + 1/2) .
E({ni }) =
(20.46)
(20.47)
i
Das Energiequantum ~ωi , das so genannte Phonon, kann wie das Photon als
Teilchen aufgefasst werden. Allerdings müssen wir wieder berücksichtigen, dass
die Gesamtzahl dieser Teilchen,
X
ni ,
(20.48)
N =
i
nicht festliegt, da die ni ganz unabhängig voneinander sind. Wie Photonen
haben auch Phononen Bosecharakter, da die ni beliebige ganzzahlige Werte
annehmen dürfen.
Um uns die thermischen Eigenschaften des Phononengases zu erschließen,
berechnen wir die kanonische Zustandssumme. Wie beim Photonengas ergibt
sie sich aus
X
ln Z = −
(20.49)
ln(1 − e−β~ωi ) ,
i
wobei die Grundzustandsenergie
P
i
~ωi /2 wieder unterdrückt ist. Die in (20.49)
auftretende Summe lässt sich durch ein Frequenzintegral approximieren, da die
Phononenfrequenzen bei makroskopischen Festkörpern sehr dicht liegen. Führen
wir eine spektrale Dichte ρ(ω) so ein, dass die Zahl der zwischen ω und ω + dω
liegenden Eigenfrequenzen 3N ρ(ω) dω beträgt. Damit ρ(ω) die Gesamtzahl 3N
die Schwingungen richtig wiedergibt, muss gelten
Z∞
dω ρ(ω) = 1 .
(20.50)
0
Für die Zustandssumme erhalten wir nun die Kontinuumsnäherung
ln Z = −3N
Z∞
0
dω ρ(ω) ln(1 − e−β~ω ) .
(20.51)
Die weitere Auswertung von Z gestaltet sich besonders einfach für tiefe Temperaturen, bei denen entsprechend ~ωi . kB T nur niederfrequente Schwingungen angeregt sind. Solche Schwingungen sind Ihnen als Schallwellen bekannt,
20.3 Thermische Phononen in Festkörpern
341
deren Wellenlängen λi = 2πc/ωi den mittleren Atomabstand im Festkörper
(≈ 1 Å = 10−10 m) um mindestens einige Größenordnungen überschreiten. Bezüglich derart langwelliger Schwingungen bleibt die atomistische Struktur unerheblich und der Festkörper verhält sich wie ein elastisches Kontinuum.
Die Abzählung der elastischen Schwingungen mit Frequenzen zwischen ω
und ω + dω erfolgt ganz ähnlich wie die Abzählung der elektromagnetischen
Schwingungen, die wir im letzten Paragrafen vorgenommen haben. Als wesentlicher Unterschied ist nur zu beachten, dass das elastische Kontinuum auch
räumlich und zeitlich periodische Dichteschwankungen (Kompressionswellen)
durchführen kann. Kompressionswellen werden auch als longitudinale Wellen
bezeichnet, weil bei ebenen monochromatischen Kompressionswellen die Auslenkung eines Massenelements aus der Gleichgewichtslage stets parallel zum
Wellenvektor verläuft. Langwellige Kompressionswellen in elastischen Kontinua
sind erfahrungsgemäß durch die Dispersionsrelation
ω(~k) = cl |~k|
(20.52)
gekennzeichnet, wobei cl die so genannte longitudinale Schallgeschwindigkeit
ist. Wie im elektromagnetischen Feld treten auch im elastischen Kontinuum
für jeden Wellenvektor ~k zwei unabhängige transversale Wellen (hier Scherwellen genannt) auf, bei denen die Auslenkung eines Massenelements aus der
Gleichgewichtslage senkrecht zu ~k steht. Niederfrequente Scherwellen haben die
Dispersionsrelation
ω(~k) = ct |~k| .
(20.53)
Die hier auftretende Schallgeschwindigkeit ct ist i. A. von cl verschieden. Sowohl
(20.52) wie (20.53) sind formgleich mit der Dispersionsrelation elektromagnetischer Wellen.
Wir nehmen nun wie in 20.2 an, dass die räumliche Ausdehnung des Systems
so groß ist, dass die genaue Art der Randbedingungen an der Oberfläche für die
Abzählung der Eigenfrequenzen im interessanten Teil des Spektrums unerheblich bleibt. Aus (20.34) können wir dann die Zahl der Wellen im Frequenzintervall dω bei ω als V ω 2 dω/π 2 c3 ablesen für den Fall, dass zu einem Wellenvektor zwei unabhängige Wellen gehören. Im Fall von Schallwellen müssen wir
für jeden Wellenvektor eine longitudinale und zwei transversale Schwingungen
berücksichtigen und als spektrale Dichte
¶
µ
2
1
V
ω2
(20.54)
+
3N ρ(ω) =
2π 2 c3t
c3l
in Rechnung stellen.
Das Phononenspektrum kann durch (20.54) nur für solche Wellenlängen gut
wiedergegeben werden, die groß gegenüber dem mittleren Atomabstand a sind,
also für
ω ¿ c/a ,
(20.55)
wobei c für ct oder cl steht. Bei der Verwendung der spektralen Dichte (20.54)
zur Berechnung der Zustandssumme gemäß (20.51),
V
ln Z = − 2
2π
µ
2
1
+ 3
c3t
cl
¶ Z∞
0
dω ω 2 ln(1 − e−β~ω ) ,
(20.56)
342
20 Ideale Gase
wird, da die Frequenzintegration bis zu unendlich großen Frequenzen läuft, der
Gültigkeitsbereich (20.55) von (20.54) verlassen. Für hinreichend tiefe Temperaturen,
kB T ¿ ~c/a ,
(20.57)
entsteht dadurch jedoch kein merklicher Fehler, da der Integrand in (20.56)
für ~ω > kB T mit wachsendem ω exponentiell abfällt, das Integral also seine
dominierenden Beiträge aus dem Intervall 0 ≤ ~ω . kB T bezieht.
Wie im 20.2 aus (20.36) erhalten wir nun aus (20.56) die Energie, die Wärmekapazität und den Druck des Phononengases zu
µ
¶
¶
µ
π2 V
2
1
∂ ln Z
=
+ 3 (kB T )4 ,
(20.58)
Ē = −
∂β
30 ~3 c3t
cl
V
¶
µ
¶
µ
2π 2 V
2
1
∂ Ē
4 3
T
(20.59)
=
+ 3 kB
CV =
∂T V
15 ~3 c3t
cl
bzw.
p = kB T
µ
∂ ln Z
∂V
¶
T
π2 1
=
90 ~3
µ
1
2
+ 3
c3t
cl
¶
(kB T )4 =
Ē
.
3V
(20.60)
Die Proportionalität der Wärmekapazität zur dritten Potenz der Temperatur
ist für elektrisch nicht leitende Festkörper im Grenzfall (20.57) empirisch gut
bestätigt. Wir schließen aus diesem Befund, dass das thermische Tieftemperaturverhalten solcher Substanzen durch Phononen dominiert ist.
Für kristalline Festkörper, bei denen Atome nur einer Sorte auf Gitterplätzen
angeordnet sind ( einatomige“ Kristalle), erlauben die Überlegungen dieses Pa”
ragrafen auch qualitative Aussagen über das Hochtemperaturverhalten der Phononen. Das Phononenspektrum entnehmen wir dem so genannten Debyemodell,
in welchem das Phononenspektrum (20.54) als für alle Frequenzen gültig angesehen wird bis hinaus zu einer Grenzfrequenz, der Debyefrequenz ωD . Für
Frequenzen ω > ωD wird ρ(ω) Null gesetzt. Dementsprechend wird die Debyefrequenz aus der Normierungsforderung
3N
ZωD
dω ρ(ω) = 3N
(20.61)
0
zu
ωD =
½
V
18π 2 N
µ
2
1
+ 3
3
ct
cl
¶¾−1/3
(20.62)
bestimmt. Die zugehörigen Debye-Wellenlängen sind also von der Größenordnung
des mittleren Teilchenabstands. Der Erwartungswert der Gesamtenergie der
Phononen ergibt sich dann als
Ē = −
µ
∂ ln Z
∂β
¶
V
3~
= 3N 3
ωD
ZωD
0
dω
ω3
.
eβ~ω − 1
(20.63)
20.4 Das ideale Bosegas
343
Nach Übergang zur dimensionslosen Integrationsvariablen y = β~ω können wir
die Energie Ē durch die Debyefunktion
D(x) =
3
x3
Zx
0
dy y 3 /(ey − 1)
ausdrücken,
Ē = 3N kB T D
µ
~ωD
kB T
¶
.
(20.64)
(20.65)
Dieses Resultat reduziert sich für tiefe Temperaturen wegen D(x) → π 4 /5x3
für x → ∞ auf das sehr viel universellere (alle festen Substanzen!) Ergebnis (20.58). Im Grenzfall hoher Temperaturen vereinfacht sich (20.65) wegen
D(x) → 1 für x → 0 (vgl. Abbildung 20.2) zu
Ē → 3N kB T
für
kB T À ~ωD .
(20.66)
Den Grenzfall (20.66) dürfen wir auch als klassischen Grenzfall bezeichnen,
Abbildung 20.2
da der Hochtemperaturwert der Energie aus (20.65) auch durch den formalen Übergang ~ → 0 gewonnen werden kann. Für den Phononenbeitrag zur
Wärmekapazität des einatomigen“ Kristalls erhalten wir aus (20.66) das em”
pirisch gut gesicherte Dulong-Petit-Gesetz
µ
¶
∂ Ē
CV =
→ 3N kB
für
kB T À ~ωD .
(20.67)
∂T V
Auf mehratomige“ Kristalle sind (20.66) und (20.67) nicht anwendbar, da
”
in diesen Systemen neben den hier in Rechnung gestellten Schwingungen (den
akustischen Phononen) weitere Schwingungen (so genannte optische Phononen)
auftreten. Die Frequenzen optischer Phononen liegen meist sämtlich oberhalb
ωD . Daher beeinflussen optische Phononen zwar nicht das thermische Tieftemperaturverhalten (kB T < ~ωD ), wohl aber die thermischen Eigenschaften für
hohe Temperaturen (kB T > ~ωD ).
20.4
Das ideale Bosegas
Denken wir uns N identische wechselwirkungsfreie Boseteilchen (der Einfachheit halber mit Spin Null) in einem würfelförmigen Kasten der Kantenlänge
344
20 Ideale Gase
L = V 1/3 eingesperrt und nehmen periodische Randbedingungen für die N Teilchenwellenfunktion ψ(~x1 , ~x2 , . . . , ~xN ) an. Die Schrödingergleichung kann
durch einen Separationsansatz gelöst werden, der für jedes Teilchen eine ebene
Welle exp(i~k · ~x) in Rechnung stellt. Die möglichen Impulse ~~k eines Teilchens
sind dann durch die Randbedingung
eikx L = eiky L = eikz L = 1
(20.68)
auf Tripel (~kx , ~ky , ~kz ) ganzzahliger Vielfacher von ~2π/L festgelegt,
kx L/2π = 0, ±1, ±2, . . . , y .
(20.69)
Die entsprechenden Einteilchenenergien lauten
ε~k =
~2~k 2
.
2m
(20.70)
Die möglichen Gesamtenergien sowie die Gesamtteilchenzahl lassen sich durch
X
E({n~k }) =
(20.71)
n~k ε~k
~
k
bzw.
N=
X
n~k
(20.72)
~
k
ausdrücken, wobei der Zahl n~k der Teilchen mit Impuls ~k alle nichtnegativen
ganzzahligen Werte offenstehen.
Die Erschließung der thermischen Eigenschaften des idealen Bosegases über
die kanonische Zustandssumme
Z(N, V, T ) =
P
Nebenbedingung
n~k ε~k
−β
X
e
(20.73)
~
k
{n~k =0,1,2,...}
ist hier viel schwieriger als beim Photonen- und beim Phononengas, da die
Besetzungszahlen n~k nicht unabhängig voneinander sind, sondern der Nebenbedingung (20.72) scharfer Gesamtzahl der Teilchen genügen. Wesentlich leichter
zu berechnen ist die großkanonische Zustandssumme (s. 18.6)
ZG (µ, V, T ) =
∞
X
eβµN Z(N, V, T )
N =0
=
∞
X
N =0
Nebenbedingung
X
{n~k }

exp −β
X
~
k

n~k (ε~k − µ) .
(20.74)
Die hier auftretende Kombination der Summen über die durch (20.72) eingeschränkten Besetzungszahlen n~k mit der Summe über alle möglichen Gesamtteilchenzahlen N ist äquivalent mit uneingeschränkten Summationen über alle n~k ;
20.4 Das ideale Bosegas
345
die wir wie beim Photonengas auf geometrische Reihen zurückführen können,




∞
Y X
X
X
¡
¢

exp −βn~k (ε~k − µ) 
n~k (ε~k − µ) =
exp −β
ZG (µ, V, T ) =
=
Y
~
k
"
~
k
~
k
{n~k }
¡
1 − exp −β(ε~k − µ)
¢
#−1
n~k =0
.
(20.75)
Zu beachten ist, dass die geometrischen Reihen in (20.75) nur dann konvergieren,
wenn gilt
£
¤
exp −β(ε~k − µ) < 1
und insbesondere, für ~k = 0,
z ≡ eβµ < 1 ⇐⇒ µ < 0 .
(20.76)
Wir folgern, dass das chemische Potential µ beim idealen Bosegas keine positiven
Werte annehmen kann.
Gemäß 19.3 erhalten wir den Druck und die mittlere Teilchenzahl aus der
großkanonischen Zustandssumme zu
βp =
¡ ∂ ln ZG ¢
∂ X
=−
ln(1 − ze−βε~k )
T,µ
∂V
∂V
(20.77)
~
k
bzw.
N̄ =
µ
∂ ln ZG
∂βµ
¶
=
T,V
X
~
k
z e−βε~k
.
1 − z e−βε~k
(20.78)
Die mittlere Gesamtzahl der Teilchen N̄ stellt sich dabei dar als Summe der
Mittelwerte n̄~k der Besetzungszahlen n~k für die Einteilchenenergieniveaus ε~k
mit
n̄~k =
z e−βε~k
1
.
= β(ε −µ)
~
k
1 − z e−βε~k
e
−1
(20.79)
Die Zustandsgleichung des idealen Bosegases erhalten wir schließlich durch Elimination des chemischen Potentials µ bzw. des Parameters z aus (20.77) und
(20.78).
Zur weiteren Auswertung von (20.77) und (20.78) idealisieren wir das betrachtete Vielteilchensystem, indem wir die mittlere Gesamtzahl der Teilchen
und das Volumen über alle Grenzen wachsen lassen, die Anzahldichte der Teilchen aber konstant halten. In diesem so genannten thermodynamischen Limes,
N̄ → ∞,
V → ∞,
N̄ /V = ρ = const ,
(20.80)
bilden gemäß (20.69) die möglichen Impulse ~~k und somit die Energieeigenwerte ε~k Kontinua, so dass wir die Impulssummen in (20.77) und (20.78) gemäß
346
20 Ideale Gase
(20.31) durch Integrale ersetzen können. Andererseits werden wir gleich sehen, dass in diesem Grenzfall ein Überschreiten des Verbots (20.76) möglich
wird. Ich verschiebe die Diskussion der dann auftretenden Singularität auf den
nächsten Paragrafen und beschränke die hiesigen Rechnungen ausdrücklich auf
den Bereich µ < 0.
Wenn die erwähnten Wellenvektorintegrale in Kugelkoordinatendarstellung
für ~k durchgeführt werden und statt |~k| die dimensionslose Integrationsvariable
x = βε~k eingeführt wird, so entsteht aus (20.77) und (20.78)
βp =
1
g(z)
λ3
1
N̄
= 3 zg 0 (z) ,
V
λ
(20.81)
(20.82)
wobei zur Vereinfachung der Schreibweise die thermische de Broglie Wellenlänge
p
λ = 2π~2 /mkB T
(20.83)
und die Funktion
2
g(z) = − √
π
Z∞
dx
√
0
x ln(1 − ze−x )
(20.84)
benutzt sind.
Für die nachfolgende Überlegung sind die im Bereich 0 ≤ z ≤ 1 gültigen
Taylorreihen
g(z) =
∞
X
z l /l5/2
l=1
zg 0 (z) =
∞
X
z l /l3/2
(20.85)
g(1) = 1, 342 . . .
(20.86)
l=1
und die Zahlenwerte
g 0 (1) = 2, 612 . . . ,
von Bedeutung. Abbildung 20.3 zeigt den Verlauf der Funktion zg 0 (z). Beachten
Sie den vertikalen Anstieg für z → 1.
Sie entnehmen dem skizzierten Verlauf von zg 0 (z) und der Gleichung (20.82),
dass die Bedingung (20.76) erfüllt bleibt für
ρλ3 < g 0 (1) = 2, 612 . . . ,
(20.87)
d. h. wenn das Gas so verdünnt oder die Temperatur so hoch ist, dass der mittlere Atomabstand ρ−1/3 größer ist als die mit g 0 (1)−1/3 = 0, 726 . . . multiplizierte
thermische de Broglie Wellenlänge. In diesem Bereich, in dem allein die hier
gegebene Betrachtung richtig ist, heißt das Bosegas nicht entartet. Die Gewinnung der Zustandsgleichung durch Elimination von z aus (20.81) und (20.82)
ist nun auf numerischem Wege vorzunehmen.
Eine einfache geschlossene Form der Zustandsgleichung ergibt sich allerdings
im klassischen Grenzfall λ → 0, den Sie sich formal als ~ → 0 oder physikalisch
20.4 Das ideale Bosegas
347
Abbildung 20.3
als Grenzfall hoher Temperaturen vorstellen können. Da für λ → 0 die rechten
Seiten in (20.81) und (20.82) zweifellos endlich bleiben müssen, sind die Funktionen g(z) und zg 0 (z) zum Verschwinden gezwungen. Den Taylorreihen (20.85)
entnehmen Sie aber, dass dann auch z nach Null gehen muss. Wegen
g(z) = z + · · · ,
zg 0 (z) = z + · · ·
(20.88)
werden die rechten Seiten in (20.81) und (20.82) dann einander gleich. Die
Elimination von z wird trivial und ergibt die Ihnen wohlbekannte Zustandsgleichung des klassischen idealen Gases
pV = N̄ kB T .
(20.89)
Abweichungen vom klassischen Verhalten werden wichtig, wenn der mittlere
Teilchenabstand nicht mehr um Größenordnungen größer ist als die thermische
de Broglie Wellenlänge. Solche Abweichungen sind sämtlich Quanteneffekte,
die von der in 20.1 besprochenen Nichtunterscheidbarkeit identischer Teilchen
herrühren.
Von Interesse ist auch die kalorische Zustandsgleichung des nicht entarteten
Bosegases. Wir erhalten sie aus der großkanonischen Zustandssumme durch
Berechnung der mittleren Energie
¶
µ
3 kB T V
∂ ln ZG
=
g(z) .
(20.90)
Ē = −
∂β
2 λ3
V,z
Unter Verwendung von (20.81) entsteht hieraus
3
Ē
= p.
V
2
(20.91)
Im klassischen Grenzfall ρ−1/3 À λ dürfen wir die Zustandsgleichung (20.89)
benutzen und finden die Energie pro Teilchen als
3
kB T .
(20.92)
2
Wegen der angenommenen Abwesenheit jeder Wechselwirkung zwischen den
Teilchen und der Vernachlässigung von Quanteneffekten hängt die Energie Ē/N̄
hier nicht vom mittleren Teilchenabstand ρ−1/3 ab.
Ē/N̄ =
348
20.5
20 Ideale Gase
Bose-Einstein-Kondensation
Im letzten Paragrafen musste der Fall hoher Dichte und/oder niedriger Temperatur entsprechend
n̄ 3
λ ≥ g 0 (1) = 2, 612 . . .
V
(20.93)
ausdrücklich ausgeschlossen werden, u. z. nicht etwa weil er physikalisch unsinnig wäre, sondern weil die dort gegebene Rechnung versagt. Den Grund des
Versagens erkennen Sie durch nochmaliges Ansehen von (20.82) und des Graphen der Funktion zg 0 (z). Für ρλ3 → g 0 (1) gehen z nach 1 und das chemische
Potential µ nach Null. Im Logarithmus der Zustandssumme gemäß (20.75)
ln ZG = −
X
~
k
ln(1 − ze−βε~k ) ,
(20.94)
wächst daher der Summand zu verschwindendem Wellenvektor wie − ln(1 − z)
über alle Grenzen. Andererseits wird dieser Summand beim Übergang zum
Integral gemäß
X
~
k
V
→
(2π)3
Z
V
d k=
4π
(2π)3
3
Z∞
dk k 2
(20.95)
0
durch den im Integrationselement d3 k auftretenden Faktor k 2 komplett unterdrückt.
Um den Grenzfall z → 1 mit behandeln zu können, müssen wir vor dem
Übergang (20.95) zum Integral den Summanden mit ~k = 0 in (20.94) isolieren,
denn für Werte von z hinreichend nahe bei 1 wird dieser Summand größer als
der Rest der Summe, der wie in 20.4 durch ein Integral ersetzt werden kann,
ln ZG = − ln(1 − z) +
V
g(z)
λ3
(20.96)
Für den Druck ergibt sich hieraus unverändert (20.81), da beim Differenzieren nach dem Volumen Temperatur und chemisches Potential, also auch der
Parameter z = eβµ konstant zu halten sind,
βp =
1
g(z) ,
λ3
(20.97)
während die mittlere Teilchendichte sich gegenüber (20.82) genau entsprechend
der mittleren Besetzungsdichte des Einteilchengrundzustands,
N̄0
1 z
≡ ρ0 =
.
V
V 1−z
(20.98)
erhöht auf
N̄
1
= ρ = ρ0 + 3 zg 0 (z) .
V
λ
(20.99)
20.5 Bose-Einstein-Kondensation
349
Im thermodynamischen Limes ist die Raumdichte der Teilchen mit verschwindendem Impuls nur dann von Null verschieden, wenn der Parameter z
gleich Eins ist. Sie sehen das nach Auflösen von (20.98) nach z,
z=
ρ0 V
→1
ρ0 V + 1
ρ0 6= 0 .
für
(20.100)
Solange also im thermodynamischen Limes z < 1 bleibt, gelten unverändert alle
Resultate von Kapitel 20.4. Insbesondere ist dann die Dichte ρ gemäß (20.87)
beschränkt. Überschreitet dagegen die Dichte ρ den Wert g 0 (1)/λ3 um
ρ0 = ρ −
1 0
g (1) ,
λ3
(20.101)
so hat der Parameter z für alle Temperaturen und Dichten im Bereich (20.93)
den konstanten Wert 1. Wir sprechen dann vom entarteten Bosegas.
Der Übergang von verschwindendem zu endlichem ρ0 heißt Bose-Einstein
Kondensation. Er erfolgt, wie Sie aus (20.101) ersehen, bei beliebig vorgegebener
Temperatur für die kritische“ Dichte
”
¶3/2
µ
mkB
0
3
0
T 3/2
(20.102)
ρBEK (T ) = g (1)/λ = g (1)
2π~2
und bei beliebig vorgegebener Dichte an der kritischen“ Temperatur
”
µ
¶
2π~2
ρ2/3 .
(20.103)
TBEK (ρ) = g 0 (1)−2/3
mkB
Für den Bruchteil der in den Einteilchenzustand niedrigster Energie kon”
densierten“ Atome folgt aus (20.101, 20.102, 20.103)
ρBEK
=1−
ρ0 /ρ = 1 −
ρ
µ
T
TBEK
¶3/2
.
(20.104)
Insbesondere sind am absoluten Nullpunkt der Temperatur alle Teilchen kon”
densiert“. Dieser Sachverhalt ist auch unmittelbar einsichtig, denn der Grundzustand eines Systems aus N wechselwirkungsfreien identischen Bosonen ist
offenbar der Zustand, für den jedes Teilchen im Einteilchenzustand niedrigster
Energie sitzt (Abbildung 20.4).
Weitere Einsicht in die Kondensation gewinnen wir durch Diskussion des
Zusammenhangs zwischen Druck und Dichte bei konstanter Temperatur, der so
genannten Isothermen. Aus (20.97) und (20.100) folgern wir, dass der Druck
längs der Isothermen für ρ ≥ ρBEK von der Dichte unabhängig ist (s. Abbildung
20.5). Für ρ < ρBEK nimmt der Druck monoton mit fallender Dichte ab, da
gemäß (20.85) sowohl g(z) wie zg 0 (z) monoton abfallen, während z von 1 nach 0
geht. Insbesondere geht p → 0 für ρ → 0 (s. a. obige Diskussion des klassischen
Grenzfalls). Bei ρ = ρBEK verläuft die Isotherme stetig. Unter Benutzung
von (20.81) und (20.82) überzeugen Sie sich auch leicht von der Stetigkeit der
Ableitung (∂p/∂ρ)T bei ρ = ρBEK Für ρ < ρBEK gilt nämlich
µ ¶
µ ¶
kB T
d
∂z
∂p
= 3 g 0 (z)
= kB T g 0 (z)/ (zg 0 (z)) ,
(20.105)
∂ρ T
λ
∂ρ T
dz
350
20 Ideale Gase
Abbildung 20.4
Abbildung 20.5
und aus
∞
X zl
d
(zg 0 (z)) =
→∞
dz
l1/2
l=1
für
z→1
(20.106)
folgt
µ
∂p
∂ρ
¶
T
→0
für
z → 1, d. h. für ρ → ρBEK .
(20.107)
Wenn Sie aus der nebenstehenden Skizze die Druckabhängigkeit des Volumens
1/ρ pro Teilchen ablesen, so konstatieren Sie, dass das System p > kB T g(1)/λ3
ein verschwindendes Volumen einnimmt. Dieses unphysikalische Verhalten liegt
daran, dass die Teilchen durch keinerlei Kräfte an beliebiger Annäherung zueinander gehindert werden und somit auch als punktförmig vorgestellt werden
können. Bei Verkleinerung des Druckes springt die Dichte bei p = kB T g(1)/λ3
unstetig auf den Wert g 0 (1)/λ3 . Derartige unstetige Dichteänderungen auf Isothermen sind Ihnen aus anderem Zusammenhang bekannt, u. z. etwa vom Übergang einer Substanz aus der flüssigen in die gasförmige Phase. Sie können die
20.5 Bose-Einstein-Kondensation
351
Bose-Einstein Kondensation auch als einen Phasenübergang auffassen, bei dem
das nichtentartete Bosegas in ein ausdehnungsloses Kondensat übergeht.
Eine andere interessante Singularität tritt bei der Bose-Einstein Kondensation in der Wärmekapazität CV = (∂ Ē/∂T )V auf. Wir erhalten sie aus der
mittleren Energie

3 kB T


g(z) für T > TBEK


µ
¶
 2 λ3
1 ∂ ln ZG
=
(20.108)
Ē/V = −

V
∂β

V,z


 3 kB T g(1) für T < TBEK
2 λ3
zu
CV /V =

15
9
d


kB λ−3 g(z) − kB ρg 0 (z)/ (zg 0 (z))


4
dz
4




 15 kB λ−3 g(1)
4
für T > TBEK
(20.109)
für T < TBEK .
d
Wegen der schon in (20.106) erwähnten Eigenschaft dz
(zg 0 (z)) → ∞ für z läuft
die Wärmekapazität stetig durch T = TBEK . Ihre Ableitung (∂CV /∂T )V macht
jedoch einen endlichen Sprung an der Kondensationstemperatur, so dass C V
selbst dort eine Spitze aufweist (Abbildung 20.6).
Beachten Sie auch, dass die Wärmekapazität für T < TBEK wie T 3/2 mit
T → 0 verschwindet, also langsamer als die Wärmekapazität des Photonen und
des Phononengases.
Abbildung 20.6
Kein reales System verhält sich strikt wie ein ideales Bosegas. Zwar ist die
Wechselwirkung der Teilchen in realen Bosegasen bei hinreichend hohen Temperaturen und/oder geringen Dichten vernachlässigbar, jedoch sind in diesem
Grenzfall Quanteneffekte meist völlig unwichtig. Jedoch stellt z. B. der Phasenübergang vom flüssigen zum suprafluiden Zustand in 4 He bei der Temperatur
Tλ = 2, 17 ◦ K einen der Bose-Einstein Kondensation des idealen Bosegases verwandten Quanteneffekt dar. Der Quantencharakter des Übergangs ist aus der
352
20 Ideale Gase
Tatsache ersichtlich, dass die thermische de Broglie Wellenlänge für Heliumatome bei T = Tλ etwa 6 Å beträgt und somit größer ist als der mittlere Atomabstand. Andererseits ist der mittlere Abstand der He Atome vergleichbar mit
der Reichweite der interatomaren Wechselwirkung, so dass letztere keinesfalls
vernachlässigbar ist.
In gasförmigem atomaren Wasserstoff, bei dem die Elektronenspins der einzelnen Atome durch ein starkes Magnetfeld alle parallel orientiert sind (spinpolarisierter atomarer Wasserstoff ), wird ein Übergang zu einer suprafluiden Phase
erwartet und derzeit experimentell gesucht. Bei einer Anzahldichte entsprechend einem mittleren Atomabstand von etwa 20 Å sollte die Übergangstemperatur
bei etwa 70 ◦ mK liegen. Da die Wechselwirkung von H-Atomen mit parallelen Elektronenspins schwach ist und eine Reichweite von wenig mehr als 1 Å
hat, sollte die interatomare Wechselwirkung auf den erwarteten Übergang nur
mäßigen Einfluss haben, der Übergang selbst also eng verwandt sein mit der
Bose-Einstein Kondensation des idealen Bosegases.
20.6
Das ideale Fermigas
Wegen des Pauliprinzips unterscheidet sich das Tieftemperaturverhalten des
idealen Fermigases radikal von dem des idealen Bosegases. Schon im bei T = 0
vorliegenden Grundzustand zeigt sich eine drastische Verschiedenheit. Während
N identische Bosonen als Grundzustand den N -fach besetzten Einteilchengrundzustand haben, dürfen keine zwei Fermionen in ein und demselben Einteilchenzustand sitzen. Zu bedenken ist allerdings, dass alle Fermionen einen (halbzahligen) Spin tragen. Bei festem Impuls ~~k kann ein Fermion mit Spin s in
(2s + 1) verschiedenen Spinzuständen vorliegen, die sich durch die Orientierung
des Spins relativ zu einer beliebigen Richtung unterscheiden. Ein Einteilchenzustand mit Impuls ~~k und Energie εk = ~2~k 2 /2m kann also durch identische
Fermionen bis zu (2s + 1)-fach besetzt sein.
Der Grundzustand von N identischen freien Fermionen entsteht gemäß dem
Pauliprinzip durch sukzessive Auffüllung der niedrigsten Einteilchenniveaus.
Das höchste so besetzte Einteilchenniveau, die so genannte Fermienergie
εF ≡
ergibt sich aus
N = (2s + 1)
X
~
k
wobei θ(x) die Sprungfunktion
θ(x) =

1
0
~2 kF2
,
2m
(20.110)
θ(εF − ~2~k 2 /2m) ,
(20.111)
für
x>0
für
x<0
bezeichnet. Die Wellenvektorsumme in (20.111) kann durch ein Integral approximiert werden,
V
N = (2s + 1)
4π
(2π)3
ZkF
0
dk k 2 ,
20.6 Das ideale Fermigas
353
wonach sich die Wellenzahl kF als Funktion der Teilchendichte aus
N
(2s + 1)
(2s + 1) 3
=ρ=
kF =
(2mεF /~2 )3/2
2
V
6π
6π 2
(20.112)
ergibt.
Die Grundzustandsenergie des N -Teilchensystems berechnet sich als Summe
der N niedrigsten Einteilchenenergien,
E0 = (2s + 1)
X
~
k
V
4π
ε~k θ(εF − ε~k ) = (2s + 1)
(2π)3
ZkF
dk k 2 ε~k .
(20.113)
0
Mit Hilfe von (20.111) und (20.112) erhalten wir das einfache Resultat
E0 =
3
εF N
5
(20.114)
und hieraus für den Druck
p0 = −
µ
∂E0
∂V
¶
=
N
2 N
2 E0
εF =
.
5 V
3 V
(20.115)
Im Gegensatz zum idealen Bosegas zeigt das Fermigas beim absoluten Nullpunkt einen endlichen Druck, muss also durch ein Gefäß an der Verflüchtigung
gehindert werden. Der physikalische Grund hierfür ist im Pauliprinzip zu sehen: das Verbot beliebiger Annäherung identischer Fermionen manifestiert sich
in einer Zunahme der Energie des Gases bei Verkleinerung des Volumens.
Der soeben charkterisierte Grundzustand des idealen Fermigases wird oft
als Fermisee bezeichnet. Er ist charakterisiert durch voll besetzte Einteilchenniveaus bis hinauf zur Fermienergie und leere Niveaus darüber. Der scharfe
Übergang von besetzt zu unbesetzt drückt sich in den Ausdrücken (20.111)
für die Teilchenzahl N und (20.113) für die Grundzustandsenergie E0 in der
Sprungfunktion θ(εF − ε~k ) aus. Bei endlichen Temperaturen, denen wir uns
jetzt zuwenden, wird dieser scharfe Übergang auf der thermischen Energieskala
kB T ausgeschmiert.
Zur Behandlung des idealen Fermigases bei endlichen Temperaturen berechnen wir wie im Bosefall die großkanonische Zustandssumme


X
X
ZG (µ, V, T ) =
exp −β
n~k,m (ε~k − µ)
(20.116)
{n~k,m }
=
+s
Y Y
~
k m=−s
=
Y
~
k




1
X
~
km
1
X
n~k,m =0
n~k,m =0

e−β(ε~k −µ) 
2s+1
e−β(ε~k −µ) 
.
Vorstehend wurden die Besetzungszahlen n~km eingeführt für Einteilchenzustände
zu festem Wellenvektor ~k und fester Spinorientierungsquantenzahl m. Letztere
354
20 Ideale Gase
hat für Spin-s Teilchen die 2s + 1 möglichen Werte m = −s, −s + 1, . . . , s. Bei
festem ~k und m darf die Besetzungszahl n~km nur die Werte
n~km = 0
oder
1
(20.117)
annehmen. Die Summationsvorschriften für die Besetzungszahlen n~km und
die Spinorientierungsquantenzahl m sind in den letzten beiden Gliedern von
(20.116) schon berücksichtigt. Die Zustandssumme (20.116) kann somit gemäß
X ¡
¡
¢¢
ln ZG = (2s + 1)
ln 1 + exp −β(ε~k − µ)
(20.118)
~
k
vereinfacht werden. Dabei ist wichtig, daß die Einteilchenenergien ε~k = ~2~k 2 /2m
nicht von der Spinorientierung abhängen (Wir setzen Abwesenheit eines Magnetfeldes voraus!).
Durch Differenziation nach dem chemischen Potential erhalten wir die mittlere Teilchenzahl als Summe der mittleren Zahl von Teilchen mit Impuls ~~k und
Spinorientierung m,
X
X
N̄ =
n̄~km = (2s + 1)
(20.119)
n̄~km ,
~
km
n̄~km =
~
k
1
£
¤
.
exp β(ε~k − µ) + 1
(20.120)
Ab hier beschränken wir uns einfachheitshalber auf Spin- 12 Teilchen, setzen also
2s + 1 = 2; bitte prüfen Sie Ihr Verständnis der nachfolgenden Argumentation,
indem Sie den Faktor 2s + 1 im Rest des Paragraphen restaurieren.
Den Druck als Funktion der Temperatur und des chemischen Potentials berechnen wir wie üblich durch Differenziation von ln ZG nach dem Volumen
¶
µ
¢¢
¡
∂ ln ZG
∂ X ¡
(20.121)
ln 1 + exp −β(ε~k − µ) .
βp =
=2
∂V
∂V
β,µ
~
k
Die Wellenvektorsummen in (20.119) und (20.121) können im thermodynamischen Limes ebenso wie die entsprechenden Summen im Bosefall durch
Integrale ersetzt werden. Dabei entstehen die zu (20.81),(20.82) und (20.84)
analogen Resultate
V
f (z) ,
λ3
2
βp = 3 f (z) ,
λ
ln ZG = 2
2
N̄
= ρ = 3 zf 0 (z) ,
V
λ
(20.122)
(20.123)
(20.124)
in denen wieder die thermische de Broglie Wellenlänge (20.83) und der Parameter
z = eβµ
(20.125)
20.6 Das ideale Fermigas
355
verwendet sind und die gegenüber (20.84) modifizierte Funktion
2
f (z) = √
π
Z∞
dx
√
x ln(1 + z e−x ) =
∞
X
(−1)l+1
l5/2
l=1
0
zl
(20.126)
eingeführt wurde.
Notieren wir auch gleich die mittlere Energie, die wir am einfachsten aus
der großkanonischen Zustandssumme mit der Identität (18.44), also Ē = hHi =
−(∂ ln ZG /∂β)z,V , erhalten. Mit Hilfe von (20.122) und ∂λ−3 /∂β = − 23 β −1 λ−3
erhalten wir
Ē = 3
3
V
f (z)kB T = pV .
λ3
2
(20.127)
Zur Zustandsgleichung, die den Druck als Funktion der Temperatur und des
Volumens bei fester Teilchenzahl N̄ angibt, gelangen wir, in dem wir aus (20.123)
und (20.124) den Parameter z eliminieren. Wie beim Bosegas führt diese Elimination nur in den Grenzfällen T → 0 und T → ∞ zu einer durch einfache
analytische Ausdrücke darstellbaren Zustandsgleichung. Für hohe Temperaturen entsteht wieder der klassische Grenzfall
λ→0
(20.128)
mit der Konsequenz f (z) → zf 0 (z) → z. Da dann die rechten Seiten in (20.123)
und (20.124) übereinstimmen, ergibt sich wieder die wohlbekannte Zustandsgleichung des klassischen idealen Gases
pV = N̄ kB T .
(20.129)
Um den Fall tiefer Temperaturen zu untersuchen, richten wir unser Augenmerk zunächst auf die in (20.124) auftretende Funktion
2
zf (z) = √
π
0
Z∞
dx
0
√
x
,
1 x
e +1
z
(20.130)
die sich nach partieller Integration und mit (20.125) auch in der Form
4
zf (z) = √
3 π
0
Z∞
dx x
3/2
ex−βµ
1
= √
x−βµ
2
(e
+ 1)
3 π
0
Z∞
0
dx µ
x3/2
x − βµ
cosh
2
¶2
(20.131)
schreiben lässt. Unter der sogleich zu rechtfertigenden Annahme, dass das chemische Potential des idealen Fermigases (im Gegensatz zu dem des idealen Bosegases!) im Grenzfall T → 0 positiv ist und dass gilt
βµ À 1 ,
(20.132)
lässt sich das Integral (20.131) leicht approximieren. Der Faktor [cosh(x − βµ)/2]
im Integranden hat ein Maximum bei x = βµ und fällt links und rechts davon
−2
356
20 Ideale Gase
auf dem Maßstab 1 ¿ βµ exponentiell ab. In einem Intervall der Länge ∆x & 1,
innerhalb dessen dieser Faktor merklich von Null verschieden ist, beträgt die relative Änderung des anderen Faktors, x3/2 , im Integranden von (20.131)
µ ¶
3 ∆x
1
3/2
3/2
∆(x )/x
=
¿1.
(20.133)
=O
2 x
βµ
Es muss sich demnach eine brauchbare Approximation des Integrals (20.131)
ergeben, wenn wir x3/2 durch die Taylorreihe
3
3
x3/2 = (βµ)3/2 + (βµ)1/2 (x − βµ) + (βµ)−1/2 (x − βµ)2 + · · ·
2
8
(20.134)
ersetzen. In einem weiteren Approximationsschritt verschieben wir die untere
Integrationsgrenze in (20.131) nach −∞. Wegen des exponentiellen Abfalls des
Integranden und wegen (20.132) ist der dabei entstehende Fehler mit der relativen Größenordnung exp(−βµ) völlig unerheblich. Wir erhalten nach Ausführen
der verbleibenden elementaren Glied-für-Glied Integration
¸
·
π2
4
−1/2
3/2
0
(βµ)
+ ··· .
(20.135)
zf (z) = √ (βµ) +
8
3 π
Nach Eintragen dieser Tieftemperaturentwicklung in (20.124) ergibt sich
#
"
µ
¶2
π 2 kB T
8
3/2
3
+ ···
(20.136)
1+
ρλ = √ (βµ)
8
µ
3 π
und hieraus insbesondere das chemische Potential bei T = 0 als der Fermienergie
εF gleich,
µ|T =0 =
~2
(3π 2 ρ)3/2 = εF .
2m
(20.137)
Damit ist die Ausnahme (20.132) gerechtfertigt, solange die thermische Energie
klein ist gegenüber der Fermienergie, kB T ¿ εF .
Durch Umkehrung der Reihe (20.136) gewinnen wir das chemische Potential
µ als Funktion von Temperatur und Dichte,
#
"
¶2
µ
π 2 kB T
+ ··· .
(20.138)
µ = εF 1 −
12
εF
Die mittlere Gesamtenergie und die Wärmekapazität bei tiefen Temperaturen (kB T ¿ εF ) folgen aus einer ganz analogen Rechnung, die hier nicht
vorgeführt wird, zu
#
"
¶2
µ
3
5π 2 kB T
Ē = εF N̄ 1 +
+ ···
(20.139)
5
12
εF
und somit
CV =
µ
∂ Ē
∂T
¶
V
=
π2
N̄ kB
2
µ
kB T
+ ···
εF
¶
.
(20.140)
20.6 Das ideale Fermigas
357
Beachten Sie, dass die Wärmekapazität hier als Funktion der Temperatur mit
T → 0 viel langsamer abfällt als beim idealen Bosegas. Aus diesem Grund
verläuft die Wärmekapazität von Metallen, deren Leitungselektronen in guter
Näherung ein ideales Fermigas darstellen, linear mit T , wenn die Temperatur
soweit abgesenkt wird, dass der Leitungselektronenbeitrag den Phononenbeitrag
dominiert.
Die Resultate (20.139) und (20.140) erlauben eine einfache qualitative Erläuterung. Bei niedrigen Temperaturen unterscheidet sich die mittlere Besetzungszahl (20.120) von der bei T = 0 vorliegenden Stufenfunktion
n̄~km |T =0 = θ(µ − ε~k ) = θ(εF − ε~k )
(20.141)
dadurch, dass einige Teilchen von Niveaus εk < εF zu Niveaus oberhalb der
Fermienergie angeregt sind. Die Besetzungsverschiebungen sind beschränkt auf
einen Energiebereich der ungefähren Größe kB T um εF herum, so dass die
Zahl der gegenüber dem ungestörten Fermisee“ verschobenen Teilchen die
”
Größenordnung N̄ (kB T /εF ) hat. Die Energieänderung relativ zum Grundzustand muss also die Größenordnung kB T N̄ (kB T /εF ) haben, d. h. quadratisch
in T sein. Dementsprechend muss die Wärmekapazität proportional zur Temperatur verlaufen.
Zu guter Letzt notieren wir die Zustandsgleichung. Verwenden wir das für
alle Temperaturen gültige Resultat Ē = 23 pV aus (20.127) sowie die Tieftemperaturentwicklung (20.139) der Energie, so ergibt sich
"
#
µ
¶2
5π 2 kB T
2 N̄
εF 1 +
+ ··· .
(20.142)
p=
5V
12
εF
Der Zuwachs des Druckes gegenüber seinem Wert am absoluten Nullpunkt (siehe
(20.115)) ist auf die Vergrößerung der mittleren Energie der gegen die Wände
stoßenden Teilchen zurückzuführen.
358
20 Ideale Gase
Kapitel 21
Begründung der
Thermodynamik
makroskopischer Systeme
21.1
Arbeit und Wärme bei Zustandsänderungen
Ein von seiner Umgebung völlig isoliertes System hat erfahrungsgemäß eine
zeitlich konstante Energie. Lassen wir jedoch ein System Arbeit verrichten (z. B.
das Benzin-Luft-Gemisch in der Brennkammer eines Motors im Takt nach der
Zündung) oder bringen es in thermischen Kontakt mit einem anderen System
(z. B. die Wärmflasche im Bett), so ändert sich im Laufe der Zeit sein Zustand,
und auch seine Energie ist zeitlicher Änderung unterworfen.
Zeitliche Zustandsänderungen, fortan Prozesse genannt, können i. A. nicht
mit den hier zur Verfügung gestellten Hilfsmitteln beschrieben werden, da während des zeitlichen Ablaufs i. A. kein Gleichgewicht herrscht. Eine wichtige
Ausnahme stellen quasistatische Prozesse dar, deren Dauer lang ist im Vergleich zu allen das betreffende System charakterisierenden Relaxationszeiten.
Bei solchen Prozessen liegt zu jedem Zeitpunkt thermisches Gleichgewicht vor,
u. z. entsprechend den momentanen Werten der Energie und der äußeren Parameter. Im Folgenden wird überwiegend von quasistatischen Prozessen die Rede
sein.
Betrachten wir einen Prozess, der ein System von einem anfänglichen Zustand der Energie Ei zu einem Endzustand der Energie Ef führt. Wenn wir die
am System geleistete Arbeit mit A (A < 0, falls das System Arbeit abgibt) und
die zugeführte Wärme mit Q bezeichnen, so lautet die Energiebilanz
∆E = Ef − Ei = A + Q .
(21.1)
Unter der am System geleisteten Arbeit verstehen wir die Energiezufuhr bei
Änderung makroskopisch kontrollierbarer äußerer Parameter gegen die entsprechenden generalisierten Kräfte (z. B. Volumenverkleinerung gegen den Druck;
Teilchenzahlvergrößerung gegen“ das chemische Potential; Ihnen anderweitig
”
bekannt sind magnetische und elektrische Arbeitsleistungen). Hingegen nennen
359
360
21 Begründung der Thermodynamik makroskopischer Systeme
wir Wärmezufuhr eine Energiezunahme bei konstanten äußeren Parametern; die
Energieeinspeisung erfolgt dann direkt in die mikroskopischen Freiheitsgrade des
Systems.
Die zu Anfang und am Ende des Prozesses vorliegenden Energien Ei bzw. Ef
sind durch die respektiven Zustände eindeutig festgelegt. Nicht so die im Verlauf
des Prozesses als Arbeit A und Wärme Q zugeführten Energieposten für sich!
Zwischen zwei Zuständen mit Energien Ei , und Ef sind viele Prozesse, auch
quasistatische, denkbar und realisierbar, die sich bei fester Summe A + Q unter
anderem durch die Werte der Größen A und Q unterscheiden. Im Gegensatz
zur Energie sind A und Q einzeln keine eindeutigen Funktionen des Zustandes.
Vielmehr charakterisieren diese Größen Prozesse.
Bei differenziellen Zustandsänderungen schreiben wir die Energiebilanz (21.1)
dE =6 dA+ 6 dQ ,
(21.2)
wobei die Querstriche an den infinitesimalen Inkrementen von A und Q sinnfällig
machen sollen, dass weder 6 dA noch 6 dQ für sich allein Differentiale eindeutiger
Zustandsfunktionen sind. Beispiele differenzieller Arbeitsleistungen sind differenzielle Volumenänderungen und Änderungen der Teilchenzahl,
6 dA = −p dV + µ dN̄ .
21.2
(21.3)
Erster Hauptsatz
Der im letzten Paragrafen diskutierte Energieerhaltungssatz (21.1) heißt auch
erster Hauptsatz der Thermodynamik. Wegen seiner überragenden Bedeutung
will ich ihn hier in drei offensichtlich äquivalenten Formulierungen nochmals
vorstellen.
(i) Ein Energiezuwachs eines Systems muss von der Umgebung aufgebracht
werden, sei es durch Arbeitsleistung gegen generalisierte Kräfte bei Änderung makroskopisch kontrollierbarer äußerer Parameter, sei es ohne Änderung letzterer bei thermischem Kontakt, d. h. durch Einspeisung von
Energie an mikroskopische Freiheitsgrade.
(ii) In abgeschlossenen Systemen, d. h. bei thermischer Isolation (6 dQ = 0)
und konstanten äußeren Parametern (6 dA = 0), können nur Vorgänge
ablaufen, die die Energie konstant lassen.
(iii) Es gibt kein perpetuum mobile erster Art, d. h. keine Maschine kann im
Dauerbetrieb Arbeit leisten, ohne dass ihr von außen Energie zugeführt
wird.
21.3
Entropieänderungen bei Zustandsänderungen
Betrachten wir einen quasistatischen Prozess, der durch eine stetige Folge von
Gleichgewichtszuständen führt. In einem differenziellen Teilprozess ändern sich
die Energie und äußere Parameter wie das Volumen und die Teilchenzahl gemäß
Ē, V, N̄ → Ē + dĒ, V + dV, N̄ + dN̄ .
(21.4)
21.4 Zweiter Hauptsatz
361
Die zugehörige Entropieänderung ist, da bei der betrachteten quasistatischen
Folge von Zuständen die Entropie jederzeit eine eindeutige Funktion des Zustands ist, gerade das in (19.56) gefundene Entropiedifferential
dS =
1
(dĒ + p dV − µ dN̄ ) .
T
(21.5)
Lösen wir diese Identität nach dem Energiedifferential auf, so finden wir wieder
den ersten Hauptsatz,
dĒ = T dS − p dV + µ dN̄ .
(21.6)
mit dem Arbeitsanteil 6 dA = −p dV + µ dN̄ und, als neuem Resultat, den
Ausdruck
6 dQ = T dS
(21.7)
für die differenzielle Wärmezufuhr.
Sie erkennen aus (21.7), dass quasistatische Prozesse in thermisch isolierten
Systemen (6 dQ = 0) isentropisch, d. h. mit dS = 0, verlaufen. Weiterhin bemerkenswert ist, dass (21.7) eine Verknüpfung eines totalen Differentials (der
Entropie) mit einer differenziellen Größe (6 dQ) gibt, die kein totales Differential
ist. In dS =6 dQ/T spielt 1/T die Rolle eines integrierenden Faktors“ ∗)
”
Anders als bei quasistatischen Prozessen muss die Entropie bei der Relaxation von Nichtgleichgewichtszuständen ins Gleichgewicht zunehmen, denn die
Entropie nimmt bekanntlich 19.1 im Gleichgewicht ihren Maximalwert an. Es
folgt, dass die Entropie eines abgeschlossenen Systems niemals abnehmen kann.
Sie sollten die gerade getroffenen Aussagen durchdenken im Hinblick auf
u. a. folgende Beispiele: (i) Ein schwingendes Pendel kommt auf Grund von Luftund Lagerreibung allmählich zur Ruhe; (ii) ein Gas verteilt sich nach plötzlicher
Gefäßvergrößerung nach einiger Zeit gleichförmig über das vergrößerte Volumen;
(iii) zwei sich berührende, verschieden warme Körper gleichen ihre Temperaturen an.
21.4
Zweiter Hauptsatz
Die Ausführungen des letzten Paragrafen beinhalten den zweiten Hauptsatz.der
Thermodynamik. Die folgenden drei Formulierungen dieses Gesetzes verdienen,
obschon äquivalent miteinander, jeweils gesonderte Würdigung.
(i) In einem abgeschlossenen System können nur Prozesse mit dS ≥ 0 ablaufen. Diese oben durch die bekannte Extremaleigenschaft der Entropie
begründete Aussage bringt u. a. die Erfahrungstatsache zum Ausdruck,
dass alle in der Natur spontan ablaufenden Relaxationsprozesse irreversibel sind. Wir werden hierauf in 21.8 zurückkommen.
∗) Im
Fall zweier unabhängiger Variablen x und y ist die Größe
6 dG = A(x, y) dx + B(x, y) dy
genau dann ein totales Differential einer Funktion G(x, y), wenn die Integralitätsbedingungen
∂A/∂y = ∂B/∂x erfüllt ist. Andernfalls ist es zuweilen möglich, einen integrierenden Faktor f (x, y) zu finden, sodass dF = f (x, y)6 dG ein totales Differential ist, d. h. so dass
∂(f A)/∂y = ∂(f B)/∂x gilt. Die Funktion F (x, y) lässt sich aus ihrem Differential durch
ein wegunabhängiges Wegintegral in der x − y-Ebene gewinnen. S.a. 2.10.
362
21 Begründung der Thermodynamik makroskopischer Systeme
(ii) Es gibt keine Maschine, die nichts anderes bewirkt, als im periodischen
Betrieb Arbeit zu leisten und den entsprechenden Energiebedarf aus einem
Wärmebad zu decken (perpetuum mobile zweiter Art). Wir werden diese
von Lord Kelvin stammende Formulierung im nächsten Paragrafen auf (i)
zurückführen. Die Vorstellung, ein Dampfer könne über’s Meer fahren
und die dazu erforderliche Energie nur dem Wärmevorrat des Meeres abzapfen, wird offenbar durch den zweiten Hauptsatz ins Reich der Träume
verwiesen.
(iii) Es gibt keinen perfekten“ Kühlapparat, der, periodisch arbeitend, nichts
”
anderes bewirkt, als einem System Wärme zu entziehen und sie einem
anderen System bei höherer Temperatur zuzuführen. Dem Beweis dieser
Clausiusschen Formulierung ist 21.6 gewidmet.
21.5
Unmöglichkeit des perpetuum mobile zweiter Art
Abbildung 21.1 zeigt ein fiktives perpetuum mobile zweiter Art. Während einer
Arbeitsperiode wird dem Wärmebad die Wärme Q entzogen und der Maschine
zugeführt, während die Maschine die Arbeit A abgibt. Die Arbeit könnte an
einem Freiheitsgrad eines externen Objekts verrichtet werden (z. B. Heben eines
Gewichts), ohne dass andere Freiheitsgrade und insbesondere die Entropie des
Objekts beeinflusst würden.
Abbildung 21.1
Der beschriebene fiktive Vorgang wäre mit dem ersten Hauptsatz, d. h. der
Energiebilanz der Maschine pro Periode
∆E = 0 = Q + (−A)
(21.8)
verträglich. Ziehen wir aber die Entropiebilanz für das aus Bad, Maschine
und Objekt gebildete abgeschlossene Gesamtsystem. Weder das Objekt (per
obiger Vereinbarung) noch die Maschine (wegen der Periodizität) ändern in einer Periode ihre Entropie, so dass die gesamte Entropieänderung allein vom
Wärmebad gestellt wird. Sie beträgt, da das Wärmebad während der endlichen
Wärmeaufnahme −Q < 0 seine Temperatur nie ändert, ∆S = −Q/T < 0. Die
21.5 Unmöglichkeit des perpetuum mobile zweiter Art
363
Verletzung des zweiten Hauptsatzes, nach dem die Entropie eines abgeschlossenen Systems nicht abnehmen kann, ist offenbar.
Das perpetuum mobile zweiter Art hätte, da die in einem Zyklus aufgenommene Wärme restlos in Arbeit umsetzend, den Wirkungsgrad
η=
A
=1.
Q
(21.9)
Realisierbare Wärmekraftmaschinen haben nach dem zweiten Hauptsatz stets
Abbildung 21.2
einen kleineren Wirkungsgrad η < 1. Abbildung 21.2 zeigt das Wirkungsschema
solcher mit den Hauptsätzen verträglichen Maschinen. Während einer Periode
entnimmt die Maschine einem Wärmebad der Temperatur T1 die Wärme Q1
und leistet am Objekt die Arbeit A. Das Verdikt des zweiten Hauptsatzes wird
vermieden, indem die Maschine an ein zweites, kälteres Wärmebad koppelt, an
das sie pro Zyklus die Wärme Q2 abführt. Die Energiebilanz der Maschine und
die Entropiebilanz des Gesamtsystems lauten
Q1 = A + Q 2
(21.10)
bzw.
∆S = −
Q2
Q1
+
,
T1
T2
(21.11)
und die Forderung ∆S > 0 ist jetzt befriedigt, wenn die Wärmeaufnahme des
kälteren Bades nur hinreichend groß ist.
364
21 Begründung der Thermodynamik makroskopischer Systeme
Der Wirkungsgrad der gerade beschriebenen Maschine beträgt
η=
Q2
A
=1−
.
Q1
Q1
(21.12)
Aus (21.11) und dem zweiten Hauptsatz, ∆S ≥ 0, folgern wir Q2 /Q1 > T2 /T1
und erhalten für den Wirkungsgrad die Ungleichung
η ≤ 1 − T2 /T1 < 1 .
(21.13)
Der maximale mit dem zweiten Hauptsatz verträgliche Wirkungsgrad,
ηmax = 1 − T2 /T1 ,
(21.14)
entspricht einer quasistatisch arbeitenden Maschine, bei der die Entropiebilanz
des Gesamtsystems pro Periode ∆S = 0 lautet (s. 21.7).
21.6
Unmöglichkeit des perfekten Kühlapparats
Reale Kühlapparate entziehen nach dem in Abbildung 21.3 gezeigten Schema
pro Zyklus unter Aufwand der Arbeit A einem System (hier zum Wärmebad
idealisiert) mit Temperatur T2 die Wärme Q2 und geben an ein wärmeres System
(hier zum Wärmebad mit T1 > T2 idealisiert) die Wärme Q1 ab. Die beiden
Hauptsätze verlangen
Q1 = Q 2 + A
(21.15)
und
∆S =
Q2
Q1
−
≥0,
T1
T2
(21.16)
wobei das Gleichheitszeichen im zweiten Glied der Kette (21.16) nur für quasistatische Arbeitsweise gelten kann.
Ohne Aufwand an Arbeit kann kein solcher Apparat funktionieren, denn mit
A = 0, d. h. Q1 = Q2 , entsteht aus (21.16) die Forderung Q1 (1/T1 − 1/T2 ) ≥ 0,
die bei T1 > T2 nicht erfüllbar ist. Damit ist auch die Clausiussche Version des
zweiten Hauptsatzes bewiesen.
21.7
Die Carnotmaschine
Das einfachste Modell einer Wärmekraftmaschine ist die so genannte Carnotmaschine. Als Arbeitssubstanz fungiert ein klassisches ideales Gas. Eine Periode,
die quasistatisch durchlaufen wird, ist in der p − V -Ebene und in der S − T Ebene in den Abbildungen 21.4 und 21.5 dargestellt. Wie aus den Diagrammen
ersichtlich besteht eine Periode aus den vier folgenden
Schritten. Von a nach b erfolgt eine isotherme Kompression, während derer
die Maschine an ein Wärmebad der Temperatur T2 Wärme abgibt. Die anschließende Kompression von b nach c geschieht unter thermischer Isolation,
also isentropisch. Hierbei nimmt die Maschine Energie in Form von Arbeit auf
21.7 Die Carnotmaschine
365
Abbildung 21.3
und die Temperatur erhöht sich zum Wert T1 . Während der letzten beiden
Schritte leistet die Maschine Arbeit, zunächst von c nach d bei isothermer Expansion und gleichzeitiger Wärmeaufnahme aus einem Bad der Temperatur T1
und schließlich, von d nach a, bei isentropischer Expansion und Abkühlung zur
Ausgangstemperatur T2 .
Bezeichnen wir die im Schritt c d von der Maschine aufgenommene Wärme
mit Q1 , die im Schritt a b an das kältere Bad abgeführte Wärme mit Q2 , sowie
die während der Periode insgesamt abgegebene Arbeit mit A, so lautet die
Energiebilanz pro Periode
A = Q 1 − Q2 .
(21.17)
Wenn der Prozess, wie angenommen, quasistatisch geführt wird, so ändert sich
die Gesamtentropie der beiden Bäder und der Maschine nicht.
∆S = 0 = −
Q2
Q1
+
.
T1
T2
(21.18)
Der Wirkungsgrad der Carnotmaschine folgt aus (21.17) und (21.18) zu
η =1−
T2
,
T1
(21.19)
hat also den maximalen mit den Hauptsätzen verträglichen Wert.
Zur Berechnung der pro Periode geleisteten Arbeit müssen wir die vier Kurvenstücke in der p − V -Ebene durch Gleichungen charakterisieren. Für die
Isothermen a b und c d liefert die Zustandsgleichung des idealen Gases direkt
pV = N kB T2 bzw. pV = N kB T1 .
366
21 Begründung der Thermodynamik makroskopischer Systeme
Abbildung 21.4
Abbildung 21.5
Um die Gleichung der Isentropen (auch Adiabaten genannt) zu gewinnen, benutzen wir das Entropiedifferential (19.56), das längs der Isentropen verschwinden muss,
T dS = 0 = dĒ + p dV .
(21.20)
Die mittlere Energie des klassischen idealen Gases lautet
Ē =
3
3
N kB T = pV ,
2
2
(21.21)
dĒ =
3
(p dV + V dp) .
2
(21.22)
ihr Differential also
Aus (21.20) und (21.22) folgt als Differentialgleichung der Isentropen
dp
5 dV
+
=0.
3 V
p
(21.23)
Die gesuchte Isentropengleichung ist also
pV 5/3 = const
(21.24)
21.8 Relaxation ins Gleichgewicht
367
oder, in der V − T -Darstellung,
T V 2/3 = const.
(21.25)
Wir berechnen nun die pro Periode von der Maschine abgegebene Arbeit als
das Wegintegral in der p − V -Ebene
A=
ZVb
p dV +
ZVc
p dV +
ZVd
ZVa
p dV +
Va
Vb
Vc
Vd
(T =T2 )
(S=S2 )
(T =T1 )
(S=S1 )
p dV .
(21.26)
Offenbar kann A auch geometrisch als die von der Kurve a b c d in der p − V Ebene umschlossene Fläche gedeutet werden. Die Beiträge der beiden Isentropen heben sich gegenseitig auf, denn der Betrag des Stücks b c
ZVc
Vb
p dV =
5/3
p b Vb
ZVc
3
5/3
−2/3
− Vc−2/3 )
V −5/3 dV = pb Vb (Vb
2
Vb
(S=S2 )
h
i
3
N kB T2 1 − (Vb /Vc )2/3
2
3
3
= N kB T2 (1 − T1 /T2 ) = N kB (T2 − T1 )
2
2
=
ist allein durch die Temperaturdifferenz der beiden Bäder bestimmt und somit
entgegengesetzt gleich dem Betrag des Stücks d a. Die Anteile der Isothermen
ergeben schließlich
A = N k B T2
ZVb
Va
= N kB T2 ln
dV
+ N k B T1
V
ZVd
dV
V
Vc
Vd
Vb
+ N kB T1 ln
.
Va
Vc
Aus der Isentropengleichung (21.25) folgt aber Vb /Vc = (T1 /T2 )−3/2 = Va /Vd ,
so dass wir die abgegebene Arbeit als
A = N kB (T1 − T2 ) ln(Vd /Vc )
(21.27)
erhalten.
Ihnen bleibt zur Übung, die im Schritt c d aufgenommene Wärme Q1 und
die Abwärme Q2 auszurechnen.
21.8
Relaxation ins Gleichgewicht
Der zweite Hauptsatz zeichnet hinsichtlich der Bewegung makroskopischer Systeme eine Zeitrichtung aus, indem er die zeitliche Abnahme der Entropie eines
368
21 Begründung der Thermodynamik makroskopischer Systeme
abgeschlossenen Systems verbietet. Im Übrigen lehrt schon die Alltagserfahrung, dass die Relaxation eines makroskopischen Systems ins Gleichgewicht ein
irreversibler Vorgang ist, dessen zeitliche Umkehrung niemals spontan auftritt.
Vom mikroskopischen Standpunkt aus kann und muss uns der zweite Hauptsatz ebenso wie die Irreversibilität von Relaxationsprozessen anstößig erscheinen. Die für die mikroskopische Dynamik eines N -Teilchensystems zuständige
Schrödingergleichung besitzt nämlich (ebenso wie die bei klassischen Behandlung zuständigen Newtonschen Gleichungen) eine Symmetrie, die Zeitumkehrinvarianz, derzufolge zu jeder beliebigen Lösung eine andere Lösung angegeben
werden kann, die den gleichen physikalischen Vorgang in zeitlich umgekehrtem
Ablauf beschreibt.
Um uns der Zeitumkehrinvarianz der Schrödingergleichung
i~ψ̇ ({~x}, t) = Hψ ({~x}, t)
(21.28)
zu vergewissern, betrachten wir Teilchen, die über Zweikörperkräfte (z. B. Coulombsch) wechselwirken entsprechend dem Hamiltonoperator
H=
N
X
p~2ν
1X
V (~xν − ~xµ ) .
+
2mν
2
ν=0
(21.29)
ν6=µ
Offensichtlich bleibt die Schrödingergleichung unverändert unter der Transformation
t → −t,
~xν → ~xν ,
p~ν → −~
pν ,
ψ → ψ∗ ,
(21.30)
wenn die potenzielle Energie V (~xν − ~xµ ) reell ist. Mit ψ({~x}, t) ist also auch
ψ ∗ ({~x}, t) Lösung von (21.28). Die respektiven Wahrscheinlichkeitsdichten
|ψ({~x}, t)|2 und |ψ ∗ ({~x}, −t)|2 = |ψ({~x}, −t)|2 beschreiben Vorgänge, die bei
Zeitumkehr ineinander übergehen.
Auf die Zeitumkehrinvarianz der Schrödingergleichung gründet sich der so
genannte Umkehreinwand gegen den zweiten Hauptsatz: zugleich mit der Relaxation ins Gleichgewicht muss auch der umgekehrte Prozess eine Lösung der
mikroskopischen Bewegungsgleichung sein. Dieser Einwand ist zweifellos im
Prinzip berechtigt. Allerdings suggeriert er unangebrachterweise eine Unverträglichkeit der Bewegungsgleichung mit der Erfahrungstatsache der Irreversibilität. Mit dem Nachweis der Existenz einer Lösung der Schrödingergleichung
ist nämlich keine Auskunft über die praktische Realisierbarkeit der Lösung gewonnen. Um eine Lösung der Schrödingergleichung eines Vielteilchensystems zu
realisieren, die wie die Umkehrung einer Relaxation ins Gleichgewicht aussieht,
müssen durch experimentelle Präparation ganz bestimmte Anfangsbedingungen
gewährleistet werden. Nun können im Labor nur einige wenige Parameter eines Vielteilchensystems mit gewünschten Anfangsbedingungen versehen werden.
Dass dabei alle anderen (womöglich 1023 ) Koordinaten genau so beeinflusst werden, dass sich eine Antirelaxation“ anschließt, ist, wie ich gleich zeigen werde,
”
grenzenlos unwahrscheinlich.
Erfahrungsgemäß führt eine makroskopische Observable A(t) nach ihrer Relaxation zum Gleichgewichtswert Ā nur winzige Fluktuationen aus (auf die
Ausnahme kritischer Systeme war schon des öfteren hingewiesen worden). Allerdings lässt sich unter sehr allgemeinen Annahmen an die Wechselwirkung
21.8 Relaxation ins Gleichgewicht
369
V (~xν − ~xµ ) zeigen, dass A(t) jedem Anfangswert A(0) irgendwann wieder beliebig nahe kommen muss. Hierauf gründet sich der so genannte Wiederkehreinwand gegen die Verträglichkeit makroskopischer Irreversibilität mit den zeitumkehrinvarianten mikroskopischen Bewegungsgleichungen. Auch dieser Wiederkehreinwand ist zwar im Prinzip berechtigt, jedoch praktisch irrelevant. Wir
werden uns nämlich gleich davon überzeugen, dass die mittlere Wiederkehrzeit
großer Auslenkungen makroskopischer Observabler aus ihren Gleichgewichtswerten unbeobachtbar groß ist.
Betrachten wir in Anlehnung an die verwandten Diskussionen in 2.14 und
13.4 die folgende Summe periodischer Funktionen
S(t) =
N
X
eiων t ,
(21.31)
ν=1
die zur Zeit t = 0 den Wert S(0) = N hat. Wir können uns S(t) als Lösung eines
reversiblen Problems (z. B. gekoppelte Schwingungen) vorstellen. Nun seien die
Zahl N der eingehenden Schwingungen so groß und die Frequenzen ων so dicht
benachbart, dass in jedem experimentell auflösbaren Frequenzintervall ∆ω viele
ων liegen, etwa gemäß der spektralen Dichte (Lorentzverteilung der Breite γ)
ρ(ω) =
N γ/π
.
ω2 + γ 2
(21.32)
Dann kann die Summe (21.31) durch ein Integral approximiert werden, und wir
erhalten für t > 0
S(t) ≈
Z∞
dω ρ(ω) eiωt = N e−γt .
(21.33)
−∞
Der resultierende irreversible Abfall von S(t) auf Null ist dem Wiederkehreinwand wie dem Umkehreinwand ausgesetzt.
Überzeugen wir uns davon, dass der Wiederkehreinwand gegenstandslos ist,
indem wir die mittlere Wiederkehrzeit T einer großen Fluktuation |S(t)| = O(N )
abschätzen. Eine derartige Fluktuation stellt sich ein, wenn die N Phasen ων t
alle zugleich in einem kleinen Intervall ∆ϕ ¿ 2π liegen. Da die Phasen alle
unabhängig voneinander sind, gilt für die Wahrscheinlichkeit einer Phasenkoinzidenz während einer mittleren Koinzidenzzeit τ
τ
=
T
µ
∆ϕ
2π
¶N
.
(21.34)
Zur Berechnung der mittleren Koinzidenzzeit betrachten wir zunächst zwei Glieder aus der Summe (21.31), etwa eiω1 t und eiω2 t . Die erste Phase liege in ∆ϕ
im Zeitintervall 0 ≤ t ≤ t1 = ∆ϕ/ω1 . Koinzidenz beider Phasen in A tritt nur
ein, wenn die zweite Phase ihren Durchlauf durch ∆ϕ beendet zu einer Zeit t0 ,
die kleiner ist als t1 + t2 , wobei t2 = ∆ϕ/ω2 . Nehmen wir an, t2 sei kleiner als
370
21 Begründung der Thermodynamik makroskopischer Systeme
t1 . Die Koinzidenz beider Phasen in ∆ϕ besteht dann für die Zeit
τ (t0 ) =

t2 + t 1 − t 0





 t2


t0




0
für
t1 ≤ t0 ≤ t1 + t2
für
t2 ≤ t0 ≤ t1
für
0 ≤ t 0 ≤ t2
(21.35)
sonst.
Da alle Endpunkte t0 gleichberechtigt sind, erhalten wir die mittlere Koinzidenzzeit zu
τ12 =
tZ
1 +t2
dt0
0
t1 t2
τ (t0 )
=
,
t1 + t 2
t1 + t 2
1/τ12 = 1/t1 + 1/t2 = (ω1 + ω2 )/∆ϕ .
(21.36)
Ohne weitere Rechnung erhalten wir als ein Maß für die Koinzidenz dreier
Phasen in ∆ϕ die mittlere Überlappzeit von τ12 und τ13 = ∆ϕ/ω3 , d. h.
1/τ123 = l/τ12 + 1/t3 = (ω1 + ω2 + ω3 )/∆ϕ. Für die mittlere Koinzidenzzeit
aller N Phasen erhalten wir so eine Abschätzung durch die mittlere Frequenz ω̄
N
1/τ =
1 X
N
ων =
ω̄ .
∆ϕ ν=1
∆ϕ
(21.37)
Damit ergibt sich die gesuchte mittlere Wiederkehrzeit,
∆ϕ
T =
N ω̄
µ
2π
∆ϕ
¶N
.
(21.38)
Selbst für so große mittlere Frequenzen, wie sie für sichtbares Licht typisch
sind, ω̄ ≈ 1015 s−1 , und die bescheidenen Forderungen ∆ϕ/2π = 1/10, N = 100
ergibt sich aus (21.38) eine Wiederkehrzeit (T ≈ 1086 s), die bedeutend größer ist
als das Alter des Universums (≈ 1010 Jahre). Damit ist der Wiederkehreinwand
als für makroskopische Systeme irrelevant erwiesen.
Der Umkehreinwand erledigt sich auch sofort. Damit die Summe S(t) zur
Zeit t einen Betrag der Ordnung N hat, nachdem zur früheren Zeit t0 ein sehr
viel kleinerer Wert vorlag, muss zur Zeit t0 die Phase ων t0 in einem kleinen Intervall ∆ϕ um den Wert ων (t0 −t) liegen. Die entsprechend gezielte Präparation
aller Phasen durch makroskopischen Eingriff ist i. Allg. unmöglich (es gibt die
Ausnahmen des Spin- und Photonenechos). Die Wahrscheinlichkeit, bei ungezieltem Eingriff die Phasen alle richtig festzulegen, hat den für große N völlig
vernachlässigbaren Wert (∆ϕ/2π)N .
Der zweite Hauptsatz stellt, wie die vorangegangene Diskussion und auch
schon seine Begründung in 21.4 zeigen, eine statistische Aussage über das Verhalten von Ensembles makroskopisch gleich präparierter Systeme dar. Ausnahmen im Einzelfall sind denkbar, allerdings grenzenlos unwahrscheinlich. Die
Relaxation makroskopischer Systeme ins Gleichgewicht ist eine Illusion, der wir
uns ungestraft hingeben dürfen.
Abbildungsverzeichnis
1.1
1.2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
16
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22
25
26
29
30
32
33
37
39
42
47
48
53
3.1
3.2
3.3
3.4
3.5
3.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
64
66
68
70
70
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
74
75
77
78
79
79
81
84
85
86
88
90
371
372
ABBILDUNGSVERZEICHNIS
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6.1
6.2
6.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
8.1
8.2
8.3
8.4
8.5
.
.
.
.
.
9.1
9.2
9.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
10.1
10.2
10.3
10.4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
184
193
199
202
11.1
11.2
11.3
11.4
11.5
11.6
11.7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
205
207
208
210
213
213
219
12.1
12.2
12.3
12.4
12.5
12.6
12.7
12.8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
223
225
226
228
229
231
232
233
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
98
99
100
101
102
104
108
110
142
144
148
152
154
13.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
13.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
13.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
ABBILDUNGSVERZEICHNIS
373
14.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
14.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
14.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
15.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
15.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
16.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
16.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
17.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
17.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
18.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
20.1
20.2
20.3
20.4
20.5
20.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
339
343
347
350
350
351
21.1
21.2
21.3
21.4
21.5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
362
363
365
366
366
Herunterladen