EINF¨UHRUNG IN DIE THEORETISCHE PHYSIK

EINFÜHRUNG IN DIE
THEORETISCHE PHYSIK
FRITZ HAAKE
2
Vorwort
Das 1982 erschienene Buch ist längst vergriffen. Der Nachfolger des damaligen Verlages ist an einer Neuauflage nicht interessiert. Der Anregung von
Lesern und Kollegen folgend mache ich den Text nun frei zugänglich. Damit
wird Wechselwirkung mit Nutzern möglich. Mir mitgeteilte Druckfehler und
Unstimmigkeiten werde ich laufend korrigieren. Auch Anregungen zu größeren
Änderungen und Anpassung an inzwischen veränderte Bedürfnisse der Lehrerausbildung sind mir willkommen.
Essen, Oktober 2002
Fritz Haake
3
4
Inhaltsverzeichnis
Inhaltsverzeichnis
5
1 Masse
1.1 Freie Teilchen . . . . . . . . . . . .
1.2 Träge Teilchen . . . . . . . . . . .
1.3 Ein Beispiel: konstante Kraft . . .
1.4 Das Galileische Relativitätsprinzip
1.5 Schwere Teilchen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
11
12
13
15
2 Schwingungen
2.1 Der harmonische Oszillator . . . . . . . . . . . . . . . . . .
2.2 Der Energieeigensatz . . . . . . . . . . . . . . . . . . . . . .
2.3 Der Energiesatz für beliebige konservative Kräfte . . . . . .
2.4 Der gedämpfte harmonische Oszillator . . . . . . . . . . . .
2.5 Resonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Antwort auf beliebige periodische Anregung (Fourierreihen)
2.7 Antwort auf beliebige Anregung . . . . . . . . . . . . . . . .
2.8 Idealisierter Kraftstoß (Deltafunktion) . . . . . . . . . . . .
2.9 Zwei gekoppelte harmonische Oszillatoren . . . . . . . . . .
2.10 Der mechanische Energiesatz für Systeme vieler Teilchen . .
2.11 Schwingungen von mehreren Freiheitsgraden . . . . . . . . .
2.12 Erzwungene Schwingungen von mehreren Freiheitsgraden .
2.13 Transversale Schwingungen der gespannten Saite . . . . . .
2.14 Theorie der Dämpfung(Modell) . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
19
19
21
23
26
29
33
35
39
42
45
48
51
53
57
3 Nichtrelativistische Bewegung im Gravitationsfeld
3.1 Das 1/r-Potential . . . . . . . . . . . . . . . . . . . . .
3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential
3.3 Die Bahnkurven . . . . . . . . . . . . . . . . . . . . .
3.4 Das Zweikörperproblem . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
63
65
68
71
4 Statische wirbelfreie Felder
4.1 Wirbelfreie Vektorfelder . . . . . . . . . . .
4.2 Quellen wirbelfreier Felder . . . . . . . . . .
4.3 Lokale Quellen . . . . . . . . . . . . . . . .
4.4 Elektrostatisches Potential . . . . . . . . . .
4.5 Geladenes Teilchen vor einem Leiter . . . .
4.6 Sphärische Ladungs- bzw. Massenverteilung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
76
78
81
83
84
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
INHALTSVERZEICHNIS
4.7
4.8
4.9
4.10
Monopole, Dipole, Multipole . . . . . . . . . . . . . . .
Die Form der Erde . . . . . . . . . . . . . . . . . . . . .
Die Energie eines Haufens von Ladungen . . . . . . . . .
Die Energie eines Ladungshaufens in einem äußeren Feld
.
.
.
.
86
90
93
95
5 Statische Magnetfelder
~ x) . . . . . . . . . . . . . .
5.1 Das magnetische (Induktions-)Feld B(~
5.2 Das Magnetfeld eines geraden stromdurchflossenen Drahtes . . .
5.3 Wirbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Lokale Wirbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5 Magnetische Monopole . . . . . . . . . . . . . . . . . . . . . . . .
5.6 Die Feldgleichungen . . . . . . . . . . . . . . . . . . . . . . . . .
5.7 Das Fernfeld stationärer Ströme . . . . . . . . . . . . . . . . . . .
5.8 Magnetisches Moment und Drehimpuls . . . . . . . . . . . . . . .
~ x) auf einen magnetischen
5.9 Kraft und Drehmoment eines Feldes B(~
Dipol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
97
99
99
102
104
105
108
111
6 Das
6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8
elektromagnetische Feld
Faradays Induktionsexperiment . . . . . . . . . .
Der Maxwellsche Verschiebungsstrom . . . . . . .
Die Maxwellschen Gleichungen . . . . . . . . . .
Der Energieerhaltungssatz . . . . . . . . . . . . .
Die Wellengleichung für die Potentiale . . . . . .
Ebene elektromagnetische Wellen im freien Raum
Die retardierten Potentiale . . . . . . . . . . . . .
Elektrische Dipolstrahlung . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
111
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
113
115
116
117
119
120
123
126
7 Elektromagnetische Felder in Materie
7.1 Polarisation und Magnetisierung . . . . . . . . . . .
7.2 Materialgesetze für Polarisation und Magnetisierung
7.3 Wellen in linearen Dielektrika . . . . . . . . . . . . .
7.4 Modell eines Dielektrikums . . . . . . . . . . . . . .
7.5 Ohmsches Gesetz . . . . . . . . . . . . . . . . . . . .
7.6 Wellen in Leitern . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
129
129
134
136
137
138
139
8 Symmetrien
8.1 Der Raum ist homogen .
8.2 Der Raum ist isotrop . .
8.3 Die Zeit ist homogen . .
8.4 Galileiinvarianz . . . . .
8.5 Lorentzinvarianz . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
141
141
143
150
150
152
9 Spezielle Relativitätstheorie
9.1 Die Lorentztransformation der Koordinaten . .
9.2 Relativität der Gleichzeitigkeit . . . . . . . . .
9.3 Zeitdilatation . . . . . . . . . . . . . . . . . . .
9.4 Längenkontraktion . . . . . . . . . . . . . . . .
9.5 Addition von Geschwindigkeiten . . . . . . . .
9.6 Lorentzinvarianz der Maxwellschen Gleichungen
9.7 Feld einer gleichförmig bewegten Punktladung .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
155
155
158
158
161
162
163
165
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
7
9.8 Lorentzskalare und Lorentzvektoren . . . . . . . . . . . . . . . .
9.9 Relativistischer Impuls und Viererimpuls eines Teilchens . . . . .
9.10 Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.11 Bewegung im konstanten elektrischen Feld . . . . . . . . . . . . .
9.12 Eine bequeme Schreibweise . . . . . . . . . . . . . . . . . . . . .
166
168
170
173
174
10 Bewegung schneller Teilchen im Gravitationsfeld
10.1 Rückblick auf die Newtonsche Theorie . . . . . . .
10.2 Einsteins Äquivalenzprinzip . . . . . . . . . . . . .
10.3 Die Viererkraft im Gravitationsfeld . . . . . . . . .
10.4 Lichtstrahlen im Gravitationsfeld . . . . . . . . . .
10.5 Der metrische Tensor ist das Gravitationsfeld . . .
10.6 Der Newtonsche Grenzfall . . . . . . . . . . . . . .
10.7 Frequenzverschiebung fallender Photonen . . . . .
10.8 Nochmal auf die rotierende Scheibe! . . . . . . . .
10.9 Das statische isotrope Gravitationsfeld . . . . . . .
10.10Bewegungsgleichungen im statischen isotropen Feld
10.11Periheldrehung der Planeten . . . . . . . . . . . . .
10.12Lichtablenkung durch die Sonne . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
179
179
180
181
184
186
188
190
192
194
196
199
202
11 Quanten
11.1 Teilchen sind Wellen . . . . . . . . . . . . .
11.2 Heisenbergs Unschärferelation . . . . . . . .
11.3 Die Grundprinzipien der Quantenmechanik
11.4 Die Schrödingergleichung . . . . . . . . . .
11.5 Normierung der Wellenfunktion . . . . . . .
11.6 Mittelwerte . . . . . . . . . . . . . . . . . .
11.7 Freie Pakete zerfließen . . . . . . . . . . . .
11.8 Das Ehrenfestsche Theorem . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
205
205
210
211
212
215
216
218
220
12 Quanten in Kästen
12.1 Eindimensionale Potentialstufe . . . . . . .
12.2 Eindimensionaler Kasten mit starrem Rand
12.3 Potentialtopf endlicher Tiefe . . . . . . . . .
12.4 Quanten durchdringen Wände . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
223
223
226
229
232
13 Harmonisch gebundene Quanten
13.1 Eindimensionaler harmonischer Oszillator . . . . . . . . . . . . .
13.2 Die Orthogonalität normierbarer Eigenfunktionen hermitescher
Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.3 Die erzwungene Schwingung des harmonischen Oszillators . . . .
13.4 Die Umgebung belässt nur den Grundzustand stabil . . . . . . .
235
235
14 Das
14.1
14.2
14.3
14.4
14.5
253
253
254
256
257
259
Wasserstoffatom
Relativ- und Schwerpunktsbewegung . . . . . .
Bewegung im Coulombfeld . . . . . . . . . . . .
Der Bahndrehimpuls . . . . . . . . . . . . . . .
Kommutierende Operatoren haben gemeinsame
Die Eigenwerte des Bahndrehimpulses . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
Eigenfunktionen
. . . . . . . . . .
240
243
245
8
INHALTSVERZEICHNIS
14.6
14.7
14.8
14.9
Die Eigenfunktionen des Bahndrehimpulses
Das Radialproblem beim Coulombfeld . . .
Die Auswahlregeln . . . . . . . . . . . . . .
Verwandte Zweikörpersysteme . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
263
266
270
272
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik geladener Teilchen
275
15.1 Die Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . 275
15.2 Die klassische Hamiltonfunktion . . . . . . . . . . . . . . . . . . . 277
15.3 Klassische (nichtrelativistische) Bewegung im konstanten Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
15.4 Geladenes Quant im konstanten Magnetfeld . . . . . . . . . . . . 282
15.5 Eichinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
15.6 Zeemaneffekt beim Wasserstoffatom (ohne Spin) . . . . . . . . . 286
16 Spin
16.1 Der Spin des Elektrons . . . . . . . . . . . . . . . . . . . . . . . .
16.2 Das magnetische Moment von Teilchen mit Spin . . . . . . . . .
16.3 Der anomale Zeemaneffekt beim H-Atom . . . . . . . . . . . . .
289
289
292
293
17 Grundbegriffe der Statistik
17.1 Wahrscheinlichkeit von Ereignissen . . . .
17.2 Diskrete eindimensionale Zufallsbewegung
17.3 Die Binomialverteilung für große N . . . .
17.4 Eindimensionale Diffusion . . . . . . . . .
17.5 Der Zentrale Grenzwertsatz . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
297
297
298
299
300
303
18 Statistische Behandlung von Vielteilchensystemen
18.1 Ensembles . . . . . . . . . . . . . . . . . . . . . . . .
18.2 Stationäre Ensembles . . . . . . . . . . . . . . . . . .
18.3 Die Energieabhängigkeit der Zustandsdichte . . . . .
18.4 Das mikrokanonische Ensemble . . . . . . . . . . . .
18.5 Das kanonische Ensemble . . . . . . . . . . . . . . .
18.6 Das großkanonische Ensemble . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
307
307
308
310
311
313
317
19 Thermodynamische Variable
19.1 Entropie . . . . . . . . . . .
19.2 Temperatur . . . . . . . . .
19.3 Druck . . . . . . . . . . . .
19.4 Chemisches Potential . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
319
319
322
325
327
.
.
.
.
.
.
331
331
334
340
343
348
352
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20 Ideale Gase
20.1 Ununterscheidbarkeit identischer Teilchen
20.2 Thermische Photonen . . . . . . . . . . .
20.3 Thermische Phononen in Festkörpern . . .
20.4 Das ideale Bosegas . . . . . . . . . . . . .
20.5 Bose-Einstein-Kondensation . . . . . . . .
20.6 Das ideale Fermigas . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
21 Begründung der Thermodynamik makroskopischer
21.1 Arbeit und Wärme bei Zustandsänderungen . . . . .
21.2 Erster Hauptsatz . . . . . . . . . . . . . . . . . . . .
21.3 Entropieänderungen bei Zustandsänderungen . . . .
21.4 Zweiter Hauptsatz . . . . . . . . . . . . . . . . . . .
21.5 Unmöglichkeit des perpetuum mobile zweiter Art . .
21.6 Unmöglichkeit des perfekten Kühlapparats . . . . . .
21.7 Die Carnotmaschine . . . . . . . . . . . . . . . . . .
21.8 Relaxation ins Gleichgewicht . . . . . . . . . . . . .
Abbildungsverzeichnis
Systeme
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
9
.
.
.
.
.
.
.
.
359
359
360
360
361
362
364
364
367
371
10
INHALTSVERZEICHNIS
Kapitel 1
Masse
1.1
Freie Teilchen
Das freie Teilchen ist eine nützliche Idealisierung. Seine Freiheit ist eine
Freiheit von Kräften. Beispiele für näherungsweise freie Teilchen kennen Sie
vom Luftkissentisch und aus der Raumfahrt.
Das freie Teilchen ändert im Lauf der Zeit seine Geschwindigkeit nicht. Es
bewegt sich geradlinig und legt in gleichen Zeitabschnitten ∆t gleiche Wegstücke
∆~x = (∆x, ∆y, ∆z) zurück, so dass für seine Geschwindigkeit gilt
~v = (vx , vy , vz ) =
µ
∆x ∆y ∆z
,
,
∆t ∆t ∆t
¶
−−−→
= const .
(1.1)
Wenn ein Teilchen in einem Bezugssystem S frei ist, so auch in jedem anderen, S 0 , das sich relativ zu S gleichförmig und geradlinig bewegt. Alle diese
Systeme heißen Inertialsysteme. Es ist gleichgültig, welches Inertialsysteme zur
Beschreibung der Bewegung des freien Teilchens benutzt wird. Beispielsweise
kann ein Ruhesystem gewählt werden, d. h. ein Koordinatensystem, bezüglich
−−−→
dessen das Teilchen unbewegt ruht. Jedenfalls gilt ~v = const in allen Inertialsystemen.
Wenn sich zwei Teilchen mit gleichförmiger Geschwindigkeit ~v1 und ~v2 bewegen, so lässt sich aus Prinzip nicht entscheiden, welches von beiden ruht und
welches in Bewegung ist. Im Ruhesystem eines der beiden bewegt sich das
andere.
1.2
Träge Teilchen
~
Um die Geschwindigkeit
eines Teilchens zu ändern, bedarf es einer Kraft K.
p
2
2
2
Zur Änderung |∆~v | = (∆vx ) + (∆vy ) + (∆vz ) in der Zeitspanne ∆t ist eine
um so größere Kraft vonnöten, je träger ein Teilchen ist. Für hinreichend kleine
Zeitspannen ∆t und Geschwindigkeitsänderungen ∆~v ergibt sich im Experiment
die Proportionalität
∆~v
~ .
∼K
∆t
11
(1.2)
12
1 Masse
Der Proportionalitätsfaktor heißt die träge Masse m des Teilchens. Je größer
sie ist, desto träger ist das Teilchen. Für alle Teilchen gilt
m≥0,
(1.3)
da erfahrungsgemäß die Änderungsrate der Geschwindigkeit ∆~v ∆t und die
~ gleichgerichtet sind.
Kraft K
Anstatt das Gesetz (1.2) für endliche aber hinreichend kleine Differenzen ∆t
und ∆~v zu formulieren, führt man den Differentialquotienten
lim
∆t→0
d~v
∆~v
=
=
∆t
dt
µ
dvx dvy dvz
,
,
dt
dt
dt
¶
(1.4)
ein und nennt den Grenzwert d~v /dt der Änderung der Geschwindigkeit im beliebig kleinen Zeitintervall die Beschleunigung des Teilchens. Mit Hilfe dieses
Begriffes schreibt sich das Gesetz (1.2) in der wohlbekannten Form
~ = m d~v .
K
dt
(1.5)
Sie kennen (1.5) als eines der Newtonschen Grundgesetze der Mechanik. Es
erlaubt, sobald die auf das Teilchen wirkende Kraft als Funktion der Koordinaten des Teilchens bekannt ist, die Berechnung der möglichen Bahnkurven
~x(t) = (x(t), y(t), z(t)).
1.3
Ein Beispiel: konstante Kraft
Ich erinnere Sie an den einfachsten Fall einer nicht gleichförmigen Bewegung: Ein Teilchen ist einer räumlich und zeitlich konstanten Kraft ausgesetzt.
Beispiele solcher Kräfte sind - mit guter Näherung - die Schwerkraft nahe der
Erdoberfläche und die elektrische Kraft, die ein geladenes Teilchen zwischen den
parallelen Platten eines ebenen Plattenkondensators erfährt.
Zur Beschreibung der Bahnkurve wählen wir das Koordinatensystem so, dass
~ = (0, 0, K). Dann lautet das Grundgesetz (1.5)
K
dvx
= 0,
dt
dvy
=0,
dt
dvz
1
=
K .
dt
m
(1.6)
Die beiden ersten dieser Gleichungen besagen, dass die x- und y-Komponenten
der Geschwindigkeit sich zeitlich nicht ändern, d. h. vx (t) = vx (0) = const
und vy (t) = vy (0) = const. Es lässt sich dann übrigens immer ein Koordinatensystem angeben, in dem vx = vy = 0 ist. Die letzte der drei Gleichungen
besagt, dass die Beschleunigung des Teilchens in z-Richtung zeitlich konstant
ist. Demnach gilt für die Geschwindigkeit
vz (t) =
1
Kt + vz (0) ,
m
(1.7)
1.4 Das Galileische Relativitätsprinzip
13
wobei die Integrationskonstante vz (0) die Bedeutung der anfänglichen Geschwindigkeit in z-Richtung hat. Die drei Lösungen der Gleichungen (1.6) lassen sich
zu der Vektorgleichung
~v (t) = ~v (0) +
1 ~
Kt
m
(1.8)
zusammenfassen.
Wenn wir beachten, dass die Geschwindigkeit des Teilchens die zeitliche
Änderung der Ortskoordinaten gibt,
µ
¶
∆~x
d~x
dx dy dz
~v = lim
=
=
,
,
,
(1.9)
∆t→0 ∆t
dt
dt dt dt
so können wir (1.8) als Differentialgleichungen für den Ortsvektor ~x = (x, y, z)
auffassen,
dx
= vx (0),
dt
dy
= vy (0),
dt
dz
1
= vz (0) + Kt .
dt
m
(1.10)
Durch Integration über die Zeit erhalten wir die Bestimmungsgleichungen der
Bahnkurve
x(t) = vx (0)t + x(0)
y(t) = vy (0)t + y(0)
1
Kt2 + vz (0)t + z(0) ,
z(t) =
2m
(1.11)
die sich wieder zu einer Vektorgleichung vereinigen lassen,
~x(t) = ~x(0) + ~v (0)t +
1 ~ 2
Kt .
2m
(1.12)
Die drei Integrationskonstanten x(0), y(0), z(0) haben offensichtlich die Bedeutung der anfänglichen Koordinaten des Teilchens. Insgesamt treten in der
Bahnkurve (1.11) sechs Integrationskonstanten auf, die drei anfänglichen Geschwindigkeitskomponenten neben den drei anfänglichen Koordinaten. Die Zahl
der Integrationskonstanten erklärt sich dadurch, dass jede der drei Bewegungsgleichungen (1.6) zweimal integriert werden musste, damit die Lösung (1.11)
entstand.
1.4
Das Galileische Relativitätsprinzip
Über das freie Teilchen hatte ich gesagt, es sei gleichgültig, von welchem
Inertialsystem aus seine Bewegung beschrieben wird; in allen Inertialsystemen
−−−→
~ wirkt, so gilt zwar in keinem
gilt ~v = const. Wenn auf ein Teilchen eine Kraft K
−−−→
~
Koordinatensystem, bezüglich dessen K 6= 0 konstatiert wird, ~v = const. Ich
14
1 Masse
zeige aber jetzt, zunächst für den eben betrachteten Spezialfall einer konstanten Kraft, dass zur Beschreibung der Bewegung immer noch alle gleichförmig
zueinander bewegten Koordinatensysteme gleichberechtigt sind.
Führen wir insbesondere ein Koordinatensystem S 0 ein, dessen Ursprung im
bisher benutzten Koordinatensystem S die Koordinaten
~x0 (t) = ~x(0) + ~v (0)t
(1.13)
hat und dessen Achsen zu den entsprechenden von S parallel liegen. S 0 ist
ein anfängliches Ruhesystem des Teilchens. Der Ursprung von S 0 bewegt sich
relativ zu S gleichförmig mit ~v (0); zur Zeit t = 0 liegt er bei ~x(0), wo dann auch
gemäß (1.12) das betrachtete Teilchen sitzt. Wenn die Uhren im S 0 genauso
laufen wie in K, was für hinreichend kleine Relativitätsgeschwindigkeit ~v (0)
eine Erfahrungstatsache ist, so misst der das Koordinatensystem S 0 benutzende
Beobachter für die Koordinaten des Teilchen
x0 (t) = 0,
y 0 (t) = 0,
z 0 (t) =
1
Kt2
2m
(1.14)
bzw. in Vektorform
~x0 (t) =
1 ~ 2
Kt .
2m
(1.15)
Zwischen den Koordinaten des Teilchens in S und S 0 besteht der Zusammenhang
~x = ~x0 + ~x(0) + ~v (0)t,
t = t0 ,
(1.16)
der als Galileitransformation bezeichnet wird.
Es ist wie gesagt gleichgültig, ob die Bewegung des Teilchens unter dem
~ im Koordinatensystem S oder im Koordinatensystem S 0
Einfluss der Kraft K
beschrieben wird. Zwar ändert sich unter der Galileitransformation (1.16) die
Bahnkurve, und zwar von (1.12) zu (1.15); gleich bleibt jedoch in S und S 0 (und
~ = md2 ~x/dt2 . Denn wir erhalten
allen Inertialsystemen) das Grundgesetz K
durch zweimaliges Differenzieren nach der Zeit aus (1.15)
Ã
!
~ 2
d2 ~x0
d2 Kt
~
m 02 = m 2
=K
dt
dt
2m
und aus (1.12)
d2 ~x
d2
m 2 =m 2
dt
dt
Ã
~ 2
Kt
+ ~v (0)t + ~x(0)
2m
!
~ ,
=K
also in beiden Fällen dieselbe Differentialgleichung.
−−−→
~ = const
Was ich hier am Beispiel des speziellen Kraftgesetzes K
vorgeführt
~ = K(~
~ x) richtig: Das Grundgesetz
habe, ist auch für andere Kraftgesetze K
~ = md~v /dt gilt in gleicher Form in allen Inertialsystemen, d. h. allen KoK
ordinatensystemen, die durch die Galileitransformation (1.16)verknüpft sind.
1.5 Schwere Teilchen
15
Der Grund für die Invarianz (Unveränderlichkeit) des Grundgesetzes unter der
Galileitransformation ergibt sich aus folgender Überlegung: einerseits ist die Beschleunigung eines Teilchens in allen Inertialsystemen gleich. Wenn wir nämlich
in (1.16)~x und ~x0 als zeitabhängige Ortsvektoren eines Teilchens ansehen, so gilt
d2 ~x
d2 ~x0
d2
d2 ~x0
=
+ 2 (~x(0) + ~v (0)t) =
.
2
2
dt
dt
dt
dt2
Andererseits sind Größe und Richtung der an einem Punkt im Raum auf das
~ x) unabhängig davon, ob wir den Raumpunkt mit
Teilchen wirkenden Kraft K(~
Koordinaten bezüglich S oder bezüglich S 0 versehen.
Die Invarianz des Grundgesetzes unter der Galileitransformation (1.16)ist eine wichtige Symmetrieeigenschaft des Grundgesetzes (1.5). Sie beinhaltet auch
das wohlbekannte Additionsgesetz für Geschwindigkeiten. Hat ein Teilchen im
System S 0 zu einem bestimmten Zeitpunkt die Geschwindigkeit ~v 0 und bewegt
sich S 0 relativ zu S gleichförmig mit ~u, so hat das Teilchen in S die Geschwindigkeit
~v = ~v 0 + ~u .
Abbildung 1.1
Empirisch ist das soeben besprochene Additionstheorem für Geschwindigkeiten genau wie das Newtonsche Grundgesetz schön abgesichert. Allerdings
nur für Teilchen- und Relativgeschwindigkeiten, die allesamt klein gegenüber
der Lichtgeschwindigkeit c ≈ 300 000 km/s sind. Sobald Geschwindigkeiten im
Spiel sind, die betragsmäßig auch nur einige Prozent von c betragen, werden sowohl das Vektoradditionsgesetz für Geschwindigkeiten wie auch das Newtonsche
Grundgesetz unrichtig. Die dann an ihre Stelle tretenden Gesetze besprechen
wir im Kapitel 9. Vorläufig beschränken wir uns auf den nichtrelativistischen“
”
Newtonschen Grenzfall |~v |/c ¿ 1.
1.5
Schwere Teilchen
Die Wanderer und Bergsteiger unter Ihnen kennen den Unterschied zwischen
leichten und schweren Rucksäcken. Verschiedene Teilchen erfahren an der Erdoberfläche eine verschiedene Schwerkraft. Im durch die Abbildung 1.5 beschriebenen Gedankenexperiment lässt sich die Schwere“ eines Körpers quantitativ
”
erfassen.
Je schwerer ein an einer Feder aufgehängter Körper ist, desto weiter dehnt sich
dieselbe aus. Nach geeigneter Eichung der Feder kann der Betrag der auf einen
16
1 Masse
Abbildung 1.2
aufgehängten Körper wirkenden Schwerkraft aus der Verlängerung ∆z der Feder
abgelesen werden.
Die Schwerkraft, die ein Probekörper an der Erdoberfläche erfährt, ist stets
zum Erdmittelpunkt hin gerichtet. Ihre Richtung ändert sich, wenn der fragliche Probekörper auf der Erdoberfläche bewegt wird. Folglich ist die Schwerkraft
nicht eine Eigenschaft des Probekörpers allein, sondern eine gemeinsame Eigenschaft desselben und der ihn anziehenden Erde.
Um die Schwere eines Probekörpers als richtungsunabhängige Eigenschaft
seiner selbst zu charakterisieren, wird der Begriff der schweren Masse eingeführt
durch
~ schwer | .
mschwer ∼ |K
(1.17)
~ schwer | in Newton
Wenn die schwere Masse in kg und die Schwerkraft |K
−2
(1 N = 1 kg · m · s ) gemessen werden, so ergibt sich der Proportionalitätsfaktor
~ schwer |/mschwer
g = |K
(1.18)
aus Messungen an der Erdoberfläche zu
g = 9, 81 m·s−2 .
(1.19)
Allerdings verkleinert sich der Proportionalitätsfaktor für wachsende Entfernung
vom Erdmittelpunkt.
Sie haben die Anziehungskraft zwischen zwei Teilchen mit den schweren
Massen mschwer und Mschwer im Labor gemessen und das berühmte Newtonsche
Gravitationsgesetz gefunden. Dieses besagt:
- Die beiden Teilchen ziehen sich gegenseitig an.
- Die beiden Anziehungskräfte sind betragsmäßig gleich (actio = reactio)
und einander entgegengerichtet; ihre Richtungen sind parallel zur Verbindungslinie der (Schwerpunkte der) Teilchen.
1.5 Schwere Teilchen
17
- Der Betrag der Gravitationskraft ist proportional zu den beiden schweren
Massen,
~ ∼ mschwer
|K
und
~ ∼ Mschwer
|K|
- Mit wachsender Entfernung r der beiden Teilchen nimmt der Betrag der
Gravitationskraft ab, u. z. umgekehrt proportional zum Quadrat der Entfernung,
~ ∼
|K|
1
.
r2
Insgesamt lässt sich der Betrag der Gravitationskraft ausdrücken als
~ =G
|K|
mschwer Mschwer
,
r2
(1.20)
wobei
G = 6, 67 × 10−11 N m2 kg−2
(1.21)
die so genannte Gravitationskonstante ist.
Jeder Körper ist zugleich träge und schwer. Die Trägheit wird quantifiziert
durch die träge Masse, die Schwere durch die Masse. Warum tragen beide
Größen den Namen Masse? Die Antwort begründet sich in einem Messergebnis,
das zuerst von Galilei (1564 - 1642) gefunden und seither immer wieder mit
wachsender Genauigkeit nachgeprüft wurde: Das Verhältnis von schwerer Masse
und träger Masse ist für alle Teilchen gleich. Der Zahlenwert des Verhältnisses
hängt von der Wahl der Einheiten ab, hat also keine physikalische Bedeutung.
Es ist üblich, sowohl mschwer als auch mträge in kg zu messen. Dann gilt
mschwer = mträge
(1.22)
und daher heißen beide Größen Masse. Meistens spricht man undifferenziert von
der Masse eines Körpers, ohne besonders hervorzuheben, ob jeweils die Trägheit
oder die Schwere des Körpers zur Debatte steht.
Die Gleichheit von schwerer und träger Masse ist, nach unserem heutigen Verständnis der Materie, von fundamentalerer Bedeutung als die beiden
~ = md~v /dt und K = GmM/r 2 . Ersteres gilt nur
Newtonschen Gesetze K
näherungsweise für Teilchen mit v ¿ c, letzteres nur näherungsweise für Teilchen mit hinreichend kleinen Massen in hinreichend großen Entfernungen voneinander. Der Planet Merkur merkt im Perihel (Punkt kleinsten Abstands zur
Sonne) seiner Bahn eine Abweichung der Anziehungskraft der Sonne von diesem Gesetz. Einstein folgerte aus mschwer = mträge eine Gravitationstheorie, die
allgemeine Relativitätstheorie, die genauer ist als das Newtonsche Gesetz.
18
1 Masse
Kapitel 2
Schwingungen
2.1
Der harmonische Oszillator
Betrachten wir ein Teilchen der Masse m, das längs einer Geraden beweglich
und durch eine harmonische Rückstellkraft an eine Gleichgewichtslage gebunden
ist. Wenn wir die Auslenkung des Teilchens aus der Gleichgewichtslage mit der
Koordinate x parametrisieren, so kommt die Harmonizität der Rückstellkraft
zum Ausdruck in der Linearität der Kraft
K = −kx
(2.1)
in der Auslenkung x. Der Proportionalitätsfaktor k wird zuweilen als Kraftkonstante bezeichnet und ist als positiv definiert. Das Minuszeichen im Kraftgesetz
(2.1) zeigt somit an, dass die Kraft der Auslenkung stets entgegenwirkt und
tatsächlich eine Rückstellkraft ist.
~ = md~v /dt
Für das in Rede stehende Teilchen gibt das Newtonsche Gesetz K
als Bewegungsgleichung die so genannte Schwingungsgleichung
m
d2 x
= −kx ,
dt2
(2.2)
aus der wir nun die Bahnkurve x(t) gewinnen wollen. Mit Hilfe von
ω 2 = k/m
(2.3)
und d2 x/dt2 = ẍ bringen wir die Bewegungsgleichung (2.2) zunächst in die
schönere Form
ẍ + ω 2 x = 0 .
(2.4)
Eine Lösung der Differentialgleichung (2.4) lässt sich sofort angeben,
x(t) = 0 .
19
(2.5)
20
2 Schwingungen
Sie entspricht dem Ruhezustand des Teilchens in der Gleichgewichtslage und
heißt die triviale Lösung. Es muss zwei linear unabhängige nichttriviale Lösungen
geben, da die Differentialgleichung (2.4) von zweiter Ordnung ist. Ein mögliches
Paar solcher Lösungen ist sin ωt und cos ωt. Wegen der Linearität der Bewegungsgleichung gilt das Superpositionsprinzip. Die allgemeinste Lösung ergibt
sich daher als die Schwingung
x(t) = a cos ωt + b sin ωt .
(2.6)
Die beiden Integrationskonstanten a und b können durch Anfangsbedingungen festgelegt werden, z. B. durch die anfängliche Auslenkung x(0) und die
anfängliche Geschwindigkeit ẋ(0). Dann entsteht aus (2.6)
x(t) = x(0) cos ωt +
1
ẋ(0) sin ωt.
ω
(2.7)
Wir können auch die Additionstheoreme für Sinus und Kosinus benutzen
und schreiben
x(t) = xmax cos(ωt − ϕ)
(2.8)
und die beiden Integrationskonstanten xmax , ϕ durch x(0) und ẋ(0) ausdrücken.
Dabei finden wir für die Amplitude xmax der Schwingung
xmax =
p
x(0)2 + (ẋ(0)/ω)2
(2.9)
und für die Phase ϕ
tan ϕ = ẋ(0)/ωx(0) .
(2.10)
Es ist für viele, vor allem rechnerische Zwecke bequem, statt mit cos ωt
und sin ωt mit Exponentialfunktionen zu arbeiten. Setzen wir zur Lösung der
Gleichung (2.4) an
x(t) = eλt ,
(2.11)
so erhalten wir aus (2.4) die Forderung
(λ2 + ω 2 ) eλt = 0 .
(2.12)
Der Ansatz (2.11) führt offenbar zu Lösungen für λ = ±iω. Diese lauten e±iωt ,
oder linear kombiniert,
x(t) = A e−iωt + B e−iωt .
(2.13)
2.2 Der Energieeigensatz
21
Die beiden Integrationskonstanten A und B lassen sich wieder durch x(0) und
ẋ(0) ausdrücken
x(t)
=
=
µ
µ
¶
¶
1
i
i
1
x(0) − ẋ(0) e iωt +
x(0) + ẋ(0) e−iωt
2
ω
2
ω
¶
µ
i
1
(2.14)
x(0) − ẋ(0) e iωt + c.c. .
2
ω
Offensichtlich gilt A = B ∗ , und das muss auch so sein, damit x(t) reell bleibt.
Mit Hilfe von
eiα = cos α + i sin α
(2.15)
lässt sich die Lösung (2.14) wieder auf die Form (2.7) oder (2.8) zurückführen.
2.2
Der Energieeigensatz
Anstatt Lösungen der Schwingungsgleichung zu raten oder durch Exponentialansätze zu suchen, können wir sie auch durch zweimaliges Integrieren konstruieren. Dabei finden wir nicht nur die bekannten Lösungen, sondern auch,
nach einer Integration, einen der wichtigsten Sätze der Physik, den Energieerhaltungssatz.
Multiplizieren wir nämlich beide Seiten der Schwingungsgleichung (2.2) mit
der Geschwindigkeit ẋ, so lässt sich die entstehende Gleichung,
mẋẍ + k ẋx = 0 ,
als das Verschwinden einer totalen Zeitableitung schreiben,
¶
µ
1
1
d
2
2
mẋ + kx = 0 .
dt 2
2
(2.16)
(2.17)
Folglich bleibt die Größe
1
1
mẋ2 + kx2 = E ≥ 0 ,
2
2
(2.18)
die Energie des Oszillators, zeitlich konstant. Sie besteht aus zwei nichtnegativen additiven Anteilen, der kinetischen Energie
T =
m 2
ẋ
2
(2.19)
U=
k 2
x .
2
(2.20)
und der potenziellen Energie
22
2 Schwingungen
Wenn U zunimmt, d. h. wenn die Auslenkung |x| wächst, muss T abnehmen,
d. h. die Geschwindigkeit |ẋ| sich verkleinern, U ist maximal, Umax = E, wenn
T = 0, d. h. wenn das Teilchen ruht. Ein solcher Momentanzustand liegt immer
in den Umkehrpunkten
±x = xmax =
p
2E/k
(2.21)
vor. Dagegen hat die Geschwindigkeit den Maximalwert
±ẋ = ẋmax =
p
2E/m
(2.22)
jedesmal, wenn das Teilchen die Gleichgewichtslage bei x = 0 durchläuft, denn
dort hat die potenzielle Energie den kleinstmöglichen Wert U = 0 Abbildung
(2.1).
Die potenzielle Energie lässt sich durch die Kraft ausdrücken und umgekehrt.
Sie verifizieren leicht, dass die Kraft der negativen Ableitung der potenziellen
Energie gleich ist,
d
K = −kx = −
dx
µ
k 2
x
2
¶
=−
d
U ,
dx
Abbildung 2.1
und die potenzielle Energie dem negativen Integral über die Kraft,
(2.23)
2.3 Der Energiesatz für beliebige konservative Kräfte
U =+
Zx
1
dx kx = kx2 = −
2
0
0
0
Zx
dx0 K(x0 ) .
23
(2.24)
0
Man sagt auch, dass beim Vergrößern von x gegen die Kraft K Arbeit geleistet
wird. Dabei wird die Arbeit als potenzielle Energie gespeichert.
Die Begriffsbildungen Energie, kinetische Energie und potenzielle Energie
werden wir später vertiefen. Vorläufig konzentrieren wir uns auf die Aufgabe,
die Bahnkurve x(t) des Oszillators zu konstruieren. Zu diesem Zweck lösen wir
den Energiesatz (2.18) nach der Geschwindigkeit auf,
s
µ
¶
2
k 2
dx
ẋ(t) =
,
(2.25)
E− x =
m
2
dt
und integrieren. Wir erhalten
x(t)
Z
x(0)
q
dx
2
m
¡
E−
k
2
x2
¢=
Zt
dt = t ,
(2.26)
0
wobei jetzt x(0) als zweite Integrationskonstante neben E auftritt. Gleichfalls
möglich und sogar ein wenig bequemer
p ist es, statt der anfänglichen Auslenkung
x(0) die größte Amplitude, xmax = 2E/k, als Integrationskonstante zu wählen
und einen der (∞ vielen) Zeitpunkte,
an denen x = +xmax vorliegt, als tmax zu
p
bezeichnen. Mit Hilfe von ω = k/m erhalten wir dann statt (2.26)
x(t)
Z
+xmax
p
dx
x2max
− x2
= ω(t − tmax ) .
(2.27)
Das links stehende Integral hat den Wert − arccos (x(t)/xmax ). Damit ist die
aus 2.1 bekannte Lösung
x(t) = xmax cos ω(t − tmax )
(2.28)
wiedergefunden. Diesmal, wohlgemerkt, nicht durch gescheites Raten sondern
durch direkte Integration der Bewegungsgleichung.
2.3
Der Energiesatz für beliebige konservative
Kräfte
Beim Integrieren der Bewegungsgleichung mẍ+kx = 0 zum Energiesatz E =
mẋ/2 + kx2 /2 war gar nicht wesentlich, dass die Kraft linear in x ist; vielmehr
nur, dass K = K(x) nur von x abhängt und nicht etwa auch von ẋ, ẍ etc.
Kräfte, die eindeutige Funktionen einer Koordinate x sind, heißen konservativ
(konservativ = erhaltend; Energieerhaltung). Wirkt eine beliebige derartige
Kraft auf ein Teilchen, so lautet die Newtonsche Bewegungsgleichung
24
2 Schwingungen
mẍ − K(x) = 0 .
(2.29)
Durch Multiplikation mit der Geschwindigkeit ẋ entsteht hieraus
mẋẍ − ẋK(x) = 0 .
(2.30)
Schreiben wir die Kraft als negative Ableitung einer Funktion U (x)
K(x) = −
d
U (x) = −U 0 (x) ,
dx
(2.31)
so lässt sich (2.30) offenbar wieder als der Erhaltungssatz
d
dt
µ
1
mẋ2 + U (x)
2
¶
=0
(2.32)
oder
1
mẋ2 + U (x) = const = E
2
(2.33)
schreiben. Dabei ist U (x) die potenzielle und T = 21 mẋ2 wieder die kinetische
Energie.
Wie schon beim harmonischen Oszillator erlaubt der Energiesatz (2.33) vor
jeder weiteren Rechnung qualitative Einblicke in den Ablauf der Bewegung des
Teilchens. Wenn etwa die potenzielle Energie den in Abbildung 2.2 skizzierten
Verlauf hat, so gilt für die Energie
E ≥ Umin ,
(2.34)
da die kinetische Energie nicht negativ sein kann. Durch den Wert der Energie
sind zwei Umkehrpunkte x1 (e) und x2 (E) festgelegt, in denen das Teilchen
momentan ruht und die die Aufenthaltsmöglichkeit des Teilchens einschränken,
x1 (E) ≤ x ≤ x2 (E) .
(2.35)
Die Teilchenkoordinate schwingt dann zwischen den beiden Umkehrpunkten hin
und her. Allerdings verläuft die Schwingung nicht harmonisch, d. h. sinusoder kosinusförmig mit einer Frequenz ω, es sei denn, U (x) habe genau die
Form einer quadratischen Parabel. Man spricht von einer nichtlinearen oder
anharmonischen Schwingung.
Die Berechnung der Bahnkurve x(t) kann für die nichtlineare Schwingung
bis auf eine Quadratur genauso durchgeführt werden wie für die harmonische
Schwingung. Durch Auflösen des Energiesatzes (2.33) nach der Geschwindigkeit
erhalten wir wieder (2.25), also
2.3 Der Energiesatz für beliebige konservative Kräfte
25
Abbildung 2.2
dx
=±
dt
r
2
(E − U (x))
m
(2.36)
und hieraus durch Integration nach der Zeit
t=±
r
m
2
Z
dx (E − U (x))
−1/2
+ const .
(2.37)
Zur Gewinnung der Bahnkurve ist nur die eine in (2.37) offene Quadratur auszuführen.
Für die Dauer einer Schwingung ergibt sich aus (2.37) das Resultat
T
=
=
r
√
x
Z2
m
2 
2m
x1
Zx2
x1
dx(E − U (x))−1/2 −
dx (E − U (x))
−1/2
.
Zx1
x2
dx (E − U (x))
−1/2



(2.38)
Im allgemeinen wird die Dauer einer nichtlinearen Schwingung von der Energie
E abhängen. Als kleine Übung bleibt Ihnen, durch Ausführen des Integrals
in (2.38) für den p
Fall der harmonischen Bindung, U = kx2 /2, das altbekannte
Resultat T = 2π m/k = 2π/ω zu gewinnen. Beachten Sie, dass T in diesem
Spezialfall von der Energie E der Schwingung (u. somit auch von der Schwingungsamplitude) unabhängig ist.
26
2 Schwingungen
Die eben gegebene Diskussion lässt sich leicht verallgemeinern auf potenzielle
Energien U (x), die komplizierter verlaufen als in Abbildung 2.2 veranschaulicht.
Ein interessanter Fall ist in Abbildung 2.3 dargestellt.
Abbildung 2.3
Wenn die Energie des Teilchens wie in der Skizze eingetragen im Intervall
U2 < E < U 4
(2.39)
liegt, so kann sich das Teilchen wegen E = T + U ≥ U im Bereich
x1 ≤ x ≤ x 3
(2.40)
aufhalten und dort eine nichtlineare Schwingung der oben beschriebenen Art
ausführen; es kann sich aber auch im nach rechts unbegrenzten Intervall
x5 ≤ x < ∞
(2.41)
befinden und wird sich dann für t → ∞ ins Unendliche verflüchtigen.
Zur Übung bleibt Ihnen die qualitative Diskussion der Teilchenbahn in den
Fällen E > U4 , E = U4 , E ≤ U2 . Im übrigen sollten Sie auch bei Ihrer nächsten
Fahrt auf der Achterbahn an den Energiesatz denken.
2.4
Der gedämpfte harmonische Oszillator
Nicht alle Kräfte sind konservativ. Als ein Beispiel einer nichtkonservativen
Kraft betrachten wir die in der Teilchengeschwindigkeit lineare Reibungskraft
~ = −α~x˙ ,
K
α>0.
(2.42)
Derartige Reibungskräfte wirken z. B. auf makroskopische Körper, die sich durch
viskose Flüssigkeiten bewegen.
2.4 Der gedämpfte harmonische Oszillator
27
Zur Illustration behandeln wir hier den Einfluss der Reibung auf die eindimensionale harmonische Schwingung. Wenn wir neben einer linearen Rückstellkraft auch die Reibungskraft (2.41) in Rechnung stellen, so finden wir als Newtonsche Bewegungsgleichung eines Teilchens der Masse m
mẍ + αẋ + kx = 0 .
(2.43)
Da nun die gesamte auf das Teilchen wirkende Kraft geschwindigkeitsabhängig
ist, gilt der Energiesatz in der bisherigen Form nicht mehr. Anfänglich im
Oszillator steckende Energie geht demselben im Laufe der Zeit verloren: ein
gedämpft schwingendes Pendel kommt nach einer Weile zur Ruhe. Sie wissen,
dass die Oszillatorenergie in Wärme verwandelt wird, d. h. sich in ungeordneter
Bewegung der Teilchen im reibenden Medium wiederfindet. Wir werden diesen
Dissipationsprozess in 2.13 im Einzelnen diskutieren.
Da die Bewegungsgleichung (2.43) linear ist, lässt sie sich ebenso wie die des
ungedämpften harmonischen Oszillators in 2.1 durch den Exponentialansatz
x(t) = eλt
(2.44)
lösen. Für den Parameter λ erhalten wir aus (2.43) die Forderung (die Säkulargleichung)
mλ2 + αλ + k = 0 ,
die durch die beiden Werte (die Eigenwerte)
)
(
r³
α ´2
k
α
±
−
λ± = −
2m
2m
m
(2.45)
(2.46)
befriedigt wird. Bequemlichkeitshalber führen wir wieder die Frequenz der ungedämpften Schwingung
r
k
(2.47)
ω0 =
m
ein und zusätzlich die so genannte Dämpfungskonstante
γ=
α
.
2m
Damit schreiben sich die beiden Eigenwerte
q
λ± = −γ ± γ 2 − ω02 .
(2.48)
(2.49)
Die beiden gefundenen Lösungen (2.44) mit (2.49) der Bewegungsgleichung
(2.43) ergeben nach Superposition die allgemeine Lösung
√ 2 2
√ 2 2
(2.50)
x(t) = Ae−(γ− γ −ω0 )t + Be−(γ+ γ −ω0 )t .
28
2 Schwingungen
Die beiden Integrationskonstanten A und B können ähnlich wie in 2.1 durch Anfangsbedingungen festgelegt, also etwa durch die anfängliche Auslenkung x(0)
und die anfängliche Geschwindigkeit ẋ(0) wie folgt ausgedrückt werden
A
=
B
=
·
µ
¶¸ . q
ẋ(0) + x(0) γ +
−
2 γ 2 − ω02
·
µ
¶¸ . q
q
2
2
−ẋ(0) − x(0) γ − γ − ω0
2 γ 2 − ω02 .
q
γ2
ω02
(2.51)
Der gedämpfte Oszillator verhält sich qualitativ verschieden, je nachdem ob die
Dämpfungskonstante γ kleiner, gleich oder größer ist als die Frequenz∗) ω0 der
ungedämpften Schwingung. Im Fall schwacher Dämpfung, γ < ω0 , werden λ±
komplex, d. h. in
q
q
γ 2 − ω02 = i ω02 − γ 2 ≡ iω
(2.52)
ist dann ω eine reelle Frequenz. Die Lösung (2.50) beschreibt eine gedämpfte
Schwingung,
x(t) = (A e+iωt + B e−iωt )e−γt .
(2.53)
Beachten Sie, dass der oszillatorische Faktor in (2.53) harmonisch schwingt
mit der Frequenz ω, die von der Eigenfrequenz ω0 bei Abwesenheit von Dämpfung
verschieden ist. Die Benennung des Parameters γ als Dämpfungskonstante rührt
genau daher, dass die Lösung (2.53) zeitlich exponentiell abklingt, u. z. auf einer
Zeitskala 1/γ. Die Zeit 1/γ wird auch als Abklingzeit bezeichnet.
Im so genannten Fall der Überdämpfung, γ > ω0 , sind beide Eigenwerte
λ± reell. Nach hinreichend langer Zeit wird die Lösung (2.50) dabei wegen
|λ− | < |λ+ | dominiert durch den ersten Summanden,
√ 2 2
(2.54)
x(t) → A e−(γ− λ −ω0 )t .
Bei starker Überdämpfung, γ À ω0 , lässt sich λ− durch wenige Glieder einer
Potenzreihe in (ω0 /γ) approximieren,
−λ−
µ
¶
q
γ 1 − 1 − ω02 /γ 2
¶
µ
1 ω02
.
.
.
≈ γ 1−1+
2 γ2
=
≈
ω02 /2γ .
(2.55)
Da nun 1/|λ− | die Bedeutung einer Abklingzeit hat, sehen wir interessanterweise
dieselbe mit wachsendem γ wachsen.
∗) Frequenz
bedeutet hier immer das 2π-fache der inversen Schwingungsdauer
2.5 Resonanz
29
Im Fall der kritischen Dämpfung, γ = ω0 fallen die beiden Eigenwerte λ+
und λ− zusammen. Der Exponentialansatz (2.44) ergibt somit nur eine Lösung
der Bewegungsgleichung. Eine zweite, linear unabhängige muss existieren, da
(2.43) eine Differentialgleichung zweiter Ordnung ist. Wir verifizieren sie leicht
als te−γt und können die allgemeine Lösung dann wieder durch Superposition
der beiden Partikularlösungen angeben als
x(t) = (a + bt)e−γt .
(2.56)
Beim Bau von Messinstrumenten mit schwingungsfähigen Zeigern wird oft
die kritische Dämpfung eingestellt, um zu erreichen, dass der Zeiger schnellstmöglich auf zeitliche Änderung der zu messenden Größe antwortet. Wir hatten
oben (s. (2.55)) gesehen, dass die Abklingzeit des Oszillators im Grenzfall großer
Dämpfung mit γ wächst wie 2γ/ω02 ; im Grenzfall kleiner Dämpfung beträgt aber
gemäß (2.53) die Abklingzeit 1/γ und wächst zu großen Werten mit γ → 0; die
kleinstmögliche Abklingzeit ergibt sich gerade für γ = ω0 . Abbildung 2.4 zeigt
das Produkt der Abklingzeit τ mit der Frequenz ω0 als Funktion von γ/ω0 und
macht das Argument sinnfälliger.
Abbildung 2.4
2.5
Resonanz
Manchmal finden Sie im Wald morsche Bäume, die sich von Hand fällen
lassen. Mit gleichmäßigem Drücken oder Ziehen gelingt es zwar nicht, wohl
aber mit rhythmischem Drücken und Ziehen im Takt einer Eigenfrequenz“ des
”
Baumes.
Um die Theorie dieses Resonanzphänomens abzuhandeln, berücksichtigen wir
in der Bewegungsgleichung des Oszillators neben der Rückstell- und der Reibungskraft eine äußere zeitlich periodische monochromatische Kraft gemäß
mẍ + 2mλẋ + mω02 x = F (t) = F1 cos ω1 t .
(2.57)
Aus Bequemlichkeit lösen wir diese Gleichung in komplexer Form, d. h. suchen zunächst die Lösung ξ(t) der Differentialgleichung
30
2 Schwingungen
Abbildung 2.5
mξ¨ + 2mγ ξ˙ + mω02 ξ = F1 eiω1 t
(2.58)
und nehmen von der Lösung den Realteil. Dieser löst die ursprüngliche Gleichung (2.57), denn (2.58) lautet
µ
¶³
´
d2
d
2
m 2 + 2mγ
Re ξ(t) + i Im ξ(t) = F1 cos ω1 t + iF1 sin ω1 t ,
+ mω0
dt
dt
(2.59)
und die Gleichheit zweier komplexer Zahlen ist gegeben bei Gleichheit ist gegeben bei Gleichheit der Real- und Imaginärteile. Es lohnt sich, komplex zu
rechnen, da Exponentialfunktionen einfachere Differentialregeln haben als Sinus und Kosinus.
Gleichung (2.58) ist eine inhomogene lineare Differentialgleichung, deren allgemeine Lösung sich durch Superposition einer beliebigen Partikularlösung der
inhomogenen Gleichung mit der allgemeinen Lösung der zugehörigen homogenen Gleichung ergibt. Eine Partikularlösung der inhomogenen Gleichung finden
wir durch den Exponentialansatz
x(t) = a1 ei(ω1 t−ϕ1 )
(2.60)
mit der reellen Amplitude a1 und der Phase ϕ1 . Dieser Ansatz liegt nahe, denn
wenn Sie mit der Frequenz ω1 am Baum rütteln, so sollte er auch mit dieser
Frequenz schwingen. Tragen wir den Ansatz in die Bewegungsgleichung (2.58)
ein, so erhalten wir die Forderung
(−mω12 + i2mγω1 + mω02 ) a1 ei(ω1 t−ϕ1 ) = F1 eiω1 t
(2.61)
Offenbar lässt sich diese Forderung erfüllen, wenn die komplexe Amplitude
a1 e−iϕ1 zu
a1 e−iϕ1 =
F1 /m
ω02 − ω12 + i2γω1
(2.62)
2.5 Resonanz
31
gewählt wird. Hiermit sind die Phase ϕ1 und die reelle Amplitude a1 festgelegt
als
und
a1 = a1 (ω1 ) = p
F1 /m
(ω02
− ω12 )2 + 4γ 2 ω12
tan ϕ1 = tan ϕ1 (ω1 ) =
2γω1
.
ω02 − ω12
(2.63)
(2.64)
Die allgemeine Lösung von (2.58) lautet nun, mit zwei beliebigen reellen Integrationskonstanten a und ϕ,
ξ(t) = ae−iϕ e(iω−γ)t + a1 e−iϕ1 eiω1 t ,
(2.65)
denn der erste Summand ist genau die im letzten Paragrafen diskutierte allgemeine Lösung der homogenen Schwingungsgleichung mit
q
ω = ω02 − γ 2 .
(2.66)
Der Realteil x(t) = Reξ(t) ist die gesuchte allgemeine Lösung von (2.57). Er
hat die Form
x(t) = a cos(ωt − ϕ)e−γt + a1 cos(ω1 t − ϕ1 ) .
(2.67)
Beachten Sie, dass die hier additiv auftretende freie gedämpfte Schwingung
nach hinreichend langer Zeit abgeklungen ist, während die erzwungene Schwingung der äußeren periodischen Einwirkung unentwegt folgt. Diese andauernde
erzwungene Schwingung will ich Ihnen noch in Einzelheiten erläutern.
Die Amplitude a1 = a1 (ω1 ) ist proportional zu F1 /m, d. h. um so größer,
je weniger träge das schwingende Teilchen und je größer die Amplitude der
erzwungenen Kraft F1 sind. Sie können letzteres Resultat als die Feststellung
lesen, dass sich mit Bulldozern fast jeder Baum umreißen (ω1 = 0) lässt. Einen
größeren morschen Baum merklich aus der Ruhestellung auszulenken oder ihn
gar zu fällen, gelingt Ihnen aus eigener Kraft i. Allg. jedoch nur, wenn Sie die
Frequenzabhängigkeit der Amplitude a1 (ω1 ) ausnutzen. Diskutieren wir diese
Abhängigkeit für den Fall schwacher Dämpfung γ ¿ ω0 .
Die maximale Antwort a1 (ω1 ) des Oszillators stellt sich bei festen Werten von
γ und ω0 für diejenige Frequenz ω1 der äußeren Störung ein, bei der da1 /dω1 = 0
und d2 a1 /dω12 < 0 ist. Aus (2.63) finden wir diese Resonanzfrequenz zu
ωres = (ω02 − 2γ 2 )1/2 ≈ ω0 − γ 2 /ω0 .
(2.68)
Ebenso wie die Eigenfrequenz (2.66) der freien ungedämpften Schwingung liegt
die Resonanzfrequenz ωres nahe der Eigenfrequenz ω0 des freien konservativen
Oszillators,
<
ωres ≈ ω0 − γ 2 /ω0 ∼ ω ≈ ω0 − γ 2 /2ω0 <
∼ ω0 ,
(2.69)
32
2 Schwingungen
falls die Dämpfung im Sinne von γ ¿ ω0 sehr schwach ist. An der Resonanzfrequenz hat die Schwingungsamplitude den Wert
a1,max =
F1
,
2mωγ
(2.70)
der für kleine Dämpfung sehr groß sein kann; so groß, dass die Resonanzkatastrophe eintritt und der Baum aus den Wurzeln gerissen wird; jedenfalls viel
größer als die Antwort auf eine statische äußere Störung
a1 (ω1 = 0) =
F1
.
mω02
(2.71)
Um ein Maß für die Schärfe der Resonanz zu erhalten, können
√ wir nach
den Frequenzen fragen, für die die Amplitude a1 (ω1 ) auf das (1/ √2)-fache des
Maximums (2.70) abgefallen ist. Die Forderung a1 (ω) = a1,max / 2 führt auf
eine quadratische Gleichung mit den Wurzeln
ω2
=
≈
ω02 − 2γ 2 ± 2γω0
ω02 (1
± 2γ/ω0 ) ,
q
1 − γ 2 /ω02
(2.72)
also
ω ≈ ω0 ± γ .
(2.73)
Die Breite der Resonanzkurve“ a1 = a1 (ω1 ) ist also im betrachteten Grenzfall
”
proportional zur Dämpfungskonstanten und somit klein im Vergleich zur Resonanzfrequenz selbst. Die Abbildung 2.6 zeigt den Verlauf der Resonanzkurve.
Abbildung 2.6
2.6 Antwort auf beliebige periodische Anregung (Fourierreihen)
33
Für die Phase ϕ1 zwischen der äußeren Kraft und der Antwort des Oszillators
finden wir aus (2.64) für Frequenzen weit unterhalb der Resonanz den kleinen
Wert
ϕ1 ≈
π
2γω1
¿
ω02 − ω12
2
für
ω0 − ω1 À γ ;
(2.74)
also schwingt der Oszillator dabei praktisch in Phase mit der äußeren Kraft. Für
ω1 = ω0 ist die Phase ϕ1 auf den Wert π/2 angewachsen und für Frequenzen
weit oberhalb der Resonanz schwingt der Oszillator praktisch im Gegentakt zur
äußeren Kraft, d. h. es gilt
ϕ1 <
∼π
für
ω1 − ω0 À γ
(2.75)
Die Abbildung 2.7 macht deutlich, dass sich der Phasensprung von Null nach π
innerhalb eines Frequenzintervalls der Größenordnung γ vollzieht. Für die Beobachtung dieses Phasensprungs sowie der vorher besprochenen Resonanzphänomene
im Labor (lieber doch nicht im Wald!) wünsche ich Ihnen viel Spaß.
Abbildung 2.7
2.6
Antwort auf beliebige periodische Anregung
(Fourierreihen)
Im letzten Paragrafen hatten wir nur monochromatische äußere Störungen
betrachtet. Jetzt will ich die Untersuchung ausdehnen auf Kräfte, die zwar
zeitlich periodisch sind mit der Periode τ gemäß
F (t) = F (t + τ )
(2.76)
die aber nicht notwendig monochromatisch schwingen wie ei2πt/τ . Die Antwort
x(t) des Oszillators auf derartige äußere Kräfte finden wir leicht, wenn wir nur
34
2 Schwingungen
beachten, dass sich eine Funktion f (t) mit der Periodizität (2.76) immer ∗) durch
eine Summe monochromatischer Funktionen, die Fourierreihe
X
F (t) =
Fn einΩt ,
Ω=
n=0,±1,±2,...
2π
τ
(2.77)
mit geeigneten Koeffizienten Fn darstellen lässt. Die Fourierkoeffizienten Fn
sind durch die Funktion F (t) eindeutig festgelegt. Um sie zu konstruieren,
multiplizieren wir beide Seiten von (2.77) mit eimΩt , integrieren über die Zeit
von 0 bis τ und beachten die für ganzzahlige m und n gültige Regel
1
τ
Zτ
dt ei(n−m)Ωt = δnm =
0
½
1
0
für
für
n=m
n 6= m .
(2.78)
Es ergibt sich
Fm
1
=
τ
Zτ
dt e−imΩt F (t) .
(2.79)
0
Nach den Überlegungen des 2.5 ruft eine auf den Oszillator einwirkende Kraft
Fn einΩt die Antwort
x(t) =
m(ω02
Fn einΩt
− n2 Ω2 + i2γnΩ)
(2.80)
hervor. Wegen der Linearität der Schwingungsgleichung
m(ẍ + 2γ ẋ + ω02 x) = F (t)
(2.81)
lässt sich die Lösung derselben bei Vorliegen der äußeren Kraft (2.77) durch
Superposition der Antworten (2.80) auf die monochromatischen Bestandteile
Fn einΩt konstruieren. Sie lautet also, unter Einschluss des Einschwingungsvorgangs,
x(t) =
X
Fn 2
(ω0 − n2 Ω2 + i2γnΩ)−1 einΩt + a cos(ωt − ϕ)e−γt (2.82)
m
n=0,±1,±2,...
mit ω = (ω02 − γ 2 )1/2 . Bis auf den zeitlich abklingenden Einschwingungsvorgang
ist diese Lösung offenbar auch periodisch mit der Periode τ = 2π/Ω.
Zu einer gegebenen periodischen äußeren Kraft F (t) sind nur die Fourierkoeffizienten Fn aus (2.79) zu bestimmen, damit die allgemeine Lösung (2.82)
der Schwingungsgleichung (2.81) explizit angegeben werden kann. Wenn eine
(und nur eine!) der Frequenzen nΩ nahe bei der Resonanzfrequenz ωres des Oszillators liegt, so wird die Fourierreihe (2.82) vom entsprechenden Summanden
∗) Die Theorie der Fourierreihen ersetzt immer“ durch Forderungen an die Funktion F (t),
”
die ich im folgenden als erfüllt ansehe.
2.7 Antwort auf beliebige Anregung
35
dominiert, da alle anderen Koeffizienten Fm betragsmäßig viel kleiner sind als
der zur Resonanz gehörige.
Würden Sie übrigens auch brummig reagieren, wenn man Ihnen Mozarts
Kleine Nachtmusik über einen Lautsprecher“ vorspielte, der bei 60 Hertz eine
”
nur schwach gedämpfte Eigenschwingung aufweist?
2.7
Antwort auf beliebige Anregung
Auch bei Vorliegen einer beliebigen nichtperiodischen äußeren Kraft F (t)
können wir die Bewegungsgleichung des harmonischen Oszillators,
ẍ + 2γ ẋ + ω02 x = F (t)/m ,
(2.83)
lösen durch Superposition der Antworten auf monochromatische Kräfte. Zu
diesem Zweck müssen wir zunächst die Kraft F (t) durch ein Fourierintegral
F (t) =
+∞
Z
dΩ iΩt
e F (Ω)
2π
(2.84)
−∞
darstellen. Wir hatten die Antwort x(Ω)eiΩt auf die monochromatische Kraft
F (Ω)eiΩt in 2.6 gefunden,
x(Ω)eiΩt =
F (Ω)/m
eiΩt ,
ω02 − Ω2 + i2γΩ
(2.85)
wobei der Einschwingvorgang nicht mit aufgeschrieben ist. Mit Hilfe des Superpositionsprinzips erhalten wir die Antwort auf die Überlagerung (2.84) von
monochromatischen Kräften als
x(t) =
+∞
Z
−∞
dΩ iΩt
F (Ω)/m
e
.
2π
ω02 − Ω2 + i2γΩ
(2.86)
Zur Auswertung der Lösung (2.86) bei vorgegebener Kraft F (t) muss zunächst
die Fouriertransformierte F (Ω) bestimmt und dann das Integral in (2.86) berechnet werden. Ich verzichte hier auf die Darlegung der erforderlichen mathematischen Techniken zugunsten der physikalisch durchsichtigeren Konstruktion
einer zu (2.86) äquivalenten Lösung der Bewegungsgleichung (2.83).
Denken wir uns unser schwingungsfähiges Teilchen zu einem Anfangszeitpunkt t0 bei x = 0 ruhend und dann einem Kraftstoß ausgesetzt, d. h. einer Kraft
F (t0 ), die nur innerhalb einer kurzen Zeitspanne ∆t von t0 bis t0 + ∆t von Null
verschieden und innerhalb dieses Intervalls konstant ist. Für das nachfolgende
Argument sind von Interesse die Auslenkung x(t0 +∆t) und die Geschwindigkeit
ẋ(t0 + ∆t) am Ende des Kraftstoßes.
Indem wir x(t) um die Zeit t = t0 in eine Taylorreihe entwickeln,
x(t) = x(t0 ) + ẋ(t0 )(t − t0 ) +
1
ẍ(t0 )(t − t0 )2 + . . . ,
2
(2.87)
36
2 Schwingungen
und hier die zur Zeit t0 gestellten Anfangsbedingungen eintragen,
x(t) =
1
ẍ(t0 )(t − t0 )2 + . . . ,
2
(2.88)
erkennen wir, dass x(t0 + ∆t) von der Ordnung (∆t)2 und die Geschwindigkeit
ẋ(t0 + ∆t) von der Ordnung ∆t sind,
x(t0 + ∆t)
=
ẋ(t0 + ∆t)
=
1
ẍ(t0 )(∆t)2 + . . .
2
ẍ(t0 )∆t + . . . .
(2.89)
Die hier eingehende anfängliche Beschleunigung ist aber durch die Schwingungsgleichung (2.83) zu ẍ(t0 ) = F (t0 )/m festgelegt, so dass wir unter Vernachlässigung von Gliedern quadratischer und höherer Ordnung in ∆t am Ende
des Kraftstoßes haben
x(t0 + ∆t)
=
ẋ(t0 + ∆t)
=
0
F (t0 )∆t
.
m
(2.90)
Nach Beendigung des Kraftstoßes schwingt der Oszillator frei. Aus (2.51,
2.53) finden wir das spätere Verhalten (für γ < ω0 ) zu
x(t) =
F (t0 )∆t −γ(t−t0 −∆t)
e
sin ω(t − t0 − ∆t)
mω
für
t ≥ t0 + ∆t
(2.91)
mit
ω=
q
ω02 − γ 2 .
(2.92)
Da wir bereits Fehler der Ordnung (∆t)2 in Kauf genommen haben, dürfen wir
im gewonnenen Ausdruck für x(t) die Zeit t − t0 − ∆t durch t − t0 ersetzen, ohne
weitere Genauigkeitsverluste zu erleiden.
Nicht zu vergessen ist, dass das Resultat (2.91) gewonnen wurde unter der
Bedingung x(t0 ) = ẋ(t0 ) = 0. Für den Fall, dass zu Beginn des Kraftstoßes
die Auslenkung x(t0 ) und die Geschwindigkeit ẋ(t0 ) nichtverschwindende Werte
haben, zeigt eine geringfügige modifizierte Überlegung, die ich Ihnen zur Übung
überlasse, dass sich (2.91) ersetzt durch
F (t0 )∆t −γ(t−t0 )
e
sin ω(t − t0 ) + . . . .
(2.93)
mω
Das Symbol . . . steht hierin sowohl für Korrekturglieder von höherer als
erster Ordnung in ∆t wie für eine von der äußeren Kraft F (t0 ) unabhängige,
durch x(t0 ) und ẋ(t0 ) festgelegte freie gedämpfte Schwingung.
x(t) =
2.7 Antwort auf beliebige Anregung
37
Wegen der Linearität der Schwingungsgleichung (2.38) kann nun ohne weitere Rechnung auch die Antwort des Oszillators auf eine Folge von n nicht
überlappenden Kraftstößen des beschriebenen Typs angegeben werden. Durch
Überlagerung der Antworten auf alle dem Zeitpunkt vorausgehenden Kraftstöße
erhalten wir für den Zeitraum nach Ende des letzten die Gesamtantwort zur
Zeit t
x(t) =
n−1
X
ν=0
F (tν )∆t −γ(t−tν )
e
sin ω(t − tν ) .
mω
(2.94)
Dabei dürfen die Kraftstöße untereinander verschiedene Stärken F (tν ) haben,
sind aber alle als zeitlich gleich lang angenommen. Etwaige dem Zeitpunkt t
nachfolgende äußere Kraftstöße können zur Zeit t noch nicht beantwortet sein
und treten daher in (2.94) nicht auf.
Ein Blick auf Abbildung 2.8 zeigt, dass sich jede zur Zeit t0 angeschaltete
und anschließend vernünftig verlaufende äußere Kraft F (t) durch eine stückweise
konstante Treppe“, also eine Folge von n aneinander grenzenden Kraftstößen
”
approximieren lässt.
Abbildung 2.8
Für große Werte von n = (tn − t0 )/∆t wird die Antwort (2.94) auf die Kraftstoßfolge die Antwort auf die äußere Kraft F (t) gut annähern. Im Grenzfall
beliebig feiner Unterteilung der äußeren Kraft in Kraftstöße sollte die exakte
Antwort entstehen. Aus (2.94) entsteht für n → ∞ bei ∆t → 0 das Integral
x(t) =
Zt
t0
mit der Antwortfunktion


G(t) =

dt0 F (t0 )G(t − t0 )
1 −γt
mω e
0
sin ωt
(2.95)
für t > 0
.
(2.96)
für t < 0
Beim Aufschreiben der Antwortfunktion habe ich nochmals die oben angesprochene Kausalität zum Ausdruck gebracht: die Antwort G(t − t0 ) auf einen
Kraftstoß zur Zeit t0 kann erst nach dem Kraftstoß auftreten. Wegen dieser
38
2 Schwingungen
Kausalität und da die äußere Kraft als für t < t0 verschwindend angenommen
wurde, kann die Antwort (2.95) auch in der Form
+∞
Z
x(t) =
dt0 G(t − t0 )F (t0 )
(2.97)
−∞
notiert werden.
Die allgemeine Lösung der Schwingungsgleichung (2.83) erhalten wir, wenn
wir auf der rechten Seite von (2.95) eine beliebige freie gedämpfte Schwingung
entsprechend der allgemeinen Lösung der zu (2.83) gehörigen homogenen Gleichung hinzufügen. Letztere beschreibt einen von der äußeren Kraft F (t) unabhängigen Einschwingvorgang.
Die Antwort (2.95) ist äquivalent zur Lösung (2.86), die wir durch Superposition der Antworten auf monochromatische Kräfte erhalten hatten. Überzeugen
wir uns davon, indem wir die Fourierdarstellung (2.84) der Kraft in (2.95) eintragen
x(t)
=
+∞
+∞
Z
Z
dΩ iΩt0
0
dt
e F (Ω)G(t − t0 )
2π
−∞
=
−∞
+∞
Z
0
dt0 e−iΩ(t−t ) G(t − t0 )
+∞
Z
dΩ
F (Ω) eiΩt
2π
+∞
Z
dΩ
F (Ω) G(Ω)eiΩt
2π
−∞
−∞
(2.98)
−∞
mit
+∞
Z
G(Ω) =
dt e−iΩt G(t) .
(2.99)
−∞
Das Zeitintegral (2.99) ist aber leicht auszuführen und ergibt
G(Ω) =
1 2
(Ω − ω02 + 2iγΩ)−1 .
m
(2.100)
Damit ist (2.98) auf die Form (2.86) gebracht.
Halten wir nochmals fest, dass die äußere Kraft F (t) sowohl durch Superposition monochromatischer Kräfte gemäß (2.84) wie durch eine Folge von
Kraftstößen dargestellt werden kann. Je nach Darstellung ergibt sich die Antwort x(t) des Oszillators als Überlagerung der Antworten auf monochromatische
Störungen bzw. auf Kraftstöße. Wegen der gezeigten Äquivalenz können wir die
Wahl der Darstellung immer nach Bequemlichkeit treffen. Mathematisch weniger aufwendig und physikalisch durchsichtiger, also in der Tat bequemer, ist der
Gebrauch der Darstellung (2.95).
2.8 Idealisierter Kraftstoß (Deltafunktion)
2.8
39
Idealisierter Kraftstoß (Deltafunktion)
Der oben eingeführte Begriff des Kraftstoßes erlaubt eine Idealisierung, die
uns im folgenden immer wieder Nutzen bringen wird. Nehmen wir an, ein
endlicher Kraftstoß, der in geeigneten Einheiten die Größe 1 habe, werde in
verschwindender Zeit ∆t übertragen, d. h.
1 = lim F · ∆t .
(2.101)
∆t→0
Es muss dann offenbar F wie 1/∆t nach ∞ gehen (Abbildung 2.9)
}
Abbildung 2.9
Man schreibt einen solchen zur Zeit t0 erfolgenden Kraftstoß als F (t) = δ(t − t0 )
und versteht unter der Deltafunktion δ(t) die Vorschrift (a,b)
(
1
ε
für t0 −
ε
2
< t < t0 +
ε
2
(a)
δ(t − t0 ) =
(b)
man führe den Grenzwert ε → 0 aus, aber immer
erst, nachdem Integrale über t ausgeführt sind.
0
für |t − t0 | > ε/2
(2.102)
Lassen Sie mich diese Vorschrift illustrieren, indem ich zunächst das Zeitintegral der Deltafunktion bestimme. Schon ohne Rechnung ist auf Grund der
obigen Einführung klar, dass es den Wert 1 haben muss,
+²/2
+∞
+∞
Z
Z
Z
1
dtδ(t) =
dt = 1 .
dt δ(t − t0 ) =
²
−∞
−∞
−²/2
Zur weiteren Illustration betrachten wir das Integral
+∞
R
−∞
eine beliebige
∗)
(2.103)
dt δ(t − t0 )f (t) für
Funktion f (t). Die folgende kleine Rechnung, die u.a. die
∗) Die Theorie der Distributionen ersetzt beliebige “ durch genaue Forderungen, die ich im
”
folgenden stillschweigend als erfüllt ansehe.
40
2 Schwingungen
Taylorentwicklung der Funktion f (t) um die Stelle t0 benutzt, vollziehen Sie
hoffentlich ohne Mühe nach:
+∞
+∞
Z
Z
dt δ(t − t0 )f (t0 ) =
dt δ(t)f (t0 + t)
−∞
=
−∞
+²/2
Z
1
dt f (t0 + t) =
²
−²/2
=
+1/2
Z
dtf (t0 + ²t)
−1/2
+1/2
Z
dt[f (t0 ) + ²tf 0 (t0 ) + O(²2 )] = f (t0 ) + O(²) = f (t0 ) ,
−1/2
also
+∞
Z
dtf (t)δ(t − t0 ) = f (t0 ) .
(2.104)
−∞
Beachten Sie, dass die Deltafunktion eine Vorschrift ist, mit Integralen umzugehen und nicht eine gewöhnliche Funktion. Nach einem wohlbekannten elementaren Satz der Integralrechnung kann nämlich eine gewöhnliche Funktion, die
überall außer an einem Punkt verschwindet, keine von Null verschiedene Fläche
mit der Abszisse einschließen.
In erster Anwendung des neu gewonnenen Begriffs der Deltafunktion werfen
wir einen Blick zurück auf den einer beliebigen Kraft F (t) ausgesetzten Oszillator. In der Bewegungsgleichung
Z
1
1
2
(2.105)
ẍ + 2γ ẋ + ω0 x = F (t) = dt0 δ(t − t0 ) F (t0 )
m
m
betrachten wir die äußere Kraft F (t) gemäß der Identität (2.104) als eine kontinuierliche Folge von deltafunktionsartigen Kraftstößen. Die Antwort auf F (t)
ist dann die Superposition von Antworten auf den Einheitskraftstoß δ(t − t 0 ).
Letztere sind gerade durch die Antwortfunktion G gegeben, die der folgenden
Differentialgleichung genügt.
G̈(t, t0 ) + 2γ Ġ(t, t0 ) + ω02 G(t, t0 )
=
=
1
δ(t − t0 )
m(
1
für (t − t0 ) <
1
²
m
0 für (t − t0 ) >
²
2
²
2
.
(2.106)
Wir hatten in (2.7) gezeigt, dass für hinreichend kleines ² (dort ∆t genannt)
die Antwortfunktion die Form
G(t, t0 )
=
G(t)
=
G(t − t0 )
( 1
−γt
sin ωt
mω e
0
t>0
t<0
(2.107)
2.8 Idealisierter Kraftstoß (Deltafunktion)
41
hat. Die Gesamtantwort des Oszillators ergab sich dann zu
+∞
Z
x(t) =
dt0 G(t − t0 )F (t0 ) .
(2.108)
−∞
Die obige Definition (2.102) der δ-Funktion macht von einem rechteckigen
Kraftstoß Gebrauch. Das ist nicht nötig. Andere Darstellungen sind beliebt
und nützlich, z. B. die folgende Gaußdarstellung
2
e−x /²
und ² → 0 nach Ausführung von Integralen .
δ(x) = √
π²
(2.109)
Auch hier gilt die wichtige Identität (2.104), wie eine zur obigen ähnliche Rechnung zeigt:
+∞
Z
2
e−(x−x0 ) /²
√
dx
f (x)
π²
=
−∞
+∞
Z
2
e−x /²
f (x0 + x)
dx √
π²
−∞
=
+∞
Z
√
2
1
dx √ e−x f (x0 + ²x)
π
−∞
=
+∞
Z
2
´
√
e−x ³
√
dx
f (x0 ) + ²xf 0 (x0 ) + 0(²)
π
−∞
³√ ´
²
=
f (x0 ) + O
=
f (x0 ) nach ² → 0 .
Noch beliebter als diese Gaußdarstellung ist die Fourierintegraldarstellung
δ(x)
=
+∞
Z
dk (ikx−²|k|)
e
2π
−∞
1
2π
" Z∞
=
1
2π
µ
=
−
1 ix + ² − ix + ²
1
²
=
.
2π
−x2 − ²2
π x2 + ² 2
=
dk e(ix−²)k +
0
+1
−1
+
ix − ² ix + ²
Z0
−∞
dk e(ix+²)k
#
¶
(2.110)
Manchmal spart man sich bei dieser Fourierdarstellung auch, ² hinzuschreiben,
42
2 Schwingungen
δ(x) =
+∞
Z
dk ikx
e
.
2π
(2.111)
−∞
Gelegentlich werden wir die Darstellung
δ(x) =
1 sin(x/²)
π
x
(2.112)
benötigen. Der Nachweis der Eigenschaft (2.104) erfolgt ähnlich wie bei den
obigen Beispielen. Qualitativen Einblick in den Verlauf der in (2.112) definierten
Funktion erhalten wir, wenn wir bei endlichem ² den Grenzübergang x → 0
durchführen; der anschließende Übergang ² → 0 gibt eine Divergenz, δ(0) ∼
1/π²; andererseits oszilliert (1/x) sin(x/²) als Funktion von x bei x 6= 0 für
² → 0 so schnell um Null herum, dass jedes Integral über x, welches die Stelle
x = 0 nicht überstreicht, im Grenzfall ² → 0 verschwindet.
Bei künftigen Anwendungen müssen Sie, wie bereits oben betont, immer im
Auge behalten, dass die Deltafunktion eine Vorschrift zum Umgang mit Integralen ist und keineswegs eine gewöhnliche Funktion. Allerdings werden Sie
feststellen, dass man mit der Deltafunktion weitgehend umgehen kann wie mit
einer normalen Funktion mit dem Vorbehalt, dass die üblichen Rechenoperationen nur unter dem Schutz von Integralen Sinn ergeben.
2.9
Zwei gekoppelte harmonische Oszillatoren
Ich will Ihnen nun Schwingungen in einem System mit zwei Freiheitsgraden
vorstellen. Betrachten wir dazu zwei Teilchen der Massen m1 und m2 ,
Abbildung 2.10
die, wie in Abbildung 2.10 gezeigt, an drei (masselos gedachte) Federn gekoppelt und längs einer Geraden beweglich sind. Die Teilchen haben kräftefreie
Gleichgewichtslagen x10 bzw. x20 und erfahren bei Auslenkung aus denselben
um qi = xi − xi0 lineare Rückstellkräfte. Wenn wir der Einfachheit halber allen
Kraftkonstanten den gleichen Wert k geben∗) , so lautet die Kraft auf das erste
Teilchen
K1 = −k(x1 − x10 ) − k(x1 − x10 − x2 + x20 ) = −2kq1 + kq2
(2.113)
∗) Im Fall verschiedener Kraftkonstanten treten Schwebungsphänomene auf, die Sie im Labor
anschauen sollten.
2.9 Zwei gekoppelte harmonische Oszillatoren
43
und die auf das zweite
K2 = −k(x2 − x20 ) + k(x1 − x10 − x2 + x20 = kq1 − 2kq2 .
Zur weiteren Vereinfachung wählen wir beide Massen als gleich m. Wir erhalten
dann die Newtonschen Bewegungsgleichungen
mq̈1 + 2kq1 − kq2
mq̈2 + 2kq2 − kq1
=
=
0
0.
(2.114)
Diese linearen Differentialgleichungen mit zeitunabhängigen Koeffizienten können
mit dem Exponentialansatz
¶
¶ µ
µ
a1
q1 (t)
eiωt
(2.115)
=
a2
q2 (t)
gelöst werden. Sowohl die Frequenz ω als auch die beiden Amplituden a1 und
a2 sind dabei offen. Durch Eintragen des Ansatzes in die Bewegungsgleichungen
(2.114) erhalten wir für die drei Unbekannten die beiden linearen homogenen
Gleichungen (mit ω02 = k/m)
(−ω 2 + 2ω02 )a1
−ω02 a1
+
2
(−ω +
−ω02 a2
2ω02 )a2
=
0
=
0.
(2.116)
Nichttriviale Lösungen für die ai können nur auftreten, wenn die Determinante
des Gleichungssystems verschwindet, d. h. wenn die Frequenz ω die Säkulargleichung
(−ω 2 + 2ω02 )2 − ω04 = 0
(2.117)
befriedigt. Letztere ist eine quadratische Gleichung für ω 2 mit den beiden
Lösungen
ω12
=
3ω02
ω22
=
ω02 .
(2.118)
√
Die Frequenzen ω1 = 3 ω0 und ω2 = ω0 heißen Eigenfrequenzen des Systems
der gekoppelten Teilchen. Um die Art der zugehörigen Eigenschwingungen zu
erkennen, müssen wir die beiden Amplituden a1a und a2a für a = 1 (zu ω1 ) und
a = 2 (zu ω2 ) suchen.
Für die Eigenschwingung mit Frequenz ω1 ergibt sich aus (2.116)
a11 = −a21
und für die Eigenschwingung mit Frequenz ω2
(2.119)
44
2 Schwingungen
a12 = a22 .
(2.120)
Beachten Sie, dass bei jeder Eigenschwingung nur das Verhältnis der Amplituden a1 /a2 festgelegt ist, die Amplituden a1 und a2 selbst also nur bis auf einen
gemeinsamen Faktor, der die Stärke der Anregung der Eigenschwingung angibt;
dieser Faktor ist aus der Anfangsbedingung zu bestimmen.
Die erste Eigenschwingung lautet, mit beliebig komplexer Amplitude A 1 ,
¶
¶ µ
µ
ª
−1 ©
q11
A1 eiω1 t + A∗1 e−iω1 t ,
(2.121)
=
1
q21
Da q11 (t) = −q21 (t), können wir diese Eigenschwingung antisymmetrisch nennen; die beiden Massen schwingen im Gegentakt. Die zweite Eigenschwingung,
mit beliebig komplexer Amplitude A2 ,
¶
¶ µ
µ
ª
1 ©
q12
(2.122)
A2 eiω2 t + A∗2 e−iω2 t ,
=
1
q22
können wir wegen q12 = q22 symmetrisch nennen; die beiden Massen schwingen
hier im Takt mit konstantem
√ x12 − x22 .
Nicht zufällig ist ω1 = 3 ω0 > ω2 = ω0 . Bei der antisymmetrischen Eigenschwingung schwingen die beiden Massen unter Deformation aller Federn, bei
der symmetrischen Eigenschwingung hingegen so, dass die mittlere Feder nicht
deformiert wird; also sieht jede Masse bei der antisymmetrischen Schwingung
eine steifere Umgebung als bei der symmetrischen Schwingung. Je größer aber
die Steifheit, desto größer die Frequenz.
Die allgemeine Lösung lautet gemäß dem Superpositionsprinzip
µ
q1 (t)
q2 (t)
¶
= A1
µ
−1
1
¶
e
iω1 (t)
+ A2
µ
1
1
¶
eiω2 t + c.c. .
(2.123)
Die beiden komplexen Integrationskonstanten A1 und A2 entsprechen vier reellen Parametern und können durch Anfangsbedingungen festgelegt werden.
Keineswegs ohne Grund sind die Eigenfrequenzen ω1 und ω2 reell. Der physikalische Grund ist, dass wir keine Reibungskräfte zugelassen und somit ein
exponentielles Abklingen von q1 (t) und q2 (t) ausgeschlossen haben. Daher sollte auch die Energie der beiden Teilchen zeitlich erhalten bleiben. Tatsächlich
finden wir den Energiesatz ganz ähnlich wie früher bei Systemen mit einem Freiheitsgrad. In (2.114) multiplizieren wir beide Seiten der Bewegungsgleichung des
i-ten Teilchens mit der Geschwindigkeit q̇i
mq̇1 q̈1 + 2k q̇1 q1 − k q̇1 q2
mq̇2 q̈2 + 2k q̇2 q2 − k q̇2 q1
=
0
=
0.
(2.124)
Durch Addition der linken Seiten finden wir, dass die Zeitableitung der Größe
2.10 Der mechanische Energiesatz für Systeme vieler Teilchen
E=
m 2 m 2
q̇ +
q̇ + k(q12 + q22 − q1 q2 )
2 1
2 2
45
(2.125)
verschwindet, E selber also zeitlich erhalten bleibt. E heißt die Energie des
Systems, und die beiden Bestandteile
T
=
U
=
m 2
(q̇ + q̇22 )
2 1
k(q12 + q22 − q1 q2 )
(2.126)
sind offenbar sinnvoll als kinetische bzw. potenzielle Energie benannt.
Beachten Sie, dass sich die kinetische Energie aus den kinetischen Energien
der beiden Teilchen additiv zusammensetzt und dass die potenzielle Energie U
quadratisch in den Auslenkungen q1 und q2 ist. Die Kraft auf das i-te Teilchen
ergibt sich aus U zu
Ki = −
∂U
.
∂qi
(2.127)
Die Kräfte K1 und K2 verschwinden für die Ruhelagen, qi = 0. Die potenzielle
Energie U hat für q1 = q2 = 0 ein Minimum, denn U (0, 0) = 0 und
U (q1 , q2 ) =
2.10
k(q22
+
q22
¯
√ ¯2
¯
1 + i 3 ¯¯
¯
− q 1 q2 ) = k ¯q1 − q 2
¯ ≥0.
¯
¯
2
(2.128)
Der mechanische Energiesatz für Systeme
vieler Teilchen
N Teilchen in drei Raumdimensionen haben 3N Freiheitsgrade, denen wir die
kartesischen Koordinaten x1 , y1 , z1 , x2 , y2 , z2 , . . . , xN , yN , zN zuordnen können.
Wir nummerieren die Koordinaten als qν mit ν = 1, 2, . . . , 3N und die Kräfte
F~i entsprechend als Fν (z. B. q5 = y2 ).
Es seien die Kräfte als partielle Ableitung einer potenziellen Energie darstellbar,
Fν (q) = −
∂
U (q) .
∂qν
(2.129)
Später untersuchen wir, unter welchen Bedingungen sich die Fν so darstellen lassen. Erst zeigen wir, dass bei Gültigkeit von (2.129) immer ein Erhaltungssatz
T + U = E = const gilt. Dazu benutzen wir die Newtonschen Bewegungsgleichungen
mν q̈ν = Fν (q) = −
∂U (q)
∂qν
(2.130)
46
2 Schwingungen
Hier multiplizieren wir mit der Geschwindigkeit q̇ν und summieren über ν. Die
linke Seite der entstehenden Gleichung,
X
mν q̇ν q̈ν +
X
q̇ν
ν
ν
∂U
=0,
∂qν
lässt sich wieder als die Zeitableitung der Gesamtenergie schreiben
Ã
!
X mν
d
d
2
q̇ν + U (q) =
(T + U ) = 0 .
dt
2
dt
ν
(2.131)
(2.132)
Im Gegensatz zum Fall eines Teilchens in einer Raumdimension erlaubt dieser Energiesatz natürlich nicht, die Bahnkurven qν (t) alle festzulegen.
Unter welchen Bedingungen kann nun die ν-te Kraft Fν (q) dargestellt werden
als Fν = −∂U/∂qν mit einer eindeutigen potenziellen Energie U (q)? Notwendig
ist die aus
Fν = −
∂U
,
∂qν
∂U
.
∂qµ
Fµ = −
(2.133)
durch Differenziationen entstehende Bedingung
∂Fν
∂Fµ
∂2U
=
=−
.
∂qµ
∂qν
∂qν ∂qµ
(2.134)
Diese Bedingung ist aber auch hinreichend, wie folgendes Argument zeigt. Betrachten Sie die beiden 3N -Tupel von Koordinaten
q10 = x0 , q20 = y0 , qν0
ν 6= 1, 2
für
und
q1 = x, q2 = y, qν = qν0
für
ν 6= 1, 2
Damit U (q) bei festem (3N )-Tupel {qν0 } eine eindeutige Funktion des 3N Tupels {qν } ist, muss gleichgültig sein, auf welchem Weg“ von qν0 nach qν man,
”
gegen die Kräfte Fν Arbeit leistend, die potenzielle Energie ändert. Wählen wir
insbesondere die beiden in (Abbildung 2.11) gezeigten stückweise achsenparallelen Wege in der q1 − q2 − Ebene.
Längs derselben werden die Arbeiten
(∆U )Weg1 = −
bzw.
Zx
x0
dq1 F1 (q1 , y0 ) −
Zy
y0
dq2 F2 (x, q2 )
2.10 Der mechanische Energiesatz für Systeme vieler Teilchen
47
Abbildung 2.11
(∆U )Weg2 = −
Zy
y0
dq2 F2 (x0 , q2 ) −
Zx
dq1 F1 (q1 , y)
x0
geleistet. Fragen wir nun nach Bedingungen für das Verschwinden der Differenz
(∆U )Weg1 − (∆U )Weg2
=
−
−
Z
Z
x
x0
dq1 (F1 (q1 , y0 ) − F1 (q1 , y))
y
y0
dq2 (F2 (x, q2 ) − F2 (x0 , q2 )) (2.135)
Sei insbesondere qν so nahe bei qν0 , dass die Kräfte F1 und F2 mit ausreichender
Genauigkeit in Taylor-Reihen um x0 , y0 herum entwickelt werden können,
Fi (q1 , q2 ) = Fi (x0 , y0 ) +
∂Fi (x0 , y0 )
∂Fi (x0 , y0 )
(q1 − x0 ) +
(q2 − y0 ) + . . . .
∂x0
∂y0
(2.136)
Bis auf Korrekturen dritter Ordnung in den Koordinatendifferenzen ergibt sich
nun für die Differenz (2.135)
(∆U )Weg1 − (∆U )Weg2 = +
−
=
µ
Zx
dq1
∂F1 (q1 , y0 )
(y − y0 )
∂y0
Zy
dq2
∂F2 (x0 , q2 )
(x − x0 )
∂x0
x0
y0
∂F1 (x0 , y0 )
∂F2 (x0 , y0 )
−
∂y0
∂x0
¶
(x−x0 )(y−y0 ) + . . . .
(2.137)
48
2 Schwingungen
Aus (2.137) ist offenbar, dass die Bedingung (2.134) hinreicht, um die Wegunabhängigkeit von ∆U = U (qν ) − U (qν0 ) zu garantieren.
Kräfte, die die Bedingung (2.134) erfüllen, heißen auch wirbelfrei. Sie lassen
sich immer durch Ableitungen einer potenziellen Energie darstellen.
2.11
Schwingungen von mehreren Freiheitsgraden
Wir verallgemeinern hier das in 2.9 behandelte System zweier Teilchen auf
N identische Teilchen, die durch Federn an Ruhelagen xi0 gebunden und längs
der Richtung der Federn beweglich sind Abbildung (2.12).
Abbildung 2.12
Bei den Auslenkungen qi = xi − xi0 sollen die Teilchen in diesen Auslenkungen
lineare Rückstellkräfte erfahren, so dass die potenzielle Energie,
U=
N
1 X
kij qi qj ,
2 i,j=1
(2.138)
quadratisch in den qi ist. Die hier auftretende Kraftkonstantenmatrix kann
offenbar symmetrisch gewählt werden,
kij = kji .
(2.139)
Im übrigen fordern wir von der Matrix kij , dass die potenzielle Energie (2.138)
für beliebige Auslenkungen nichtnegativ ist. Wegen U ({0}) = 0 hat dann die
potenzielle Energie ein Minimum, wenn jedes Teilchen in seiner kräftefreien
Gleichgewichtslage sitzt.
Auf das i-te Teilchen wirkt, wenn es aus seiner Gleichgewichtsposition ausgelenkt ist, die Kraft (in x-Richtung, nur eine Raumdimension ist zugelassen!)
Ki = −
N
X
∂U
kij qj ,
=−
∂qi
j=1
(2.140)
so dass die N Bewegungsgleichungen lauten
mq¨i +
N
X
j=1
kij qj = 0 ;
(2.141)
2.11 Schwingungen von mehreren Freiheitsgraden
49
dabei ist m die Masse jedes Teilchens. Wegen der Linearität der Bewegungsgleichungen und der zeitlichen Konstanz der Masse und Kraftkonstanten finden
wir die Lösung wie immer durch einen Exponentialansatz
qi = ai eiωt .
(2.142)
Die Bewegungsgleichungen geben, da eiωt sich heraushebt, N homogene Gleichungen für die Amplituden ai ,
−mω 2 ai +
N
X
kij aj = 0 ,
j=1
oder, mit dem Kronecker Delta,
δij =
N
X
j=1
½
1
0
i=j
i 6= j ,
(kij − mω 2 δij )aj = 0 .
(2.143)
(2.144)
Den Spezialfall N = 2 (mit kij = ?) hiervon kennen wir aus 2.9. Nichttriviale Lösungen für die Amplituden ai gibt es nur, wenn die Determinante
verschwindet,
det(kij − mω 2 δij ) = 0 .
(2.145)
Diese Säkulargleichung ist eine Gleichung N -ter Ordnung für ω 2 mit N Lösungen
ωα2 . Die N Lösungen können je nach Beschaffenheit der Matrix kij teilweise übereinstimmen; der Einfachheit halber verlange ich jedoch von den Kraftkonstanten, dass die ωα2 alle verschieden sind. Jedenfalls sind alle ωα2 positiv,
denn komplexe Frequenzen ωα würden Widersprüche zum Energieerhaltungssatz bringen.
Zur α-ten Eigenfrequenz ±ωα gibt es einen Satz von Amplituden aiα , der
aus (2.144) bis auf einen konstanten Faktor bestimmt werden kann; dieser konstante Faktor bestimmt die Stärke der α-ten Eigenschwingung und ist durch
Anfangsbedingungen festzulegen. Ohne Einschränkung der Allgemeinheit kann
der α-te Satz von Amplituden aiα (der α-te Eigenvektor mit Komponenten aiα )
als reell gewählt und normiert werden durch die Verfügung
N
X
aiα aiα = 1 .
(2.146)
i=1
Somit sind alle N Eigenvektoren zu reellen Einheitsvektoren geworden.
Mit Hilfe der jetzt eindeutig gemachten reellen aiα können wir die α-te Eigenschwingung angeben als
qi (t) = aiα (Aα eiωα t + A∗α e−iωα t )
(2.147)
50
2 Schwingungen
mit beliebig komplexen Aα . Die allgemeinste Lösung finden wir durch Superposition
qi (t) =
N
X
aiα (Aα eiωα t + A∗α e−iωα t ) .
(2.148)
α=1
Die N komplexen Integrationskonstanten Aα sind durch Anfangsbedingungen
festzulegen, z. B. durch die N anfänglichen Geschwindigkeiten q̇i (0) und N
anfänglichen Auslenkungen qi (0).
Die Bestimmung der Integrationskonstante Aα aus den Anfangsbedingungen
wird rechnerisch enorm bequem, wenn wir ausnutzen, dass die N Eigenvektoren
aiα orthogonal aufeinander sind gemäß
N
X
aiα aiβ = δαβ =
i=1
½
1
0
α=β
α 6= β .
(2.149)
Die Orthogonalität folgt aus der Eigenwertgleichung (2.144) durch folgende Betrachtung. Multiplizieren wir die beiden in (2.144) gleichgesetzten Vektoren
X
kij ajα = mωα2 aiα ,
(2.150)
j
skalar mit dem β-ten Eigenvektor aiβ ,
X
aiβ kij ajα = mωα2
X
aiβ aiα .
(2.151)
X
aiα aiβ ,
(2.152)
i
ij
Eine ähnliche Gleichung,
X
aiα kij ajβ = mωβ2
i
ij
folgt, wenn (2.150) für den β-ten Eigenvektor aufgeschrieben und mit dem α-ten
Eigenvektor skalar multipliziert wird. Subtraktion von (2.151) und (2.152) gibt
m(ωβ2 − ωα2 )
X
aiα aiβ =
i
X
ij
(aiβ kij ajα − aiα kij ajβ ) .
Durch Umbenennung der Summationsindizes gemäß i ↔ j im zweiten Summanden und nach Beachtung der Symmetrie kij = kji sehen wir, dass die rechte
Seite verschwindet. Also gilt auch
(ωβ2 − ωα2 )
X
aiα aiβ = 0 .
(2.153)
i
Da die Eigenfrequenzen alle als voneinander verschieden angenommen sind,
folgt, dass das Skalarprodukt des α-ten mit dem β-ten Eigenvektor verschwinden
muss, also gerade die Orthogonalität (2.149).
2.12 Erzwungene Schwingungen von mehreren Freiheitsgraden
51
Jetzt legen wir die Integrationskonstanten Aα durch die anfänglichen Auslenkungen qi (0) und Geschwindigkeiten q̇i (0) fest. Aus der allgemeinen Form
der Lösung (2.147) folgt
qi (0)
=
X
aiβ (Aβ + A∗β )
(2.154)
β
q̇i (0)
=
X
aiβ iωβ (Aβ − A∗β ) .
β
Multiplizieren wir in beiden Gleichungen skalar mit dem α-ten Eigenvektor α iα ,
so folgt aus der Orthogonalität (2.149) und der Normierung (2.146)
Aα + A∗α
X
=
ajα qj (0)
j
Aα + A∗α
X 1
ajα q̇j (0)
iωα
j
=
oder, nach Aα aufgelöst,
Aα =
X
j
ajα
1
2
µ
i
q̇j (0)
qj (0) −
ωα
¶
.
(2.155)
Damit lautet die Lösung unseres Anfangswertproblems
qi (t) =
X
α
ajα
µ
¶
1X
i
q̇j (0) eiω at + c. c. .
ajα qj (0) −
2 j
ωα
(2.156)
Ein höchst interessanter Spezialfall ist dieser: Sei am Anfang nur ein Teilchen, etwa das k-te, ausgelenkt, mit qk (0) = Q, q̇k (0) = 0, während alle anderen
anfänglich in ihren Gleichgewichtslagen ruhen sollen. Zu späteren Zeiten geht
die ausgezeichnete Rolle des k-ten Teilchens verloren; alle Teilchen geraten in
Bewegung gemäß
X
qi (t) = Q
aiα akα cos ωα t .
(2.157)
α
Wenn die Eigenfrequenzen ωα keine rationalen Verhältnisse zueinander haben,
ist die Schwingung i. A. nicht periodisch.
2.12
Erzwungene Schwingungen von mehreren
Freiheitsgraden
Wir betrachten wieder N gleich kollinear harmonisch schwingende Teilchen
wie in 2.11, lassen nun aber auch eine äußere zeitabhängige Kraft Fi (t) auf das
i-te Teilchen zu, so dass die Bewegungsgleichungen lauten
52
2 Schwingungen
mq̈i +
N
X
kij qj = Fi (t) .
(2.158)
j=1
Die Antwort auf diese äußeren Kräfte wird am bequemsten mit Hilfe der
Amplituden der Eigenschwingung angegeben. Zerlegen wir den Vektor qi (t)
nach den in 2.11 eingeführten normierten und untereinander orthogonalen Eigenvektoren aiα der ungestörten Schwingung gemäß
qi (t) =
X
aiα Θα (t)
X
ajα qj (t) .
(2.159)
α
bzw.
Θα (t) =
j
Dabei ist Θα (t) die Komponente des Vektors qi längs des α-ten Einheitsvektors
aiα . Man nennt Θα (t) auch die α-te Normalkoordinate des Systems. Ganz
entsprechend kann auch der Vektor Fi (t) zerlegt werden
Fi (t) =
X
aiα Fα (t)
(2.160)
X
αjα Fi (t) .
(2.161)
α
bzw.
Fα (t) =
j
Wenn die Einheitsvektoren aiα explizit bekannt sind, können die Komponenten
Fα (t) der äußeren Kräfte längs der Einheitsvektoren aiα aus (2.161) berechnet
werden.
Tragen wir die Zerlegungen (2.159), (2.160) in die Bewegungsgleichung (2.158)
ein, so ergeben sich für die Normalkoordinaten die N untereinander ungekoppelten Bewegungsgleichungen
Θ̈β (t) + ωβ2 Θβ (t) =
1
Fβ (t) ,
m
(2.162)
deren jede die Bewegung eines harmonischen Oszillators der Eigenfrequenz ω β
unter dem Einfluss einer äußeren Kraft Fβ (t) beschreibt. Die Antwort eines
harmonischen Oszillators auf eine äußere Kraft ist uns aus 2.7 bekannt. Durch
Überlagerung dieser Antworten gemäß (2.159) und (2.160) lässt sich die Antwort von qi (t) auf Fj (t) gewinnen. Die Antwort wird besonders stark ausfallen
für solche Fi (t), die große Fourierkomponenten bezüglich einer oder mehrerer
Eigenfrequenzen ωβ haben, also in Nähe von Resonanzen liegen.
2.13 Transversale Schwingungen der gespannten Saite
2.13
53
Transversale Schwingungen der gespannten
Saite
Eine Saite sei zwischen x = 0 und x = l gespannt mit der Spannkraft F und
werde seitlich, d. h. in y-Richtung ausgelenkt.
Im Gegensatz zu bisher betrachteten schwingungsfähigen Systemen haben
wir es jetzt nicht mit diskreten Teilchen zu tun, sondern mit einer kontinuierlichen Saite. Die Zahl N der Freiheitsgrade ist unendlich. Sorgen wir für endliches
N , indem wir uns die Saite in N Stücke der Länge ∆x = l/N aufgeteilt denken. Die beiden Randpunkte sind fest eingespannt, während die N − 1 inneren
Punkte transversal beweglich sind und in sich die Masse eines Saitenstücks der
Länge ∆x vereinigt haben sollen (Abbildung 2.13).
Abbildung 2.13
Wenn diese Aufteilung hinreichend fein ist, wird sich das diskrete System nicht
erheblich vom kontinuierlichen System unterscheiden.
Die Saite sei elastisch. Beim Auslenken aus der Ruhelage yi = 0 ändert sich
die Länge von l auf l + ∆l. Die Verlängerung lässt sich durch die Auslenkungen
yi wie folgt ausdrücken
∆l =
N p
X
i=1
(∆x)2 + (yi − yi−1 )2 − l .
(2.163)
Bei der Verlängerung um ∆l wird gegen die Spannkraft die Arbeit F ∆l geleistet,
die sich als potenzielle Energie U = F ∆l in der Saite wiederfindet,
U
=
=
F
Ã
N p
X
(∆x)2 + (yi − yi−1 )2 − l
i=1
∆xF
N
X
i=1
s

1+
µ
yi − yi−1
∆x
¶2
!
(2.164)

− 1 .
Wenn die Auslenkung klein ist, so dass die Steigung (yi −yi−1 )/∆x betragsmäßig
klein gegen Eins ist für alle i, kann die Wurzel entwickelt werden,
54
2 Schwingungen
X µ 1 ¶2
1
U = ∆xF
(yi − yi−1 )2 + . . . .
2
∆x
i
(2.165)
Dies ist eine quadratische Form in den Auslenkungen yi mit Minimum bei
yi = 0. Auf das i-te Teilchen“ wirkt jetzt die Kraft (in y-Richtung; bei der
”
betrachteten transversalen Schwingung verlassen die Teilchen ihre anfänglichen
x-Koordinaten nie)
Fi = −
∂U
= −∆xF
∂yi
µ
1
∆x
¶2
(2yi − yi−1 − yi+1 ) .
(2.166)
Die Saite habe die Masse ρ pro Längeneinheit, das i-te Teilchen“ also die
”
Masse mi = ρ∆x. Es gehorcht dann der Bewegungsgleichung
∆xp ÿi (t) + ∆xF
µ
1
∆x
¶2
(2yi (t) − yi−1 (t) − yi+1 (t)) = 0
oder nach Division durch die Teilchenmasse
ÿ1 (t) +
µ
F
ρ
¶µ
1
∆x
¶2
(2yi (t) − yi−1 (t) − yi+1 (t)) = 0 .
(2.167)
Die Lösung dieses Problems haben wir in Abbildung 2.11 kennengelernt. Um
sie explizit zu konstruieren, müssten wir die Eigenwerte mωα2 der Kraftkonstantenmatrix kij suchen. Das ist kein schweres Problem, da kij eine sehr einfache
Struktur hat: jedes Teilchen wechselwirkt nur mit seinen beiden Nachbarn.
Physikalisch neue Einsicht gewinnen wir, wenn wir hier den Grenzwert ∆x →
0 ausführen und mit yi (t) → y(x, t) zur Kontinuumsbeschreibung der schwingenden Saite übergehen. Dazu bedenken wir
yi±1 = y(xi ± ∆x) = y(xi ) ± y 0 (xi )∆x +
1 00
y (xi )∆x2 + . . .
2
(2.168)
und finden für die Differenz der Auslenkungen im zweiten Term von (2.167)
´
³
(2.169)
2yi − yi−1 − yi+1 = −(∆x)2 y 00 (xi ) + O (∆x)3
und somit für die Bewegungsgleichung
ÿ(xi , t) − (F/p) [y 00 (xi , t) + O(∆x)] = 0 .
(2.170)
Bis auf Korrekturen von erster Ordnung in ∆x lautet die Bewegungsgleichung,
wenn der Index i weggelassen und die Abkürzung
c2 = F/ρ
eingeführt wird,
(2.171)
2.13 Transversale Schwingungen der gespannten Saite
µ
∂2
1 ∂2
− 2
2
∂x
c ∂t2
¶
y(x, t) = 0 .
55
(2.172)
Dies ist die so genannte Wellengleichung, hier erhalten aus dem Newtonschen
Grundgesetz für diskrete Teilstücke der Saite im Grenzfall ∆l → 0. Bei der
Lösung beachten wir die Randbedingung
y(0, t) = y(l, t) = 0
(2.173)
und gehen im übrigen vor wie in 2.11.
Suchen wir Eigenschwingungen. Wir finden sie, da die Wellengleichung linear
ist und keine explizit zeit- und ortsabhängigen Koeffizienten enthält, mit dem
Exponentialansatz
y(x, t) = a(x)eiωt .
(2.174)
(In 2.11 war der Teilchenindex diskret, hier ist er kontinuierlich.) Für die Amplitude a(x) ergibt sich die Forderung
a00 (x) +
ω2
a(x) = 0 .
c2
(2.175)
Statt wie in 2.11 mit einem System algebraischer Gleichungen, haben wir es
hier mit einer Differentialgleichung für a(x) zu tun, die, da sie linear ist und
konstante Koeffizienten hat, ihrerseits auch mit einem Exponentialansatz gelöst
werden kann,
a(x) = A eikx .
Der Parameter k bestimmt sich dann aus (2.175) zu
k = ±ω/c .
(2.176)
Die Wellengleichung hat also Lösungen der Form
y(x, t) = eiωt (A eiωx/c + B e−iωx/c )
(2.177)
mit beliebigem ω, A, B .
Die Randbedingungen schränken die Beliebigkeit ein. Wir finden mit (2.173)
A+B =0
A eiωl/c + Be−iωl/c = 0 .
(2.178)
Es folgt B = −A und sin(ωl/c) = 0. Letztere Forderung legt die Eigenfrequenzen fest. Nur für
56
2 Schwingungen
ω = ωn = nπc/l,
n = 1, 2, 3, . . .
(2.179)
sind die Wellengleichungen und die Randbedingungen zugleich befriedigbar. Zur
n-ten Eigenfrequenz gehört der Eigenvektor (beachte, dass der Vektor jetzt kontinuierlich viele, mit x nummerierte Komponenten hat)
sin(ωn x/c) = sin(kn x) = an (x) .
(2.180)
Die in 2.11 erklärte Orthogonalität der Eigenvektoren überträgt sich auch auf
die Eigenvektoren (2.180). Das Skalarprodukt zweier Eigenvektoren mit einer
kontinuierlichen Gesamtheit von Komponenten wird in nahe liegender Verallgemeinerung des diskreten Falls definiert durch das Integral
Zl
dx an (x)an (x) .
(2.181)
0
Für die Eigenvektoren (2.180) hat das Skalarprodukt den Wert
Zl
dx sin(kn x) sin(kn0 x) =
l
δn,n0 .
2
(2.182)
0
Demnach
sind die Eigenvektoren auch zu Einheitsvektoren normierbar:
q
2
l sin(πnx/l) ist Einheitsvektor.
Die allgemeinste Lösung der Wellengleichung, die zugleich die Randbedingung befriedigt, erhalten wir durch Superposition der Eigenschwingungen
y(x, t) =
∞
X
sin(kn x)(An eiωn t + A∗n e−iωn t )
(2.183)
n=1
mit beliebig komplexen Integrationskonstanten An , die durch Anfangsbedingungen festgelegt werden können. Unter Beachtung der Orthogonalität der Eigenvektoren sin(kn x) lassen sich die an wie in 2.11 durch die Anfangswerte y(x, 0)
und ẏ(x, 0) angeben.
Die allgemeine Lösung (2.183) kann übrigens auch in der Form
y(x, t) = f (x − ct) + g(x + ct)
aufgeschrieben werden, wobei f und g durch die Anfangsbedingungen festgelegt
sind. Aus dieser Neuformulierung lernen Sie, dass c die Bedeutung der Wellengeschwindigkeit (hier Schallgeschwindigkeit) hat. Offenbar beschreibt f (x − ct)
eine längs der x-Achse mit der Geschwindigkeit c nach rechts laufende Welle,
da die Funktion f (x − ct) ein und denselben Wert hat für alle Koordinaten x
und Zeiten t, für die das Argument x − ct konstant ist. Entsprechend beschreibt
g(x + ct) eine linkslaufende Welle.
Eine grafische Darstellung von Eigenschwingungen finden Sie in Abb. 12.2.
Wundern Sie sich nur darüber, dass die Ihnen hier begegnenden Eigenschwingungen im dortigen quantenmechanischen Kontext wieder auftreten. Sie werden
2.14 Theorie der Dämpfung(Modell)
57
noch lernen, dass dabei kein Zufall waltet.
2.14
Theorie der Dämpfung(Modell)
Bekanntlich ist die gedämpfte Bewegung eines makroskopischen Systems die
Konsequenz der Wechselwirkung desselben mit vielen anderen, mikroskopischen
Systemen. Letztere sind mit entsprechend feinen Methoden zwar auch beobachtbar, i. Allg. jedoch nicht sichtbar auf den Längen- und Zeitmaßstäben, auf denen
sich ihr mittlerer Effekt auf das makroskopische System manifestiert.
Die einfachste, sehr grobschlächtige Abschätzung einer Reibungskraft ist die
folgende: Eine Kugel der Masse M mit Radius r bewege sich mit der Geschwindigkeit v durch ein Gas, in dem sich pro Volumeneinheit ρ Atome der Masse m befinden. In der Zeit ∆t durchstreicht die Kugel das Volumen πr 2 v∆t,
stößt also gegen ρπr 2 v∆t-Atome. Bei jedem dieser elastischen Stöße erhält
das gestoßene Atom, da es sehr viel leichter ist als die Kugel, einen Impuls
der Größenordnung mv. Die Kugel erfährt die entgegengesetzt gleiche Impulsänderung. Der einzelne Stoß hat auf die Kugel wegen m/M ≈ 10−23 keinen
merklichen Effekt, die Gesamtheit der in ∆t erfolgten Stöße aber führt zur Impulsänderung ∆ρ = −ρπr 2 v∆tmv. Die sekündliche Impulsänderung ∆ρ/∆t
entspricht einer Reibungskraft der Größe
F = ρπr2 mv 2 ∼ v 2 .
(2.184)
Die folgende Modellrechnung wird etwas detaillierter sein als die eben vorgestellte grobschlächtige Abschätzung. Zur Vorbereitung gebe ich eine kurze, rein
mathematische Überlegung. Betrachten Sie eine Summe vieler oszillierender
Exponentialfunktionen
S(t) =
n
X
eiων t ,
(2.185)
ν=1
deren Frequenzen ωv keine rationalen Verhältnisse zueinander haben sollen.
Dann ist S(t) nicht periodisch. Es seien die Frequenzen ωk so zahlreich und
so dicht benachbart, dass die Summe S(t) gut durch ein Integral approximiert
werden kann. Die Zahl der ωk im Frequenzintervall ∆ω bei ω sei ρ(ω)∆ω. Dann
gilt
+∞
Z
S(t) ≈
dωρ(ω) eiωt .
(2.186)
−∞
Die Koordinate zu einem makroskopischen Freiheitsgrad möge durch obige Summe S(t) gegeben sein. Das Auftreten der oszillierenden Terme eiων τ macht deutlich, dass die Bewegung reversibel, d. h. ungedämpft ist. Andererseits kann für
sehr große N die Bewegung gedämpft erscheinen, wie wir sehen, wenn wir für
die spektrale Dichte ρ(ω) der ων eine Lorentzverteilung nehmen,
+∞
Z
dωeiωt N
S(t) ≈
−∞
γ/π
= N eiΩt−γ|t| .
(ω − Ω)2 + γ 2
(2.187)
58
2 Schwingungen
Nach diesen Vorbemerkungen nun zum angekündigten Modell, das den mikroskopischen Ursprung der Dämpfung der Schwingung eines makroskopischen Oszillators beschreibt.
Ein makroskopischer“ Oszillator der Masse M und viele (N À 1) mikro”
”
skopische“ Oszillatoren der Masse m ¿ M seien harmonisch an Gleichgewichtslagen q0 = 0 bzw. qν = 0 mit ν = 1, 2, . . . gebunden gemäß der potenziellen
Energie
U=
N
N
X
1 X
1
k0 q02 +
q0 qν .
kν qν2 + λ
2
2 ν=1
ν=1
(2.188)
Das letzte Glied beschreibt eine Kopplung des makroskopischen Oszillators an
seine mikroskopischen Partner. Die Kopplung sei schwach, d. h. λ ¿ k0 , kν .
Am Anfang, bei t = 0, sollen die mikroskopischen Oszillatoren alle in ihren
Gleichgewichtslagen ruhen, während der makroskopische Oszillator eine endliche
Auslenkung und verschwindende Geschwindigkeit habe.
Die zugehörigen Bewegungsgleichungen haben die Form
q̈0
q̈ν
+
Ω20 q0
+
+
ων2 qν
+
λ
M
λ
m
P
q0
ν
qν
=0
=0
(2.189)
mit Ω20 = k0 /M und ων2 = kν /m.
Die Kraftkonstantenmatrix

k0



kν
kij =
λ/m



0
für
für
für
sonst
i=j=0
i = j = ν = 1, 2, . . . N
i = 0, j = ν sowie i = ν, j = 0
(2.190)
ist so einfach strukturiert, dass die Eigenfrequenzen und Eigenvektoren ohne
Mühe explizit angegeben werden können. Mit anderen Worten, man kann die
Auslenkung q0 (t) des makroskopischen Oszillators explizit angeben als Funktion
der anfänglichen Auslenkungen qi (0) und Geschwindigkeiten q̇i (0).
Den für uns interessanten Grenzfall
λ/k0 ¿ 1 ,
λ/kν ¿ 1 ,
1/N ¿ 1
(2.191)
beschreiben wir jedoch am bequemsten, indem wir gar nicht erst die formal
exakte Lösung des Problems suchen, sondern sofort die Kleinheit der angegebenen Parameter benutzen. Die entsprechende Näherungslösung, die ich nun
vorstelle, ist vor allem bekannt als die Wigner-Weißkopf Lösung des Problems
der natürlichen Linienbreite von Spektrallinien, also eines Problems aus der
Quantenelektrodynamik.
Wir können die Bewegungsgleichung für die Auslenkung des ν-ten mikroskopischen Oszillators formal auffassen als die einer erzwungenen Schwingung
mit der äußeren Kraft −λq0 (t). Die Lösung mit der Anfangsbedingung qν (0) =
q̇ν (0) = 0 lautet (s. 2.95 und 2.96 mit γ = 0)
2.14 Theorie der Dämpfung(Modell)
λ
qν (t) = −
m
Zt
dt0 q0 (t0 )
0
sin ων (t − t0 )
=0.
ων
59
(2.192)
Dies setzen wir ein in die Bewegungsgleichung des makroskopischen Oszillators
und erhalten
q̈0 (t) + Ω20 q0 (t) −
λ2
mM
Zt
dt0 q0 (t0 )
0
N
X
sin ων (t − t0 )
=0.
ων
ν=1
(2.193)
Diese Bewegungsgleichung ist insofern etwas komplizierter als die ursprüngliche,
als die unbekannte Auslenkung q0 (t) auch unter einem Integral auftritt. Allerdings sind dafür die Auslenkungen der mikroskopischen Oszillatoren völlig
eliminiert.
Da die Kopplung des makroskopischen Oszillators an die mikroskopischen
Oszillatoren schwach ist, wird q0 (t) nur wenig abweichen von der freien Schwingung, die wir früher mit dem Ansatz q0 (t) ∼ e±iΩ0 t gefunden hatten als
q0 (t) = q0 (0) cos(Ω0 t) +
1
q̇0 (0) sin(Ω0 t) .
Ω0
(2.194)
Daher wird jetzt der Ansatz
q0 (t) = a(t) eiΩ0 t
(2.195)
sinnvoll sein mit einer Amplitude a(t), die schwach zeitabhängig ist gemäß
|ȧ(t)| ¿ |Ω0 a(t)| .
(2.196)
Für a(t) ergibt sich mit Hilfe von
¡
¢
q̈0 (t) = ä(t) + 2iΩ0 ȧ(t) − Ω20 a(t) eiΩ0 t ,
also
q̈0 (t) + Ω20 q0 (t)
≈
(ä + 2iΩ0 ȧ) eiΩ0 t
≈
2iΩ0 ȧ eiΩ0 t ,
(2.197)
die genäherte Bewegungsgleichung
λ2
ȧ(t) = −
4mM Ω0
Zt
0
dt0 a(t−t0 )
i
X 1 h
0
0
ei(ων −Ω0 )t − e−i(ων +Ω0 )t . (2.198)
ων
ν
60
2 Schwingungen
Wir sehen deutlich, dass ȧ(t) verschwindet, a(t) also zeitlich konstant wird,
wenn die Kopplung ganz abgeschaltet wird. Da ȧ(t) = 0(λ2 ), gilt auch a(t−t0 ) =
a(t) + 0(λ2 ) und unter Inkaufnahme eines Fehlers der Ordnung λ4 können wir
a(t − t0 ) durch a(t) ersetzen und aus dem Integral herausziehen. Dann ergibt
sich
ȧ(t)
a(t)
=
=
λ2
−
4mM Ω0
Zt
dt0
0
i
X 1 h
0
0
ei(ων −Ω0 )t − e−i(ων +Ω0 )t
ων
ν
· i(ων −Ω0 )t
¸
N
X
λ2
e
− 1 e−i(ων +Ω0 )t − 1
1
−
+
.
4mM Ω0 ν=1 ων
i(ων − Ω0 )
i(ων + Ω0 )
(2.199)
Bei der Ausführung der Frequenzsummen über die mikroskopischen Oszillatoren beachten wir ων ≥ 0. Große Beiträge zur Summe können nur die Oszillatoren machen, die fast oder ganz in Resonanz zum makroskopischen Oszillator
sind, d. h. für die ων ≈ Ω0 gilt. Insbesondere kann der zweite Summand vernachlässigt werden. Nun schlachten wir die Größe von N aus und approximieren
die Frequenzsumme durch ein Integral. Wenn die Zahl der mikroskopischen Oszillatoren mit Frequenzen im Intervall ∆ω bei ω gerade ρ(ω)∆ω ist, können wir
schreiben
λ2
ȧ(t)
=−
a(t)
4mM Ω0
Z∞
0
dω
ρ(ω)
ω
·
1 − cos(ω − Ω0 )t
sin(ω − Ω0 )t
+i
ω − Ω0
ω − Ω0
¸
. (2.200)
Die rechts stehenden Integrale werden für t À Ω−1
0 zeitunabhängig. Für das
erste der beiden sehen wir diese Eigenschaft daraus, dass
¯
sin(ω − Ω0 )t ¯¯
= πδ(ω − Ω0 )
(2.201)
¯
ω − Ω0 ¯
−1
tÀΩ0
genau die Darstellung (2.112) der Deltafunktion ist. Die strenge Begründung
der Zeitunabhängigkeit des zweiten Integrals ist mathematisch zu aufwendig,
als dass sich die Darstellung hier lohnen würde. Qualitativ lässt sie sich wie
folgt einsehen. Für ω 6= Ω0 oszilliert der Cosinus cos(ω − Ω0 )t wegen t → ∞
als Funktion von ω so schnell um Null herum, dass jedes über ihn erstreckte
Integral verschwindet, wenn die Stelle ω = Ω0 aus dem Integrationsbereich
ausgespart bleibt; anderseits verschwindet 1 − cos(ω − Ω0 )t an der Stelle ω = Ω0
quadratisch, also schneller als der Nenner ω − Ω0 im Integranden; insgesamt hat
der Imaginärteil der geschweiften Klammer in (2.200) auf das Integral denselben
Effekt wie die Vorschrift, ein beliebig kleines Intervall um die Stelle ω = Ω0 aus
dem Integrationsbereich herauszulassen.
Aus (2.200) entsteht also für große Zeiten
ȧ(t)
= −Γ − iδ
a(t)
(2.202)
2.14 Theorie der Dämpfung(Modell)
61
mit
Γ=
πλ2
ρ(Ω0 )
4mM Ω20
(2.203)
und
λ2
δ=
4mM Ω0
Z∞
0
¯
ρ(ω) 1 − cos(ω − Ω0 )t ¯¯
dω
¯
¯
ω
ω − Ω0
.
(2.204)
tÀΩ−1
0
Die beiden Parameter Γ und δ haben die physikalische Bedeutung einer Dämpfungskonstanten bzw. einer Frequenzverschiebung, wie wir aus der Lösung
a(t) = a(0) e−Γt−iδt
der Differentialgleichung (2.202) ersehen. Für die Amplitude des makroskopischen Oszillators erhalten wir als Endresultat
q0 (t) = a e−Γt+i(Ω0 −δ)t + c.c. .
(2.205)
Unter dem Einfluss der vielen mikroskopischen Oszillatoren führt der makroskopische Oszillator also eine gedämpfte Schwingung aus.
Argwöhnen Sie, die gefundene Dämpfung sei ein Artefakt der näherungsweisen
Ersetzung von Frequenzsummen durch Frequenzintegrale wie beim Übergang
von (2.185) zu (2.186) oder insbesondere zu (2.187)? Die Skepsis wäre prinzipiell berechtigt, im Fall vieler dicht liegender ων jedoch praktisch gegenstandslos.
Für hinreichend viele eng benachbarte ων ist die Summe (2.185) vom Integral
(2.186) praktisch nicht zu unterscheiden. Eine genauere Diskussion der Güte
derartiger Näherungen stelle ich Ihnen in 21.8 vor.
Die hier beschriebene Modellrechnung wird uns mit geringfügigen Modifikationen bei der Diskussion der spontanen Emission von Licht durch angeregte
Atome in 13.4 wiederbegegnen.
62
2 Schwingungen
Kapitel 3
Nichtrelativistische
Bewegung im
Gravitationsfeld
3.1
Das 1/r-Potential
Zwei Teilchen mit den schweren Massen M und m üben aufeinander eine
anziehende Gravitationskraft aus, die in Richtung der Verbindungslinie wirkt
und den Betrag
F =G
mM
r2
(3.1)
Abbildung 3.1
hat. Legen wir den Ursprung des Koordinatensystems in den Mittelpunkt des
Teilchens der Masse M , so lautet die Kraft auf das andere
63
64
3 Nichtrelativistische Bewegung im Gravitationsfeld
mM ~x
.
F~ = −G 2
r
r
(3.2)
Dieses Kraftfeld ist wirbelfrei (s. 2.10),
∂Fν
∂Fµ
=
∂xµ
∂xν
mit
xµ = x, y, z;
F µ = F x , Fy , Fz ,
(3.3)
und hat eine potenzielle Energie U (~x), die bei festem Bezugspunkt ~x0 eine
eindeutige Funktion der Koordinaten des Beobachtungspunktes“ ~x ist. Wir
”
können U (~x) als Wegintegral der Kraft längs eines beliebigen Weges von ~x0
nach ~x berechnen. Da gegen F~ bei Wegen auf der Kugelfläche |~x| = r = const
keine Arbeit geleistet wird, ändert sich U (~x) längs solcher Wege nicht. Also
kann U nur von |~x| = r abhängen, U (~x) = U (r). Die Änderung von U längs
eines Wegstücks dr in radialer Richtung gemäß d~x = dr ~xr beträgt
mM
dU = −F~ · d~x = G 2 dr .
r
(3.4)
Für endliche Wege längs eines Radialstrahls gilt
U (r) − U (r0 ) =
Zr
r0
dr0 G
mM
= − GmM
r02
µ
1
1
−
r
r0
¶
.
(3.5)
Es ist üblich, den Bezugspunkt r0 ins Unendliche zu legen mit U (∞) = 0; dann
haben wir
U (r) = −
GmM
.
r
(3.6)
Abbildung 3.2
Dies ist das sogenannte Keplerpotential (s. Abbildung 3.2). Da alle Massen
positiv sind, ist es immer anziehend.
Die elektrostatische Wechselwirkung zweier Punktladungen q, Q wird auch
durch eine kugelsymmetrische potenzielle Energie, die mit wachsendem r wie
1/r abfällt, beschrieben, das Coulombpotential
Uelstat (r) ∼
qQ
.
r
(3.7)
3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential
65
Da elektrische Ladungen verschiedene Vorzeichen haben können, liegt hier bei
Ladungen gleichen Vorzeichens Abstoßung und bei Ladungen ungleicher Vorzeichen Anziehung vor.
3.2
Die Erhaltungssätze bei Bewegungen im
1/r-Potential
Ein Teilchen der Masse m bewege sich unter dem Einfluss der potenziellen
Energie
U =−
km
.
r
(3.8)
Die Bewegungsgleichung lautet, wegen
Fµ
=
¨ =
m~x
∂U
,
∂xµ
(3.9)
mk ~x
.
r2 r
(3.10)
−
Das sind die drei Differentialgleichungen für die drei Koordinaten
~x(t) = (x(t), y(t), z(t)). Obwohl es sich um nichtlineare gekoppelte Differentialgleichungen 2. Ordnung handelt, lässt sich die allgemeine Lösung in geschlossener Form angeben.
Ein erstes Integral ist der Energiesatz
T + U = E = const
(3.11)
2
2
2
mit T = m
x˙ 2 = m
2 ~
2 (ẋ + ẏ + ż ) ≥ 0 . Wegen T ≥ 0 muss entlang der Bahn
~x(t) des Teilchens immer gelten U ≤ E. Dieser Erhaltungssatz reicht natürlich
nicht aus, die drei Funktionen ~x(t) festzulegen.
Um ein weiteres Bewegungsintegral zu finden, multiplizieren wir die Bewegungsgleichung (3.10) vektoriell mit ~x und beachten
−
mk ~x
× ~x = 0 .
r2 r
(3.12)
Die Bewegungsgleichungen geben somit
¨ × ~x = 0 .
m~x
(3.13)
Die linke Seite dieser Identität ist aber eine totale zeitliche Ableitung, denn
d
¨,
(~x × ~x˙ ) = ~x˙ × ~x˙ +~x × ~x
| {z }
dt
= 0
(3.14)
66
3 Nichtrelativistische Bewegung im Gravitationsfeld
so dass
d
(~x × m~x˙ ) = 0 .
dt
(3.15)
Bei der Bewegung im 1/r Potential bleibt also das Vektorprodukt aus Ortsvektor
~x und Impulsvektor m~x˙ , der Drehimpuls, zeitlich konstant
−−→
~ = ~x × m~x˙ = −
L
const .
(3.16)
1
|~x × ~x˙ | = const .
2
(3.17)
Aus diesem Drehimpulserhaltungssatz folgt sofort eine wichtige Eigenschaft
der Bahnkurven ~x(t). Zu jedem Zeitpunkt spannen die beiden Vektoren ~x und
m~x˙ eine Ebene auf. Die Ebene wird charakterisiert durch ihren Normalenvektor,
d. h. einen auf ihr senkrecht stehenden Vektor. Senkrecht auf der Ebene steht
~ Die zeitliche Konstanz von L
~ besagt, dass die Ebene,
gerade der Drehimpuls L.
˙
in der ~x und ~x liegen, sich zeitlich nicht ändert. Die Bahnkurve ~x(t) bleibt also
immer in einer Ebene.
Weiterhin folgt aus der Konstanz des Drehimpulses die Zeitunabhängigkeit
seines Betrages, |~x × m~x˙ | und ebenso die Zeitunabhängigkeit der Größe
Dieser Erhaltungssatz ist das zweite Keplersche Gesetz, der so genannte Flächensatz:
die Verbindungslinie zwischen den beiden Teilchen (bei Kepler Sonne und Planet) überstreicht in gleichen Zeiten ∆t gleiche Flächen, denn bekanntlich ist
1
x × ∆~x| die Fläche des von ~x und ∆~x aufgespannten Dreiecks (s. Abbildung
2 |~
3.3).
Abbildung 3.3
Die Erhaltungssätze von Energie und Drehimpuls reichen aus, die Bahnkurven ~x(t) festzulegen. Wir dürfen die Ebene der Bahnkurve (die Ebene der
Erdbahn heißt Ekliptik) zur x-y-Ebene unseres Koordinatensystems machen.
Dann ist eine Lösung trivial,
z(t) = 0 ,
(3.18)
3.2 Die Erhaltungssätze bei Bewegungen im 1/r-Potential
67
und der Drehimpuls hat die Komponenten
Lx = 0,
Ly = 0,
Lz = L .
(3.19)
Zu bestimmen bleiben x(t) und y(t). Da das Kraftzentrum (im Keplerproblem der Ort der Sonne) der einzige ausgezeichnete Punkt der Bahnebene (im
Keplerproblem Ekliptik) ist, und das U (~x) = U (r), liegt es nahe, die Bahnkurve
in ebenen Polarkoordinaten
x = r cos ϕ
y = r sin ϕ
(3.20)
zu suchen. Die Geschwindigkeiten lassen sich durch r(t) und ϕ(t) und deren
Ableitungen ausdrücken gemäß
ẋ = ṙ cos ϕ − rϕ̇ sin ϕ
ẏ = ṙ sin ϕ + rϕ̇ cos ϕ
(3.21)
~x˙ 2 = ẋ2 + ẏ 2 = ṙ2 + r2 ϕ̇2
und entsprechend die z-Komponente des Drehimpulses als
Lz = m(xẏ − y ẋ) = mr 2 ϕ̇ .
(3.22)
Somit lauten die Erhaltungssätze für Energie und Drehimpuls
1
km
m(ṙ2 + r2 ϕ̇2 ) −
2
r
=
E
(3.23)
mr2 ϕ̇
=
L.
(3.24)
Mit Hilfe des Drehimpulses lässt sich ϕ̇ aus dem Energiesatz eliminieren, woraufhin dieser lautet
L2
km
1
mṙ2 +
−
=E .
2
2
2mr
r
(3.25)
In dieser Form erinnert der Energiesatz an das für einen Freiheitsgrad Bekannte.
Die effektive potenzielle Energie Ueff (r) für die Radialkoordinate,
Ueff (r) =
km
L2
,
−
2mr2
r
(3.26)
enthält außer dem 1/r-Term die abstoßende Zentrifugalenergie“ L2 /2mr 2 .
”
68
3 Nichtrelativistische Bewegung im Gravitationsfeld
Da 12 mr2 ≥ 0, verläuft die Bahnkurve so, dass immer Ueff (r) ≤ E. Es folgt,
dass im Fall der anziehenden Gravitationswechselwirkung (k > 0) die Bahnen
negativer Energie und positiver Energie verschiedenen Charakter haben. Wie
aus Abbildung 3.4 ersichtlich, liegt für E < 0
Abbildung 3.4
der Abstand des Teilchens vom Zentrum immer zwischen zwei Schranken r min
und rmax . Da das Teilchen sich vom Zentrum nie weiter als bis zum Abstand
rmax entfernen kann, spricht man auch von gebundenen Bahnen. Das Auftreten der unteren Schranke rmin liegt an der abstoßenden Zentrifugalkraft bzw.
-energie, die für kleine Abstände die anziehende Gravitationskraft überwiegt.
Letztere Potentialbarriere liegt zwar auch für E ≥ 0 vor, jedoch kann sich das
Teilchen nun beliebig weit vom Kraftzentrum entfernen. Ein Teilchen auf solcher Bahn wird gestreut und ist nicht gebunden.
3.3
Die Bahnkurven
Wir hatten die Erhaltungssätze für Energie und Drehimpuls geschrieben als
L2
km
m 2
ṙ +
−
2
2
2mr
r
mr2 ϕ̇
= E
(3.27)
= L.
(3.28)
Erstere Gleichung ist eine Differentialgleichung erster Ordnung für die Zeitabängigkeit der Radialkoordinate r(t). Die Lösung
t − t0 =
Zr
r0
q
dr0
2E
m
+
2k
r0
−
L2
m2 r 02
(3.29)
ist mit Hilfe von Integraltafeln auswertbar. Anschließend ergibt sich ϕ(t) durch
Integration des Drehimpulssatzes.
Interessieren wir uns vorläufig nur für die geometrische Form r(ϕ) der Bahnkurven. Dazu fassen wir r als Funktion von ϕ auf und schreiben
3.3 Die Bahnkurven
dr dϕ
dr L
dr
=
=
.
dt
dϕ dt
dϕ mr2
69
(3.30)
Daraus liefert der Energiesatz eine Differentialgleichung für die Bahnkurve r =
r(ϕ),
µ
dr
dϕ
¶2
L2
L2
km
+
−
=E .
4
2mr
2mr2
r
(3.31)
Die Form der Bahnkurve wird unmittelbar ersichtlich, wenn wir vorübergehend
u=
1
r
(3.32)
als abhängige Variable einführen. Die Transformation (3.32) überführt den
Energiesatz (3.31) in
µ 2¶
2mE
2km2
du
u=
(3.33)
+ u2 −
dϕ
L2
L2
Diese Beziehung ist aber formgleich mit dem Energiesatz für eine harmonische
Schwingung der Frequenz 1 um den Mittelpunkt
km2
1
≡ .
2
L
p
(3.34)
Tatsächlich löst
u=
1
1
= [1 + ² cos(ϕ − ϕ0 )]
r
p
(3.35)
mit
²=
µ
2EL2
1+ 2 3
k m
¶1/2
(3.36)
und der beliebigen reellen Integrationskonstanten ϕ0 die Differentialgleichung
(3.33).
Aus (3.35) erkennen wir die Bahnkurven r = r(ϕ) als ebene Kegelschnitte.
Der Parameter ² heißt die Exzentrizität derselben. Im Fall der anziehenden
≤
≤
Wechselwirkung wird die Bahnkurve je nach ² > 1, d. h. E > 0, qualitativ
verschieden verlaufen. Die obige Diskussion kann jetzt präzisiert werden.
Für ² < 1, d. h. E < 0, läuft r periodisch in ϕ (nicht nur in der Zeit t, was
wir schon in 3.2 gesehen hatten) im Intervall
rmin =
p
p
≤ r ≤ rmax =
.
1+²
1−²
(3.37)
Die Bahnkurve ist geschlossen und hat die Form einer Ellipse (erstes Keplersche
Gesetz), wobei das Kraftzentrum Abbildung (3.5) in einem der Brennpunkte
liegt.
70
3 Nichtrelativistische Bewegung im Gravitationsfeld
Im Grenzfall ² = 0 ist die Ellipse zum Kreis entartet; aus (3.31) ersehen wir,
dass der Kreisradius zum Minimum der effektiven potenziellen Energie gehört.
}
}
}
}
Abbildung 3.5
Für ² > 1 d. h. E > 0, liegt ein Streuzustand vor. Die Bahnkurve ist eine
Hyperbel, die das Kraftzentrum umläuft Abbildung (3.6).
{
{
Abbildung 3.6
Weit weg vom Zentrum läuft das Teilchen unter dem Winkel ϕ∞ auf praktisch
gerader Bahn ein. Später läuft es asymptotisch wieder auf einer Geraden aus,
gestreut um den Winkel (s. Skizze)
Θ = 2ϕ∞ − π ,
(3.38)
wobei 1 + ² cos ϕ∞ = 0, also
ϕ∞ =
1
π
+ arcsin
.
2
²
(3.39)
Für ² = 1, d. h. E = 0, ist die Bahnkurve eine Parabel. Ein so bewegtes Teilchen hat für r → ∞ gerade verschwindende kinetische Energie, d. h.
verschwindende Geschwindigkeit.
Die Zeitabhängigkeit r(t) lässt sich auch durch elementare Funktionen ausdrücken. Statt hierin Mühe zu investieren, halten wir lieber als allgemeine
3.4 Das Zweikörperproblem
71
Aussage fest, dass die Geschwindigkeit ~v im Perihel den maximalen Betrag hat.
Das ist sofort aus dem Energiesatz ersichtlich.
Ferner erhalten wir die Umlaufzeit T auf einer Ellipsenbahn aus dem Flächenansatz
Keplers, d. h. dem Drehimpulserhaltungssatz (3.17)
L
1
= |~x × ~x˙ | = const .
2m
2
(3.40)
Nach einem Umlauf ist gerade die Fläche der Ellipse, F = πab überstrichen.
Also finden wir durch Integration von t = 0 bis t = T
T =
πab
.
L/2m
(3.41)
Nach bekannten Formeln der analytischen Geometrie findet man für die Halbachsen der Ellipsen
a=
km
p
=
,
2
1−²
2|E|
und somit für die Umlaufzeit
T = πkm
r
b= √
p
L
=p
2
1−²
2m|E|
m
= 2πa3/2
2|E|3
r
(3.42)
1
.
k
Dieses Resultat enthält das dritte Keplersche Gesetz: die Quadrate der Umlaufzeit der Planeten sind proportional zu den Kuben der großen Halbachsen ihrer
Bahnen.
3.4
Das Zweikörperproblem
Wir haben bisher die Bewegung eines Teilchens im Keplerpotential behandelt.
Das ist noch nicht genau das Problem der Planetenbahnen. Die Anziehungskraft
der Sonne auf einen Planeten ist entgegengesetzt gleich der Anziehungskraft
des Planeten auf die Sonne und letztere führt dazu, dass sich auch die Sonne
beschleunigt bewegt. Wir haben die beiden (bzw. sechs) Bewegungsgleichungen
¨P + G
mP ~x
¨S − G
mS ~x
mP mS
~xP − ~xS
=0
|~xP − ~xS |2 |~xP − ~xS |
(3.43)
mP mS
~xP − ~xS
=0.
|~xP − ~xS |2 |~xP − ~xS |
(3.44)
wobei mP und ~xP Masse und Ortsvektor der Planeten, mS und ~xS die entsprechenden Größen für die Sonne sind.
¨S |/|~x
¨P | =
Beachten wir, dass die Beschleunigungen das Betragsverhältnis |~x
mP /mS haben. Für Jupiter, den schwersten Planeten, hat dieses Verhältnis
einen Wert von etwa 10−3 und für die Erde gar nur von etwa 2 · 10−6 . Wir
72
3 Nichtrelativistische Bewegung im Gravitationsfeld
erwarten also, dass bei der Behandlung der Planetenbahnen die Sonne bis auf
einen Fehler von ≤ 1% als ruhendes Kraftzentrum angesehen werden kann.
Astronomische Beobachtungen sind phantastisch genau. Zum Vergleich der
Theorie mit den Messdaten brauchen wir die Planetenbahnen genauer als bis auf
einen Fehler von etwa 1%. Sie sind, solange die Wechselwirkung der Planeten
untereinander vernachlässigt, also nur das Zweikörpersystem Planet und Sonne
behandelt wird, billig exakt zu haben. Wir führen statt der Ortsvektoren ~xP
und ~xS Relativkoordinaten
~x = ~xP − ~xS
(3.45)
~ = mP ~xP + mS ~xS
X
mP + m S
(3.46)
und Schwerpunktskoordinaten
ein. Aus den Newtonschen Gleichungen (3.43), (3.44) folgen für Bewegungsglei~ Sie lauten, wenn wir als Abkürzungen
chungen für die Koordinaten ~x und X.
die Gesamtmasse
M = mP + mS
(3.47)
mP · m S
mP + m S
(3.48)
und die reduzierte Masse
m=
einführen,
~¨ = 0
MX
¨+G
m~x
mM ~x
=0.
|~x|2 |~x|
(3.49)
(3.50)
Die erste Gleichung besagt, dass sich der Schwerpunkt des Zweikörpersystems
kräftefrei, also mit konstanter Geschwindigkeit bewegt. Die zweite beschreibt
ein Teilchen der Masse m, das sich unter dem Einfluss der von einem fixen
Kraftzentrum ausgehenden Gravitationskraft bewegt. Letzteres Problem war
in 3.2 und 3.3 gelöst worden. Wir haben m dabei als die reduzierte Masse des
Planeten zu interpretieren. Wegen mP ¿ mS weicht die reduzierte Masse nur
wenig von der Planetenmasse ab.
Kapitel 4
Statische wirbelfreie Felder∗
4.1
Wirbelfreie Vektorfelder
Wirbelfreie Vektorfelder hatten wir schon im Kapitel 2 kennengelernt. Die
Wirbelfreiheit bezeichnet die Eigenschaft
∂Vi
∂Vj
=
,
∂xj
∂xi
i, j = 1, 2, 3
bzw. x, y, z.
(4.1)
Für derartige Felder ist, wie wir gesehen hatten, das Wegintegral
Z~x
~ (~x0 ) ≡ −ϕ(~x)
d~x0 · V
(4.2)
~
x0
für alle zwischen ~x0 und ~x laufenden Wege gleich und somit, bei festgehaltenem
Bezugspunkt“ ~x0 , eine eindeutige Funktion der Koordinaten des Beobach”
”
tungspunktes“ ~x (s. Abbildung 4.1).
Abbildung 4.1
Da ein Wegintegral sein Vorzeichen wechselt, wenn beim Integrieren der Weg
in umgekehrter Richtung durchlaufen wird, muss jedes Wegintegral über ein
∗ In diesem Kapitel werden überwiegend drei Raumdimensionen in Rechnung gestellt;
ein Punkt wird durch den Ortsvektor ~
x = (x, y, z) = (x1 , x2 , x3 ) beschrieben; ein skala~ (~
res Feld ϕ(~
x) ist eine Zuordnung einer Zahl ϕ(~
x) zum Punkt ~
x; ein Vektorfeld V
x) =
(Vx (~
x), Vy (~
x), Vz (~
x)) = (V1 , V2 , V3 ) ist eine Zuordnung des Zahlentripels Vx , Vy , Vz zum
Punkt ~
x.
73
74
4 Statische wirbelfreie Felder
wirbelfreies Feld längs eines beliebigen geschlossenen Weges (Einschränkung:
einfach zusammenhängendes Gebiet!) verschwinden,
I
~ (x) = 0 .
ZL = d~x · V
(4.3)
L
~ längs des geschlossenen Weges L. Das VerschwinZL heißt die Zirkulation von V
den von ZL ist die anschaulichste Manifestation von Wirbelfreiheit (Gegenbeispiel: schauen Sie den Wirbel in der Badewanne an).
~ (~x) durch DiffeAus dem skalaren Wegintegral ϕ(~x) kann das Vektorfeld V
renzieren zurückgewonnen werden:
Vi = −
∂ϕ
,
∂xi
kurz
~ = − grad ϕ
V
oder
~ = −∇ϕ .
V
(4.4)
Als ein Beispiel kennen wir das Gravitationsfeld eines schweren Teilchens
der Masse M. Auf ein Probeteilchen der Masse m am Ort ~x (Nullpunkt in M )
wirkt die Gravitationskraft
F~
= m~g ,
~g
= − GM
~x
= ~g (~x)
r3
(4.5)
Abbildung 4.2
Zur Beschreibung des von M am Ort ~x erzeugten Gravitationsfeldes ist ~g , da
von der Masse m des Probekörpers unabhängig, besser geeignet als die Gravitationskraft F~ . Wir nennen ~g (~x) die Feldstärke oder kurz das Gravitationsfeld.
Zur Gravitationskraft F~ gehört die potenzielle Energie des Probeteilchens
U (~x)
=
mϕ(~x) ,
ϕ(~x)
=
ϕ(r) = −
GM
.
r
(4.6)
Das skalare Feld ϕ(~x) heißt Gravitationspotential.
Es ist eine Erfahrungstatsache, dass sich (schwache) Gravitationsfelder, die
von verschiedenen Teilchen erzeugt werden, linear superponieren. Also gilt für
das von N Teilchen mit den Massen mi erzeugte Gravitationspotential
ϕ(~x) = −
N
X
Gmi
.
|~
x
− ~xi |
i=1
(4.7)
4.1 Wirbelfreie Vektorfelder
75
Ganz entsprechend erhalten wir das Gravitationspotential, das von einer kontinuierlichen Massenverteilung der Dichte ρ(~x) erzeugt wird. Wir denken uns
das mit Masse gefüllte Volumen in N so kleine Teile ∆x∆y∆z zerlegt, dass
innerhalb jedes Teiles ρ(~x) als konstant angesehen werden kann. Dann gilt, mit
mi = ρ(~x)∆x∆y∆z als der i-ten Teilmasse,
ϕ(~x) = −
N
X
Gρ(~xi )∆x∆y∆z
|~x − ~xi |
i=1
und im Grenzfall beliebig feiner Zerlegung
Z
Gρ(~x0 )
.
ϕ(~x) = − d3 ~x0
|~x − ~x0 |
Wir können auch die Feldstärken ~g (~x) superponieren und das Integral
Z
Gρ(~x0 ) ~x − ~x0
~g (~x) = d3 ~x0
|~x − ~x0 |2 |~x − ~x0 |
(4.8)
(4.9)
(4.10)
für eine gegebene Massenverteilung ausrechnen. Meist ist es jedoch erheblich
bequemer, die Feldstärke durch Differenziation aus dem Potential zu gewinnen
~g = −∇ϕ, da sich skalare Volumenintegrale leichter als vektorielle gewinnen
lassen.
~ x), das die
Als ein zweites Beispiel kennen wir das elektrostatische Feld E(~
Kraft auf ein am Ort ~x befindliches Teilchen der Ladung q gibt gemäß
~ x) .
F~ (~x) = q E(~
(4.11)
Elektrische Felder werden durch ruhende Ladungen erzeugt. Das von einer
Punktladung Q erzeugte Feld ist∗)
¶
µ
Q ~x
1
~
.
(4.12)
E(~x) =
4π²0
r2 r
Abbildung 4.3
Das zugehörige elektrostatische Potential ist das Coulombpotential
¶
µ
Q
1
ϕ(x) =
.
4π²0
r
(4.13)
Das elektrostatische Feld vieler Ladungen erhalten wir wieder durch Superposition. Insbesondere lautet das von einer kontinuierlichen Ladungsverteilung der
Ladungsdichte ρ(~x) erzeugte elektrostatische Potential
∗) ²
0
= 8, 854 . . . × 10−12 Coulomb/Volt · Meter ist die elektrische Feldkonstante.
76
4 Statische wirbelfreie Felder
ϕ(~x) =
µ
1
4π²0
¶Z
d3 ~x0
ρ(~x0 )
.
|~x − ~x0 |
(4.14)
Beachten Sie die Vorzeichenkonvention. Die potenzielle Energie der Ladung
q im Feld der Ladung Q (und umgekehrt) lautet
¶
µ
qQ
1
.
(4.15)
U (~x)
4π²0
r
Sie ist anziehend (U < 0, Topf), wenn q und Q verschiedene Vorzeichen haben
und abstoßend (U > 0, Wall) für Ladungen gleichen Vorzeichens.
4.2
Quellen wirbelfreier Felder
Gravitationsfelder werden von massiven Teilchen erzeugt, elektrostatische
Felder durch geladene Teilchen. Man sagt, Massen und Ladungen sind die
Quellen der respektiven Felder. Präzisieren wir diese Redeweise!
~ ein ebenes Flächenelement am Ort ~x, dem Betrag nach so klein,
Sei ∆S
~ (~x) als überall auf dem Flächenstück konstant angesehen
dass das Vektorfeld V
~ gibt die Normale zum Flächenstück
werden kann. Die Richtung des Vektors ∆S
~ durch ∆S
~ bezeichnen wir das Skalarprodukt
an. Als Fluss ∆Φ von V
~ (~x) · ∆S
~ .
∆Φ(~x) = V
(4.16)
~ durch S ergibt
Sei S eine beliebige gekrümmte Fläche. Der Fluss von V
~ zerlegt wird, dass
sich, wenn S in so viele kleine gerichtete Flächenstücke ∆S
~ (~x) in jedem als konstant angesehen werden kann, durch
jedes als eben und V
Summieren der Teilflüsse durch die Flächenstücke zu
X
~ (x~i ) · ∆S
~i .
φ=
V
(4.17)
i
Im Grenzfall beliebig verfeinerter Zerlegung wird der Fluss Φ durch die Fläche
S durch das Integral
ZZ
~ ·V
~ (~x)
φ=
dS
(4.18)
S
gegeben.
Soll der Fluss durch eine geschlossene Fläche berechnet werden, so wird der
Normalenvektor stets als nach außen gerichtet definiert. Wenn der Fluss Φ von
~ durch eine geschlossene Fläche S von Null verschieden ist, so umschließt S
V
~ . (Manchmal spricht man von Quellen bei Φ > 0 und von Senken
Quellen von V
bei Φ < 0.)
Betrachten wir den Fluss des von einer Ladung Q erzeugten elektrischen
~ durch die Oberfläche einer Kugel am Ort der Ladung als Mittelpunkt.
Feldes E
~ (s. Abbildung 4.4) ist genau wie E
~ radial vom
Das Oberflächenelement ∆S
Ursprung weg gerichtet und lautet in Kugelkoordinaten
~=
∆S
~x
rdΘr sin Θdϕ .
r
(4.19)
4.2 Quellen wirbelfreier Felder
77
Abbildung 4.4
Der gesuchte Fluss,
Φ=r
2
Zπ
dΘ sin Θ
0
Z
2π
0
dϕ ·
µ
1
4π²0
¶
Q
r2
µ ¶2
~x
= Q/²0 ,
r
(4.20)
ist bis auf den Faktor 1/²0 gleich der umschlossenen Ladung Q.
Dieses Resultat ist unabhängig davon, welche Form die geschlossene Fläche
S hat, solange nur die Ladung umschlossen wird. Denn jede solche Fläche
~ zerlegt werden, deren jedes
kann in gerichtete, praktisch ebene Teilstücke ∆S
vom Ort der Ladung aus gesehen gerade über (oder unter) dem rechteckigen
Teilstück der Einheitskugel liegt, welches zwischen ϕ und ϕ + dϕ bzw. Θ und
Θ + dΘ aufgespannt ist und die Fläche sin ΘdϕdΘ hat. Ein solches Teilstück
hat, wenn es sich im Abstand r von der Ladung befindet, einen Flächenvektor
~ · ~x/r) in radialer Richtung. Also gilt
mit Komponente r 2 sin ΘdϕdΘ = (∆S
Φ
=
I
=
Q/4π²0
~ ·E
~ =
dS
Zπ
0
I
~ · ~x/r)Q/r 2 4π²0
(dS
sin ΘdΘ
Z2π
dϕ = Q/²0 .
0
Beim eben gegebenen Argument war stillschweigend angenommen, dass jeder von Q ausgehender Radialstrahl die Oberfläche S nur einmal schneidet.
Diese Annahme ist aber auch unnötig. Jedenfalls liegt eine ungerade Zahl solcher Überschneidungen vor, wie Abbildung 4.5) zeigt.
Betrachten wir die Flächenstücke, die von Q aus gesehen über einem Rechteck
mit Fläche sin ΘdΘdϕ auf der Einheitskugel erscheinen, so sind die respektiven
Beiträge zum Oberflächenintegral alle betragsmäßig gleich,
78
4 Statische wirbelfreie Felder
Abbildung 4.5
¯
¯ ¯
¯
¯ ¯Q 2
¯ Q ~xi
~¯ ¯
¯
ΘdΘdϕ
¯ r2 ri ∆Si ¯ = ¯ r2 ri sin
| {z }
¯ i
i
dΩ
¯
¯
¯
¯ = QdΩ ,
¯
¯
(4.21)
alternieren jedoch im Vorzeichen von einem zum nächsten. Bis auf einen heben
sie sich paarweise auf, so dass der gesamte Fluss wieder den Wert Q/²0 hat.
Es ist auch keineswegs nötig, dass Q im Ursprung des Koordinatensystems
sitzt; noch, dass Q eine einzelne Punktladung
P ist; Q kann durchaus die Summe
mehrerer Punktladungen darstellen, Q = i qi , die von S umschlossen werden.
Jedenfalls gilt: Der Fluss des elektrischen Feldes durch eine geschlossene Fläche
S ist gleich dem (1/²0 )-fachen der umschlossenen Ladung. Wenn die Ladung im
von S umschlossenen Volumen kontinuierlich verteilt ist, so gilt
ZZZ
ZZ
~ · E(~
~ x) = Q/²0 = 1
d3 ~xρ(~x) .
(4.22)
Φ = ° dS
²0
S
Wenn die geschlossene Fläche S keine Ladungen umschließt, so ist der Fluss
durch S Null. Außerhalb des von S umschlossenen Gebietes liegende Ladungen
~ durch S nicht bei, wie wir uns nochmals klarmachen
tragen zum Fluss von E
anhand der zur in Abbildung 4.5 analogen Skizze in Abbildung 4.6:
Umgekehrt darf aus dem Verschwinden des Flusses ϕ durch S nicht geschlossen werden, S umschließe keine Quellen des Feldes, also keine Ladungen. Es
könnten nämlich im umschlossenen Gebiet genauso viele negative wie positive
Ladungen sitzen, so dass das Gebiet insgesamt elektrisch neutral ist.
4.3
Lokale Quellen
Der Begriff der Quelle eines Feldes entfaltet seine volle Nützlichkeit erst,
~ durch ihre
wenn wir infinitesimal kleine Raumbereiche und den Fluss von E
Oberfläche betrachten. Nehmen wir speziell ein achsenparalleles Parallelepiped mit den Kantenlängen ∆x, ∆y, ∆z und berechnen den Fluss durch seine
Oberfläche (Abbildung 4.7).
4.3 Lokale Quellen
79
Abbildung 4.6
Abbildung 4.7
Da die Normalvektoren auf den Kantenflächen in Richtung der Koordinatenachsen zeigen, lautet der gesuchte Fluss durch die 6 Kantenflächen
Φ
=
y+∆y
Z
dη
z+∆z
Z
x+∆x
Z
x+∆x
Z
y+∆y
Z
dζ
z
+
¡
¢
dζ − Ex (x, η, ζ) + Ex (x + ∆x, η, ζ)
z
y
+
z+∆z
Z
x
dξ
x
y
¡
¢
dξ − Ey (ξ, y, ζ) + Ey (ξ, y + ∆y, ζ)
¡
¢
dη − Ez (ξ, η, z) + Ez (ξ, η, z + ∆z) .
(4.23)
Durch Taylorentwicklung der Integranden um den Punkt ~x = (x, y, z) sehen
wir, dass Φ für kleine Kantenlängen von der Ordnung ∆x∆y∆z ist. Unter
Vernachlässigung von Korrekturen höherer Ordnung in den Koordinateninkre-
80
4 Statische wirbelfreie Felder
menten haben wir
Φ
=
y+∆y
Z
dη
y
=
z+∆z
Z
dζ
∂Ex (x, η, ζ)
∆x + (zykl. Vert.)
∂x
z
∂Ex (x, y, z)
∆x
∂x
y+∆y
Z
dη
y
=
∆x∆y∆z
½
z+∆z
Z
dζ + (zykl. Vert.)
(4.24)
z
∂Ex
∂Ey
∂Ez
+
+
∂x
∂y
∂z
¾
.
Die hier auftretende Größe
∂Ey
∂Ez
∂Ex
~
+
+
= divE
∂x
∂y
∂z
(4.25)
~
heißt die Quellstärke oder Divergenz von E.
~
~ hat, so ist der Fluss
Wenn die Divergenz von E am Ort ~x den Wert divE
~
von E durch die Oberfläche eines kleinen Parallelepipeds bei ~x gleich
~ = 1 ρ(~x)∆x∆y∆z .
(4.26)
Φ = ∆x∆y∆z div E
²0
Wir sehen, dass die Ladungsdichte ρ(~x) bis auf den Faktor 1/²0 die Quellstärke
~ von E
~ ist,
divE
1
ρ(~x) .
(4.27)
²0
Mit gleicher Begründung finden wir für die Quellstärke div ~g (~x) des Gravitationsfeldes ~g (~x)
~ x) =
divE(~
div ~g (~x) = −4π Gρ(~x) ,
(4.28)
wobei ρ(~x) natürlich die Massendichte bedeutet.
~ durch die Oberfläche eines infiUnser Resultat (3.2) über den Fluss von E
nitesimalen Volumenelements ∆x∆y∆z gestattet sofort eine Aussage über den
~ durch die Oberfläche S eines endlichen Volumens. Letzteres kann
Fluss von E
nämlich in infinitesimale Volumina ∆V zerlegt werden, wobei S durch ebene
Teilstücke ∆S approximiert wird. Der Fluss durch S ist dann gleich der Summe
der Flüsse durch die Oberfläche der Teilvolumina ∆V , denn jede innere Kantenfläche ist Teil der Oberfläche zweier benachbarter Teilvolumina, und die beiden
respektiven, jeweils auf die nach außen gerichtete Flächennormale bezogenen
Flüsse heben sich gegenseitig auf (vgl. Abbildung 4.8).
Es folgt somit der Gaußsche Integralsatz, wenn der Fluss durch die Oberfläche jedes Teilvolumens gemäß (4.24) durch die Quellstärke am Ort des Teilvolumens ausgedrückt wird
ZZZ
ZZ
~ = °E
~ · dS
~ .
d3 x div E
(4.29)
V
S
4.4 Elektrostatisches Potential
81
Abbildung 4.8
Beachten Sie, dass die eben skizzierte Herleitung des Gaußschen Satzes keinen
~ wirbelfrei ist. Der Satz gilt tatsächlich auch für
Gebrauch davon macht, dass E
Felder mit Wirbeln.
4.4
Elektrostatisches Potential
Wirbelfreie Vektorfelder sind durch ihre Quellen und Randbedingungen eindeutig
festgelegt. Um diese Behauptung plausibel zu machen, stelle ich zunächst klar,
dass die Angabe der Quellen eines Feldes gemäß
~ =
divE
1
ρ
²0
(4.30)
~ x) festzulegen: obige Gleichung stellt eine Diffeallein nicht ausreicht, um E(~
rentialgleichung für die drei Unbekannten Ei (~x) dar. Nehmen wir allerdings die
~ hinzu, d. h. stellen das Vektorfeld E
~ als Gradienten eines
Wirbelfreiheit von E
skalaren Feldes dar mit
~ x) = −∇ϕ(~x) .
E(~
(4.31)
so erhalten wir für das Potential ϕ(~x) die Differentialgleichung 2. Ordnung
div grad ϕ(~x) = ∆ϕ(~x) = −
∆=
1
ρ(~x),
²0
(4.32)
∂2
∂2
∂2
+ 2+ 2 ,
2
∂x
∂y
∂z
die als die Poissonsche Differentialgleichung bekannt ist.
Die Poissonsche Gleichung ist bei vorgegebener Ladungsverteilung (bzw.
Massenverteilung) eine inhomogene Differentialgleichung. Ihre allgemeine Lösung
ergibt sich durch Superposition eines Partikularintegrals der inhomogenen Gleichung mit dem allgemeinen Integral der homogenen Gleichung. Durch Randbedingungen wird eine eindeutige Lösung ϕ(~x) fixiert, aus der sich mit (4.32)
~ eindeutig ergibt.
auch das Feld E
Ein Partikularintegral der Poissonschen Gleichung kennen wir schon,
ϕ(~x) =
1
4π²0
Z
V
d3 x 0
ρ(~x 0 )
.
|~x − ~x 0 |
(4.33)
82
4 Statische wirbelfreie Felder
Es erfüllt die Randbedingung ϕ = 0 für |~x| → ∞. Wir hatten dieses Integral konstruiert, bevor wir die Feldgleichung ∆ϕ = −4πρ aufgestellt hatten.
Nachträglich lernen wir zu verifizieren, dass das Integral die Feldgleichung befriedigt.
Wenn speziell eine Punktladung Q bei ~x = 0 vorliegt, also
ρ(~x) = Qδ (3) (~x) = Qδ(x)δ(y)δ(z) ,
(4.34)
so gibt obiges Integral gerade das wohlbekannte Coulombpotential
1 Q
1 Q
=
.
4π²0 |~x|
4π²0 r
Erfüllt letzteres wirklich die Poissongleichung, d. h. gilt wirklich
ϕ(~x) =
(4.35)
1
= − 4πδ (3) (~x) ?
(4.36)
r
Einfaches Nachrechnen
zeigt, dass ∆(1/r) = 0 überall außer für r = 0. Denn
p
für eine nur von r = x2 + y 2 + z 2 abhängige Funktion f (r) gilt
∆
gradf (r) = f 0 (r)
~x
r
(4.37)
und
div grad f (r)
f 0
f 0
f 0
~x = ~x · grad
+
div ~x
r
r
r
µ ¶0
~x f 0
+ 3f 0 /r = f 00 (r) + 2f 0 (r)/r
= ~x ·
r
r
=
div
und somit ∆ 1r = 0 für r 6= 0. Am Ursprung selbst ist ∆ 1r nicht definiert. Um
zu sehen, dass die Singularität am Ursprung von der Art einer Deltafunktion
ist, haben wir wie immer (s. 2.8) eine geeignete nichtsinguläre Darstellung zu
betrachten. Wählen wir etwa
1
1
=√
2
r
r + ²2
mit dem Vorbehalt, ² letztlich nach Null gehen zu lassen. Dann ist
1
3²2
=
−
.
(r2 + ²2 )1/2
(r2 + ²2 )5/2
Dies über den ganzen Raum integriert gibt
∆
Z
1
d x∆ √
r 2 + ²2
3
=
Z∞
2
r dr
−12π
dΘ sin Θ
0
0
=
Zπ
|
Z∞
0
|
dx
{z
4π
Z2π
0
(4.39)
dϕ
(r2
−3²2
+ ²2 )5/2
}
x2
= −4π .
(1 + x2 )5/2
{z
}
1/3
(4.38)
(4.40)
4.5 Geladenes Teilchen vor einem Leiter
83
Da das Integral unabhängig von ² ist, ist (4.39) tatsächlich bis auf den Faktor
− 4π eine Darstellung der Deltafunktion. Damit ist klargestellt, dass das Coulombpotential (4.35) die Lösung der Poissongleichung für den Fall der punktförmigen
Ladungsverteilung (4.34) darstellt. Dann folgt mit
∆
1
= − 4πδ (3) (~x − ~x 0 )
|~x − ~x 0 |
(4.41)
auch die Richtigkeit von (4.33).
Wir hätten auch andersherum argumentieren können und aus der vorher
erwiesenen Gültigkeit des Potentials (4.33) und der Feldgleichung (4.32) folgern
können, dass das Coulombpotential 1/r die Feldgleichung mit ρ(~x) = δ (3) (~x)
löst.
Ich betone, dass die bisher betrachteten Potentiale alle die Randbedingung
ϕ(~x) → 0 für |~x| → ∞ erfüllen.
4.5
Geladenes Teilchen vor einem Leiter
Abweichungen des Potentials von der Form
ϕ(~x) =
1
4π²0
ϕ(~x) → 0
Z
für
d3 x 0
ρ(~x 0
|~x − ~x 0 |
(4.42)
|~x| → ∞
werden wichtig, wenn der Abstand des Beobachtungspunktes |~x| von irgendeinem Teil der Quellverteilung ρ(~x) vergleichbar mit dem (nicht sehr klein gegen
den) Abstand von irgendeinem anderen Körper ist. Solche anderen Körper sind
gegebenenfalls mit zu berücksichtigen entweder, falls sie auch starr vorgegebene Ladungsverteilungen haben, durch Einbeziehung in die Verteilung ρ(~x) oder
durch Randbedingungen für ϕ(~x) an ihrer Oberfläche.
Letzterer Fall liegt z. B. vor, wenn diese anderen Körper elektrische Leiter darstellen. Da Leiter frei bewegliche Ladungen enthalten, muss, wenn ein
zeitunabhängiger Zustand vorliegt, auf ihrer Oberfläche und in ihrem Inneren
ϕ(~x) = const gelten. Andernfalls würde ein nichtverschwindendes elektrisches
Feld E = −∇ϕ herrschen, welches die Ladungen in beschleunigte Bewegung setzen würde. Bei der Bestimmung des elektrischen Feldes außerhalb elektrischer
Leiter ist die Randbedingung ϕ = const für die Leiteroberfläche zu stellen.
Als einfachstes nichttriviales Beispiel betrachten wir eine Ladung Q im Abstand a vor einem unendlich ausgedehnten Leiter mit ebener Oberfläche (Abbildung 4.9).
Auf der Leiteroberfläche (xy-Ebene) ist ϕ = const; ohne Einschränkung der
Allgemeinheit setzen wir
ϕ(0, y, z) = 0 .
(4.43)
Im Halbraum x > 0 ist die Lösung der Poissongleichung darstellbar als
ϕ(~x) =
1
Q
+ ϕhom (~x) ,
4π²0 |~x − ~a|
(4.44)
84
4 Statische wirbelfreie Felder
Abbildung 4.9
wobei ϕhom (~x) eine Lösung der homogenen Gleichung ∆ϕhom = 0 ist. Der
Anteil ϕhom (~x) muss seine Quellen also im Leiter haben.
Wegen der Symmetrie des Problems liegt es nahe, zu raten
ϕhom (~x) = −
1
Q
.
4π²0 |~x + ~a|
(4.45)
Das gesamte Potential
ϕ(~x) =
1
4π²0
µ
Q
Q
−
|~x − ~a| |~x + ~a|
¶
(4.46)
sieht dann so aus, als wäre neben der Ladung Q am Ort ~a eine entgegengesetzt
gleiche Ladung im Innern des Leiters am Ort −~a vorhanden.
Tatsächlich erfüllt (4.45) im rechten Halbraum die homogene Gleichung
∆ϕ = 0 und die Superposition (4.46) somit die Poissongleichung
∆ϕ(~x) = −
1
Qδ (3) (~x − ~a) .
²0
(4.47)
Auch die Randbedingung (4.42) ist offensichtlich erfüllt.
Wir haben hier die Methode der Spiegelladungen“ an einem einfachen Bei”
spiel kennengelernt. Eine Fülle anderer Randwertaufgaben ist ganz ähnlich
lösbar.
4.6
Sphärische Ladungs- bzw. Massenverteilung
Die Sonne ist in recht guter Näherung eine sphärische Massenverteilung. (Tatsächlich liegt ein abgeplattetes Rotationsellipsoid vor, jedoch unterscheiden sich
polarer und äquatorialer Radius zu wenig.) Sphärische Ladungsverteilungen
lassen sich im Labor herstellen.
Einfach zu behandeln und illustrativ ist der Fall einer gleichförmig mit Masse
erfüllten oder elektrisch geladenen Kugel mit Radius a. Im elektrischen Fall
lautet das Potential
4.6 Sphärische Ladungs- bzw. Massenverteilung
ϕ(~x)
=
1
4π²0
Q
4π 3
3 a
Z
=
1
4π²0
Q
4π 3
3 a
Za
85
d3 x 0
|~x − ~x 0 |
0 02
dr r
Zπ
dΘ sin Θ
0
0
Z
2π
1
dϕ √
2
02
r + r − 2rr 0 cos Θ
| 0 {z }
2π
=
1 3Q
4π²0 2a3
Za
dr0 r02
(r + r 0 ) − |r − r 0 |
.
rr0
(4.48)
0
Für Beobachtungspunkte außerhalb der Kugel, d. h. für r > a ergibt sich,
da r > r 0 ,
ϕ(~x) =
1 Q
4π²0 r
für
r>a.
(4.49)
Im Innern der Kugel hingegen
ϕ(~x)
=
=
=

 r
Z
Za


1
3Q
0 0 0
0 0
dr
r
2r
+
dr
r
2r

4π²0 2a3 r 
r
0
½ 2
¾
1
r
3
2
2
Q
+
(a
−
r
)
4π²0
a3
2a3
µ
¶
3
r2
1
Q
− 3
für r ≤ a .
4π²0
2a 2a
(4.50)
Abbildung 4.10 veranschaulicht die Abhängigkeit des Potentials (4.50) vom Abstand r.
Abbildung 4.10
Das zugehörige elektrische Feld lautet
86
4 Statische wirbelfreie Felder
~
E
=
=
−∇ϕ = −ϕ0 (r)



~x
r
Q ~
x
1
4π²0 r 2 r
für r ≥ a
Qr ~
x
1
4π²0 a3 r
für 0 ≤ r ≤ a
.
(4.51)
Außerhalb der Kugel ergibt sich das bekannte Coulombfeld, als wäre die
Gesamtladung Q (bzw. Masse) im Mittelpunkt vereinigt. Unter anderen aus
diesem Grund ist es möglich, Sonne und Planeten als punktförmige Teilchen zu
behandeln. Dabei werden die kleinen Abweichungen der betreffenden Körper
von der Kugelform vernachlässigt. Das Feld innerhalb der Kugel lässt sich
schreiben als
~ =
E
4πr3 /3 1 ~x
1
Q
4π²0
4πa3 /3 r2 r
(4.52)
und kann als Coulombfeld der von der Kugel mit Radius r umschlossenen Ladung interpretiert werden.
4.7
Monopole, Dipole, Multipole
Außerhalb einer beliebigen nichtsphärischen Ladungs- (bzw. Massen-) Wolke“
”
fällt ϕ(~x) nicht genau wie 1/r ab. Betrachten wir die Abweichungen in großer
Entfernung von den Quellen. Zur Auswertung des Potentials (4.14) legen wir
den Ursprung des Koordinatensystems zunächst irgendwohin ins Innere des Gebietes, in dem ρ(~x) 6= 0 ist (s. Abbildung 4.11).
Abbildung 4.11
In großer Entfernung gilt für alle Quellpunkte ~x 0 die Ungleichung |~x0 | ¿ |~x|,
so dass wir entwickeln können
1
1
=
|~x − ~x|
r
"
1
1−
2
µ
r02 − 2~x · ~x
r2
0
¶
3
+
8
µ
r02 − 2~x · ~x0
r2
¶2
± ...
#
.
(4.53)
4.7 Monopole, Dipole, Multipole
87
Im Integranden entstehen dabei Glieder nullter, erster, zweiter und höherer
Ordnung in ~x0 bzw. r 0 . Dieselben geben zum Integral Beiträge entsprechender
Ordnung im “Durchmesser” a (größter Abstand zweier Quellpunkte). Es ergibt
sich die so genannte Multipolentwicklung des Potentials
ϕ(~x) = ϕ(0) (~x) + ϕ(1) (~x) + ϕ(2) (~x) . . . ,
(4.54)
die umso besser durch das niedrigste Glied (oder die paar ersten) repräsentiert
wird, je kleiner das Verhältnis a/r ist.
In nullter Ordnung entsteht der von der inneren Struktur und der äußeren
Gestalt der Ladungswolke unabhängige Coulombterm
ϕ(0) (~x) =
1 Q
,
4π²0 r
(4.55)
wobei
Q=
Z
d3 x0 ρ(~x0 )
(4.56)
die Gesamtladung der Ladungsverteilung darstellt. Im Falle elektrischer Neutralität der Wolke verschwindet Q und die Entwicklung beginnt frühestens mit
dem Glied erster Ordnung, ϕ(1) = 0(a/r 2 ). Beim Gravitationsfeld kann dieser
Fall natürlich nicht eintreten, da es keine Teilchen negativer Masse gibt.
Das gerade besprochene Coulombglied (auch Monopolterm genannt) wird
ausschließlich durch die Gesamtladung Q bestimmt. Bei sphärischen Wolken
gibt es bereits das gesamte Potential. Insofern i. A. weitere Glieder ϕ(1) (~x) etc.
auftreten, können wir sagen, dass diese die Abweichung von der Kugelsymmetrie
beschreiben.
Das Glied erster Ordnung lautet
ϕ1 (~x) =
1 d~ · ~x
,
4π²0 r3
(4.57)
wobei der Vektor
d~ =
Z
d3 ~x0 ~x0 ρ(~x0 )
(4.58)
das Dipolmoment der Wolke bezüglich des Koordinatenursprungs angibt. Beachten Sie, dass das Dipolpotential ϕ(1) (x) schneller mit wachsendem Abstand
abfällt als das Coulombpotential. Im Fall des Gravitationsfeldes und bei elektrostatischen Systemen, die nur Ladungen eines Vorzeichens enthalten, lässt sich
das Dipolmoment immer zum Verschwinden bringen, indem der Ursprung des
Koordinatensystems in den Massen- bzw. Ladungsschwerpunkt gelegt wird.
Wenn wir den Koordinatenursprung um ~x verschieben, so ändert sich die
Gesamtladung Q der Wolke offenbar nicht, wohl aber das Dipolmoment gemäß
X
~ = d~ − QX
~ .
d~ 0 =
Qi (~xi − X)
(4.59)
i
Also nicht nur im oben erwähnten Fall von Ladungen gleichen Vorzeichens,
sondern für alle Wolken mit endlicher Gesamtladung lässt sich das elektrische
Dipolmoment zum Verschwinden bringen, indem der Koordinatenursprung in
den Ladungsschwerpunkt gelegt wird. Wir schließen aus (4.59) weiterhin, dass
88
4 Statische wirbelfreie Felder
bei elektrisch neutralen Systemen das Dipolmoment unabhängig von der Wahl
des Koordinatenursprungs ist.
Das Dipolpotential (4.57) lässt sich besonders einfach in Kugelkoordinaten
~ so
(r, Θ, Φ) schreiben. Legen wir die z-Achse in Richtung des Dipolmoments d,
haben wir
ϕ−1 =
1 d cos Θ
.
4π²0
r2
(4.60)
In der Unabhängigkeit dieses Potentials vom Azimutwinkel Φ zeigt sich die
zylindrische Symmetrie des Dipols. Das zugehörige elektrische Feld hat die
Komponenten
Er
=
− ∂ϕ
∂r =
EΘ
=
− 1r
∂ϕ
∂Θ
1
− r sin
Θ
2d cos Θ
1
4π²0
r3
=
2d cos Θ
1
4π²0
r3
∂ϕ
∂Φ
Änderung des Potentials bei Variation
von r mit Φ, Θ = const
=
Änderung des Potentials bei Variation
von rΘ mit r, Φ = const
Änderung des Potentials bei Variation
von r sin Θϕ mit r, Θ = const
(4.61)
Hier zeigt sich die erwähnte Zylindersymmetrie im Verschwinden der Azimutalkomponente Eϕ . In der Abbildung 4.12 sind einige Linien konstanten Dipolpotentials in der y − z-Ebene aufgezeichnet.
EΦ
=
=0
=
=
Abbildung 4.12
Ähnlich wie eine sphärische Ladungswolke hinsichtlich ihres Feldes außerhalb
ihrer selbst durch eine Punktladung idealisiert werden kann, hat der mathema”
tische Dipol“, den ich gleich konstruieren will, ein Feld, das durch (4.60) bzw.
(4.61) exakt wiedergegeben wird. Denken wir uns zwei entgegengesetzt gleiche
Punktladungen ±Q im Abstand a. Das Dipolmoment dieser Anordnung hat
offenbar den Betrag
4.7 Monopole, Dipole, Multipole
d = Qa .
89
(4.62)
Wegen der elektrischen Neutralität hat das zugehörige Potential keinen 1/rAnteil, wohl aber Anteile ∼ 1/r n mit n = 2, 3, . . . . Der mathematische Dipol,
dessen Potential ausschließlich den 1/r 2 -Term enthält, entsteht im Grenzfall
¾
Q→∞
bei aQ = d = const .
(4.63)
a→0
Das Glied ϕ(2) (~x) der Multipolentwicklung heißt Quadrupolpotential und lautet
Z
3(~x · ~x 0 )2 − r2 r02
1
d3 x0 ρ(~x 0 )
.
(4.64)
ϕ(2) (~x) =
4π²0
2r5
Es fällt für große r wie 1/r 3 ab. Offenbar lässt es sich schreiben als
ϕ(2) (~x) =
wobei die Koeffizienten
Qij
=
Qij
=
3
1 1 X
xi xj
Qij
,
4π²0 2 i,j=1
r5

Qxx
Qxy
Qxz
 Qyx
Qyy
Qyz  = Qji
Qzx
Qzy
Qzz
Z
d3 x0 (3x0i x0j − δij r02 )ρ(~x)

(4.65)
(4.66)
den symmetrischen Tensor des Quadrupolmoments bilden.
Für wichtige Spezialfälle nehmen das Quadrupolmoment Qij und das Quadrupolpotential (4.64) einfache Form an. Wir betrachten insbesondere den Fall
von Ladungsverteilungen mit Rotationssymmetrie. Die Symmetrieachse kann
als z-Achse gewählt werden. Dann verschwinden alle in (4.64) vorkommenden
Integrale, die einen in x0 oder y 0 linearen Integranden haben, z. B.
Z
Z
3 0
0
0 0
d x ρ(~x ) x z = d3 x0 ρ(~x0 ) x0 y 0 = 0 .
(4.67)
Ebenfalls wegen der Rotationssymmetrie gilt
Z
Z
3 0
0
02
d x ρ(~x ) x = d3 x0 ρ(~x0 ) y 02 .
(4.68)
Es folgt, dass (4.64) sich schreiben lässt als
ϕ(2) (~x) =
1 2z 2 − x2 − y 2 (2)
Q
4π²0
4r5
mit dem Quadrupolmoment“
”
Z
Q(2) = d3 x0 ρ(~x0 ) (2z 02 − x02 − y 02 ) .
(4.69)
(4.70)
Besonders schön sieht das Potential (4.69) für einen rotationssymmetrischen
Quadrupol in Polarkoordinaten aus, nämlich
90
4 Statische wirbelfreie Felder
1 Q(2)
(3 cos2 Θ − 1) .
(4.71)
4π²0 4r3
Wir können leicht eine Ladungsverteilung angeben, die sowohl elektrisch neutral ist als auch kein Dipolmoment aufweist, deren Multipolentwicklung also mit
dem Quadrupolglied (4.69) beginnt. Wir haben einfach zwei einander entgegengerichtete Dipole d~ und −d~ im Abstand a kollinear zu legen (s. Abbildung 4.13).
ϕ2 (~x) =
}
Abbildung 4.13
Jeden dieser Dipole denken wir uns punktförmig gemäß
~ = lim bQ .
|d|
(4.72)
b→0
Q→∞
Die zugehörige Ladungsverteilung lautet
ρ(~x) = Qδ(x) δ(y) [δ(z) − δ(z − b) − δ(z − b − a) + δ(z − 2b − a)] .
Ihr sehen wir sofort an, dass die Gesamtladung und das Dipolmoment bezüglich
des Koordinatenursprungs verschwinden. Wegen der Rotationssymmetrie ist
das Quadrupolmoment durch den einen Parameter
Q(2)
Z
dx
Z
dy
Z
=
2
=
4(b2 + ab)Q .
dz z 2 ρ(~x)
(4.73)
festgelegt. Im Grenzübergang (4.72) entsteht
Q(2) = 4ad .
(4.74)
In diesem Grenzfall beginnt die Entwicklung des Potentials mit dem Quadrupolterm (4.71). Um ein reines Quadrupolfeld zu haben, idealisieren wir weiter
gemäß a → 0 und d → ∞ bei ad = const.
4.8
Die Form der Erde
Von lokalen Erhebungen wie dem Kahlen Asten oder dem Mt. Everest und
Absenkungen wie der oberrheinischen Tiefebene und Death Valley abgesehen
4.8 Die Form der Erde
91
hat die Erde die Form eines an den Polen abgeplatteten Rotationsellipsoids.
Der polare Radius c ist um etwa 21,5 km kleiner als der äquatoriale Radius a,
die relative Abplattung also
1
a−c
=
.
(4.75)
a
300
Infolge der Abplattung ist das Gravitationspotential der Erde nicht exakt gleich
dem Keplerpotential. Bezüglich des Erdschwerpunktes verschwindet das Dipolmoment. Also ist der wichtigste Korrekturterm der Quadrupolterm. Nehmen wir die Nord-Süd-Achse als z-Achse, so lautet das Gravitationspotential in
großer Entfernung von der Erde
²=
GQ(2)
GM
−
(3 cos2 Θ − 1) .
(4.76)
r
4r3
Für das Quadrupolmoment Q(2) der Erde finden wir leicht eine Abschätzung,
wenn wir annehmen, dass die Masse M homogen über das Rotationsellipsoid
verteilt ist (tatsächlich nimmt die Dichte zum Mittelpunkt hin zu). Die Dichte
ρ lässt sich dann durch die Masse M und das Volumen 4πa2 c/3 des Rotationsellipsoids ausdrücken,
ϕ(~x) = −
ρ=
M
.
4πa2 c/3
Zur Berechnung des Integrals (4.69),
Z
Q(2) = ρ d3 x(2z 2 − x2 − y 2 ) ,
(4.77)
(4.78)
über das Erdvolumen mit der Oberfläche
x2
y2
z2
+ 2 + 2 =1
2
a
a
c
dehnen wir die Integrationsvariablen gemäß
x = ξa ,
y = ηa ,
z = cζ ,
woraufhin das Quadrupolmoment (4.78) die Form
Z
Z
Z
3M
dξ dη dζ (2c2 ζ 2 − a2 ξ 2 − a2 η 2 )
dQ(2) =
4π
annimmt und die Erdoberfläche durch die Gleichung
ξ2 + η2 + ζ 2 = 1
(4.79)
(4.80)
(4.81)
(4.82)
beschrieben wird. Bezüglich der Koordinaten ξ, η, ζ sieht die Erdoberfläche also
wie eine Einheitskugel aus. Aus Symmetriegründen sind die Raumintegrale
von ζ 2 , η 2 , ξ 2 über das Volumen der Einheitskugel gleich, so dass sich (4.81)
vereinfacht zu
Z
3M 2
(c − a2 ) dξdηdζ ζ 2 .
Q(2) =
2π
Das verbleibende
Integral rechnen wir am bequemsten in Kugelkoordinaten aus
R
und finden d3 xx2 = 4π/15, also
92
4 Statische wirbelfreie Felder
2
4
M (a2 − c2 ) ≈ − M a2 ² .
(4.83)
5
5
Tatsächlich muss das Quadrupolmoment kleiner sein, da die Dichte der Erde
nach innen zunimmt und somit Volumenelemente mit größerem Abstand vom
Mittelpunkt weniger als in (4.83) beitragen.
Die Erde ist abgeplattet, weil sie rotiert. In Äquatornähe wirkt auf Volumenelemente des Erdmantels eine größere Zentrifugalkraft als in Polnähe. Über
erdgeschichtlich lange Zeiträume musste und muss die Erdoberfläche sich so einstellen, dass Volumenelemente des Erdmantels in guter Näherung kräftefrei sind
bezüglich Gravitationskraft, Zentrifugalkraft und Druckkraft seitens benachbarter Volumenelemente. Ein solcher Zustand wird durch plastische Formänderungen
erreicht. Tun wir so, als wäre die Erde aus einer extrem viskosen Flüssigkeit
gebildet ∗) . Im beschriebenen Gleichgewichtszustand muss die Erdoberfläche
eine Äquipotentialfläche darstellen. Ansonsten würde sich die Gestalt der Erde
dadurch ändern, dass die Flüssigkeit zu Gebieten niedrigeren Potentials fließt.
Vernachlässigen wir die Ortsabhängigkeit der Druckkraft, d. h. der elastischen Energie von Volumenelementen nahe der Erdoberfläche, so setzt sich das
Potential zusammen aus dem Gravitationspotential (4.76) und dem Potential
der Zentrifugalkraft
Q(2) =
ϕzentr (~x)
=
=
1 2 2
ω (x + y 2 )
2
1
− ω 2 r2 sin2 Θ .
2
−
(4.84)
(Dieses Potential gibt gerade die Zentrifugalkraft auf ein Volumenelement bei
~x mit Masse m, F~zentr = −∇ϕm = (mω 2 x, mω 2 y, 0) = − m~
ω × (~
ω × ~x).)
Insgesamt lautet das Potential also
GM
GM a2 ²
1 2 2 2
ω r sin Θ −
+
(3 cos2 Θ − 1) .
(4.85)
2
r
5r3
Setzen wir das Potential am Nordpol Θ = 0 gleich dem Potential am Äquator
Θ = π/2, so finden wir eine Bestimmungsgleichung für die relative Abplattung
²,
ϕ=−
GM
2GM a2 ²
1
GM
GM a2 ²
+
= − ω 2 a2 −
−
.
3
c
5c
2
a
5a2
Beachten wir, dass ² ¿ 1 und daher
−
(4.86)
1
1 a
1
1
=
= (1 − ²)−1 ≈ (1 + ²) .
(4.87)
c
a c
a
a
Wenn wir schließlich auch in (4.86) Glieder der Ordnung ²2 vernachlässigen, so
finden wir die lineare Gleichung
−
∗) Für
GM
GM
2GM
1
GM
GM a
−
²+
² = − ω 2 a2 −
−
².
a
a
5a
2
a
5a
(4.88)
die Frühgeschichte des Planeten vor der Erstarrung der Erdkruste ist die Annahme
sicherlich vernünftig. Bis auf die Effekte der Erosion und der Plattentektonik sollte sich die
Form der Erde seither nicht verändert haben.
4.9 Die Energie eines Haufens von Ladungen
93
Die Lösung,
²=
1
5 ω 2 a3
≈
,
4 GM
230
stimmt bis auf 30% mit der beobachteten Abplattung überein.
4.9
Die Energie eines Haufens von Ladungen
Die Energie eines Haufens von Ladungen wird berechnet, indem wir die den
Haufen aufbauenden Teilladungen qi alle nacheinander aus dem Unendlichen
(wo die wechselseitige potenzielle Energie verschwindet) in ihre Positionen ~x i
im Haufen gebracht denken.
Die erste Teilladung qi nach ~x1 zu bringen, kostet keine Energie, da alle
anderen Ladungen noch im Unendlichen (d. h. nirgends) sitzen. Die zweite, q 2 ,
nach ~x2 zu bringen, kostet, da q2 im durch q1 erzeugten Feld eine Kraft erfährt,
Energie, u. z.
q2 ϕ1 (~x2 ) =
1
q1 q2
.
4π²0 |~x1 − ~x2 |
(4.89)
Beim Heranholen von q3 nach ~x3 ins von q1 und q2 erzeugte Feld vergrößert sich
die Energie um
(
)
1
q3 q2
q3 q1
q3 ϕ1 (~x3 ) + q3 ϕ2 (~x3 ) =
+
.
(4.90)
4π²0 |~x3 − ~x1 | |~x3 − ~x2 |
Wird schließlich die n-te und letzte Teilladung in ihre Position ~xn geholt, so
erhöht sich die gesamte Wechselwirkungsenergie um die Energie der n-ten Teilladung im Feld der n − 1 anderen, also um
qn
X
ϕi (~xn ) =
i<n
X
qi
1
qn
|.
4π²0
|~
x
− ~xi
n
i<n
(4.91)
Die gesamte Wechselwirkungsenergie, die Summe aller aufgelisteten Beiträge,
lautet
W+
n
1 X X qj qi
1 1X
qi qj
=
.
4π²0 j=1 i<j |~xj − ~xi |
4π²0 2
|~xi − ~xj |
(4.92)
i6=j
Beachten Sie, dass per Konstruktion die Wechselwirkungsenergie keine dia”
gonalen“ Glieder mit i = j enthält. Eine Definition von W , die solche Glieder
mit einschlösse, wäre höchst unglücklich, denn die Energie einer Punktladung im
eigenen Feld, die Selbstenergie“ einer Punktladung, divergiert und hat keinen
”
Sinn.
Für den Fall einer kontinuierlichen Ladungsverteilung verwenden wir die diskrete Formel (4.92), in der wir qi mit ρ(~x)d3 x und qj mit ρ(~x0 )d3 x0 identifizieren
und integrieren
1 1
W =
4π²0 2
Z
3
d x
Z
d3 x 0
ρ(~x)ρ(~x0 )
.
|~x − ~x0 |
(4.93)
94
4 Statische wirbelfreie Felder
Allerdings unterscheidet sich (4.92) von (4.93) insofern wesentlich, als in (4.93)
Beiträge von ~x = ~x0 nicht ausgeschlossen sind, so dass (4.93) auch Selbstenergiebeiträge enthält. Dennoch ist W gemäß (4.93) für kontinuierliche Ladungsverteilung ρ(~x) wohl definiert. Divergente Selbstenergien treten nur bei diskreten
Punktladungen auf. (Woran sich zeigt, dass der Begriff der Punktladung, da
in manchen Zusammenhängen zu Unsinn führend, eine mit Vorsicht zu behandelnde Idealisierung ist.)
Berechnen wir, um ein Beispiel vor Augen zu haben, die Energie eines homogenen kugelförmigen Ladungshaufens, in dessen Innerem die Ladungsdichte
Q
Q
=
V
R3
p(~x) =
(4.94)
4π
3
vorliegt. Aus (4.93) finden wir
µ
1 1
W =
4π²0 2
Q
V
¶2 Z
3
d x
Z
d3 x 0
1
.
|~x − ~x0 |
(4.95)
Führen wir zuerst die Integration über ~x0 aus und stellen ~x0 in Kugelkoordinaten
dar. Dabei können wir die vorläufig feste Richtung von ~x als die z 0 -Richtung
wählen und erhalten
W
=
µ
1 1
4π²0 2
sin Θ
0
Z2π
Q
V
¶2 Z
dΦ0 √
0
| {z }
r2
ZR
3
d x
0 02
dr r
+
dΘ0
0
0
r02
Zπ
1
− 2rr 0 cos Θ0
2π
=
=
1
π
4π²0
1
2π
4π²0
µ
Q
V
µ
¶2 Z
Q
V
¶2 Z
d3 x
ZR
dr0 r02
−1
0
3
d x
(
Z+1
dξ p
1
r2
|
1
r
|
Zr
dr r +
1
2
r
2
r0
=
0 02
0
+ r02 − 2rr 0 ξ
{z
}
( 2
{z
R2 − 16
ZR
r
r2
0 0
dr r
)
.
für
r > r0
für
r > r0
(4.96)
}
Nun führen wir das zweite Raumintegral aus und erhalten mit
W =
1 3 Q2
4π²0 5 R
(4.97)
ein Ergebnis, das wir bis auf den numerischen Faktor 3/5 aus einer Dimensionsbetrachtung ohne Rechnung hätten gewinnen können.
4.10 Die Energie eines Ladungshaufens in einem äußeren Feld
95
Die Energie (4.93) eines Ladungshaufens lässt sich auch durch die von den
Ladungen erzeugte Feldstärke ausdrücken. Wir gewinnen einen solchen Ausdruck, indem wir (4.93) in der Form
Z
1
W =
d3 xρ(~x)ϕ(~x)
(4.98)
2
schreiben und die Ladungsdichte mit Hilfe der Poissongleichung −ρ(~x)/² 0 =
+∆ϕ(~x) eliminieren,
Z
²0
W =−
d3 xϕ(~x) div grad ϕ(~x) .
(4.99)
2
Hierin benutzen wir die Identität
div(ϕ grad ϕ) = (grad ϕ) · (grad ϕ) + ϕ div grad ϕ ,
(4.100)
und erhalten
W =
²0
2
Z
d3 x|E(~x)|2 +
²0
2
Z
~ .
d3 x div(ϕE)
(4.101)
Der zweite Term kann mit Hilfe des Gaußschen Integralsatzes in ein Oberflächenintegral über eine im Unendlichen liegende Kugelfläche verwandelt werden und verschwindet, falls der Ladungshaufen endliche Ausdehnung hat. Be~
achten wir nur, dass für große Entfernung |~x| = r vom Ladungshaufen das Feld E
2
mindestens wie 1/r und das Potential ϕ mindestens wie 1/r abfallen, während
das Oberflächenelement auf einer Kugel sich wie |df~| = r 2 sin ΘdΘdΩ verhält.
Demnach lautet der gesuchte Ausdruck für die Energie des Ladungshaufens
Z
²0
~ x)|2 .
d3 x|E(~
(4.102)
W =
2
Das gefundene Resultat legt die Interpretation nahe, dass überall im elektrostatischen Feld Energie mit einer Raumdichte
w(~x) =
²0 ~
|E(~x)|2 .
2
(4.103)
konzentriert ist.
4.10
Die Energie eines Ladungshaufens in einem
äußeren Feld
Die Energie eines Ladungshaufens in einem äußeren Feld lautet, da eine Ladung
q im Potential ϕ(~x) die potenzielle Energie qϕ(~x) hat,
Z
W = d3 xρ(~x) ϕ(~x) .
(4.104)
Wir studieren diese Energie genauer für den Fall, dass das äußere Potential
ϕ(~x) über den Ladungshaufen hinweg nur schwach veränderlich ist. Dann lässt
sich ϕ(~x) in eine Taylorreihe um einen im Ladungshaufen gelegenen Nullpunkt
herum entwickeln
96
4 Statische wirbelfreie Felder
ϕ(~x)
=
ϕ(0) +
3
X
i=1
=
xi
3
∂ϕ(0) 1 X
∂ 2 ϕ(0)
+
xi xj
+ ...
∂xi
2 i,j=1
∂xi ∂xj
3
∂Ej (0)
1 X
~
xi xj
+ ...
ϕ(0) − ~x · E(0) −
2 i,j=1
∂ xi
(4.105)
Im dritten Term dürfen wir, da das äußere Feld innerhalb des Ladungshaufens
P
∂E (0)
~
keine Quellen hat, also ∇· E(0)
= 0 gilt, ungestraft den Term ij 61 r2 δij ∂xj i
abziehen und schreiben
∂Ej (0)
1 X
~
+ ...
(3xi xj − δij r2 )
ϕ(~x) = ϕ(0) − ~x · E(0)
−
6 ij
∂xi
(4.106)
Setzen wir diese Reihe in (4.104) ein, so finden wir die Energie des Ladungshaufens im äußeren Feld ausgedrückt durch die Multipolmomente
1X
∂Ej (0)
~
W = Qϕ(0) − d~ · E(0)
−
.
Qij
6 ij
∂xi
(4.107)
Sehen Sie, dass Parallelstellung eines Dipols zum äußeren Feld energetisch
begünstigt ist gegen alle anderen Orientierungen? Dass das Quadrupolmoment
mit dem Feldgradienten wechselwirkt? Im Labor lernen Sie, diese Eigenschaften
zur Messung von Dipol- und Quadrupolmomenten auszunutzen.
Kapitel 5
Statische Magnetfelder
5.1
~ x)
Das magnetische (Induktions-)Feld B(~
~ x) ist definierbar und messbar durch die
Das magnetische (Induktions-) Feld B(~
Kraft, die eine mit Geschwindigkeit ~v bewegte Ladung q erfährt,
~ + ~v × B)
~ .
F~ = q(E
(5.1)
~ dt .
dq = ρ(~x) ~v (~x) · df
(5.2)
ρ(~x) ~v (~x) = ~j(~x)
(5.3)
~ wir schon beDas ist die wohlbekannte Lorentzkraft, deren Coulombanteil q E
sprochen hatten.
Aus der Experimentalphysik ist Ihnen ebenfalls bekannt, dass stromdurchflossene Leiter im Magnetfeld eine Kraft erfahren. Überzeugen wir uns davon
nochmal mit Hilfe von (5.1). Dazu zunächst eine Vorüberlegung. Betrachten
wir einen Ladungshaufen mit der Ladungsdichte ρ(~x), dessen Ladungselemente
mit der stationären Geschwindigkeit ~v (~x) durch den Raum driften. Dann strömt
~ im Zeitintervall dt die Ladung
durch ein Flächenelement df
Die hier auftretende Größe
heißt elektrische Stromdichte und ist ein Vektorfeld, das wir hier vorläufig als
zeitunabhängig annehmen.
Der elektrische Strom I, der durch eine beliebige Fläche F , z. B. durch den
Querschnitt eines Drahtes fließt, ist einfach der Fluss der Stromdichte ~j durch
F , also
Z
~ · ~j(~x) .
(5.4)
I = df
F
Das ist die elektrische Ladung, die sekündlich durch F strömt.
Zurück zur Lorentzkraft! Da wir uns hier nur für den magnetischen Anteil
~ sei gleich Null. Die Kraft auf eine Ladung qi
interessieren, nehmen wir an, E
~
~
ist Fi = qi~vi × B(~xi ). Haben wir einen Haufen vieler bewegter Punktladungen,
so erhalten wir die Gesamtkraft auf alle Punktladungen als
97
98
5 Statische Magnetfelder
F~ =
X
i
~ xi ) ,
qi~vi × B(~
bzw. für ausgeschmierte Haufen,
Z
Z
3
~
~
~ x) .
F = d xρ(~x)~v (~x) × B(~x) = d3 x~j(~x) × B(~
(5.5)
(5.6)
Schauen wir insbesondere ein Stück eines dünnen stromdurchflossenen Drahtes mit dem Querschnitt df und der Länge dl an. Wir können das Längenelement
~ ernennen, wenn wir als Richtung die des Drahtstücks nehmen
dl zum Vektor dl
(Abbildung 5.1).
Abbildung 5.1
Insgesamt sei der Querschnitt so klein, dass ~j(~x) darin konstant ist. Dann gilt
~ = I dl
~ ,
~j(~x)d3 x = |~j(~x)| df dl
wobei I der durch den Draht fließende Strom ist. Für die Kraft auf das Drahtstück
haben wir
~ × B(~
~ x) .
dF~ (~x) = I dl
(5.7)
Die Gesamtkraft auf ein endliches Drahtstück erhalten wir hieraus durch Superposition der Kräfte auf kleine Teilstücke,
Z
~ × B(~
~ x)I .
F~ = dl
(5.8)
Es gilt in der Natur ein Erhaltungssatz für elektrische Ladungen: Die Gesamtladung eines abgeschlossenen Systems bleibt zeitlich konstant. Ladungen gehen nie verloren und werden nie erzeugt. (Dieser Erhaltungssatz steht
keineswegs im Widerspruch, vielmehr in schöner Übereinstimmung zu Paarerzeugungsprozessen, bei denen ein γ-Quant mit E > 1MeV in ein ElektronPositronpaar zerfällt: Das γ-Quant ist neutral, das Elektron-Positronpaar auch).
Der Ladungserhaltungssatz besagt für unseren Draht, dass der Strom I durch
den Querschnitt unabhängig von ~x ist. Die Ladung, die vorne“ durch die
”
Querschnittsfläche df in ein Drahtstück pro Sekunde hineinfließt, muss, da Stationarität angenommen, pro Sekunde hinten“ wieder herausfließen. Demnach
”
haben wir für die Kraft auf einen dünnen, vom Strom I durchflossenen Draht
den Ihnen bekannten Ausdruck
5.2 Das Magnetfeld eines geraden stromdurchflossenen Drahtes
F~ = I
5.2
Z
~ × B(~
~ x) .
dl
99
(5.9)
Das Magnetfeld eines geraden stromdurchflossenen Drahtes
Das Magnetfeld eines geraden stromdurchflossenen Drahtes ist Ihnen ebenfalls
~ hat keine Komponente parallel zum Draht und auch keine
wohlbekannt. B
radial vom
Abbildung 5.2
~ fällt umgekehrt
Draht weg gerichtete (vgl. Abbildung 5.2)). Der Betrag von B
proportional zum Abstand vom Draht ab und ist proportional zum Strom I.
~
Führen wir Zylinderkoordinaten ~x = (z, r, ϕ) ein, so lautet B
Bz = 0 ,
Br = 0 , Bϕ = Bϕ (r) =
2I
1
.
2
4π²0 c r
(5.10)
~ geschlossene
Gemäß einer anschaulichen Redeweise sind die Feldlinien von B
Kreise in Ebenen senkrecht zum Draht (also Ebenen z = const) mit Mittelpunkt
im Draht.
Das eben in Erinnerung gerufene Feld des geraden stromdurchflossenen Drahtes ist für die Beschreibung des magnetostatischen Feldes ein ähnlich bequemer
~ = (1/4π²0 )q~x/r 3 für die BeschreiAusgangspunkt wie das Coulombgesetz E
bung des elektrostatischen Feldes. Wir werden lernen, (5.10) zu lesen als: Das
statische Magnetfeld hat keine Quellen und hat als Wirbel elektrische Ströme.
5.3
Wirbel
~ x) entlang einer geDie Wirbelstärke alias Zirkulation eines Vektorfeldes B(~
schlossenen Kurve K wird gegeben durch das Linienintegral
100
5 Statische Magnetfelder
I
K
~ =Z .
~ x) · dl
B(~
(5.11)
~ und der
Im allgemeinen ist die Zirkulation Z eine Eigenschaft des Feldes B
Kurve K. Wenn allerdings Z = 0 für beliebige Kurven K, so kann geschlossen
~ x) keine Wirbel hat.
werden, dass das Feld B(~
~ x) des geraden stromdurchflossenen DrahBetrachten wir das Magnetfeld B(~
tes und berechnen Z für einen Kreis in einer Ebene z = const mit Mittelpunkt
~ parallel zu B
~ = rdϕ, wenn r
~ und |dl|
im Draht. Überall längs des Weges ist dl
der Radius von K ist und ϕ der Azimutwinkel. Also folgt
Z2π
Z2π
Z = dϕ rBϕ (r) = dϕ r
0
0
1
1
2I
=
I .
2
4π²0 c r
²0 c2
(5.12)
~ längs des betrachteten Kreises ist also zum Strom I proDie Wirbelstärke von B
portional. Dieses Ergebnis wird erst wirklich interessant durch die Feststellung,
dass es unabhängig vom Weg K ist, vorausgesetzt, K umschlingt den Draht
genau ein Mal.
Um letztere Feststellung als richtig zu erweisen, beobachten wir zunächst,
dass Z unabhängig vom Radius r des Kreises und der Lage der Ebene z = const
ist. Sodann denken wir uns in dieser Ebene den Kreis beliebig deformiert, z. B.
so wie in Abbildung (5.3) gezeigt.
Abbildung 5.3
Die Teilstückzerlegung des Weges denken wir uns so, dass jedes Wegelement
~ vom Durchstoßpunkt des Drahtes durch die Ebene aus gesehen unter dem
dl
gleichen Winkelstück dϕ erscheint. Dann ergeben alle Winkelstücke dϕ den
gleichen Beitrag zu Z, nämlich rdϕ(1/4π²0 c2 )(2l/r). Das gilt auch für solche
~ (nämlich 3, 5, 7, ..., jedenfalls
Winkelstücke, zu denen mehrere Wegstücke dl
ungeradzahlig viele) gehören, denn in solchen Fällen alternieren die Beiträge der
~ im Vorzeichen und heben sich
nach außen aufeinander folgenden Wegstücke dl
bis auf einen paarweise auf. Die Summe aller Beiträge von allen Winkelelementen ist wieder die in (5.12) gegebene Zirkulation.
5.3 Wirbel
101
Schließlich lassen wir noch Deformationen des Weges K in z-Richtung zu.
Solche Deformationen können aber den Wert von Z nicht ändern, da
~ keinen Beitrag zum Skalarprodukt dl
~ ·B
~ ϕ Bϕ
~ = (dl)
z-Komponenten von dl
geben.
~
Mit gleicher Argumentation können wir zeigen, dass die Zirkulation von B
um mehrere stromdurchflossene Drähte, wobei jeder vom geschlossenen Weg K
genau einmal umschlossen wird, gleich der Summe aller Ströme Ii ist. Dabei sind
natürlich die Vorzeichen der Ii als verschieden anzusehen, wenn die respektiven
Drähte in verschiedener Richtung von Strom durchflossen werden
Z
X
~ x) = 1
Z = d~x · B(~
Ii ,
(5.13)
²0 c2 i
K
Die hier rechts stehende Summe aller Ströme, die von der geschlossenen Kurve K umschlungen werden, lässt sich auch schreiben als Fluss des Stromdichtefeldes ~j(~x) durch irgendeine offene, von K berandete Fläche F (vgl. Abbildung
5.4),
Z
X
~ · ~j(~x) .
Ii = df
(5.14)
i
F
Abbildung 5.4
Da der Strom durch einen Draht (durch die Querschnittsfläche des Drahtes)
überall längs des Drahtes gleich ist (Ladungserhaltung und Stationarität), gilt
(5.14) für alle von K berandeten offenen Flächen F .
~ längs der geschlosWir schließen, dass die Zirkulation des Magnetfeldes B
senen Kurve K proportional zu dem Fluss der elektrischen Stromdichte durch
irgendeine von K berandete Fläche F ist,
I
Z
1
~
~ · ~j(~x) .
~
dl · B(~x) =
df
(5.15)
²0 c2
K
F
102
5 Statische Magnetfelder
5.4
Lokale Wirbel
~ längs einer geschlossenen Kurve K gibt erst dann eine
Die Wirbelstärke von B
eindeutige Auskunft über das Magnetfeld, wenn wir die Kurve K zu einem beliebig kleinen Ring schrumpfen lassen. Bleibt K in engster Nachbarschaft eines
Punktes ~x, so wird die Wirbelstärke längs K durch die Stromdichte ~j(~k) am Ort
~x charakterisiert sein. Überlegen wir uns, welche differenziellen Eigenschaften
~ am Ort ~x durch die Stromdichte ~j(~x) festgelegt werden.
des Magnetfeldes B
Betrachten wir einen Weg K längs eines kleinen Rechtecks. Ohne
Beschränkung der Allgemeinheit wählen wir das Koordinatensystem so, dass
das Rechteck in einer Ebene z = const liegt (Abbildung 5.5):
Abbildung 5.5
~ längs K lautet
Die Zirkulation von B
Z
=
x+∆x
Z
dξ [Bx (ξ, y, z) − Bx (ξ, y + ∆y, z)]
x
+
y+∆y
Z
y
dη [By (x + ∆x, η, z) − By (x, η, z)] .
(5.16)
Es seien die Kantenlängen ∆x und ∆y so klein, dass die Taylorreihen
Bx (ξ, y + ∆y, z)
∂Bx (ξ, y, z)
∆y + . . .
∂y
=
Bx (ξ, y, z) +
=
∂By (x, η, z)
By (x, η, z) +
∆x + . . .
∂x
(5.17)
By (x + ∆x, η, z)
nach den Gliedern erster Ordnung abgebrochen werden können. Dann vereinfacht sich Z zu
5.4 Lokale Wirbel
Z = −∆y
x+∆x
Z
∂Bx (ξ, y, z)
dξ
+ ∆x
∂y
x
y+∆y
Z
dη
∂By (x, η, z)
,
∂x
103
(5.18)
y
woraus wir sehen, dass im Grenzfall beliebig kleiner Kantenlängen ∆x, ∆y die
Zirkulation von der Ordnung des Produktes ∆x ∆y ist. Unter Vernachlässigung
von Gliedern höherer Ordnung können wir (5.18) weiter verschönern zu
¶
µ
∂By (~x) ∂Bx (~x)
−
.
(5.19)
Z = ∆x∆y
∂x
∂y
In der Klammer steht, was wir künftig die z-Komponente der lokalen Wir~ nennen werden,
belstärke oder Rotation von B
~ z=
(rotB)
∂By
∂Bx
−
.
∂x
∂y
(5.20)
~ und der
Der gesuchte Zusammenhang zwischen der lokalen Wirbelstärke von B
Stromdichte ~j ergibt sich, indem wir die Proportionalität der Zirkulation (5.19)
mit dem Fluss der elektrischen Stromdichte ~j(~x) durch das Flächenelement beachten. Letzterer Fluss ist, da die Normale des Flächenelements in z-Richtung
weist, ∆x∆y jz (~x). Wir haben also
~ z=
(rotB)
1
jz .
²0 c2
(5.21)
Betrachten wir Flächenstückchen, die in Ebenen y = const bzw. x = const
liegen, so erhalten wir durch simple Wiederholung der zu (5.21) führenden
Überlegung zwei weitere Gleichungen, die sich von (5.21) nur durch die Ersetzung des Vektorindex z durch y bzw. x unterscheiden. Insgesamt haben wir
~ das
als Zusammenhang zwischen der Stromdichte und der Wirbelstärke von B
vektorielle Gesetz
~ =
rotB
1 ~
j.
²0 c2
(5.22)
~ eines
Als Nebenprodukt unserer Überlegungen haben wir die Rotation rot B
~ gewonnen,
Vektorfeldes B
~ x
(rotB)
=
∂By
∂Bz
−
.
∂y
∂z
~ y
(rotB)
=
∂Bx
∂Bz
−
.
∂z
∂x
~ z
(rotB)
=
∂Bx
∂By
−
.
∂x
∂y
Wir werden manchmal die Schreibweise
~ =∇
~ ×B
~
rotB
(5.23)
104
5 Statische Magnetfelder
benutzen, die offenbar sinnvoll ist, denn die vektorielle Multiplikation des Vek”
~ = (∂/∂x, ∂/∂y, ∂/∂z) mit dem Vektor B
~ gibt gerade einen Vektor
tors“ ∇
mit
den in (5.23) angegebenen Komponenten.
Als weiteres Nebenprodukt ernten wir den Stokes’schen Integralsatz der Vek~ längs eines endlichen Weges
toranalysis, wenn wir nochmal die Zirkulation von B
K und den Fluss der elektrischen Stromdichte durch irgendeine von K berandete offene Fläche F betrachten. Denken wir uns die Fläche F zerlegt in kleine
~ längs K ist gleich
Stückchen dFi mit Berandungen Ki . Die Zirkulation von B
der Summe der Zirkulationen längs der Ki , da die Wegintegrale längs der inneren Kanten sich paarweise aufheben (s. Abbildung 5.6).
Abbildung 5.6
Für jede Teilfläche dFi gilt dann
I
Zi =
Ki
~ = dF~i rotB
~ · dl
~
B
und für die Summe, im Grenzfall beliebig feiner Unterteilung,
I
Z
~ =
~ · rotB
~ · dl
~ .
B
df
K
(5.24)
(5.25)
F
~ längs einer geschlossenen Kurve K ist gleich
Die Zirkulation eines Vektorfeldes B
~
dem Fluss der Rotation von B durch irgendeine von K berandete Fläche.
5.5
Magnetische Monopole
Magnetische Monopole sind bisher nie zweifelsfrei beobachtet worden. Obwohl
die Suche weitergeht und ein abschließendes Urteil nicht möglich ist, bleibt
die Erfahrungstatsache, dass magnetische Felder keine Quellen haben, vorläufig
unerschüttert.
Dem magnetostatischen Feld des stromdurchflossenen Drahtes sehen wir die
Quellenfreiheit sofort an: alle Feldlinien sind in sich geschlossene Kreise. Wir
schließen
5.6 Die Feldgleichungen
~ x) = 0 .
divB(~
105
(5.26)
Sollten eines Tages doch Teilchen mit magnetischer Ladung gefunden werden,
so wäre die Theorie des elektromagnetischen Feldes an dieser Stelle abzuändern.
5.6
Die Feldgleichungen
Die Feldgleichungen des magnetostatischen Feldes sind die oben gewonnenen
~
Aussagen über Quellen und Wirbel von B,
~ =0
divB
~ =
rotB
1 ~
j.
²0 c2
(5.27)
(5.28)
Hierin sind die Stationarität der Stromverteilung ~j und des von ihr erzeugten
~ enthalten und ebenso der Erhaltungssatz für die elektrische Ladung.
Feldes B
Nehmen wir, um die Ladungserhaltung zu verifizieren, die Divergenz der in
~ = ∇ · (∇ × B)
~ = 0 folgt die
(5.28) gleichgesetzten Vektoren. Wegen div rotB
Quellenfreiheit der Stromdichte,
div ~j = 0 .
(5.29)
Tatsächlich ist klar, dass ~j am Ort ~x nur dann eine Quelle haben kann, wenn sich
dort die elektrische Ladungsdichte ρ zeitlich ändert, was wir mit der Annahme
der Stationarität hier ausgeschlossen haben.
Bei vorgegebener Stromverteilung ~j(~x) stellen (5.27) und (5.28) inhomogene
Differentialgleichungen für die drei Komponenten Bi (~x) dar, die, zusammen mit
~ eindeutig festlegen. Zur Lösung dieser
geeigneten Randbedingungen, das Feld B
Differentialgleichungen ist es bequem, das Magnetfeld als die Wirbelstärke eines
anderen Vektorfeldes, des so genannten Vektorpotentials, darzustellen,
~ x) = rotA(~
~ x) .
B(~
(5.30)
~ schon eingearbeitet, denn für
Diese Darstellung hat die Quellenfreiheit von B
~
~
beliebiges A gilt div rot A = 0.
~ durch das Vektorpotential A
~ in (5.30) eindeutig
Während das Magnetfeld B
festgelegt ist, gilt nicht das Umgekehrte! Überzeugen wir uns davon, dass wir
~ den Gradienten eines beliebigen skalaren Feldes hinzufügen können, d. h.
von A
~ wählen dürfen
statt A
~ 0=A
~ + gradf (~x) ,
A
(5.31)
~ ändert. Der Grund ist einfach, dass ein Gradientenfeld wirohne dass sich B
belfrei ist,
rot gradf (~x) = 0 .
(5.32)
~ 0 = rotA
~=B
~ .
rotA
(5.33)
Es gilt also
106
5 Statische Magnetfelder
Ähnlich war’s in der Elektrostatik. Dort durften wir zum elektrostatischen
Potential ϕ eine beliebige Konstante hinzufügen, ohne dass sich das elektrische
Feld änderte. Die willkürliche additive Konstante in ϕ hatten wir aus Bequemlichkeit meist so festgelegt, dass
ϕ(~x → ∞) = 0
~ indem wir die Eichbedingung (CouHier benützen wir den Spielraum in A,
lombeichung)
~=0
divA
(5.34)
fordern. Die Bequemlichkeit dieser Wahl wird weiter unten sichtbar werden. Die
~ 0 (~x) mit Quellen,
Bedingung (5.34) ist immer erfüllbar, denn haben wir ein A
so finden wir mit der Eichtransformation“ (5.31) ein skalares Feld f (~x), dessen
”
~ 0 aufhebt und A
~ =A
~ 0 + grad f quellenfrei macht.
Gradient die Quellen von A
Die Bestimmungsgleichung für f lautet
0 = divA~0 + div gradf .
(5.35)
Wir erkennen in (5.35) sofort die Poissonsche Differentialgleichung wieder, die
wir in der Elektrostatik gelöst haben. Eine Lösung lautet bekanntlich
1
4π
f (~x) =
Z
d3 x 0
~ 0 (~x 0 )
divA
.
|~x − ~x 0 |
(5.36)
~ durch Angabe des Magnetfeldes B
~ und der
Im übrigen ist das Vektorpotential A
Eichbedingung (5.34) immer noch nicht eindeutig bestimmt, denn wir können
noch Randbedingungen stellen.
~ betrachten wir den Fall eines räumlich
Zur Gewöhnung an den Umgang mit A
homogenen magnetischen Feldes
~ x) = (0, 0, Bz )
B(~
(5.37)
mit Bz = B = const. Das Vektorpotential bestimmen wir aus
Bx
=
0
=
By
=
0
=
Bz
=
B
=
∂Az
∂y
∂Bz
∂z
∂Ay
∂x
−
−
−
∂Ay
∂z
∂Az
∂x
∂Ax
∂y
(5.38)
.
Mögliche Lösungen sind u. a.
(0, xB, 0)
(−yB, 0, 0)
¡ 1
¢
− 2 yB, 12 xB, 0 .
Alle genannten Lösungen sind auch quellenfrei. Andere lassen sich leicht finden.
Die hier angegebenen haben die schöne Eigenschaft, dass die Komponenten Ai
lineare Funktionen der Koordinaten xi sind.
Bestimmen wir nun das Vektorpotential aus einer vorgegebenen Stromver~ = rotA
~ und die Wirbel rotB
~ = 1 2 ~j,
teilung. Verwenden wir die Definition B
²0 c
so haben wir
5.6 Die Feldgleichungen
~=
rot rotA
1 ~
j.
²0 c2
107
(5.40)
Die kompakte Schreibweise darf uns nicht darüber hinwegtäuschen, dass (5.40)
drei gekoppelte Differentialgleichungen für die drei Komponenten von A darstellen. Eine erhebliche Vereinfachung dieser Gleichungen wird erreicht, wenn
wir die Eichbedingungen (5.34) und die Vektoridentität
~ = grad divA
~ − ∆A
~
rot rotA
(5.41)
verwenden. Aus (5.40) entstehen dann drei entkoppelte Gleichungen für die
~
Komponenten von A
~=−
∆A
1 ~
j.
²0 c2
(5.42)
Jede der drei Gleichungen (5.42) hat die Form der Poissonschen Differentialgleichung, deren Lösung wir aus der Elektrostatik kennen. Eine Lösung ist
~ x) =
A(~
1
4π²0 c2
Z
d3 x 0
~j(~x 0 )
.
|~x − ~x 0 |
(5.43)
Sie gehorcht der Randbedingung
~ x → ∞) = 0 .
A(~
(5.44)
Wenn andere Randbedingungen zu befriedigen sind, müssen zu (5.43) noch ge~ = 0 addiert werden.
eignete Lösungen der homogenen Gleichung ∆A
Nachdem wir in (5.43) das Vektorpotential einer beliebigen Stromverteilung
bestimmt haben, können wir durch bloßes Differenzieren auch das zugehörige
~ ausrechnen,
Magnetfeld B
~
B
~ x)
B(~
Z
~j(~x 0 )
1
3 0
d
x
= rot
4π²0 c2
|~x − ~x 0 |
Z
1
1
=
d3 x0~j(~x 0 ) × grad~x
4π²0 c2
|~x − ~x 0 |
Z
~x − ~x 0
1
3 0~
0
d
x
j(~
x
)
×
.
=
4π²0 c2
|~x − ~x 0 |3
(5.45)
(5.46)
Dies ist das Biot-Savartsche-Gesetz, von dem wir den Spezialfall eines geraden Leiters schon oben behandelt hatten. Von Interesse ist auch der Fall eines
beliebig gekrümmten Drahtes mit sehr dünnem Querschnitt df , bei dem gilt
~ = I dl
~ .
~j(~x 0 )d3 x0 = |~j(~x 0 )| df dl
(5.47)
Dabei muss wegen div~j = 0 der Strom I längs des Drahtes überall konstant sein
und das Magnetfeld lautet
I
0
1
~ × ~x − ~x
~
dl
.
(5.48)
B(~x) =
4π²0 c2
|~x − ~x 0 |3
108
5 Statische Magnetfelder
wobei das Linienintegral längs des geschlossenen Stromkreises im Draht zu berechnen ist. Warum geschlossen? Wegen Ladungserhaltung und Stationarität
gilt div ~j = 0, also müssen die Stromlinien von ~j und somit der Draht in sich
geschlossen sein.
5.7
Das Fernfeld stationärer Ströme
Das Fernfeld stationärer Ströme erhalten wir aus dem Vektorpotential (5.43)
mit Hilfe der Taylorentwicklung von |~x − ~x 0 |−1 nach Potenzen von ~x 0 /|~x|. Das
Vorgehen ist ganz analog zur Konstruktion der Multipolentwicklung des elektrostatischen Potentials (vgl. Abbildung 5.7).
Abbildung 5.7
Wir erhalten, mit r = |~x|,
~ x) =
A(~
1
1
2
4π²0 c r
Z
µ 2 ¶¸
·
a
~x · ~x 0
+
0
d3 x0~j(~x 0 ) 1 +
.
2
r
r2
(5.49)
Der erste Term verschwindet wegen div ~j = 0 für eine Stromverteilung endlicher Ausdehnung. Wir sehen das unter Verwendung der Identität
X
i
∂
(ji xk ) = jk + xk div ~j = jk .
∂xi
(5.50)
Integration über den ganzen Raum gibt mit Hilfe des Gaußschen Satzes, wenn
~j(~x)r 3 → 0 für |~x| = r → ∞,
Z
d3 x~j(~x) = 0 .
(5.51)
Physikalisch hängt die Abwesenheit eines Gliedes 0-ter Ordnung in a/r in der
~ natürlich damit zusammen, dass die Grundgleichung
Multipolentwicklung für A
~
div B = 0 die Existenz magnetischer Monopole verbietet. Erinnern wir uns, dass
5.7 Das Fernfeld stationärer Ströme
109
das Glied 0-ter Ordnung in (a/r) in der Multipolentwicklung des elektrostatischen Potentials gerade der Coulombterm, d. h. das elektrische Monopolglied
war.
Das erste nicht notwendig verschwindende Glied in der Multipolentwicklung
(5.49) ist das Vektorpotential eines magnetischen Dipols,
Z
1
1
~ (1) (~x) =
A
d3 x0~j(~x 0 )(~x 0 · ~x) .
(5.52)
4π²0 c2 r3
Um es in etwas freundlicherer Form aufzuschreiben, definieren wir das magnetische Dipolmoment der Stromverteilung als
Z
1
d3 x0 ~x 0 × ~j(~x 0 ) .
(5.53)
m
~ =
2
Mit Hilfe von m
~ finden wir nach einfacher Umformung
~
A
(1)
(~x) = −
1
~x
×m
~ .
2
4π²0 c r3
(5.54)
Die zu (5.54) führende Zwischenrechnung benutzt zunächst eine zu (5.50) ähnliche
Identität,
X
i
∂
(ji xk xi ) = xk xi div ~j + jk xl + jl xk = jk xi + jl xk .
∂xi
(5.55)
Durch Integrieren über den ganzen Raum erhalten wir, falls ~j(~x)r 4 → 0 für
|~x| = r → ∞, die Antisymmetrie der ersten Momente der Stromverteilung
Z
Z
d3 x xl jk (~x) = − d3 x xk jl (~x) .
(5.56)
Nach Ausmultiplizieren des Vektorprodukts in (5.54),
A(1)
x)
x (~
=
=
1
1
(ymz − zmy )
4π²0 c2 r3
½ Z
1
1
−
y d3 x0 [x0 jy (~x 0 ) − y 0 jx (~x 0 )]
8π²0 c2 r3
¾
Z
−z d3 x0 [z 0 jx (~x 0 ) − x0 jz (~x 0 )] ,
−
verwenden wir die Antisymmetrie (5.56) und erhalten
A(1)
x (x)
1
1
=−
4π²0 c2 r3
µ Z
¶
Z
3 0 0
0
3 0 0
0
y d x y jx (~x ) + z d x z jx (~x ) .
Dazu
R darf rechts, wieder wegen der Antisymmetrie (5.56) ungestraft
x d3 x0 x0 jx (~x 0 ) zugefügt werden, woraufhin (5.52) entsteht.
Aus (5.54) folgt, dass die Feldlinien des Vektorpotentials, das von einem
magnetischen Dipol erzeugt wird, in Kreisen um die Dipolachse verlaufen (vgl.
110
5 Statische Magnetfelder
Abbildung 5.8
Abbildung 5.8).
~ = rot A
~ zu
Das magnetische Feld erhalten wir aus B
~ =−
B
1
grad
4π²0 c2
µ
m
~ · ~x
r3
¶
.
(5.57)
Die zu (5.57) führende Rechnung ist leicht:
·
´
´¸
∂Az ∂Ay
∂ ³z
1
y
x
∂ ³x
Bx =
−
=
my − 3 mx +
mx − 3 mz
.
−
∂y
∂z
4π²0 c2
∂y r3
r
∂z r3
r
Hier verwenden wir
1
Bx =
4π²0 c2
·
∂
∂x
1
r
=−
x
r3
und schreiben
∂2 1
∂2 1
my
+ mz
− mx
∂x ∂y r
∂x ∂z r
Beachten wir noch ∆
1
∂
Bx =
4π²0 c2 ∂x
=
µ
1
r
µ
∂2
∂2
+
∂y 2
∂z 2
¶
1
r
¸
.
= 0 für r 6= 0, so erhalten wir
∂
∂
∂
mx
+ my
+ mz
∂x
∂y
∂z
¶
1
1
∂
=−
r
4π²0 c2 ∂x
µ
m
~ · ~x
r3
¶
,
und das ist (5.57).
Nun erinnern wir uns an das elektrische Feld eines elektrischen Dipols,
~ = − 1 grad
E
4π²0
Ã
~x · d~
r3
!
(5.58)
und freuen uns darüber, dass die Felder des elektrischen und des magnetischen
Dipols dieselbe Struktur haben.
5.8 Magnetisches Moment und Drehimpuls
5.8
111
Magnetisches Moment und Drehimpuls
Für eine Stromdichte, die von einem Haufen geladener punktförmiger Teilchen
getragen wird, gilt
X
~j(~x) =
qν ~vν δ(~x − ~xν ) .
(5.59)
ν
Dabei nummeriert der Index ν die Teilchen. Das magnetische Moment der
Stromverteilung lautet
Z
X1
1
m
~ =
d3 x~x × ~j(~x) =
qν ~xν × ~vν .
(5.60)
2
2
ν
Tragen die Teilchen die Masse Mν , so hat das ν-te Teilchen den Drehimpuls
~ ν = Mν ~xν × ~vν ,
L
(5.61)
so dass wir das magnetische Moment (5.60) auch durch die Drehimpulse der
Teilchen ausdrücken können,
X qν
~ν .
L
(5.62)
m
~ =
2Mν
ν
Unsere besondere Aufmerksamkeit verdient der Spezialfall, in dem die Teilchen alle identisch (qν = q, Mν = M ) sind, denn dann ist das magnetische
Moment proportional zum Gesamtdrehimpuls
X
~ =
~ν ,
L
L
(5.63)
ν
nämlich
q ~
L.
(5.64)
2M
Dieses Resultat der klassischen Physik wird uns später auch in der Quan~ der so genannte Bahndrehimpuls ist.
tenmechanik wieder begegnen, wobei L
Für das den Elektronenspin begleitende magnetische Moment gilt, wie Ihnen
schon aus der Elementarphysik bekannt ist, der Zusammenhang (5.64) nicht.
~ als der Drehimpuls des Spins genommen wird,
Vielmehr tritt rechts, wenn L
der Faktor
m
~ =
g = 2, 00232
(5.65)
hinzu. Wir kommen hierauf in 16. zurück.
5.9
~ x)
Kraft und Drehmoment eines Feldes B(~
auf einen magnetischen Dipol
~ x) erfährt,
Die Kraft, die eine Stromverteilung ~j(~x) im eingeprägten Feld B(~
kennen wir schon als
Z
~
~ x) .
F = d3 x~j(~x) × B(~
(5.66)
112
5 Statische Magnetfelder
~ sich über die Stromverteilung hinweg nur wenig ändert,
Wenn das äußere Feld B
lässt sich die Kraft (5.66) durch das magnetische Moment der Verteilung ausdrücken als
~ ,
F~ = grad(m
~ · B)
(5.67)
~ am Ort des magnetischen Moments bzw. am Schwerpunkt der Stromwobei B
verteilung zu denken ist. Die Kraft F~ verschwindet nur dann nicht, wenn das
magnetische Feld räumlich inhomogen ist und insbesondere am Ort des Moments nichtverschwindende erste Ableitungen hat. Die Kraft wirkt in diejenige
~ parallel zu m
Richtung, in der die Komponente von B
~ am stärksten wächst.
Die von allgemeinem Ausdruck (5.66) für die Lorentzkraft zu (5.67) führende
Rechnung geht aus von der Taylorreihe für die Komponenten Bi des Magnetfeldes um den Mittelpunkt der Stromverteilung, der auch als Ursprung des Koordinatensystems gewählt wird.
Bi (~x) = Bi (0) +
X ∂Bi (0)
xj + . . . .
∂xj
j
(5.68)
Das Glied 0-ter Ordnung in (5.68) gibt keinen Beitrag zur Kraft in (5.66), da
das Raumintegral über ~j(~x) verschwindet, s. (5.51). Das Glied erster Ordnung
liefert
¸
Z
Z
3 ·
X
∂Bz (0)
∂By (0)
3
3
Fx =
d xxi jy (~x) −
d xxi jz (~x) .
∂xi
∂xi
i=1
Unter Benutzung der Antisymmetrie (5.56) der ersten Momente der Stromverteilung können wir dies umschreiben in die Form
∂Bz
Fx =
∂x
Z
∂By
d xxjy +
∂x
3
Z
3
d xzjx −
µ
∂Bz
∂By
+
∂z
∂y
¶Z
d3 xyjz .
Die hier vorkommenden Momente der Stromverteilung sind gerade die Komponenten des magnetischen Dipolmoments, z. B.
Z
Z
1
mx =
d3 x(yjz − zjy ) = d3 x y jz .
2
Beachten wir
´ die Quellenfreiheit des Magnetfeldes,
³ schließlich
∂By
∂Bx
∂Bz
=
−
+
∂x
∂y
∂z , so entsteht genau das Resultat (5.67).
~ auf den Dipol das
Ganz analog lässt sich zeigen, dass das äußere Feld B
Drehmoment
~ =m
~
M
~ ×B
ausübt.
äußeren
stellung
anderen
(5.69)
Dieses Moment verschwindet bei Parallelstellung des Moments zum
Feld. Sie kennen die zu (5.69) äquivalente Aussage, dass die Paralleldes Moments zum äußeren Feld energetisch begünstigt ist gegenüber
Orientierungen (s. a. 4.107).
Kapitel 6
Das elektromagnetische
Feld
6.1
Faradays Induktionsexperiment
Beim Spielen mit Stromkreisen und Magneten überzeugt man sich leicht von
der Richtigkeit der folgenden von Faraday gewonnenen Feststellung. In einem
Stromkreis wird ein zeitlich vorübergehender Strom induziert, wenn
a) in einem benachbarten Stromkreis ein Strom ein- oder ausgeschaltet wird,
b) ein benachbarter Kreis, in dem ein konstanter Strom aufrechterhalten
wird, relativ zum ersten Kreis bewegt wird,
c) in der Nähe des Kreises ein Permanentmagnet bewegt wird.
Faraday interpretierte diese seine Beobachtung mit Hilfe der Flussregel, die
oft auch
R Faradays Induktionsgesetz genannt wird. Wenn sich der magnetische
~ ·B
~ durch eine vom Stromkreis aufgespannte Fläche F zeitlich ändert,
Fluss F df
~ induziert. Die Flussregel verknüpft
so wird im Stromkreis ein elektrisches Feld E
H
~ des induzierten
~ · dl
den magnetischen Fluss durch F mit dem Linienintegral E
elektrischen Feldes längs des Stromkreises,
Z
I
∂
~ ·B
~
~ .
~
df
(6.1)
dl · E = −
∂t
H
~ E
~ die Zirkulation von E
~ längs des StromWir nennen das Linienintegral dl·
kreises oder Ringspannung oder manchmal elektromotorische Kraft. Letzterer
Name macht besonders sinnfällig, dass als Folge der Induktion im Stromkreis
ein Strom in Gang gesetzt wird.
Sie wissen sicher aus der Experimentalphysik, dass auf der Flussregel (6.1)
die Wirkungsweise von Elektromotoren, Transformatoren, Generatoren, Ampèremeter etc. beruht. Nicht gegenwärtig ist Ihnen vielleicht, dass die Faradaysche
Flussregel eines der merkwürdigsten Gesetze der Physik überhaupt ist. In ihr
kommen nämlich zwei unabhängige Sachverhalte zu gleich lautendem Ausdruck.
Der Fluss des Magnetfeldes durch die vom Stromkreis aufgespannte Fläche kann
auf zwei völlig verschiedene Weisen zeitlich geändert werden:
113
114
6 Das elektromagnetische Feld
~ den Ort oder die Gestalt
1. Einmal, indem man im zeitunabhängigen Feld B
des Kreises variiert. In diesem Fall ist die Flussregel, wie gleich gezeigt
wird, eine Folge der Lorentzkraft auf bewegte Ladungen.
2. Zum anderen, indem man bei räumlich fixiertem und starrem Kreis die
~ zeitlich ändert. In diesem Fall werden wir die
magnetische Feldstärke B
~
Flussregel erkennen als die Aussage, dass bei zeitlicher Änderung von B
Wirbel des elektrischen Feldes entstehen.
Zur Diskussion des Falles (1) betrachten wir einen ebenen Stromkreis, der
aus einem starren U -förmigen Leiterstück und einem Querstück besteht Abbildung (6.1). Letzteres liege senkrecht auf den Schenkeln des U und werde mit
gleichförmiger Geschwindigkeit v auf den Schenkeln des U bewegt. Senkrecht
~ Der magnetizur Ebene dieses Stromkreises liege ein homogenes Magnetfeld B.
sche Fluss durch den Kreis ist BaL(t), seine zeitlich Änderungsrate Bav. Gemäß
H
~ = − vBa
~ · dl
der Flussregel wird also im Kreis die elektromotorische Kraft E
induziert. Dieses Resultate erhalten wir, indem wir die Lorentzkraft auf die
~
Ladungsträger im Kreis betrachten. Die Kraft auf die Einheitsladung ist ~v × B.
Die Ladungen im U sind unbewegt, erfahren also keine Kraft. Die Ladungen
im Querbalken bewegen sich mit diesem also mit der Geschwindigkeit v, und
erfahren daher pro Ladungseinheit die Kraft vB in RichtungRdes Querbalkens.
~ hat den
~ · dl,
Das Linienintegral dieser Kraft, die elektromotorische Kraft E
Betrag vBa,Rwas genau der von der Flussregel angegebene Wert ist. Das Vor~ ergibt sich auch richtig, wenn die Richtung aller beteiligten
~ · dl
zeichen von E
Vektoren in Rechnung gestellt wird. Somit haben wir die Flussregel für den
Fall (1) als Konsequenz der Lorentzkraft auf bewegte Ladungen im Magnetfeld
verstanden.
Abbildung 6.1
~ lautet die FlussIm Fall (2), bei starrem Leiter im zeitlich variablen Feld B,
regel
I
Z
Z
∂
~
~
~ · ∂ B
~
~
~ ,
E · dl = −
df × B = − df
(6.2)
∂t
∂t
F
F
denn bei starrem Kreis kann die Zeitableitung unter das Integral gezogen werden. Mit Hilfe des Stokesschen Satzes der Vektoranalysis können wir die Zir-
6.2 Der Maxwellsche Verschiebungsstrom
115
~ längs des Kreises als Fluss von rot E
~ durch eine beliebige vom
kulation von E
Kreis berandete Fläche schreiben. Dann lautet die Flussregel
Z
Z
~
~ · ∂ B
~ .
~
(6.3)
df · rot E = − df
∂t
r
F
Da die Fläche F beliebig ist, muss auch gelten
~ .
~ =− ∂ B
(6.4)
rot E
∂t
Diese lokale Formulierung der Flussregel, die von Maxwell stammt, nimmt
keinen Bezug mehr auf den Stromkreis. Sie besagt, dass die zeitliche Änderungsrate
~ lokale Wirbel des elektrischen Feldes E
~ erzeugt.
des magnetischen Feldes B
∂ ~
Bei statischen Verhältnissen verschwindet natürlich ∂t
B, und die Maxwell’sche
Gleichung (6.4) reduziert sich auf die Feststellung, dass das elektrostatische Feld
wirbelfrei ist.
6.2
Der Maxwellsche Verschiebungsstrom
Einen wichtigen Beitrag Maxwells zur Theorie der elektromagnetischen Felder,
die lokale Formulierung der Flussregel, haben wir eben kennengelernt. Hier wird
ein zweiter Beitrag besprochen.
Maxwell betrachtete das Grundgesetz der Magnetostatik, welches die Zirku~ längs einer Kurve K mit dem elektrischen Strom durch eine von
lation von B
K berandete Fläche F verknüpft, schrieb es in lokaler Form auf,
~ =
rot B
1 ~
j
²0 c2
(6.5)
und wunderte sich. Aus (6.5) folgt doch zwingend, dass die elektrische Strom~ gilt identisch div rot B
~ = 0. Das
dichte quellenfrei ist, denn bei beliebigem B
aber heißt, dass aus dem durch eine beliebige
Fläche
F
umschlossenen
Volumen
R
H
~ · ~j. In der Tat,
keine Ladung herausfließen kann, wegen d3 x div ~j = df
stationäre Verhältnisse können nur herrschen, wenn durch F pro Zeiteinheit
genauso viel Ladung hinein- wie herausfließt.
In zeitabhängigen Situationen ist die Erfahrungstatsache der Ladungserhaltung allgemeiner zu formulieren. Der Nettostrom durch eine beliebige geschlossene Fläche F muss gleich der zeitlichen Änderungsrate der Ladung im von F
umschlossenen Volumen V sein
Z
I
~ · ~j = − d
d3 xρ .
(6.6)
df
dt
F
V
Mit Hilfe des Gaußschen Satzes der Vektoranalysis kann der Ladungserhaltungssatz (6.6) als
µ
¶
Z
∂
d3 x div~j +
ρ =0
(6.7)
∂t
V
geschrieben werden. Er muss dann auch lokal gelten, da das Volumen V beliebig
ist,
116
6 Das elektromagnetische Feld
∂
div~j +
ρ=0.
∂t
(6.8)
~ = 1 2 ~j verallgemeinerungsbedürftig ist,
Maxwell sah, dass das Gesetz rotB
²0 c
wenn zeitabhängige Ladungs- und Stromverteilungen zu beschreiben sind. Hier
ist die von Maxwell vorgeschlagene Verallgemeinerung, die sich aufs Schönste
bewährt hat,
~ =−
rot B
1 ∂ ~
1 ~
j+ 2
E.
2
²0 c
c ∂t
(6.9)
~ wird die zeitliche Änderungsrate des elekAls Beitrag zur Wirbelstärke von B
trischen Feldes postuliert.
Wir sehen sofort, dass die Maxwellsche Gleichung (6.9) den bekannten statischen Grenzfall enthält. Um zu sehen, dass auch der lokale Ladungserhaltungssatz (6.8) befriedigt ist, nehmen wir die Quellstärke beider Seiten in (6.9),
~ =0=
div rot B
1 ∂
1
~ .
div ~j + 2
div E
²0 c2
c ∂t
(6.10)
Dies ist genau dann der Erhaltungssatz (6.8), wenn wie schon in der Elektrostatik die elektrischen Ladungen als Quellen des elektrischen Feldes auftreten,
~ = ρ/²0 .
div E
(6.11)
Den Maxwellschen Zusatzterm zum Strom in (6.9) bezeichnen wir als den
Maxwellschen Verschiebungsstrom.
6.3
Die Maxwellschen Gleichungen
Die Maxwellschen Gleichungen für beliebig orts- und zeitabhängige Situationen
haben wir inzwischen alle kennengelernt. Fassen wir sie noch einmal zusammen.
Die Quellen des elektrischen Feldes sind Ladungen,
~ = ρ/²0 .
div E
(6.12)
Die Wirbel des elektrischen Feldes sind nach der Flussregel durch die zeitliche
Änderungsrate des Magnetfeldes gegeben,
~ =− ∂ B
~ .
rot E
∂t
Das magnetische Feld hat keine Quellen,
~ =0.
div B
(6.13)
(6.14)
Die Summe aus elektrischem Strom und Verschiebungsstrom gibt die Wirbel
des magnetischen Feldes
~ =
rot B
1 ∂ ~
1 ~
j+ 2
E.
²0 c2
c ∂t
(6.15)
Die Feldgleichungen (6.12 bis 6.15) implizieren die lokale Ladungserhaltung,
6.4 Der Energieerhaltungssatz
117
∂
ρ=0.
(6.16)
div~j +
∂t
Sie implizieren nicht, sondern sind zu ergänzen durch einen Ausdruck für die
Kraft, die eine Punktladung im Feld erfährt, die Lorentzkraft
~ + ~v × B)
~ .
F~ = q(E
(6.17)
Die lokalen Maxwellschen Gleichungen (6.12 bis 6.15) verknüpfen die ersten
~ und B
~ an einem Raum-Zeit-Punkt. Als zu ihnen
Ableitungen der Felder E
äquivalent hatten wir integrale Aussagen über das Verhalten des elektromagnetischen Feldes in endlichen Raumbereichen erkannt, die wir im Folgenden
auch nochmals zusammenstellen. Die Übersetzung zwischen den lokalen und
den integralen Versionen der Maxwellschen Gleichungen erfolgt mit Hilfe des
Gaußschen und des Stokesschen Satzes der Vektoranalysis.
Der Fluss des elektrischen Feldes durch eine geschlossene Fläche ist gleich
dem ²10 -fachen der umschlossenen Ladung Q,
I
~ ·E
~ = Q/²0 .
df
(6.18)
Die Zirkulation des elektrischen Feldes längs einer geschlossenen Kurve K ist
gleich der negativen zeitlichen Änderungsrate des magnetischen Flusses durch
eine beliebige von K berandete Fläche F ,
I
Z
~ ·E
~ ·B
~ =− ∂
~ .
dl
df
(6.19)
∂t
K
F
Der Fluss des magnetischen Feldes durch jede geschlossene Fläche verschwindet,
I
~ ·B
~ =0.
df
(6.20)
Die Zirkulation des magnetischen Feldes längs des Randes einer Fläche setzt
sich aus dem elektrischen Strom und dem Verschiebungsstrom (der zeitlichen
~ durch die Fläche zusammen als
Änderungsrate des Flusses von E)
Z
Z
I
~ · ~j + 1 ∂
~ ·E
~ ·B
~ .
~ = 1
df
df
(6.21)
dl
²0 c2
c2 ∂t
6.4
Der Energieerhaltungssatz
Die Erfahrungstatsache der Ladungserhaltung hatten wir lokal formuliert mit
Hilfe der Begriffe Ladungsdichte und (Ladungs-)Stromdichte,
∂
ρ(~x, t) + div ~j(~x, t) = 0 .
(6.22)
∂t
Auch für die Energie gilt bekanntlich ein Erhaltungssatz. Bei naivem Vorgehen könnte man die Erwartung hegen, dass sich für das elektromagnetische
Feld (wie schon für das elektrostatische Feld in (4.10) eine Energiedichte u(~x, t)
~ x, t), derart, dass ein
definieren lässt und zusätzlich eine Energiestromdichte S(~
Erhaltungssatz gleicher Form wie der obige für die Ladung gilt. Wir überzeugen
118
6 Das elektromagnetische Feld
uns jedoch leicht davon, dass sich der Energieinhalt des elektromagnetischen Feldes innerhalb eines kleinen Volumens d3 x nicht nur dadurch ändern kann, dass
Energie durch die Oberfläche strömt; dass vielmehr das Feld die innerhalb des
betrachteten Volumens vorhandenen Ladungen beschleunigen und somit Energie
an die Materie abgeben kann. Letztere Arbeitsleistung muss selbstverständlich
in die lokale Energiebilanz einbezogen werden.
Die im Volumenelement d3 x pro Zeiteinheit an den Ladungen geleistete Arbeit finden wir mit Hilfe der Lorentzkraft
~ + ~v × B)
~ .
F~ = d3 xρ(E
(6.23)
Im Zeitintervall dt ändern die Ladungen ihren Ort um das Wegstück ~dt~v ,
wobei die Kraft (6.23) die Arbeit
~ = dtd3 x~j · E
~
dtd3 xρ~v · E
(6.24)
verrichtet. Um diesen Betrag würde sich die Feldenergie ud3 x vermindern,
selbst wenn kein Abströmen durch die Oberfläche des betrachteten Volumens
~ stattfände. Vernünftigerweise können wir demnach als lokale
um dtd3 x div S
Energiebilanz ein Gesetz der Form
∂
~ = − ~j · E
~
u + div S
∂t
(6.25)
erwarten.
Tatsächlich beinhalten die Maxwellschen Gleichungen einen Energieerhaltungssatz der Form (6.25), wobei als Energiedichte
1
~ 2 + ² 0 c2 B
~ 2)
(²0 E
2
und als Energiestromdichte das Vektorfeld
u(~x, t) =
~ x, t) = ²0 c2 E
~ × B
~
S(~
(6.26)
(6.27)
fungieren. Die folgende kleine Rechnung dient dazu, die Aussagen (6.25, 6.26,
6.27) zu gewinnen.
Multiplizieren wir beide Seiten der Maxwellschen Gleichung für die Wirbel
des Magnetfeldes,
~ =
rotB
1 ∂ ~
1 ~
j + 2
E,
²0 c2
c ∂t
(6.28)
~ und beide Seiten der Flussregel
skalar mit dem elektrischen Feld E
~ =−
rotE
∂ ~
B
∂t
(6.29)
~ Subtraktion der entstehenden beiden Skalare gibt
skalar mit B.
~ · rotB
~ − B
~ · rotE
~ =
E
1 ~
~ + ∂ 1 (²0 E
~ 2 + ² 0 c2 B
~ 2) .
j · E
2
²0 c
∂t 2
Benutzen wir auf der linken Seite von Gleichung (6.30) die Identität
(6.30)
6.5 Die Wellengleichung für die Potentiale
~ × B)
~ =−E
~ · rotB
~ + B
~ · rotE
~ ,
div(E
119
(6.31)
so entsteht aus (6.30) gerade der Energieerhaltungssatz (6.25) mit der Energiedichte gemäß (6.26) und der Energiestromdichte gemäß (6.27).
~ heißt auch Poynting-Vektor, denn J. H. Poynting
Die Energiestromdichte S
hat 1884 als erster den Energiesatz für elektromagnetische Feldenergie in lokaler
~ ohne Schaden für die
Form aufgeschrieben. Beachten Sie übrigens, dass sich S
~ abändern lässt, da die
Energiebilanz (6.25) um ein beliebiges Wirbelfeld rotV
~ = ² 0 c2 E
~ × P~ und S
~ 0=S
~ + rotV
~ dieselben Quellen haben.
Felder S
6.5
Die Wellengleichung für die Potentiale
Hinter der scheinbaren Kompliziertheit der Maxwellschen Gleichungen verbirgt
sich eine verblüffende Einfachheit aller elektromagnetischen Phänomene. Um
sie zu durchschauen, schlachten wir unsere Erfahrung mit den statischen Spezialfällen aus.
Die Nichtexistenz magnetischer Monopole, divB = 0, haben wir schon früher
~ x, t) gemäß
als durch den Ansatz eines Vektorpotentials A(~
~ = rotA
~
B
(6.32)
zu befriedigen gelernt. Die nächsteinfache unter den Maxwellschen Gleichungen,
da ebenfalls weder Ladungs- noch Stromdichte enthaltend, ist Faradays Fluss∂ ~
~
~
regel,
³ rotE = −
´ ∂t B. Sie lässt mit Hilfe des Ansatzes (6.32) für B schreiben als
∂
~+
~ = 0. Wir wissen schon, dass sich ein wirbelfreies Vektorfeld als
rot E
A
∂t
Gradient eines skalaren Feldes darstellen lässt. Also können wir die Flussregel
erfüllen durch den Ansatz eines skalaren Potentials ϕ(~x, t) gemäß
~ − grad ϕ .
~ =− ∂ A
(6.33)
E
∂t
Mit den Ansätzen (6.32) und (6.33) gehen wir nun in die restlichen Maxwellschen Gleichungen ein. Aus dem Gesetz über die Quellen des elektrischen
~ = ρ/²0 , wird mit Hilfe von (6.33)
Feldes, div E
∂
~ = ρ/²0
div A
(6.34)
∂t
~ =
und aus dem Ampereschen Gesetz über die Wirbel des Magnetfeldes, rotB
1 ~
1 ∂ ~
j
+
E,
wird
² 0 c2
c2 ∂t
−∆ϕ −
1 ~
1 ∂2 ~
1 ∂
j − 2
A − 2
grad ϕ
2
²0 c
c ∂t2
c ∂t
bzw. mit der schon früher bewiesenen Identität rot rot = grad div − ∆
~=
rot rotA
¶
µ
1 ~
1 ∂2
1 ∂2 ~
~
~
ϕ .
A=−
j + grad divA + 2
∆A − 2
c ∂t2
²0 c2
c ∂t
(6.35)
~ und ϕ
Die Bestimmungsgleichungen (6.34) und (6.35) für die Potentiale A
ersetzen uns die Maxwellschen Gleichungen. Noch ist die angekündigte verblüffende Einfachheit der elektro-magnetischen Phänomene nicht sichtbar.
120
6 Das elektromagnetische Feld
Erinnern wir uns daran, dass die Ansätze (6.32) und (6.33) die Potentiale
~
~ ϕ zu neuen
A und ϕ nicht eindeutig festlegen. In der Tat, wenn wir von A,
0
0
~
Potentialen A , ϕ übergehen mit Hilfe einer Transformation
~
A
0
ϕ0
~ + gradΛ
= A
= ϕ−
∂
Λ,
∂t
(6.36)
wobei das skalare Feld Λ ganz beliebig sein darf, so ändern sich die Felder
~ und B
~ gar nicht. Die Transformation (6.36) heißt Eichtransformation, die
E
~ und B
~ unter Eichtransformationen heißt Eichinvarianz.
Invarianz der Felder E
~ und ϕ, indem
Wir nutzen die somit klar gestellte Freiheit in der Wahl von A
wir fordern
~ +
divA
1 ∂
ϕ=0.
c2 ∂t
(6.37)
~=0
In der Magnetostatik hatten wir die so genannte Coulombeichung divA
verwendet. Das könnten wir hier zwar auch tun, jedoch ist die so genannte
Lorentzeichung (6.37) bei zeitabhängigen Verhältnissen wesentlich bequemer.
Die Bequemlichkeit besteht darin, dass mit Hilfe von (6.37) aus den Bestimmungsgleichungen (6.34) und (6.35) einfachere Gleichungen entstehen, nämlich
~ −
∆A
1 ∂2 ~
A
c2 ∂t2
=
−
∆ϕ −
1 ∂2
ϕ
c2 ∂t2
=
− ρ/²0 .
1 ~
j
²0 c2
(6.38)
Welche verblüffende Einfachheit der elektromagnetischen Phänomene wird
sichtbar? Bei vorgegebenen Ladungs- und Stromverteilungen gehorchen die vier
~ und ϕ ungekoppelten inhomogenen Wellengleichungen. BewegPotentiale A
te Ladungen erzeugen elektromagnetische Wellen. Elektromagnetische Wellen
breiten sich mit der Geschwindigkeit c aus, also mit Lichtgeschwindigkeit.
Die eben formulierten Erkenntnisse sind uns in den Schoß gefallen, nachdem
die Lorentzeichung (6.37) eingeführt war. Zur Absicherung sollte noch klar
gemacht werden, dass die Lorentzeichung ohne Beschränkung der Allgemeinheit
immer gewählt werden kann. Dies Ihnen zur Übung, wobei Ihnen unsere frühere
Ausschlachtung der Eichinvarianz der Magnetostatik als Anleitung dienen kann.
6.6
Ebene elektromagnetische Wellen im freien
Raum
Um zu lernen, wie der schon anschaulich geschilderte Inhalt der Maxwellschen
Gleichungen auch quantitativ erschlossen werden kann, betrachten wir zunächst
Raumgebiete, die frei von Ladungen sind, so dass ρ = ji = 0. Dort gelten für
die Potentiale die homogenen Wellengleichungen
6.6 Ebene elektromagnetische Wellen im freien Raum
¶
1 ∂2 ~
A = 0
∆ − 2
c ∂t2
µ
¶
1 ∂2
∆ − 2
ϕ = 0.
c ∂t2
121
µ
(6.39)
~ und B
~ selbst
Durch bloßes Differenzieren finden wir, dass hier auch die Felder E
Komponente für Komponente diesen Gleichungen gehorchen,
µ
µ
1 ∂2
∆ − 2
c ∂t2
1 ∂2
∆ − 2
c ∂t2
¶
¶
~
E
=
0
~
B
=
0.
(6.40)
Ganz offensichtlich können wir nach Lösungen suchen, die nicht von allen drei
Raumkoordinaten x, y, und z, sondern nur von einer, etwa x, abhängen. Solche
~
~
Felder E(x,
t) und B(x,
t) beschreiben eine ebene elektromagnetische Welle. Für
sie lautet der Prototyp der Wellengleichung
µ
1 ∂2
∂2
− 2
2
∂x
c ∂t2
¶
f (x, t) = 0 .
(6.41)
Um sie zu lösen, schreiben wir sie in der Form
µ
∂
1 ∂
−
∂x
c ∂t
¶µ
∂
1 ∂
+
∂x
c ∂t
¶
f (x, t) = 0
(6.42)
und führen statt x und t die neuen Veränderlichen
ξ = x − ct,
η = x + ct
(6.43)
ein. Die Wellengleichung lautet dann
∂2f
=0.
∂ξ∂η
(6.44)
Jetzt drängt sich als allgemeine Lösung auf
f (ξ, η) = f1 (ξ) + f2 (η) ,
(6.45)
wobei f1 und f2 ganz beliebige (differenzierbare) Funktionen sind. In den physikalischen Koordinaten finden wir aus (6.45)
f (x, t) = f1 (x − ct) + f2 (x + ct) .
(6.46)
Wir sehen, dass f1 und f2 entlang der x-Achse nach rechts bzw. nach links
laufende Wellen darstellen.
Die Potentiale für eine beliebige in die positive x-Richtung laufende ebene
elektromagnetische Welle lauten
122
6 Das elektromagnetische Feld
Ai (x, t)
=
ϕ(x, t)
=
Ai (x − ct)
=
ϕ(x − ct)
=
Ai (ξ)
(6.47)
ϕ(ξ) .
Die vier Funktionen Ai , ϕ werden durch die Lorentzkonvention dem Zusammenhang
∂Ax
1 ∂ϕ
∂
∂ 1
+ 2
=
Ax −
ϕ=0.
∂x
c ∂t
∂ξ
∂ξ c
(6.48)
unterworfen. Als ein Integral von (6.48) wählen wir
Ax =
1
ϕ.
c
(6.49)
~ und B
~ in der betrachteten Welle durch DiffeNun finden wir die Felder E
renzieren
Ex (x − ct)
=
x
− ∂A
∂t −
Ey (x − ct)
=
−
Ez (x − ct)
∂ϕ
∂x
∂Ay
∂t
z
− ∂A
∂t
=
=
0
=
cA0y
=
cA0z ,
wobei Ableitungen nach ξ mit einem Strich bezeichnet sind. Auf ähnliche Weise
~ = rot A.
~ Insgesamt haben wir
gewinnen wir das Magnetfeld mit Hilfe von B
~
E
=
c(0, A0y , A0z )
~
B
=
(0, −A0z , A0y ) .
(6.50)
~ und B
~ der ebenen elektromagnetischen Welle
Wir lesen ab, dass die Felder E
überall aufeinander orthogonal sind,
~ ·B
~ =0,
E
(6.51)
und überdies beide senkrecht zur Ausbreitungsrichtung, hier der x-Richtung
stehen. Daher heißen elektromagnetische Wellen im freien Raum auch transver~ B
~ und der
sale Wellen. Besonders einprägsam wird die Dreibeinigkeit von E,
Ausbreitungsrichtung durch die Kompaktfassung von (6.50)
~
B
=
~
E
=
~
+ k̂ × A
0
~ = − ck̂ × (k̂ × A
~0) ,
− ck̂ × B
(6.52)
wobei k̂ der Einheitsvektor in Ausbreitungsrichtung ist. Offenbar muss zur
~ und B
~ der ebenen Welle nur das Vektorpotential
Bestimmung der Felder E
~ und B
~ in der
bekannt sein. Schließlich ist aus (6.52) offensichtlich, dass E
ebenen Welle bis auf den Faktor c gleiche Beträge haben,
~ = c|B|
~ .
|E|
(6.53)
6.7 Die retardierten Potentiale
123
~ finden wir die nützlichen
Für die Energiedichte u und die Energiestromdichte S
Relationen
u =
²0 ~ 2
~ 2 ) = ²0 E 2
(E + c 2 B
2
~
S
~ ×B
~
² 0 c2 E
=
= ² 0 c2 B 2
= ²0 cE 2 k̂ = cuk̂ .
(6.54)
(6.55)
Hieraus ist ersichtlich, dass der Energiestrom mit Lichtgeschwindigkeit fließt.
Ein wichtiger Spezialfall ebener Wellen ist gegeben, wenn die Felder zeitlich
periodisch und darüber hinaus monochromatisch sind. Solche monochromatischen ebenen Wellen werden wir hier in der Form
~ = Re[A
~ 0 e−iω(t−x/c) ]
A
(6.56)
darstellen. Die Größe ω ist dabei die Kreisfrequenz der Welle. Die zugehörige
Wellenlänge ist
λ = 2πc/ω .
(6.57)
Wir werden ebene monochromatische Lichtwellen oft durch ihren Wellenvektor
ω
k̂
(6.58)
c
charakterisieren; dieser zeigt in die Ausbreitungsrichtung der Welle und gibt mit
seinem Betrag die Frequenz. Mit Hilfe des Wellenvektors können wir (6.56) in
einer vom Koordinatensystem unabhängigen Form schreiben
k̂ =
~ = Re [A
~ 0 ei(~k~x−ωt) ] .
A
(6.59)
Für den Fall der monochromatischen ebenen Wellen wird aus (6.52)
~
B
~
E
~
= Re (+i ~k × A)
¶
µ
c2 ~ ~
k×B .
=
−
ω
(6.60)
Die Energiedichte der betrachteten Welle ist im Mittel über eine zeitliche Periode
~ 6= 0), jedoch transportiert
räumlich konstant. Zwar ist der Poynting-Vektor S
die monochromatische Welle keine Energie von Ort zu Ort. Dies nachzuweisen,
bleibt Ihnen als kleiner Spaß.
6.7
Die retardierten Potentiale
Wir suchen nun das elektromagnetische Feld, das von vorgegebenen Ladungshaufen ρ(~x, t) und Stromverteilungen ~j(~x, t) abgestrahlt wird. Dazu haben wir
~ und ϕ
die inhomogenen Wellengleichungen für die Potentiale A
µ
∆−
µ
1 ∂2
c2 ∂t2
1 ∂2
∆− 2
c ∂t2
¶
¶
1 ~
j
²0 c2
~
A
= −
ϕ
= − ρ/²0
(6.61)
124
6 Das elektromagnetische Feld
zu lösen. Nach schon mehrfach bewährtem Muster versuchen wir, ein spezielles
Integral der Gleichung für das skalare Potential ϕ zu konstruieren, indem wir
zunächst das ladungserfüllte Volumen in kleine Stückchen d3 x einteilen, deren
jedes die Punktladung“ ρ(~x, t)d3 x enthält; sodann suchen wir das von einer
”
Punktladung erzeugte Potential und setzen schließlich das Potential des gesamten Ladungshaufens aus den Beiträgen der Stückchen additiv zusammen.
Das Potential einer bei ~x = 0 sitzenden Punktladung finden wir aus
µ
¶
1 ∂2
1
∆− 2
ϕ(~x, t) = −
ρ(~x, t) d3 xδ (3) (~x) .
(6.62)
c ∂t2
²0
Außerhalb des Ursprungs gilt überall δ (3) (~x) = 0, so dass die Wellengleichung
(6.62) homogen wird,
¶
µ
1 ∂2
ϕ=0.
(6.63)
∆− 2
c ∂t2
Das skalare Potential ϕ einer Punktladung sollte kugelsymmetrisch sein, also
nur von r = |~x| abhängen. Auf Funktionen ϕ(r) wirkt der Laplaceoperator wie
2ϕ0 (r)
1 d2
~x 0
rϕ(r) ,
ϕ (r) =
+ ϕ00 (r) =
r
r
r dr2
so dass sich die Wellengleichung (6.63) vereinfacht zu
µ 2
¶
∂
1 ∂2
−
rϕ(r, t) = 0 .
∂r2
c2 ∂t2
∆ϕ(r) = div
(6.64)
Aus dem letzten
³
´ Paragrafen wissen wir schon, dass die Gleichung
∂2
1 ∂2
∂r 2 − c2 ∂t2 f (r, t) = 0 die allgemeine Lösung f (r, t) = f1 (r − ct) + f2 (r + ct)
hat. Für das skalare Potential gilt also
1
1
f1 (r − ct) +
f2 (r + ct) ,
(6.65)
r
r
wobei f1 und f2 wieder ganz beliebige Funktionen sind.
Der erste Term in (6.65) stellt eine vom Ursprung, also von der Punktladung
nach außen laufende Kugelwelle dar, der zweite eine in den Ursprung einlaufende
Kugelwelle. Die Abstrahlung von elektromagnetischen Wellen durch die Punktladung sollte allein durch die auslaufende Lösung beschreibbar sein. Daher
versuchen wir, mit dem Ansatz f2 = 0 auszukommen. Um f1 (r − ct) festzulegen, schauen wir uns das Feld ϕ in unmittelbarer Umgebung des Ursprungs
an.
Beachten wir, dass ϕ(r, t) = f1 (r − ct)/r für r → 0 wie 1/r über alle Grenzen
wächst, wenn f1 (−ct) nur existiert. Es folgt, dass die Ortsableitungen von ϕ
bei Annäherung an den Ursprung schneller wachsen als die Zeitableitungen. In
∂
f1 ,
der Tat, für r → 0 gilt, mit f10 = ∂r
ϕ(r, t) =
∂ϕ
∂ϕ
∼ f1 (−ct)/r 2 ,
∼ f10 (ct)/r .
(6.66)
∂r
∂t
Für hinreichend kleine r können wir also in der Wellengleichung (6.62) die Zeitableitungen gegenüber den Ortsableitungen von ϕ vernachlässigen. Daraufhin
wird die Wellengleichung zur Laplaceschen Differentialgleichung
6.7 Die retardierten Potentiale
125
∆ϕ = − ²10 ρ(0, t)d3 xδ (3) (x). Daher muss die Lösung ϕ(r, t) der Wellengleichung
für r → 0 in das aus der Statik bekannte Coulombpotential übergehen,
ϕ(r, t) =
1
1 1
1
f1 (r − ct) →
f1 (−ct) =
ρ(0, t)d3 x .
r
r
4π²0 r
(6.67)
Damit aber ist die bisher unbekannte Funktion f1 (r − ct) festgelegt und wir
haben als Potential der Punktladung
ϕ(~x, t) =
1 1
ρ(0, t − r/c)d3 x .
4π²0 r
(6.68)
Sitzt die Punktladung nicht am Ursprung des Koordinatensystems sondern
am Ort ~x0 , so lautet das Potential
ϕ(x, t) =
1
1
ρ(~x 0 , t − |~x − ~x 0 |/c)d3 x0
4π²0 |~x − ~x 0 |
(6.69)
Durch Superposition erhalten wir das gesuchte Potential des Ladungshaufens
zu
Z
ρ(~x 0 , t − |~x − ~x 0 |/c)
1
d3 x 0
.
(6.70)
ϕ(~x, t) =
4π²0
|~x − ~x 0 |
Dies ist eine Partikularlösung der Wellengleichung für ϕ. Sie erfüllt die
Randbedingung
ϕ(~x, t) → 0
für
|~x| → ∞ .
(6.71)
Wenn andere Randbedingungen erfüllt werden sollten, so ist zur Partikularlösung
eine entsprechende Lösung der homogenen Wellengleichung hinzuzufügen. Wir
werden uns mit derartigen Problemen hier nicht beschäftigen.
Da die Wellengleichungen für die Komponenten Ai (~x, t) des Vektorpotentials
die gleiche Form haben wie die eben gelöste Wellengleichung für das skalare
Potential, finden wir ohne weitere Rechnung
~ x, t) =
A(~
1
4π²0 c2
Z
d3 x 0
~j(~x 0 , t − |~x − ~x 0 |/c)
.
|~x − ~x 0 |
(6.72)
Die Lösungen (6.70) und (6.72) heißen retardierte Potentiale. Retardiert,
weil sich am Beobachtungsort ~x zur Zeit t die an anderen Orten ~x 0 befindlichen
Ladungen nicht instantan bemerkbar machen. Vielmehr fungieren als Ursa”
chen“ für Wirkungen“ am Ort ~x zur Zeit t die Ladungen bzw. Ströme am Ort
”
~x zur früheren Zeit t0 = t − |~x − ~x 0 |/c. Beachten wir, dass die Zeitspanne
|~x − ~x 0 |/c gerade die Laufzeit eines mit Lichtgeschwindigkeit von ~x 0 nach ~x
laufenden Signals ist. Wir sehen nochmals deutlich, dass elektromagnetische
Wellen sich mit Lichtgeschwindigkeit fortpflanzen.
Würdigen Sie das mit (6.70) und (6.72) Erreichte und die verblüffende Einfachheit der elektromagnetischen Phänomene! Für statische Ladungshaufen
bzw. stationäre Stromverteilung reduzieren sich die retardierten Potentiale auf
die aus der Elektro- bzw. Magnetostatik bekannten Lösungen. Das retardierte
skalare Potential ϕ(~x, t) lässt sich charakterisieren als das mit Laufzeiteffekten
dekorierte Coulombpotential.
126
6 Das elektromagnetische Feld
6.8
Elektrische Dipolstrahlung
Betrachten wir einen Ladungs- und Stromhaufen und berechnen das von ihm
erzeugte elektromagnetische Feld in großen Entfernungen, r = |~x| À a (Abbildung 6.2)
Abbildung 6.2
Innerhalb eines kleinen Raumbereichs um einen weit vom Haufen entfernten
Beobachtungspunkt herum wird das Feld die Form einer ebenen Welle annehmen. Daher muss sich, wie wir oben gesehen hatten, das elektromagnetische
Feld dort allein aus dem Vektorpotential gewinnen lassen mit
∂ ~
1
k̂ ×
A(~x, t)
c
∂t
~ x, t)
B(~
=
−
~ x, t)
E(~
=
~ x, t) ,
− ck̂ × B(~
(6.73)
wobei ~k = ~x/r der Einheitsvektor in Ausbreitungsrichtung ist.
Wir müssen also zur Bestimmung des Feldes nur das Integral
~ x, t)
A(~
Z
=
1
4π²0 c2
≈
1
1
2
4π²0 c r
d3 x 0
Z
~j(~x 0 , t − |~x − ~x 0 |/c)
|~x − ~x 0 |
d3 x0 ~j(~x 0 , t − |~x − ~x 0 |/c)
(6.74)
auswerten. Hier ist schon unter dem Integral 1/|~x −~x 0 | durch 1/r approximiert,
es sind also Korrekturen der relativen Ordnung a/r vernachlässigt. Es liegt
nahe, das Zeitargument des Stromes ebenfalls so zu vereinfachen, d. h.
t − |~x − ~x 0 |/c ≈ t − r/c
(6.75)
zu schreiben. Diese Näherung ist jedoch nicht mir a ¿ r zu rechtfertigen. Die
Zeitabhängigkeit des Stroms muss durchaus nicht so langsam sein, dass ~j sich
in der Zeitspanne
6.8 Elektrische Dipolstrahlung
|~x − ~x 0 |/c − r/c
127
(6.76)
nicht merklich ändert. Vielmehr muss, wenn ω eine für die zeitliche Änderung
des Stromes typische Frequenz ist, der Maximalwert der Zeitspanne (6.76), a/c,
vernachlässigbar klein sein gegenüber der typischen Periode, 1/ω. Äquivalent
dazu ist die Bedingung
a¿λ,
(6.77)
die verlangt, dass die Lineardimensionen des Senders klein sein müssen im Vergleich zur typischen Wellenlänge der Strahlung.
Die beschriebene Näherung heißt elektrische Dipolnäherung“ und gibt für
”
das Vektorpotential den sehr einfachen Ausdruck
Z
1
1
~
A(~x, t) =
d3 x0 ~j(~x 0 , t − r/c) .
(6.78)
4π²0 c2 r
Wir können das verbleibende Integral durch das elektrische Dipolmoment des
Ladungshaufens ausdrücken. Zu diesem Zweck wiederholen wir unter leichter
Verallgemeinerung eine schon in der Magnetostatik gemachte Nebenrechnung
(s. 5.7)
Z
d3 x
P
∂
(ji xl ) = 0
∂xi
i
Z
Z
3
~
=
d x(xl div j + jl ) = d3 x(jl − xl ρ̇)
und sehen, dass das Volumenintegral der Stromdichte über den Ladungshau~ ist.
fen gleich der zeitlichen Änderungsrate des elektrischen Dipolmoments d(t)
Somit wird aus dem Vektorpotential
~ x, t) =
A(~
1
1 ∂ ~
d(t − r/c) .
4π²0 c2 r ∂t
(6.79)
~ und B
~ ergeben sich hieraus durch Differenzieren,
Die Felder E
1
1
~¨ − r/c)
k̂ × d(t
4π²0 c2 cr
~ x, t)
B(~
=
−
~ x, t)
E(~
=
1
1
~¨ − r/c)] ,
k̂ × [k̂ × d(t
2
4π²0 c r
(6.80)
wobei die Zeitableitung mit einem Punkt bezeichnet ist.
Beachtenswert an diesen Feldern ist, dass sie mit r → ∞ wie 1/r abfallen,
langsamer also, als die statischen Felder. Der 1/r-Abfall garantiert, dass durch
jede Kugel um den Dipol ein Energiefluss läuft, der unabhängig ist vom Radius
r. Um das einzusehen, bedenken wir nur, dass die Kugeloberfläche wie r 2 wächst
~ = ² 0 c2 E
~ × B
~ wie 1/r 2 abfällt.
und die Energiestromdichte S
Schauen wir uns die Energiestromdichte genauer an. Da in der ebenen Welle
~ = |B|
~ gilt, haben wir
|E|
128
6 Das elektromagnetische Feld
~ = k̂
S
1
1 ~¨
[d(t − r/c)]2 sin2 Θ ,
(4π)2 ²0 c3 r2
(6.81)
wobei Θ der Winkel zwischen der Beobachtungsrichtung k̂ und dem Dipolmoment ist (s. Abbildung 6.3). Beachten Sie, dass die Abstrahlung von Energie
rotationssymmetrisch um die Achse des Dipols erfolgt; ferner, dass in Richtung
des Dipols gar nicht und quer zum Dipol maximal gestrahlt wird.
Abbildung 6.3
~
Die gesamte pro Sekunde abgestrahlte Energie erhalten wir als Fluss von S
durch eine Kugel um den Dipol als Mittelpunkt. Da das Oberflächenelement
~ = k̂r2 sin ΘdΘdϕ überall parallel zur Ausbreitungsrichtung k̂ ist, erhalten
df
wir sofort
I(t) =
2 ~¨
1
[d(t − r/c)]2 .
4π²0 3c3
(6.82)
Nicht alle Ladungshaufen können Dipolstrahlung aussenden. Wenn z. B.
der Ladungshaufen aus Teilchen aufgebaut ist, die alle das gleiche Verhältnis
von Ladung und Masse haben, so
proportional zum OrtsPist das Dipolmoment
P
e
vektor des Schwerpunktes d~ =
eν ~xν = m
m
~
x
ν ν . Wenn nun auf den
ν
ν
Ladungshaufen keine äußeren Kräfte wirken, so bewegt sich der Schwerpunkt
mit konstanter Geschwindigkeit. Seine Beschleunigung und somit auch die zweite Zeitableitung des elektrischen Dipolmoments verschwinden dann. Derartige
Systeme können zwar auch Energie abstrahlen, jedoch müssen wir, um ihr Strahlungsverhalten zu beschreiben, die Entwicklung von t−|~x −~x 0 |/c| nach Potenzen
von a/c über die nullte Ordnung hinaustreiben. Es ergeben sich dann magnetische Dipolstrahlung, Quadrupolstrahlung etc.
Kapitel 7
Elektromagnetische Felder
in Materie
7.1
Polarisation und Magnetisierung
Beim Eindringen in gasförmige, flüssige oder feste Materie tritt ein elektromagnetisches Feld mit allen das Medium aufbauenden geladenen Teilchen in
Wechselwirkung. Falls im Spektrum des Feldes Wellenlängen bis hinab zu etwa
1 Å (entsprechend Röntgenstrahlung) vorhanden sind, müssen alle Atomkerne
und Elektronen (d. h. sowohl die in Atomen und Molekülen gebundenen wie
die ungebundenen) in der Ladungsdichte ρ(~x, t) und in der Stromdichte ~j(~x, t
berücksichtigt werden.
Wenn jedoch die kürzesten Wellenlängen etwa 1000 Å nicht unterschreiten,
können die elektromagnetischen Wellen die atomare Struktur des Mediums nicht
auflösen. In diesem für Experimente mit ultraviolettem, sichtbarem und infrarotem Licht wichtigen Fall erlauben die mikroskopischen Ausdrücke für Ladungsund Stromdichte
ρ(~x, t)
=
X
ν
~j(~x, t)
=
X
ν
qν δ (3) (~x − ~xν (t))
(7.1)
qν ~x˙ ν (t)δ (3) (~x − ~xν (t))
(7.2)
eine äußerst bequeme Vereinfachung, die ich nun beschreiben will.
Trennen wir zunächst in (7.1) die Beiträge ungebundener Punktladungen,
ρfrei (~x, t) =
frei
X
ν
qν δ (3) (~x − ~xν (t)) ,
(7.3)
von den Beiträgen von Komplexen (Atome, Moleküle oder Elementarzellen in
Kristallen), in denen jeweils mehrere Punktladungen gebunden sind. Bezeichnen wir den Ortsvektor des Schwerpunkts des µ-ten derartigen Komplexes mit
~xµ (t) und die diesbezügliche Auslenkung der i-ten Punktladung qνi innerhalb
des µ-ten Komplexes mit ξ~µi (t), so lautet die von den Komplexen dargestellte
Ladungsdichte
129
130
7 Elektromagnetische Felder in Materie
X X
Komplexe
ρgeb (~x, t) =
µ
i
qµi δ (3) (~x − ~xµ (t) − ξ~µi (t)) .
(7.4)
Um den Einfluss der Anteile (7.3) und (7.4) der mikroskopischen Ladungsdichte
auf eine elektromagnetische Welle der Wellenlänge λ zu untersuchen, müssen
wir gemäß (6.34) die räumlichen Fourierkomponenten
Z
~
ρ(~k, t) = d3 xe−ik·~x ρ(~x, t)
(7.5)
mit Wellenzahlen
|~k| = 2π/λ
(7.6)
betrachten, also im Einzelnen
ρfrei (~k, t) =
frei
X
~
qν e−ik·~xν (t)
(7.7)
ν
und
X X
Komplexe
ρgeb (~k, t) =
µ
~
~
qµi e−ik·(~xµ (t)+ξµi (t) .
(7.8)
i
Die angekündigte Vereinfachung beruht darauf, dass die Lineardimensionen
von Atomen, Molekülen und Elementarzellen in Kristallen die Größenordnung
1 Å haben, d. h. viel kleiner sind als die angenommene Größenordnung der
Wellenlänge λ. In (7.8) dürfen wir daher nach Potenzen von ~k · ξ~µi entwickeln,
X
Komplexe
ρgeb (~k, t) =
e
−i~
k·~
xµ (t)
µ
Ã
X
i
qµi − i~k ·
X
qµi ξµi (t) + . . .
i
!
.
(7.9)
Die beiden ersten Glieder dieser Entwicklung sind durch die Ladung qµ und das
elektrische Dipolmoment d~µ der Komplexe festgelegt. Unter Vernachlässigung
der nachfolgenden Glieder, die offenbar die höheren Multipolmomente der Komplexe enthalten, gewinnen wir für die gesamte Ladungsdichte
X
µ
X
Komplexe
Komplexe
ρ(~k, t) = ρfrei (~k, t) +
~
qµ e−ik·~xµ (t) − i~k ·
~
d~µ(t) e−ik·~xµ (t) .
(7.10)
µ
Hier erscheint ρ(~k, t) als zusammengesetzt aus den Fourierkomponenten einer
vergröberten Ladungsdichte,
X
Komplexe
ρmakr (~k, t) = ρfrei (~k, t) +
µ
und des Vektorfeldes der Polarisationsdichte,
~
qµ e−ik·~xµ (t) ,
(7.11)
7.1 Polarisation und Magnetisierung
X
131
Komplexe
P~ (~k, t) =
~
d~µ (t)eik·~xµ (t) ,
(7.12)
µ
gemäß
ρ(~k, t) = ρmakr (~k, t) − i~k · P̃(~k, t) .
(7.13)
Die gegenüber dem exakten Ausdruck (7.8) erreichte Vereinfachung besteht darin, dass (i) in ρmakr jeder Komplex aneinander gebundener Ladungen selbst als
eine strukturlose Punktladung erscheint und (ii) die innere Struktur eines Komplexes nur über das Dipolmoment d~µ (t) in die Polarisationsdichte eingeht. Zu
betonen ist, dass die Näherung (7.13) sinnlos wird für Wellenlängen, die nicht
sehr groß sind im Vergleich zur Lineardimension der Komplexe.
Eine völlig entsprechende Vereinfachung erhalten wir für die Stromdichte
(7.2). Die ~k-te Fourierkomponente des Anteils der in Komplexen gebundenen
Ladungen lautet exakt
X X
Komplexe
~jgeb (~k, t) =
µ
i
³
´ ~
~
˙
qµi ~x˙ µ (t) + ξ~µi (t) e−ik·(~xµ (t)+ξµi (t))
(7.14)
und nach Vernachlässigung von Gliedern zweiter und höherer Ordnung in (~k· ξ~µi )
X
Komplexe
~jgeb (~k, t) =
µ
X X
µ
~
˙
d~µ (t)e−ik·~xµ (t)
µ
Komplexe
−i
X
Komplexe
~
qµ ~x˙ µ (t) e−ik·~xµ (t) +
i
´
´³
³
~
˙
qµi ~x˙ µ (t) + ξ~µi (t) ~k · ξ~µi (t) e−ik·~xµ (t) .
(7.15)
Den ersten hier auftretenden Term vereinigen wir mit der durch freie Punktladungen getragenen Stromdichte zu einer vergröberten Stromdichte
X
Komplexe
~jmakr (~k, t) = ~jfrei (~k, t) +
~
qµ ~x˙ µ (t)e−ik·~xµ (t) ,
(7.16)
µ
in der jeder Komplex als zu einer Punktladung geschrumpft erscheint. Den
zweiten Term in (7.15) eliminieren wir zugunsten der Zeitableitung der Polarisationsdichte
˙
P~ (~k, t) =
³
´i
X h˙
~
d~µ (t) − id~µ (t) ~k · ~x˙ µ (t) e−ik·~xµ (t)
Komplexe
(7.17)
µ
und erhalten für gesamte Stromdichte
~j(~k, t)
˙
= ~jmakr (~k, t) + P~ (~k, t)
³
´
³
´i
Komplexe
P h~
~
dµ (t) ~k · ~x˙ µ (t) − ~x˙ µ (t) ~k · d~µ (t) e−ik·~xµ (t)
+i
µ
³
´
Komplexe
P P ~˙
~
−i
qµi ξµi (t) ~k · ξ~µi (t) e−ik·~xµ (t) .
µ
i
(7.18)
132
7 Elektromagnetische Felder in Materie
Wir dürfen das in der Geschwindigkeit ~x˙ µ und im Dipolmoment d~µ antisymmetrische Glied vernachlässigen, da es unter praktisch allen Umständen winzig
˙
ist im Vergleich zu P~ (~k, t). Um uns davon zu überzeugen, bedenken wir, dass
die Ausbreitung elektromagnetischer Wellen des Wellenvektors ~k durch die Frequenz
ω(~k) = c̃|~k|
(7.19)
charakterisiert ist. Die in Materie vorliegende Lichtgeschwindigkeit c̃ kann
übrigens verschieden sein von der Lichtgeschwindigkeit im Vakuum; c̃ kann sogar vom Wellenvektor ~k abhängen, siehe (7.2 und 7.3). Unter dem Einfluss des
elektromagnetischen Feldes wird das Dipolmoment eine erzwungene Bewegung
gleicher Frequenz ausführen. Die Zeitableitung des Dipolmoments wird demnach die Größenordnung c̃|~k||d~µ | haben, d. h. etwa um den Faktor c̃/|~x˙ µ | von
dem erwähnten in d~µ und ~x˙ µ antisymmetrischen Glied verschieden sein. Letzte˙
res ist also gegen P~ vernachlässigbar, wenn die Geschwindigkeiten |~x˙ µ (t)| klein
sind gegenüber der Lichtgeschwindigkeit ~c.
Um schließlich das letzte Glied in (7.18) zu untersuchen, vereinfachen wir
vorübergehend die Schreibweise, indem wir die die Ladungen nummerierenden
Indices weglassen und hochgestellte Indices zur Bezeichnung der Vektorkomponenten einführen. Die i-te Vektorkomponente j i (~k, t) erhält im letzten Glied
von (7.18) von einem Komplex einen Beitrag proportional zu
X X
Ladungen
q ξ˙i (t)k j ξ j (t)
=
X
k
j
j
j
(
X
+
Ladungen
=
i
q h ˙i
ξ (t)ξ j (t) − ξ˙j (t)ξ i (t)
2
Ladungen
X
i
q h ˙i
ξ (t)ξ j (t) + ξ˙j (t)ξ i (t)
2
−(~k × m)
~ i+
X
kj
j
)
d X q i
ξ (t)ξ j (t) .
dt Ladungen 2
(7.20)
Hierin tritt das magnetische Moment m
~ µ des Komplexes auf sowie die Zeitableitung eines in ξ quadratischen Moments der Ladungsverteilung. Da wir Glieder
des letzteren Typs in der obigen Entwicklung (7.10) der Ladungsverteilung vernachlässigt hatten, müssen wir sie konsistenterweise auch hier außer Acht lassen.
Die zu guter Letzt entstehende Näherung für die gesamte Stromdichte lautet
~ (~k, t),
~j(~k, t) = ~jmakr (~k, t) + P~˙ (~k, t) + i~k × M
(7.21)
wobei die ~k-te Fourierkomponente der Magnetisierungsdichte als
X
Komplexe
~ (~k, t) =
M
µ
~
m
~ µ (t)e−ik·~xµ (t)
(7.22)
7.1 Polarisation und Magnetisierung
133
eingeführt wurde.
Die Näherungen (7.13) und (7.21) für die Ladungs- bzw. Stromdichte bestehen übrigens eine wichtige Konsistenzprüfung, indem sie den Ladungserhaltungssatz befriedigen. In der Tat gilt für die ~k-te Fourierkomponente von
ρ̇(~x, t) + div ~j(~x, t)
ρ̇(~k, t) + i~k · ~j(~k, t) = ρ̇makr (~k, t) + i~k · ~jmakr (~k, t) .
(7.23)
Das Verschwinden der rechten Seite in (7.23) folgt unmittelbar, wenn die Definition (7.10) nach der Zeit differenziert wird.
Wir können nun die Maxwellschen Gleichungen für langwellige (λ À Durchmesser aller Komplexe Felder in Materie aufschreiben. Beachten Sie dabei nur,
~ x) die Fourierdass die Wirbelstärke und die Quellstärke eines Vektorfeldes X(~
komponenten
~ ~k) =
i~k × X(
Z
~ x)
d3 xe−ik·~x rotX(~
(7.24)
~ ~k) =
i~k × X(
Z
~
~ x)
d3 xe−ik·~x divX(~
(7.25)
~
bzw.
haben. (Letztere Relation war übrigens schon in (7.23) benutzt worden.) Damit
ergeben sich die Feldgleichungen aus (6.12 bis 6.15) zu
³
´
~ ~k, t) + P~ (~k, t)
i~k · ²0 E(
~ ~k, t)
i~k × E(
=
ρmakr (~k, t)
(7.26)
=
~˙ ~k, t)
B(
(7.27)
~ ~k, t) = 0
i~k · B(
(7.28)
³
´
³
´
∂
~ ~k, t) + P~ (~k, t) .
~ ~k, t) − M
~ (~k, t)
²0 E(
i~k × ²0 c2 B(
= ~jmakr (~k, t) +
∂t
(7.29)
~ ~k, t) und B(
~ ~k, t), die ausschließlich langwellige (im o. g. Sinn)
Für Felder E(
~
~
~ ~k, t) enthalten, dürfen wir in allen vier GleiFourierkomponenten E(k, t) bzw. B(
chungen (7.26 - 7.29) gemäß
~ x, t) =
E(~
Z
d3 k −i~k·~x ~ ~
e
E(k, t) etc.
(2π)3
(7.30)
die inverse Fouriertransformation ausführen, woraufhin wir die Ortsraumdarstellung der Maxwellschen Gleichungen gewinnen,
134
7 Elektromagnetische Felder in Materie
³
´
~ x, t) + P~ (~x, t)
div ²0 E(~
~ x, t)
rotE(~
=
ρmakr (~x, t)
(7.31)
=
~˙ x, t)
−B(~
(7.32)
~ x, t) = 0
divB(~
(7.33)
³
´
³
´
∂
~ x, t) − M
~ (~x, t)
~ x, t) + P~ (~x, t) .
rot ²0 c2 B(~
= ~jmakr (~x, t) +
²0 E(~
∂t
(7.34)
Letztere Darstellung macht besonders sinnfällig, dass (bei langwelligen Feldern!) die vergröberte Ladungsdichte ρmakr als Quelle für das so genannte
elektrische Verschiebungsfeld
~ = ²E
~ + P~
D
(7.35)
~
fungiert, während die vergröberte Stromdichte ~jmakr zusammen mit dem aus D
˙~
gebildeten Verschiebungsstrom D die Wirbel der so genannten Magnetfeldstärke
~ = ² 0 c2 B
~ −M
~
H
(7.36)
angibt.
Für eine explizite Beschreibung der elektromagnetischen Phänomene in Materie müssen zunächst die Ladungen ρmakr spezifiziert werden. Die einfachst
mögliche Situation liegt vor, wenn keine ungebundenen Ladungen auftreten
und die Komplexe gebundener Ladungen (Moleküle, Elementarzellen in Kristallen ...) elektrisch neutral sind; in diesem Fall verschwinden ρmakr und ~jmakr .
Zusätzliche Kenntnis ist erforderlich über die elektrischen und magnetischen Dipolmomente der Komplexe gebundener Ladungen, d. h. die Polarisationsdichte
~.
P~ und die Magnetisierungsdichte M
7.2
Materialgesetze für Polarisation und Magnetisierung
Solange kein elektromagnetisches Feld eingeprägt wird, zeigen die meisten Materialien keine langwellige (λ > 1000 Å) Polarisation und Magnetisierung. Selbst
wenn die Atome, Moleküle und/oder gegebenenfalls Elementarzellen in Probekörpern elektrische und/oder magnetische Dipole tragen, so sind diese Dipole bezüglich ihrer Richtungen i. A. unkorreliert und summieren sich daher in
Raumbereichen der Lineardimensionen (λ > 1000 Å) zu Null. Ausnahmen, die
hier nicht weiter diskutiert werden können, sind Ferroelektrika und Ferromagnetika bei hinreichend tiefen Temperaturen.
Beim Eindringen eines langwelligen elektromagnetischen Feldes in Probekörpern können jedoch endliche Werte der Polarisation und der Magnetisierung
entstehen. Zum einen sind nämlich etwaige permanente molekulare Dipole bestrebt, sich längs des eingeprägten Feldes zu orientieren. Andererseits tendiert
ein eingeprägtes elektrisches Feld dazu, in Komplexen aneinander gebundener Ladungen Dipolmomente zu erzeugen, da es auf Ladungen verschiedenen
7.2 Materialgesetze für Polarisation und Magnetisierung
135
Vorzeichens Kräfte entgegengesetzter Richtung ausübt. Schließlich kann ein
zeitabhängiges Magnetfeld Ringspannungen und somit Ringströme erzeugen,
die ein magnetisches Moment tragen.
Viele so genannte Dielektrika reagieren auf die Anwesenheit eines elektromagnetischen Feldes zwar nicht mit merklicher Magnetisierung, wohl aber mit
einer durch das elektrische Feld eindeutig festgelegten Polarisation. Da die
durch äußeren Eingriff in dielektrischen Probekörpern erzeugbaren elektrischen
Felder i. A. viel schwächer sind als typische innermolekulare Coulombfelder
(≈ 108 V /cm), also nur kleine Änderungen der mikroskopischen Ladungskonfigurationen erzeugen können, lässt sich die Polarisation P~ als Potenzreihe im elek~ darstellen. Meist ist sogar nur die lineare Antwort, |P~ | ∼ |E|,
~
trischen Feld E
beobachtbar. Da diese Antwort sowohl vom Wellenvektor wie von der Frequenz
des eingeprägten Feldes abhängen kann, ist es zweckmäßig, das entsprechende
Materialgesetz für die raum-zeitlichen Fouriertransformierten,
Z
Z
~
P~ (~k, ω) = d3 x dt e−i(k·~x+ωt) P~ (~x, t)
(7.37)
etc., aufzuschreiben.
Das allgemeinste derartige lineare Gesetz lautet
X
~ j (~k, ω) .
χij (~k, ω)E
P~i (~k, ω) = ²0
(7.38)
j
Die Matrix des Koeffizienten χij wird als der Tensor der linearen elektrischen
Suszeptibilität bezeichnet. Nur in isotropen Medien ist dieser Tensor diagonal,
~ also parallel.
χij ∼ δij , sind die Vektoren P~ und E
Die Suszeptibilität vieler Materialien ist in gewissen Spektralbereichen eine
von Frequenz und Wellenvektor unabhängige Konstante. Insbesondere entfällt
jede Abhängigkeit von ~k für Substanzen, die räumlich homogen sind auf Längenskalen, bezüglich derer die Polarisation und die Magnetisierung definiert sind
(λ À Komplexdurchmesser). Für Felder, deren Fourierkomponenten ausschließlich in solchen Spektralbereichen liegen, darf das lineare Gesetz auch in der
raum-zeitlichen lokalen Form
X
χij Ej (~x, t)
(7.39)
P~i (~x, t) = ²0
j
geschrieben werden.
Mit Lasern erzeugte Lichtfelder können so intensiv sein, dass die elektrische
Feldstärke nicht mehr winzig ist im Vergleich zu typischen innermolekularen
Coulombfeldern. Auf solche Felder reagieren viele Materialien merklich nichtlinear, z. B. wie
136
7 Elektromagnetische Felder in Materie
Pi (k,~ω)
= ²0
X
χij (~k, ω)Ej (~l, ω)
j
+ ²0
XZ
3 0
d k
j,l
Z
dω 0 χijl (~k 0 , ω 0 , ~k − ~k 0 , ω − ω 0 )
Ej (~k 0 , ω 0 )El (~k − ~k 0 , ω − ω 0 ) .
(7.40)
Der vom Tensor χijl vermittelten Nichtlinearität entspricht eine Fülle interessanter Phänomene (Frequenzmischung, Frequenzverdopplung etc.), deren Untersuchung Gegenstand der nichtlinearen Optik ist.
In magnetisierbaren Materialien sind Zusammenhänge zwischen der Magne~ und dem Induktionsfeld B
~ beobachtbar, die den elektrischen Matisierung M
terialgesetzen (7.38) und (7.40) ganz analog sind.
7.3
Wellen in linearen Dielektrika
Für den einfachen Fall eines linearen, räumlich homogenen und isotropen Dielektrikums mit verschwindender magnetischer Suszeptibilität,
~ ~k, ω),
P~ (~k, ω) = ²0 χ(ω)E(
~ (~x, t) = 0 ,
M
(7.41)
will ich nun darlegen, wie sich die Ausbreitung elektromagnetischer Wellen modifiziert gegenüber dem Fall der Ausbreitung im Vakuum.
Wenn keine freien Ladungen ins Dielektrikum gebracht und alle Komplexe
gebundener Ladungen neutral sind, so lauten die Maxwell’schen Gleichungen
(7.24 bis 7.27) (nach Fouriertransformation bezüglich der Zeit wie in (7.37))
~k · E(
~ ~k, ω) = 0 ,
~k · B(
~ ~k, ω) = 0 ,
~k × E(
~ ~k, ω) = −ω B(
~ ~k, ω) ,
~k × B(
~ ~k, ω) =
²(ω)
c2
~ (~k, ω) ,
ωE
(7.42)
wobei ²(ω) die Dielektrizitätskonstante
²(ω) ≡ 1 + χ(ω)
(7.43)
~ ~k, ω) aus (7.42) erhalten wir
bezeichnet. Durch Elimination von B(
³
´
2
~ ~k, ω) = k 2 E(
~ ~k, ω) ²(ω)ω E(
~ ~k, ω) .
−~k × ~k × E(
(7.44)
c2
Ebene monochromatische Wellen im betrachteten Dielektrikum haben also die
Dispersionsrelation
ck = ω
p
²(ω) .
(7.45)
Der früher besprochene Fall des Vakuums ist hierin als ² = 1 enthalten. Der
Faktor
n(ω) ≡
p
²(ω)
(7.46)
7.4 Modell eines Dielektrikums
137
wird auch Brechungsindex des Dielektrikums genannt.
Wie Sie im nächsten Paragrafen sehen werden, können die Suszeptibilität χ
und somit die Dielektrizitätskonstante wie der Brechungsindex komplexe Werte
annehmen. Um die physikalische Bedeutung von Realteil n0 und Imaginärteil
n00 eines komplexen Brechungsindex
n = n0 + in00
(7.47)
zu erkennen, betrachten wir eine in die positive x-Richtung laufende ebene monochromatische Welle
0
ei(ωt−kx) = eiω(t−xn /c) e+xn
00
ω/c
.
(7.48)
Da sich die Flächen konstanter Phase des in (7.48) auftretenden periodischen
Faktors mit der Geschwindigkeit x/t = c/n0 bewegen, heißt
c̃(ω) = c/n0 (ω)
(7.49)
die Phasengeschwindigkeit elektromagnetischer Wellen im Dielektrikum. Offenbar ist c̃ allein durch den Realteil des Brechungsindex festgelegt und hängt über
diesen i. A. von der Frequenz der Welle ab.
Der nichtperiodische Faktor in (7.48) beschreibt je nach Vorzeichen von n00
eine exponentielle Dämpfung (n00 < 0) oder Verstärkung (n00 > 0) der Welle
beim Eindringen ins Dielektrikum. Beide Fälle lassen sich experimentell realisieren. Im Fall der Dämpfung hat die Größe
l ≡ c/ω|n00 (ω)|
(7.50)
offenbar die Bedeutung einer Eindringtiefe.
7.4
Modell eines Dielektrikums
Denken wir uns jeden Komplex aneinander gebundener Ladungen repräsentiert
durch einen harmonischen Oszillator der Eigenfrequenz ω0 . Bei Auslenkung aus
der Ruhelage um ξ~ trete das Dipolmoment
d~ = q ξ~
(7.51)
auf.
Unter dem Einfluss eines monochromatischen elektrischen Feldes führt der
Oszillator eine erzwungene Schwingung gemäß der Bewegungsgleichung
q ~ −iωt
¨
¨
E0 e
(7.52)
ξ~ − 2γ ξ~ + ω02 ξ~ =
m
aus. Hierin ist m die effektive Masse des Oszillators und γ eine Dämpfungskonstante,
die den dissipativen Effekt anderer Freiheitsgrade des Systems auf den Oszillator beschreibt. Im stationären Regime schwingt das Dipolmoment d~ mit der
Frequenz ω und der Amplitude
d~ =
ω02
q 2 /m
~0 .
E
− ω 2 + i2γω
(7.53)
138
7 Elektromagnetische Felder in Materie
Wenn die Volumeneinheit im Dielektrikum mit N derartigen Oszillatoren
gleichförmig∗) ausgefüllt ist, so gilt für die ~k-ten Fourierkomponenten der Polarisationsdichte und des elektrischen Feldes
P~ (~k, t) =
N q 2 /m
~ ~k, t) ,
E(
ω02 − ω 2 + i2γω
(7.54)
solange die Wellenlänge λ = 2π/|~k| groß gegenüber dem mittleren Teilchenabstand (≈ N −1/3 ) ist. Für die Dielektrizitätskonstante folgt aus (7.54)
²(ω) = n(ω)2 = 1 +
ω02
N q 2 /m²0
.
− ω 2 + i2γω
(7.55)
Aus (7.55) entnehmen wir zunächst, dass der Imaginärteil n00 (ω) des Brechungsindex stets negativ ist. Eine in das Medium aus harmonischen Oszillatoren eindringende Welle wird also gedämpft. Unser Modell ist nicht geeignet,
verstärkende Medien zu beschreiben. Die Dämpfung einfallender Wellen ist offenbar am stärksten für Frequenzen ω nahe der Eigenfrequenz ω0 , d. h. bei
Resonanz.
Für ω ≈ ω0 zeigt auch der Realteil des Brechungsindex eine für Resonanzphänomene typische starke Frequenzabhängigkeit. Beachten Sie übrigens,
dass für ω > ω0 der Realteil n0 kleiner als eins, die Phasengeschwindigkeit also
größer als die Lichtgeschwindigkeit im Vakuum ist.
7.5
Ohmsches Gesetz
Anders als in Dielektrika treten in elektrischen Leitern stets Ladungen auf, die
nicht an Ruheladungen gebunden, sondern über das ganze Volumen des jeweiligen Körpers beweglich sind. Zum Beispiel besteht ein Metall aus beweglichen
Leitungselektronen und positiv geladenen Ionen, die elastisch an Gleichgewichtslagen gebunden sind.
Ein auf einen Leiter eingeprägtes elektrisches Feld beschleunigt jedes bewegliche geladene Teilchen und bewirkt somit einen elektrischen Strom. Insbesonde~ in einem räumlich
re erzeugt ein nicht aus starkes statisches homogenes Feld E
homogenen und isotropen Leiter eine Stromdichte, die durch das Ohmsche Gesetz
~
~j = σ E
(7.56)
beschrieben wird. Die Materialkonstante σ heißt die elektrische Leitfähigkeit.
Eine elementare gaskinetische Modellvorstellung für die beweglichen Ladungen in einem Leiter besagt, dass sich jede dieser Ladungen bei Abwesenheit
eines eingeprägten Feldes frei bewegt bis auf gelegentlich Stöße in mittlerem
zeitlichen Abstand τ . Bei Stoß ändert sich im Mittel zwar nicht der Betrag der
Geschwindigkeit, wohl aber ihre Richtung, u. z. in jeweils beliebiger Weise ohne
Bevorzugung irgendeiner Orientierung. Da die mittlere Geschwindigkeit eines
∗) Gleichförmig heißt, dass bei immer feinerer Unterteilung des Gesamtvolumens gleich große
Teilvolumina ∆V bis auf vernachlässigbare Schwankungen gleich viele Teilchen enthalten,
solange N ∆V À 1.
7.6 Wellen in Leitern
139
Haufens solchermaßen bewegter Teilchen gleich Null ist (s. Abbildung 7.1), verschwinden alle hinreichend langwelligen Fourierkomponenten der Stromdichte
und insbesondere die
Abbildung 7.1
~k = 0-Komponente, die einem räumlich homogenen Strom entspricht. Bei Anlegen eines elektrischen Feldes ändert sich die geschilderte Situation nur insofern,
als sich die Geschwindigkeit eines beweglichen Teilchens der Masse m und der
Ladung q zwischen zwei Stößen um
~ /m
~u = q Eτ
(7.57)
erhöht. Im Mittel werden alle beweglichen Ladungen mit der Geschwindig~ driften, so dass N die Volumeneinheit gleichförmig
keit ~u längs des Feldes E
ausfüllende gleiche Ladungen die Stromdichte
~
~j = N q~u = (N q 2 τ /m)E
(7.58)
tragen. Aus (7.58) lesen Sie für die Leitfähigkeit des Modells ab
σ = N q 2 τ /m .
7.6
(7.59)
Wellen in Leitern
Der statische Fall (7.56) des Ohmschen Gesetzes verallgemeinert sich für Wellen
der Frequenz ω in homogenen und isotropen Leitern zu
~ ~k, ω) .
~j(~k, ω) = σ(ω)E(
(7.60)
Der Beschreibung der entsprechenden Wellen lege ich die Maxwellschen Gleichungen in der Form
~k · E(
~ ~k, ω)
~k · B(
~ ~k, ω)
=
0,
=
0,
~k × E(
~ ~k, ω)
~ ~k, ω)
i~k × B(
=
=
~ ~k, ω)
− ω B(
1
² 0 c2
~ ~k, ω)
~j(~k, ω) + i ω2 E(
c
(7.61)
140
7 Elektromagnetische Felder in Materie
zugrunde. Dabei sind die Polarisierbarkeit und Magnetisierbarkeit aller Komplexe aneinander gebundener Ladungen vernachlässigt sowie elektrische Neutralität
des Leiters bezüglich der Längenskala λ = 2π/|~k| angenommen.
Nach Eintragen des Ohmschen Gesetzes (7.60) in die Maxwellschen Glei~ ergibt sich ähnlich
chungen (7.61) und nach Elimination des Induktionsfeldes B
wie in 7.3
1 ~
~ = 1 (σ(ω)/²0 + iω)E
~ .
~ = i 1 k2 E
(7.62)
k × (~k × E)
ω
ω
c2
Als Dispersionsrelation elektromagnetischer Wellen in Leitern entnehmen wir
hieraus
¶
µ
σ(ω)
c2 k 2 = ω 2 1 +
.
(7.63)
iω²0
−i
Wie im Dielektrikum lässt sich die Abweichung der Dispersionsrelation von der
des Vakuums wieder durch einen frequenzabhängigen Brechungsindex
n(ω) =
µ
¶1/2
σ(ω)
1+
iω²0
(7.64)
beschreiben. Daher gilt das in 7.3 über Phasengeschwindigkeit und Eindringtiefe
der Welle Dargelegte ohne Änderung auch für Wellen in Leitern.
Das in 7.4 beschriebene Modell eines Dielektrikums lässt sich übrigens auch
auf Leiter übertragen, indem in (7.52) die Rückstellkraft mω02 ξ, d. h. die Eigenfrequenz ω0 Null gesetzt und die Dämpfungskonstante γ mit der mittleren
Stoßzeit mittels 2γ = 1/τ verknüpft wird. Durch Vergleich von (7.55) und (7.64)
erhalten wir dann die frequenzabhängige Leitfähigkeit des Modells zu
σ(ω) =
σ
N q 2 τ /m
=
.
1 + iωτ
1 + iωτ
(7.65)
Im Grenzfall ωτ → 0 reduziert sich dieses Resultat auf die in (7.59) gegebene
statische Leitfähigkeit σ(0) ≡ σ.
Kapitel 8
Symmetrien
8.1
Der Raum ist homogen
Eine in Essen arbeitende Maschine funktioniert gleichermaßen auf dem Kahlen
Asten, vorausgesetzt, alle den Lauf der Maschine beeinflussenden Umweltbedingungen (je nach Gerät verschieden, z. B. Temperatur, Luftdruck, Luftfeuchtigkeit, Luftzusammensetzung, elektrische und magnetische Felder) werden gleich
gestellt. Mit gewissem Aufwand an Technik und Geld lassen sich manche Maschinen auch auf dem Mond betreiben. Einschränkend muss notiert werden,
dass Großvaters Pendeluhr, auf den Mond gebracht, langsamer als zu Hause ticken würde; die Synchronisierung der Ticks der häuslichen Pendeluhr mit denen
des auf dem Mond tickenden Duplikats durch Vergrößerung des Gravitationsfeldes des Mondes um einen Faktor 6 (entsprechend den Radien und Massen von
Mond und Erde) ist uns nicht möglich.
Kein Punkt im Raum ist vor irgendeinem anderen Punkt ausgezeichnet. Das
heißt, was an einem Punkt physikalisch bewirkt werden kann, ist auch anderswo
zu bewerkstelligen. Der beschriebene Sachverhalt, eine Erfahrungstatsache, ist
zwar umgangssprachlich nur mangelhaft präzisierbar, hat aber in allen Grundgesetzen der Physik einen wichtigen Niederschlag: keines dieser Grundgesetze
zeichnet irgendeinen Punkt im Universum aus.
Es folgt, dass alle Grundgesetze der Physik, wenn als Gleichungen für ortsabhängige Größen geschrieben, ihre Form nicht ändern, wenn der Koordinatenursprung verschoben wird. Alle Grundgesetze bleiben formgleich bei der
Koordinatentransformation
~x0 = ~x + d~
t0 = t ,
(8.1)
die einer zeitunabhängigen Verschiebung des Ursprungs um d~ entspricht.
Prüfen wir diese Invarianz am Beispiel des Newtonschen Grundgesetzes F~ =
m~a, welches die Beschleunigung ~a eines Teilchens der Masse m mit der auf
das Teilchen wirkenden Kraft F~ verknüpft. Die Masse m des Teilchens ist in
beiden Koordinatensystemen die gleiche. Da beide Koordinatensysteme parallele Achsen haben, sind die Komponenten des am Ort des Teilchens wirkenden
Kraftvektors bezüglich der einander entsprechenden Achsen gleich. Die in den
141
142
8 Symmetrien
Abbildung 8.1
beiden Systemen messbaren Beschleunigungen sind ebenfalls gleich, da wegen
der Zeitunabhängigkeit von d~ gilt
~
d2 ~x0
d2 ~x0
d2 (~x + d)
d2 ~x
=
=
= 2 .
02
2
2
dt
dt
dt
dt
Wenn also im Koordinatensystem S das Newtonsche Gesetz F~ = m~a gilt, so
~ 0 . Wie in Essen,
gilt es auch mit ungeänderter Form im Koordinatensystem S
so auf dem Kahlen Asten.
Drücken wir’s vornehmer aus! Die Homogenität des Raumes ist gleichbedeutend mit der Invarianz der Grundgesetze unter Translationen des Koordinatensystems. Dies ist keine nur esoterische Weisheit sondern eine prägnante Zusammenfassung vieler praktischer Erfahrungen. Insbesondere ist die Erfahrung
beinhaltet, dass der Gesamtimpuls eines abgeschlossenen Systems (abgeschlossen = keine äußeren Einwirkungen) zeitlich konstant bleibt. Zeigen wir das am
Beispiel eines mechanischen Systems, das wir uns als einen Haufen wechselwirkender Teilchen vorstellen können.
Die Wechselwirkung der Teilchen im Haufen werden beschrieben mit Hilfe
der potenziellen Energie U (~x1 , ~x2 , . . .), die von den Ortsvektoren ~x, aller Teilchen abhängt. Wegen der Homogenität des Raumes ändert sich die potenzielle
Energie nicht, wenn zu allen Ortsvektoren ~x, derselbe zeitunabhängige Vektor
d~ addiert wird,
~ ~x2 + d,
~ . . .) .
U (x~1 , x~2 , . . .) = U (~x1 + d,
~ so
Differenzieren wir diese Gleichung nach der i-ten Komponente des Vektors d,
erhalten wir unter Benutzung der Kettenregel
8.2 Der Raum ist isotrop
0=
∂
~ ~x2 + d,
~ . . .)
U (~x1 + d,
∂di
=
X
ν
=
X
ν
143
∂
~ ~x2 + d,
~ . . .)
U (~x1 + d,
∂xνi
∂
U (~x1 , ~x2 , . . .).
∂xνi
Nun ist −∂U/∂xνi , gerade die i-te Komponente der auf das ν-te Teilchen wirkenden Kraft und wir erkennen, dass die Summe der Kräfte auf alle Teilchen für
einen abgeschlossenen Haufen verschwindet. Wenn das abgeschlossene System
insbesondere nur aus zwei Teilchen besteht, so ergibt sich Newtons berühmtes
Gesetz actio = reactio. Um auch den Impulserhaltungssatz zu erschließen,
schauen wir die Bewegungsgleichung des ν-ten Teilchens an,
µ
¶
∂
∂
∂
d2 ~xν
=
−∇
U
=
−
U,
U,
U
,
mν
ν
dt2
∂xν1
∂xν2
∂xν3
und summieren über alle Teilchen. Da die Summe der Kräfte verschwindet,
finden wir
−
X
ν
∇ν U = 0 =
Also bleibt die Größe
X
mν
d2 ~xν
dxν
d X
mν
=
.
2
dt
dt ν
dt
X
mν
ν
P~ =
ν
d~xν
,
dt
die wir Gesamtimpuls des Haufens nennen, zeitlich konstant,
d ~
P =0.
dt
Nicht nur die Grundgesetze der Mechanik, sondern alle Grundgesetze der
Physik sind invariant unter Translationen des Koordinatensystems. Dementsprechend gilt der Impulserhaltungssatz auch allgemeiner als nur für rein mechanische abgeschlossene Systeme (die es streng genommen gar nicht gibt). Betrachten wir etwa einen Haufen geladener Teilchen, die über das von ihnen erzeugte elektromagnetische Feld wechselwirken, ohne dass äußere Einflüsse wirksam wären. Da alle zur Beschreibung dieses Systems einschlägigen Grundgesetze
translations-invariant sind, bleibt der Gesamtimpuls des Systems zeitlich konstant. Allerdings tragen nicht nur die Teilchen, sondern auch das von ihnen
erzeugte elektromagnetische Feld zum Gesamtimpuls bei. Erinnern Sie sich an
den Comptoneffekt!
8.2
Der Raum ist isotrop
Die Naturgesetze zeichnen nicht nur keinen Punkt des Universums aus, sondern
auch keine Richtung im Raum. Zwar gibt es in vielen physikalischen Systemen
eine oder gar mehrere ausgezeichnete Richtungen, aber solche Anisotropien sind
stets erzeugt durch Materiekonfigurationen; werden letztere gedreht, so drehen
144
8 Symmetrien
sich die ausgezeichneten Richtungen mit, ohne dass sich irgendeine andere Eigenschaft ändert.
Denken wir an die Schwerkraft an der Erdoberfläche, die im Labor die von
unten nach oben“ weisende Richtung auszeichnet. Die Schwerkraft wird von
”
der Erde erzeugt. Dreht man die Erde, so dreht sich die ausgezeichnete Richtung. Die Isotropie des Raumes zeigt sich bei diesem Beispiel darin, dass viele
Laborexperimente um 12 Uhr mittags die gleichen Resultate geben wie abends
um 6 Uhr. Viele, nicht alle: messen Sie den Wasserpegel an der Atlantikküste
und bemerken die durch Sonne und Mond bewirkten zusätzlichen Anisotropien
des Gravitationsfeldes an der Erdoberfläche. Also verfeinern wir die Aussage:
schwerkraftempfindliche Laborexperimente verlaufen gleich, wenn gleiche Konstellation von Labor, Erdmittelpunkt, Mond und Sonne vorliegt.
Die allgemeine und präzise Fassung der geschilderten Erfahrung von der
prinzipiellen Gleichberechtigung aller Richtungen besagt, dass alle Grundgesetze
invariant sind unter Rotationen des Koordinatensystems. Um diese Aussage für
konkrete Gesetze nachprüfen zu können, müssen wir uns überlegen, wie sich die
Koordinaten eines Punktes bei Drehung der Koordinatenachsen ändern.
Betrachten wir der Einfachheit halber eine reine Rotation (keine Nullpunktverschiebung) um den Winkel ϕ bezüglich der z-Achse. Sie sehen leicht anhand
von Abbildung 8.2, dass
Abbildung 8.2
x0
=
x cos ϕ + y sin ϕ
y0
=
z0
=
−x sin ϕ + y cos ϕ
0
=
t
bzw.
x
=
y
=
x0 cos ϕ − y 0 sin ϕ
x0 sin ϕ + y 0 cos ϕ
z
t,
wobei letztere Gleichung ausdrückt, dass zwar nicht eine Pendeluhr, wohl aber
eine sorgfältig konstruierte Armbanduhr unverändert geht, wenn sie auf den
Kopf gestellt wird.
Prüfen wir die Rotationsvarianz der Newtonschen Bewegungsgleichheit für
ein Teilchen,
d2 ~x
(8.3)
F~ = m 2 .
dt
Drücken wir die Beschleunigung durch die Koordinaten im gedrehten System
aus, so ergibt sich
8.2 Der Raum ist isotrop
d2 x
dt2
=
d2 x 0
d2 y 0
cos ϕ − 0 2 sin ϕ
02
dt
dt
d2 y
dt2
=
d2 x 0
d2 y 0
sin ϕ + 0 2 cos ϕ .
02
dt
dt
145
(8.4)
Die Komponenten der auf das Teilchen wirkenden Kraft F~ erhalten wir durch
Projektion des Kraftvektors auf die gedrehten Koordinatenachsen, genau wie
sich die Transformationsformel für die Koordinaten durch Projektion des Ortsvektors ~x gewinnen lassen,
Fx
=
Fy
=
Fx0 cos ϕ − Fy 0 sin ϕ
Fx0 sin ϕ + Fy 0 cos ϕ .
(8.5)
Da die Masse des Teilchens natürlich unabhängig von der Orientierung der Koordinatenachsen ist (ob Sie sich auf eine Waage stellen oder legen, ist für Ihr
Gewicht unerheblich), müssen wir nicht zwischen m und m0 unterscheiden. Tragen wir nun die Transformationen (8.4) und (8.5) in die Bewegungsgleichungen
(8.3) ein, so finden wir
Fx0 cos ϕ − Fy 0 sin ϕ
= m
d2 y 0
d2 x 0
cos ϕ − m 0 2 sin ϕ
02
dt
dt
Fx0 sin ϕ − Fy 0 cos ϕ
= m
d2 x 0
d2 y 0
sin ϕ + m 0 2 cos ϕ .
02
dt
dt
(8.6)
Da diese Gleichungen für beliebige Drehwinkel ϕ gelten, also z. B. für ϕ = π2 und
ϕ = 0, ergibt sich als Satz von Bewegungsgleichungen im Koordinatensystem S 0
d2 ~x0
(8.7)
F~ 0 = m 0 2 ,
dt
der formgleich ist mit dem Satz (8.3) im System S. Wenn also (8.3) in S gilt,
so gilt auch (8.7) in S 0 .
Wir können auch so argumentieren: Die Koordinaten x, y, z, die Komponenten Fx , Fy , Fz wie die Komponenten der Beschleunigung bilden jeweils
einen Vektor; alle diese Vektoren transformieren sich gleichartig bei Drehung des
Koordinatenkreuzes, wie aus (8.2), (8.4), (8.5) ersichtlich. Wenn daher die beiden Vektoren F~ und md2 ~x/dt2 in einem Koordinatensystem übereinstimmen,
so auch in einem beliebig zu diesem verdrehten.
Haben Sie bisher einen Vektor als eine Größe angesehen, die durch Betrag
und Richtung charakterisiert ist und auch durch ihre Komponenten bezüglich
eines Achsenkreuzes spezifiziert werden kann? Dann präzisieren wir diese Auffassung jetzt. Ein Zahlentripel, das sich bei Drehung des Koordinatensystems
ebenso transformiert wie die Koordinaten x, y, z, ist ein Vektor. Die Bedeutung
dieser Begriffsbildung liegt darin, dass die Rotationsinvarianz von Naturgesetzen
der Form
~ =V
~,
U
z. B.
F~ = m~a
(8.8)
146
8 Symmetrien
~ und V
~ Vektoren sind, die in irgendeinem Koordinatenevident wird. Wenn U
system übereinstimmen, so gilt die Gleichheit auch in allen verdrehten Koordinatensystemen.
Ein verwandter, Ihnen ebenfalls bekannter Begriff ist der Skalar. Eine
Größe ϕ heißt skalar, wenn sie sich bei Drehung des Koordinatensystems gar
nicht ändert. Beispiele sind Masse, Ladung, Volumeninhalt, Ladungsdichte
etc. Selbstverständlich sind Naturgesetze, die sich als Gleichheit zweier Skalare schreiben lassen, invariant unter Rotationen. So zum Beispiel gilt, dass
Ladungen die Quellen des elektrischen Feldes sind, in allen zueinander verdreh~ = ρ/²0 .
ten Koordinatensystemen in der Form divE
Wir hatten oben eine spezielle Rotation (Drehung um z-Achse um Winkel
ϕ) betrachtet. Bei allgemeinen Drehungen mischen sich alle drei räumlichen
Koordinaten linear, während gleiche Uhren in zueinander gedrehten Systemen
immer mit gleicher Frequenz ticken,
x0
=
R11 x + R12 y + R13 z
y
0
=
R21 x + R22 y + R23 z
z
0
=
R31 x + R32 y + R33 z
t0
=
t.
(8.9)
Die neun Koeffizienten Rij der Linearkombination lassen sich, wie Sie gelernt
haben oder nachlesen können, stets durch drei Parameter (z. B. Eulersche Winkel) festlegen. Überzeugen wir uns davon, indem wir ausnutzen, dass sich das
~,
Längenquadrat eines beliebigen Vektors V
~ 2 = Vx2 + Vy2 + Vz2 ,
V
(8.10)
bei beliebiger Drehung des Koordinatensystems nicht ändern kann, also ein
Skalar ist.
Um die Betrachtung bequem aufschreiben zu können, vereinbaren wir eine
Neubenennung der Vektorkomponenten gemäß
Vx = V 1 ,
Vy = V 2 ,
Vz = V 3 .
(8.11)
Dann schreibt sich die Transformation (8.9) als
xi =
3
X
Rij xj
(8.12)
Vi2 .
(8.13)
j=1
~ 2 als
und als Längenquadrat V
~2 =
V
3
X
i=1
~ 2 offenbar ein Skalar ist, gilt
Da V
X
i
0
Vi 2 =
X
i
Vi2 =
X
ijk
Rij Rik Vj Vk ,
(8.14)
8.2 Der Raum ist isotrop
147
oder
X
jk
Ã
δjk −
X
Rij Rik
i
!
Vj Vk = 0 .
(8.15)
~ beliebig ist, folgt
Da der Vektor V
3
X
Rij Rik = δjk .
(8.16)
i=1
(Vollziehen Sie den Schluss selbst im Detail nach, indem Sie nacheinander ge~ treffen; beachten Sie die Symmetrie von P Rij Rik unter
eignete Wahlen für V
i
Vertauschung der Indices j und k.)
Wir haben in (8.16) sechs unabhängige Gleichungen für die neun Matrixelemente Rij . Es folgt, dass die Drehmatrix R drei freie Parameter enthält.
Wenn wir beachten, dass Rij das ji-Element der zu R transponierten Matrix
R̃ ist, so können wir (8.16) als die Matrixgleichung
R̃R = 1
(8.17)
schreiben und folgern, dass die zu R inverse gleich der transponierten Matrix
ist,
R̃ = R−1 .
(8.18)
Dieser Zusammenhang liefert uns die Umkehrung der Transformation (8.12)
X
xi =
(8.19)
Rji x0j .
j
Ebenso wie die Translationsvarianz der Grundgesetze hat auch die Rotationsinvarianz viele höchst wichtige und praktische Konsequenzen. Eine davon ist, dass der Gesamtdrehimpuls eines abgeschlossenen Systems eine zeitlich
konstante Größe ist. Es lohnt sich, diesen wichtigen Erhaltungssatz für einen
abgeschlossenen Haufen wechselwirkender Teilchen zu verifizieren.
Wir nutzen aus, dass die potenzielle Energie U (~x1 , ~x2 , . . .) des Haufens ein
Skalar sein muss. Für eine beliebige Rotation muss also gelten
U (~x1 , ~x2 , . . .) = U (~x01 , ~x02 , . . .),
(8.20)
wobei ~x0ν = (x0ν1 , x0ν2 , x0ν3 ) = (x0ν , yν0 , zν0 ) das Koordinatentripel des ν-ten Teilchens im gedrehten System bezeichnet. Insbesondere muss die Gleichung (8.20)
gelten für eine so genannte differenzielle Rotation, d. h. eine Drehung um einen
sehr kleinen Winkel δϕ bezüglich einer beliebigen Achse. Solche differenziellen Rotationen können durch einen Vektor δ ϕ
~ charakterisiert werden, dessen
Richtung die Drehachse und dessen Betrag den Drehwinkel δϕ = |δ ϕ
~ | angeben
(wobei, so die übliche Konvention, im Sinne einer Rechtsschraube gedreht wird).
Offenbar ändern sich bei einer differenziellen Rotation die Komponenten
~ nur wenig. Wir können schreiben
eines vorgegebenen Vektors V
~0 =V
~ + δV
~
V
(8.21)
148
8 Symmetrien
~ durch folgende einfache Überlegung. Der
und finden die kleine Änderung δ V
vorgegebene Vektor selbst ändert sich bei der Drehung des Koordinatensystems
~ 0 in (8.21) meint
um δ ϕ
~ natürlich nicht (nur seine Koordinaten ändern sich; V
das Koordinatentripel des Vektors im gedrehten System). Denken wir uns aber
ein Duplikat dieses Vektors, welches vor Ausführung der Drehung des Koordinatendreibeins mit dem vorgegebenen Vektor übereinstimmt, bei der Drehung
des Dreibeins zum System S 0 jedoch starr mitgeführt wird. Das Duplikat ist ein
vom vorgegebenen Vektor verschiedener Vektor; die Komponenten des Duplikats bezüglich des Systems S 0 sind jedoch numerisch gleich den Komponenten
des vorgegebenen Vektors bezüglich des ursprünglichen Koordinatensystems S,
da das Duplikat im System S 0 genauso orientiert ist wie der vorgegebene Vektor
im System S. Die in S 0 ausgedrückte Differenz zwischen dem mitgeführten Du~ in (8.21).
plikat und dem stehengebliebenen Original ist genau die Änderung δ V
Wir erhalten sie als die Änderung, die das Duplikat erleiden würde, wenn es, losgelöst vom Dreibein S 0 , um −δ ϕ
~ gedreht, also ins Original zurückrotiert würde.
~ | = |V
~ | sin Θδψ und ferner, dass δ V
~
Ein Blick auf die Abbildung 8.3 enthüllt |δ V
senkrecht auf der
Abbildung 8.3
~ aufgespannten Ebene steht, so dass δ V
~×V
~ und δ ψ
~ = δψ
~ bei Drehung
von V
~ Wir haben die Drehung des Vektors V
~ = −δ ϕ
~ um δ ψ
um δ ψ.
~ in Rechnung zu
stellen und finden als explizite Form der Transformation (8.21)
~0 =V
~ +V
~ × δϕ
V
~ .
(8.22)
Ihnen bleibt zur Übung überlassen, diese infinitesimale Rotation des Koordinatensystems in die Form (8.12) zu bringen und die zugehörige Drehmatrix
aufzuschreiben.
Jetzt können wir uns vollends schnell klarmachen, dass, wie behauptet,
der Gesamtdrehimpuls eines abgeschlossenen Teilchenhaufens zeitlich konstant
bleibt. Benutzen wir (8.20) für die infinitesimale Rotation (8.22),
U ({~xν + ~xν × δ ϕ
~ }) − U ({~xν }) = 0 .
(8.23)
Entwickeln wir links nach Potenzen von δ ϕ
~ bis zum Glied erster Ordnung, so
erhalten wir
8.2 Der Raum ist isotrop
X ∂U ({~xν })
v,i
∂xνi
(~xν × δ ϕ
~ )i = 0 .
149
(8.24)
Erinnern wir uns, dass −∇ν U gerade die auf das ν-te Teilchen wirkende Kraft
F~ν ist und beachten die zyklische Invarianz des Spatprodukts gemäß
−
X
ν
F~ν · (~xν × δ ϕ
~ ) = +δ ϕ
~·
X
(~xν × F~ν ) = 0 .
(8.25)
ν
Es erscheint das Skalarprodukt des Drehvektors δ ϕ
~ mit der Summe der Drehmomente ~xν × F ~ν der Kräfte F ~ν . Da der Drehwinkel ganz beliebig orientiert
sein darf, schließen wir, dass die Summe der Drehmomente der Kräfte auf alle
Teilchen des abgeschlossenen Haufens verschwindet.
Das zeitliche Verhalten des Gesamtdrehimpulses finden wir, indem wir die
Bewegungsgleichung des ν-ten Teilchens vektoriell mit dem Ortsvektor ~x ν multiplizieren,
d2 ~xν
= ~xν × F~ν
dt2
und nun diese Gleichungen für alle Teilchen additiv zusammenfassen,
~xν × mν
X
ν
~xν × mν
X
d d~xν
=
~xν × F~ν = 0 .
dt dt
ν
(8.26)
(8.27)
Wegen ~xν × ~xν = 0 können wir die linke Seite als eine totale Zeitableitung
schreiben und finden den Erhaltungssatz
~
d X
d~xν
dL
=
=0.
~xν × mν
dt ν
dt
dt
(8.28)
Die erhaltene Größe ist der Vektor des Gesamtdrehimpulses der Teilchen
~ =
L
X
ν
~xν × mν
d~xν
.
dt
(8.29)
Die somit vollzogene Herleitung des rein mechanischen Drehimpulserhaltungssatzes beginnt mit der Annahme, dass die Wechselwirkung der Teilchen
durch eine potenzielle Energie U ({~xν }) beschreibbar sei und ist somit kritikbedürftig. Anstatt eine allgemeine und abstrakte Kritik zu geben, verweise ich
wieder auf das Beispiel eines abgeschlossenen Haufens geladener Teilchen. Die
Wechselwirkung solcher Teilchen über das von ihnen selbst erzeugte elektromagnetische Feld kann nicht durch eine potenzielle Energie U ({~xν }) beschrieben
werden. Denken wir nur daran, dass das elektromagnetische Feld eines Teilchens
sich mit der Lichtgeschwindigkeit ausbreitet. Befindet sich also ein Teilchen zur
Zeit t am Ort ~xν , so kann sich dieser Sachverhalt andernorts auf andere Teilchen erst zu späteren Zeitpunkten auswirken. Eine derart retardierte Wechselwirkung zwischen Teilchen kann offenbar nicht durch eine potenzielle Energie
U (~x1 (t), ~x2 (t), . . .), in die alle Teilchenkoordinaten zu einer Zeit eingehen, beschrieben werden.
Die Ausschlachtung der Rotationsinvarianz der Maxwellschen Gleichungen
und der Teilchenbewegungsgleichungen zugleich, die hier nicht vorgenommen
150
8 Symmetrien
werden kann, ergibt, dass sowohl die Teilchen wie das von ihnen erzeugte elektromagnetische Feld einen Drehimpuls haben. Erst die Summe beider Beiträge
liefert den zeitlich erhaltenen Gesamtdrehimpuls für das abgeschlossene System
geladener Teilchen.
8.3
Die Zeit ist homogen
Als Leonardo da Vinci (1452 - 1519) Maschinen baute, machte er sich Grundgesetze zunutze (wenn diese auch noch nicht alle formuliert gewesen sein mögen),
die heute noch unverändert gelten. Wir haben auch keinen Grund zu der Annahme, dass für künftige Ingenieurgenerationen die Maxwellschen Gleichungen
außer Kraft geraten könnten. Mit anderen Worten, in den Grundgesetzen ist
kein Zeitpunkt ausgezeichnet, die Grundgesetze sind alle invariant unter Verschiebungen des Zeitnullpunktes
t0
=
t+τ
x0
=
x, y 0 = y, z 0 = z .
(8.30)
Auch diese Symmetrie der Natur bzw. Invarianz der Grundgesetze impliziert
einen Erhaltungssatz für abgeschlossene Systeme, den der Energie.
Bei einem abgeschlossenen rein mechanischen Teilchenhaufen, bei dem die
Wechselwirkungen durch eine potenzielle Energie U ({~xν }) beschreibbar sind,
bedeutet die Gleichberechtigung aller Zeitpunkte, dass U nicht explizit von der
Zeit abhängt. Allein aus dieser Annahme aber hatten wir in 2.9 gefolgert, dass
die mechanische Gesamtenergie
E=
X 1
mν ~x˙ 2ν + U ({~xν })
2
ν
(8.31)
zeitlich erhalten bleibt.
Für ein abgeschlossenes System, das aus geladenen Teilchen und ihrem elektromagnetischen Feld besteht, hatten wir in 6.4 den Energieerhaltungssatz hergeleitet. Die für das abgeschlossene System erhaltene Gesamtenergie hat einen
rein mechanischen, einen rein elektromagnetischen Anteil sowie einen Wechselwirkungsanteil. Der Nachweis der Konstanz der Gesamtenergie macht wesentlichen Gebrauch von der Tatsache, dass weder die Bewegungsgleichungen der
Teilchen noch die Maxwellschen Gleichungen irgendeinen Zeitpunkt auszeichnen.
8.4
Galileiinvarianz
Denken wir uns zwei identische Labors, die sich relativ zueinander gleichförmig
bewegen. In beiden werde das gleiche Experiment durchgeführt. Nach aller
Erfahrung ergeben sich gleiche Messresultate. Ohne Beobachtung der Außenwelt kann in keinem Labor festgestellt werden, ob das Labor ruht oder sich in
gleichförmiger Bewegung befindet.
Dieser Erfahrungstatsache entspricht eine Invarianz aller Grundgesetze: alle
Naturgesetze haben in allen gleichförmig zueinander bewegten Koordinatensystemen die gleiche Form. Das ist das so genannte Relativitätsprinzip.
8.4 Galileiinvarianz
151
Um die erwähnte Invarianz konkreter formulieren zu können, müssen wir uns
klarmachen, wie sich die Koordinaten eines Raum-Zeitpunktes in gleichförmig
gegeneinander bewegten Koordinatensystemen ineinander umrechnen lassen.
Wenn sich das System S vom System S 0 aus gesehen mit der Geschwindigkeit
~u bewegt, so gilt gemäß der Galileitransformation
~x0
= ~x + ~ut
t0
=
t,
(8.32)
falls entsprechende Achsen von S und S 0 zueinander parallel sind und die Ursprünge zur Zeit t = t0 = 0 zusammenfallen. Naturgesetze, die bei der Galileitransformation (8.32) ihre Form behalten, heißen galileiinvariant.
Bekanntlich entspricht die Galileiinvarianz nur einer näherungsweise gültigen
Symmetrie der Natur. Die Galileitransformation (8.32) ist zwar vom Alltag
geläufig und daher anschaulich, ist jedoch, wie später auszuführen sein wird,
völlig unbrauchbar, wenn die Relativgeschwindigkeit ~u betragsmäßig nicht vernachlässigbar ist gegenüber der Lichtgeschwindigkeit.
Die Newtonsche Mechanik für Teilchenhaufen, die über ihre Gravitationsanziehung wechselwirken, ist eine galileiinvariante Theorie. Für das ν-te Teilchen
in einem solchen Haufen gilt die Bewegungsgleichung
mν
X mν mµ (~xµ − ~xν )
d2 ~xν
=G
.
2
dt
|~xµ − ~xν |3
(8.33)
µ(6=ν)
Da die Teilchenmassen in allen galileischen Koordinatensystemen (d. h. Koordinatensystemen, die durch Galileitransformationen verknüpft sind) gleich sind
und da gemäß (8.32)
d2 ~xν
d2 ~x0ν
=
,
2
dt
dt0 2
~xµ − ~xν = ~x0µ − ~x0ν ,
(8.34)
folgt aus der Gültigkeit der Bewegungsgleichung
mν
X mν mµ (~xµ − ~xν )
d2 ~x0ν
=G
.
2
dt
|~xµ − ~xν |3
(8.35)
µ(6=ν)
Wie behauptet, ändert die Bewegungsgleichung ihre Form nicht unter Galileitransformationen.
Die Newtonsche Mechanik ist, ebenso wie die Galileitransformation, nur
näherungsweise richtig. Wir wissen heute, dass sie nur gilt, solange die Geschwindigkeit aller Teilchen vernachlässigbar klein ist im Vergleich zur Lichtgeschwindigkeit.
Bevor wir zur Besprechung der auch für große Relativgeschwindigkeiten
gültigen Koordinatentransformation übergehen, sollen zwei Eigenschaften der
Galileitransformation (8.32) besonders hervorgehoben werden. Beachten Sie,
was im Alltag selbstverständlich erscheint, dass die Zeitkoordinate in allen Koordinatensystemen die gleiche ist und dass in t0 = t die räumlichen Koordinaten
nicht eingehen. Gemäß der Galileitransformation sollte eine gleichförmig bewegte Uhr gleich schnell gehen wie eine ruhende.
152
8 Symmetrien
Betrachten wir auch, dass die Galileitransformation das uns geläufige Additionsgesetz für Geschwindigkeiten beinhaltet. Lesen wir (8.32) als Zusammenhang
zwischen den Koordinaten ~x(t) und ~x0 (t) eines gleichförmig bewegten Teilchens
und differenzieren nach der Zeit. Mit ~v = d~x/dt und ~v 0 = d~x/dt entsteht das
Gesetz
Abbildung 8.4
welches durch Abbildung 8.4 veranschaulicht ist. Geschwindigkeiten addieren
sich wie Vektoren.
8.5
Lorentzinvarianz
Während eine bewegte Uhr 10 mal tickt, tickt eine gleich gebaute ruhende Uhr
auch 10 mal? Experimente mit Armbanduhren und Schnellzügen legen eine
bejahende Antwort nahe. Experimente mit hinreichend schnellen Teilchen erzwingen das Nein: die bewegte Uhr geht langsamer als die ruhende Kopie.
Ein lustiges Beispiel geben µ Mesonen, die im äußeren Teil der irdischen
Atmosphäre (einige 10 km über der Erdoberfläche) durch dort einfallende kosmische Strahlen erzeugt und dabei mit außerordentlich hohen Geschwindigkeiten ausgestattet werden. Nun sind Muonen instabile Teilchen. Ruhende
Muonen zerfallen durchschnittlich nach 2 · 10−6 s. Die Alltagserfahrungen mit
D-Zügen und Rennwagen lassen uns erwarten, dass Muonen, welche fast mit
Lichtgeschwindigkeit in Richtung Erdoberfläche rasen, im Durchschnitt etwa
3 · 105 (km/sec) · 2 · 10−6 s ≈ 600m weit fliegen, bevor sie zerfallen; demnach
sollten durch kosmische Strahlung erzeugte Muonen allenfalls in hoch fliegenden
Luftballons, nicht aber an der Erdoberfläche nachweisbar sein. Tatsächlich fallen
viele im Bodenlabor ein. Der unten noch ausführlicher zu diskutierende Grund
dafür ist dieser: während für die Muonen 2 · 10−6 s vergehen, verstreicht im Bodenlabor, relativ zu dem sich die Muonen schnell bewegen, eine viel längere Zeit
(die wir unten berechnen). Die Zeiteinheit mittlere Lebensdauer eines Muons“
”
beträgt ∼ 2 · 10−6 sec für eine mitbewegte Uhr, relativ zu der das Muon ruht,
jedoch mehr für die Uhr im Labor. Die für die Beschreibung schnell bewegter
Muonen einschlägigen Grundgesetze sind nicht galileiinvariant.
Auch die Alltagserfahrung, dass Geschwindigkeiten sich wie Vektoren addieren, wird hinfällig bei Experimenten mit schnellen Teilchen. Ein einleuchtendes
und historisch bedeutsames Beispiel gibt das Michelson-Morley Experiment, das
wir kurz besprechen wollen.
Bezüglich eines mit der Sonne starr verbundenen Koordinatensystems Ss
bewegt sich die Erde mit einer Geschwindigkeit von |~u| ≈ 30 km/sec. Durch
den Raum reisende Lichtsignale sollten, wenn das Vektoradditionsgesetz für
Geschwindigkeiten gilt, im System Ss eine andere Geschwindigkeit haben, als
8.5 Lorentzinvarianz
153
im mit der Erde fest verbundenen System SE . Gilt denn
?
~cS = ~cE + ~u ?
(8.36)
Es müsste dann, falls in Ss die Lichtgeschwindigkeit richtungsunabhängig ist,
auf der Erde eine Anisotropie der Lichtausbreitung feststellbar sein, d. h. eine Abhängigkeit der Lichtgeschwindigkeit |~cE | = ~cs − ~u vom Winkel zwischen
~u und ~cs . Das Michelson-Morley Experiment war darauf angelegt, eine derartige Anisotropie nachzuweisen. Das Resultat war negativ (übrigens zu allen
Jahreszeiten).
Ein positives Resultat des Michelson-Morley Experiments, d. h. eine Richtungsabhängigkeit des Beitrages der Lichtgeschwindigkeit (oder eine jahreszeitliche Schwankung solcher Anisotropie) für irdische Beobachter hätte das Relativitätsprinzip in Schwierigkeiten gebracht. Warum sollte die Lichtausbreitung im
heliozentrischen (oder in irgendeinem galaktischen) Koordinatensystem isotrop
sein, nicht aber im geozentrischen Koordinatensystem? Die experimentell gefundene Isotropie der Lichtausbreitung ist im Einklang mit dem Relativitätsprinzip
und zeigt, dass das vektorielle Additionsgesetz (1) für Geschwindigkeiten zumindest für Lichtausbreitung nicht richtig sein kann.
Erinnern wir uns an den Aufbau des Michelson-Morley Experiments. Auf
einem starren Rahmen montiert sind eine Lampe, ein halbdurchlässiger Spiegel
H, zwei Spiegel S1 und S2 sowie ein Schirm (Abbildung 8.5). Auf dem Schirm
entsteht durch Überlagerung der von S1 und S2 reflektierten Teilstrahlen ein
Interferenzmuster. Zunächst ist die Anordnung so orientiert, dass HS2 parallel
zur Bahngeschwindigkeit der Erde verläuft. Anschließend wird die Anordnung
um 90◦ gedreht, so das H S1 entlang der Erdbahn weist. Eine Anisotropie der
Lichtausbreitung auf Grund der Bewegung der Erde im heliozentrischen Bezugssystem müsste sich in einer Verschiebung des Interferenzmusters auf dem
Schirm zeigen. (Zur Übung machen Sie sich selbst wieder klar, welche Laufzeitunterschiede für die Phasen der Lichtwelle auftreten müssten, wenn (8.36)
gälte.) Tatsächlich ist keine Verschiebung beobachtbar.
Zu folgern ist, dass die Lichtgeschwindigkeit in allen gleichförmig zueinander bewegten Bezugssystemen gleich ist. Ebenfalls, dass die Naturgesetze, die
die Lichtausbreitung beschreiben, nicht galileiinvariant sein können, denn wir
hatten gesehen, dass die Galileitransformation die vektorielle Geschwindigkeitsaddition beinhaltet.
Wir werden sehen, dass die Koordinatentransformation zwischen gleichförmig
zueinander bewegten Koordinatensystemen eindeutig festgelegt ist durch die
Forderungen der Konstanz der Lichtgeschwindigkeit und der Isotropie und Homogenität des Raumes sowie der Homogenität der Zeit in allen diesen Koordinatensystemen. Die resultierende Koordinatentransformation ist die Lorentztransformation.
Wir werden uns auch klarmachen, dass die Maxwellsche Elektrodynamik,
d. h. die für Lichtausbreitung zuständige Theorie, lorentzinvariant ist; ferner,
wie die galileiinvariante Newtonsche Mechanik zu einer lorentzinvarianten Theorie verallgemeinert werden kann.
Halten wir fest: in allen Labors“, die gegeneinander verschoben, gekippt
”
oder gleichförmig bewegt aber ansonsten identisch sind, bringen gleiche Experimente gleiche Messergebnisse. Insbesondere die Lichtgeschwindigkeit hat in
154
8 Symmetrien
Abbildung 8.5
allen solchen Labors denselben Wert. Folglich müssen alle Grundgesetze invariant sein unter den Koordinatentransformationen Translation, Rotation und
Lorentztransformation entsprechend konstanter Relativgeschwindigkeit.
Kapitel 9
Spezielle Relativitätstheorie
9.1
Die Lorentztransformation der Koordinaten
Von einem Punkt ~x1 werde zur Zeit t1 (bezüglich irgendeines Koordinatensystems S) ein Lichtsignal ausgesandt und gelange zur Zeit t2 am Punkt ~x2 an.
Da Licht sich mit der endlichen Geschwindigkeit c ausbreitet, gilt zwischen den
Koordinaten ~x1 , t1 und ~x2 , t2 der Zusammenhang
(x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − c2 (t2 − t1 )2 = 0 .
(9.1)
0
In einem zu S mit konstanter Geschwindigkeit ~u bewegten System S haben
Aussendung und Ankunft des Lichtsignals andere Koordinaten, die wir ~x 01 , t01
bzw. ~x02 , t02 nennen können. Dabei müssen wir insbesondere auch die Möglichkeit
zulassen, dass t1 6= t01 ist, d. h. dass die Zeit ihre in der Galileitransformaiton
ausgezeichnete Rolle verliert. Da die Lichtgeschwindigkeit bezüglich S 0 den
gleichen Wert wie bezüglich S hat, gilt in S 0 auch
(x02 − x01 )2 + (y20 − y10 )2 + (z20 − z10 )2 − c2 (t02 − t01 )2 = 0 .
(9.2)
Um den folgenden Überlegungen eine anschauliche geometrische Interpretation geben zu können, denken wir uns ein vierdimensionales Koordinatensystem
mit drei räumlichen Achsen x, y, z und einer zusätzlichen Achse, auf der wir die
Zeit auftragen. Einen Punkt im Raum-Zeit-Kontinuum nennen wir ein Ereignis und definieren den Minkowskiabstand τ12 zweier Ereignisse ~x1 , t1 und ~x2 , t2
durch
2
−τ12
= (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − c2 (t2 − t1 )2 .
(9.3)
Gemäß dieser Definition haben zwei durch Lichtsignale verbundene Ereignisse den Abstand Null. Aus der Konstanz der Lichtgeschwindigkeit folgt, dass ein
in irgendeinem System S verschwindender Abstand auch in allen anderen dazu
gleichförmig bewegten Systemen S 0 verschwindet. Dies ist eine starke Forderung
an die Koordinatentransformation von S und S 0 .
Darüber hinaus muss die gesuchte Lorentztransformation auch nicht verschwindende Abstände invariant lassen, wenn nicht die in S etwa konstatierte
Homogenität und Isotropie des Raumes und die Homogenität der Zeit in S 0
verloren sein soll. Um diese weitere Forderung zu begründen, betrachten wir
155
156
9 Spezielle Relativitätstheorie
insbesondere zwei infinitesimal benachbarte Ereignisse, deren Koordinaten in
S ~x, t und ~x + d~x, t + dt bzw. in S 0 ~x0 , t0 und ~x0 + d~x0 , t0 + dt0 lauten. Die entsprechenden Abstände dτ und dτ 0 müssen, da im gleichen Sinn klein, einander
proportional sein
dτ 0 = adτ ,
(9.4)
wobei der Proportionalitätsfaktor a wegen der Homogenität von Raum und Zeit
nicht von ~x und t nicht von ~x und t abhängen darf. Bleibt zu diskutieren, ob
a von der Relativgeschwindigkeit ~u der beiden Systeme S und S 0 abhängen
kann. Aus der Isotropie des Raumes können wir sofort folgern, dass jedenfalls
die Richtung von ~u nicht in a eingehen darf, so dass allenfalls eine Abhängigkeit
vom Betrag |~u| in Frage kommt.
Um letztere Möglichkeit zu prüfen, betrachten wir drei Systeme S, S 0 und
00
S . Es mögen sich von S aus gesehen, S 0 mit ~v1 und S 00 mit ~v2 bewegen. Die
Relativgeschwindigkeit zwischen S 00 und S 0 heiße ~v12 . Für die Abstände der
beiden differenziell benachbarten Ereignisse haben wir die Relationen
dτ 0
=
a(|~v1 |)dτ
dτ 00
=
a(|~v2 |)dτ
dτ 0
=
a(|~v12 |)dτ 00 ,
(9.5)
die nur dann miteinander verträglich sind, wenn gilt
a(|~v12 |) =
a(|~v1 |)
.
a(|~v2 |)
(9.6)
Die linke Seite dieser Gleichung hängt vom Winkel zwischen den Vektoren ~v1
und ~v2 ab, die rechte aber nicht, so dass jede Abhängigkeit des Proportionalitätsfaktors a von irgendeiner Geschwindigkeit auszuschließen ist. Es folgt a = 1
und somit
dτ = dτ 0 ,
(9.7)
also die Invarianz differenzieller Abstände unter der gesuchten Lorentztransformation. Da endliche Abstände sich als Summen differenzieller Abstände darstellen lassen, muss die gesuchte Lorentztransformation sogar beliebige Abstände
im Raum-Zeit-Kontinuum erhalten.
Erinnern wir uns an Altbekanntes aus dem gewöhnlichen (euklidischen)
dreidimensionalen Raum. Die einzigen Koordinatentransformationen die den
gewöhnlichen (euklidischen) Abstand
¡
¢1/2
d12 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2
(9.8)
invariant lassen, sind Translationen und Drehungen. Zwar ist das vierdimensionale Raum-Zeit-Kontinuum kein euklidischer Raum mit vier völlig gleichberechtigten Achsen (wegen des einen Minuszeichens vor dem Zeitquadrat in (9.3)),
jedoch legt die Ähnlichkeit des Abstandes (9.3) mit dem gewöhnlichen Abstand
(9.8) die Vermutung nahe, dass die den Abstand (9.3) erhaltenden Koordinatentransformationen gerade Translationen und Drehungen“ sind.
”
9.1 Die Lorentztransformation der Koordinaten
157
Translationen sind Transformationen der Form
~
~x0 = ~x + d,
t0 = t + t 0
(9.9)
und erhalten offenbar den Abstand (9.3). Das ist gut so, sonst wäre der Homogenität von Zeit und Raum verletzt. Drehungen“ im vierdimensionalen
”
Raum-Zeit-Kontinuum sind insbesondere auch rein räumliche Drehungen
x0i =
3
X
Rij xj ,
t0 = t,
RR̃ = 1 ,
(9.10)
j=1
denn diese lassen, wie wir im letzten Kapitel gelernt haben, den gewöhnlichen
räumlichen Abstand d12 (9.8) und somit auch den Minkowskischen Abstand τ12
invariant. Diese rein räumlichen Rotationen haben natürlich nichts mit einer
relativen Bewegung von S und S 0 zu tun.
Unter den Drehungen“ ohne Analogon im gewöhnlichen Raum muss es sol”
che geben, die sich ganz in der x − t-Ebene vollziehen, so dass die Koordinaten
y und z sich gar nicht ändern und die Koordinaten x0 , t0 in S 0 mit den entsprechenden in S, also x und t, linear zusammenhängen. Physikalisch müssen solche
Drehungen“ einer Relativgeschwindigkeit ~u zwischen S und S 0 entsprechen, die
”
parallel zur x- und x0 -Achse verläuft. Setzen wir an
ct0 = Ax + Bct
x0 = Cx + Dct
y0 = y
z0 = z .
(9.11)
Zur Bestimmung der vier Parameter A, B C, D haben wir zunächst die Forderung, dass der Minkowskiabstand des Ereignisses ~x, t vom Ursprung invariant
bleiben muss, d. h.
2
2
c 2 t2 − x 2 = c 2 t0 − x 0 .
(9.12)
Da x0 und t0 beliebig sind, ergeben sich nach Eintragen von (9.11) drei unabhängige Gleichungen, so dass in der Transformation (9.11) ein freier Parameter bleibt. Wir finden leicht AB − CD = 0, A2 − C 2 = −1 B 2 − D2 = 1, wählen
den freien Parameter gemäß A = D = sinh ψ, B = C = cosh ψ und erhalten die
Drehung“
”
ct0 = ct cosh ψ + x sinh ψ
x0 = ct sinh ψ + x cosh ψ .
(9.13)
Der Drehwinkel“ ψ muss sich durch die Geschwindigkeit u ausdrücken lassen,
”
mit der sich S relativ zu S 0 bewegt. Um diesen Zusammenhang zu finden,
betrachten wir insbesondere den räumlichen Ursprung von S, der zu allen Zeiten
t die Koordinate x = 0 hat. Im System S 0 hat er die Koordinaten
ct0 = ct cosh ψ,
x0 = ct sinh ψ ,
158
9 Spezielle Relativitätstheorie
woraus folgt
u
x0
= tanh ψ = .
(9.14)
0
ct
c
Damit ist die Lorentztransformation voll spezifiziert und lautet für den Fall, dass
S sich von S 0 aus gesehen mit der Geschwindigkeit u in x0 -Richtung bewegt,
ct + uc x
ct0 = p
1 − u2 /c2
x0 = p
ut + x
1 − u2 /c2
y0 = y
z0 = z .
(9.15)
Beachten wir, dass die Lorentztransformation (9.15) im Grenzfall kleiner
Relativgeschwindigkeiten, d. h. in nullter Ordnung in u/c in die aus dem Alltag
bekannte Galileitransformation übergeht. Da für Waldläufer, Schnellzüge und
sogar für unerlaubt schnelle Autos das Verhältnis u/c stets klein ist, gilt im
Erfahrungsbereich des Alltags die Galileitransformation mit guter Genauigkeit.
Für u = c und u > c verliert die Lorentztransformation (9.15) ihren Sinn, da
die Nenner verschwinden bzw. imaginär werden. Dem entspricht die Erfahrung,
dass die Bewegung von massiven Teilchen mit Licht- und Überlichtgeschwindigkeit nicht möglich ist.
9.2
Relativität der Gleichzeitigkeit
In der Galileitransformation war die Zeitkoordinate ausgezeichnet. Wegen t = t 0
ist es beim Umgang mit langsamen Teilchen wie Radfahrern etc. erlaubt und beliebt, von einer absoluten Zeit zu reden. Nicht mehr beim Umgang mit schnellen
Teilchen. Es ist eine der erstaunlichsten Konsequenzen der Lorentztransformation, dass zwei Ereignisse, die für einen Beobachter gleichzeitig erscheinen, für
einen anderen, relativ zum ersten bewegten Beobachter zu verschiedenen Zeitpunkten stattfinden.
Der Beobachter B benutze das System S und registriere zwei gleichzeitige
Ereignisse an benachbarten Orten auf der x-Achse, d. h. ∆t = 0 und ∆x 6=
0. Der Beobachter B 0 sehe S mit u in x0 -Richtung fahren und registriert für
dieselben Ergebnisse
³
´
u
∆x
u/c
1
∆t + 2 ∆x = p
·
6= 0 .
(9.16)
∆t0 = p
2
2
2
2
c
c
1 − u /c
1 − u /c
Wegen des Faktors u/c sind wir durch Alltagserfahrung nicht an diese Relativität
des Begriffs der Gleichzeitigkeit gewöhnt.
9.3
Zeitdilatation
Als empirisches Resultat bei schnellen Teilchen hatte ich Ihnen schon vorgestellt,
dass schnell bewegte Uhren deutlich langsamer gehen als ruhende. Jetzt können
wir’s nachrechnen.
9.3 Zeitdilatation
159
Der Beobachter B schaue auf seine ruhende Uhr. Zwei aufeinander folgende
Ticks sind Ereignisse mit den Koordinatendifferenzen ∆~x = 0 und ∆t, wobei
∆t die vom Fabrikanten garantierte, der Uhr eigene Zeiteinheit ist. Der Minkowskiabstand dieser Ticks ist
p
∆τ = c2 (∆t)2 − (∆~x)2 = c∆t .
(9.17)
Wir werden künftig die mit der Einheit ∆t = ∆τ /c multiplizierte laufende Zahl
der Ticks der Uhr die Eigenzeit der Uhr nennen.
Der Beobachter B 0 sehe die Uhr mit Geschwindigkeit u in die x0 -Richtung
fliegen. Er registriert mit Hilfe von Uhren, die längs der x0 -Achse ruhend aufgestellt sind, für das Zeitintervall zwischen zwei Ticks der bewegten Uhr den Wert
∆t0 ; überdies sieht er die Ticks an verschiedenen Orten stattfinden, die um die
räumliche Distanz ∆x0 = u∆t0 auseinander liegen. Er gibt den Minkowskiabstand der beiden Ticks an als
p
p
(9.18)
∆τ 0 = c2 (∆t0 )2 − u2 (∆t0 )2 = c∆t0 1 − u2 /c2 .
Der Minkowskiabstand zweier Ereignisse ist aber in allen gleichförmig zueinander bewegten Systemen gleich, so dass wir folgern
∆t0 = p
∆t
1 − u2 /c2
.
(9.19)
Die bewegte Uhr scheint langsamer zu ticken als ihr ruhendes Duplikat.
Eine drastische Illustration der Zeitdilatation erfährt ein fiktiver Reisender
am Rand einer schnell rotierenden Kreisscheibe (Abbildung 9.1). Vom ruhenden
Laborsystem aus gesehen dauert eine Rundreise Tlab , entsprechend der Kreisfrequenz ω = 2π/Tlab . Der Reisende liest auf seiner mitgeführten Uhr als Zeit
einer Umdrehung Trot ab. Die nachfolgende Rechnung zeigt Trot < Tlab (Reisen
erhält jung).
Abbildung 9.1
Bei der Berechnung der Zeit Trot stoßen wir zunächst auf die Schwierigkeit, dass die Bewegung des Reisenden nicht mit konstanter Geschwindigkeit
erfolgt, also nicht gleichförmig ist, so dass die Lorentztransformation gar nicht
anwendbar scheint. Wir können aber die Kreisbewegung des Reisenden durch
eine stückweise gleichförmige Bewegung längs eines Polygonzuges approximieren (Abbildung 9.2). Bezüglich jedes Geradenstücks geben wir mit Hilfe der
160
9 Spezielle Relativitätstheorie
Abbildung 9.2
Lorentztransformation den Zusammenhang zwischen der Reisedauer ∆tlab in
Laborzeit und der Reisedauer ∆trot der Bordzeit an,
∆tlab = p
∆trot
1−
u2 /c2
≈p
∆trot
1 − ω 2 R2 /c2
(9.20)
wobei die Reisegeschwindigkeit als u = ωR approximiert wurde. In den Ecken
des Polygons verbringt der Reisende keine Zeit. Also finden wir die Reisezeit
für einen Umlauf durch Summieren der Zeiten, die auf den Geradenstücken
verbracht werden. Wir denken uns die Polygoneinteilung beliebig verfeinert
und erhalten
p
(9.21)
Tlab = Trot / 1 − ω 2 R2 /c2 > Trot .
Das gewonnene Resultat verdient eine weitere Bemerkung. Wenn wir unter
Berufung auf die Lorentztransformation feststellen, dass eine gleichförmig bewegte Uhr langsamer geht als eine ruhende, so tut sich eine Schwierigkeit auf.
Welche der beiden Uhren bewegt sich und geht daher langsamer? Der Beobachter B könnte dem Reisenden B 0 zurufen: Ich ruhe, Du fliegst, ich altere
”
leider schneller“. Mit nicht minderem Recht könnte B 0 sich selbst für ruhend
halten und B um die höhere Lebenserwartung beneiden. Ein Paradox? Nein,
denn die beiden gegeneinander gleichförmig bewegten Beobachter begegnen sich
einmal und nie wieder, haben also keine Möglichkeit eines späteren Uhrenvergleichs. Anders die beiden Menschen, deren einer auf der rotierenden Scheibe
reist, während der andere im Labor sitzt und mit dem Reisenden nach jedem
Umlauf die Uhren vergleichen kann. Kein Zweifel nun, wer hier reist und wer
ruht. Der Mitrotierende fühlt Beschleunigungskräfte, der Ruhende nicht. Kein
Zweifel, der Ruhende altert schneller.
Bei Rundflügen schneller Flugzeuge ist inzwischen auch experimentell verifiziert, dass die auf Borduhren ermittelte Reisedauer kleiner ist als die auf im
Ausgangspunkt ruhenden Uhren abgelesene.
Für Astronomen wichtig ist das folgende Exempel der Zeitdilatation für
bewegte Uhren. Denken wir uns als Uhr“ eine monochromatische Strahlungs”
quelle auf einem entfernten Stern. Die Ticks“ dieser Uhr erfolgen, wenn die
”
Quelle als ruhend beobachtet wird, im Zeitabstand ∆t = 1/ν. Wenn sich die
Quelle jedoch relativ zum Beobachter mit der Geschwindigkeit ~u bewegt, so ist
das Zeitintervall ∆t0 zwischen der Emission aufeinander folgender Wellenmaxima durch (9.19) gegeben. Dies ist jedoch nicht die Zeitspanne ∆tobs zwischen
den Ankünften aufeinander folgender Wellenmaxima beim Beobachter, denn im
9.4 Längenkontraktion
161
Intervall ∆t0 bewegt sich die Quelle und verändert die Distanz zum Beobachter
um ~ur ∆t0 , entsprechend der Komponente ~ur der Geschwindigkeit ~u längs der
Verbindungslinie von Beobachter zur Quelle (Abbildung 9.3).
Abbildung 9.3
Demnach hat jedes Wellenmaximum einen Weg zum Beobachter zurückzulegen, der um ~ur ∆t0 gegenüber dem Weg des vorangehenden Maximums geändert
ist. Die Wellenmaxima sind bei der Ankunft beim Beobachter zeitlich um
∆tobs = ∆t0 +
ur 0
1 + ur /c
∆t = p
∆t
c
1 − u2 /c2
(9.22)
getrennt. Die vom Beobachter registrierte Frequenz νobs = 1/∆tobs des Lichts
ist also verschieden von der Frequenz ν = 1/∆t, die er fände, wenn die Quelle
ruhte, und es gilt
p
1 − u2 /c2
ν.
(9.23)
νobs =
1 + ur /c
Sie prüfen leicht nach, dass diese so genannte Dopplerverschiebung eine Rotverschiebung (νobs < ν) darstellt, wenn sich die Quelle vom Beobachter entfernt,
während das Licht einer sich nähernden Quelle blauverschoben ist (νobs > ν).
Ich hatte auf die astronomische Bedeutung dieser Dopplerverschiebung hingewiesen. Im Licht vieler Sterne findet man eine Vielfalt von Spektrallinien, aus
denen sich oft Spektren bestimmter Atome oder Ionen aussondern lassen. In
solchen Fällen besteht die Möglichkeit, einzelne Spektrallinien zu identifizieren
und deren Frequenzen νobs zu vergleichen mit den Frequenzen ν der entsprechenden im irdischen Labor erzeugten Linien. Aus dem Verhältnis ν/νobs kann
dann die Relativgeschwindigkeit zwischen dem entsprechenden Stern und der
Erde bestimmt werden.
9.4
Längenkontraktion
Es ist eine weitere unerwartete Konsequenz der Lorentztransformation - und
somit eine Eigenschaft der Natur -, dass an ein- und demselben Körper verschiedene Lineardimensionen vermessen werden, je nachdem, ob er in Ruhe oder in
Bewegung ist.
162
9 Spezielle Relativitätstheorie
Im System S ruhe ein Maßstab der Länge l parallel zur x-Achse. Im achsenparallelen System S 0 bewege sich der Stab mit seinem Ruhesystem mit der
Geschwindigkeit u in x0 -Richtung. Im System S 0 sollen zu einem Zeitpunkt t0 die
Endpunkte x0links und x0rechts gemessen werden. Mit den Endpunkten xlinks und
xrechts im Ruhesystem bestehen die durch die Lorentztransformation gegebenen
Zusammenhänge
xlinks = p
xrechts = p
1
1 − u2 /c2
1
1−
u2 /c2
(−ut0 + x0links )
(−ut0 + x0rechts ) .
(9.24)
Die Länge l = xrechts −xlinks im Ruhesystem des Stabes und die Länge bezüglich
des Systems S 0 , l0 = x0rechts − x0links , sind also verknüpft durch
p
l0 = l 1 − u2 /c2 ≤ l .
(9.25)
Die größtmögliche Länge hat der Stab in seinem Ruhesystem.
Quer zur Bewegungsrichtung (hier der x0 -Richtung) erleidet der Stab keine Kontraktion, da die Lorentztransformation die entsprechenden Koordinaten
unverändert lässt.
9.5
Addition von Geschwindigkeiten
Wie schon mehrfach angedeutet, addieren sich große ( relativistische“, d. h.
”
|~v | 6¿ c) Geschwindigkeiten nicht wie Vektoren.
Betrachten wir die gleichförmige Bewegung eines Teilchens von zwei achsenparallelen Systemen S und S 0 aus, wobei S sich bezüglich S 0 in x0 -Richtung
mit der Geschwindigkeit u bewegen soll. Bezüglich S (S 0 ) bewegt sich das Teilchen im Zeitintervall ∆t(∆t0 ) um d~x(d~x0 ). Die Lorentztransformation gibt die
Zusammenhänge
p
dt0 = (dt + u dx/c2 )/ 1 − u2 /c2
p
dx0 = (u dt + dx)/ 1 − u2 /c2
dy 0 = dy
dz 0 = dz .
(9.26)
Hier finden wir sofort die Relation der Geschwindigkeiten ~v = d~x/dt und ~v 0 =
d~x0 /dt0 zu
p
1 − u2 /c2
u + vx
0
0
=
v
,
v
,
vx =
y
y
1 + uvx /c2
1 + uvx /c2
p
1 − u2 /c2
0
vz = v z
.
(9.27)
1 + uvx /c2
Dieses Transformationsgesetz reduziert sich für hinreichend kleine Geschwindigkeiten auf das Additionsgesetz für gewöhnliche Vektoren, liefert jedoch drastisch andere Resultate als letzteres, wenn die beteiligten Geschwindigkeiten groß
9.6 Lorentzinvarianz der Maxwellschen Gleichungen
163
werden. Insbesondere lesen wir aus (9.27) wieder ab, dass die Lichtgeschwindigkeit eine nicht überschreitbare Grenzgeschwindigkeit ist. Für ~v = (c, 0, 0) ist
auch ~v 0 = (c, 0, 0).
9.6
Lorentzinvarianz der Maxwellschen Gleichungen
Wir hatten in 6.5 die Maxwellschen Gleichungen als Wellengleichungen für das
~ und das skalare Potential ϕ geschrieben. Diese Form der
Vektorpotential A
Maxwell-Gleichung erlaubt einen leichten Nachweis der Lorentzinvarianz der
Maxwellschen Elektrodynamik, den ich jetzt führen will.
Im Koordinatensystem S lauten die Wellengleichungen der Potentiale
¶
µ
1 ∂2 ~
= −~j/ε0 c2
(9.28)
∆2 − 2 2 A
c ∂t
¶
µ
1 ∂2
∆2 − 2 2 ϕ = −ρ/ε0 ,
c ∂t
wobei ~j die elektrische Stromdichte und ρ die Ladungsdichte sind und die Potentiale der Lorentzkonvention
~+ 1 ∂ϕ=0
div A
c2 ∂t
(9.29)
unterworfen sind. Um zu zeigen, dass im zu S achsenparallelen System S 0 ,
bezüglich dessen S sich mit der Geschwindigkeit u in x0 -Richtung bewegt, die
Gleichungen (9.28) und (9.29) ihre Form behalten, müssen wir die Lorentztransformation der Koordinaten (ct, ~x) eintragen und das Transformationsverhalten
~ sowie der Quellen ρ und ~j finden.
der Potentiale ϕ und A
Aus der Lorentztransformation
ct0 = γ (ct + βx),
x0 = γ (βct + x),
y 0 = y,
z0 = z
mit
p
1 − u2 /c2 ,
(9.30)
µ
¶
∂t0 ∂
∂x0 ∂
∂
=
+
erhalten wir zunächst mit Hilfe der Kettenregel
∂t
∂t ∂t0
∂t ∂x0
β = u/c,
γ = 1/
µ
¶
1 ∂
∂
1 ∂
=γ β 0 +
c ∂t
∂x
c ∂t0
¶
µ
1 ∂
∂
∂
+
β
=γ
∂x
∂x0
c ∂t0
∂
∂
=
∂y
∂y 0
∂
∂
= 0 .
∂z
∂z
(9.31)
164
9 Spezielle Relativitätstheorie
Wir können sofort die Lorentzinvarianz der Lorentzkonvention prüfen, indem
wir (9.31) in (9.29) verwenden,
∂
∂
1 ∂
∂
Az +
Ay +
Ax + 2 ϕ
∂z
∂y
∂x
c ∂t
µ
¶
µ
¶
∂
∂
1
∂
1 ∂
1 ∂
∂
= 0 Az + 0 Ay + γ
+β
ϕ
Ax + γ β 0 +
0
0
0
∂z
∂y
∂x
c ∂t
∂x
c ∂t c
µ
µ
¶
¶
∂
∂
1
1
1 ∂
∂
γ Ax + βϕ +
γ βAx + ϕ .
= 0 Az + 0 Ay +
∂z
∂y
∂x0
c
c ∂t0
c
0=
Wenn wir die transformierten Potentiale wählen gemäß
ϕ0 /c = γ(βAx + ϕ/c)
A0x = γ(Ax + βϕ/c)
(9.32)
A0y = Ay
A0z = Az ,
so lautet die Lorentzkonvention in S 0 genauso wie in S, nämlich
0=
∂ 0
∂
∂ 0
1 ∂
~ 0 + 1 ∂ ϕ0 .
Az + 0 A0y +
A x + 2 0 ϕ0 = ∇ 0 · A
0
0
∂z
∂y
∂x
c ∂t
c2 ∂t0
(9.33)
~
Im Vergleich von (9.32) und (9.30) zeigt sich, dass sich das Quadrupel (ϕ/c, A)
genauso transformiert wie das Quadrupel der Koordinaten (ct, ~x). Wir werden
~ künftig das Viererpotential des elektromagnetischen Feldes nennen.
(ϕ/c, A)
Wenden wir uns jetzt den Wellengleichungen (9.28) zu. Den links stehenden
Differentialoperator rechnen wir mit der Transformation (9.32) auf die Koordinaten (ct0 , ~x0 ) um,
µ
¶2
∂2
∂
∂2
∂2
1 ∂
∂2
1 ∂
∂2
2
+
+
γ
+
+
−
=
+
β
∂z 2
∂y 2
∂x2
c2 ∂t2
∂x0
c ∂t0
∂z 0 2
∂y 0 2
µ
¶2
1 ∂
∂
− γ2 β 0 +
∂x
c ∂t0
µ 2
¶
∂2
∂
1 ∂2
∂2
−
= 02 + 02 +
γ 2 (1 − β 2 )
c2 ∂t0 2
∂z
∂y
∂x0 2
=
∂2
∂2
1 ∂
∂2
+
+
− 2 02 ,
2
2
c ∂t
∂z 0
∂y 0
∂x0 2
(9.34)
und sehen, dass er beim Übergang von S zu S 0 seine Form beibehält. Um die
~ 0 ) im System S 0 zu erhalten, bilWellengleichungen für die Potentiale (ϕ0 /c, A
den wir Linearkombinationen der Gleichungen (9.28) gemäß der Transformation
9.7 Feld einer gleichförmig bewegten Punktladung
165
(9.32) der Potentiale,
µ
¶
1 ∂2
∇ − 2 0 2 A0z (~x0 , t0 ) = −jz (~x, t)/ε0 c2
c ∂t
¶
µ
1 ∂2
02
∇ − 2 0 2 A0y (~x0 , t0 ) = −jy (~x, t)/ε0 c2
c ∂t
µ
¶
1 ∂2
02
∇ − 2 0 2 A0x (~x0 , t0 ) = −γ (jx (~x, t) + βcρ(~x, t)) /ε0 c2
c ∂t
µ
¶
µ
¶
1 ∂2
1
2
∇0 − 2 0 2 ϕ0 (~x0 , t0 ) = −γ β jx (~x, t) + ρ(~x, t) /ε0 .
c ∂t
c
02
(9.35)
Offensichtlich reproduziert sich die Form der Wellengleichungen (9.28) genau,
wenn wir als Transformationsverhalten der Quellen (cρ, ~j) fordern
cρ0 (~x0 , t0 ) = γ (βjx (~x, t) + cρ(~x, t))
jx0 (~x0 , t0 ) = γ (jx (~x, t) + βcρ(~x, t))
(9.36)
jy0 (~x0 , t0 ) = jy (~x, t)
jz0 (~x0 , t0 ) = jz (~x, t) .
Hiernach transformieren sich die Quellen (cρ, ~j) ebenso wie das Viererpotential
~ und die Koordinaten (ct, ~x).
(ϕ/c, A)
Wir haben soeben nachgerechnet, dass die Wellengleichungen (9.28) und die
Lorentzkonvention (9.29) in allen gleichförmig zueinander bewegten Bezugssystemen gelten., wenn sie nur in einem System S richtig sind. Damit ist die
Lorentzinvarianz der Elektrodynamik erwiesen.
Als lehrreiche Übung bleibt Ihnen, das Transformationsverhalten der Felder
~ − grad ϕ
~ =−∂A
E
∂t
~ = rot A
~
B
aufzustellen.
9.7
Feld einer gleichförmig bewegten Punktladung
Die Lorentzinvarianz der Elektrodynamik gestattet häufig, umständliche Rechnungen abzukürzen. Das Feld einer mit konstanter Geschwindigkeit ~u = (u, 0, 0)
bewegten Ladung e, z. B. , lässt sich höchst einfach durch Lorentztransformation aus dem bekannten Feld im Ruhesystem S der Ladung gewinnen. In S
gilt
ϕ=
1 e
,
4πε0 r
~=0
A
(9.37)
166
9 Spezielle Relativitätstheorie
mit r = |~x|. Im Laborsystem S 0 , in welchem sich die Ladung mit u in x0 Richtung bewege, haben wir aus (9.32)
ϕ0 (~x0 , t0 ) = γ
1 e
,
4πε0 r
A0x (~x0 , t0 ) =
1
1 e
γβ
c 4πε0 r
A0y = A0z = 0
(9.38)
Um hieraus ϕ0 , und Ax0 als Funktionen der Laborkoordinaten ~x0 , t0 zu erhalten,
müssen wir nur rechts die Größe r = (x2 +y 2 +z 2 )1/2 durch ~x0 und t0 ausdrücken.
Mit Hilfe der Lorentztransformation (9.30) bzw. deren Umkehrung (die sich
durch u → −u ergibt) erhalten wir
ϕ0 =
=
1
q
4πε0
1
q
4πε0
γe
γ 2 (x0 − βct0 )2 + y 0 2 + z 0 2
e
(x0 − ut0 )2 + (1 − u2 /c2 )(y 0 2 + z 0 2 )
1
A0x = β ϕ0
c
(9.39)
Sie sehen, dass die Äquipotentialflächen von ϕ0 durch (x0 − ut0 )2 + (1 −
2
2
u /c2 )(y 0 + z 0 ) = const > 0 gegeben sind, also die Form von Rotationsellipsoiden haben. Die Symmetrieachse dieser Flächen verläuft natürlich in der
Bewegungsrichtung der Ladung. Beachten Sie auch, dass die Ellipsoide in Bewegungsrichtung abgeplattet sind, u. z. um so stärker, je schneller die Ladung
fliegt. Im Grenzfall u → 0 gehen die Äquipotentialflächen wieder über in die
für die ruhende Ladung charakteristischen Kugeln.
Es ist bemerkenswert, wie leicht das Resultat (9.39) hier mit Hilfe der Lorentztransformation erhältlich ist. Sie dürfen, um ein Gefühl für die Ersparnis
an Rechenaufwand zu kriegen, für sich einen anderen Weg ausprobieren, etwa
die Integration der Wellengleichungen für die Potentiale mit den Quellen
2
ρ = eδ(x − ut)δ(y)δ(z),
9.8
jx = uρ,
j y = jz = 0 .
(9.40)
Lorentzskalare und Lorentzvektoren
Spielen wir wieder mit der geometrischen Analogie zwischen gewöhnlichen Drehungen im dreidimensionalen euklidischen Raum und Lorentztransformationen
im vierdimensionalen Raum-Zeit-Kontinuum. Drehungen lassen den euklidischen Abstand zweier Raumpunkte
¤1/2
£
d12 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2
(9.41)
invariant, während Lorentztransformationen den Minkowskiabstand zweier RaumZeit-Punkte
¤1/2
£
(9.42)
τ12 = c2 (t2 − t1 )2 − d212
unverändert lassen. Wir hatten d12 wie jede unter Drehungen invariante Größe
einen Skalar genannt und entsprechend bezeichnen wir den Minkowskiabstand
9.8 Lorentzskalare und Lorentzvektoren
167
τ12 und jede andere unter Lorentztransformationen invariante Größe als einen
~+
Lorentzskalar. Als weitere Lorentzskalare hatten wir schon die Größen div A
1 ∂
1 ∂2
2
ϕ
und
den
Wellenoperator
∇
−
identifiziert.
c2 ∂t
c2 ∂t2
Vektoren im dreidimensionalen euklidischen Raum kennen Sie als durch Betrag und Richtung festgelegte Größen. Während Betrag und Richtung eines
Vektors bei Drehungen des Koordinatensystems unverändert bleiben, ändert
sich doch das Tripel seiner Koordinaten. Wir hatten nachgerade einen Vektor
~ als ein Zahlentripel (Vx , Vy , Vz ) definiert, das sich bei Drehungen des KoordiV
natensystems genauso transformiert wie die Koordinaten x, y, z eines Punktes,
nämlich
Vi0 =
3
X
Rij Vj
mit
RR̃ = 1 .
(9.43)
j=1
Die Frage liegt nahe, ob es im vierdimensionalen Raum-Zeit-Kontinuum
nicht außer dem Koordinatenquadrupel (ct, x, y, z) eines Ereignisses weitere
Quadrupel (V 0 , Vx , Vy , Vz ) gibt, die sich unter Lorentztransformationen ebenso
verhalten wie das Koordinatenquadrupel, nämlich
0
V 0 = γ(βVx + V 0 )
V 0 x = γ(Vx + βV 0 )
(9.44)
V 0 x = Vy
V 0 z = Vz
wobei wieder β = u/c, γ = (1 − β 2 )−1/2 . Tatsächlich gibt es solche Quadrupel, die wir im Sinne der hier verfolgten Analogie Lorentzvektoren nennen.
Zwei wichtige Lorentzvektoren hatten wir im obigen Streifzug durch die Elek~ und das
trodynamik ausfindig gemacht, das Quadrupel der Potentiale (ϕ/c, A)
Stromdichte-Ladungsdichtequadrupel (cρ, ~j). Weitere Lorentzvektoren werden
folgen.
Die Wichtigkeit des Begriffs des Lorentzvektors ist ganz analog der Wichtigkeit des Begriffs des Vektors. Sie erinnern sich: stimmen zwei Vektoren in
einem Koordinatensystem S überein, so auch in allen anderen zu S verdrehten. Wenn ein Naturgesetz als die Gleichheit zweier Vektoren formuliert werden
kann, so gilt dieses Gesetz gleichermaßen in allen zueinander verdrehten Koordinatensystemen; die Isotropie des Raumes ist dann manifest. Genauso ist das
Relativitätsprinzip, d. h. die Gleichberechtigung aller gleichförmig zueinander
bewegten Koordinatensysteme, manifest, wenn ein Naturgesetz als die Gleichheit zweier Lorentzvektoren geschrieben werden kann; der Grund dafür ist, dass
zwei Lorentzvektoren in allen solchen Koordinatensystemen übereinstimmen,
wenn sie in irgendeinem gleich sind.
Letztere Aussage wirft ein nützliches Verfahren ab zum Prüfen der Lorentzinvarianz von Gleichungsquadrupeln. Die Invarianz ist gesichert, wenn die
vier fraglichen Gleichungen als Gleichheit zweier Lorentzvektoren geschrieben
werden können. Wir hatten diese Methode beim Nachweis der Lorentzinvarianz der Elektrodynamik bereits angewendet: nachdem sich der Wellenopera∂2
tor ∇2 − c12 ∂t
2 als Lorentzskalar erwiesen hatte, ergaben sich die vier Wellen³
´
2
~
gleichungen als Gleichung zwischen den Lorentzvektoren ∇2 − 12 ∂ 2 (ϕ/c, A)
c ∂t
168
9 Spezielle Relativitätstheorie
und (cρ, ~j).
9.9
Relativistischer Impuls und Viererimpuls eines Teilchens
In der Newtonschen Mechanik hatten wir den Vektor m~v den Impuls eines
Teilchens genannt. Der wichtigste Grund für die Beliebtheit dieses Begriffs
beim
P Umgang mit langsamen Teilchen ist, dass der Newtonsche Gesamtimpuls
mν ~vν eines abgeschlossenen Teilchenhaufens zeitlich konstant bleibt. Leider
ν
entfällt dieser Grund, wie wir sehen werden, bei schnellen Teilchen.
Eine weitere
PPeinlichkeit wäre in Kauf zu nehmen, wenn wir den Newtonvν auch zur Formulierung der Kinematik und Dynamik
schen Impuls
ν mν ~
schneller Teilchen verwendeten.
Während
¡P
P sich ¢unter GalileitransPdiese Größe
vν0 = ~u ν mν + ν mν ~vν , gibt die Lorentzformation einfach verhält
ν mν ~
transformation ein abstoßend hässliches, nämlich nichtlineares Transformationsgesetz, das Sie aus dem Transformationsgesetz für die Geschwindigkeit (s. 9.5)
entnehmen können.
Die obigen Betrachtungen legen die Suche nach einer Verallgemeinerung
des Newtonschen Impulses nahe. Diese Verallgemeinerung sollte sich (i) für
|~v |/c ¿ 1 auf den Newtonschen Impuls reduzieren, und (ii) unter Lorentztransformationen einfach benehmen. Es gibt einen solchen relativistischen Impuls,
und wir können ihn leicht finden durch Präzisierung der obigen Kritik am Newtonschen Begriff.
Die Forderungen (i) und (ii) sind sicher erfüllt, wenn der relativistische Impuls p~ ³die drei Raumkomponenten
eines Lorentzvektors gibt. Nun stellt das
´
dy
dz
dx
Tripel m dt , m dt , m dt im Gegensatz zum Tripel (m dx, m dy, m dz) genau
deshalb keinen Teil eines Lorentzvektors dar, weil das im Labor gemessene Zeitinkrement dt kein Lorentzskalar ist. Es gibt aber einen Lorentzskalar, der sich
für ein langsames Teilchen auf dt reduziert, u. z. die Eigenzeit des bewegten
Teilchens, d. h. die Zeit, die auf einer vom Teilchen mitgeführten Uhr abgelesen
werden könnte.
In jedem Augenblick lässt sich ein zum Labor gleichförmig bewegtes Koordinatensystem so finden, in dem das Teilchen ruht. In diesem momentanen
Ruhesystem gilt für die am Teilchen fixiert gedachte Uhr d~x0 = 0, so dass das
auf ihr abgelesene Eigenzeitinkrement dt0 bis auf den Faktor 1c mit dem Inkrement dτ des Minkowskiabstands übereinstimmt. Da dτ ein Lorentzskalar ist,
können wir ihn auch leicht durch die Koordinateninkremente des Teilchens im
Laborsystem ausdrücken,
p
p
dτ = c2 dt2 − d~x2 = c dt 1 − v 2 /c2 .
(9.45)
Wenn wir uns die Bahnkurve des Teilchens mit τ anstatt mit der Laborzeit
parametrisiert denken, so gilt für die Änderungsrate der Teilchenkoordinaten
mit τ
dt d~x
1
~v
d~x
=
=p
.
(9.46)
2
2
dτ
dτ dt
1 − v /c c
Bis auf den Faktor 1c stimmt also d~x/dτ für kleine Geschwindigkeit ~v mit ~v
überein. Genau wie das Tripel d~x gibt nun das Tripel mc d~x/dτ die ersten drei
9.9 Relativistischer Impuls und Viererimpuls eines Teilchens
169
Komponenten eines Lorentzvektors, da mc wie dτ Lorentzskalare sind. Ansatzweise nehmen wir daher als relativistischen Impuls
p~ = mc
d~x
m~v
=p
.
dτ
1 − v 2 /c2
(9.47)
Der zugehörige Lorentzvektor wird auch Viererimpuls genannt und lautet offenbar
!
¶ Ã
µ
m~v
mc
d~x
cdt
,p
≡ (E/c, p~) .
(9.48)
= p
, mc
mc
dτ
dτ
1 − v 2 /c2
1 − v 2 /c2
Die zeitartige Komponente
E/c = p
mc
1 − v 2 /c2
(9.49)
hat auch die Dimension eines Impulses, so dass E die Dimension einer Energie
hat. Tatsächlich wird E als die relativistische Energie des Teilchens bezeichnet.
Die Namensgebung relativistischer Impuls bzw. relativistische Energie für die
in (9.47) bzw. (9.49) definierten Größen p~ bzw. E ist zumindest insofern sinnvoll,
als sich diese Größen im Newtonschen Grenzfall kleiner Geschwindigkeit auf die
entsprechenden Newtonschen Größen reduzieren gemäß
p~ → m~v
E → mc2 +
(9.50)
m 2
v + ···
2
Beachten Sie dabei, dass die Energie eines Teilchens in der Newtonschen Mechanik nur bis auf eine additive Konstante definiert ist. In der relativistischen
Mechanik jedoch, und somit in Stoßexperimenten mit schnellen Teilchen, ist die
additive Konstante mc2 von großer Bedeutung. Ein ruhendes Teilchen hat nach
(9.50) die Ruheenergie
E0 = mc2 .
(9.51)
Sie haben früher schon gelernt, die Relation (9.51) als die von Einstein gefundene Äquivalenz von Masse und Energie zu lesen. Die folgenden Hinweise
sollen Sie an einige für die Hochenergiephysik und auch für die Energiepolitik
wichtige Anwendungen erinnern.
Die Masse eines α-Teilchens ist kleiner als die Summe der Massen seiner
Bausteine, d. h. je zweier Protonen und Neutronen. Wir hoffen, uns den so
genannten Massendefekt bald in Fusionsreaktoren zunutze machen zu können.
Ein Elektron und ein Positron, die mit entgegengesetzt gleichen Geschwindigkeiten aufeinander stoßen, können sich gegenseitig vernichten und als Reaktionsprodukt zwei γ-Quanten hinterlassen. Letztere sind nichts anderes als
eine elektromagnetische Welle, die keine Masse, wohl aber Energie
(und Impuls)
p
hat. Jedes der beiden γ-Quanten trägt die Energie mc2 / 1 − v 2 /c2 wobei v
die Geschwindigkeit jedes Stoßpartners (lange) vor dem Stoß war. Masse wird
also bei dieser Paarvernichtung in Energie verwandelt.
Alle bisherige experimentelle Erfahrung zeigt, dass bei Stößen schneller Teilchen die Summe aller relativistischen Impulse (9.47) und auch die Summe aller
170
9 Spezielle Relativitätstheorie
relativistischen Energien erhalten bleiben, wobei allerdings der Beitrag von an
der Wechselwirkung beteiligten Feldern zu Energie und Impuls mit berücksichtigt werden muss. Im soeben besprochenen Beispiel der Paarvernichtung trägt
das elektromagnetische Feld sogar den ganzen Impuls und die ganze Energie des
Systems nach der Reaktion. Mit mehr formalem Aufwand, als wir hier treiben
können, lässt sich zeigen, dass der gesamte Viererimpuls wechselwirkender Teilchen und Felder, die ein abgeschlossenes System bilden, zeitlich erhalten bleiben
muss, wenn Raum und Zeit homogen sind. Ich erinnere nochmals daran, dass
wir immerhin die Äquivalenz der Homogenität von Raum und Zeit mit der Erhaltung von Impuls und Energie für abgeschlossene rein mechanische Systeme
im Newtonschen Grenzfall vorrechnen konnten.
Aus den Ausdrücken (9.47) und (9.49) für p~ und E können wir die Geschwindigkeit ~v eliminieren und so einen Zusammenhang zwischen Energie und Impuls
des Teilchens herstellen,
E 2 /c2 − p~2 = m2 c2 .
(9.52)
Dieser Zusammenhang gilt unabhängig vom Koordinatensystem, d. h. beide
Seiten der Gleichung sind Lorentzskalare. Man kann sich davon überzeugen,
indem man die Lorentztransformation
E 0 /c = γ(E/c + βpx ),
p0x = γ(βE/c + px ),
p0y = py ,
p0z = pz
(9.53)
auf der linken Seite von (9.52) einträgt. Die Rechnung erübrigt sich aber, da
die linke Seite von (9.52) sich aus den Komponenten des Viererimpulses (E/c, p~)
genauso aufbaut wie das Quadrat des Minkowskiabstands aus den Koordinaten
(ct, ~x). Sie erinnern sich, dass die Lorentztransformation gerade durch die Forderung der Invarianz des Minkowskiabstands festgelegt war.
Unter Verwendung der Lorentztransformation können Sie selber leicht eine
~ und
Verallgemeinerung der eben getroffenen Aussagen beweisen. Wenn (A0 , A)
~ zwei beliebige Lorentzvektoren sind – die sich also beide wie (E/c, p~) in
(B 0 , B)
(9.53) transformieren –, so ist die Verknüpfung
~·B
~
A0 B 0 − A
(9.54)
ein Lorentzskalar.
9.10
Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld
Um die Bewegung von Elektronen, Positronen und anderen geladenen Teilchen
in Beschleunigungsanlagen beschreiben zu können, müssen wir die Newtonsche
Bewegungsgleichung ersetzen durch eine relativistische Verallgemeinerung. Als
empirisches Resultat kennen Sie
´
³
d
~ + ~v × B
~
p~ = e E
dt
(9.55)
mit p = m~v (1 − v 2 /c2 )−1/2 , wobei e und m die Ladung bzw. Masse des Teil~ und B
~ das elektrische bzw. magnetische Feld. Die
chens bezeichnen und E
9.10 Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen
Feld
171
Änderung gegenüber der Newtonschen Bewegungsgleichung besteht in der Ersetzung des Newtonschen durch den relativistischen Impuls. Während diese
Änderung für langsame Teilchen unerheblich ist, bringt sie die Vergrößerung
der Trägheit eines Teilchens mit wachsender Geschwindigkeit
zum Ausdruck.
p
Als Maß für die Trägheit kann offenbar die Größe m/ 1 − v 2 /c2 angesehen
werden; da diese Größe mit v → c über alle Grenzen wächst, kann das Teilchen
nie Lichtgeschwindigkeit erreichen.
Trotz der angedeuteten vernünftigen Eigenschaften in den Grenzfällen v ¿ c
und v / c ist keineswegs offensichtlich, dass die Gleichung (9.55) die richtige Bewegungsgleichung darstellt. Um uns dessen zu vergewissern, müssen wir
nachweisen, dass (9.55) in allen gleichförmig zueinander bewegten Koordinatensystemen gilt. Zu diesem Zweck zeigen wir nun, dass (9.55) zu einer Gleichung
zwischen zwei Lorentzvektoren äquivalent ist.
Die linke Seite von (9.55) stellt nicht den räumlichen Teil eines Lorentzvektors dar, u. z. deshalb nicht, weil die Änderung d~
p des relativistischen Impulses
p~ auf das Laborzeitinkrement dt statt auf einen Lorentzskalar bezogen ist. Ersetzen wir also, wie schon bei den Betrachtungen des letzten Paragrafen, das
Laborzeitinkrement dt durch die Lorentz-invariante Änderung dτ /c der Eigenzeit des Teilchens gemäß
p
(9.56)
dτ = c dt 1 − v 2 /c2
und schreiben (9.55) als
³
´
e
d~
p
~ + ~v × B
~ .
= p
E
dτ
c 1 − v 2 /c2
(9.57)
Jetzt steht links, wie wir im letzten Paragrafen gezeigt haben, der räumliche
Teil eines Lorentzvektors. Die zugehörige zeitartige Komponente dieses Lorentzvektors ist d(E/c)/dτ , also gegeben durch die Änderungsrate der Energie
E des Teilchens mit der Eigenzeit desselben. Da die Energie eines Teilchens
durch seinen Impuls und seine Masse schon festgelegt ist als
p
(9.58)
E/c = m2 c2 + p~2 ,
können wir mit Hilfe von (9.59) die Änderungsrate d(E/c)/dτ ausrechnen zu
c
d~
p
e
dE/c
~ .
~v · E
= p~ ·
= p
2
dτ
E
dτ
c 1 − v 2 /c2
(9.59)
Bei der zum letzten Glied in (9.59) führenden Zwischenrechnung ist beach~ = 0 das magnetische Feld die Energie des
tenswert, dass wegen p~ · (~v × B)
Teilchens nicht ändert. Ein Magnetfeld bewirkt eine Änderung der Richtung,
nicht jedoch des Betrags des Impulses eines Teilchens.
Was ist gewonnen, nachdem wir (9.55) zu (9.57) umformuliert und zusätzlich
(9.59) aus (9.55) gefolgert haben? Zunächst nur, dass die linken Seiten von
d
d
(9.56) und (9.59), also das Quadrupel ( dτ
E/c, dτ
p~), einen Lorentzvektor darstellen. Zu zeigen bleibt, dass das Quadrupel der rechten Seiten und somit auch
die Viererkraft
e
~ ,
~v · E
(9.60)
f0 = p
2
c 1 − v 2 /c2
´
³
e
~ + ~v × B
~
f~ = p
E
1 − v 2 /c2
172
9 Spezielle Relativitätstheorie
sich unter Lorentztransformationen wie ein Lorentzvektor verhält. Dazu ist es
~ und B
~ durch
bequem, in den Komponenten des Quadrupels (f 0 , f~) die Felder E
~
die Komponenten des Lorentzvektors (ϕ, A) der Potentiale auszudrücken,
~ =−∂A
~ − ∇ϕ,
E
∂t
~ = rot A
~.
B
(9.61)
Ferner nutzen wir aus, dass die Geschwindigkeit ~v des Teilchens in (9.60) nur
über die Komponenten des Lorentzvektors
Ã
!
c
~v
0
(u , ~u) = p
,p
= Vierergeschwindigkeit
(9.62)
1 − v 2 /c2
1 − v 2 /c2
eingehen. Letzteres Quadrupel ist zweifellos ein Vierervektor, da es nur um
einen Faktor m vom Viererimpuls des Teilchens abweicht. Mit Hilfe von (9.61)
und (9.62) schreiben wir nun das Quadrupel (f 0 , f~) in der Form
µ
¶
∂ ~
e 0
~
~
f = − u ∇ϕ + A + e~u × rot A
c
∂t
µ
¶
e
∂ ~
0
f = − ~u · ∇ϕ + A
(9.63)
c
∂t
bzw.
µ
µ
¶
· µ
¶
¶¸
∂Ax
∂Az
∂Ay
∂Ax
e 0 ∂ϕ ∂Ax
+ e uy
− uz
+
−
−
fx = − u
c
∂x
∂t
∂x
∂y
∂z
∂x
usf.
Nun ist es leicht, das Verhalten der Viererkraft (f 0 , f~) unter Lorentztransformationen zu studieren. Gehen wir wieder über zu einem System S 0 , bezüglich
dessen sich das bisher verwendete S mit Geschwindigkeit u in x0 -Richtung bewegt und dessen Achsen zu denen von S parallel verlaufen. Die Lorentzvektoren
~ transformieren sich dabei wie üblich,
(u0 , ~u) und (ϕ/c, A)
0
u0 = γ(u0 − βux0 ),
0
ux = γ(ux0 − βu0 ),
uy = uy 0 ,
uz = u z 0
mit
β = u/c,
γ = (1 − β 2 )−1/2
(9.64)
während wir für das Quadrupel der Ableitungen nach den Koordinaten schon
in 9.6 gefunden hatten
µ
µ
¶
¶
∂
∂
∂
∂
∂
∂
=γ β
=γ
+β 0 ,
+β
,
∂ct
∂ct0
∂x
∂x
∂x0
∂ct0
∂
∂
=
,
∂y
∂y 0
∂
∂
= 0 .
∂z
∂z
Durch bloßes Eintragen von (9.64) und (9.65) in (9.63) finden wir
´
´
³
³ 0
0
f 0 = γ f 0 − βfx0 , fx = γ fx0 − βf 0 , fy = fy0 , fz = fz0 .
(9.65)
(9.66)
9.11 Bewegung im konstanten elektrischen Feld
173
Das aber ist, genau wie (9.64), das Transformationsverhalten eines Lorentzvektors.
Also gilt in allen gleichförmig zueinander bewegten Koordinatensystemen:
Die Änderungsrate des Viererimpulses mit der Eigenzeit eines Teilchens ist
gleich der auf das Teilchen wirkenden Viererkraft. Mit dieser Formulierung
ist, Sie hören’s heraus, Newton Ehre erwiesen, wiewohl wir mehr im Sinn haben
als die nur für langsame Teilchen gültige Urform des Gesetzes.
Schreiben wir die manifest lorentzinvariante Form der Bewegungsgleichung
des Teilchens nochmals auf,
d
d2
1
(E/c, p~) = cm 2 (ct, ~x) = (f 0 , f~).
(9.67)
dτ
dτ
c
³
´
Das sind, bei gegebener Viererkraft f 0 (~x, t), f~(~x, t) , d. h. bei gegebenen Fel~ x, t) und B(~
~ x, t), vier Differentialgleichungen zweiter Ordnung für die
dern E(~
vier Funktionen x(τ ), y(τ ), z(τ ) und t(τ ). Hat man diese gelöst und eliminiert den Parameter τ , so erhält man die Bahnkurve des Teilchens in Form des
zeitabhängigen Ortsvektors ~x(t). In der Praxis ist es meist bequemer, mit der
zu (9.67) äquivalenten Form (9.55) der Bewegungsgleichung zu rechnen, ohne
erst den invarianten Parameter τ und die Viererkraft einzuführen.
9.11
Bewegung im konstanten elektrischen Feld
Als Beispiel untersuchen wir die Bewegung eines geladenen Teilchens in einem
~ das wir uns in x-Richtung denhomogenen zeitabhängigen elektrischen Feld E,
ken können. Anfänglich ruhe das Teilchen. Dann wird die Bahnkurve offenbar
eine in x-Richtung laufende Gerade sein, die wir als x-Achse wählen können.
Als einzige Bewegungsgleichung haben wir
d
dpx
mv
p
=
= eEx .
dt
dt 1 − v 2 /c2
(9.68)
Der Impuls des Teilchens wächst demnach im Laufe der Zeit linear mit t,
mv
= eEx t.
(9.69)
px = p
1 − v 2 /c2
Mit ihm wächst die kinetische Energie
p
p
E = c m2 c2 + p~2 = m2 c4 + (ceEx t)2 .
(9.70)
Im Gegensatz zu Impuls und Energie bleibt die Geschwindigkeit, wie es sein
muss, beschränkt. Lösen wir nämlich (9.69) nach der Geschwindigkeit v auf, so
ergibt sich
v=p
ceEx t
m2 c 2
+ (eEx t)2
<c.
(9.71)
So lang ein Linearbeschleuniger auch ausgelegt wird, die Teilchengeschwindigkeit bleibt immer unter der Lichtgeschwindigkeit. Schließlich erhalten wir wegen
v = dx/dt durch Integration von (9.71) die Bahnkurve
c p 2 2
x(t) =
m c + (eEx t)2 .
(9.72)
eEx
174
9 Spezielle Relativitätstheorie
Ihnen bleibt als lustige Übung das Studium der Teilchenbahn im homogenen
Magnetfeld (s. a. 15.3).
9.12
Eine bequeme Schreibweise
~ oder
Vektoren im dreidimensionalen euklidischen Raum bezeichnen wir mit V
(Vx , Vy , Vz ) oder (V1 , V2 , V3 ) oder Vi . Vierervektoren im Raum-Zeit-Kontinuum
~ ) = (V 0 , Vx , Vy , Vz ) aufgeschrieben. Die
haben wir bisher in der Form (V 0 , V
Fortführung der relativistischen Betrachtungen erfordert nun, statt dieser umständlichen eine einfachere Schreibweise einzuführen. Wir nummerieren die
Komponenten mit einem hochgestellten griechischen Index, schreiben den Vierervektor als V µ und meinen
V 0 = zeitartige Komponente
V 1 = V1 = Vx
V 2 = V2 = Vy
(9.73)
V 3 = V3 = Vz
Das Quadrupel der Koordinaten (ct, x, y, z), zum Beispiel, werden wir demnach
künftig als den Viererortsvektor xµ bezeichnen und schreiben
x0 = ct,
x1 = x1 = x,
x2 = x2 = y, x3 = x3 = z .
(9.74)
Die raumartigen Indizes dürfen dabei nach Belieben oben oder unten stehen,
nicht aber der zeitartige.
Es lohnt sich, die Begriffsbildung des Vierervektors zu verfeinern und zu jedem Vierervektor eine kontravariante Version V µ sowie eine kovariante Version
Vµ zu zulassen, wobei
V 0 = −V0 ,
V i = Vi für 1 = 1, 2, 3
(9.75)
gelten soll. Der Sinn dieser Unterscheidung ist, dass sie den aus V µ gewinnbaren
Lorentzskalar schöner zu schreiben erlaubt,
−(V 0 )2 + (V 1 )2 + (V 2 )2 + (V 3 )2 = V 0 V0 + V 1 V1 + V 2 V2 + V 3 V3
=
3
X
V µ Vµ .
(9.76)
µ=0
Noch mehr Bequemlichkeit wird erreicht, wenn wir vereinbaren, rechts das Summenzeichen wegzulassen. Diese Summenkonvention impliziert auch
Aµ Bµ = A 0 B0 + A 1 B1 + A 2 B2 + A 3 B3
= −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3
= −A0 B0 + A1 B1 + A2 B2 + A3 B3
~·B
~ .
= −A0 · B 0 + A
(9.77)
9.12 Eine bequeme Schreibweise
175
Auch Aµ Bµ ist, wie oben besprochen, ein Lorentzskalar. Im Folgenden soll
also jeder griechische Index, der in einem Produkt zweimal vorkommt, einmal
hochgestellt (als kontravarianter Index) und einmal tiefgestellt (als kovarianter
Index), über die vier Werte 0, 1, 2, 3 summiert werden.
Die neue Schreibweise ermöglicht eine einfache Formulierung der Lorentztransformation
α
x0 = Λαβ xβ = Λα0 x0 + Λα1 x1 + Λα2 x2 + Λα3 x3
= Λα0 ct + Λα1 x + Λα2 y + Λα3 z .
(9.78)
Die Matrix Λαβ lautet für unser stets verwendetes Beispiel, bei dem das zu S 0
achsenparallele System S sich mit Geschwindigkeit u in x0 -Richtung bewegt,


γ γβ 0 0


γβ γ 0 0
 , β = u , γ = (1 − β 2 )−1/2 .
Λµν = 
(9.79)

0
c
0
1
0


0
0 0 1
Dabei zählt der erste Index, hier µ, wie üblich die Zeilen in der Reihenfolge 0,
1, 2, 3 und der zweite, hier ν, die Spalten.
Den Lorentzskalar Aµ Bµ schreibt man auch gern unter Benutzung einer
Matrix ηαβ (des so genannten Minkowskitensors) als
Aµ Bµ = ηµν Aµ B ν ,
(9.80)
wobei
ηαβ

1



= −1



0
für
α = β = 1, 2, 3
für
α=β=0
für
α 6= β .
(9.81)
Der Minkowskitensor erlaubt, die Lorentzinvarianz des Minkowskiabstands oder
anderer Größen wie Aµ Bµ , als eine Forderung an die Matrix Λαβ der Lorentztransformation zu schreiben. Aus
α
α
β
A0 Bβ0 = ηαβ A0 B 0 = ηαβ Λαµ Λβν Aµ B ν = ηµν Aµ B ν
(9.82)
folgt, da Aµ und B µ beliebige Lorentzvektoren sind,
ηαβ Λαµ Λβν = ηµν .
(9.83)
Sehen Sie, dass dies gerade die Verallgemeinerung der aus dem euklidischen
Raum bekannten Eigenschaft R̃R = 1 der Drehmatrizen auf die Drehmatrizen“
”
Λαβ darstellt?
Der Minkowskitensor gestattet offenbar auch, aus einem kontravarianten
Vektor Aµ den zugehörigen kovarianten Vektor Aµ zu gewinnen,
Aµ = ηµν Aν .
(9.84)
176
9 Spezielle Relativitätstheorie
Die Umkehrung dieser Beziehung wird vermittelt durch die zu ηµν inverse Matrix. Wir nennen dieselbe η µν und haben
ηαν η
νβ
=
(
+1
für
α=β
0
für
α 6= β .
(9.85)
Offenbar ist ηµν Element für Element mit der inversen Matrix η µν gleich. Aus
(9.84) und (9.85) ergibt sich nun der kontravariante Vektor Aµ als Linearkombination der Komponenten des zugehörigen kovarianten Vektors Aµ
Aµ = η µν Aν .
(9.86)
Wir haben bisher das Verhalten von kontravarianten Vektoren Aµ unter Lorentztransformationen studiert. Kovariante Vektoren transformieren sich anders.
Aus (9.78), (9.84) und (9.86) folgt
β
Bα0 = ηαβ B 0 = ηαβ Λβµ B µ = ηαβ Λβµ η µν Bν , also
Bα0 = Λαβ Bβ
(9.87)
mit
Λαβ = ηαν Λνµ η µβ .
(9.88)
Wir sehen leicht, dass die Matrix Λαβ invers zur Matrix Λβα ist,
Λαγ Λαβ = ηαν Λνµ η µγ Λαβ = η µγ ηαν Λνµ Λαβ = η µγ ηµβ = δ γβ .
(9.89)
Ohne Rechnung können wir die Matrix Λαβ aus Λβα durch Vorzeichenwechsel der
Geschwindigkeit β = u/c gewinnen, also (unterscheiden Sie die Geschwindigkeit
β = u/c vom gleichbezeichneten Index!)
Λαβ

γ

−γβ
=
 0

0
−γβ
0
γ
0
0
1
0
0
0


0
 .
0

1
(9.90)
Die Ableitungen ∂/∂xµ nach den kontravarianten Koordinaten xµ bilden
offenbar einen kovarianten Lorentzvektor, denn wir hatten früher schon gezeigt,
dass der Wellenoperator
∇2 −
1 ∂2
∂2
∂ ∂
µν
=
η
=
c2 ∂t2
∂xµ ∂xµ
∂xµ ∂xν
(9.91)
ein Lorentzskalar ist. Andererseits hatten wir auch schon das Transformations-
9.12 Eine bequeme Schreibweise
verhalten von ∂/∂xµ ausgerechnet und gefunden
¶
µ
∂
∂
∂
−β 1
=γ
∂x0
∂x
∂x0 0
¶
µ
∂
∂
∂
= γ −β 0 +
∂x
∂x1
∂x0 1
177
(9.92)
∂
∂
2 = ∂x2
0
∂x
∂
∂
3 = ∂x3
0
∂x
und das ist gerade das Gesetz (9.87) mit der Matrix (9.90).
Neben Lorentzskalaren und -vektoren hatten wir auch, ohne ausdrücklich
davon zu reden, Lorentztensoren zweiter Stufe betrachtet, das sind 16-Tupel T µν
wie z. B. das direkte Produkt Aµ B ν zweier Lorentzvektoren. Die definierende
Eigenschaft des Lorentztensors ist, dass er sich unter Lorentztransformationen
verhält wie das Produkt Aµ B ν , nämlich
T0
µν
= Λµα Λνβ T αβ .
(9.93)
Sie sollen Indexgymnastik treiben und zeigen, dass T µν Aν ein Lorentzvektor
und T µµ = T µν ηνµ ein Lorentzskalar ist.
Die eben eingeführte Schreibweise gibt vielen in diesem Kapitel besprochenen
Gesetzen eine schön einfache Form. So sind die elektromagnetischen Potentiale
~ und die Ströme j µ = (cρ, ~j) durch die Wellengleichung (s. (9.28))
Aµ = (ϕ/c, A)
∂2
Aµ = −j µ /ε0 c2
∂xα ∂xα
(9.94)
verknüpft, vorausgesetzt, die Potentiale sind der Lorentzkonvention (9.29)
∂ µ
A =0
∂xµ
(9.95)
unterworfen. Und die Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld lautet (s. (9.67))
cm
dpµ
1
d2 xµ
=
= fµ .
dτ 2
dτ
c
(9.96)
Die Viererkraft f µ lässt sich durch die Vierergeschwindigkeit
uµ = c
dxµ
dτ
und durch die Ableitungen der Potentiale Aµ wie folgt ausdrücken
µ
¶
∂ ν
∂ µ
µ
f =e
A −
A uν .
∂xµ
∂xν
Der antisymmetrische Tensor
F µν =
∂ µ
∂ ν
A −
A
∂xµ
∂xν
(9.97)
(9.98)
178
9 Spezielle Relativitätstheorie
heißt auch der Feldstärkentensor des elektromagnetischen Feldes. Offenbar gilt


0
Ex /c Ey /c Ez /c


−Ex /c
0
Bz
−By 
µν


(9.99)
F =
0
Bx 

−Ey /c −Bz
−Ez /c By
−Bx
0
~ und B
~ wie die Kompound auf einmal wird klar, dass sich die Feldstärken E
nenten eines Lorentztensors transformieren.
Haben Sie übrigens für die in 9.6 gestellte Übungsaufgabe zum Transforma~ und B
~ als Lösung erhalten, was Sie nun aus (9.99)
tionsverhalten der Felder E
und (9.77) einfach abschreiben,
Ex0 = Ex ,
Ey0 = γ(Ey + βcBz ),
Ez0 = γ(Ez − βcBy )
Bx0 = Bx ,
By0 = γ(By − βEz /c),
Bz0 = γ(Bz + βEy /c) ?
(9.100)
Jedenfalls sollten Sie sich jetzt klarmachen, dass ein in einem rein elektrosta~ = 0) bewegtes Teilchen auch ein magnetisches Induktionsfeld
tischen Feld (B
0
~
B 6= 0 spürt.
Kapitel 10
Die Bewegung schneller
Teilchen im
Gravitationsfeld (Einsteins
Äquivalenzprinzip)
10.1
Rückblick auf die Newtonsche Theorie
Die Bewegung eines langsamen (v ¿ c) Teilchens in einem schwachen (die Bedingung für Schwäche wird später gegeben) Gravitationsfeld wird beschrieben
durch das Newtonsche Gesetz
m
d2 ~x
= F~ (~x) ,
dt2
(10.1)
wobei m die träge Masse des Teilchens und F~ (~x) die auf das Teilchen am Ort
~x wirkende Gravitationskraft sind. Rührt die Gravitationskraft von einem anderen Teilchen der schweren Masse M her, welches am Ursprung des Koordinatensystems sitzt, so gilt
mM ~x
F~ (~x) = −G 2
.
|~x| |~x|
(10.2)
Die Eigenschaft des Teilchens, die die Größe der auf es wirkenden Gravitationskraft bestimmt, seine schwere Masse, stimmt erfahrungsgemäß mit seiner trägen
Masse überein. Daher geht in (10.1) und (10.2) dieselbe Masse m ein.
Sie wissen, dass obiges F~ (~x sich als Gradient des so genannten Gravitationspotentials ϕ(~x) darstellen lässt gemäß
F~ (~x) = −m∇ϕ(~x)
ϕ(~x) = −
GM
.
|~x|
(10.3)
Da sich schwache Gravitationsfelder linear superponieren, haben wir für das
Gravitationspotential vieler massiver Teilchen mit Massen mν , die an den Orten
179
180
10 Bewegung schneller Teilchen im Gravitationsfeld
~xν sitzen,
ϕ(~x) = −
X Gmν
.
|~x − ~xν |
ν
(10.4)
Als Bewegungsgleichung für einen Planeten im Sonnensystem gilt nach Newton
mν
X
d2 ~xν (t)
Gmµ mν
=
−∇
,
ν
dt2
|~xν (t) − ~xµ (t)|
(10.5)
µ(6=ν)
wobei die rechts stehende Gravitationskraft sich aus den Beiträgen aller anderen Planeten und der Sonne (und gegebenenfalls anderer nahe gelegener Himmelskörper) zusammensetzt.
Einstein war mit der in (10.5) zusammengefassten Theorie nicht einverstanden, u. z. aus drei Gründen: (i) Wegen der nicht gegebenen Lorentzinvarianz
kann die Theorie nicht für schnelle Teilchen richtig sein; (ii) ein herausgegriffenes Teilchen erfährt die Gravitationswirkung der anderen instantan, da die
¨µ (t)} zur gleichen
Teilchenorte {~xν (t)} zu einer Zeit t die Beschleunigungen {~x
Zeit festlegen; gemäß dem Einsteinschen Relativitätsprinzip sollten sich Gravitationswechselwirkungen aber höchstens mit Lichtgeschwindigkeit ausbreiten; (iii)
die genaue Analyse der schon von Newton verwendeten Gleichheit von schwerer
und träger Masse führt, wie wir sehen werden, zu Widersprüchen zu (10.5).
10.2
Einsteins Äquivalenzprinzip
Der Angelpunkt der allgemeinen Relativitätstheorie ist die Gleichheit von schwerer und träger Masse für alle Körper. Genauer, das Verhältnis von schwerer zu
träger Masse hat für alle Körper den gleichen Wert. Für Probekörper aus Aluminium und Gold, z. B., fand R. H. Dicke Übereinstimmung dieses Verhältnisses
mit einer relativen Genauigkeit von 10−11 . Die Gleichheit von träger und schwerer Masse kann dann durch Wahl der Einheit eingerichtet werden.
Wir folgern, mit Einstein, dass im Innern eines frei fallenden Fahrstuhls kein
äußeres statisches homogenes Gravitationsfeld festgestellt werden kann, denn
Fahrstuhl, Beobachter wie experimentelle Aufbauten im Fahrstuhl reagieren
alle gleich auf ein solches Feld.
Zur Veranschaulichung betrachten wir N langsame Teilchen, die untereinander paarweise wechselwirken gemäß einer abstandsabhängigen Kraft F~ (~xν − ~xµ )
−−−→
und alle einem äußeren konstanten Gravitationsfeld ~g = −∇ϕ = const ausgesetzt sind. Die Bewegungsgleichungen lauten in irgendeinem Laborsystem S
mν
X
d2 ~xν
= mν ~g +
F~ (~xν − ~xµ ) .
2
dt
(10.6)
µ(6=ν)
Ein frei im Gravitationsfeld fallender Beobachter benutzt sein Ruhesystem S 0 .
Solange der Beobachter langsam ist, gilt als Koordinatentransformation
1
~x0 = ~x − ~g t2 ,
2
t0 = t .
(10.7)
10.3 Die Viererkraft im Gravitationsfeld
181
Der frei fallende Beobachter gibt auf Grund seiner Messungen als Bewegungsgleichungen für den Teilchenhaufen an
mν
X
d2 ~x0ν
= mν (~g − ~g ) +
F~ (~x0ν − ~x0µ ) .
02
dt
(10.8)
µ(6=ν)
Sie lesen ab, dass die Trägheitskraft die Gravitationskraft gerade weghebt und
dass der Beobachter im Fahrstuhl keine Gravitationskraft feststellen kann. Sie
sehen auch, dass in S und S 0 die gleichen Newtonschen Gesetze gelten. Der
einzige Unterschied zwischen beiden Bezugssystemen ist, dass in S ein Gravitationsfeld auftritt, nicht aber in S 0 .
Einstein verallgemeinerte diese Folgerung aus mschwer = mträge , die zunächst
nur für die Grundgesetze der Newtonschen Mechanik gezogen ist, und erhob zum
Prinzip (d. h. zu einer immer wieder in geeigneten neuen Experimenten nachzuprüfenden Hypothese): ein zeitlich und räumlich konstantes Gravitationsfeld
ist durch kein Experiment zu unterscheiden von einer zeitlich konstanten Beschleunigung des Bezugssystems.
Das Einsteinsche Prinzip von der Äquivalenz von Schwere und Trägheit muss
noch präziser formuliert werden. Ein zeitlich nicht konstantes und räumlich
nicht homogenes Gravitationsfeld kann nicht überall und immer durch eine Koordinatentransformation exakt eliminiert werden. Immerhin, die Aufhebung
eines Gravitationsfeldes wird mit guter Näherung möglich sein für jeden RaumZeit-Bereich, der so klein gewählt ist, dass innerhalb seiner das Gravitationsfeld
als räumlich und zeitlich konstant angesehen werden kann. Also: In jedem
Raum-Zeitpunkt lässt sich ein lokales frei fallendes Koordinatensystem angeben,
so dass in einem hinreichend kleinen Raum-Zeit-Bereich um den betrachteten
Punkt die Naturgesetze die Form annehmen, die sie in nicht beschleunigten Bezugssystemen bei Abwesenheit von Gravitation haben. Es gibt ein solches frei
fallendes Koordinatensystem, aber nicht nur eins, sondern beliebig viele, die sich
relativ zueinander gleichförmig bewegen. Da beliebige Relativgeschwindigkeiten
|~u| < c zwischen diesen gleichberechtigten Koordinatensystemen möglich sind,
muss der Übergang von einem zum anderen durch die Lorentztransformation
bewerkstelligt werden. Es müssen also in den lokalen frei fallenden Koordinatensystemen die Naturgesetze eine Lorentzinvariante Form besitzen.
Die Koordinatentransformationen, die wie 2.2 dafür sorgen, dass ein Gravitationsfeld lokal eliminiert wird, sind notwendig nichtlinear. Daher ist die
Kunst, mit Gravitationsfeldern umzugehen, die gleiche wie die, nichtlineare Koordinatentransformationen zu hantieren.
10.3
Die Viererkraft im Gravitationsfeld
Betrachten wir ein Teilchen an einem Raum-Zeit-Punkt xα unter dem Einfluss
eines Gravitationsfeldes. Die Bewegungsgleichung muss Lorentzinvariant sein,
d. h. die Form
mträge
1
d2 x α
= 2 mschwer g α
dτ 2
c
bzw.
d2 x α
1
= 2 gα
dτ 2
c
(10.9)
haben, wobei dτ ein Lorentzskalar ist und g α ein Lorentzvektor. Den Lorentzvektor werden wir die Gravitationsfeldstärke nennen.
182
10 Bewegung schneller Teilchen im Gravitationsfeld
Eine, die wichtigste, Eigenschaft von g α kennen wir schon: es gibt an jedem
Raum-Zeit-Punkt xα ein frei fallendes Koordinatensystem mit Koordinaten ξ α ,
bezüglich dessen das Teilchen momentan und lokal (d. h. solange es sich vom
herausgegriffenen Raum-Zeit-Punkt nicht zu weit entfernt hat) keine Gravitationskraft erfährt und sich daher (ein kleines Wegstück weit) auf einer Geraden
bewegt. In diesem frei fallenden Koordinatensystem lautet die Bewegungsgleichung des Teilchens
d2 ξ α
=0,
dτ 2
(10.10)
wobei dτ − c das Inkrement der Eigenzeit des Teilchens ist,
¡ ¢ 2 ³ ´2 ¡ ¢ 2 ¡ ¢ 2 ¡ ¢ 2 ¡ ¢ 2
dτ 2 = −ηαβ dξ α dξ β = dξ 0 − dξ~ = dξ 0 − dξ 1 − dξ 2 − dξ 3 .
(10.11)
Der Übergang von den Laborkoordinaten xα zu den Koordinaten ξ α im
frei fallenden System geschieht durch eine nichtlineare Koordinatentransformation, d. h. die ξ α sind nichtlineare Funktionen der xα . Wir schreiben meistens
α
ξ α = ξ α (x), zuweilen zur Vermeidung von Missverständnissen auch ξ α = ξX
(x),
wobei der Index X den Raum-Zeit-Punkt angibt, bezüglich dessen das frei fallende Koordinatensystem errichtet ist. Wohlgemerkt, nur räumlich und zeitlich
konstante Gravitationsfelder können durch eine einzige Koordinatentransformation eliminiert werden. Wir lassen aber jetzt beliebig variable Gravitationsfelder
zu.
Hätten wir die Koordinatentransformation ξ α (x), die das Gravitationsfeld
α
g lokal eliminiert, explizit vorliegen, so können wir g α leicht rekonstruieren.
Tragen wir ξ α (x) in die Bewegungsgleichung (10.10) ein,
0=
d
dτ
µ
∂ξ α dxµ
∂xµ dτ
¶
=
∂ 2 ξ α dxµ dxν
∂ξ α d2 xµ
+
,
µ
2
∂x dτ
∂xµ ∂xν dτ dτ
(10.12)
multiplizieren mit ∂xλ /∂ξ α und benutzen die Kettenregel in der Form
∂xλ ∂ξ α
= δ λµ ,
∂ξ α ∂xµ
(10.13)
µ
ν
d2 x λ
λ dx dx
=0
+
Γ
µν
dτ 2
dτ dτ
(10.14)
so entsteht
mit
Γλµν =
∂xλ ∂ 2 ξ α
.
∂ξ α ∂xµ ∂xν
(10.15)
Somit ist das Gravitationsfeld g α durch die Koordinatentransformation ξ(x)
ausgedrückt, die das Feld lokal eliminiert,
µ
ν
1 α
α dx dx
g
=
−Γ
µν
c2
dτ dτ
(10.16)
10.3 Die Viererkraft im Gravitationsfeld
183
Das Feld g α ist also durch das so genannte Christoffelsymbol Γαµν und die Vierergeschwindigkeit dxµ /dτ gegeben.
Mit (10.14) haben wir die allgemeine Form der Bewegungsgleichung eines
Teilchens im Gravitationsfeld gewonnen. Zur Behandlung konkreter Probleme,
wie etwa der Bewegung eines Planeten um die Sonne, müssen wir natürlich
die Gravitationsfeldstärke g α , d. h. das Christoffelsymbol Γαµν für das Feld der
Sonne als Funktion der Koordinaten xα kennen. Bei gegebenem Γλµν (x) können
wir im Prinzip die vier Gleichungen (10.14) lösen. Aus den gewonnen Lösungen
xα = xα (τ ) lässt sich, falls gewünscht, der Parameter τ eliminieren, so dass nach
Beachtung von x0 = ct die Bahnkurve in der üblichen Form ~x = ~x(t) entsteht.
Wir werden darauf zurückkommen.
Mit Hilfe der Transformation ξ α = ξ α (x) können wir auch das Eigenzeitinkrement des Teilchens durch die Laborkoordinateninkremente dxµ ausdrücken,
dτ 2 = −ηαβ dξ α dξ β = −ηαβ
∂ξ α ∂ξ β µ ν
dx dx ≡ −gµν dxµ dxν .
∂xµ ∂xν
(10.17)
Die zur Abkürzung eingeführte Größe
gµν = ηαβ
∂ξ α ∂ξ β
∂xµ ∂xν
(10.18)
heißt metrischer Tensor. Dieser spielt im Weiteren eine wichtige Rolle. Klar ist,
dass gµν bei Vorliegen eines Gravitationsfeldes (und somit einer nichtlinearen
Transformation ξ α = ξ α (x)) weder konstant noch im allgemeinen diagonal sein
wird. Gemäß seiner Definition ist gµν jedoch immer symmetrisch.
Wir haben soeben das Christoffelsystem Γαµν (x) und den metrischen Tensor gµν eingeführt mit Hilfe der Koordinatentransformation ξ α = ξ α (x) von
den Laborkoordinaten xα zu den Koordinaten ξ α des frei fallenden Systems,
bezüglich dessen das beobachtete Teilchen momentan gleichförmig bewegt ist.
Das umgekehrte Vorgehen ist auch möglich und lehrreich. Überzeugen wir uns
davon, dass wir bei gegebenem Gravitationsfeld, bzw. bei gegebenen Γαµν und
gµν immer die Koordinaten ξ α (x) konstruieren können. Dazu multiplizieren wir
die Definition (10.15) mit ∂ξ β /∂xλ und erhalten
∂ξ β ∂xλ ∂ 2 ξ α
∂2ξβ
∂ξ β λ
=
.
Γ µν (x) =
λ
λ
α
∂x
∂x ∂ξ ∂xµ ∂xν
∂xµ ∂xν
(10.19)
Diese Gleichungen können wir, bei gegebenem Γλµν (x), als Differentialgleichungen für die vier Funktionen ξ β (x) lesen. Wir suchen eine Lösung für eine Nachbarschaft von X durch Ansatz einer Potenzreihe in x − X,
µ α¶
∂ξ
α
α
ξ (x) =ξ (X) +
(xµ − X µ )
∂xµ x=X
µ 2 α ¶
∂ ξ
1
+
(xµ − X µ )(xν − X ν ) + · · · .
(10.20)
2 ∂xµ ∂xν x=X
Nach Eintragen des Ansatzes (10.20) in (10.19) finden wir die zweiten Ableitungen als durch Γλµν (x) bestimmt,
µ α¶
µ 2 α ¶
∂ξ
∂ ξ
=
· Γλµν (x) ,
(10.21)
∂xµ ∂xν x=X
∂xλ x=X
184
10 Bewegung schneller Teilchen im Gravitationsfeld
während ξ α (X) und (∂ξ α /∂xµ )x=X als Integrationskonstanten offen bleiben.
Die Beliebigkeit der Matrix (∂ξ α /∂xλ )x=X ist natürlich durch den metrischen
Tensor
gµν (X) = ηαβ (∂ξ α /∂xµ )x=X (∂ξ β /∂xν )x=X
eingeschränkt. Es bleiben, da gµν = gνµ , sechs freie Parameter in der Matrix (∂ξ α /∂xλ )x=X . Das ist gut so, denn das frei fallende Koordinatensystem
darf nicht eindeutig festliegen. Hat man eines, so ist jedes dazu verdrehte und
gleichförmig bewegte gleichberechtigt.
10.4
Lichtstrahlen im Gravitationsfeld
Keine andere wissenschaftliche Entdeckung dieses Jahrhunderts wurde so als
Sensation gefeiert wie Einsteins Vorhersage, dass Lichtstrahlen durch starke
Gravitationsfelder abgelenkt werden, nach ihrer Bestätigung anlässlich einer
Sonnenfinsternis im Jahr 1919 (vgl. Abbildung 10.1. Um den Effekt verstehen und nachrechnen zu lernen, wenden wir wieder das Äquivalenzprinzip an.
Letzteres beansprucht Gültigkeit nicht nur für die Bewegung massiver Teilchen
im Gravitationsfeld, sondern für den Einfluss der Gravitation auf alle physikalischen Phänomene, insbesondere auch auf Lichtausbreitung.
Abbildung 10.1
Bei Abwesenheit von Gravitation sollte ein Lichtstrahl gerade laufen, entsprechend einer ebenen Welle mit dem Phasenfaktor exp i(~k · ξ~ − ωξ 0 /c). Der
Wellenvektor ~k und die Frequenz ω haben dabei den Zusammenhang k 2 = ω 2 /c2 .
Dieser Zusammenhang, auch Dispersionsrelation für Licht im Vakuum genannt,
garantiert, dass ~k · ξ~ − ωξ 0 /c ein Lorentzskalar ist. Wir können den Vierervektor k µ = (k 0 = ω/c, ~k) einführen und den Phasenfaktor der Lichtwelle als
exp(ikµ ξ µ ) schreiben. Die Geradlinigkeit des Lichtstrahls lässt sich auch zum
Ausdruck bringen, indem wir einen Punkt ξ~ auf einer Wellenfront ins feste Augenmerk nehmen und als dessen Bewegungsgleichung“ notieren
”
d2 ξ~
=0.
(10.22)
(dξ 0 )2
Statt der Zeitkoordinate ξ 0 können wir auch einen anderen mit ihr linear verknüpften Parameter σ zur Beschreibung der Bahn des betrachteten Punktes
10.4 Lichtstrahlen im Gravitationsfeld
185
verwenden, woraufhin die Bewegungsgleichung die etwas symmetrischere Form
d2 ξ µ
=0
dσ 2
(10.23)
annimmt.
Im Gravitationsfeld verläuft, wie die erwähnten Beobachtungen bei Sonnenfinsternissen sinnfällig machen, der Lichtstrahl nicht mehr geradlinig. Jedoch
gibt es in jedem Punkt in Sonnennähe ein frei fallendes Koordinatensystem,
in dem die Gravitation lokal vollständig eliminiert ist, so dass die Bewegungsgleichung (10.23) gilt. Sobald wir für jeden Punkt X im Gravitationsfeld die
Koordinatentransformation ξX (x) kennen, die die Laborkoordinaten x mit den
frei fallenden Koordinaten verknüpft, können wir aus (10.23) die Bewegungsgleichung des betrachteten Punktes auf einer Wellenfront gewinnen. Die weitere
Überlegung und Rechnung ist identisch mit der für massive Teilchen und gibt
ν
µ
d2 x λ
λ dx dx
+
Γ
=0.
µν
dσ 2
dσ dσ
(10.24)
Diese die Lichtausbreitung im Gravitationsfeld beschreibende Gleichung hat
das gleiche Aussehen wie die Bewegungsgleichung eines massiven Teilchens.
Natürlich können wir hier den Bahnparameter σ nicht mit der Eigenzeit des
betrachteten Punktes auf der Wellenfront identifizieren, denn dieser Punkt bewegt sich mit Lichtgeschwindigkeit und hat somit keine Eigenzeit. Für Lichtausbreitung gilt dτ = 0, sowohl im frei fallenden System wie im Labor. Die
Umrechnung läuft wie im letzten Paragrafen und führt zu
0 = −ηαβ
dxµ dxν
dξ α dξ β
= −gµν
.
dσ dσ
dσ dσ
(10.25)
Statt von einem fiktiven Punkt auf einer Wellenfront werden wir künftig von einem masselosen Teilchen reden, das sich im gravitationsfreien Raum (und somit
auch in einem frei fallenden Bezugssystem) geradlinig mit Lichtgeschwindigkeit
bewegt. Diese Redeweise macht deutlich, dass der Einfluss des Gravitationsfeldes auf massive und masselose Teilchen der gleiche ist. Sie wissen andererseits, aus quantenmechanischer Vorbildung, dass das in Rede stehende masselose
Teilchen, das Photon, keine bloße Fiktion ist, dass vielmehr elektromagnetische
Wellen auch in anderer Hinsicht Teilchencharakter zeigen.
Die Lichtartigkeitsbedingung (10.25) für eine Photonenbahn xλ ermöglicht
die Berechnung der Zeit dt = dx0 /c, die ein Photon benötigt, um den Weg d~x
zu durchlaufen. Aus (10.25) folgt∗) unter Beachtung der Symmetrie von gµν
g00 c2 dt2 + 2gi0 dxi c dt + gij dxi dxj = 0
(10.26)
und hieraus die Laufzeit
dt =
·
¸
q
1
−gi0 dxi − (gi0 gj0 − gij g00 ) dxi dxj
cg00
(10.27)
In diesem Ausdruck erscheint das Minuszeichen vor der Wurzel. Das umgekehrte Vorzeichen kommt nicht in Frage, wie wir uns klarmachen am Beispiel einer linearen Koordinatentransformation, für die gilt gµν = ηµν d. h.
∗) Beachte,
dass der lateinische Index i die drei Raumkoordinaten zählt, also i = 1, 2, 3.
186
10 Bewegung schneller Teilchen im Gravitationsfeld
h √
i
c dt = − − d~x2 . Eine wichtige Konsequenz aus (10.25) springt sofort ins
Auge. Da im Gravitationsfeld der metrische Tensor gµν koordinatenabhängig
und jedenfalls ungleich dem Minkowskitensor ist, gilt nicht mehr c dt = |d~x|,
d. h. im Gravitationsfeld weicht die Lichtgeschwindigkeit von c ab.
Letzterer Effekt ist uns, ebenso wie die Lichtablenkung durch schwere Massen, aus der Alltagserfahrung nicht geläufig. Der Grund dafür ist die Schwachheit des Gravitationsfeldes der Erde. Selbst das viel stärkere Feld der Sonne
bewirkt eine Lichtablenkung um bloße 1, 75 Bogensekunden für Lichtstrahlen,
die in unmittelbarer Nähe der Sonnenoberfläche an der Sonne vorbeilaufen (s.
10.12).
10.5
Der metrische Tensor ist das Gravitationsfeld
Sie haben eben gelernt, dass das Christoffelsymbol Γλµν die Gravitationskraft
und der metrische Tensor gµν das Eigenzeitinkrement von Teilchen festlegen.
Jetzt will ich zeigen, dass sich das Christoffelsymbol durch den metrischen Tensor gµν und seine ersten Ableitungen darstellen lässt als
Γλµν
1
= g λσ
2
½
∂gµσ
∂gνσ
∂gµν
+
−
∂xν
∂xµ
∂xσ
¾
,
(10.28)
wobei g µν der zu gµν inverse Tensor ist,
g µσ gσν = δ µν .
(10.29)
Der metrische Tensor spielt also die Rolle eines Potentials für die durch Γλµν (x)
bestimmte Gravitationskraft. Jedenfalls genügt die Kenntnis des metrischen
Tensors gµν (x), um die Bewegung von Teilchen im Gravitationsfeld vollständig
beschreiben zu können.
Der obige Zusammenhang zwischen dem Christoffelsymbol Γλµν und dem
metrischen Tensor gµν folgt aus dem Äquivalenzprinzip, welches wir zunächst
etwas verfeinert formulieren müssen. Am Punkt xα = X α (in Laborkoordinaα
ten) seien ξX
die Koordinaten des dortigen frei fallenden Systems. Mit Hilfe
α
α
(x) definiert sich der metrische Tensor als
= ξX
der Transformation ξX
gµν (X) =
Ã
β
α
(x)
∂ξX
(x) ∂ξX
ηαβ
µ
∂x
∂xν
!
.
(10.30)
x=X
α
An einem benachbarten Raum-Zeit-Punkt xα = X 0 hat man, wenn das Gravitationsfeld nicht konstant ist, ein anderes frei fallendes Bezugssystem mit Koorα
α
dinaten ξX
0 . Für einen mit den ξX fallenden Beobachter erscheint das System
α
α
der ξX 0 , beschleunigt, er konstatiert also ein bei ξX
(x = X 0 ) herrschendes Gravitationsfeld gemäß dem metrischen Tensor
!
Ã
β
α
∂ξX
0 ∂ξX 0
X
0
.
(10.31)
gµν (ξX (X )) =
µ
ν ηαβ
∂ξX
∂ξX
0
ξX =ξX (X )
10.5 Der metrische Tensor ist das Gravitationsfeld
187
Dem in Rede stehenden Beobachter wird nahe liegen, diesen metrischen Tensor
α
als Funktion seiner Koordinaten ξX
zu schreiben; wir könnten auch Laborkoordinaten verwenden.
X
Offenbar ist gµν
(ξX (X)) = ηµν . Wenn wir zur Vereinfachung der Symbolik
den Ursprung des bei X frei fallenden Systems so wählen, dass ξX (x = X) = 0,
α
X
(ξX )
so lautet die für kleine ξX
gültige Taylorreihe für gµν
Ã
!
Ã
!
X
X
∂gµν
∂ 2 gµν
1
X
α
α α
gµν
(ξX ) = ηµν +
ξ
+
ξX
ξX + · · · . (10.32)
X
α
α ∂ξ β
∂ξX
2 ∂ξX
X
ξX =0
ξX =0
α
In dieser Reihe kommt klar zum Ausdruck, dass die ξX
zwar am Ort x =
X, nicht aber in endlichem Abstand davon ein frei fallendes System bilden.
α
In hinreichender Entfernung vom Ursprung ξX = 0 bemerkt der mit den ξX
fallende Beobachter sehr wohl ein Gravitationsfeld.
Wir hatten das Äquivalenzprinzip bisher formuliert als die Forderung, dass
α
sich durch ein geeignetes frei fallendes System ξX
das Gravitationsfeld in einem
hinreichend kleinen Raum-Zeit-Bereich um x = X herum eliminieren lassen
muss. Wir präzisieren nun das hinreichend“ dahingehend, dass sich die Koor”
α
X
α
dinaten ξX
so einrichten lassen müssen, dass die ersten Ableitungen (∂gµν
/∂ξX
)
X
bei ξX = 0 verschwinden. Die Abweichung des metrischen Tensors gµν (ξX ) vom
α
Minkowskitensor ist dann, wie (10.32) zeigt, mindestens quadratisch in ξ X
. Erst
α
α
in zweiter Ordnung in ξX wird für den mit dem System der ξX fallenden Beobachter ein Gravitationsfeld bemerkbar. Wir werden gleich sehen, dass erst
die hier gegebene Präzisierung des Äquivalenzprinzips sicherstellt, dass ein bei
α
x = X befindliches Teilchen bezüglich des Systems ξX
tatsächlich keine Beschleunigung erfährt.
Nach dieser Vorbemerkung finden wir aus einer leichten Rechnung, bei der
X
wir übrigens gµν
als Funktion der Laborkoordinaten nehmen, den oben vorgestellten Zusammenhang zwischen dem Christoffelsymbol und seinem Potenti”
al“, dem metrischen Tensor. Unter bloßer Beachtung der Kettenregel können
wir umformen wie
!
Ã
β
α
∂ξX
0 ∂ξX 0
0
ηαβ
gµν (X ) =
∂xµ ∂xν
x=X 0
!
Ã
µ γ
¶
β
α
δ
∂ξX ∂ξX
∂ξX
0 ∂ξX 0
ηαβ
=
,
γ
δ
∂ξX
∂xµ ∂xν x=X 0
∂ξX
0
x=X
also
X
gµν (X 0 ) = gγδ
(X 0 )
µ
γ
δ
∂ξX
∂ξX
µ
∂x ∂xν
¶
.
(10.33)
x=X 0
λ
Dies differenzieren wir nach X 0 und setzen X = X 0 . Da
³
´
¢
¡ α
¢
¡ X
λ
λ
X
α
·
∂ξ
/∂X
∂gγδ
(X 0 )/∂X 0
= ∂gγδ
/∂ξX
=0,
X
X 0 =X
ξ=0
X 0 =X
gibt der erste Faktor auf der rechten Seite von (10.33) keinen Beitrag zur geX
suchten Ableitung und wir erhalten wegen gγδ
(X) = ηγδ
¶
µ 2 γ
γ
δ
δ
∂ ξX (x) ∂ξX
(x) ∂ξX (x) ∂ 2 ξX
(x)
∂gµν
.
(10.34)
=
η
+
γδ
∂X λ
∂xλ ∂xµ ∂xν
∂xµ ∂xν ∂xλ x=X
188
10 Bewegung schneller Teilchen im Gravitationsfeld
Die rechte Seite dieser Gleichung lässt sich durch das Christoffelsymbol ausdrücken
µ
γ
γ ¶
δ
δ
∂gµν
σ ∂ξX ∂ξX
σ ∂ξX ∂ξX
= ηγδ Γ λµ σ
+ Γ λν σ
∂X λ
∂x ∂xν
∂x ∂xµ x=X
= Γσλµ (X)gσν (X) + Γσλν (X)gσµ (X) .
(10.35)
Um nach dem Christoffelsymbol auflösen zu können, addieren wir zu dieser
Gleichung die nämliche mit µ und λ vertauscht und subtrahieren dieselbe nochmals mit ν und λ vertauscht. Es entsteht, wenn wir die aus den Definitionen
folgenden Symmetrien gµν = gνµ und Γλµν = Γλνµ benutzen,
∂gλν
∂gµλ
∂gµν
+
−
= 2Γσλµ gσν .
∂xλ
∂xµ
∂xν
(10.36)
Nach Multiplikation mit dem zu gµν inversen Tensor g µν entsteht schließlich die
eingangs vorgestellte Relation.
Ihnen bleibt als kleine Übung, zu zeigen, dass sich der Tensor g µν durch
die Transformation ξ = ξ(x) zum frei fallenden Koordinatensystem ausdrücken
lässt,
g µν = g νµ =
10.6
∂xν ∂xµ γδ
η .
∂ξ γ ∂ξ δ
(10.37)
Der Newtonsche Grenzfall
Für langsame Teilchen in schwachen Gravitationsfeldern muss die Einsteinsche
Bewegungsgleichung
µ
ν
d2 x λ
λ dx dx
=
−Γ
µν
dτ 2
dτ dτ
(10.38)
in die Newtonsche übergehen. Überzeugen wir uns davon und lernen dabei, wie
der metrische Tensor (das Einsteinsche Gravitationspotential“) im Grenzfall
”
des schwachen statischen Feldes aussieht.
Bei |~v | ¿ c können wir zunächst die räumlichen Komponenten d~x/dτ ≈ ~v /c
gegen dx0 /dτ = c dt/dτ ≈ 1 vernachlässigen und erhalten
d2 x λ
= −Γλ00
dτ 2
µ
dct
dτ
¶2
.
(10.39)
Da das Gravitationsfeld als statisch angenommen wurde, verschwinden die Zeitableitungen des metrischen Tensors,
µ
¶
1 λσ
∂g0σ
∂g00
∂g00
1
λ
2
−
.
(10.40)
Γ 00 = g
= − g λi
σ
2
∂ct
∂x
2
∂xi
Bei Abwesenheit des Gravitationsfeldes wäre gµν = ηµν . Im schwachen Feld
wird der metrische Tensor nur wenig vom Minkowskitensor abweichen, so dass
wir ansetzen können
gµν = ηµν + hµν
(10.41)
10.6 Der Newtonsche Grenzfall
189
mit |hµν | ¿ |ηµν |. In erster Ordnung in der Störung hµν entsteht aus (10.40)
1 ∂h00
∂h00
1
, also Γ000 = 0 und Γi 00 = −
Γλ00 = − η λi
i
2
∂x
2 ∂xi
Tragen wir dies in die Bewegungsgleichung (10-39) ein, so entsteht
¶2
µ
d2 ct
d2 x i
1 ∂h00 dct
und
=
=0.
dτ 2
2 ∂xi
dτ
dτ 2
(10.42)
(10.43)
Letztere Gleichung besagt, dass Laborzeit und Eigenzeit linear verknüpft sind,
(dct/dτ ) = const. Damit kann aus der ersten Gleichung in (10.43) der Para2 i
meter τ leicht eliminiert werden, denn ddτx2 = (const)2 d2 xi /d(ct)2 . Daraufhin
erhalten wir
c2 ∂h00
d2 x i
=
dt2
2 ∂xi
(10.44)
oder
d2 ~x
c2
= ∇h00 .
2
dt
2
In der Newtonschen Mechanik gilt
(10.45)
d2 ~x
= −∇ϕ ,
(10.46)
dt2
wobei ϕ das Newtonsche Gravitationspotential ist. Die Einsteinsche Bewegungsgleichung reduziert sich also auf die Newtonsche, wenn wir die Korrektur h 00
zur 0−0-Komponente des Minkowskitensors identifizieren als
2
ϕ(~x) + const .
(10.47)
c2
In beliebig großer Entfernung von allen felderzeugenden Massen muss das Gravitationsfeld beliebig klein werden, d. h. h00 (~x → ∞) → 0. Das Newtonsche
Potential hatten wir ebenfalls so definiert, dass es im Unendlichen verschwindet, so dass die Konstante in (10.47) verschwindet. Somit gilt im Newtonschen
Grenzfall
h00 (~x) = −
g00 = −(1 + 2ϕ/c2 ) .
(10.48)
2
Um ein Gefühl für die Größe der Korrektur 2ϕ/c in (10.48) zu erhalten, erinnern wir uns an das Newtonsche Potential eines Teilchens mit Masse m,
ϕ~x = Gm/|~x|. Sie rechnen leicht aus, nach Aufsuchen der entsprechenden
Massen und Radien,
¯ ¯
¯ 2ϕ ¯
¯ ¯ ≈ 10−39 an der Oberfläche eines Protons
¯ c2 ¯
≈ 10−9
auf der Erdoberfläche
≈ 10−6
auf der Sonnenoberfläche
≈ 10−4
auf der Oberfläche eines weißen Zwerges.
Offenbar machen wir an der Erdoberfläche keinen großen Fehler, wenn wir das
Eigenzeitinkrement eines Teilchens mit dem Minkowskitensor statt mit dem
metrischen Tensor ausrechnen.
190
10.7
10 Bewegung schneller Teilchen im Gravitationsfeld
Frequenzverschiebung fallender Photonen
Eine der schönsten experimentellen Bestätigungen des Äquivalenzprinzips wurde im Jahr 1960 von Pound und Rebka gegeben. Das Messergebnis besteht im
Nachweis einer Frequenzvergrößerung ( Blauverschiebung“) von Gammastrah”
len, die im Schwerefeld der Erde um etwa 20 m gefallen sind. Hier will ich Ihnen
die theoretische Grundlage zur Diskussion dieses Experiments und verwandter
Phänomene geben.
Betrachten wir eine Uhr, die sich mit beliebiger Geschwindigkeit in einem
beliebigen Gravitationsfeld bewegt. Zwischen zwei aufeinander folgenden Ticks
vergeht die Eigenzeit ∆t. Das Eigenzeitintervall ∆t ist nicht gleich dem Zuwachs dx0 /c = dt der Laborzeit t = x0 /c, den wir im Labor als Zeitabstand der
beiden in Rede stehenden Ticks messen, denn zur Messung der Laborzeit t bzw.
x0 verwenden wir i. A. im Labor ruhende Instrumente ( x0 -Anzeiger“). Selbst
”
wenn wir die Laborzeit x0 /c ablesen auf einer Uhr, die konstruktionsgleich ist
mit der zum Zeitpunkt x0 am Ort ~x beobachteten, so wird das Laborzeitinkrement dx0 /c zwischen den beiden Ticks des Beobachtungsobjekts mit dem
Eigenzeitinkrement ∆t nur dann übereinstimmen, wenn sich der x0 -Anzeiger
zum Beobachtungszeitpunkt ebenfalls am Ort ~x befindet und dort relativ zur
beobachteten Uhr ruht.
Vereinbaren wir jedoch, dass der x0 -Anzeiger bei ~x = 0 ruht. Das Laborzeitintervall dt = dx0 /c zwischen zwei aufeinander folgenden Ticks der Uhr bei ~x
denken wir uns so gemessen, dass dieselbe anlässlich jedes Ticks einen Lichtblitz
zum x0 -Anzeiger schickt; auf letzterem wird dt abgelesen als Zeitabstand der
Ankunft zweier aufeinander folgender Lichtblitze.
Um den Zusammenhang zwischen ∆t und dt auszurechnen, erinnere ich an
die anfängliche Bemerkung, dass ∆t die Zeit ist, die zwischen den Ticks verstreicht bzgl. eines frei fallenden Systems, in dem die Uhr ruht. In einem
anderen lokal frei fallenden System, in dem die Uhr sich gleichförmig bewegt,
verstreicht dξ 0 und es gilt
q
1
−ηαβ dξ α dξ β ,
(10.49)
∆t =
c
während sich das im Laborsystem ablaufende Zeitintervall berechnet aus
r
∂ξ α ∂ξ β
1p
1
−ηαβ µ ν dxµ dxν =
−gµν dxµ dxν .
∆t =
(10.50)
c
∂x ∂x
c
Dabei sind wir jetzt weniger an der schon bei Abwesenheit von Gravitation auftretenden Verschiedenheit von ∆t und dt interessiert, die mit einer Relativbewegung von Beobachtungsobjekt und Labor verbunden ist; viel mehr interessiert
uns der Einfluss des Gravitationsfeldes auf das Verhältnis ∆t/dt; daher nehmen
wir an, dass die beobachtete Uhr relativ zum Labor ruht, so dass d~x = 0. Dann
folgt
p
(10.51)
∆t = −g00 (x) dt .
p
Man kann den Dilatationsfaktor“ −g00 (x) nicht durch Messungen an ei”
nem Raum-Zeit-Punkt x allein festlegen. Denn wenn der x0 -Anzeiger zur Zeit
x0 nach ~x gebracht wird, wo sich auch das Beobachtungsobjekt befindet, so
10.7 Frequenzverschiebung fallender Photonen
191
wird er dann und dort vom Gravitationsfeld genauso beeinflusst wie das letztere. Somit kann zwischen beiden Uhren kein Gangunterschied auftreten. Um den
Einfluss des Gravitationsfeldes auf den Gang von Uhren nachzuweisen, müssen
Uhren an verschiedenen Raum-Zeit-Punkten verglichen werden.
Betrachten wir der Einfachheit halber zwei Raumpunkte in einem zeitunabhängigen Gravitationsfeld gµν (~x). Am Ort ~xQ ruhe als Uhr“ eine Lichtquelle,
”
die Licht einer Spektrallinie aussendet. Am Ort ~xB wird dieses Licht empfangen
und hinsichtlich seiner Frequenz verglichen mit Licht derselben Spektrallinie, das
am Ort ~xB selbst erzeugt wird.
Der Zeitabstand zwischen der Aussendung aufeinander folgender Wellenmaxima (das seien die Ticks“ der Uhr“) sei dtQ = dx0Q /c; er hängt mit dem
”
”
entsprechenden Zeitabstand ∆t bei Abwesenheit des Gravitationsfeldes zusammen gemäß
q
(10.52)
dtQ = ∆t/ −g00 (~xQ ) .
Die Reisedauer der Wellenfronten von der Quelle zum Beobachter bei ~xB wird
für alle Wellenmaxima gleich groß sein, da sich das Gravitationsfeld zeitlich nicht
ändert. Die Zeitspanne zwischen den Ankünften aufeinander folgender Wellenmaxima wird also auch stets gleich bleiben und den durch (10.52) gegebenen
Wert haben. Der entsprechende Zeitabstand zwischen den Wellenmaxima einer
in ~xB ruhenden Quelle beträgt jedoch
p
(10.53)
dtB = ∆t/ −g00 (~xB ) .
Demnach erscheint einunddieselbe Spektrallinie unter verschiedenen Frequenzen, deren Verhältnis durch
s
νB
g00 (~xB )
dtQ
=
=
(10.54)
νQ
dtB
g00 (~xQ )
gegeben ist.
Im schwachen Feld, wo g00 (~x) ≈ −1 − 2ϕ(~x)/c2 mit |ϕ|/c2 ¿ 1 gilt, drückt
sich die Linienverschiebung durch die Newtonschen Potentiale an den beteiligten
Orten aus,
s
1 + 2ϕ(~xB )/c2
1
νB
≈
≈ 1 + [ϕ(~xB ) − ϕ(~xQ )] 2 .
(10.55)
νQ
1 + 2ϕ(~xQ )/c2
c
Als relative Frequenzverschiebung ∆ν/νB = (νQ − νB )/νB erhalten wir somit
∆ν
1
= (ϕ(~xQ ) − ϕ(~xB )) 2 .
νB
c
(10.56)
Das ist eine Rotverschiebung, wenn das Feld am Ort der Quelle stärker ist als
beim Beobachter, während ein im Gravitationsfeld fallendes Photon offenbar
eine Vergrößerung seiner Frequenz, d. h. eine Blauverschiebung erleidet.
Das Resultat (10.56) legt wieder die schon benutzte Redeweise vom Photon
als einem (masselosen) Teilchen nahe. Wenn ein massives Teilchen im Gravitationsfeld zu tieferem Potential fällt, so vergrößert sich dabei seine kinetische
192
10 Bewegung schneller Teilchen im Gravitationsfeld
Energie. Ganz ähnlich ergeht es dem Photon. Der einzige Unterschied zum massiven Teilchen ist, dass das schon mit c fliegende Photon Energie nicht durch
Vergrößerung seiner Geschwindigkeit aufnimmt sondern durch Vergrößerung seiner Frequenz.
Im Pound-Rebka Experiment entsprach der Potentialunterschied zwischen
Quelle und Empfänger einem Höhenunterschied von 22, 6 m, betrug also ∆ϕ/c2
= 9, 81 m s−2 · 22, 6 m/9 · 1016 m2 s−2 ≈ 2, 5 · 10−15 . Wie eine derart winzige Frequenzverschiebung nachgewiesen wurde, ist eine Geschichte für sich, die
Sie anderswo ausführlich nachlesen müssen. Jedenfalls ist die Vorhersage des
Äquivalenzprinzips durch Experimente dieses Typs inzwischen bis auf ∼ 1%
bestätigt.
Eine an der Sonnenoberfläche erzeugte Spektrallinie muss dem terrestrischen Beobachter rotverschoben erscheinen, denn das Gravitationspotential am
Entstehungsort ist, wie ich schon oben notiert hatte, betragsmäßig wesentlich
stärker als das Gravitationspotential an der Erdoberfläche. Die vom Äquivalenzprinzip vorhergesagte relative Linienverschiebung von etwa 2 · 10−6 ist wegen
experimenteller Schwierigkeiten bisher nur bis auf eine Genauigkeit von etwa
5% gesichert.
10.8
Nochmal auf die rotierende Scheibe!
Schon mit Hilfsmitteln der speziellen Relativitätstheorie hatten wir uns davon
überzeugt, dass eine am Rand einer gleichförmig rotierenden Scheibe festgemachte Uhr langsamer geht als ihr im Labor ruhendes Duplikat. Als Umlaufdauer wird auf der mitrotierenden Uhr Trot und auf der Laboruhr Tlab abgelesen
und es gilt, wenn ω die Kreisfrequenz der Scheibe ist und R den Abstand der
rotierenden Uhr von der Drehachse bezeichnet,
Trot = Tlab
p
1 − ω 2 R2 /c2 .
(10.57)
Um Sie an den Umgang mit dem Äquivalenzprinzip zu gewöhnen, will ich dieses
Resultat nun nochmals herleiten.
Ein auf der rotierenden Scheibe ruhender Reisender mag sich einbilden, die
Scheibe sei in Ruhe und die für ihn überall auf der Scheibe feststellbaren Kräfte
auf Probeteilchen rührten von einem Gravitationsfeld her. Er wird dieses Feld
durch den metrischen Tensor gµν beschreiben und seine Mühe damit haben,
gµν (x) durch Messungen festzulegen. Wir haben keinerlei Mühe, den metrischen
Tensor auszurechnen mit Hilfe der Koordinatentransformation vom Scheibensystem xα zum System der ξ α , bezüglich dessen wir die Scheibe rotieren sehen.
Der Beobachter auf der Scheibe möge sich dazu entschließen, als seinen x0 Anzeiger unseren ξ 0 -Anzeiger zu verwenden. Das wird ihm Unbequemlichkeiten
bringen, denn er sieht diese Uhr kreisen (der Bundespostminister dürfte sich
sicher nicht erlauben, den Taktgeber des hiesigen Telefonsystems auf dem Mond
zu installieren), jedoch kommt uns bei der weiteren Überlegung die Verrücktheit
des Scheibenmännchens sehr zupass. Im Übrigen verwende das Scheibenmännchen Zylinderkoordinaten x1 = r, x2 = ϕ, x3 = z, wobei die z-Achse die
Symmetrieachse des Systems sei. Wenn wir im Labor kartesische Koordinaten
ξ i wählen, so haben wir die Transformation
10.8 Nochmal auf die rotierende Scheibe!
193
ξ 0 = x0
ξ x = r cos(ϕ + ωx0 /c)
(10.58)
ξ y = r sin(ϕ + ωx0 /c)
ξz = z
Abbildung 10.2
und können den metrischen Tensor gµν (x) mit Hilfe seiner Definition
gµν (x) =
∂ξ α ∂ξ β
ηαβ
∂xµ ∂xν
(10.59)
∂ξ 0 ∂ξ 0
∂ξ x ∂ξ x
∂ξ y ∂ξ y
∂ξ z ∂ξ z
+
+
+
∂xµ ∂xν
∂xµ ∂xν
∂xµ ∂xν
∂xµ ∂xν
ausrechnen. Das für uns wichtige Element ist g00 . Es lautet
=−
g00 (r, ϕ, z, x0 ) = −1 +
r2 ω2
r2 ω2
sin2 (ϕ + ωx0 /c) + 2 cos2 (ϕ + ωx0 /c)
2
c
c
= −1 + r 2 ω 2 /c2 .
Obwohl wir die anderen hier nicht benötigen, sollten Sie sie zur Gewöhnung an’s
Differenzieren und Summieren ausrechnen.
Da die am Scheibenrand bei r = R, ϕ = 0, z = 0 festgemachte Uhr für
das Scheibenmännchen ruht, drückt er ihr Eigenzeitinkrement ∆t aus als (s.
(10.51))
p
p
∆t = −g00 (R, 0, 0)dx0 /c = 1 − ω 2 R2 /c2 dx0 /c .
(10.60)
P
Die Summe
∆t = Trot
P 0 aller dieser Inkremente für einen Umlauf lesen wir mit
und
dx = Tlab als das oben schon vorgestellte Resultat (s. (10.51)).
Im letzten Kapitel hatte ich das Resultat (10.57) salopp als Reisen erhält
”
jung“ formuliert. Jetzt liegt die Interpretation starker Gravitationsfelder als
Jungbrunnen nahe.
194
10.9
10 Bewegung schneller Teilchen im Gravitationsfeld
Das statische isotrope Gravitationsfeld
Obwohl die Sonne leicht abgeplattet ist und um ihre Symmetrieachse rotiert, obwohl also die Massenverteilung der Sonne weder kugelsymmetrisch noch statisch
ist, werden wir ihr Gravitationsfeld als statisch und isotrop idealisieren. Der
hierdurch entstehende Fehler bei der Berechnung der Licht- und Teilchenbahnen ist bei weitem zu klein, um experimentell nachgewiesen werden zu können.
Zur Bestimmung des Gravitationsfeldes einer vorgegebenen Massenverteilung hat man die hier nicht diskutierten Einsteinschen Feldgleichungen zu lösen,
ähnlich wie man das Coulombfeld durch Lösung der Maxwellschen Gleichungen
findet. Tatsächlich können wir uns auch ohne Benutzung der Feldgleichungen durch elementare Überlegungen hinreichenden Aufschluss über das gesuchte
Feld verschaffen.
Wir benutzen am besten räumliche Kugelkoordinaten xµ = (ct, r, θ, ϕ), wobei r = 0 das Zentrum der Massenverteilung bedeutet. Den metrischen Tensor
gµν können wir dann ablesen aus der allgemeinst möglichen Form des Eigenzeitintervalls dτ 2 = −gµν dxµ dxν . Für letztere dürfen wir, wie leicht einzusehen
ist, ansetzen
dτ 2 = −g00 (r)c2 dt2 − grr (r2 ) dr2 − r2 (dθ2 + sin2 θdϕ2 ) .
(10.61)
Wegen der Isotropie und Zeitunabhängigkeit des Feldes hängen nämlich die Koeffizienten g00 und grr nur von r ab. Die Nichtdiagonalelemente g0r , g0θ , g0ϕ ,
grθ , grϕ , gθϕ müssen alle verschwinden; ein Beitrag zu dτ 2 der Form grϕ dr dϕ,
z. B., würde vom Vorzeichen von dϕ abhängen und somit die Richtung θ = 0
auszeichnen, während die Mischglieder g0i dct dxi eine Zeitrichtung auszeichnen
würden. Dass das dritte Glied in (10.61) nicht eine weitere freie Funktion von
r enthält, sondern gθθ = r2 erscheint, lässt sich immer durch Festlegung der
2
Längeneinheit einrichten; wenn etwa
p gθθ = C(r) 6= 2r gegeben ist, so führt die
Koordinatentransformation r̃ = C(r) zu gθθ = r̃ , ohne dass sich die Struktur von (10.61) ansonsten ändert. Es ist jedoch nicht möglich, durch weitere
Koordinatentransformationen die Zahl der freien Funktionen in dτ 2 unter zwei
zu drücken.
Von den beiden Koeffizienten g00 (r) und grr (r) wissen wir zunächst nur, dass
sie im feldfreien Raum, d. h. insbesondere für r → ∞ die Werte −1 bzw. +1
haben müssen, denn dort ist die Metrik Minkowskisch. Außerdem hatten wir
uns davon überzeugt, dass im Newtonschen Grenzfall, d. h. für ein schwaches
Feld gilt
g00 (r) ≈ −1 − 2ϕ/c2 = −1 +
2M G
,
c2 r
(10.62)
wobei M die felderzeugende Masse ist. Der hier auftretende Parameter M G/c2
hat die Dimension einer Länge und heißt Schwarzschildradius der Massenverteilung. Sein Zahlenwert für die Sonne ist
MS G/c2 = 1.48 km ,
(10.63)
also sehr klein gegenüber dem Sonnenradius
RS = 6.96 × 105 km
(10.64)
10.9 Das statische isotrope Gravitationsfeld
195
und erst recht klein gegenüber dem kleinsten Abstand eines Planeten vom Sonnenzentrum. Zum Beispiel beträgt der Aphelabstand des Merkur
rM ≈ 4.59 × 107 km ≈ 65RS .
(10.65)
Die Kleinheit des Schwarzschildradius der Sonne gegen RS ist der Grund der
Schwäche des Gravitationsfeldes überall im Sonnensystem.
Wenn die relativistische Gravitationstheorie außer der Gravitationskonstanten G keine weiteren Kopplungskonstanten in Rechnung stellen muss – es gibt
in der Tat keine empirischen Hinweise auf das Auftreten solcher Kopplungskonstanten –, so ist der Schwarzschildradius der einzige Parameter der Dimension
einer Länge, den die Gravitationstheorie für das Feld eines statischen isotropen
Sterns der Masse M zur Verfügung stellt. Da die Koeffizienten g00 (r) und grr (r)
dimensionslos sind, müssen sie dann vom dimensionslosen Argument M G/c2 r
abhängen, d. h. die Form
grr = A
µ
MG
c2 r
¶
,
g00 = −B
µ
MG
c2 r
¶
(10.66)
haben. Überall im Sonnensystem und sogar an der Sonnenoberfläche ist das
Argument der Funktionen A und B sehr klein gegen eins, so dass wir A und B
sicher durch die Taylorreihen
A = 1 + 2γ
MG
+ ···
c2 r
MG
B = 1 − 2 2 + 2(β − γ)
c r
µ
MG
c2 r
¶2
+ ···
(10.67)
approximieren können. Die Parametrisierung der Entwicklungskoeffizienten durch
die noch zu bestimmenden Größen β und γ ist Konventionssache.
Aus dem Eigenzeitinkrement (10.61) lesen wir den metrischen Tensor g µν
ab. Seine nicht verschwindenden Elemente lauten
g00 = −B,
gθθ = r2 ,
grr = A,
gϕϕ = r2 sin2 θ .
(10.68)
Der inverse metrische Tensor ist ebenfalls diagonal und kann ohne Rechnung
aus (10.68) entnommen werden
g 00 = −1/B,
g rr = 1/A,
gθθ = r−2 ,
g ϕϕ = 1/r 2 sin2 θ .
(10.69)
Zum Aufstellen der Bewegungsgleichung eines Teilchens benötigen wir noch das
Christoffelsymbol
Γλµν =
1 λσ
g
2
µ
∂gσµ
∂gσν
∂gµν
+ µ − σ
xν
x
x
¶
.
(10.70)
196
10 Bewegung schneller Teilchen im Gravitationsfeld
Aus (10.68) und (10.69) finden wir die nichtverschwindenden Elemente zu
1 dA
r
r sin2 θ
, Γrθθ = − , Γrϕϕ = −
,
2A dr
A
A
1
= Γθθr = , Γθϕϕ = − sin θ cos θ,
r
1
= Γϕϕr = , Γϕθϕ = Γϕϕθ = cot θ,
r
Γrrr =
Γθrθ
Γϕrϕ
Γ0r0 = Γ00r =
Γr00 =
1 dB
2A dr
(10.71)
1 dB
.
2B dr
Wir wenden uns nun der Bewegungsgleichung eines Teilchens zu, wobei wir
für die Funktionen A und B die Entwicklungen (10.67) nehmen. Nebenbei sei
bemerkt, dass die Einsteinschen Feldgleichungen das exakte Resultat
B = A−1 = 1 −
2M G
,
c2 r
(10.72)
also
β=γ=1
(10.73)
zulassen.
10.10
Bewegungsgleichungen im statischen isotropen Feld
Wenn wir den Ort eines Teilchens zur Zeit t = x0 /c durch Kugelkoordinaten
x1 = r, x2 = θ, x3 = ϕ festlegen, so nehmen die allgemeinen Bewegungsgleichungen
µ
ν
d2 x λ
λ dx dx
+
Γ
=0
µν
dτ 2
dτ dτ
(10.74)
im eben gewonnenen statischen isotropen Feld die folgenden Formen an
d2 t
B 0 (r) dt dr
=0
(10.75)
+
dσ 2
B(r) dσ dσ
µ ¶2
µ ¶2
µ ¶2
µ
¶2
d2 r
A0 dr
r dθ
r sin2 θ dϕ
B 0 dct
+
−
−
+
= 0 (10.76)
dσ 2
2A dσ
A dσ
A
dσ
2A dσ
µ ¶2
dϕ
d2 θ
2 dθ dr
−
sin
θ
cos
θ
+
=0
(10.77)
2
dσ
r dσ dσ
dσ
dϕ dθ
d2 ϕ 2 dϕ dr
+ 2 cot θ
=0.
+
dσ 2
r dσ dσ
dσ dσ
(10.78)
Dabei bedeutet A0 = dA/dr, B 0 = dB/dr. Die Bahnkurve xµ (σ) ist mit einer
Größe σ parametrisiert, die ganz beliebig gewählt werden kann. Für ein massives
Teilchen ist dessen Eigenzeit eine nahe liegende und manchmal bequeme Wahl.
10.10 Bewegungsgleichungen im statischen isotropen Feld
197
Trotz der ungewohnten Form sind die Bewegungsgleichungen (10.75-10.78)
nicht schwerer zu lösen als ihre in 3 behandelten nichtrelativistischen Vereinfachungen. Letztere, die Newtonschen Gleichungen für das Keplerproblem, sind
hier als Grenzfall c → ∞ enthalten, wie Sie nach Eintragen von A und B aus
10.9 sofort sehen. Die folgenden Betrachtungen Schritt für Schritt mit den entsprechenden der Newtonschen Theorie zu vergleichen, sollte für Sie lehrreich
und erfreulich sein.
Die nichtrelativistischen Bahnkurven im isotropen Feld verlaufen in Ebenen.
Ebenso die relativistischen Bahnen, denn die Gleichungen (10.75-10.78) erlauben
die Lösungen ϕ = const oder θ = π2 . Wir wählen die Bezugsrichtungen der
Winkel so, dass die Bahn in der Ebene
θ=
π
2
(10.79)
liegt. Es bleibt die Aufgabe, die Bahnkurve in den Polarkoordinaten r = r(t)
und ϕ = ϕ(t) zu finden. Beim nichtrelativistischen Keplerproblem hatten wir
uns dabei der Erhaltungssätze für Drehimpuls und Energie bedient. Auch hier
gehen wir so vor.
Die Gleichungen (10.75) und (10.78) besagen, dass längs der Bahn die Größen
B(dt/dσ) bzw. r 2 dϕ/dσ konstant bleiben. Ohne Verlust an Allgemeinheit setzen wir
dσ = B dt ,
(10.80)
denn die auftretende Integrationskonstante lässt sich im Parameter σ absorbieren. Die Konstanz von r 2 dϕ/dσ lässt sich dann ausdrücken als
r2 dϕ
= l = const .
B dt
(10.81)
Die nichtrelativistische Version (c = ∞ bzw. B = 1) dieses Erhaltungssatzes
für ein Teilchen der Masse m hatten wir als Drehimpulserhaltungssatz kennengelernt mit
L = lm
(10.82)
als Betrag des Bahndrehimpulses. In der Form (10.81) gilt der Drehimpulssatz
nun sowohl für massive wie für masselose Teilchen, d. h. Lichtbahnen. Auch
hier bleibt der Drehimpuls übrigens nach Betrag und Richtung erhalten. Die
Drehimpulsrichtung ist durch (10.79) als parallel zur Geraden θ = 0 bestimmt.
Um schließlich die relativistische Verallgemeinerung des Newtonschen Energieerhaltungssatzes aufzustellen, verwenden wir die Konstanz des Drehimpulses
gemäß (10.79) und (10.81) sowie die Beziehung (10.80) in (10.76) und erhalten
d2 r
A0
+
dτ 2
2A
µ
dr
dσ
¶2
−
c2 B 0
l2
+
=0.
r3 A 2AB 2
(10.83)
Nach Multiplikation mit 2A(dr/dσ) entsteht hieraus der gesuchte Erhaltungssatz
µ µ ¶2
¶
l2
dr
d
c2
+ 2−
A
=0.
(10.84)
dσ
dσ
r
B
198
10 Bewegung schneller Teilchen im Gravitationsfeld
Die gegenüber dem nichtrelativistischen Grenzfall erreichte Verallgemeinerung
wird besonders sinnfällig, wenn wir den Parameter σ mit Hilfe von (10.80) zugunsten der Zeit t eliminieren,
µ
dr
dt
A
2B 2
µ
A
B2
¶2
+
l2
c2
−
= const ≡ 2e − c2
r2
B
(10.85)
oder
dr
dt
¶2
+
c2
l2
+
2
2r
2
µ
1−
1
B
¶
=e.
(10.86)
Die Integrationskonstante ist hier so benannt, dass im Grenzfall c → ∞ aus
(10.85) gerade der Newtonsche Energiesatz entsteht mit
e = E/m
(10.87)
als der nichtrelativistischen Energie pro Masseneinheit des bewegten Teilchens.
Beachten Sie, dass der Ansatz der Integrationskonstanten in (10.85) gerade die
Ruheenergie eines massiven Teilchens als additiven Beitrag zur Energiebilanz
längs der Bahn in Rechnung stellt.
Schließlich will ich, nachdem der Zusammenhang von (10.86) mit dem Newtonschen Energiesatz für ein massives Teilchen im Keplerpotential hergestellt
ist, betonen, dass der relativistische Erhaltungssatz (10.86) auch für masselose
Teilchen, insbesondere also Lichtbahnen gilt; dabei wird nur die Interpretation
der Integrationskonstanten e gemäß (10.87) hinfällig. Um die Integrationskonstante e für Lichtbahnen zu bestimmen, berücksichtigen wir, dass längs einer
Lichtbahn der Minkowskiabstand beliebiger Raum-Zeit-Punkte verschwindet.
Aus
dτ 2 = +Bc2 dt2 − A dr 2 − r2 (dθ2 + sin2 θ dϕ2 ) = 0
(10.88)
folgt mit dθ und dϕ aus (10.79) bzw. (10.81)
Bc2 − A
µ
dr
dt
¶2
−
B 2 l2
=0
r2
(10.89)
und dies ist gerade der Energiesatz (10.85) mit
e = c2 /2 .
(10.90)
Die beiden Differentialgleichungen (10.81) und (10.86) legen die zeitlichen
Abläufe der möglichen Teilchenbahnen im statistischen isotropen Gravitationsfeld, d. h. die Funktionen r(t) und ϕ(t) fest. Falls nur die rein räumliche Gestalt
der Bahnkurven, d. h. die Funktion r(ϕ) von Interesse ist, kann mit Hilfe von
(10.81) die Zeit aus (10.86) eliminiert werden, woraufhin wir erhalten
Al2
2r4
µ
dr
dϕ
¶2
l2
c2
+ 2+
2r
2
µ
¶
1
1−
=e.
B
(10.91)
Diese Differentialgleichung für die Bahnkurve r = r(ϕ) werden wir nun für zwei
wichtige Spezialfälle lösen.
10.11 Periheldrehung der Planeten
10.11
199
Periheldrehung der Planeten
Die Keplerellipsen sind keine strengen Lösungen der Einsteinschen Bewegungsgleichung eines Planeten im statischen isotropen Feld. Vielmehr gleichen die
relativistischen Lösungen r = r(ϕ) Rosetten, die wir uns aus den Keplerellipsen
dadurch entstanden denken können, dass die große Ellipsenachse sich bei jedem
Umlauf um einen kleinen Winkel δϕ verdreht. Die Abbildung 10.3 übertreibt
δϕ.
Abbildung 10.3
Wir wollen nun δϕ in niedrigster Ordnung in 1/c2 ausrechnen und tragen
dazu die Entwicklungen (10.67)
1/B = 1 + 2
M 2 G2
MG
+ 2(2 − β − γ) 4 2 + · · ·
2
c r
c r
1/A = 1 − 2γ
MG
+ ···
c2 r
(10.92)
in den Energiesatz“ (10.91) ein. Es ergibt sich, mit r 0 = dr/dϕ,
”
2
¶
·
¸
MG
c2 M G
M 2 G2
1 − 2γ 2
− 2
+ 2(2 − β − γ) 4 2
c r
l
c2 r
c r
µ
¶
MG
2e
.
= 2 1 − 2γ 2
l
c r
1
r0
+
r4 r2
µ
(10.93)
Sie sehen hier übrigens, warum die obige Entwicklung für 1/B eine Ordnung
weiter getrieben werden muss als die für 1/A. Der Grund besteht im Auftreten
des Faktors c2 vor dem Glied [1 − 1/B]. Die Gleichung (10.93) verschönert sich,
wenn wir
u(ϕ) = 1/r(ϕ)
(10.94)
200
10 Bewegung schneller Teilchen im Gravitationsfeld
als abhängige Variable einführen, zu
µ
·
¸
¶
MG
c2 2M G
M 2 G2 2
2
u0 + u2 1 − 2γ 2 u − 2
u
+
2(2
−
β
−
γ)
u
c
l
c2
c4
µ
¶
2e
MG
= 2 1 − 2γ 2
u.
(10.95)
l
c
Da wir nur an Korrekturen der Ordnung 1/c2 zum Newtonschen Resultat interessiert sind, verzichten wir auf die exakte Lösung von (10.95). Die angemessene
Näherungslösung finden wir am schnellsten, indem wir durch Differenzieren nach
ϕ eine Differentialgleichung zweiter Ordnung herstellen,
¸
µ
¶
·
MG
2e
MG
M 2 G2
00
1 − γ 2 = 3γ 2 u2 . (10.96)
u + 1 − 2(2 − β − γ) 2 2 u − 2
c l
l
c
c
In nullter Ordnung in 1/c2 ist dies eine Schwingungsgleichung mit der Lösung
uK (ϕ) =
MG
[1 + ε cos(ϕ − ϕ0 )] = 1/rK (ϕ) ,
l2
(10.97)
wobei ϕ0 und ε als Integrationskonstanten auftreten. Für ε < 1 sind die Lösungen (10.97) gerade die Keplerellipsen. Die Bezugsrichtung für den Winkel ϕ
kann immer so gewählt werden, dass ϕ0 = 0 ist.
Bis auf das (kleine!) nichtlineare Glied auf der rechten Seite ist (10.96)
ebenfalls die Differentialgleichung einer linearen Schwingung, deren Lösungen
offenbar lauten
µ
¶
MG
2e 1
u0 (ϕ) = 2
1−γ 2
(1 + ε cos ωϕ)
l
c
ω2
mit
ω 2 = 1 − 2(2 − β − γ)
M 2 G2
.
c2 l 2
(10.98)
Suchen wir nun die Lösung von (10.96) durch den Ansatz
u(ϕ) = u0 (ϕ) + u1 (ϕ) ,
(10.99)
so erhalten wir u1 bis auf Korrekturen der Ordnung 1/c4 aus der Differentialgleichung
u001 + ω 2 u1 = 3γ
M 3 G3
(1 + ε cos ωϕ)2 .
l 4 c2
(10.100)
Die Korrektur u1 (ϕ) kann demnach als eine erzwungene Schwingung aufgefasst
werden und ist leicht zu finden,
·
¸
ω 2 ε2 /2
M 3 G3
cos
2ωϕ
.
(10.101)
u1 (ϕ) = 3γ 2 2 2 (1 + ε2 /2) + εωϕ sin ϕω −
l c ω
4 − ω2
Nur der in ϕ lineare Summand ist von Belang, denn er allein wächst mit jeder
Umrundung der Sonne, um schließlich, nach hinreichend vielen Umläufen, die
Schwelle der Beobachtbarkeit zu erreichen. Wir vernachlässigen die anderen
10.11 Periheldrehung der Planeten
201
Glieder in (10.101). Insgesamt finden wir, unter Inkaufnahme weiterer Fehler
der Ordnung 1/c4
µ
¶
2e 1
MG
(1 + ε cos ωϕ)
1−γ 2
u(ϕ) ≈ 2
l
c
ω2
M 3 G3 ϕ
ε sin ωϕ
l 4 c2 ω
¸
µ
¶
·
2e 1
M 2 G2
MG
ϕ
sin
ωϕ
.
1−γ 2
1
+
ε
cos
ωϕ
+
ε3γ
≈ 2
l
c
ω2
c2 l 2
+ 3γ
(10.102)
Die beiden ϕ-abhängigen Glieder lassen sich wegen cos(ϕ3γM 2 G2 /l2 c2 ) ≈ 1 mit
Hilfe eines trigonometrischen Additionstheorems zusammenfassen, woraufhin
wir erhalten
u(ϕ) ∼ 1 + ε cos Ωϕ ∼ 1/r(ϕ)
Ω=1−
M 2 G2
(2 − β + 2γ) .
c2 l 2
(10.103)
Wir schließen, dass zwei aufeinander folgende größte Annäherungen (Perihelia)
des Planeten an die Sonne durch das Winkelinkrement 2π/Ω 6= 2π getrennt
sind. Die Abweichung 2π/Ω − 2π ist die gesuchte Periheldrehung pro Umlauf,
δϕ = 2π(−1 + 1/Ω) = 2π
M 2 G2
(2 − β + 2γ) + O(1/c4 ) .
c2 l 2
(10.104)
Da in den astronomischen Tafeln meist nicht der auf die Planetenmasse bezogene Drehimpuls gegeben wird, ist es zweckmäßig, l2 durch die große Halbachse
a und die Exzentrizität ε der Keplerellipse auszudrücken. Aus (10.97) finden
Sie leicht l2 = a(1 − ε2 )M G und somit
δϕ = 6π
MG
2 − β + 2γ
.
2
−ε )
3
c2 a(1
(10.105)
Unter den Planeten der Sonne hat der erst im Jahr 1949 entdeckte Ikarus
die größte Periheldrehung pro Umlauf. Die bis heute akkumulierten astronomischen Daten erlauben die Bestimmung der Periheldrehung aber erst mit einer
Genauigkeit von etwa 10%. Viel genauer ist die Periheldrehung des Merkur,
δϕM = 43.1100 ± 0.4500
pro Erdjahrhundert ,
(10.106)
bekannt. Tragen wir die Daten MS , aM und εM sowie die Periheldrehung
(10.106) in (10.105) ein, so erhalten wir
2 − β + 2γ
= 1.00 ± 0.01 .
3
(10.107)
Dieses Resultat ist in schönstem Einklang mit den aus den Einsteinschen
Feldgleichungen folgenden Werten β = γ = 1. Zur experimentellen Bestimmung von β und γ brauchen wir allerdings neben (10.106) einen weiteren unabhängigen Zusammenhang zwischen diesen Parametern.
202
10 Bewegung schneller Teilchen im Gravitationsfeld
10.12
Lichtablenkung durch die Sonne
Zur Berechnung der Bahn eines Lichtstrahls, der, von einem Stern kommend,
an der Oberfläche der Sonne vorbei zur Erde läuft, können wir den Energie”
satz“ (10.91) oder, besser, die aus ihm gewonnene Differentialgleichung (10.96)
verwenden. Dabei müssen wir, wie in 10.10 besprochen, als kinetische Energie
”
pro Masse“ des Photons
e = c2 /2
(10.108)
ansetzen. Ferner ist wichtig, den Drehimpuls pro Masse“ l des Photons als
”
proportional zur Lichtgeschwindigkeit c zu erkennen. Dazu müssen wir uns nur
klarmachen, dass der Teil des Lichtstrahls, der so weit vor der Sonne verläuft,
dass das Feld der Sonne noch vernachlässigbar klein ist, durch die Gerade
b
= sin ϕ
r
(10.109)
beschrieben wird (Abbildung 10.4). Dabei ist b, der so genannte Stoßparameter,
Abbildung 10.4
die kürzeste Entfernung der Geraden von der Sonne. In diesem Raumbereich
wandert eine Wellenfront mit der Geschwindigkeit
c=−
d
(r cos ϕ) = −ṙ cos ϕ + ϕ̇r sin ϕ .
dt
(10.110)
Aus letzterer Gleichung und der aus (10.109) durch Differenzieren gewonnenen
Identität
0 = ṙ sin ϕ + ϕ̇r cos ϕ
(10.111)
finden wir rϕ̇ = c sin ϕ = bc/r, also den Drehimpuls pro Masse“
”
r2 ϕ̇ = l = bc .
(10.112)
Dieser Ausdruck war zu erwarten für ein mit Lichtgeschwindigkeit bewegtes
Teilchen“.
”
Nach Eintragen der Integrationskonstanten e und l in (10.95) finden wir als
Differentialgleichung für die Lichtbahn u(ϕ) = 1/r(ϕ)
·
¸
M 2 G2
MG
MG
u00 + 1 − 2(2 − β − γ) 2 4 u − (1 − γ) 2 2 = 3γ 2 u2 .
(10.113)
b c
b c
c
10.12 Lichtablenkung durch die Sonne
203
Da wir nur an der Korrektur niedrigster Ordnung in 1/c2 zur Geraden (10.109)
interessiert sind, lassen wir das zu 1/c4 proportionale Glied auf der linken Seite
fallen und untersuchen die Gleichung
u00 + u = (1 − γ)
MG
MG
+ 3γ 2 u2 .
b2 c 2
c
(10.114)
Wegen der Kleinheit der rechts stehenden relativistischen Korrekturglieder (der
Schwarzschildradius MS G/c2 der Sonne ist viel kleiner als der kleinstmögliche
Wert für den Stoßparameter b, d. h. als der Sonnenradius), verzichten wir wieder
auf eine exakte Lösung. Wir begnügen uns mit der Näherung
u(ϕ) =
1
sin(ϕ − ϕ0 ) + u1 (ϕ) ,
b
(10.115)
wobei u1 (ϕ) die Korrektur der Ordnung 1/c2 zur Lösung nullter Ordnung ist.
Letztere statten wir bequemlichkeitshalber mit einer (in (10.109) Null gesetzten)
Integrationskonstanten ϕ0 aus und berechnen die Störung aus
u00 (ϕ) + u(ϕ) = (1 − γ)
MG
MG
+ 3γ 2 2 sin2 (ϕ − ϕ0 ) + O(1/c4 ) .
2
2
b c
b c
(10.116)
Die Lösung dieser Differentialgleichung einer erzwungenen Schwingung finden
Sie leicht selbst. Insgesamt ergibt sich
u(ϕ) =
MG
MG
1
2
sin(ϕ − ϕ0 ) + (1 − γ) 2 2 + γ 2 2 [1 + cos(ϕ − ϕ0 )]
b
b c
b c
+ O(1/c4 )
(10.117)
Hieraus berechnen wir schnell den gesuchten Ablenkungswinkel δϕ. Legen wir
zunächst die Integrationskonstante ϕ0 so fest, dass der Lichtstrahl mit dem
Winkel ϕ = π einläuft, wie das in der Skizze und in (10.109) angenommen ist.
Wegen der Kleinheit der relativistischen Effekte wird |ϕ0 | ¿ 1 sein und wir
erhalten aus u(π) = 1/r(π) = 0
0=
1
MG
ϕ0 + (1 − γ) 2 2 + O(ϕ40 ) .
b
b c
(10.118)
Der Strahl läuft aus für ϕ → ϕ∞ und es gilt ebenfalls |ϕ∞ | ¿ 1. Wir finden
ϕ∞ aus u(ϕ∞ ) = 1/r(ϕ∞ ) = 0, also
ϕ∞ − ϕ0 + (1 − γ)
¡
¢¤
MG
MG£
+ γ 2 4 + O (ϕ∞ − ϕ0 ) = 0 .
bc2
bc
(10.119)
Zusammen mit der Bestimmung (10.118) für ϕ0 ergibt sich der Ablenkungswinkel
δϕ = |ϕ∞ | = 2(1 + γ)
MG
.
bc2
(10.120)
Setzen wir hier den Schwarzschildradius der Sonne, MS G/c2 ≈ 1, 48 km,
und für b den Sonnenradius, RS ≈ 6, 95 × 105 km, ein. Dann ergibt sich der
Ablenkwinkel für einen Lichtstrahl, der auf dem Weg zur Erde unmittelbar an
der Sonnenoberfläche vorbeistreicht,
δϕmax = 1, 7500 ×
1+γ
.
2
(10.121)
204
10 Bewegung schneller Teilchen im Gravitationsfeld
Die heute verfügbaren Daten (im optischen Spektralbereich und für Radiowellen) sind verträglich mit der Einsteinschen Vorhersage γ = 1, legen aber den
Parameter γ, erst mit etwa 10-prozentiger Genauigkeit fest. Von genaueren
Messungen werden Sie mit Sicherheit in naher Zukunft hören und lesen.
Insgesamt geben die hier besprochenen experimentellen Befunde (zur Frequenzverschiebung fallender Photonen, zur Periheldrehung und zur Lichtablenkung im Gravitationsfeld) eine schöne Bestätigung des Einsteinschen Äquivalenzprinzips und der weitergehenden Aussagen der Einsteinschen Gravitationstheorie.
Kapitel 11
Quanten
11.1
Teilchen sind Wellen
Teilchen sind Wellen, und Wellen sind Teilchen. Um den Sinn solchen Verwirrspiels mit Worten klarzulegen, rufen wir uns einige prototypische experimentelle
Erfahrungen in Erinnerung.
Davisson und Germer ließen, wie in Abbildung 11.1 schematisch dargestellt,
einen gut kollimierten Strahl monoenergetischer Elektronen auf eine ebene Oberfläche eines Kristalls einfallen und maßen, bei konstantem einfallenden Elektro-
{
Abbildung 11.1
nenstrom und konstantem Einfallswinkel ϕ, den Strom der reflektierten Elektronen als Funktion des Impulses der einfallenden Elektronen. Es ergeben sich
besonders starke reflektierte Ströme für solche Impulse p, die die Beziehung
h
2a sin ϕ = n ,
p
mit n = 1, 2, 3, . . .
(11.1)
erfüllen, wobei
h = 6, 61 × 10−27 erg s = 6.61 × 10−34 J s
(11.2)
die Plancksche Konstante ist. Die Elektronen verhalten sich dabei wie Wellen
der Wellenlänge (de Broglie-Wellenlänge)
λ = h/p,
205
(11.3)
206
11 Quanten
denn für derartigen Wellen garantiert die Beziehung (11.1) gerade konstruktive
Interferenz der an aufeinander folgenden Netzebenen reflektierten Wellenamplituden. Entsprechende Experimente mit Röntgenstrahlen, also elektromagnetischen Wellen, waren vorher schon von von Laue durchgeführt worden. Die
bevorzugten Reflexionen sind dabei ebenfalls durch (die aus der Optik bekannte
Braggsche Relation)
2a sin ϕ = nλ
(11.4)
ausgezeichnet.
Dass umgekehrt auch elektromagnetische Wellen Teilchencharakter zeigen
können, wissen Sie z. B. vom Comptoneffekt. Läuft ein Elektron gegen einen
γ-Strahl mit Wellenlänge λ, Frequenz ν = c/λ und Wellenvektor ~k, so kann
das Elektron einen Stoß erleiden, bei dem sich die Energie und der Impuls des
Elektrons ändern. Unverändert bleiben jedoch Gesamtenergie und Gesamtimpuls von Elektron und elektromagnetischer Welle, wenn dem Stoßpartner des
Elektrons, dem Photon, der Impuls
|~
p| = h/λ
und p~ =
h~
k
2π
(11.5)
und die Energie
E = hν = hc/λ
(11.6)
zugeordnet werden.
Bevor wir uns in die Konsequenzen derartiger Experimente vertiefen, dürfen
wir uns klarmachen, dass wenigstens im Erfahrungsbereich des Alltags, dem
jedes Kind seine Anschauung der Welt abgewinnt, ein Teilchen ein Teilchen
bleibt und keine Welle Teilchencharakter vorgaukelt. Um etwa den Wellencharakter einer Kegelkugel nachzuweisen, müsste auf einem Längenmaßstab
λ = h/p experimentiert werden. Nun ist der Impuls einer Kegelkugel von der
Größenordnung p ≈ 1 kg m/s, und dieser Wert entspricht einer de Broglie Wellenlänge λ ≈ 6, 6 × 10−32 cm. Solch aberwitzig kleine Wellenlängen entziehen
sich übrigens nicht nur alltäglichen Beobachtungsmethoden. Sie dürfen nun selber überlegen, ob der Wellencharakter der Erde bei der alljährlichen Umrundung
der Sonne nachweisbar ist.
Ebenso aufschlussreich ist die Berechnung der typischen Elektronengeschwindigkeit im Davisson Germer Experiment, v ≈ h/ma. Sie beträgt einige tausend
Stundenkilometer, wenn als Gitterkonstante a ≈ 10−8 cm angesetzt wird. Wegen der Kleinheit der Elektronenmasse können solche für den Alltag exotisch
großen Geschwindigkeiten bequem erreicht werden, indem Elektronen einem
elektrischen Feld der Größenordnung 100 V ausgesetzt werden. Im Übrigen beträgt hier die typische Elektronengeschwindigkeit wenige Prozent der Lichtgeschwindigkeit, so dass eine nichtrelativistische Behandlung des Effektes gerade
noch gerechtfertigt ist.
Überzeugen wir uns davon, dass auch die Elektronenbewegung in der Atomhülle nichtrelativistischen Wellencharakter zeigen muss. Die typische Bindungsenergie eines Elektrons beträgt einige zehn Elektronenvolt, was wieder einer
Geschwindigkeit von wenigen tausend Sekundenkilometern und einer de Broglie
Wellenlänge λ ≈ h/mv der Größenordnung 10−8 cm entspricht. Diese Wellenlänge stimmt aber gerade mit der Größenordnung des Atomdurchmessers
überein.
11.1 Teilchen sind Wellen
207
Die klassischen Begriffe Teilchen“ und Welle“ sind beide zu eng, als dass ei”
”
ner allein ausreichen würde zur Beschreibung des Verhaltens mikroskopischer
”
Gebilde“, die wir künftig Quanten nennen werden. Das Quant Elektron benimmt sich bei manchen Experimenten, als sei es ein klassisches Teilchen, zeigt
aber Welleneigenschaften, wenn es auf Längenskalen beobachtete wird, die mit
der de Broglie Wellenlänge vergleichbar sind. Das Quant Photon benimmt sich
wie eine Welle bei den klassischen Interferenzexperimenten, jedoch wie ein Teilchen, wenn eine elektromagnetische Welle mit der Frequenz ν auf Energieskalen
der Ordnung hν beobachtet wird.
Zur Charakterisierung des unterschiedlichen Verhaltens von klassischen Teilchen, klassischen Wellen und Quanten sind die folgenden Karikaturen beliebt
und nützlich (Abbildung 11.2).
Denken wir uns Wasserwellen einer Wellenlänge λ durch zwei Spalte eines
ebenen Schirms geschickt und hinter diesem in einer zu ihm parallelen Ebene
registriert.
Abbildung 11.2
In der Beobachtungsebene stellen wir ein kontinuierliches Anströmen von
Energie fest und schließen aus genauen Messungen, dass die Intensität I quadratisch in der kontinuierlich variablen Wellenamplitude h ist. Messen wir die
Intensität als Funktion der Koordinate x quer zur Richtung der Spalte, so finden
wir
I = I1 = |h1 |2 ,
falls der untere Spalt verdeckt ist,
2
I = I2 = |h2 | ,
falls der obere Spalt verdeckt ist,
2
I = I12 = |h1 + h2 | ,
falls beide Spalte geöffnet sind.
Im letzteren Fall werden, da sich die Wellenamplituden additiv verhalten, die
für klassische Wellen typischen Interferenzen sichtbar.
Denken wir uns nun einen stationären Strom klassischer Teilchen, etwa
Schrotkörner, von einem Quellpunkt aus auf eine Blende geschleudert, so re-
208
11 Quanten
gistrieren wir auf dem Schirm die Ankunft diskreter Teilchen. Die Zahl der pro
Zeiteinheit in einem Zähler bei x anlangenden Teilchen sei I1 (x) und I2 (x), wenn
der untere bzw. der obere Spalt verdeckt sind. Dann ergibt sich, wenn beide
Spalte geöffnet sind, die Verteilung I12 (x) = I1 (x) + I2 (x), da jedes registrierte
Teilchen entweder durch den oberen oder durch den unteren Spalt gelaufen ist.
Es addieren sich also hier die Intensitäten und nicht etwa die Wellenamplituden.
Bei dieser Karikatur ist natürlich angenommen, dass die Spaltdurchmesser, der
Spaltabstand und das räumliche Auflösungsvermögen des in der Schirmebene
benutzten Teilchenzählers groß sind gegenüber der de Broglie Wellenlänge der
Schrotkörner.
Schließlich unterwerfen wir Quanten, etwa Elektronen, entsprechendem Vorgehen. In den Zähler gelangen die Elektronen einzeln, wobei sich ihr Teilchencharakter manifestiert. Jedoch zeigt die Stromverteilung auf der Blende ein
Interferenzmuster ähnlich dem der Wasserwellen, wenn beide Spalte geöffnet
sind. Offenbar ist die Bewegung der Elektronen hier durch eine Wellenamplitude ψ charakterisiert, die sich additiv aus den Beiträgen von beiden Spalten
zusammensetzt.
ψ = ψ1 + ψ2
I12 = |ψ1 + ψ2 |2 = I1 + I2 + ψ1 ψ2∗ + ψ1∗ ψ2 .
(11.7)
Zu schließen ist, dass von einem im Detektor anlangenden Quant nicht gesagt
werden kann, durch welchen der beiden Spalte es gekommen ist; zeigt doch das in
der Beobachtungsebene nachgewiesene Interferenzmuster, dass eine Welle durch
beide Spalte gelaufen ist.
Um die merkwürdige Dualität der Quanten weiter zu beleuchten, wiederholen wir das letztere Gedankenexperiment mit Elektronen, stellen aber, um
uns des Weges eines Elektrons zu vergewissern, hinter den Spalten eine Lampe
auf, die den Durchgang eines Elektrons durch einen Spalt durch einen Lichtblitz
anzeigt (ein Photon wird am Elektron gestreut)(Abbildung 11.3). Von jedem
Abbildung 11.3
auf dem Schirm auftreffenden Elektron ist nun bekannt, durch welchen Spalt es
11.1 Teilchen sind Wellen
209
gelaufen ist. Die Gesamtheit der Elektronen, die so als durch den oberen (unteren) Spalt laufend erkannt sind, führt auf dem Schirm zu einer Verteilung I1 (x)
(bzw. I2 (x)), die vorher bei verdecktem unterem (bzw. oberen) Spalt gefunden
wurde. Als Verteilung aller Elektronen, deren Weg identifiziert wurde als oberer
oder unterer Weg, ergibt sich I12 = I1 + I2 . Die Interferenzerscheinungen gehen
also verloren, wenn wir uns durch Beobachtung vergewissern, ob das Elektron
den oberen oder den unteren Spalt passiert.
Schließen Sie nicht etwa, das Elektron richte sein Verhalten danach, ob ein
neben der Apparatur stehender Mensch Augen und Ohren geöffnet oder verschlossen hält, ob also eine sinnlich Wahrnehmung des Lichtblitzes am Spalt und
des Tickens des Zählers am Schirm erfolgt. Gegenüber mancherorts geäußerten
Feststellungen einer besonderen Rolle des beobachtendem Subjekts in der Quantenmechanik ist äußerste Vorsicht und Zurückhaltung geboten. Sämtliche hier
skizzierten Gedankenexperimente können im Labor automatisiert durchgeführt
werden. Die Rolle des Beobachters bleibt darauf beschränkt, dass er die vom
Zeichengerät ausgeworfenen Intensitätsverteilungen zur Hand nimmt und über
sie nachdenkt.
Für die oben angesprochene Lokalisierung eines Elektrons an einem Spalt
und den damit verbundenen Verlust der Interferenz ist keineswegs konstitutiv
ein subjektiver Wahrnehmungsakt, sondern ausschließlich die Beeinflussung des
Elektrons durch das zur Lokalisierung verwendete Licht. Damit nämlich ein
Lichtfleck am unteren Spalt räumlich getrennt erscheint von einem Lichtfleck
am oberen Spalt, muss, wie Sie aus der Einführung in die Optik wissen, Licht
verwendet werden, dessen Wellenlänge λph kleiner ist als der Spaltabstand ∆x.
Nun gilt beim Elektron-Photon-Stoß der Impulserhaltungssatz, so dass sich der
Impuls des Elektrons beim Stoß um einen Betrag der Größenordnung
|∆p| ≈ h/λph & h/∆x
(11.8)
ändert. Folglich ändert sich auch die de Broglie Wellenlänge λel des Elektrons,
u. z. gilt wegen λel ≈ h/p
|∆λel | ≈
λ2
λ2
h
|∆p| ≈ el & el .
2
p
λph
∆x
(11.9)
Da das Experiment mit ∆x ≈ λel durchgeführt werden muss, damit der Quantencharakter des Elektrons im Interferenzmuster auf dem Schirm sichtbar werden kann, ist klar, dass beim zur Lokalisierung des Elektrons notwendigen Stoß
eine relative Änderung ∆λel /λel der de Broglie Wellenlänge der Größenordnung 1
auftritt. Die Monochromasie der Elektronenwelle (d. h. die durch Auswahl der
Quelle vor dem Stoß gegebene Konstanz von Impuls und Energie von Elektron
zu Elektron) geht also bei der Wechselwirkung mit der zur Lokalisierung geeigneten Lichtwelle (d. h. beim Elektron-Proton-Stoß) völlig verloren. Somit ist
das Verschwinden des Interferenzmusters für die lokalisierten Elektronen physikalisch geklärt.
Zur weiteren Bestätigung der durchgeführten Überlegung dient eine letzte
Variante des obigen Gedankenexperiments. Beleuchten wir ein Elektron links
von der Blende mit Licht, dessen Wellenlänge größer ist als der Spaltabstand.
Der jetzt bei der Wechselwirkung des Lichts und einem Elektron entstandene
Lichtfleck hat eine räumliche Ausdehnung, die größer ist als der Spaltabstand,
erlaubt also nicht mehr die Zuordnung des Elektronenweges zu einem der Spalte.
210
11 Quanten
Auf dem Schirm sind nun auch für die durch Lichtflecke aufgefallenen Elektronen
Interferenzmuster nachweisbar. Das zur Lokalisierung des Elektrons zu langwellige Licht stört die Monochromasie des Elektrons nur so wenig, dass letztere zu
konstruktiver Interferenz fähig bleibt.
11.2
Heisenbergs Unschärferelation
Das eben Erschlossene erlaubt die bündige Zusammenfassung, dass die Interferenzfähigkeit der Elektronen rechts von den Spalten notwendigerweise zerstört
wird durch die Lokalisierung der Elektronen beim einen oder anderen Spalt.
Äquivalent ist die folgende, oben auch schon getroffene Feststellung: Bei der Lokalisierung eines Quants mit einer räumlichen Unschärfe ∆x ist unvermeidbar,
dass dem Quant die Unschärfe ∆p seines Impulses erteilt wird, die mindestens
h/∆x beträgt.
∆p ∆x > h
(11.10)
Diese Ungleichung, die Heisenbergsche Unschärferelation, ist die prägnanteste
aller Formulierungen des Quantencharakters von Teilchen und Wellen. Sie wird
uns im Folgenden häufig zur Illustration des Unterschiedes zwischen klassischer
Physik und Quantenphysik dienen.
Ich stelle gleich eine typische Anwendung vor. Betrachten wir ein Teilchen
2 2
in einem harmonischen Potential V = m
2 ω x . Nehmen wir an, vorbehaltlich
späterer Rechtfertigung, dass die Energie sich wie gewohnt aus einem kinetischen
und einem potenziellen Beitrag zusammensetzt gemäß
E=
1 2 1
p + mω 2 x2 ≥ 0 .
2m
2
(11.11)
Nach klassischer Anschauung hat das Teilchen die kleinstmögliche Energie,
nämlich E = 0, wenn es am Grund der Potentialmulde, also bei x = 0 ruht.
Heisenbergs Ungleichung setzt der räumlichen Lokalisierung ∆x bei x = 0 und
Abbildung 11.4
der Schärfe des Ruhens jedoch Grenzen. Bei gegebenem ∆x kann der Impuls
11.3 Die Grundprinzipien der Quantenmechanik
211
nämlich nicht mit Sicherheit kleiner sein als h/∆x, die Energie also nicht mit
Sicherheit kleiner als der kleinstmögliche Wert von
µ
¶2
1
1
h
E=
+ mω 2 (∆x)2 .
(11.12)
2m ∆x
2
Wenn wir diese Größe als Funktion von ∆x minimalisieren, also ∆x aus dE/d(∆x)
= 0 festlegen, so finden wir als minimale Unschärfen ∆x und ∆p
p
√
∆pmin ≈ mhω
(11.13)
∆xmin ≈ h/mω,
und somit als Schranke für die Energie
Emin ≈ hω .
(11.14)
Wir werden diese Abschätzung der Grundzustandsenergie des harmonischen Oszillators bald verfeinern.
Halten wir zunächst nochmals fest, dass der Grundzustand des quantenmechanischen Oszillators nicht den Zustand der Ruhe im Potentialminimum
sein kann. Für makroskopische Oszillatoren sind die Nullpunktschwingungen“
”
gemäß den Unschärfen (11.13) meist unmessbar klein. Für die Schwingung
eines H2 -Moleküls hingegen ist, wie Sie durch Einsetzen der entsprechenden
Masse und Frequenz leicht finden, die minimale Ortsunschärfe ∆xmin von gleicher Größenordnung die der Moleküldurchmesser und somit so berechenbar wie
letzterer.
11.3
Die Grundprinzipien der Quantenmechanik
Aus der Erfahrung, dass Elektronen Interferenzerscheinungen zeigen können,
hatten wir bereits geschlossen, dass die Bewegung von Quanten durch eine
Wellenamplitude charakterisierbar sein muss. Die folgenden Präzisierung des
Schlüssel dient uns als Schlüssel zur Entwicklung der Quantenmechanik.
Die Wahrscheinlichkeit P eines Ereignisses (z. B. Registrieren eines Teilchens
im Zähler am Ort ~x zur Zeit t) ist gegeben durch das Absolutquadrat einer
komplexen Zahl ψ, die wir Wellenamplitude oder Wahrscheinlichkeitsamplitude
oder auch Wellenfunktion nennen werden
P = |ψ|2 .
(11.15)
Die Wahrscheinlichkeit des Ereignisses ist experimentell zu bestimmen als seine
relative Häufigkeit im Vergleich zu anderen möglichen Ereignissen (z. B. Ankunft
des Teilchens im Zähler am anderen Ort x~0 ) bei häufiger Wiederholung des
Experiments unter identischen Bedingungen.
Wenn ein Ereignis auf verschiedene Weisen stattfinden kann (z. B. Ankunft
des Teilchens im Zähler nach Durchlaufen eines Doppelspalts), so ist ψ die
Summe der Wahrscheinlichkeitsamplituden für die einzelnen Weisen, also etwa
ψ =ψ1 + ψ2
P =|ψ1 + ψ2 |2 = |ψ1 |2 + |ψ2 |2 + ψ1∗ ψ2 + ψ1 ψ2∗ .
(11.16)
212
11 Quanten
Die Superponierbarkeit der Wellenfunktion entspricht der Beobachtbarkeit von
Interferenzen.
Wenn allerdings durch zusätzliche Eingriffe in den Ablauf des Experiments
bei jedem Ereignis festgestellt wird, auf welche der mögliche Weisen es eintritt,
so sind in der Wahrscheinlichkeitsverteilung P über die möglichen Ereignisse
keine Interferenzen der den verschiedenen Weisen entsprechenden Partialwellen
mehr feststellbar. Vielmehr addieren sich dann die Wahrscheinlichkeiten für die
einzelnen Weisen also etwa
P = P1 + P2 .
(11.17)
Das Registrieren eines Teilchens zur Zeit t im Zähler am Ort ~x ist ein aber
keineswegs der einzige Typ von Ereignis. Ein anderer Typ ist die Messung des
Impulses p~ zur Zeit t, wieder ein anderer die Messung der z-Komponente des
Drehimpulses Lz eines Teilchens; die entsprechenden Wellenamplituden sind
dann Funktionen von p~ und t bzw. Lz und t. Wir werden Situationen kennen
lernen, in denen die Mannigfaltigkeit möglicher Ereignisse (d. h. Messwerte)
diskret ist. In anderen Fällen (wie etwa bei der Feststellung des Ortes eines
Teilchens) sind die möglichen Messwerte kontinuierlich. Die Wellenfunktion ψ
wird dann zweckmäßigerweise als Funktion der entsprechenden kontinuierlichen
Variablen (also etwa des Ortsvektors ~x) angesetzt und ihr Absolutquadrat (also
z. B. |ψ(~x, t)|2 ) als (räumliche) Wahrscheinlichkeitsdichte definiert. Bei einer
ortsabhängigen Wahrscheinlichkeitsamplitude ψ(~x, t) bedeutet dann
P (~x, t) d3 x = |ψ(~x, t)|2 d3 x
(11.18)
die Wahrscheinlichkeit, das Teilchen zur Zeit t im Volumenbereich d3 x am Ort ~x
zu finden.
11.4
Die Schrödingergleichung
Wir haben bereits genug Kenntnisse zusammengetragen, um mit der Berechnung der orts- und zeitabhängigen Wellenfunktion ψ(~x, t) eines Teilchens beginnen zu können.
Erinnern wir uns des experimentellen Befundes, dass ein Teilchen des Impulses p~ auch Eigenschaften einer Welle mit dem Wellenvektor
~k = p~ 2π = p~/~
(11.19)
h
zeigt. Da die Plancksche Konstante h im Folgenden häufig in Verbindung mit
dem Faktor 1/2π auftaucht, ist es zweckmäßig, die Größe
~ = h/2π
(11.20)
einzuführen. Ferner wissen wir, dass die Energie E eines Teilchens mit der
Kreisfrequenz ω der entsprechenden Welle gemäß
E = ~ω
(11.21)
zusammenhängt. Ebenfalls experimentell gesichert ist, dass ein Teilchen der
Masse m mit dem Impuls p~ stets die Energie E = p~2 /2m hat,
E = p~2 /2m = ~ω =
(~~k)2
.
2m
(11.22)
11.4 Die Schrödingergleichung
213
Durch Energie und Impuls des Teilchens sind also Kreisfrequenz und Wellenvektor der zugehörigen Welle eindeutig festgelegt. Die Wahrscheinlichkeitsamplitude hat dann notwendigerweise die Form einer ebenen monochromatischen
Welle,
~
ψ(~x, t) ∼ ei(k·~x−ωt) .
(11.23)
Es folgt, dass die Wahrscheinlichkeitsdichte |ψ(~x, t)|2 dafür, das Teilchen zur
Zeit t am Ort ~x zu finden, orts- und zeitunabhängig ist. Das ist nicht verwunderlich, denn wenn, wie angenommen, der Impuls p~ des Teilchens ohne die geringste
Unsicherheit |∆~
p| fest liegt, so ist nach der Heisenbergschen Unschärferelation
der Ort des Teilchens völlig ungewiss,
|∆~xmin | ≈ ~/|∆~
p| → ∞
für
∆~
p→0.
(11.24)
Also müssen die Wahrscheinlichkeitsdichte dafür, das Teilchen am Ort ~x bzw.
am Ort ~x 6= x~0 zu finden, übereinstimmen.
Es ist auch anschaulich klar, dass eine streng monochromatische ebene Welle
keinen Anfang und kein Ende haben kann (Abbildung 11.5).
Abbildung 11.5
Andererseits kann eine räumlich lokalisierte Welle (Abbildung 11.6) nicht
Abbildung 11.6
streng monochromatisch sein. Ein Wellenpaket mit räumlicher Ausdehnung
∆x mag noch eine ungefähre Wellenlänge λ der Trägerwelle aufweisen, wenn
λ ¿ ∆x, aber der Wert von λ ist mit einer Unsicherheit
¯ µ ¶¯
¯
h ¯¯
h
(11.25)
∆λmin ≈ ¯¯∆
≈ 2 ∆p ≈ λ2 /∆x
¯
p
p
behaftet, wie aus p = h/λ und der Heisenbergschen Unschärferelation (∆p)min ≈
h/∆x folgt. Wird der Zustand eines Teilchens durch ein derartiges Wellenpaket
beschrieben, so ist das Teilchen mit einer Genauigkeit ∆x räumlich lokalisiert,
denn |ψ(~x)|2 ist nur innerhalb eines Raumbereiches der Lineardimension ∆x
214
11 Quanten
merklich von Null verschieden. Das Wellenpaket muss sich dann als Superposition ebener monochromatischer Wellen
Z
~
ψ(~x, t) ∼ d3 k ϕ(~k)ei(k·~x−ωt)
(11.26)
darstellen lassen. dabei kann die wellenvektorabhängige Wahrscheinlichkeitsamplitude ϕ(~k) merklich von Null verschiedene Werte annehmen nur für Wellenvektoren, die vom mittleren Wellenvektor des Pakets nicht mehr als ∆k ≈ 1/∆x
abweichen. Wir werden derartige Wellenpakete noch genauer anschauen.
Als Wellengleichung für freie Quanten der Masse m bietet sich nun die so
genannte Schrödingergleichung
i~
~2 2
∂
ψ=−
∇ ψ
∂t
2m
(11.27)
an. Diese Differentialgleichung hat nämlich gerade die ebenen monochromatischen Wellen (11.23) mit der Energie E = p2 /2m gemäß (11.22) als Lösungen.
Sie wird, da linear in der Wellenfunktion ψ, auch durch räumlich lokalisierte
Wellenpakete der Form (11.26) befriedigt. Die Linearität in ψ ist im Einklang
mit der bereits als experimenteller Befund vorgestellten linearen Superponierbarkeit der Wellenamplitude.
Sie dürfen nicht glauben, dass (11.27) die einzig mögliche Wellengleichung
ist, die mit der de Broglie-Relation p~ = ~~k und E = p2 /2m verträglich ist.
Andere, kompliziertere, lassen sich zum Beispiel durch Differenzieren nach t
oder den Komponenten des Ortsvektors auf beiden Seiten von (11.27) erzeugen.
Jedoch ist (11.27) die einfachste und daher naheliegendste Wellengleichung. Sie
hat sich für (langsame, nichtrelativistische!) Teilchen bestens bewährt.
Die Schrödingergleichung liest sich besonders plausibel, wenn wir die folgende Korrespondenz zwischen den in ihr auftretenden Differentialoperatoren
i~∂/∂t und −i~∇ und der Energie E bzw. dem Impuls p~ des Teilchens einführen
i~
∂
b
≡E
∂t
~
∇ ≡ p~ˆ
i
↔
Energie E
↔
Impuls p~ .
(11.28)
Mit Hilfe dieser Korrespondenz erkennen wir dir Schrödingergleichung Êψ =
(1/2m)(p~ˆ)2 als Verallgemeinerung der Teilcheneigenschaft E = p2 /2m auf eine
Eigenschaft der Wellenfunktion ψ(~x, t).
Wenn das betrachtete Teilchen nicht frei ist, sondern eine ortsabhängige
potenzielle Energie V (~x) hat, so liegt nahe, die klassische Teilcheneigenschaft
p
~2 /2m + V (~x) ´= E = const zu verallgemeinern auf die Eigenschaft Êψ =
³
p~ˆ2 /2m + V (~x) ψ der Wellenfunktion ψ(~x, t). Tatsächlich ist
∂
i~ ψ(~x, t) =
∂t
½
¾
~2 2
−
∇ + V (~x) ψ(~x, t)
2m
(11.29)
die Schrödingersche Wellengleichung, die sich zur quantenmechanischen Beschreibung nichtrelativistischer Teilchen der Masse m mit der potenziellen Energie V (~x) als richtig erwiesen hat.
11.5 Normierung der Wellenfunktion
11.5
215
Normierung der Wellenfunktion
Ein Teilchen befinde sich irgendwo im Inneren eines (der Einfachheit halber
zunächst endlichen) Raumbereichs V . Die Interpretation seiner Wellenfunktion
ψ(~x, t) als einer Wahrscheinlichkeitsamplitude verlangt, dass die Gesamtwahrscheinlichkeit, das Teilchen in V zu finden, gleich Eins ist,
Z
d3 x |ψ(~x, t)|2 = 1 .
(11.30)
V
Die Normierung muss zeitlich erhalten bleiben, solange das Teilchen in V eingesperrt bleibt.
Die folgende kleine Rechnung zeigt, dass die Schrödingergleichung mit der
zeitlichen Erhaltung der Norm (11.30) verträglich ist. Schreiben wir die Zeitableitung der Norm mit Hilfe der Schrödingergleichung
Z
Z
n
o
∂
d3 x |ψ(~x, t)|2 = d3 x ψ̇ψ ∗ + ψ ψ̇ ∗
∂t
V
V
1
=
i~
¸
½ ·
h2 2
∗
∇ +V ψ
d x ψ −
2m
Z
3
V
¸ ¾
·
~2 2
−ψ −
∇ + V ψ∗
2m
Z
©
ª
i~
=
d3 x ψ ∗ ∇2 ψ − ψ∇2 ψ ∗
2m
V
i~
=
2m
Z
d3 x ∇ · {ψ ∗ ∇ψ − ψ∇ψ ∗ }
V
und benutzen den Gaußschen Satz, um das erhaltene Volumenintegral in ein
Flächenintegral über die Oberfläche F von V zu verwandeln, so erhalten wir
den Erhaltungssatz
Z
I
∂
3
2
d x |ψ(~x, t)| = − df~ · ~j(~x, t)
(11.31)
∂t
V
F
mit der Wahrscheinlichkeitsstromdichte
~j(~x, t) ≡ 1 ~ {ψ ∗ ∇ψ − ψ∇ψ ∗ } .
2m i
(11.32)
Damit die Norm (11.30) zeitlich erhalten bleibt, müssen wir nun fordern, als
Randbedingung für die Wellenfunktion ψ(~x, t) auf F , dass der WahrscheinlichH
keitsstrom df~ · ~j(~x, t) durch F verschwindet. Durch diese Forderung stellen
F
wir sicher, dass das Teilchen in V eingesperrt bleibt.
216
11.6
11 Quanten
Mittelwerte
Für ein Teilchen mit der Wahrscheinlichkeitsdichte |ψ(~x, t)|2 am Ort ~x berechnen
sich die Mittelwerte h~xi seiner Ortskoordinaten offenbar als die Integrale
Z
h~xi = d3 x ~x|ψ(~x, t)|2 ,
(11.33)
die über das ganze (u. U. unendliche) dem Teilchen zugängliche Volumen zu
erstrecken sind. Entsprechend gilt für den Mittelwert einer Funktion des Ortsvektors wie z. B. der potenziellen Energie U (~x)
Z
hU i = d3 x U (~x)|ψ(~x, t)|2 .
(11.34)
Behalten Sie in Erinnerung, dass derartige Mittelwerte experimentell dadurch
zu bestimmen sind, dass der Ort ~x bzw. die potenzielle Energie des Teilchens an
vielen identisch präparierten Systemen gemessen und die Resultate anschließend
gemittelt werden.
Der Mittelwert des Impulses p~ eines Teilchens, welches sich im unendlichen
Volumen −∞ < x, y, z < +∞ befindet, kann in entsprechender Weise gewonnen
werden, wenn die Wahrscheinlichkeitsamplitude ϕ(~k, t) dafür bekannt ist, dass
der Wellenvektor ~k = p~/h zur Zeit t seinen Wert im Intervall (2π)−3 d3 k bei ~k
hat. Dabei ist |ϕ(~k, t)|2 d3 k/(2π)3 die Wahrscheinlichkeit, den Wellenvektor in
diesem Intervall zu finden, und es gilt
h~
pi = ~
Z
d3 k ~ ~
k|ψ(k, t)|2 = ~h~ki ,
(2π)3
(11.35)
wobei wir bezüglich aller drei Komponenten von ~k von −∞ bis +∞ zu integrieren haben.
Nun legt ϕ(~x, t) als Amplitude dafür, dass das Teilchen sich als die ebene
~
Welle eik·~x erweise, auch die Amplitude ψ(~x, t) für den Aufenthalt des Teilchens
am Ort ~x fest gemäß
ψ(~x, t) =
Z
d3 k
~
ϕ(~k, t) eik·~x .
(2π)3
(11.36)
Diese Darstellung der ortsabhängigen Wellenfunktion als Superposition ebener
Wellen verallgemeinert die Wellenpakete für ein freies Teilchen, die wir in 11.4
kennengelernt hatten. Die Theorie der Fouriertransformationen spezifiziert die
Bedingungen für die Darstellbarkeit einer Funktion ψ(~x) durch ein Fourierintegral der Form (11.36). Wir nehmen hier alle solchen Bedingungen als erfüllt
an und setzen auch stillschweigend stets voraus, dass die uns begegnenden Wellenfunktionen ψ(~x) eindeutig ihre Fouriertransformierten ϕ(~k) festlegen. Bei so
durch Annahme gesicherter Eindeutigkeit von ϕ(~k) können wir leicht verifizieren, dass
Z
~
~
ϕ(k, t) = d3 x ψ(~x, t)e−ik·~x
(11.37)
11.6 Mittelwerte
217
gerade die Umkehrung der Darstellung (11.36) gibt. Setzen wir nämlich (11.37)
in (11.36) ein, so erhalten wir die Identität
Z
Z
d3 k i~k·(~x−x~0 ) ~0
3 0
e
ψ(x , t)
ψ(~x, t) = d x
(2π)3
Z
~
~0
= d3 x0 δ (3) (~x − x~0 )eik·(~x−x ) ψ(x~0 , t)
= ψ(~x, t) ,
wobei wir die uns von früher bekannte Fourierintegral-Darstellung der Deltafunktion
Z
d3 k i~k·~x
e
.
(11.38)
δ (3) (~x) =
(2π)3
benutzt haben.
Drücken wir nun in (11.35) die Amplitude ϕ(~k, t) für das Auftreten des
Wellenvektors ~k gemäß (11.37) durch die ortsabhängige Wellenfunktion ψ(~x, t)
aus, so erhalten wir die Möglichkeit, den Mittelwert des Impulses mit Hilfe der
letzteren auszurechnen, nämlich
Z
Z
Z
d3 k ~
~
~0
3
hpi =
~
k
d
x
ψ(~
x
,
t)
d3 x0 ψ ∗ (x~0 , t)e−ik·(~x−x )
(2π)3
Z
Z
Z
d3 k −i~k·(~x−x~0 )
3
3 0
∗ ~0
e
.
= d x ψ(~x, t) d x ψ (x , t)i~∇
(2π)3
Dabei wirkt der Gradient ∇ auf die ungestrichenen Koordinaten. Nach partieller
Integration (die Randterme verschwinden, sonst könnte ψ(~x, t) nicht normierbar
sein) und Beachtung der Darstellung (11.38) der Deltafunktion ergibt sich der
gesuchte Mittelwert des Impulses zu
Z
~
h~
pi = d3 x ψ ∗ (~x, t) ∇ψ(~x, t) .
(11.39)
i
Wir stoßen hier wieder auf die Korrespondenz des Impulses eines Teilchens
mit dem Differentialoperator ~i ∇. Die Ubiquität dieser Korrespondenz in der
Quantenmechanik macht es zweckmäßig, den Operator
µ
¶
~
~ ∂ ∂ ∂
p~op = ∇ =
,
,
(11.40)
i
i ∂x ∂y ∂z
als Impulsoperator in der Ortsdarstellung oder, kürzer, als Impulsoperator zu
bezeichnen. Ähnlich bequem ist es, den in der Schrödingergleichung auftretenden Differentialoperator
~2 2
∇ + V (~x)
(11.41)
2m
kurz der Hamiltonoperator des Teilchens zu nennen, der die Energie des Teilchens repräsentiert. Die mittlere Energie des Teilchens lässt sich offenbar durch
das Integral
Z
hHi = d3 x ψ ∗ (~x, t)Hop ψ(~x, t)
(11.42)
Hop = p~2op /2m + V (~x) = −
berechnen.
218
11.7
11 Quanten
Freie Pakete zerfließen
Ein freies Wellenpaket vergrößert im Lauf der Zeit seine räumliche Ausdehnung.
Diese bei klassischen Teilchen unbekannte Eigenschaft von Quanten will ich hier
der Einfachheit der Rechnung halber in einer Raumdimension illustrieren.
Die anfängliche Wellenfunktion habe die Gaußsche Form
ψ(x, 0) = (πσ)−1/4 e−x
2
/2σ
.
(11.43)
/σ
(11.44)
Die Wahrscheinlichkeitsdichte
|ψ(x, 0)|2 = (πσ)−1/2 e−x
2
ist dann auf Eins normiert,
+∞
Z
dx |ψ(x, 0)|2 = 1 .
(11.45)
−∞
Um die Wellenfunktion ψ(x, t) zu späteren Zeiten zu finden, müssen wir die
Schrödingergleichung i~ψ̇ = (p2 /2m)ψ mit der Anfangsbedingung (11.43) lösen.
Dazu ist es zweckmäßig, das Paket (11.43) als Superposition ebener Wellen
darzustellen,
ψ(x, 0) = (4πσ)
1/4
+∞
Z
dk ikx− σ k2
2
e
.
2π
(11.46)
−∞
Sie prüfen oder schlagen leicht nach, dass das Fourierintegral (11.46) gerade die
Gaußfunktion (11.43) ergibt (sogar bei komplexem σ, jedoch muss Re σ > 0
sein). Die zugehörige zeitabhängige Lösung der Schrödingergleichung muss nun
lauten
ψ(x, t) = (4πσ)
1/4
+∞
Z
dk ikx− σ k2 −i hk2 t
2
2m
e
,
2π
(11.47)
−∞
denn zur ebenen Welle eikx gehört die Frequenz ω = ~k 2 /2m. Das Wellenzahlintegral (11.47) ist leicht ausgeführt, denn es unterscheidet sich vom anfänglichen,
d. h. von (11.46) nur durch σ → σ + i ~t
m im Exponenten. Statt (11.43) ergibt
sich also
s
½
¾
σ
x2
1/4
exp −
.
(11.48)
ψ(x, t) = (πσ)
2(σ + i~t/m)
σ + i ~t
m
√
Uns interessiert besonders der Fall eines reellen σ, denn dann ist σ ein Maß
für die anfängliche Ausdehnung des Pakets. Um die Ausdehnung des Pakets zu
späteren Zeiten zu studieren, betrachten wir das Absolutquadrat
|ψ(x, t)|2 = (πσ(t))
−1/2 −x2 /σ(t)
e
mit
σ(t) = σ +
1
σ
µ
~t
m
¶2
.
(11.49)
11.7 Freie Pakete zerfließen
219
Dies ist wie (11.43) ein Gaußsches Paket, jedoch mit der räumlichen Ausdehnung
½
µ ¶2 ¾1/2
p
1 ~t
,
(11.50)
σ(t) = σ +
σ m
die im Laufe der Zeit monoton wächst. Nun ist nachgerechnet, dass freie Pakete
zerfließen.
Niemand hat je einen Fußball zerfließen gesehen, ohne sofort den Fernseher
als defekt zu erklären. Der Grund ist aus dem Resultat (11.50) leicht abzulesen. Bis zur Verdoppelung einer anfänglichen
Längendimension
∆x des Pakets
p
√
vergeht die Zeit T , die aus (11.50) mit σ(T ) = 2 σ zu
√
(∆x)2 m 3
T =
(11.51)
~
folgt. Als normalsichtiger Zuschauer können Sie zwei irgendwo auf dem Fels
unmittelbar nebeneinander liegende Bälle als getrennt auflösen, also einen Ball
mit der Genauigkeit der Größenordnung ∆x ≈ 10 cm lokalisieren. Mit diesem
∆x und der typischen Masse eines Fußballs finden Sie die Zeit T als bei weitem
größer als das Alter des Universums (das wir auf etwa 1010 Jahre schätzen). Wir
haben also keinerlei Veranlassung, die Schrödingergleichung zu lösen, wenn es
die Bahnen makroskopischer Teilchen zu berechnen gilt. Mikroskopische Wellenpakete zerfließen recht schnell. Für ein auf ∆x ≈ 1 Å = 10−8 cm lokalisiertes Elektron verdoppelt sich die Ausdehnung des Wellenpakets innerhalb von
10−15 Sekunden (s. Abbildung 11.7).
Abbildung 11.7
220
11.8
11 Quanten
Das Ehrenfestsche Theorem
Untersuchen wir die Bewegung von Quanten in äußeren Potentialen U (~x). Eine
wichtige Eigenschaft dieser Bewegung kann für beliebiges Potential U (~x) ohne
explizite Lösung der Schrödingergleichung gefunden werden. Sie betrifft das
zeitliche Verhalten des Mittelwerts h~xi, also des Schwerpunkts des Wellenpakets.
Wir werden gleich sehen, dass sich der Schwerpunkt h~xi wie ein klassisches
Teilchen bewegt, auf das der Mittelwert der Kraft, also −h∇U (~x)i, wirkt.
Um dieses von Ehrenfest erkannte Theorem zu beweisen, differenzieren wir
den Mittelwert h~xi nach der Zeit und benutzen für die Zeitableitung der Wellenfunktion ψ(~x, t) die Schrödingergleichung.
Z
n
o
d
h~xi = d3 x ψ̇ ∗ ~xψ + ψ ∗ ~xψ̇
dt
¸
½
·
Z
~2 2
1
3
∇ + U ψ∗
d x −~xψ −
=
i~
2m
·
¸ ¾
~2 2
∇ +U ψ
+ ~xψ ∗ −
2m
Z
©
ª
~
d3 x −~xψ ∗ ∇2 ψ + ~xψ∇2 ψ ∗ .
=
2mi
Im zweiten Summanden der letzten Zeile integrieren wir nacheinander zweimal
partiell. Die dabei auftretenden Randterme müssen verschwinden, da die Normierbarkeit der Wellenfunktion hinreichend schnellen Abfall von ψ für |~x| → ∞
sicherstellt. Es ergibt sich
Z
©
ª
d
~
h~xi =
d3 x ψ ∗ ∇2 ~x − ~x∇2 ψ .
(11.52)
dt
2mi
Den in der geschweiften Klammer stehenden Differentialoperator vereinfachen
wir schnell gemäß (Summenkonvention!)
µ
¶
∂2
∂2
∂
∂
∂
x
=
+ xi 2 ,
(11.53)
δ
+
x
=2
i
ij
i
2
∂xj
∂xj
∂xj
∂xj
∂xj
und erhalten
1
d
h~xi =
dt
m
Z
~
1
d3 x ψ ∗ ∇ψ = h~
pi .
i
m
(11.54)
Dies ist der klassische nichtrelativistische Zusammenhang zwischen der Ged
h~xi und dem Impuls h~
pi. Nochmaliges Differenzieren nach der
schwindigkeit dt
Zeit liefert
Z
o
n
d2
1 d
1 ~
3
∗
∗
ψ̇
∇ψ
+
ψ
∇
ψ̇
h~
x
i
=
h~
p
i
=
d
x
dt2
m dt
mi
¸
½
·
Z
1
~2 2
=
∇ + U ψ∗
d3 x [∇ψ] −
m
2m
·
¸ ¾
~2 2
− ψ∗ ∇ −
∇ +U ψ .
2m
11.8 Das Ehrenfestsche Theorem
221
Hier heben sich die beiden von der kinetischen Energie rührenden Summanden
gegenseitig weg, wie wir nach zweimaliger partieller Integration eines derselben
sehen, und es bleibt
m
d2
h~xi =
dt2
Z
d3 x ψ ∗ {U ∇ − ∇U } ψ .
(11.55)
Ähnlich, wie wir in (11.52) die Differenz der Operatorprodukte“ ∇2 ~x und ~x∇2
”
ausrechnen, haben wir hier die Vertauschungsrelation“ der Operatoren U (~x)
”
und ∇ zu bestimmen. Beachten Sie, dass im zweiten Summanden in (11.55) der
Differentialoperator ∇ auf die Funktion U (~x)ψ(~x, t) wirkt. Nach der Produktregel der Differenziation gilt
∇U ψ = ψ(∇U ) + U ∇ψ ,
(11.56)
so dass wir für die Beschleunigung des Schwerpunktes des Wellenpaketes erhalten
Z
d2
(11.57)
m 2 h~xi = d3 x |ψ(~x, t)|2 ∇U (~x) .
dt
Dies ist gerade die Newtonsche Bewegungsgleichung eines Teilchens der Masse
m, welches am Ort h~xi der Kraft −h∇U (~x)i ausgesetzt ist,
m
d2
h~xi = −h∇U (~x)i .
dt2
(11.58)
Das Ehrenfestsche Theorem gibt natürlich keine Auskunft über die zeitliche
Änderung der Form der Wellenfunktion ψ(~x, t) eines Teilchens, insbesondere also nicht darüber, ob und wie schnell ein vorgegebenes Paket ψ(~x, 0) zerfließt.
Die Überlegungen des vorigen Paragrafen besagen aber, dass das Zerfließen von
Wellenpakete für makroskopische Teilchen selbst über extrem lange Zeitspannen hinweg völlig vernachlässigbar ist. Dieses Resultat und das Ehrenfestsche
Theorem zusammen begründen die Möglichkeit, die Bewegung langsamer makroskopischer Teilchen nach Newtons Mechanik zu behandeln.
222
11 Quanten
Kapitel 12
Quanten in Kästen
12.1
Eindimensionale Potentialstufe
Ein einfaches Beispiel eines nicht überall kräftefreien Teilchens wird gegeben
durch das Potential
(
0
für x < 0
V (x) =
(12.1)
V0 > 0 für x > 0
Wir lassen der Einfachheit halber auch in der Wellenfunktion ψ(x, t) nur eine
Raumkoordinate zu.
Abbildung 12.1
Bei klassischer Betrachtungsweise konstatieren wir Kräftefreiheit überall außer an der Sprungstelle des Potentials bei x = 0. Ein klassisches Teilchen der
Energie E bewegt sich im linken Halbraum mit konstantem Impuls ±pL =
√
2mE; im rechten Halbraum kann es sich nur aufhalten, wenn seine Gesamtenergie E = p2 /2m + V (x) größer ist p
als die Potentialstufe V0 , welchenfalls es
dort mit konstantem Impuls ±pR = 2m(E − V0 ) läuft; beim Durchdringen
der Grenze x = 0 nach rechts erfährt das Teilchen die Kraft −V 0 (x) = −V0 δ(x),
die den Impuls pL auf pR herabsetzt.
Die Wellenfunktion eines Quants finden wir durch Lösung der Schrödinger223
224
12 Quanten in Kästen
gleichung
¸
·
~2 d 2
+
V
(x)
ψ(x, t) .
i~ ψ̇(x, t) = −
2m dx2
(12.2)
Offenbar lässt sich diese Differentialgleichung durch den Ansatz einer monochromatischen Welle
ψ(x, t) = e−iEt/~ u(x)
(12.3)
lösen. Die Kreisfrequenz dieser Welle ist ω = E/~, also hat die Konstante E die
Bedeutung der Energie des Teilchens. Für den zeitunabhängigen Anteil u(x)
ergibt sich die Differentialgleichung
µ
¶
~2 d 2
−
+ V (x) u(x) = Eu(x) ,
(12.4)
2m dx2
die die eben erschlossene Interpretation von E als Energie nochmals stützt.
Von besonderem Interesse ist der Fall einer Teilchenernergie unterhalb der
Stufe, d. h. 0 < E < V0 . In beiden Halbräume lässt sich u(x) aus (12.4) durch
einen Exponentialansatz finden. Die allgemeinen Lösungen lauten

√
ikx
−ikx

für x < 0
mit ~k = 2mE
 A e +B e
(12.5)
u(x) =

 a e−βx + b e+βx mit ~β = p2m(V − E) für x > 0 .
0
Uns bleibt die Aufgabe, die vier Integrationskonstanten A, B, a, b festzulegen.
Ganz sicher müssen wir
b=0
verlangen, da sonst die Wellenfunktion für x → +∞ über alle Grenzen wachsen
würde und somit nicht mehr als Wahrscheinlichkeitsamplitude eines Teilchens
interpretierbar wäre.
Weiteren Aufschluss über die verbleibenden Integrationskonstanten erhalten
wir, wenn wir (12.4) in unmittelbarer Umgebung der Potentialstufe, d. h. im
Intervall −ε ≤ x ≤ +ε betrachten. Da |u(x)|2 als normierbare Wahrscheinlichkeitsdichte hier beschränkt bleiben muss, folgt aus der Schrödingergleichung (12.4),
dass die zweite Ableitung, u00 (x), an der Stelle x = 0 einen endlichen Sprung
macht,
u00 (ε) − u00 (−ε) =
¢
¢
2m ¡
2m ¡
V (ε) − E u(ε) − 2 V (−ε) − E u(−ε) .
2
~
~
Die erste Ableitung, u0 (x), läuft also mit einem Knick stetig durch x = 0, so dass
u(x) selbst dort ebenfalls stetig ist. Die Argumentation macht übrigens nicht
von der stückweisen Konstanz von V (x), sondern nur von der Endlichkeit des
Potentialsprunges Gebrauch. Also gilt allgemein: Die Wellenfunktion und ihre
erste Ortsableitung verlaufen stetig, wenn das äußere Potential einen endlichen
Sprung macht.
Die Stetigkeit von u(x) und u0 (x) bei x = 0 verlangt in unserem Beispiel
A+B =a
12.1 Eindimensionale Potentialstufe
225
bzw.
ik(A − B) = −βa .
(12.6)
Diese Bedingungen legen zwei der drei Integrationskonstanten fest, und wir
erhalten die Wellenfunktion
 µ
¶
µ
¶
1
β
1
β


1+i
eikx +
1−i
e−ikx
für x < 0

2
k
2
k
−iEt/~
ψ(x, t) = ae


e−βx
für x > 0 .
(12.7)
Die verbleibende Konstante a kann schließlich durch eine Normierungsforderung
festgelegt werden.
Sehen sie, dass ein Quant der Energie E im linken Halbraum den gleichen
√
Impuls hat wie das klassische Teilchen gleicher Energie, ±pL = ±~k = 2mE?
Dass ψ eine nach rechts einlaufende und eine nach rechts reflektierte Welle
enthält? Bemerkenswert ist, dass das Quant im Gegensatz zum klassischen
Teilchen in den rechten Halbraum eindringen kann; die Eindringtiefe 1/β der
Welle ist umso kleiner, je tiefer die Energie E unter der Kante V0 liegt.
Ihnen empfehle ich zur Übung den Nachweis, dass das Quant wie das klassische Teilchen keine negative Energie haben kann; zeigen Sie ebenfalls, dass
das Quant der Energie E > V0 im linken und rechten Halbraum die jeweiligen
klassischen Werte des Impulses annimmt.
Betrachten wir abschließend eine unendlich hohe Potentialstufe, gemäß V0 →
∞ in (12.1). Die Eindringtiefe 1/β der Welle ist dann Null. Die unendlich
hohe Potentialbarriere ist für das Quant ebenso undurchdringlich wie für das
klassische Teilchen. Aus (12.6) folgern wir, dass a = A + B = 0, so dass die
Wellenfunktion zur Wand hin stetig nach Null abfällt (Abbildung 12.2). Die
Ableitung u0 (x) hingegen bleibt an der Wand unbestimmt.
Abbildung 12.2
226
12.2
12 Quanten in Kästen
Eindimensionaler Kasten mit starrem Rand
Wenn Wellen in Kästen endlicher Ausdehnung eingesperrt und somit Randbedingungen unterworfen werden, so sind freie Schwingungen nur bei bestimmten
Eigenfrequenzen möglich. Denken Sie an Saiten, Pauken und Flöten, insbesondere auch an 2.13. Quanten in endlichen Kästen sollten also nicht mit beliebigen
Energien, sondern nur mit diskreten Eigenenergien auftreten können.
Zur Bestätigung dieser Erwartung betrachten wir ein Potential
(
0
für
− a < x < +a
V (X) =
∞
für
|x| > a .
Die unendlich hohe Potentialbarriere am Kastenrand bei x = ±a ist undurch-
Abbildung 12.3
dringlich und erzwingt die Randbedingung
ψ(±a, t) = 0 .
(12.8)
Ein Quant der Masse m bewegt sich im Innern des Kastens kräftefrei. Die
Schrödingergleichung ist dort die des freien Teilchens und hat als Lösungen
ebene monochromatische Wellen
ψ(x, t) = e−iEt/~ (A cos kx + B sin kx) = e−iEt/~ u(x)
(12.9)
mit dem Impuls
~k =
√
2mE.
(12.10)
Die Randbedingung (12.8) lässt sich für E ≤ 0 nur durch die triviale Lösung
A = B = 0, also ψ(x, t) = 0 erfüllen. Also kann im Kasten kein Teilchen mit
verschwindender oder negativer Energie existieren. Für E > 0 finden wir jedoch
sofort nichttriviale Lösungen. Aus
0 = A cos ka + B sin ka
0 = A cos ka − B sin ka
(12.11)
12.2 Eindimensionaler Kasten mit starrem Rand
227
folgt
A cos ka = 0
und
B sin ka = 0 ,
(12.12)
also entweder
A=0
und
sin ka = 0
(12.13)
B=0
und
cos ka = 0 .
(12.14)
oder
Im ersten Fall (A = 0) haben wir als Eigenschwingungen die in x ungeraden
Funktionen
un (x) = B sin kn x,
kn a =
π
n,
2
n = 2, 4, 6, . . .
(12.15)
und im zweiten Fall (B = 0) die geraden Funktionen
un (x) = A cos kn x,
kn a =
π
n,
2
n = 1, 3, 5, . . .
(12.16)
Die zugehörigen Eigenwerte der Energie sind in beiden Fällen durch (12.10) als
En =
~2 kn2
~2 π 2 2
=
n ,
2m
8ma2
n = 1, 2, 3, . . .
(12.17)
festgelegt.
Die ersten vier En aus der unendlichen Folge von Energieniveaus sind in die
Abbildung 12.4 eingetragen. Schematisch aufgesetzt sind dabei die zugehörigen
Eigenfunktionen. Beachten und bewahren Sie folgende Eigenarten unseres Ergebnisses:
(i) Die Grundzustandsenergie ist (nicht E = 0 sondern!) E1 = ~2 π 2 /8ma2 ;
ein auf ∆x ≈ a lokalisiertes Teilchen hat eine Impulsunschärfe von mindestens ∆p ≈ ~/a, also eine kinetische Energie der Ordnung ~2 /ma2 .
(ii) Der Grundzustand u1 (x) hat im Innern des Kastens keine Nullstelle; der
Zustand un (x) hat im Innern des Kastens n − 1 Nullstellen.
(iii) Alle Eigenfunktionen sind gerade oder ungerade; Energieniveaus zu geraden und ungeraden Zuständen wechseln in der Folge En einander ab.
(iv) Die Eigenfunktionen liegen nur bis auf einen Normierungsfaktor fest. Dieser kann so gewählt werden, dass
Z+a
dx un (x)2 = 1
−a
gilt.
228
12 Quanten in Kästen
Abbildung 12.4
Es ist kein Zufall, dass alle Eigenschwingungen un (x) entweder ungerade
(s. 12.15) oder gerade Funktionen sind. Dass keine Eigenfunktion auftritt, die
weder gerade noch ungerade ist, legt vielmehr daran, dass das Potential V (x)
selbst gerade ist,
V (x) = −V (x) ,
(12.18)
wie Sie aus der folgenden Überlegung entnehmen.
Bei beliebigem geraden Potential V (x) bleibt die Schrödingergleichung
−
~2 00
u (x) + V (x)u(x) = Eu(x)
2m
(12.19)
unverändert bei der Transformation x → −x. Wenn also u(x) eine Lösung
zum Eigenwert E ist, so auch u(−x). Wenn es zum Eigenwert E nur eine
Eigenfunktion gibt (bis auf Normierungsfaktor), so ist u(−x) nicht von u(x)
linear unabhängig, sondern muss zu u(x) proportional sein,
u(x) = εu(−x) = ε2 u(x) .
(12.20)
Die zweite Gleichung in (12.20) entsteht bei nochmaliger Transformation x →
−x. Wir folgern ε = ±1, also dass u(x) entweder gerade oder ungerade sein
muss. Die Einschränkung, dass zu einem Eigenwert E nur eine Eigenfunktion
12.3 Potentialtopf endlicher Tiefe
229
u(x) auftreten solle, können wir übrigens allen lassen; eventuell auftretende linear unabhängige u(x) zu einer Energie können immer zu geraden und ungeraden
Funktionen linear kombiniert werden.
12.3
Potentialtopf endlicher Tiefe
Beim oben diskutierten Potentialtopf unendlicher Tiefe gibt es Eigenschwingungen des Quants nur mit diskreten Eigenfrequenzen bzw. Energien. Dieses
Verhalten ist typisch (was ich hier nicht zeige) für Potentiale, die für x → ±∞
(bzw. |~x| → ∞ in zwei oder drei Dimensionen) unbeschränkt wachsen. Eine
andere Situation liegt bei einem Potentialtopf endlicher Tiefe vor. Hier laute
die potenzielle Energie des Quants
V (x) =
(
V0
für
|x| > a
0
für
|x| < a .
(12.21)
Abbildung 12.5
Ein diesem Potential unterworfenes klassisches Teilchen ist, falls seine Energie E kleiner ist als die√Topftiefe V0 , gebunden im Kasten −a < x < +a und
hat dort den Impuls ± 2mE. Falls jedoch E > V0 , so kann sich das√klassische Teilchen überall in −∞ < x < ∞ aufhalten;
sein Impuls beträgt ± 2mE,
p
so lange es in −a < x < a bleibt, und ± 2m(E − V0 ), sobald es sich in den
Bereichen |x| > a befindet.
Die im Potential (12.21) möglichen Eigenschwingungen des Quants
ψ(x, t) = e−iEt/~ u(x)
(12.22)
finden wir wie in den vorigen Paragrafen durch Zusammenstückeln der freien
Wellen aus den Bereichen konstanten Potentials. Durch die beiden Sprungstellen
x = ±a müssen u(x) und u0 (x) stetig verlaufen. Zum Aufbau der Lösung
erinnern wir uns zunächst daran, dass der Wellenvektor des Quants der Energie
E die Werte
p
±k = 2mE/~
(12.23)
230
12 Quanten in Kästen
und
±iβ =
p
2m(E − V0 )/~
(12.24)
annimmt bezüglich der Wellen im Bereich |x| < a bzw. |x| > a (letzterer
Wellenvektor ist natürlich als inverse Eindringtiefe zu interpretieren, wenn E <
V0 ). Ferner beachten wir, dass das Potential gerade in x ist, und folgern, dass
wir alle Eigenfunktionen u(x) finden können durch den Ansatz gerader und
ungerader Linearkombination der genannten ebenen Wellen.
Als Kandidaten gerader Eigenfunktionen mit 0 < E < V0 bieten sich an

cos kx
für
|x| < a



−β(x−a)
(12.25)
u(x) = B · cos kae
für
x>a



cos kae+β(x+a)
für
x < −a
Hier habe ich die für x → ±∞ unbegrenzt wachsenden Lösungen der Schrödingergleichung unter Berufung auf die Wahrscheinlichkeitsinterpretation der
Wellenfunktion unterdrückt. Außerdem ist die Stetigkeit von u(x) bei x = ±a
bereits berücksichtigt. Da der Wellenvektor k und die Eindringtiefe 1/β gemäß
(12.23) und (12.24) durch die Energie E festgelegt sind, treten in (12.25) noch
die Energie E und die Normierungskonstante B als freie Parameter auf. Eine
Einschränkung für diese beiden Parameter erhalten wir aus der Forderung der
Stetigkeit von u0 (x) bei x = ±a,
−Bk sin ka = −Bβ cos ka .
(12.26)
Die Befriedigung dieser Randbedingung durch die Wahl B = 0 ist uninteressant, da dann u(x) trivial wird. Nichttriviale Eigenschwingungen des Quants
mit 0 < E < V0 sind nur möglich für Energien, die die Gleichungen (12.23),
(12.24) und (12.26) bei B 6= 0 befriedigen, also
(ak) tan ak = aβ
(12.27)
(ak)2 + (aβ)2 = 2mV0 a2 /~2 ≡ ρ2
E=
~2 k 2
.
2m
(12.28)
(12.29)
Die beiden ersten dieser Gleichungen müssen wir daraufhin untersuchen, ob sie
(positive!) Lösungen für ak und aβ zulassen. Abbildung 12.6 zeigt Graphen der
Funktion ak tan ak = aβ und des Kreises (ak)2 + (aβ)2 = ρ2 . Sie sehen, dass
genau ein Schnittpunkt, d. h. eine Eigenenergie E0
0 < E0 <
³ π ´2
2
~2
2ma2
(12.30)
p
auftritt, wenn ρ = 2mV0 a2 /~ < π. Wenn die Tiefe des Potentialtopfs zunimmt, so entstehen weitere Schnittpunkte, d. h. Eigenenergien.
Ihnen bleibt als eine schöne Übung, die Zahl der auftretenden Eigenwerte
in Abhängigkeit von der Topftiefe V0 zu untersuchen und dabei auch ungerade
Lösungen u(x) zu berücksichtigen. Mir kam es bei der dargelegten Rechnung
12.3 Potentialtopf endlicher Tiefe
231
Abbildung 12.6
darauf an, Ihnen klarzumachen, dass im Topf gebundene Eigenschwingungen
zu Eigenenergien 0 < E < V0 nur für diskrete Werte der Energie auftreten
können. Von im Topf gebundenen Eigenschwingungen zu sprechen, ist hier
angebracht, da die Lösungen (12.23) für |x| > a, also außerhalb des Kastens,
exponentiell abfallen. Folglich sind die gebundenen Zustände auch normierbar
+∞
R
durch
|u(x)|2 = 1.
−∞
Ganz anders benehmen sich die Eigenschwingungen mit E > V0 ! Da für
diese β nach (12.24) imaginär wird, will ich statt β lieber den Wellenvektor
p
(12.31)
K = 2m(E − V0 )/~
benutzen und gerade Eigenschwingungen mit dem Ansatz

cos kx



u(x) = B · cos ka [cos K(x − a) + D sin K(x − a)]



cos ka [cos K(x + a) − D sin K(x + a)]
für
|x| < a
für
x>a
für
x < −a
(12.32)
suchen. Beachten Sie, dass jetzt für |x| > a sowohl exp(+iKx) als auch exp(−iKx)
zuzulassen sind, da beide Wellen beschränkt bleiben. Es tritt also gegenüber
(12.25) eine freie Konstante mehr auf; insgesamt sind B, D und die Energie E
zunächst offen. Die Stetigkeit von u0 (x) bei x = ±a gibt die zu (12.26) analoge
Forderung −kB sin ka = KBD cos ka oder, da nur B 6= 0 von Interesse,
−ka tan ka = DKa ,
(12.33)
Aus (12.23) und (12.31) folgt, dass die Lösungen ka und Ka auch auf der
Hyperbel
(ka)2 − (Ka)2 = 2mV0 a2 /~2 = ρ2
(12.34)
232
12 Quanten in Kästen
liegen müssen. Abbildung 12.7 zeigt, dass für jeden Wert von D unendlich
viele Schnittpunkte der durch (12.33) und (12.34) definierten Kurven im ersten
Quadranden auftreten. Da der Parameter D keiner weiteren Einschränkung
Abbildung 12.7
unterworfen ist, kann die Energie
~2 2
k > V0
(12.35)
2m
kontinuierliche Werte annehmen. Ein solches kontinuierliches Spektrum von
Energieeigenwerten haben wir schon beim freien Quant kennengelernt.
Die zum kontinuierlichen Spektrum gehörigen Eigenzustände (12.32) (sowie
die entsprechenden ungeraden Lösungen) fallen für x → ±∞ nicht ab. Sie
ähneln insofern den ebenen Wellen e±ikx des überall freien Teilchens. Keine der
Lösungen mit E > V0 ist für sich allein im ganzen Raum normierbar im Sinne
von
+∞
Z
dx |ψ(x, t)|2 = 1 .
(12.36)
E=
−∞
Wohl aber lassen sich aus den Lösungen u(x) Wellenpakete
+∞
Z
ψ(x, t) =
dE ϕ(E) e−iEt/~ u(x)
(12.37)
V0
aufbauen, die zu allen Zeiten die Normierung (12.36) behalten.
Halten wir fest: Quanten mit Energien unterhalb des Topfrandes, d. h. mit
E < V0 , sind (ähnlich wie klassische Teilchen) im Kasten −a < x < a gebunden;
sie sind zu Eigenschwingungen nur mit diskreten Energien fähig. Hingegen
können sich Quanten mit Energien oberhalb des Topfrandes, d. h. mit E >
V0 , ähnlich wie klassische Teilchen beliebig weit vom Kasten entfernen und
Eigenschwingungen mit kontinuierlichem Energiespektrum ausführen.
12.4
Quanten durchdringen Wände
Unseren Variationen zum Thema stückweise konstante Potentiale ist eine letzte
höchst lehrreiche hinzuzufügen. Sie soll den so genannten Tunneleffekt illustrie-
12.4 Quanten durchdringen Wände
233
ren.
Zwei Raumbereiche mit verschwindendem Potential seien durch eine Potentialbarriere getrennt gemäß
(
V0
für
|x| < 0
V (x) =
(12.38)
0
für
|x| > d .
Ein von links ankommendes klassisches Teilchen der Energie E < V0 stößt bei
x = 0 auf eine undurchdringbare Wand und wird reflektiert. Ein Quant hingegen
kann die endliche Potentialbarriere durchtunneln“.
”
Abbildung 12.8
Die Lösung der Schrödingergleichung mit der
mit dem Ansatz
 ikx
e + ρ e−ikx
für



u(x) = B · C eβx + D e−βx
für


 ik(x−d)
τe
für
Energie E < V0 suchen wir
x<0,
0<x<d,
(12.39)
x>d,
wobei der Wellenvektor k und die Eindringtiefe 1/β wieder gegeben sind durch
p
√
~β = 2m(V0 − E) .
(12.40)
~k = 2mE,
Der Ansatz berücksichtigt im Bereich x < 0 eine von links einlaufende und eine
nach links reflektierte Welle, sowie für x > d eine von der Barriere durchgelassene nach rechts weiterlaufende Welle. Innerhalb der Wand kann keine der
Partikularlösungen e±βx außer Acht gelassen werden, da beide in 0 < x < d
beschränkt bleiben.
Die vier Integrationskonstanten ρ, C, D und τ lassen sich festlegen durch die
Forderung der Stetigkeit von u(x) und u0 (x) an den Sprungstellen des Potentials.
Von besonderem Interesse ist die Amplitude τ der durch die Wand gedrungenen
Welle, die sich nach leichter aber länglicher Rechnung als
£
¤−1
τ = 2βk 2βk cosh βd − i(k 2 − β 2 ) sinh βd
(12.41)
ergibt. Ihr Absolutquadrat, die Wahrscheinlichkeit, dass ein von links einfallendes Teilchen die Wand durchdringt, heißt die Durchlässigkeit T (E) der Wand
234
12 Quanten in Kästen
und beträgt
·
p
V02
sinh2 2m(V0 − E)d2 /~2
T (E) = |τ | = 1 +
4E(V0 − E)
2
¸−1
(12.42)
Die Durchlässigkeit nimmt monoton zu, wenn E bis V0 wächst. Andererseits
fällt T (E) exponentiell auf Null, wenn die Höhe V0 oder die Breite d der Barriere
über alle Grenzen steigt,
T (E) →
16E(V0 − E) −2√2m(V0 −E)d2 /~2
e
.
V02
(12.43)
Ihnen bleibt als Übung, die so genannte Reflektivität R = |ρ|2 der Wand zu
suchen und das Resultat, R = 1 − T , zu interpretieren.
Kapitel 13
Harmonisch gebundene
Quanten
13.1
Eindimensionaler harmonischer Oszillator
Wir greifen hier einen in Kapitel 2. klassisch behandelten Problemkreis auf und
betrachten ein durch eine lineare Rückstellkraft an eine Ruhelage gebundenes
Teilchen der Masse m. Der Auslenkung x entspricht die potenzielle Energie
V (x) =
1
mω 2 x2 ,
2
(13.1)
wobei ω sich bei der klassischen Behandlung als die Frequenz erwies, mit der
das Teilchen um seine Ruhelage schwingt.
Zur quantenmechanischen Behandlung haben wir die Schrödingergleichung
¶
µ
1
~2 d 2
2 2
+
mω
x
ψ(x, t)
(13.2)
i~ψ̇(x, t) = Hψ(x, t) = −
2m dx2
2
zu lösen. Wir suchen zunächst die Eigenzustände
ψ(x, t) = eiEt/~ u(x)
(13.3)
und Eigenwerte der Energie E aus
Hu(x) = Eu(x) .
(13.4)
Da die potenzielle Energie V (x) des Quants bei Entfernung vom Kraftzentrum
unbeschränkt wächst, erwarten wir ein diskretes Spektrum von Eigenenergien
mit gebundenen, normierbaren Zuständen gemäß
+∞
Z
dx |u(x)|2 = 1 .
(13.5)
−∞
Um die normierbaren Lösungen u(x) der Differentialgleichung (13.4) und
die zugehörigen Energien E zu finden, bedienen wir uns eines algebraischen
235
236
13 Harmonisch gebundene Quanten
Verfahrens, welches die uns schon mehrfach begegnete Produktregel der Differentialrechnung in der Form
d
d
x−x
=1
dx
dx
(13.6)
ausschlachtet. Diese wohlbekannte Identität gibt, nach Multiplikation beider
d
Seiten mit (~/i), eine Aussage über den Impulsoperator p = ~i dx
und die Koordinate x (den Ortsoperator“),
”
~
(13.7)
px − xp ≡ [p, x] = .
i
In Produkten von x und p darf die Reihenfolge der Faktoren also nicht beliebig
vertauscht werden. Wir sprechen, eingebürgerten Brauch folgend, von (13.7) als
der kanonischen Vertauschungsrelation für Koordinate und Impuls.
Für unser Vorhaben ist es zweckmäßig, den Hamiltonoperator
1
H = p2 /2m + mω 2 x2
2
statt durch x und p durch die Linearkombinationen
Ãr
!
r
¶
µr
1
1
mω
mω
~ d
i
a= √
p =√
x+ √
+
,
~
~
mω dx
2
2
mω~
Ãr
!
r
µr
¶
1
1
i
d
mω
mω
~
a† = √
p =√
x− √
x−
~
~
mω dx
2
2
mω~
(13.8)
(13.9)
auszudrücken. Für die Operatoren a und a† finden wir aus (13.7) die Vertauschungsrelation
[a, a† ] = aa† − a† a =
i
[p, x] = 1
~
(13.10)
sowie das Produkt
¶
1 2
i
mω 2
x +
p − [p, x]
~
m~ω
~
¶
µ
1
1
1 2 1
p + mω 2 x2 − .
=
~ω 2m
2
2
1
a a=
2
†
µ
Der Hamiltonoperator (13.8) lässt sich somit in der Form (13.11)
µ
¶
1
†
H = ~ω a a +
2
(13.11)
(13.12)
aufschreiben. Seine Eigenfunktionen u(x) und Eigenwerte E sind bekannt, wenn
die des Operators a† a gefunden sind. Versuchen wir also, die Eigenwertgleichung
a† auλ (x) = λuλ (x)
zu lösen.
(13.13)
13.1 Eindimensionaler harmonischer Oszillator
237
Von den Eigenwerten λ ist schnell zu sehen, dass sie alle nichtnegativ sind.
Wenn wir nämlich (13.13) mit u∗λ (x) multiplizieren und integrieren,
+∞
+∞
Z
Z
∗
†
dx|uλ (x)|2 ,
dx uλ (x)a auλ (x) = λ
(13.14)
−∞
−∞
so entsteht rechts ein Integral über das Absolutquadrat der Funktion uλ (x), das
nicht negativ sein kann. Auch das links auftretende Integral hat diese Eigenschaft, denn in
Ãr
!
r
+∞
Z
1
mω
~ d
∗
dx uλ (x) √
auλ (x)
x−
~
mω dx
2
−∞
können wir durch einmalige partielle Integration die Ableitung d/dx auf u ∗ (x)
abwälzen, woraufhin wir erhalten
r
+∞
+∞
¶
¸
µr
·
Z
Z
mω
~ d
1
∗
†
x+
u∗λ (x) auλ (x)
dx uλ (x)a auλ (x) =
dx √
~
mω dx
2
−∞
−∞
+∞
+∞
Z
Z
∗
dx |auλ (x)|2 ≥ 0 .
dx (auλ (x)) auλ (x) =
=
−∞
−∞
(13.15)
Es folgt die behauptete Eigenschaft der Eigenwerte,
λ≥0.
(13.16)
Hätten wir eine Lösung uλ (x) der Eigenwertgleichung (13.13) mit Eigenwert
λ gefunden, so ergäbe sich mit a† uλ (x) gleich noch eine, u. z. zum Eigenwert
λ + 1. Um das zu zeigen, müssen wir nur die Vertauschungsrelation (13.10)
bemühen, denn
a† a(a† uλ ) = a† (1 + a† a)uλ = a† uλ + a† λuλ = (λ + 1)a† uλ .
(13.17)
Das gleiche Argument erweist (a† )2 uλ als eine Eigenfunktion von a† a zum Eigenwert λ + 2 und, für beliebige natürliche Zahlen µ, (a† )µ uλ als Eigenfunktion
zum Eigenwert (λ + µ).
Eine ähnliche Folge von Eigenfunktionen lässt sich aus uλ (x) durch wiederholte Multiplikation mit dem Operator a erzeugen. Mit Hilfe der Vertauschungsrelation (13.10) finden wir nämlich
a† a(auλ ) = (aa† − 1)auλ = aλuλ − auλ = (λ − 1)auλ .
(13.18)
Also ist auλ Eigenfunktion von a† a zum Eigenwert λ − 1 und entsprechend a2 uλ
Eigenfunktion zum Eigenwert λ − 2 usf.
Die Folge auλ , a2 uλ , a3 uλ , . . . muss abbrechen, d. h. es muss sich beim wiederholten Anwenden des Operators a eine Funktion u0 (x) ergeben mit der Eigenschaft
au0 (x) = 0 .
(13.19)
238
13 Harmonisch gebundene Quanten
Ansonsten würden entgegen der obigen Erkenntnis (13.16) in der Folge von Eigenwerten λ, λ−1, λ−2, . . . negative Eigenwerte auftreten. Durch Multiplikation
von (13.19) mit dem Operator a† finden wir
a† au0 (x) = 0
(13.20)
und schließen, dass der kleinste Eigenwert von a† a gleich Null ist.
Damit ist klar, dass der Operator a† a alle nichtnegativen ganzen Zahlen als
Eigenwerte hat,
a† aun (x) = nun (x),
n = 0, 1, 2, . . . .
(13.21)
Sobald die nullte“ Eigenfunktion u0 (x) bekannt ist, erhalten wir die n-te als
”
un (x) = αn (a† )n u0 (x) ,
(13.22)
wobei die Zahl αn als Normierungsfaktor zuzulassen und noch zu bestimmen
ist, wenn wir für alle un (x) die Normierung (13.5) fordern. Diese Forderung
lautet jetzt
+∞
Z
£
¤¡
¢∗
dx |αn |2 (a† )n u0 (x) (a† )n u0 (x)
1=
−∞
!
Ãr
r
+∞
Z
¤∗
£ † n
¤ 1
mω
~ d £ † n−1
(a )
u0 (x) .
= |αn |
dx (a ) u0 (x) √
x−
~
mω dx
2
2
−∞
Durch eine partielle Integration wälzen wir den Differentialoperator d/dx auf
den linken Faktor im Integranden und erhalten
Ãr
!
r
+∞
·
¸
Z
£
¤∗
1
mω
~
d
2
† n
1 = |αn |
dx √
x+
(a ) u0 (x) (a† )n−1 u0 (x)
~
mω
dx
2
−∞
+∞
Z
£
¤£
¤∗
= |αn |
dx aa† (a† )n−1 u0 (x) (a† )n−1 u0 (x) .
2
−∞
Wir benutzen nochmals die Vertauschungsrelation aa† = 1 + a† a und beachten,
dass (a† )n−1 u0 (x) Eigenfunktion von a† a mit Eigenwert n − 1 ist. Aus der
Normierungsbedingung ergibt sich dann eine Rekursionsformel für |an |2 ,
+∞
Z
dx |(a† )n−1 u0 (x)|2 = |αn |2 n
1 = |αn | n
1
2
−∞
|αn−1 |2
also
|αn |2 =
1
|αn−1 |2 .
n
+∞
Z
dx |un−1 (x)|2 ,
−∞
|
{z
=1
}
(13.23)
13.1 Eindimensionaler harmonischer Oszillator
239
Die Lösung dieser Rekursionsformel bestätigen Sie leicht als |αn |2 = |α0 |2 /n!.
Da u0 (x) genau wie alle un (x) gemäß (13.5) normiert sein soll, muss |α0 |2 gelten.
Nicht durch die Normierung festgelegt sind die Phasen der Normierungsfaktoren
αn . Da nur das Absolutquadrat der Wellenfunktion eine direkte physikalische
Bedeutung hat, dürfen wir vereinbaren, dass alle αn reell sein sollen. Demnach
lauten die richtig normierten Eigenfunktionen von a† a endlich
1
un (x) = √ (a† )n u0 (x) .
n!
(13.24)
Noch ungeklärt ist allerdings, ob u0 (x) als Eigenfunktion von a† a zum Eigenwert Null existiert und normierbar ist. Wir beantworten die Frage, indem
wir u0 (x) konstruieren. Die Differentialgleichung (13.19) lässt sich schreiben als
Ãr
!
r
mω
~ d
1
√
u0 (x) = 0
(13.25)
x−
~
mω dx
2
oder
mω
xdx + du0 /u0 = 0. Hieraus lesen wir als Lösung ab
~
³ mω ´
x2 .
u0 (x) = N exp −
2~
Das Normierungsintegral existiert für diese Gaußfunktion (s. 11.7. Die Normierungskonstante N hat den Betrag |N | = (mω/π~)1/4 und lässt sich als positiv
wählen. Es ergibt sich die nullte Eigenfunktion zu
h mω i
³ mω ´1/4
exp −
u0 (x) =
x2 .
(13.26)
π~
2~
Ihnen bleibt als Übung zu zeigen, dass die nun explizit konstruierten Eigenfunktionen un (x) für n = 0, 1, 2, . . . abwechselnd gerade und ungerade sind; ferner,
dass un (x)/u0 (x) ein Polynom n-ter Ordnung in x ist.
Wie schon oben bemerkt, sind die Funktionen un (x) wegen des Zusammenhangs (13.12) zwischen dem Operator a† a und dem Hamiltonoperator H auch
Eigenfunktionen zu letzterem. Die zugehörigen Eigenwerte von H sind
¶
µ
1
(13.27)
En = ~ω n +
2
Offenbar liegen diese Eigenwerte äquidistant (vgl. Abbildung 13.1). Dem
Oszillator lässt sich Energie entlocken und zuführen nur in Einheiten ~ω. Dass
die Grundzustandsenergie E0 = 12 ~ω von Null verschieden ist, hatten wir uns
schon früher klar gemacht.
Nachdem alle Eigenfunktionen und Eigenwerte von H bekannt sind, können
wir die allgemeine zeitabhängige Lösung der Schrödingergleichung angeben,
X
ψ(x, t) =
cn e−iEn t/~ un (x) .
n
Der Koeffizient cn , ist die Wahrscheinlichkeitsamplitude dafür, den Oszillator im
n-ten Energieniveau anzutreffen. Die cn sind durch eine Anfangsbedingung für
ψ(x, 0) festzulegen. Wie die cn bei vorgegebener anfänglicher Wellenfunktion
ψ(x, 0) ausgerechnet werden können, können Sie im folgenden Paragrafen lernen.
240
13 Harmonisch gebundene Quanten
Abbildung 13.1
13.2
Die Orthogonalität normierbarer Eigenfunktionen hermitescher Operatoren
Für zwei normierbare, d. h. für x → ±∞ hinreichend schnell abfallende Wellenfunktionen ϕ(x) und ψ(x) gilt die Integrationsregel
+∞
+∞
·
¸∗
Z
Z
d
d
∗
dx
dx ψ (x) ϕ(x) = −
ψ(x) ϕ(x) .
dx
dx
(13.28)
−∞
−∞
Sie impliziert eine wichtige Identität für den Impulsoperator p =
+∞
+∞
Z
Z
∗
∗
dx ψ (x)pϕ(x) = +
dx [pψ(x)] ϕ(x) .
−∞
~ d
i dx
(13.29)
−∞
Ohne Änderung des Integrals kann der Impulsoperator von einer der beiden
Funktionen ϕ(x) und ψ(x) auf die andere abgewälzt werden. Diese Eigenschaft
des Operators p bezüglich des in ϕ und ψ bilinearen Integrals (13.29) heißt
Hermitezität.
Der Umgang mit Integralen des obigen Typs gestaltet sich bequemer, wenn
wir als Skalarprodukt zweier Funktionen ϕ(x) und ψ(x) im Intervall a < x < b
13.2 Die Orthogonalität normierbarer Eigenfunktionen hermitescher
Operatoren
241
einführen
hψ | ϕi =
Zb
dx ψ ∗ (x)ϕ(x) .
(13.30)
a
Dabei darf sich das Intervall auch über die ganze reelle Achse erstrecken; in zwei
oder drei Dimensionen ist das Skalarprodukt bezüglich eines Bereichs entsprechender Dimension zu definieren. Die Regel (13.28) verknüpft also die Skalard
d
ϕi und h dx
ψ | ϕi, und die Hermitezität des Impulsoperators p
produkte hψ | dx
lässt sich in der Form
hψ | pϕi = hpψ | ϕi
(13.31)
aufschreiben. Jeder Operator A mit der Eigenschaft
hψ | Aϕi = hAψ | ϕi
heißt hermitesch. Beispiele sind der Ortsoperator“ x, reelle Zahlen, p2 , der
”
Hamiltonoperator H = p2 /2m + V (x) usf. Nicht hermitesch ist nach (13.28)
der Differentialoperator d/dx, desgleichen nichtreelle Zahlen.
Die im letzten Paragrafen eingeführten Operatoren a und a† hatten wir durch
partielles Integrieren als nicht hermitesch erwiesen (ohne das so auszudrücken),
hψ | aϕi = ha† ψ | ϕi
(13.32)
hψ | a† ϕi = haψ | ϕi .
Wegen der Eigenschaft (13.32) nennen wir a† den zu a adjungierten Operator
und umgekehrt. Selbstadjungiert (= hermitesch) ist jedoch der Operator a † a,
denn aus (13.32) folgt
hψ | a† aϕi = haψ | aϕi = ha† aψ | ϕi .
(13.33)
Die Hermitezität eines Operators A hat zwei schöne und wichtige Konsequenzen für seine Eigenfunktionen ψn . Die fraglichen Eigenschaften werden uns
erlauben, das am Ende des letzten Paragrafen gestellte Anfangswertproblem zu
lösen. Die erste lautet: Die Eigenwerte eines hermiteschen Operators sind reell.
Zum Beweis dieser Aussage multiplizieren wir die Eigenwertgleichung
Aψn (x) = λn ψn (x)
(13.34)
hψn | Aψn i = λn hψn | ψn i .
(13.35)
mit ψn∗ (x) und integrieren,
Von letzter Gleichung subtrahieren wir ihre konjugiert komplexe und erhalten
(λn − λ∗n ) hψn | ψn i = hψn | Aψn i − hAψn | ψn i .
(13.36)
Wegen der Hermitezität von A verschwindet die rechte Seite in (13.36). Da
hψn | ψn i als Integral über die nichtnegative Funktion |ψn (x)|2 nicht verschwinden kann, folgt die Behauptung
λn = λ∗n .
(13.37)
242
13 Harmonisch gebundene Quanten
Der Hamiltonoperator eines Teilchens mit einer (reellen) potenziellen Energie V (x) ist, wie wir gesehen hatten, hermitesch. Daher sind die Energieeigenwerte stets reell. An diese Eigenschaft der Energieeigenwerte sind wir von den
bisher behandelten Beispielen her schon gewöhnt.
Die zweite angekündigte Eigenschaft hermitescher Operatoren betrifft ihre
Eigenfunktionen: Zu verschiedenen Eigenwerten gehörige normierbare Eigenfunktionen eines hermiteschen Operators sind aufeinander orthogonal. Damit
ist gemeint, dass das Skalarprodukt
Z
hψn | ψm i = dx ψn (x)ψm (x) .
(13.38)
verschwindet, wenn
Aψn = λn ψn
(13.39)
Aψm = λm ψm
(13.40)
λn 6= λm .
(13.41)
und
Zum Nachweis dieser Eigenschaft multiplizieren wir beide Seiten von (13.39)
∗
und beide Seiten der zu (13.40) konjugiert komplexen Gleichung mit ϕn
mit ψm
und integrieren,
hψm | Aψn i = λn hψm | ψn i
(13.42)
hAψm | ψn i = λm hψm | ψn i .
(13.43)
Wegen der angenommenen Hermitezität des Operators A sind die linken Seiten
von (13.42) und (13.43) einander gleich, woraus folgt
(λn − λm ) hψm | ψn i = 0 .
(13.44)
Aus der Verschiedenheit der Eigenwerte λn und λm folgt nun die Orthogonalität der Eigenfunktionen,
hψm | ψn i = 0
für
λn 6= λm .
(13.45)
Falls zu einem Eigenwert λn mehrere linear unabhängige Eigenfunktionen
auftreten, so sind diese zwar nicht notwendig untereinander orthogonal, können
aber (Übung!) durch Bildung geeigneter Linearkombinationen durch einen Satz
wechselseitig orthogonaler Funktionen ersetzt werden.
Da der Hamiltonoperator H = ~ω(a† a + 1/2) des harmonischen Oszillators
(ebenso wie der Operator a† a) hermitesch ist, sind seine im letzten Paragrafen gefundenen Eigenfunktionen untereinander orthogonal. Aus dem gleichen
Grund sind untereinander orthogonal die in 11.2 konstruierten Energieeigenfunktionen eines Teilchens im Kasten.
Wir können nun das am Ende des letzten Paragrafen gestellte Anfangswertproblem lösen, u. z. nicht nur für den eindimensionalen harmonischen Oszillator, sondern für alle Potentiale V (~x), für die die Gesamtheit der Eigenfunktionen des Hamiltonoperators H = p~2 /2m + V (~x) eine unendliche diskrete
13.3 Die erzwungene Schwingung des harmonischen Oszillators
243
Folge ψn (~x) mit n = 0, 1, 2, . . . bildet (die Verallgemeinerung auf kontinuierliche Spektren soll hier nicht besprochen werden). Die allgemeinste Lösung der
Schrödingergleichung i~ψ̇ = Hψ lautet dann nach dem Superpositionsprinzip
X
ψ(~x, t) =
cn e−iEn t/~ ψn (~x) .
(13.46)
n
Wenn die anfängliche Wellenfunktion ψn (~x, 0) gegeben ist, so lassen sich die
Koeffizienten cn bestimmen, indem die Gleichung
X
cn ψn (~x)
(13.47)
ψ(~x, 0) =
n
mit ψn∗ (x) multipliziert und integriert wird. Es ergibt sich wegen der Orthogonalität der Energieeigenfunktionen

®
cn = ψn | ψ(t = 0) /hψn | ψn i .
(13.48)
Dieses Resultat verschönert sich natürlich, wenn die Eigenfunktionen ψn auf
Eins normiert sind.
Die Darstellung der Funktion ψn (x, 0) durch eine unendliche Reihe gemäß
(13.47) und (13.48) wirft Konvergenzprobleme auf, auf deren Diskussion ich
hier verzichten muss. Ich will nur anmerken, dass die Darstellung (13.47, 13.48)
sowie die ihr anhaftende Konvergenzproblematik der Fourierreihenentwicklung
sehr ähnlich sind. Im Fall des Teilchens im Kasten mit starren Wänden (s. 12.2)
läuft die Darstellung sogar genau auf eine Fourierreihe hinaus.
13.3
Die erzwungene Schwingung des harmonischen Oszillators
Denken wir uns einen harmonischen Oszillator einer äußeren Kraft F (t) unterworfen, die zeitabhängig sein, aber nicht von der Auslenkung x des Oszillators
abhängen soll. Zur potenziellen Energie tritt dann das Zusatzglied −xF (t), so
dass der Hamiltonoperator lautet
H(t) =
1 2 1
p + mω 2 x2 − xF (t) .
2m
2
(13.49)
Im Gegensatz zu allen bisher betrachteten Fällen weist der Hamiltonoperator (13.49) eine explizite Zeitabhängigkeit auf. Aus diesem Grund kann die
Schrödingergleichung
·
¸
~2 ∂ 2
1
2 2
i~ψ̇(x, t) = −
+
mω
x
−
xF
(t)
ψ(x, t)
(13.50)
2m ∂x2
2
nicht mehr durch einen Separationsansatz der Form f (t)u(x) gelöst werden.
Zur Zeit t = 0 befinde sich der Oszillator im ungestörten Grundzustand, so
dass die anfängliche Wellenfunktion die Gaußsche Form (13.26)
ψ(x, 0) =
³ mω ´1/4
π~
n mω o
exp −
x2
2~
(13.51)
244
13 Harmonisch gebundene Quanten
hat. Da der Hamiltonoperator (13.49) ebenso wie der des freien Oszillators in der
Auslenkung x quadratisch ist, liegt die Vermutung nahe, dass die Lösung ψ(x, t)
der Schrödingergleichung (13.50) ebenso wie die Anfangsamplitude (13.51) Gaußsch
bleibt. Prüfen wir also den Ansatz
½
¾
³ mω ´1/4
mω
i
2
exp −
[x − x̄(t)] − p̄(t)x − iϕ(t)
(13.52)
ψ(x, t) =
π~
2~
~
mit zunächst unbekannten Funktionen x̄(t), p̄(t), ϕ(t). Bevor Sie nachrechnen,
dass dieser Ansatz bei geeigneter Wahl von x̄(t), p̄(t) und ϕ(t) die Schrödingergleichung befriedigt, sollten Sie ihn durch die folgenden Überlegungen würdigen
lernen.
Die rechte Seite in (13.52) stellt nicht die allgemeinste Gaußfunktion dar,
da der Normierungsfaktor (mω/π~)1/4 und der Koeffizient (mω/2~) des quadratischen Gliedes im Exponenten gegenüber der Anfangsamplitude (13.51) unverändert sind. Diese Einschränkungen garantieren jedoch, falls die Funktionen
x̄(t), p̄(t) und ϕ(t) reell sind, die zeitliche Konstanz des Normierungsintegrals
+∞
+∞
½
¾
Z
³ mω ´1/2 Z
mω
2
2
dx|ψ(x, t)| =
dx exp −
[x − x̄(t)] = 1 .
π~
~2
−∞
(13.53)
−∞
Auch besteht zur Änderung des Koeffizienten des quadratischen Gliedes im Exponenten kein Anlass, da dieser Koeffizient beim freien Oszillator durch die
Federkonstante mω 2 in der harmonischen Rückstellkraft bestimmt ist und da
die Federkonstante durch das Anschalten der äußeren Kraft F (t) nicht verändert
wird.
Übrigens dürfen die Funktionen x̄(t), p̄(t) ohne Beschränkung der Allgemeinheit als reell angenommen werden, da das in x lineare Glied¡ im Exponenten¢ in
(13.52) insgesamt den jedenfalls komplexen Koeffizienten ip̄(t) − mωx̄(t) /~
hat. Die Phase ϕ(t) muss dann auch reell sein, damit die Normierung (13.51)
gilt.
Der Spezialfall der freien Oszillation ist in (13.52) als x̄ = p̄ = 0, ϕ(t) =
E0 t/~ = ωt/2 enthalten. Nach Anschalten der äußeren Kraft beginnt die Energie des Oszillators von der Grundzustandsenergie E0 = ~ω/2 abzuweichen, weshalb die Phase ϕ(t) nicht mehr linear mit der Zeit wachsen kann.
Um die Bedeutung der Funktion x̄(t) zu klären, betrachten wir die Wahrscheinlichkeitsdichte
|ψ(x, t)|2 =
³ mω ´1/2
π~
n mω
o
2
exp −
[x − x̄(t)]
.
~
(13.54)
Wie zur Zeit t = 0 handelt es sich hierbei um eine Gaußsche Verteilung, die
allerdings ihr Maximum zur Stelle x = x̄(t) verschoben hat. Offensichtlich gilt
auch
+∞
Z
hxi =
dx x|ψ(x, t)|2 = x̄(t) ,
(13.55)
−∞
so dass x̄(t) mit der mittleren Auslenkung des Oszillators zu identifizieren ist.
13.4 Die Umgebung belässt nur den Grundzustand stabil
245
Der Phasenfaktor exp [ip̄(t)x/~] in (13.52) bringt zum Ausdruck, dass der
Oszillator nach erzwungener Auslenkung in Bewegung bleibt und einen von
Null verschiedenen mittleren Impuls aufweist. In der Tat gilt
+∞
+∞
Z
Z
©
ª
∗~ ∂
dx |ψ|2 p̄(t) + imω [x − x̄(t)] = p̄(t) ,
dx ψ
ψ=
hpi =
i ∂x
(13.56)
−∞
−∞
woraus wir die noch unbekannte Funktion p̄(t) als den mittleren Impuls des
Oszillators erkennen.
Jetzt dürfen Sie durch Eintragen des Ansatzes (13.52) in die Schrödingergleichung (13.50) verifizieren, dass in (13.52) die richtige Lösung vorliegt, vorausgesetzt, die Mittelwerte x̄(t) und p̄(t) und die Phase ϕ(t) werden bestimmt
aus
mẋ(t) = p̄(t)
˙ = −mω 2 x̄(t) + F (t)
p̄(t)
~ϕ̇(t) =
(13.57)
1
1
1
~ω +
p̄(t)2 − mω 2 x̄(t)2 .
2
2m
2
Die ersten beiden Gleichungen in (13.57) sind, wie nach dem Ehrenfestschen
Theorem zu erwarten, formgleich mit der Newtonschen Bewegungsgleichung für
die erzwungene Schwingung eines klassischen harmonischen Oszillators. Ihre
allgemeine Lösung ist uns aus 2.6 bekannt (die dort auftretende Dämpfungskonstante ist hier gleich Null zu setzen). Da im anfänglich vorliegenden Grundzustand die Mittelwerte von Auslenkung und Impuls verschwinden
hxit=0 = hpit=0 = 0 ,
(13.58)
lautet die mittlere Amplitude
x̄ =
Zt
0
dt0 F (t0 )
1
sin ω(t − t0 ) .
mω
(13.59)
Die Phase ϕ(t) ergibt sich schließlich aus dem Zeitintegral der rechten Seite der
letzten der Gleichungen (13.57).
13.4
Die Umgebung belässt nur den
Grundzustand stabil (Spontane Emission)
Makroskopische Oszillatoren (Pendel, elektrische Schwingkreise etc.) trifft man
stets im Ruhezustand bei verschwindender Auslenkung an, es sei denn, sie unterlägen zusätzlichen äußeren makroskopischen Kräften. Der Grund dafür ist,
dass eine etwa anfänglich vorhandene Anregungsenergie des Oszillators im Lauf
der Zeit durch Dämpfung dissipiert, d. h. an die Freiheitsgrade der Umgebung
abgegeben wird. Wir hatten diesen Effekt durch eine klassische Modellrechnung
in 2.13 illustriert.
Ähnlich benehmen sich Quantensysteme wie einzelne Oszillatoren oder Atome. Von den mehreren oder vielen Energieniveaus, die man durch Lösung
246
13 Harmonisch gebundene Quanten
der Schrödingergleichung für das einzelne System findet, bleibt i. A. nur der
Grundzustand streng stabil, wenn eine Wechselwirkung mit der Umgebung“ in
”
Rechnung gestellt wird. Praktisch heißt das z. B. , dass ein anfänglich schwingendes Molekül im Lauf der Zeit seine Anregungsenergie abstrahlt und in den
Grundzustand übergeht (s. Abbildung 13.2). Als Umgebung fungiert dabei das
elektromagnetische Feld.
Abbildung 13.2
Zur Illustration dieses Phänomens dient uns eine Modellrechnung, die der
in 2.13 vorgestellten eng verwandt ist. Als dissipierende Umgebung verwenden wir wieder einen Haufen harmonischer Oszillatoren, deren Frequenzen ω i
(i = 1, 2, . . . , N ) den Bereich 0 ≤ ωi < ∞ so dicht belegen, dass man eine
spektrale Dichte ρ(ω) einführen kann; ρ(ω)∆ω ist die Zahl dieser Oszillatoren,
mit Frequenzen im kleinen Intervall ∆ω bei ω. Das zu dämpfende Objekt sei
ebenfalls ein Oszillator, und dessen Frequenz heiße ω0 . Die Kopplung zwischen
dem zu dämpfenden Objekt und der Umgebung nehmen wir der Einfachheit
halber wieder als bilinear in den Koordinaten und Impulsen x0 und p0 bzw. xi
und pi an.
Bequemlichkeitshalber drücken wir den Hamiltonoperator des Systems gleich
durch die Erzeugungs-“ und Vernichtungsoperatoren“ a+
ν (ν = 0, 1, 2, . . . , N )
”
”
bzw. aν aus, die beim ν-ten Oszillator die Anregungsenergie um den Betrag ~ων
erhöhen (daher Erzeugungsoperator) bzw. erniedrigen (daher Vernichtungsoperator). Die Vertauschungsrelationen sind bezüglich jedes Oszillators die in 13.1
gefundenen (keine Summenkonvention!)
+ +
[aν , a+
ν ] = 1, [aν , aν ] = [aν , aν ] = 0 .
(13.60)
Wegen dxdν xµ = xµ dxdν bei µ 6= ν ist die Reihenfolge von zu zwei verschiedenen
Oszillatoren gehörigen Operatoren vertauschbar,
+
[aν , a+
µ ] = [aν , aµ ] = [aν , aµ ] = 0
für
ν 6= µ .
(13.61)
tritt jedenfalls die wohl bekannte ungestörte Energie ~ων
¢
¡Im+Hamiltonoperator
aν aν + 12 für jeden der N + 1 Oszillatoren auf. Hinzutreten muss ein Kopplungsglied, das die Wechselwirkung des zentralen Oszillators mit seiner Umgebung beschreibt (s. Abbildung 13.3). Eine einfache und anschauliche,Pder harx0 xi ∼
monischen Feder entsprechende Wahl für das Kopplungsglied wäre
i
13.4 Die Umgebung belässt nur den Grundzustand stabil
247
P
+
(a0 + a+
0 )(ai + ai ). Der nachfolgenden Rechnung lege ich jedoch bequemlichP
+
keitshalber die ebenfalls anschauliche Modifikation (a0 a+
i + a0 ai ) zu Grunde.
i
i
Beachten Sie, dass das Glied a0 a+
i die Vernichtung eines Quants im zentralen
und die Erzeugung eines anderen im i-ten Oszillator beschreibt; das hermitesch
konjugierte Glied a+
0 ai trägt dem umgekehrten Prozess Rechnung, der Verlagerung eines Quants aus der Umgebung in den zentralen Oszillator. Insgesamt
lautet damit der Hamiltonoperator
Abbildung 13.3
µ
¶ X
µ
¶ X
N
N
1
1
+
+
+
a
a
+
+
H = ~ω0 a+
a
+
~ω
~g(a0 a+
i
0
i
0
i
i + a0 ai ) . (13.62)
2
2
i=1
i=1
Die im Kopplungsglied auftretende Kopplungskonstante g hat die Dimension
einer Frequenz. In einem noch zu spezifizierenden Sinn sei g klein, die Kopplung
also schwach, damit die zu erwartenden Dissipationseffekte klein bleiben.
Der Anfangszustand des Systems sei der ungestörte Grundzustand u0 (xi ) für
alle N Oszillatoren der Umgebung“ und der erste ungestörte Anregungszustand
”
u1 (x0 ) des zentralen Oszillators. Die entsprechende Wellenfunktion lautet also
Φ(t = 0) = u1 (x0 )
N
Y
u0 (xi ) .
(13.63)
i=1
Im Fall verschwindender Kopplung, g = 0, wäre (13.63) ein Eigenzustand des
Hamiltonoperators (13.62). Der entsprechende Eigenwert der Energie läge um
das Energiequant“ ~ω0 über der Grundzustandsenergie
”
N
1X
~ων .
(13.64)
E0 =
2 ν=0
Bei nichtverschwindender Kopplung ist der Anfangszustand kein Eigenzustand
des Hamiltonoperators (13.62) mehr. Wegen
aν u0 (xν ) = 0, a+
ν u0 (xν ) = u1 (xν ) und aν u1 (xν ) = u0 (xν ) .
(13.65)
248
13 Harmonisch gebundene Quanten
gilt vielmehr
HΦ(t = 0) = (E0 + ~ω0 )Φ(t = 0) + ~g
N
N
X
u1 (xj ) Y
j=1
u0 (xj ) ν=0
u0 (xν ) .
(13.66)
Unter der Wirkung von H entsteht also aus Φ(t = 0) eine Linearkombination
von Wellenfunktionen, deren jede genau einen Oszillator als im ungestörten
ersten angeregten Zustand und alle anderen Oszillatoren als im ungestörten
Grundzustand befindlich beschreibt. Keine einzige dieser Wellenfunktionen ist
für sich Eigenfunktion zu H, da
Ã
!
Ã
!
u1 (xj ) Y
u1 (xj ) Y
H
u0 (xν ) = (E0 + ~ωj )
u0 (xν ) + ~gΦ(t = 0) .
u0 (xj ) ν
u0 (xj ) ν
(13.67)
Aus den beiden Beziehungen (13.66) und (13.67) folgt, dass sich die Schrödingergleichung des Gesamtsystems
i~Φ̇(t) = HΦ(t)
(13.68)
mit der Anfangsbedingung (13.64) lösen lässt durch den einfachen Ansatz
Φ(t) =
N
X
cν (t)
ν=0
N
u1 (xj ) Y
u0 (xµ ) .
u0 (xj ) µ=0
(13.69)
Hierin ist cν (t) die zu bestimmende Wahrscheinlichkeitsamplitude dafür, dass
der ν-te Oszillator zur Zeit t ein Energiequant ~ων enthält und alle anderen Oszillatoren im Grundzustand sitzen. Für die N + 1 Unbekannten cν (t) finden wir
aus der Schrödingergleichung (13.68) mit Hilfe von (13.66) und (13.67) folgende
Bewegungsgleichungen
ċ0 (t) = −i(ω0 + E0 /~)c0 (t) − ig
N
X
ci (t)
(13.70)
i=1
ċi (t) = −igc0 (t) − i(ωi + E0 /~)ci (t) .
(13.71)
Diese haben wir mit der Anfangsbedingung
c0 (0) = 1,
ci (0) = 0
(13.72)
zu lösen.
Die weitere Rechnung verläuft ganz ähnlich wie die in 2.13. Genießen Sie
den Vergleich! Da das Schicksal des zentralen Oszillators (die zu erwartende
Dämpfung, c0 (t → ∞) → 0) von besonderem Interesse ist, eliminieren wir
zunächst die ci (t), indem wir (13.71) formal integrieren,
ci (t) = ci (0) e−i(ωi +E0 /~)t − ig
| {z }
=0
Zt
0
0
dt0 e−i(ωi +E0 /~)t c0 (t − t0 ) ,
(13.73)
13.4 Die Umgebung belässt nur den Grundzustand stabil
249
und dieses Integral in (13.70) eintragen. Dabei entsteht für c0 (t) die Integrodifferentialgleichung
ċ0 (t) = −i(ω0 + E0 /~)c0 (t) − g
2
Zt
dt0
X
i
0
0
e−i(ωi +E0 /~)t c0 (t − t0 ) .
(13.74)
Um die Abweichung des Verhaltens von c0 (t) von der freien Schwingung (g = 0)
besonders sinnfällig zu machen, benutzen wir die Darstellung
ci (t) = e−i(ωi +E0 /~)t c̃0 (t)
(13.75)
und erhalten für die Amplitude c̃0 (t)
c̃˙0 (t) = −g 2
Zt
X
dt0
i
0
0
ei(ω0 −ωi )t c˜0 (t − t0 ) .
(13.76)
Offenbar bleibt c0 (t) bei verschwindender Kopplung zeitlich konstant. Versuchen wir, die bei schwacher Kopplung zu erwartende schwache Zeitabhängigkeit
durch den Exponentialansatz
c̃0 (t) = e−Γt−iδt
(13.77)
zu erfassen. Die reellen Parameter Γ und δ haben, falls der Ansatz die Bewegungsgleichung (13.76) befriedigt, die physikalische Bedeutung einer Dämpfungskonstanten bzw. einer Frequenzverschiebung.
Tragen wir den Ansatz
(13.77) in (13.76) ein, so erhalten wir die Kompatibilitätsbedingungen zur Bestimmung von Γ und δ
Γ + iδ = g 2
X e{Γ+i(ω0 +δ−ωi )}t − 1
.
{Γ + i(ω0 + δ − ωi )}
i
(13.78)
In niedrigster Ordnung in g (auf die wir uns im Grenzfall schwacher Kopplung beschränken dürfen) können wir auf der rechten Seite Γ und δ vernachlässigen. Ferner erlaubt uns die Annahme eines dichten Spektrums von Frequenzen
ωi die Ersetzung der Summe über die Umgebungsoszillatoren durch ein Frequenzintegral. Daraufhin verändert sich (13.78) zu
Γ + iδ = g
2
Z∞
dω ρ(ω)
0
ei(ω0 −ω)t − 1
i(ω0 − ω)
oder, nach Real- und Imaginärteil getrennt,
Γ=g
2
Z∞
0
δ = g2
Z∞
0
sin(ω0 − ω)t
ω0 − ω
(13.79)
1 − cos(ω0 − ω)t
.
ω0 − ω
(13.80)
dω ρ(ω)
dω ρ(ω)
250
13 Harmonisch gebundene Quanten
Die gewonnenen Ausdrücke für Γ und δ (und damit der Ansatz (13.77) sind
nur sinnvoll, wenn die rechts stehenden Integrale zeitunabhängig sind. Dies
ist für große Zeiten, t À ω0−1 , tatsächlich der Fall, wie wir uns schon in 2.13
überlegt hatten. Insbesondere gilt
lim
t→∞
sin(ω0 − ω)t
= πδ(ω − ω0 )
(ω0 − ω)
(13.81)
und somit
Γ = πg 2 ρ(ω0 ) .
(13.82)
Es nimmt also die Wahrscheinlichkeit dafür, den zentralen Oszillator im
ersten angeregten Zustand zu finden, zeitlich exponentiell ab,
|c0 (t)|2 = |e−i(ω0 +E0 /~)t e−Γt−iδτ |2 = e−2Γt .
(13.83)
Also kann 1/2Γ als Lebensdauer des Anfangszustandes interpretiert werden.
Nach Ablauf einiger dieser Zeiteinheiten 1/2Γ hat der zentrale Oszillator seine
anfängliche Anregungsenergie ~ω0 in die Umgebung emittiert.
Damit die Amplitude
c0 (t) = e−i(ω0 +δ+E0 /~)t−Γt
(13.84)
auf Grund der Wechselwirkung mit der Umgebung nur schwach vom ungestörten
Verhalten abweicht, müssen (beachten Sie, dass die Phase E0 /~ keine physikalische Bedeutung hat, da sie in allen cν (t) auftritt; sie kann durch Wahl des
Energienullpunktes zum Verschwinden gebracht werden) sowohl die Dämpfungskonstante Γ wie die Frequenzverschiebung δ klein gegenüber der ungestörten
Eigenfrequenz ω0 sein,
Γ, δ0 ¿ ω0 .
(13.85)
Dies ist die eingangs angekündigte Bedingung für die Schwäche der Kopplung.
Die soeben durchgeführte quantenmechanische Betrachtung der Dämpfung
ist von recht weitreichender Bedeutung. Eine unmittelbare Anwendung findet
sie auf die spontane Emission von infrarotem Licht durch anfänglich angeregt
schwingende Moleküle. Die Anwendbarkeit begründet sich darin, dass das elektromagnetische Strahlungsfeld als ein Haufen von Oszillatoren angesehen werden
kann. Von spontaner Emission spricht man dabei deshalb, weil das elektromagnetische Feld (die Umgebung) als anfänglich im Grundzustand befindlich angenommen ist und somit zunächst keine elektromagnetische Welle vorhanden ist,
die einen Übergang eines angeregt schwingenden Moleküls in den Grundzustand
induzieren könnte. Der durch kein äußeres Signal oder anfängliches elektromagnetisches Feld erzwungene, vielmehr spontane Übergang des Moleküls in den
Grundzustand der Schwingung manifestiert eine intrinsische Instabilität des angeregten Zustands auf Grund der Ankopplung der Freiheitsgrade des elektromagnetischen Feldes.
Mit nur geringen Modifikationen entsteht aus der dargelegten Rechnung die
berühmte Wigner-Weißkopf Theorie der spontanen Emission von Licht durch
angeregte Atome. In diesem Fall entspricht dem zentralen Oszillator das von
13.4 Die Umgebung belässt nur den Grundzustand stabil
251
einem angeregten Zustand in den Grundzustand springende und dabei strahlende Atom, während die Umgebungsoszillatoren durch die Gesamtheit der
monochromatischen Wellen des elektromagnetischen Feldes dargestellt werden.
Die Dämpfungskonstante (13.82) gibt dann die Linienbreite der zum atomaren
Übergang gehörenden Spektrallinie.
252
13 Harmonisch gebundene Quanten
Kapitel 14
Das Wasserstoffatom
14.1
Relativ- und Schwerpunktsbewegung
Im Wasserstoffatom bewegt sich ein Elektron der Ladung −e um ein Proton
der Ladung +e (e > 0). Wir haben es also mit einem Zweikörperproblem zu
tun, dessen Wellenfunktion von den sechs Ortskoordinaten ~xel = (xel , yel , zel )
und ~xp = (xp , yp , zp ) abhängt. Da die Wechselwirkung der beiden Teilchen
Coulombsch ist,
U = U (~xel − ~xp ) = −
1
e2
,
4πε0 |~xel − ~xp |
lautet die zu lösende Schrödingergleichung
¶
µ
1 2
1
e2
1 2
p~ +
p~ −
Φ,
i~Φ̇ = HΦ =
2mel el 2mp p 4πε0 |~xel − ~xp |
(14.1)
(14.2)
wobei
p~el =
~
~
∇el = (∂/∂xel , ∂/∂yel , ∂/∂zel )
i
i
p~p =
~
~
∇p = (∂/∂xp , ∂/∂yp , ∂/∂zp )
i
i
und
(14.3)
die Impulsoperatoren für das Elektron bzw. das Proton sind; mel und mp sind
die entsprechenden Massen.
Ganz ähnlich wie wir in Kapitel 3.4 das klassische Keplerproblem auf ein
Einkörperproblem zurückgeführt haben, können wir bei der vorstehenden quantenmechanischen Aufgabe vorgehen. Führen wir Relativ - und Schwerpunktskoordinaten ein, gemäß
~x = ~xel − ~xp
~ =
X
1
(mel ~xel + mp ~xp ) .
mel + mp
253
(14.4)
254
14 Das Wasserstoffatom
In diesen Koordinaten schreibt sich die Schrödingergleichung
·
µ 2
¶
~2
∂2
∂2
∂
i~Φ̇ = HΦ = −
+
+
2m ∂x2
∂y 2
∂z 2
µ
¸
¶
∂2
∂2
∂2
~2
1 e2
+
+
Φ
−
−
2M ∂X 2
∂Y 2
∂Z 2
4πε0 |~x|
(14.5)
mit
m=
mel mp
mel + mp
M = mel + mp
(14.6)
als reduzierter Masse und Gesamtmasse des Systems.
Da die Wechselwirkungsenergie nur von den Relativkoordinaten abhängt,
und da in der kinetischen Energie keine Produkte von Ableitungen nach Relativund Schwerpunktskoordinaten auftreten, lässt sich die Schrödingergleichung
(14.5) lösen durch den Ansatz,
~ t) = ψ(~x, t)Ψ(X,
~ t) .
Φ(~x, X,
(14.7)
~ t) ergeben sich aus (14.5) die
Für die Teilwellenfunktionen ψ(~x, t) und Ψ(X,
beiden voneinander völlig entkoppelten Schrödingergleichungen
·
¸
~2 2
1 e2
i~ψ̇(~x, t) = −
∇ −
ψ(~x, t) mit ∇2 = ∂ 2 /∂x2 + · · · (14.8)
2m
4πε0 |~x|
und
2
~ t)
~ t) = − ~ ∇2 Ψ(X,
i~Ψ̇(X,
2M
mit
∇2 = ∂ 2 /∂X 2 + · · ·
(14.9)
Letztere Gleichung ist uns wohlbekannt als die Schrödingergleichung eines
freien Teilchens der Masse M , während erstere die Bewegung eines Quants der
Masse m in einem Coulombfeld mit Zentrum bei ~x = 0 beschreibt. Die Unabhängigkeit der freien Schwerpunktsbewegung von der Relativbewegung ist
offenbar Ausdruck der Homogenität des Raumes, in welchem sich das Gesamtsystem befindet: die ursprüngliche Schrödingergleichung (14.2) zeichnet keinen
Punkt des Raumes aus; sie bleibt unverändert gegenüber der galileischen Koordinatentransformation ~x0 = ~x + d~ + ~v t.
14.2
Bewegung im Coulombfeld
Wegen der Isotropie des Coulombfeldes bezüglich des Zentrums ~x = 0 ist es
zweckmäßig, die Schrödingergleichung der Relativbewegung im Wasserstoffatom in Kugelkoordinaten zu behandeln. Die Transformation von diesen zu den
kartesischen Koordinaten lautet:
x = r cos ϕ sin θ,
y = r sin ϕ sin θ,
z = r cos θ
(14.10)
14.2 Bewegung im Coulombfeld
255
bzw. umgekehrt
r=
p
x2 + y 2 + z 2 ,
tan ϕ = y/x,
tan θ =
p
x2 + y 2 /z .
(14.11)
Die Ableitungen nach Kugel- und kartesischen Koordinaten sind verknüpft durch
die Kettenregel, also z. B. ∂/∂x = (∂r/∂x)∂/∂r+(∂ϕ/∂x)∂/∂ϕ+(∂θ/∂x)∂/∂θ.
Insgesamt gilt
∂
1
∂
1 sin ϕ ∂
∂
= sin θ cos ϕ
+ cos θ cos ϕ
−
∂x
∂r
r
∂θ
r sin θ ∂ϕ
∂
1
∂
1 cos ϕ ∂
∂
= sin θ sin ϕ
+ cos θ sin ϕ
+
∂y
∂r
r
∂θ
r sin θ ∂ϕ
∂
1
∂
∂
= cos θ
− sin θ
∂z
∂r
r
∂θ
sowie für den Laplaceoperator
∇2 =
1 ∂ 2 ∂
∂
∂2
1
∂
1
r
+
sin
θ
+
.
r2 ∂r ∂r r2 sin θ ∂θ
∂θ r2 sin2 θ ∂ϕ2
(14.12)
Somit schreibt sich die zu untersuchende Schrödingergleichung als
i~ψ̇(r, ϕ, θ, t) = Hψ(r, ϕ, θ, t)
(14.13)
¶
µ
1 ~2
1 e2
~2 ∂ 2 ∂
r
+
L
−
ψ(r, ϕ, θ, t)
= −
2mr2 ∂r ∂r 2mr2
4πε0 r
mit der Abkürzung
~ 2 = −~2
L
µ
1 ∂
∂
1 ∂2
sin θ
+
sin θ ∂θ
∂θ sin2 θ ∂ϕ2
¶
.
(14.14)
Der enorme gegenüber der Formulierung in kartesischen Koordinaten erreich~ 2 die Radialvariable r
te Vorteil ist nun offenbar. Da der Differentialoperator L
nicht enthält, muss die Lösung der Schrödingergleichung (14.13) mit Hilfe des
Produktansatzes
ψ = e−iEt/~ R(r)Y (θ, ϕ)
(14.15)
gelingen. Die winkelabhängige Amplitude Y (θ, ϕ) ist dabei als Eigenfunktion
~ 2 zu wählen gemäß
des Operators L
~ 2 Y (θ, ϕ) = ~2 l(l + 1) Y (θ, ϕ) ;
L
(14.16)
~2
die hier vorgenommene Benennung der noch zu suchenden Eigenwerte von L
ist Konventionssache. Für den Radialteil R(r) der Eigenfunktion (14.15) des
Hamiltonoperators ergibt sich schließlich die gewöhnliche Differentialgleichung
¶
µ
~2 d 2 d
~2 l(l + 1) ~ 2
1 e2
R,
(14.17)
ER = −
r
+
L
−
2mr2 dr dr
2mr2
4πε0 r
256
14 Das Wasserstoffatom
aus der auch die möglichen Energieeigenwerte E festzulegen sind.
Unsere in Kapitel 3 gewonnene Erfahrung mit dem klassischen Keplerproblem lässt uns erwarten, dass für negative Energien gebundene Zustände vorliegen, deren Normierungsintegral endlich ist
Z∞
0
dr r
2
Zπ
0
dθ sin θ
Z2π
0
dϕ |R(r)Y (θ, ϕ)|2 = hψ | ψi < ∞ .
(14.18)
Andererseits sollten Eigenfunktionen mit E ≥ 0 ungebundenen Streuzuständen
entsprechen, da auch klassische Teilchen mit E ≥ 0 durch die potenzielle Energie
U ∼ 1/r nicht an der Flucht in beliebige Entfernung vom Zentrum gehindert
werden.
Letztere Erwartung erfüllen wir uns sofort, indem wir die Eigenwertgleichung
(14.8) für große Abstände vom Zentrum betrachten. Nach Weglassen aller mit
r → ∞ abfallenden Glieder vereinfacht sich diese Gleichung zu
~2 d 2 R
+ ER = 0
2m dr2
(14.19)
und hat die Partikularlösungen
R = e±ir
√
2mE/~2
.
(14.20)
Wie erwartet, verhalten sich die Lösungen mit positiven Energien oszillatorisch,
fallen also nicht ab mit r → ∞; beliebig große Abstände r behalten eine endliche
Wahrscheinlichkeitsamplitude. Wie es für derartige Streuzustände typisch ist,
existiert das über den ganzen Raum erstreckte Normierungsintegral nicht.
Bei negativer Energie verhält sich eine der beiden asymptotischen Lösungen
exponentiell abfallend, entspricht also einem normierbaren gebundenen Zustand,
während die andere mit r → ∞ exponentiell wächst. Letztere würde keine Interpretation als Wahrscheinlichkeitsamplitude zulassen und darf nicht auftreten.
Das Verbot exponentiellen Anwachsens für r → ∞ ist eine Randbedingung für
die Eigenlösungen von (14.17), die sich, wie wir sehen werden, nur für diskrete
Werte der Energie im Intervall −∞ < E < 0 befriedigen lässt. Wie bei den
früher behandelten Quantensystemen sind also auch hier die diskreten Energieniveaus zu den gebundenen Zuständen durch Randbedingungen festgelegt.
14.3
Der Bahndrehimpuls∗)
Die oben konstatierte Separierbarkeit der Schrödingergleichung (14.13) in Kugelkoordinaten, d. h. die Lösbarkeit durch den Produktansatz (14.15), ist keineswegs zufällig, sondern eine Konsequenz der Winkelunabhängigkeit des Coulombpotentials. Beim klassischen Keplerproblem hatte die Isotropie bezüglich
des Zentrums, Sie erinnern sich, die zeitliche Erhaltung des Drehimpulses
~ = ~x × p~
L
(14.21)
∗) Der nicht an der Konstruktion der Drehimpulseigenwerte und -eigenfunktionen interessierte Leser möge direkt zum Ergebnis springen, das ab (14.71) dargestellt wird.
14.4 Kommutierende Operatoren haben gemeinsame Eigenfunktionen
257
zur Folge. Ich will hier begründen, dass der gleiche Erhaltungssatz in der Quantenmechanik gilt und sich in der genannten Separierbarkeit der Schrödingergleichung manifestiert.
~ = (Lx , Ly , Lz ) durch
Klassisch wie quantenmechanisch ist der Vektor L
~ wegen p~ = ~ ∇
(14.21) definiert. Auf ortsabhängige Wellenfunktionen wirkt L
i
als Differentialoperator. Seine Komponenten lauten
µ
¶
µ
¶
∂
∂
~
∂
∂
y
= i~ sin ϕ
Lx = ypz − zpy =
−z
+ cot θ cos ϕ
i
∂z
∂y
∂θ
∂ϕ
µ
¶
µ
¶
∂
∂
∂
∂
~
−x
+ cot θ sin ϕ
z
= i~ − cos ϕ
Ly = zpx − xpz =
i
∂x
∂z
∂θ
∂ϕ
µ
¶
∂
~
∂
~ ∂
−y
.
(14.22)
Lz = xpy − ypx =
x
=
i
∂y
∂z
i ∂ϕ
~ finden wir aus (14.22) zu
Das Quadrat des Vektors L
¶
µ
∂
1 ∂2
1 ∂
2
2
2
2
~
sin θ
+
L = Lx + Ly + Lz = −~
sin θ ∂θ
∂θ sin2 ∂ϕ2
(14.23)
und erkennen hierin die im letzten Paragrafen verwendete Abkürzung für den
winkelabhängigen Anteil des Hamiltonoperators
H=−
1 e2
1 ~2
~2 1 ∂ 2 ∂
r
−
+
L .
2
2m r ∂r ∂r 4πε0 r
2mr2
(14.24)
~ 2 die Radialkoordinate nicht enthält, vertauscht er mit
Da der Operator L
dem Hamiltonoperator,
~ 2] = 0 .
[H, L
(14.25)
Diese Vertauschbarkeit bliebe sogar erhalten, wenn das Coulombfeld e2 /r in
(14.24) durch ein beliebiges Zentralfeld U (r) ersetzt würde, hängt also nur an
der Isotropie bezüglich des Zentrums. Überzeugen wir uns nun davon, dass
das Verschwinden des Kommutators (14.25) einen Erhaltungssatz für das Quadrat des Drehimpulses darstellt. Dabei hilft der folgende kleine mathematische
Exkurs.
14.4
Kommutierende Operatoren haben gemeinsame Eigenfunktionen
Seien A und B zwei Operatoren. Damit ϕ eine gemeinsame Eigenfunktion ist,
muss gelten
Aϕ = aϕ,
Bϕ = bϕ ,
(14.26)
wobei a und b die respektiven Eigenwerte sind. Multiplizieren wir die erste
dieser Gleichungen mit B und die zweite mit A, so erhalten wir als Differenz
(AB − BA)ϕ = (ab − ba)ϕ = 0 .
(14.27)
258
14 Das Wasserstoffatom
Hieraus darf noch nicht geschlossen werden, dass A und B kommutieren. Wenn
jedoch alle Eigenfunktionen von A und B gemeinsame Eigenfunktionen sind,
also die Eigenschaft (14.27) haben, so folgt
[A, B] = 0 .
(14.28)
Die Argumentation kann auch umgekehrt geführt werden, d. h. das Verschwinden des Kommutators impliziert, dass A und B alle Eigenfunktionen gemeinsam
haben.
In etwas anschaulicherer Formulierung lautet die eben gewonnene Erkenntnis: Kommutierende Observable sind zugleich scharf messbar. Scharf ist eine
physikalische Größe (das ist eine Observable“) A bezüglich ihrer Eigenzustände.
”
Liegen nämlich Systeme im Zustand ϕ vor, der Eigenzustand von A mit Eigenwert a ist, so hat die Observable in diesen Systemen genau den Wert a; bei
Messung an im Zustand ϕ präparierten Systemen ergibt sich für die fragliche
Observable immer nur der Wert a. Wenn ϕ sogar Eigenzustand von zwei Observablen A und B ist, so ergeben Messungen an in ϕ präparierten Systemen
eben immer nur die respektiven Eigenwerte als Messwerte dieser Observablen.
Unscharf ist dagegen eine Observable A bezüglich jedes Zustandes, der nicht
einer ihrer Eigenzustände ist. Schauen wir etwa eine Linearkombination zweier
normierter Eigenzustände ϕ und ϕ0 von A mit Eigenwerten a und a0 an,
ψ = cϕ + c0 ϕ0
mit
|c|2 + |c0 |2 = 1 .
(14.29)
Dann sind |c|2 und |c0 |2 die Wahrscheinlichkeiten dafür, dass wir bei Messung
von A an Systemen mit der Wellenfunktion ψ den Wert a bzw. a0 finden.
Offenbar ist die Unschärfe von A bei Zuständen der Form (14.29) am größten
für |c|2 = |c0 |2 = 1/2.
Ein beliebtes, Ihnen aus der Experimentalphysik bekanntes Maß für die
Schärfe einer Observablen bezüglich einer Wellenfunktion ψ ist die so genannte
Streuung
¡
¢1/2
Str(A) = hψ | A2 ψi − hψ | Aψi2
.
(14.30)
Für hermitesche Operatoren ist die Streuung reell und nicht negativ, denn es
gilt mit A = A+ und hAi = hψ | Aψi = hAi∗


®
2
2 ®
{Str(A)} = ψ | (A − hAi) ψ = (A − hAi) ψ | (A − hAi) ψ ≥ 0 . (14.31)
Den kleinstmöglichen Wert Null kann die Streuung gemäß (14.31) übrigens nur
annehmen, wenn der nichtnegative Integrand im Integral h(A − hAi) ψ | (A − hAi) ψi
verschwindet, d. h. wenn
Aψ = hAiψ
(14.32)
gilt, also ψ eine Eigenfunktion von A ist.
Als Übung bleibt Ihnen, die Streuung von A bezüglich des Zustands (14.29)
auszurechnen. Sie finden leicht
2
{Str(A)} = |c|2 (1 − |c|2 )(a − a0 )2
(14.33)
und bestätigen hieraus, dass die Streuung für |c|2 = 1/2 maximal ist, während
sie für |c|2 = 0 und für |c|2 = 1 verschwindet.
14.5 Die Eigenwerte des Bahndrehimpulses
259
Jetzt können Sie verstehen, dass die Vertauschbarkeit eines Operators A (wie
~ 2 ) mit dem Hamiltonoperator, [H, A] = 0, der
des Bahndrehimpulsquadrats L
zeitlichen Erhaltung von A entspricht. Der zeitabhängige Zustand ψ(t) des fraglichen Systems lässt sich nämlich als Überlagerung von Energieeigenzuständen
ψn darstellen.
X
cn e−iEn t/~ ψn .
(14.34)
ψ(t) =
n
Der entsprechende Erwartungswert von A ergibt sich dann, da die ψn wegen
[H, A] = 0 auch Eigenzustände von A sind, zu
hAi(t) =
=
X
n,m
X
n
cn c∗m e−i(En −Em )t/~ an hψm | ψn i
|cn |2 an hψn | ψn i ,
(14.35)
d. h. als zeitunabhängig. Ebenso zeitunabhängig bleiben die Streuung von A
und die Erwartungswerte beliebiger Potenzen Aν .
Gleichermaßen einsehbar wird der Zusammenhang zwischen der Separierbarkeit der Schrödingergleichung (14.13) und der Erhaltung des Bahndrehimpulsquadrats für die Bewegung im Coulombfeld. Die Separierbarkeit von (14.13)
~ 2 gemeinsame Eigenfunktiodurch den Ansatz (14.15) bedeutet, dass H und L
~ 2 ist im Verschwinden des
nen haben. Dies und die zeitliche Erhaltung von L
2
~
Kommutators [H, L ] begründet. Vergessen Sie nicht den physikalischen Grund
~ 2 ] = 0, die Isotropie des Coulombpotentials.
für [H, L
14.5
Die Eigenwerte des Bahndrehimpulses
Anders als die Komponenten des Impulses p~ = ~i ∇ kommutieren die Kompo~ = ~x × p~ nicht untereinander. Vielmehr folgt
nenten des Bahndrehimpulses L
aus [pi , xj ] = ~i δij
[Lx , Ly ] = [ypz − zpy , zpx − xpz ] = [ypz , zpx ] + [zpy , xpz ]
= ypx [pz , z] + xpy [z, pz ] =
~
(ypx − xpy )
i
= i~Lz .
(14.36)
Ganz ähnlich finden Sie die anderen Kommutatoren. Insgesamt gilt
[Lx , Ly ] = i~Lz ;
[Ly , Lz ] = i~Lx ;
[Lz , Lx ] = i~Ly
(14.37)
Beachtenswert ist, dass sich alle diese Relationen aus einer derselben ergeben
durch zyklische Permutation der Vektorindizes. Diese Verwandtschaft besteht
nicht zufällig; sie entspricht der Gleichberechtigung der Benennungen der 1-, 2und 3-Achsen eines rechtssinnigen rechtwinkligen Dreibeins mit Koordinaten in
der Reihenfolge xyz, yzx und zxy.
Wir schließen aus den Vertauschungsregeln (14.37), dass verschiedene Komponenten des Drehimpulses nicht zugleich scharf sein können. Wohl aber kann
260
14 Das Wasserstoffatom
~ mit dem Quadrat des Drehimpulses zugleich scharf
jede Komponente von L
sein, denn es gilt
~ 2 ] = [Lx , L2y ] + [Lx , L2z ] = i~(Ly Lz + Lz Ly ) − i~(Lz Ly + Ly Lz ) = 0
[Lx , L
und insgesamt
~ 2 ] = [Ly , L
~ 2 ] = [Lz , L
~ 2] = 0 .
[Lx , L
(14.38)
~ 2 und, sagen wir,
Suchen wir also die gemeinsamen Eigenfunktionen von L
der z-Komponente Lz . Zweckmäßigerweise benutzen wir dabei Kugelkoordina~ allein durch die
ten, denn bezüglich dieser hatten wir in 14.3 die Operatoren L
Winkel θ und ϕ ausdrücken können. Demnach hängen auch die gesuchten Eigenfunktionen Y (θ, ϕ) nur von diesen Winkeln ab und nicht von der Radialkoordinate r. Allgemeinem Brauch entsprechend benennen wir die Eigenfunktionen
und Eigenwerte wie folgt
~ 2 Ylm (θ, ϕ) = ~2 l(l + 1)Ylm (θ, ϕ)
L
Lz Ylm (θ, ϕ) = ~mYlm (θ, ϕ) .
(14.39)
Die Eigenwerte ~2 l(l + 1) und ~m sind reell, denn alle Komponenten Li und
somit auch das Quadrat des Drehimpulses sind hermitesche Operatoren. Am
einfachsten sehen wir das am Ausdruck (14.22) für die z-Komponente
Lz =
~ ∂
.
i ∂ϕ
(14.40)
Im Skalarprodukt zweier Wellenfunktionen Φ(r, θ, ϕ) und Ψ(r, θ, ϕ) wirkt Lz wie
hΦ | Lz Ψi =
Z∞
=
Z∞
dr r
2
0
dr r
0
+
Z∞
0
2
Zπ
0
Z2π
Zπ
Z2π
dθ sin θ
dr r
~ ∂
Ψ(r, θ, ϕ)
i ∂ϕ
0
dθ sin θ
0
0
2
dϕ Φ∗ (r, θ, ϕ)
Zπ
0
dϕ
µ
~ ∂
Φ(r, θ, ϕ)
i ∂ϕ
¶∗
Ψ(r, θ, ϕ)
µ
~
Φ∗ (r, θ, 2π) Ψ(r, θ, 2π)
dθ sin θ
i
∗
− Φ (r, θ, 0) Ψ(r, θ, 0)
¶
.
(14.41)
Da als Wellenfunktionen nur solche Funktionen Φ und Ψ zugelassen sind, die
einem Raumpunkt ~x genau eine Wahrscheinlichkeitsdichte |Φ(~x)|2 bzw. |Ψ(~x)|2
zuweisen, haben in Kugelkoordinaten die erlaubten Wellenfunktionen entweder
alle die Periodizität
Φ(r, θ, ϕ) = Φ(r, θ, ϕ + 2π)
(14.42)
14.5 Die Eigenwerte des Bahndrehimpulses
261
oder alle die Eigenschaft†) Φ(r, θ, ϕ+2π) = −Φ(r, θ, ϕ). Jedenfalls verschwinden
die beiden Randterme in (14.41), und es folgt die Hermitezität von Lz ,
hΦ | Lz Ψi = hLz Φ | Ψi .
(14.43)
Da im vorliegenden Problem die z-Richtung nur durch ihren Namen vor der xund der y-Richtung ausgezeichnet ist, müssen auch Lx und Ly hermitesch sein.
~ 2.
Ohne Rechnung ergibt sich dann auch die Hermitezität von L
2
2
~
Die Eigenwerte von L und Lz , ~ l(l+1) bzw. ~m, sind nun als reell erkannt.
Vom Eigenwert ~2 l(l + 1) sehen wir überdies schnell, dass er nicht negativ sein
kann. Mit einer beliebigen Wellenfunktion Φ(~x) gilt nämlich wegen Li = L+
i
~ 2 Φi = hΦ | L2x Φi + hΦ | L2y Φi + hΦ | L2z Φi = hLx Φ | Lx Φi + · · · .
hΦ | L
(14.44)
~ 2 Φi für
Als Summe von Integralen über nichtnegative Integranden kann hΦ | L
keine Wahl von Φ negativ sein. Insbesondere auch nicht für Wellenfunktionen,
deren Winkelanteil eine Eigenfunktion Ylm (θ, ϕ) ist. Ohne Beschränkung der
Allgemeinheit kann also l als positiv angesehen werden.
Zur weiteren Festlegung der Eigenwerte l und m sowie der Eigenfunktionen
Ylm bedienen wir uns der Vertauschungsrelationen (14.37) und (14.38). Ihr
Verständnis der folgenden Argumentation wird sicher befördert, wenn Sie die
Analogie zu unserer Konstruktion der Energieeigenfunktionen des harmonischen
Oszillators in 12.1 betrachten.
Bequemlichkeitshalber führen wir zunächst die zueinander adjungierten Operatoren
½
¾
∂
∂
±iϕ
L± = Lx ± iLy = ~ e
±
(14.45)
+ i cot θ
∂θ
∂ϕ
ein, die sich als den Erzeugungs- und Vernichtungsoperatoren a+ bzw. a beim
Oszillator analog erweisen werden. Aus (14.37) und (14.38) ergeben sich für L±
die Vertauschungsrelationen
[Lz , L± ] = ±~L± ,
[L+ , L− ] = 2~Lz
und
~ 2 , L± ] = 0 .
[L
(14.46)
Ferner folgen aus (14.37) die Identitäten
~ 2 − Lz (Lz + ~)
L− L+ = L
~ 2 − Lz (Lz − ~),
L+ L− = L
(14.47)
die wir sofort ausschlachten. Offenbar kommutiert L− L+ ebenso wie L+ L− mit
~ 2 und Lz . Also haben beide Operatoren die Funktionen Ylm als EigenfunktioL
nen, u. z. gilt
£
¤
L− L+ Ylm = ~2 l(l + 1) − m(m + 1) Ylm = ~2 (l − m)(l + m + 1)Ylm (14.48)
†) Wir
werden im nächsten Paragrafen letzteren Fall als unphysikalisch ausschließen können.
262
14 Das Wasserstoffatom
und
£
¤
L+ L− Ylm = ~2 l(l + 1) − m(m − 1) Ylm = ~2 (l + m)(l − m + 1)Ylm . (14.49)
Die hier auftretenden Eigenwerte können nicht negativ sein, denn da L+ und
L− zueinander adjungiert sind, haben wir für eine beliebige Wellenfunktion
Φ(r, θ, m) die Ungleichungen hΦ | L− L+ Φi = hL+ Φ | L+ Φi ≥ 0 und hΦ | L+ L− Φi
= hL− Φ | L− Φi ≥ 0. Durch die Eigenschaften
(l − m)(l + m + 1) ≥ 0
und
(l + m)(l − m + 1) ≥ 0
(14.50)
sind die möglichen Werte von m bei festem l eingeschränkt auf den Bereich
−l ≤ m ≤ +l .
(14.51)
(Erinnern Sie sich an den harmonischen Oszillator? Wir hatten in 13.1 argumentiert, dass a+ a nichtnegative Eigenwerte hat, weil a und a+ zueinander
adjungiert sind.)
Nun überzeugen wir uns davon, dass mit Ylm auch L± Ylm Eigenfunktionen
~ 2 und Lz sind und zwar zu den respektiven Eigenwerten ~2 l(l + 1) und
von L
~(m ± 1). Dazu müssen wir nur die Kommutatoren (14.46) bemühen:
~ 2 L± Ylm = L± L
~ 2 Ylm = ~2 l(l + 1)L± Ylm
L
Lz L± Ylm = ±~L± Ylm + L± Lz Ylm = ~(m ± 1)L± Ylm .
(14.52)
Durch mehrfache Multiplikation mit L+ und L− entstehen weitere Eigenfunktionen,
Lz (L± )p Ylm = ~(m ± p)(L± )p Ylm
mit
p = 1, 2, 3, . . .
(14.53)
Beide so konstruierten Folgen müssen nach endlich vielen Gliedern abbrechen, damit der Eigenwert von Lz nicht das Intervall (14.51) verlässt. Beim
wiederholten Anwenden von L+ bzw. L− müssen schließlich Funktionen Yl,max
bzw. Yl,min entstehen mit den Eigenschaften
L+ Yl,max = 0
(14.54)
L− Yl,min = 0 .
(14.55)
und
Wenn wir (14.54) mit L− multiplizieren und (14.55) mit L+ , so sehen wir nach
Vergleich mit (14.48) bzw. (14.49), dass der größte Eigenwert von Lz durch
max = +l
(14.56)
min = −l
(14.57)
und der kleinste durch
gegeben ist.
14.6 Die Eigenfunktionen des Bahndrehimpulses
263
Über die möglichen Werte von l erhalten wir auch Aufschluss. Ausgehend
von Yl,−l muss nämlich in einer ganzen Zahl p von Schritten mit (L+ )p Yl,−l eine
Eigenfunktion von Lz mit dem größtmöglichen Eigenwert erreicht werden. Es
gilt offenbar −l + p = l oder p = 2l mit p = 1, 2, 3, . . .. Zunächst scheinen dabei
sowohl ganzzahlige wie halbzahlige Werte für l (und somit auch für m) erlaubt.
Der Fall halbzahliger Werte für l und m wird sich jedoch gleich als unphysikalisch erweisen. (Zwar existieren in der Natur auch halbzahlige Drehimpulse,
jedoch handelt es dabei nicht um Bahndrehimpulse, sondern um den noch zu
diskutierenden Spin von Fermiteilchen wie Elektron, Proton etc.)
14.6
Die Eigenfunktionen des Bahndrehimpulses
Die im letzten Paragrafen gewonnenen Eigenschaften der Eigenwerte l und m
sowie der Eigenfunktionen Ylm beruhen ganz auf den Vertauschungsrelationen
(14.37) und (14.38). Noch haben wir keinen Gebrauch davon gemacht, dass die
~ 2 Differentialoperatoren bezüglich der Winkel θ und ϕ sind. Letztere
Li und L
Tatsache machen wir uns jetzt zunutze, wenn wir die gesuchten Drehimpulseigenfunktionen Ylm (θ, ϕ) explizit konstruieren. Die ϕ-Abhängigkeit gewinnen
wir aus (14.39) und (14.40), d. h. aus
~ ∂
Ylm (θ, ϕ) = ~mYlm (θ, ϕ) ,
i ∂ϕ
(14.58)
Ylm (θ, ϕ) ∼ eimϕ .
(14.59)
sofort als
Die θ-Abhängigkeit besorgen wir uns zunächst für den Fall m = −l, d. h. für
~ 2 = ~2 l(l + 1) kleinstmögliche z-Komponente, Lz = −~l. Die
die bei festem L
Funktion Yl,−l = e−ilϕ fl (θ) gehorcht der Bedingung (14.55), also
¶
µ
µ
¶
∂
∂
∂
−ilϕ
−ilϕ
e
fl (θ) = e
−
−
+ i cot θ
+ l cot θ fl (θ) = 0 . (14.60)
∂θ
∂ϕ
∂θ
Als Lösung verifizieren Sie sofort fl (θ) = sinl θ. Insgesamt erhalten wir somit
Yl,−l (θ, ϕ) = cl e−ilϕ sinl θ ,
(14.61)
wobei cl eine durch Normierung festzulegende Integrationskonstante ist. Der
Betrag von cl ergibt sich aus
|cl |
2
Z2π
0
dϕ
Zπ
0
© ª
dθ sin θ sin2l θ = |cl |2 4π l!2l /(2l + 1)! = 1 .
Für die beliebige Phase von cl hat sich die Konvention cl /|cl | = (−1)l eingebürgert. Damit ist
p
(2l + 1)!
(14.62)
cl = (−1)l √
4π2l l!
264
14 Das Wasserstoffatom
bestimmt.
Schließlich finden wir gemäß (14.53) die Eigenfunktion Ylm (θ, ϕ) durch (l +
m)-malige Multiplikation von Yl,−l mit dem Operator L+ ,
· µ
¶¸l+m
∂
∂
e−ilϕ sinl θ .
(14.63)
Ylm (θ, ϕ) ∼ cl eiϕ
+ i cot
∂θ
∂ϕ
Jetzt endlich können wir halbzahlige Werte für l und m ausschließen, indem
wir nachrechnen, dass die explizit vorliegenden Eigenfunktionen für halbzahliges
l gar nicht die aus (14.54) folgende Bedingung
(L+ )2l+1 Yl,−l ∼ L+ Yl,l = 0
(14.64)
erfüllen. Die Rechnung verläuft am einfachsten im Fall l = 1/2:
µ
¶
∂
∂
1/2
2 −iϕ/2
iϕ
(L+ ) e
sin θ = L+ ~e
+ i cot
e−iϕ/2 sin1/2 θ
∂θ
∂ϕ
¶
µ
1
∂
iϕ/2
+ cot θ sin1/2 θ
= L+ ~e
∂θ 2
= L+ ~eiϕ/2 cos θ sin−1/2 θ
µ
¶
∂
∂
= ~2 eiϕ
eiϕ/2 cos θ sin−1/2 θ
+ i cot θ
∂θ
∂ϕ
µ
¶
∂
1
= ~2 ei3ϕ/2
− cot θ cos θ sin−1/2 θ
∂θ 2
= −~2 ei3ϕ/2 sin−3/2 θ 6= 0 .
Für größere halbzahlige Werte von l führt die entsprechende Rechnung auch
zum Widerspruch zu (14.64); sie vorzuführen, wäre ein unfreundlicher Akt, da
sie länglich ist. Zu mehr Freude werden wir gleich Anlass haben, wenn wir
die aus (14.63) bei halbzahligem l und m entstehenden Funktionen als nicht
normierbar erkennen.
Alle zulässigen Drehimpulseigenfunktionen Ylm (θ, ϕ) müssen normierbar sein
durch die Forderung
hYlm | Ylm i =
Zπ
0
dθ sin θ
Z2π
0
dϕ |Ylm (θ, ϕ)|2 = 1 ,
(14.65)
2
damit |Ylm | sin θ dθ dϕ als Wahrscheinlichkeitsverteilung für die Winkel θ und
ϕ interpretierbar ist. Für die halbzahligen Werte l = 3/2, 5/2, . . . führt (14.63)
jedoch zu divergierenden Normierungsintegralen. Am einfachsten sehen wir das,
wenn wir für derartige l die Yll (θ, ϕ) in der Nähe von θ = 0 betrachten, wo
sinl θ ≈ θ l und cot θ ≈ 1/θ gilt; es folgt für L+ Yl,−l
¶
µ
i ∂
∂
iϕ
e−i/ϕ θl ∼ 2le−i(l−1)ϕ θl−1
(14.66)
+
L+ Yl,−l ∼ e
∂θ θ ∂ϕ
und entsprechend
(L+ )2 Yl,−l ∼ 22 l(l − 1)e−i(l−2)ϕ θl−2
(14.67)
14.6 Die Eigenfunktionen des Bahndrehimpulses
265
und so weiter. Bei halbzahligem l entsteht schließlich in Yll , als führender Term
Yll ∼ (L+ )2 Yl,−l ∼ l(l − 1) . . . (−l + 1)(−l)eilϕ θ−l .
(14.68)
Im Skalarprodukt (14.65) verhält sich der Integrand in der Nähe von θ = 0 dann
wie θ −2l+1 , so dass das Integral für l = 3/2, 5/2 etc. jedenfalls divergiert. Bei
ganzzahligen Werten von l (und somit m) kann das eben beschriebene Unglück
nicht passieren. Beachten Sie, dass die rechte Seite in (14.68) für jedes ganze l
verschwindet.
Die in (14.63) angegebenen Ylm sind außer für m = −l noch nicht auf Eins
normiert. Um diese Normierung für alle m = −l, −l + 1, . . . , +l zu erreichen,
benutzen wir ein einfaches Rekursionsargument. Stellen wir uns vor, Ylm sei
schon so normiert und setzen an
Yl,m+1 = cm L+ Ylm .
(14.69)
Die Konstante cm wählen wir so, dass auch Yl,m+1 gemäß (14.65) normiert ist.
Für den Betrag von cm entsteht sofort die Forderung
1 = |cm |2 hL+ Ylm | L+ Ylm i
= |cm |2 hYlm | L− L+ Ylm i
= |cm |2 ~2 (l − m)(l + m + 1)hYlm | Ylm i
= |cm |2 ~2 (l − m)(l + m + 1) ,
wobei ich (14.48) benutzt habe. Die Phase von cm bleibt dabei offen; es ist
üblich, sie so festzusetzen, dass alle cm reell und positiv sind. Dann gilt
p
(14.70)
L+ Ylm = ~ (l − m)(l + m + 1)Yl,m+1
und (14.63) kann präzisiert werden zu
Ylm
s
p
(2l + 1)!
(l − m)!
= (−1) √
l
(l + m)!(2l)!
4π2 l!
· µ
¶¸l+m
∂
∂
· eiϕ
e−ilϕ sinl θ .
+ i cot θ
∂θ
∂ϕ
l
(14.71)
Die so bestimmten Ylm sind unter der Bezeichnung Kugelflächenfunktionen bekannt.
Geschafft! Die Argumentation war ärgerlich langwierig, das Resultat ist
aber einfach: Die Eigenwerte ~2 l(l + 1) des Drehimpulsquadrats sind durch die
natürlichen Zahlen
l = 0, 1, 2, . . .
(14.72)
festgelegt. Bei festem l, d. h. festem Drehimpulsquadrat, kann die z-Komponente
Lz die (2l + 1) verschiedenen Eigenwerte ~m mit
m = 0, ±1, ±2, . . . , ±l
(14.73)
266
14 Das Wasserstoffatom
annehmen.
Die ersten paar Kugelflächenfunktionen Ylm lauten
1
Y00 = √
4π
r
3
Y10 =
cos θ ,
4π
r
5
(3 cos2 θ − 1) ,
Y2,0 =
16π
r
15
sin2 θ e±2iϕ .
Y2,±2 =
32π
(14.74)
Y1,±1 = ±
Y2,±1 = ±
r
r
3 ±iϕ
e
sin θ ,
8π
15
sin θ cos θ e±iϕ ,
8π
Eine anschauliche graphische Darstellung ihrer θ-Abhängigkeit ergibt sich, wenn
wir auf einen Radialstrahl in Richtung θ bezüglich der z-Achse |Ylm |2 auftragen
(Abbildung 14.1):
Abbildung 14.1
14.7
Das Radialproblem beim Coulombfeld
Wir hatten uns klar gemacht, dass wir die Eigenfunktionen und Eigenwerte des
Hamiltonoperators
H=−
1 ~2
~2 1 ∂ 2 ∂
1 e2
r
+
L
−
2m r2 ∂r ∂r 2mr2
4πε0 r
(14.75)
14.7 Das Radialproblem beim Coulombfeld
267
durch den Produktansatz
Φ(r, θ, ϕ) = R(r)Ylm (θ, ϕ)
(14.76)
erhalten. Zu bestimmen bleibt der Radialteil R(r) der Wellenfunktion aus
µ 2
¶
2mE
d
2 d
l(l + 1)
1 2me2
R(r) = − 2 R(r) .
+
−
+
(14.77)
2
2
2
dr
r dr
r
4πε0 ~ r
~
Wir hatten ebenfalls gesehen, dass gebundene Zustände nur für negative Energien auftreten und für große r exponentiell abfallen
´
³ p
für
r→∞.
(14.78)
R(r) ∼ exp −r −2mE/~2
Die Differentialgleichung (14.77) verschönert sich, wenn wir statt r die dimensionslose Variable
p
ρ = 2r −2mE/~2
(14.79)
verwenden, zu
·
2 d
d2
+
+
2
dρ
ρ dρ
µ
λ l(l + 1) 1
−
−
ρ
ρ2
4
¶¸
R=0,
(14.80)
worin der zu bestimmende Energieeigenwert sich in dem dimensionslosen Parameter
λ=
1 e2 p
−m/2E
4πε0 ~
(14.81)
versteckt hat. Da nun das asymptotische Verhalten für ρ → ∞ durch R →
exp(−ρ/2) charakterisiert ist, liegt es nahe, die Amplitude R durch den Ansatz
R = f (ρ) e−ρ/2
zu suchen. Für f (ρ) entsteht aus (14.80) die Differentialgleichung
¶
·
¸
µ
λ − 1 l(l + 1)
2
− 1 f 0 (ρ) +
−
f (ρ) = 0 .
f 00 (ρ) +
ρ
ρ
ρ2
(14.82)
(14.83)
Wenn wir versuchen, diese Gleichung durch eine Potenzreihe zu befriedigen,
X
f (ρ) =
Cν ρν ,
(14.84)
ν
so finden wir die Koeffizienten Cν durch (14.83) der folgenden Rekursionsformel
unterworfen
Cν =
ν−λ
Cν−1 .
ν(ν + 1) − l(l + 1)
(14.85)
Eine Lösung, die zu einer normierbaren Amplitude R führt, ergibt sich durch
folgende Überlegung.
Ein Verschwinden des Nenners auf der rechten Seite ist ausgeschlossen für
Reihen (14.84), die nur Glieder mit ν > l enthalten, also mit dem Glied xl
268
14 Das Wasserstoffatom
beginnen. Im übrigen kann die Rekursionsformel (14.85) insofern Schrecken
einflößen, als sie sich für ν → ∞ vereinfacht zu Cν ≈ Cν−1 /ν; sie lässt also
eine Lösung zu, die sich für große ν wie Cν → 1/ν! verhält. Da die Glieder
hoher Ordnung in ν das Verhalten der Reihe (14.84) für großePρ dominieren,
ρν /ν! = e+ρ ;
verhält sich die entsprechende Reihe asymptotisch wie f (ρ) →
ν
ein solches f (ρ) führt nach (14.82) zu einer nicht normierbaren Amplitude R
und ist daher zu verwerfen.
Nichts Besseres dürfen wir erwarten! Nur für spezielle Werte der Energie E,
d. h. auch des Parameters λ können mit der Randbedingung der Normierbarkeit
verträgliche Lösungen R entstehen. In der Tat, genau wenn λ ganzzahlig ist
gemäß
λ = n = l + 1, l + 2, l + 3, . . .
(14.86)
erlaubt (14.85) die endliche Folge endlicher Koeffizienten
Cl , Cl+1 , . . . , Cn−1 ,
(14.87)
während Cn und somit auch alle Cν mit ν > n verschwinden. Die zugehörige
Radialamplitude
Rnl = e−ρ/2
n−1
X
cν ρν
(14.88)
ν=l
ist offensichtlich normierbar.
Das diskrete Spektrum der Energieeigenwerte ist durch (14.86) und (14.81)
gegeben als
Enl = −
µ
1
4πε0
¶2
me4 1
2~2 n2
(14.89)
mit n = l + 1, l + 2, . . . und l = 0, 1, 2, . . ..
Diese Energieniveaus sind in Abbildung 14.2 eingetragen. Die Darstellung
macht sinnfällig, dass zur festen Drehimpulsquantenzahl l die Folge Enl mit
den Hauptquantenzahlen n = l + 1, l + 2, . . . gehört, während bei festem n die
Drehimpulsquantenzahlen l = 0, 1, . . . , n − 1 möglich sind. Das Bild erinnert Sie
auch an die aus der Spektroskopie stammende Bezeichnung der l = 0, 1, 2, 3, . . .Zustände durch die Symbole s, p, d, f , . . ..
Die niedrigste Energie, die Grundzustandsenergie, ist
E10 = −
µ
1
4πε0
¶2
me4
≈ −13, 6 eV .
2~2
(14.90)
Um ein H-Atom aus dem Grundzustand heraus zu ionisieren, muss also mindestens eine Energie von 13, 6 eV aufgebracht werden. Beachten (und begründen)
Sie den hier zu Tage tretenden Unterschied zur klassischen Bewegung im Coulombfeld; dort ergibt sich die niedrigste Energie E = −∞, wenn das Teilchen
im Kraftzentrum ruht.
Alle Energieniveaus des H-Atoms außer dem Grundzustandsniveau sind entartet. Bei fester Hauptquantenzahl n hängt Enl nämlich gar nicht mehr von
14.7 Das Radialproblem beim Coulombfeld
269
Abbildung 14.2
der Drehimpulsquantenzahl l ab. Zudem kann bei festem n und l die Orien”
tierungsquantenzahl“ m noch die 2l + 1 verschiedenen Werte m = 0, ±1, . . . , ±l
annehmen. Die Tatsache, dass die Energieniveaus Enl von m unabhängig sind,
dass also alle Werte der z-Komponente des Drehimpulses energetisch gleichberechtigt sind, ist natürlich Ausdruck der Isotropie des Coulombpotentials.
Die Zahl der unabhängigen Energieeigenfunktionen, die zum selben Eigenwert der Energie gehören, heißt Entartungsgrad des entsprechenden Niveaus.
Da die Energiewerte zu den Wasserstoffeigenfunktionen
Rnl (r)Ylm (θ, ϕ)
(14.91)
nur von der Hauptquantenzahl n abhängen, hat jedes dieser Niveaus den Entartungsgrad
n−1
X
(2l + 1) = n2 .
(14.92)
l=0
Unsere Resultate für die Energieeigenfunktionen des H-Atoms erlauben uns,
nach der Größe des Wasserstoffatoms zu fragen. Nach (14.79), (14.92) und
(14.89) fällt die Aufenthaltswahrscheinlichkeit |Rnl |2 als Funktion von der Radialkoordinate exponentiell ab auf dem Längenmaßstab
anl =
p
4πε0 ~2
~2 /2m(−Enl ) =
n.
me2
(14.93)
Diese Abklinglängen sind ganze Vielfache des so genannten Bohrschen Radius
a = 4πε0 ~2 /me2 ≈ 0, 5 × 10−10 m = 0, 5 Å .
(14.94)
Der Durchmesser“ eines H-Atoms im Grundzustand hat also die Größenord”
nung eines Angströms.
270
14 Das Wasserstoffatom
Die ersten paar Radialamplituden des H-Atoms lauten, nach Normierung
gemäß
Z∞
0
dr r 2 |Rnl |2 = 1 ,
(14.95)
R10 = 2a−3/2 e−r/a
³
r ´ −r/2a
e
R20 = (2a)−3/2 2 −
a
r
R21 = 3−1/2 (2a)−3/2 e−r/2a
a
¶
µ
r2
r
−4
−l/2 −5/2
R30 = 3 · 3
a
54 − 36 + 4 2 e−r/3a
a
a
³
´
r
r
R31 = 3−4 · 6−1/2 a−5/2 4
6−
e−r/3a
a
a
R32 = 3−4 · 30−1/2 a−5/2 4
(14.96)
r2 −r/3a
e
.
a2
Die zu verschwindendem Bahndrehimpuls l = 0 gehörigen unter ihnen sind in
Abbildung 14.3 aufgezeichnet.
Abbildung 14.3
14.8
Auswahlregeln
Sie erinnern sich: Stabil, d. h. beliebig langlebig kann nur der Grundzustand
eines Systems sein. Das Wasserstoffatom macht keine Ausnahme. Selbst wenn
keine anderen Atome bei Stößen und auch kein von außen eingestrahltes elektromagnetisches Feld einem anfänglich angeregten H-Atom die Anregungsenergie
abnehmen, wird der angeregte Zustand i. A. nicht beliebig lange erhalten bleiben; vielmehr wird das Atom i. A. unter Aussendung eines Lichtquants spontan
in den Grundzustand zurückkehren.
Die anfängliche atomare Anregungsenergie ∆E wird nach der Emission als
14.8 Die Auswahlregeln
271
Energie des Photons auftreten. Entsprechend
∆E = ~ω
(14.97)
gehört zu jeder Energiedifferenz ∆E zweier Niveaus eine charakteristische Frequenz ω. Sie wissen, dass diese Erklärung der Spektrallinien des H-Atoms einer
der ersten großen Triumphe der Quantentheorie war.
Nicht zu allen Paaren von Energieniveaus Enl , En0 l0 des Wasserstoffatoms
werden Spektrallinien beobachtet. Erlaubt“, d. h. unter Laborbedingungen
”
im infraroten bis ultravioletten Spektralbereich leicht beobachtbar sind nur
Übergänge zwischen Zuständen Rnl Ylm und Rn0 l0 Yl0 m0 , bei denen sich die Bahndrehimpulsquantenzahl l und die Orientierungsquantenzahl m ändern gemäß
den Auswahlregeln
∆l = ±1
und
∆m = 0 oder ± 1 .
(14.98)
Ich kann die Auswahlregeln hier nicht durch eine Rechnung begründen und
auch nicht klarmachen, dass die entsprechenden Übergänge zu elektrischer Dipolstrahlung führen. Wohl aber will ich bemerken, dass in den Auswahlregeln
(14.98) u. a. die Tatsache zum Ausdruck kommt, dass das abgestrahlte Photon
einen Eigendrehimpuls, Spin genannt, der Größe J~2 = ~2 j(j + 1) mit j = 1
hat. Wie jeder quantenmechanische Drehimpuls kann die z-Komponente J z des
Photonenspins nur die Werte (in Einheiten ~) −j, . . . , +j, d. h. −1, 0, +1 annehmen‡) . Der Gesamtdrehimpuls von Atom und elektromagnetischem Feld bleibt
stets erhalten. Es muss sich bei der Emission eines Photons der Drehimpuls des
Atoms genau um den Betrag ändern, den das abgestrahlte Photon fortträgt.
Neben der gerade besprochenen Isotropie des Raums kommt in den Auswahlregeln noch eine weitere Symmetrie der Wechselwirkung zwischen geladenen Teilchen und dem elektromagnetischen Feld zum Ausdruck. Es handelt
sich um die so genannte Paritätsinvarianz, die Sie sich wohl besser unter der
Bezeichnung Spiegelsymmetrie merken. Sie besagt, dass zu jedem in der Natur vorkommenden elektromagnetischen Strahlungsprozess auch der räumlich
gespiegelte Prozess auftritt.
Diese Spiegelsymmetrie gilt übrigens auch für die Gravitation. Überzeugen
Sie sich davon, dass z. B. die Newtonschen Bewegungsgleichungen (10.5) für
einen Haufen gravitierender Teilchen invariant sind unter der Ersetzung jedes
Ortsvektors ~xν durch −~xν . Verfallen Sie aber nicht dem Irrglauben, die bei
Gravitation und Elektromagnetismus gegebene Spiegelsymmetrie sei eine selbstverständliche Eigenschaft der Natur. Beim β-Zerfall, also bei der schwachen
Wechselwirkung, gilt die Spiegelsymmetrie nicht.
Da ich nicht vorrechne, dass die Auswahlregeln (14.98) aus der Erfahrungstatsache folgen, dass die elektromagnetischen Wechselwirkung weder eine Raumrichtung auszeichnet, noch die Welt von ihrem Spiegelbild zu unterscheiden gestattet, kann ich ebenfalls nur berichten die Präzisierung, dass die Auswahlregeln (14.98) nur für die elektrische Dipolstrahlung gelten. In Spektralbereichen,
in denen die Wellenlänge nicht sehr groß ist gegen den Atomdurchmesser, wird
elektrische und magnetische Multipolstrahlung wichtig, für die andere Auswahlregeln gelten. Die Verletzung der Auswahlregeln (14.98) in solchen Prozessen
‡) Mit Hilfe der Eichinvarianz der Elektrodynamik lässt sich zeigen, dass dem Photon der
Eigenwert Jz = 0 verboten ist.
272
14 Das Wasserstoffatom
bedeutet übrigens nicht eine Verletzung der Isotropie und der Paritätsinvarianz
der elektromagnetischen Wechselwirkung. Vielmehr macht sich bemerkbar, dass
das abgestrahlte Photon dem Atom Drehimpuls entziehen kann sowohl vermöge
seines Spins als auch in Form von Bahndrehimpuls.
14.9
Verwandte Zweikörpersysteme
Ohne neue Rechnung können wir die für das H-Atom gewonnenen Resultate auf
mehrere andere Systeme übertragen.
Deuterium und Tritium unterscheiden sich vom Wasserstoff dadurch, dass
die Atomkerne außer einem Proton zusätzlich ein bzw. zwei Neutronen enthalten. Die respektiven Kernmassen mD und mT sind etwa doppelt bzw. dreimal
so groß wie die des H-Atoms. Die Kernmassen gehen in die Energieniveaus E nl
nur über die reduzierte Masse der Relativbewegung ein. Wegen der Linearität
der Energieniveaus (14.89) in m beträgt die relative Isotopenverschiebung der
Energieniveaus
¯
¯
¯ δEnl ¯ δm
¯
¯
(14.99)
¯ Enl ¯ = m ,
wobei δm die Änderung der reduzierten Masse von einem Isotop des Wasserstoffs
zum anderen darstellt. Die Verschiebung (14.99) ist zwar klein (. 10−3 ), aber
durchaus nachweisbar.
Beim einfach ionisierten Helium oder doppelt ionisierten Lithium liegt auch
die Isotopenverschiebung (14.99) vor. Eine gewichtigere Änderung des Energieniveauschemas rührt jedoch von der Erhöhung der Kernladung um den Faktor
Z = 2 bzw. Z = 3 her. Die Energieniveaus (14.89) sinken dementsprechend
tiefer, u. z. gemäß e2 → Ze2 auf
Enl = −
1 Z 2 me4 1
.
4πε0 2~2 n2
(14.100)
Offenbar ist das Elektron umso stärker gebunden, je größer die Kernladungszahl
Z ist.
Die Spektren der neutralen Alkaliatome Li, Na, K, Rb, Cs, Fr weisen eine gewisse Ähnlichkeit zum Wasserstoffspektrum auf. Der Grund dafür ist,
dass in diesen Atomen ein Elektron, das so genannte Leuchtelektron, sehr viel
schwächer gebunden ist als alle anderen; dem Leuchtelektron erscheint der Rest
des Atoms dann als eine (fast) starre, kugelsymmetrische und einfach positiv
geladene Einheit.
Gewisse Anregungszustände in Halbleitern, die so genannten Exzitonen, zeigen Energieniveaus mit wasserstoffähnlicher Anordnung. Eine einfache Modellvorstellung für das Exziton besagt, dass ein aus seinem Normalzustand gehobenes Elektron an seinem ursprünglichen Ort ein effektiv positiv geladenes Loch“
”
hinterlässt. Sowohl das Loch wie das Elektron sind im Halbleiter beweglich. Beiden kann eine effektive Masse zugeschrieben werden, die allerdings von einem
Halbleiter zum anderen verschieden ist und oft stark von der Masse des freien
Elektrons abweicht. Wasserstoffähnliche Bindungszustände der beiden Teil”
chen“ entstehen, wenn ihre Wechselwirkung von der Coulombschen Anziehung
dominiert wird. Das Exziton ist übrigens nicht stabil. Nach einer mittleren Lebensdauer, die von Halbleiter zu Halbleiter verschieden ist, kehrt das Elektron
14.9 Verwandte Zweikörpersysteme
273
in seinen Normalzustand zurück. Dabei füllt es das von ihm selbst gerissene
Loch, woraufhin das Exziton vernichtet ist. Die Anregungsenergie geht dabei
i. A. in Licht oder/und Schall über.
Für die Elementarteilchenphysik von hervorragendem Interesse ist das Positronium, in dem ein Elektron und ein Positron aneinander gebunden sind.
Das Positron ist bis auf das Vorzeichen seiner elektrischen Ladung mit dem
Elektron identisch und wird daher auch als das Antiteilchen des Elektrons bezeichnet. Das Positronium kann daher als eine leichtere Version des H-Atoms
angesehen werden. Verschieden ist allerdings die reduzierte Masse der beiden
Zweikörpersysteme. Beim Positronium beträgt sie
m=
mel · mel
1
= mel ,
mel + mel
2
(14.101)
ist also nur etwa halb so groß wie beim Wasserstoff. Gemäß (14.94) hat das
Positronium eine gegenüber dem H-Atom verdoppelte Ausdehnung, während
die Energieniveaus ihre Beträge um den Faktor 1/2 verkleinern.
Um zu prüfen, ob eine nichtrelativistische Behandlung des Positroniums
möglich ist, schätzen wir die Geschwindigkeit der Relativbewegung mit der
Unschärferelation ab. Die räumliche Lokalisierung auf apos = 2aH bedingt eine
Impulsunschärfe ∆p ≈ ~/2aH ; nach Division durch die reduzierte Masse mpos ≈
1
2 mH ergibt sich die Geschwindigkeitsunschärfe ∆v ≈ ~/mpos apos ≈ ~/mH aH .
Genau wie beim H-Atom beträgt die typische Geschwindigkeit also einige tausend km/s, so dass die nichtrelativistische Behandlung im einen wie im anderen
Fall gerade noch angemessen erscheint.
Tatsächlich sind sowohl beim H-Atom wie beim Positronium relativistische
Effekte trotz ihrer Kleinheit durchaus messbar. Einige dieser Effekte hängen damit zusammen, dass das Elektron, das Proton und das Positron außer den drei
klassischen Freiheitsgraden, die den Ort eines Teilchens festlegen, noch einen
zusätzlichen inneren Freiheitsgrad, den Spin, haben. Über diesen Spin wird
später noch zu reden sein. Hier will ich eine andere und drastischere relativistische Eigenschaft des Positroniums erwähnen, seine Instabilität. Einige 10−6 s
nach der Erzeugung ist kaum ein Positronium mehr intakt. Die Bestandteile,
das Elektron und das Positron, vernichten sich gegenseitig und hinterlassen als
Spur z. B. elektromagnetische Wellen. Da die Ruheenergie mel c2 des Elektrons
und des Positrons je etwa 0, 5 MeV beträgt, tragen die beim Zerstrahlen des
Positroniums in elektromagnetische Wellen entstehenden Photonen zusammen
eine Energie von mindestens 1 MeV. Derart energiereiche Photonen sind Sie
gewohnt, γ-Quanten zu nennen.
Die derzeit meistdiskutierten wasserstoffähnlichen Zweikörpersysteme sind
zwei kürzlich entdeckte Mesonen, das Charmonium (auch ψ-Meson oder J genannt, 1974 entdeckt) und das Bottomium (auch Y-Meson genannt, 1977 entdeckt). Viele Eigenschaften dieser Mesonen können erklärt werden durch die
Annahme, dass beide aus je zwei Teilchen, so genannten Quarks, zusammengesetzt sind.
Insbesondere stellt man sich unter dem Charmonium einen Bindungszustand
des so genannten charmanten Quarks c und seines Antiteilchens c̄ vor. Beide
Teilchen sind elektrisch geladen, u. z. betragen die Ladungen in Einheiten der
Elektronenladung
ec = −2/3
und
ec̄ = +2/3 .
(14.102)
274
14 Das Wasserstoffatom
Die respektiven Massen sind nicht genau bekannt; indirekte Schlüsse legen jedoch nahe, dass das charmante Quark mehr als doppelt so schwer ist wie ein
Proton
mc c2 = mc̄ c2 ≈ 2 GeV
(14.103)
(wobei c2 = Quadrat der Lichtgeschwindigkeit). Sehr genau bekannt ist die
Masse des Charmoniums,
m2ψ = 3, 097 GeV .
(14.104)
Beachten Sie, dass das Charmonium deutlich leichter ist als zwei charmante
Quarks. Der Massendefekt mψ − 2mc gibt bis auf den Faktor c2 die Bindungsenergie des ψ-Mesons. (Derartige Massendefekte sind ihnen aus der Kernphysik
bekannt; die Masse des α-Teilchens ist kleiner als die Gesamtmasse je zweier
freien Protonen und Neutronen; Sie erinnern sich, dass sich im Massendefekt
die Einsteinsche Äquivalenz von Masse und Energie zeigt?)
Die Verwandtschaft des ψ-Mesons mit dem Wasserstoffatom (für das YMeson gilt Ähnliches) besteht darin, dass die Bindung des charmanten Quarks
c an sein Antiteilchen c̄ nichtrelativistisch, also durch Lösung einer Schrödingergleichung behandelt werden kann. Die in Rechnung zu stellende Wechselwirkungsenergie V (~xc , ~xc̄ ) ist zwar nicht genau bekannt, jedoch stellt sich heraus,
dass
V (~xc , ~xc̄ ) = V (r) = −
α
+ βr,
r
r = |~xc − ~xc̄ |
(14.105)
die beobachteten Anregungsenergien des Charmoniums für geeignete Wahlen
der positiven Parameter α und β vernünftig wiedergibt. Der erste Term in V ,
−α/r, enthält zwar die elektrostatische Anziehung der beiden Quarks; jedoch
stellt diese nur eine völlig unerhebliche Korrektur an der starken Wechselwirkung
dar, die den überwältigenden Beitrag zum Parameter α macht. Der zweite
Term in V , βr, bringt den experimentellen Befund zum Ausdruck, dass Quarks
bisher trotz angestrengter Suche nie als freie Teilchen beobachtet worden sind.
Möglicherweise können Quarks gar nicht isoliert existieren. Jedenfalls verbietet
der mit dem Abstand r unbegrenzt wachsende Anteil des Potentials (14.105),
dass das fragliche Zweikörpersystem sich in seine beiden Bestandteile auflöst.
Dass das ψ-Meson tatsächlich ein nichtrelativistischer Bindungszustand sein
sollte, können wir uns durch die folgende Größenordnungsabschätzung für die
Geschwindigkeit der Relativbewegung der beiden Quarks klarmachen. Die Lineardimension des Charmoniums sollte wie die aller stark wechselwirkenden
beobachtbaren Teilchen (Proton, Neutron, andere Mesonen . . . ) die Größenordnung aψ ≈ 10−13 cm haben. Die Unschärferelation gibt dann als einen typischen
Impuls pψ ≈ ~/aψ . Mit der Masse mψ aus (14.104) erhalten wir als typische
Geschwindigkeit
vψ /c ≈
~c
. 0, 1 ,
amψ c2
(14.106)
also einen Wert, der die nichtrelativistische Behandlung der Relativbewegung
der beiden Quarks gerade noch als nicht unsinnig erscheinen lässt.
Kapitel 15
Der Einfluss
elektromagnetischer Felder
auf die Quantenmechanik
geladener Teilchen
15.1
Die Schrödingergleichung
Für den Moment ohne Begründung, jedoch mit dem Versprechen, diese bald
nachzuholen, stelle ich Ihnen hier die Schrödingergleichung eines Teilchens mit
der Masse m und der Ladung q bei Anwesenheit eines beliebigen elektromagnetischen Feldes vor,
i~ψ̇(~x, t) = Hψ(~x, t)
´2
1 ³
~ x, t) + qϕ(~x, t) .
p~ − q A(~
H=
2m
(15.1)
(15.2)
~ und ϕ das Vektorpotential bzw. das skalare Potential, die das
Dabei sind A
~ und das Magnetfeld B
~ festlegen gemäß
elektrische Feld E
~ − grad ϕ
~ =−∂A
E
∂t
~ = rot A
~.
B
(15.3)
Der Teilchenimpuls p~ ist wie bisher mit dem Differentialoperator p~ = (~/i)∇ zu
identifizieren.
Einen wichtigen Spezialfall haben wir im letzten Kapitel besprochen. Das
elektrostatische Feld eines Atomkerns der Ladung e kann beschrieben werden
durch
~ = 0,
A
ϕ=
1 e
.
4πε0 r
(15.4)
Für q = −e mit e = Elementarladung entsteht dann aus (15.3) der Hamiltonoperator für die Bewegung des Elektrons im Wasserstoffatom.
275
276
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
Im Folgenden werden wir uns mit dem Einfluss eines räumlich und zeitlich
~ auf die Teilchenbewegung beschäftigen. Ein solches
konstanten Magnetfeldes B
Feld kann durch das Vektorpotential
~ × ~x
~ = 1B
A
2
(15.5)
festgelegt werden, wie Sie mit Hilfe von (15.3) leicht nachrechnen. Für diesen
Fall lässt sich der Hamiltonoperator (15.2) in einer physikalisch durchsichtigeren
Form aufschreiben. Beachten wir zu diesem Zweck, dass für das Vektorpotential
(15.5) gilt
1 ∂(By z − Bz y)
∂Ax
=
= 0,
∂x
2
∂x
∂Ay
∂Az
=
=0.
∂y
∂z
(15.6)
Es folgt, dass beim Ausmultiplizieren des Quadrats in (15.2) die Operatorpro~ · p~ und p~ · A
~ gleichgesetzt werden können,
dukte A
¶
µ
µ
¶
~ = ~ ∂ Ax + ∂ Ay + ∂ Az = ~ ∂Ax + · · ·
p~ · A
i ∂x
∂y
∂z
i
∂x
µ
¶
∂
~
~ · p~ .
Ax
+
+ ··· = A
(15.7)
i
∂x
Somit entsteht
H=
q2 ~ 2
q ~
p~2
+ qϕ − A
· p~ +
A .
2m
m
2m
(15.8)
~
Mit Hilfe der zyklischen Invarianz des Spatprodukts, (B × ~x)~
p = (~x × p~) · B,
erhalten wir schließlich
H=
´2
p~2
q ~ ~
q2 ³ ~
+ qϕ −
L·B+
B × ~x
.
2m
2m
8m
(15.9)
q ~
L.
2m
(15.10)
~ enthaltende Term in (15.9) erlaubt eine anschauDer den Bahndrehimpuls L
liche Deutung. Aus der klassischen Elektrodynamik (siehe 5. (5.64)) ist uns der
~ und dem magnetischen Moment
Zusammenhang zwischen dem Drehimpuls L
m
~ eines Ladungshaufens mit Masse m und Ladung q bekannt,
m
~ =
~ klassisch die Einstellenergie eines magnetischen
Ferner wissen wir, dass −m
~ ·B
~ angibt. Im quantenmechanischen
Moments m
~ im konstanten Magnetfeld B
~
~ Operatoren, jedoch bleibt der
Kontext werden zwarL und somit m
~ wie −m
~ ·B
~ des Hamilfrühere Zusammenhang (15.10) erhalten, und der Anteil −m
~ ·B
tonoperators bringt nach wie vor zum Ausdruck, dass die Parallelstellung des
magnetischen Moments zum konstanten Magnetfeld energetisch bevorzugt ist
~
gegenüber allen anderen Orientierungen von m
~ zu B.
Übrigens sind in vielen Experimenten mit Atomen in Magnetfeldern die Ma~ quadratische Effekte nicht beobachtet werden
gnetfelder so klein, dass in B
können. In solchen Fällen kann der letzte Term im Hamiltonoperator (15.9)
15.2 Die klassische Hamiltonfunktion
277
vernachlässigt werden. Machen Sie sich den Spaß, die Größenordnung des Magnetfeldes auszurechnen, für welche der letzte Term in (15.9) vergleichbar wird
~ ·B
~
mit der Einstellenergie (q/2mc)L
Vor der Diskussion von Anwendungen will ich nun, wie versprochen, begründen, dass die Wechselwirkung von Ladungen mit elektromagnetischen Feldern durch den Hamiltonoperator (15.2) richtig beschrieben wird. Ein Exkurs
in die klassische Physik wird dabei helfen.
15.2
Die klassische Hamiltonfunktion
Ein klassisches Teilchen, das sich in einer Raumdimension bewegt und am Ort
x die potenzielle Energie U (x) hat, gehorcht der Newtonschen Bewegungsgleichung
mẍ = −
dU (x)
.
dx
(15.11)
Diese Differentialgleichung zweiter Ordnung in der Zeit lässt sich ersetzen durch
zwei Differentialgleichungen erster Ordnung für die Ortskoordinate x und den
Impuls p, nämlich
ẋ =
1
p,
m
ṗ = −
dU
.
dx
(15.12)
Wir verschönern nun das Aussehen der letzteren Gleichungen, wenn wir in der
2
Energie E = m
2 ẋ + U (x) = E(ẋ, x) des Teilchens die Geschwindigkeit zu Gunsten des Impulses eliminieren,
E(ẋ, x) → H(p, x) =
1 2
p + U (x) .
2m
(15.13)
Die so gewonnene Hamiltonfunktion H(p, x) hat offenbar die partiellen Ableitungen ∂H/∂x = dU/dx und ∂H/∂p = p/m und erlaubt daher, die Bewegungsgleichungen (15.12) in der Form
ẋ =
∂H
,
∂p
ṗ = −
∂H
∂x
(15.14)
zu schreiben. Dies sind die so genannten Hamiltonschen Gleichungen.
Für ein Teilchen, das sich in drei Raumdimensionen bewegen kann und die
potenzielle Energie U (~x) hat, lautet die Hamiltonfunktion offensichtlich
H=
1 2
p~ + U (~x) ,
2m
(15.15)
während die Hamiltonschen Gleichungen (15.14) sich verallgemeinern zu
ẋi =
∂H
,
∂pi
p˙i = −
∂H
.
∂xi
(15.16)
Beachten Sie, dass der Übergang zur Quantenmechanik nun formal dadurch vollzogen werden kann, dass der klassische Impuls p~ in der Hamiltonfunktion durch
den Differentialoperator (~/i)∇ ersetzt wird; die Hamiltonfunktion verwandelt
sich dabei in den uns längst bekannten Hamiltonoperator.
278
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
Wenden wir uns nun einem klassischen geladenen Teilchen im elektromagnetischen Feld zu. Es erfährt dort die Lorentzkraft
´
³
~ + ~v × B
~ .
(15.17)
F~ = q E
Zur Vorbereitung des Übergangs zur Quantenmechanik suchen wir zunächst eine
Hamiltonfunktion H(~
p, ~x, t), die die Newtonsche Bewegungsgleichung
´
³
¨=q E
~ + ~v × B
~
(15.18)
m~x
als Hamiltonsche Gleichungen der Form (15.16) zu schreiben erlaubt. Da die
Lorentzkraft (15.17) sich i. A. nicht als Gradient eines skalaren Feldes schreiben
lässt (das geht nur im rein elektrostatischen Feld), kann die gesuchte Hamiltonfunktion nicht die Form (15.15) haben. Wir können jedoch leicht verifizieren,
dass
H=
1
~ 2 + qϕ
(~
p − q A)
2m
(15.19)
die gestellte Aufgabe löst, wenn das elektrische und das magnetische Feld wie
~ und ϕ festgelegt werden als
üblich durch die Potentiale A
~
~ = −∇ϕ − ∂ A
E
∂t
(15.20)
~ = rot A
~.
B
(15.21)
Die zu (15.19) gehörigen Hamiltonschen Gleichungen lauten
ẋi =
1
∂H
= (pi − qAi )
∂pi
m
ṗi = −
∂H
q
∂Aj
∂ϕ
= + (pj − qAj )
−q
∂xi
m
∂xi
∂xi
= q ẋj
(15.22)
(15.23)
∂ϕ
∂Aj
−q
.
∂xi
∂xi
Beachten Sie, dass ich Ihnen in (15.23) durch Verwendung von (15.22) sowie der
Summenkonvention Bequemlichkeit verschafft habe. Bevor ich den Nachweis der
Äquivalenz dieser Hamiltonschen Gleichungen zu der Newtonschen Gleichung
(15.18) führe, ist eine Erläuterung am Platze.
Sie dürfen den in der Hamiltonfunktion (15.19) und den Hamiltonschen Gleichungen (15.22) und (15.23) auftretenden Vektor p~ als ein Tripel von Hilfsgrößen
ansehen, das zu nichts anderem nützt, als zur Überführung der Newtonschen
Bewegungsgleichung (15.18) in ein System von Differentialgleichungen erster
Ordnung in der Zeit. Ich will Ihnen diese Ansicht sogar nahe legen. Als Name für das fragliche Tripel p~ hat sich kanonischer Impuls eingebürgert. Wenn
Sie diese Bezeichnung übernehmen und sich sogar der üblichen Schlamperei
anschließen, das Epitheton kanonisch zu unterdrücken, so dürfen Sie doch nie
vergessen, dass der kanonische Impuls eines geladenen Teilchens im elektromagnetischen Feld nicht gleich dem Produkt aus Masse und Geschwindigkeit des
Teilchens ist. Vielmehr ist der Zusammenhang zwischen Geschwindigkeit und
15.2 Die klassische Hamiltonfunktion
279
kanonischem Impuls durch (15.22) gegeben; nur im Spezialfall verschwindenden
Vektorpotentials reduziert derselbe sich auf p~ = m~v .
Die vorstehende Erläuterung erschließt eine schöne Einsicht. Der erste Summand in der Hamiltonfunktion (15.19) stellt offenbar gerade die kinetische Energie 21 m~v 2 des Teilchens dar. In (15.19) kommt also insbesondere die altbekannte
Tatsache zum Ausdruck, dass im rein magnetostatischen Feld, das durch ϕ = 0
beschrieben werden kann, die Energie eines geladenen Teilchens konstant bleibt.
Da nämlich der magnetische Anteil der Lorentzkraft senkrecht auf der Teilchengeschwindigkeit steht, kann das Magnetfeld nur die Richtung von ~v ändern, nicht
aber den Betrag der Geschwindigkeit und ebenso wenig die Energie E = 21 m~v 2 .
Zum Nachweis der Äquivalenz der Hamiltonschen Gleichungen (15.22, 15.23)
mit der Newtonschen Gleichung (15.18) differenzieren wir (15.22) nach der Zeit
und eliminieren die rechts entstehende Zeitableitung des kanonischen Impulses
mit Hilfe von (15.23). Wir finden dann
mẍi = q ẋj
∂ϕ
d
∂Aj
−q
− q Ai .
∂xi
∂xi
dt
(15.24)
d
d
Beim Ausführen der Zeitableitung dt
Ai = dt
Ai (~x(t), t) müssen wir beachten,
dass sich das Vektorpotential i. A. an einem festen Ort ~x zeitlich ändert; am Ort
~x(t) des Teilchens ist Ai (~x(t), t) zusätzlich zeitabhängig, wenn sich das Teilchen
bewegt, wenn also ~x(t) sich zeitlich ändert. Schreiben wir
¯
¯
¯
∂Ai (~x, t) ¯¯
d
∂
¯
+ ẋj
Ai (~x(t), t) = Ai (~x, t)¯
dt
∂t
∂xj ¯~x=~x(t)
~
x=~
x(t)
schlampig aber schön
d
dt Ai
mẍi = −q
µ
=
∂
∂t Ai
(15.25)
i
+ ẋj ∂A
∂xj , so ergibt sich aus (15.24)
∂ϕ
∂
− Ai
∂xi
∂t
¶
− q ẋj
µ
∂Ai
∂Aj
−
∂xj
∂xi
¶
.
(15.26)
Dies aber ist genau die Newtonsche Gleichung; der erste der beiden Summanden
auf der rechten Seite ist nach (15.20) der elektrische Teil der Lorentzkraft; den
zweiten Summanden erkennen wir als den magnetischen Anteil der Lorentzkraft,
wenn wir bedenken
µ
¶
¶
µ
∂Ax
∂Ay
∂Ax
∂Az
~
~
− vz
(~v × B)x = (~v × rot A)x = vy
−
−
∂x
∂y
∂z
∂x
µ
µ
µ
¶
¶
¶
∂Ax
∂Ax
∂Ay
∂Ax
∂Az
∂Ax
−
−
−
= vx
+ vy
+ vz
∂x
∂x
∂x
∂y
∂x
∂z
µ
¶
∂Aj
∂Ax
= vj
−
.
(15.27)
∂x
∂xj
Nachdem wir nun die klassische Hamiltonfunktion H(~
p, ~x, t) eines geladenen Teilchens im elektromagnetischen Feld gefunden haben, gewinnen wir den
quantenmechanischen Hamiltonoperator, indem wir den kanonischen Impuls p~
durch den Differentialoperator (~/i)∇ ersetzen. Damit ist das Versprechen der
Begründung des Hamiltonoperators (15.2) eingelöst.
280
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
15.3
Klassische (nichtrelativistische) Bewegung
im konstanten Magnetfeld
Bevor wir das eben Gelernte auf die Quantenmechanik eines geladenen Teilchens
im konstanten Magnetfeld anwenden, will ich Sie, zur Vorbereitung, an Altbekanntes erinnern: Ein klassisches geladenes Teilchen bewegt sich auf einer Spi~ B|
~ 2
ralbahn längs des Magnetfeldes; die Geschwindigkeitskomponente (~v · B)/|
~
längs des Feldes B bleibt konstant. In einem Koordinatensystem, bezüglich
~ = 0, vollführt das Teilchen eine gleichförmige Kreisbewegung in eidessen ~v · B
~
ner zu B senkrechten Ebene. Der Radius und die Mittelpunktskoordinaten der
Kreisbahn hängen davon ab, wo und wie schnell das Teilchen in das Magnetfeld
eingeschossen wird. Die Umlauffrequenz, die so genannte Zyklotronfrequenz,
ω=
~
q |B|
m
(15.28)
ist jedoch von den Anfangsbedingungen unabhängig, jedenfalls für nichtrelativistische Teilchen.
Die eben getroffenen Aussagen über die Teilchenbahn im konstanten Magnetfeld sind ohne Rechnung aus der Bewegungsgleichung
¨ = q~x˙ × B
~
m~x
(15.29)
~ wirkt, bleibt das Teilzu gewinnen. Da die Lorentzkraft senkrecht zum Feld B
~
chen längs B unbeschleunigt; da die Lorentzkraft auch senkrecht zur Teilchengeschwindigkeit ist, kann sie den Betrag von ~x˙ nicht ändern; folglich muss die
Teilchenbahn, wenn sie in einer Ebene liegt, ein Kreis sein; dieser Kreis muss
gleichförmig umlaufen werden, da der Betrag der Beschleunigung
¨| =
|~x
~
|q| · |B|
|~x˙ | = ω|~x˙ |
m
(15.30)
ebenfalls zeitlich konstant bleibt (vgl. Abbildung 15.1).
Abbildung 15.1
Sie werden die spätere quantenmechanische Behandlung des Problems mehr
genießen, wenn wir das soeben ohne Rechnung Erkannte auch durch Lösung der
15.3 Klassische (nichtrelativistische) Bewegung im konstanten Magnetfeld
281
Hamiltonschen Gleichungen
ẋi =
∂H
,
∂pi
ṗi = −
∂H
,
∂xi
H=
1
~ 2 + qϕ
(~
p − q A)
2m
(15.31)
erarbeiten. Dabei will ich die Richtung des Magnetfeldes als z-Richtung wählen,
~ = (0, 0, B)
B
(15.32)
und die Potentiale durch
Ax = −By,
A y = Az = ϕ = 0
(15.33)
festlegen. Letztere Wahl weicht zwar von der in 15.1 benutzten (s. (15.1)) ab,
ist aber so gut wie diese, da sie das Magnetfeld (15.32) auch eindeutig festlegt.
Sie wissen doch noch, dass die klassische Elektrodynamik eichinvariant ist, d. h.
~ x, t) und B(~
~ x, t) eine ganze Klasse
dass zu einem festen Paar von Feldern E(~
~
gleichberechtigter Potentiale A und ϕ gehört (s.(6.36)).
An der speziellen Eichung (15.33) haben wir insofern gleich Freude, als die
entstehende Hamiltonfunktion
H=
1 2
1
(px + qBy)2 +
(p + p2z )
2m
2m y
(15.34)
von den Koordinaten x und z unabhängig ist. Nach den Hamiltonschen Gleichungen bleiben somit die entsprechenden Komponenten des kanonischen Impulses zeitlich konstant
ṗx = −
∂H
=0
∂x
=⇒
px (t) = px (0) ,
(15.35)
ṗz = −
∂H
=0
∂z
=⇒
pz (t) = pz (0) .
(15.36)
Die restlichen vier Hamiltonschen Gleichungen lauten
ṗz = −
∂H
= −ωpx − mω 2 y
∂y
(15.37)
ẋ =
∂H
1
= px + ωy
∂px
m
(15.38)
ẏ =
1
∂H
= py
∂py
m
(15.39)
ż =
∂H
1
= pz .
∂pz
m
(15.40)
Mit der zeitlichen Erhaltung von pz folgt aus (15.40) sofort, dass die Teilchenbewegung in z-Richtung gleichförmig verläuft
z(t) = z(0) + ż(0)t .
(15.41)
Beachten Sie, dass die Bewegung in x-Richtung trotz der Erhaltung von px
gemäß (15.38) komplizierter ist. In (15.38) kommt zum Ausdruck, dass der
282
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
kanonische Impuls i. A. nicht mit dem Produkt aus Masse und Geschwindigkeit
übereinstimmt.
Zur Diskussion der Bewegung in y-Richtung differenzieren wir (15.39) nach
der Zeit und eliminieren mit (15.37) den kanonischen Impuls py , woraufhin wir
die Bewegungsgleichung
ÿ + ω 2 y = −
ω
px (0)
m
(15.42)
erhalten. Diese beschreibt eine harmonische Schwingung mit der Frequenz ω
um die Ruhelage
y0 = −px (0)/mω .
(15.43)
Wenn wir die in der Lösung auftretenden Integrationskonstanten durch die Anfangslage y(0) und die Anfangsgeschwindigkeit ẏ(0) festlegen, beschreibt sich
die Schwingung durch
y(t) − y0 = (y(0) − y0 ) cos ωt +
ẏ(0)
sin ωt
ω
(15.44)
Schließlich erhalten wir die Zeitabhängigkeit von x, indem wir in die Hamiltonschen Gleichung (15.38) die Lösung (15.44) eintragen und über die Zeit integrieren. Es ergibt sich die harmonische Schwingung
x(t) − x0 = (y(0) − y0 ) sin ωt −
ẏ(0)
cos ωt
ω
(15.45)
um den Mittelpunkt
x0 = x(0) +
ẏ(0)
.
ω
(15.46)
Offenbar liegen x(t) und y(t) auf einem Kreis in der x − y-Ebene. Sie sehen
nun, wie der Radius
£
¤1/2
(y(0) − y0 )2 + ẏ(0)2 /ω 2
(15.47)
und die Mittelpunktskoordinaten x0 und y0 von den Anfangsdaten abhängen.
15.4
Geladenes Quant im konstanten Magnetfeld
Wir lösen nun die quantenmechanische Version des gerade besprochenen Problems. Der Hamiltonoperator
1 2
1
(px + qBy)2 +
(p + p2z )
2m
2m y
1
1 2
=
(px + p2y + p2z ) + ωypx + mω 2 y 2
2m
2
H=
(15.48)
unterscheidet sich in der Form nicht von der klassischen Hamiltonfunktion (15.34),
jedoch hat er in der Schrödingergleichung
i~ψ̇ = Hψ
(15.49)
15.4 Geladenes Quant im konstanten Magnetfeld
283
wegen p~ = (~/i)∇ die Bedeutung eines Differentialoperators.
Da die Koordinaten x und z in H nicht vorkommen, kommutieren die Kom∂
∂
ponenten px = (~/i) ∂x
und pz = (~/i) ∂z
des Impulsoperators mit H,
[px , H] = [pz , H] = 0 .
(15.50)
Die im letzten Paragrafen gefundenen Erhaltungssätze (15.35) und (15.36) gelten also auch für die Quantenmechanik. Die Lösungen der Schrödingergleichung
(15.49) können wir daher aus gemeinsamen Eigenfunktionen der Operatoren px ,
pz und H aufbauen. Da die Eigenfunktionen der Impulsoperatoren bekanntlich
ebene Wellen sind, können wir für die Eigenlösungen von (15.49) das Produkt
ψ(x, y, z, t) = eiEt/~ eikx x eikz z ψ(y)
(15.51)
ansetzen. Dabei sind ~kx , ~kx und E die respektiven Eigenwerte von px , pz und
H. Für die Amplitude ψ(y) liefert (15.49) die gewöhnliche Differentialgleichung
¸
· 2
~2 d 2
~ω
1
~
2
2
2 2
(k + kz ) −
+
kx y + mω y ψ(y) = Eψ(y) . (15.52)
2m x
2m dy 2
~ωkx y
2
Die Bewegung des Quants in y-Richtung hat wie die des entsprechenden klassischen Teilchens den Charakter einer harmonischen Schwingung der Frequenz
ω um die Ruhelage
y0 = −~kx /mω ,
(15.53)
denn die Nullpunktverschiebung
y 0 = y − y0
(15.54)
lässt aus (15.52) die wohlbekannte Schrödingergleichung des harmonischen Oszillators entstehen
¸
µ
¶
·
~2 kz2
1
~2 d 2
2 02
0
ψ(y 0 ) .
(15.55)
+ mω y ψ(y ) = E −
−
2m dy 0 2
2
2m
Diese Differentialgleichung hat, wie wir wissen, normierbare Lösungen ψ(y 0 ) nur
für diskrete Werte des Parameters E − ~2 kz2 /2m, u. z. gilt
µ
¶
1
E − ~2 kz2 /2m = ~ω n +
mit
n = 0, 1, 2, . . . .
(15.56)
2
Die Energie des Quants im konstanten Magnetfeld
¶
µ
1
2
2 2
,
En (kz ) = ~ kz /2m + ~ω n +
2
(15.57)
hat also neben dem kontinuierlichen Anteil ~2 kz2 /2m einen diskreten Teil. Ersterer entspricht der freien Bewegung des Quants längs des Magnetfeldes, zweiterer
~
der gebundenen harmonischen Bewegung quer zu B.
Der Eigenwert ~kx des Impulses px bestimmt wie (bei der klassischen Bewegung) die Gleichgewichtskoordinate y0 , geht jedoch nicht in die Energie ein.
Folglich ist jeder Energieeigenwert En (kz2 ) unendlichfach entartet.
Die Überlegungen dieses Paragrafen finden wichtige Anwendungen in der
Festkörper- und insbesondere der Metallphysik. Der diskrete Anteil der Energie
(15.57) ist dort unter der Bezeichnung Landauniveaus bekannt; er ist für viele
magnetische Eigenschaften von Metallen bei tiefen Temperaturen verantwortlich. Schmökern Sie mal in den Festkörperbüchern.
284
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
15.5
Eichinvarianz
~ und ϕ im Hamiltonoperator
Das Auftreten der elektromagnetischen Potentiale A
eines geladenen Teilchen muss uns zu ernster Beunruhigung Anlass geben, da die
Potentiale selbst gar nicht messbar sind. Sie können sogar in gewissem Umfang
beliebig verändert werden, ohne dass sich die messbaren Felder
~ = −A
~˙ − ∇ϕ
E
~ = rot A
~
B
(15.58)
~ invariant unter der Eichtransformation der
ändern. Offenbar bleiben E und B
Potentiale
~→A
~0 = A
~ + ∇χ
A
ϕ → ϕ0 = ϕ − χ̇ ,
(15.59)
wobei χ(~x, t) ein beliebiges reelles skalares Feld sein darf. Von solchen Eichtransformationen unberührt bleibt übrigens auch die klassische Bewegungsgleichung
eines geladenen Teilchens,
´
³
¨=q E
~ + ~v × B
~ ,
(15.60)
m~x
~ und B
~ eindeutig festlegt. Die klassida die Lorentzkraft sich durch die Felder E
sche Theorie der elektromagnetischen Wechselwirkung zwischen Ladungen und
Feldern ist also, Sie wussten’s schon längst, eichinvariant.
Ist aber auch die in 15.1 und 15.3 gegebene Quantentheorie für ein geladenes
Teilchen im klassischen elektromagnetischen Feld eichinvariant? Anders gefragt,
sind die in (15.4) berechneten Energiewerte En (kz ) objektive Eigenschaften des
~ und des geladenen Teilchens oder vielmehr nur Ausfluss unserer
Magnetfeldes B
~ und ϕ? Letzterer Verdacht ist nicht leicht
Willkür bei der Wahl der Potentiale A
~ und ϕ nach (15.59) umvon der Hand zu weisen, denn wenn die Potentiale A
geeicht werden, ändert sich das Aussehen des Hamiltonoperators. Überzeugen
~ × ~x, ϕ = 0 und dann
~ = 1B
Sie sich davon, indem Sie einmal die Eichung A
2
~ = (−By, 0, 0), ϕ = 0 verwenden, um ein konstantes Magnetfeld
die Eichung A
~ = (0, 0, B) zu repräsentieren.
B
Um die Abhängigkeit beobachtbarer Größen von der Eichung der Potentiale zu verhüten, müssen wir fordern, dass sich die Wellenfunktion ψ(~x, t) des
Teilchens bei einer Eichtransformation (15.59) so ändert, dass die umgeeichte
Schrödingergleichung
"
#
¶2
µ
1
∂ 0
~
0
0
~
i~ ψ (~x, t) =
∇ − qA
+ qϕ ψ 0 (~x, t) = H 0 ψ 0 (~x, t)
(15.61)
∂t
2m i
äquivalent ist zu der ursprünglichen,
"
#
¶2
µ
1
~
∂
~ + qϕ ψ(~x, t) = Hψ(~x, t) .
∇ − qA
i~ ψ(~x, t) =
∂t
2m i
(15.62)
15.5 Eichinvarianz
285
Diese Forderung ist leicht erfüllt! Mit Hilfe der Produktregel der Differenziation
bestätigen Sie leicht die Identitäten
·
¸
¶
µ
~
~
iqχ/~
iqχ/~
~
~
∇ − q A − q(∇χ) e
=e
∇ − qA
(15.63)
i
i
µ
¶
∂ iqχ/~
∂
iqχ/~
i~ e
i~ − q χ̇
=e
(15.64)
∂t
∂t
und lesen ab, dass
ψ 0 (~x, t) = eiqχ/~ ψ(~x, t)
(15.65)
die Gleichung (15.61) befriedigt, wenn ψ(~x, t) eine Lösung von (15.62) ist.
Nun beachten Sie, dass die Eichtransformation (15.65) mit reellem χ sich
in der Multiplikation der Wellenfunktion ψ mit einem Phasenfaktor erschöpft.
Eichinvariant ist also jedenfalls die Wahrscheinlichkeitsdichte für den Aufenthalt
des Teilchens am Ort ~x zur Zeit t,
|ψ 0 |2 = |ψ|2 .
(15.66)
Eichinvariant sind wegen (15.63) auch die Erwartungswerte von Funktionen des
~
Geschwindigkeitsoperators, (~
p − q A)/m,
insbesondere also der kinetischen Energie, denn für eine beliebige Wellenfunktion ψ(~x, t) gilt
Z
Z
∗
~ 0 )n ψ 0 = d3 x e−iqχ/~ ψ ∗ e+iqχ/~ (~
~ nψ
d3 x ψ 0 (~
p − qA
p − q A)
=
Z
~ nψ
d3 x ψ ∗ (~
p − q A)
mit
n = 1, 2, 3, . . . .
(15.67)
Auch die Eigenwerte des Hamiltonoperators sind, falls es überhaupt solche
gibt, eichinvariant. Bedenken Sie nur, dass zeitunabhängige Eigenfunktionen
und Eigenwerte gemäß
HψE = EψE
(15.68)
nur existieren können, wenn H selbst zeitunabhängig ist, insbesondere müssen
~ und ϕ zeitunabhängig sein. Wird nun eiauch die in H eingehenden Potentiale A
ne beliebige Eichtransformation mit einer auch zeitabhängigen Funktion χ(~x, t)
~ 0 und ϕ0 sowie die Wellenfunktion
durchgeführt, so werden die Potentiale A
0
ψE
(~x, t) = eiEt/~ eiqχ(~x,t)/~ ψE (~x)
0
ψE
(15.69)
0
Eigenfunktion von H nicht im Sinn der
zeitabhängig. Dementsprechend ist
Gleichung (15.68), sondern im Sinn der Schrödingergleichung (15.61). Es gilt
nämlich wegen (15.63) und (15.64)
0
H 0 ψ 0 = (E − χ̇) ψE
∂ 0
0
ψ = (E − χ̇) ψE
.
(15.70)
∂t E
Unabhängig von der Eichung bleiben offensichtlich die möglichen Werte des
Parameters E, d. h. die Energieeigenwerte.
Die Beunruhigung, die ich Ihnen eingangs nahe gelegt habe, ist nun ausgeräumt. Alle physikalischen Aussagen der Quantentheorie für geladene Teilchen sind von der Eichung der elektromagnetischen Potentiale unabhängig.
i~
286
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
15.6
Zeemaneffekt beim Wasserstoffatom (ohne
Spin)
Bei Anwesenheit eines konstanten Magnetfeldes
~ = (0, 0, B)
B
(15.71)
und eines elektrischen Coulombfeldes können wir die elektromagnetischen Potentiale als
~ × ~x,
~ = −1B
A
2
ϕ=
1 e
4πε0 r
(15.72)
wählen. Den Hamiltonoperator für die Relativbewegung im Wasserstoffatom,
H=
2
1
~ 2− 1 e ,
(~
p + eA)
2m
4πε0 r
(15.73)
hatten wir schon in15.1 für die Potentiale (15.72) schon zu
H=
1 e2
e ~ ~
1 2
p~ −
+
L·B
2m
4πε0 r
2m
(15.74)
~ quadratische Teil vernachlässigt wurde. Drücken
vereinfacht, wobei der in B
~
wir hier die Einstellenergie des magnetischen Dipolmoments im Magnetfeld B
durch das Bohrsche Magneton
µB =
~e
2m
(15.75)
aus und bezeichnen den Hamiltonoperator des Wasserstoffatoms im magnetfeldfreien Raum, p~2 /2m − e2 /r4πε0 , mit H0 , so lautet der hier zu untersuchende
Operator
1
H = H 0 + µ B B Lz .
~
(15.76)
Die Eigenfunktionen und Eigenwerte des Hamiltonoperators (15.74) erhalten
wir ohne Mühe aus denen des ungestörten Operators H0 . Da nämlich, wie wir
schon aus 14.5 wissen, die z-Komponente Lz des Bahndrehimpulses mit H0
vertauscht, sind die Eigenfunktionen zu H0 ,
H0 ψnlm = Enl ψnlm ,
(15.77)
auch Eigenfunktionen zu H,
Hψnlm = (Enl + µB Bm)ψnlm ,
m = 0, ±1, ±2, . . . , ±l .
(15.78)
Es haben also die (2l + 1) zu festem n und l gehörigen Eigenfunktionen ψnlm
~ zerstört die Isotropie des
nicht mehr die gleichen Energien. Das Magnetfeld B
Raumes und hebt die energetische Gleichberechtigung aller Einstellungen des
15.6 Zeemaneffekt beim Wasserstoffatom (ohne Spin)
287
Bahndrehimpulses auf. Die Aufhebung der Orientierungsentartung und die zu
~ proportionale Aufspaltung
B
Enl → Enlm = Enl + µB Bm
(15.79)
heißt normaler Zeemaneffekt.
Für die niedrigsten Niveaus des H-Atoms mit den Drehimpulsquantenzahlen
l = 0 und l = 1 lässt das Resultat (15.79) die in Abbildung 15.2 gezeigten
Aufspaltungen erwarten:
Abbildung 15.2
Insbesondere sollte das Grundzustandsniveau, da nach unserer bisherigen Erkenntnis nicht entartet, vom Magnetfeld unbeeinflusst bleiben und nicht aufspalten.
Tatsächlich wird beim Wasserstoffatom ein komplizierteres Verhalten der
Energieniveaus beobachtet (anomaler Zeemaneffekt). Schon das Grundzustandsniveau spaltet im Magnetfeld zwei Niveaus auf. Die Erklärung dieses Phänomens
besprechen wir im folgenden Kapitel.
288
15 Der Einfluss elektromagnetischer Felder auf die Quantenmechanik
geladener Teilchen
Kapitel 16
Spin
16.1
Der Spin des Elektrons
Gelegentlich habe ich schon angedeutet, dass der Zustand eines Elektrons nicht
vollständig charakterisiert ist durch Angabe der Wahrscheinlichkeitsamplitude
für den Aufenthalt beim Ort ~x. Wie viele andere Teilchen (Proton, Neutron,
Muon, die Neutrinos etc.) hat das Elektron einen zusätzlichen Freiheitsgrad,
den so genannten Spin. In diesem Freiheitsgrad offenbart sich ein wichtiger Unterschied des Quants Elektron von der klassischen Fiktion eines punktförmigen
Teilchens. Die Bezeichnung Spin bringt zum Ausdruck, dass der fragliche Freiheitsgrad Drehimpulseigenschaften hat (denken Sie ans Spinnrad oder an to
spin, was so viel heißt wie sich drehen).
Der Drehimpulscharakter des Elektronenspins zeigt sich besonders sinnfällig
beim anomalen Zeemaneffekt. Ein Magnetfeld sollte die (2j + 1)-fache Entartung eines Energieniveaus mit Drehimpulsquantenzahl j aufheben. Für das
Grundzustandsniveau des Wasserstoffs ergibt sich eine zweifache Aufspaltung.
Identifizieren wir
2 = 2j + 1 ,
(16.1)
so folgt, dass die Drehimpulsquantenzahl j = 1/2 vorliegt. Jedoch kann der
fragliche Drehimpuls nichts mit der Bahnbewegung des Elektrons zu tun haben, denn die Bahndrehimpulsquantenzahl l kann bekanntlich nur ganzzahlige
Werte annehmen und außerdem ist die Grundzustandswellenfunktion ψ100 (r)
zweifelsohne kugelsymmetrisch, d. h. hat die Bahndrehimpulsquantenzahl l = 0.
Ein zweites berühmtes Experiment, in dem sich das Elektron als mit einem
Spin ausgestattet erweist, ist der Stern-Gerlach-Versuch. Entsprechend dem
skizzierten Schema wird in derartigen Versuchen ein Strahl von Atomen durch
ein quer zum Strahl laufendes räumlich inhomogenes Magnetfeld geschickt und
anschließend auf einem Schirm registriert (Abbildung 16.1). Für Atome mit
der Drehimpulsquantenzahl j erwarten wir dabei folgendes Verhalten. Relativ
~ x) hat der Drehimpuls (2j +1) energetisch verschiedene Einzum Magnetfeld B(~
stellmöglichkeiten; diese sollten, wenn viele Atome im Strahl laufen, alle gleich
häufig vorkommen, sofern nur die Quelle des Strahls keine Orientierung bevorzugt. Das mit dem Drehimpuls verbundene magnetische Moment m
~ hat dann
ebenfalls (2j + 1) verschiedene Komponenten in Feldrichtung. Nach 5.9 erfah289
290
16 Spin
Abbildung 16.1
~ x) im inhomogenen Magnetfeld
ren Atome mit verschiedenen Werten von m
~ · B(~
verschiedene Kräfte,
³
´
~ x) .
F~ = grad m
~ · B(~
(16.2)
Es sollte also der Atomstrahl in (2j + 1) verschiedene untereinander gleich intensive Teilstrahlen aufspalten. Für wasserstoffähnliche Atome, bei denen ein
Leuchtelektron eine räumliche kugelsymmetrische Wellenfunktion ohne Bahndrehimpuls besitzt (z. B. Li), wird eine Aufspaltung in zwei Teilstrahlen beobachtet. Wieder wird mit 2j + 1 = 2 auf die Drehimpulsquantenzahl j = 1/2
geschlossen.
Um den Zustand eines Elektrons vollständig zu spezifizieren, müssen wir
die beiden Einstellmöglichkeiten des Spins bezüglich einer beliebig wählbaren
Richtung (etwa der z-Richtung) berücksichtigen und zwei Wahrscheinlichkeitsamplituden ψ± (~x, t) angeben. Die Funktionen ψ+ (~x, t) und ψ− (~x, t) sind die
Amplituden dafür, das Elektron zur Zeit t beim Ort ~x mit der Spinkomponente
+~/2 bzw. −~/2 längs der Bezugsrichtung zu finden.
Es ist zweckmäßig, den Zustand des Elektrons durch den zweikomponentigen
Zustandsvektor
Ã !
!
Ã !
Ã
0
1
ψ+ (~x, t)
(16.3)
+ ψ− (~x, t)
= ψ+ (~x, t)
ψ(~x, t) =
1
0
ψ− (~x, t)
zu beschreiben. Die beiden hier auftretenden zweikomponentigen Einheitsvektoren und
Ã !
Ã !
1
0
χ+ =
und
χ− =
(16.4)
0
1
geben, für sich allein, keine Auskunft über den Ort des Elektrons, wohl aber
erschöpfende Auskunft über die Spinkomponente längs der Bezugsrichtung: sie
beträgt +~/2 für χ+ und −~/2 für χ− .
Wie jedem Drehimpuls ist dem Spin ein Operatortripel zugeordnet, das wir
mit
~ = (Sx , Sy , Sz )
S
(16.5)
16.1 Der Spin des Elektrons
291
bezeichnen. Die Komponenten Si müssen die Drehimpulsvertauschungsrelationen
[Sx , Sy ] = i~Sz ,
[Sy , Sz ] = i~Sx ,
[Sz , Sx ] = i~Sy
(16.6)
und
~ 2 , Si ] = 0
[S
(16.7)
~ 2 liegt beim Elektron fest als
befriedigen. Der Eigenwert des Spinquadrats S
2
2
~ j(j + 1) = 3~ /4. Es müssen also die Vektoren (16.4) beide Eigenvektoren zu
~ 2 sein,
S
~ 2 χ ± = 3 ~2 χ ± .
(16.8)
S
4
Wenn wir ohne Verlust an Allgemeinheit die Bezugsrichtung, längs derer die
Vektoren (16.4) die Spinkomponente festlegen, als die z-Richtung wählen, so
müssen diese Vektoren die 2j + 1 = 2 Eigenvektoren von Sz sein,
Ã !
Ã !
Ã !
Ã !
0
1
~ 0
~ 1
und
Sz
.
(16.9)
Sz
=−
=+
2 0
2 1
1
0
~ 2 und Sz , die den VertauschungsSie erinnern sich doch, dass Operatoren S
relationen (16.6) und (16.7) genügen, Eigenwerte ~2 j(j + 1) bzw. ~m mit
m = −j, −j + 1, . . . haben, wobei j ganz- oder halbzahlig sein darf. Wir hatten in 14.6 aus der Zusatzforderung, dass die Bahndrehimpulseigenfunktionen
die Winkelabhängigkeit der räumlichen Wellenfunktion geben muss, geschlossen, dass beim Bahndrehimpuls nur ganzzahlige Werte der Quantenzahlen j
und m möglich sind. Im Spin des Elektrons haben wir nun einen Drehimpuls
kennengelernt, dessen Eigenwerte durch j = 12 und m = ± 21 festgelegt sind.
Wir können aus 14.5 alle Überlegungen übernehmen, die auf den Drehimpulsvertauschungsrelationen aufbauen. Insbesondere wissen wir schon, dass wir
die beiden Operatoren
S± = Sx ± iSy
(16.10)
benutzen können, um aus einem Eigenvektor von Sz alle anderen, d. h. hier den
zweiten zu konstruieren. Wegen
[Sz , S± ] = ±~S±
(16.11)
muss z. B. S+ χ− ein Eigenvektor von Sz mit Eigenwert (− 21 + 1)~ = + 21 ~ sein
(vgl. (14.52)), der dann bis auf einen Normierungsfaktor mit χ+ übereinstimmen
muss,
Ã !
Ã !
1
1
S+
.
(16.12)
= const
0
0
Den Normierungsfaktor hatten wir in (14.70) für beliebige Werte von j und m
schon festgelegt. Mit j = 1/2, m = −1/2 ergibt sich const = ~, also
Ã !
Ã !
1
1
.
(16.13)
=~
S+
0
0
292
16 Spin
Ebenso ist schon erwiesen, dass der Operator S− den Eigenvektor von Sz zum
Eigenwert +~/2 überführt in einen Eigenvektor von Sz zum Eigenwert −~/2.
Die frühere Normierungsbedingung und Phasenkonvention legen fest
Ã !
Ã !
0
0
S−
(16.14)
=~
1
1
Insofern die Spinoperatoren auf zweikomponentige Vektoren wirken, müssen
sie sich durch 2 × 2-Matrizen darstellen lassen. Tatsächlich folgt aus (16.9)
Ã
!
0
~ 1
Sz =
,
(16.15)
2 0 −1
aus (16.13)
S+ = ~
Ã
0
1
0
0
S− = ~
Ã
0
0
1
0
!
(16.16)
und aus (16.14)
!
.
Für Sx und Sy erhalten wir schließlich aus (16.10) die Matrizen
Ã
!
Ã
!
~ 0 −i
~ 0 1
und
Sy =
.
Sx =
2 1 0
2 i
0
(16.17)
(16.18)
Dass alles schön zusammenpasst, sehen wir, wenn wir aus (16.15) und (16.18)
~ 2 = S 2 + S 2 + S 2 erstellen;
die Matrix für S
x
y
z
(Ã
Ã
! Ã
!
! Ã
!)
1
0
1
0
1
0
1
0
1
3
~ 2 = ~2
+
.
(16.19)
S
+
= ~2
4
4
0 1
0 1
0 1
0 1
~ 2 auf die Spinvektoren (16.4) wie das (3~2 /4)-fache
Wie es sein muss, wirkt S
der Einheitsmatrix.
16.2
Das magnetische Moment von Teilchen mit
Spin
Wir hatten uns klar gemacht, dass Teilchen mit der Ladung q, der Masse m und
~ ein magnetisches Moment
dem Bahndrehimpuls L
m
~ Bahn =
q ~
L
2m
(16.20)
tragen. Den Betrachtungen des letzten Paragrafen lag andererseits die Auffassung zugrunde, dass der Spin ähnlich wie der Bahndrehimpuls zum magnetischen Moment beitragen muss. Tatsächlich besteht der experimentelle Befund
16.3 Der anomale Zeemaneffekt beim H-Atom
1
2
(also Elektron, Muon, Proton,
q ~
S,
2m
(16.21)
für alle bekannten geladenen Teilchen mit Spin
. . .)
m
~ Spin = g
293
wobei der numerische Faktor g von Teilchen zu Teilchen verschieden ist. Für
das Elektron hat g einen nahe bei 2 liegenden Wert, der in der Quantenelektrodynamik berechnet werden kann als Potenzreihe in der Sommerfeldschen
Feinstrukturkonstanten
α=
1 e2
1
≈
.
4πε0 ~c
137
(16.22)
Die Berechnung des Gliedes erster Ordnung in
1
gel = 2 + α + O(α2 ) = 2, 00232
2
(16.23)
durch J. Schwinger (1949) war einer der ersten Triumphe der modernen Quantenelektrodynamik.
Beim Proton gilt empirisch gproton ≈ 5, 59. Beachten Sie, dass das magnetische Moment des Protons sehr viel kleiner ist als das des Elektrons, da die
Protonenmasse die Elektronenmasse um einen Faktor der Größenordnung 2000
überwiegt. Demgemäß kann sich im Stern-Gerlach-Versuch mit Wasserstoffatomen der Protonenspin gegenüber dem Elektronenspin kaum bemerkbar machen.
Im Auftreten des Faktors g im Spinbeitrag zum magnetischen Moment zeigt
sich, wie oben schon in der Halbzahligkeit der Spinquantenzahlen des Elektrons,
die nichtklassische Natur des Spins. Eine wichtige Konsequenz ist, dass der
Gesamtdrehimpuls
~ +S
~
J~ = L
(16.24)
nicht notwendig parallel zum gesamten magnetischen Moment
m
~ =
q ~
~
(L + g S)
2m
(16.25)
des Teilchens ist.
16.3
Der anomale Zeemaneffekt beim H-Atom
Diskutieren wir nun das Verhalten des H-Atoms im konstanten Magnetfeld unter
Berücksichtigung des Elektronenspins. Der in Rechnung zu stellende Hamiltonoperator (e = Elementarladung)
H=
2
1
~ 2 − 1 e + ge B
~ ·S
~
(~
p + eA)
2m
4πε0 r
2m
(16.26)
unterscheidet sich nur um die Einstellenergie des magnetischen Moments des
~
Elektronenspins im Feld B,
~ ·S
~ = gµB 1 B
~ ·S
~
~ = ge B
m
~ spin · B
2m
~
(16.27)
294
16 Spin
von dem in 15.6 behandelten∗) . Wählen wir wieder
~ = (0, 0, B)
B
~ = 1B
~ × ~x ,
A
2
(16.28)
~ quadratischen Teil des Hamiltonoperators
und vernachlässigen den in B
H=
1 e2
1
1 2
p~ −
+ µB B (Lz + gSz ) .
2m
4πε0 r
~
(16.29)
Das Aufsuchen der Eigenfunktionen und Eigenwerte dieses Hamiltonoperators bereitet keinerlei Schwierigkeit, wenn wir nur beachten, dass die Spinoperatoren Si , da auf einen inneren Freiheitsgrad des Elektrons wirkend, mit allen
auf die Ortskoordinaten wirkenden Operatoren wie pi , Li und xi kommutieren.
Insbesondere gilt
~ 2 ] = [Sz , H] = 0 ,
[Sz , Lz ] = [Sz , L
(16.30)
~ 2 und H gemeinsame Eigenfunktionen haben.
so dass die Operatoren Sz , Lz , L
~ 2 und zum spinunabhängigen
Nun sind uns sowohl die Eigenfunktionen zu Lz , L
Teil von H bekannt als
Rnl (r) Ylm (θ, ϕ) ,
wie auch die Eigenvektoren von Sz ,
Ã !
1
und
χ+ =
0
χ− =
(16.31)
Ã !
0
1
,
(16.32)
so dass wir die Eigenlösungen Ψ von
HΨ = EΨ
(16.33)
durch bloßes Zusammensetzen finden,
Ψnlm,± = Rnl (r) Ylm (θ, ϕ) χ± .
Die zugehörigen Eigenwerte der Energie lauten
³
g´
Enlm,± = Enl + µB B m ±
,
2
(16.34)
(16.35)
wobei wie üblich n = 1, 2, 3, . . ., l = 0, 1, . . . , n − 1 und m = 0, ±1, . . . , ±l .
Abbildung 16.2 zeigt die entsprechende Niveauaufspaltung für die niedrigsten Niveaus des H-Atoms:
Sie lesen ab, dass nun die Aufspaltung der Grundzustandsenergie in zwei Niveaus richtig wiedergegeben ist. Die p-Niveaus spalten streng genommen in
6 Unterniveaus auf, jedoch bleibt wegen g ≈ 2 ein Niveau praktisch doppelt
entartet.
∗) Nachdem die reduzierte Masse m nun im Bohrschen Magneton absorbiert ist, kann im
Folgenden der Buchstabe m wieder zur Bezeichnung der Orientierungsquantenzahl des Bahndrehimpulses verwendet werden.
16.3 Der anomale Zeemaneffekt beim H-Atom
Abbildung 16.2
295
296
16 Spin
Kapitel 17
Grundbegriffe der Statistik
17.1
Wahrscheinlichkeit von Ereignissen
Die statistische Behandlung eines Systems (Würfel, Lotto, mit Gas gefüllter
Behälter, . . .) erfordert zur mathematischen Grundlegung wie zur experimentellen Verifizierung eine vielfache Reproduktion des Systems bei gleichbleibender Präparationsvorschrift. Statistische Aussagen besagen i. A. nichts über das
Verhalten eines einzelnen Systems, sondern beziehen sich auf Gesamtheiten (Ensembles) vieler gleichartig präparierter Systeme.
In einer Gesamtheit von N Systemen hat ein Ereignis i die relative Häufigkeit
Ni /N , wenn es bei genau Ni der N Systeme auftritt. Im Grenzfall einer großen
Gesamtheit nennen wir diese relative Häufigkeit auch die Wahrscheinlichkeit wi
des Ereignisses i,
Ni
.
N →∞ N
wi = lim
(17.1)
Sie verdeutlichen sich die Natur von Wahrscheinlichkeitsaussagen leicht am
Beispiel eines ungezinkten Würfels. Der Ausgang eines einzelnen Wurfes lässt
sich nicht vorhersagen. Unter einer großen Anzahl von Würfen erwarten Sie
jedoch die Fünf auf der oberen Fläche mit der relativen Häufigkeit 1/6. Sie
finden diese Erwartung im Spiel mit um so größerer Genauigkeit erfüllt, je öfter
Sie insgesamt würfeln.
Seien i und j zwei sich gegenseitig ausschließende Ereignisse, die im Ensemble
mit den Wahrscheinlichkeiten wi bzw. wj auftreten. Dann hat die Wahrscheinlichkeit, an einem System entweder das Ereignis i oder das Ereignis j zu finden,
den Wert
wi∪j = wi + wj .
(entweder-oder-Regel)
(17.2)
Zum Beispiel finden Sie beim Würfeln entweder die Eins oder die Fünf mit der
Wahrscheinlichkeit w = 1/6 + 1/6 = 1/3.
Wenn i und j zwei verschiedene Eigenschaften eines Systems sind, die unabhängig voneinander auftreten können und einzeln mit den Wahrscheinlichkeiten wi bzw. wj realisiert sind, so stellen sie sich zusammen mit der Wahrscheinlichkeit
wi∩j = wi · wj
(sowohl-als-auch-Regel)
297
(17.3)
298
17 Grundbegriffe der Statistik
ein. Würfeln Sie etwa mit einem roten und einem blauen Würfel zugleich, so
ergibt sich für das Ereignispaar rote Fünf und blaue Drei die Wahrscheinlichkeit
w = 1/36 und für das Ereignispaar fünf und drei w = 1/18.
17.2
Diskrete eindimensionale Zufallsbewegung
Auf einem linearen Gitter äquidistanter Punkte hüpfe ein Teilchen mit den
Wahrscheinlichkeiten p und (1 − p) zum rechten bzw. zum linken Nachbarplatz.
Aufeinander folgende Sprünge seien voneinander unabhängig. Berechnen wir die
Wahrscheinlichkeit dafür, dass das Teilchen von insgesamt N Sprüngen genau n
nach rechts, also N − n nach links macht. Mit der gleichen Wahrscheinlichkeit
finden Sie (i) beim N -maligen Wurf einer Münze n mal Wappen, (ii) unter N
Spin- 21 Systemen n Spins in die positive z-Richtung ( nach oben“) und N − n
”
in die entgegengesetzte Richtung ( nach unten“) orientiert, (iii) n von N freien
”
Atomen in der linken Hälfte des ihnen zugänglichen Gesamtvolumens, etc.
Schauen wir auf das Beispiel der Spins. Nach der sowohl-als-auch Regel
(17.3) zeigen n ganz bestimmte Spins nach oben und alle anderen nach unten
mit der Wahrscheinlichkeit pn (1 − p)N −n . Irgendeiner (statt ein bestimmter)
der insgesamt möglichen N !/n!(N − n)! Sätze von n aus N Spins ist gemäß
(17.2) nach oben orientiert mit der Wahrscheinlichkeit (entweder-oder)
µ ¶
N!
n
N −n N
n
N −n
= p (1 − p)
WN (n) = p (1 − p)
.
(17.4)
n!(N − n)!
n
Diese so genannte Binomialverteilung ist in Abbildung 17.1 für den Fall p = 1/2,
N = 20 aufgemalt.
0.1
0
10
20
Abbildung 17.1
Der binomische Lehrsatz,
N
X
n N −n
p q
n=0
µ ¶
N
= (p + q)N ,
n
(17.5)
lässt Sie sofort erkennen, dass die Verteilung (17.4) richtig normiert ist,
N
X
n=0
WN (n) = 1 .
(17.6)
17.3 Die Binomialverteilung für große N
299
Er hilft auch bei der Berechnung der so genannten Momente, d. h. der Mittelwerte von ganzzahligen Potenzen der Zufallsvariablen n,
"
"
µ ¶#
µ ¶#
X
X µ ∂ ¶ν
N
N
pn q N −n
hnν i =
nν pn q N −n
=
p
∂p
n
n
n
n
q=1−p
q=1−p
¶ν
¸
·µ
∂
.
=
p
(p + q)N
∂p
q=1−p
(17.7)
Wir folgern für die ersten beiden Momente
hni = N p,
hn2 i = N 2 p2 + N p(1 − p)
(17.8)
und somit für die mittlere quadratische Schwankung
h(∆n)2 i ≡ hn2 i − hni2 = N p(1 − p) .
(17.9)
Bemerkenswerterweise wächst h(∆n)2 i nur linear mit N , während sowohl
hn i wie hni2 in N quadratisch sind. Die relative Streuung von n,
r
1−p
1 p
1
2
Str(n) ≡
,
(17.10)
h(∆n) i =
hni
hni
Np
√
geht daher für N → ∞ nach Null wie 1/ N . Offenbar konzentriert sich die
Binomialverteilung WN (n) umso schärfer um den Mittelwert hni , je größer N
ist. Für’s Münzenwerfen ziehen Sie die Folgerung, dass (i) Zahl und Wappen im
Mittel über viele Serien von je N Würfen gleich oft erscheinen und (ii) relativ
große Differenzen der Zahlen der beiden Ereignisse umso seltener auftreten, je
größer N ist.
Zurück zum hüpfenden Teilchen! Nach N Schritten der Schrittlänge (Gitterkonstante) a hat es sich zum Ausgangspunkt um die Strecke x = na − (N − n)a
entfernt, im Mittel über viele Beobachtungen also um
2
hxi = (2hni − N )a = N a(2p − 1) .
(17.11)
Bei gleicher Wahrscheinlichkeit für beide Hüpfrichtungen, also für p = 21 ,
kommt das Teilchen im Mittel nicht vom Fleck. Seine Lokalisierbarkeit nimmt
mit wachsendem N jedoch ab, da die Streuung seiner Entfernung vom Ausgangspunkt,
√
£
®¤1/2
(17.12)
Str(x) = (x − hxi)2
=a N
mit N anwächst.
17.3
Die Binomialverteilung für große N
Wir hatten schon gesehen, dass die Binomialverteilung (17.4) bei großen Werten
von N nur für solche Werte der Zufallsvariablen n deutlich von Null verschieden
sein kann, die relativ nahe beim Mittelwert hni = N p liegen. Es lohnt sich, diese
Erkenntnis zu vertiefen und den Verlauf von WN (n) für n nahe beim Maximum
im Grenzfall N → ∞ genauer zu studieren.
300
17 Grundbegriffe der Statistik
Für die zur Debatte stehenden Werte von n und N können alle in (17.4)
auftretenden Fakultäten mit der Stirlingschen Formel
√
ν! ≈ 2πνν ν e−ν
(17.13)
approximiert werden. Daraufhin nimmt die Binomialverteilung die Form
WN (n) =
·
N
2πn(N − n)
¸1/2
NN
³ p ´n µ 1 − p ¶N −n
n
N −n
(17.14)
an. Zur weiteren Vereinfachung für n ≈ hni = N p beachten wir, dass die rechte
Seite von (17.14) auch für nichtganzzahlige Werte von n definiert ist. Sie hat,
als Funktion der reellen Variablen n, ein Maximum an der Stelle
n̂ = pN = hni .
(17.15)
Der Wert des Maximums lässt sich durch die in (17.9) gegebene mittlere quadratische Schwankung von n ausdrücken,
Ŵ = [2πp(1 − p)N ]
−1/2
£
¤−1/2
= 2πh(∆n)2 i
.
(17.16)
Wir wissen bereits, dass das Maximum der Verteilung von n scharf ausgeprägt ist, d. h. dass WN (n) schon bei relativ kleiner Entfernung der Variablen
n von n̂ stark abgefallen ist. Daher können wir eine sinnvolle Vereinfachung
von (17.14) nicht etwa durch eine nach wenigen Gliedern abgebrochene Taylorreihe der rechten Seite um die Stelle n = n̂ erhalten. Beachten wir aber, dass
ln WN (n) sehr viel weniger empfindlich von n abhängt als WN (n) selbst. Die
Taylorreihe
·
¸
1 d2 ln WN (n)
(n − n̂)2 + · · ·
ln WN = ln Ŵ +
2
dn2
n=n̂
= ln Ŵ −
1
(n − hni)2 + · · ·
2h(∆n)2 i
(17.17)
gibt also eine nicht offensichtlich unsinnige Näherung ab. Tatsächlich lässt sich
leicht zeigen, dass der Abbruch der Reihe nach dem Glied zweiter Ordnung im
Bereich [N p(1 − p)]1/2 ¿ n − hni ¿ N p(1 − p), also jedenfalls nahe bei n = hni,
eine sehr gute Approximation liefert, wenn N p(1 − p) À 1. Die entsprechende
Wahrscheinlichkeitsverteilung,
£
¤−1/2
£
¤
WN (n) = 2πh(∆n)2 i
exp −(n − hni)2 /2h(∆n)2 i ,
(17.18)
eine Gaußfunktion der Zufallsvariablen n, ist in Abbildung 17.2 für kontinuierlich variables n zusammen mit der Binomialverteilung (17.4) für den Fall
N = 50, p = 1/2 aufgemalt.
17.4
Eindimensionale Diffusion
Wenn eine Zufallsvariable x ein Kontinuum von Werten annehmen kann, etwa
−∞ < x < +∞, so ist es nicht mehr sinnvoll, nach der Wahrscheinlichkeit
dafür zu fragen, dass x genau einen bestimmten Wert annimmt. Sie wissen von
17.4 Eindimensionale Diffusion
301
0.1
0
25
50
Abbildung 17.2
unserer Behandlung der Quantentheorie (s. 11.3), dass bei kontinuierlichen Zufallsprozessen die Wahrscheinlichkeit W (x)∆x für das Auffinden der Variablen
im Intervall ∆x beim Wert x benutzt werden muss. Die Funktion W (x) heißt
Wahrscheinlichkeitsdichte. Die Normierung
+∞
Z
dx W (x) = 1
(17.19)
−∞
bedeutet dann, dass die Variable mit Sicherheit irgendeinen Wert im Intervall
−∞ < x < +∞ annimmt. Mittelwerte berechnen sich nach der Vorschrift
+∞
Z
dx xν W (x) .
hx i =
ν
(17.20)
−∞
Kontinuierliche Zufallsvariable treten oft auf als Idealisierung diskreter Variabler. Wenn wir zum Beispiel das hüpfende Teilchen aus 17.2 und 17.3 auf
einem Längenmaßstab betrachten, der sehr viel größer ist als die Gitterkonstante
a, so lässt sich die Teilchenkoordinate
x = na − (N − n)a
(17.21)
als kontinuierlich ansehen. Wenn wir darüber hinaus annehmen, dass die Sprünge des Teilchens im zeitlichen Abstand τ erfolgen und der Zeitmaßstab der
Beobachtung sehr viel größer als τ ist, so können wir auch die Zeit
t = Nτ
(17.22)
als kontinuierlich betrachten. Aus der diskreten Gaußverteilung (17.18) erhalten
wir eine Wahrscheinlichkeitsdichte für die kontinuierliche Variable x, indem wir
das Inkrement ∆n = 1 mit Hilfe von (17.21) in ein Inkrement ∆x überführen
und im Übrigen die diskreten Größen n und N durch x und t ersetzen,
µ
¶
x
t ∆x
WN (n) = WN (n)∆n = WN
+
≡ W (x, t)∆x .
(17.23)
2a 2τ 2a
302
17 Grundbegriffe der Statistik
Die gesuchte Wahrscheinlichkeitsdichte ist wie ihr diskretes Analogon eine Gaußfunktion. Sie lautet im Fall p = 1/2
¶
µ
1
x2
,
(17.24)
W (x, t) = √
exp −
2Dt
2πDt
wobei die so genannte Diffusionskonstante
D = a2 /τ
(17.25)
eingeführt wurde.
Die Gaußverteilung (17.24) ist für alle Zeiten t > 0 auf Eins normiert,
+∞
µ
¶
Z
x2
1
exp −
=1.
dx √
2Dt
2πDt
(17.26)
−∞
Da diese Normierung auch für t → 0 erhalten bleibt, während
(
0
für x 6= 0 ,
W (x, t) −−−→
t→0
∞ für x = 0
(17.27)
schließen wir, dass (17.24) anfänglich eine Deltafunktion darstellt,
W (x, 0) = δ(x) .
(17.28)
Diese Anfangsverteilung impliziert die Kontinuumsversion der Anfangsbedingung, dass das Teilchen zur Zeit t = 0 bei x = 0 scharf lokalisiert ist. Zu
späteren Zeiten wird die Lokalisierung immer diffuser, da die Breite der Verteilung (17.24) mit t wächst,
h(∆x)2 i = Dt .
(17.29)
Für t → ∞ schließlich strebt W (x, t) überall nach Null. Dabei bleibt allerdings
gemäß (17.26) die Normierung gewahrt, denn das Teilchen kann sich zwar beliebig weit vom Ausgangspunkt entfernen, nicht aber zur Gänze verloren gehen.
Durch Differenzieren überzeugen Sie sich leicht davon, dass die Verteilung
(17.24) eine Lösung der Diffusionsgleichung
1 ∂2
∂
W (x, t) = D 2 W (x, t)
∂t
2 ∂x
(17.30)
darstellt. Beachten Sie auch, dass diese Diffusionsgleichung der Schrödingergleichung eines freien Teilchens in einer Raumdimension sehr ähnlich sieht. Formal
kann (17.30) in die Schrödingergleichung überführt werden durch die Transformation t → it/~, D → ~2 /m.
Die Differentialgleichung (17.30) tritt in vielen verschiedenen Zusammenhängen auf. In der Theorie der Wärmeleitung wird sie benutzt zur Beschreibung
der Orts- und Zeitabhängigkeit der Temperatur beim Wärmetransport. Eine
Lösung der Form (17.24) beschreibt das allmähliche Zerfließen einer anfänglichen
lokalen Erhitzung in einem wärmeleitenden Körper. Der Konzentrationsausgleich in einem anfänglich inhomogenen Gemisch ineinander lösbarer Flüssigkeiten
folgt, wenn keine Strömungen auftreten, der drei-dimensionalen Verallgemeinerung (∂ 2 /∂x2 → ∇2 ) von (17.30). Die Brownsche Bewegung und die Wanderung
von Fremdatomen Fehlstellen in Kristallen sind andere Anwendungsbeispiele.
17.5 Der Zentrale Grenzwertsatz
17.5
303
Der Zentrale Grenzwertsatz
Eine Zufallsgröße x, die sich additiv aus N unabhängigen, gleichartigen Zufallsgrößen zusammensetzt, ist im Grenzfall√N → ∞ Gaußsch verteilt. Die relative
Streuung von x ist von der Ordnung 1/ N .
Der soeben formulierte zentrale Grenzwertsatz ist für das Verständnis von
Vielteilchensystemen von außerordentlicher Bedeutung. Makroskopische“ Ge”
genstände aus dem Alltagsbereich enthalten etwa 1023 (ein Liter Gas) bis 1026
(1 kg feste Materie) Moleküle. Derartige Körper können wir uns in viele (sagen wir 1014 ) winzige Stücke zerteilt denken, deren jedes immer noch viele (im gewählten Beispiel 109 bis 1012 ) Teilchen enthält. Wenn im betrachteten Körper bezüglich makroskopischer Messungen räumliche und zeitliche
Homogenität herrscht, sind die Stücke normalerweise in guter Näherung unabhängig voneinander. Die Unabhängigkeit rührt daher, dass die Wechselwirkung von Molekülen (die typische Reichweite beträgt einige Å) aus benachbarten
Stücken nur in engster Nachbarschaft der gemeinsamen Oberfläche stattfindet,
während die typische Lineardimension der Stücke im gewählten Beispiel 104 Å
beträgt. Viele physikalische Größen (wie die Gesamtenergie die Magnetisierung,
die elektrische Polarisation) können dann aufgefasst werden als Summen der
unabhängigen Beiträge der Teilstücke des betrachteten Körpers. Der zentrale
Grenzwertsatz besagt, dass die relativen statistischen Schwankungen
derartiger
p
additiver Variabler winzig (im gewählten Beispiel Str(x)/ hx2 i ≈ 10−7 ) und
Gaußsch verteilt sind. Dabei wird keine Annahme gemacht über die statistischen
Eigenschaften des Beitrags eines der Teilstücke des Körpers zu x; insbesondere
können diese Beiträge relativ große Schwankungen aufweisen. Selbst wenn die
Energie eines Teilstücks nur mit großer relativer Unschärfe bekannt ist, hat die
Gesamtenergie des Körpers nur eine winzige Unschärfe. Der zentrale Grenzwertsatz lässt uns also verstehen, warum jeder additiven physikalischen Größe für
einen makroskopischen Körper (z. B. Nährwert eines Pakets Haferflocken) normalerweise ein Zahlenwert statt einer Wahrscheinlichkeitsverteilung zugeordnet
werden kann.
Die wesentliche Voraussetzung für die Anwendbarkeit des zentralen Grenzwertsatzes ist die Unabhängigkeit der N Einzelbeiträge zu x. Sie ist bei zeitlich
stationären und räumlich homogenen makroskopischen Systemen zwar nicht immer, aber normalerweise erfüllt. Eine wichtige Ausnahme betrifft Körper in so
genannten kritischen Zuständen bei Phasenübergängen wie dem Übergang vom
flüssigen zum gasförmigen Zustand. Für einen derartigen Körper können additive Observable riesige Fluktuationen zeigen, d. h. mit ihren Mittelwerten vergleichbare Streuungen haben. Solche kritischen Fluktuationen sind auch nicht
durch Gaußsche Wahrscheinlichkeitsverteilungen charakterisierbar. Sie gehen
Hand in Hand damit, dass fiktive Teilstücke über die ganze Lineardimension
des Systems hinweg korreliert, d. h. nicht unabhängig voneinander sind.
Die folgende, lehrreiche Rechnung beweist den zentralen Grenzwertsatz. Bezeichnen wir die Einzelbeiträge zu x mit xi und betrachten der Einfachheit
halber die xi als kontinuierliche Variable im Intervall −∞ < xi < +∞. Wegen der angenommenen Gleichartigkeit haben alle xi für sich allein die gleiche
Wahrscheinlichkeitsdichte w(xi ). Die Wahrscheinlichkeitsdichte für das Auffinden des ersten Beitrags bei xi , des zweiten bei x2 , etc. ist nach der sowohlals-auch-Regel (17.3) durch das Produkt w(x1 )w(x2 ) · · · w(xN ) gegeben. Die
entweder-oder-Regel (17.2) gibt dann die Wahrscheinlichkeit für das Auffinden
304
17 Grundbegriffe der Statistik
der Summe aller N Beiträge zwischen x und x + ∆x als das Integral
Z
Z
Z
dx1 dx2 · · · dxN w(x1 )w(x2 ) · · · w(xN ) .
{z
}
|
P
x≤
(17.31)
xi ≤x+∆x
i
Nach Wechsel der Integrationsvariablen ξ1 = x1 +x2 +· · ·+xN , ξ2 = x2 , ξ3 = x3
etc. schreiben wir dieses Integral in der Form
x+∆x
Z
x
+∞
+∞
Z
Z
dξ1
dξ2 · · ·
dξN w(ξ1 − ξ2 · · · − ξN )w(ξ2 ) · · · w(ξN ) .
−∞
(17.32)
−∞
Für hinreichend kleines ∆x ist die in Rede stehende Wahrscheinlichkeit proportional zu ∆x und definiert durch
+∞
+∞
Z
Z
∆x
dξ2 · · ·
dξN w(x − ξ2 · · · − ξN )w(ξ2 ) . . . w(ξN ) ≡ W (x)∆x
−∞
(17.33)
−∞
die Wahrscheinlichkeitsdichte W (x) für die additive Zufallsvariable x.
Um zu zeigen, dass W (x) für N → ∞ in eine Gaußverteilung übergeht,
schreiben wir die Definition (17.33) in der symmetrischeren und leichter ausschlachtbaren Form
+∞
+∞
+∞
Z
Z
Z
W (x) =
dξ1
dξ2 · · ·
dξN δ(x − ξ1 − ξ2 · · · − ξN )w(ξ1 )w(ξ2 ) · · · w(ξN )
−∞
−∞
−∞
(17.34)
und verwenden hierin die Fourierdarstellung (2.111) der Deltafunktion,
δ(x −
X
+∞
Z
ξi ) =
i
P
dk ik(x− i
e
2π
ξi )
.
(17.35)
−∞
Damit erhalten wir
W (x) =
+∞
Z
dk ikx
e Q(k)N .
2π
(17.36)
−∞
wobei Q(k) die Fouriertransformierte der Einzelwahrscheinlichkeit w(ξ) ist
Q(k) =
+∞
Z
dξ e−ikξ w(ξ).
(17.37)
−∞
Offenbar hat die Funktion Q(k) die Momente der Verteilung w(ξ) als ihre
Ableitungen bei k = 0,
i
ν
·
dν Q(k)
dk ν
¸
k=0
+∞
Z
=
dξ ξ ν w(ξ) = hξ ν i .
−∞
(17.38)
17.5 Der Zentrale Grenzwertsatz
305
Insbesondere gibt das nullte Moment das Normierungsintegral,
+∞
Z
Q(0) =
dξ w(ξ) = 1 .
(17.39)
−∞
Wir können uns leicht davon überzeugen, dass |Q(k)| den Wert Q(0) = 1 für
kein k überschreiten kann. Da der Betrag einer Summe nie größer ist als die
Summe der Beträge der Summanden, gilt
Z
Z
|Q(k)| ≤ dx |e−ikx w(x)| = dx w(x) = Q(0) = 1 .
(17.40)
Tatsächlich wird |Q(k)| für wachsendes |k| umso schneller abfallen, je langsamer w(ξ) mit wachsendem |ξ| abfällt (blättern Sie zurück zu 11.7, um ein
Beispiel zu haben). Zur anschaulichen Begründung der getroffenen Aussage
vergegenwärtigen wir uns, dass die Exponentialfunktion exp(−ikx) in (17.37)
als Funktion von x umso schneller oszilliert, je größer |k| ist; für hinreichend
großes |k| wird w(x) auf dem Längenmaßstab 1/|k| kaum noch variieren, das
Integral (17.37) also nur noch wenig von Null abweichen kann.
Wegen (17.40) und da Q(k) für wachsendes |k| abfällt, wird die Potenz Q(k)N
bei großem N extrem schnell abfallen. Zur näherungsweisen Berechnung des
Integrals (17.36) suchen wir nun eine Approximation für Q(k)N , die diesem
extrem schnellen Abfall vom Maximalwert Eins auf Null Rechnung trägt. Wie
bei einer ähnlichen Fragestellung in 17.3 verwenden wir die Taylorreihe von
ln Q(k)N um die Stelle k = 0,
¶
µ
1 2 2
N
(17.41)
ln Q(k) = N ln Q(k) = N ln 1 − ihξik − hξ ik · · · .
2
Mit Hilfe der Entwicklung ln(1 + x) = x − x2 /2 + . . . erhalten wir aus (5.11)
µ
¶
1
ln Q(k)N = −ihξik − h(∆ξ)2 ik 2 + · · · ,
2
also
Q(k)
N
µ
1
≈ exp −iN hξik − N h(∆ξ)2 ik 2
2
¶
.
(17.42)
In dieser für große N vernünftigen Approximation wird Q(k)N nur durch die
ersten beiden Momente der Einzelwahrscheinlichkeit w(ξ) festgelegt.
Nach Eintragen der Näherung (17.42) in das Integral (17.36) ergibt sich für
die gesuchte Wahrscheinlichkeitsdichte der additiven Variablen x die Gaußfunktion (s. 11.7 für das Integral)
W (x) = p
mit dem ersten Moment
1
2πh(∆x)2 i
£
¤
exp −(x − hxi)2 /2h(∆x)2 i
hxi = N hξi
(17.43)
(17.44)
306
17 Grundbegriffe der Statistik
und der mittleren quadratischen Schwankung
h(∆x)2 i = N h(∆ξ)2 i .
(17.45)
Wie eingangs angekündigt, verschwindet die relative Streuung für N → ∞ wie
£
¤1/2
1
Str(x)/hxi = N h(∆ξ)2 i
/N hξi ∼ √ .
N
(17.46)
Kapitel 18
Statistische Behandlung
von Vielteilchensystemen
18.1
Ensembles
Die Wellenfunktion ψ(~x1 , ~x2 , . . . , ~xN , t) eines Haufens von N gleichen Teilchen
hat wie die Wellenfunktion eines einzelnen Teilchens die Bedeutung einer Wahrscheinlichkeitsamplitude. Ihr Absolutquadrat gibt die Wahrscheinlichkeitsdichte
dafür an, ein Teilchen in einem Volumenelement d3 x1 beim Ort ~x1 zu finden,
ein zweites in einem Volumenelement d3 x2 bei ~x2 etc. Die Wahrscheinlichkeitsinterpretation ist allerdings wie im Fall eines einzelnen Teilchens nur möglich,
wenn ψ normiert ist gemäß
Z
Z
Z
hψ | ψi ≡ d3 x1 d3 x2 · · · d3 xN |ψ(~x1 , ~x2 , . . . , ~xN , t)|2 = 1 .
(18.1)
Entsprechend der Bedeutung von ψ berechnet sich der Erwartungswert einer
~ x1 , . . . , ~xN , p~1 , . . . , p~N ) als das Integral (s. 11.6)
Observablen A(~
Z
Z
3
hAi ≡ hψ | Aψi = d x1 · · · d3 xN ψ ∗ Aψ .
(18.2)
Falls die Wellenfunktion ψ nicht Eigenfunktion des Operators A ist, so werden sich bei Messung der Observablen A an einem Ensemble von durch ψ repräsentierten Systemen verschiedene Messwerte ergeben. Das Mittel der Messergebnisse hat den Wert (18.2). Als ein Maß für die typische Schwankung der
Messwerte um den Mittelwert können wir die Streuung
¡
¢1/2 ¡
¢1/2
Str(A) = hA2 i − hAi2
= hψ | A2 ψi − hψ | Aψi2
(18.3)
benutzen.
Ein Ensemble von Systemen, die alle in ein und demselben Zustand präpariert wurden, ist nicht die allgemeinst mögliche Gesamtheit. Wir werden künftig
stets zulassen, dass zu einem Ensemble Systeme in verschiedenen Zuständen ψν ,
ν = 1, 2, . . ., gehören, wobei ein beliebig aus dem Ensemble herausgegriffenes
System mit Wahrscheinlichkeit wν im Zustand ψν sitzt. Der Erwartungswert
307
308
18 Statistische Behandlung von Vielteilchensystemen
der Observablen A (die keine explizite Zeitabhängigkeit haben soll),
hAi =
X
ν
wν hψν | Aψν i ,
(18.4)
entsteht dann als statistisches Mittel der quantenmechanischen Erwartungswerte bezüglich der Zustände ψν . Derart zusammengesetzte Ensembles werden
auch Zustandsgemische genannt. Bei dem einfachen Ensemble, das einer einzigen Wellenfunktion entspricht, sprechen wir auch von einem reinen Zustand.
18.2
Stationäre Ensembles
Im Allgemeinen sind Erwartungswerte wie (18.4) zeitabhängig, da die Wellenfunktionen ψν sich entsprechend der Schrödingergleichung
i~
∂
ψν = Hψν
∂t
(18.5)
zeitlich entwickeln. Der Hamiltonoperator H = T + V für N Teilchen enthält
die kinetische Energie T
T =
N
N
X
X
~2 ∇2i
1 2
p~ = −
,
2mi
2mi
i=1
i=1
(18.6)
wobei ∇i = (∂/∂xi , ∂/∂yi , ∂/∂zi ) der Nablaoperator bezüglich der Koordinaten
des iten Teilchens ist. Hinzu kommt im Allgemeinen eine potenzielle Energie
V (~x1 , ~x2 , . . . , ~xN ). Wenn die letztere Wechselwirkungen zwischen den Teilchen
beschreibt, so ist sie im Gegensatz zu T nicht additiv bezüglich der Beiträge der
einzelnen Teilchen.
Die Schrödingergleichung (18.5) erlaubt, die zeitliche Änderungsrate des Erwartungswerts (18.4) zu berechnen
Z
Z
i
h
X
d
wν d3 x1 · · · d3 xN ψ̇ν∗ Aψν + ψν∗ Aψ˙ν
hAi =
dt
ν
Z
Z
X
¤
i£
3
=
(18.7)
wν d x1 · · · d3 xN (Hψν∗ )Aψν − ψν∗ AHψν .
~
ν
Wenn V impulsunabhängig, d. h. kein Differentialoperator und darüber hinaus
reell ist, können wir schreiben
µ ¶
Z
Z
X
d
i
3
3
hAi =
wν d x 1 . . . d x N
dt
~
ν
¤
£
· (T ψν∗ )Aψν − ψν∗ AT ψν + ψν∗ (V A − AV )ψν .
Im ersten Term der eckigen Klammer können wir die Differentialoperatoren
in (∇2i ψν∗ )Aψν durch zweimalige partielle Integration nach rechts abwälzen“;
”
da hierbei für normierbare Wellenfunktionen ψν keine Randterme entstehen,
18.2 Stationäre Ensembles
erhalten wir schließlich
µ ¶
Z
Z
X
i
d
wν d3 x 1 . . . d3 x N
hAi =
(HA − AH)ψν
dt
~
ν
µ ¶
Z
Z
X
i
3
3
∗
=
[H, A]ψν .
w ν d x 1 . . . d x N ψν
~
ν
309
(18.8)
Die Änderungsrate des Erwartungswerts hAi verschwindet offensichtlich, falls
[H, A] = 0, d. h. falls die Observable A eine Erhaltungsgröße ist (s. 14.4). Aber
auch im Fall [H, A] 6= 0 kann der Erwartungswert hAi zeitlich konstant bleiben.
Ist nämlich das betrachtete Ensemble ein Gemisch von Energieeigenzuständen,
Hψν = Eν ψν ,
(18.9)
so ersehen Sie schon aus (18.7) das Verschwinden der Änderungsrate dhAi/dt.
Da für Gemische von Energieeigenzuständen die Erwartungswerte beliebiger Observabler zeitlich konstant bleiben, werden diese Gemische füglich als stationär
bezeichnet. Der folgenden Behandlung von Vielteilchensystemen im thermischen Gleichgewicht werden stets stationäre Gemische zugrunde gelegt.
Von besonderem Interesse für die Beschreibung von Vielteilchensystemen
sind Erwartungswert und Streuung der Energie. Bei stationären Ensembles gilt
X
X
w ν Eν .
(18.10)
wν hψν | Hψν i =
hHi =
ν
ν
Sie können im nächsten Paragrafen lernen, dass die Energieniveaus in Vielteilchensystemen außerordentlich dicht aufeinander folgen. Summen über Energiezustände wie in (18.10) können daher durch Integrale genähert werden. Dazu
muss die Zahl Ω(E)∆E der Zustände ψν bekannt sein, deren Energieniveaus
im Intervall zwischen E und E + ∆E liegen, und ferner muss wν durch w(Eν )
ersetzt werden. Der Erwartungswert (18.10) der Energie nimmt dann die Form
hHi =
Z∞
dE Ω(E) w(E) E
(18.11)
E0
an, wobei E0 die Grundzustandsenergie des Systems bezeichnet. Im vorstehenden Ausdruck für die mittlere Energie erkennen Sie übrigens das Produkt
Ω(E)∆E als Wahrscheinlichkeitsdichte der Energie. Die Streuung der Energie
erhalten wir durch eine entsprechende Überlegung als
1/2
∞
Z
2
2
.
(18.12)
Str(H) =  dE Ω(E) w(E) (E − hHi )
E0
Die Energie eines makroskopischen Systems ist im Sinne der Betrachtungen
von 17.5 eine additive Größe. Nach dem zentralen Grenzwertsatz müssen wir
also erwarten, dass die Streuung (18.12) i. A. sehr klein ist gegenüber dem Mittelwert (18.11). Um diese Erwartung durch Berechnen der Integrale in (18.11,
18.12) überprüfen zu können, müssen wir uns die Zustandsdichte Ω(E) sowie
die Wahrscheinlichkeit w(E) für stationäre Vielteilchensysteme zur Verfügung
stellen.
310
18 Statistische Behandlung von Vielteilchensystemen
18.3
Die Energieabhängigkeit der Zustandsdichte
Die Abzählung der Energiezustände ψν mit Energien Eν innerhalb eines Intervalls zwischen E und E +∆E erfordert im Prinzip die Kenntnis aller Eigenwerte
des Hamiltonoperators (und ihren Entartungsgrad). Diese Kenntnis ist für Vielteilchensysteme nicht leicht zu erlangen. Ohne große Mühe machen wir uns aber
klar, dass die Zustandsdichte eines Systems vieler Teilchen extrem stark von der
Energie abhängt.
Denken wir uns ein System von N Teilchen durch einen glatten Schnitt halbiert. Bei Teilchenzahlen der Größenordnung 1023 stellt die Wechselwirkung der
Hälften einen vernachlässigbaren Teil der Gesamtenergie dar. Zudem können
wir die Hälften als statistisch unabhängig ansehen. Da sich jede der Hälften
vom Gesamtsystem nur durch Volumen, Teilchenzahl und Energie unterscheidet,
wird die Zustandsdichte für alle drei Systeme dieselbe Funktion der respektiven
Energien, Teilchenzahlen und Volumina sein∗) Wegen der Unabhängigkeit der
Untersysteme gilt für die Zahl Ω(E, N, V )∆E der Zustände des Gesamtsystems
mit Energien im Intervall ∆E bei E
¶
X µE
N
V
∆E
− e,
− n,
Ω(E, N, V )∆E =
Ω
2
2
2
e,n
¶
E
N
V
∆E
+ e,
+ n,
2
2
2
· µ
¶
¸2
E N V
, ,
≈ Ω
∆E
.
2 2 2
·Ω
µ
(18.13)
Die Summe im zweiten Glied der Gleichungskette erstreckt sich über alle möglichen Verteilungen der Gesamtenergie E und der Gesamtteilchenzahl N auf die
beiden Untersysteme. Wir dürfen diese Summe durch den Summanden entsprechend halbierter Energie und halbierter Teilchenzahl approximieren, denn wenn
Ω(E, N, V ) schon bei kleinem Zuwachs von E extrem stark wächst, was wir
gleich zeigen werden, so hat das Produkt Ω(E/2 − e, N/2 − n, V /2) · Ω(E/2 +
e, N/2 + n, V /2) ein extrem scharf ausgeprägtes Maximum bei e = n = 0.
Anstatt das ursprüngliche System zu halbieren, können wir es auch in n
makroskopisch gleiche Teile zerlegen. Dann gilt statt (18.13) mit gleicher Begründung
¶
¸n
· µ
E N V
, ,
∆E
.
(18.14)
Ω(E, N, V )∆E ≈ Ω
n n n
Die Näherung (18.14) bleibt bei wachsendem n gut, solange jedes Untersystem
noch viele Teilchen enthält und die Gesamtenergie additiv in den Beiträgen
der Untersysteme bleibt; bei N = 1023 ist das normalerweise bei mindestens
n ≈ 1014 der Fall. Wenn der mittlere Teilchenabstand wie bei verdünnten
Gasen größer ist als die Reichweite der Wechselwirkungskräfte zwischen den
Teilchen, gilt (18.14) sogar bis zu Werten von n in der Größenordnung der
Gesamtteilchenzahl N .
∗) Es
lässt sich zeigen, dass Ω von der Form der Berandung des Systems nicht abhängt.
18.4 Das mikrokanonische Ensemble
311
Aus (18.14) gewinnen wir durch Differenzieren die relative Änderung der
Zustandsdichte bei kleiner relativer Änderung der Energie,
δΩ(E, N, V )
δΩ(E/n, N/n, V /n)
=n
,
Ω(E, N, V )
Ω(E/n, N/n, V /n)
(18.15)
als das n-fache der entsprechenden relativen Änderung bei einem von n Untersystemen. Mag die relative Änderung von Ω(E/n, N/n, V /n) für das kleinstmögliche Untersystem auch winzig sein, sagen wir 10−6 , so wird Ω(E, N, V )
doch um den riesigen Faktor n · 10−6 wachsen.
Bei vielen Systemen wird das schnelle Anwachsen der Zustandsdichte Ω mit
der Energie außer in Nachbarschaft der Grundzustandsenergie durch ein Potenzgesetz mindestens qualitativ richtig beschrieben,
Ω(E, N, V ) = E aN A(N, V ) ,
(18.16)
wobei der Exponent aN eine sehr große Zahl ist, deren Größenordnung sogar
der der Teilchenzahl N nahe kommen kann. Für hinreichend verdünnte Gase,
bei denen (18.14) und (18.15) bis n ≈ N gelten, ist a von der Größenordnung
Eins.
Prüfen Sie Ihr Verständnis der vorstehenden Diskussion, indem Sie sich davon überzeugen, dass Ω(E, N, V ) auch empfindlich vom Volumen V abhängt,
u. z. stark wächst bei Volumenvergrößerung.
Wenn wir wie hier und in der Folge die Niveaudichte Ω(E, N, V ) als Funktion der Energie E, desr Teilchenzahl N und des Volumens V ansehen†) , dann
ist stillschweigend angenommen, dass nur eine Teilchensorte (z.B. Wassermoleküle) und nur eine Phase (gasförmig, flüssig oder fest) vorliegen. Von diesen
drei Variablen muss die Niveaudichte sicher abhängen: vom Volumen V , weil
am Rand des Systemvolumens Randbedingungen für die Wellenfunktion erfüllt
sein müssen, so dass auch die Energieniveaus En (V ) vom Volumen abhängen;
von der Teilchenzahl N , weil jedes Teilchen zur Gesamtenergie (also zu jedem
Energieniveau des Gesamtsystems) beiträgt und schließlich wie oben beschrieben auch von der Energie E.
18.4
Das mikrokanonische Ensemble
Ich erinnere nochmals an eine in 17.5 gegebene Erläuterung des zentralen Grenzwertsatzes. Ein räumlich homogenes und zeitlich stationäres System vieler, etwa
N = 1023 , Teilchen können wir uns in viele, z. B. n = 1014 Stücke zerlegt denken, die mit glatten Oberflächen aneinander grenzen und deren jedes immer
noch viele, im Beispiel 109 , Teilchen enthält. Normalerweise (immer, außer in
kritischen Systemen) sind solche Teilstücke in guter Näherung unabhängig voneinander. Die Energie des Systems ist additiv in den Beiträgen seiner Teilstücke,
hHi ∼ n, und die relative Streuung der Energie, Str(H)/hHi ∼ n−1/2 , ist winzig,
zumeist sogar erheblich kleiner als die relative Unsicherheit der experimentellen
Bestimmung der Gesamtenergie.
Derart kleine Streuungen verdienen durchaus, vernachlässigt zu werden. Die
entsprechende Näherung für die in (18.11) auftretende Wahrscheinlichkeit Ω(E)
†) Der Kürze halber wird die Niveaudichte im Folgenden zuweilen als Ω(E) notiert, womit
die Abhängigkeit von V und N keineswegs negiert ist
312
18 Statistische Behandlung von Vielteilchensystemen
w(E) dE dafür, die Energie des Systems im infinitesimalen Intervall zwischen
E und E + dE zu finden, lautet
Ω(E) w(E) dE = δ(E − Ē)dE .
(18.17)
Die Deltafunktion verbietet gerade das Auftreten von Energien außerhalb eines
infinitesimalen Intervalls um den Mittelwert
hHi =
Z∞
dE δ(E − Ē)E = Ē .
(18.18)
E0
Alle höheren Momente ergeben sich als Potenzen des Mittelwerts,
ν
hH i =
Z∞
dE δ(E − Ē)E ν = Ē ν .
(18.19)
E0
und insbesondere verschwindet die Streuung der Energie. Das so definierte stationäre Ensemble von Systemen heißt aus historischen Gründen mikrokanonisch.
Neben der absoluten Schärfe der Energie hat das mikrokanonische Ensemble
eine weitere bemerkenswerte Eigenschaft. Um dieselbe klarzulegen, fassen wir
vorübergehend wieder die Diskretheit der Energieniveaus ins Auge und fragen
nach der Wahrscheinlichkeit, im Ensemble irgendeinen der insgesamt Ω(E)∆E
Energieeigenzustände ψn mit einem Energieeigenwert En im kleinen aber endlichen Intervall ∆E bei E anzutreffen. Die gefragte Wahrscheinlichkeit beträgt
für das mikrokanonische Ensemble

1

für Ē ≤ En ≤ Ē + ∆E

Ω(
Ē)∆E
(18.20)
w(En ) =


0
sonst.
Im Grenzfall infinitesimaler Dicke ∆E der Energieschale“ stimmt (18.20) mit
”
(18.17) überein. Sie rechnen leicht nach, dass die Relationen (18.19) bis auf Korrekturen der Ordnung ∆E/Ē auch für die diskrete Version (18.20) von (18.17)
richtig bleiben. Ganz ohne Rechnung lesen Sie aus (18.20) ab, dass das mikrokanonische Ensemble jedem der Ω(E)∆E Zustände mit Energie innerhalb der
erlaubten Energieschale die gleiche Wahrscheinlichkeit zuweist.
Per Konstruktion ist gesichert, dass das mikrokanonische Ensemble das statistische Verhalten der Energie eines Vielteilchensystems (nämlich die Kleinheit
ihrer Schwankungen) angemessen beschreibt. Ganz unklar ist jedoch zunächst,
ob auch die statistischen Eigenschaften anderer makroskopischer Observabler
(Gesamtimpuls, Gesamtdrehimpuls, ggf. Magnetisierung, elektrische Polarisation etc.) richtig wiedergegeben werden.
Für alle Variablen, die im gleichen Sinn wie die Energie additiv sind (oder
sogar additiv in den Beträgen der einzelnen Teilchen), sichert der zentrale Grenzwertsatz Streuungen, die zur Wurzel aus der Teilchenzahl N proportional sind,
Streuungen also, die auf zu N proportionalen Maßstäben als winzig erscheinen.
Diese Eigenschaft jedes Vielteilchensystems kann im mikrokanonischen Ensemble nicht verfälscht sein, da die Schärfen der Energie und anderer additiver
Observablen nicht im Widerspruch zueinander stehen.
18.5 Das kanonische Ensemble
313
Keineswegs ist durch den Grenzwertsatz jedoch garantiert, dass das mikrokanonische Ensemble auch die richtigen Mittelwerte der genannten Variablen
liefert. Der Mittelwert des Gesamtimpulses von N Teilchen etwa verschwindet
im mikrokanonischen Ensemble, denn nach dem Ehrenfestschen Theorem 11.8
gilt
N
X
i=1
h~
pi i =
X
i
mi
d
h~xi i ,
dt
(18.21)
und nach den Überlegungen von 18.2 ist der Erwartungswert von h~xi i in jedem
stationären Ensemble zeitunabhängig. Also eignet sich das Ensemble (18.17)
nur zur Beschreibung von Systemen mit verschwindendem Gesamtimpuls, nicht
aber, zum Beispiel, zur Behandlung von stationären Strömungen durch Rohre. Wenn der Mittelwert einer additiven Observablen eines Vielteilchensystems
im Ensemble (18.17) verschwindet, in einer zu beschreibenden Realisierung des
Systems aber nicht, so enthält (18.17) zu viele Zustände. Zum Beispiel lässt
(18.17) zu jedem Wert des Gesamtimpulses mit gleicher Häufigkeit den entgegengesetzt gleichen zu, während in einem insgesamt translatorisch bewegten
oder strömenden System Impulse einer bestimmten Richtung bevorzugt sind.
Um in derartigen Fällen die Zahl der Zustände angemessen zu reduzieren, kann
statt (18.17) ein verallgemeinertes mikrokanonisches Ensemble benutzt werden
mit der Wahrscheinlichkeitsdichte
¯
w(E, ξ) Ω(E, ξ) = δ(E − Ē) δ(ξ − ξ)
(18.22)
dafür, dass die Energie und die weitere(n) unabhängig vorgebbare(n) additive(n) Variable(n) Werte bei E bzw. ξ annehmen. Ferromagnete, Supraleiter
und suprafluides Helium sind weitere Beispiele von Systemen, bei denen die
Verallgemeinerung (18.22) angebracht ist.
Offensichtlich ist die Beschreibung eines Vielteilchensystems durch das mikrokanonische Ensemble von mikroskopischem Standpunkt aus extrem unvollständig, da nur die Energie oder neben ihr nur wenige weitere Observable spezifiziert werden. Hinsichtlich makroskopischer Observabler von Systemen im thermischen Gleichgewicht ist diese Beschreibung jedoch, wie Sie am Beispiel der
idealen Gase in 20. sehen werden, erschöpfend. Im Übrigen ist Ihnen aus der elementaren phänomenologischen Thermodynamik schon bekannt, dass das thermische Gleichgewicht eines Gases von N Teilchen hinsichtlich makroskopischer
Beobachtungen (von Druck, Temperatur, Energie etc.) eindeutig festgelegt ist
nach Vorgabe zweier Größen wie etwa des Volumens V und der Gesamtenergie
E. Die letzteren beiden Größen bestimmen aber gerade die Niveaudichte und
somit das mikrokanonische Ensemble.
18.5
Das kanonische Ensemble
Die mikrokanonische Besetzungswahrscheinlichkeit (18.20) für ein Energieniveau
Eν ist nicht die einzig mögliche Wahl für w(Eν ), die die Kleinheit der Energieschwankungen in einer Gesamtheit von Vielteilchensystemen richtig wiedergibt.
Ich will Ihnen hier eine andere Wahl vorstellen, die sich für viele Rechnungen
sogar als bequemer handhabbar erweist.
314
18 Statistische Behandlung von Vielteilchensystemen
Betrachten wir ein stationäres Vielteilchensystem und denken es uns durch
einen glatten Schnitt in zwei Stücke zerlegt, deren jedes immer noch viele Teilchen enthalten soll. Die Wechselwirkung der beiden Stücke macht normalerweise
einen vernachlässigbaren Beitrag zur Gesamtenergie E, so dass letztere durch
die Summe der Energien der beiden Teile approximiert werden kann,
E = E1 + E2 .
(18.23)
Zugleich werden die beiden Teile in guter Näherung statistisch unabhängig sein.
Die Wahrscheinlichkeit, die Gesamtenergie beim Wert E zu finden, wird nach
der sowohl-als-auch-Regel (17.3) durch das Produkt der Wahrscheinlichkeiten,
die Energien der Teile bei E1 bzw. E2 zu finden, gegeben sein,
w(E) = w(E1 ) · w(E2 ) .
(18.24)
Da die beiden Teilsysteme von gleicher Natur sind wie ihre Vereinigung, tritt in
(18.24) einunddieselbe Funktion w(x) mit drei verschiedenen Argumenten auf.
Die beiden Relationen (18.23, 18.24) legen die Funktion w(E) fest als die
Exponentialfunktion
w(E) =
1 −βE
e
.
Z
(18.25)
Dabei sind Z und β zwei offene Parameter, deren Bedeutung später klarzustellen
sein wird. Durch Einsetzen prüfen Sie leicht nach, dass (18.25) eine Lösung der
Gleichungen (18.23, 18.24) darstellt. Die Eindeutigkeit der Lösung (18.25) ist
auch schnell erwiesen. Differenzieren wir nämlich beide Seiten von (18.24) nach
E1 , so erhalten wir w 0 (E1 + E2 ) = w0 (E1 )w(E2 ). Für E1 = 0 entsteht die
Differentialgleichung w 0 (E2 ) = w0 (0)w(E2 ), deren Lösung bekanntlich die Form
(18.25) hat.
Sie erkennen auf der rechten Seite von (18.25) den Boltzmannfaktor und erinnern sich an die Maxwellsche Geschwindigkeitsverteilung, die barometrische
Höhenformel und andere Beispiele exponentieller Energieverteilungen. Ebenfalls
bekannt ist Ihnen, dass der Parameter 1/β zur absoluten Temperatur proportional ist. Die folgenden Überlegungen machen jedoch von derlei Vorkenntnissen
keinen Gebrauch.
Damit (18.25) tatsächlich eine Wahrscheinlichkeit w(En ) definiert, muss die
Summe über alle Energieeigenzustände den Wert Eins haben
X
w(En ) = Z −1
n
X
e−βEn = 1 .
(18.26)
n
Diese Forderung definiert den Normierungsfaktor Z, die so genannte Zustandssumme,
Z=
X
n
e
−βEn
≈
Z∞
dE Ω(E, N, V )e−βE = Z(β, N, V ) .
(18.27)
E0
Für die hier betrachteten Systeme ist, wie vorstehend symbolisch angedeutet,
die kanonische Zustanssumme eine Funktion der Variablen β, N, V . Sobald Z
18.5 Das kanonische Ensemble
315
bekannt ist, sind alle Momente der Energieverteilung durch Differenziation nach
dem Parameter β zugänglich,
ν
hH i = Z
−1
X
∂ν Z
= Z −1
Enν e−βEn ≈ Z −1
(−1)
ν
∂β
n
ν
Z∞
dE E ν Ω(E) e−βE .
E0
(18.28)
Die Differentiation nach β ist eine partielle; die beiden anderen Variablen Volumen und Teilchenzahl sind als konstant anzusehen.
Die offenbare Verschiedenheit der kanonischen Verteilung (18.25) und der
mikrokanonischen Verteilung
w(E) =
1
δ(E − Ē)
Ω(E)
(18.29)
muss Sie beunruhigen! Beide sollen die makroskopischen Eigenschaften von Vielteilchensystemen im thermischen Gleichgewicht beschreiben, beide sind konstruiert unter Berufung auf die Additivität der Energie bezüglich der Beiträge hinreichend großer Teilsysteme, aber irgendeine Ähnlichkeit zwischen der mikrokanonischen Deltafunktion und der kanonischen Exponentialfunktion ist zunächst
nicht zu erkennen.
Trotz des drastisch verschiedenen Aussehens sind die Verteilungen (18.17)
und (18.25) äquivalent. Die Äquivalenz ist ohne Rechnung unschwer dem zentralen Grenzwertsatz zu entnehmen. Die Additivität der Energie bezüglich vieler
hinreichend großer Untersysteme und die statistische Unabhängigkeit derartiger
Untersysteme führen einerseits zwingend zur kanonischen Verteilung (18.25) und
bedingen andererseits nach dem Grenzwertsatz eine winzige relative Streuung
der Gesamtenergie. Die Schärfe der Energie ist aber gerade eines der beiden wesentlichen Charakteristika des mikrokanonischen Ensembles. Das andere Charakteristikum, die Gleichheit der Besetzungswahrscheinlichkeiten aller Zustände
einer Energie bzw. mit Energien innerhalb einer dünnen Energieschale“, ist
”
dem kanonischen Ensemble ebenfalls eigen, denn die Verteilung (18.25) hängt
wie (18.17) neben der Energie von keinen anderen Quantenzahlen ab.
Wir können die Kleinheit der Energieschwankungen im kanonischen Ensemble auch durch Berechnung der Erwartungswerte hH ν i gemäß (18.28) illustrieren. Dazu verwenden wir die Zustandsdichte (18.16), die das für makroskopische
Systeme typische starke Anwachsen von Ω(E) mit der Energie qualitativ richtig
beschreibt,
Ω(E, N, V ) = A(N, V )E aN .
(18.30)
Der Einfachheit halber denken wir uns für den Exponenten aN zunächst nur
ganzzahlige Werte zugelassen. Damit wird die Integration in (18.28) zu einer
elementaren Aufgabe mit der Lösung (der Einfachheit halber wird der Energienullpunkt so gewählt, dass E0 = 0)
hH ν i = Z −1 Aβ −(aN +ν+1) (aN + ν)! .
(18.31)
Insbesondere erhalten wir für ν = 0 die Zustandssumme
Z = Aβ −(aN +1) (aN )!
(18.32)
316
18 Statistische Behandlung von Vielteilchensystemen
und schließlich, nach Elimination von Z aus (18.31),
hH ν i = β −ν (aN + ν)(aN + ν − 1) · · · (aN + 1) .
(18.33)
Dieses Resultat lässt sich auch für nicht ganzzahlige Werte von aN gewinnen.
Von (18.33) gelangen wir sofort zum angestrebten Ziel, der relativen Streuung
der Energie,
√
Str(H)/hHi = (aN + 1)−1/2 ∼ 1/ N ,
(18.34)
deren Winzigkeit nun auch nachgerechnet ist.
Um etwaige Beunruhigung über die Verschiedenheit der Besetzungswahrscheinlichkeit w(Eν ) im kanonischen und mikrokanonischen Ensemble vollends
auszuräumen, sollten Sie noch einen Blick auf das letzte Glied in (18.28) werfen.
Sie erkennen, dass das Produkt aus Zustandsdichte und Boltzmannfaktor und
nicht letzterer allein die Wahrscheinlichkeitsdichte für das Auffinden der Energie
beim Wert E angibt. Da Ω(E) stark mit E wächst, hat das Produkt Ω(E)e−βE
ein scharf ausgeprägtes Maximum nahe beim Mittelwert hHi (s. Abbildung
18.1).
Abbildung 18.1
Ich hatte schon in 18.4 darauf hingewiesen, dass bei manchen Vielteilchensystemen neben der Energie eine oder mehrere weitere Variable spezifiziert werden müssen. Die entsprechende Verallgemeinerung der kanonischen Verteilung
(18.25) lautet, falls die unabhängig vorgebbare(n) Variable(n) ξ ebenso wie die
Energie additiv sind,
w(E, ξ) = Z −1 e−β(E−ϕξ) ,
(18.35)
wobei als zusätzlicher Parameter die Größe ϕ auftritt. Die Begründung von
(18.35) läuft völlig parallel der Begründung von (18.25) und ist Ihnen zur Übung
anempfohlen.
Das kanonische Ensemble wird oft auch für kleine Systeme mit wenigen Freiheitsgraden verwendet. Die (zuweilen unausgesprochene) Rechtfertigung dafür
besteht stets darin, dass das betreffende kleine System als in schwacher Wechselwirkung mit einer großen Umgebung befindlich angesehen werden kann.
Als Beispiel eines kleinen Systems betrachten wir einen harmonischen Oszillator im Gleichgewicht mit einer Umgebung, die so schwach ankoppelt, dass ihr
Einfluss auf die Energieniveaus vernachlässigbar ist. Die Energieeigenwerte
18.6 Das großkanonische Ensemble
µ
1
En = ~ω n +
2
¶
,
n = 0, 1, 2, . . .
317
(18.36)
sind Ihnen aus 13.1 bekannt. Die Zustandssumme (18.27) wird hier zu einer
geometrischen Reihe,
Z=
∞
X
e−β~ω(n+ 2 ) =
1
n=0
1
e−β~ω/2
=
.
−β~ω
1−e
2 sinh(β~ω/2)
(18.37)
Durch Differenzieren gemäß (18.28) erhalten wir hieraus die mittlere Energie
hHi =
~ω
β~ω
coth
2
2
(18.38)
β~ω
~ω
/ sinh
.
2
2
(18.39)
und die Streuung
Str(H) =
Sie sollten diese Resultate in den Grenzfällen β → 0 (große Temperaturen) und
β → ∞ (kleine Temperaturen) untersuchen. Überzeugen Sie sich auch davon,
daß sich die mittlere Energie gemäß (18.38) schreiben lässt als
µ
1
hHi = ~ω nth +
2
¶
,
nth =
1
,
eβ~ω − 1
wobei nth die thermisch gemittelte Zahl der Anregungsquanten ist; die letztere Form der mittleren Energie und die Interpretation von nth werden durch
Vergleich mit (18.36) nahegelegt.
Nach diesem kleinen Exkurs zu einem “kleinen” System kehren wir zum
Hauptthema der Vielteichensysteme zurück mit der Bemerkung, dass bei Benutzung des kanonischen Ensembles naheliegt, die mittlere Energie hHi = Ē(β, N, V )
als Funktion der Teichenzahl N , des Volumens sowie des Parameters β (der sich
wie bereits erwähnt als ein Maß für die Temperatur herausstellen wird) anzusehen.
18.6
Das großkanonische Ensemble
Im mikrokanonischen wie im kanonischen Ensemble sind nur Systeme mit einundderselben Zahl von Teilchen zugelassen. Dies ist eine manchmal lästige Beschränkung. Insbesondere ist es experimentell unmöglich, ein makroskopisches
System vielfach zu reproduzieren unter genauer Beibehaltung der Teilchenzahl
N . Jedenfalls ist die Beschränkung auf fixes N bei N À 1 völlig unnötig. Da
nämlich die Teilchenzahl wie die Energie additiv ist bezüglich der Beiträge von
Teilsystemen, sichert der zentrale Grenzwertsatz die Vernachlässigbarkeit der
Streuung von N . Wir können also ohne weiteres statt der bisher besprochenen
Ensembles das so genannte großkanonische Ensemble benutzen, bei dem die
Teilchenzahl genau wie die Energie zwar nicht absolut scharf fixiert ist, jedoch
318
18 Statistische Behandlung von Vielteilchensystemen
nur vernachlässigbare Schwankungen aufweist. In diesem großkanonischen Ensemble haben Systeme mit Energieeigenwert Eν und Teilchenzahl N die relative
Häufigkeit
−1 −β(Eν −µN )
w(Eν , N ) = ZG
e
.
(18.40)
Dabei hängen die Energieeigenwerte Eν = Eν (N, V ) über Randbedingungen am
Rand des Systems vom Volumen V sowie auch von der Teilchenzahl N ab. Die
großkanonische Zustandssumme ZG ist durch die Wahrscheinlichkeitsinterpretation für w(Eν , N ) festgelegt,
ZG =
∞ X
X
e−β(Eν −µN ) = ZG (β, V, µ) .
(18.41)
N =0 ν
Das so genannte chemische Potential µ und der Parameter β können nach Vorgabe der mittleren Energie und der mittleren Teilchenzahl hN i fixiert werden.
Offenbar gilt
¶
µ
∂ ln ZG
(18.42)
−hHi + µhN i =
∂β
µ,V
¶
µ
∂ ln ZG
,
(18.43)
βhN i =
∂µ
β,V
wobei die Differenziation in (18.42) bei konstantem chemischen Potential µ und
die in (18.43) bei konstantem β auszuführen ist; das Volumen V ist beidemal
als konstant anzusehen.
Wir hatten am Ende des letzten Paragraphen erkannt, daß bei Benutzung
des kanonischen Ensembles naheliegt, die mittlere Energie hHi = Ē(β, N, V )
als Funktion der Variablen β, N, V anzusehen. Ebenso natürlich ist es, bei
Benutzung des großkanonischen Ensembles die Variablen β, µ, V zu benutzen
und hHi = Ē(β, µ, V ) zu schreiben. Der mittleren Energie ist es gleichgültig,
als Funktion welcher drei Variabler sie angesehen wird, und der Übergang von
einem Satz wie β, N, V zu einem anderen wie β, µ, V ist nichts als eine Variablentransformation. Mit derartigen Variablentransformationen muss man in
der Thermodynamik oft spielen. Ein derartiges Spiel liefert uns übrigens die
mittlere Energie als
¶
µ
∂ ln ZG
hHi = −
,
(18.44)
∂β
z,V
also etwas direkter als über 18.42 und 18.43.
Kapitel 19
Thermodynamische
Variable
19.1
Entropie
Der hier vorzustellende Begriff der Entropie ist in der phänomenologischen Thermodynamik seit seiner Einführung durch Rudolf Clausius (1865) von zentraler
Bedeutung und hat auch bei der Grundlegung des statistischen Verständnisses
der Thermodynamik durch Ludwig Boltzmann eine Schlüsselrolle gespielt. Wir
definieren die Entropie eines Vielteilchensystems im thermischen Gleichgewicht
als
X
S = −kB
w(Eν ) ln w(Eν ) .
(19.1)
ν
Die hier per Konvention auftretende Boltzmannkonstante,
kB = 1, 38062 × 10−23 J = 1, 38062 × 10−16 erg ,
(19.2)
weist der Entropie die Dimension einer Energie zu. Da die Besetzungswahrscheinlichkeiten w(Eν ) alle zwischen Null und Eins liegen, gilt sicher
S≥0.
(19.3)
Die so definierte Entropie könnte keine brauchbare thermodynamische Variable sein, wenn sie in den verschiedenen Gleichgewichtsensembles verschiedene
Werte annähme. Nun hat die Summe in (19.1) für das mikrokanonische Ensemble (18.20) den Wert
h
i
S = kB ln Ω(Ē, N, V )∆E = Smikro (Ē, V, N )
(19.4)
während Sie für das kanonische Ensemble (18.25) leicht
S = kB β Ē + kB ln Z = Skan (β, V, N ),
Ē = hHi
(19.5)
finden. Wir müssen uns eilends von der Gleichheit der rechten Seiten in (19.4)
und (19.5) überzeugen. Die Gleichheit muß übrigens bestehen ungeachtet der
319
320
19 Thermodynamische Variable
schon mehrfach angesprochenen Tatsache, daß beim mikrokanonischen Vorgehen
die Variablen Ē, N, V als die natürlichen erscheinen, während im kanonischen
Fall die mittlere Energie Ē durch β ersetzt ist. Übrigens spricht man von Ē
und β oft als von einem konjugierten Paar. Nun zum Bewies der Gleichheit
Smikro = Skan .
Dazu betrachten wir die kanonische Zustandssumme
Z∞
X
−βEn
Z=
≈ dE Ω(E)e−βE
e
(19.6)
n
E0
und erinnern uns der in 18.5 gewonnenen Erkenntnis, dass das Produkt der
Zustandsdichte Ω(E) mit dem Boltzmannfaktor ein extrem scharfes Maximum
bei E = Ē aufweist. Da die Breite der Funktion Ω(E) exp(−βE) unterhalb des
Maximums in etwa der Streuung der Energie gleich ist, kann die Zustandssumme
durch die Näherung
Z ≈ Ω(Ē) e−β Ē Str(H)
(19.7)
nicht um Größenordnungen verfälscht werden. Tragen wir die entsprechende
Näherung für in Z in (19.5) ein, so erhalten wir
h
i
S ≈ kB ln Ω(Ē) Str(H) .
(19.8)
Der Unterschied dieses Resultats zu (19.4) ist sicher vernachlässigbar: da ln Ω(Ē)
∝ N , während ln Str(H) ∝ ln N und die Dicke ∆E der Energieschale allerhöchstens ∝ N sind, ist der relative Unterschied der in (19.4) und (19.8) gegebenen
Größen von der Ordnung (ln N )/N . Werten wir schließlich die Definition (19.1)
der Entropie im großkanonischen Ensemble (18., (18.40)) aus, so ergibt sich
S = kB ln ZG + kB β Ē − kB βµN̄ = Sgroß (β, µ, V ).
(19.9)
Die Übereinstimmung der so berechneten Entropie mit der aus den beiden
anderen Ensembles gewonnenen für Vielteilchensysteme liegt daran, dass die
Teilchenzahl ebenso wie die Energie im großkanonischen Ensemble nur winzige Schwankungen aufweist. Der Nachweis der Übereinstimmung verläuft ganz
ähnlich wie der oben dargestellte Nachweis der Äquivalenz von (19.4) und (19.5)
und bleibt Ihnen zur Übung überlassen. Würdigen Sie im Übrigen die Tatsache,
dass die großkanonisch berechntete Entropie als Funktion der Variablen β, µ, V
erscheint; gegenüber dem kanonischen Fall ist die Teilchenzahl durch das zu ihr
konjugierte chemische Potential ersetzt.
Aus der Definition (19.1) folgt unmittelbar, dass die Entropie additiv ist in
den Beiträgen unabhängiger Untersysteme. Benennen wir nämlich die Energieniveaus zweier unabhängiger Untersysteme mit Eν1 und Eµ2 , die entsprechenden Besetzungswahrscheinlichkeiten mit w1 (Eν1 ) und w2 (Eµ2 ), so haben wir als
sowohl-als-auch-Wahrscheinlichkeit das Produkt
w(Eν1 , Eµ2 ) = w1 (Eν1 ) w2 (Eµ2 )
(19.10)
und somit für die Gesamtentropie die Summe
#
"
X
X
1
2
1
2
S = −kB
w1 (Eν ) ln w1 (Eν ) +
w2 (Eµ ) ln w2 (Eµ ) = S1 + S2 . (19.11)
ν
µ
19.1 Entropie
321
Ludwigs Boltzmann’s Pioniertat bestand unter anderem darin, die vorher im
phänomenologischen Kontext gebräuchliche Entropie eines thermischen Gleichgewichtszustands mit der Wahrscheinlichkeit dafür zu verknüpfen, in einem Ensemble makroskopisch identischer Systeme irgendeine der vielen Orts- und Impulskonfigurationen zu finden, die mit den makroskopisch feststellbaren Eigenschaften des Systems verträglich sind. Boltzmann’s Überlegungen bleiben weitgehend unberührt davon, dass wir heute die mikroskopische Dynamik quantenmechanisch statt klassisch beschreiben und von Energieniveaus statt von Ortsund Impulskonfigurationen sprechen. Der Zusammenhang zwischen Entropie
und Wahrscheinlichkeit ist am unmittelbarsten aus der mikrokanonischen Form
(19.4) ersichtlich, da 1/Ω(Ē)∆E gerade die Wahrscheinlichkeit darstellt, eines
der Ω(Ē)∆E Energieniveaus innerhalb der Schale ∆E bei Ē besetzt anzutreffen.
Die Bedeutung der Entropie für die phänomenologische Thermodynamik
fußt auf einer Extremaleigenschaft. Die Definition (19.1) verlangt, dass die Besetzungswahrscheinlichkeiten einem Gleichgewichtsensemble entsprechen. Formal können wir auch eine Nichtgleichgewichtsentropie S 0 definieren, indem wir
(19.1) für Nichtgleichgewichtsbesetzungen wν verwenden,
X
wν ln wν .
(19.12)
S 0 = −kB
ν
0
Diese Nichtgleichgewichtsentropie S kann nie größer sein als die Gleichgewichtsentropie desselben Systems,
S0 ≤ S .
(19.13)
Wir beweisen die außerordentlich wichtige Ungleichung (19.13), indem wir
zunächst die Besetzungswahrscheinlichkeit wν als variable Parameter ansehen
und S 0 bezüglich derselben extremalisieren. Bei jeder Variation der wν muss
natürlich die Normierung
X
wν = 1
(19.14)
ν
gewahrt bleiben; unverändert bleiben soll auch die Gesamtenergie des Systems.
Die Extremalisierung von S 0 unter den beiden Nebenbedingungen konstanter
Normierung und Energie kann dadurch erfolgen, dass wir zwei Lagrangemultiplikatoren kB β und kB (ln Z − 1) einführen∗) , die Funktion
X
X
wν
(19.15)
wν Eν − kB (ln Z − 1)
S 0 − kB β
ν
ν
ohne Nebenbedingungen extremalisieren und die beiden Parameter Z und β
zuletzt durch die Forderungen (19.14) und
X
Ē =
w ν Eν
(19.16)
ν
festlegen. Bei infinitesimaler Änderung der wν darf sich die in (19.15) gegebene
Funktion nicht ändern, da sie einen Extremalwert annehmen soll,
X
δwν (ln wν + βEν + ln Z) = 0 .
(19.17)
−kB
ν
∗) Die Benennung dieser Lagrangemultiplikatoren mag unnötig kompliziert aussehen, wird
sich aber im Ergebnis (19.18) als zweckmäßig herausstellen
322
19 Thermodynamische Variable
Wegen der Unabhängigkeit der δwν muss die Klammer für jedes ν verschwinden,
und es folgt
wν = Z −1 e−βEν .
(19.18)
Wir schließen, dass bei Vorgabe der mittleren Energie durch (19.16) die Größe
S 0 genau dann den Extremalwert S annimmt, wenn die Besetzungsverteilung
der Energieniveaus die des kanonischen Gleichgewichtsensembles ist. Der Parameter β erscheint hier in der Rolle eines Lagrangemultiplikators, der die mittlere
Energie festlegt.
Anstatt mit Hilfe eines Lagrangemultiplikators können wir die Gesamtenergie auch dadurch vorgeben, dass wir nur solche wν als von Null verschieden
zulassen, die zu Energieniveaus Eν innerhalb einer Schale der Dicke ∆E bei Ē
gehören. Die Extremalisierung von S 0 mit der Nebenbedingung (19.14) führt
dann zu der Forderung
−kB
Schale
X
δwν (ln wν + ln Z) = 0 ,
(19.19)
ν
also genau zur mikrokanonischen Verteilung wν = 1/Z = const. Die mikrokanonische Zustandssumme“ ist natürlich gleich der Zahl Ω(Ē)∆E der Energie”
eigenzustände mit Energien innerhalb der Schale.
Nachdem wir uns davon überzeugt haben, dass der im thermischen Gleichgewicht vorliegende Extremalwert der Größe S 0 gleich der Entropie S ist, müssen
wir zur Vervollständigung des Beweises der Ungleichung (19.13) noch zeigen,
dass das Extremum von S 0 ein Maximum ist. Das aber ist einfach, denn zweimaliges Differenzieren nach einem wµ in (19.12) gibt
∂2S0
= −kB /wµ < 0 .
∂wµ2
19.2
(19.20)
Temperatur
In einer ersten Nutzung der soeben erklärten Extremaleigenschaft der Entropie denken wir uns zwei zunächst getrennte abgeschlossene Vielteilchensysteme;
beide seien für sich im Gleichgewicht. Die respektiven Energien und Entropien
seien e1 und e2 bzw. S1 (e1 ) und S2 (e2 ). Sodann denken wir uns die zwei Systeme in Kontakt gebracht derart, dass die Gesamtenergie und die äußeren Parameter (insbesondere die beiden Volumina und Teichenzahlen) konstant bleiben,
Energieaustausch zwischen den beiden Systemen jedoch möglich wird.
Ein Kontakt der geschilderten Art heißt thermischer Kontakt und die gegebenenfalls ausgetauschte Energie heißt Wärme. Zwar i. A. nicht zu Beginn des
Kontakts, aber erfahrungsgemäß doch nach hinreichend langer Zeit wird das
vereinigte System im thermischen Gleichgewicht sein. Die vorher getrennten
Teile werden die Energie Ē1 , Ē2 mit der Summe
Ē = Ē1 + Ē2 = e1 + e2
(19.21)
und die Entropien S1 (Ē1 ), S2 (Ē2 ) haben. Die Gesamtentropie des vereinigten
Systems zu Beginn des Kontakts,
S 0 = S1 (e1 ) + S2 (Ē − e1 ) ,
(19.22)
19.2 Temperatur
323
und die schließlich erreichte Gleichgewichtsentropie
S 0 = S1 (Ē1 ) + S2 (Ē − Ē1 )
(19.23)
S0 ≤ S .
(19.24)
erfüllen die Ungleichung
Darüber hinaus erreicht S 0 als Funktion von e1 im Gleichgewicht, also für e1 =
Ē1 , ihren Maximalwert S, und es gilt die Gleichgewichtsbedingung
¸
·
∂S1 (Ē1 ) ∂S2 (Ē2 )
δe1 = 0 ,
(19.25)
δS 0 (Ē1 ) =
−
∂ Ē1
∂ Ē2
also
∂S1 (Ē1 )
∂S2 (Ē2 )
=
.
∂ Ē1
∂ Ē2
(19.26)
Das Inverse der hier auftretenden Größe
∂S
1
≡
∂E
T
(19.27)
nennen wir die absolute Temperatur. Zwei Systeme in thermischem Kontakt
können nach (19.26) nur bei Gleichheit ihrer Temperaturen im Gleichgewicht
sein.
Stimmen die Temperaturen T1 und T2 zweier Systeme bei Herstellung thermischen Kontakts nicht überein, so fließt Wärme vom wärmeren System (dem
mit der höheren Temperatur) zum kälteren, bis die Temperaturen angeglichen
sind. Die Richtigkeit dieser Ihnen auch aus dem Alltag geläufigen Aussage folgt
aus der Ungleichung (19.13). Bilden wir nämlich die Differenz S −S 0 aus (19.22)
und (19.23), der Einfachheit halber für den Fall infinitesimaler Abweichung vom
Gleichgewicht, so entsteht die Ungleichung
∂S20 (e2 )
∂S10 (e1 )
(Ē1 − e1 ) +
(Ē2 − e2 ) > 0 .
∂e1
∂e2
(19.28)
Da anfänglich jedes Teilsystem für sich im Gleichgewicht sein soll, bedeutet
(19.28)
¶
µ
1
1
−
(Ē1 − e1 ) > 0 .
(19.29)
T1
T2
Sie lesen ab, dass das erste Teilsystem Wärme aufnimmt, Ē1 − e1 > 0, falls es
anfänglich kälter ist als das zweite, T1 < T2 .
Sie können nun den schon erwähnten Zusammenhang des Parameters β,
der im kanonischen Ensemble die mittlere Energie fixiert, mit der absoluten
Temperatur T erkennen. Differenzieren wir den kanonischen Ausdruck (19.5),
also S(β, N, V ) = kB β Ē + kB ln Z, für die Entropie nach der mittleren Energie,
so ergibt sich
1
∂S
= kB β ,
=
T
∂ Ē
324
19 Thermodynamische Variable
also
β = 1/kB T .
(19.30)
Doch halt! Die vorstehende partielle Ableitung bedarf eines Kommentars!
Die kanonische Form der Entropie erscheint als Funktion von β, N, V . Beim
partiellen Differenzieren nach der Energie Ē sind Teilchenzahl N und Volumen
V konstant zu halten; die Variable β ist dann als Funktion der Energie Ē anzusehen, so dass gilt
∂S
1
=
T
∂ Ē
(19.31)
= kB β + kB Ē
∂β
∂ ln Z
+ kB
.
∂ Ē
∂ Ē
(19.32)
Jedoch heben sich die beiden letzten Terme in vorstehender Gleichung auf, wegen ∂ ln Z/∂ Ē = (∂ ln Z/∂β)(∂β/∂ Ē) = −Ē(∂β/∂ Ē), so dass die kavaliersartig
schnelle Rechnung im vorstehenden Absatz doch nicht falsch war!
Für den Grenzfall beliebig großer Temperatur entnehmen wir (19.30) und
der kanonischen Besetzungsverteilung
w(Eν ) = Z −1 e−βEν ,
(19.33)
dass die Besetzungswahrscheinlichkeiten für alle Energieniveaus gleich werden.
Hingegen ist für den Grenzfall T → 0 ersichtlich, dass nur das niedrigste Energieniveau besetzt ist; thermisches Gleichgewicht am absoluten Nullpunkt der
Temperatur bedeutet für jedes System sicheren Aufenthalt im Grundzustand.
Es folgt, sofern der Grundzustand nicht entartet ist, dass die Entropie am absoluten Nullpunkt verschwindet,
S→0
für
T →0.
(19.34)
Dieses Resultat ist als dritter Hauptsatz der Thermodynamik bekannt.
Einen ebenfalls aufschlussreichen Zusammenhang zwischen der absoluten
Temperatur, der mittleren Energie Ē und der Niveaudichte Ω(Ēν ) erhalten wir,
wenn wir in (19.27) den mikrokanonischen Ausdruck (19.4) für die Entropie
benutzen,
1
∂ ln Ω(Ē)∆E
= kB
.
T
∂ Ē
(19.35)
Da für Vielteilchensysteme ein starkes Anwachsen der Niveaudichte bei zunehmender Energie typisch ist, können wir folgern, dass solche Systeme keine negativen Temperaturen annehmen können,
T ≥0.
(19.36)
Insofern das Anwachsen der Niveaudichte mit der Energie qualitativ durch
Ω(Ē) = A Ē aN
(19.37)
beschrieben werden kann (wobei a für hinreichend verdünnte Gase von der
Größenordnung Eins ist), dürfen wir aus (19.35) schließen, dass die absolute
Temperatur über die Relation
Ē = aN kB T
(19.38)
19.3 Druck
325
die Größenordnung der mittleren Energie pro Freiheitsgrad eines Vielteilchensystems misst.
Eine weitere, historische Bemerkung ist am Platze. Wir haben durch Einführung der Boltzmannkonstanten in (19.1) der Entropie die Dimension einer
Energie zugewiesen. Als Konsequenz dieser Konvention wird die Temperatur
zu einer dimensionslosen Variablen. Der Zahlenwert der Boltzmannkonstanten
geht übrigens zurück auf eine (inzwischen überholte) Definition der Temperaturskala, bei der dem Schmelz- und dem Siedepunkt von H2 O unter gewissen
Normalbedingungen“ die Temperatur 0◦ Celsius bzw. 100◦ Celsius zugeschrie”
ben werden. Diese Celsius’sche Temperatur T (c) ist mit der in Grad Kelvin angegebenen absoluten Temperatur verknüpft durch die Übereinkunft, dass Temperaturdifferenzen in beiden Skalen numerisch gleich sind und dass 0◦ Celsius
der absoluten Temperatur 273, 15◦ Kelvin entspricht,
T = T (c) + 273, 15 .
(19.39)
Mit den beschriebenen Konventionen für Dimensionen und Einheiten wäre völlig
gleichwertig eine Übereinkunft, die Temperatur mit der Dimension einer Energie
auszustatten und somit die Entropie als dimensionslose Variable zu definieren.
Wegen des innigen Zusammenhangs von Entropie und Wahrscheinlichkeit und
weil die Temperatur gemäß (19.38) ein grobes Maß für die mittlere Energie
darstellt, wäre eine derartige Konvention sogar recht naheliegend. Aber einer
kleinen Zweckmäßigkeit wegen verwerfen wir nicht schnöde eine liebe Tradition.
19.3
Druck
In Gefäßen eingesperrte Systeme üben i. A. Kräfte auf die Gefäßwände aus. Die
Kraft pro Flächeneinheit der Gefäßwand wird als Druck bezeichnet. Sie kennen
die elementare gaskinetische Vorstellung, die den Druck eines Gases erklärt als
den Impulsübertrag auf das Gefäß bei der unaufhörlichen Folge von Stößen der
Teilchen im Gas gegen die Wand. Hier will ich Ihnen die allgemeine quantenstatistische Methode zur Berechnung des Drucks eines Systems im thermischen
Gleichgewicht erklären.
Liegt das fragliche System in einem Energieeigenzustand ψν mit der Energie
Eν vor, so bezeichnen wir als seinen Druck die Größe
pν = −
∂Eν
.
∂V
(19.40)
Dieser Druck könnte im Prinzip gemessen werden über die infinitesimale Änderung der Energie Eν (V ) bei sehr langsamer Änderung des Volumens um dV ; die
Volumenänderung hätte so langsam zu erfolgen, dass das System den Energieeigenzustand zur laufenden“ Energie Eν (V ) nicht verlässt. Die experimentelle
”
Vorgabe der Energie eines Vielteilchensystems bedeutet allerdings i. A. nicht die
Präparation genau eines Energieeigenzustandes, vielmehr die Herstellung eines
Gemisches, in dem der Zustand ψν mit der relativen Häufigkeit w(Eν ) auftritt.
Der Druck ist dann als statistisches Mittel über die pν zu berechnen,
p=−
X
ν
w(Eν )
∂Eν
.
∂V
(19.41)
326
19 Thermodynamische Variable
Die Auswertung der Summe (19.41) gestaltet sich besonders einfach, wenn
die kanonische Zustandssumme
Z∞
X
−βEν
(19.42)
≈ dE Ω(E, V ) e−βE
e
Z(T, V ) =
ν
E0
als Funktion der Temperatur und des Volumens schon bekannt ist, denn für das
kanonische Ensemble gilt
µ
¶
X
∂Z
∂Eν
= β −1 Z −1
p = −Z −1
,
(19.43)
e−βEν
∂V
∂V T
ν
also
βp =
µ
∂ ln Z
∂V
¶
.
(19.44)
T
Hier soll der Index T an der rechten Seite andeuten, dass die Differenziation nach
dem Volumen bei konstanter Temperatur erfolgen muss. Die Relation (19.44)
gibt den Druck als Funktion von Temperatur und Volumen (sowie ggf. weiterer
äußerer Parameter, die jedoch bei den von uns zu behandelnden Systemen nicht
auftreten). Sie wird die Zustandsgleichung des Systems genannt.
Statt der kanonischen Zustandssumme Z können wir in (19.44) mit Hilfe
von (19.5) die Entropie S und die mittlere Energie Ē einführen,
·µ
¶
µ
¶ ¸
∂S
1 ∂ Ē
p=T
.
(19.45)
−
∂V T
T ∂V T
Beachten Sie, dass die Entropie in (19.45) als Funktion des Volumens und der
beim Differenzieren nach V konstant zu haltenden Temperatur anzusehen ist.
Tatsächlich ist es üblich, S als Funktion von V und der mittleren Energie Ē
anzugeben. Die Identität
µ
µ
µ
¶
¶
µ
¶ µ
¶
¶
µ
¶
∂S
∂S
∂S
∂ Ē
1 ∂ Ē
∂S(Ē, V )
=
=
+
+
∂V
∂V Ē
∂V Ē T ∂V T
∂ Ē V ∂V T
T
(19.46)
erlaubt, diesem Brauch zu folgen und die Zustandsgleichung (19.45) zu
µ
¶
∂S
p=T
(19.47)
∂V Ē
zu vereinfachen.
Verwenden wir in (19.47) den mikrokanonischen Ausdruck (19.4) für die
Entropie, so erscheint der Druck als durch die Niveaudichte Ω(E, V ) gegeben,
p = kB T
∂ ln Ω(Ē, V )
.
∂V
(19.48)
Schließlich können wir den Druck auch mit Hilfe des großkanonischen Ensembles
berechnen, d. h. durch die großkanonische Zustandssumme
XX
ZG (T, V, µ) =
e−β(Eν −µN )
(19.49)
N
ν
19.4 Chemisches Potential
327
ausdrücken. Eine Nebenrechnung, die zu der in (19.43) ausgeführten völlig
parallel läuft,
¶
µ
X
∂Eν
∂ZG
−1
−1
p = −ZG
e−β(Eν −µN )
,
(19.50)
= β −1 ZG
∂V
∂V T,µ
N,ν
gibt statt (19.44)
βp =
µ
∂ ln ZG
∂V
¶
.
(19.51)
T,µ
Hieraus ergibt sich p als Funktion von V , T und des chemischen Potentials µ.
Die letztere Größe kann gemäß
µ
¶
∂ ln ZG
N̄ = kB T
(19.52)
∂µ
T,V
zugunsten der mittleren Teilchenzahl aus der Zustandsgleichung eliminiert werden.
Ihnen sollte hinlänglich klar sein, dass die drei Formen (19.44, kanonisch),
((19.48), mikrokanonisch) und ((19.51), großkanonisch) der Zustandsgleichung
für Vielteilchensysteme miteinander äquivalent sind. Die Freiheit, beim Aufstellen der Zustandsgleichung von Vielteilchen systemen irgendeines der drei
Ensembles benutzen zu dürfen, wird uns im folgenden viel unerfreuliche Rechenarbeit zu sparen erlauben.
19.4
Chemisches Potential
Das chemische Potential µ war uns in 18.6 bei der Einführung des großkanonischen Ensembles als ein Parameter begegnet, mit dessen Hilfe die mittlere
Teilchenzahl im Ensemble festgelegt wird. In genau diesen Hilfsdienst werden
wir µ im nächsten Kapitel stellen. Hier will ich Ihnen erläutern, dass das chemische Potential auch eine eigene physikalische Bedeutung hat.
Wenn bei festem Volumen (und sonstigen äußeren Parametern) sowie konstanter Entropie die Teilchenzahl geändert wird, so ändert sich die Energie
gemäß
¶
µ
∂ Ē
=µ.
(19.53)
∂N S,V
Zum Beweis dieser Eigenschaft des chemischen Potentials greifen wir auf den
großkanonischen Ausdruck für die Entropie (19.9) zurück und schreiben denselben in differenzieller Form,
dS = kB d(ln ZG ) +
1
1
1
(−Ē + µN ) dT + dĒ − (N̄ dµ + µ dN̄ ) . (19.54)
T2
T
T
Nun ist die großkanonische Zustandssumme definiert als eine Funktion der Variablen T , V (über die Energiewerte) und µ. Ihr allgemeines Differential lautet
also
µ
¶
¶
¶
µ
µ
∂ ln ZG
∂ ln ZG
∂ ln ZG
d ln ZG =
dT +
dV +
dµ . (19.55)
∂T
∂V
∂µ
V,µ
T,µ
T,V
328
19 Thermodynamische Variable
Die hier auftretenden Koeffizienten von dV und dµ hatten wir in (19.51) bzw.
(19.52) bereits als βp bzw. β N̄ identifiziert, während sich der Koeffizient von
dT aus (18.42) als (Ē − µN̄ )/kB T 2 ergibt. Damit erhalten wir für das Entropiedifferential (19.54) den Ausdruck
T dS = dĒ + pdV − µdN̄ ,
(19.56)
aus dem Sie die Relation (19.53) sowie die analoge Eigenschaft des Drucks
µ
¶
∂ Ē
p=−
(19.57)
∂V S,N
entnehmen.
Zwischen dem chemischen Potential und dem Druck besteht insofern eine
Analogie, als beide Größen die isentropische (dS = 0) Antwort der mittleren Energie auf die differenzielle Änderung eines äußeren Parameters, nämlich
Teilchenzahl bzw. Volumen, angeben. (Man spricht auch von generalisierten
Kräften; die äußeren Parameter wären dann als generalisierte Koordinaten zu
bezeichnen.) Dementsprechend gilt für das chemische Potential auch eine zu
unserer Definition des Druckes (19.41) analoge Relation,
µ=
X
ν,N
w(EνN )
∂EνN
.
∂N
(19.58)
Zum Beweis von (19.58) verwenden wir das großkanonische Ensemble. Die
rechte Seite erlaubt dann folgende Umformung
µ
¶X
∞
1
∂ X −βEνN
1 X −β(EνN −µN ) ∂EνN
e
=−
.
eβµN
e
ZG
∂N
βZG
∂N ν
ν,N
Hierin ist
P
ν
N =0
exp(−βEνN ) ≡ Z(N ) die kanonische Zustandssumme bei fixer
Teilchenzahl N . Die Ableitung dieser Größe nach N können wir approximieren
als
¤
1 £
∂
Z(N ) ≈
Z(N ) − Z(N − δN ) ,
∂N
δN
(19.59)
wobei δN irgendeine im Vergleich zur mittleren Teilchenzahl N̄ winzige Zahl
sein darf. Die rechte Seite von (19.58) nimmt dann folgende Form an
−
µ
1
βZG
¶
∞
¤
1 X −βµN £
e
Z(N ) − Z(N − δN )
δN
N =0
"
#
¶
µ
X
1
1
βµN
ZG −
=−
e
Z(N − δN )
βZG δN
N
≈−
1 1
(1 − eβµδN ) .
β δN
(19.60)
Das letzte Glied in der Gleichungskette (19.60) entsteht nach Einführung der
neuen Summationsvariablen N 0 = (N − δN ) in exzellenter Näherung, da die
19.4 Chemisches Potential
329
Teilchenzahlsumme im vorletzten Glied erhebliche Beiträge nur für Werte von
N in Nähe der mittleren Teilchenzahl N̄ erhält. Im Grenzübergang δN → 0
ergibt sich schließlich in (19.60) das chemische Potential µ.
Nachdem nun die enge Verwandtschaft von Druck und chemischem Potential ausführlich gewürdigt worden ist, verdient auch ein kleiner Unterschied Aufmerksamkeit, das negative Vorzeichen in der Definition des Drucks. Es sorgt
dafür, dass Systeme im Gleichgewicht einen positiven Druck haben. Warum
wäre im Umgang mit großen Systemen mit negativem Druck äußerste Vorsicht
geboten?
330
19 Thermodynamische Variable
Kapitel 20
Ideale Gase
20.1
Ununterscheidbarkeit identischer Teilchen
Beim Beobachten der Bewegung mehrerer identischer klassischer Teilchen (z. B.
Billardkugeln) kann man immer, jedenfalls im Prinzip, die einzelnen Teilchen
unterscheiden: jedes der im übrigen gleichen Teilchen durchläuft seine eigene
Bahnkurve und kann an derselben jederzeit identifiziert werden. Bei Quanten
hingegen ist diese Unterscheidungsmöglichkeit nicht gegeben, da wegen des Wellencharakters der Bewegung von einer Bahnkurve gar nicht gesprochen werden
kann. Tatsächlich sind identische Quanten (wie die 47 Elektronen in der Hülle
eines Silberatoms, die Natriumatome in einem Salzkorn, die beiden Wasserstoffatome in einem Wasserstoffmolekül . . .) auf keine Weise voneinander unterscheidbar. Ich will Ihnen hier einige der drastischen Konsequenzen der Ununterscheidbarkeit identischer Quanten vorstellen.
Betrachten wir zunächst zwei identische Teilchen, die durch die Wellenfunktion Φ(~x1 , ~x2 ) beschrieben werden. Das Absolutquadrat |Φ(~x1 , ~x2 )|2 gibt die
Wahrscheinlichkeitsdichte dafür, eines der Teilchen bei ~x1 und das andere bei
~x2 zu finden. Die Ununterscheidbarkeit der beiden Teilchen macht die Frage, welches von ihnen bei ~x1 angefunden wird, unbeantwortbar. Dementsprechend muss die Wahrscheinlichkeitsdichte |Φ(~x1 , ~x2 )|2 symmetrisch unter Vertauschung der Koordinatentripel ~x1 und ~x2 sein,
|Φ(~x1 , ~x2 )|2 = |Φ(~x2 , ~x1 )|2 .
(20.1)
Ein etwaiger Unterschied |Φ(~x1 , ~x2 )|2 von |Φ(~x2 , ~x1 )|2 würde nämlich bedeuten,
dass zwei verschiedene und verschieden wahrscheinliche Ereignisse des Typs ein
”
Teilchen wird bei ~x1 , das andere bei ~x2 registriert“ möglich sind und somit eine
Unterscheidbarkeit der beiden Teilchen begründen.
Die Symmetrie der Wahrscheinlichkeitsdichte erzwingt, dass die Wellenfunktion Φ(~x1 , ~x2 ) entweder symmetrisch oder antisymmetrisch ist,
Φ(~x1 , ~x2 ) = ±Φ(~x2 , ~x1 ) .
(20.2)
Beide Möglichkeiten kommen in der Natur vor. Die Erfahrung lehrt, dass
die Wellenfunktionen identischer Fermiteilchen (d. h. Teilchen mit halbzahligem
Spin wie Elektronen, Protonen, Neutronen etc.) ausnahmslos antisymmetrisch
331
332
20 Ideale Gase
sind, während die Koordinaten identischer Boseteilchen (Teilchen mit ganzzahligem Spin wie α-Teilchen, π-Mesonen etc.) stets symmetrisch in der Wellenfunktion auftreten. Diese Eigenart von Bosonen und Fermionen ist nicht nur
bei Zweiteilchensystemen gegeben. Liegen N identische Teilchen vor, so gilt
Φ(~x1 . . . ~xi . . . ~xj . . . ~xN ) =
(
+Φ(~x1 . . . ~xj . . . ~xi . . . ~xN )
für Bosonen
−Φ(~x1 . . . ~xj . . . ~xi . . . ~xN )
für Fermionen
(20.3)
bezüglich aller N (N − 1)/2 Paare von Koordinatentripeln.
Zur weiteren Erläuterung des Prinzips der Ununterscheidbarkeit betrachten
wir zwei freie und nicht wechselwirkende identische Teilchen. Der Hamiltonoperator ist rein kinetischer Natur,
H=
1 2
(~
p + p~22 ) .
2m 1
(20.4)
Die Schrödingergleichung
i~Φ̇(~x1 , ~x2 , t) = HΦ(~x1 , ~x2 , t)
(20.5)
kann durch den Separationsansatz ψ(~x1 , t)ϕ(~x2 , t) gelöst werden, wobei sich die
Einteilchenwellenfunktionen ψ(~x, t) und ϕ(~x, t) als ebene Wellen exp(i~k · ~x −
iE~k t/~) und E~k = ~2 k 2 /2m (oder Linearkombinationen solcher ebener Wellen)
erweisen. Allerdings kommen in der Natur keine Zustände vor, die das Produkt
ψ(~x1 )ϕ(~x2 ) als Wellenfunktion hätten. Wohl aber entspricht das symmetrisierte
Produkt
£
¤
ΦS (~x1 , ~x2 , t) = N ψ(~x1 , t)ϕ(~x2 , t) + ψ(~x2 , t)ϕ(~x1 , t)
(20.6)
einem möglichen Zustand zweier identischer Bosonen und das antisymmetrisierte Produkt
£
¤
ΦA (~x1 , ~x2 , t) = N ψ(~x1 , t)ϕ(~x2 , t) − ψ(~x2 , t)ϕ(~x1 , t)
(20.7)
einem möglichen Zustand zweier identischer Fermionen. Der in (20.6) und (20.7)
auftretende Normierungsfaktor N garantiert, dass die Zweiteilchenwellenfunktionen auf Eins normiert sind, wenn die Einteilchenwellenfunktionen diese Eigenschaft haben,
Z
Z
Z
Z
2
2
2
d3 x1 d3 x2 |ΦA,S (~x1 , ~x2 , t)| = d3 x1 |ψ(~x1 , t)| = d3 x2 |ϕ(~x1 , t)| = 1 .
(20.8)
√
Insbesondere hat der Normierungsfaktor den Wert N = 1/ 2, falls die beiden
Einteilchenwellenfunktionen orthogonal sind.
Aus (20.7) erkennen Sie, dass zwei identische Fermionen nicht in einunddemselben Einteilchenzustand sitzen können: für ψ = ϕ verschwindet das antisymmetrisierte Produkt ΦA Diese Konsequenz der Ununterscheidbarkeit identischer
Quanten ist als das Pauliprinzip bekannt. Für Bosonen besteht hingegen kein
Verbot der Mehrfachbesetzung eines Einteilchenzustandes.
20.1 Ununterscheidbarkeit identischer Teilchen
333
Sie sollten sich überlegen, dass aus drei normierten Einteilchenwellenfunktionen ϕ(~x), ψ(~x) und χ(~x) nur die folgenden (normierten) Dreiteilchenwellenfunktionen
1 £
ΦSA (~x1 , ~x2 , ~x3 ) = √ ϕ(~x1 )ψ(~x2 )χ(~x3 ) ± ϕ(~x1 )ψ(~x3 )χ(~x2 )
6
± ϕ(~x2 )ψ(~x1 )χ(~x3 ) + ϕ(~x2 )ψ(~x3 )χ(~x1 )
¤
±ϕ(~x3 )ψ(~x2 )χ(~x1 ) + ϕ(~x3 )ψ(~x1 )χ(~x2 )
(20.9)
gebildet werden können. Lesen sie wieder ab, dass ΦA verschwindet, wenn
zwei oder gar alle drei Einteilchenwellenfunktionen übereinstimmen, während
in ΦS Doppel- oder gar Dreifachbesetzung
√ eines Einteilchenzustandes durchaus
erlaubt ist. (Der Normierungsfaktor 1/ 6 ist allerdings nur für normierte und
wechselseitig orthogonale ϕ, ψ, χ richtig; suchen Sie den Normierungsfaktor für
die bei Bosonen möglichen Mehrfachbesetzungen ϕ = ψ ⊥ χ und ϕ = ψ = χ.)
Sie werden im Folgenden lernen, dass die verschiedene Besetzbarkeit von Einteilchenzuständen durch identische Fermionen (höchstens einfach) und Bosonen
(keine Beschränkung) sich makroskopisch manifestiert in verschiedenem Tieftemperaturverhalten von Gasen aus identischen Fermi- und Boseteilchen.
Denken wir uns nochmals zwei Identische Quanten ohne Wechselwirkung.
~ verschiedenen Orten lokalisiert, bezüglich dieser
Sie seien an um den Vektor X
Orte jedoch jedes für sich durch dieselbe Einteilchenwellenfunktion ψ beschrieben. Als gemeinsame Zweiteilchenwellenfunktion kommt nun nicht das Produkt
~ in Frage, sondern für Bosonen das symmetrisierte und für Ferψ(~x1 )ψ(~x2 − X)
mionen das antisymmetrisierte Produkt
i
1 h
~ ± ψ(~x1 − X)ψ(~
~
x2 ) .
(20.10)
ΦSA (~x1 , ~x2 ) = √ ψ(~x1 )ψ(~x2 − X)
2
Die entsprechende Wahrscheinlichkeitsdichte dafür, beide Teilchen am gleichen
Ort ~x zu finden, |Φ(~x, ~x)|2 , verschwindet offenbar für Fermionen (Pauliprinzip!)
während sie für Bosonen das Doppelte des Wertes beträgt, den sie für unter~ hätte.
scheidbare Teilchen, d. h. Φ = ψ(~x1 )ψ(~x2 − X),
Noch eine andere Erkenntnis ziehen wir aus (20.10). Sie müssen nicht ein auf
Ihrer Nasenspitze sitzendes Proton und ein anderes im Barte Ihres Großvaters
durch eine Wellenfunktion beschreiben, die antisymmetrisch unter Vertauschung
der respektiven Koordinatentripel ist. Ist nämlich die Wellenfunktion ψ(~x) in
(20.10) auf Eins normiert, so muss sie für hinreichend großes |~x| nach Null gehen.
Sei etwa |ψ(~x)|2 für |~x| > R auf vernachlässigbar kleine Werte abgefallen. Falls
~ den Radius“ R des
in der Zweiteilchenwellenfunktion (20.10) der Abstand |X|
”
Wellenpakets ψ überschreitet,
~ ÀR,
|X|
(20.11)
so können nie beide Summanden in (20.10) zugleich merklich von Null verschieden sein. Statt durch (20.10) können die beiden Teilchen dann durch das
Produkt
~
Φ(~x1 , ~x2 ) = ψ(~x1 )ψ(~x2 − X)
(20.12)
beschrieben werden, u. z. unabhängig davon, ob es sich um Bosonen oder Fermionen handelt.
334
20 Ideale Gase
Die soeben vorgestellte Überlegung erlaubt uns eine Abschätzung der Temperatur, unterhalb derer in einem idealen Gas identischer Teilchen die quantenmechanische Ununterscheidbarkeit derselben merklich wird, oberhalb derer
sich demnach auch Bose- und Fermigase gleich verhalten. Sie wissen bereits (s.
19.2), dass die Größenordnung der mittleren Energie pro Teilchen eines Gases
durch die Temperatur T festgelegt ist über E ≈ kB T . Diese Energie ist beim
idealen Gas rein kinetisch, so √
dass der Betrag des mittleren Impulses eines Teilchens von der Ordnung p ≈ mkB T ist. Die zugehörige Wellenlänge ~/p, die
thermische de Broglie Wellenlänge
p
λth = 2π~2 /mkB T ,
(20.13)
gibt die Größenordnung der prinzipiellen Grenze für die Lineardimension, mit
der wir uns die Teilchen des Gases räumlich lokalisiert denken dürfen. Wenn
der mittlere Teilchenabstand l ≈ (V /N )1/3 viel größer ist als die typische Ortsunschärfe (20.13) eines Teilchens,
l À λth ,
(20.14)
so können Quanteneffekte wie die Ununterscheidbarkeit identischer Teilchen
vernachlässigt werden. Dieser klassische Grenzfall wird für hinreichende Verdünnung und/oder genügend hohe Temperaturen erreicht. Aus der Gleichung
l = λth erhalten Sie die Temperatur, unterhalb welcher sich Quanteneffekte, also auch der Unterschied zwischen Bosonen und Fermionen deutlich bemerkbar
machen.
20.2
Thermische Photonen
(Plancksches Strahlungsgesetz)
Wir betrachten das elektromagnetische Feld im Innern eines Hohlraumes. Die
Atome in den Wänden, die den Hohlraum umschließen, emittieren und absorbieren fortwährend elektromagnetische Strahlung und wechselwirken auch untereinander. Die Wände und das elektromagnetische Feld seien miteinander im
thermischen Gleichgewicht.
~ x, t) im Hohlraum lässt sich als Superposition von
Das elektrische Feld E(~
ebenen monochromatischen transversalen Wellen
~ x, t) = ê ei(~k·~x−ω~k t)
E(~
(20.15)
darstellen, wobei die Frequenz ω~k und der Wellenvektor ~k durch die Dispersionsrelation
ω~k = c|~k|
(20.16)
verknüpft sind (s. 6.6). Der Einheitsvektor ê in (20.15) gibt die Polarisationsrichtung der Schwingung. Wegen der Transversalität der elektromagnetischen
Welle steht ê senkrecht zur Ausbreitungsrichtung
ê · ~k = 0 .
(20.17)
20.2 Thermische Photonen
335
Zu jedem Wellenvektor ~k gibt es demnach zwei unabhängige Wahlen für die
Orientierung des Einheitsvektors ê.
Die klassische Elektrodynamik erlaubt für jede der unabhängigen Wahlen
(20.15) eine beliebige komplexe Amplitude. Zur Behandlung der thermischen
Eigenschaften des Strahlungsfeldes müssen wir jedoch den Quantencharakter des
Feldes berücksichtigen und dazu jede der unabhängigen Schwingungen exp(−iω~k t)
als einen harmonischen Oszillator ansehen, der Energie nur in der diskreten
Einheit ~ω~k abgeben und aufnehmen kann. Die Energieeigenwerte eines solchen
Oszillators kennen Sie aus 13.1 als
µ
¶
1
ε~k,ê = ~ω~k n~k,ê +
,
(20.18)
2
wobei die Zahl der Quanten (hier Photonen) im Oszillator mit dem Wellenvektor
~k und der Polarisationsrichtung ê alle ganzzahligen Werte annehmen kann,
n~kê = 0, 1, 2, . . . .
(20.19)
Die Gesamtenergie des Strahlungsfeldes erhalten wir durch Summation der Beiträge aller unabhängigen Wellen als
X
E({n~k,ê }) =
n~k,ê ~ω~k + E0 .
(20.20)
~
k,ê
Die Grundzustandsenergie
E0 =
X
~ω~k /2 .
(20.21)
~
k,ê
will ich im Folgenden durch Neuwahl des Energienullpunktes zum Verschwinden
gebracht denken.
Die Form (20.20) der Gesamtenergie legt nahe, Photonen als Teilchen anzusehen. Indem Sie sich dieser Vorstellung hingeben, dürfen Sie jedoch nicht
außer Acht lassen, dass die Gesamtzahl der Photonen
X
(20.22)
N=
n~k,ê
~
k,ê
nicht fixiert ist, da die Beiträge n~k,ê der einzelnen Oszillatoren ganz unabhängig
voneinander sind. Im Übrigen ist diesen Teilchen Bosonencharakter zuzuweisen,
da gemäß (20.19) beliebig viele (anstatt höchstens eines) Teilchen der Sorte ~k, ê
vorkommen dürfen.
Um uns die thermischen Eigenschaften des Photonengases zu erschließen,
verwenden wir das kanonische Ensemble und berechnen zunächst die Zustandssumme
X
Z=
e−βE({n~k,ê }) .
(20.23)
{n~k,ê =0,1,2,...}
Hierin ist für jeden der durch ~k und ê nummerierten Oszillatoren über alle
möglichen Besetzungszahlen zu summieren. Nach Eintragen von (20.20) und
336
20 Ideale Gase
(20.16) können wir Z als das Produkt
Y
Z=
Z~k,ê
(20.24)
~
k,ê
Z~k,ê =
∞
X
n~k,ê =0
³
´
~ −1
e−β~ω~k n~k,ê = 1 − e−β~c|k|
schreiben. Da der Faktor Z~k,ê die Zustandssumme für den Oszillator mit Wellenvektor ~k und Polarisationsrichtung ê, für die beiden bei festem ~k möglichen
unabhängigen Richtungen ê den gleichen Wert hat, ergibt sich für die Zustandssumme
Y¡
~ ¢−2
Z=
1 − e−β~c|k|
,
(20.25)
~
k
oder
ln Z = − 2
X
~
k
¡
~ ¢
ln 1 − e−β~c|k| .
(20.26)
Das Produkt in (20.25) und die Summe in (20.26) laufen nur noch über alle
erlaubten Werte des Wellenvektors.
Welche Werte der Wellenvektor ~k annehmen darf, hängt (wie immer bei in
Kästen eingesperrten Wellen) von den Randbedingungen an der inneren Oberfläche des Hohlraumes und auch von der Form des Hohlraums ab. Universelle,
d. h. von der Form des Hohlraums unabhängige Aussagen können wir nur gewinnen für den Spektralbereich, in dem alle Wellenlängen λ = 2π/|~k| klein
sind gegenüber allen Lineardimensionen des Hohlraums. Für diesen Spektralbereich ist plausibel (und lässt sich zeigen), dass die erlaubten Wellenvektoren
bei Änderung der Randbedingungen unverändert bleiben. Wir nutzen die entsprechende Freiheit, denken uns den Hohlraum als von der Form eines Würfels
mit der Kantenlänge L und unterwerfen die ebenen Wellen (20.15) periodischen
Randbedingungen
~ + L, y, z) = E(x,
~
~
~
E(x
y + L, z) = E(x,
y, z + L) = E(x,
y, z) .
(20.27)
Für die erlaubten Wellenvektoren erhalten wir somit die Bedingungen
eikx L = eiky L = eikz L = 1 .
Die drei Komponenten von ~k haben also alle ganzzahligen Vielfachen von (2π/L)
als erlaubte Werte,
kx =
2π
nx ,
L
nx = 0, 1, 2, . . . .
(20.28)
Die Gültigkeit dieses Resultats ist allerdings beschränkt auf den Spektralbereich
λ = 2π/|~k| ¿ L, d. h.
¢1
2π
2π ¡ 2
nx + n2y + n2z 2 À
.
|~k| =
L
L
(20.29)
20.2 Thermische Photonen
337
Die Differenz zweier benachbarter Werte einer Wellenvektorkomponente beträgt nach (20.28)
∆k =
2π
.
L
(20.30)
Nach (20.29) ist diese Differenz sehr klein gegenüber allen durch (20.28) richtig
angegebenen erlaubten Wellenzahlen |~k|. Bei derart dicht liegenden Wellenvektoren können Wellenvektorsummen wie die in (20.26) durch Integrale ersetzt
werden. Unter Beachtung von (20.30) gewinnen wir die Ersetzungsvorschrift
µ ¶3 X
Z
X
L
V
−→
∆kx ∆ky ∆kz −→
d3 k .
(20.31)
2π
(2π)3
kx ,ky ,kz
kx ,ky ,kz
Für den Logarithmus der Zustandssumme erhalten wir nun das Integral
Z
³
´
V
3
−β~c|~
k|
d
k
ln
1
−
e
,
(20.32)
ln Z = −2
(2π)3
das wir wegen der Isotropie des Integranden am bequemsten in Kugelkoordinaten ausführen. Dabei gibt die Winkelintegration den Faktor
Zπ
dθ sin θ
0
Zπ
dϕ = 4π .
(20.33)
0
Die Integration über den Betrag des Wellenvektors ist von einer unteren Grenze
kmin À L1 entsprechend dem Gültigkeitsbereich (20.29) unserer Wellenvektorbestimmung bis ins Unendliche zu erstrecken,
1
ln Z = − 2 V
π
Z∞
kmin
¡
¢
dk k 2 ln 1 − e−β~ck .
(20.34)
Wir werden weiter unten sehen, dass die untere Integrationsgrenze kmin für
hinreichend hohe Temperaturen,
kB T À ~ c V −1/3 ,
(20.35)
ohne merklichen Fehler für das Integral nach Null verschoben werden darf,
1
ln Z = − 2 V
π
Z∞
0
¡
¢
dk k 2 ln 1 − e−β~ck .
(20.36)
Nach Übergang zu der dimensionslosen Integrationsvariablen x = β~ck erhalten
wir
Z∞
¡
¢
1
V
dx x2 ln 1 − e−x
ln Z = −
3
2
(β~c) π
0
und schließlich, mit Hilfe einer Integraltafel,
ln Z =
π2 V
.
45 (β~c)3
(20.37)
338
20 Ideale Gase
Jetzt sind uns alle thermischen Eigenschaften des Photonengases unmittelbar zugänglich. Nach (18.28) gilt für die mittlere Energie
¶
µ
π2 V
∂ ln Z
=
Ē = −
(kB T )4 .
(20.38)
∂β
15 (~c)3
V
Dieses Resultat können Sie lesen als das Produkt der mittleren thermischen
Energie pro Freiheitsgrad (Größenordnung kB T ) und der Zahl der im Volumen
V verfügbaren Freiheitsgrade des Feldes, deren Größenordnung mit Hilfe der
thermischen Wellenlänge λmax = 2πc/ωmax (siehe weiter unten für die Frequenz
maximaler Strahlungsintensität ωmax ) als V /λ3max ∝ V (kB T /~c)3 geschätzt werden kann.
Für den Druck, den Sie sich übrigens durch Stöße der Photonen gegen die
Kastenwand anschaulich machen können, erhalten wir gemäß (19.44)
¶
µ
1 Ē
π2 1
∂ ln Z
(kB T )4 =
.
(20.39)
=
p = kB T
3
∂V
45
(~c)
3
V
T
Bemerkenswerterweise ändert sich der Photonendruck bei isothermer (T = const)
Kompression nicht, da p bei T = const nicht vom Volumen V abhängt. Von
Interesse ist auch die durch
¶
µ
∂ Ē
(20.40)
CV =
∂T V
definierte Wärmekapazität bei konstantem Volumen, die wir aus (20.38) zu
CV =
4π 2 V
k4 T 3
15 (~c)3 B
(20.41)
erhalten.
Um schließlich die Verteilung der Gesamtenergie über die Strahlungsfrequenzen zu studieren, gehen wir zurück zum Integral (20.36) und ersetzen dort die
Wellenzahl k durch die Frequenz ω = ck als Integrationsvariable. Durch Differenzieren nach β gemäß (18.28) gewinnen wir die mittlere Energie in der Form
V~ 1
Ē = 3 2
c π
Z∞
3
dω ω (e
0
β~ω
− 1)
−1
≡V
Z∞
dω u(ω)
0
und lesen für die so genannte spektrale Energiedichte u(ω) das von Max Planck
im Jahr 1900 gefundene Plancksche Strahlungsgesetz ab
u(ω) =
1 ~ω 3 /c3
.
π 2 eβ~ω − 1
(20.42)
Die in Abbildung 20.1 gezeigte spektrale Energiedichte fällt exponentiell nach
Null für ω → ∞, verschwindet wie ω 2 für ω → 0 und hat ein Maximum bei der
Frequenz
ωmax = 2, 82kB T /~ .
(20.43)
Dieser lineare Zusammenhang zwischen der Frequenz maximaler Strahlungsintensität und der Temperatur ist als das Wiensche Verschiebungsgesetz bekannt.
20.2 Thermische Photonen
339
Abbildung 20.1
Sie können jetzt die Bedingung (20.35) für die Ersetzbarkeit der unteren
Integrationsgrenze kmin in (20.34) durch Null verstehen. Genau dann, wenn die
zu ωmax gehörige Wellenzahl kmax = ωmax /c groß ist gegenüber der inversen
Lineardimension V −1/3 des Hohlraums, so dass gilt
V −1/3 ¿ kmin ¿ kmax = 2, 82kB T /~c ,
(20.44)
erhält das Integral (20.36) einen vernachlässigbaren Beitrag aus dem Integrationsintervall 0 ≤ k ≤ kmin , ist also mit (20.34) praktisch gleich.
Das Plancksche Strahlungsgesetz kann experimentell verifiziert werden. Wenn
durch die Wand eines Hohlraums ein kleines Loch gebohrt und die sekündlich
pro Flächeneinheit des Lochs ins Frequenzintervall ∆ω bei der Frequenz ω nach
außen gestrahlte Energie cu(ω)∆w gemessen wird.
Alle hier für das Photonengas gewonnenen Resultate sind von wesentlich
quantenmechanischer Natur. Wenn Sie versuchen, durch den formalen Grenzübergang ~ → 0 Quanteneffekte zu eliminieren, so erhalten Sie weder für die
Energie, noch für den Druck und die Wärmekapazität wohldefinierte klassische
Grenzwerte sondern jeweils unsinnige Divergenzen. Lediglich der langwellige
(β~ω ¿ 1) Teil der spektralen Strahlungsdichte (20.42) hat einen sinnvollen
klassischen Grenzwert,
u(ω) =
1
kB T ω 2 /c3 ,
π2
(20.45)
der als das Rayleigh-Jeanssche Gesetz schon vor 1900 bekannt war, sowohl empirisch wie auf Grund klassischer statistischer Überlegungen. Die dem RayleighJeansschen Gesetz für ω → ∞ eigene Ultraviolettkatastrophe u(ω) → ∞ wird im
Planckschen Gesetz durch den für große Frequenzen auftretenden exponentiellen
Abschneidefaktor e−β~ω verhindert.
Max Planck benutzte bei der Konstruktion seiner Strahlungsformel (20.42)
die von ihm selbst zunächst ungeliebte ad hoc Annahme, dass das Strahlungsfeld bei der Frequenz ω Energie nur in diskreten Portionen ~ω abgeben und
aufnehmen könne. Die Annahme und ihre erste Konsequenz (20.42) markieren
den Beginn der Quantenphysik.
340
20.3
20 Ideale Gase
Thermische Phononen in Festkörpern
Wenn N Atome einen festen Körper bilden, so ist i. A. jedes einzelne an eine
Gleichgewichtslage gebunden, um die herum es Schwingungen ausführen kann.
Bei hinreichend kleinen Schwingungsamplituden sind die einzelnen Rückstellkräfte in guter Näherung linear in den Auslenkungen, so dass die Bewegung der
N Atome durch das Modell von 3N harmonischen Oszillatoren repräsentiert
werden kann. Zur gesamten Schwingungsenergie trägt der i-te Oszillator in
quantenmechanischer Behandlung einen der Werte
εi = ~ωi (ni + 1/2),
ni = 0, 1, 2, . . .
bei. Die möglichen Werte der Gesamtenergie lauten also
X
~ωi (ni + 1/2) .
E({ni }) =
(20.46)
(20.47)
i
Das Energiequantum ~ωi , das so genannte Phonon, kann wie das Photon als
Teilchen aufgefasst werden. Allerdings müssen wir wieder berücksichtigen, dass
die Gesamtzahl dieser Teilchen,
X
ni ,
(20.48)
N =
i
nicht festliegt, da die ni ganz unabhängig voneinander sind. Wie Photonen
haben auch Phononen Bosecharakter, da die ni beliebige ganzzahlige Werte
annehmen dürfen.
Um uns die thermischen Eigenschaften des Phononengases zu erschließen,
berechnen wir die kanonische Zustandssumme. Wie beim Photonengas ergibt
sie sich aus
X
ln Z = −
(20.49)
ln(1 − e−β~ωi ) ,
i
wobei die Grundzustandsenergie
P
i
~ωi /2 wieder unterdrückt ist. Die in (20.49)
auftretende Summe lässt sich durch ein Frequenzintegral approximieren, da die
Phononenfrequenzen bei makroskopischen Festkörpern sehr dicht liegen. Führen
wir eine spektrale Dichte ρ(ω) so ein, dass die Zahl der zwischen ω und ω + dω
liegenden Eigenfrequenzen 3N ρ(ω) dω beträgt. Damit ρ(ω) die Gesamtzahl 3N
die Schwingungen richtig wiedergibt, muss gelten
Z∞
dω ρ(ω) = 1 .
(20.50)
0
Für die Zustandssumme erhalten wir nun die Kontinuumsnäherung
ln Z = −3N
Z∞
0
dω ρ(ω) ln(1 − e−β~ω ) .
(20.51)
Die weitere Auswertung von Z gestaltet sich besonders einfach für tiefe Temperaturen, bei denen entsprechend ~ωi . kB T nur niederfrequente Schwingungen angeregt sind. Solche Schwingungen sind Ihnen als Schallwellen bekannt,
20.3 Thermische Phononen in Festkörpern
341
deren Wellenlängen λi = 2πc/ωi den mittleren Atomabstand im Festkörper
(≈ 1 Å = 10−10 m) um mindestens einige Größenordnungen überschreiten. Bezüglich derart langwelliger Schwingungen bleibt die atomistische Struktur unerheblich und der Festkörper verhält sich wie ein elastisches Kontinuum.
Die Abzählung der elastischen Schwingungen mit Frequenzen zwischen ω
und ω + dω erfolgt ganz ähnlich wie die Abzählung der elektromagnetischen
Schwingungen, die wir im letzten Paragrafen vorgenommen haben. Als wesentlicher Unterschied ist nur zu beachten, dass das elastische Kontinuum auch
räumlich und zeitlich periodische Dichteschwankungen (Kompressionswellen)
durchführen kann. Kompressionswellen werden auch als longitudinale Wellen
bezeichnet, weil bei ebenen monochromatischen Kompressionswellen die Auslenkung eines Massenelements aus der Gleichgewichtslage stets parallel zum
Wellenvektor verläuft. Langwellige Kompressionswellen in elastischen Kontinua
sind erfahrungsgemäß durch die Dispersionsrelation
ω(~k) = cl |~k|
(20.52)
gekennzeichnet, wobei cl die so genannte longitudinale Schallgeschwindigkeit
ist. Wie im elektromagnetischen Feld treten auch im elastischen Kontinuum
für jeden Wellenvektor ~k zwei unabhängige transversale Wellen (hier Scherwellen genannt) auf, bei denen die Auslenkung eines Massenelements aus der
Gleichgewichtslage senkrecht zu ~k steht. Niederfrequente Scherwellen haben die
Dispersionsrelation
ω(~k) = ct |~k| .
(20.53)
Die hier auftretende Schallgeschwindigkeit ct ist i. A. von cl verschieden. Sowohl
(20.52) wie (20.53) sind formgleich mit der Dispersionsrelation elektromagnetischer Wellen.
Wir nehmen nun wie in 20.2 an, dass die räumliche Ausdehnung des Systems
so groß ist, dass die genaue Art der Randbedingungen an der Oberfläche für die
Abzählung der Eigenfrequenzen im interessanten Teil des Spektrums unerheblich bleibt. Aus (20.34) können wir dann die Zahl der Wellen im Frequenzintervall dω bei ω als V ω 2 dω/π 2 c3 ablesen für den Fall, dass zu einem Wellenvektor zwei unabhängige Wellen gehören. Im Fall von Schallwellen müssen wir
für jeden Wellenvektor eine longitudinale und zwei transversale Schwingungen
berücksichtigen und als spektrale Dichte
¶
µ
2
1
V
ω2
(20.54)
+
3N ρ(ω) =
2π 2 c3t
c3l
in Rechnung stellen.
Das Phononenspektrum kann durch (20.54) nur für solche Wellenlängen gut
wiedergegeben werden, die groß gegenüber dem mittleren Atomabstand a sind,
also für
ω ¿ c/a ,
(20.55)
wobei c für ct oder cl steht. Bei der Verwendung der spektralen Dichte (20.54)
zur Berechnung der Zustandssumme gemäß (20.51),
V
ln Z = − 2
2π
µ
2
1
+ 3
c3t
cl
¶ Z∞
0
dω ω 2 ln(1 − e−β~ω ) ,
(20.56)
342
20 Ideale Gase
wird, da die Frequenzintegration bis zu unendlich großen Frequenzen läuft, der
Gültigkeitsbereich (20.55) von (20.54) verlassen. Für hinreichend tiefe Temperaturen,
kB T ¿ ~c/a ,
(20.57)
entsteht dadurch jedoch kein merklicher Fehler, da der Integrand in (20.56)
für ~ω > kB T mit wachsendem ω exponentiell abfällt, das Integral also seine
dominierenden Beiträge aus dem Intervall 0 ≤ ~ω . kB T bezieht.
Wie im 20.2 aus (20.36) erhalten wir nun aus (20.56) die Energie, die Wärmekapazität und den Druck des Phononengases zu
µ
¶
¶
µ
π2 V
2
1
∂ ln Z
=
+ 3 (kB T )4 ,
(20.58)
Ē = −
∂β
30 ~3 c3t
cl
V
¶
µ
¶
µ
2π 2 V
2
1
∂ Ē
4 3
T
(20.59)
=
+ 3 kB
CV =
∂T V
15 ~3 c3t
cl
bzw.
p = kB T
µ
∂ ln Z
∂V
¶
T
π2 1
=
90 ~3
µ
1
2
+ 3
c3t
cl
¶
(kB T )4 =
Ē
.
3V
(20.60)
Die Proportionalität der Wärmekapazität zur dritten Potenz der Temperatur
ist für elektrisch nicht leitende Festkörper im Grenzfall (20.57) empirisch gut
bestätigt. Wir schließen aus diesem Befund, dass das thermische Tieftemperaturverhalten solcher Substanzen durch Phononen dominiert ist.
Für kristalline Festkörper, bei denen Atome nur einer Sorte auf Gitterplätzen
angeordnet sind ( einatomige“ Kristalle), erlauben die Überlegungen dieses Pa”
ragrafen auch qualitative Aussagen über das Hochtemperaturverhalten der Phononen. Das Phononenspektrum entnehmen wir dem so genannten Debyemodell,
in welchem das Phononenspektrum (20.54) als für alle Frequenzen gültig angesehen wird bis hinaus zu einer Grenzfrequenz, der Debyefrequenz ωD . Für
Frequenzen ω > ωD wird ρ(ω) Null gesetzt. Dementsprechend wird die Debyefrequenz aus der Normierungsforderung
3N
ZωD
dω ρ(ω) = 3N
(20.61)
0
zu
ωD =
½
V
18π 2 N
µ
2
1
+ 3
3
ct
cl
¶¾−1/3
(20.62)
bestimmt. Die zugehörigen Debye-Wellenlängen sind also von der Größenordnung
des mittleren Teilchenabstands. Der Erwartungswert der Gesamtenergie der
Phononen ergibt sich dann als
Ē = −
µ
∂ ln Z
∂β
¶
V
3~
= 3N 3
ωD
ZωD
0
dω
ω3
.
eβ~ω − 1
(20.63)
20.4 Das ideale Bosegas
343
Nach Übergang zur dimensionslosen Integrationsvariablen y = β~ω können wir
die Energie Ē durch die Debyefunktion
D(x) =
3
x3
Zx
0
dy y 3 /(ey − 1)
ausdrücken,
Ē = 3N kB T D
µ
~ωD
kB T
¶
.
(20.64)
(20.65)
Dieses Resultat reduziert sich für tiefe Temperaturen wegen D(x) → π 4 /5x3
für x → ∞ auf das sehr viel universellere (alle festen Substanzen!) Ergebnis (20.58). Im Grenzfall hoher Temperaturen vereinfacht sich (20.65) wegen
D(x) → 1 für x → 0 (vgl. Abbildung 20.2) zu
Ē → 3N kB T
für
kB T À ~ωD .
(20.66)
Den Grenzfall (20.66) dürfen wir auch als klassischen Grenzfall bezeichnen,
Abbildung 20.2
da der Hochtemperaturwert der Energie aus (20.65) auch durch den formalen Übergang ~ → 0 gewonnen werden kann. Für den Phononenbeitrag zur
Wärmekapazität des einatomigen“ Kristalls erhalten wir aus (20.66) das em”
pirisch gut gesicherte Dulong-Petit-Gesetz
µ
¶
∂ Ē
CV =
→ 3N kB
für
kB T À ~ωD .
(20.67)
∂T V
Auf mehratomige“ Kristalle sind (20.66) und (20.67) nicht anwendbar, da
”
in diesen Systemen neben den hier in Rechnung gestellten Schwingungen (den
akustischen Phononen) weitere Schwingungen (so genannte optische Phononen)
auftreten. Die Frequenzen optischer Phononen liegen meist sämtlich oberhalb
ωD . Daher beeinflussen optische Phononen zwar nicht das thermische Tieftemperaturverhalten (kB T < ~ωD ), wohl aber die thermischen Eigenschaften für
hohe Temperaturen (kB T > ~ωD ).
20.4
Das ideale Bosegas
Denken wir uns N identische wechselwirkungsfreie Boseteilchen (der Einfachheit halber mit Spin Null) in einem würfelförmigen Kasten der Kantenlänge
344
20 Ideale Gase
L = V 1/3 eingesperrt und nehmen periodische Randbedingungen für die N Teilchenwellenfunktion ψ(~x1 , ~x2 , . . . , ~xN ) an. Die Schrödingergleichung kann
durch einen Separationsansatz gelöst werden, der für jedes Teilchen eine ebene
Welle exp(i~k · ~x) in Rechnung stellt. Die möglichen Impulse ~~k eines Teilchens
sind dann durch die Randbedingung
eikx L = eiky L = eikz L = 1
(20.68)
auf Tripel (~kx , ~ky , ~kz ) ganzzahliger Vielfacher von ~2π/L festgelegt,
kx L/2π = 0, ±1, ±2, . . . , y .
(20.69)
Die entsprechenden Einteilchenenergien lauten
ε~k =
~2~k 2
.
2m
(20.70)
Die möglichen Gesamtenergien sowie die Gesamtteilchenzahl lassen sich durch
X
E({n~k }) =
(20.71)
n~k ε~k
~
k
bzw.
N=
X
n~k
(20.72)
~
k
ausdrücken, wobei der Zahl n~k der Teilchen mit Impuls ~k alle nichtnegativen
ganzzahligen Werte offenstehen.
Die Erschließung der thermischen Eigenschaften des idealen Bosegases über
die kanonische Zustandssumme
Z(N, V, T ) =
P
Nebenbedingung
n~k ε~k
−β
X
e
(20.73)
~
k
{n~k =0,1,2,...}
ist hier viel schwieriger als beim Photonen- und beim Phononengas, da die
Besetzungszahlen n~k nicht unabhängig voneinander sind, sondern der Nebenbedingung (20.72) scharfer Gesamtzahl der Teilchen genügen. Wesentlich leichter
zu berechnen ist die großkanonische Zustandssumme (s. 18.6)
ZG (µ, V, T ) =
∞
X
eβµN Z(N, V, T )
N =0
=
∞
X
N =0
Nebenbedingung
X
{n~k }

exp −β
X
~
k

n~k (ε~k − µ) .
(20.74)
Die hier auftretende Kombination der Summen über die durch (20.72) eingeschränkten Besetzungszahlen n~k mit der Summe über alle möglichen Gesamtteilchenzahlen N ist äquivalent mit uneingeschränkten Summationen über alle n~k ;
20.4 Das ideale Bosegas
345
die wir wie beim Photonengas auf geometrische Reihen zurückführen können,




∞
Y X
X
X
¡
¢

exp −βn~k (ε~k − µ) 
n~k (ε~k − µ) =
exp −β
ZG (µ, V, T ) =
=
Y
~
k
"
~
k
~
k
{n~k }
¡
1 − exp −β(ε~k − µ)
¢
#−1
n~k =0
.
(20.75)
Zu beachten ist, dass die geometrischen Reihen in (20.75) nur dann konvergieren,
wenn gilt
£
¤
exp −β(ε~k − µ) < 1
und insbesondere, für ~k = 0,
z ≡ eβµ < 1 ⇐⇒ µ < 0 .
(20.76)
Wir folgern, dass das chemische Potential µ beim idealen Bosegas keine positiven
Werte annehmen kann.
Gemäß 19.3 erhalten wir den Druck und die mittlere Teilchenzahl aus der
großkanonischen Zustandssumme zu
βp =
¡ ∂ ln ZG ¢
∂ X
=−
ln(1 − ze−βε~k )
T,µ
∂V
∂V
(20.77)
~
k
bzw.
N̄ =
µ
∂ ln ZG
∂βµ
¶
=
T,V
X
~
k
z e−βε~k
.
1 − z e−βε~k
(20.78)
Die mittlere Gesamtzahl der Teilchen N̄ stellt sich dabei dar als Summe der
Mittelwerte n̄~k der Besetzungszahlen n~k für die Einteilchenenergieniveaus ε~k
mit
n̄~k =
z e−βε~k
1
.
= β(ε −µ)
~
k
1 − z e−βε~k
e
−1
(20.79)
Die Zustandsgleichung des idealen Bosegases erhalten wir schließlich durch Elimination des chemischen Potentials µ bzw. des Parameters z aus (20.77) und
(20.78).
Zur weiteren Auswertung von (20.77) und (20.78) idealisieren wir das betrachtete Vielteilchensystem, indem wir die mittlere Gesamtzahl der Teilchen
und das Volumen über alle Grenzen wachsen lassen, die Anzahldichte der Teilchen aber konstant halten. In diesem so genannten thermodynamischen Limes,
N̄ → ∞,
V → ∞,
N̄ /V = ρ = const ,
(20.80)
bilden gemäß (20.69) die möglichen Impulse ~~k und somit die Energieeigenwerte ε~k Kontinua, so dass wir die Impulssummen in (20.77) und (20.78) gemäß
346
20 Ideale Gase
(20.31) durch Integrale ersetzen können. Andererseits werden wir gleich sehen, dass in diesem Grenzfall ein Überschreiten des Verbots (20.76) möglich
wird. Ich verschiebe die Diskussion der dann auftretenden Singularität auf den
nächsten Paragrafen und beschränke die hiesigen Rechnungen ausdrücklich auf
den Bereich µ < 0.
Wenn die erwähnten Wellenvektorintegrale in Kugelkoordinatendarstellung
für ~k durchgeführt werden und statt |~k| die dimensionslose Integrationsvariable
x = βε~k eingeführt wird, so entsteht aus (20.77) und (20.78)
βp =
1
g(z)
λ3
1
N̄
= 3 zg 0 (z) ,
V
λ
(20.81)
(20.82)
wobei zur Vereinfachung der Schreibweise die thermische de Broglie Wellenlänge
p
λ = 2π~2 /mkB T
(20.83)
und die Funktion
2
g(z) = − √
π
Z∞
dx
√
0
x ln(1 − ze−x )
(20.84)
benutzt sind.
Für die nachfolgende Überlegung sind die im Bereich 0 ≤ z ≤ 1 gültigen
Taylorreihen
g(z) =
∞
X
z l /l5/2
l=1
zg 0 (z) =
∞
X
z l /l3/2
(20.85)
g(1) = 1, 342 . . .
(20.86)
l=1
und die Zahlenwerte
g 0 (1) = 2, 612 . . . ,
von Bedeutung. Abbildung 20.3 zeigt den Verlauf der Funktion zg 0 (z). Beachten
Sie den vertikalen Anstieg für z → 1.
Sie entnehmen dem skizzierten Verlauf von zg 0 (z) und der Gleichung (20.82),
dass die Bedingung (20.76) erfüllt bleibt für
ρλ3 < g 0 (1) = 2, 612 . . . ,
(20.87)
d. h. wenn das Gas so verdünnt oder die Temperatur so hoch ist, dass der mittlere Atomabstand ρ−1/3 größer ist als die mit g 0 (1)−1/3 = 0, 726 . . . multiplizierte
thermische de Broglie Wellenlänge. In diesem Bereich, in dem allein die hier
gegebene Betrachtung richtig ist, heißt das Bosegas nicht entartet. Die Gewinnung der Zustandsgleichung durch Elimination von z aus (20.81) und (20.82)
ist nun auf numerischem Wege vorzunehmen.
Eine einfache geschlossene Form der Zustandsgleichung ergibt sich allerdings
im klassischen Grenzfall λ → 0, den Sie sich formal als ~ → 0 oder physikalisch
20.4 Das ideale Bosegas
347
Abbildung 20.3
als Grenzfall hoher Temperaturen vorstellen können. Da für λ → 0 die rechten
Seiten in (20.81) und (20.82) zweifellos endlich bleiben müssen, sind die Funktionen g(z) und zg 0 (z) zum Verschwinden gezwungen. Den Taylorreihen (20.85)
entnehmen Sie aber, dass dann auch z nach Null gehen muss. Wegen
g(z) = z + · · · ,
zg 0 (z) = z + · · ·
(20.88)
werden die rechten Seiten in (20.81) und (20.82) dann einander gleich. Die
Elimination von z wird trivial und ergibt die Ihnen wohlbekannte Zustandsgleichung des klassischen idealen Gases
pV = N̄ kB T .
(20.89)
Abweichungen vom klassischen Verhalten werden wichtig, wenn der mittlere
Teilchenabstand nicht mehr um Größenordnungen größer ist als die thermische
de Broglie Wellenlänge. Solche Abweichungen sind sämtlich Quanteneffekte,
die von der in 20.1 besprochenen Nichtunterscheidbarkeit identischer Teilchen
herrühren.
Von Interesse ist auch die kalorische Zustandsgleichung des nicht entarteten
Bosegases. Wir erhalten sie aus der großkanonischen Zustandssumme durch
Berechnung der mittleren Energie
¶
µ
3 kB T V
∂ ln ZG
=
g(z) .
(20.90)
Ē = −
∂β
2 λ3
V,z
Unter Verwendung von (20.81) entsteht hieraus
3
Ē
= p.
V
2
(20.91)
Im klassischen Grenzfall ρ−1/3 À λ dürfen wir die Zustandsgleichung (20.89)
benutzen und finden die Energie pro Teilchen als
3
kB T .
(20.92)
2
Wegen der angenommenen Abwesenheit jeder Wechselwirkung zwischen den
Teilchen und der Vernachlässigung von Quanteneffekten hängt die Energie Ē/N̄
hier nicht vom mittleren Teilchenabstand ρ−1/3 ab.
Ē/N̄ =
348
20.5
20 Ideale Gase
Bose-Einstein-Kondensation
Im letzten Paragrafen musste der Fall hoher Dichte und/oder niedriger Temperatur entsprechend
n̄ 3
λ ≥ g 0 (1) = 2, 612 . . .
V
(20.93)
ausdrücklich ausgeschlossen werden, u. z. nicht etwa weil er physikalisch unsinnig wäre, sondern weil die dort gegebene Rechnung versagt. Den Grund des
Versagens erkennen Sie durch nochmaliges Ansehen von (20.82) und des Graphen der Funktion zg 0 (z). Für ρλ3 → g 0 (1) gehen z nach 1 und das chemische
Potential µ nach Null. Im Logarithmus der Zustandssumme gemäß (20.75)
ln ZG = −
X
~
k
ln(1 − ze−βε~k ) ,
(20.94)
wächst daher der Summand zu verschwindendem Wellenvektor wie − ln(1 − z)
über alle Grenzen. Andererseits wird dieser Summand beim Übergang zum
Integral gemäß
X
~
k
V
→
(2π)3
Z
V
d k=
4π
(2π)3
3
Z∞
dk k 2
(20.95)
0
durch den im Integrationselement d3 k auftretenden Faktor k 2 komplett unterdrückt.
Um den Grenzfall z → 1 mit behandeln zu können, müssen wir vor dem
Übergang (20.95) zum Integral den Summanden mit ~k = 0 in (20.94) isolieren,
denn für Werte von z hinreichend nahe bei 1 wird dieser Summand größer als
der Rest der Summe, der wie in 20.4 durch ein Integral ersetzt werden kann,
ln ZG = − ln(1 − z) +
V
g(z)
λ3
(20.96)
Für den Druck ergibt sich hieraus unverändert (20.81), da beim Differenzieren nach dem Volumen Temperatur und chemisches Potential, also auch der
Parameter z = eβµ konstant zu halten sind,
βp =
1
g(z) ,
λ3
(20.97)
während die mittlere Teilchendichte sich gegenüber (20.82) genau entsprechend
der mittleren Besetzungsdichte des Einteilchengrundzustands,
N̄0
1 z
≡ ρ0 =
.
V
V 1−z
(20.98)
erhöht auf
N̄
1
= ρ = ρ0 + 3 zg 0 (z) .
V
λ
(20.99)
20.5 Bose-Einstein-Kondensation
349
Im thermodynamischen Limes ist die Raumdichte der Teilchen mit verschwindendem Impuls nur dann von Null verschieden, wenn der Parameter z
gleich Eins ist. Sie sehen das nach Auflösen von (20.98) nach z,
z=
ρ0 V
→1
ρ0 V + 1
ρ0 6= 0 .
für
(20.100)
Solange also im thermodynamischen Limes z < 1 bleibt, gelten unverändert alle
Resultate von Kapitel 20.4. Insbesondere ist dann die Dichte ρ gemäß (20.87)
beschränkt. Überschreitet dagegen die Dichte ρ den Wert g 0 (1)/λ3 um
ρ0 = ρ −
1 0
g (1) ,
λ3
(20.101)
so hat der Parameter z für alle Temperaturen und Dichten im Bereich (20.93)
den konstanten Wert 1. Wir sprechen dann vom entarteten Bosegas.
Der Übergang von verschwindendem zu endlichem ρ0 heißt Bose-Einstein
Kondensation. Er erfolgt, wie Sie aus (20.101) ersehen, bei beliebig vorgegebener
Temperatur für die kritische“ Dichte
”
¶3/2
µ
mkB
0
3
0
T 3/2
(20.102)
ρBEK (T ) = g (1)/λ = g (1)
2π~2
und bei beliebig vorgegebener Dichte an der kritischen“ Temperatur
”
µ
¶
2π~2
ρ2/3 .
(20.103)
TBEK (ρ) = g 0 (1)−2/3
mkB
Für den Bruchteil der in den Einteilchenzustand niedrigster Energie kon”
densierten“ Atome folgt aus (20.101, 20.102, 20.103)
ρBEK
=1−
ρ0 /ρ = 1 −
ρ
µ
T
TBEK
¶3/2
.
(20.104)
Insbesondere sind am absoluten Nullpunkt der Temperatur alle Teilchen kon”
densiert“. Dieser Sachverhalt ist auch unmittelbar einsichtig, denn der Grundzustand eines Systems aus N wechselwirkungsfreien identischen Bosonen ist
offenbar der Zustand, für den jedes Teilchen im Einteilchenzustand niedrigster
Energie sitzt (Abbildung 20.4).
Weitere Einsicht in die Kondensation gewinnen wir durch Diskussion des
Zusammenhangs zwischen Druck und Dichte bei konstanter Temperatur, der so
genannten Isothermen. Aus (20.97) und (20.100) folgern wir, dass der Druck
längs der Isothermen für ρ ≥ ρBEK von der Dichte unabhängig ist (s. Abbildung
20.5). Für ρ < ρBEK nimmt der Druck monoton mit fallender Dichte ab, da
gemäß (20.85) sowohl g(z) wie zg 0 (z) monoton abfallen, während z von 1 nach 0
geht. Insbesondere geht p → 0 für ρ → 0 (s. a. obige Diskussion des klassischen
Grenzfalls). Bei ρ = ρBEK verläuft die Isotherme stetig. Unter Benutzung
von (20.81) und (20.82) überzeugen Sie sich auch leicht von der Stetigkeit der
Ableitung (∂p/∂ρ)T bei ρ = ρBEK Für ρ < ρBEK gilt nämlich
µ ¶
µ ¶
kB T
d
∂z
∂p
= 3 g 0 (z)
= kB T g 0 (z)/ (zg 0 (z)) ,
(20.105)
∂ρ T
λ
∂ρ T
dz
350
20 Ideale Gase
Abbildung 20.4
Abbildung 20.5
und aus
∞
X zl
d
(zg 0 (z)) =
→∞
dz
l1/2
l=1
für
z→1
(20.106)
folgt
µ
∂p
∂ρ
¶
T
→0
für
z → 1, d. h. für ρ → ρBEK .
(20.107)
Wenn Sie aus der nebenstehenden Skizze die Druckabhängigkeit des Volumens
1/ρ pro Teilchen ablesen, so konstatieren Sie, dass das System p > kB T g(1)/λ3
ein verschwindendes Volumen einnimmt. Dieses unphysikalische Verhalten liegt
daran, dass die Teilchen durch keinerlei Kräfte an beliebiger Annäherung zueinander gehindert werden und somit auch als punktförmig vorgestellt werden
können. Bei Verkleinerung des Druckes springt die Dichte bei p = kB T g(1)/λ3
unstetig auf den Wert g 0 (1)/λ3 . Derartige unstetige Dichteänderungen auf Isothermen sind Ihnen aus anderem Zusammenhang bekannt, u. z. etwa vom Übergang einer Substanz aus der flüssigen in die gasförmige Phase. Sie können die
20.5 Bose-Einstein-Kondensation
351
Bose-Einstein Kondensation auch als einen Phasenübergang auffassen, bei dem
das nichtentartete Bosegas in ein ausdehnungsloses Kondensat übergeht.
Eine andere interessante Singularität tritt bei der Bose-Einstein Kondensation in der Wärmekapazität CV = (∂ Ē/∂T )V auf. Wir erhalten sie aus der
mittleren Energie

3 kB T


g(z) für T > TBEK


µ
¶
 2 λ3
1 ∂ ln ZG
=
(20.108)
Ē/V = −

V
∂β

V,z


 3 kB T g(1) für T < TBEK
2 λ3
zu
CV /V =

15
9
d


kB λ−3 g(z) − kB ρg 0 (z)/ (zg 0 (z))


4
dz
4




 15 kB λ−3 g(1)
4
für T > TBEK
(20.109)
für T < TBEK .
d
Wegen der schon in (20.106) erwähnten Eigenschaft dz
(zg 0 (z)) → ∞ für z läuft
die Wärmekapazität stetig durch T = TBEK . Ihre Ableitung (∂CV /∂T )V macht
jedoch einen endlichen Sprung an der Kondensationstemperatur, so dass C V
selbst dort eine Spitze aufweist (Abbildung 20.6).
Beachten Sie auch, dass die Wärmekapazität für T < TBEK wie T 3/2 mit
T → 0 verschwindet, also langsamer als die Wärmekapazität des Photonen und
des Phononengases.
Abbildung 20.6
Kein reales System verhält sich strikt wie ein ideales Bosegas. Zwar ist die
Wechselwirkung der Teilchen in realen Bosegasen bei hinreichend hohen Temperaturen und/oder geringen Dichten vernachlässigbar, jedoch sind in diesem
Grenzfall Quanteneffekte meist völlig unwichtig. Jedoch stellt z. B. der Phasenübergang vom flüssigen zum suprafluiden Zustand in 4 He bei der Temperatur
Tλ = 2, 17 ◦ K einen der Bose-Einstein Kondensation des idealen Bosegases verwandten Quanteneffekt dar. Der Quantencharakter des Übergangs ist aus der
352
20 Ideale Gase
Tatsache ersichtlich, dass die thermische de Broglie Wellenlänge für Heliumatome bei T = Tλ etwa 6 Å beträgt und somit größer ist als der mittlere Atomabstand. Andererseits ist der mittlere Abstand der He Atome vergleichbar mit
der Reichweite der interatomaren Wechselwirkung, so dass letztere keinesfalls
vernachlässigbar ist.
In gasförmigem atomaren Wasserstoff, bei dem die Elektronenspins der einzelnen Atome durch ein starkes Magnetfeld alle parallel orientiert sind (spinpolarisierter atomarer Wasserstoff ), wird ein Übergang zu einer suprafluiden Phase
erwartet und derzeit experimentell gesucht. Bei einer Anzahldichte entsprechend einem mittleren Atomabstand von etwa 20 Å sollte die Übergangstemperatur
bei etwa 70 ◦ mK liegen. Da die Wechselwirkung von H-Atomen mit parallelen Elektronenspins schwach ist und eine Reichweite von wenig mehr als 1 Å
hat, sollte die interatomare Wechselwirkung auf den erwarteten Übergang nur
mäßigen Einfluss haben, der Übergang selbst also eng verwandt sein mit der
Bose-Einstein Kondensation des idealen Bosegases.
20.6
Das ideale Fermigas
Wegen des Pauliprinzips unterscheidet sich das Tieftemperaturverhalten des
idealen Fermigases radikal von dem des idealen Bosegases. Schon im bei T = 0
vorliegenden Grundzustand zeigt sich eine drastische Verschiedenheit. Während
N identische Bosonen als Grundzustand den N -fach besetzten Einteilchengrundzustand haben, dürfen keine zwei Fermionen in ein und demselben Einteilchenzustand sitzen. Zu bedenken ist allerdings, dass alle Fermionen einen (halbzahligen) Spin tragen. Bei festem Impuls ~~k kann ein Fermion mit Spin s in
(2s + 1) verschiedenen Spinzuständen vorliegen, die sich durch die Orientierung
des Spins relativ zu einer beliebigen Richtung unterscheiden. Ein Einteilchenzustand mit Impuls ~~k und Energie εk = ~2~k 2 /2m kann also durch identische
Fermionen bis zu (2s + 1)-fach besetzt sein.
Der Grundzustand von N identischen freien Fermionen entsteht gemäß dem
Pauliprinzip durch sukzessive Auffüllung der niedrigsten Einteilchenniveaus.
Das höchste so besetzte Einteilchenniveau, die so genannte Fermienergie
εF ≡
ergibt sich aus
N = (2s + 1)
X
~
k
wobei θ(x) die Sprungfunktion
θ(x) =

1
0
~2 kF2
,
2m
(20.110)
θ(εF − ~2~k 2 /2m) ,
(20.111)
für
x>0
für
x<0
bezeichnet. Die Wellenvektorsumme in (20.111) kann durch ein Integral approximiert werden,
V
N = (2s + 1)
4π
(2π)3
ZkF
0
dk k 2 ,
20.6 Das ideale Fermigas
353
wonach sich die Wellenzahl kF als Funktion der Teilchendichte aus
N
(2s + 1)
(2s + 1) 3
=ρ=
kF =
(2mεF /~2 )3/2
2
V
6π
6π 2
(20.112)
ergibt.
Die Grundzustandsenergie des N -Teilchensystems berechnet sich als Summe
der N niedrigsten Einteilchenenergien,
E0 = (2s + 1)
X
~
k
V
4π
ε~k θ(εF − ε~k ) = (2s + 1)
(2π)3
ZkF
dk k 2 ε~k .
(20.113)
0
Mit Hilfe von (20.111) und (20.112) erhalten wir das einfache Resultat
E0 =
3
εF N
5
(20.114)
und hieraus für den Druck
p0 = −
µ
∂E0
∂V
¶
=
N
2 N
2 E0
εF =
.
5 V
3 V
(20.115)
Im Gegensatz zum idealen Bosegas zeigt das Fermigas beim absoluten Nullpunkt einen endlichen Druck, muss also durch ein Gefäß an der Verflüchtigung
gehindert werden. Der physikalische Grund hierfür ist im Pauliprinzip zu sehen: das Verbot beliebiger Annäherung identischer Fermionen manifestiert sich
in einer Zunahme der Energie des Gases bei Verkleinerung des Volumens.
Der soeben charkterisierte Grundzustand des idealen Fermigases wird oft
als Fermisee bezeichnet. Er ist charakterisiert durch voll besetzte Einteilchenniveaus bis hinauf zur Fermienergie und leere Niveaus darüber. Der scharfe
Übergang von besetzt zu unbesetzt drückt sich in den Ausdrücken (20.111)
für die Teilchenzahl N und (20.113) für die Grundzustandsenergie E0 in der
Sprungfunktion θ(εF − ε~k ) aus. Bei endlichen Temperaturen, denen wir uns
jetzt zuwenden, wird dieser scharfe Übergang auf der thermischen Energieskala
kB T ausgeschmiert.
Zur Behandlung des idealen Fermigases bei endlichen Temperaturen berechnen wir wie im Bosefall die großkanonische Zustandssumme


X
X
ZG (µ, V, T ) =
exp −β
n~k,m (ε~k − µ)
(20.116)
{n~k,m }
=
+s
Y Y
~
k m=−s
=
Y
~
k




1
X
~
km
1
X
n~k,m =0
n~k,m =0

e−β(ε~k −µ) 
2s+1
e−β(ε~k −µ) 
.
Vorstehend wurden die Besetzungszahlen n~km eingeführt für Einteilchenzustände
zu festem Wellenvektor ~k und fester Spinorientierungsquantenzahl m. Letztere
354
20 Ideale Gase
hat für Spin-s Teilchen die 2s + 1 möglichen Werte m = −s, −s + 1, . . . , s. Bei
festem ~k und m darf die Besetzungszahl n~km nur die Werte
n~km = 0
oder
1
(20.117)
annehmen. Die Summationsvorschriften für die Besetzungszahlen n~km und
die Spinorientierungsquantenzahl m sind in den letzten beiden Gliedern von
(20.116) schon berücksichtigt. Die Zustandssumme (20.116) kann somit gemäß
X ¡
¡
¢¢
ln ZG = (2s + 1)
ln 1 + exp −β(ε~k − µ)
(20.118)
~
k
vereinfacht werden. Dabei ist wichtig, daß die Einteilchenenergien ε~k = ~2~k 2 /2m
nicht von der Spinorientierung abhängen (Wir setzen Abwesenheit eines Magnetfeldes voraus!).
Durch Differenziation nach dem chemischen Potential erhalten wir die mittlere Teilchenzahl als Summe der mittleren Zahl von Teilchen mit Impuls ~~k und
Spinorientierung m,
X
X
N̄ =
n̄~km = (2s + 1)
(20.119)
n̄~km ,
~
km
n̄~km =
~
k
1
£
¤
.
exp β(ε~k − µ) + 1
(20.120)
Ab hier beschränken wir uns einfachheitshalber auf Spin- 12 Teilchen, setzen also
2s + 1 = 2; bitte prüfen Sie Ihr Verständnis der nachfolgenden Argumentation,
indem Sie den Faktor 2s + 1 im Rest des Paragraphen restaurieren.
Den Druck als Funktion der Temperatur und des chemischen Potentials berechnen wir wie üblich durch Differenziation von ln ZG nach dem Volumen
¶
µ
¢¢
¡
∂ ln ZG
∂ X ¡
(20.121)
ln 1 + exp −β(ε~k − µ) .
βp =
=2
∂V
∂V
β,µ
~
k
Die Wellenvektorsummen in (20.119) und (20.121) können im thermodynamischen Limes ebenso wie die entsprechenden Summen im Bosefall durch
Integrale ersetzt werden. Dabei entstehen die zu (20.81),(20.82) und (20.84)
analogen Resultate
V
f (z) ,
λ3
2
βp = 3 f (z) ,
λ
ln ZG = 2
2
N̄
= ρ = 3 zf 0 (z) ,
V
λ
(20.122)
(20.123)
(20.124)
in denen wieder die thermische de Broglie Wellenlänge (20.83) und der Parameter
z = eβµ
(20.125)
20.6 Das ideale Fermigas
355
verwendet sind und die gegenüber (20.84) modifizierte Funktion
2
f (z) = √
π
Z∞
dx
√
x ln(1 + z e−x ) =
∞
X
(−1)l+1
l5/2
l=1
0
zl
(20.126)
eingeführt wurde.
Notieren wir auch gleich die mittlere Energie, die wir am einfachsten aus
der großkanonischen Zustandssumme mit der Identität (18.44), also Ē = hHi =
−(∂ ln ZG /∂β)z,V , erhalten. Mit Hilfe von (20.122) und ∂λ−3 /∂β = − 23 β −1 λ−3
erhalten wir
Ē = 3
3
V
f (z)kB T = pV .
λ3
2
(20.127)
Zur Zustandsgleichung, die den Druck als Funktion der Temperatur und des
Volumens bei fester Teilchenzahl N̄ angibt, gelangen wir, in dem wir aus (20.123)
und (20.124) den Parameter z eliminieren. Wie beim Bosegas führt diese Elimination nur in den Grenzfällen T → 0 und T → ∞ zu einer durch einfache
analytische Ausdrücke darstellbaren Zustandsgleichung. Für hohe Temperaturen entsteht wieder der klassische Grenzfall
λ→0
(20.128)
mit der Konsequenz f (z) → zf 0 (z) → z. Da dann die rechten Seiten in (20.123)
und (20.124) übereinstimmen, ergibt sich wieder die wohlbekannte Zustandsgleichung des klassischen idealen Gases
pV = N̄ kB T .
(20.129)
Um den Fall tiefer Temperaturen zu untersuchen, richten wir unser Augenmerk zunächst auf die in (20.124) auftretende Funktion
2
zf (z) = √
π
0
Z∞
dx
0
√
x
,
1 x
e +1
z
(20.130)
die sich nach partieller Integration und mit (20.125) auch in der Form
4
zf (z) = √
3 π
0
Z∞
dx x
3/2
ex−βµ
1
= √
x−βµ
2
(e
+ 1)
3 π
0
Z∞
0
dx µ
x3/2
x − βµ
cosh
2
¶2
(20.131)
schreiben lässt. Unter der sogleich zu rechtfertigenden Annahme, dass das chemische Potential des idealen Fermigases (im Gegensatz zu dem des idealen Bosegases!) im Grenzfall T → 0 positiv ist und dass gilt
βµ À 1 ,
(20.132)
lässt sich das Integral (20.131) leicht approximieren. Der Faktor [cosh(x − βµ)/2]
im Integranden hat ein Maximum bei x = βµ und fällt links und rechts davon
−2
356
20 Ideale Gase
auf dem Maßstab 1 ¿ βµ exponentiell ab. In einem Intervall der Länge ∆x & 1,
innerhalb dessen dieser Faktor merklich von Null verschieden ist, beträgt die relative Änderung des anderen Faktors, x3/2 , im Integranden von (20.131)
µ ¶
3 ∆x
1
3/2
3/2
∆(x )/x
=
¿1.
(20.133)
=O
2 x
βµ
Es muss sich demnach eine brauchbare Approximation des Integrals (20.131)
ergeben, wenn wir x3/2 durch die Taylorreihe
3
3
x3/2 = (βµ)3/2 + (βµ)1/2 (x − βµ) + (βµ)−1/2 (x − βµ)2 + · · ·
2
8
(20.134)
ersetzen. In einem weiteren Approximationsschritt verschieben wir die untere
Integrationsgrenze in (20.131) nach −∞. Wegen des exponentiellen Abfalls des
Integranden und wegen (20.132) ist der dabei entstehende Fehler mit der relativen Größenordnung exp(−βµ) völlig unerheblich. Wir erhalten nach Ausführen
der verbleibenden elementaren Glied-für-Glied Integration
¸
·
π2
4
−1/2
3/2
0
(βµ)
+ ··· .
(20.135)
zf (z) = √ (βµ) +
8
3 π
Nach Eintragen dieser Tieftemperaturentwicklung in (20.124) ergibt sich
#
"
µ
¶2
π 2 kB T
8
3/2
3
+ ···
(20.136)
1+
ρλ = √ (βµ)
8
µ
3 π
und hieraus insbesondere das chemische Potential bei T = 0 als der Fermienergie
εF gleich,
µ|T =0 =
~2
(3π 2 ρ)3/2 = εF .
2m
(20.137)
Damit ist die Ausnahme (20.132) gerechtfertigt, solange die thermische Energie
klein ist gegenüber der Fermienergie, kB T ¿ εF .
Durch Umkehrung der Reihe (20.136) gewinnen wir das chemische Potential
µ als Funktion von Temperatur und Dichte,
#
"
¶2
µ
π 2 kB T
+ ··· .
(20.138)
µ = εF 1 −
12
εF
Die mittlere Gesamtenergie und die Wärmekapazität bei tiefen Temperaturen (kB T ¿ εF ) folgen aus einer ganz analogen Rechnung, die hier nicht
vorgeführt wird, zu
#
"
¶2
µ
3
5π 2 kB T
Ē = εF N̄ 1 +
+ ···
(20.139)
5
12
εF
und somit
CV =
µ
∂ Ē
∂T
¶
V
=
π2
N̄ kB
2
µ
kB T
+ ···
εF
¶
.
(20.140)
20.6 Das ideale Fermigas
357
Beachten Sie, dass die Wärmekapazität hier als Funktion der Temperatur mit
T → 0 viel langsamer abfällt als beim idealen Bosegas. Aus diesem Grund
verläuft die Wärmekapazität von Metallen, deren Leitungselektronen in guter
Näherung ein ideales Fermigas darstellen, linear mit T , wenn die Temperatur
soweit abgesenkt wird, dass der Leitungselektronenbeitrag den Phononenbeitrag
dominiert.
Die Resultate (20.139) und (20.140) erlauben eine einfache qualitative Erläuterung. Bei niedrigen Temperaturen unterscheidet sich die mittlere Besetzungszahl (20.120) von der bei T = 0 vorliegenden Stufenfunktion
n̄~km |T =0 = θ(µ − ε~k ) = θ(εF − ε~k )
(20.141)
dadurch, dass einige Teilchen von Niveaus εk < εF zu Niveaus oberhalb der
Fermienergie angeregt sind. Die Besetzungsverschiebungen sind beschränkt auf
einen Energiebereich der ungefähren Größe kB T um εF herum, so dass die
Zahl der gegenüber dem ungestörten Fermisee“ verschobenen Teilchen die
”
Größenordnung N̄ (kB T /εF ) hat. Die Energieänderung relativ zum Grundzustand muss also die Größenordnung kB T N̄ (kB T /εF ) haben, d. h. quadratisch
in T sein. Dementsprechend muss die Wärmekapazität proportional zur Temperatur verlaufen.
Zu guter Letzt notieren wir die Zustandsgleichung. Verwenden wir das für
alle Temperaturen gültige Resultat Ē = 23 pV aus (20.127) sowie die Tieftemperaturentwicklung (20.139) der Energie, so ergibt sich
"
#
µ
¶2
5π 2 kB T
2 N̄
εF 1 +
+ ··· .
(20.142)
p=
5V
12
εF
Der Zuwachs des Druckes gegenüber seinem Wert am absoluten Nullpunkt (siehe
(20.115)) ist auf die Vergrößerung der mittleren Energie der gegen die Wände
stoßenden Teilchen zurückzuführen.
358
20 Ideale Gase
Kapitel 21
Begründung der
Thermodynamik
makroskopischer Systeme
21.1
Arbeit und Wärme bei Zustandsänderungen
Ein von seiner Umgebung völlig isoliertes System hat erfahrungsgemäß eine
zeitlich konstante Energie. Lassen wir jedoch ein System Arbeit verrichten (z. B.
das Benzin-Luft-Gemisch in der Brennkammer eines Motors im Takt nach der
Zündung) oder bringen es in thermischen Kontakt mit einem anderen System
(z. B. die Wärmflasche im Bett), so ändert sich im Laufe der Zeit sein Zustand,
und auch seine Energie ist zeitlicher Änderung unterworfen.
Zeitliche Zustandsänderungen, fortan Prozesse genannt, können i. A. nicht
mit den hier zur Verfügung gestellten Hilfsmitteln beschrieben werden, da während des zeitlichen Ablaufs i. A. kein Gleichgewicht herrscht. Eine wichtige
Ausnahme stellen quasistatische Prozesse dar, deren Dauer lang ist im Vergleich zu allen das betreffende System charakterisierenden Relaxationszeiten.
Bei solchen Prozessen liegt zu jedem Zeitpunkt thermisches Gleichgewicht vor,
u. z. entsprechend den momentanen Werten der Energie und der äußeren Parameter. Im Folgenden wird überwiegend von quasistatischen Prozessen die Rede
sein.
Betrachten wir einen Prozess, der ein System von einem anfänglichen Zustand der Energie Ei zu einem Endzustand der Energie Ef führt. Wenn wir die
am System geleistete Arbeit mit A (A < 0, falls das System Arbeit abgibt) und
die zugeführte Wärme mit Q bezeichnen, so lautet die Energiebilanz
∆E = Ef − Ei = A + Q .
(21.1)
Unter der am System geleisteten Arbeit verstehen wir die Energiezufuhr bei
Änderung makroskopisch kontrollierbarer äußerer Parameter gegen die entsprechenden generalisierten Kräfte (z. B. Volumenverkleinerung gegen den Druck;
Teilchenzahlvergrößerung gegen“ das chemische Potential; Ihnen anderweitig
”
bekannt sind magnetische und elektrische Arbeitsleistungen). Hingegen nennen
359
360
21 Begründung der Thermodynamik makroskopischer Systeme
wir Wärmezufuhr eine Energiezunahme bei konstanten äußeren Parametern; die
Energieeinspeisung erfolgt dann direkt in die mikroskopischen Freiheitsgrade des
Systems.
Die zu Anfang und am Ende des Prozesses vorliegenden Energien Ei bzw. Ef
sind durch die respektiven Zustände eindeutig festgelegt. Nicht so die im Verlauf
des Prozesses als Arbeit A und Wärme Q zugeführten Energieposten für sich!
Zwischen zwei Zuständen mit Energien Ei , und Ef sind viele Prozesse, auch
quasistatische, denkbar und realisierbar, die sich bei fester Summe A + Q unter
anderem durch die Werte der Größen A und Q unterscheiden. Im Gegensatz
zur Energie sind A und Q einzeln keine eindeutigen Funktionen des Zustandes.
Vielmehr charakterisieren diese Größen Prozesse.
Bei differenziellen Zustandsänderungen schreiben wir die Energiebilanz (21.1)
dE =6 dA+ 6 dQ ,
(21.2)
wobei die Querstriche an den infinitesimalen Inkrementen von A und Q sinnfällig
machen sollen, dass weder 6 dA noch 6 dQ für sich allein Differentiale eindeutiger
Zustandsfunktionen sind. Beispiele differenzieller Arbeitsleistungen sind differenzielle Volumenänderungen und Änderungen der Teilchenzahl,
6 dA = −p dV + µ dN̄ .
21.2
(21.3)
Erster Hauptsatz
Der im letzten Paragrafen diskutierte Energieerhaltungssatz (21.1) heißt auch
erster Hauptsatz der Thermodynamik. Wegen seiner überragenden Bedeutung
will ich ihn hier in drei offensichtlich äquivalenten Formulierungen nochmals
vorstellen.
(i) Ein Energiezuwachs eines Systems muss von der Umgebung aufgebracht
werden, sei es durch Arbeitsleistung gegen generalisierte Kräfte bei Änderung makroskopisch kontrollierbarer äußerer Parameter, sei es ohne Änderung letzterer bei thermischem Kontakt, d. h. durch Einspeisung von
Energie an mikroskopische Freiheitsgrade.
(ii) In abgeschlossenen Systemen, d. h. bei thermischer Isolation (6 dQ = 0)
und konstanten äußeren Parametern (6 dA = 0), können nur Vorgänge
ablaufen, die die Energie konstant lassen.
(iii) Es gibt kein perpetuum mobile erster Art, d. h. keine Maschine kann im
Dauerbetrieb Arbeit leisten, ohne dass ihr von außen Energie zugeführt
wird.
21.3
Entropieänderungen bei Zustandsänderungen
Betrachten wir einen quasistatischen Prozess, der durch eine stetige Folge von
Gleichgewichtszuständen führt. In einem differenziellen Teilprozess ändern sich
die Energie und äußere Parameter wie das Volumen und die Teilchenzahl gemäß
Ē, V, N̄ → Ē + dĒ, V + dV, N̄ + dN̄ .
(21.4)
21.4 Zweiter Hauptsatz
361
Die zugehörige Entropieänderung ist, da bei der betrachteten quasistatischen
Folge von Zuständen die Entropie jederzeit eine eindeutige Funktion des Zustands ist, gerade das in (19.56) gefundene Entropiedifferential
dS =
1
(dĒ + p dV − µ dN̄ ) .
T
(21.5)
Lösen wir diese Identität nach dem Energiedifferential auf, so finden wir wieder
den ersten Hauptsatz,
dĒ = T dS − p dV + µ dN̄ .
(21.6)
mit dem Arbeitsanteil 6 dA = −p dV + µ dN̄ und, als neuem Resultat, den
Ausdruck
6 dQ = T dS
(21.7)
für die differenzielle Wärmezufuhr.
Sie erkennen aus (21.7), dass quasistatische Prozesse in thermisch isolierten
Systemen (6 dQ = 0) isentropisch, d. h. mit dS = 0, verlaufen. Weiterhin bemerkenswert ist, dass (21.7) eine Verknüpfung eines totalen Differentials (der
Entropie) mit einer differenziellen Größe (6 dQ) gibt, die kein totales Differential
ist. In dS =6 dQ/T spielt 1/T die Rolle eines integrierenden Faktors“ ∗)
”
Anders als bei quasistatischen Prozessen muss die Entropie bei der Relaxation von Nichtgleichgewichtszuständen ins Gleichgewicht zunehmen, denn die
Entropie nimmt bekanntlich 19.1 im Gleichgewicht ihren Maximalwert an. Es
folgt, dass die Entropie eines abgeschlossenen Systems niemals abnehmen kann.
Sie sollten die gerade getroffenen Aussagen durchdenken im Hinblick auf
u. a. folgende Beispiele: (i) Ein schwingendes Pendel kommt auf Grund von Luftund Lagerreibung allmählich zur Ruhe; (ii) ein Gas verteilt sich nach plötzlicher
Gefäßvergrößerung nach einiger Zeit gleichförmig über das vergrößerte Volumen;
(iii) zwei sich berührende, verschieden warme Körper gleichen ihre Temperaturen an.
21.4
Zweiter Hauptsatz
Die Ausführungen des letzten Paragrafen beinhalten den zweiten Hauptsatz.der
Thermodynamik. Die folgenden drei Formulierungen dieses Gesetzes verdienen,
obschon äquivalent miteinander, jeweils gesonderte Würdigung.
(i) In einem abgeschlossenen System können nur Prozesse mit dS ≥ 0 ablaufen. Diese oben durch die bekannte Extremaleigenschaft der Entropie
begründete Aussage bringt u. a. die Erfahrungstatsache zum Ausdruck,
dass alle in der Natur spontan ablaufenden Relaxationsprozesse irreversibel sind. Wir werden hierauf in 21.8 zurückkommen.
∗) Im
Fall zweier unabhängiger Variablen x und y ist die Größe
6 dG = A(x, y) dx + B(x, y) dy
genau dann ein totales Differential einer Funktion G(x, y), wenn die Integralitätsbedingungen
∂A/∂y = ∂B/∂x erfüllt ist. Andernfalls ist es zuweilen möglich, einen integrierenden Faktor f (x, y) zu finden, sodass dF = f (x, y)6 dG ein totales Differential ist, d. h. so dass
∂(f A)/∂y = ∂(f B)/∂x gilt. Die Funktion F (x, y) lässt sich aus ihrem Differential durch
ein wegunabhängiges Wegintegral in der x − y-Ebene gewinnen. S.a. 2.10.
362
21 Begründung der Thermodynamik makroskopischer Systeme
(ii) Es gibt keine Maschine, die nichts anderes bewirkt, als im periodischen
Betrieb Arbeit zu leisten und den entsprechenden Energiebedarf aus einem
Wärmebad zu decken (perpetuum mobile zweiter Art). Wir werden diese
von Lord Kelvin stammende Formulierung im nächsten Paragrafen auf (i)
zurückführen. Die Vorstellung, ein Dampfer könne über’s Meer fahren
und die dazu erforderliche Energie nur dem Wärmevorrat des Meeres abzapfen, wird offenbar durch den zweiten Hauptsatz ins Reich der Träume
verwiesen.
(iii) Es gibt keinen perfekten“ Kühlapparat, der, periodisch arbeitend, nichts
”
anderes bewirkt, als einem System Wärme zu entziehen und sie einem
anderen System bei höherer Temperatur zuzuführen. Dem Beweis dieser
Clausiusschen Formulierung ist 21.6 gewidmet.
21.5
Unmöglichkeit des perpetuum mobile zweiter Art
Abbildung 21.1 zeigt ein fiktives perpetuum mobile zweiter Art. Während einer
Arbeitsperiode wird dem Wärmebad die Wärme Q entzogen und der Maschine
zugeführt, während die Maschine die Arbeit A abgibt. Die Arbeit könnte an
einem Freiheitsgrad eines externen Objekts verrichtet werden (z. B. Heben eines
Gewichts), ohne dass andere Freiheitsgrade und insbesondere die Entropie des
Objekts beeinflusst würden.
Abbildung 21.1
Der beschriebene fiktive Vorgang wäre mit dem ersten Hauptsatz, d. h. der
Energiebilanz der Maschine pro Periode
∆E = 0 = Q + (−A)
(21.8)
verträglich. Ziehen wir aber die Entropiebilanz für das aus Bad, Maschine
und Objekt gebildete abgeschlossene Gesamtsystem. Weder das Objekt (per
obiger Vereinbarung) noch die Maschine (wegen der Periodizität) ändern in einer Periode ihre Entropie, so dass die gesamte Entropieänderung allein vom
Wärmebad gestellt wird. Sie beträgt, da das Wärmebad während der endlichen
Wärmeaufnahme −Q < 0 seine Temperatur nie ändert, ∆S = −Q/T < 0. Die
21.5 Unmöglichkeit des perpetuum mobile zweiter Art
363
Verletzung des zweiten Hauptsatzes, nach dem die Entropie eines abgeschlossenen Systems nicht abnehmen kann, ist offenbar.
Das perpetuum mobile zweiter Art hätte, da die in einem Zyklus aufgenommene Wärme restlos in Arbeit umsetzend, den Wirkungsgrad
η=
A
=1.
Q
(21.9)
Realisierbare Wärmekraftmaschinen haben nach dem zweiten Hauptsatz stets
Abbildung 21.2
einen kleineren Wirkungsgrad η < 1. Abbildung 21.2 zeigt das Wirkungsschema
solcher mit den Hauptsätzen verträglichen Maschinen. Während einer Periode
entnimmt die Maschine einem Wärmebad der Temperatur T1 die Wärme Q1
und leistet am Objekt die Arbeit A. Das Verdikt des zweiten Hauptsatzes wird
vermieden, indem die Maschine an ein zweites, kälteres Wärmebad koppelt, an
das sie pro Zyklus die Wärme Q2 abführt. Die Energiebilanz der Maschine und
die Entropiebilanz des Gesamtsystems lauten
Q1 = A + Q 2
(21.10)
bzw.
∆S = −
Q2
Q1
+
,
T1
T2
(21.11)
und die Forderung ∆S > 0 ist jetzt befriedigt, wenn die Wärmeaufnahme des
kälteren Bades nur hinreichend groß ist.
364
21 Begründung der Thermodynamik makroskopischer Systeme
Der Wirkungsgrad der gerade beschriebenen Maschine beträgt
η=
Q2
A
=1−
.
Q1
Q1
(21.12)
Aus (21.11) und dem zweiten Hauptsatz, ∆S ≥ 0, folgern wir Q2 /Q1 > T2 /T1
und erhalten für den Wirkungsgrad die Ungleichung
η ≤ 1 − T2 /T1 < 1 .
(21.13)
Der maximale mit dem zweiten Hauptsatz verträgliche Wirkungsgrad,
ηmax = 1 − T2 /T1 ,
(21.14)
entspricht einer quasistatisch arbeitenden Maschine, bei der die Entropiebilanz
des Gesamtsystems pro Periode ∆S = 0 lautet (s. 21.7).
21.6
Unmöglichkeit des perfekten Kühlapparats
Reale Kühlapparate entziehen nach dem in Abbildung 21.3 gezeigten Schema
pro Zyklus unter Aufwand der Arbeit A einem System (hier zum Wärmebad
idealisiert) mit Temperatur T2 die Wärme Q2 und geben an ein wärmeres System
(hier zum Wärmebad mit T1 > T2 idealisiert) die Wärme Q1 ab. Die beiden
Hauptsätze verlangen
Q1 = Q 2 + A
(21.15)
und
∆S =
Q2
Q1
−
≥0,
T1
T2
(21.16)
wobei das Gleichheitszeichen im zweiten Glied der Kette (21.16) nur für quasistatische Arbeitsweise gelten kann.
Ohne Aufwand an Arbeit kann kein solcher Apparat funktionieren, denn mit
A = 0, d. h. Q1 = Q2 , entsteht aus (21.16) die Forderung Q1 (1/T1 − 1/T2 ) ≥ 0,
die bei T1 > T2 nicht erfüllbar ist. Damit ist auch die Clausiussche Version des
zweiten Hauptsatzes bewiesen.
21.7
Die Carnotmaschine
Das einfachste Modell einer Wärmekraftmaschine ist die so genannte Carnotmaschine. Als Arbeitssubstanz fungiert ein klassisches ideales Gas. Eine Periode,
die quasistatisch durchlaufen wird, ist in der p − V -Ebene und in der S − T Ebene in den Abbildungen 21.4 und 21.5 dargestellt. Wie aus den Diagrammen
ersichtlich besteht eine Periode aus den vier folgenden
Schritten. Von a nach b erfolgt eine isotherme Kompression, während derer
die Maschine an ein Wärmebad der Temperatur T2 Wärme abgibt. Die anschließende Kompression von b nach c geschieht unter thermischer Isolation,
also isentropisch. Hierbei nimmt die Maschine Energie in Form von Arbeit auf
21.7 Die Carnotmaschine
365
Abbildung 21.3
und die Temperatur erhöht sich zum Wert T1 . Während der letzten beiden
Schritte leistet die Maschine Arbeit, zunächst von c nach d bei isothermer Expansion und gleichzeitiger Wärmeaufnahme aus einem Bad der Temperatur T1
und schließlich, von d nach a, bei isentropischer Expansion und Abkühlung zur
Ausgangstemperatur T2 .
Bezeichnen wir die im Schritt c d von der Maschine aufgenommene Wärme
mit Q1 , die im Schritt a b an das kältere Bad abgeführte Wärme mit Q2 , sowie
die während der Periode insgesamt abgegebene Arbeit mit A, so lautet die
Energiebilanz pro Periode
A = Q 1 − Q2 .
(21.17)
Wenn der Prozess, wie angenommen, quasistatisch geführt wird, so ändert sich
die Gesamtentropie der beiden Bäder und der Maschine nicht.
∆S = 0 = −
Q2
Q1
+
.
T1
T2
(21.18)
Der Wirkungsgrad der Carnotmaschine folgt aus (21.17) und (21.18) zu
η =1−
T2
,
T1
(21.19)
hat also den maximalen mit den Hauptsätzen verträglichen Wert.
Zur Berechnung der pro Periode geleisteten Arbeit müssen wir die vier Kurvenstücke in der p − V -Ebene durch Gleichungen charakterisieren. Für die
Isothermen a b und c d liefert die Zustandsgleichung des idealen Gases direkt
pV = N kB T2 bzw. pV = N kB T1 .
366
21 Begründung der Thermodynamik makroskopischer Systeme
Abbildung 21.4
Abbildung 21.5
Um die Gleichung der Isentropen (auch Adiabaten genannt) zu gewinnen, benutzen wir das Entropiedifferential (19.56), das längs der Isentropen verschwinden muss,
T dS = 0 = dĒ + p dV .
(21.20)
Die mittlere Energie des klassischen idealen Gases lautet
Ē =
3
3
N kB T = pV ,
2
2
(21.21)
dĒ =
3
(p dV + V dp) .
2
(21.22)
ihr Differential also
Aus (21.20) und (21.22) folgt als Differentialgleichung der Isentropen
dp
5 dV
+
=0.
3 V
p
(21.23)
Die gesuchte Isentropengleichung ist also
pV 5/3 = const
(21.24)
21.8 Relaxation ins Gleichgewicht
367
oder, in der V − T -Darstellung,
T V 2/3 = const.
(21.25)
Wir berechnen nun die pro Periode von der Maschine abgegebene Arbeit als
das Wegintegral in der p − V -Ebene
A=
ZVb
p dV +
ZVc
p dV +
ZVd
ZVa
p dV +
Va
Vb
Vc
Vd
(T =T2 )
(S=S2 )
(T =T1 )
(S=S1 )
p dV .
(21.26)
Offenbar kann A auch geometrisch als die von der Kurve a b c d in der p − V Ebene umschlossene Fläche gedeutet werden. Die Beiträge der beiden Isentropen heben sich gegenseitig auf, denn der Betrag des Stücks b c
ZVc
Vb
p dV =
5/3
p b Vb
ZVc
3
5/3
−2/3
− Vc−2/3 )
V −5/3 dV = pb Vb (Vb
2
Vb
(S=S2 )
h
i
3
N kB T2 1 − (Vb /Vc )2/3
2
3
3
= N kB T2 (1 − T1 /T2 ) = N kB (T2 − T1 )
2
2
=
ist allein durch die Temperaturdifferenz der beiden Bäder bestimmt und somit
entgegengesetzt gleich dem Betrag des Stücks d a. Die Anteile der Isothermen
ergeben schließlich
A = N k B T2
ZVb
Va
= N kB T2 ln
dV
+ N k B T1
V
ZVd
dV
V
Vc
Vd
Vb
+ N kB T1 ln
.
Va
Vc
Aus der Isentropengleichung (21.25) folgt aber Vb /Vc = (T1 /T2 )−3/2 = Va /Vd ,
so dass wir die abgegebene Arbeit als
A = N kB (T1 − T2 ) ln(Vd /Vc )
(21.27)
erhalten.
Ihnen bleibt zur Übung, die im Schritt c d aufgenommene Wärme Q1 und
die Abwärme Q2 auszurechnen.
21.8
Relaxation ins Gleichgewicht
Der zweite Hauptsatz zeichnet hinsichtlich der Bewegung makroskopischer Systeme eine Zeitrichtung aus, indem er die zeitliche Abnahme der Entropie eines
368
21 Begründung der Thermodynamik makroskopischer Systeme
abgeschlossenen Systems verbietet. Im Übrigen lehrt schon die Alltagserfahrung, dass die Relaxation eines makroskopischen Systems ins Gleichgewicht ein
irreversibler Vorgang ist, dessen zeitliche Umkehrung niemals spontan auftritt.
Vom mikroskopischen Standpunkt aus kann und muss uns der zweite Hauptsatz ebenso wie die Irreversibilität von Relaxationsprozessen anstößig erscheinen. Die für die mikroskopische Dynamik eines N -Teilchensystems zuständige
Schrödingergleichung besitzt nämlich (ebenso wie die bei klassischen Behandlung zuständigen Newtonschen Gleichungen) eine Symmetrie, die Zeitumkehrinvarianz, derzufolge zu jeder beliebigen Lösung eine andere Lösung angegeben
werden kann, die den gleichen physikalischen Vorgang in zeitlich umgekehrtem
Ablauf beschreibt.
Um uns der Zeitumkehrinvarianz der Schrödingergleichung
i~ψ̇ ({~x}, t) = Hψ ({~x}, t)
(21.28)
zu vergewissern, betrachten wir Teilchen, die über Zweikörperkräfte (z. B. Coulombsch) wechselwirken entsprechend dem Hamiltonoperator
H=
N
X
p~2ν
1X
V (~xν − ~xµ ) .
+
2mν
2
ν=0
(21.29)
ν6=µ
Offensichtlich bleibt die Schrödingergleichung unverändert unter der Transformation
t → −t,
~xν → ~xν ,
p~ν → −~
pν ,
ψ → ψ∗ ,
(21.30)
wenn die potenzielle Energie V (~xν − ~xµ ) reell ist. Mit ψ({~x}, t) ist also auch
ψ ∗ ({~x}, t) Lösung von (21.28). Die respektiven Wahrscheinlichkeitsdichten
|ψ({~x}, t)|2 und |ψ ∗ ({~x}, −t)|2 = |ψ({~x}, −t)|2 beschreiben Vorgänge, die bei
Zeitumkehr ineinander übergehen.
Auf die Zeitumkehrinvarianz der Schrödingergleichung gründet sich der so
genannte Umkehreinwand gegen den zweiten Hauptsatz: zugleich mit der Relaxation ins Gleichgewicht muss auch der umgekehrte Prozess eine Lösung der
mikroskopischen Bewegungsgleichung sein. Dieser Einwand ist zweifellos im
Prinzip berechtigt. Allerdings suggeriert er unangebrachterweise eine Unverträglichkeit der Bewegungsgleichung mit der Erfahrungstatsache der Irreversibilität. Mit dem Nachweis der Existenz einer Lösung der Schrödingergleichung
ist nämlich keine Auskunft über die praktische Realisierbarkeit der Lösung gewonnen. Um eine Lösung der Schrödingergleichung eines Vielteilchensystems zu
realisieren, die wie die Umkehrung einer Relaxation ins Gleichgewicht aussieht,
müssen durch experimentelle Präparation ganz bestimmte Anfangsbedingungen
gewährleistet werden. Nun können im Labor nur einige wenige Parameter eines Vielteilchensystems mit gewünschten Anfangsbedingungen versehen werden.
Dass dabei alle anderen (womöglich 1023 ) Koordinaten genau so beeinflusst werden, dass sich eine Antirelaxation“ anschließt, ist, wie ich gleich zeigen werde,
”
grenzenlos unwahrscheinlich.
Erfahrungsgemäß führt eine makroskopische Observable A(t) nach ihrer Relaxation zum Gleichgewichtswert Ā nur winzige Fluktuationen aus (auf die
Ausnahme kritischer Systeme war schon des öfteren hingewiesen worden). Allerdings lässt sich unter sehr allgemeinen Annahmen an die Wechselwirkung
21.8 Relaxation ins Gleichgewicht
369
V (~xν − ~xµ ) zeigen, dass A(t) jedem Anfangswert A(0) irgendwann wieder beliebig nahe kommen muss. Hierauf gründet sich der so genannte Wiederkehreinwand gegen die Verträglichkeit makroskopischer Irreversibilität mit den zeitumkehrinvarianten mikroskopischen Bewegungsgleichungen. Auch dieser Wiederkehreinwand ist zwar im Prinzip berechtigt, jedoch praktisch irrelevant. Wir
werden uns nämlich gleich davon überzeugen, dass die mittlere Wiederkehrzeit
großer Auslenkungen makroskopischer Observabler aus ihren Gleichgewichtswerten unbeobachtbar groß ist.
Betrachten wir in Anlehnung an die verwandten Diskussionen in 2.14 und
13.4 die folgende Summe periodischer Funktionen
S(t) =
N
X
eiων t ,
(21.31)
ν=1
die zur Zeit t = 0 den Wert S(0) = N hat. Wir können uns S(t) als Lösung eines
reversiblen Problems (z. B. gekoppelte Schwingungen) vorstellen. Nun seien die
Zahl N der eingehenden Schwingungen so groß und die Frequenzen ων so dicht
benachbart, dass in jedem experimentell auflösbaren Frequenzintervall ∆ω viele
ων liegen, etwa gemäß der spektralen Dichte (Lorentzverteilung der Breite γ)
ρ(ω) =
N γ/π
.
ω2 + γ 2
(21.32)
Dann kann die Summe (21.31) durch ein Integral approximiert werden, und wir
erhalten für t > 0
S(t) ≈
Z∞
dω ρ(ω) eiωt = N e−γt .
(21.33)
−∞
Der resultierende irreversible Abfall von S(t) auf Null ist dem Wiederkehreinwand wie dem Umkehreinwand ausgesetzt.
Überzeugen wir uns davon, dass der Wiederkehreinwand gegenstandslos ist,
indem wir die mittlere Wiederkehrzeit T einer großen Fluktuation |S(t)| = O(N )
abschätzen. Eine derartige Fluktuation stellt sich ein, wenn die N Phasen ων t
alle zugleich in einem kleinen Intervall ∆ϕ ¿ 2π liegen. Da die Phasen alle
unabhängig voneinander sind, gilt für die Wahrscheinlichkeit einer Phasenkoinzidenz während einer mittleren Koinzidenzzeit τ
τ
=
T
µ
∆ϕ
2π
¶N
.
(21.34)
Zur Berechnung der mittleren Koinzidenzzeit betrachten wir zunächst zwei Glieder aus der Summe (21.31), etwa eiω1 t und eiω2 t . Die erste Phase liege in ∆ϕ
im Zeitintervall 0 ≤ t ≤ t1 = ∆ϕ/ω1 . Koinzidenz beider Phasen in A tritt nur
ein, wenn die zweite Phase ihren Durchlauf durch ∆ϕ beendet zu einer Zeit t0 ,
die kleiner ist als t1 + t2 , wobei t2 = ∆ϕ/ω2 . Nehmen wir an, t2 sei kleiner als
370
21 Begründung der Thermodynamik makroskopischer Systeme
t1 . Die Koinzidenz beider Phasen in ∆ϕ besteht dann für die Zeit
τ (t0 ) =

t2 + t 1 − t 0





 t2


t0




0
für
t1 ≤ t0 ≤ t1 + t2
für
t2 ≤ t0 ≤ t1
für
0 ≤ t 0 ≤ t2
(21.35)
sonst.
Da alle Endpunkte t0 gleichberechtigt sind, erhalten wir die mittlere Koinzidenzzeit zu
τ12 =
tZ
1 +t2
dt0
0
t1 t2
τ (t0 )
=
,
t1 + t 2
t1 + t 2
1/τ12 = 1/t1 + 1/t2 = (ω1 + ω2 )/∆ϕ .
(21.36)
Ohne weitere Rechnung erhalten wir als ein Maß für die Koinzidenz dreier
Phasen in ∆ϕ die mittlere Überlappzeit von τ12 und τ13 = ∆ϕ/ω3 , d. h.
1/τ123 = l/τ12 + 1/t3 = (ω1 + ω2 + ω3 )/∆ϕ. Für die mittlere Koinzidenzzeit
aller N Phasen erhalten wir so eine Abschätzung durch die mittlere Frequenz ω̄
N
1/τ =
1 X
N
ων =
ω̄ .
∆ϕ ν=1
∆ϕ
(21.37)
Damit ergibt sich die gesuchte mittlere Wiederkehrzeit,
∆ϕ
T =
N ω̄
µ
2π
∆ϕ
¶N
.
(21.38)
Selbst für so große mittlere Frequenzen, wie sie für sichtbares Licht typisch
sind, ω̄ ≈ 1015 s−1 , und die bescheidenen Forderungen ∆ϕ/2π = 1/10, N = 100
ergibt sich aus (21.38) eine Wiederkehrzeit (T ≈ 1086 s), die bedeutend größer ist
als das Alter des Universums (≈ 1010 Jahre). Damit ist der Wiederkehreinwand
als für makroskopische Systeme irrelevant erwiesen.
Der Umkehreinwand erledigt sich auch sofort. Damit die Summe S(t) zur
Zeit t einen Betrag der Ordnung N hat, nachdem zur früheren Zeit t0 ein sehr
viel kleinerer Wert vorlag, muss zur Zeit t0 die Phase ων t0 in einem kleinen Intervall ∆ϕ um den Wert ων (t0 −t) liegen. Die entsprechend gezielte Präparation
aller Phasen durch makroskopischen Eingriff ist i. Allg. unmöglich (es gibt die
Ausnahmen des Spin- und Photonenechos). Die Wahrscheinlichkeit, bei ungezieltem Eingriff die Phasen alle richtig festzulegen, hat den für große N völlig
vernachlässigbaren Wert (∆ϕ/2π)N .
Der zweite Hauptsatz stellt, wie die vorangegangene Diskussion und auch
schon seine Begründung in 21.4 zeigen, eine statistische Aussage über das Verhalten von Ensembles makroskopisch gleich präparierter Systeme dar. Ausnahmen im Einzelfall sind denkbar, allerdings grenzenlos unwahrscheinlich. Die
Relaxation makroskopischer Systeme ins Gleichgewicht ist eine Illusion, der wir
uns ungestraft hingeben dürfen.
Abbildungsverzeichnis
1.1
1.2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
16
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22
25
26
29
30
32
33
37
39
42
47
48
53
3.1
3.2
3.3
3.4
3.5
3.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
64
66
68
70
70
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
74
75
77
78
79
79
81
84
85
86
88
90
371
372
ABBILDUNGSVERZEICHNIS
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6.1
6.2
6.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
8.1
8.2
8.3
8.4
8.5
.
.
.
.
.
9.1
9.2
9.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
10.1
10.2
10.3
10.4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
184
193
199
202
11.1
11.2
11.3
11.4
11.5
11.6
11.7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
205
207
208
210
213
213
219
12.1
12.2
12.3
12.4
12.5
12.6
12.7
12.8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
223
225
226
228
229
231
232
233
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
98
99
100
101
102
104
108
110
142
144
148
152
154
13.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
13.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
13.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
ABBILDUNGSVERZEICHNIS
373
14.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
14.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
14.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
15.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
15.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
16.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
16.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
17.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
17.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
18.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
20.1
20.2
20.3
20.4
20.5
20.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
339
343
347
350
350
351
21.1
21.2
21.3
21.4
21.5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
362
363
365
366
366