Theoretische Physik I - Fakultät für Physik

Werbung
Theoretische Physik I
Nicolas Borghini
Version vom 15. Februar 2016
Nicolas Borghini
Universität Bielefeld, Fakultät für Physik
Homepage: http://www.physik.uni-bielefeld.de/~borghini/
Email: borghini at physik.uni-bielefeld.de
Vorwort
Inhaltsverzeichnis
Einleitung
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
1
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
5
Newton’sche Mechanik
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
5
•
•
•
•
•
Klassische Mechanik
I
I.1 Grundbegriffe der Newton’schen Mechanik 5
I.1.1 Raumzeit der Newton’schen Mechanik 6
I.1.2 Beschreibung von mechanischen Systemen und ihrer Bewegung 7
I.1.3 Mechanische Kräfte 9
I.2 Newton’sche Gesetze 12
I.2.1
I.2.2
I.2.3
I.2.4
I.2.5
Erstes Newton’sches Gesetz 12
Zweites Newton’sches Gesetz 13
Drittes Newton’sches Gesetz 15
„Viertes Newton’sches Gesetz“ 15
Energieerhaltung 16
I.3 Inertialsysteme. Galilei-Transformationen 17
I.3.1
I.3.2
I.3.3
I.3.4
I.3.5
Translationen 17
Eigentliche Galilei-Transformationen 18
Drehungen 19
Allgemeine Galilei-Transformationen 20
Kräfte und Galilei-Transformation 20
I.4 Beschleunigte Bezugssysteme. Scheinkräfte 21
I.4.1 Linear beschleunigte Bezugssysteme 22
I.4.2 Rotierende Bezugssysteme 23
I.5 Mehrteilchensysteme 27
I.5.1
I.5.2
I.5.3
I.5.4
I.5.5
Grundlagen 28
Bewegung des Schwerpunkts 30
Drehimpuls 30
Energie 31
Schwerpunktsystem 35
I.6 Zwei-Körper-Systeme 36
I.6.1
I.6.2
I.6.3
I.6.4
Separation der Bewegungsgleichungen 36
Gekoppelte Punktmassen 38
Kepler-Problem 38
Streuung 44
Appendix zum Kapitel I
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
49
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
50
I.A Alternative Herleitung der Kepler’schen Bahnkurven 49
II
Lagrange-Formalismus: Grundlagen
II.1 Ein Resultat aus der Variationsrechnung 50
II.1.1 Funktional 50
II.1.2 Extremierung eines Funktionals 51
•
•
•
•
v
II.2 Hamilton-Prinzip 54
II.2.1
II.2.2
II.2.3
II.2.4
Definitionen 54
Hamilton-Prinzip. Euler–Lagrange-Gleichungen 55
Erste Beispiele 56
Systeme mit Zwangsbedingungen 59
II.3 Symmetrien und Erhaltungsgrößen 62
II.3.1 Invarianz unter Raumzeit-Transformationen 62
II.3.2 Noether-Theorem 66
III
Lagrange-Formalismus: Anwendungen
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
69
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
85
Grundlagen der Speziellen Relativitätstheorie
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
101
Mathematischer Apparat der Speziellen Relativitätstheorie •
•
•
•
•
•
•
•
•
101
•
•
•
•
•
•
•
•
116
III.1 Starre Körper 69
III.1.1 Beschreibung des starren Körpers 69
III.1.2 Bewegungsgleichungen 71
III.2 Kleine Schwingungen 78
III.2.1 Eindimensionales Problem 78
III.2.2 Multidimensionales Problem 81
III.2.3 Gedämpfte Schwingungen 83
IV
Hamilton-Formalismus •
•
•
•
•
•
•
•
IV.1 Hamilton’sche Bewegungsgleichungen 85
IV.1.1
IV.1.2
IV.1.3
IV.1.4
Kanonisch konjugierter Impuls 85
Hamilton-Funktion 86
Kanonische Bewegungsgleichungen 87
Beispiele 88
IV.2 Kanonische Transformationen 90
IV.2.1
IV.2.2
IV.2.3
IV.2.4
Phasenraum-Funktionen 90
Poisson-Klammer 90
Poisson-Klammer und Zeitentwicklung 92
Kanonische Transformationen 93
IV.3 Phasenraum 97
V
V.1 Einstein’sche Postulate 101
V.1.1 Motivation 101
V.1.2 Einstein’sche Postulate 101
V.2 Lorentz-Transformationen 102
V.2.1
V.2.2
V.2.3
V.2.4
Linienelement 102
Lorentz-Transformationen 103
Folgerungen 106
Minkowski-Raum 106
V.3 Vierervektoren und Vierertensoren 108
V.3.1
V.3.2
V.3.3
V.3.4
VI
Lorentz-Skalare 108
Vierervektoren 108
Vierertensoren 112
Kovariante Formulierung eines physikalischen Gesetzes 114
Relativistische Mechanik •
•
•
•
•
•
•
•
•
•
•
•
VI.1 Bewegung eines freien relativistischen Teilchens 116
VI.1.1 Lagrange-Funktion und Wirkung eines freien Teilchens 116
VI.1.2 Impuls und Energie eines freien Teilchens 117
VI.2 Kovariante Formulierung des Grundgesetzes der Mechanik 119
•
•
•
•
vi
Klassische Elektrodynamik •
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
123
VII
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
123
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
129
•
•
•
•
•
•
•
•
•
•
148
•
•
•
•
•
•
•
•
•
•
162
Einleitung
•
•
•
•
•
•
VII.1 Grundbegriffe und Definitionen 123
VII.2 Einheiten 126
VIII
Elektrostatik
•
•
•
•
•
•
•
VIII.1 Elektrisches Potential 129
VIII.1.1
VIII.1.2
VIII.1.3
VIII.1.4
Skalarpotential 129
Poisson-Gleichung 129
Elektrisches Feld und Potential von Ladungen 130
Elektrostatische potentielle Energie 132
VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung 135
VIII.2.1 Green’sche Funktionen 135
VIII.2.2 Lösung der Poisson-Gleichung auf R3 135
VIII.2.3 Lösung der Poisson-Gleichung auf einem endlichen Gebiet von R3 137
VIII.3 Multipolentwicklung 140
VIII.3.1
VIII.3.2
VIII.3.3
VIII.3.4
IX
Kartesische Multipolmomente 140
Beispiele von Multipolmomenten 141
Wechselwirkung zwischen zwei Ladungsverteilungen 143
Multipolentwicklung in Kugelkoordinaten 146
Magnetostatik •
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
IX.1 Grundbegriffe und -ergebnisse der Magnetostatik 148
IX.1.1
IX.1.2
IX.1.3
IX.1.4
IX.1.5
Vektorpotential 148
Poisson-Gleichungen der Magnetostatik 149
Integrale Formulierung der Grundgleichungen der Magnetostatik 152
Magnetisches Feld induziert durch einfache Ladungsströme 153
Kraft zwischen zwei Stromkreisen 156
IX.2 Multipolentwicklung 157
IX.2.1 Multipolmomente einer Ladungsstromverteilung 157
IX.2.2 Magnetisches Dipolmoment einer Leiterschleife 159
IX.2.3 Magnetischer Dipol in einem äußeren magnetischen Feld 160
X
Zeitabhängige elektromagnetische Felder
•
•
•
•
•
•
X.1 Grundgesetze 162
X.1.1 Maxwell-Gleichungen 162
X.1.2 Bewegungsgleichungen für die elektrischen und magnetischen Felder 165
X.2 Elektrodynamische Potentiale 166
X.2.1 Definition 166
X.2.2 Eichinvarianz 167
X.2.3 Bewegungsgleichungen für die elektrodynamischen Potentiale 168
X.3 Energie und Impuls des elektromagnetischen Feldes 169
X.3.1 Energiedichte und -stromdichte des elektromagnetischen Feldes 169
X.3.2 Impulsdichte und -stromdichte des elektromagnetischen Feldes 171
X.4 Elektromagnetische Wellen im Vakuum 173
X.4.1 Klassische Wellengleichung 173
X.4.2 Elektromagnetische Wellen 176
X.5 Klassische Theorie der Strahlung 179
X.5.1
X.5.2
X.5.3
X.5.4
Green’sche Funktion der klassischen Wellengleichung 179
Retardierte Potentiale 182
Multipolentwicklung 183
Potentiale und Felder einer bewegten Punktladung 185
vii
XI
Relativistisch kovariante Formulierung der Elektrodynamik
•
•
•
•
•
•
•
•
193
•
•
•
•
•
•
•
•
•
201
XI.1 Lorentz-kovariante elektromagnetische Größen 193
XI.1.1
XI.1.2
XI.1.3
XI.1.4
Elektromagnetischer Feldstärketensor 193
Viererpotential 195
Elektrischer Viererstrom 196
Energieimpulstensor 196
XI.2 Relativistisch kovariante Formulierung der Grundgesetze 197
XI.2.1
XI.2.2
XI.2.3
XI.2.4
Maxwell-Gleichungen 197
Kontinuitätsgleichung 197
Lorentz-Kraft und -Kraftdichte 198
Energie- und Impulsbilanzgleichungen 198
XI.3 Weitere Resultate in relativistisch kovarianter Form 199
XI.3.1 Bewegungsgleichung für das Viererpotential 199
XI.3.2 Klassische Wellengleichung und ebene Wellen 199
XI.3.3 Retardiertes Viererpotential 200
XII
Lagrange-Formulierung der Elektrodynamik •
•
•
•
•
•
XII.1 Ladungen und Ströme in einem elektromagnetischen Feld 201
XII.1.1 Wiederholung: Lagrange-Funktion einer freien Punktladung 201
XII.1.2 Punktladung in einem äußeren elektromagnetischen Feld 202
XII.1.3 Ladungs- und Stromverteilungen in einem elektromagnetischen Feld 204
XII.2 Elektromagnetisches Feld mit Quellen 205
XII.2.1 Einführung in die klassische Feldtheorie 205
XII.2.2 Elektromagnetisches Feld in Anwesenheit fester Quellen 206
XII.2.3 Energieimpulstensor 207
Anhang •
A
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
213
Tensoren auf einem Vektorraum •
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
213
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
220
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
224
•
•
•
•
•
•
•
•
•
•
•
•
226
•
•
•
•
•
•
•
•
•
•
•
•
A.1 Vektoren, Linearformen und Tensoren 213
A.1.1
A.1.2
A.1.3
A.1.4
A.1.5
Vektoren 213
Linearformen 214
Tensoren 214
Metrischer Tensor 216
Warum Tensoren? 218
A.2 Basistransformation 218
B
Drehungen
•
•
•
•
•
•
•
•
•
B.1 Isometrien im euklidischen Raum 220
B.2 Infinitesimale Drehungen 222
C
Legendre-Transformation •
•
•
C.1 Legendre-Transformation einer Funktion einer Variablen 224
C.2 Legendre-Transformation einer Funktion mehrerer Variablen 224
D
Die δ -Distribution
•
•
•
•
•
•
D.1 Definition und erste Ergebnisse 226
D.1.1
D.1.2
D.1.3
D.1.4
Definition 226
Erste Eigenschaften 227
Darstellungen der δ -Distribution 227
Heaviside-Funktion 228
•
•
•
•
•
•
•
•
•
viii
D.2 Rechenregeln 229
D.2.1 Skalierung 229
D.2.2 Ableitung 230
D.2.3 Substitution der Integrationsvariablen 230
D.3 Mehrdimensionale δ -Distributionen 231
E
Kugelflächenfunktionen
Literaturverzeichnis
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
233
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
235
Einleitung
Allgemeine Einleitung.
Notationen, Konventionen, usw.
Allgemeine Literaturhinweise
(in alphabetischer Ordnung)
• Arnold, Mathematical methods of classical mechanics [1] (mehr mathematisch);
• Fließbach, Lehrbuch zur theoretischen Physik I. Mechanik [2] & II. Elektrodynamik [3];
• Goldstein, Klassische Mechanik [4] = Classical Mechanics [5]
• Greiner, Klassische Mechanik I & II [6, 7]; Klassische Elektrodynamik [8];
• Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10];
• Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12]
• Landau & Lifschitz, Lehrbuch der theoretischen Physik. Band I: Mechanik [13] & Band II:
Klassische Feldtheorie [14]
• Nolting, Grundkurs Theoretische Physik. Band 1: Klassische Mechanik [15], Band 2: Analytische Mechanik [16] & Band 3: Elektrodynamik [17].
• Scheck, Theoretische Physik 1: Mechanik [18] & 3: Klassiche Feldtheorie [19].
2
Erster Teil
Klassische Mechanik
K APITEL I
Newton’sche Mechanik
Die am meisten intuitive, und historisch die erste, Formulierung der Mechanik ist diejenige von Isaac
Newton.(a) Die nach ihm genannten Beschreibung beruht einerseits auf in Abschn. I.1 eingeführten
Grundbegriffen, die als vom Anfang an gegeben betrachtet werden: Somit bilden Raum und Zeit den
Rahmen, in welchen physikalische Systeme sich befinden und entwickeln, ohne dadurch beeinflusst
zu werden. Dazu werden Änderungen des Bewegungszustands eines Systems, charakterisiert durch
kinematische Größen, durch mechanische Kräfte verursacht.
Andererseits wird der Einfluss der letzteren auf physikalische Systeme durch Beziehungen zwischen diesen Kräften und kinematischen Größen bestimmt, und zwar hier durch die auf Newton
zurückgehenden Gesetze, die in Abschn. I.2 dargelegt werden. Insbesondere führt laut dem zweiten Newton’schen Gesetz eine Kraft zur instantanen Beschleunigung des Systems, auf welchem sie
ausgeübt wird.
In der (modernen) Formulierung der Newton’schen Gesetze spielen bestimmte Bezugssysteme
zur Beschreibung der Bewegung eine besondere Rolle, und zwar die Inertialsysteme. Nach Angabe
eines solchen Systems ist jedes weitere Bezugssystem, das sich relativ zum ersten in gleichförmiger
geradliniger Bewegung befindet, ebenfalls ein Inertialsystem. Genauer nehmen die Newton’schen
Gesetze die gleiche Form in allen Koordinatensystemen an, die sich über eine Galilei-Transformation
aus kartesischen Koordinaten in einem Inertialsystem erhalten lassen (Abschn. I.3).
In einem relativ zu Inertialsystemen beschleunigten Bezugssystem ist die Situation unterschiedlich. Das zweite Newton’sche Gesetz lässt zwar noch in der gleichen Form ausdrücken, jedoch auf
Kosten der Einführung von Scheinkräften auf den bewegten Körper, die in der Beschreibung der
Bewegung in einem Inertialsystem nicht auftreten (Abschn. I.4).
Die genauere Formulierung der Bewegungsgleichungen für ein mechanisches System bestehend
aus mehreren Massenpunkten unter Berücksichtigung der Newton’schen Gesetze wird in Abschn. I.5
dargelegt. Dabei lässt sich die Bewegung in zwei Anteile zerlegen, und zwar einerseits die globale
Bewegung des Systems — oder genauer seines Schwerpunkts —, andererseits die Bewegung der Teile
des Systems relativ zueinander.
Schließlich wird der besondere Fall von Zwei-Körper-Systemen in Abschn. I.6 betrachtet, wobei
der entwickelte Formalismus auf einige wichtige Beispiele angewandt wird.
I.1 Grundbegriffe der Newton’schen Mechanik
Die Mechanik beschäftigt sich mit der Bewegung von physikalischen Systemen, d.h. mit der zeitlichen
Änderung ihrer Position (und ihrer Richtung) im Raum. Zur genaueren Beschreibung der Bewegung
müssen deshalb Modelle für „unsere“ Raum und Zeit spezifiziert werden (§ I.1.1). In § I.1.2 werden
einige zusätzliche Basisdefinitionen und -Begriffe eingeführt, welche für die Formulierung der Gesetze
der Newton’schen Dynamik vorausgesetzt sind oder zur Beschreibung von Systemen bzw. von deren
Bewegung benutzt werden. Schließlich werden Kräfte, die Ursache für die Bewegung sind, und ihre
mathematische Modellierung in § I.1.3 eingeführt.
(a)
I. Newton, 1643–1727
6
Newton’sche Mechanik
Die in diesem Abschnitt diskutierten Begriffe sind nicht auf den Rahmen der Newton’schen
Mechanik beschränkt, sondern bleiben noch relevant in den anderen Formulierungen der Mechanik
nach Lagrange (Kap. II) oder Hamilton (Kap. IV) ohne Änderung, solange nicht-relativistische
Mechanik gültig bleibt. Es sei hier schon erwähnt, dass manche Grundannahmen jenseits des nichtrelativistischen Rahmens nicht mehr erfüllt sind — wie z.B. die Absolutheit von Raum und Zeit in
der relativistischen Mechanik —, während einige Begriffe an Bedeutung verlieren — beispielsweise
wird die Bahnkurve in der Quantenmechanik nur als klassisches Analogon gesehen.
I.1.1 Raumzeit der Newton’schen Mechanik
Nach Newton sind der Raum, in welchem physikalische Systeme sich befinden, und die Zeit,
deren Vergehen die Entwicklung der Systeme erlaubt, absolute Größen. Das heißt, sie stellen einen
allgemeinen Rahmen dar, in welchem physikalische Prozesse stattfinden, ohne durch diese Prozesse
bzw. die daran beteiligten Systeme beeinflusst zu werden.
I.1.1
a Der Raum der Newton’schen Mechanik
::::::::::::::::::::::::::::::::::::::::::::::
Der räumliche Rahmen der Newton’schen Mechanik — und allgemeiner der nicht-relativistischen
Mechanik — ist ein dreidimensionaler euklidischer PunktraumE 3 , hiernach oft Ortsraum genannt,
dessen Punkte alle äquivalent sind. Dieser Raum ist statisch, er ändert sich also nicht mit der Zeit.
Dem Ort eines (als punktförmig modellierten) Systems zu einer gegebenen Zeit wird ein Punkt
P ∈ E 3 zugeordnet. Zur Kennzeichnung dieses Orts werden einerseits Bezugssysteme eingeführt,
entsprechend Beobachtern, die sich möglicherweise bewegen.
Andererseits können in jedem Bezugssystem Koordinatensysteme gefunden werden, mit insbesondere einem Ursprungspunkt, der in diesem Skript oft mit O bezeichnet wird. Eine wichtige
Eigenschaft von euklidischen Räumen ist die Existenz von überall im Raum geltenden kartesischen
Koordinatensystemen, bestehend aus dem Nullpunkt O und drei zueinander orthogonalen Achsen
mit festen Richtungen.
Gegeben der Nullpunkt eines Bezugssystems, man kann die (Orts)Vektoren zwischen diesem
Ursprung und jedem Punkt P ∈ E 3 betrachten. Diese Vektoren — die im Folgenden mit Pfeilen
gekennzeichnet werden, z.B. ~r — bilden einen dreidimensionalen Vektorraum, auf welchem eine
euklidische Struktur definiert werden kann. Somit entspricht der Betrag |~r| ≡ r des Vektors ~r dem
Abstand zwischen seinen Endpunkten im Punktraum. Hiernach wird mehrmals der Einheitsvektor
~er in Richtung von ~r benutzt, d.h. der auf 1 normierter Vektor, für welchen ~r ≡ r~er gilt (falls ~r 6= ~0).
Wiederum ist der euklidische Vektorraum nach Angabe eines kartesischen Koordinatensystems
isomorph zum Koordinatenraum R3 aller möglichen 3-Tupel (x1 , x2 , x3 ) von Koordinaten. Dies wird
günstig als
 1
x
(I.1a)
~r = x2 
3
x
geschrieben, was eigentlich
~r =
3
X
xi ~ei ≡ xi ~ei
(I.1b)
i=1
mit (~e1 ,~e2 ,~e3 ) den Basisvektoren des Koordinatensystems bedeutet, wobei in der zweiten Gleichung
die Einstein’sche Summenkonvention benutzt wird.
Im Fall kartesischer Koordinaten wird auch die Notation (x, y, z) bzw. (~ex ,~ey ,~ez ) statt (x1 , x2 , x3 )
bzw. (~e1 ,~e2 ,~e3 ) verwendet.
Hiernach wird der Vektorraum der Ortsvektoren entweder mitE 3 — um seine euklidische Struktur zu betonen —oder mit R3 — wegen der Isomorphie mit dem Koordinatenraum — bezeichnet.
Bemerkung: Die Struktur der Menge der Ortsvektoren als euklidischer Vektorraum bedarf weiterer
Diskussion, vgl. ???.
7
I.1 Grundbegriffe der Newton’schen Mechanik
I.1.1
b Die Zeit in der Newton’schen Mechanik
::::::::::::::::::::::::::::::::::::::::::::::
Die Zeit der nicht-relativistischen Mechanik ist ein eindimensionaler Parameter — so dass Zeitpunkte als Elemente von R modelliert werden —, der universal ist; das heißt, die Zeit ist die gleiche
für alle Beobachter, unabhängig von ihrer Position und Bewegung. Insbesondere können zumindest
prinzipiell alle Beobachter ihre jeweiligen Uhren zu einem bestimmten Zeitpunkt t0 synchronisieren; dann bleiben diese Uhren auch in der Zukunft synchronisiert, d.h. wenn zwei Beobachter sich
wieder treffen, zeigen ihre beide Uhren die gleiche Zeit t1 > t0 , egal was ihre Bewegungen in der
Zwischenzeit waren.
Bemerkung: Wie wir später sehen werden, gilt diese Synchronisierungseigenschaft nicht mehr im
relativistischen Kontext.
I.1.2 Beschreibung von mechanischen Systemen und ihrer Bewegung
I.1.2
a Idealisierte Systeme
:::::::::::::::::::::::::::
Die Mechanik befasst sich nicht nur mit realistischen physikalischen Systemen, sondern auch mit
Idealisierungen, deren Bewegung viel einfacher zu beschreiben und bestimmen ist.
Das einfachste solche Modell ist der Massenpunkt oder Punktmasse: dabei handelt es sich um
einen punktförmigen Gegenstand, ohne innere Struktur, der nur eine Eigenschaft besitzt, und zwar
seine Masse m.
Die Bewegung eines physikalischen Körpers lässt sich mit diesem Modell gut beschreiben, wenn
die Ausdehnung des Körpers für das betrachtete Problem irrelevant ist.
Ist der Massenpunkt neben seiner Masse m noch mit einer elektrischen Ladung q versehen, so
dass es in einem elektromagnetischen Feld einer entsprechenden Kraft unterliegt, dann spricht man
von einer Punktladung
Bemerkung: Wie in § I.2.2 weiter diskutiert wird, handelt es sich bei der hier mit m bezeichneten
Größe um die träge Masse des Massenpunkts bzw. der Punktladung.
Ein weiteres idealisiertes Modell, für ein System dessen Ausdehnung eine Rolle spielt, ist das
des starren Körpers, der Thema des Abschn. III.1 ist.
I.1.2 b Kinematische Größen
Die zeitliche Reihenfolge der sukzessiven Positionen eines (Massen)Punktes im Ortsraum ist seine
Bahnkurve oder Trajektorie. Unter Betrachtung der Vektorraum-Struktur des Ortsraums kann diese
Bahnkurve als eine Funktion ~x(t) : R → E 3 angesehen werden — oder äquivalent, nach Angabe
eines Koordinatensystems, als eine Abbildung von R nach R3 .
:::::::::::::::::::::::::::::
Bemerkung: Mathematisch genauer sollte man zwischen der Trajektorie — was im engeren Sinne die
geometrische Kurve in E 3 oder R3 bezeichnet — und der Orts-Zeit-Beziehung ~x(t) unterscheiden,
wobei die letztere die Parametrisierung der Kurve — mathematisch ein Weg — durch die Zeit t
ist. Somit kann jede Bahnkurve auch anders als durch die Zeit parametrisiert werden, wie es in den
Beispielen des § I.1.3 b gemacht wird.
Gegeben die (durch die Zeit parametrisierte) Bahnkurve ~x(t) eines Massenpunktes, ist dessen
instantane Geschwindigkeit zur Zeit t die Rate der Änderung des Ortsvektors zu diesem Zeitpunkt,
d.h.
~v (t) ≡
d~x(t)
≡ ~x˙ (t),
dt
(I.2)
wobei hier und im Folgenden der Überpunkt eine zeitliche Ableitung darstellt. Die physikalische
8
Newton’sche Mechanik
Dimension (vgl. § I.1.2 c unten) der Geschwindigkeit ist [v] = L T−1 , wobei L für Länge und T für
Zeit (time) steht; dementsprechend ist die Einheit im SI-System der m s−1 .
Wiederum ist die Beschleunigung des Massenpunktes die zweite Ableitung des Ortsvektors nach
der Zeit
~a(t) ≡
d2 ~x(t)
¨(t) = ~v(t),
˙
≡ ~x
dt2
(I.3)
mit physikalischer Dimension bzw. SI-Einheit [a] = L T−2 bzw. m s−2 .
Schließlich wird der (kinetische) Impuls des Massenpunktes als das Produkt aus seiner Masse
und Geschwindigkeit definiert
~p(t) ≡ m~v (t),
(I.4)
während sein Drehimpuls bezüglich des Nullpunkts ~r = ~0 des Bezugssystems das Kreuzprodukt aus
Ortsvektor und Impuls ist
~
(I.5)
L(t)
≡ ~x(t) × p~(t).
Die jeweiligen physikalischen Dimensionen und SI-Einheiten sind [p] = M L T−1 , in kg m s−1 ,
und [L] = M L2 T−1 mit Einheit kg m2 s−1 , wobei M für Masse steht.
I.1.2
c Physikalische Dimension, Einheiten
:::::::::::::::::::::::::::::::::::::::::::
Entsprechend ihrer qualitativ verschiedenartiger Natur — z.B. ist eine Länge keine Masse —
haben unterschiedliche physikalische Größen verschiedene Dimensionen, und dementsprechend unterschiedliche Einheiten.
Dabei stellt sich aber heraus, dass einige Größen mit einander verknüpft ist: eine Fläche ist
eine Länge zum Quadrat; eine Geschwindigkeit ist eine Länge pro Zeiteinheit, also eine Länge
geteilt durch eine Zeit; usw. Somit kann man eine Handvoll Basisgrößen finden, aus welchen die
anderen abgeleitet werden können. Äquivalent gibt es in einem gegebenen Einheitensystem ein paar
Basiseinheiten und die daraus abgeleiteten Einheiten.
Ein mögliches System von Basisgrößen ist das des sog. internationalen Größensystems, das dem
SI-System von Einheiten entspricht. Dabei sind die Basisgrößen, welche für die Mechanik relevant
sind, die Länge, die Zeit und die Masse, deren jeweilige Dimensionen mit L, T und M bezeichnet
werden. Dann lässt sich die Dimension jeder mechanischen Größe als Produkt von Potenzen der
Basisgrößen ausdrücken, wie im vorigen Paragraphen schon gesehen wurde.
Bemerkung: In der Elektrodynamik wird auch die Stromstärke, mit Dimension I, dazukommen. Und
in der Thermodynamik sollen noch thermodynamische Temperatur Θ und Stoffmenge N betrachtet
werden.
Wichtig ist, dass man nur Größen derselben Dimension addieren oder gleichsetzen kann. Somit
kann eine Gleichung wie „Masse + Länge = Geschwindigkeit“ nie richtig sein.(1) Dagegen dürfen
Größen unterschiedlicher Dimensionen miteinander multipliziert werden, so dass z.B. die Gleichung
„Beschleunigung mal Zeit = Geschwindigkeit“, entsprechend L T−2 · T = L T−1 , sinnvoll ist.(1)
Entsprechend den unterschiedlichen Dimensionen von Ort, Geschwindigkeiten, Beschleunigung,
Impuls, usw. sind die zugehörigen Vektoren (~r, ~v , ~a, ~p, . . . ) Elemente unterschiedlicher Vektorräume, auch wenn diese alle reell und dreidimensional sind, und somit isomorph zu R3 .
Dieser Unterschied ist zwar nicht erkennbar, wenn man auf dem gleichen Bild den Ortsvektor (im Ortsraum) eines Körpers, seine Geschwindigkeit (im Geschwindigkeitsraum) und die
darauf wirkenden Kräfte (im ‚Kraftraum“) darstellt, man darf aber die jeweiligen Pfeile nicht
miteinander addieren.
(1)
Dementsprechend sollte die Leserin immer prüfen, dass ihre Gleichung „die richtige Dimension“ hat.
9
I.1 Grundbegriffe der Newton’schen Mechanik
I.1.3 Mechanische Kräfte
Erfahrung hat gezeigt, dass Änderungen des Bewegungszustands eines physikalischen Körpers
das Resultat der Wirkung von äußeren Ursachen widerspiegeln, welche (mechanische) Kräfte heißen.
Diese werden hiernach allgemein mit dem Zeichen F bezeichnet. Die physikalische Dimension einer
Kraft ist [F ] = M L T−2 und die zugehörige SI-Einheit ist das Newton, wobei 1 N = 1 kg m s−2 .
Nach der Darstellung der mathematischen Modellierung von mechanischen Kräften (§ I.1.3 a)
wird die Arbeit einer Kraft eingeführt (§ I.1.3 b). In vielen Situationen hängt die letztere nur von
den Endpunkten der zurückgelegten Strecke ab; in solchen Fällen entspricht die durch die Kraft
verrichtete Arbeit (dem Negativen) der Variation der potentiellen Energie des Systems (§ I.1.3 c).
Bemerkung: Neben den „wirksamen“ Kräften, die zu einer Bewegung führen — wie z.B. die für den
freien Fall eines Körpers verantwortliche Schwerkraft —, gibt es auch Kräfte, deren „Rolle“ darin
besteht, die möglichen Bewegungen einzuschränken. Ein Beispiel davon ist die durch einen Tisch auf
einen Körper ausgeübte Kraft, die zusammen mit der Schwerkraft dazu führt, dass die Bewegung
des Körpers unter dem Einfluss anderer Kräfte in der Tischebene bleibt. Solche Kräfte werden oft
als Zwangskräfte bezeichnet.
I.1.3
a Mathematische Modellierung
::::::::::::::::::::::::::::::::::::
Neben ihrem Betrag hat eine Kraft erfahrungsgemäß auch eine Richtung: somit ist die Schwerkraft auf einen Körper auf der Erdoberfläche „nach unten“, Reibungskräfte sind „entgegengesetzt zur
Bewegungsrichtung“, usw. Dementsprechend werden Kräfte mathematisch durch dreidimensionale
Vektoren F~ dargestellt.
Diese Modellierung durch Vektoren geht mit einer wichtigen Eigenschaft einher, und zwar mit
einem Superpositionsprinzip. Laut dem letzteren sind Kräfte in der Newton’schen Mechanik additiv,
d.h. wenn zwei unterschiedliche Kräfte F~1 , F~2 auf einen Körper wirken, dann ist ihre Resultierende
durch die Summe F~1 + F~2 gegeben. Dank der Vektorraum-Struktur ist diese Summe wieder ein
Vektor, d.h. kann eine Kraft darstellen.
Dieses Superpositionsprinzip gilt nicht mehr im Rahmen der Allgemeinen Relativitätstheorie.
Wie wir unten weiter sehen werden — vgl. der dritten Bemerkung nach Gl. (I.14b) —, kann die
mathematische Form der Kraft auf einen bewegten Körper in den üblichen Fällen eine Funktion der
Zeit t, der Position ~x(t) und der Geschwindigkeit ~x˙ (t) des Körpers sein, d.h. F~ = F~ t, ~x(t), ~x˙ (t) .
Falls F~ nicht von der Geschwindigkeit abhängt, sondern nur vom Ort (und von der Zeit), wird
F~ (t,~r) Kraftfeld genannt.
Gegeben eine Kraft F~ ist das zugehörige Drehmoment bezüglich eines Bezugspunkts O als
~ ≡ ~r × F~
M
(I.6)
definiert, mit ~r dem Abstandsvektor von O des Drehmoments zum Angriffspunkt der Kraft.
I.1.3 b Arbeit einer Kraft
Wird die Wirkung einer Kraft über ein Zeitintervall — oder genauer über die Strecke, welche
das mechanische System in diesem Zeitintervall zurücklegt — passend integriert, so ergibt sich die
Arbeit der Kraft.
::::::::::::::::::::::::
~ geleistete Arbeit in der Verschiebung eines Körpers um das
Definition: Die durch eine Kraft F
infinitesimale Wegelement d~x entlang seiner Bahnkurve ist
dW = F~ · d~x.
Die hier verwendete Notation dW ist relativ standard, bedeutet aber nicht, dass dW das totale
Differential einer Funktion W ist — was nur gilt, wenn F~ konservativ ist, s. § I.1.3 c. Eine bessere
Notation wäre δW , wie in der Thermodynamik oder der Statistischen Mechanik üblich ist.
(I.7a)
10
Newton’sche Mechanik
Aus Gl. (I.7a) folgt die Arbeit einer Kraft entlang einem endlichen Weg C , indem die elementaren Beiträge entlang infinitesimaler Wegelemente summiert werden. Daraus ergibt sich ein
Kurvenintegral entlang des Wegs C :
Z
(I.7b)
W = F~ · d~x.
C
Die physikalische Dimension der Arbeit einer Kraft ist [W ] = M L2 T−2 .
Zur Berechnung des Kurvenintegral in Gl. (I.7b) muss man in der Praxis eine Parametrisierung
des Wegs C einführen. Oft, aber nicht unbedingt, kann die Zeit t als Parameter benutzt werden.
Dann lässt sich C genau durch die Bahnkurve ~x(t) für t ∈ [t1 , t2 ] beschreiben, und das infinitesimale
Wegelement im Kurvenintegral ist d~x = ~v (t) dt. Somit lautet die Arbeit entlang dem Weg C
Z
Z
Z t2
~
W = dW = F · d~x =
F~ · ~v (t) dt
(I.8)
C
C
t1
und das Kurvenintegral wird zu einem gewöhnlichen Integral. Dabei ist das Produkt F~ · ~v (t) die
(instantane) Leistung der Kraft.
Beispiel 1:
Betrachte man die 2-dimensionale Bewegung (unter irgendeinem nichtspezifizierten Einfluss) eines Massenpunkts, welcher der Kraft
Fx (x, y)
ay
~
≡
F (x, y) =
Fy (x, y)
b
unterliegt, mit a, b Konstanten. Der Massenpunkt bewegt sich von einem
Ausgangspunkt O mit Koordinaten (x = 0, y = 0) zu einem Endpunkt P mit
(x = 1, y = 1). Wir wollen die Arbeit von F~ entlang zwei unterschiedlicher
Wege C1 , C2 von O nach P berechnen.
y6
1
C1
-
•P
C
61 C2
•
O
1
-
x
Abbildung I.1
Die Kurve C1 besteht aus zwei geraden Linienelementen mit x = 0, 0 ≤ y ≤ 1 bzw. y = 1,
0 ≤ x ≤ 1. Somit lässt sich das Kurvenintegral entlang C1 als Summe von zwei einfachen Integralen
schreiben:
Z
Z
Z I
Z P
~
~
W1 =
dW =
F (x, y) · d~x =
F (x = 0, y) · d~x +
F~ (x, y = 1) · d~x,
C1
C1
O
I
mit I dem Punkt mit Koordinaten (x = 0, y = 1). Entlang des Linienelements von O nach I bzw.
von I nach P kann man für C1 einfach y bzw. x als Parameter benutzen, was zu
Z 1
Z 1
W1 =
Fy (x = 0, y) dy +
Fx (x, y = 1) dx
0
0
führt. Ersetzt man die Komponenten Fx , Fy durch ihre Ausdrücke, so kommt
Z 1
Z 1
W1 =
b dy +
a dx = b + a.
0
0
Wiederum lässt sich die Kurve C2 als
x(s) = s
~x(s) =
y(s) = s
d~x
1
mit s ∈ [0, 1] parametrisieren; dann gilt d~x =
ds =
ds.
1
ds
Dies gibt für die Arbeit von F~ entlang C2
Z
Z 1
d~x
W2 =
dW =
F~ x(s), y(s) ·
ds.
ds
C2
0
11
I.1 Grundbegriffe der Newton’schen Mechanik
Indem man das Skalarprodukt explizit schreibt, kommt
2
1
Z 1
as
a
W2 =
(as + b) ds =
+ bs = + b.
2
2
0
0
Somit ist W2 6= W1 : die Arbeit der Kraft F~ zwischen zwei Punkten hängt vom gewählten Weg ab.
Beispiel 2: Lorentz-Kraft
~ — in Abwesenheit von elektrischem Feld —
Eine bewegte Punktladung in einem Magnetfeld B
(b)
unterliegt der Lorentz-Kraft
~
F~ = q~v × B.
(I.9)
Diese Kraft ist immer senkrecht zur Geschwindigkeit ~v der Punktladung. Setzt man diese Kraft in
Gl. (I.8) ein,
Z t2
Z t2
~ · ~v (t) dt,
~
q~v (t) × B
W =
F · ~v (t) dt =
t1
t1
so findet man sofort, dass die Lorentz-Kraft keine Arbeit verrichtet, denn das Integrand ist null.
I.1.3
c Konservative Kräfte
:::::::::::::::::::::::::::
~ (~r) wird konservativ genannt, wenn es ein Potential
Definition: Ein zeitunabhängiges Kraftfeld F
V (~r) gibt, das
~ (~r)
F~ (~r) = −∇V
(I.10)
erfüllt.
~ angewandt auf eine skalare Funktion auf R3 , den
Dabei bezeichnet der Nabla-Operator ∇,
Gradienten dieser Funktion.
Für konservative Kraftfelder hängt die durch die Kraft zwischen zwei Punkten verrichtete Arbeit
nicht vom Weg ab.
Beweis: Das Resultat folgt aus
Z ~r2
Z
W =
F~ (~x) · d~x = −
~r 1
~r 2 ~ (~x) · d~x = − V (~r2 ) − V (~r1 )
∇V
(I.11)
~r 1
~ (~r) ist.
unter Verwendung der Tatsache, dass V (~r) eine Stammfunktion von ∇V
2
Bemerkungen:
∗ Offensichtlich ist V (~r) nur bis auf eine additive Konstante eindeutig. Die Letztere wird oft so
gewählt, dass das Potential im Unendlichen verschwindet.
∗ V (~r) wird auch als potentielle Energie bezeichnet.
~ (~r), definiert auf einem einfach zusammenhängenden Gebiet von
Behauptung: Sei ein Kraftfeld F
R3 .(2) Dann ist F~ (~r) genau dann konservativ, wenn seine Rotation verschwindet:
~ (~r)
F~ (~r) = −∇V
⇔
~ × F~ (~r) = ~0.
∇
(I.12)
Dass die Rotation eines konservativen Kraftfeldes null ist, folgt direkt aus der Identität
~ × ∇V
~ (~r) = ~0,
∇
(2)
Ein Gebiet wird als einfach zusammenhängend bezeichnet, wenn sich jeder geschlossene Weg im Gebiet stetig
zu einem Punkt zusammenziehen lässt, ohne das Gebiet zu verlassen. Zum Beipiel ist eine Ebene (R2 ) einfach
zusammenhängend, während R2 ohne einen Punkt nicht mehr einfach zusammenhängend ist.
(b)
H. A. Lorentz, 1853–1926
12
Newton’sche Mechanik
die sich z.B. komponentenweise beweisen lässt: die i-te Komponente (in einem kartesischen Koordinatensystem) des Terms auf der linken Seite ist ijk ∂j ∂k V (~r), mit ijk dem Levi-Civita-Symbol
und ∂` die Ableitung nach dem Komponenten x` des Ortsvektors. Dabei ist ijk antisymmetrisch
unter dem Austausch von j und k, während die zweite Ableitung ∂j ∂k symmetrisch ist, so dass
die Summe über alle Werte dieser Indizes Null ergibt.
Zum Beweis, dass ein rotationsfreies Kraftfeld F~ (~r) sich als (Negative des) Gradienten eines
skalaren Potentials V (~r) schreiben lässt, soll man zunächst einen beliebigen Punkt ~r0 wählen
und V durch
Z ~r
V (~r) = − F~ (~r 0 ) · d~r 0
~r 0
definieren. Das
R Integral auf der rechten Seite der obigen Formel ist eindeutig definiert, wenn
Wegintegrale F~ · d~x von ~r0 nach ~r unabhängig vom gewählten Weg sind. Betrachte man zwei
unterschiedliche Wege C1 , C2 in R3 , die von ~r0 nach ~r führen. Dann definiert C2 trivial einen
Weg −C2 (mit gleicher Kurve und umgekehrter Parametrisierung) von ~r nach ~r0 , und somit
einen geschlossenen Weg C1 − C2 mit Anfangs- und Endpunkt in ~r0 . Aus dem Stokes’schen Satz
folgt für das Wegintegral der Kraft entlang C1 − C2
I
Z
~ × F~ (~r 0 ) · d2 S
~ = 0,
F~ (~r 0 ) · d~r 0 =
∇
C1 −C2
S
wobei S die durch die Kurve C1 − C2 abgeschlossene Fläche bezeichnet, während die letzte
~ × F~ = ~0 folgt, die in jedem Punkt von S gilt (dank der Annahme
Gleichung aus der Annahme ∇
eines einfach zusammenhängenden Gebiets). Andererseits gilt
I
I
I
0
0
0
0
~
~
F~ (~r 0 ) · d~r 0 ,
F (~r ) · d~r −
F (~r ) · d~r =
C1 −C2
C1
C2
woraus die gesuchte Unabhängigkeit des Wegintegrals vom Weg folgt.
2
I.2 Newton’sche Gesetze
Basierend auf den in Abschn. I.1 eingeführten Begriffen, insbesondere auf der Existenz absoluter
Raum und Zeit, können die dynamischen Gesetze, welche die Wirkung von Kräften auf mechanische
Systeme bestimmen, angegeben werden. Dabei besagen diese Gesetze aber nichts über die mathematische Form der Kräfte: diese hängen von der Situation ab und sollen durch zusätzliche Theorien
oder Modelle präzisiert werden.
I.2.1 Erstes Newton’sches Gesetz
Das erste newtonsche Gesetz — das auch erstes Axiom, lex prima oder Trägheitsgesetz genannt
wird — besagt die Existenz von bevorzugten Bezugssystemen, in denen der Bewegungszustand eines
Körpers sich nicht ändert, so lange keine Kraft auf ihn ausgeübt wird:
Erstes Newton’sches Gesetz
Es gibt besondere Bezugssysteme, sog. Inertialsysteme, in denen ein Massenpunkt, der
keiner Kraft unterliegt, in seinem Zustand der Ruhe oder gleichförmigen geradlinigen (I.13)
Bewegung beharrt.
Anders gesagt bleibt in Inertialsystemen die Geschwindigkeit ~x˙ (t) eines kräftefreien Massenpunktes
¨(t) verschwindet.
konstant, d.h. seine Beschleunigung ~x
Bemerkungen:
∗ Eigentlich wurde dieses Prinzip schon durch Galilei(c) formuliert, weshalb es auch seinen Namen
trägt. Dazu ist der obige Ausdruck des Gesetzes in der Tat nicht die ursprüngliche Formulierung,
denn es gab bei Newton keinen Bezug auf Inertialsysteme.
(c)
G. Galilei, 1564–1642
13
I.2 Newton’sche Gesetze
∗ Das Gesetz setzt die Existenz eines kräftefreien Zustands implizit voraus. In der Praxis ist dies
eine Idealisierung, denn kein Körper kann von der (anziehenden) Schwerkraft der anderen Körper
im Universum isoliert werden.
Was aber praktisch realisierbar ist — zumindest in sehr guter Näherung —, ist dass die Resultierende
der auf ein System wirkenden Kräfte verschwindet, was sich dann als äquivalent zur Abwesenheit
von Kräfte herausstellt.
∗ Auf Inertialsysteme wird in Abschn. I.3 genauer eingegangen; als solches gilt für Experimente auf
der Erde ein Bezugssystem, das sich relativ zu „Fixsternen“, oder besser weit entfernten Galaxien
oder Quasars, nicht bewegt.
I.2.2 Zweites Newton’sches Gesetz
Das zweite newtonsche Gesetz — auch zweites Axiom, lex secunda oder Bewegungsgesetz genannt — beschreibt die Änderung der Bewegung eines Körpers mit Impuls ~p(t) unter dem Einfluss
einer Gesamtkraft F~ :
Zweites Newton’sches Gesetz
In Inertialsystemen gilt
d~p(t)
~
≡ ~p˙(t) = F.
dt
(I.14a)
In dieser Bewegungsgleichung kann der Impuls ~p(t) durch die Masse m und die Geschwindigkeit
~v (t) des Körpers ausgedrückt werden. Wenn die Masse in der Bewegung konstant bleibt, so kann
sie aus der Ableitung herausgezogen werden. Dann wird Gl. (I.14a) zu
m
d~v
d2 ~x
~
=m
= m~a = F.
2
dt
dt
(I.14b)
Das heißt, die Beschleunigung des Körpers ist proportional zur Kraft, welche die Bewegung beeinflusst, und antiproportional zur Masse m.
Bemerkungen:
∗ Das erste Gesetz ist ein Spezialfall des zweiten mit F~ = ~0.
∗ Die Masse m in der Bewegungsgleichung (I.14b) ist die sog. träge Masse des Massenpunktes, die
ein Maß für die Trägheit des letzteren gegenüber Änderungen seines Bewegungszustands darstellt.
Bei der trägen Masse handelt es sich um eine universale Eigenschaft des Körpers, welche die gleiche
bleibt, egal welchen Kräften er unterliegt.
∗ Im zweiten Gesetz wird implizit vorausgesetzt, dass die Kraft F~ möglicherweise von ~x und ~x˙
abhängt, sowie von der Zeit t, nicht aber von höheren Ableitungen.
Dank der letzteren Bemerkung stellt die vektorielle Bewegungsgleichung (I.14b) ein System gewöhnlicher Differentialgleichungen
zweiter Ordnung dar. Wenn die mathematische Form der Kraft
F~ = F~ t, ~x, ~x˙ sowie die Anfangsbedingungen ~x(t0 ), ~x˙ (t0 ) gegeben sind, mit t0 irgend eine Referenzzeit, dann hat dieses System eine eindeutige Lösung.
Beispiel: Massenpunkt im homogenen Schwerefeld mit Luftreibung
Betrachtet sei die Bewegung eines Massenpunktes mit Masse m unter dem Einfluss der Schwerkraft und einer Reibungskraft. Die Resultierende der auf ihn wirkenden Kraft lautet
F~ = F~S + F~R ,
(I.15a)
14
Newton’sche Mechanik
wobei das Superpositionsprinzip für Kräfte (I.20) benutzt wurde. Dabei ist die Schwerkraft
F~S = mS~g ,
(I.15b)
wobei ~g prinzipiell nach unten gerichtet ist — obwohl das im Folgenden keine Rolle spielt —,
während mS die schwere Masse des Körpers bezeichnet. Experimentell ist die letztere proportional
zur trägen Masse, mS ∝ m, wie sich im berühmten Ergebnis „im Vakuum fallen alle Körper gleich“
widerspiegelt. Mit der Wahl mS = m gilt |~g | ' 9, 8 m s−2 auf der Erdoberfläche.
Hier werden zwei Annahmen gemacht, und zwar dass träge und schwere Masse erstens die gleiche
Dimension M haben, und sich somit mit der gleichen Einheit quantifizieren lassen, und zweitens
denselben numerischen Wert haben, was wiederum den Wert der Schwerkraftbeschleunigung g
festlegt.
Andererseits wird für die Reibungskraft die Form der Stokes’schen(d) Reibung
F~R = −α~v
(I.15c)
angenommen, mit α einer positiven Konstanten.
Unter diesen Bedingungen lautet die Bewegungsgleichung (I.14b)
m
d2 ~x(t)
= m~g − α~v (t),
dt2
d.h., mit γR ≡ α/m
d~v (t)
+ γR~v (t) = ~g .
(I.16)
dt
Somit ergibt sich eine lineare inhomogene gewöhnliche Differentialgleichung erster Ordnung. Ihre
Lösung erfolgt wie üblich.
Zuerst wird die allgemeine Lösung ~vh der assoziierten homogenen Differentialgleichung
d~vh (t)
+ γR~vh (t) = 0
dt
gesucht, und zwar
~ e−γR t
~vh (t) = C
~ ∈ R3 beliebig.
mit C
Zweitens ist eine spezielle Lösung ~vs der homogenen Differentialgleichung gebraucht:
d~vs (t)
+ γR~vs (t) = ~g .
dt
Zum Beispiel kann die stationäre Lösung
~vs (t) =
1
~g
γR
genommen werden.
Mit deren Hilfe kann als dritter Schritt die allgemeine Lösung der inhomogenen Differentialgleichung als Summe aus ~vh (t) und ~vs (t) geschrieben werden:
~ e−γR t +
~v (t) = ~vh (t) + ~vs (t) = C
1
~g .
γR
~ festgestellt werden, was unter Berücksichtigung der
Dabei soll noch die Integrationskonstante C
Anfangsbedingung (hier bei t = 0)
(d)
G. G. Stokes, 1819–1903
15
I.2 Newton’sche Gesetze
~+
~v0 ≡ ~v (t = 0) = C
1
~g
γR
erfolgt. Aus der letzteren Gleichung folgt
~ = ~v0 − 1 ~g ,
C
γR
was schließlich zur Lösung
~v (t) = ~v0 e−γR t +
1 − e−γR t
~g
γR
(I.17)
führt. Physikalisch findet man, dass der Einfluss der Anfangsgeschwindigkeit ~v0 wegen der Reibungs−1
kraft auf einer Zeitskala τR ≡ γR
verschwindet. Dies führt zu einem stationären Endzustand, der
unabhängig von der Anfangsbedingung ist.
Wenn nötig kann man auch die Bahnkurve des Massenpunktes über
Z t
~x(t) = ~x0 +
~v (t0 ) dt0
0
bestimmen, und zwar
~x(t) = ~x0 +
1 − e−γR t
γR t + e−γR t − 1
~v0 +
~g .
2
γR
γR
(I.18)
I.2.3 Drittes Newton’sches Gesetz
Das dritte newtonsche Gesetz — auch bekannt als drittes Axiom, lex tertia, Reaktionsprinzip
oder actio und reactio — verknüpft die Kräfte, die zwei Körper aufeinander ausüben:
Drittes Newton’sches Gesetz
Die von zwei Massenpunkten aufeinander ausgeübten Kräfte haben den gleichen
Betrag aber entgegengesetzte Richtungen.
(I.19a)
Wenn die zwei Körper jeweils durch 1 und 2 gekennzeichnet werden, mit F~2→1 bzw. F~1→2 der auf
den ersten durch den zweiten bzw. auf 2 durch 1 ausgeübten Kraft, dann gilt
F~2→1 = −F~1→2 .
(I.19b)
Bemerkungen:
∗ Wie in der Bemerkung in § I.5.1 a weiter diskutiert wird, schließt dieses Gesetz implizit die
Existenz von Drei-Körper-Kräften aus.
∗ Laut dem dritten Gesetz ist die Reaktion von Körper 2 auf Körper 1 instantan, wenn Körper 1
eine Kraft auf Körper 2 ausübt. Dies wird in der Relativitätstheorie nicht mehr möglich sein, wenn
die Körper sich nicht berühren.
I.2.4 „Viertes Newton’sches Gesetz“
Als viertes newtonsches Gesetz, oder lex quarta, wird oft das Superpositionsprinzip für Kräfte
hinzugefügt, das in § I.1.3 schon dargelegt wurde:
Viertes Newton’sches Gesetz
Wirken auf einen Massenpunkt mehrere Kräfte F~1 , . . . , F~k , so addieren sich diese
vektoriell.
(I.20a)
16
Newton’sche Mechanik
Das heißt, die resultierende Kraft auf den Massenpunkt ist
F~ =
k
X
F~k .
(I.20b)
i=1
Es ist dann diese resultierende Kraft, die in der mathematischen Formulierung des zweiten Gesetzes (I.14) auftritt.
I.2.5 Energieerhaltung
Eine erste Folgerung der Newton’schen Gesetze ist der Zusammenhang zwischen der Änderung
der kinetischen Energie eines Massenpunkts und der Arbeit der auf ihn ausgeübten Kräfte.
Definition: Die kinetische Energie eines Massenpunktes mit Masse m und Impuls ~p bzw. Geschwin-
digkeit ~v wird definiert als
~p 2
1
= m~v 2 .
2m
2
T ≡
(I.21)
Bemerkungen:
∗ Offensichtlich hängt der Zahlenwert der kinetische Energie vom Bezugssystem ab. Dies ist in
der Praxis aber kein Problem, denn nur Energiedifferenzen sind in der klassischen Mechanik von
Bedeutung, wie z.B. in Gl. (I.23) unten.
∗ Die physikalische Dimension bzw. die SI-Einheit einer Energie ist — wie für eine mechanische
Arbeit! — [E] = M L2 T−2 bzw. das Joule(e) (1 J = 1 kg m2 s−2 ).
Für einen Massenpunkt, der nur konservativen Kräften unterliegt, gilt der
Theorem (Energieerhaltungssatz):
Wenn alle Kräfte konservativ sind, ist die Summe T + V ≡ E aus kinetischer und
potentieller Energie eines Massenpunktes, entsprechend seiner Gesamtenergie, erhalten.
(I.22)
Die Erweiterung dieses Ergebnisses auf Systeme aus mehreren Massenpunkten wird in § I.5.4 a
dargelegt.
Der Satz lässt sich beweisen, indem das Integral
Z ~r2
F~ (~x) · d~x
~r 1
auf zwei unterschiedliche Weisen geschrieben wird. Da die Kraft konservativ ist, ist das Integral
einerseits laut Gl. (I.11) gleich V (~r1 ) − V (~r2 ).
Andererseits gilt, unter Verwendung der Newton’schen Bewegungsgleichung (I.14b) und der
Identität d~x = ~v (t) dt
Z t2 Z ~r2
Z t2
d~v (t)
d 1
2
~
F (~x) · d~x =
m
· ~v (t) dt =
m~v (t) dt = T (t2 ) − T (t1 ).
(I.23)
dt
~r 1
t1
t1 dt 2
Somit gilt V (~r1 ) − V (~r2 ) = T (t2 ) − T (t1 ), d.h.
T (t1 ) + V (~r1 ) = T (t2 ) + V (~r2 ),
wobei die Zeitpunkten t1 , t2 beliebig sind.
2
Dabei bedeutet Gl. (I.23), dass die Arbeit der auf das System wirkenden Kräften gleich der Änderung
der kinetischen Energie des Systems ist.
(e)
J. P. Joule, 1818–1889
17
I.3 Inertialsysteme. Galilei-Transformationen
I.3 Inertialsysteme. Galilei-Transformationen
Das erste und das zweite Newton’sche Gesetz beruhen auf der Existenz von besonderen Bezugssystemen, nämlich von den Inertialsystemen. Sei angenommen, dass ein solches Inertialsystem BI
existiert. Dann gibt es noch eine ganze Klasse anderer Inertialsysteme B 0 , in denen die Gesetze der
Newton’schen Mechanik die gleiche Form annehmen, und zwar alle Bezugssysteme, die mit BI durch
eine Galilei-Transformation verknüpft sind.
In diesem ganzen Abschnitt werden Ortsvektoren bezüglich eines festen Koordinatensystems in
BI bzw. B 0 mit ~r bzw. ~r 0 bezeichnet. Dementsprechend steht ~x(t) bzw. ~x 0(t) für die Trajektorie eines
Massenpunktes bezüglich BI bzw. B 0 . Für jede Klasse von „einfachen“ Galilei-Transformationen —
und zwar Translationen (§ I.3.1), Galilei-Boosts (§ I.3.2) und Drehungen (§ I.3.3) — werden wir
zeigen, dass die Beschleunigungen d2 ~x(t)/dt2 im Inertialsystem BI und d2 ~x 0(t)/dt2 im Bezugssystem B 0 gleichzeitig verschwinden. Schließlich wird das Verhalten von Kräften unter GalileiTransformationen diskutiert (§ I.3.5).
I.3.1 Translationen
Eine erste Klasse von einfachen Transformationen zwischen Inertialsystemen — oder genauer
gesagt, zwischen Systemen von kartesischen Koordinaten, in deren Nullpunkte Inertialbeobachter
ruhen — besteht aus den Translationen, entweder im Raum oder in der Zeit.
I.3.1
a Räumliche Translationen
::::::::::::::::::::::::::::::::
Betrachten wir zunächst den Fall eines Bezugssystem B 0 bzw. eines Koordinatensystems in B 0 ,
das sich aus dem Inertialsystem BI bzw. aus dem Koordinatensystem in BI durch eine räumliche
Translation um einen festen Vektor ~a ableiten lässt. Dann sind die Koordinaten ~r bzw. ~r 0 eines
Punkts P bezüglich BI bzw. B 0 über die Beziehung
~r 0 = ~r − ~a
(I.24)
verknüpft (vgl. Abb. I.2).
Der gleiche Zusammenhang gilt für die Bahnkurven ~x(t) bzw. ~x 0(t) eines bewegten Massenpunkts. Somit gilt trivial nach Zeitableitung
d~x 0(t)
d~x(t)
d2 ~x 0(t)
d2 ~x(t)
=
,
=
.
dt
dt
dt2
dt2
¨(t) = ~0, dann ist auch ~x
¨ 0(t) = ~0.
Wenn keine Kräfte auf den Massenpunkt wirken, so dass ~x
¨ 0(t) = ~0 zu ~x
¨(t) = ~0, d.h. das erste Newton’sche Gesetz (I.13) gilt genau dann in
Umgekehrt führt ~x
0
B , wenn es im Inertialsystem BI gilt.
x3
P
•
BI
0
x3
~r
O
~r 0
x2
B0
~a
0
x2
x1
O0
0
x1
Abbildung I.2
18
Newton’sche Mechanik
Bemerkung: Führt man zwei Translationen (um Vektoren ~a und ~b) hintereinander aus, so ist die
resultierende Transformation ebenfalls eine Translation, und zwar um den Vektor ~a + ~b.
I.3.1 b Translationen in der Zeit
Sei jetzt angenommen, dass das Bezugssystem B 0 bezüglich des Inertialsystems BI ruht, und
dass die gleichen Raumkoordinaten in B 0 als in BI verwendet werden, d.h. ~r = ~r 0 für Ortsvektoren.
Dagegen unterscheidet sich der in B 0 gewählte Nullpunkt der Zeit t0 = 0 von dem Nullpunkt t = 0
in BI :
t0 = t − τ.
(I.25)
:::::::::::::::::::::::::::::::
Dies entspricht einer zeitlichen Translation, so wie Gl. (I.24) eine räumliche Translation darstellt.
Unter Verwendung der Kettenregel gilt dann für die Zeitableitungen in jedem Bezugssystem(3)
d
dt d
d
= 0
= ,
dt0
dt dt
dt
und eine ähnliche Gleichung für die zweite Ableitungen. Insbesondere ist d2 ~x(t)/dt2 = ~0 genau
äquivalent zu d2 ~x(t0 )/dt02 = ~0.
Bemerkung: Gleichung (I.25) bedeutet nicht nur, dass die Beobachter in BI und B 0 unterschied-
liche Nullpunkte der Zeit genommen haben, sondern auch, dass die Zeit gleich schnell in beiden
Bezugssystemen vergeht. Das heißt, hier wird t0 = αt − τ mit α = 1 betrachtet.
I.3.2 Eigentliche Galilei-Transformationen
Ein Bezugssystem B 0 bewege sich gegenüber dem Inertialsystem BI mit konstanter Geschwindigkeit. Der Einfachheit halber wird angenommen, dass die an BI und B 0 gebundenen Beobachter
Koordinatensysteme verwenden, deren Ursprungspunkte zur Zeit t = 0 übereinstimmen, während
deren Achsen parallel sind, wie in Abb. I.3 dargestellt wird. Dann gilt für die Koordinaten eines
bestimmten Punkts P in den beiden Bezugssystemen
~r 0 = ~r − ~u t.
(I.26)
Eine solche Transformation zwischen Bezugssystemen wird eigentliche Galilei-Transformation oder
auch Galilei-Boost genannt.
x3
P
•
BI
0
x3
~r
O
~r 0
x2
B0
~u t
0
x2
x1
O0
0
x1
Abbildung I.3
(3)
Die hier benutzte Notation bedeutet, dass für jede Funktion f (t0 ) = ϕ t(t0 ) die Gleichung df (t0 )/dt0 = dϕ/dt gilt.
19
I.3 Inertialsysteme. Galilei-Transformationen
Die Beziehung (I.26) führt für die Bahnkurven ~x(t) bzw. ~x 0(t) eines bewegten Massenpunkts P
sofort zu
d~x(t)
d~x 0(t)
d d2 ~x 0(t)
d2 ~x(t)
=
~x(t) − ~u t =
− ~u und
=
.
dt
dt
dt
dt2
dt2
Die erstere Gleichung bedeutet, dass die Beobachter in BI und B 0 einem bewegten physikalischen
System unterschiedliche Geschwindigkeiten zuordnen. Dagegen sind die durch die beiden Beobachter
gemessenen Beschleunigungen gleich.
¨(t) = ~0 in BI , dann gilt ebenfalls ~x
¨ 0(t) = ~0 in B 0 ,
Falls keine Kräfte auf P wirken, so dass ~x
d.h. was in einem der Bezugssystem als kräftefrei aussieht, wird auch im anderen Bezugssystem als
kräftefrei gesehen.
Bemerkung: Genau wie bei Translationen führt die Hintereinanderausführung zweier Galilei-Boosts
zu einem neuen Galilei-Boost.
I.3.3 Drehungen
Die letzte Klasse “einfacher“ Galilei-Transformationen besteht aus den Drehungen, um jede beliebige Achse im Raum. Sei somit angenommen, dass die Beobachter in BI und B 0 Koordinatensysteme
benutzen, deren Achsen gegenüber einander um einen konstanten Winkel θ gedreht sind. Dagegen
stimmen die Ursprungspunkte der Koordinatensysteme miteinander überein.
BI
~r
B0
θ
~eR
Abbildung I.4
In diesem Fall lassen sich Ortsvektoren bezüglich B 0 bzw. ihre Koordinaten aus denen bezüglich
BI durch eine konstante 3 × 3-Drehmatrix R erhalten:(4)
~r 0 = R ~r.
(I.27a)
Äquivalent lässt sich diese Beziehung komponentenweise schreiben:
0
0
xi = R i j xj ,
(I.27b)
0
mit R ij für i0 , j ∈ {1, 2, 3} den Matrixelementen von R.
Bemerkung: Bei der hier betrachteten Drehung — sowie bei den Translationen in § I.3.1 oder den
Galilei-Boosts in § I.3.2 — handelt es sich um eine sog. passive Transformation. Im Gegensatz
zu einer aktiven Drehung wird der betrachtete Massenpunkt nicht gegenüber anderen Objekten
gedreht; hier wird der Beobachter oder äquivalent das Bezugs- bzw. Koordinatensystem, in dem der
Massenpunkt beschrieben wird, gedreht.
(4)
Vgl. Anhang B über Drehmatrizen.
20
Newton’sche Mechanik
Beziehung (I.27a) bzw. (I.27b) gilt auch für die Bahnkurve eines Massenpunkts bezüglich jedes
der Bezugssysteme bzw. für die Komponenten der Bahnkurve. Da die Beziehung zwischen Bahnkurven linear und zeitunabhängig ist, gibt sie nach zweifachen Zeitableitung
d2 ~x 0(t)
d2 ~x(t)
=
R
dt2
dt2
bzw.
0
2 j
d2 xi (t)
i0 d x (t)
=
R
.
j
dt2
dt2
¨(t) = ~0 zu ~x
¨ 0(t) = ~0. Da jede Drehmatrix invertierbar ist, gilt die Implikation auch in
Somit führt ~x
der umgekehrten Richtung.
Bemerkung: Wie bei Translationen oder Galilei-Boosts ist das Produkt zweier Drehmatrizen, ent-
sprechend der Verkettung der assoziierten Drehungen, wieder eine Drehmatrix. Dabei ist aber das
Produkt zweier Drehmatrizen im Allgemeinen nicht-kommutativ, d.h. die Reihenfolge, in der die
Drehungen aufeinander folgen, ist wichtig.
I.3.4 Allgemeine Galilei-Transformationen
Generell sind die Galilei-Transformationen G die linearen Abbildungen (t, ~x) → G(t, ~x) = (t0 , ~x 0 )
zwischen den Zeiten und Positionen gemessen in zwei unterschiedlichen Inertialsystemen.
In § I.3.1–I.3.3 wurde gezeigt, dass räumliche oder zeitliche Translationen, Galilei-Boosts und
Drehungen Beispiele solcher Galilei-Transformationen sind. Allgemeiner definiert jedes „Produkt“ —
d.h. Hintereinanderausführung — von Translationen im Raum oder in der Zeit, Galilei-Boosts und
Drehungen eine allgemeine Galilei-Transformation. Dabei hängt die resultierende Transformation
von der Reihenfolge der Transformationen ab, genau wie es schon bei Drehungen der Fall ist.
Umgekehrt kann man zeigen, dass jede Galilei-Transformation zwischen Inertialsystemen sich
als Verkettung von Translationen, Drehungen und Galilei-Boosts zerlegen lässt.
Schließlich ist das Produkt zweier Galilei-Transformationen wieder eine Galilei-Transformation.
Somit bilden diese Transformationen mit diesem Produkt mathematisch eine sog. Gruppe.(5)
Dabei benutzt man auch, dass es ein „neutrales Element“ für das Produkt gibt, und zwar die
Identitätstransformation, dass jeder Galilei-Transformation eine inverse Transformation zugeordnet werden kann, und schließlich dass das Produkt assoziativ ist.
Da das Ergebnis eines Produkts von der Reihenfolge der „Multiplikanden“ abhängt, wird die Gruppe
als nicht-kommutativ oder äquivalent nicht-abelsch (f) bezeichnet.
Bemerkung: Die Translationen — im Raum oder in der Zeit —, die Drehungen und die Galilei-Boosts
bilden jeweils Untergruppen der Galilei-Gruppe.
I.3.5 Kräfte und Galilei-Transformation
In den vorigen Paragraphen wurde nur das Verhalten des Ortsvektors und seiner Ableitungen
unter Galilei-Transformationen von einem Inertialsystem zu einem anderen betrachtet. Daraus folgt,
¨(t) eines Massenpunktes in einem Inertialsystem BI verschwindet,
dass wenn die Beschleunigung ~x
0
¨ (t) = ~0 für einen Beobachter, dessen Koordinatensystem mit dem in BI über eine Galileidann gilt ~x
Transformation zusammenhängt.
Um zu zeigen, dass das zweite Newton’sche Gesetz (I.14) ebenfalls in beiden Bezugssystemen
BI und B 0 gleichzeitig gilt, soll noch das Transformationsgesetz für Kräfte präzisiert werden. Dafür
soll man die Form der Kraft genauer berücksichtigen.
(5)
(f)
Diese Gruppe wird manchmal mit Gal(3) bezeichnet.
N. H. Abel, 1802–1829
I.4 Beschleunigte Bezugssysteme. Scheinkräfte
21
• Kräfte der Form F~ = F ~eF relativ zu BI , mit konstantem Betrag F und einer festen Richtung
~eF im Raum, transformieren sich unter Drehungen genau wie Ortsvektoren — indem ~eF
für einen Inertialbeobachter in B 0 gedreht aussieht —, während sie unter Translationen oder
¨(t) = F~ sowohl in BI als (mit
Lorentz-Boosts invariant bleiben. Somit gilt die Gleichung m~x
0
„gestrichenen“, transformierten Vektoren) in B .
Ein Beispiel für eine solche Kraft ist die Schwerkraft m~g in einem homogenen Schwerefeld.
• Realistische ortsabhängige Kräfte hängen nicht vom Ortsvektor des Körpers ab, auf den sie
ausgeübt werden, sondern nur von seinem Abstandsvektor von einem anderen Körper. Dies
ist z.B. der Fall der Newton’schen Gravitationskraft zwischen zwei Massenpunkten. Dieser
Abstandsvektor, und somit die Kraft, bleibt unverändert unter Translationen oder LorentzBoosts, während es sich unter Drehungen genau wie ein Ortsvektor bzw. eine Beschleunigung
¨(t) = F~ sowohl in BI als in B 0 .
verhält. Wieder gilt m~x
• Bei geschwindigkeitsabhängigen Kräften ist eine zusätzliche Fallunterscheidung nötig.
– Bei Reibungskräften, wie z.B. der Stokes’schen Reibung (I.15c), ist die relevante Geschwindigkeit diejenige relativ zum Ruhesystem eines Mediums — z.B. der Luft oder
Flüssigkeit, durch welche der Körper sich bewegt. Diese Relativgeschwindigkeit ändert
sich nicht, bis auf Änderungen der beobachteten Richtung, unter den Transformationen
¨(t) = F~ die gleiche Form in BI und in B 0
der § I.3.1–I.3.3, so dass die Gleichung m~x
annimmt.
– Der Fall der Lorentz-Kraft ist mehr problematisch.
~ lautet sie F~ = q~v × B,
~ mit B
~ einem statischen
In Abwesenheit eines elektrischen Feldes E
magnetischen Feld. Dabei ist ~v die Geschwindigkeit der bewegten Punktladung relativ
~ = ~0 und B
~ stationär ist. In Bezugssystemen, die sich
zum Bezugssystem, in dem E
~ und B
~
relativ zu diesem Bezugssystem mit einer Geschwindigkeit ~u bewegen, nehmen E
unterschiedliche Forme an, wie man im Rahmen der Elektrodynamik nachprüfen kann.
Die Felder ändern sich dabei so, dass die Lorentz-Kraft, einschließlich des Terms mit
~ (in Betrag) invariant bleibt. Dies gilt zumindest annähernd, solange |~u| „klein“ ist,
E,
und zwar gegenüber dem Vakuumlichtgeschwindigkeit. Für entsprechende Galilei-Boosts
¨(t) = F~ die gleiche im gleichförmig bewegten Bezugssystem als
erhält die Gleichung m~x
in einem Inertialsystem.
Eigentlich transformieren sich die Gleichungen der Elektrodynamik unter Galilei-Boosts
nicht, wie sie sollten, damit Galilei-Transformationen die richtigen Transformationen
zwischen Inertialsystemen darstellen. Auf dieses Thema wird in Kap. V weiter eingegangen.
Abgesehen vom oben erwähnten Problem mit der Lorentz-Kraft nimmt die mathematische Formulierung (I.14) des zweiten Newton’schen Gesetzes die gleiche Form in allen Bezugssystemen an,
die sich aus einem Inertialsystem über eine Galilei-Transformation ableiten lassen. Deshalb sind
diese Bezugssysteme auch Inertialsysteme.
I.4 Beschleunigte Bezugssysteme. Scheinkräfte
Im vorigen Abschnitt wurde gesehen, dass ein Bezugssystem B 0 , das sich relativ zu einem Inertialsystem BI gleichförmig und geradlinig bewegt, oder dessen Koordinaten konstant verschoben oder
gedreht gegenüber solchen von BI sind, ebenfalls ein Inertialsystem ist.
In diesem Abschnitt wird wieder ein Inertialsystem BI betrachtet, in denen die Newton’schen
Gesetze des Abschn. I.2 gelten. Dann bezeichnet B 0 ein zweites Bezugssystem in beschleunigter
Bewegung gegenüber BI . Wie wir sehen werden ist ein solches Bezugssystem kein Inertialsystem.
22
Newton’sche Mechanik
Ortsvektoren bezüglich eines festen Koordinatensystems in BI bzw. B 0 werden mit ~r bzw. ~r 0
bezeichnet. Wiederum steht ~x(t) bzw. ~x 0(t) für Bahnkurven bezüglich BI bzw. B 0 .
Sei Σ ein physikalisches System, modelliert durch einen Massenpunkt mit träger Masse m. Laut
dem zweiten Newton’schen Gesetz (I.14) gilt im Inertialsystem BI
d2 ~x(t)
~
= F,
(I.28)
dt2
mit F~ der (möglicherweise zeitabhängigen) Resultierenden der physikalischen Kräfte auf Σ. Im
Folgenden wird die in B 0 beobachtete Beschleunigung d2 ~x 0(t)/dt2 für unterschiedliche Bewegungen
von B 0 berechnet, und zwar erstens für den Fall eines linear beschleunigten Bezugssystems (§ I.4.1),
dann für ein rotierendes Bezugssystem (§ I.4.2). In beiden Fällen weicht d2 ~x 0(t)/dt2 von der im
Inertialsystem beobachteten Beschleunigung d2 ~x(t)/dt2 ab: die zusätzlichen Terme, multipliziert
mit m, lassen sich als auf Σ wirkende Scheinkräfte interpretieren.
m
I.4.1 Linear beschleunigte Bezugssysteme
Betrachten wir zunächst den Fall eines Bezugssystems B 0 , das sich relativ zum Inertialsystem
BI mit einer zeitabhängigen Geschwindigkeit ~u(t) bewegt, wobei die Richtung von ~u(t) konstant
bleibt, so dass die Bewegung linear ist. Der Einfachheit halber wird angenommen, dass die an BI
und B 0 gebundenen Beobachter Koordinatensysteme verwenden, deren Ursprungspunkte zur Zeit
t = 0 übereinstimmen, und deren Achsen parallel sind (Abb. I.5). Dann gilt für die Positionen eines
bestimmten Punkts P bezüglich der beiden Bezugssysteme
Z t
0
~r = ~r −
~u(t0 ) dt0 ,
(I.29)
0
wobei der zweite Term (ohne das Minus-Zeichen) die Verschiebung zur Zeit t des Ursprungspunkts
O0 vom Koordinatensystem in B 0 darstellt.
x3
P
•
BI
0
x3
~r
O
~r 0
x2
B0
Z
x1
t
0
x2
~u(t0 ) dt0
O0
0
0
x1
Abbildung I.5
Falls B 0 konstant beschleunigt ist, so gilt ~u(t) = ~a t + ~u(0) und somit
1 2
0
~r = ~r −
~at + ~u(0)t .
2
Beziehung (I.29) gilt auch zwischen den in BI und B 0 gemessenen Bahnkurven ~x(t) und ~x 0(t)
eines Massenpunkts. Eine erste Zeitableitung liefert dann
d~x 0(t)
d~x(t)
=
− ~u(t),
dt
dt
(I.30)
23
I.4 Beschleunigte Bezugssysteme. Scheinkräfte
entsprechend einem Additionstheorem für Geschwindigkeiten. Dann gibt eine zweite Ableitung
d2 ~x 0(t)
d2 ~x(t) d~u(t)
=
−
.
dt2
dt2
dt
(I.31)
In Abwesenheit von physikalischen Kräften, d.h. wenn F~ = ~0, gilt im Inertialsystem BI laut
den ersten zwei Newton’schen Gesetzen d2 ~x(t)/dt2 = ~0. Dagegen ist d2 ~x 0(t)/dt2 im Allgemeinen
gemäß Gl. (I.31) ungleich Null: für einen Beobachter im Bezugssystem B 0 ist die Beschleunigung
¨ 0(t) = −~u˙ (t), was der
eines bezüglich BI ruhenden, d.h. eigentlich kräftefreien, Massenpunkts ~x
Beobachter als Antwort des Massenpunkts zur Anwendung einer Scheinkraft −m~u˙ (t) interpretiert.
Da ein kräftefreier Massenpunkt relativ zu B 0 nicht ruht, sondern sich bewegt, ist jenes Bezugssystem kein Inertialsystem.
I.4.2 Rotierende Bezugssysteme
Jetzt wird angenommen, dass das Bezugssystem B 0 gegenüber dem Inertialsystem BI rotiert.
Dabei können sowohl die (momentane) Achse der Rotation als auch die Rotationsgeschwindigkeit
von B 0 bezüglich BI von der Zeit abhängen. Der Einfachheit halber wird angenommen, dass die
Koordinatensysteme in B 0 und BI den gleichen Ursprungspunkt haben.
Somit lassen sich Vektoren in B 0 aus denen bezüglich BI durch eine zeitabhängige Drehmatrix
RB0/BI(t) ∈ SO(3) erhalten [vgl. Gl. (I.27a)]; z.B. gilt für den Ortsvektor eines Punkts
~r 0 = RB0/BI(t)~r.
(I.32a)
Im Folgenden wird es günstiger sein, die Bahnkurve eines Massenpunkts bezüglich BI durch
jene relativ zu B 0 auszudrücken. Da die Drehmatrix RB0/BI(t) eine orthogonale Matrix ist, ist sie
automatisch invertierbar, woraus
~r = [RB0/BI(t)]−1 ~r 0 ≡ R(t)~r 0
(I.32b)
folgt, wobei die kürzere Notation R(t) für die inverse Drehmatrix eingeführt wurde.(6)
Diese Beziehung gilt nicht nur für den Ortsvektor, sondern für jeden Vektor. Somit gilt für die
in BI und B 0 beobachteten Bahnkurven
~x(t) = R(t)~x 0(t)
(6)
(I.33a)
Es wird der Leserin empfohlen, sich die etwa abstrakten Berechnungen dieses Paragraphen anhand eines Beispiels
klarer zu machen. Z.B. kann man annehmen, dass B0 mit konstanter Rotationsgeschwindigkeit ω0 um die x3 -Achse
des Koordinatensystems von BI rotiert. Die Beziehung zwischen den Basisvektoren der beiden Koordinatensysteme
lautet dann
 
  
~e10
cos(ω0 t)
sin(ω0 t) 0
~e1
~e20  = −sin(ω0 t) cos(ω0 t) 0~e2 
0
0
1
~e3
~e30
oder äquivalent, nach Transposition


cos(ω0 t) −sin(ω0 t) 0
~e10 ~e20 ~e30 = ~e1 ~e2 ~e3  sin(ω0 t)
cos(ω0 t) 0 .
0
0
1
Für die Koordinaten eines Vektors in B0 und BI gilt [vgl. Gl. (I.32a)]
 0 
 1 
 1
x1
cos(ω0 t)
sin(ω0 t) 0
x
x
 20  
2
2
x  = −sin(ω0 t) cos(ω0 t) 0x  ≡ RB0/BI(t)x  .
3
30
0
0
1
x
x3
x
Daraus folgt
 1 
x
cos(ω0 t)
x2  =  sin(ω0 t)
x3
0
−sin(ω0 t)
cos(ω0 t)
0
mit R(t) der in Gl. (I.32b) eingeführten Drehmatrix.
 0
 10 
x
x1
0
 0
 0
0x2  ≡ R(t)x2 
0
0
1
x3
x3
24
Newton’sche Mechanik
und gleichfalls für die Kräfte
F~ (t) = R(t) F~ 0(t),
(I.33b)
vgl. die Diskussion in § I.3.5.
I.4.2
a Bewegungsgleichung in einem rotierenden Bezugssystem
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Leitet man zunächst die Beziehung (I.33a) nach der Zeit ab, so ergibt sich unter Verwendung
der Produktregel
d~x(t)
dR(t) 0
d~x 0(t)
=
~x (t) + R(t)
.
(I.34)
dt
dt
dt
Dabei ist dR(t)/dt die Zeitableitung
dR(t)
R(t+δt) − R(t)
1
R(t+δt)R(t)−1 − 13 R(t)
(I.35)
= lim
= lim
δt→0
δt→0 δt
dt
δt
mit 13 der 3 × 3-Einheitsmatrix, wobei das Produkt zweier Drehmatrizen R(t + δt)R(t)−1 ≡ D
selbst eine Drehmatrix ist.
Im Limes δt = 0 gilt D = 13 . Somit lässt sich D bei „kleinem“ δt als
D = 13 + Ω(t)δt + O (δt)2
(I.36)
schreiben, mit Ω(t) einer 3×3-Matrix.
Genauer muss der Betrag des Produkts aus δt mit irgendeinem der Matrixelemente von Ω(t)
klein gegenüber 1 sein. Bei Gl. (I.36) handelt es sich eigentlich um eine Taylor-Entwicklung,
wobei Ω(t) die Zeitableitung von D ist.
Diese Näherung kann in Gl. (I.35) eingesetzt werden, woraus sich
dR(t)
= Ω(t)R(t)
dt
(I.37)
ergibt. Da D eine Drehmatrix ist, gilt DDT = DT D = 13 . Die Transposition der Gl. (I.36) gibt
DT = 13 + Ω(t)T δt + O (δt)2 ,
woraus DDT = 13 + Ω(t) + Ω(t)T δt + O (δt)2 folgt. Dies ist gleich 13 bis auf Terme der Ordnung
(δt)2 oder höher vorausgesetzt
Ω(t)T = −Ω(t),
d.h. wenn Ω(t) eine antisymmetrische Matrix ist. Diese lässt sich dann parametrisieren als


0
−ω 3 (t) ω 2 (t)
0
−ω 1 (t)
Ω(t) =  ω 3 (t)
(I.38)
2
1
−ω (t) ω (t)
0
oder äquivalent [Ω(t)]ij = −ijk ω k (t) für jede Zeit t, mit ω 1 (t), ω 2 (t), ω 3 (t) drei reellen Zahlen.(7)
Mit dieser Parametrisierung gilt für jeden Vektor ~a mit Komponenten (a1 , a2 , a3 )

 1   2

0
−ω 3 (t) ω 2 (t)
a
ω (t)a3 − ω 3 (t)a2
0
−ω 1 (t)a2  = ω 3 (t)a1 − ω 1 (t)a3  ,
Ω(t)~a = Ω(t) =  ω 3 (t)
2
1
−ω (t) ω (t)
0
a3
ω 1 (t)a2 − ω 2 (t)a1
(7)
Für das in Fußnote (6) eingeführte Beispiel gilt

cos(ω0 δt)
−1
D ≡ R(t+δt)R(t) =  sin(ω0 δt)
0
Somit ist in diesem Fall [vgl. Gl. (I.36)]
−sin(ω0 δt)
cos(ω0 δt)
0

0
Ω(t) = ω0
0
−ω0
0
0


0
1
0 ∼ ω0 δt
δt→0
1
0

0
0
0
und der über die Parametrisierung (I.38) assoziierte Vektor ist ω
~ (t) = ω0~e3 .
−ω0 δt
1
0

0
0 .
1
25
I.4 Beschleunigte Bezugssysteme. Scheinkräfte
d.h.
Ω(t)~a = ω
~ (t) × ~a
(I.39)
mit ω
~ (t) dem Vektor mit Komponenten ω 1 (t), ω 2 (t), ω 3 (t) . Die physikalische Bedeutung dieses
Vektors wird am Ende dieses Paragraphen diskutiert. Wie wir dort sehen wird, macht ω
~ (t) Sinn,
wenn er als Vektor im Inertialsystem BI angesehen wird.
Ersetzt man die Ableitung dR(t)/dt in Gl. (I.34) mit Hilfe von Gl. (I.37), so kommt
d~x(t)
d~x 0(t)
d~x 0(t)
= Ω(t)R(t)~x 0(t) + R(t)
=ω
~ (t) × R(t)~x 0(t) + R(t)
,
dt
dt
dt
wobei die zweite Gleichung aus Beziehung (I.39) folgt.
Sei jetzt ω
~ 0 (t) ≡ R(t)−1 ω
~ (t). Unter Verwendung der Identität
R~a × R~b = R ~a × ~b ,
die für jede Drehmatrix R und jedes Paar von Vektoren ~a, ~b gilt, kann man dann
d~x 0(t)
d~x(t)
0
0
= R(t) ω
~ (t) × ~x (t) +
dt
dt
(I.40)
(I.41)
(I.42)
schreiben.
Beweis der Identität (I.41): es seien {ai } bzw. {bi } die kartesischen Koordinaten von ~a bzw. ~b
0
und R ij die Matrixelemente von R. Dann gilt
i0
0
0
R~a × R~b
= i0j 0k0 R jj aj R kk bk .
Andererseits ist die Determinante der Drehmatrix R durch
0
0
0
det R = `0j 0k0 R `1 R j2 R k3
gegeben, wobei eigentlich det R = 1. Äquivalent gilt nach einer Permutation 1 → `, 2 → j,
3 → k der Matrixspalten
0
0
0
`jk det R = `0j 0k0 R `` R jj R kk ,
0
wobei `jk das Signum der Permutation ist. Multipliziert man diese Gleichung mit R i` und
0
0
0
0
0
0
summiert man über `, so kommt `jk R i` = `0j 0k0 R i` R `` R jj R kk . Dabei ist R `` das `0 `-Element
0
0
der Matrix R, d.h. auch das ``0 -Element der transponierten Matrix R T , so dass R i` R `` , mit
Summe über `, das i0`0 -Element des Produkts RR T = 13 ist. Somit gilt
0
0 0
0
0
0
0
`jk R i` = `0j 0k0 δ i ` R jj R kk = i0j 0k0 R jj R kk .
Schließlich findet man
i0
i0
0
0
0
R~a × R~b
= i0j 0k0 R jj aj R kk bk = `jk R i` aj bk = R ~a × ~b ,
entsprechend dem gesuchten Ergebnis.
Das wiederholte Ableiten von Gl. (I.42) nach der Zeit liefert dann
0
d~x 0(t)
d~
ω (t)
d~x 0(t) d2 ~x 0(t)
dR(t) 0
d2 ~x(t)
0
0
0
=
ω
~ (t) × ~x (t) +
+ R(t)
× ~x (t) + ω
~ (t) ×
+
.
dt2
dt
dt
dt
dt
dt2
Für den ersten Term im rechten Glied können Gl. (I.37), (I.39) und (I.41) wieder benutzt werden:
dR(t) 0
d~x 0(t)
d~x 0(t)
0
0
0
ω
~ (t) × ~x (t) +
= Ω(t)R(t) ω
~ (t) × ~x (t) +
dt
dt
dt
d~x 0(t)
0
0
=ω
~ (t) × R(t) ω
~ (t) × ~x (t) +
dt
d~x 0(t)
0
0
0
= R(t)~
ω (t) × R(t) ω
~ (t) × ~x (t) +
dt
0
d~x (t)
= R(t) ω
~ 0 (t) × ω
~ 0 (t) × ~x 0(t) +
.
dt
26
Newton’sche Mechanik
Somit ergibt sich insgesamt
2 0
0
d2 ~x(t)
d ~x (t)
d~x 0(t) d~
ω 0 (t)
0
0
0
0
= R(t)
+ω
~ (t) × ω
~ (t) × ~x (t) + 2~
ω (t) ×
+
× ~x (t) .
dt2
dt2
dt
dt
(I.43)
Unter Berücksichtigung des zweiten Newton’schen Gesetzes (I.28) lässt sich der Term auf der
~
linken Seite als F/m
umschreiben. Dabei kann man F~ mithilfe der Gl. (I.33b) ersetzen. Nach
−1
Anwendung von R auf die daraus folgende Gleichung erhält man schließlich
m
0
d2 ~x 0(t)
d~x 0(t)
d~
ω 0 (t)
0
0
0
~ 0 − m~
=
F
ω
(t)
×
ω
~
(t)
×
~
x
(t)
−
2m~
ω
(t)
×
−
m
× ~x 0(t).
dt2
dt
dt
(I.44)
Die drei letzten Terme auf der rechten Seite sind wieder Scheinkräfte, die zur im Bezugssystem B 0
gemessenen Beschleunigung beitragen.
Bemerkung: Alle drei neuen Scheinkräfte in Gl. (I.44) sind proportional zur trägen Masse m, so
wie die in § I.4.1 gefundene Scheinkraft in einem linear beschleunigten System. Aus diesem Grund
werden Scheinkräfte auch manchmal Trägheitskräfte genannt.
Wegen der nach heutigem (Herbst 2015) Wissenstand gültigen Proportionalität zwischen schwerer und träger Masse ist auch die Schwerkraft proportional zu m. Daher kann die Schwerkraft
zumindest mathematisch als eine Scheinkraft betrachtet werden, die sich über eine passende
Wahl von Bezugssystem annullieren lässt — was die grobe Grundidee von der Allgemeinen
Relativitätstheorie darstellt.
Bevor wir die drei Scheinkräfte in Gl. (I.44) weiter diskutieren, sollte die Bedeutung des darin
auftretenden Vektors ω
~ 0(t) bzw. von ω
~ (t) festgestellt werden. Zu diesem Zweck kann Gl. (I.40) für
den Fall eines bezüglich B 0 ruhenden Massenpunkts geschrieben werden. Für d~x 0(t)/dt = ~0 gilt
nämlich
d~x(t)
=ω
~ (t) × R(t)~x 0(t) = ω
~ (t) × ~x(t).
(I.45)
dt
Das heißt, die (Rate der) Änderung der in BI gemessenen Position ~x(t) ist senkrecht auf ~x(t) und auf
den Vektor ω
~ (t). Diese Gleichung beschreibt eine (instantane) Rotationsbewegung bezüglich BI um
eine Achse, die durch den Ursprungspunkt des Koordinatensystems geht und entlang der Richtung
von ω
~ (t) liegt. Dazu kann man anhand eines Beispiels(8) sehen, dass die zugehörige Rotationsgeschwindigkeit — d.h. die Rate der Änderung des Winkels von ~x(t) bezüglich einer festen Richtung
— genau durch den Betrag |~
ω (t)| gegeben wird. Entsprechend diesen Eigenschaften heißt der Vektor
ω
~ (t) Winkelgeschwindigkeit.
I.4.2
b Zentrifugalkraft
::::::::::::::::::::::
Der zweite Term auf der rechten Seite von Gl. (I.44) ist die Zentrifugalkraft
0
F~zentrifugal ≡ −m~
ω 0 (t) × ω
~ (t) × ~x 0(t) .
(I.46)
Zerlegt man den Ortsvektor ~x 0(t) in die Summe aus einem Vektor ~xk0 (t) parallel zur Winkelgeschwindigkeit ω
~ 0(t) und einem Vektor ~x⊥0 (t) senkrecht darauf, so trägt nur ~x⊥0 (t) zum geklammerten
Kreuzprodukt bei, und man findet
0 2 0
F~zentrifugal = −m ω
~ (t) ~x⊥(t).
Somit ist die Zentrifugal kraft orthogonal zur Richtung der instantanen Achse der Rotationsbewegung, wie in Abb. I.6 dargestellt wird.
(8)
... wie jenes aus der Fußnote (6)! Vgl. den entsprechenden Ausdruck von ω
~ (t) in Fußnote (7).
27
I.5 Mehrteilchensysteme
ω
~0
F~zentrifugal
~xk0
ω
~ 0×~x 0
~x 0
~x⊥0
Abbildung I.6 – Zentrifugalkraft
Diese Scheinkraft wird auch durch Körper gespürt, die bezüglich des beschleunigten Bezugssystems B 0 ruhen, falls sie nicht auf der Achse der Rotationsbewegung sitzen — d.h. für ~x⊥0 (t) 6= ~0.
I.4.2 c Coriolis-Kraft
Die zweite in Gl. (I.44) auftretende Scheinkraft ist die Coriolis (g) -Kraft
::::::::::::::::::::
F~Coriolis ≡ −2m~
ω 0 (t) × ~v 0(t)
(I.47)
mit ~v 0(t) ≡ d~x 0(t)/dt der Geschwindigkeit im nicht-Inertialsystem B 0 . Diese Scheinkraft ist offensichtlich senkrecht sowohl auf ~v 0(t) als auf ω
~ 0(t), und wirkt nicht auf Körper, die sich parallel zur
instantanen Achse der Drehbewegung bewegen.
Ein an die Erde gebundenes Bezugssystem B 0 ist wegen der Erdrotation in Drehbewegung relativ
zu entfernten Galaxien. Somit erfahren Körper, die auf der Erde sich bewegen, eine Coriolis-Kraft.
Diese dafür sorgt, dass horizontale Bewegungen, wie von z.B. Strömen in Ozeanen oder von Wolken,
auf der Nord- bzw. Südhalbkugel nach rechts bzw. links abgelenkt werden.
I.4.2
d Euler-Kraft
::::::::::::::::::
Der letzte Term in Gl. (I.44) ist die Euler (h) -Kraft
0
d~
ω (t)
× ~x 0(t).
F~Euler ≡ −m
dt
(I.48)
Diese Scheinkraft tritt nur auf, wenn die Winkelgeschwindigkeit sich zeitlich
entsprechend
0 ändert,
einer Änderung entweder der Rotationsgeschwindigkeit — d.h. des Betrags ω
~ (t) — oder der Drehachse, oder natürlich von beiden. Dabei spielt der Bewegungszustand — bewegt oder ruhend — des
Körpers relativ zum beschleunigten Bezugssystem keine Rolle.
˙ 0(t) parallel zu ω
Falls die Rotationsachse konstant bleibt, so dass ~ω
~ 0(t) ist, findet man sofort,
dass die Euler-Kraft tangential zur Bahnkurve des Körpers ist.
I.5 Mehrteilchensysteme
Die in Abschn. I.2 eingeführten Newton’schen Gesetze bzw. der in § I.2.5 betrachtete Energiesatz
beziehen sich auf der Bewegung eines einzigen Massenpunkts unter dem Einfluss äußerer Kräfte
bzw. in einem äußeren Potential — obwohl das dritte Gesetz eigentlich schon Aufschluss über die
Kräfte zwischen zwei Körpern gibt.
Im Gegensatz befasst sich dieser Abschnitt mit der Bewegung eines Systems Σ aus N Massenpunkten — die hiernach auch als „Teilchen“ bezeichnet werden — mit N ≥ 2. Ein solches System
wird dann Mehrteilchensystem genannt. Im Folgenden werden die unterschiedlichen Massenpunkte
(g)
G. Coriolis, 1792–1843
(h)
L. Euler, 1707–1783
28
Newton’sche Mechanik
mit Indizes a, b = 1, 2, . . . , N gekennzeichnet: ihre Ortsvektoren relativ zu einem festen Bezugssystem werden mit ~r1 ,~r2 , . . . ,~rN ≡ {~ra }1≤a≤N bezeichnet; ihre Bahnkurven mit {~xa (t)}1≤a≤N ; ihre
Massen mit {ma }1≤a≤N ; ihre Impulse mit {~pa (t)}1≤a≤N ; usw.
Als einfache Beispiele eines solchen Systems kann man entweder die Erde um die Sonne oder zwei
durch eine Feder gekoppelte Massen betrachten, entsprechend N = 2. Der Fall N = 3 kann z.B. mit
dem System {Sonne + Erde + Mond} illustriert werden. Unter Vernachlässigung des interstellaren
Mediums sind Galaxien Systeme aus N ≈ 109 –1012 Sternen. Schließlich stellen die Moleküle in
einem Kubikmeter von Gas ein Beispiel mit N ≈ 1024 dar.
Die üblichen Größen zur Beschreibung eines Mehrteilchensystems, sowie die in der klassischen
Mechanik üblichen Modellierung der für ein solches System relevanten Kräfte, werden in § I.5.1
dargelegt. In § I.5.2–I.5.4 werden Aussagen über die Zeitentwicklung einiger charakteristischen Größen — Impuls, Drehimpuls und Energie — hergeleitet. Insbesondere wird sich herausstellen, dass
diese Größen bei Mehrteilchensystem, die mit ihrer Umgebung nicht wechselwirken, erhalten sind,
d.h. sie bleiben konstant in der Zeit. Schließlich befasst sich § I.5.5 mit dem „geeigneten“ Bezugssystem, in welchem die Teilchenbewegungen entkoppelt von der globalen Bewegung des Systems
sind.
I.5.1 Grundlagen
I.5.1
a Modellierung des Systems. Bewegungsgleichungen
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Um die Bewegung eines der Massenpunkte des Systems Σ beschreiben zu können, soll man
zunächst die Kraft auf ein solches Teilchen formulieren. Der Einfachheit halber wird die Bewegung
des Mehrteilchensystems in einem Inertialsystem B untersucht wird, so dass keine Scheinkräfte
vorhanden sind. Somit wird angenommen, dass die Kraft auf Teilchen a sich als
F~a = F~a,ext +
N
X
F~b→a
(I.49)
b=1
b6=a
schreiben lässt, wobei eine mögliche Zeit- oder Ortsabhängigkeit nicht geschrieben wurde. Dabei
stellt F~a,ext die Resultierende aus den auf a wirkenden externen Kräften dar, die auch äußere Kräfte
genannt werden. Dieser Term beschreibt den Einfluss von Ursachen, die nicht teil vom betrachteten
Mehrteilchensystem sind, wie z.B. eines Schwerefeldes, in dem die Teilchen sind.
Dagegen steht F~b→a für eine innere Kraft, und zwar für diejenige, die das b-te Teilchen von Σ auf
das Teilchen a übt. Damit die Massenpunkte des Mehrteilchensystems sich gegenseitig beeinflussen,
sollten diese inneren Kräfte nicht identisch Null sein.
Um Gleichungen kürzer zu machen, kann man eine innere Kraft F~a→a = ~0 definieren. Mit diesem
Trick läuft z.B. die Summe in Gl. (I.49) über alle Werte von b von 1 bis N , ohne a auszuschließen.
Bemerkung: Die Zerlegung (I.49) enthält eigentlich eine wichtige Annahme, und zwar dass es keine
Drei-Körper-Kräfte im System gibt. Das heißt, Teilchen a unterliegt keiner Kraft, die durch Teilchen
b und b0 gemeinsam verursacht wird: der ganze Einfluss dieser beiden Teilchen auf a lässt sich als
Summe von Zwei-Körper-Kräften F~b→a + F~b0 →a beschreiben. A fortiori gibt es keine Vier-, Fünfusw. Körper-Kräfte.
Diese Annahme liegt eigentlich der ganzen Newton’schen Mechanik zu Grunde, denn sie ist für das
dritte Gesetz (I.19) nötig.
Laut dem zweiten Newton’schen Gesetz (I.14) lautet die Bewegungsgleichung für jedes Teilchen
a = 1, . . . , N
N
X
d~pa (t)
d2 ~xa (t)
~a = F~a,ext +
= ma
=
F
F~b→a
dt
dt2
b=1
für jedes a ∈ {1, 2, . . . , N }.
(I.50)
29
I.5 Mehrteilchensysteme
Die N vektoriellen Gleichungen (I.50) bzw. die 3N entsprechenden skalaren Gleichungen, die sich
aus Projektion auf drei Koordinatenachsen ergeben, bilden ein System aus gekoppelten Differentialgleichungen, welche die Bewegung des Mehrteilchensystems beschreiben.
I.5.1 b Grundbegriffe und Definitionen
Die Gesamtmasse des Mehrteilchensystems Σ wird definiert als
:::::::::::::::::::::::::::::::::::::::
M≡
N
X
ma .
(I.51)
a=1
Diese Definition sieht trivial aus, sie gilt aber nur als Newton’sche, nicht-relativistische Näherung. Eigentlich ist die Masse eines gebundenen Systems kleiner als die Summe seiner Bestandteile — z.B. ist die Masse eines Atomkerns kleiner als die Summe der Massen dessen Protonen
und Neutronen —, wobei die Differenz, der „Massendefekt“, mit der Bindungsenergie des Systems
zusammenhängt.
Zur Charakterisierung der Bewegung von Σ lohnt es sich, den Schwerpunkt des Mehrteilchensystems einzuführen. Dabei handelt es sich erstens um den Punkt mit Ortsvektor
N
1 X
~
ma~ra .
R≡
M
(I.52)
a=1
Entsprechend dieser Definition spricht man auch von dem Massenmittelpunkt. In ähnlicher Weise
lautet die Bahnkurve des Schwerpunkts
N
1 X
~
X(t)
≡
ma ~xa (t).
M
(I.53)
a=1
In einem zweiten Schritt kann man diesem geometrischen Schwerpunkt die Masse M des Mehrteil~
chensystems zuordnen, so dass als Schwerpunkt jetzt einen fiktiven Massenpunkt mit Ortsvektor R
~
bzw. Trajektorie X(t) bezeichnet wird.
Summiert man die Impulse bzw. Drehimpulse aller Teilchen von Σ, so erhält man den Gesamtimpuls
N
X
P~ ≡
~pa
(I.54)
a=1
bzw. den Gesamtdrehimpuls
~ ≡
L
N
X
~ra × ~pa
(I.55)
a=1
des Mehrteilchensystems. Dabei findet man einfach, dass der Gesamtimpuls P~ (t) mit der Gesamt~
masse M und der Geschwindigkeit dX(t)/dt
des Schwerpunkts zusammenhängt, und zwar über
~
dX(t)
P~ (t) = M
.
dt
Diese Beziehung folgt sofort aus P~ (t) =
N
X
a=1
ma
N
d~xa (t)
d 1 X
=M
ma ~xa (t)
dt
dt M a=1
(I.56)
2
Definition: Eine Funktion f t, {~r a }, {~
va } der Ortsvektoren und Geschwindigkeiten der N Teilchen
heißt Erhaltungsgröße oder Konstante der Bewegung, wenn sie für alle Lösungen {~ra = ~xa (t)},
{~va = ~x˙ a (t)} der Bewegungsgleichungen (I.50) konstant in der Zeit bleibt:
d
f t, {~xa (t)}, {~x˙ a (t)} = 0.
(I.57)
dt
Bemerkung: Der Wert der Konstanten hängt im Allgemeinen von der Lösung ab!
30
Newton’sche Mechanik
I.5.2 Bewegung des Schwerpunkts
Summiert man die individuellen Bewegungsgleichungen (I.50) über alle Teilchen bzw. alle Werte
von a, so ergibt sich
N
N
X
dP~ (t) X ~
=
Fa,ext +
F~b→a .
(I.58)
dt
a=1
a,b=1
Unter Verwendung der Gl. (I.56) ist der linke Term dieser Gleichung einfach gleich dem Produkt
2.
~
aus der Gesamtmasse und der Beschleunigung des Schwerpunkts, M d2X(t)/dt
Für den zweiten Term im rechten Glied von Gl. (I.58) kann man schreiben
N
X
N
N
1 X
1 X ~
Fb→a + F~b→a =
F~b→a + F~a→b = ~0
F~b→a =
2
2
a,b=1
a,b=1
(I.59)
a,b=1
wobei die erste Gleichung trivial ist, während die zweite aus eine Umbennenung der Indizes im
zweiten Summanden in den Klammern, und die dritte aus dem dritten Newton’schen Axiom (I.19)
folgt.
Somit führt Gl. (I.58) insgesamt zur Bewegungsgleichung
N
X
~
dP~ (t)
d2X(t)
=M
=
F~a,ext .
dt
dt2
(I.60a)
a=1
Diese Gleichung stellt die mathematische Formulierung des Schwerpunktsatzes dar:
Der Schwerpunkt eines N -Teilchensystems bewegt sich nur unter dem Einfluss der
Summe der äußeren Kräfte auf die Teilchen, und zwar wie ein Massenpunkt mit
der Masse M , an dem diese Summe angreift.
(I.60b)
Falls keine äußere Kräfte vorliegen — d.h. für ein sog. abgeschlossenes System, ohne Wechselwirkung mit seiner Umgebung —, oder wenn ihre Resultierende verschwindet, dann gilt einfach
dP~ (t)/dt = ~0, d.h. der Gesamtimpuls P~ (t) ist erhalten:
Wenn die Resultierende aller äußeren Kräfte auf einem Mehrteilchensystem Σ
verschwindet, dann ist der Gesamtimpuls von Σ eine Erhaltungsgröße.
(I.60c)
I.5.3 Drehimpuls
Als nächstes können wir jetzt die Zeitentwicklung des durch Gl. (I.55) definierten Gesamtdrehimpulses untersuchen. Leitet man dessen Ausdruck nach der Zeit ab, so ergibt sich nach Anwendung
der Produktregel
N
N
X
X
~
dL(t)
d~xa (t)
d~p (t)
=
× ~pa (t) +
~xa (t) × a .
dt
dt
dt
a=1
a=1
Da die Geschwindigkeit d~xa (t)/dt parallel zum Impuls ist, verschwindet der erste Term auf der
rechten Seite. Unter Verwendung der Bewegungsgleichung (I.50) für Teilchen a erhält man dann
N
N
N
X
X
X
~
dL(t)
=
~xa (t) × F~a =
~xa (t) × F~a,ext +
~xa (t) × F~b→a ,
dt
a=1
a=1
(I.61)
a,b=1
wobei die zweite Gleichung aus der Aufspaltung (I.49) der Kraft auf a folgt.
Jeder Beitrag ~xa (t) × F~a,ext für a ∈ {1, . . . , N } ist das Drehmoment der äußeren Kraft F~a,ext ,
d.h. der erste Term auf der rechten Seite von Gl. (I.61) ist die Resultierende dieser Drehmomente.
31
I.5 Mehrteilchensysteme
Ähnlich wie in Gl.(I.59) kann man den zweiten Term im Ausdruck ganz rechts von Gl. (I.61)
umschreiben, und zwar als
N
N
N
X
1X
1 X
~xa (t) × F~b→a =
~xa (t) × F~b→a + ~xa (t) × F~b→a =
~xa (t) × F~b→a + ~xb (t) × F~a→b .
2
2
a,b=1
a,b=1
a,b=1
Laut dem dritten Newton’schen-Gesetz kann F~a→b durch −F~b→a ersetzt werden, woraus sich
N
X
a,b=1
N
1 X
~
~xa (t) − ~xb (t) × F~b→a
~xa (t) × Fb→a =
2
a,b=1
ergibt. Falls die Kraft F~b→a entlang des Vektors ~xb (t) − ~xa (t) von Teilchen a nach Teilchen b liegt —
was z.B. der Fall für die Coulomb-Kraft zwischen zwei Punktladungen oder für die Newton’schen
Schwerkraft zwischen zwei Punktmassen ist —, wird F~b→a Zentralkraft genannt. In diesem Fall
verschwindet das Kreuzprodukt auf der rechten Seite der oberen Gleichung, und die Gl. (I.61)
vereinfacht sich zu
N
X
~
dL(t)
=
~xa (t) × F~a,ext .
(I.62a)
dt
a=1
Dieses Ergebnis stellt den Drehimpulssatz für ein Mehrteilchensystem dar, und zwar
Für ein System aus N Teilchen, zwischen denen nur Zentralkräfte wirken, ist die
Rate der Änderung des Gesamtdrehimpulses gleich der Resultierenden von den
äußeren Drehmomenten.
(I.62b)
Falls keine äußere Kräfte vorliegen, oder wenn die Resultierende ihrer Drehmomente verschwin~
~
det, gilt dL(t)/dt
= ~0, d.h. der Gesamtdrehimpuls L(t)
ist erhalten:
Wenn die Resultierende aller äußeren Drehmomente auf einem Mehrteilchensystem mit nur zentralen inneren Kräften verschwindet, dann ist der Gesamtdrehimpuls des Systems eine Erhaltungsgröße.
(I.62c)
Bemerkungen:
∗ Zentralkräfte werden oft definiert als Kräfte, die immer entlang der Richtung bis zu einem festen
Punkt — dem Kraftzentrum — liegen. Die hier adoptierte Definition, laut der die Zweikörperkraft
F~b→a immer in Richtung des Abstandsvektors zwischen Teilchen a und b zeigt, lässt sich ähnlich
betrachten: wird die Position vom Massenpunkt b als fest angenommen, ist die durch Teilchen b auf
jedes andere Teilchen a ausgeübte Kraft eine Zentralkraft bezüglich der Position von b.
∗ Hier wurde in der Herleitung der Ergebnisse (I.61)–(I.62c) angenommen, dass die ineren Kräfte
zentral sind. Eigentlich ist die Erhaltung des Gesamtdrehimpulses in abgeschlossenen Systemen viel
allgemeiner — wie wir in § II.3.1 c sehen werden, spiegelt diese Erhaltung die Isotropie des Raums
wider — und gilt auch für Systeme mit nicht-zentralen Kräften.
I.5.4 Energie
I.5.4
a Energiesatz
::::::::::::::::::
Die kinetische Energie des a-ten Teilchens eines Systems ist Ta = ~pa2 /2ma , vgl. Definition (I.21).
Damit lässt sich die gesamte kinetische Energie eines Mehrteilchensystems als
T ≡
N
X
~pa2
2ma
a=1
definieren.
(I.63)
32
Newton’sche Mechanik
Sei jetzt angenommen, dass sowohl die äußeren als die inneren Kräfte, die auf die Körper des
Mehrteilchensystems wirken, konservativ sind. Das heißt einerseits, dass es Potentiale Va,ext (~ra )
existieren, die
~ a Va,ext (~ra ) für a ∈ {1, . . . , N }
F~a,ext = −∇
(I.64)
~ a den Gradienten bezüglich dem Ortsvektor ~ra bezeichnet.(9) Andererseits gibt es
erfüllen, wobei ∇
paarweise Wechselwirkungspotentiale Vab , die nur von Abstand |~ra − ~rb | abhängen, aus denen die
inneren Kräfte abgeleitet werden können, und zwar über
~ a Vab |~ra − ~rb | für a, b ∈ {1, . . . , N }.
F~b→a = −∇
(I.65)
In diesem Fall ist die Zweikörperkraft der Form
F~b→a = fba |~ra − ~rb | ~eab
mit fba einer Funktion einer reellen Variablen und ~eab ≡ (~rb − ~ra )/|~rb − ~ra | dem Einheitsvektor
entlang des Abstandsvektors der beiden Teilchen. Somit ist die Kraft zentral.
Damit das dritte Newton’sche Axiom erfüllt wird, muss Vab = Vba für jedes Paar a, b gelten.
~ a Vab |~ra − ~rb | = ∇
~ b Vab |~ra − ~rb | .
Die Kettenregel gibt nämlich −∇
Die gesamte potentielle Energie V des Mehrteilchensystems ist dann
V ≡
N
X
Va,ext (~ra ) +
a=1
X
Vab |~ra − ~rb | .
(I.66)
1≤a<b≤N
Dabei muss die Wechselwirkungsenergie jedes Teilchenpaars nur einmal mitgezählt werden, weshalb
die Summe über Paare mit a < b eingeschränkt wurde. Äquivalent kann man die Summe im zweiten
Term auf der rechten Seite noch anders umschreiben, und zwar entweder als die Hälfte der Summe
über alle Werte von a und b mit der Einschränkung a 6= b, oder als die halbe Summe über alle Werte
von a und b ohne Einschränkung, jedoch mit der Konvention Vaa ≡ 0:
X
Vab =
N N
N
1 XX
1X
Vab =
Vab mit Vaa = 0.
2
2
a=1 b=1
b6=a
1≤a<b≤N
a,b=1
~a auf das a-te Teilchen kann noch durch das Gesamtpotential V
Bemerkung: Die Gesamtkraft F
[Gl. (I.66)] ausgedrückt werden:
~ a V,
F~a = −∇
(I.67)
wobei V als Funktion der N Ortsvektoren ~r1 , . . . ,~rN zu betrachten ist.
Unter den obigen Annahmen über die Kräfte ist die Summe
" N
#
N
X
X
X
T +V ≡
Ta +
Va,ext +
Vab |~ra − ~rb |
a=1
a=1
(I.68)
1≤a<b≤N
aus allen kinetischen und potentiellen Energien eine Konstante der Bewegung, die Gesamtenergie
des Systems.
Dieses Ergebnis stellt den Energieerhaltungssatz für ein Mehrteilchensystem dar, und zwar
Die Gesamtenergie eines Systems aus N Teilchen mit nur konservativen inneren
und äußeren Kräften ist eine Erhaltungsgröße.
(9)
(I.69)
Hier ist diese Notation noch überflüssig, denn Va,ext ist nur Funktion der Ortskoordinaten des a-ten Körpers.
Dagegen hängt Vab von ~ra und ~rb ab, oder das in Gl. (I.66) definierte Potential V ist Funktion der Positionen aller
Bestandteile des Systems, so dass die Präzisierung der Variablen, nach denen abgeleitet wird, dann nötig wird.
33
I.5 Mehrteilchensysteme
Beweis: Einerseits gilt unter Verwendung der Bewegungsgleichung (I.50)
N
N
N
X dTa
X ~p (t) d~p (t) X
dT
a
=
=
· a
=
~va (t) · F~a ,
dt
dt
m
dt
a=1
a=1
a=1
(I.70)
mit ~va der Geschwindigkeit von Teilchen a. Andererseits gibt die Kettenregel
i
X h
dV
d
~ a V ~x1 (t), . . . , ~xN (t) · d~xa (t) .
∇
= V ~x1 (t), . . . , ~xN (t) =
dt
dt
dt
a=1
Der Term in eckigen Klammern ist genau das Negative der Kraft auf Teilchen a, vgl. Gl. (I.67),
so dass
N
X
dV
=−
F~a · ~va (t)
(I.71)
dt
a=1
Insgesamt liefern Gl. (I.70) und (I.71) das gesuchte Ergebnis d(T +V )/dt = 0.
2
Bemerkung: Wenn einige der Kräfte nicht-konservativ sind, gilt Gl. (I.70) immer noch. Dagegen
gilt Gl. (I.71) nicht mehr, denn nicht jede Kraft F~a sich aus einem Potential ableiten lässt. Spaltet
man die Kräfte in einen konservativen und einen nicht-konservativen Anteil auf, und definiert man
die gesamte potentielle Energie der ersteren, so findet man einfach, dass die Rate d(T +V )/dt der
Änderung der Gesamtenergie gleich der gesamten Leistung der nicht-konservativen Kräfte ist:
N
X
d
F~a,diss. · ~va (t),
(T + V ) =
dt
(I.72)
a=1
wobei das hier verwendete Kürzel „diss.“ für dissipative Kraft steht, weil diese Kräfte zur nichtErhaltung der Energie, zu ihrer Dissipation, führen.
In der Praxis wird die dissipierte Energie nicht vernichtet, sondern in eine andere „nichtmechanische“ Form umgewandelt, und zwar Wärme. Unter Berücksichtigung der letzteren bleibt
die Gesamtenergie erhalten, entsprechend dem ersten Hauptsatz der Thermodynamik.
I.5.4
b Virialsatz
::::::::::::::::
Wie kurz gesehen wurde bleibt die Gesamtenergie T + V eines Mehrkörpersystems mit nur
konservativen Kräfte erhalten. Dagegen sind die kinetische und potentielle Energien im allgemeinen
nicht getrennt konstant, sondern wandeln sich ständig in einander um. Man kann aber noch eine
Aussage über die zeitlichen Mittelwerte von T und V — oder genauer, im allgemeinen Fall, dem
Gradienten von V — machen.
Sei f eine Funktion einer reellen Variablen, und zwar der Zeit. Der zeitliche Mittelwert von f (t)
wird als
Z
1 τ
hf it ≡ lim
f (t) dt
(I.73)
τ →∞ τ 0
definiert, wobei es angenommen wird, dass der Limes des Integrals existiert.
Unter Verwendung dieser Definition gilt den Virialsatz
*N
+
X
~ a V · ~xa (t) .
2 hT i =
∇
(I.74)
t
a=1
t
Beweis: Die Bewegungsgleichungen (I.50) geben
N
X
a=1
¨a (t) · ~xa (t) =
ma ~x
N
X
a=1
F~a · ~xa (t) = −
N
X
~ a V · ~xa (t)
∇
a=1
wobei die linke Seite noch als
" N
#
N
N
X
X
X
d
¨a (t) · ~xa (t) =
ma ~x
ma~x˙ a (t) · ~xa (t) −
ma~x˙ a (t)2
dt
a=1
a=1
a=1
geschrieben werden kann. Somit sind die zeitlichen Mittelwerte der rechten Seiten dieser Glei-
34
Newton’sche Mechanik
chungen gleich. Dabei gilt unter Nutzung der Definition (I.73)
* " N
#+
" N
#
Z
1 τ d X
d X
˙
˙
ma~xa (t) · ~xa (t)
= lim
ma~xa (t) · ~xa (t) dt
τ →∞ τ 0 dt
dt a=1
a=1
t
τ
N
1X
˙
= lim
ma~xa (t) · ~xa (t) .
τ →∞ τ
0
a=1
Wenn die Produkte ~x˙ a (t) · ~xa (t) immer abgegrenzt bleiben, nimmt die Summe im letzten Term
einen endlichen Werte an, so dass der Grenzwert Null ist. Somit ergibt sich
* N
+ * N
+
X
X
2
˙
~
−
∇a V · ~xa (t) = −
ma~xa (t) .
a=1
t
a=1
t
Nach trivialen Umschreibung ist dies genau das gesuchte Ergebnis (I.74).
2
Für abgeschlossene Systeme — d.h. Va,ext = 0 für alle Teilchen a — mit Wechselwirkungspotentialen der Form
Vab |~rb − ~ra | = αab |~ra − ~rb |n
(I.75)
mit n ∈ Z und αab ∈ R für alle a, b ∈ {1, . . . , N } nimmt der Virialsatz eine einfachere Form an.
In der Tat gelten
~ a |~rb − ~rc | = (δab − δac ) ~rb − ~rc
∇
|~rb − ~rc |
und
dVbc
Vbc
=n
,
d|~rb − ~rc |
|~rb − ~rc |
woraus unter Anwendung der Kettenregel
" N
#
N
N
X
X
X
dVbc ~
Vbc
~
~
∇a V = ∇a
Vbc =
∇a |~rb − ~rc | = n
(~rb − ~rc )(δab − δac )
d|~rb − ~rc |
|~rb − ~rc |2
b,c=1
b,c=1
b,c=1
folgt. Beim Durchführen des (Skalar)Produkts mit ~ra und der Summe über a führen die Terme
(δab − δac )~ra zu ~rb − ~rc , und daher zu
N
X
N
X
~ a V · ~ra = n
Vbc = 2nV.
∇
a=1
b,c=1
Insgesamt vereinfacht sich der Virialsatz (I.74) zu
2 hT it = n hV it .
(I.76a)
Daraus folgt dann für die Gesamtenergie — die wegen ihrer Konstanz natürlich gleich ihrem zeitlichen Mittelwert ist
n
2
E = hEit = hT it + hV it =
+ 1 hV it =
+ 1 hT it .
(I.76b)
2
n
Ein erstes wichtiges Anwendungsbeispiel ist das von Massenpunkten, die unter einander über
das Newton’sche Gravitationspotential Vab ∝ 1/|~ra −~rb | wechselwirken, entsprechend Gl. (I.75) mit
n = −1. Diese Massenpunkte können z.B. die Sterne eines Kugelsternhaufens oder die Mitglieder
eines Galaxienhaufens darstellen.(10) In diesem Fall lautet der Virialsatz
2 hT it = − hV it
(I.77a)
und die Gesamtenergie
1
hV it = − hT it .
(I.77b)
2
Da hT it genau wie T positiv ist, gilt E < 0 — wie wir im Fall N = 2 in § I.6.3 wieder finden werden.
E=
(10)
. . . unter der Annahme, dass relativistische Effekte keine Rolle spielen.
35
I.5 Mehrteilchensysteme
Ein zweites Beispiel ist das von gekoppelten harmonischen Oszillatoren, d.h. mit quadratischen
Potentialen Vab ∝ (~ra − ~rb )2 , entsprechend dem Fall n = 2. Dann kommen
hT it = hV it
und E = 2 hT it .
(I.78)
Da dieses Problem (zumindest prinzipiell) analytisch lösbar ist, indem die Oszillatoren entkoppelt
werden können (vgl. § III.2.2), kann dieses Ergebnis direkt wiedergefunden werden. Eigentlich gelten
nämlich die zwei Gleichungen schon für einen einzelnen harmonischen Oszillator.
I.5.5 Schwerpunktsystem
∗ bezeichnet,
Sei Σ ein Mehrteilchensystem. Als Schwerpunktsystem wird ein Bezugssystem BΣ
in welchem der Schwerpunkt von Σ ruht, und welches gegenüber eines Inertialsystems BI nicht
∗ mit dem
rotiert. Um beide Bedingungen zu erfüllen, nimmt man oft ein Koordinatensystem in BΣ
Schwerpunkt von Σ als Ursprungspunkt und den Achsen parallel zu denen eines Koordinatensystems
von BI .
∗ gemessenen Größen mit Sternchen gekennzeichnet: Ortsvektor
Hiernach werden die bezüglich BΣ
∗
∗
~r , Teilchenbahnkurven ~xa (t), Impulse ~pa∗ (t), usw.
Bemerkung: Das Schwerpunktsystem ist nicht unbedingt ein Inertialsystem! Dies gilt nur bei abge-
schlossenen Mehrteilchensystemen, die keiner resultierenden äußeren Kraft unterliegen. In solchen
Fällen wird der Schwerpunkt laut der Bewegungsgleichung (I.60a) bzw. dem Schwerpunktsatz (I.60b)
nicht beschleunigt.
∗
Aus Gl. (I.53), abgeleitet nach der Zeit, und der Tatsache, dass der Schwerpunkt bezüglich BΣ
ruht, folgt sofort für den Gesamtimpuls des Mehrteilchensystems
P~ ∗ (t) ≡
N
X
~pa∗ (t) = ~0.
(I.79)
a=1
Diese Beziehung kann auch als Definition des Schwerpunktsystems — das auf Englisch öfter centerof-momentum frame genannt wird, wobei „momentum“ = Impuls — angesehen werden.
∗ so gewählt, dass der Schwerpunkt von Σ im Nullpunkt
Wird das Koordinatensystem von BΣ
~ ∗ (t) = 0 zu jeder Zeit t.
sitzt, so gilt automatisch X
~ ∗ eines Mehrteilchensystems Σ bezüglich des zugehörigen SchwerpunktDer Gesamtdrehimpuls L
systems(11)
N
X
∗
~
L (t) ≡
~xa∗ (t) × ~pa∗ (t)
(I.80)
a=1
wird Eigendrehimpuls des Systems Σ genannt. Wiederum wird die gesamte kinetische Energie be∗
züglich BΣ
N
X
~pa∗2
∗
T ≡
(I.81)
2ma
a=1
als innere kinetische Energie des Systems bezeichnet.
Sei jetzt B ein beliebiges Bezugssystem mit der einzigen Einschränkung, dass es gegenüber dem
Schwerpunktsystem BΣ∗ nicht rotiert. Es gelten dann zwei nach König(i) genannte Ergebnisse, und
zwar
(11)
(i)
. . . noch besser, relativ zum eigenen Schwerpunkt, indem der letztere als Ursprungspunkt genommen wird.
J. S. König, 1712–1757
36
Newton’sche Mechanik
~ des Systems Σ relativ zu einem festen Punkt
Theorem (1. Satz von König): Der Gesamtdrehimpuls L
~ ∗ des Systems und dem
in B, z.B. dem Nullpunkt, ist die Summe aus dem Eigendrehimpuls L
Drehimpuls bezüglich B des Schwerpunkts von Σ, versehen mit der Gesamtmasse M :
~
dX(t)
~
~ ∗ (t) + X(t)
~
L(t)
=L
× P~ (t) mit P~ (t) = M
dt
(I.82)
~
und X(t)
der Bahnkurve des Schwerpunkts von Σ relativ zu B.
Theorem (2. Satz von König): Die gesamte kinetische Energie T des Systems Σ relativ zu B ist die
Summe aus der inneren kinetischen Energie T ∗ des Systems und der kinetischen Energie bezüglich
B des Schwerpunkts von Σ, versehen mit der Gesamtmasse M :
T (t) = T ∗ (t) +
P~ (t)2
.
2M
(I.83)
Der Beweis dieser zwei Resultate wird der Leserin gelassen.
Diese Sätze bedeuten, dass die Bewegung eines System aus N Körpern in zwei unabhängige
Anteile zerlegt werden kann, und zwar in die „innere“ Bewegung der Teilchen relativ zum Schwerpunkt des Systems und die „globale“ (Translations-)Bewegung des Schwerpunkts durch den Raum.
Dementsprechend finden theoretische Untersuchungen des Systems meistens in seinem Schwerpunktsystem statt.
I.6 Zwei-Körper-Systeme
Der Formalismus des vorigen Abschnitts kann natürlich auf den Fall eines Systems aus zwei Körpern
angewandt werden. In diesem Fall treten aber einige wichtigen Vereinfachungen aus, beginnend
bei den Bewegungsgleichungen, die sich oft entkoppeln (§ I.6.1). Somit lassen sich verschiedene
Probleme ziemlich ausführlich behandeln: harmonisch gekoppelte Punktmassen (§ I.6.2), Körper in
Newton’scher Gravitationswechselwirkung (§ I.6.3), oder die Streuung zweier Teilchen (§ I.6.4).
I.6.1 Separation der Bewegungsgleichungen
I.6.1 a Variablen
Genau wie in § I.5.1 b wird die Schwerpunktkoordinate definiert durch
::::::::::::::::
m1 ~x1 (t) + m2 ~x2 (t)
~
X(t)
≡
.
m1 + m2
(I.84a)
Da es nur zwei Körper gibt, kann man auch eine Relativkoordinate einführen:
~x(t) ≡ ~x1 (t) − ~x2 (t).
(I.84b)
~
Bei dem Übergang von den Variablen ~x1 (t), ~x2 (t) zu den neuen Variablen X(t),
~x(t) handelt es sich
um eine lineare Transformation. Die entsprechende Rücktransformation lautet
m1
m2
~
~
~x1 (t) = X(t)
+
~x(t),
~x2 (t) = X(t)
−
~x(t),
(I.84c)
m1 +m2
m1 +m2
wie sich leicht nachprüfen lässt.
Für die Beschreibung der Bewegung wird es sich lohnen, die reduzierte Masse
µ≡
einzuführen.
m1 m2
m1 +m2
(I.85)
37
I.6 Zwei-Körper-Systeme
I.6.1
b Bewegungsgleichungen
:::::::::::::::::::::::::::::::
Aus den allgemeinen Bewegungsgleichungen [vgl. Gl. (I.50)]
d2 ~x1 (t)
= F~1,ext + F~2→1 ,
dt2
d2 ~x2 (t)
= F~2,ext + F~1→2
m2
dt2
m1
~
lassen sich Entwicklungsgleichungen für X(t)
und ~x(t) herleiten.
Erstens liefert eine Summe die Bewegungsgleichung des Schwerpunkts, und zwar
(m1 +m2 )
~
d2X(t)
= F~1,ext + F~2,ext
dt2
(I.86a)
unabhängig von den inneren Kräften, in Übereinstimmung mit dem allgemeinen Ergebnis (I.60).
Andererseits ergibt sich nach Division jeder Gleichung durch die darin auftretende Masse und
anschließender Subtraktion
F~1,ext F~2,ext F~2→1 F~1→2
d2 ~x(t)
−
+
−
,
=
2
dt
m1
m2
m1
m2
d.h. unter Verwendung des dritten Newton’schen Axioms F~1→2 = −F~2→1 und der reduzierten
Masse (I.85)
F~1,ext F~2,ext F~2→1
d2 ~x(t)
=
.
(I.86b)
−
+
dt2
m1
m2
µ
Im Allgemeinen hängt diese Gleichung noch von den äußeren Kräften ab.
Sei jetzt angenommen, dass das Zwei-Körper-System abgeschlossen ist, F~a,ext = ~0 für a = 1, 2.
Dann vereinfachen sich die Bewegungsgleichungen (I.86) zu
~
d2X(t)
= ~0,
(I.87a)
dt2
entsprechend der Erhaltung des Gesamtimpulses (I.60c) für ein System ohne äußere Kräfte, und
d2 ~x(t)
= F~2→1 .
(I.87b)
dt2
Dabei hängt die Kraft auf der rechten Seite a priori noch von den Positionen ~x1 (t), ~x2 (t) der beiden
~
Körper — d.h. äquivalent von X(t)
und ~x(t) — und von ihren Geschwindigkeiten ab. Falls die
Zweikörperkraft F~2→1 nur Funktion von der Relativkoordinate ~x(t) und von ihrer Zeitableitung ist,
dann ist Gl. (I.87b) die Bewegungsgleichung eines einzelnen fiktiven Massenpunktes mit der reduzierten Masse µ. Somit wird das ursprüngliche Zwei-Körper-Problem in zwei entkoppelte einfachere
Ein-Körper-Probleme transformiert, und zwar einerseits für den Schwerpunkt, andererseits für den
fiktiven Massenpunkt.
Ist die Kraft F~2→1 nun zentral, d.h. parallel zu ~x1 (t)−~x2 (t), dann bewegt sich dieser Massenpunkt in einem Zentralkraftfeld mit Kraftzentrum in ~x2 (t). In diesem Fall ist der Drehimpuls des
fiktiven Teilchens
~` = ~x(t) × µ d~x(t)
dt
eine Erhaltungsgröße, und man spricht von einem Zentralkraftproblem.
In den folgenden § I.6.2–I.6.4 werden wir Beispiele solcher Zentralkraftprobleme sehen, im Fall
~ (r).
konservativer Kraftfelder, F~2→1 (~r1 −~r2 ) ≡ F~ (~r) = −∇V
µ
Bemerkung: Wenn eine der Massen viel größer als die andere ist, z.B. m2 m1 , dann gelten
~
X(t)
' ~x2 (t) — d.h. die Position des Schwerpunkts stimmt fast mit jener des schweren Partners
~
überein —, ~x1 (t) ' X(t)
+ ~x(t) und µ ' m1 — d.h. die Eigenschaften des fiktiven Teilchens sind
ähnlich denen des leichten Körpers.
38
Newton’sche Mechanik
I.6.2 Gekoppelte Punktmassen
Betrachten wir als erstes Beispiel zwei Massen m1 , m2 , die über eine Feder gekoppelt sind. Es
wird angenommen, dass die Bewegung der Massen eindimensional entlang der horizontalen x-Achse
bleibt, und dass es keine äußere Kraft gibt.
m1
k
QPPPPPPR
m2
-
x
Abbildung I.7 – Gekoppelte Massen
Die Feder wird als ein harmonischer Oszillator modelliert, d.h. die dadurch verursachte Kraft
ist proportional zur Auslenkung aus einer Ruhelänge. Somit lautet die Kraft auf Masse 1
F~2→1 = k (x2 − x1 − `0 )~ex
(I.88)
mit k der Federkonstante und `0 der Ruhelänge der Feder, und x1 , x2 den Positionen der Massen —
die als Punktmassen zu betrachten sind.
Die Bewegungsgleichungen für x1 (t), x2 (t) lauten
d2 x2 (t)
= −k x2 (t) − x1 (t) − `0 ,
(I.89)
2
dt
wobei das dritte Newton’sche Gesetz benutzt wurde, um die Kraft F~1→2 auszudrücken. Das Addieren
der beiden Gleichungen führt zur Zeitunabhängigkeit der Schwerpunktkoordinate X(t) — wie zu
erwarten war!
Aus den Gl. (I.89) folgt noch
m1
d2 x1 (t)
= k x2 (t) − x1 (t) − `0 ,
2
dt
m2
d2
[x1 (t)−x2 (t)] = k x2 (t) − x1 (t) − `0 ,
2
dt
d.h., für die Relativkoordinate x(t) ≡ x1 (t)−x2 (t)
µ
d2 x(t)
=
−k
x(t)
+
`
.
(I.90)
0
dt2
Das ist die Bewegungsgleichung für einen einzelnen Massenpunkt mit der reduzierten Masse µ, der
an einem Kraftzentrum harmonisch gebunden ist.
p
Die Lösung ist dann der Form x(t) = −`0 + A cos(ωt + ϕ) mit ω ≡ k/µ und A, ϕ zwei
Konstanten, die durch Anfangsbedingungen festgestellt sind. Daraus erhält man über die Rücktransformation (I.84c) die Abhängigkeiten x1 (t) und x2 (t).
µ
I.6.3 Kepler-Problem
Die Newton’sche Gravitationskraft zwischen zwei Massenpunkten mit Massen m1 , m2 ist eine
konservative Zentralkraft, gegeben durch
GN m1 m2 ~x
~ (|~x|)
F~ (|~x|) = −
= −∇V
|~x|2
|~x|
mit dem Potential
V (|~x|) = −
GN m1 m2
.
|~x|
(I.91a)
(I.91b)
Dabei bezeichnet ~x der Abstandsvektor zwischen den Massen und GN die Newton’sche Gravitationskonstante, GN ' 6, 674 · 10−11 m3 kg−1 s−2 .
39
I.6 Zwei-Körper-Systeme
Das Ziel in diesem Abschnitt ist die Untersuchung der einfachsten möglichen Bewegungen, zu
denen dieses Potential führen kann, und insbesondere die Herleitung der drei durch Kepler(j) experimentell ermittelten Gesetze. Zu diesem Zweck wird die Bewegung zweier Massenpunkte betrachtet,
die über das Potential (I.91b) miteinander wechselwirken, während sie keiner äußeren Kraft unterliegen. Dieses Fragestellung wird als Kepler-Problem bezeichnet.
I.6.3
a Vorbereitungen
::::::::::::::::::::::
In Übereinstimmung mit den allgemeinen Ergebnissen des § I.6.1 kann man die triviale Bewegung
des Schwerpunkts von der mehr interessanten Relativbewegung separieren, wobei die letztere die
Zeitänderung der Relativkoordinate ~x für ein fiktives Teilchen mit der reduzierten Masse µ ist.
Da es sich bei dem Newton’schen Potential (I.91b) um ein Zentralpotential handelt, ist der
Drehimpuls ~` für die Relativbewegung erhalten. Da sowohl ~x(t) als ~x˙ (t) senkrecht auf ~` sind, bleibt
die Bahnkurve in einer Ebene senkrecht auf ~` — der sog. Ekliptik. Dementsprechend lohnt es sich,
ein Koordinatensystem zu wählen, in dem die Richtung von ~` entlang einer der Achse ist, z.B. der
z-Achse.
Die Wahl der Koordinaten in der Bewegungsebene bleibt noch offen. Man kann zunächst feste
kartesische Basisvektoren ~ex , ~ey einführen, und dementsprechend die Bahnkurve durch x(t), y(t)
parametrisieren. Da das Wechselwirkungspotential (I.91b) nur vom Abstand r(t) = |~x(t)| zum
Kraftzentrum abhängt, ist es sinnvoll, ein Koordinatensystem — genauer eine Parametrisierung der
Bahnkurve — zu wählen, in dem dieser Abstand eine direkte Rolle spielt. Dazu dient noch der Winkel
ϕ(t) der Relativkoordinate relativ zu einer festen Richtung, z.B. zur x-Achse, zur Charakterisierung
von ~x(t).
Somit lautet die Relativkoordinate
~x(t) = r(t)~er (t),
(I.92)
wobei die instantane Richtung des Einheitsvektors ~er (t) in Radialrichtung von der Position des
(fiktiven) bewegten Körpers und damit indirekt von der Zeit abhängt: bezüglich der Basisvektoren
eines festen kartesischen Koordinatensystems gilt
~er (t) = cos ϕ(t)~ex + sin ϕ(t)~ey .
(I.93)
Man bezeichnet mit ~eϕ (t) einen orthogonal auf ~er (t) stehenden Einheitsvektor in der Bewegungsebene
~eϕ (t) = − sin ϕ(t)~ex + cos ϕ(t)~ey ,
(I.94)
so dass ~er (t), ~eϕ (t) und ~ez (t) ≡ ~er (t)×~eϕ (t) die Basisvektoren eines mitbewegten Koordinatensystems
bilden, wobei ~ez (t) hier eigentlich zeitunabhängig ist.
Die Ableitung der Gl. (I.93) nach der Zeit gibt
d~er (t)
dϕ(t)
dϕ(t)
=−
sin ϕ(t)~ex +
cos ϕ(t)~ey = ϕ̇(t)~eϕ (t).
dt
dt
dt
(I.95)
Somit lautet die Relativgeschwindigkeit, unter Verwendung der Kettenregel beim Ableiten der
Gl. (I.92)
d~x(t)
dr(t)
d~er (t)
=
~er + r(t)
= ṙ(t)~er + r(t) ϕ̇(t)~eϕ (t).
(I.96)
dt
dt
dt
Schließlich ist der Drehimpuls der Relativbewegung gegeben durch
~`(t) ≡ ~x(t) × µ~x˙ (t) = µr(t)2 ϕ̇(t)~ez
mit konstanter Richtung und konstantem Betrag
` ≡ ~`(t) = µr(t)2 ϕ̇(t).
(j)
J. Kepler, 1571–1630
(I.97)
(I.98)
40
Newton’sche Mechanik
I.6.3
b Zweites Kepler’sches Gesetz
::::::::::::::::::::::::::::::::::::
In dem Intervall zwischen zwei sukzessiven Zeitpunkten t und t + dt
ändert sich der Polarwinkel ϕ(t) der Bahnkurve um dϕ ' ϕ̇(t) dt. Die
Ortsvektoren ~x(t) und ~x(t+dt) und die Bahnkurve grenzen ein Flächenelement ab, dessen Flächeninhalt annähernd durch
dS =
1
r(t) r(t) dϕ =
2
t + dt
r(t) dϕ
t
dϕ
r(t)2
dϕ(t)
dt
2
dt
r(t)
Abbildung I.8
gegeben ist.
Ersetzt man die Zeitableitung ϕ̇(t) mithilfe der Gl. (I.98), so kommt der „Flächensatz“
`
dS
=
= Konstante.
dt
2µ
(I.99)
d.h. (zweites Kepler’sches Gesetz )
Der Ortsvektor (von dem Stern zum Planeten) überstreicht in gleichen Zeiten gleich
große Flächen.
(I.100)
Dabei beziehen sich die Worte zwischen Klammern auf den historischen durch Kepler betrachteten
Fall eines Planeten um einen viel schwereren Stern, m2 m1 . Im Fall zweier (ungefähr) gleich
schweren Körper, wie z.B. die zwei Sterne eines Doppelsternsystems, geht die Relativkoordinate
von einem Stern zum anderen.
Bemerkung: In der Herleitung dieses Ergebnisses wurde die Form des Potentials V (r) nicht benutzt,
d.h. der Flächensatz gilt für jedes Zentralkraftproblem.
I.6.3 c Bahnkurve. Erstes und drittes Kepler’sches Gesetz
Die Gesamtenergie der Relativbewegung ist
1 d~x(t) 2
E = T (t) + V (t) = µ
+ V r(t) ,
2
dt
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
d.h. unter Verwendung der expliziten Form (I.96) der Geschwindigkeit
µ
E=
ṙ(t)2 + r(t)2 ϕ̇(t)2 + V r(t) .
2
Da die Newton’sche Gravitationskraft konservativ ist, ist diese Gesamtenergie erhalten.
Mithilfe der Gl. (I.98) kann man die Zeitableitung ϕ̇(t) durch `/µr(t)2 ersetzen, so dass die
totale Energie sich noch als
µ
`2
E = ṙ(t)2 +
+ V (r)
(I.101)
2
2µr(t)2
umschreiben lässt, unabhängig von der Winkelvariablen ϕ. Dabei ist ṙ(t) die radiale Geschwindigkeit. Betrachtet man dementsprechend die rechte Seite von Gl. (I.101) als totale Energie für
die eindimensionale Bewegung in Radialrichtung, so ist der erste Term die zugehörige kinetische
Energie, während die zwei letzten ein effektives Potential
Veff (r) ≡ V (r) +
darstellen. Dann gilt
ṙ(t)2 =
`2
2µr2
2
E − Veff (r) .
µ
(I.102)
(I.103)
Je nach den relativen Werten von der Gesamtenergie E und dem minimalen Wert Veff,min < 0 des
effektiven Potentials kommen drei verschiedene Möglichkeiten vor (vgl. auch Abb. I.9):
41
I.6 Zwei-Körper-Systeme
`2
2µr2
E>0
•
rmin
r
Veff (r)
rmax
•
rmin
Veff,min < E < 0
•
E < Veff,min
V (r)
Abbildung I.9 – Effektives Potential Veff (r) für das Kepler-Problem.
• Für E < Veff,min ist die rechte Seite von Gl. (I.103) immer negativ, so dass keine Lösung der
Gleichung mit reeller Radialgeschwindigkeit existieren kann: diesen mathematischen Werten
von E und ` entspricht keine physikalisch erlaubte Lösung des Kepler-Problems.
• Für Veff,min < E < 0 kann die rechte Seite von Gl. (I.103) nicht-negativ sein, und zwar für
Werte rmin ≤ r ≤ rmax , wobei rmin , rmax die zwei Lösungen der Gleichung Veff (r) = E sind. Da
rmax endlich ist, bleibt das fiktive Teilchen immer in endlichem Abstand vom Kraftzentrum,
und ist somit daran „gebunden“.
Bei den Abständen rmin und rmax verschwindet die Radialgeschwindigkeit ṙ — die eigentlich
ihr Vorzeichen ändern wird: dabei handelt es sich um Umkehrpunkte.
Im Spezialfall E = Veff,min ist V (r) = E für einen einzigen Wert von r. Dazu gibt Gl. (I.103)
ṙ(t) = 0, d.h. r bleibt konstant: die entsprechende Bahnkurve ist ein Kreis.
• Für E ≥ 0 hat die Gleichung Veff (r) = E eine einzige Lösung rmin , und die rechte Seite
von Gl. (I.103) bleibt positiv für r > rmin . Somit geht die Bahnkurve des fiktiven Teilchens
unendlich weit weg vom Kraftzentrum: das Teilchen ist „ungebunden“.
Für die obige Fallunterscheidung war die genaue Form des effektiven Potentials, und daher von
V (r), nicht nötig, um die Existenz oder nicht-Existenz von Lösungen festzustellen. Die exakten
Bahnkurven entsprechend den verschiedenen Fällen hängen aber natürlich von V (r) ab.
Ausgehend aus Gl. (I.103) kann man den Verlauf der Bahnkurve bestimmen.(12) Einerseits gilt
unter Verwendung der Kettenregel
dr(t)
dr(ϕ) dϕ(t)
dr(ϕ) `
=
=
,
dt
dϕ
dt
dϕ µr2
wobei Gl. (I.98) benutzt wurde. Andererseits ist ṙ(t) auch durch Gl. (I.103) gegeben. Betrachtet
man eine Lösung mit positiver Radialgeschwindigkeit, so kann man schreiben
dr(ϕ)
µr2
r2 p
=
ṙ(t) =
2µ[E − Veff (r)] .
dϕ
`
`
(12)
Eine alternative Herleitung wird im Anhang I.A zu diesem Kapitel vorgestellt.
42
Newton’sche Mechanik
Das heißt,
` dr
` dr
p
= p
2
2µ[E − Veff (r)]
r 2µ[E − V (r)] − `/r2
und nach formeller Integration beider Seiten dieser Gleichung
Z r
` dr0
p
ϕ − ϕ0 =
,
02 2µ[E − V (r 0 )] − `2 /r 02
r0 r
dϕ =
r2
(I.104)
wobei r0 > rmin und r < rmax sein müssen.
Im Fall des Newton’schen Potentials V (r) = −α/r mit α = GN m1 m2 kann die Integration
explizit durchgeführt werden. Dabei ist
Z r
` dr0
p
ϕ − ϕ0 =
.
02 2µ(E + α/r 0 ) − `2 /r 02
r0 r
Eine erste Substitution u0 = 1/r0 , d.h. du0 = −dr0 /r02 , gibt zunächst
Z u
Z u
du0
` du0
p
p
=−
.
ϕ − ϕ0 = −
2µ(E + αu0 ) − `2 u02
2µE/`2 + (2µα/`2 )u0 − u02
u0
u0
Der Term unter der Wurzel im Nenner ist der Form a + bu0 − u02 = ap+ b2/4 − (u0 − b/2)2 , mit
a = 2µE/`2 und b = 2µα/`2 . Eine weitere Substitution v 0 = (u0 − b/2)/ a + b2/4 liefert dann
Z u
Z v
du0
dv 0
u − b/2
p
√
=
= − arccos(v) = − arccos p
.
1 − v 02
a + b2 /4 − (u0 − b/2)2
a + b2/4
Somit erhält man
"
2/r − 2µα/`2
ϕ − ϕ0 = arccos
p
8µE/`2 + 4µ2 α2 /`4
#r
.
r0
Mit der Wahl der Anfangsbedingung ϕ = ϕ0 bei r = r0 ergibt sich
1/r − µα/`2
1/r − µα/`2
p
cos ϕ = p
=
.
2µE/`2 + µ2 α2 /`4
(µα/`2 ) 2E`2 /µα2 + 1
Mit den Definitionen
s
≡
1+
2E`2
µα2
und p ≡
`2
µα
(I.105a)
wird die φ-r-Abhängigkeit zu cos ϕ = p/r − 1, d.h.
r=
p
.
1 + cos ϕ
(I.105b)
Das ist die Gleichung in Polarkoordinaten eines Kegelschnitts mit Exzentrizität und Parameter p.
Genau wie in der Diskussion der Abb. I.9 gibt es unterschiedliche Fälle je nach dem Wert der
Energie E. Dafür kann man schon bemerken, dass das effektive Potential −α/r + `2 /2µr2 minimal
für r0 = `2 /µα ist, wo Veff den Wert −µα2 /2`2 ≡ Veff,min annimmt.
• Für Veff,min ≤ E < 0 gilt laut Gl. (I.105a) 0 ≤ < 1; d.h., die Bahnkurve ist eine Ellipse —
ein Kreis falls = 0, entsprechend E = Veff,min . Dies bildet das erste Kepler’sche Gesetz :
Die Planeten bewegen sich auf elliptischen Bahnen (mit der Sonne in einem
gemeinsamen Brennpunkt).
(I.106)
43
I.6 Zwei-Körper-Systeme
In einem Doppelsternsystem folgt jeder Stern einer elliptischen Bahnkurve mit dem anderen
Stern in einem Brennpunkt, während die Position ihres Schwerpunkts unverändert bleibt.
b
•
a
ϕ
•
Abbildung I.10 – Ellipse mit Exzentrizität = 0, 6; die Punkte sind die Brennpunkte.
√
Die große Halbachse der Ellipse ist a = p/(1 − 2 ), die kleine Halbachse b = p/ 1 − 2 . Die
durch die Ellipse abgeschlossene Oberfläche ist S = πab. Andererseits ist diese Fläche über
den Flächensatz (I.99) mit der Umlaufzeit T verknüpft: S = (`/2µ)T . Somit gilt
T2=
4µ2 2 4π 2 µ2 2 2 4π 2 µ2 p 3 4π 2 µ 3
S =
a b =
a =
a .
`2
`2
`2
α
Mit den Ausdrücken der reduzierten Masse und der Konstante α = GN m1 m2 ergibt sich
schließlich
4π 2
T2=
a3 .
GN (m1 +m2 )
Dies entspricht dem dritten Kepler-Gesetz :
Die Quadrate der Umlaufbahnen der Planeten sind proportional zur dritten
Potenz der großen Bahnhalbachse.
(I.107)
Auf der Parametrisierung (I.105b) kann sofort den bei ϕ = 0 bzw. ϕ = π stattfindenden
minimalen bzw. maximalen Abstand rmin = p/(1+) bzw. rmax = p/(1−) zwischen Planeten
und Stern lesen.
• Für E = 0 ist die Exzentrizität der Bahnkurve gleich 1, so dass diese eine Parabel ist.
• Für E > 0 ist gemäß Gl. (I.105a) die Exzentrizität größer als 1, > 1, d.h. die Bahnkurve ist
eine Hyperbel (Abb. I.11).
Wie aus der Diskussion des effektiven Potentials erwartet war, ist die Bewegung räumlich
unbegrenzt, und r(ϕ) wächst unendlich groß wenn cos ϕ von oben gegen −1/ geht. Dagegen
wird für ϕ = 0 der minimale Abstand zum Brennpunkt rmin = p/(1 + ) erreicht.
Bemerkung: In § I.5.4 b wurde argumentiert, dass die Gesamtenergie eines Systems aus Teilchen,
die über die Newton’sche Gravitationskraft unter einander wechselwirken, negativ ist, s. Gl. (I.77).
Dies wird durch die obigen Ergebnisse nicht versprochen, denn die Lösungen mit nicht-negativer
Energie sind ungebunden, und somit eine Annahme des Virialsatzes nicht erfüllen.
Bisher wurde nur das anziehende Newton’sche Potential (I.91b) betrachtet, entsprechend einem
positiven Wert von α = GN m1 m2 . Man kann auch die Bahnkurven mit dem abstoßenden Potential
44
Newton’sche Mechanik
•
ϕ
Abbildung I.11 – Hyperbel mit Exzentrizität = 1, 6 für ein anziehendes Potential.
V (r) = −α/r mit α < 0 betrachten, was insbesondere dem elektrostatischen Coulomb-Potential
zwischen zwei positiven oder zwei negativen Punktladungen entspricht.
Wiederholt man die Herleitung zwischen Gl. (I.104) und (I.105) für den Fall α < 0, so findet
man, dass die möglichen Bahnkurven wieder Kegelschnitte sind. Dabei treten die abgeschlossenen
Trajektorien (Ellipse, Kreis) aber nicht mehr auf, da es keine gebundene Zustände des Zwei-KörperSystems gibt — das effektive Potential Veff (r) ist immer positiv und nimmt monoton mit r ab —,
sondern nur ungebundene. Da Veff (r) > 0 für alle Abstände r, gibt es auch keine Bahnkurve mit
E = 0, d.h. keine Parabel.
Dagegen gibt es Hyperbeln ( > 1), wobei man aufpassen soll, das der Parameter p jetzt negativ
ist. Der minimale Abstand ist somit rmin = |p|/( − 1) und wird für ϕ = π erreicht (Abb. I.12).
Wiederum wird r unendlich groß für cos ϕ → (−1/) von unten.
ϕ
•
Abbildung I.12 – Hyperbel mit Exzentrizität = 1, 6 für ein abstoßendes Potential.
45
I.6 Zwei-Körper-Systeme
I.6.4 Streuung
Die am Ende des § I.6.3 gefundenen unbegrenzten Bahnkurven entsprechen (fiktiven) Massenpunkten, die zur Zeit t → −∞ unendlich weit weg vom Kraftzentrum sind, sich daran annähern,
und dann weg fliegen, so dass sie für t → ∞ wieder unendlich entfernt vom Kraftzentrum sind. Ein
solcher Prozess heißt auch Stoß oder Streuung.
Hiernach wird die Streuung eines Massenpunktes mit reduzierten Masse µ an einem Streuzentrum
betrachtet, entsprechend den Bewegungsgleichungen, die aus der in § I.6.1 b dargestellten Separation
folgen — und die in der Tat den Stoß eines physikalischen Massenpunktes an einem anderen modellieren. Der Prozess wird in einem Bezugssystem beschrieben, in welchem das Streuzentrum ruht.
Dazu wird ein Koordinatensystem gewählt, in dessen Nullpunkt O sich das Streuzentrum befindet.
In § I.6.4 a werden zunächst ein paar Größen eingeführt, die zur Kennzeichnung einer Streuung
dienen. Der Zusammenhang zwischen einigen dieser Größen wird durch die Dynamik des Stoßes
bestimmt, d.h. durch die für die Streuung relevante Wechselwirkung, wie in § I.6.4 b erklärt und
an einem Beispiel illustriert wird. Falls der Streuprozess mehrmals stattfindet, jedoch mit (leicht)
unterschiedlichen Anfangsbedingungen, werden die Wahrscheinlichkeiten für die möglichen Endzuständen durch Wirkungsquerschnitte charakterisiert (§ I.6.4 c).
I.6.4
a Geometrische Grundbegriffe der klassischen Streutheorie
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Es wird angenommen, dass der Einfluss des Streuzentrums auf den gestreuten Massenpunkt
vernachlässigbar für t → ∓∞ ist, d.h. lange vor oder nach dem Stoß. Das heißt wiederum, dass die
Kraft zwischen den zwei physikalischen Massenpunkten für unendliche große Abstände verschwinden
muss. Mathematisch muss das zugehörige Potential(13) V (~r) ebenfalls für große Abstände Null
werden:
lim V (~r) = 0.
(I.108)
|~r|→∞
~p
au
s
Lange vor oder nach dem Stoß ist der gestreute Massenpunkt annähernd frei, so dass er sich
dann geradlinig bewegt: sei ~pein bzw. ~paus sein Impuls für t → −∞ bzw. t → +∞, wobei das Kürzel
ein bzw. aus für „einfallendes“ bzw. „auslaufendes“ Teilchen steht. Wegen der Wechselwirkung mit
dem Streuzentrum wird sich die Flugrichtung des gestreuten Massenpunktes im Allgemeinen ändern.
Der Winkel zwischen den asymptotischen Flugrichtungen heißt Streuwinkel und wird hiernach mit
θ bezeichnet, wie in Abb. I.13 zu sehen ist.
~pein
θ
φ
b
Abbildung I.13 – Charakteristische Größen zur Beschreibung einer Streuung.
Eine weitere geometrische Größe, die in klassischer Streutheorie einen bestimmten Streuprozess
charakterisiert, ist der Stoßparameter b. Dabei handelt es sich um den minimalen Abstand des
einfallenden Massenpunktes zum Streuzentrum für den fiktiven Fall, wo es sich geradlinig bewegen
würden, statt abgelenkt zu werden, d.h. bei ausgeschalteter Wechselwirkung, wie in Abb. I.13 zu
sehen ist.
(13)
... unter der versteckten Annahme, dass die Kraft konservativ ist!
46
Newton’sche Mechanik
Sei angenommen, dass die Flugrichtung des einfallenden Teilchens bekannt ist — was in einem
Streuexperiment der Fall ist. In der transversalen Ebene senkrecht zu dieser Richtung kann man
eine Referenzrichtung festlegen, womit sich Winkel φ relativ dazu definieren lassen. Somit wird die
auslaufende Flugrichtung neben θ auch durch einen Azimutwinkel φaus charakterisiert. Wiederum
kann der einfallenden Flugrichtung einen Winkel φein assoziiert werden; stattdessen wird der entsprechende Azimutwinkel dem Stoßparameter zugeordnet, der somit zu einem (zweidimensionalen)
Vektor ~b, mit Betrag b und Winkel φein , in der transversalen Ebene wird.
Bezeichnet man dann den Azimutwinkel der auslaufenden Flugrichtung mit φ anstatt φaus , so
besteht der Zweck der klassischen Streutheorie darin, die Beziehung zwischen den Winkeln (θ, φ)
und dem Stoßparameter ~b festzulegen. Dabei charakterisieren die ersteren bzw. der letztere das
auslaufende Teilchen, d.h. den Endzustand, bzw. den Anfangszustand,
und zwar das einlaufende
~
~
Teilchen. Somit werden im Allgemeinen Funktionen θ(b), φ(b) gesucht.
Bemerkung: In einem quantenmechanischen Rahmen verliert der Begriff des Stoßparameters, genau
wie jener der Bahnkurve, an Bedeutung.
I.6.4
b Streuung an einem Zentralpotential
:::::::::::::::::::::::::::::::::::::::::::
Im Fall der Streuung an einem Zentralpotential — d.h. falls die Kraft zwischen den zwei wechselwirkenden Massenpunkten zentral ist — liegt die Bahnkurve des gestreuten Massenpunkts in einer
Ebene, der Streuebene. Dann ist der Azimutwinkel des auslaufenden Flugrichtung automatisch gleich
jenem des Stoßparameters, und die einzige festzulegende Abhängigkeit ist die des Streuwinkels θ,
der eigentlich nur vom Betrag b abhängt.(14)
Die Winkelhalbierende der zwei Asymptoten zur Bahnkurve des gestreuten Massenpunkts ist
eine Symmetrieachse der Bahnkurve. Sei α der Winkel zwischen dieser Winkelhalbierenden und
einer der Asymptoten. Dann gilt automatisch
2α + θ = π,
(I.109a)
vgl. Abb. I.14
α
α
θ
~rmin
ϕθ
Abbildung I.14 – Definition einiger Winkel.
Wiederum ist der Schnittpunkt zwischen Trajektorie und der Winkelhalbierenden genau der
Punkt des minimalen Abstands rmin zwischen Bahnkurve und Streuzentrum. Unter Verwendung
der gleichen Parametrisierung r(ϕ) der Bahnkurve wie in § I.6.3 c wird dieser Punkt für ϕ = π
erreicht, während die Asymptote für t → +∞ dem Winkel ϕ = ϕθ entspricht, wobei (Abb. I.14)
ϕθ = π − α.
(14)
(I.109b)
Dies folgt aus der Kugelsymmetrie des Zentralpotentials, das nur von der Abstand r = |~r| vom Streuzentrum
abhängt.
47
I.6 Zwei-Körper-Systeme
Für diesen Wert des Winkels ist der gestreute Massenpunkt unendlich weit vom Streuzentrum.
Somit liefert Gl. (I.104)(15)
Z r
` dr0
p
π − ϕθ =
,
(I.110)
02 2µ[E − V (r 0 )] − `2 /r 02
rmin r
woher sich ϕθ und somit θ herleiten lässt, denn aus Gl. (I.109a) und (I.109b) folgt nach Eliminierung
von α die einfache Beziehung θ = 2ϕθ − π.
Die Werte der Gesamtenergie E und des Bahndrehimpulses ` in Gl. (I.110) können durch die
charakteristischen Größen des Anfangszustands ausgedrückt werden. Somit ist das Potential für
t → −∞, d.h. r → ∞, Null, woraus
~p 2
µv 2
E = ein = ∞ ,
2µ
2
wobei v∞ = |~pein |/µ die Geschwindigkeit des gestreuten Massenpunkts im Unendlichen ist. Wiederum gilt
` = ~
L = µbv∞ .
Mit diesen Werten wird Gl. (I.110) zu
Z
π − ϕθ =
∞
b
q
rmin
1−
(r0 )
2V
2
µv∞
−
b2
r02
dr0
.
r02
(I.111a)
Schließlich ist der dabei auftretende minimale Abstand rmin Lösung der impliziten Gleichung
b2
2V (rmin )
+
= 1,
2
2
µv∞
rmin
(I.111b)
d.h. bei rmin wird der Nenner des Integranden in Gl. (I.111a) gleich Null.
Beweis der Beziehung (I.111b): Für ϕ = π, d.h. r = rmin , ist die Geschwindigkeit ~v (~rmin ), mit
Betrag vmin , senkrecht zum Abstandsvektor ~rmin . Demzufolge ist der Betrag des Drehimpulses
dort µvmin rmin . Wegen der Drehimpulserhaltung ist dies auch gleich `, d.h.
vmin =
b
v∞ .
rmin
Die gesamte Energie im Punkt der minimalen Abstand lautet dann
E=
1 2
1 b2 2
µvmin + V (rmin ) = µ 2 v∞
+ V (rmin ).
2
2 rmin
Nach Division durch E und unter Verwendung der Beziehung zwischen E, µ und v∞ ergibt sich
genau Gl. (I.111b).
2
Beispiel: Streuung harter Kugel
Zur Illustration kann man die Streuung eines Massenpunktes mit Masse µ am Zentralpotential
(
∞ für r < R
V (r) =
(I.112)
0 für r ≥ R
betrachten, wobei R eine positive Zahl ist. Dieses Modell entspricht dem Stoß zweier undurchdringbaren, nicht-deformierbaren Kugeln mit Masse m = 2µ und Radius a = R/2, d.h. deren Zentren
sich minimal um R annähern können.
(15)
... mit einem kleinen Dreh: Gleichung (I.104) wurde für eine Lösung mit dr/dϕ > 0 hergeleitet, vgl. ein paar
Zeilen oben, während hier dr/dϕ < 0 gilt, weshalb das Negative der linken Seite betrachtet wird.
48
Newton’sche Mechanik
Für b > R gibt es offensichtlich keine Streuung, so dass wir b < R annehmen können, um einen
nicht-trivialen Prozess zu erhalten. Physikalische Intuition sagt, dass rmin = R gilt; dies lässt sich
2
aber auch aus der Gleichung (I.111b) beweisen. Für rmin > R lautet diese nämlich b2 /rmin
= 1, was
mit rmin > R > b unmöglich ist; für rmin > R gibt Gl. (I.111b) mit dem Potential (I.112)
2∞
b2
= 1,
+
2
2
µv∞
rmin
was wieder unmöglich ist. Somit bleibt nur die Möglichkeit rmin = R übrig.
Dabei ist Gl. (I.111b) noch nicht erfüllt, was auf erster Sicht problematisch aussehen kann.
Eigentlich ist die Geschwindigkeit des gestreuten Massenpunktes unstetig für r = R: dort ist
sie, und mit ihr der Drehimpuls, nicht wohldefiniert, so dass der Beweis der Beziehung (I.111b),
der auf dem Wert des Drehimpulses in ~rmin basiert, nicht mehr gilt.
Gemäß der Gl. (I.111a) ist der Streuwinkel θ durch
Z ∞
b
dr0
p
θ = 2ϕθ − π = π − 2
1 − b2 /r02 r02
R
gegeben, wobei V (r0 ) = 0 für r0 ≥ R benutzt wurde. Mit der Substitution u = b/r0 , entsprechend
du = −b dr0 /r02 , kommt
Z 0
h
i0
du
b
√
θ =π+2
= π + 2 arccos u
= 2 arccos ,
2
R
b/R
1−u
b/R
d.h. b(θ) = R cos 2θ . Dieses Ergebnis kann auch geometrisch gefunden werden: mit dem in Abb. I.15
definierten Winkel α gilt nämlich b = R sin α (Trigonometrie!). Dann ist θ = π − 2α, woraus das
Resultat folgt.
α
α
b
θ
α
Abbildung I.15 – Streuung harter Kugel.
I.6.4
c Wirkungsquerschnitt
::::::::::::::::::::::::::::
Literatur zum Kapitel I
• Fließbach, Mechanik [2] Teil I, Kap. 1–6.
• Greiner, Klassische Mechanik I [6] Kap. II und Klassische Mechanik II [7] Kap. I & II.
• Nolting, Klassische Mechanik [15] Kap. 2 & 3.
• Scheck, Mechanik [18] Kap. 1.
Appendix zum Kapitel I
I.A Alternative Herleitung der Kepler’schen Bahnkurven
... ist das Thema einer Aufgabe der Probeklausur!
K APITEL II
Lagrange-Formalismus: Grundlagen
Die im vorigen Kapitel dargelegte Formulierung der Mechanik nach Newton ist zwar sehr intuitiv:
man zählt alle auf das zu studierende System wirkenden Kräfte auf, schreibt ihre Resultierende auf
die rechte Seite des zweiten Newton’schen Gesetzes (I.14) auf, und löst die sich daraus ergebende
Differentialgleichung — möglicherweise anhand eines numerischen Verfahrens.
In der Praxis kann der hier skizzierte Vorgang sich als nicht so direkt herausstellen. Zum einen
können die Kräfte nicht einfach formulierbar sein, insbesondere wenn es sich um eine Zwangskraft
handelt, welche die Bewegung des Systems einschränkt, von dem Bewegungszustand aber abhängt.
Dies passiert z.B. im Fall eines Pendels, in welchem die Stange eine Zwangskraft auf die Masse
am Ende des Pendels übt, die von der Position und Geschwindigkeit der Masse abhängt. Zum
anderen können die „natürlichen“ Variablen der Newton’schen Beschreibung, d.h. die zeitabhängigen
Koordinaten von Ortsvektoren, nicht die geeignetsten sein.
Zur Beseitigung der besagten Schwierigkeiten kann man zunächst die Newton’schen Bewegungsgleichungen (I.14) verallgemeinern, um Zwangskräfte in einer geeigneten Form zu berücksichtigen:
diese erste Erweiterung des Formalismus führt zu den sog. Lagrange (k) -Gleichungen erster Art. In einem zweiten Schritt werden verallgemeinerte Koordinaten eingeführt und die Lagrange-Gleichungen
erster Art so manipulieren, dass die Zwangskräfte in den resultierenden Gleichungen nicht mehr auftreten. Somit erhält man die Lagrange-Gleichungen zweiter Art.
Anstatt dieser Vorgehensweise zu folgen,(16) kann man die Lagrange-Gleichungen zweiter Art
aus einem neu postulierten Prinzip folgern, dem Hamilton (l) -Prinzip. Letzteres lässt sich sowohl in
Systemen mit als ohne Zwangskräfte anwenden, und stellt sich oft als einfacher heraus, wenn das
Interesse an den Bewegungsgleichungen, nicht an den Kräften, liegt.
Um dieses Prinzip mathematisch formulieren zu können, ist es notwendig, ein Ergebnis aus der
Variationsrechnung einzuführen (Abschn. II.1). Danach werden die Definitionen einiger Größen —
insbesondere verallgemeinerter Koordinaten, Lagrange-Funktion oder Wirkung — vorgestellt, die
eine zentrale Rolle im Hamilton-Prinzip spielen. Das letztere wird dann formuliert und die daraus
folgenden Lagrange-Gleichungen zweiter Art hergeleitet, die in diesem Rahmen öfter als Euler–
Lagrange-Gleichungen bezeichnet werden (Abschn. II.2).
Ein Nebenprodukt des entwickelten Formalismus ist einerseits die genauere Definition des intuitiven Begriffs einer physikalischen Symmetrietransformation, andererseits die Entdeckung eines
tiefen Zusammenhangs zwischen Symmetrien und Erhaltungsgrößen (II.3).
II.1 Ein Resultat aus der Variationsrechnung
In diesem Abschnitt wird zunächst die Definition eines Funktionals, d.h. einer Funktion von Funktionen, gegeben (§ II.1.1). Dann wird ein nützliches Ergebnis dargelegt, um die Funktionen, die eine
bestimmte Funktional extremal machen, zu charakterisieren (§ II.1.2).
(16)
(k)
Die interessierte Leserin kann diesen Zugang z.B. in Fließbach [2], Kap. 7–9 finden.
J.-L. Lagrange, 1736–1813
(l)
W. R. Hamilton, 1805–1865
51
II.1 Ein Resultat aus der Variationsrechnung
II.1.1 Funktional
Im mathematischen Sinne ist eine Funktion oder Abbildung f eine Beziehung, die jedem Element
x einer (Definitions-)Menge genau ein Element f (x) einer anderen Menge (Zielmenge) zuordnet. Im
physikalischen Kontext ist die Definitionsmenge oft eine Untermenge — ein Gebiet — eines endlichdimensionalen (Vektor)Raums V , insbesondere R, C, Rn , oder Cn , wobei n ∈ N. Das gleiche gilt
für die Zielmenge V 0 .
Als Funktional bezeichnen Physiker eine Abbildung F , deren Definitionsmenge V ein unendlichdimensionaler Funktionenraum ist, während die Zielmenge V 0 entweder R oder C ist. Der Wert eines
Funktionals F für eine Funktion f ∈ V wird mit F [f ], oder manchmal mit F [f (x)], bezeichnet.
Im Folgenden wird die Zielmenge von Funktionalen immer R sein. Wiederum werden die Funktionen f der Definitionsmenge bestimmte Eigenschaften besitzen: meistens sind das (mindestens
einmal) stetig differenzierbare Funktionen.
Beispiel 1: In diesem und den folgenden Beispielen ist die Definitionsmenge der jeweiligen Funk-
tionale der Raum der stetig differenzierbaren Funktionen f : R → R, die automatisch stetig und
integrierbar auf jedem endlichen Intervall sind.
Seien zwei reelle Zahlen x1 < x2 ; die Integration über das Intervall [x1 , x2 ] definiert ein FunktioZ x2
nal:(17)
f (x) dx.
F [f ] ≡
x1
Beispiel 2: Sei x0 ∈ R. Die Abbildung, die jeder Funktion f ihren Wert im Punkt x0 zuordnet, ist
ein Funktional:
Z
∞
δ(x − x0 )f (x) dx,
F [f ] = f (x0 ) =
−∞
wobei in der zweiten Gleichung das Dirac(m) -Delta eingeführt wurde.
Beispiel 3: Eine reelle Funktion x 7→ y(x) lässt sich günstig als Kurve in der (x, y)-Ebene darstellen.
Wenn x1 < x2 zwei
reelle Zahlen sind, dann ist die Länge `[y] der Kurve y(x) zwischen den Punkten
P1 = x1 , y(x1 ) und P2 = x2 , y(x2 ) ein Funktional
Z P2
Z P2 p
Z x2q
2
2
2
`[y] =
d` =
(dx) + (dy) =
1 + y 0 (x) dx
(II.1)
P1
P1
x1
wobei y 0 die Ableitung von y nach x bezeichnet.
Beispiel 4: Sei Φ eine reelle Funktion von drei reellen Argumenten und x1 < x2 zwei reelle Zahlen.
Dann definiert die Formel
Z
x2
F [f ] =
Φ x, f (x), f 0 (x) dx
x1
ein Funktional, das wir im nächsten Paragraphen wieder diskutieren werden.
II.1.2 Extremierung eines Funktionals
II.1.2
a Euler-Gleichung
::::::::::::::::::::::::
Sei Φ eine stetig differenzierbare Funktion von drei reellen Variablen und x1 < x2 gegebene
reelle Zahlen. Wir betrachten das Funktional
Z x2
F [f ] =
Φ x, f (x), f 0 (x) dx
x1
(17)
(m)
Mathematisch wird eher das Integral als Funktional mit bestimmten Eigenschaften (wie Linearität) definiert. . .
P. A. M. Dirac, 1902–1984
52
Lagrange-Formalismus: Grundlagen
mit f einer stetig differenzierbaren reellen Funktion auf dem Intervall [x1 , x2 ] und f 0 deren Ableitung,
wobei die Werte an den Grenzen gegeben sind: f (x1 ) = y1 und f (x2 ) = y2 . Hiernach werden die
partiellen Ableitungen von Φ mit ∂Φ/∂x , ∂Φ/∂f und ∂Φ/∂f 0 bezeichnet.
Wir wollen eine notwendige Bedingung dafür herleiten, dass das Funktional ein Extremum —
Minimum oder Maximum — für eine Funktion f0 hat. Das heißt, für alle Funktionen f (x), die
f (x1 ) = y1 und f (x2 ) = y2 erfüllen, gilt F [f ] ≥ F [f0 ] (falls F minimal für f0 ) bzw. F [f ] ≤ F [f0 ]
(Maximum für f0 ).
Sei δf eine beliebige stetig differenzierbare Funktion [x1 , x2 ] → R, mit δf (x1 ) = δf (x2 ) = 0.
Dann ist λ 7→ F [f0 + λ δf ] eine Funktion von R nach R. Damit F extremal in f0 sei, muss die
Ableitung dieser Funktion nach λ Null für λ = 0 sein:
dF [f0 +λ δf ] = 0.
dλ
λ=0
Mit dem Einsetzen des Ausdrucks von F [f0+λ δf ] als Integral und dem Austausch von der Ableitung
nach λ und der Integration über x ergibt sich
Z x2
Z x2 ∂Φ
d
∂Φ
dF [f0 +λ δf ]
Φ x, f0 (x)+λ δf (x), f00 (x)+λ δf 0 (x) dx =
=
δf (x) + 0 δf 0 (x) dx,
dλ
dλ x1
∂f
∂f
x1
wobei die partiellen Ableitungen im Punkt x, f0 (x)+λ δf (x), f00 (x)+λ δf 0 (x) zu berechnen sind.
Der zweite Summand im Integranden des letzten Terms lässt sich mithilfe einer partiellen Integration umschreiben:
x2 Z x2 Z x2
∂Φ 0
∂Φ
d ∂Φ
δf (x) dx =
δf (x) −
δf (x) dx.
0
0
∂f 0
x1 ∂f
x1 dx ∂f
x1
Dank der Bedingung δf (x1 ) = δf (x2 ) = 0 verschwindet der integrierte Term auf der rechten Seite.
Somit gilt
Z x2 dF [f0 +λ δf ]
∂Φ
d ∂Φ
=
−
δf (x) dx.
dλ
∂f
dx ∂f 0
x1
Dies muss für λ = 0 verschwinden, d.h. wenn die partiellen Ableitungen im Punkt f0 (x), f00 (x), x
genommen sind. Da die Wahl der „Variation“ δf bis auf ihren Werten an den Rändern beliebig
ist, findet man einfach, dass die Differenz in den eckigen Klammern selbst identisch verschwinden
muss,(18) d.h.
∂Φ x, f0 (x), f00 (x)
d ∂Φ x, f0 (x), f00 (x)
−
= 0 ∀x ∈ [x1 , x2 ].
∂f
dx
∂f 0
Somit haben wir bewiesen das
Theorem: Sei Φ eine in allen ihren drei reellen Variablen stetig differenzierbare Funktion und x1 , x2 ,
y1 , y2 gegebene reelle Zahlen mit x1 < x2 . Für stetig differenzierbare Funktionen f : [x1 , x2 ] → R,
die f (x1 ) = y1 und f (x2 ) = y2 erfüllen, wird das Funktional
Z x2
F [f ] =
Φ x, f (x), f 0 (x) dx
(II.2a)
x1
definiert. Wenn F ein Extremum für eine Funktion f0 hat, dann erfüllt f0 die Euler-Gleichung
∂Φ x, f (x), f 0 (x)
d ∂Φ x, f (x), f 0 (x)
=
∀x ∈ [x1 , x2 ].
(II.2b)
∂f
dx
∂f 0
Bemerkungen:
∗ Bei gegebener Φ ist die zugehörige Euler-Gleichung eine gewöhnliche Differentialgleichung zweiter
Ordnung in f .
(18)
Dies bildet das Fundamentallemma der Variationsrechnung.
53
II.1 Ein Resultat aus der Variationsrechnung
∗ Wenn die Funktion Φ bestimmte Bedingungen erfüllt, kann man auch zeigen, dass eine Lösung
der Euler-Gleichung (II.2b) auch Lösung des Extremierunsproblems für F ist.
∗ Die Anwesenheit eines Extremum für das Funktional F wird (durch Physiker) oft mit der kurzen
Schreibweise δF [f ] = 0 bezeichnet.
Das obige Theorem lässt sich auf den Fall eines Funktionals
Z x2
0
Φ x, f1 (x), f10 (x), . . . , fN (x), fN
(x) dx
F [f1 , . . . , fN ] =
(II.3a)
x1
von N Funktionen fa , a = 1, . . . , N verallgemeinern, wobei Φ jetzt eine stetig differenzierbare
Funktion von 2N + 1 reellen Variablen ist. Wenn ein Satz (f1 , . . . , fN ) das Funktional F minimiert
oder maximiert, dann genügen die zugehörigen Funktionen den N Euler-Gleichungen
∂Φ
d
∂Φ
=
∀x ∈ [x1 , x2 ]
(II.3b)
∂fa
dx ∂fa0
für jedes a ∈ {1, . . . , N }.
Das Theorem kann auch verallgemeinert werden, um den Fall eines Funktionals zu berücksichtigen, dessen Argumente Funktionen mehrerer Variablen x1 , . . . , xp sind:
Z ∂f (x1 , . . . , xp )
∂f (x1 , . . . , xp )
F [f ] =
Φ x1 , . . . , xp , f (x1 , . . . , xp ),
,...,
dx1 . . . dxp , (II.4a)
∂x1
∂xp
D
mit D einem p-dimensionalen Integrationsgebiet. Dabei ist Φ jetzt eine stetig differenzierbare Funktion von 2p+1 reellen Variablen. Wenn eine Funktion f das Funktional F minimiert oder maximiert,
dann erfüllt sie die Euler-Gleichung
p
∂Φ X ∂
∂Φ
=
∀x ∈ D
(II.4b)
∂f
∂xj ∂(∂f /∂xj )
j=1
Schließlich lässt sich auch die Extremierung von Funktionalen von N Funktionen von p Variablen
behandeln, indem die zwei obigen Verallgemeinerungen kombiniert werden.
II.1.2
b Beispiel
:::::::::::::::
Als Anwendung der Euler-Gleichung können wir den (bekannten!) kürzesten Weg zwischen zwei
Punkten (x1 , y1 ) und (x2 , y2 ) in der Ebene suchen. Das heißt, wir möchten die Kurve f (x) finden,
die f (x1 ) = y1 und f (x2 ) = y2 erfüllt und das Funktional
Z x2 q
2
`[f ] =
1 + f 0 (x) dx
(II.1)
x1
p
minimiert. Dieses Funktional ist der Form (II.2a) mit Φ x, f (x), f 0 (x) = 1 + [f 0 (x)]2 . Die zugehörigen partiellen Ableitungen sind
∂Φ
= 0,
∂x
∂Φ
= 0,
∂f
∂Φ
f 0 (x)
p
=
.
∂f 0
1 + [f 0 (x)]2
Leitet man die letztere nach x ab, so ergibt sich
d ∂Φ
f 00 (x)
=
3/2
dx ∂f 0
1 + [f 0 (x)]2
mit f 00 der zweiten Ableitung von f . Die Euler-Gleichung (II.2b) lautet dann
d ∂Φ
∂Φ
f 00 (x)
=
⇔
0
=
3/2 .
∂f
dx ∂f 0
1 + [f 0 (x)]2
54
Lagrange-Formalismus: Grundlagen
Dies gibt sofort f 00 (x) = 0: nach doppelter Integration unter Berücksichtigung der Randbedingungen
in x1 und x2 kommt
y2 − y1
f (x) = y1 +
(x − x1 ),
x2 − x1
d.h. die Gleichung der Gerade zwischen den zwei Endpunkten, was zu erwarten war.
Bemerkung: Zur Berechnung der totalen Ableitung nach x von ∂Φ/∂f 0 kann man entweder den
Ausdruck der partiellen Ableitung direkt ableiten, oder die Kettenregel anwenden und dafür die
drei zweiten Ableitungen ∂ 2 Φ/∂x ∂f 0 , ∂ 2 Φ/∂f ∂f 0 und ∂ 2 Φ/∂f 02 berechnen und mit jeweils x0 = 1,
f 0 (x) und f 00 (x) multiplizieren. Natürlich führen beide Wege zum gleichen Ergebnis.
II.2 Hamilton-Prinzip
Was machen wir schönes in diesem Abschnitt?
Definition (§ II.2.1) Euler–Lagrange-Gleichungen (§ II.2.2) Beispiele (§ II.2.3) Zwangsbedingungen (§ II.2.4)
II.2.1 Definitionen
II.2.1
a Verallgemeinerte Koordinaten
::::::::::::::::::::::::::::::::::::::
Sei ein System Σ aus N Massenpunkten. Die N Ortsvektoren ~xa (t) mit a ∈ {1, . . . , N } sind
äquivalent zu 3N Koordinaten. Wenn die Massenpunkte sich unabhängig voneinander bewegen
können, dann besitzt das System genau s = 3N Freiheitsgrade.
In der Praxis untersucht man oft aber Probleme, in denen es (feste) Zusammenhänge zwischen
den 3N Koordinaten gibt: z.B. ist der Abstand zwischen zwei Massenpunkten festgelegt, oder die
Massenpunkte müssen auf irgendeiner Fläche bleiben. In solchen Fällen sind die 3N Koordinaten
der Positionen nicht unabhängig von einander, d.h. die Anzahl s der Freiheitsgrade des Systems ist
kleiner als 3N . Es ist daher sinnvoll, mit nur s Größen zu arbeiten, anstatt mit N .
Somit führt man zur Charakterisierung eines mechanischen Systems s verallgemeinerte bzw.
generalisierte Koordinaten q1 (t), q2 (t), . . . , qs (t) ein, welche die folgenden Bedingungen erfüllen:
i. Sie legen den Zustand des Systems eindeutig fest, d.h. jede Position ~xa (t) mit a ∈ {1, . . . , N }
lässt sich als eine bestimmte Funktion — die auch mit ~xa bezeichnet wird — der Zeit und der
s verallgemeinerten Koordinaten schreiben:
~xa (t) = ~xa t, q1 (t), . . . , qs (t) ∀a ∈ {1, . . . , N }
(II.5)
ii. Sie sind alle voneinander unabhängig,
d.h. es existiert keine Funktion f von s+1 Argumenten,
für die f t, q1 (t), . . . , qs (t) = 0 für jede Zeit t gilt.
Die Newton’schen Bewegungsgleichungen sind Differentialgleichungen zweiter Ordnung, so dass
man neben den Positionen ~xa (t) noch die N Geschwindigkeiten ~x˙ a (t) betrachten muss, um die
Zeitentwicklung für t0 > t zu bestimmen. Laut Gl. (II.5) sind diese Geschwindigkeiten Funktion von
der Zeit t, den verallgemeinerten Koordinaten qi (t) für i ∈ {1, . . . , s}, und von deren Zeitableitungen.
Dementsprechend muss man auch die verallgemeinerten Geschwindigkeiten q̇i (t) in Betracht ziehen.
Genau wie die Geschwindigkeiten ~x˙ a (t) im Allgemeinen unabhängig von den Positionen ~xa (t),
gilt dies auch für die verallgemeinerten Geschwindigkeiten und Koordinaten.
Der Kürze halber werden die s generalisierten Koordinaten qi (t) bzw. Geschwindigkeiten q̇i (t)
kollektiv als ein s-dimensionaler Vektor q(t) bzw. q̇(t) bezeichnet.
55
II.2 Hamilton-Prinzip
Bemerkungen:
∗ Während die Anzahl s der Freiheitsgrade für ein bestimmtes Problem eindeutig festgelegt ist,
gilt das im Allgemeinen nicht für die verallgemeinerten Koordinaten qi (t), entsprechend z.B. der
Freiheit bei der Wahl von Koordinaten.
∗ Genau wie es schon der Fall bei „üblichen“ Koordinaten ist, haben verallgemeinerte Koordinaten
nicht unbedingt die Dimension einer Länge.
II.2.1
b Lagrange-Funktion. Wirkung
::::::::::::::::::::::::::::::::::::
Jedem System aus s Freiheitsgraden kann eine reelle Funktion von 2s + 1 (reellen) Variablen
zugeordnet werden, die Lagrange-Funktion L, welche die Bewegung des Systems völlig bestimmt,
und die (physikalische) Dimension einer Energie hat. Dabei nimmt die Funktion als Argumente die
Zeit t, die s verallgemeinerten Koordinaten qi (t) und s verallgemeinerten Geschwindigkeiten q̇i (t):
L t, q(t), q̇(t) .
(II.6)
Somit ergibt sich eigentlich eine Funktion der Zeit t alleine.
Die Form der Lagrange-Funktion wird später angegeben, nachdem ihre Rolle in der Bestimmung
der Bewegungsgleichungen eines Systems genauer präzisiert worden ist (vgl. § II.2.3). Es sei aber
schon hier erwähnt, dass diese Form nicht eindeutig festgelegt ist, auch wenn die verallgemeinerten
Koordinaten gewählt wurden.
Seien jetzt zwei Zeitpunkte t1 < t2 . Das Integral der Funktion (II.6) über das Zeitintervall [t1 , t2 ]
definiert die Wirkung, die auch Wirkungsintegral genannt wird:
Z
t2
S[q] ≡
L t, q(t), q̇(t) dt.
(II.7)
t1
In der Schreibweise wurde schon berücksichtigt, dass die Wirkung von den verallgemeinerten Koordinaten und Geschwindigkeiten qi (t), q̇i (t) abhängt, so dass es sich um ein Funktional handelt —
weshalb S[q] auch als Wirkungsfunktional bezeichnet wird.
Die Wirkung hat die Dimension des Produkts von Energie und Zeit, d.h. die zugehörige Einheit
im SI-System ist das J s = kg m2 s−1 .
II.2.2 Hamilton-Prinzip. Euler–Lagrange-Gleichungen
Es seien t1 < t2 . Bei dem Hamilton-Prinzip handelt es sich um ein Extremalprinzip, laut dem die
Zeitentwicklung eines Systems im Intervall [t1 , t2 ] so erfolgt, dass die physikalisch realisierten verallgemeinerten Koordinaten q(t) und Geschwindigkeiten q̇(t) das Wirkungsfunktional (II.7) extremal
(oder „stationär“) machen. Dies wird oft kurz als
Hamilton-Prinzip: δS[q] = 0
(II.8)
ausgedrückt.
Gemäß dem in § II.1.2 a angegebenen Theorem genügt dann das Integrand des Wirkungsintegrals,
d.h. die Lagrange-Funktion L, den Euler-Gleichungen (II.3b), die in diesem Kontext als Euler–
Lagrange-Gleichungen bezeichnet werden:
∂L t, q(t), q̇(t)
d ∂L t, q(t), q̇(t)
=
∀i ∈ {1, . . . , s}.
(II.9)
∂qi
dt
∂ q̇i
Diese s Differentialgleichungen zweiter Ordnung für die s verallgemeinerten Koordinaten stellen die
Bewegungsgleichungen des Systems dar.
56
Lagrange-Formalismus: Grundlagen
Bemerkungen:
∗ Das Hamilton-Prinzip wird auch als das Wirkungsprinzip, das Prinzip der stationären Wirkung
oder, fehlerhaft, das Prinzip der kleinsten Wirkung bezeichnet.
Wiederum werden die Euler–Lagrange-Gleichungen (II.9) noch Lagrange-Gleichungen zweiter Art
genannt.
∗ Die Lagrange-Funktion für ein gegebenes System ist nicht eindeutig: wenn L t, q(t), q̇(t) eine
mögliche Lagrange-Funktion bezeichnet, dann ist
d
L0 t, q(t), q̇(t) ≡ L t, q(t), q̇(t) + M t, q(t)
dt
(II.10)
eine äquivalente Lagrange-Funktion, die zu denselben Euler–Lagrange-Gleichungen führt, wobei M
eine beliebige stetig differenzierbare Funktion der Zeit und der generalisierten Koordinaten ist.
Beweis: das mit L0 berechnete Wirkungsintegral lautet
Z t2
Z t2
dM t, q(t)
0
0
S [q] ≡
dt = S[q] + M t2 , q(t2 ) − M t1 , q(t1 ) .
L t, q(t), q̇(t) dt = S[q] +
dt
t1
t1
Unter Variationen q → q + δq, mit δq(t1 ) = δq(t2 ) = 0 bleiben die zwei letzten Terme unverändert, d.h. sie haben keinen Einfluss auf die Position des Extremums bzw. auf die Euler–LagrangeGleichungen.
2
Alternativ kann man die totale Ableitung nach der Zeit dM t, q(t) /dt durch die partiellen
Ableitungen (nach t und nach den qi ) ausdrücken. Dann findet man, dass der zusätzliche Term
in der Lagrange-Funktion Beiträge zu den beiden Seiten der Euler–Lagrange-Gleichungen liefert,
die sich gegenseitig kompensieren.
Die Invarianz der Bewegungsgleichungen unter Transformationen (II.10) wird manchmal als Eichinvarianz bezeichnet, und eine derartige Transformation als Eichtransformation.
∗ Die Euler–Lagrange-Gleichungen (II.9) sind Form-invariant oder kovariant unter den gleichzeitigen Transformationen
qa (t) → qa0 (t) = qa0 t, q(t)
(II.11a)
(II.11b)
L t, q(t), q̇(t) → L0 t, q0(t), q̇0(t) ≡ L t, q t, q0(t) , q̇ t, q0(t) ,
entsprechend einem Koordinatenwechsel.
Beweis: ohne Schwierigkeit.
Definition: Der verallgemeinerte Impuls oder kanonisch konjugierte Impuls wird definiert als
∂L t, q(t), q̇(t)
pi t, q(t), q̇(t) ≡
∂ q̇i
(II.12)
Falls die Lagrange-Funktion nicht explizit von einer verallgemeinerten Koordinaten qi abhängt,
dann folgt sofort aus der entsprechenden Euler–Lagrange-Gleichung, dass der zugehörige generalisierte Impuls pi eine Erhaltungsgröße ist (vgl. auch § II.3.1 b).
II.2.3 Erste Beispiele
II.2.3
a Freier Massenpunkt
:::::::::::::::::::::::::::
57
II.2 Hamilton-Prinzip
Als mögliche Lagrange-Funktion für einen freien Massenpunkt mit Masse m und Position ~x(t)
kann man folgende Funktion annehmen:
m
L t, ~x(t), ~x˙ (t) = ~x˙ (t)2 .
2
(II.13)
Dabei sind die verallgemeinerten Koordinaten qi die kartesischen Koordinaten xi , so dass q̇i = ẋi .
Wegen der Gleichung
∂L t, ~x(t), ~x˙ (t)
= mẋi
∂ ẋi
ist der mit ~x(t) assoziierte verallgemeinerte Impuls einfach der (kinetische) Impuls ~p = m~x˙ . Wiederum ist ∂L/∂xi = 0. Dann drücken die assoziierten Euler–Lagrange-Gleichungen
∂L t, ~x(t), ~x˙ (t)
d ∂L t, ~x(t), ~x˙ (t)
i
= mẍ = 0 =
dt
∂ ẋi
∂xi
die Erhaltung dieses Impulses in der Bewegung, d.h. das erste Newton’sche Gesetz, aus.
II.2.3
b System aus Massenpunkten mit konservativen Kräften
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Für ein System aus N Massenpunkten, die miteinander über konservative Kräfte wechselwirken,
kann man als generalisierte Koordinaten einfach die Ortsvektoren betrachten, d.h. qi = xja , mit xja
der j-Koordinaten der Position vom Massenpunkt a. Dann lautet eine mögliche Lagrange-Funktion
N
X
m˙
˙
L t, {~xa (t)}, {~xa (t)} =
~xa (t)2 − V {~xa (t)} = T − V
2
(II.14)
a=1
mit T der kinetischen Energie.
Schreibt man nämlich die entsprechenden Euler–Lagrange-Gleichungen
d ∂L
∂L
=
,
dt ∂ ẋja
∂xja
so gilt einerseits, genau wie im obigen Fall des freien Massenpunkts, ∂L/∂ ẋja = mẋja . Daraus ergibt
sich sofort
d ∂L
= mẍja (t).
dt ∂ ẋja
Andererseits beträgt die Ableitung nach xja auf der linken Seite der Euler–Lagrange-Gleichung
∂L
∂xja
=−
∂V
= Faj ,
∂xia
wobei Faj die j-Komponente der Kraft auf den a-ten Massenpunkt bezeichnet. Insgesamt findet man
somit
mẍia = Fai ,
(II.15)
d.h. genau die j-Komponente der aus dem zweiten Newton’schen Gesetz bekannten Bewegungsgleichung für den a-ten Massenpunkt.
II.2.3 c System aus Massenpunkten mit nicht-konservativen Kräften
Falls die Massenpunkte eines System miteinander über nicht-konservative Kräfte wechselwirken,
kann man generell keine allgemein geltende zugehörige Lagrange-Funktion schreiben. In zwei Fällen
sind jedoch Erweiterungen der Lagrange-Funktion (II.14) möglich, und zwar einerseits für Kräfte,
die aus einem verallgemeinerten, Zeit- und Geschwindigkeitsabhängigen Potential abgeleitet werden
können, andererseits für Reibungskräfte proportional zur Geschwindigkeit.
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
58
Lagrange-Formalismus: Grundlagen
Kräfte aus einem generalisierten Potential
Betrachten wir eine nicht-konservative Kraft F~n.-k. auf einen Massenpunkt derart, dass ihre kartesischen Komponenten sich in der Form
∂U t, ~x(t), ~x˙ (t)
d ∂U t, ~x(t), ~x˙ (t)
j
Fn.-k. = −
+
für j = 1, 2, 3
(II.16a)
∂xj
dt
∂ ẋj
schreiben lassen, mit U einem verallgemeinerten Potential und xj (t) bzw. ẋj (t) der j-Komponente
der Position bzw. der Geschwindigkeit des Massenpunkts.
Vektoriell kann man schreiben
~ ~v U t, ~x(t), ~x˙ (t) ,
~ ~r U t, ~x(t), ~x˙ (t) + d ∇
F~n.-k. = −∇
dt
(II.16b)
~ ~r bzw. ∇
~ ~v den Gradienten bezüglich der Orts- bzw. Geschwindigkeitskoordinaten bewobei ∇
zeichnet.
Sei zudem V das Potential, aus dem die konservativen Kräften F~ auf den Massenpunkt folgen.
Dann stellt
m
L t, ~x(t), ~x˙ (t) = T − V − U = ~x˙ (t)2 − V ~x(t) − U t, ~x(t), ~x˙ (t)
(II.17)
2
eine geeignete Lagrange-Funktion für den Massenpunkt dar. Man prüft nämlich einfach nach, dass
die zugehörigen Euler–Lagrange-Gleichungen
j
mẍj = F j + Fn.-k.
für j = 1, 2, 3
sind.
~ eine reelle bzw. vektorielle Funktion von Zeit und Ort. Man kann eine
Beispiel: Sei Φ bzw. A
Lagrange-Funktion für einen Massenpunkt mit Position ~x(t) und Geschwindigkeit ~x˙ (t) durch
~ t, ~x(t)
U t, ~x(t), ~x˙ (t) = qΦ t, ~x(t) − q ~x˙ (t) · A
(II.18a)
definieren, mit q eine für den Massenpunkt charakteristische Zahl. Über die Beziehung (II.16b) führt
dieses verallgemeinerte Potential zur Kraft
h
~ t, ~x(t)
∂A
i
˙
~
~
~
~
F = q − ∇Φ t, ~x(t) −
.
(II.18b)
+ ~x(t) × ∇ × A t, ~x(t)
∂t
~ ≡ −∇Φ
~ − ∂ A/∂t
~
~ ≡∇
~ × A,
~ dann ist dies genau die Lorentz-Kraft, die eine
Definiert man E
und B
~ B)
~ erfährt.
Punktladung q in einem elektromagnetischen Feld (E,
~ der
Bemerkung: Wie in § I.1.3 b schon bemerkt wurde leistet der „magnetische Anteil“ q~
x˙ (t) × B
Lorentz-Kraft keine Arbeit. Diese Aussage entspricht genau der Tatsache, dass die Lorentz-Kraft
sich aus einem verallgemeinerten Potential über Gl. (II.16a) ableiten lässt.
Reibungskräfte
Im Gegensatz zu konservativen Kräften oder zur Lorentz-Kraft hängt die Arbeit von Reibungskräften zwischen zwei Punkten von der genauen Trajektorie ab. Dementsprechend kann man kein
generalisiertes Potential finden, mit dessen Hilfe Reibungskräfte über Gl. (II.16a) abgeleitet werden
können.
Für die Stokes’schen-Reibungskraft, die proportional zur Geschwindigkeit ist, kann man eine
Funktion einführen, deren Ableitung die Kraft ist. Im Fall der Kraft auf einen Massenpunkt mit
Position bzw. Geschwindigkeit ~x(t) bzw. ~x˙ (t) definiert man die Rayleigh (n) -Dissipationsfunktion
(n)
J. W. Strutt, Lord Rayleigh, 1842–1919
59
II.2 Hamilton-Prinzip
3
X
˙
D ~x(t) ≡
γj ẋj(t)2
(II.19)
j=1
mit positiven Koeffizienten γj . Nach Ableitung nach der Komponente ẋj der Geschwindigkeit folgt
−
∂D
= −γj ẋj(t),
∂ ẋj
(II.20)
d.h. eine Stokes’sche Reibungskraft mit unterschiedlichen Reibungskoeffizienten in drei Richtungen.
Führt man dann generalisierte
Koordinaten
q(t) ein, so lässt sich die Dissipationsfunktion durch
diese über D t, q(t), q̇(t) = D {~x˙ (t, q, q̇)} ausdrücken. Um die Bewegungsgleichungen zu erhalten
werden dann „modifizierte Lagrange-Gleichungen“ postuliert:
∂L t, q(t), q̇(t)
∂D t, q(t), q̇(t)
d ∂L t, q(t), q̇(t)
=
+
,
(II.21)
∂qi
dt
∂ q̇i
∂ q̇i
die das richtige Ergebnis liefern. Es muss aber betont werden, dass die Gleichungen (II.21), im
Gegensatz zu den üblichen Euler–Lagrange-Gleichungen, sich nicht aus einem Extremalprinzip herleiten lassen. In diesem Sinne ist die obige Konstruktion ziemlich künstlich.
Bemerkung: Das Interessante bei der Rayleigh-Dissipationsfunktion liegt daran, dass die instantane
Leistung, welche der Massenpunkt gegen die Reibungskraft verrichten muss, gleich 2D ist.
II.2.4 Systeme mit Zwangsbedingungen
Die individuellen Punkte eines Systems können sich oft nicht uneingeschränkt unabhängig voneinander bewegen. Stattdessen müssen die Koordinaten oder die Geschwindigkeiten der Punkte
gewisse Bedingungen genügen (§ II.2.4 a): beispielsweise müssen Abstände konstant bleiben, oder
die Punkte müssen auf einer gegebenen Fläche, oder innerhalb eines gegebenen Volumens bleiben.
Diese Einschränkungen der Bewegung werden durch Zwangskräfte erzwungen, deren Form nicht
immer einfach auszudrücken ist. Im Rahmen des Lagrange-Formalismus kann man die Bewegungsgleichungen formulieren, ohne die Zwangskräfte genau zu kennen, indem man geeignete verallgemeinerte Koordinaten verwendet (§ II.2.4 b).
II.2.4
a Zwangsbedingungen
:::::::::::::::::::::::::::::
A priori besetzt ein System aus N Massenpunkten 3N Freiheitsgrade für seine Bewegung, und
zwar Lagrange-Formalismus drei (orthogonal zueinander) Bewegungsrichtungen, die sich als die
insgesamt 3N Komponenten xja (t), a ∈ {1, . . . , N }, j = 1, 2, 3 der Ortsvektoren visualisieren lassen.
Sei angenommen, dass diese Massenpunkte Zwangskräften unterliegen. Diese einschränken die
Entwicklung des Systems, was sich mathematisch durch Gleichungen der Form
(II.22)
fi t, ~x1 (t), . . . , ~xN (t), ~x˙ 1 (t), . . . , ~x˙ N (t) = 0
mit fi einer genügend regulären Funktion von 6N + 1 Variablen. Wir werden annehmen, dass es r
unabhängige solche Beziehungen gibt, d.h. i ∈ {1, . . . , r}.
Definition: Eine Gleichungen der Form (II.22), in welcher nur die Zeit und die Positionen der Mas-
senpunkte auftreten, heißt holonome Zwangsbedingung (oder holonome Nebenbedingung):
fi t, ~x1 (t), . . . , ~xN (t) = 0,
(II.23)
wobei fi jetzt Funktion von 3N + 1 Variablen ist.
Dank jeder holonomen Zwangsbedingung lässt sich eine Koordinate durch alle anderen (und die
Zeit) ausdrücken, zumindest implizit. Ein System aus N Massenpunkten mit r Nebenbedingungen
hat somit nur noch s = 3N − r unabhängige Freiheitsgrade.
60
Lagrange-Formalismus: Grundlagen
Bemerkungen:
∗ Einschränkungen der Bewegung können auch durch Ungleichungen ausgedrückt werden. Zum
Beispiel lässt das Einsperren von Teilchen in einem gegebenen Volumen, entsprechend einem Behälter, mit Ungleichungen formulieren. Dabei handelt es sich um eine nichtholonome Zwangsbedingung.
∗ Man unterscheidet noch zwischen skleronomen, d.h. zeitunabhängigen, und rheonomen, d.h. zeitabhängigen, Zwangsbedingungen.
Beispiel 1: Einfaches Pendel
Wir betrachten ein ebenes Pendel bestehend aus einer
Masse m am Ende
eines masselosen Stabs mit Länge l. Sei x(t), y(t), z(t) die Trajektorie der
Masse, wobei der Nullpunkt des Koordinatensystem im Aufhängepunkt des
Pendels genommen.
Das Pendel schwingt in der (x, y)-Ebene,
d.h. z(t) = 0: dies lässt sich durch
eine erste Zwangsbedingung f1 t, ~x(t) ≡ z(t) = 0 ausdrücken.
Wiederum entspricht die Forderung
einer festen Länge l einer zweiten
2
Zwangsbedingung f2 t, ~x(t) ≡ x(t) + y(t)2 − l2 = 0.
y
6
•
x
J
J
3J
ϕ l
J
J
JJ
•m
Abbildung II.1
Da es r = 2 Zwangsbedingungen gibt, bleibt nach deren Berücksichtigung nur s = 3N − r = 1
Freiheitsgrad übrig.
Beispiel 2: Gleitende Masse auf einer schiefen Ebene
−
−−
y6
PP
P
x
PP • P
P
PP PP
m
P
P
P
q
P
PP
q P
P
φ PPP
−
Sei jetzt ein durch einen Massenpunkt modellierte Körper
mit Masse m, der reibungslos auf einer Ebene gleitet.
Wegen einer ersten Zwangsbedingung f1 t, ~x(t) ≡ z(t) = 0
bleibt der Körper in der (x, y)-Ebene. Dazu bewegt er sich
in der schiefen Ebene mit Neigungswinkel φ, so dass seine
Koordinaten y(t) = x(t) tan φ (bis auf einer unwesentlichen
additiven Konstante) erfüllen. Dementsprechend
gibt es eine
zweite Zwangsbedingung f2 t, ~x(t) ≡ y(t) − x(t) tan φ = 0.
Abbildung II.2
Wie beim einfachen Pendel bleibt somit nur ein Freiheitsgrad übrig, d.h. ein einziger Parameter soll
reichen, um die Bewegung des Körpers völlig zu charakterisieren.
II.2.4 b Lagrange-Formalismus für Systeme mit Zwangsbedingungen
Einer der Vorteile des Lagrange-Formalismus besteht darin, dass man Kräfte und insbesondere
Zwangskräfte nicht explizit ausdrücken soll, um die Bewegungsgleichungen zu erhalten. Zu diesem
Zweck kann man einem relativ einfachen Rezept folgen:(19)
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
• Als erster Schritt muss man s = 3N −r verallgemeinerte Koordinaten q1 , . . . , qs einführen. Diese sollen so gewählt werden, dass sie die Konfigurationen des Systems parametrisieren, welche
die Zwangsbedingungen erfüllen. Dementsprechend sollen die qi durch die Nebenbedingungen
uneingeschränkt sein.
• Danach soll man die Lagrange-Funktion L = T − V , die man als Funktion der kartesischen
Ortskoordinaten kennt, durch die verallgemeinerten Koordinaten q(t) und Geschwindigkeiten
q̇(t) ausdrücken.
In diesem Falle enthält das Potential V eigentlich nur die Beiträge, die nicht Zwangskräfte
verursachen.
• Schließlich kann man die Euler–Lagrange-Gleichungen aufstellen und lösen — möglicherweise
numerisch.
(19)
Die „Begründung“ des Rezepts wird später hinzugefügt.
61
II.2 Hamilton-Prinzip
Beispiel 1: Einfaches Pendel
Wir betrachten wieder das in Abb. II.1 dargestellte ebene Pendel. Die zwei Zwangsbedingungen
schränken die (kartesische) z-Komponente und den Abstand vom Aushängepunkt ein. Dagegen ist
der Ablenkwinkel ϕ noch uneingeschränkt, und jede Konfiguration des System, welche die Nebenbedingungen erfüllt, kann mit diesem Winkel ϕ alleine charakterisiert werden. Somit ist q = ϕ eine
gute Wahl für die (hier ist s = 1) verallgemeinerte Koordinate.
Dann lassen sich die kartesischen Koordinaten der Position x(t), y(t), z(t) einfach durch ϕ(t)
ausdrücken:
x(t) = l sin ϕ(t), y(t) = −l cos ϕ(t), z(t) = 0,
woraus ẋ(t) = l ϕ̇(t) cos ϕ(t), ẏ(t) = l ϕ̇(t) sin ϕ(t), ż(t) = 0 folgt. Ersetzt man diese kartesischen
Koordinaten im Ausdruck der kinetischen Energie
m
ml2
m ˙ 2 m
~x(t) =
ẋ(t)2 + ẏ(t)2 + ż(t)2 = l2 ϕ̇(t)2 cos2 ϕ(t) + sin2 ϕ(t) =
ϕ̇(t)2
2
2
2
2
und des Potentials
V = mgy(t) = −mgl cos ϕ(t),
T =
so ergibt sich für die Lagrange-Funktion:
ml2
ϕ̇(t)2 + mgl cos ϕ(t).
2
Die partiellen Ableitungen der Lagrange-Funktion lauten dann
L=T −V =
∂L
= −mgl sin ϕ(t) und
∂ϕ
∂L
= ml2 ϕ̇(t).
∂ ϕ̇
Aus der zweiten folgt d(∂L/∂ ϕ̇)/dt = ml2 ϕ̈(t), so dass die Euler–Lagrange-Gleichung (II.9) zur
Bewegungsgleichung
g
ϕ̈(t) = − sin ϕ(t)
(II.24)
l
führt, wie der Leserin wahrscheinlich schon aus einer früheren Vorlesung bekannt ist.
Der Vollständigkeit halber: Lösung... (mehr später)
Schwingungen kleiner Amplitude: sin ϕ(t) ∼ ϕ(t)... trivial
Schwingungen beliebiger Amplitude: Multipliziere Gl. (II.24) mit ϕ̇(t) und integriere:
Z t
Z
1
g t
g
0
0
0
2
2
ϕ̈(t )ϕ̇(t ) dt = ϕ̇(t) − ϕ̇(t0 ) = −
sin ϕ(t0 ) ϕ̇(t0 ) dt0 =
cos ϕ(t) − cos ϕ(t0 ) .
2
l
l
t0
t0
Mit Anfangsbedingung ϕ(t0 ) ≡ ϕ0 , ϕ̇(t0 ) = 0 und Separation der Variablen:
s
dϕ
2l
√
dt = ±
g cos ϕ − cos ϕ0
führt zu einem elliptischen Integral erster Art.
Beispiel 2: Gleitende Masse auf einer schiefen Ebene
Für den gleitenden Körper der Abb. II.2, die Bewegung ist eingeschränkt in die Richtung senkrecht zur schiefen Ebene und die z-Richtung, jedoch ist noch frei entlang der Neigung der Ebene.
Daher stellt die dargestellte Entfernung (aus einem beliebigen Referenzpunkt) q eine geeignete generalisierte Koordinate dar. Dann gelten
x(t) = q(t) cos φ,
y(t) = −q(t) sin φ,
z(t) = 0,
bis auf additiven Konstanten, die von der genauen Position des Nullpunkts abhängen, und zu den
Bewegungsgleichungen nicht beitragen. Die Zeitableitungen sind trivial und führen zur kinetischen
Energie
62
Lagrange-Formalismus: Grundlagen
m
m
ẋ(t)2 + ẏ(t)2 + ż(t)2 = q̇(t)2 .
2
2
Wiederum lautet das Potential (noch einmal bis auf einer Konstante)
T =
V = mgy(t) = −mgq(t) sin φ.
Dies gibt die Lagrange-Funktion
L=T −V =
m
q̇(t)2 + mgq(t) sin φ
2
mit partiellen Ableitungen
∂L
∂L
= mg sin φ und
= m q̇(t),
∂q
∂ q̇
so dass die Euler–Lagrange-Gleichung (II.9) zur Bewegungsgleichung
q̈(t) = g sin φ
führt.
II.3 Symmetrien und Erhaltungsgrößen
Im Rahmen des Newton’schen Formalismus sind Erhaltungsgrößen bzw. Erhaltungssätze schöne
Konstrukte, deren Ursprung aber unklar bleibt: Gleichungen werden manipuliert, Größen werden
eingeführt, auf erster Sicht gibt es aber keine tiefere unterliegende, gemeinsame Begründung für die
Existenz der verschiedenen Konstanten der Bewegung.
Eine solche globale Erklärung für die Erhaltungssätze lässt sich im Lagrange-Formalismus einfacher erkennen. Somit spiegelt eine Erhaltungsgröße die Invarianz der theoretischen Beschreibung,
und der Physik, unter bestimmten Transformationen der Koordinaten wider, entsprechend einer
Symmetrie des physikalischen Systems.
Dieser Zusammenhang zwischen Invarianz der Physik unter einigen Transformationen und Erhaltungsgrößen wird zunächst am Beispiel verschiedener Arten von Transformationen der RaumzeitKoordinaten — Translationen in der Zeit oder im Raum und Drehungen — illustriert (§ II.3.1). Die
Verallgemeinerung auf den Fall mehr abstrakter Transformationen wird dann in § II.3.2 skizziert,
wobei der Begriff von Symmetrien im physikalischen Sinne genauer definiert wird.
II.3.1 Invarianz unter Raumzeit-Transformationen
Per Annahme ist die Raumzeit der klassischen Mechanik zeitlich und räumlich homogen und
räumlich isotrop. Betrachtet man ein idealisiertes Experiment — einschließlich der ganzen Umgebung, die dabei einen Einfluss hat —, das man beliebig verschieben, sowohl im Raum als in der Zeit,
oder drehen kann, dann soll das Ergebnis des Experiments weder von der Anfangszeit, noch von
der Position oder der Orientierung im Raum abhängen. Die Modellierung dieses Experiments soll
dann invariant unter zeitlichen und räumlichen Translationen und unter Drehungen sein. Daraus
ergibt sich die Konstanz in der Bewegung der drei „klassischen“ Erhaltungsgrößen der Newton’schen
Mechanik, und zwar Energie, Impuls und Drehimpuls.
II.3.1
a Homogenität der Zeit und Energieerhaltung
:::::::::::::::::::::::::::::::::::::::::::::::::::
Als erstes können wir die Folgerung der Invarianz unter Zeittranslationen untersuchen. Betrachten wir dementsprechend eine Theorie mit einer Lagrange-Funktion L, die nicht explizit von der
Zeit abhängt:
L q(t), q̇(t) ,
wobei die qi (t) verallgemeinerte Koordinaten sind.
Definiert man dann eine Größe, die Energie des Systems, durch
63
II.3 Symmetrien und Erhaltungsgrößen
s
X
∂L q(t), q̇(t)
q̇i (t) − L q(t), q̇(t) ,
E≡
∂ q̇i
(II.25a)
i=1
so ist diese eine Erhaltungsgröße
dE
= 0.
dt
(II.25b)
Anders gesagt folgt Energieerhaltung in einem physikalischen System aus der Invarianz des Systems
unter Zeitverschiebungen.
Beweis: das einfache Ableiten der Definition (II.25a) nach der Zeit gibt
!
s
s
dE
d X ∂L
dL X d ∂L
dL
=
q̇i −
=
q̇i −
.
dt
dt i=1 ∂ q̇i
dt
dt
∂
q̇
dt
i
i=1
Der erste Term auf der rechten Seite kann mithilfe der Produktregel und der Euler–LagrangeGleichung (II.9) transformiert werden:
d ∂L
d ∂L
∂L dq̇i
∂L
∂L
q̇i =
q̇i +
=
q̇i +
q̈i .
dt ∂ q̇i
dt ∂ q̇i
∂ q̇i dt
∂qi
∂ q̇i
Der zweite Term lässt sich auch mit der Produktregel umschreiben:
X
s s ∂L dq̇i
∂L
∂L
dL X ∂L dqi
=
+
q̇i +
q̈i .
=
dt
∂qi dt
∂ q̇i dt
∂qi
∂ q̇i
i=1
i=1
2
Somit ist die Differenz der beiden Terme genau Null.
Bemerkung: Unter Verwendung der verallgemeinerten Impulse (II.12) lässt sich die Energie noch
als
E≡
s
X
pi q(t), q̇(t) q̇i (t) − L q(t), q̇(t)
(II.25c)
i=1
schreiben.
Beispiel: Sei ein System mit der Lagrange-Funktion
s
1X
λj,k q(t) q̇j (t) q̇k (t) − V q(t) ,
L=T −V =
2
j,k=1
d.h. mit einer kinetischen Energie, die quadratisch in den verallgemeinerten Geschwindigkeiten ist.
Dabei soll λj,k symmetrisch unter dem Austausch von j und k sein. Wie die Leserin sofort erkennen
kann, gibt λj,k = 21 mj δjk den üblichen kinetischen Term 21 mj q̇j2 , die folgende Herleitung ist aber
für beliebige λj,k gültig.
Das Einsetzen dieser Form der Lagrange-Funktion in die Definition (II.25a) gibt
!
s
s
s
X
∂ 1X
1X
E=
q̇i
λj,k q̇j q̇k − V −
λj,k q̇j q̇k + V.
∂ q̇i 2
2
i=1
j,k=1
j,k=1
Einerseits hängt das Potential nicht von der generalisierten Geschwindigkeiten ab, ∂V /∂ q̇i = 0,
so dass der zweite Term in den Klammern nicht beiträgt. Andererseits gilt unter Verwendung der
Produktregel
!
s
s
s
s
s
X
1X
∂ 1X
1X X
q̇i
λj,k q̇j q̇k =
q̇i
λj,k δij q̇k + q̇j δik =
λj,k q̇j q̇k + q̇j q̇k = 2T.
∂ q̇i 2
2
2
i=1
j,k=1
i=1
j,k=1
j,k=1
64
Lagrange-Formalismus: Grundlagen
Insgesamt ergibt sich daher
E=
s
1X
λj,k q̇j q̇k + V = T + V,
2
j,k=1
entsprechend der üblichen Definition der Gesamtenergie.
II.3.1
b Homogenität des Raums und Impulserhaltung
::::::::::::::::::::::::::::::::::::::::::::::::::::::
Dieses Paragraph wird dem Zusammenhang zwischen Invarianz unter räumlichen Translationen
und Impulserhaltung gewidmet.
Definition: Eine verallgemeinerte Koordinate qj heißt zyklische Koordinate, wenn die Lagrange-
Funktion nicht explizit davon abhängt, d.h.
∂L t, q(t), q̇(t)
= 0.
∂qj
(II.26)
Falls eine generalisierte Koordinate qj zyklisch ist, dann ist die Lagrange-Funktion invariant
unter den Translationen qj → qj + a mit a ∈ R. Dann ist der dazu kanonisch konjugierte Impuls
∂L t, q(t), q̇(t)
pj ≡
∂ q̇j
(II.12)
eine Konstante der Bewegung, d.h.
dpj
= 0.
dt
(II.27)
Beispiel: Sei ein System aus N Massenpunkten mit nur inneren Zentralkräften, die aus dem Potential
V ~x1 (t), . . . , ~xN (t) =
X
Vab |~xa (t)−~xb (t)|
1≤a<b≤N
abgeleitet werden können [vgl. Gl. (I.66)].
Wählt man als verallgemeinerte Koordinaten zum einen (die drei Koordinaten von) ~x1 (t), und
zum anderen die Relativkoordinaten ~xa1 (t) ≡ ~xa (t) − ~x1 (t), so lautet die Lagrange-Funktion des
Systems
L=T −V =
N
X
X
2
m1 ˙
ma ˙
~xa1 (t) + ~x˙ 1 (t) −
Vab |~xa1 (t)−~xb1 (t)| .
~x1 (t)2 +
2
2
a=2
1≤a<b≤N
Diese Lagrange-Funktion ist unabhängig von jeder der drei Komponenten xj1 (t) von ~x1 (t), die somit zyklische Koordinaten sind, so dass die zugehörigen verallgemeinerten Impulse pj , j = 1, 2, 3
Erhaltungsgrößen sind:
pj (t) =
∂L
∂ ẋj1
= m1 ẋj1 (t) +
N
X
a=2
N
X
ma ẋja1 (t) + ẋj1 (t) = m1 ẋj1 (t) +
ma ẋja (t),
a=2
wobei die Unabhängigkeit der Variablen ẋj1 und ẋja1 benutzt wurde. Das heißt, die Erhaltungsgröße
ist hier die j-te Komponente des Gesamtimpulses des Systems.
II.3.1
c Isotropie des Raums und Drehimpulserhaltung
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
Wir betrachten jetzt ein System aus Massenpunkten mit Positionen ~xa (t), dessen LagrangeFunktion L invariant unter Drehungen ist. Eine solche Invarianz folgt aus der Isotropie des Raums
in Abwesenheit von einem externen Feld — z.B. Magnetfeld —, das eine bevorzugte Richtung
auswählen würde.
65
II.3 Symmetrien und Erhaltungsgrößen
Sei ~pa (t) der zu ~xa (t) kanonisch konjugierte Impuls. Dann ist der Gesamtdrehimpuls
~ ≡
L
X
~xa (t) × ~pa (t)
(II.28)
a
eine Erhaltungsgröße, d.h.
~
dL
= 0.
dt
(II.29)
Zum Beweis dieses Ergebnis, betrachte man eine beliebige (aktive) infinitesimale Drehung mit
−
→
Winkel δϕ um eine Achse mit Einheitsvektor ~eδϕ . Sei δϕ ≡ δϕ~eδϕ . Die Änderung der Position eines
Massenpunkts, die aus der Anwendung der Drehung resultiert, lautet dann
−
→
δ~xa = δϕ × ~xa .
(II.30)
Unter Nutzung der Kettenregel lautet die Änderung der Lagrange-Funktion für eine Variation
δ~xa , δ~x˙ a = d(δ~xa )/dt der Variablen
δL =
3 XX
∂L
a
j=1
δxja
∂xja
+
∂L
δ ẋja
∂ ẋja
.
Der erste Term in den Klammern kann mithilfe der Euler–Lagrange-Gleichung (II.9) umschrieben
werden:
XX
3 3 XX
dpa,j j
∂L j
d ∂L
j
j
δxa + j δ ẋa =
δL =
δxa + pa,j δ ẋa ,
dt ∂ ẋja
dt
∂ ẋa
a j=1
a j=1
wobei in der zweiten Gleichung die verallgemeinerten Impulse (II.12) eingeführt wurden. Dabei
erkennt man in den Klammern die Zeitableitung des Produkts pa,j δxja , so dass die Summe über j
einfach einem Skalarprodukt entspricht:
Xd
d X
δL =
~pa · δ~xa =
~pa · δ~xa .
dt
dt
a
a
Fordert man dann, dass die Lagrange-Funktion invariant unter Drehungen bleibt, so ist dieser Variation δL Null für Variationen δ~xa der Form (II.30), d.h.
−
d X −
→
→
d X
~p · δϕ × ~xa =
δϕ · ~xa × ~pa = 0.
dt a a
dt a
−
→
Da die Drehung zeitunabhängig ist, kann δϕ aus der Ableitung herausgezogen werden. Daher soll
die Gleichung
−
→ d X
δϕ ·
~xa × ~pa = 0
dt a
−
→
für eine beliebige infinitesimale Drehung, d.h. ein beliebiges δϕ, gelten: Dies ist nur dann möglich,
wenn das zweite Multiplikand des Skalarprodukts verschwindet, was genau Gl. (II.30) entspricht.
Bemerkung: Falls ein System nicht invariant unter allen Drehungen ist, sondern nur unter den
Drehungen um eine gegebene Achse, dann ist nur die Komponente des Drehimpulses entlang dieser
Richtung erhalten.
66
Lagrange-Formalismus: Grundlagen
II.3.2 Noether-Theorem
Die oben gefundenen Zusammenhänge zwischen Invarianz unter Zeittranslationen und Energieerhaltung, Invarianz unter räumlichen Translationen und Impulserhaltung, oder Invarianz unter
Drehungen und Drehimpulserhaltung, sind alle Beispiele eines allgemeineren Theorems, die durch
Emmy Noether(o) erfunden wurde. Hiernach wird eine mathematisch nicht-rigorose Version des
Satzes dargestellt, ohne genaue Angabe der Annahmen und ohne Beweis.
II.3.2
a Symmetrien
:::::::::::::::::::
Definition: Sei ein physikalisches System, beschrieben durch Koordinaten q(t). Ist seine Wirkung
S[q] invariant unter einer bestimmten Koordinatentransformation
t → t0 t, q, q̇
,
q → q0 t, q, q̇ ,
(II.31)
so heißt die letztere Symmetrietransformation. Dann wird gesagt, dass das System die entsprechende
Symmetrie besitzt.
Bemerkung: Dabei wird die Invarianz der Wirkung erfordert, nicht jene der Lagrange-Funktion, die
eine stärkere Forderung bildet.
Beispielsweise wurden in § II.3.1 schon verschiedene Symmetrietransformationen erwähnt, welche die Wirkung physikalischer Systeme oft invariant lassen: Zeit- und Raumtranslationen, oder
Drehungen. Dabei handelt es sich um sog. kontinuierliche Symmetrien, denn jede davon lässt sich
durch einen Parameter beschreiben — Translationsparameter, Winkel der Drehung —, der seine
Werte in einer „kontinuierlichen Menge“ (20) annehmen kann.
Im Gegensatz dazu ist eine Punktspiegelung — wie z.B. die Zeitumkehr t → t0 ≡ −t oder die
Raumspiegelung ~r → ~r0 ≡ −~r — keine kontinuierliche, sondern eine diskrete Symmetrie(-Transformation).
Im Fall einer kontinuierlichen Symmetrie kann man infinitesimale Transformationen der Koordinaten
qi → qi0 = qi + εQi t, q, q̇ mit |ε| 1
(II.32)
betrachten, die um den kleinen Parameter ε von der Identität abweichen. Dabei heißen die Funktionen Qi die Generatoren der Koordinatentransformationen.
II.3.2
b Noether-Theorem
:::::::::::::::::::::::::
Ausgehend von kontinuierlichen Symmetrietransformationen kann man einen wichtigen Satz der
mathematischen Physik beweisen, dessen Inhalt wir jetzt nur relativ informell formulieren.
Theorem (Noether-Theorem):
Mit jeder kontinuierlichen Symmetrie eines physikalischen Systems kann eine
Erhaltungsgröße, die Noether-Ladung, assoziiert werden.
(II.33)
Dazu erklärt noch der genauere Satz, wie die Erhaltungsgröße für eine bestimmte Symmetrie aussieht
bzw. wie sie sich berechnen lässt. Die zugehörige Form werden wir jetzt finden, indem wir plausible
Elemente eines Beweises darstellen.(21)
Dafür soll man eine infinitesimale Symmetrietransformation betrachten, hier der Einfachheit
halber mit t0 = t. Neben Gl. (II.32) gilt noch für die generalisierten Geschwindigkeiten
(20)
(21)
(o)
D.h. eine Menge, die homöomorph zu einem zusammenhängenden Intervall bzw. Gebiet von R bzw. Rn ist.
Ein ausführlicher Beweis „für Physiker“ befindet sich in (fast) jedem Lehrbuch zur theoretischen Mechanik. Wer
mathematische Genauigkeit sehen möchte, kann sie z.B. in Kap. 4 von Arnold, Mathematical methods of classical
mechanics [1] finden.
E. Noether, 1882–1935
67
II.3 Symmetrien und Erhaltungsgrößen
q̇i → q̇i0 = q̇i + εQ̇i t, q, q̇ .
(II.34)
Die Variation der Lagrange-Funktion
δL ≡ L t, q0 (t), q̇0 (t) − L t, q(t), q̇(t)
entsprechend den Transformationen (II.32), (II.34) kann auf zwei alternative Weisen geschrieben
werden. Einerseits gilt
df t, q(t), q̇(t)
δL = ε
(II.35)
dt
mit f einer Funktion, deren Form von jener der Lagrange-Funktion und von der Symmetrie abhängt.
Der Faktor ε — es könnte theoretisch eine ganzzahlige Potenz davon sein — folgt daraus, dass
die Variation δL verschwinden muss, wenn ε gegen Null geht. Dann multipliziert dieser Faktor
eine Funktion von den verallgemeinerten Koordinaten und Geschwindigkeiten, die sich in der Form
einer totalen Zeitableitung schreiben lässt, denn ein solcher Ansatz ist erlaubt, weil er die Wirkung
invariant lässt: S[q] = S[q0 ], entsprechend der Forderung einer Symmetrietransformation.
Andererseits liefert die Kettenregel für die Variation von L unter Variationen {δqi (t)}, {δ q̇i (t)}
ihrer Argumente die Gleichung
s s X
X
∂L
∂L
∂L
∂L
δL =
δqi +
δ q̇i = ε
Qi +
Q̇i ,
∂qi
∂ q̇i
∂qi
∂ q̇i
i=1
i=1
wobei in der zweiten Gleichung die aus den Transformationen (II.32), (II.34) folgenden Variationen
δqi , δ q̇i benutzt wurden. Die Euler–Lagrange-Gleichungen (II.9) und eine wiederholte Anwendung
der („inversen“) Kettenregel geben dann
s
s X
X
∂L
d ∂L
d ∂L
Qi +
Q̇i = ε
Qi ,
δL = ε
dt ∂ q̇i
∂ q̇i
dt ∂ q̇i
i=1
i=1
d.h. noch
!
s
d X ∂L
δL = ε
Qi .
dt
∂ q̇i
(II.36)
i=1
Subtrahiert man schließlich Gl. (II.35) von Gl. (II.36), so ergibt sich
s
ε
X ∂L
dQ
= 0 mit Q ≡
Qi − f.
dt
∂ q̇i
(II.37)
i=1
Da die linke Gleichung für jede infinitesimale Transformation, d.h. für ein beliebiges ε, gilt, muss
die hier definierte Noether-Ladung Q eine Konstante der Bewegung sein.
2
Beispiel 1: Räumliche Translation
Sei qj eine zyklische Koordinate (vgl. § II.3.1 b). Die Lagrange-Funktion des Systems ist dann
invariant unter Translationen qj → qj0 = qj + a dieser Koordinate, wobei a = ε für eine infinitesimale
Transformation. Für die anderen Koordinaten qi mit i 6= j betrachten wir die Identitätstransformation qi → qi0 = qi .
Identifiziert man diese Transformationen mit Gl. (II.32), so ist der Generator in diesem Fall
einfach Qi = δij , woraus nach Ableitung Q̇i = 0 folgt. Wegen der angenommenen Zyklizität der
Koordinate ist die Lagrange-Funktion L invariant unter einer (infinitesimalen) Transformation, d.h.
f = 0 in Gl. (II.35).
Laut Gl. (II.37) lautet die zugehörige Erhaltungsgröße
s
X
∂L
Q=
δij = pj ,
∂ q̇i
i=1
68
Lagrange-Formalismus: Grundlagen
d.h. wir finden noch einmal, dass die Invarianz unter räumlichen Transformationen die Erhaltung
des Impulses impliziert.
Beispiel 2: Zeitliche Translation
Als zweites Beispiel betrachten wir ein System, dessen Wirkung invariant unter den gleichzeitigen
Transformationen
t → t0 = t + a , qi → qi0 (t0 ) = qi (t0 )
ist. Dank Taylor-Entwicklung gilt qi0 (t0 ) = qi (t + ε) = qi + εq̇i + O(ε2 ), so dass die Generatoren der
(infintesimalen) Transformationen [Gl. (II.32)] durch Qi = q̇i gegeben sind.
Da t0 = t + ε gibt eine zweite Taylor-Entwicklung
dL t, q(t), q̇(t)
0
0
0
δL = L t , q (t), q̇ (t) − L t, q(t), q̇(t) = ε
+ O(ε2 ),
dt
d.h. f = L in Gl. (II.36). Insgesamt ist die erhaltene Noether-Ladung gegeben durch
s
X
∂L
Q=
δij q̇i − L = E.
∂ q̇i
i=1
Somit wird das Ergebnis des § II.3.1 a wieder gefunden.
Literatur zum Kapitel II
• Arnold, Mathematical methods of classical mechanics [1] Teil II.
• Feynman, Vorlesungen über Physik. Band 2 [20] = Lectures on Physics. Vol. II [21], Kap. 19.
• Fließbach, Mechanik [2] Teil II, Kap. 7–10 & Teil III, Kap. 12–14.
• Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 1.3–1.6, 2.1–2.3 & 2.5.
• Greiner, Klassische Mechanik II [7] Kap. V.
• Landau & Lifschitz, Mechanik [13], Kap. I.
• Nolting, Analytische Mechanik [16] Kap. 1.
• Scheck, Mechanik [18] Kap. 2.1–2.10.
K APITEL III
Lagrange-Formalismus: Anwendungen
In diesem Kapitel werden einige längeren Anwendungen des in Kap II vorgestellten LagrangeFormalismus diskutiert.
III.1 Starre Körper
Ein physikalischer Festkörper ist ein System aus vielen Atomen — für ein Stück auf menschlicher
Skala, etwa 1023 –1026 Atomen. Dementsprechend ist die Beschreibung als ein Mehrteilchensystem
wie in Abschn. I.5 unrealistisch. Stattdessen werden idealisierte Modelle des Festkörpers benutzt.
Eines davon ist das Modell eines starren Körpers. Dabei handelt es sich um ein System aus
(vielen) Massenpunkten ma mit konstanten Abständen zueinander. Diese Zwangsbedingungen über
die Abstände folgen aus inneren Kräften. Dank den letzteren bleibt die Anzahl der eigentlichen
Freiheitsgrade trotz der hohen Teilchenzahl immer klein im Modell (§ III.1.1). Für die Beschreibung
der globalen Bewegung des Körpers ist eine Kenntnis der inneren Zwangskräfte nicht nötig. Deshalb eignet sich die Lagrange’sche Vorgehensweise besser als der Newton’sche Formalismus, um die
Bewegungsgleichungen für den starren Körper herzuleiten (§ III.1.2).
In der Idealisierung eines starren Körpers ist das System definitionsgemäß nicht deformierbar.
Dementsprechend können im Rahmen des Modells Eigenschaften wie Elastizität, Plastizität. . . nicht
untersucht werden. Für solche Phänomene würde man den Körper eher als ein verformbares Kontinuum beschreiben. Dieser Kontinuum-Limes ist auch günstiger als die Beschreibung als eine Menge
von diskreten punktförmigen Teilchen, um einige Größen zu berechnen, die in der Bewegung von
Relevanz sind. Deshalb wird der Limes auch diskutiert.
III.1.1 Beschreibung des starren Körpers
III.1.1
a Anzahl der Freiheitsgrade
::::::::::::::::::::::::::::::::::
Das Modell des starren Körpers reduziert die a priori große (3N ) Anzahl der Freiheitsgrade
eines N -Teilchen-Systems zu einer kleinen Anzahl, und zwar meistens nur 6 für die Fälle, wo die
Vereinfachung von Nutze ist.
Im Fall von zwei Massenpunkten 1 und 2 mit der Zwangsbedingung eines zeitlich konstanten
Abstands |~x2 (t) − ~x1 (t)| besitzt das System insgesamt s = 3N − 1 = 5 Freiheitsgrade. Diese können
z.B. die drei Koordinaten des Schwerpunkts und zwei Winkel für die Orientierung des Verbindungsvektors zwischen 1 und 2 sein.
Falls es drei Massenpunkte 1, 2 und 3 mit drei entsprechenden Zwangsbedingungen über die
Abstände |~x2 (t) − ~x1 (t)|, |~x3 (t) − ~x1 (t)| und |~x3 (t) − ~x1 (t)| gibt, bleiben nach Berücksichtigung der
letzteren s = 3N − 3 = 6 Freiheitsgrade übrig. Beispielsweise kann man drei Schwerpunktskoordinaten betrachten, zusammen mit drei Winkeln für die Orientierung im Raum der Ebene, in welcher
die drei Massenpunkte liegen.(22)
Addiert man einen vierten Massenpunkt, so ist seine Position durch 3 Zwangsbedingungen
|~x4 (t)−~x1 (t)|, |~x4 (t)−~x2 (t)| und |~x4 (t)−~x3 (t)| völlig bestimmt — bis auf einer Spiegelung bezüglich
(22)
... im allgemeinen Fall, wo die drei Punkte nicht auf einer Gerade sitzen.
70
Lagrange-Formalismus: Anwendungen
der durch die drei ersten Punkte definierten Ebene. Somit gibt es immer noch 6 Freiheitsgrade.
Das gleiche gibt für eine beliebige Anzahl N ≥ 4. Wenn man einen N -ten Massenpunkt zu
N −1 schon anwesenden Punkten addiert, dann bestimmen drei Zwangsbedingungen |~xN (t)−~x1 (t)|,
|~xN (t) − ~x2 (t)| und |~xN (t) − ~x3 (t)| seine Position: die weiteren Abstände sind dadurch automatisch
festgelegt bzw. sind nicht unabhängig davon. Deshalb werden die drei möglichen Freiheitsgrade
dieses zusätzlichen Massenpunkts durch genau drei Bedingungen annulliert, d.h. die Anzahl der
Freiheitsgrade ändert sich nicht, und bleibt gleich 6.
Kontinuumlimes
Dank der Unabhängigkeit der Anzahl von Freiheitsgraden von der Anzahl N von Massenpunkten
für N ≥ 3 kann man problemlos den Limes N → ∞ betrachten, und danach zum Modell eines
Kontinuums übergehen. Im letzteren Fall entspricht der starre Körper einem endlichen kontinuierlichen Volumen, wie z.B. eine Vollkugel, das sich nicht verformen kann. Dementsprechend werden
einige Eigenschaften des Körpers durch (teilweise) stetige Funktionen vom Ort — insbesondere eine
Massendichte ρ(~r) —, die genau da ungleich Null sind, wo der Körper sich befindet.
Um den Grenzfall genauer zu definieren kann man zuerst das nicht-deformierbare kontinuierliche Medium als Zusammensetzung aus endlich vielen (N ) kleinen Massenstücken ma beschreiben,
die sich relativ zu einander nicht bewegen; seien ~xa ihre Ortsvektoren. Ersetzt man die
P Massenstückchen durch Massenpunkte, so hat man einen starren Vielteilchen-Körper. Sei M = a ma die
Gesamtmasse des Körpers.
Im Kontinuumlimes wird die Anzahl der Massenpunkte unendlich groß, N → ∞, und ihre
Massen werden unendlich klein , ma → 0, bei festgehaltener Gesamtmasse M . Im Grenzfall werden
Summen über a, d.h. über alle Massenpunkte, durch Integrale über das durch den Körper besetzte
Volumen V ersetzt. Genauer schreibt man für jede Funktion f der Position
Z
X
ma f ~xa → ρ(t,~r)f (~r) d3~r
(III.1)
V
a
mit ρ der Massendichte.
Bemerkung: Schreibt man
ρ(~r) =
X
ma δ (3) ~r − ~xa
a
δ (3)(
mit
) der 3-dimensionalen Dirac-Distribution,(23) so kann man ein System aus diskreten Massenpunkten in der Sprache des Kontinuumlimes beschreiben.
III.1.1
b Kinematik des starren Körpers
:::::::::::::::::::::::::::::::::::::::
Zur Untersuchung der Bewegung eines starren Körpers ist es sinnvoll, zwei unterschiedliche
Bezugssysteme mit zugehörigen Koordinatensystemen einzuführen. Somit betrachtet man einerseits
ein raumfestes Inertialsystem BI , entsprechend z.B. einem inertialen Beobachter, der die Bewegung
des Körpers misst, ohne sich damit zu bewegen. Ortsvektoren relativ zu diesem System werden
~ a (t) für die Positionen der Massenpunkte des starren
hiernach mit Großbuchstaben bezeichnet, wie X
Körpers.
Andererseits wird auch ein körperfestes Bezugssystem B definiert, das sich zusammen mit dem
starren Körper bewegt. Insbesondere ist B nicht unbedingt Inertial, denn die Bewegung vom Körper
kann beschleunigt sein. In B wird dann ein Koordinatensystem gewählt, insbesondere ein Ursprungs~
punkt O, dessen Position bezüglich BI mit X(t)
bezeichnet wird. In der Praxis wird es günstig sein,
diesen Nullpunkt im Schwerpunkt des starren Körpers zu nehmen, obwohl dies nicht erforderlich
ist. Ortsvektoren relativ zu B werden mit Kleinbuchstaben denotiert, z.B. ~xa für die Positionen der
Massenpunkte des starren Körpers, die definitionsgemäß zeitunabhängig sind.
(23) (3)
δ
(~r) = δ(x)δ(y)δ(z) mit (x, y, z) den kartesischen Koordinaten von ~r.
III.1 Starre Körper
71
Drei der für die Beschreibung des starren Körpers nötigen 6 Freiheitsgrade beschreiben die
Translationsbewegung des Ursprungspunkts O von B relativ zu BI , die drei anderen entsprechen
z.B. den Winkeln der Drehungen, die von den Achsen des Koordinatensystems in BI zu den Koordinatenachsen von B führen (vgl. § III.1.1 c).
Die Position eines Massenpunkts a des starren Körpers bezüglich des Inertialsystems kann jetzt
als
~ a (t) = X(t)
~
X
+ R(t)~xa
(III.2)
geschrieben werden, mit R der zeitabhängigen Drehmatrix, welche die Koordinatenachsen von B in
jene von BI transformiert. Eine Ableitung nach der Zeit gibt für die Geschwindigkeit relativ zu BI
[vgl. Gl. (I.42)]
~˙ a (t) = X(t)
~˙
X
+ R(t) ω
~ (t) × ~xa
(III.3)
˙
mit ω
~ (t) der Winkelgeschwindigkeit der Rotationsbewegung des starren Körpers, wobei ~xa = ~0
benutzt wurde.
III.1.1
c Euler-Winkel
:::::::::::::::::::::
der Vollständigkeit(?) halber....
weniger wichtig / dringend als andere Paragraphen!
III.1.2 Bewegungsgleichungen
III.1.2
a Kinetische Energie
:::::::::::::::::::::::::::
Die kinetische Energie des starren Körpers bezüglich des Inertialsystems BI ist die Summe aus
der kinetischen Energien der individuellen Massenpunkten, d.h.
X ma ˙
~ a (t)2 .
X
T =
2
a
~˙ a (t) substituiert werden
Dabei kann der Ausdruck (III.3) der Geschwindigkeit X
X ma ˙
2
~
T =
X(t)
+ R(t) ω
~ (t) × ~xa .
2
a
Die Berechnung des (Betrags)Quadrats liefert dann
X
X ma 2
1X
~˙
~˙ 2 + X(t)
· R(t) ω
~ (t) ×
ma ~xa +
T =
ma X(t)
R(t) ω
~ (t) × ~xa .
2 a
2
a
a
(III.4)
~˙ 2 umschreiben, entspreDer erste Term lässt sich mithilfe der Gesamtmasse einfach als 12 M X(t)
chend der kinetischen Energie eines Massenpunkts der Masse M , der sich im Ursprungspunkt O des
körperfesten Bezugssystems befindet.
Bei dem zweiten Beitrag handelt es sich um einen Mischterm, der sowohl von der Translationsbewegung des starren Körpers als von seiner Rotationsbewegung abhängt. Dieser Term verschwindet
~˙
in zwei Fällen, und zwar entweder wenn der Nullpunkt O in BIPruht, d.h. falls X(t)
= ~0, oder
~
wenn O genau im Schwerpunkt des starren Körpers liegt, so dass a ma ~xa = 0 gilt. Hiernach wird
meistens angenommen, dass einer dieser beiden Möglichkeit erfüllt ist.
Den dritte Term in Gl. (III.4) lässt sich zuerst vereinfachen, indem man die Invarianz des Skalarprodukts zweier Vektoren, und daher des Betragsquadrats eines Vektors, unter Drehungen benutzt:
X ma 2 1 X
2
=
~ (t) × ~xa .
R(t) ω
~ (t) × ~xa
ma ω
2
2 a
a
Der Betragsquadrat kann noch mithilfe einiger Manipulationen umgeschrieben werden. Führt man
z.B. die kartesischen Koordinaten ω i (t), xia der Vektoren ω
~ (t) und ~xa ein, so gilt
2 k k ω
~ (t) × ~xa = ω
~ (t) × ~xa ω
~ (t) × ~xa = kij ω i (t)xja klm ω l (t)xm
a ,
72
Lagrange-Formalismus: Anwendungen
wobei Summen über k, i, j, l und m von 1 bis 3 nicht geschrieben wurden. Fängt man mit der
Summe über k an, so gibt die Identität kij klm = δ il δ jm − δ im δ jl
2
ω
~ (t) × ~xa = δ il δ jm − δ im δ jl ω i (t)ω l (t)xja xm
a .
Die Summen über l und m liefern dann
h i
2
2
ω
~ (t) × ~xa = ω i (t) ~xa δ ij − xia xja ω j (t),
(III.5)
wobei im ersten Term ω i (t)ω i (t) = ω i (t)δ ij ω j (t) benutzt wurde. Dieses Resultat kann im dritten
Term des Ausdrucks (III.4) der kinetischen Energie eingesetzt werden. Dann lautet dieser dritte
Term 21 ω i (t)I ij ω j (t) mit
I ij ≡
X
h i
2
ma ~xa δ ij − xia xja
für i, j = 1, 2, 3,
(III.6a)
a
wobei die Summe über alle Massenpunkte des starren Körpers läuft. Gemäß des Rezepts (III.1) gilt
im Grenzfall eines kontinuierlichen Körpers
I
ij
Z
≡ ρ(~r) ~r 2 δ ij − xi xj d3~r
für i, j = 1, 2, 3
(III.6b)
mit {xi }i=1,2,3 den Komponenten des Vektors ~r. Der Integrationsbereich ist entweder das durch den
starren Körper besetzte Volumen V , oder kann den ganzen Raum R3 sein, unter der Konvention,
dass ρ(~r) = 0 für ~r außerhalb V .
Alternative Herleitung der Gl. (III.5): Der Betragsquadrat auf der linken Seite kann als Spatprodukt interpretiert werden und in der Form
2
ω
~ × ~xa = ω
~ × ~xa · ω
~ × ~xa = ~xa × ω
~ × ~xa · ω
~ = ~xa · ~xa ω
~ − ~xa · ω
~ ·ω
~
umgeschrieben werden, wobei die Zeitabhängigkeit von ω
~ der Kurze halber nicht geschrieben
wurde. Dies vereinfacht sich noch zu
2
2
ω
~ × ~xa = ~xa2 ω
~ 2 − ~xa · ω
~ ,
was äquivalent zu Gl. (III.5) ist.
2
Insgesamt lautet die kinetische Energie des starren Körpers bezüglich des Inertialsystems BI
1 ~˙ 2 1 i
T = M X(t)
+ ω (t)I ij ω j (t)
2
2
(III.7)
~
mit X(t)
der Position in BI des Schwerpunkts des starren Körpers. Dabei stellt der zweite Beitrag
die Rotationsenergie des Körpers dar.
Im Gegensatz zur Gesamtmasse, deren Wert unabhängig vom Koordinatensystem ist, hängen
die Zahlen I ij von der Wahl des körperfesten Koordinatensystems ab, insbesondere von dessen
Nullpunkt. Wie in § III.1.2 c unten argumentiert wird, sind die I ij die (kartesischen) Komponenten
eines Tensors zweiter Stufe I , der Trägheitstensor genannt wird.
~˙
Bemerkung: Die Form (III.7) gilt auch — mit X(t)
= ~0 — für starren Körper, der einen Punkt
~
besitzt, der sich nicht bewegt, vorausgesetzt X(t) die Position dieses Punkts bezeichnet.
III.1.2 b Bewegungsgleichungen
Entsprechend den 6 Freiheitsgraden eines starren Körpers wählt man als verallgemeinerte Koordinaten für die Beschreibung seiner Bewegung einerseits die 3 Koordinaten X i (t) der Ortsvektors
~
X(t)
seines Schwerpunkts, und andererseits drei Winkel ϕi (t); die letzteren beschreiben Drehun::::::::::::::::::::::::::::::::
73
III.1 Starre Körper
gen des festen Körpers um drei unabhängige Achsen, die bezüglich des Körpers fest bleiben. Die
zugehörigen verallgemeinerten Geschwindigkeiten sind Ẋ i (t) und ϕ̇i (t).
Die Lagrange-Funktion des starren Körpers lautet dann
3
3
MX
2 1 X
L {X i }, {ϕi }, {Ẋ i }, {ϕ̇i } =
Ẋ i +
ϕ̇i I ij ϕ̇j − V {X i }, {ϕi }
2
2
i=1
(III.8)
i,j=1
mit I ij den Komponenten des Trägheitstensors bezüglich der körperfesten Drehachsen entsprechend den drei Winkeln ϕi . Ausgehend von dieser Lagrange-Funktion liefern die Euler–LagrangeGleichungen (II.9) die Bewegungsgleichungen des festen Körpers.
Translationsbewegung des starren Körpers
Betrachten wir zuerst die Bewegungsgleichung für die Koordinaten X i (t). Laut Definition (II.12)
ist der zu X i kanonisch konjugierte Impuls durch
pi ≡
∂L
= M Ẋ i
i
∂ Ẋ
(III.9a)
~˙ Dann lautet
gegeben. Dabei handelt es sich um die i-te Komponente des Gesamtimpulses ~p = M X.
die damit assoziierte Euler–Lagrange-Gleichung
dpi
∂L
∂V
= M Ẍ i =
=−
.
i
dt
∂X
∂X i
(III.9b)
Auf der rechten Seite ist −∂V /∂X i die i-te Komponente der Gesamtkraft auf den starren Körper.
~
Falls X(t)
die Position im Inertialsystem BI des Schwerpunkts ist, entspricht Gl. (III.9b) dem
üblichen Schwerpunktsatz (I.60) für ein Mehrteilchensystem.
Rotationsbewegung des starren Körpers
Benutzt man die auf Gl. (III.6) offensichtlich Symmetrie I ij = I ji für jedes mögliches Paar (i, j),
so findet man für den zu X i kanonisch konjugierten verallgemeinerten Impuls
3
Li =
X
∂L
=
I ij ϕ̇j .
∂ ϕ̇i
(III.10a)
j=1
Dies ist die i-te Komponente des Eigendrehimpulses des starren Körpers
Die Zeitentwicklung dieses generalisierten Impulses wird durch die Euler–Lagrange-Gleichung
3
∂L
∂V
dLi X ij j
=
I ϕ̈ =
=− i
i
dt
∂ϕ
∂ϕ
(III.10b)
j=1
gegeben, wobei die „verallgemeinerte Kraft“ auf der rechten Seite der Gleichung das Drehmoment
ist.
III.1.2
c Trägheitstensor
::::::::::::::::::::::::
Um zu zeigen, dass die I ij die Komponenten eines Tensors bilden, soll man ihr Verhalten unter Drehungen untersuchen. Sei R eine Drehmatrix. Unter ihrer Wirkung transformieren sich die
Komponenten eines Ortsvektors bezüglich B gemäß
0
0
xi → xi = R i i xi .
0
0
0
0
Dementsprechend transformiert sich das Produkt xi xj in xi xj = R jj R ii xi xj . Andererseits gilt
0
0
0
0
0
0
0 0
R ii R jj δ ij = R ii δ ij (R T )jj = R ii (R T )ij = δ i j ,
74
Lagrange-Formalismus: Anwendungen
wobei R T die zu R transponierte Matrix bezeichnet, die gleichzeitig die inverse Drehmatrix R −1
ist, wie in der letzten Gleichung benutzt wurde. Somit transformieren sich beide Terme mit Indizes
in der Definition (III.6) der I ij gleich unter Drehungen, und zwar derart, dass I ij sich insgesamt
gemäß
0
0
0 0
0
0
I ij → I i j = R ii R jj I ij = R ii (R T )jj I ij
(III.11)
transformiert, d.h. wie die Komponenten eines Tensors zweiter Stufe.
Identifiziert man der Tensor I mit einer 3 × 3-Matrix, die ebenfalls mit I bezeichnet wird, so
kann die letzte Gleichung noch in Matrixform als
I → I0 = R I R T
(III.12)
geschrieben werden. Gleichermaßen gilt für die Rotationsenergie in Gl. (III.7)
1 i
1
ω (t)I ij ω j (t) = ω
~ (t)T I ω
~ (t)
2
2
(III.13)
mit ω
~ (t)T dem zu ω
~ (t) transponierten Zeilenvektor, und für den Eigendrehimpuls (III.10a)
~ =Iω
L
~
(III.14)
mit ω
~ =ϕ
~˙ der Winkelgeschwindigkeit.
Entsprechend der tensoriellen Natur von I können Rotationsenergie und Drehimpuls noch in
„geometrischer“ Form geschrieben werden:
1
1 i
ω (t)I ij ω j (t) = ω
~ (t) · I · ω
~ (t),
2
2
wobei · die Kontraktion zweier Tensoren bezeichnet.
~ = I·ω
L
~
Trägheitsmoment
Sei ~e der Einheitsvektor entlang einer beliebigen Richtung. Das Trägheitsmoment des starren
Körpers bezüglich der (Dreh)Achse parallel zu dieser Richtung, die durch den Ursprungspunkt des
körperfesten Bezugssystem geht, wird durch
I = ei I ij ej = ~eT I ~e = ~e · I · ~e
(III.15)
definiert, wobei {ei }i=1,2,3 die Koordinaten von ~e bezeichnen. Beispielsweise ist das relevante Trägheitsmoment für eine Rotationsbewegung um eine Achse in Richtung des Basisvektors ~e3 einfach
die Komponente I 33 = ~eT
e3 . Dabei gilt
3 I~
h i X
h X
2 i
2
2
I 33 =
ma ~xa δ 33 − x3a x3a =
ma x1a + x2a
a
a
d.h. unter Einführung der Projektion ~xa,⊥ von ~xa auf der (x1 , x2 )-Ebene orthogonal zur Drehachse
I 33 =
X
ma ~xa,⊥
2
(III.16a)
a
2
mit ~xa,⊥ dem Quadrat des Abstands des Massenpunkts a von der Drehachse. Im Kontinuumlimes
wird dieses Trägheitsmoment zu
Z
33
I = ρ(~r)~r⊥2 d3~r.
(III.16b)
Für eine Rotationsbewegung mit Winkelgeschwindigkeit ω
~ = ω~e3 um diese Richtung ist die
Rotationsenergie T = 12 I 33 ω
~ 2 . Da I 33 automatisch positiv ist, gilt das auch für diese kinetische
Energie.
III.1 Starre Körper
75
Beispiel: homogener Zylinder
x3
Sei ein homogener Vollzylinder mit Massendichte ρ, Radius R und
Höhe h. Dementsprechend ist seine Gesamtmasse M = πR2 hρ.
Der Zylinder dreht sich um seine eigene Achse, welche die Richtung x3
h
definiert.
3
In Zylinderkoordinaten (r, ϕ, z ≡ x ) ist der Abstand eines Punkts
R
von der Drehachse genau gleich der Radialkoordinate r. Somit lautet
das durch Gl. (III.16b) gegebene Trägheitsmoment des Zylinders um
Abbildung III.1
diese Achse
Z h Z 2πZ R
4
2
πR h
MR
ρ r2 r dr dϕ dz = ρ
I 33 =
=
,
(III.17)
2
2
0
0
0
wobei das letztere Ergebnis auch im Grenzfall einer unendlich dünnen Scheibe h → 0 gilt.
Eigenschaften des Trägheitstensors
Wie schon erwähnt wurde ist der Trägheitstensor ein symmetrischer Tensor, d.h. T ij = T ji für
alle i, j = 1, 2, 3. Dies bedeutet zuerst, dass nur 6 seiner Komponenten unabhängig voneinander
sind.
Ähnlich einer symmetrischen reellwertigen Matrix ist ein symmetrischer reellwertiger Tensor
zweiter Stufe diagonalisierbar. Das heißt, man kann eine Orthonormalbasis {~e1̄ ,~e2̄ ,~e3̄ } finden, in
welcher der Tensor, oder genauer seine Matrixdarstellung, die Diagonalform


I1 0 0
I =  0 I2 0 
(III.18)
0 0 I3
annimmt, mit I1 , I2 , I3 den Eigenwerten der Matrix, die wie oben schon bemerkt alle positiv sind.
Diese Eigenwerte werden Hauptträgheitsmomente des starren Körpers genannt, während die zugehörigen Eigenvektoren {~eı̄ }ı̄=1̄,2̄,3̄ Einheitsvektoren entlang der Hauptträgheitsachsen sind.
Im Hauptachsensystem — d.h. im Koordinatensystem, dessen Achsen die Hauptträgheitsachsen
des starren Körpers sind — nimmt die Rotationsenergie des Körpers die einfache Form
2
2
2 i
1h
T = I1 ω 1̄ + I2 ω 2̄ + I3 ω 3̄
2
an.
Besitzt ein starrer Körper Symmetrien, wie z.B. Invarianz unter der Spiegelung bezüglich einer
Ebene oder Rotationssymmetrie, so sind die entsprechenden Symmetrieelemente, insbesondere Symmetrieachsen, einfach mit den Hauptträgheitsachsen verknüpft. Um dieses Ergebnis zu illustrieren,
betrachten wir die nichtdiagonale Elemente des Trägheitstensors, z.B. I 12 . Die Definition (III.6b)
gibt
Z
Z
3
2 12
12
1 2
I = ρ(~r) ~r δ − x x d ~r = ρ(x1, x2, x3 )(−x1 x2 ) dx1 dx2 dx3
Z
1
ρ(x1, x2, x3 )(−x1 x2 − x1 x2 ) dx1 dx2 dx3 .
=
2
Wie unter Gl. (III.6b) schon diskutiert wurde, kann der Integrationsbereich mit einer geeigneten
Definition von ρ auf R3 erweitert werden, was wir hier annehmen. Führt man die Substitution
x1 → y ≡ −x1 für den zweiten Summanden in den Klammern, so ergibt sich
Z
Z
1 2 3 1 2 1 2 3
1
12
2 3
2
2
3
I =
− ρ(x , x , x )x x dx dx dx − ρ(−y, x , x )(−y)x dy dx dx
2
Z
1 =
−ρ(x1, x2, x3 ) + ρ(−x1, x2, x3 ) x1 x2 dx1 dx2 dx3 ,
2
76
Lagrange-Formalismus: Anwendungen
wobei die Integrationsvariable y des zweiten Terms x1 in der zweiten Zeile umbenannt wurde.
Falls der starre Körper symmetrisch unter Spiegelungen bezüglich der Ebene x1 = 0 ist, so dass
ρ(−x1 , x2 , x3 ) = ρ(x1 , x2 , x3 ) für alle Werte von x2 , x3 , dann ist I 12 = 0.
Allgemeiner findet man, dass die Symmetrieachsen des starren Körpers, falls einige vorhanden sind,
auch seine Hauptträgheitsachsen sind.
Klassifikation von Trägheitstensoren
Je nach den Werten der Hauptträgheitsmomente lassen sich drei verschiedene Fälle unterscheiden:
• Für I1 6= I2 6= I3 6= I1 sind die Eigenvektoren {~e1̄ ,~e2̄ ,~e3̄ } und somit die Hauptträgheitsachsen
eindeutig(24) definiert. Dann spricht man um einen „unsymmetrischen Kreisel“.
Ein einfaches Beispiel ist ein homogener Quader, dessen Seiten unterschiedliche Längen a 6=
b 6= c 6= a haben: die Symmetrieachsen des Quaders sind seine Hauptträgheitsachsen, die
zugehörigen Trägheitsmomente sind unterschiedlich.
• Für I1 = I2 6= I3 ist der Eigenvektor ~e3̄ bzw. die entsprechende Hauptachse eindeutig definiert.
Dagegen gibt es Entartung in der (x1, x2 )-Ebene, in welcher jedes Paar von orthogonalen
Achsen als Hauptträgheitsachsen betrachtet werden kann. Dies entspricht dem Modell des
symmetrischen Kreisels.
Beispiele sind ein eindimensionaler Stab parallel zur 3-Richtung: x1 = x2 = 0 geben sofort
I 33 = 0 und I 11 = I 22 6= 0; oder ein homogener Zylinder (im allgemeinen Fall), insbesondere
eine zweidimensionale Scheibe in der Ebene x3 = 0, für die man einfach I 11 = I 22 = 21 I 33
nachprüft.
• Für I1 = I2 = I3 sind die Achsen jedes Koordinatensystems Hauptträgheitsachsen, entsprechend einem Kugelkreisel .
Dies ist z.B. der triviale Fall des Trägheitstensors einer homogenen Kugel um drei Achsen, die
durch ihren Schwerpunkt verläuft. Falls der Radius der Kugel verschwindet, d.h. die Kugel
wird zu einem Punkt, ist I = 0 .
Offensichtlich sind die (Haupt)Trägheitsmomente eines homogenen Würfels um seine drei Symmetrieachsen auch gleich, und damit gilt es noch für die Momente um jedes Triplett von
Achsen, die durch seinen Schwerpunkt gehen.
Während die Unabhängigkeit des Trägheitsmoments von der Richtung einer durch den
Schwerpunkt durchlaufenden Drehachse intuitiv im Fall der Kugel ist, wirkt sie bei dem
Würfel überraschend. Dabei ist unsere(25) Intuition falsch, denn wir stellen uns die ganzen
Massenverteilungen ρ(~r) vor — die offensichtlich unterschiedlich für eine Kugel und einen
Würfel sind —, während das Trägheitsmoment bzw. der Trägheitstensor nur einem sehr
geringen Anteil der in dieser Massenverteilungen enthaltenen Information entspricht. Für
die Rotationsbewegung der Körper reicht aber diese Information aus.
Steiner’scher Satz
Trägheitsmomente um die Symmetrieachsen eines starren Körpers sind meistens einfacher zu
berechnen, entsprechend dem Fall, wo der Ursprungspunkt des Koordinatensystems in der Definition (III.6) im Schwerpunkt des Körpers liegt. Oft dreht sich der starre Körper aber um eine Achse,
die nicht durch seinen Schwerpunkt durchläuft. Anstatt das Trägheitsmoment um die verschobene
Drehachse explizit aus Definition (III.6) zu berechnen, ist es dann einfacher, das folgende Resultat
zu benutzen.
(24)
(25)
... bis auf einem Minus Zeichen für die Einheitseigenvektoren.
... oder zumindest die des Autors!
77
III.1 Starre Körper
Theorem (Satz von Steiner(p) ):
Das Trägheitsmoment eines starren Körpers mit Masse M um eine beliebige
Achse im Abstand L von seinem Schwerpunkt ist gegeben durch die Summe
aus M L2 und dem Trägheitsmoment des Körpers um die parallele Drehachse,
die durch den Schwerpunkt geht.
(III.19a)
Bezeichnet man mit I bzw. I 0 das Drehmoment um eine durch den Schwerpunkt durchlaufende Drehachse bzw. um eine dazu parallele Achse im Abstand L vom Schwerpunkt, so lautet der
Steiner’sche Satz
I 0 = I + M L2 .
(III.19b)
Zum Beweis dieses Satzes betrachte man neben dem körperfesten Bezugssystem B mit Ursprung
im Schwerpunkt des starren Körpers ein zweites körperfestes Bezugssystem B 0 , dessen Nullpunkt
um ~b relativ zu B verschoben ist, während die Koordinatenachsen von B 0 parallel zu denen von
B bleiben. Dann gilt für die Position jedes (Massen)Punkts des starren Körpers relativ zu beiden
Bezugssystemen ~xa0 = ~xa − ~b. Dies gibt für den Trägheitstensor relativ zu B 0
h i X
h
i
X
2
2
I 0 ij =
ma ~xa0 δ ij − x0ia x0j
ma ~xa − ~b δ ij − (xia − bi )(xja − bj )
a =
a
ij
a
ij ~
= I − 2δ b ·
X
i
ma ~xa + b
a
X
ma xja + bj
a
X
ma xia +
a
X
ma ~b 2 δ ij − bi bj .
a
Dabei verschwinden der zweite, der dritte und der vierte Beiträge der zweiten Zeile, während die
Summe der Massen im fünften Term durch die Gesamtmasse ersetzt werden kann. Somit ergibt sich
die tensorielle Form des Steiner’schen Satzes:
I 0 ij = I ij + M ~b 2 δ ij − bi bj .
(III.19c)
Um das Drehmoment um eine gegebene Achse zu erhalten, multipliziert man diese Gleichung mit den
Komponenten des Einheitsvektors in Richtung der Achse, vgl. Gl. (III.15), woraus sich Gl. (III.19b)
ergibt.
Beispiel: homogener Zylinder (2)
Wir betrachten nochmals den homogenen Vollzylinder (Masse M ,
Radius R) der Abb. (III.1), der sich jetzt um eine Achse drehen soll,
die parallel zu seiner Symmetrieachse ist, um den Abstand L aber
verschoben ist.
Dann ist gemäß dem Steiner’schen Satz (III.19) das Trägheitsmoment
des Zylinders um diese Achse
I 0 33 = I 33 + M L2 =
M R2
+ M L2 ,
2
x3
x03
L
h
R
Abbildung III.2
wobei der Ausdruck (III.17) des Trägheitsmoments um die Symmetrieachse benutzt wurde.
(p)
J. Steiner, 1796–1863
78
Lagrange-Formalismus: Anwendungen
III.2 Kleine Schwingungen
In der Physik, oder in der mathematischen Modellierung eines physikalischen Systems, kommt oft
das folgende Problem vor.
Gegeben ein mechanisches System, beschrieben durch eine LagrangeFunktion L t, q(t), q̇(t) , ist die Lösung der entsprechenden Bewegungsgleichungen für bestimmte
Anfangsbedingungen bekannt. Sei q0 (t) diese Lösung. Das System — in der Praxis entweder das
gleiche oder eine Kopie davon, wobei alle relevanten Bedingungen gleich bleiben — wird irgendwie
leicht „gestört“, entsprechend z.B. einer kleiner Änderung der Anfangsbedingungen. Die Frage ist
dann, was ist die neue Lösung q(t) der Bewegungsgleichungen für das gestörte System?
Intuitiv kann man sich vorstellen, dass in manchen Fällen q(t) „in der Nähe“ (26) der ungestörten
Lösung q0 (t) bleibt. Andererseits kann eine kleine Störung auch manchmal zu einer großen Änderung
führen, wie z.B. wenn eine Kugel auf dem schmalen Gipfel eines Hügels ein wenig verschoben ist,
und damit anfängt, hinabzurollen.
Dieser Abschnitt befasst sich mit diesem Problem der kleinen Auslenkungen aus einer Bezugslösung, erstens für ein System mit einem einzigen Freiheitsgrad (§ III.2.1), dann für Systeme mit
mehreren Freiheitsgraden (§ III.2.2). Dabei werden die beiden oben diskutierten Verhalten gefunden.
Im letzteren Fall mit s > 1 Freiheitsgraden wird auch gezeigt, dass auch wenn diese unter einander
gekoppelt sind, jedoch kann man immer s Linearkombinationen ihrer kleinen Variationen finden,
die sich unabhängig von einander bewegen.
Der Einfachheit halber beschränken sich die Diskussionen auf zeitunabhängige Systeme mit
konservativen Kräften — der Fall mit dissipativen Kräften, die sich im Rahmen des LagrangeFormalismus nicht natürlich behandeln lassen, wird in § III.2.3 kurz erwähnt. Darüber hinaus wird
angenommen, dass die Referenzlösung eine „Gleichgewichtslösung“ der Euler–Lagrange-Gleichungen
darstellt, d.h. sie ist stationär (q0 ist zeitunabhängig), woraus sofort q̇0 (t) = 0 folgt.
III.2.1 Eindimensionales Problem
Wir betrachten zuerst ein physikalisches System mit einem einzigen Freiheitsgrad q(t). Dies kann
z.B. die eindimensionale Bewegung eines Massenpunkts sein, oder die mehrdimensionale Bewegung
mit genug Zwangsbedingungen damit am Ende nur s = 1 Freiheitsgrad übrig bleibt.
Wie in der Einleitung angekündigt wurde, ist das System zeitunabhängig, d.h. seine LagrangeFunktion L hängt nicht von der Zeit ab. Für diese wird die Form
f q(t)
L q(t), q̇(t) =
q̇(t)2 − V q(t)
(III.20)
2
angenommen, mit einer kinetischen Energie die quadratisch von der generalisierten Geschwindigkeit
abhängt. Dabei sind f und V genug reguläre Funktionen einer Variable.
Sei q0 eine stationäre Lösung der assoziierten Euler–Lagrange-Gleichung, d.h. q̇0 (t) = 0. Damit
q0 wirklich eine Gleichgewichtslösung ist, soll das Potential hat ein Extremum bei q0 haben
V 0 (q0 ) = 0,
(III.21)
entsprechend einer verschwindenden generalisierten Kraft. Hier und danach bezeichnet der Strich
die Ableitung nach der verallgemeinerten Kraft.
Die Euler–Lagrange-Gleichung (II.9) lautet hier
f 0 q(t)
f q(t) q̈(t) + f q(t) q̇(t) =
q̇(t)2 − V 0 q(t) ,
2
0
2
so dass q̇0 (t) = 0 und damit q̈0 (t) = 0 automatisch zur Bedingung (III.21) führen.
(26)
Um diese qualitative Redensart mehr quantitativ auszudrücken, sollte man einen Abstand in einem Funktionenraum einführen, was hier nicht gemacht wird.
79
III.2 Kleine Schwingungen
Wir betrachten nun eine kleine, zeitabhängige Variation der generalisierten Koordinate um den
Gleichgewichtswert
q(t) = q0 + δq(t),
(III.22)
wobei δq(t) „klein“ sein soll, d.h. höhere Potenzen [δq(t)]n sollen viel kleiner als die niedrigeren
Ordnungen sein. Die Zeitableitung δ q̇(t) wird als kleine Größe der gleichen Ordnung wie δq(t)
betrachtet.
Die Taylor-Entwicklung der Lagrange-Funktion (III.20) zur zweiten Ordnung in δq, δ q̇ lautet
f (q0 )
V 00 (q0 )
L q(t), q̇(t) =
[δ q̇(t)]2 − V (q0 ) − V 0 (q0 )δq(t) −
[δq(t)]2 + O [δq(t)]3 ,
2
2
wobei im ersten
Term auf der rechten Seite die höheren Terme in der Taylor-Entwicklung von
f q0 +δq(t) nicht beitragen, weil [δ q̇(t)]2 schon zweiter Ordnung ist. Dank der Bedingung (III.21)
verschwindet der dritte Term, während der zweite konstant ist, und daher zu den Bewegungsgleichungen nicht beiträgt. Somit bleibt
f (q0 )
V 00 (q0 )
L q(t), q̇(t) '
[δ q̇(t)]2 −
[δq(t)]2 − V (q0 ),
2
2
(III.23)
d.h. die Lagrange-Funktion ist quadratisch in der verallgemeinerten Koordinate und der zugehörigen
Geschwindigkeit, ohne Mischterm.
Die Erklärung „δq(t) soll klein sein“ ist in der Tat sehr schlampig: da q(t), und somit δq(t),
im Allgemeinen eine physikalische Dimension besitzen kann, hängt sein Zahlenwert von der
gewählten Einheit ab, so dass δq(t) nicht „klein“ sein kann, sondern nur klein gegenüber einem
Referenzwert.
Ein mathematisch mehr präziser Weg von Gl. (III.22) nach Gl. (III.23) lautet wie folgt. Sei
q1 (t) beliebig und δq(t) ≡ εq
1 (t), wobei |ε| 1 ist; dann gilt δ q̇(t) = εq̇1 (t). Betrachtet man
L q0 (t)+εq1 (t), q̇0 (t)+εq̇1 (t) als eine Funktion von ε, so kann man ihre Taylor-Entwicklung um
ε = 0 schreiben. Zur Ordnung ε2 gilt
f (q0 )
V 00 (q0 )
[εq̇1 (t)]2 − V (q0 ) − V 0 (q0 )εq1 (t) −
[εq1 (t)]2 .
L q0 (t)+εq1 (t), q̇0 (t)+εq̇1 (t) ∼
2
2
Mit εq1 (t) = δq(t) und εq̇1 (t) = δ q̇(t) ist dies genau Gl. (III.23).
Ausgehend von der Lagrange-Funktion (III.23) und unter Verwendung von ∂/∂q = ∂/∂(δq)
und ∂/∂ q̇ = ∂/∂(δ q̇) lauten die partiellen Ableitungen auf beiden Seiten der Euler–LagrangeGleichung (II.9)
∂L
∂L
= −V 00 (q0 )δq(t),
= f (q0 )δ q̇(t).
∂q
∂ q̇
Nach einer Zeitableitung des letzteren Terms lautet die Bewegungsgleichung schließlich
δ q̈(t) = −
V 00 (q0 )
δq(t).
f (q0 )
(III.24)
Je nach dem Zahlenwert des konstanten Verhältnisses V 00 (q0 )/f (q0 ) > 0 — oder eigentlich von
V
0 ), weil f (q0 ) in physikalischen Problemen immer nicht-negativ ist, wie hiernach angenommen
wird — lassen sich drei Fälle unterscheiden.
00 (q
• Für V 00 (q0 ) > 0 kann man ω 2 ≡ V 00 (q0 )/f (q0 ) definieren. Dann ist Gl. (III.24) die Bewegungsgleichung eines harmonischen Oszillators mit Kreisfrequenz ω.
Die allgemeine Lösung der Gleichung
δq(t) = A cos(ωt) + B sin(ωt)
mit Konstanten A und B, die von den Anfangsbedingungen abhängen, bleibt begrenzt: das
System führt kleine Schwingungen um die Gleichgewichtslage q0 durch, die somit stabil ist.
80
Lagrange-Formalismus: Anwendungen
• Für V 00 (q0 ) < 0 kann man κ2 ≡ −V 00 (q0 )/f (q0 ) einführen. Dann ist die allgemeine Lösung der
Bewegungsgleichung
δq(t) = Aeκt + Be−κt .
Einer der beiden Terme — der erste falls κ > 0 ist — wächst exponentiell schnell mit der Zeit
und ist daher unbegrenzt, d.h. bleibt nicht in der Nähe der Gleichgewichtslösung, die instabil
ist.
Wegen des Wachstums wird δq(t) nicht mehr „klein“, so dass die Näherungen, die zur
Bewegungsgleichung führen, nicht mehr gelten. Anstatt unendlich zu wachsen, wird wahrscheinlich eine andere (Gleichgewichts)Lösung in endlichem Abstand von q0 gefunden.
• Für V 00 (q0 ) = 0 führt die approximative Bewegungsgleichung (III.24) zu einer Bewegung mit
konstanter Geschwindigkeit, d.h. wieder unbegrenzt. Jedoch die höheren Terme in der TaylorEntwicklung könnten dieses Verhalten ändern.
81
III.2 Kleine Schwingungen
III.2.2 Multidimensionales Problem
Sei jetzt ein physikalisches System mit s > 1 Freiheitsgraden, denen verallgemeinerte Koordinaten q1 (t), . . . , qs (t) — kollektiv mit q(t) bezeichnet — zugeordnet sind. Für die Lagrange-Funktion
wird die Form
s
1X
L q(t), q̇(t) =
fab q(t) q̇a (t) q̇b (t) − V q(t)
(III.25)
2
a,b=1
angenommen, wobei fab symmetrisch unter dem Austausch von a und b ist.
Falls fab nicht symmetrisch ist, trägt eigentlich nur der symmetrische Anteil 21 (fab + fba ) zur
kinetischen Energie bei, während der antisymmetrische Anteil 21 (fab − fba ) sich in der Summe
über alle Werte von a und b kürzt.
Sei q0 = {q0,a }a=1,...,s eine Gleichgewichtslösung. Dann hat das Potential V automatisch ein
Extremum bei q0 , d.h.
∂V q(t) = 0,
(III.26)
∂qa q0
so dass die verallgemeinerte Kraft für die Gleichgewichtslösung Null ist.
Betrachtet man jetzt eine kleine Variation
qa (t) = q0,a + δqa (t)
(III.27)
der Trajektorie — im abstrakten s-dimensionalen Raum aufgespannt durch die verallgemeinerten
Koordinaten —, so gibt eine Taylor-Entwicklung der Lagrange-Funktion bis zur zweiten Ordnung
in den δqa und δ q̇a
s
1X
L q(t), q̇(t) =
fab q0 δ q̇a (t)δ q̇b (t)
2
a,b=1
s
s
X
X
∂V q(t) 1 ∂ 2 V q(t) − V (q0 ) −
δqa (t)δqb (t).
δqa (t) −
∂qa q0
2 ∂qa ∂qb q0
a=1
a,b=1
Unter Verwendung der Bedingungen (III.26) und nach Einführung der kurzen Notationen
∂ 2 V q(t) (III.28a)
mab ≡ fab q0 ,
kab ≡
∂qa ∂qb q0
bleibt
s
s
X
X
mab
kab
L q(t), q̇(t) '
δ q̇a (t)δ q̇b (t) −
δqa (t)δqb (t) − V (q0 ).
2
2
a,b=1
(III.28b)
a,b=1
Wie in § III.2.1 ist die Lagrange-Funktion quadratisch in den verallgemeinerten Koordinaten und den
zugehörigen Geschwindigkeiten ohne Mischterm zwischen den beiden. Dafür sind die verschiedenen
Koordinaten miteinander gekoppelt und das gleiche gilt für die Geschwindigkeiten.
Die Lagrange-Funktion (III.28b) kann noch in Matrixschreibweise geschrieben werden. Sei m
bzw. k die quadratische s×s-Matrix mit Elementen mab bzw. kab . Beide Matrizen sind symmetrisch,
d.h. m = mT und k = kT : einerseits wurde oben schon erwähnt, dass die fab symmetrisch sind, woraus
die Symmetrie von m folgt. Andererseits sind die kab die zweiten Ableitungen einer Funktion — die
wir implizit als mindestens zweimal kontinuierlich differenzierbar annehmen —, und somit auch
symmetrisch.
Sieht man dann q(t) und q̇(t) als s-dimensionale Spaltenvektoren, und dementsprechend δq(t)T
und δ q̇(t)T als Zeilenvektoren, so lässt sich Gl. (III.28b) in der Form
L q(t), q̇(t) ' δ q̇(t)T m δ q̇(t) + δq(t)T k δq(t) − V (q0 )
(III.28c)
schreiben.
82
Lagrange-Formalismus: Anwendungen
Als symmetrische reelle Matrizen sind m und k diagonalisierbar. Im Folgenden wird gezeigt, dass
sie eigentlich gleichzeitig diagonalisierbar sind, auf Kosten einer geeigneten Wahl von verallgemeinerten Koordinaten.
Zunächst kann man die Matrix m diagonalisieren: da m symmetrisch ist, existieren eine Drehmatrix R und eine diagonale Matrix


m1 0 . . . . . . . . . 0
..
 0 m2 0
···
. 
 ..
.. 
.. ..
..

.
.
.
. 
mD ≡  ..
 ≡ diag(m1 , . . . , ms )
 .. · · · 0 ms−1 0 
0 ........
0
ms
derart, dass sie
mD = R m R T
erfüllen. Da R eine Drehmatrix ist, gilt für seine Inverse R −1 = R T , und man hat äquivalent
m = R T mD R,
so dass nach Einsetzen in Gl. (III.28c)
1
1
L q(t), q̇(t) = δ q̇(t)T R T mD R δ q̇(t) + δq(t)T k δq(t)
2
2
Sei δq0 (t) ≡ R δq(t), entsprechend einer Drehung im Raum der verallgemeinerten Koordinaten. Da
die Matrix m, wie ihre Elemente, nicht von der Zeit abhängt, ist es auch der Fall der Drehmatrix
R. Somit gilt δ q̇0 (t) = R δ q̇(t). Dann erhält man für die Lagrange-Funktion in den neuen Variablen
1
1
L δq0 (t), δ q̇0 (t) = δ q̇0 (t)T mD δ q̇0 (t) + δq0 (t)T R k R T δq0 (t).
2
2
Drückt man den kinetischen Term durch die (Zeitableitungen der) Komponenten {δqa0 (t)} aus, die
Linearkombinationen der ursprünglichen verallgemeinerten Koordinaten {δqb (t)} sind, so sieht man
explizit, dass die kinetische Energie jetzt keinen Mischterm enthält:
0
0
L δq (t), δ q̇ (t) =
s
X
ma a=1
2
δ q̇a0 (t)
2
1
+ δq0 (t)T R k R T δq0 (t).
2
Dagegen wird der Potential-Term im Allgemeinen noch nicht-diagonal sein.
Um den letzteren zu diagonalisieren, ohne die Diagonalform der kinetischen Energie zu zerstören, kann man nicht direkt eine Drehung durchführen. Stattdessen soll man neue verallgemeinerte
√
Koordinaten Q0a (t) ≡ ma δqa0 (t) einführen, entsprechend einer Reskalierung der δqa0 (t), wobei der
Skalierungsfaktor unterschiedlich für jede Koordinate ist. Das ist ja möglich, denn die generalisierten
Koordinaten keine „absolute“ Zahlenwerte von Vektorkomponenten sind, sondern Parametrisierungen von Freiheitsgraden.
Führt man die zeitunabhängigen diagonalen Matrizen
√
√
√
√
1/2
−1/2
mD ≡ diag( m1 , . . . , ms ) und mD ≡ diag(1/ m1 , . . . , 1/ ms )
ein, wobei die Exponenten 1/2, −1/2 als eine Notation ohne Bedeutung zu sehen sind, so gelten
1/2
−1/2
Q0 (t) = mD δq0 (t) und δq0 (t) = mD
Q0 (t)
mit Q0 (t) dem Spaltenvektor mit Komponenten {Q0a (t)}. Die Lagrange-Funktion lässt sich dann als
Funktion der {Q0a (t)} und deren Zeitableitungen schreiben
1
1
−1/2
−1/2
L Q0 (t), Q̇0 (t) = Q̇0 (t)T Q̇0 (t) − Q0 (t)T mD R k R T mD Q0 (t).
2
2
83
III.2 Kleine Schwingungen
−1/2
−1/2
Wie sich einfach nachprüfen lässt, ist die Matrix mD R k R T mD
symmetrisch:
−1/2
−1/2 T
−1/2 T
−1/2 T
mD R k R T mD
= mD
R k R T mD
.
Deshalb kann sie diagonalisiert werden, d.h. es existiert eine zeitunabhängige diagonale Matrix
KD ≡ diag(K1 , . . . , Ks ) und eine s-dimensionale Drehmatrix R 0 , die
−1/2
mD
−1/2
R k R T mD
= R 0T KD R 0
erfüllen. Sei ein neuer Satz von s verallgemeinerten Koordinaten {Qa (t)}, Linearkombinationen der
{Q0b (t)}, definiert durch Q(t) ≡ R 0 Q0 (t), woraus Q0 (t) = R 0T Q(t) folgt. Diese neuen Koordinaten
bringen natürlich den Potential-Term der Lagrange-Funktion in Diagonalform.
Andererseits gilt
0
0
0
0T
Q̇ (t) Q̇ (t) = Q̇(t) R R Q̇(t) = Q̇(t) Q̇(t) =
T
T
T
s
X
2
Q̇a (t)
a=1
für den kinetischen Anteil der Lagrange-Funktion, die insgesamt durch
s
1
2
1
1 X T
T
L Q(t), Q̇(t) = Q̇(t) Q̇(t) − Q(t) KD Q(t) =
Q̇a (t) − Ka Qa (t)2
2
2
2
(III.29)
a=1
gegeben ist. Das heißt, die neuen verallgemeinerten Koordinaten {Qa (t)}, deren Zeitentwicklungen
nach Anwendung der Euler–Lagrange-Gleichungen
Q̈a (t) = −Ka Qa (t) für a = 1, . . . , s
lauten, sind jetzt entkoppelt von einander. Diese Variablen {Qa (t)} mit einer einfachen Bewegungsgleichung werden Normalkoordinaten oder auch Normalmoden genannt.
Für jede dieser Normallkoordinaten kann dann die Fallunterscheidung am Ende des § III.2.1
wiederholt werden.
√
Somit entspricht der Fall Ka > 0 einem harmonischen Oszillator mit Kreisfrequenz Ka , und das
System ist stabil unter kleinen Variationen entlang der Richtung von Qa . Dagegen ist das System
instabil falls Ka < 0, denn eine kleine Auslenkung kann zu einer großen Änderung führen. Schließlich
ist das Potential „flach“ entlang einer Richtung mit Ka = 0, und die zugehörige verallgemeinerte
Koordinate Qa ist zyklisch — zumindest in der Näherung, in der Gl. (III.29) gilt.
III.2.3 Gedämpfte Schwingungen
Später!
Literatur zum Abschnitt III.2
• Fließbach, Mechanik [2] Teil VI, Kap. 24–26.
• Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 6.1–6.3.
• Greiner, Klassische Mechanik II [7] Kap. IV.
Literatur zum Kapitel III
• Feynman, Vorlesungen über Physik. Band 1 [22] = Lectures on Physics. Vol. I [23], Kap. 18–20
& Band 2 [20] = Vol. II [21], Kap. 31.4;
84
Lagrange-Formalismus: Anwendungen
• Fließbach, Mechanik [2] Teil V, Kap. 19–23 & Teil VI, Kap. 24–26.
• Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 4.1–4.4, 5, & 6.1–6.3.
• Greiner, Klassische Mechanik II [7] Kap. III & IV.
• Nolting, Klassische Mechanik [15] Kap. 4.
• Scheck, Mechanik [18] Kap. 3.
K APITEL IV
Hamilton-Formalismus
Einleitung!
IV.1 Hamilton’sche Bewegungsgleichungen
IV.1.1 Kanonisch konjugierter Impuls
Sei ein mechanisches System mit s Freiheitsgraden. Im Rahmen des in Kap. II eingeführten
Lagrange-Formalismus benutzt man zur Beschreibung dieses Systems und dessen Zeitentwicklung
einerseits s verallgemeinerte Koordinaten
q = qa a=1,...,s
und andererseits die zugehörigen verallgemeinerten Geschwindigkeiten
q̇ = q̇a a=1,...,s .
(IV.1a)
(IV.1b)
Zusammen mit der Zeit bilden die generalisierten
Koordinaten und Geschwindigkeiten die Argu
mente der Lagrange-Funktion L t, q, q̇ , welche die ganze Information über das System enthält.
Mithilfe der Lagrange-Funktion werden noch die verallgemeinerten Impulse definiert; somit ist
∂L t, q, q̇
pa ≡
(IV.1c)
∂ q̇a
der zur Koordinate qa (t) konjugierte Impuls. Im Folgenden werden diese Impulse kollektiv mit
p = pa a=1,...,s
(IV.1d)
bezeichnet.
Die Grundidee des Hamilton-Formalismus besteht darin, den Bewegungszustand eines mechanischen Systems zur Zeit t durch die verallgemeinerten Koordinaten qa (t) und die dazu konjugierten
Impulse pa (t) zu charakterisieren, statt durch die Variablen {qa (t)}, {q̇a (t)}.
Definition: Der von den 2s Variablen {qa } und {pa } aufgespannte Raum Γ heißt Phasenraum des
Systems. Dementsprechend werden die {qa } und {pa } für a ∈ {1, . . . , s} gemeinsam Phasenraumkoordinaten genannt.
Jedem möglichen Bewegungszustand eines gegebenen Systems wird ein Punkt in dessen Phasenraum Γ zugeordnet, und die Bewegung entspricht einer Phasenraumtrajektorie. Dieses Thema wird
in Abschn. IV.3 ausführlicher diskutiert werden.
Bemerkung: Der Phasenraum ist im Allgemeinen kein Vektorraum, weil einige Variablen — wie z.B.
Winkel — ihre Werte nur in einem endlichen Intervall annehmen können.
Mathematisch ist der Phasenraum eine Mannigfaltigkeit der Dimension 2s.
86
Hamilton-Formalismus
IV.1.2 Hamilton-Funktion
Um die Variablen {qa }, {q̇a } des Lagrange-Formalismus durch die Koordinaten {qa } und die
konjugierten Impulse {pa } zu ersetzen, muss eine Funktion der neuen Variablen definiert werden,
welche die gesamte Information über das System enthält, um die Rolle der Lagrange-Funktion zu
übernehmen.
Definition: Gegeben die Lagrange-Funktion eines System wird seine Hamilton-Funktion definiert
durch
s
X
H t, q, p ≡
pa q̇a − L t, q, q̇ .
(IV.2)
a=1
Auf der rechten Seite dieser Definition sollen die q̇a als Funktionen
der Zeit t und der Phasenraumkoordinaten {qb } und {pb } betrachtet werden: q̇a = q̇a t, q, p . Das heißt, dass die definierende
Beziehung
des konjugierten Impulses (IV.1c) invertiert werden soll. Wenn dies möglich ist, gilt bei
festen pb b=1,...,s
!
s
X
∂H
∂
∂L
=
pb q̇b − L = pa −
= 0,
∂ q̇a
∂ q̇a
∂ q̇a
a=1
d.h. H hängt nicht explizit von q̇a ab.
Laut dem Satz von der Umkehrabbildung sollen die zweiten Ableitungen ∂ 2 L/∂ q̇a ∂ q̇b positiv
sein, damit Gl. (IV.1c) lokal invertierbar sei; vgl. auch Anhang C.
Wie oben erwähnt muss die Hamilton-Funktion H die gleiche Information wie die LagrangeFunktion L enthalten. Dass dies der Fall ist, lässt sich beweisen, indem man L aus H rekonstruieren
kann.
Sei somit angenommen, dass die Hamilton-Funktion H t, q, p bekannt ist. Definiert man zunächst
∂H t, q, p
Q̇a ≡
,
∂pa
so folgt aus Gl. (IV.2) und der Kettenregel
!
s
s
s
X
X
∂ q̇b X ∂L ∂ q̇b
∂
pb q̇b − L = q̇a +
pb
−
Q̇a =
∂pa
∂pa
∂ q̇b ∂pa
b=1
b=1
b=1
wobei ∂qb /∂pa = 0 benutzt wurde, entsprechend der Unabhängigkeit der Variablen qb und pa . Unter
Verwendung der Beziehung (IV.1c) im letzten Term kommt dann Q̇a = q̇a . Somit lassen sich die
verallgemeinerten Geschwindigkeiten aus der Hamilton-Funktion über
∂H t, q, p
q̇a t, q, p =
∂pa
(IV.3a)
wiederfinden. Dann liefert eine einfache Berechnung
s
X
a=1
s
s
X
a=1
a=1
X
∂H
pa
−H=
pa q̇a −
∂pa
!
pa q̇a − L
= L.
Das heißt, die Lagrange-Funktion kann aus der Hamilton-Funktion gemäß
s
X
L t, q, q̇ ≡
pa q̇a t, q, p − H t, q, p
a=1
rekonstruiert werden, wobei q̇a durch Gl. (IV.3a) gegeben ist.
(IV.3b)
87
IV.1 Hamilton’sche Bewegungsgleichungen
Mathematisch ist der Übergang von L zu H ein Beispiel von Legendre (q) -Transformation, und
der Übergang von H zu L ist die Rücktransformation (inverse Legendre-Transformation).
Bemerkung: Vergleicht man Gl. (IV.2) mit Gl. (II.25c), so stimmt die Definition der HamiltonFunktion mit jener der Noether-Ladung assoziiert mit Invarianz unter Zeittranslationen überein,
die als Energie des Systems interpretiert wurde.
IV.1.3 Kanonische Bewegungsgleichungen
Die Position eine Systems im Phasenraum zu einer gegebenen Zeit t gibt seine verallgemeinerten Koordinaten und konjugierten Impulse zu diesem Zeitpunkt, die ganz natürlich mit {qa (t)} und
{pa (t)} bezeichnet werden. Zur Charakterisierung der Bewegung des Systems sind noch Bewegungsgleichungen erforderlich, welche die Zeitentwicklung von den {qa (t)} und {pa (t)} bestimmen.
Im vorigen Paragraphen wurde schon Gl. (IV.3a) gefunden, welche die Zeitableitung der verallgemeinerten Koordinate qa (t) durch Größen des Hamilton-Formalismus ausdrückt. Betrachtet man
jetzt die Ableitung der Hamilton-Funktion (IV.2) nach der verallgemeinerten Koordinate qa , so
ergibt sich
!
s
s
s
X
X
∂H
dH
d
∂L X ∂L ∂ q̇b
∂ q̇b
=
=
−
−
.
pb q̇b − L =
pb
∂qa
dqa
dqa
∂qa ∂qa
∂ q̇b ∂qa
b=1
b=1
b=1
Im letzten Summanden kann ∂L/∂ q̇b durch pb ersetzt werden, so dass dieser Term sich mit dem ersten
herauskürzt. Dann ist der zweite Term ∂L/∂qa , berechnet entlang der Trajektorie des Systems, laut
der Euler–Lagrange-Gleichung (II.9) gleich der Zeitableitung von ∂L/∂ q̇a . Nach Gl. (IV.1c) ist dies
auch gleich der Zeitableitung des konjugierten Impulses pa . Somit ergibt sich
∂H t, q(t), p(t)
dpa (t)
=−
.
∂qa
dt
Insgesamt gelten die (kanonischen) Hamilton’schen Gleichungen
∂H t, q(t), p(t)
dqa (t)
=
dt
∂pa
∂H t, q(t), p(t)
dpa (t)
=−
dt
∂qa
für a = 1, . . . , s.
(IV.4)
Ein wichtiger Gegensatz zum zweiten Newton’schen Gesetz (I.14) oder zu den Euler–LagrangeGleichungen (II.9), die zweiter Ordnung sind, besteht darin, dass die 2s Hamilton’schen Bewegungsgleichungen Differentialgleichungen erster Ordnung sind. Deshalb ist für jede Phasenraumkoordinate
eine einzige Anfangsbedingung nötig, um die Lösung der Bewegungsgleichungen, d.h. die Phasenraumtrajektorie, zu bestimmen.
Bemerkungen:
∗ Die Ableitung der Definition (IV.2) nach der Zeit mithilfe der Produktregel gibt unter Verwendung der Euler–Lagrange-Gleichungen (II.9) und der Kettenregel
s s dH X dpa
dq̇a
dL X ∂L dqa
∂L dq̇a
dL
∂L
=
q̇a + pa
−
=
+
−
=− .
dt
dt
dt
dt
∂qa dt
∂ q̇a dt
dt
∂t
a=1
a=1
Andererseits liefern die Hamilton’schen Gleichungen (IV.4)
s
s
s
a=1
a=1
a=1
X ∂H
∂H
dH
∂H X ∂H
∂H X
=
+
q̇a +
ṗa =
+
− ṗa q̇a + q̇a ṗa =
.
dt
∂t
∂qa
∂pa
∂t
∂t
(q)
A.-M. Legendre, 1752–1833
88
Hamilton-Formalismus
Falls die Hamilton-Funktion nicht explizit von der Zeit abhängt (∂H/∂t = 0), ist sie somit eine
Konstante der Bewegung, entsprechend Energieerhaltung im System.
∗ Die Hamilton’schen Bewegungsgleichungen (IV.4) können aus einem Extremalprinzip, dem schon
angetroffenen Hamilton(!)-Prinzip (II.8), hergeleitet werden. Demgemäß ist die Wirkung
Z t2 X
s
S[q, p] ≡
pa (t) q̇a t, q(t), p(t) − H t, q(t), p(t) dt
(IV.5)
t1
a=1
unter allen Phasenraumtrajektorien mit festen Endpunkten extremal für die physikalisch realisierte
Bewegung.
IV.1.4 Beispiele
IV.1.4
a Eindimensionales System
::::::::::::::::::::::::::::::::::
Das einfachste Beispiel ist das eines zeitunabhängigen Systems mit einem einzigen Freiheitsgrad,
parametrisiert durch eine verallgemeinerte Koordinate q. Sei
m
L(q, q̇) = q̇ 2 − V (q)
(IV.6a)
2
die zugehörige Lagrange-Funktion, mit V dem Potential für die generalisierte Koordinate. Der zu q
konjugierte Impuls ist
∂L(q, q̇)
= m q̇,
(IV.6b)
p=
∂ q̇
woraus q̇(t, q, p) = p/m folgt.
Die Hamilton-Funktion (IV.2) für dieses System lautet
m
m
H(q, p) = p q̇ − L(q, q̇) = m q̇ 2 − q̇ 2 + V (q) = q̇ 2 + V (q).
2
2
Ersetzt man q̇ durch p/m, so ergibt sich schließlich
H(q, p) =
p2
+ V (q).
2m
(IV.6c)
Ausgehend von dieser Hamilton-Funktion lauten die Hamilton’schen Gleichungen (IV.4)
∂H q(t), p(t)
dq(t)
p(t)
=
=
(IV.6d)
dt
∂p
m
und
∂H q(t), p(t)
∂V q(t)
dp(t)
=−
=−
.
(IV.6e)
dt
∂q
∂q
Wird die zweite in der Ableitung der ersten nach der Zeit eingesetzt, so findet man die übliche
Bewegungsgleichung wieder.
Schließlich prüft man schnell nach, dass die Lagrange-Funktion aus der Hamilton-Funktion rekonstruiert werden kann:
p
∂H(q, p)
p
p2
p2
− H(q, p) = p −
− V (q) =
− V (q).
∂p
m 2m
2m
IV.1.4
b Harmonischer Oszillator
:::::::::::::::::::::::::::::::::
Ein wichtiger Sonderfall der im letzten Paragraphen gefundenen Ergebnisse ist der des eindimensionalen harmonischen Oszillators mit Potential V (q) = 12 mω 2 q 2 . Die Hamilton-Funktion ist
H(q, p) =
p2
1
+ mω 2 q 2 ,
2m 2
(IV.7)
89
IV.1 Hamilton’sche Bewegungsgleichungen
entsprechend den Hamilton’schen Bewegungsgleichungen
dq(t)
p(t)
=
dt
m
(IV.8a)
und
dp(t)
= −mω 2 q(t).
(IV.8b)
dt
Diese zwei gekoppelten Differentialgleichungen können natürlich kombiniert werden, um die übliche
Differentialgleichung zweiter Ordnung mq̈(t) + mω 2 q(t) = 0 zu geben. Stattdessen wird hiernach
eine geeignete Linearkombination von q(t) und p(t) eingeführt, um eine einfach lösbare Gleichung
erster Ordnung zu erhalten.
Sei
r
p(t)
mω
α(t) ≡
q(t) + i √
.
(IV.9a)
2
2mω
Die Phasenraumtrajektorie lässt sich durch α(t) und die komplexe konjugierte Funktion α(t)∗ ausdrücken:
r
1 1 mω ∗
q(t) = √
α(t) + α(t)
, p(t) =
α(t) − α(t)∗ .
(IV.9b)
i
2
2mω
p
√
Die Summe aus Gl. (IV.8a), multipliziert mit mω/2, und Gl. (IV.8b) multipliziert mit i/ 2mω
gibt
dα(t)
= −iω α(t).
(IV.10)
dt
Diese gewöhnliche Differentialgleichung erster Ordnung lässt sich sofort lösen: wenn α0 die Anfangsbedingung bei t = 0 bezeichnet, gilt
α(t) = α0 e−iωt ,
(IV.11)
woraus q(t) und p(t) über Gl. (IV.9b) folgen. Insbesondere ergibt sich das der Leserin schon bekannte
oszillatorische Verhalten von q(t).
90
Hamilton-Formalismus
IV.2 Kanonische Transformationen
IV.2.1 Phasenraum-Funktionen
Die verallgemeinerten Koordinaten {qa (t)} und die dazu konjugierten Impulse {pa (t)} bestimmen den Bewegungszustand eines mechanischen Systems zur Zeit t vollständig. Das heißt, jede
mögliche Größe, um diesen Zustand zu charakterisieren — wie z.B. die Position, der Drehimpuls
oder die gesamte Energie —, kann durch die Phasenraumkoordinaten des Systems ausgedrückt
werden.
Dementsprechend ist es sinnvoll, Funktionen von der Zeit t und den 2s Phasenraumkoordinaten
{qa }, {pa } mit a = 1, . . . , s zu betrachten. Im Rest dieses Kapitels werden solche Funktionen der
Kürze halber als „Phasenraum-Funktionen“ oder „Funktionen auf dem Phasenraum“ bezeichnet,
auch wenn die Zeit auch Argument der Funktion ist. Dazu wird angenommen, dass sie beliebig
differenzierbar sind, ohne dass das jedes Mal erwähnt wird.
Bemerkung: Wenn die Funktion einer messbaren physikalischen Größe entspricht, anstatt ein ma-
thematisches Konstrukt zu sein, wird sie auch Observable genannt.
IV.2.2 Poisson-Klammer
IV.2.2
a Definition
::::::::::::::::::
Definition: Seien f und g zwei Funktionen von der Zeit t und den 2s Phasenraumkoordinaten {qa },
{pa } mit a = 1, . . . , s. Ihre Poisson (27) -Klammer ist ebenfalls eine Phasenraum-Funktion derselben
Variablen, definiert durch
s X
∂f ∂g
∂f ∂g
f, g ≡
−
,
∂qa ∂pa ∂pa ∂qa
(IV.12)
a=1
wobei die (t, q, p)-Abhängigkeit aller Funktionen nicht geschrieben wurde.
Bemerkungen:
∗ In der Literatur sind Poisson-Klammern manchmal mit einem globale Vorzeichen vor der rechten
Seite definiert. Um nur internationale Standardreferenzen zu nennen ist die hier verwendete Konvention die gleiche wie bei Arnold [1] oder Goldstein [4, 5], während Landau & Lifschitz [13, 24] die
alternative Konvention benutzen.
Auf ähnlicher Weise ist die Notation nicht universell: somit benutzen viele Autoren rechteckige
Klammern [ · , · ] — z.B. Arnold, Goldstein oder Landau & Lifschitz — um die formelle Analogie
mit dem Kommutator der Quantenmechanik zu betonen.
∗ Hiernach wird die Poisson-Klammer (IV.12) manchmal auch mit f, g q,p bezeichnet, d.h. mit
expliziter Angabe der relevanten Phasenraumkoordinaten.
Für die spätere Diskussion über kanonische Transformationen in § IV.2.4 ist es günstig, die
Poisson-Klammer in einer Matrixform zu schreiben. Dafür führt man die s-dimensionalen Spaltenvektoren




∂f /∂q1
∂f /∂p1




∇q f ≡  ...  und ∇p f ≡  ... 
(IV.13)
∂f /∂qs
∂f /∂ps
ein. Diese können dann wiederum in einen Spaltenvektor mit insgesamt 2s Komponenten kombiniert
(27)
S. Poisson, 1781–1740
91
IV.2 Kanonische Transformationen
werden. Dann ist die Poisson-Klammer von f und g durch
f, g = (∇q f )T (∇p f )T
0
1s
−1s
0
!
∇q g
!
∇p g
(IV.14)
gegeben, mit (∇q f )T und (∇p f )T den Zeilenvektoren transponiert zu den Spaltenvektoren (IV.13)
und 1s der s × s-Einheitsmatrix.
IV.2.2
b Eigenschaften
::::::::::::::::::::::
Die Poisson-Klammer besitzt einige mathematische Eigenschaften, die sich generell problemlos
beweisen lassen und deshalb hiernach nur aufgelistet werden. Der Kürze halber werden die Abhängigkeit der verschiedener Funktion von ihren Variablen (t, q, p) nicht geschrieben.
Bilinearität Seien f, g1 , g2 bzw. f1 , f2 , g drei Funktionen auf dem Phasenraum und λ1 , λ2 ∈ C.
Dann gelten
λ1 f1 + λ2 f2 , g = λ1 f1 , g + λ2 f2 , g ,
(IV.15)
f, λ1 g1 + λ2 g2 = λ1 f, g1 + λ2 f, g2 .
Antisymmetrie / Antikommutativität Für jedes Paar (f, g) von Funktionen auf dem Phasenraum gilt
f, g = − g, f .
(IV.16)
Daraus folgt trivial f, f = 0.
Nullelemente Sei K eine Zahl; die Funktion auf dem Phasenraum, die identisch konstant gleich K
ist, ist ein Nullelement, d.h. ihre Poisson-Klammer mit jeder Funktion f auf dem Phasenraum
verschwindet
f, K = 0.
(IV.17)
Produktregel Für jedes Triplett (f, g, h) von Funktionen auf dem Phasenraum gelten
f, gh = f, g h + g f, h
(IV.18)
sowie die
Jacobi(28) -Identität
{f, g}, h + {g, h}, f + {h, f }, g = 0.
(IV.19)
Im Gegensatz zu den anderen Eigenschaften, die sich in einer Zeile nachprüfen lassen,
ist der Beweis dieser Identität mühsam. Jeder der drei Terme ist eine Summe über zwei
Freiheitsgrade-Indizes von 8 Beiträgen, die selbst Produkte von zwei Ableitungen und einer doppelten Ableitung sind. Das Spiel besteht darin, Indizes zu umbenennen und die
Vertauschung der Ordnung der Ableitungen zu benutzen, um das gesuchte Ergebnis zu
finden.
Bemerkungen:
∗ Für die dritte Eigenschaft ist eigentlich nur die Unabhängigkeit der Funktion K von den Phasenraumkoordinaten nötig: die „Konstante“ kann noch von der Zeit abhängen, entsprechend einer auf
dem Phasenraum gleichförmigen Funktion, ohne den Nullwert deren Poisson-Klammer mit jeder
anderen Funktion zu ändern.
∗ Versehen mit der Addition und der Poisson-Klammer bildet die Menge der Funktionen auf dem
Phasenraum eines Systems eine Algebra.
92
Hamilton-Formalismus
IV.2.3 Poisson-Klammer und Zeitentwicklung
Mit Hilfe der Poisson-Klammer lässt sich die Zeitentwicklung einer Phasenraumfunktion elegant
umschreiben.
IV.2.3
a Zeitentwicklung einer Phasenraumfunktion
::::::::::::::::::::::::::::::::::::::::::::::::::::
Sei jetzt f eine beliebige Funktion auf dem Phasenraum eines physikalischen Systems, dessen
Hamilton-Funktion H als bekannt angenommen wird. Die Anwendung der Kettenregel gibt für die
totale Ableitung von f nach der Zeit
s
s
X
X
∂f t, q(t), p(t)
df t, q(t), p(t)
∂f t, q(t), p(t)
∂f t, q(t), p(t)
q̇a (t) +
ṗa (t).
=
+
dt
∂t
∂qa
∂pa
a=1
a=1
Dabei können die Zeitableitungen q̇a (t), q̇a (t) der Koordinatenfunktionen mithilfe der Hamilton’schen
Bewegungsgleichungen (IV.4) umgeschrieben werden:
s
s
df
∂f X ∂f ∂H X ∂f ∂H
−
,
=
+
dt
∂t
∂qa ∂pa
∂pa ∂qa
a=1
a=1
wobei alle Funktionen im gleichen Punkt t, q(t), p(t) zu betrachten sind. Unter Verwendung der
Poisson-Klammer (IV.12) lautet diese Zeitableitung
df
∂f =
+ f, H .
dt
∂t
(IV.20)
Insbesondere werden die Hamilton’schen Bewegungsgleichungen (IV.4) zu
dqa = qa , H
dt
für a = 1, . . . , s,
(IV.21)
dpa = pa , H
dt
weil die Projektionen qa t, q(t), p(t) = qa , pa t, q(t), p(t) = pa auf die Koordinatenachsen der
Position im Phasenraum trotz ihrer Notation keine explizite Funktion der Zeit sind.
Bemerkung: Wegen der Bilinearität (IV.15) der Poisson-Klammer ist die Abbildung f 7→ f, H
bei gegebener Hamilton-Funktion H eine lineare Abbildung.
IV.2.3
b Integrale der Bewegung
::::::::::::::::::::::::::::::::
In Übereinstimmung mit Definition (I.57) ist eine Funktion K der Zeit t und der Phasenraumkoordinaten eine Konstante der Bewegung, auch Integral der Bewegung genannt, wenn sie konstant
entlang der Trajektorie eines System im Phasenraum bleibt, d.h. wenn dK/dt = 0. Laut Gl. (IV.21)
ist diese Anforderung äquivalent zu
∂K + K, H = 0,
∂t
d.h. unter Verwendung der Antikommutativität (IV.16) der Poisson-Klammer
K t, q, p Integral der Bewegung ⇔
∂K = H, K .
∂t
(IV.22)
Dank der Poisson-Klammer können auch — zumindest prinzipiell — neue Integrale der Bewegung gefunden werden, dank dem
Theorem (Satz
vonPoisson): Seien K1 , K2 zwei Konstanten der Bewegung. Dann ist ihre Poisson
Klammer K1 , K2 auch eine Erhaltungsgröße.
93
IV.2 Kanonische Transformationen
Beweis: die Jacobi-Identität (IV.19) mit f = K1 , g = K2 , h = H1 gibt
H, {K1 , K2 } = {K2 , H}, K1 + {H, K1 }, K2
d.h. nach Verwendung der Beziehung (IV.22) für beide Konstanten der Bewegung
o ∂ n
∂K2 o n ∂K1
+
H, {K1 , K2 } = K1 ,
, K2 =
K1 , K2 ,
∂t
∂t
∂t
wobei die letzte Gleichung aus dem Austauschen
vonpartiellen Ableitung nach der Zeit und
nach Phasenraumkoordinaten folgt. Somit ist K1 , K2 laut Gl. (IV.22) erhalten.
2
Bemerkung: In der Praxis ist dieser Satz nicht so nützlich, denn seine Anwendung führt schnell
entweder zur Nullfunktion, oder zu einem Integral der Bewegung, das abhängig von den schon
bekannten Integralen ist, und somit nicht „neu“ ist.
Eigentlich kann ein System mit s Freiheitsgraden maximal 2s − 1 unabhängige Konstanten der
Bewegung haben.
IV.2.4 Kanonische Transformationen
Es kann günstig sein, Koordinatentransformationen im Phasenraum durchzuführen.
IV.2.4
a Fundamentale Poisson-Klammern
::::::::::::::::::::::::::::::::::::::::::
Seien {qa }a=1,...,s verallgemeinerte Koordinaten und {pa }a=1,...,s die zugehörigen konjugierten
Impulse. Aus der Definition der Poisson-Klammer zweier Funktionen (IV.12) und der Tatsache,
dass die Phasenraumkoordinaten unabhängig voneinander sind, folgen die fundamentalen PoissonKlammern
qa , qb = pa , pb = 0
(IV.23)
qa , pb = δab
Bemerkung: Da die Poisson-Klammer zweier Funktionen selbst eine Funktion von der Zeit und der
Phasenraumkoordinaten ist, bedeutet δab hier die Funktion, die identisch Null für a 6= b, identisch
1 für a = b ist.
Der Beweis der Beziehungen (IV.23) ist trivial. Beispielsweise gilt
s
s
X
X
∂qa ∂pb
∂qa ∂pb
qa , pb =
−
=
δac δbc ,
∂qc ∂pc
∂pc ∂qc
c=1
c=1
wobei die zweite Gleichung die Unabhängigkeit der Koordinaten ausdrückt und zu qa , pb = δab
führt.
Definition: Wenn Phasenraumkoordinaten {qa }, {pa } die Gleichungen (IV.23) erfüllen, so heißen sie
kanonische Variablen.
IV.2.4
b Koordinatentransformation im Phasenraum
::::::::::::::::::::::::::::::::::::::::::::::::::::
Wir betrachten eine allgemeine Koordinatentransformation im Phasenraum

Qa = Qa (t, q, p)
{qa }, {pa } → {Qa }, {pa } mit
für a = 1, . . . , s.
Pa = Pa (t, q, p)
(IV.24)
Unter diese Transformation der Koordinaten ändert sich im Allgemeinen auch die funktionale Form
der Phasenraum-Funktion, welche eine gewisse physikalische Größe ausdrückt. Das heißt, eine Funktion f der alten Koordinaten q ≡ {qa }, p ≡ {pa } soll durch eine Funktion F der neuen Koordinaten
94
Hamilton-Formalismus
Q ≡ {Qa }, P ≡ {Pa } ersetzt werden. Die beiden Funktion stehen in Zusammenhang zu einander,
weil sie die Beziehung
F t, Q(t, q, p), P(t, q, p) = f (t, q, p)
erfüllen müssen.
Beispiel: Sei ein System mit einem einzigen Freiheitsgrad, beschrieben durch kanonisch konjugierte
Variablen q, p, mit der Hamilton-Funktion
h(q, p) =
a 1
b
+ p2 q 4 ,
2 q2 2
(IV.25)
wobei a und b positiv sind.
Die Hamilton’schen Bewegungsgleichungen lauten
q̇ =
∂h
= bpq 4 ,
∂p
ṗ = −
∂h
a
= 3 − 2bp2 q 3 .
∂q
q
Wird die erste Gleichung nach der Zeit abgeleitet bzw. nach p umgestellt, so ergibt sich
q̈ = b ṗq 4 + 4bpq 3 q̇,
p=
bzw.
Daraus folgt die Bewegungsgleichung
q̈ = abq + 2
q̇
.
bq 4
q̇ 2
,
q
deren Lösung auf erster Sicht nicht trivial aussieht.
Führt man aber die Koordinatentransformation
Q = pq 2 ,
P =
1
q
(IV.26)
durch, so nimmt die Hamilton-Funktion die bekannte Form
a 2 b 2
P + Q ,
2
2
entsprechend einem harmonischen Oszillator mit Masse m = 1/a und natürlicher Kreisfrequenz
ω 2 = ab.
Was aber noch nicht klar ist, ist ob die Bewegungsgleichungen in den neuen Koordinaten (Q, P )
die gleiche Form wie in den alten erhält, mit Hamilton-Funktion H(Q, P ) statt h(q, p).
H(Q, P ) =
IV.2.4
c Kanonische Transformationen
:::::::::::::::::::::::::::::::::::::::
Sei nun g eine neue Funktion der alten Koordinaten q, p und G die damit assoziierte Funktion
der neuen Koordinaten Q, P:
G t, Q(t, q, p), P(t, q, p) = g(t, q, p).
Definition: Eine Koordinatentransformation (IV.24) im Phasenraum heißt kanonische Transforma-
tion, wenn sie die Poisson-Klammer zweier beliebigen Funktionen unverändert lässt, d.h.
f, g q,p = F, G Q,P .
(IV.27)
Insbesondere sollen die fundamentalen Poisson-Klammern in den neuen Koordinaten
Qa , Qb Q,P = Pa , Pb Q,P = 0 ,
Qa , Pb Q,P = δab
(IV.28)
sein.
Reziprok kann man zeigen, dass wenn die fundamentalen Poisson-Klammern in den neuen Phasenraumvariablen die kanonische Form (IV.28) annehmen, dann ist die Koordinatentransformation
kanonisch.
IV.2 Kanonische Transformationen
95
Bemerkung: Anstatt der mathematisch korrekten Notation F , G für die Funktionen der neuen
Variablen Q, P einzuführen, benutzen Physiker oft die gleiche Notation f und g, auch wenn die
mathematische Form nicht die gleiche wie in den alten Variablen q, p ist. Dementsprechend wird
f, g q,p = f, g Q,P
(IV.29)
statt Gl. (IV.27) geschrieben.
Transformation der Phasenraumkoordinaten für s = 1
Seien f , g zwei Funktionen der Phasenraumkoordinaten q, p eines Systems mit einem einzigen
Freiheitsgrad. Unter einer Koordinatentransformation (q, p) → (Q, P ) werden sie durch neue Funktionen F , G ersetzt mit
f (t, q, p) = F t, Q(t, q, p), P(t, q, p) , g(t, q, p) = G t, Q(t, q, p), P(t, q, p) .
Die Ableitung der ersten dieser Gleichungen nach einer der Phasenraumvariablen, zB q, gibt
∂f
dF
=
∂q
dq
d.h. unter Verwendung der Kettenregel
∂f
∂F ∂Q ∂F ∂P
=
+
.
∂q
∂Q ∂q
∂P ∂q
Ähnliche Gleichungen gelten für die Ableitung nach p oder für die Ableitungen von g, so dass die
Poisson-Klammer von f und g sich als
∂f ∂g ∂f ∂g
f, g q,p =
−
∂q ∂p ∂p ∂q
∂G ∂Q ∂G ∂P
∂F ∂Q ∂F ∂P
∂G ∂Q ∂G ∂P
∂F ∂Q ∂F ∂P
+
+
−
+
+
=
∂Q ∂q
∂P ∂q
∂Q ∂p
∂P ∂p
∂Q ∂p
∂P ∂p
∂Q ∂q
∂P ∂q
schreiben lässt. Beim Ausmultiplizieren des Terms auf der rechten Seite kommen acht Beiträge,
wovon vier sich kürzen, während die vier übrigen Terme faktorisiert werden können. Insgesamt
ergibt sich
∂F ∂G ∂F ∂G
∂Q ∂P
∂Q ∂P
f, g q,p =
−
−
,
∂Q ∂P
∂P ∂Q
∂q ∂p
∂p ∂q
d.h.
∂(Q, P )
f, g q,p = F, G Q,P
(IV.30a)
∂(q, p)
mit


∂Q ∂Q
 ∂q ∂p 
∂(Q, P )
∂Q ∂P
∂Q ∂P

≡
−
= det
(IV.30b)
 ∂P ∂P 
∂(q, p)
∂q ∂p
∂p ∂q
∂q ∂p
Gleichung (IV.30a) zeigt, dass die Transformation (q, p) → (Q, P ) kanonisch ist, wenn die Determinante (IV.30b) gleich 1 ist.
Beispiel: Kommt man zurück zum Beispiel des § IV.2.4 b, man prüft einfach nach, dass die Trans-
formation (IV.26) eigentlich kanonisch ist.
Transformation der Phasenraumkoordinaten für s > 1
Wie betrachten nur eine Transformation (q, p) → (Q, P) der Phasenraumkoordinaten für ein
System mit s Freiheitsgraden, wobei s > 1 ist — eigentlich kann auch s = 1 sein. Laut Gl. (IV.14)
lässt sich die Poisson-Klammer zweier Funktionen der Variablen (q, p) als
!
!
!
0
1s
∇q g
∇q g
f, g q,p = (∇q f )T (∇p f )T
≡ (∇q f )T (∇p f )T J 2s
(IV.31)
−1s 0
∇p g
∇p g
96
Hamilton-Formalismus
schreiben, wobei die zweite Gleichung die 2s × 2s-Matrix J 2s definiert. Wie im Fall des Problems
mit s = 1 Freiheitsgrad lassen sich die partiellen Ableitungen von f , g nach den Variablen qa , pa
durch die Ableitungen von F , G nach den zugehörigen Variablen Qa , Pa ausdrücken; z.B. gelten
s X
∂g
dG
∂G ∂Qb
∂G ∂Pb
=
=
+
∂qa
dqa
∂Qb ∂qa
∂Pb ∂qa
b=1
und
s X
dG
∂G ∂Qb
∂G ∂Pb
∂g
=
=
+
∂pa
dpa
∂Qb ∂pa
∂Pb ∂pa
b=1
sowie ähnliche Gleichungen mit g bzw. G ersetzt durch f bzw. F . Führt man die vier folgenden
s × s-Matrizen definiert durch ihre Elemente
∂Qb
∂Pb
∂Qb
∂Pb
∇q Q ab =
,
∇q P ab =
,
∇p Q ab =
,
∇p P ab =
,
∂qa
∂qa
∂pa
∂pa
ein, so lassen sich die Beziehungen zwischen den partielle Ableitungen von g und denen von G in
der kürzeren Matrix-Schreibweise
!
!
!
!
∇q g
∇q Q ∇q P
∇Q G
∇Q G
=
≡Λ
∇p g
∇p Q ∇p P
∇P G
∇P G
schreiben. Dabei stellt die 2s × 2s-Matrix Λ die Transformationsmatrix für die Koordinatentransformation unter Betrachtung dar.
Die Transposition dieser Beziehung, mit g bzw. G ersetzt durch f bzw. F , lautet
(∇q f )T (∇p f )T = (∇Q F )T (∇P F )T ΛT .
Dies kann im Ausdruck (IV.31) der Poisson-Klammer von f und g eingesetzt werden. Somit ergibt
sich
!
∇
G
Q
.
f, g q,p = (∇Q F )T (∇P F )T ΛTJ 2s Λ
∇P G
Andererseits gilt in den neuen Phasenraumkoordinaten
F, G
Q,P
= (∇Q F )T
(∇P F )T J 2s
!
∇Q G
∇P G
.
Vergleicht man beide Ausdrücke, man sieht dass die Transformation (q, p) → (Q, P) kanonisch ist,
wenn die Anforderung
ΛTJ 2s Λ = J 2s
(IV.32)
an die Transformationsmatrix Λ erfüllt ist.
Bemerkung: Man prüft einfach nach, dass wenn zwei Transformationsmatrizen Λ 1 , Λ 2 der obigen
Gleichung genügen, dann erfüllt sie auch das Produkt Λ 1 Λ 2 : anders gesagt ist das Hintereinanderausführen zweier kanonischer Transformation wieder eine kanonische Transformation.
Die Matrizen, welche die Beziehung (IV.32) erfüllen, bilden die symplektische Gruppe Sp(2s).
IV.3 Phasenraum
IV.3 Phasenraum
Literatur zum Kapitel IV
• Fließbach, Mechanik [2] Teil V, Kap. 19–23 & Teil VI, Kap. 24–26.
• Goldstein, Klassische Mechanik [4] = Classical Mechanics [5], Kap. 4.1–4.4, 5, & 6.1–6.3.
• Greiner, Klassische Mechanik II [7] Kap. III & IV.
• Nolting, Klassische Mechanik [15] Kap. 4.
• Scheck, Mechanik [18] Kap. 3.
97
98
Hamilton-Formalismus
Zweiter Teil
Grundlagen der
Speziellen Relativitätstheorie
K APITEL V
Mathematischer Apparat der Speziellen
Relativitätstheorie
Einleitung
V.1 Einstein’sche Postulate
V.1.1 Motivation
Trotz der vielen Erfolge der klassischen Newton’schen Mechanik tritt ein wichtiges Problem
auf, wenn man Effekte aus dem Elektromagnetismus betrachtet. Aus den Maxwell(r) -Gleichungen
folgert man leicht, dass die Ausbreitungsgeschwindigkeit im Vakuum von elektromagnetischen Wellen — insbesondere von Licht, das laut Arbeiten von Hertz(s) ein elektromagnetisches Phänomen
ist — denselben Wert (c) in allen Inertialsystemen annimmt. In der Tat zeigten die InterferenzExperimente von Michelson(t) und Morley(u) , dass die Lichtgeschwindigkeit parallel oder senkrecht
zur (instantanen) Bewegungsrichtung der Erde um die Sonne gleich bleibt.
Die theoretische Vorhersage sowie ihre experimentelle Bestätigung(29) lassen sich aber offensichtlich nicht mit dem Additionstheorem für Geschwindigkeiten in der Newton’schen Raumzeit
vereinbaren.
V.1.2 Einstein’sche Postulate
Um die theoretisch und experimentell gefundene Konstanz der Vakuumlichtgeschwindigkeit zu
berücksichtigen hat Einstein seine Postulate eingeführt [25], welche die durch Newton postulierten
Gesetze ersetzen müssen.
V.1.2
a Erstes Postulat
:::::::::::::::::::::::
Das erste dieser Postulate ist das (Einstein’sche) Relativitätsprinzip
Die Gesetze der Physik nehmen in allen Inertialsystemen die gleiche Form an.
(V.1)
Dabei handelt es sich um eine Erweiterung des sog. Galilei-Relativitätsprinzip — das eigentlich
durch Newton formuliert wurde —, das aber nur für mechanische System galt. Mit seiner Verallgemeinerung meinte insbesondere Einstein, dass auch elektromagnetische Phänomene diesem Prinzip
genügen sollen.
V.1.2 b Zweites Postulat
Mit seinem zweiten Postulat entschied sich Einstein gegen die Newton’schen Gesetze mit ihren
Invarianz unter Galilei-Transformationen, und legte mehr Wert auf die Maxwell-Gleichungen und
::::::::::::::::::::::::
(29)
(r)
... vorausgesetzt, die Michelson–Morley-Experimente wirklich das Fortpflanzen von Licht im Vakuum messen,
nicht in irgendeinem hypothetischen Medium — dem Äther —, wie damals vorgeschlagen wurde, um die NewtonMechanik zu retten.
J. C. Maxwell, 1831–1879
(s)
H. Hertz, 1857–1894
(t)
A. Michelson, 1852–1931
(u)
E. Morley, 1838–1923
102
Mathematischer Apparat der Speziellen Relativitätstheorie
deren experimentellen Bestätigungen, indem er die Konstanz der Lichtgeschwindigkeit als grundsätzlich erklärte:
Die Lichtgeschwindigkeit im Vakuum ist in allen Inertialsystemen gleich.
(V.2)
Demzufolge kann das klassische Additionsgesetz für Geschwindigkeiten nicht mehr gelten. Dies
bedeutet wiederum, dass Galilei-Transformationen, insbesondere Galilei-Boosts, nicht die richtigen
Transformationen zwischen Inertialsystemen sind. Wegen dieses Prinzip muss also die ganze Kinematik neu geschrieben werden.
V.2 Lorentz-Transformationen
In diesem Abschnitt sind B und B 0 zwei Inertialsysteme, wobei das letztere sich relativ zum ersteren
mit der Geschwindigkeit ~u bewegt. t und ~r bzw. t0 und ~r 0 bezeichnen die Zeit und den Ortsvektor
gemessen durch einen in B bzw. B 0 ruhenden Beobachter.
V.2.1 Linienelement
Seien P1 und P2 zwei Punkte, zwischen denen Vakuum herrscht. Zu einem ersten Zeitpunkt wird
Licht in P1 emittiert. Für den Beobachter in B geschieht dies zur Zeit t1 bei der Position ~r1 ; für
den Beobachter in B 0 , zur Zeit t01 bei der Position ~r01 . Das Licht wird zu einem späteren Zeitpunkt
in P2 detektiert, und zwar für den Beobachter in B bzw. B 0 zur Zeit t2 bzw. t02 bei der Position ~r2
bzw. ~r20 .
Laut dem zweiten Einstein’schen Postulat muss die Vakuumlichtgeschwindigkeit gleich c für
beide Beobachter sein, d.h.
0
0
~r2 − ~r1 ~r − ~r 0 ∆~r
∆~r 2
1
= c und
=c
≡
≡
t2 − t1
∆t
t02 − t01
∆t0
oder äquivalent ∆~r = c∆t und ∆~r 0 = c∆t0 , oder noch
2
2
∆~r = c2 ∆t2 und ∆~r 0 = c2 ∆t02 .
Betrachtet man infinitesimal benachbarte Punkte P1 und P2 , und dementsprechend ein infinitesimales Zeitintervall für die Lichtpropagation, so kann man die Änderungen ∆~r, ∆t, usw. durch kleine
Variationen d~r, dt, usw. ersetzen. Dann lässt sich die obige Beziehung als
d~r 2 − c2 dt2 = d~r 02 − c2 dt 02 = 0.
umschreiben. Sei
ds2 ≡ −c2 dt2 + d~r 2 .
(V.3a)
Gemäß der obigen Diskussion muss dieses infinitesimale Linienelement dasselbe — und hier gleich
Null — für beide Beobachter sein, damit beide dieselbe Lichtgeschwindigkeit im Vakuum messen.
Seien jetzt P1 , P2 zwei beliebige Punkte derart, dass in beiden Orten zu gegebenen Zeitpunkten
etwas passiert. Für den Beobachter in B bzw. B 0 findet das „erste“ Ereignis zur Zeit t1 bzw. t01 statt,
als sich der Punkt P1 bei der Position ~r1 bzw. ~r10 befindet. Wiederum sind die jeweiligen Zeit- und
Ortskoordinaten des „zweiten“ Ereignisses t2 ≡ t1 + dt und ~r2 ≡ ~r1 + d~r bzw. t02 ≡ t01 + dt0 und
~r20 ≡ ~r10 + d~r 0 . Dabei wird nichts über die Vorzeichen von dt und dt0 angenommen.
Das Linienelement ds2 bzw. ds02 zwischen den beiden Ereignissen für den Beobachter in B bzw.
0
B kann wieder über Gl. (V.3a) definiert werden. Wenn B und B 0 beide Inertialsysteme sind, dann
müssen ds2 und ds02 gleich sein.
103
V.2 Lorentz-Transformationen
Diese Anforderung, die hier postuliert wird, wurde oben heuristisch hergeleitet für den Fall zweier
Ereignisse, welche den aufeinanderfolgenden Emission und Detektion von Licht entsprechen.
V.2.2 Lorentz-Transformationen
In der Transformation der Zeit- und Ortskoordinaten zwischen zwei Inertialsystemen muss das
oben definierte Linienelement ds2 invariant bleiben.
Definition: Die linearen Transformationen
c dt0
c dt
=Λ
d~r 0
d~r
(V.4)
mit Λ einer 4 × 4-Matrix, die das Linienelement ds2 ≡ −c2 dt2 + d~r 2 invariant lassen, heißen
Lorentz-Transformationen.
Es gibt zwei Haupttypen solcher Transformationen, und zwar einerseits Drehungen (§ V.2.2 a) —
unter welchen das Zeitintervall dt sich nicht ändert — und Lorentz-Boosts (§ V.2.2 b).
V.2.2
a Drehungen
::::::::::::::::::
Einfache Lorentz-Transformationen sind die Drehungen der Raumkoordinaten, welche die Zeit
invariant lassen, und somit den Drehungen im dreidimensionalen Ortsraum der nicht-relativistischen
Mechanik entsprechen. Solche Transformationen gelten für zwei Koordinatensysteme, die sich relativ
zueinander nicht bewegen, deren Achsen aber nicht parallel sind.
Die assoziierte Transformationsmatrix lautet
1 0
(V.5)
Λ=
0 R
mit R einer 3 × 3-Drehmatrix. In der Tat führt
c dt
c dt0
=
R d~r
d~r 0
(V.6)
mit der Bedingung R T R = 13 sofort zu d~r 02 − c2 dt 02 = d~rT R TR d~r − c2 dt2 = d~r 2 − c2 dt2 .
V.2.2
b Lorentz-Boosts
:::::::::::::::::::::::
Sei jetzt angenommen, dass die Achsen des Koordinatensystems von B 0 parallel zu den Achsen
von B sind. Jetzt bewegt sich B 0 relativ zu B mit Geschwindigkeit ~u. Der Einfachheit halber wird
angenommen, dass die x = x0 -Richtung der Koordinaten entlang der Bewegungsrichtung liegt, d.h.
~u = u~ex .
y
B
t
y0
B0
t0
x
O
~r
z
•
P
~u
z0
Abbildung V.1
x0
O0
~r 0
104
Mathematischer Apparat der Speziellen Relativitätstheorie
Da nichts in den Richtungen y = y 0 und z = z 0 senkrecht zur Bewegung passiert, bleiben die
Koordinaten eines Punkts entlang dieser Achsen unverändert in der Transformation von B nach B 0 .
Demzufolge gelten dy 0 = dy und dz 0 = dz für das Intervall zwischen benachbarten Punkten. Diese
senkrechten Richtungen sollen sich auch nicht mit den anderen Koordinaten mischen, d.h. dt0 , dx0
sind unabhängig von dy, dz.
Daher ist die gesuchte Matrix der Transformation der Art

 


c dt0
A B 0 0
c dt
 dx0  C D 0 0 dx 

 


 dy 0  =  0 0 1 0 dy 
dz 0
0 0 0 1
dz
mit A, B, C, D drei reellen Zahlen. Dann lautet das Linienelement in B 0
ds02 = −(Ac dt + B dx)2 + (Cc dt + D dx)2 + dy 2 + dz 2
= −(A2 − C 2 )c2 dt2 + (D2 − B 2 ) dx2 + 2(CD − AB)c dt dx + dy 2 + dz 2 ,
was gleich ds2 = −c2 dt2 + dx2 + dy 2 + dz 2 sein muss. Beliebige dt und d~r genügen dieser Gleichung
nur genau dann, wenn das System

2
2

A − C = 1
D2 − B 2 = 1


CD − AB = 0
erfüllt wird.
Seien A ≡ γ und B ≡ −βγ.
p Dann stellen sie mit C =B = −βγ und D = A = γ eine Lösung des
2
Systems dar,
wenn γ = 1/ 1 − β ist. Dazu soll β = ~u /c, um den richtigen nicht-relativistischen
Limes u = ~u c wiederzufinden (s. unten). Schließlich lautet die Matrix für ein Lorentz-Boost,
auch spezielle Lorentz-Transformation genannt,


γ
−βγ 0 0
−βγ
γ
0 0

Λ=
(V.7a)
 0
0
1 0
0
0
0 1
mit
1
γ=p
1 − β2
,
β≡
u
.
c
(V.7b)
γ heißt Lorentz-Faktor des Boosts.
Im nicht-relativistischen Limes u c, d.h. β 1, gibt eine Taylor-Entwicklung
1
β2
p
∼ 1+
+ O(β 4 ),
2
2
1 − β β1
(V.8)
so dass βγ ∼ β + O(β 3 ) ist. Aus Gl. (V.4) und der Form (V.7a) des Lorentz-Boosts folgen dann
c dt0 = c dt + O(β) und dx0 = −βc dt0 + dx + O(β 2 ).
Die erste Gleichung gibt t0 = t + Konstante, während die zweite mit β = u/c zu dx0 = dx − u dt
oder äquivalent x0 = x − ut führt, entsprechend dem bekannten nicht-relativistischen Ergebnis
für ein Galilei-Boost entlang der x-Achse.
Bemerkung: Rapidität des Lorentz-Boosts... später!
ξu ≡ artanh
u
1 c+u
= ln
.
c
2 c−u
(V.9)
105
V.2 Lorentz-Transformationen
V.2.2
c Lorentz-Gruppe
:::::::::::::::::::::::
Allgemeiner bilden die linearen Transformationen (ct,~r) → (ct0 ,~r 0 ), die das Linienelement ds2
[Gl. (V.3a)] invariant lassen, eine Gruppe, die Lorentz-Gruppe.
Wie wir unten (§ V.2.4 b) sehen werden, lassen sich diese Transformationen noch äquivalent
dadurch charakterisieren, dass ihre Matrixdarstellung Λ die Gleichung
η = ΛT ηΛ
(V.10)
erfüllen, wobei η in Gl. (V.18) definiert ist. Dass die Menge solcher Matrizen versehen mit der
üblichen Matrixmultiplikation eine Gruppe bilden ist dann schnell bewiesen:
• Die 4 × 4-Einheitsmatrix 14 — entsprechend der Identitätstransformation — genügt die Beziehung (V.10).
• Wenn Λ1 , Λ2 die Gl. (V.10) erfüllen, dann gilt das noch für ihr Produkt Λ1 Λ2 .
• Aus Gl. (V.10) folgt |det Λ| = 1, d.h. Λ ist invertierbar; die inverse Matrix Λ−1 erfüllt trivial
die definierende Beziehung.
Die Lorentz-Gruppe wird oft mit O(1,3) bezeichnet.
Sowohl die Drehungen des § V.2.2 a als die Lorentz-Boosts des § V.2.2 b, die je eine Untergruppe der Lorentz-Gruppe bilden, sind sog. eigentliche orthochrone Lorentz-Transformationen,
Elemente der eigentlichen orthochronen Lorentz-Gruppe SO+ (1,3).(30) Bei den eigentlichen LorentzTransformationen handelt es sich um solche mit Determinante +1; diese bilden die eigentliche
Lorentz-Gruppe, die mit SO(1,3) bezeichnet wird.
Wiederum sind die orthochronen Lorentz-Transformationen diejenigen, welche die Richtung der
Zeitkomponente nicht ändern. Das heißt, das Matrixelement oben links in der Matrixdarstellung
0
Λ — das in Abschn. V.3 mit Λ0 0 bezeichnet wird — muss positiv, und in der Tat größer gleich 1,
sein. Diese Transformationen bilden die orthochrone Lorentz-Gruppe O+ (1,3).(30)
Beispiele von uneigentlichen (det Λ = −1) Lorentz-Transformationen sind einerseits die Raumspiegelung (ct,~r) → (ct0 = ct,~r 0 = −~r) mit der Matrixdarstellung


1 0
0
0
0 −1 0
0

ΛP = 
(V.11)
0 0 −1 0 
0 0
0 −1
und andererseits die Zeitumkehr (ct,~r) → (ct0 = −ct,~r 0 =~r) mit Matrixdarstellung


−1 0 0 0
 0 1 0 0

ΛT = 
 0 0 1 0 ,
0 0 0 1
(V.12)
die offensichtlich auch nicht orthochron ist. Dann ist die (kommutierende) Verknüpfung beider
Transformationen, mit Matrixdarstellung ΛP ΛT = −14 , eine nicht-orthochrone eigentliche LorentzTransformation.
Mathematisch stellen die eigentliche orthochrone Lorentz-Gruppe SO+ (1,3) und die drei Mengen
SO− (1,3) ≡ {ΛP ΛT Λ, Λ ∈ SO+ (1,3)}, {ΛP Λ, Λ ∈ SO+ (1,3)} und {ΛT Λ, Λ ∈ SO+ (1,3)} die
vier Zusammenhangskomponenten der Lorentz-Gruppe O(1,3) dar, entsprechend jeweils den vier
Möglichkeiten ++, +−, +−, −+ für die Vorzeichen der Determinante det Λ und des Matrix0
elements Λ0 0 .
(30)
Statt O+ (1,3) bzw. SO+ (1,3) wird auch die Notation SO↑ (1,3) bzw. SO↑ (1,3) benutzt.
106
Mathematischer Apparat der Speziellen Relativitätstheorie
V.2.3 Folgerungen
V.2.3
a Zeitdilatation
::::::::::::::::::::
V.2.3
b Längenkontraktion
::::::::::::::::::::::::::
→ Aufgabe 30
V.2.3
c Additionstheorem für Geschwindigkeiten
:::::::::::::::::::::::::::::::::::::::::::::::::
→ Aufgabe 34
V.2.4 Minkowski-Raum
Wegen der Absolutheit von Zeit und Raum in der Newton’schen Mechanik faktorisiert sich die
zugehörige nicht-relativistische Raumzeit in das Produkt einer eindimensionalen Zeit-Geraden mit
dem dreidimensionalen euklidischen OrtsraumE 3 . Dagegen mischen die Lorentz-Boosts die Zeit und
die Ortskomponenten eines Beobachters miteinander. Demzufolge lohnt es sich, die Zeit und die drei
Ortskoordinaten als Komponenten eines Vektors in einer vierdimensionalen reellen Raumzeit M 4 .
V.2.4
a Viererortsvektor
::::::::::::::::::::::::
Ein Punkt in M 4 , entsprechend einem Zeitpunkt und einem Ort, wird Ereignis genannt. Sei B ein
Bezugssystem, versehen mit einem Koordinatensystem, wobei die räumliche Koordinaten kartesisch
sind. Nach deren Angabe lässt sich ein Ereignis durch seinen Viererortsvektor x mit Komponenten xµ
mit µ = 0, 1, 2, 3 charakterisieren, wobei x0 = ct, während die xi mit i = 1, 2, 3 die Koordinaten des
Ortsvektors ~r sind. Der Kurze halber wird hiernach für die Zerlegung in Zeit- und Ortskoordinaten
die Notation
 0
x
x1 
ct

(V.13)
x≡
x2  = ~r
x3
benutzt.
Definition: Die Trajektorie eines Massenpunktes in der Raumzeit heißt Weltlinie.
Betrachte man einen bewegten Massenpunkt und B0 ein Inertialsystem, das momentan mit dem
Ruhesystem des Massenpunktes übereinstimmt. Das heißt, dass der Massenpunkt relativ zu B0
momentan ruht. Sei τ die Zeit in B0 ; τ heißt Eigenzeit des Massenpunktes, und das Linienelement
entlang der Weltlinie des Massenpunktes lässt sich momentan als ds2 = −c2 dτ 2 schreiben.
Sei t die Zeit in einem Inertialsystem B, relativ zu welchem der Massenpunkt (oder äquivalent
das Inertialsystem B0 ) sich mit Geschwindigkeit ~v bewegt. Das Eigenzeitelement dτ hängt mit dem
infinitesimalen Zeitintervall dt in B über
r
~v 2
dτ = 1 − 2 dt
(V.14)
c
zusammen, wie sich mithilfe der Lorentz-Transformation von B0 nach B finden lässt.
V.2.4
b Metrischer Tensor
::::::::::::::::::::::::::
Bezeichnet man dann mit dx die Verschiebung zwischen zwei benachbarten Ereignissen in M 4 ,
dann lässt sich das Linienelement (V.3a) als
ds2 = − dx0
2
+ dx1
2
+ dx2
schreiben, mit dxµ , µ = 0, 1, 2, 3 den Koordinaten von dx.
2
+ dx3
2
(V.15)
107
V.2 Lorentz-Transformationen
Für µ, ν = 0, 1, 2, 3 definiert man ηµν durch


η00 = −1
ηii = +1 für i = 1, 2, 3


ηµν = 0 für µ 6= ν.
(V.16)
Mithilfe dieser Zahlen lautet das Linienelement (V.15) noch
ds2 = ηµν dxµ dxν ,
(V.17)
wobei die Summe über alle Werte von µ und ν von 0 bis 3 nicht geschrieben wurde.
In Matrixdarstellung wird ηµν zum Element der (µ+ 1)-ten Zeile und (ν +1)-ten Spalte einer
4×4-Matrix:


−1 0 0 0
 0 1 0 0

η=
(V.18)
 0 0 1 0
0 0 0 1
und das Linienelement wird zu
ds2 = dxT η dx
(V.19)
mit dxT dem Zeilenvektor mit Elementen dxµ .
Die 16 Zahlen ηµν sind die Komponenten des metrischen Tensors (31) η . Dieser dient dazu, ein
(pseudo-)skalares Produkt zu definieren, vgl. § V.3.2 c, welches unter Lorentz-Transformationen der
Koordinaten invariant bleibt. Wiederum bedeutet dies, dass der metrische Tensor unter solchen
Koordinatentransformationen x → x0 = Λx bzw. dx → dx0 = Λdx invariant bleibt, d.h. dass seine
Komponenten gleich bleiben. nach Einsatz von dx0 und dx0T in Beziehung (V.19) ergibt sich die
Matrixgleichung
ΛT ηΛ = η.
(V.20)
Die Raumzeit M 4 versehen mit dem metrischen Tensor η heißt Minkowski (v) -Raum. Wiederum
ist ein System von Minkowski-Koordinaten ein Koordinatensystem in M 4 , in welchem die Komponenten des metrischen Tensors die einfache Form (V.16) annehmen(32) — was im Folgenden immer
der Fall sein wird.
Bemerkungen:
∗ Ein Merkmal des Minkowski-Raums M 4 der Speziellen Relativitätstheorie ist die Existenz von
globalen Minkowski-Koordinatensystemen, deren Koordinaten überall und zu jeder Zeit gelten —
obwohl M 4 mathematisch kein Vektorraum, sondern eine vierdimensionale Mannigfaltigkeit ist.
∗ In diesem Skript wurde der metrische Tensor nach den Lorentz-Transformationen eingeführt;
jedoch die logische Herangehensweise, die oben nur implizit benutzt wurde, geht eher in die andere
Richtung: der metrische Tensor wird zunächst postuliert, dann sind die Lorentz-Transformationen
die zugehörigen Isometrien, d.h. die linearen Koordinaten, die das entsprechende Skalarprodukt
invariant lassen. Dementsprechend kann die Matrixgleichung (V.20) eigentlich als die definierende
Beziehung der Lorentz-Transformationen betrachtet werden.
∗ Hier wurden für den metrischen Tensor und seine natürliche Matrixdarstellung unterschiedliche
Notationen η bzw. η verwendet, um den Unterschied zwischen den beiden mathematischen Objekten
zu betonen.
(31)
(32)
(v)
Oder kurz Metrik .
Das heißt, dass die zugehörigen Basisvektoren ein orthonormiertes System bilden.
H. Minkowski, 1864–1909
108
Mathematischer Apparat der Speziellen Relativitätstheorie
V.3 Vierervektoren und Vierertensoren
Die in Abschn. V.2 eingeführten Lorentz-Transformationen geben die Beziehungen zwischen den
Minkowski-Koordinaten eines gegebenen Ereignisses bezüglich zwei verschiedener Inertialsysteme B
und B 0 . In diesem Übergang von B nach B 0 können sich die mathematischen Darstellungen physikalischer Größen nicht nur wie der Viererortsvektor x, sondern auch anders transformieren.
Der Kürze halber wird hiernach die Redensart „unter Lorentz-Transformationen“ statt „im Übergang von einem Inertialsystem zu einem anderen“ verwendet, wobei die besagte Transformation
diejenige für die Viererortsvektoren [Gl. (V.22)] ist.
V.3.1 Lorentz-Skalare
Definition: Ein Lorentz-Skalar oder Viererskalar ist eine Größe, die invariant unter Transformationen
von einem Inertialsystem zu einem anderen ist.
Ein erstes Beispiel davon ist (definitionsgemäß!) das Linienelement (V.3a) bzw. (V.17). Demzufolge ist das Eigenzeitelement dτ ebenfalls ein Lorentz-Skalar.
Ein weiteres Beispiel ist das Vierervolumenelement d4 x, definiert durch
d4 x ≡ dx0 dx1 dx2 dx3 .
(V.21)
Wenn der 4-Ortsvektor sich gemäß x → x0 = Λx transformiert, entsprechend Gl. (V.22b) für die
Koordinaten, dann transformiert sich das 4-Volumenelement gemäß
d4 x → d4 x0 = |det Λ| d4 x,
woraus das Ergebnis dank |det Λ| = 1 folgt.
Bemerkung: Man definiert auch Lorentz-Pseudoskalare, die invariant unter der eigentlichen Lorentz-
Gruppe sind, jedoch unter uneigentlichen Transformationen wie Raumspiegelung oder Zeitumkehr
ihr Vorzeichen ändern.
V.3.2 Vierervektoren
Der Viererortsvektor x mit Komponenten xµ [Gl. (V.13)] ist ein erstes Beispiel von Vierervektor,
der sich im Übergang von einem Inertialsystem B nach einem zweiten Inertialsystem B 0 gemäß
x → x0 = Λx
(V.22a)
mit Λ einer Lorentz-Transformation transformiert, entsprechend für die Koordinaten
0
0
xµ → xµ = Λµν xν
für µ0 = 00 , 10 , 20 , 30 .
(V.22b)
Wie es sich herausstellt, gibt es zwei unterschiedliche Arten von Vierervektoren, die sich entweder
wie x oder wie der damit assoziierte Vierergradient transformieren.
Bemerkungen:
∗ Aus Gl. (V.22b) folgt die Beziehung
0
0
Λµν
∂xµ
=
∂xν
∀µ0 , ν.
(V.23)
∗ In der Tat sind die Lorentz-Transformationen nicht die einzigen linearen Transformationen, die
das Linienelement (V.3a) invariant lassen. Daneben gibt es noch die affinen Transformationen der
Poincaré (w) -Gruppe (oder inhomogenen Lorentz-Gruppe) ISO(1,3), der Form
x → x0 = Λx + a
(w)
H. Poincaré, 1854–1912
(V.24a)
109
V.3 Vierervektoren und Vierertensoren
mit a einem Vierervektor; komponentenweise lautet diese Transformation
0
0
0
xµ → xµ = Λµν xν + aµ .
(V.24b)
Die Poincaré-Transformationen mit Λ = 14 und beliebigem a sind offensichtlich die RaumzeitTranslationen.
V.3.2
a Kontravariante Vierervektoren
::::::::::::::::::::::::::::::::::::::
Definition: Ein sog. kontravarianter Vierervektor V ist eine Menge aus vier Zahlen V µ , die sich unter
Lorentz-Transformationen wie die Koordinaten xµ des Viererortsvektors transformieren, d.h.
0
0
V µ → V µ = Λµν V ν ,
(V.25a)
V → V0 = ΛV.
(V.25b)
oder in Matrixform
Ein Beispiel ist die Vierergeschwindigkeit u, eines massiven Teilchens (Massenpunktes) entlang
seiner Weltlinie x(s), die als
dx(s)
u≡
(V.26a)
dτ
definiert ist, mit s einer Parametrisierung der Weltlinie und τ der Eigenzeit des Teilchens. Komponentenweise lautet diese Definition
dX µ (s)
uµ ≡
(V.26b)
dτ
mit uµ bzw. xµ (s) den Koordinaten der Vierergeschwindigkeit bzw. der Weltlinie. Dass u ein kontravarianter Vierervektor ist, folgt aus der Tatsache, dass das Eigenzeitelement dτ im Zähler ein
Lorentz-Skalar ist.
Wenn v i , i = 1, 2, 3 die Komponenten der dreidimensionalen Geschwindigkeit ~v des Teilchens
und γ den damit assoziierten Lorentz-Faktor bezeichnen, dann lauten die Koordinaten der Vierergeschwindigkeit u0 = γc und ui = γv i für i = 1, 2, 3, d.h.
γc
u=
.
(V.27)
γ~v
Bemerkung: Für ein masseloses Teilchen, z.B. ein Photon, wird die Vierergeschwindigkeit nicht
definiert, da solche Teilchen kein Ruhesystem haben, in welchem die Eigenzeit definiert werden
kann: sie bewegen sich entlang lichtartige Weltlinien (s. unten).
V.3.2
b Kovariante Vierervektoren
::::::::::::::::::::::::::::::::::
Seien ∂µ ≡ ∂ /∂xµ die Komponenten des Vierergradient-Operators:
∂
1∂
∂
, ∂i ≡
=
für i = 1, 2, 3,
(V.28)
0
∂x
c ∂t
∂xi
wobei die drei räumlichen Komponenten genau die Koordinaten des dreidimensionalen Gradienten
sind.
Mithilfe der Kettenregel gilt unter der Transformation (V.22)
∂0 ≡
0
∂ν ≡
∂xρ ∂
∂
ρ0 ∂
ρ0
=
0 = Λ ν
0 = Λ ν ∂ρ0 .
ν
ν
ρ
ρ
∂x
∂x ∂x
∂x
(V.29)
Sei Λµρ0 das (µ, ρ0 )-Element der inversen Matrix Λ−1 , d.h.
0
Λµρ0 Λρ ν = δνµ
0
0
und Λµρ Λρ ν 0 = δνµ0 .
(V.30)
Multipliziert man Gl. (V.29), die für jedes ν ∈ {0, 1, 2, 3} gilt, mit Λν µ0 und summiert man über ν,
110
Mathematischer Apparat der Speziellen Relativitätstheorie
so ergibt sich
0
0
Λν µ0 ∂ν = Λν µ0 Λρ ν ∂ρ0 = δµρ 0 ∂ρ0 ,
d.h.
∂µ0 = Λν µ0 ∂ν .
(V.31)
Somit transformiert sich der Vierergradient mit Λ−1 , wenn der Ortsvektor sich mit Λ transformiert.
Definition: Ein kovarianter Vierervektor ist eine Menge aus vier Größen Wµ , die sich unter Lorentz-
Transformationen wie die Komponenten ∂µ des Vierergradienten verhalten, d.h.
Wµ → Wµ0 = Λν µ0 Wν .
(V.32)
Jedem kontravarianten Vierervektor mit Koordinaten V µ kann man einen kovarianten Vierervektor mit Komponenten Vµ gemäß
Vµ = ηµν V ν
(V.33)
zuordnen.
In einer Basistransformation ändern sich V ν bzw. ηµν gemäß
0
0
V ν → V ν = Λν ρ V ρ
bzw.
ηµν → ηµ0 ν 0 = Λµµ0 Λν ν 0 ηµν
vgl. Gl. (V.25a) bzw. (V.42). Dann kommt
0
0
Vµ → Vµ0 = ηµ0 ν 0 V ν = Λµµ0 Λν ν 0 ηµν Λν ρ V ρ = Λµµ0 ηµν δρν V ρ ,
wobei die letzte Gleichung aus Gl. (V.30) folgt. Schreibt man dann ηµν δρν V ρ = ηµν V ν = Vµ , so
ergibt sich
Vµ → Vµ0 = Λµµ0 Vµ ,
2
was zu beweisen war.
Umgekehrt kann mit jedem kovarianten Vierervektor mit Komponenten Vµ der kontravariante
Vierervektor mit Komponenten
V µ = η µν Vν
(V.34)
assoziiert werden, mit η µν den Komponenten des inversen metrischen Tensors η−1 , die numerisch
gleich den ηµν sind, vgl. § V.3.3 b. Unter Verwendung des metrischen Tensors (V.16) findet man
V0 = −V 0 ,
V1 = V 1 ,
V2 = V 2 ,
V3 = V 3 .
(V.35)
Bemerkungen:
∗ Bezeichnet man den 4-komponentigen Zeilenvektor mit Koordinaten Wµ mit W, so lässt sich die
e
Transformation (V.32) noch in Matrixdarstellung als
W → W0 = W Λ−1
e
e
e
schreiben. Dann lautet Gl. (V.33) bzw. (V.34)
(V.36)
V = VT ηT bzw. V = η−1 VT ,
(V.37)
e
e
T
wobei η in der ersten Gleichung durch η ersetzt werden kann, weil der metrische Tensor — und
damit seine Matrixdarstellung — symmetrisch ist. Mit dieser Änderung ist die zweite Gleichung die
transponierte der ersten.
∗ Kontravariante und kovariante Vierervektoren sind Elemente unterschiedlicher Vektorräume,
auch wenn sie die gleiche physikalische Dimension haben — wie z.B. kontravariante und kovariante
Vierergeschwindigkeiten. Der metrische Tensor η und sein Inverse η−1 bilden zwar eine Bijektion
zwischen diesen Vektorräumen, so dass man kurz nur von „Vierervektoren“ sprechen kann, ohne
kontra- oder kovariant zu präzisieren. Man darf aber kontra- und kovariante Vektoren nicht miteinander addieren oder gleich setzen: Ausdrücke wie aµ + bµ oder aµ = bµ sind sinnlos — wenn es sich
dabei nicht um numerische Gleichungen handelt, die nur in einem Bezugssystem gelten.
V.3 Vierervektoren und Vierertensoren
111
V.3.2
c Viererprodukt
:::::::::::::::::::::
Seien V µ bzw. Wµ die Komponenten eines kontravarianten bzw. kovarianten Vierervektors. Die
Transformationsgesetze (V.25a) und (V.32) zeigen, dass die Kombination Wµ V µ , mit Summe über
µ = 0, 1, 2, 3, ein Lorentz-Skalar ist. Dieses Skalar wird Viererprodukt der beiden Vierervektoren
genannt, oder auch Lorentz-Skalarprodukt — etwa uneigentlich, da es sich eher um ein PseudoSkalarprodukt handelt.
Da Wµ V µ = W µ ηµν V ν = W ν Vν = W µ Vµ ist, spielt es hier keine Rolle, welcher Index oben und
welcher unten ist, so lange es einen oben und einen unten gibt. Komponentenweise gilt
Wµ V µ = −W 0 V 0 + W 1 V 1 + W 2 V 2 + W 3 V 3 = W µ Vµ .
(V.38a)
Unter Verwendung der Matrixdarstellungen W bzw. V für den kovarianten bzw. kontravarianten
e als W V µ = W V schreiben. Ein Nachteil dieser
Vierervektor, lässt sich das Viererprodukt noch
µ
e
Schreibweise ist, dass die Multiplikation zweier Matrizen nicht-kommutativ
ist: W V ist eine Zahl,
µ
V W eine 4 × 4-Matrix. Das heißt, der Gleichung Wµ V = W µ Vµ entspricht WeV = V W, wobei
e führt
e man eine
diee Symmetrie bezüglich des Austauschs der Vierervektoren verloren wird. Somit
weitere Notation, ähnlich dem Skalarprodukt von zwei Dreiervektoren im euklidischen Raum:
Wµ V µ = W V ≡ W · V.
(V.38b)
e
Dann gilt problemlos W · V = V · W. Man sollte aber dabei nicht vergessen, dass es sich trotz
der Notation um das Lorentz -Skalarprodukt handelt, nicht um das euklidische, d.h. dass es ein
Minus-Zeichen vor dem Produkt der zeitlichen Komponenten gibt.
Bemerkung: Im Gegensatz zum Viererprodukt Wµ V µ sind die Kombinationen W µ V µ und Wµ Vµ
keine Skalare unter Lorentz-Transformation, d.h. sie nehmen unterschiedliche Werte in unterschiedlichen Inertialsystemen an.
Ein erstes Beispiel von Viererprodukt ist die Kombination ∂µ j µ (x), mit ∂µ den Komponenten
des Vierergradienten und j µ (x) die Koordinaten eines Feldes, das in jedem Punkt x eines Gebiets
der Raumzeit M 4 definiert ist:
∂µ j µ (x) =
∂j µ (x)
∂j 0 (x) ∂j 1 (x) ∂j 2 (x) ∂j 3 (x)
1 ∂j 0 (t,~r) ~
=
+
+
+
=
+ ∇ · ~(t,~r),
∂xµ
∂x0
∂x1
∂x2
∂x3
c
∂t
(V.39)
wobei der Dreiervektor ~ die räumlichen Komponenten j i des Vierervektors j zusammenfasst, wäh~ die (Dreier-)Divergenz dieses Vektorfeldes darstellt. In Analogie mit dem dreidimensionalen
rend ∇·
Fall heißt ∂µ j µ (x) ≡ 6 · j(x) Viererdivergenz des Vierervektorfeldes j.
Lorentz-Quadrat
Ein weiteres, wichtiges Beispiel von Viererprodukt ist der skalare Lorentz-Quadrat eines Vierervektors:
2
2
2
2
V 2 ≡ Vµ V µ = − V 0 + V 1 + V 2 + V 3 ,
(V.40)
der denselben Wert in allen Inertialsystemen annimmt. Beispielsweise beträgt der Lorentz-Quadrat
einer Vierergeschwindigkeit (V.26) immer u2 = uµ uµ = −c2 . Das Linienelement ds2 ist ebenfalls ein
Lorentz-Quadrat.
Definition: Je nach dem Vorzeichen des Lorentz-Quadrats unterscheidet man zwischen drei Arten
von Vierervektoren:
• zeitartige Vierervektoren, mit negativem Lorentz-Quadrat V2 < 0;
• lichtartige Vierervektoren, auch Nullvektoren genannt, mit Lorentz-Quadrat V2 = 0;
• raumartige Vierervektoren, mit positivem Lorentz-Quadrat V2 > 0.
112
Mathematischer Apparat der Speziellen Relativitätstheorie
Zum Beispiel ist die Vierergeschwindigkeit eines Massenpunktes ein zeitartiger Vierervektor.
Der Unterschied zwischen den drei Arten ist insbesondere wichtig wenn der Vierervektor dem
Abstandsvektor zwischen zwei Ereignissen P1 und P2 entspricht. Im Fall einer zeitartigen Separation
kann man immer ein Inertialsystem B derart finden, dass die Weltlinie seines Ursprungspunkts
durch P1 und P2 geht. Somit ist das eine Ereignis in der Zukunft des anderen, z.B. t2 > t1 : die
zwei Ereignisse sind miteinander kausal verknüpft, d.h. was im einen passiert kann das andere
beeinflussen.
Falls der Abstandsvektor raumartig ist, kann ein solches Inertialsystem nicht gefunden werden.
Angenommen, dass das Vakuumlichtgeschwindigkeit die maximale Ausbreitungsgeschwindigkeit von
Signalen ist, kann kein aus P1 ausgesandte Signal P2 erreichen, und umgekehrt. Eigentlich gibt es
in diesem Fall Inertialsystemen, in denen t1 < t2 , während in anderen Inertialsystemen t2 < t1 gilt:
keines der Ereignisse liegt auf absoluter Weise in der Zukunft des anderen. Dementsprechend darf
nicht mehr von der Gleichzeitigkeit zweier Ereignisse geredet werden, denn t1 = t2 in einem ersten
Inertialsystem wird in einem anderen Bezugssystem zu t01 < t02 oder t001 > t002 .
Schließlich kann im Fall eines lichtartigen Abstandsvektors zwischen Ereignissen Licht von dem
einen zum anderen propagieren, so dass die Ereignisse noch im kausalen Zusammenhang stehen.
Vom Standpunkt eines Ereignisses P0 kann somit die Raumzeit in unterschiedlichen Bereichen
zerlegt werden (vgl. Abb. V.2) Die Ereignisse, die in lichtartigem Abstand von P0 sind, bilden
die Lichtkegel .(33) Innerhalb der letzteren, d.h. in zeitartigem Abstand von P0 , befinden sich die
Ereignisse, die im kausalen Zusammenhang mit P0 sind, und zwar entweder in seiner Zukunft —
wie P1 in Abb. V.2 — oder in der Vergangenheit, wie P2 . Dagegen sind die Ereignisse außerhalb
der Lichtkegel — d.h. in raumartigem Abstand von P0 , wie P3 — kausal entkoppelt von P0 .
Li
Zukunft
ch
tk
eg
el
x0
• P1
„anderswo“
•
~r
P0
• P3
• P2
Vergangenheit
Abbildung V.2 – Kausalitätsstruktur der Raumzeit: die horizontale Achse steht für die drei
räumlichen Dimensionen, die vertikale Achse für die Zeit im Ruhesystem von P0 .
Bemerkung: Entsprechend dieser Kausalitätsstruktur hängt die Physik in P0 nur von den Ereignissen
innerhalb der „vergangenen Lichtkegel“ ab: instantane Fernwirkung wird somit ausgeschlossen.
(33)
Um die Kegel zu erkennen, muss sich die Leserin erstens eine Raumzeit mit einer zeitlichen Richtung — die
der Achse der Kegel entspricht — und nur zwei räumlichen Richtungen vorstellen; dann kann sie die dritte
Raumdimension hinzufügen.
113
V.3 Vierervektoren und Vierertensoren
V.3.3 Vierertensoren
Auf dem euklidischen Raum E 3 der nicht-relativistischen Mechanik gibt es „Dreier-“Tensoren
höherer Stufe, die sich unter Drehungen alle gleich transformieren. Ähnlich existieren auf der
Minkowski-Raumzeit M 4 Vierertensoren bzw. Lorentz-Tensoren mit bestimmten Transformationsgesetzen unter Lorentz-Transformationen.
Diese Vierertensoren können vom Typ m
n , oder „m-fach kontravariant und n-fach kovariant“,
sein, d.h. ihre Komponenten besitzen m ≥ 0 kontravariante und n ≥ 0 kovariante Indizes, wobei
jeder Index sich wie ein entsprechender Vierervektor transformiert.(34) Beispielsweise transformiert
sich der Vierertensor dritter Stufe mit Komponenten T µνρ wie V µ V ν Vρ .
Insbesondere lautet das Transformationsgesetz für einen Lorentz-Tensor vom Typ 02 , unter
Verwendung der Gl. (V.32),
Tµν → Tµ0 ν 0 = Λµµ0 Λν ν 0 Tµν .
(V.41a)
In Matrixform kann ein solcher Vierertensor zweiter Stufe durch eine quadratische 4×4-Matrix T
mit Elementen Tµν dargestellt werden; dann lautet die Transformation
T → T0 = ΛT TΛ,
(V.41b)
wie aus der Gleichung Λµµ0 Λν ν 0 Tµν = Λµµ0 Tµν Λν ν 0 = (ΛT )µµ0 Tµν Λν ν 0 sofort folgt.
V.3.3
a Metrischer Tensor
::::::::::::::::::::::::::
Der metrische Tensor η wurde schon in Gl. (V.16) über die Angabe seiner Komponenten ηµν in
einem bestimmten System von Minkowski-Koordinaten definiert. Jede dieser Komponenten nimmt
in allen solchen Systemen denselben Wert an, d.h. der metrische Tensor ist invariant unter LorentzTransformationen.
Unter Verwendung des Transformationsgesetzes (V.41a) transformieren sich die Komponenten
von η gemäß
(V.42a)
ηµν → ηµ0 ν 0 = Λµµ0 Λν ν 0 ηµν ,
entsprechend in Matrixdarstellung
η → η0 = ΛT ηΛ.
(V.42b)
Fördert man die Invarianz des metrischen Tensors unter Lorentz-Transformationen, so sollen die
Matrizen η und η0 gleich sein, woraus sich Bedingung (V.20) ergibt.
V.3.3
b Inverser metrischer Tensor
:::::::::::::::::::::::::::::::::::
Dem metrischen Tensor wird der inverse metrische Tensor η−1 zugeordnet, dessen Komponenten
η µν bzw. Matrixdarstellung η−1 derart sind, dass
ηµρ η ρν = η νρ ηρµ = δµν
∀µ, ν = 0, 1, 2, 3 bzw.
ηη−1 = η−1 η = 14
(V.43)
gelten, mit δµν dem üblichen Kronecker-Symbol und 14 der 4×4-Einheitsmatrix. Dabei ist eigentlich
η−1 = η, d.h. numerisch gilt η µν = ηµν für alle möglichen Werte von µ und ν.
Wie in § V.3.2 b schon gesehen wurde lassen sich mithilfe des metrischen bzw. des inversen
metrischen Tensors mit Komponenten ηµν bzw. η µν kontra- bzw. kovariante Lorentz-Indizes heraufbzw. herabziehen, ähnlich den Gleichungen (V.33) und (V.34). Zum Beispiel kann
man aus einem
Tensor vom Typ 02 mit Komponenten Tµν verwandte Tensoren von den Typen 11 und 20 erhalten:
Tµ σ ≡ η σν Tµν ,
T ρν ≡ η ρµ Tµν
und T ρσ ≡ η ρµ η σν Tµν = η ρµ Tµ σ = η σν T ρν .
(V.44)
Wenn Tµν nicht symmetrisch ist, sind die Tensoren mit Komponenten Tµ σ und T ρν a priori unterschiedlich.(35)
(34)
(35)
Vgl. Anhang A.
Bezeichnet T die Matrixdarstellung des Tensors mit Komponenten Tµν , so sind die drei anderen Tensoren jeweils
durch Tη, ηT und ηTη dargestellt, wie die Leserin einfach nachprüfen kann.
114
Mathematischer Apparat der Speziellen Relativitätstheorie
Angewandt auf η µν selber lautet die zweite der Gleichungen (V.44)
η ρν ≡ η ρµ ηµν .
(V.45)
Der Vergleich mit Gl. (V.43) gibt dann η ρν = δµρ .
V.3.3
c Levi-Civita-Tensor
::::::::::::::::::::::::::
Ein anderer invarianter Vierertensor — genauer Pseudotensor , da sein Vorzeichen sich unter
uneigentlichen Lorentz-Transformationen ändert — ist der vollständig antisymmetrische Levi-CivitaTensor 4. Stufe(36)


+1 falls (µ, ν, ρ, σ) eine gerade Permutation von (0,1,2,3) ist
µνρσ
= −1 falls (µ, ν, ρ, σ) eine ungerade Permutation von (0,1,2,3) ist
(V.46)


0
sonst.
Hier sollte beachtet werden, dass 0123 = −0123 , während für den dreidimensionalen Levi–Civita
Tensor 123 = 123 gilt.
Unter einer Lorentz-Transformation Λ transformiert sich dieser Tensor gemäß
0 0 0 0
0
0
0
0
µνρσ → µ ν ρ σ ≡ Λµµ Λν ν Λρ ρ Λσσ µνρσ = (det Λ)µνρσ ,
(V.47)
wobei die letzte Gleichung aus der Definition der Determinante folgt.
V.3.3
d Kontraktion zweier Tensoren
:::::::::::::::::::::::::::::::::::::
Das Herauf- oder Herabziehen von Indizes mithilfe des metrischen Tensors oder seines Inversen
sind Beispiele von Tensorverjüngungen (vgl. § A.1.3 b). Allgemeiner können zwei Tensoren T und
T0 kontrahiert werden, vorausgesetzt der eine (mindestens) einen kovarianten und der andere einen
0 (einfache
kontravarianten Index hat. Dann wird über solche Indizes kontrahiert, wie z.B. T µν Tµρ
µν
Kontraktion) oder µνρσ T (doppelte Kontraktion).
V.3.4 Kovariante Formulierung eines physikalischen Gesetzes
Laut dem ersten Einstein’schen Postulat (V.1) sollen die Naturgesetze mathematisch so formuliert werden, dass die entsprechenden Gleichungen in allen Inertialsystemen die gleiche Form
annehmen. Theorien, die diesem Prinzip genügen, werden als Lorentz- oder relativistisch kovariant
bezeichnet.
Infolgedessen können solche Gleichungen nur Identitäten zwischen Lorentz-Tensoren gleicher
Stufe sein, nachdem alle möglichen Kontraktionen von Indizes berücksichtigt wurden. Solche Gleichungen können entweder „geometrisch“, in Matrixdarstellung (für Vierertensoren der Stufe 1 oder
2) oder komponentenweise geschrieben werden.
Beispiele kovarianter Gleichungen sind somit V = W oder äquivalent V µ = W µ ; oder TV = W
bzw. T µν V ν = W µ . Unter einer Lorentz-Transformation
transformieren sie sich in V0 = W0 bzw.
0
0
0
0
µ0
µ
µ
0
0
0
ν
µ
V = W oder T V = W bzw. T ν 0 V = W , d.h. sie nehmen die gleiche Form an.
Dagegen sind Identitäten wie V µ = T µ ν oder V µ = Wµ keine gültige relativistisch kovariante
Gleichungen, sondern können einen (Tipp-?)Fehler signalisieren. . .
Bemerkung: Manchmal wird statt Lorentz-kovariant die Redensart „Lorentz-invariant“ verwendet.
Streng genommen bedeutet aber die Letztere, dass die Gleichungen unverändert unter den LorentzTransformationen bleiben: dies stellt eine stärkere Bedingung dar, als die Invarianz der Form der
Gleichungen, die nur im Fall einer Gleichung zwischen zwei skalaren Größen erfüllt ist, wie z.B.
u2 = −c2 (für den Lorentz-Quadrat einer Vierergeschwindigkeit).
(36)
Einige Autoren benutzen die Konvention 0123 = +1, entsprechend 0123 = −1. . .
V.3 Vierervektoren und Vierertensoren
115
Literatur zum Kapitel V
• Feynman, Vorlesungen über Physik. Band 1 [22] = Lectures on Physics. Vol. I [23], Kap.
15–17.
• Fließbach, Mechanik [2], Kap. IX.
• Greiner, Klassische Mechanik I [6] Kap. III.
• Landau & Lifschitz, Band II: Klassische Feldtheorie [14] = The classical theory of fields [26],
Kap. I.
• Nolting, Spezielle Relativitätstheorie, Thermodynamik [27], 1. Teil.
• Scheck, Mechanik [18] Kap. 4.
K APITEL VI
Relativistische Mechanik
Der Formalismus des vorigen Kapitels wird nun angewandt, um die charakteristischen Größen
und Funktionen zur Beschreibung der Bewegung eines freien relativistischen Massenpunktes auszudrücken (Abschn. VI.1). Dann wird die relativistische Verallgemeinerung des zweiten Newton’schen
Gesetzes vorgestellt (Abschn. VI.2).
VI.1 Bewegung eines freien relativistischen Teilchens
VI.1.1 Lagrange-Funktion und Wirkung eines freien Teilchens
Die Wirkung S eines physikalischen Systems, insbesondere eines freien Teilchens, ist eine reelle
Zahl. Sie hängt von Größen — Positionen, Geschwindigkeiten — ab, die vom Bezugssystem abhängen. Die einfachste Möglichkeit um sicherzustellen, dass die Extrema der Wirkung immer für
die gleichen physikalischen Trajektorien erreicht werden, entsprechend den physikalisch realisierten
Bewegungen, ist, dass die Wirkung ein Lorentz-Skalar ist, d.h. den gleichen Zahlenwert in allen
Inertialsystemen annimmt.
Betrachte nun einen einzelnen, wechselwirkungsfreien Massenpunkt mit Masse m. Wegen der
Homogenität der Raumzeit — d.h. die Invarianz der Physik unter zeitlichen und räumlichen Translationen — kann seine Lagrange-Funktion L(t, ~x, ~x˙ ) weder von der Zeit noch vom seiner Position
abhängen; d.h. sie ist nur Funktion von seiner Geschwindigkeit ~v = ~x˙ . Die letztere ist zwar nicht
Lorentz-invariant, jedoch die Lagrange-Funktion L selbst ist auch nicht Lorentz-invariant: nur das
Produkt L dt, das zwischen zwei Zeitpunkten integriert wird, soll Lorentz-invariant sein, damit S
ein Lorentz-Skalar ist.
Aus dem vorigen Kapitel kennen wir eine „einfache“ Größe, proportional zum Zeitintervallelement
dt und dazu Funktion der
p Geschwindigkeit, die Lorentz-invariant ist, und zwar das infinitesimal
Eigenzeitintervall dτ = 1 − ~v 2/c2 dt, vgl. Gl. (V.14). Somit ist ein möglicher Ansatz
Z B
S=α
dτ
(VI.1)
A
mit α einer reellen Zahl und A, B zwei Ereignissen der Raumzeit. Diese Wirkung lässt sich noch als
Z tB r
~v 2
S=α
1 − 2 dt
c
tA
umschreiben; daher entspricht der Ansatz einer Lagrange-Funktion
r
~v 2
L=α 1− 2.
c
(VI.2)
Wird eine Taylor-Entwicklung dieser Abhängigkeit für den nicht-relativistischen Limes |~v |/c 1
durchgeführt, so ergibt sich
4 ~v 2
~v
L=α 1− 2 +O 4
.
2c
c
117
VI.1 Bewegung eines freien relativistischen Teilchens
Nach Ausmultiplizieren der Klammer kommt zuerst eine Konstante (α), die keine Rolle bei den
Bewegungsgleichungen spielt. Der nächste Term ist −α~v 2 /2c2 : damit er mit der Lagrange-Funktion
eines nicht-relativistischen freien Teilchens 21 m~v 2 übereinstimmt, soll α gleich −mc2 sein. Somit
lautet die Lagrange-Funktion bzw. die Wirkung eines freien relativistischen Massenpunktes
r
2
L = −mc
~v 2
c2
(VI.3a)
dτ.
(VI.3b)
1−
bzw.
S = −mc
2
Z
B
A
Erfahrung zeigt, dass der Ansatz (VI.3a) die richtige Physik wiedergibt, insbesondere den richtigen
Impuls und die richtige Energie, wie sie im nächsten Paragraphen eingeführt werden.
VI.1.2 Impuls und Energie eines freien Teilchens
VI.1.2
a Impuls
:::::::::::::::
Gemäß der Definition(II.12) ist die i-te Komponente des konjugierten Impulses des Massenpunktes mit Lagrange-Funktion (VI.3a) durch
∂L
∂ ẋi
gegeben, wobei hier die Komponente mit einem kovarianten Index geschrieben wurde, im Einklang
mit der Division durch eine kontravariante Komponente im rechten Glied. Eine einfache Berechnung
gibt dann
pi ≡
m~v
= γm~v
~p = q
2
1 − ~vc2
(VI.4)
mit γ dem Lorentz-Faktor entsprechend der Geschwindigkeit ~v .
VI.1.2
b Energie
::::::::::::::::
Benutzt man nun die Definition (II.25a), so lässt sich die Energie des freien relativistischen
Massenpunktes als
3
X
E=
pi ẋi − L
i=1
bestimmen, d.h.
E=q
mc2
1−
~v 2
c2
= γmc2 .
(VI.5)
In Fall eines ruhenden Massenpunktes ergibt sich E0 = mc2 , entsprechend der Massenenergie.
Wiederum ist die Differenz (γ − 1)mc2 die kinetische Energie eines bewegten Massenpunktes.
VI.1.2
c Viererimpuls
:::::::::::::::::::::
Definiert man p0 ≡ E/c, so bilden p0 , p1 , p2 , p3 ein 4-Tupel von Zahlen, die laut den Gl. (VI.4)
und (VI.5) gleich m mal den Komponenten u0 , u1 , u2 , u3 der Vierergeschwindigkeit (V.27) sind. Da
die Masse m ein Lorentz-Skalar ist, sind die pµ die Komponenten eines Vierervektors p:
pµ = muµ
(VI.6a)
118
Relativistische Mechanik
bzw.
p = mu
mit
p=
!
E/c
~p
(VI.6b)
.
(VI.7)
Dieser Vierervektor heißt Viererimpuls.
Vergleicht man die Gl. (VI.4) und (VI.5), so findet man, dass sich die Geschwindigkeit als
~v =
~p c2
E
(VI.8)
schreiben lässt. Somit ist der nicht-relativistische Limes |~v | c äquivalent zu |~p|c E.
Unter Verwendung der Definition (V.40) und der Gl. (VI.4) und (VI.5) beträgt der LorentzQuadrat p2 des Viererimpulses (VI.7)
p2 ≡ −
E2
+ ~p 2 = −m2 c2 .
c2
(VI.9)
Dies folgt auch sofort aus der Beziehung (VI.6b), die zu p2 = m2 u2 führt, oder aus einer Berechnung
im Ruhesystem des Massenpunktes.
Dieses Ergebnis wird auch oft in der Form
E 2 = ~p 2 c2 + m2 c4
(VI.10)
geschrieben. Ist der erste Term auf der rechten Seite viel kleiner als der zweite, d.h. |~p| mc —
was wiederum äquivalent zu |~p| E/c ist, entsprechend dem nicht-relativistischen Limes —, folgt
aus einer Taylor-Entwicklung
r
p
~p 2
1 ~p 2
1 ~p 2 2
2
2
2
4
2
2
E = m c + ~p c = mc 1 + 2 2 = mc 1 +
−
+ ···
m c
2 m2 c2
8 m2 c2
d.h.
~p 2
(~p 2 )2
−
+ ···
(VI.11)
2m 8m3 c2
Dabei erkennt man als ersten, führenden Term die Massenenergie, dann als nächsten Term die nichtrelativistische kinetische Energie, während der dritte Term (und die nächsten) eine relativistische
Korrektur darstellt. Insbesondere ist im nicht-relativistischen Fall die kinetische Energie viel kleiner
als die Massenenergie — die im nicht-relativistischen Rahmen aber nie ins Betracht gezogen wird,
weil sie nur eine additive Konstante darstellt!
E = mc2 +
Schließlich folgt aus der Invarianz der Wirkung (VI.3b) unter zeitlichen und räumlichen Translationen, dass die Energie und der Impuls Konstanten der Bewegung sind, vgl. § II.3.1 a–II.3.1 b.
Folglich ist der Viererimpuls erhalten, wie man auch direkt aus der Invarianz der Wirkung (VI.3b)
unter den Raumzeittranslationen xµ → xµ + aµ herleiten kann.
Mathematisch lässt sich diese Viererimpulserhaltung als
dp
=0
dτ
bzw.
dpµ
=0
dτ
(VI.12)
ausdrücken: dabei wird die Ableitung nach der Eigenzeit betrachtet, um auf der linken Seite einen
Lorentz-Vektor zu erhalten. Somit ergibt sich eine Gleichung, die in jedem Inertialsystem die gleiche
Form annimmt, wie gemäß dem ersten Einstein’schen Postulat (V.1) der Fall sein soll.
119
VI.2 Kovariante Formulierung des Grundgesetzes der Mechanik
VI.2 Kovariante Formulierung des Grundgesetzes der Mechanik
Wir haben gerade gesehen, dass der Viererimpuls eines freien Massenpunktes erhalten ist, was sich
„relativistisch kovariant“ als Gl. (VI.12) schreiben lässt.
Unterliegt der Massenpunkt Kräften, so sollte sich dieses Ergebnis ändern, denn es ändert sich
im nicht-relativistischen Fall, der als Grenzwert in den relativistischen Gleichungen erhalten ist. Um
die Newton’sche Mechanik zu verallgemeinern, wird ein Vierervektor F eingeführt, die Viererkraft,
mit Komponenten F µ . Im Einklang mit dem nicht-relativistischen Fall sollte eine solche Viererkraft
nur von der Raumzeit-Position x und der Vierergeschwindigkeit u des Massenpunktes abhängen:
F(x, u) bzw.
F µ (xν , uν ).
(VI.13)
Insbesondere wird in Kap. XI die Form der relativistisch kovarianten Formulierung der Lorentz-Kraft
angegeben.
Gegeben eine solche Viererkraft — oder die Resultierende solcher Viererkräfte —, die natürliche relativistisch kovariante Verallgemeinerung des zweiten Newton’schen Gesetzes, die auch in
Abwesenheit von Kraft zur Viererimpulserhaltung (VI.12) führen wird, ist
dp
=F
dτ
(VI.14a)
dpµ
= F µ.
dτ
(VI.14b)
oder äquivalent, komponentenweise
Unter Einführung der Viererbeschleunigung des Massenpunktes
a≡
du
dτ
bzw.
aµ ≡
duµ
dτ
(VI.15)
lässt sich Gl. (VI.14a) bzw. (VI.14b) als
ma = m
du
= F bzw.
dτ
maµ = m
duµ
= F µ.
dτ
(VI.16)
Bemerkung: Damit die Beziehungen (VI.14), (VI.16) erfüllt werden können, dürfen die Komponen-
ten einer Viererkraft nicht beliebig sein. In der Tat folgt aus der Konstanz des Lorentz-Quadrats u2
der Vierergeschwindigkeit, dass diese senkrecht auf die Viererbeschleunigung ist: u · a = uµ aµ = 0.
Somit soll u · F = uµ F µ = 0 gelten, d.h. nur drei Komponenten der Viererkraft sind unabhängig voneinander — z.B. die drei räumlichen Komponenten, die im nicht-relativistischen Limes die
Dreierkraft wiedergeben müssen.
Literatur zum Kapitel VI
• Fließbach, Mechanik [2], Kap. IX.
• Greiner, Klassische Mechanik I [6] Kap. III.
• Landau & Lifschitz, Band II: Klassische Feldtheorie [14] = The classical theory of fields [26],
Kap. II.
• Nolting, Spezielle Relativitätstheorie, Thermodynamik [27], 1. Teil.
• Scheck, Mechanik [18] Kap. 4.
120
Relativistische Mechanik
Dritter Teil
Klassische Elektrodynamik
K APITEL VII
Einleitung
Die Elektrodynamik beruht auf ein paar gekoppelten Gleichungen, die das Wechselspiel von elektri~ B
~ mit elektrischen Ladungen und Strömen ρel. , ~el. beschreiben.
schen und magnetischen Feldern E,
Somit können die Maxwell-Gleichungen
~ · E(t,~
~ r) = 1 ρel.(t,~r)
∇
0
~ · B(t,~
~ r) = 0
∇
~
~ × E(t,~
~ r) + ∂ B(t,~r) = ~0
∇
∂t
~
~ × B(t,~
~ r) − 0 µ0 ∂ E(t,~r) = µ0~el.(t,~r).
∇
∂t
(VII.1a)
(VII.1b)
(VII.1c)
(VII.1d)
als die Gleichungen angesehen werden, welche die „Antwort“ vom elektromagnetischen Feld auf die
Wirkung dessen Quellen modellieren.
Jede der Maxwell-Gleichungen trägt einen eigenen Namen, der sich meistens auf die davon abgeleitete — jedoch historisch früher gefundene — integrale Formulierung der Gleichung. Somit
ist Gl. (VII.1a) die Maxwell–Gauß (x) -Gleichung — entsprechend dem in § VIII.1.2 diskutierten Gauß’schen Gesetz. Dann wird Gl. (VII.1b) (relativ selten) Maxwell–Thomson (y) -Gleichung
genannt. Gleichung (VII.1c) heißt Maxwell–Faraday-Gleichung, denn sie stellt die differentiale
Formulierung des Faraday(z) -Induktionsgesetzes (§ X.1.1 a) dar. Schließlich ist Gl. (VII.1d) die
Maxwell–Ampère (aa) -Gleichung, welche das Ampère-Gesetz (§ IX.1.3 b) verallgemeinert.
Wiederum erfahren Ladungen und Strömen in einem elektromagnetischen Feld eine Kraft. Die
zugehörige Kraftdichte, d.h. Kraft pro Volumeneinheit, ist die Lorentz-Kraftdichte
~ r) + ~el.(t,~r) × B(t,~
~ r).
f~L (t,~r) = ρel.E(t,~
(VII.2)
In diesem Einführungskapitel werden die verschiedenen Größen und Faktoren, die in den Gleichungen (VII.1)–(VII.2) auftreten, erläutert (Abschn. VII.1). Dann befasst sich Kapitel VII.2 mit
dem Problem der „Einheiten“ in der Elektrodynamik.
VII.1 Grundbegriffe und Definitionen
~ r) und B(t,~
~ r) sind mathematische Vektorfelder, die jeweils das elektrische und das
Die Größen E(t,~
magnetische Feld beschreiben. Beide Felder — genau wie jedes Feld, das in der Elektrodynamik
eingeführt wird — sind im Prinzip in jedem Punkt ~r des Raums und zu jeder Zeit t definiert, sind
also Felder auf der Raumzeit oder auf einem Gebiet davon.
(x)
C. F. Gauß, 1777–1855
A.-M. Ampère, 1775–1836
(aa)
(y)
W. Thomson, Lord Kelvin, 1824–1907
(z)
M. Faraday, 1791–1867
124
Einleitung
~ elektrische Feldstärke, mit physikalischer Dimension M L I−1 T−3
Genauer heißt das Vektorfeld E
~ als magnetische Flussdichte
und SI-Einheit V m−1 , wobei V für das Volt steht. Wiederum wird B
oder magnetische Induktion bezeichnet; die zugehörige Dimension bzw. SI-Einheit ist M I−1 T−2
bzw. das Tesla T.
Zur Beschreibung der elektrischen und magnetischen Felder in einem Medium werden weitere
Vektorfelder eingeführt, und zwar die elektrische Flussdichte (oder dielektrische Verschiebung)
~ und die magnetische Feldstärke H,
~ weshalb die genaueren Bezeichnungen manchmal nötig
D
sind. Im Vakuum, wie es im Rahmen dieses Skripts der Fall sein wird, sind die Ausdrücke
„elektrisches Feld“ und „magnetisches Feld“ eindeutig.
Die materiellen „Quellen“ des elektromagnetischen Feldes auf der rechten Seite der MaxwellGleichungen (VII.1) sind die elektrischen Ladungsdichte und -stromdichte ρel. und ~el. . Die erstere
ist natürlich die elektrische Ladung pro Volumeneinheit, so dass deren Integral über ein Gebiet V
Z
QV (t) ≡ ρel. (t,~r) d3~r
(VII.3)
V
die gesamte elektrische Ladung im Volumen V zur Zeit t darstellt.
Wiederum ist die elektrische Stromdichte derart definiert, dass deren Oberflächenintegral
Z
I(t) ≡ ~el. (t,~r) · d2 S~
(VII.4)
S
die elektrische Stromstärke durch die Fläche S zur Zeit t ist, wobei die Stromstärke die Gesamtladung ist, die pro Zeiteinheit durch S strömt. Dementsprechend stellt die elektrische Stromdichte
jel. die Ladung dar, die pro Zeiteinheit durch eine Einheitsfläche fließt.
Eine elektrische Ladung Q bzw. Stromstärke I hat im SI-System die physikalische Dimension
[Q] = I T bzw. [I] = I — die elektrische Stromstärke ist eine Basisgröße des Internationalen Größensystems —, entsprechend der Einheit Coulomb(ab) (C) bzw. Ampere (A), wobei 1 C = 1 A s. Daraus
folgt, dass die elektrische Ladungsdichte bzw. Stromdichte die Dimension [ρel. ] = I T L−3 , gemessen
in C m−3 bzw. [~el. ] = I L−2 (Einheit A m−2 ) hat.
Man sieht also, dass die elektrische Stromdichte die Dimension des Produkt aus Ladungsdichte
und Geschwindigkeit hat. Dies lässt sich an einem einfachen Beispiel gut nachvollziehen: betrachte
man Punktladungen, die sich alle mit der gleichen Geschwindigkeit ~v bewegen. Diejenigen, die im
Zeitintervall [t, t + δt] durch eine ebene Fläche S strömen, sind solche, die sich zur Zeit t innerhalb
eines Zylinders mit Basis S und den Seiten parallel zu ~v befinden (Abb. VII.1). Dabei ist die Höhe
~v δ t
1111
0000
S
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
Abbildung VII.1
(ab)
C. A. Coulomb, 1736–1806
125
VII.1 Grundbegriffe und Definitionen
des Zylinders ~v · ~en δt mit ~en dem Normaleinheitsvektor zur Fläche S. Diese Punktladungen im
Zylinder entsprechen einer Gesamtladung
ρel.(t,~r) S ~v · ~en δt,
denn S ~v · ~en δt das Volumen des Zylinders ist. Laut der Gl. (VII.4) soll diese elektrische Ladung
auch gleich
I(t) δt = ~el. (t,~r) · S ~en δt
sein, weil S ~en der mit der Fläche assoziierte Vektor ist. Somit gilt in diesem Fall
~el. (t,~r) = ρel.(t,~r) ~v .
(VII.5)
Das Ergebnis lässt sich direkt verallgemeinern: für eine Menge aus N Punktladungen {qa } mit
jeweiligen Ortsvektoren {~xa (t)} und Geschwindigkeiten {~va (t)} zur Zeit t lautet die elektrische
Ladungsdichte
ρel.(t,~r) =
N
X
qa δ (3) ~r − ~xa (t)
(VII.6a)
a=1
mit δ (3) der dreidimensionalen Dirac-Distribution, die hier dafür sorgt, dass nur die Punkte im Raum
beitragen, wo sich eine Punktladung gerade befindet. Integriert über irgendein Volumen ergibt diese
Ladungsdichte die Summe der Ladungen, die innerhalb des Volumens sind, wie in Gl. (VII.3).
Andererseits ist die elektrische Stromdichte der Punktladungen
~el.(t,~r) =
N
X
qa~va (t) δ (3) ~r − ~xa (t) .
(VII.6b)
a=1
Falls alle Geschwindigkeiten den gleichen Wert ~v haben, findet man die Beziehung (VII.5) wieder.
Betrachtet man eine einzige Punktladung, so führen die Gl. (VII.6), eingesetzt in die LorentzKraftdichte (VII.2), zu
~ r) + ~v (t) × B(t,~
~ r)
f~L (t,~r) = qδ (3) ~r − ~x(t) E(t,~
mit ~x(t) bzw. ~v (t) der Position bzw. Geschwindigkeit der Punktladung zur Zeit t. Integriert man
über irgendein Volumen, das die Punktladung enthält, ergibt sich
~ t, ~x(t) + ~v (t) × B
~ t, ~x(t) ,
F~L (t) = q E
(VII.7)
d.h. die Lorentz-Kraft auf die Punktladung.
In den Maxwell-Gleichungen treten (im SI-System, vgl. Abschn. VII.2) zwei Konstanten auf:
• die elektrische Feldkonstante 0 , die früher Permittivität des Vakuums genannt wurde;
• die magnetische Feldkonstante µ0 , früher Permeabilität des Vakuums.
Im SI-System beträgt die erstere 0 ' 8, 854 · 10−12 F m−1 mit F dem Farad (1 F = 1 C/V), und
die letztere ist definitionsgemäß µ0 ≡ 4π · 10−7 N A−2 . Die jeweiligen physikalischen Dimensionen
im internationalen Größensystem sind [0 ] = M−1 L−3 T4 I2 und [µ0 ] = L M T−2 I−2 .
Beispiele
von Ladungs- und Stromverteilungen
::::::::::::::::::::::::::::::::::::::::::::::::
Ein erstes Beispiel von elektrischer Ladungs- und Stromdichte ist das von Punktladungen, das
oben diskutiert wurde.
126
Einleitung
Betrachte man eine Metallkugel mit auf deren Oberfläche einer homogen verteilten Ladung Q. In
einem sphärischen Koordinatensystem mit dem Nullpunkt im Zentrum der Kugel soll die zugehörige
Ladungsdichte der Form ρel.(~r) ∝ δ(r − R) mit R dem Radius der Kugel und r ≡ |~r|; sei K der
Proportionalitätsfaktor. Laut Beziehung (VII.3) soll
Z
ρel.(~r) d3~r = Q
gelten. Das Integral lässt sich als
Z
Z
2
ρel.(~r) 4πr dr = Kδ(r − R) 4πr2 dr = 4πR2 K
umschreiben, woraus K = Q/4πR2 folgt.
Bemerkung: Zur Beschreibung einer solchen Ladungsverteilung, die auf einer Ober- oder Grenz-
fläche eingeschränkt ist, wird manchmal eine Flächenladungsdichte eingeführt, die die elektrische
Ladung pro Einheitsfläche darstellt. Dabei handelt es sich um eine Funktion von nur zwei Ortskoordinaten, welche die Fläche parametrisieren, statt drei: im obigen Beispiel könnte man zwei
Winkel (Polar- und Azimutwinkel θ, ϕ) wählen. Auf ähnlicher Weise definiert man auch elektrische
Flächenstromdichten.
Als nächstes Beispiel sei ein elektrischer Strom mit Stärke I durch einen unendlich dünnen geradlinigen Draht lokalisiert auf der z-Achse eines Systems kartesischer Koordinaten. Die zugehörige
Ladungsstromdichte ist der Form ~el.(~r) = Kδ(x) δ(y)~ez mit K einer festzustellenden Konstanten.
Sei S eine durch den Draht durchlaufene Fläche parallel zur (x, y)-Ebene. Beziehung (VII.4) lautet
Z
Z
I = ~el.(~r) · d2 S~ = Kδ(x) δ(y)~ez · d2 S~ez = K,
S
und legt somit ~el. fest.
Bemerkung: Hier handelt es sich um eine Linienstromdichte, die nur von z abhängt. Ähnlich gibt
es Linienladungsdichten.
VII.2 Einheiten
In diesem Skript werden die SI-Einheiten und dementsprechend die physikalischen Größen des Internationalen Größensystems verwendet.
Manche Referenzen benutzen aber andere Systeme, insbesondere um die Feldkonstanten 0 und
µ0 loszuwerden. Dabei handelt es sich(37) nicht um eine Wahl von Einheiten, wie der Einfachheit
halber oft gesagt wird, sondern wirklich um eine Neudefinition der elektromagnetischen Größen
(Ladung, elektrisches und magnetisches Feld, usw.). Dementsprechend nehmen die Gleichungen
eine andere Form an.
Um die Gleichungen aus dem Internationalen Größensystem in ein anderes System zu übersetzen,
braucht man nur einige Konversionsfaktoren zwischen den Größen in beiden Systemen. Hiernach
beziehen sich die physikalischen Größen mit einem Sternchen auf ein alternatives System.
Somit schreibt man für die elektrische Ladung
p
q = 0 ψ q ∗ ,
(VII.8a)
was für die Ladungsdichte und -stromdichte zu den Skalierungen
p
p
∗
ρel. = 0 ψ ρ∗el. , ~el. = 0 ψ ~el.
(VII.8b)
führt. Das elektrische Feld wird gewöhnlich derart umdefiniert, dass dessen Produkt mit der Ladung
(37)
... trotz des Titels dieses Abschnitts!
127
VII.2 Einheiten
die gleiche Form erhält: mit
~ = √1 E
~∗
E
0 ψ
(VII.8c)
~ = q∗E
~ ∗ . Wiederum transformiert sich die magnetische Induktion gemäß
gilt q E
r
~ ∗.
~ = µ0 B
B
ψ0
In der „Übersetzung“ der Gleichungen sollen schließlich alle auftretenden Produkte
ersetzt werden.
Mit diesen Rezepten wird die Lorentz-Kraftdichte (VII.2) zu
s
∗
∗
∗
~ + ψ 1 ~v × B
~∗ ,
f~L = q E
ψ0 c
(VII.8d)
√
0 µ0 durch 1/c
(VII.9a)
mit dem charakteristischen Faktor 1/c vor dem magnetischen Feld. Im neuen Größensystem lauten
die Maxwell-Gleichungen nach einiger trivialen Umschreibung
~ ·E
~ ∗ = ψρ∗
∇
el.
∗
~ ·B
~ =0
∇
s
~∗
∗
~ ×E
~ + ψ 1 ∂ B = ~0
∇
ψ 0 c ∂t
s
√ 0
~∗
ψ0 1 ∂ E
ψψ ∗
∗
~
~
∇×B −
=
~el. .
ψ c ∂t
c
(VII.9b)
(VII.9c)
(VII.9d)
(VII.9e)
Dazu werden natürlich auch weitere Gleichungen geändert, wie z.B. der Ausdruck des CoulombPotentials (VIII.14b) zwischen zwei statischen Punktladungen q1 , q2 im Abstand r12 voneinander,
das zu
ψq1∗ q2∗
V =
(VII.10)
4πr12
wird.
Die Konversionsfaktoren und die Konventionen für 0 , µ0 und c für die am meisten benutzten
Systeme werden in der Tabelle (VII.1) zusammengefasst.
Tabelle VII.1 – Konversionsfaktoren zwischen Größensystemen.
„SI-System“
Gauß-System
Heaviside(ac) –Lorentz-System
ψ0
0
µ0
c
ψ
1
µ0 c2
1
µ0 ≡ 4π·10−7 N A−2
c = 299792458 m s−1
µ0 c2
1
c
4π
µ0
c2
4π
1
1
c
1
1
~ ∗ und B
~ ∗ die gleiche
Bemerkung: In den Gauß- und Heaviside–Lorentz-Systemen haben die Felder E
physikalische Dimension, weshalb sie hoch beliebt sind. Dementsprechend nehmen die linken Seiten
der Gl. (VII.9d) und (VII.9e) eine ähnliche Form an — bis auf das Minus-Zeichen —, was auch sehr
angenehm ist.
Dagegen gilt die Beziehung 0 µ0 c2 = 1 [vgl. Gl. (X.29c)] nicht mehr — was der Autor dieser
Zeilen Schade findet —, es sei denn, man wählt ein System von (sog. „natürlichen“) Einheiten mit
c = 1.
(ac)
O. Heaviside, 1850–1925
128
Einleitung
Literatur zum Kapitel VII
• Fließbach, Elektrodynamik [2] Teil II.
• Greiner, Klassische Elektrodynamik II [8] Kap. I.
• Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap 2.1–2.4 & 3.
• Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 1.1–1.5, 1.7–
1.11, 2.1, 3.5–3.6 & 4.1–4.2.
• Nolting, Elektrodynamik [17] Kap. 2.1–2.3.
• Scheck, Klassiche Feldtheorie [19] Kap. 1.5 & 1.7.
K APITEL VIII
Elektrostatik
Hier fehlt die obligatorische Einleitung. . .
Im stationären Fall vereinfachen sich die Maxwell–Gauß und die Maxwell–Faraday-Gleichungen
~ r) — die jetzt zeitunabhängig ist — zu
für die elektrische Feldstärke E(~
~ · E(~
~ r) = ρel.(~r)
∇
0
~
~
~
∇ × E(~r) = 0.
(VIII.1a)
(VIII.1b)
VIII.1 Elektrisches Potential
VIII.1.1 Skalarpotential
Betrachte ein einfach zusammenhängendes Gebiet(2) des Raums. Aus der stationären Maxwell–
Faraday-Gleichung (VIII.1b) folgt die Existenz einer differenzierbaren skalaren Funktion Φ(~r) derart, dass die Beziehung
~ r) = −∇Φ(~
~ r)
(VIII.2)
E(~
in jedem Punkt ~r des Gebiets erfüllt wird. Nach Angabe eines beliebigen Punktes ~r0 kann man
nämlich Φ durch
Z ~r
~ r 0 ) · d~r 0
Φ(~r) = Φ(~r0 ) − E(~
(VIII.3)
~r0
definieren, wobei das Wegintegral dank dem Stokes’schen Satz unabhängig vom Weg ist, so dass
Φ(~r) eindeutig festgelegt ist, abgesehen von der beliebigen Wahl des Zahlenwerts für Φ(~r0 ).
Φ wird als elektrostatisches Potential oder Skalarpotential bezeichnet. Die zugehörige SI-Einheit
ist das Volt (V) mit physikalischer Dimension [Φ] = M L2 T−3 I−1 .
VIII.1.2 Poisson-Gleichung
Das Ausdrücken des elektrostatischen Feldes in der Maxwell–Gauß-Gleichung (VIII.1a) durch
das Skalarpotential gemäß Gl. (VIII.2) führt zur Poisson-Gleichung
4Φ(~r) = −
ρel.(~r)
0
(VIII.4)
mit 4 dem Laplace-Operator.
Insbesondere ergibt sich im Vakuum, d.h. in Abwesenheit von Ladungen, die Laplace-Gleichung
4Φ(~r) = 0,
deren Lösungen die sog. harmonischen Funktionen sind.
(VIII.5)
130
Elektrostatik
Gauß’sches
Gesetz
::::::::::::::::::::
Sei ∂ V eine geschlossene Fläche, die ein zusammenhängendes Raumvolumen V einschließt. Der
elektrische Fluss durch die Oberfläche ∂ V wird durch
I
~ r) · d2 S~
ΦE ≡
E(~
(VIII.6)
∂V
gegeben, mit d2 S~ = d2 S ~en dem vektoriellen Oberflächenelement, wobei ~en den Normaleinheitsvektor zu d2 S bezeichnet.
Unter Verwendung des Integralsatzes von Gauß ist das Oberflächenintegral auf der rechten Seite
gleich dem Volumenintegral der Divergenz des Integranden, d.h.
Z
I
2~
~ · E(~
~ r) d3~r.
~
E(~r) · d S = ∇
V
∂V
~ · E(~
~ r) ersetzen
Unter Betrachtung der Maxwell–Gauß-Gleichung (VIII.1a) lässt sich ∇
Z
ρel.(~r) 3
ΦE =
d ~r.
V 0
Schließlich ergibt sich somit das Gauß’sche Gesetz
ΦE =
Qin
0
(VIII.7)
mit Qin der Gesamtladung im Volumen V . Dieses Resultat stellt die globale Formulierung der
lokalen Maxwell–Gauß-Gleichung (VIII.1a) dar.
VIII.1.3 Elektrisches Feld und Potential von Ladungen
VIII.1.3
a Elektrisches Feld und Potential einer Punktladung
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Eine Punktladung q befinde sich im Punkt ~r0 , während im ganzen Rest des Raums Vakuum
herrscht. Die Situation ist dann kugelsymmetrisch um ~r0 . Insbesondere sollte das elektrische Feld
~ r) in konstantem Abstand |~r − ~r0 | von der Punktladung einen konstanten Betrag E |~r −~r0 |
E(~
haben. Für die Richtung des elektrischen Feldes, die am meistens symmetrische Möglichkeit ist, das
es in jedem Punkt entlang der Radialrichtung mit Einheitsvektor (~r−~r0 )/|~r−~r0 | zeigt. Somit ist ein
vernünftiger Ansatz
~ r) = E |~r−~r0 | ~r − ~r0 .
E(~
(VIII.8)
|~r − ~r0 |
Betrachte man jetzt eine Kugel mit Radius R und Zentrum in ~r0 . In jedem Punkt der Kugelfläche
∂ V ist das elektrische Feld normal, so dass
I
I
2~
~
~ r) d2 S
E(~
E(~r) · d S =
∂V
∂V
~ r) im
gilt. Dabei ist ∂ V definitionsgemäß die Menge der Punkte mit |~r −~r0 | = R, so dass E(~
Integral durch E(R) ersetzt werden kann. Da dieser Betrag konstant über ∂V bleibt, kann er aus
dem Integral herausgezogen werden:
I
I
2~
~
E(~r) · d S = E(R)
d2 S = 4πR2 E(R),
∂V
∂V
wobei benutzt wurde, dass das Oberflächenintegral im mittleren Glied einfach die Oberfläche der
Kugel mit Radius R ist.
131
VIII.1 Elektrisches Potential
Dank dem Gauß’schen Gesetz (VIII.7) ist die linke Seite auch mit der Gesamtladung innerhalb
des durch ∂ V abgeschlossenen Volumens verknüpft. Hier ist diese Gesamtladung einfach gleich der
Ladung q, die im Zentrum der Kugel liegt:
I
~ r) · d2~S = q .
E(~
0
∂V
Somit ergibt sich insgesamt
q
= 4πR2 E(R) bzw.
0
E(R) =
q
.
4π0 R2
Nach Einsetzen dieses Betrags in den Ansatz (VIII.8) ergibt sich schließlich für das elektrische
Feld einer Punktladung
~ r) =
E(~
q ~r − ~r0
.
4π0 |~r − ~r0 |3
(VIII.9a)
Man prüft problemlos nach, dass das zugehörige Skalarpotential
Φ(~r) =
q
4π0 |~r − ~r0 |
(VIII.9b)
ist, hier mit der Wahl Φ(~r) = 0 im Unendlichen.
VIII.1.3
b Elektrisches Feld und Potential mehrerer Punktladungen
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Betrachte man jetzt N Punktladungen q1 , . . . , qN , die sich jeweils in ~r1 , . . . , ~rN befinden, in
Abwesenheit weiterer Ladungen im ganzen Raum.
Zur Bestimmung des entsprechenden elektrischen Feldes bzw. Skalarpotentials soll man nur
~ B)
~ und in den Quellen
darauf beachten, dass die Maxwell-Gleichungen linear in den Feldern (E,
(ρel. , ~el. ) sind. Demzufolge gilt ein Superpositionsprinzip für deren Lösungen,
das natürlich auch für
~
~ 2 (~r), Φ2 (~r)
die stationären Gleichungen (VIII.1) gilt: wenn ρel.,1 (~r), E1 (~r), Φ1 (~r) und ρel.,2 (~r), E
~ 1 (~r)+E
~ 1 (~r), Φ1 (~r)+Φ2 (~r)
zwei Lösungen der Gleichungen auf R3 sind, dann ist ρel.,1 (~r)+ρel.,2 (~r), E
ebenfalls eine Lösung auf R3 .
Dementsprechend lautet das Skalarpotential für die N Punktladungen
Φ(~r) =
N
X
a=1
qa
,
4π0 |~r − ~ra |
(VIII.10a)
wieder mit der Wahl Φ(~r) = 0 für |~r| → ∞; das zugehörige elektrische Feld ist
~ r) =
E(~
N
X
qa ~r − ~ra
.
4π0 |~r − ~ra |3
(VIII.10b)
a=1
VIII.1.3
c Elektrisches Feld und Potential einer Ladungsverteilung
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Ähnlich dem Übergang (III.1) von einer diskreten Massenverteilung ma , d.h. einer endlichen
Anzahl von Massenpunkten, zu einer durch eine Massendichte ρ(~r) beschriebenen kontinuierlichen
Verteilung, kann man von einer endlichen Anzahl von Punktladungen qa zu einer kontinuierlichen
Ladungsverteilung ρel. übergehen, indem man das Rezept
Z
X
qa f (~ra ) → f (~r)ρel.(~r) d3~r
(VIII.11)
a
V
anwendet, wobei V das durch die Ladungsverteilung besetzte Raumvolumen bezeichnet.
132
Elektrostatik
Dementsprechend lautet das elektrostatische Potential bzw. Feld für eine Ladungsverteilung ρel.
ρel.(~r 0 )
d3~r 0 ,
4π0 |~r − ~r 0 |
(VIII.12a)
ρel.(~r 0 ) ~r − ~r 0 3 0
d ~r .
4π0 |~r − ~r 0 |3
(VIII.12b)
Z
Φ(~r) =
V
bzw.
~ r) =
E(~
Z
V
Bemerkungen:
∗ Der Vorsicht halber sollte der Punkt ~r außerhalb des Volumens V sein, um unangenehme Divisionen durch 0 zu vermeiden.
∗ Hiernach wird das Potential (VIII.12a) auf eine alternative Weise hergeleitet (§ VIII.2.2).
∗ Setzt man in die Gl. (VIII.12a)–(VIII.12b) die Ladungsverteilung (VII.6a) für eine Menge von
Punktladungen ein, so findet man natürlich Gl. (VIII.10a) und (VIII.10b) wieder.
VIII.1.4 Elektrostatische potentielle Energie
VIII.1.4
a Coulomb-Kraft
::::::::::::::::::::::::
In Abwesenheit von magnetischen Feld oder für ruhende Ladungen lautet die Lorentz-Kraft auf
eine Punktladung a
~ a (~ra )
F~a (~ra ) = qa E
(VIII.13a)
~ a dem Feld, das die anderen Ladungen b 6= a im Punkt ~ra erzeugen, d.h.
mit E
F~a (~ra ) =
N
X
qa ~ra − ~rb
,
4π0 |~ra − ~rb |3
(VIII.13b)
b=1
b6=a
wobei Gl. (VIII.10b) verwendet wurde.
Falls es nur eine andere Ladung gibt, die hiernach mit q2 bezeichnet wird und sich in ~r2 befindet,
ist das dadurch erzeugte elektrische Feld durch Gl. (VIII.9a) gegeben. Dann lautet die Kraft auf die
Punktladung qa ≡ q1
q1 q2 ~r1 − ~r2
.
F~ (~r1 ) =
4π0 |~r1 − ~r2 |3
(VIII.14a)
Somit findet man die Coulomb-Kraft wieder, sowie das zugehörige Potential
V (~r1 ) =
q1 q2
,
4π0 |~r1 − ~r2 |
(VIII.14b)
~ 1 V (~r1 ) ableiten lässt.
aus dem die Kraft sich gemäß F~ (~r1 ) = −∇
VIII.1.4
b Potentielle Energie
::::::::::::::::::::::::::::
~ a×E
~ a = ~0 ist die Kraft F~a [Gl. (VIII.13b)] auch im
Wegen der Maxwell–Thomson-Gleichung ∇
allgemeinen Fall konservativ. Genauer gilt
~ a V {~rb }
F~a (~ra ) = −∇
(VIII.15a)
~ a dem Gradient bezüglich des Ortsvektors ~ra und V einer potentiellen Energie, die durch
mit ∇
133
VIII.1 Elektrisches Potential
N
qa qb
1 X
V {~rb } =
2
4π0 |~ra − ~rb |
(VIII.15b)
N
1X
V {~rb } =
qa Φa (~ra ),
2
(VIII.15c)
a,b=1
a6=b
gegeben ist. Alternativ gilt
a=1
wobei Φa durch Gl. (VIII.10a) mit Summierung über die Punktladungen b 6= a gegeben wird.
Beweis: Mit dem Potential (VIII.15b) gilt unter Verwendung der Kettenregel
N
N
X
~rc − ~rd
qc qd ~
1
1 X qc qd
~rc − ~rd
~ aV = − 1
−∇
+
δ
∇a
=−
−δca
da
2
4π0
|~ra − ~rb |
2
4π0
|~rc − ~rd |3
|~rc − ~rd |3
c,d=1
c6=d
=
c,d=1
c6=d
1 X qa qc ~rc − ~ra
1 X qa qd ~ra − ~rd
−
.
3
2
4π0 |~ra − ~rd |
2
4π0 |~rc − ~ra |3
d6=a
c6=a
Ersetzt man d bzw. c durch b in der ersten bzw. zweiten Summe der zweiten Zeile, so sind beide
Summanden gleich und man findet genau das gesuchte Ergebnis (VIII.13b).
2
Im Limes einer kontinuierlichen Ladungsverteilung ρel. wird die potentielle Energie (VIII.15c) zu
V =
1
2
Z
Φ(~r)ρel.(~r) d3~r
(VIII.16)
V
mit V dem Raumvolumen, das die Ladungsverteilung besetzt; eigentlich kann V durch R3 ersetzt
werden
Bemerkung: Die letztere Gleichung könnte auf erster Sicht verwirrend sein, denn das elektrostatische
Potential Φ im Integral wird in einem Punkt betrachtet, wo sich Ladungen befinden. Das heißt, dass
dies nicht dem Gültigkeitsbereich der Gl. (VIII.12a) entspricht, für die der Punkt ~r außerhalb der
Ladungsverteilung sein soll. Dies bedeutet nur, dass Φ(~r) nicht durch Gl. (VIII.12a) gegeben ist.
VIII.1.4
c Energie des elektrostatischen Feldes
:::::::::::::::::::::::::::::::::::::::::::::::
Die potentielle Energie (VIII.16) einer Ladungsverteilung ρel. kann auch durch das elektrostati~ r) ausgedrückt werden, erzeugt durch die Verteilung.
sche Feld E(~
In der Tat gilt
Z ~ 2
E(~r) 3
V =
d ~r,
(VIII.17)
R3 20
wobei sich das Integrand als die elektrische Energiedichte ee (~r) des Feldes im Punkt ~r interpretieren
lässt.
Zum Beweis dieses Ergebnisses kann das Integral auf der rechten Seite der Gl. (VIII.16) zuerst
über das Volumen einer Kugel mit Radius R berechnen, dann am Ende den Grenzwert R → ∞
betrachten. Dank der Maxwell–Gauß-Gleichung (VIII.1a) gilt
Z
Z
1
0
3
~ · E(~
~ r) d3~r.
Φ(~r)ρel.(~r) d ~r =
Φ(~r) ∇
2 |~r|≤R
2 |~r|≤R
Dabei lässt sich das Integrand mithilfe der Identität
134
Elektrostatik
~ · E(~
~ r) = ∇
~ · Φ(~r) E(~
~ r) − E(~
~ r) · ∇Φ(~
~ r) = ∇
~ · Φ(~r) E(~
~ r) + E(~
~ r)2
Φ(~r) ∇
umschreiben:
1
2
Z
0
Φ(~r)ρel.(~r) d ~r =
2
|~r|≤R
3
Z
~ · Φ(~r) E(~
~ r) d3~r +
∇
|~r|≤R
~ r)2
E(~
d3~r.
2
0
|~r|≤R
Z
Der zweite Term auf der rechten Seite gibt das gesuchte Ergebnis im Limes R → ∞, so dass
man nur beweisen soll, dass der erste in diesem Limes verschwindet. Tatsächlich kann das erste
Volumenintegral auf der rechten Seite mit dem Gauß’schen Integralsatz in ein Oberflächenintegral
über die Kugelfläche transformiert werden
Z
I
3
~
~
~ r) · d2~S .
∇ · Φ(~r) E(~r) d ~r =
Φ(~r) E(~
|~r|≤R
|~r|=R
Wenn R groß genug ist, befinden sich alle Ladungen innerhalb der Kugel |~r| ≤ R. Dann nehmen
das elektrostatische Potential und das Feld mit R ab, gemäß(38)
Φ(R) ∝
1
,
R
~
|E(R)|
∝
1
.
R2
Dagegen gilt d2 S = R2 d2 Ω mit d2 Ω dem Raumwinkelelement. Insgesamt kommt
I
~ r) · d2~S ∝ 4πR2 1 1 ∝ 1 ,
Φ(~r) E(~
R R2
R
|~r|=R
so dass dieser Term im Grenzwert R → ∞ Null wird.
(38)
Dies folgt aus dem Gauß’schen Gesetz (VIII.7), unter Verwendung des gleichen Arguments wie in § VIII.1.3 a.
2
135
VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung
VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung
Im § VIII.1.3 wurde das elektrostatische Potential erzeugt durch eine Ladungsverteilung (VIII.12a)
mithilfe des Gauß’schen Gesetzes hergeleitet. Eine alternative Vorgehensweise zur Bestimmung von
Φ(~r) besteht darin, die Poisson-Gleichung
4Φ(~r) = −
ρel.(~r)
0
(VIII.4)
direkt zu lösen. In diesem Abschnitt werden einige allgemeinen(39) mathematischen Rezepte und
Ergebnisse zur Lösung dieser Differentialgleichung vorgestellt.
VIII.2.1 Green’sche Funktionen
Die Poisson-Gleichung (VIII.4) ist ein Beispiel von partieller Differentialgleichung, hier zweiter
Ordnung.
Definition: Eine Funktion G(~r,~r 0 ) zweier vektoriellen Variablen ~r,~r 0 heißt Green’sche (ad) Funktion
zur Poisson-Gleichung, wenn sie eine Lösung der partiellen Differentialgleichung
4~r G(~r,~r 0 ) = δ (3)(~r − ~r 0 )
(VIII.18)
ist, mit 4~r dem Laplace-Operator bezüglich der Variablen ~r.
Aus einer solchen Lösung der Gl. (VIII.18) folgt eine Lösung der Poisson-Gleichung (VIII.4) mit
fast jedem beliebigen rechten Glied, und zwar
Z
−1
Φ(~r) =
G(~r,~r 0 )ρel.(~r 0 ) d3~r 0 ,
(VIII.19)
0
unter der offensichtlichen Beschränkung, dass das Integral existieren soll.
Wendet man nämlich den Laplace-Operator 4~r auf das so definierten Potential an, so kann der
Differentialoperator in das Integral über ~r 0 eingezogen werden:
Z
−1 4~r G(~r,~r 0 ) ρel.(~r 0 ) d3~r 0 ,
4~r Φ(~r) =
0
Unter Verwendung der definierenden Gleichung (VIII.18) wird das Integral zur Faltung von
der δ (3) -Distribution mit der Ladungsdichte ρel., so dass sich die rechte Seite zu −ρel.(~r)/0
vereinfacht.
2
Bemerkung: Im obigen Beweis wurde die spezifische Form des Laplace-Operators nirgendwo benutzt.
Somit können Green’sche Funktionen auch für andere Differentialoperatoren, d.h. andere Differentialgleichungen, eingeführt werden, als „Antwort“ zur lokalisierten „Anregung“ modelliert durch eine
δ-Distribution.
VIII.2.2 Lösung der Poisson-Gleichung auf R3
Die Poisson- (VIII.4) und Laplace-Gleichung (VIII.5) wurden durch Mathematiker aufwändig
untersucht, woraus eine Menge Resultate zur Existenz und Eindeutigkeit ihrer Lösungen resultiert.
In diesem und im nächsten Paragraphen werden einige dieser Ergebnisse kurz dargestellt.
Betrachte man zuerst die Poisson-Gleichung, und daher die assoziierte partielle Differentialgleichung (VIII.18), auf dem ganzen dreidimensionalen Raum R3 . Dann lautet eine Green’sche
Funktion zur Poisson-Gleichung
−1
.
(VIII.20)
G(~r,~r 0 ) =
4π|~r − ~r 0 |
(39)
Das heißt, dass sie auch auf andere Differentialgleichungen anwendbar sind.
(ad)
G. Green, 1793–1841
136
Elektrostatik
~ ≡ ~r − ~r 0 und R ≡ |R
~ |; dann gilt dank der Kettenregel 4~r = 4 ~ . Da die
Beweis: Sei R
R
0
~ = ~0 hat, wird erstens eine „regularisierte“ Version
Funktion (VIII.20) ein Pol für ~r = ~r bzw. R
~ ≡
Gε R
−1
4π R2 + ε2
√
ohne Divergenz im Ursprungspunkt eingeführt, wobei ε am Ende der Berechnung gegen Null zu
nehmen ist. Die Funktion Gε hängt nur vom Betrag R abhängt, so dass im Raum der Variablen
~ kugelsymmetrisch um den Nullpunkt ist. Demzufolge ist es interessant, in Kugelkoordinaten
R
(R, θR~ , ϕR~ ) zu arbeiten, wobei das Problem unabhängig von den zwei Winkeln θR~ , ϕR~ ist. Daher
vereinfacht sich der Laplace-Operator 4R~ zu
∂2
2 ∂
+
∂R2
R ∂R
ohne den üblichen winkelabhängigen Anteil. Wendet man diesen Operator auf Gε an, so ergibt
sich dank einfacher Ableitungen
2
1
~ = 3ε
.
4R~ Gε R
2
4π (R + ε2 )5/2
(3) ~ (3)
Die Funktion im rechten Glied sei mit δε R
bezeichnet. Für festes ε besitzt δε die folgenden
Eigenschaften:
~ | ≥ |ε|;
~ ≤ 3ε für |R
• δε(3) R
4π
3
• δε(3) ~0 =
;
4π|ε|
Z
Z a
Z a
3R2 ε2
~ d3 R
~ =
~ 4πR2 dR =
• sei a > 0; dann gilt
δε(3) R
dR, d.h.
δε(3) R
2
2 5/2
~
|R|≤a
0
0 (R + ε )
a
Z
3
R3
a3
(3) ~
~
δε R d R =
=
.
(R2 + ε2 )3/2 0
(a2 + ε2 )3/2
~
|R|≤a
Betrachte man jetzt den Grenzwert ε → 0. Laut der ersten Eigenschaft gilt in diesem Limes
(3) ~ ~ 6= ~0. Somit wird der Peak bei R
~ = ~0 (zweite Eigenschaft) unendlich
= 0 für R
lim δε R
(3)
schmal und hoch. Schließlich geht das Integral von δε über eine Kugel mit Radius a gegen 1,
(3)
unabhängig von der Wahl von a. Diese Eigenschaften zeigen, dass δε eine Darstellung der
dreidimensionalen δ-Distribution ist, entsprechend dem nachzuprüfenden Ergebnis.(40)
2
Setzt man jetzt die Green’sche Funktion (VIII.20) in die Beziehung (VIII.19) ein, so ergibt sich
genau das elektrostatische Skalarpotential (VIII.12a)
Z
ρel.(~r 0 )
Φ(~r) =
d3~r 0 .
(VIII.21)
0|
4π
|~
r
−
~
r
3
0
R
Dabei wird die vorsichtige Beschränkung des § VIII.1.3 c auf Punkten ~r, die nicht zum durch die
Ladungsverteilung besetzten Raumvolumen V gehören, jetzt automatisch aufgehoben.
Ein Problem bei der Konstruktion des elektrischen Potentials aus der Poisson-Gleichung besteht
darin, dass die Funktion (VIII.20) nicht die einzige Green’sche Funktion zur Poisson-Gleichung auf
R3 ist.
Betrachtet man nämlich eine Lösung F der Laplace-Gleichung — eine harmonische Funktion —
auf R3 , so ist G2 (~r,~r 0 ) ≡ G(~r,~r 0 ) + F (~r − ~r 0 ) auch eine mögliche Green’sche Funktion.
In der Tat gilt 4~r G2 (~r,~r 0 ) = 4~r G(~r,~r 0 ) + 4~r F (~r − ~r 0 ) = δ (3)(~r − ~r 0 ) + 0.
(40)
2
Die Funktion (VIII.20) kann auch direkt gefunden werden, indem die definierende Differentialgleichung (VIII.18)
im Fourier-Raum aufgestellt wird.
VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung
137
Da es unendlich viele harmonische Funktionen auf R3 , beispielsweise jede lineare Funktion der Form
F (~r) = ax1 + bx2 + cx3 , gibt es auch unendlich viele Green’sche Funktionen.
Einzigartig bei der Funktion (VIII.20) unter den Green’schen Funktionen zur Poisson-Gleichung
ist aber, dass sie im Unendlichen |~r − ~r 0 | → ∞ Null wird. Dementsprechend verschwindet das
Potential (VIII.21) weit von der Ladungsverteilung (wenn die letztere nur ein endliches Raumgebiet
besetzt).
Genauer kann man zeigen, dass die einzigen harmonischen Funktionen auf R3 — und allgemeiner
auf Rn für jede n ∈ N∗ —, die überall endlich bleiben, die identisch konstanten Funktion sind.
Bemerkung: Addiert man zur Funktion (VIII.20) eine Konstante K ∈ R, so unterscheidet sich das
aus Gl. (VIII.19) resultierende Potential von dem Wert (VIII.21) um eine additive Konstante — das
Produkt aus K und der Gesamtladung der Verteilung geteilt durch 0 —, die nichts am elektrischen
Feld ändert.
VIII.2.3 Lösung der Poisson-Gleichung auf einem endlichen Gebiet von R3
VIII.2.3
a Mathematische Fragestellung und Ergebnisse
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Anstatt einer Lösung der Poisson-Gleichung auf dem ganzen Raum kann man auch eine Lösung
auf einem endlichen Gebiet V von R3 suchen — entsprechend z.B. dem elektrostatischen Potential
in einem leeren Hohlraum im Inneren von Materie. Ist die letztere irgendein Metall, in welchem frei
bewegliche elektrische Ladungsträger vorhanden sind, so können sich solche Ladungen möglicherweise auf der Oberfläche ∂ V des Bereichs V befinden: dann dienen diese Ladungen als Quellen für
das elektrische Skalarpotential im Hohlraum.
11111111
00000000
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
∂V
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
V
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
Abbildung VIII.1
Meistens wird die entsprechende (Oberflächen)Ladungsdichte nicht explizit präzisiert. Stattdessen werden in der mathematischen Formulierung Randbedingungen für das zu festzustellende
Potential Φ(~r) vorgegeben, entsprechend seinem Verhalten auf der Oberfläche ∂ V , das physikalisch
„von außen“ gesteuert wird. Dazu wird oft angenommen, dass im Hohlraum Vakuum herrscht, so dass
sich die Poisson-Gleichung auf die Laplace-Gleichung 4Φ(~r) = 0 vereinfacht. Bei der Fragestellung
handelt es sich dann um ein sog. Randwertproblem.
Ein solches mathematisches Randwertproblem ist für physikalische Anwendungen nur dann nützlich, wenn es wohlgestellt ist. Dies bedeutet, dass das Problem eine Lösung hat, die eindeutig ist —
möglicherweise bis auf eine additive Konstante — und stetig von den vorgegebenen Randbedingungen abhängt. Bei der Poisson-Gleichung ist es insbesondere der Fall für zwei einfache Arten von
Randbedingungen:
138
Elektrostatik
• bei Dirichlet (ae) -Randbedingungen (oder Randbedingungen erster Art) werden die Werte des
Potentials Φ(~r) — oder allgemeiner der zu bestimmenden Funktion — an der Oberfläche ∂ V
vorgeschrieben;
• bei Neumann (af) -Randbedingungen (oder Randbedingungen zweiter Art) wird die Normalenableitung ∂n Φ(~r) vorgegeben, wobei die letztere die Änderungsrate in der Richtung senkrecht
~ r) schreiben, mit ~en (~r) den
zur Oberfläche ist. Diese Ableitung lässt sich auch als ~en (~r) · ∇Φ(~
Normaleinheitsvektor zur Oberfläche im Punkt ~r ∈ ∂ V .
Stimmt die Oberfläche ∂ V lokal mit der (x1 , x2 )-Ebene überein, so ist der lokale Normal~ ist gleich ∂Φ/∂x3 , was auch mit ∂3 Φ bezeichnet wird.
einheitsvektor ~e3 , d.h. ~en · ∇Φ
Bemerkung: Im Fall von Neumann-Bedingungen ist die Vorschrift von ∂n Φ(~r) auf ∂ V äquivalent
~ r) = −∇Φ(~
~ r) in jedem Punkt der
zur Angabe der normalen Komponente des elektrischen Feldes E(~
Oberfläche.
Die Existenz einer Lösung der Poisson-Gleichung auf V und ihre stetige Abhängigkeit von den
Randbedingungen sind im allgemeinen Fall nicht trivial zu zeigen. Dagegen ist der Beweis der
Eindeutigkeit bis auf eine additive Konstante ziemlich einfach.
Dieser Beweis macht die sog. erste Green’sche Identität, gültig für zwei (zweimal differenzierbare)
reellwertige Funktionen f1 , f2
Z
I
3
~
~
f1 (~r) ∂n f2 (~r) d2 S
(VIII.22)
∇f1 (~r) · ∇f2 (~r) + f1 (~r)4f2 (~r) d ~r =
V
∂V
zu Nutze.
~ · (f1 ∇f
~ 2 ) = ∇f
~ 1 · ∇f
~ 2 + f1 4f2 , d.h. nach Integration und
Beweis: Die Kettenregel gibt ∇
Anwendung des Gauß’schen Integralsatzes
Z
Z
I
~ 1 · ∇f
~ 2 + f1 4f2 d3~r = ∇
~ · (f1 ∇f
~ 2 ) d3~r =
~ 2 · d2~S .
∇f
f1 ∇f
V
V
∂V
2~
2
Dabei ist das vektorielle Oberflächenelement d S gleich d S ~en , woraus die Identität folgt.
2
Sind Φ1 , Φ2 nämlich zwei Lösungen der Poisson-Gleichung auf V mit beliebiger rechter Seite und
gegebenen Dirichlet- bzw. Neumann-Randbedingungen, dann ist ihre Differenz U ≡ Φ2 − Φ1 eine Lösung der Laplace-Gleichung 4U (~r) = 0 für ~r ∈ V , mit verschwindenden Dirichlet- bzw.
Neumann-Randbedingungen U (~r) = 0 bzw. ∂n U (~r) = 0 für ~r ∈ ∂ V . Die erste Green’sche Identität
mit f1 = f2 = U lautet dann
Z
I
3
~
~
∇U (~r) · ∇U (~r) + U (~r)4U (~r) d ~r =
U (~r) ∂n U (~r) d2 S .
V
∂V
Das Integrand auf der rechten Seite, und daher das Integral, verschwindet wegen der Randbedingungen. Wiederum ist der zweite Term in den eckigen Klammern auf der linken Seite ebenfalls Null,
denn U erfüllt die Laplace-Gleichung. Deshalb bleibt nur
Z
~ (~r) 2 d3~r = 0
∇U
V
~ (~r) identisch auf V verschwindet, d.h. wenn U (~r) konstant
übrig, was nur dann möglich ist, wenn ∇U
auf V ist: U (~r) = K, wobei K = 0 falls Dirichlet-Bedingungen vorgegeben sind. Somit unterscheiden
sich Φ1 und Φ2 nur um eine additive Konstante.
(ae)
P. G. Lejeune Dirichlet, 1805–1859
(af)
C. Neumann, 1832–1925
VIII.2 Bestimmung des Skalarpotentials aus der Poisson-Gleichung
139
VIII.2.3
b Physikalische Anwendungen
:::::::::::::::::::::::::::::::::::::::
Faraday Käfig
Als erste Anwendung der obigen mathematischen Ergebnisse kann man das elektrische Feld in
einem leeren Hohlraum innerhalb einer metallischen Oberfläche ∂ V bestimmen.
Da ∂ V metallisch ist, können sich darauf freie Ladungsträger befinden. Im statischen Fall dürfen
sie diese Ladungen definitionsgemäß nicht bewegen. Demzufolge darf kein elektrisches Feld in der
~ = −∇Φ
~ = ~0 auf ∂ V , so dass das Skalarpotential Φ dort konstant ist:
Metallfläche vorhanden sein, E
Φ(~r) = Φ0 für ~r ∈ ∂ V . Dies stellt eine Dirichlet-Randbedingung für das elektrostatische Potential
im Hohlraum dar.
Dort soll Φ wegen der Abwesenheit von Ladungen Lösung der Laplace-Gleichung 4Φ(~r) = 0
sein. Eine Lösung, die auch die Randbedingung erfüllt, ist einfach die konstante Funktion Φ(~r) = Φ0
für ~r ∈ V . Wegen der Eindeutigkeit ist dies in der Tat die einzige Lösung. Daraus folgt dann
~ = −∇Φ
~ = ~0 im Hohlraum, der als Faraday-Käfig bezeichnet wird.
E
Spiegelladungsmethode
Basierend auf die Eindeutigkeit der Lösung der Poisson-Gleichung für vorgegebene DirichletRandbedingungen lässt sich eine andere Methode zur Lösung der Poisson-Gleichung in einem Gebiet
von R3 formulieren.
Sei ein zu lösendes Problem P1 , bei dem eine Fläche ∂ V ein Raumgebiet
V abgrenzt, in welP
(3)(~
q
δ
r
−
~xa ) befinden, mit
chem sich Ladungen entsprechend einer Ladungsdichte ρel.(~r) =
a a
~xa den Positionen der Ladungen. Als (Dirichlet)-Randbedingung wird angenommen, dass ∂ V eine
Äquipotentialfläche ist, d.h. Φ(~r) ist konstant auf ∂ V .
Sei dann ein anderes Problem P2 ohne Fläche jedoch mit denselben Ladungen an den gleichen
Positionen ~xa sowie zusätzlichen Ladungen – sog. „Spiegelladungen“ — außerhalb V . Wenn das
(lösbare!) Problem P2 zu einem Potential Φ führt, wovon eine Äquipotentialfläche mit der Fläche
∂ V vom Problem P1 übereinstimmt, dann ist das Potential von P2 im Volumen V genau gleich
dem gesuchten Potential von P1 .
Als Beispiel dieser Methode kann man das folgende Problem (P1 )
betrachten: im Halbraum x < 0 befindet sich ein elektrischer Leiter,
q0
q
dessen Oberfläche bei x = 0 eine Äquipotentialfläche ist;(41) im Punkt
• a - a -•
~xq = (a, 0, 0) außerhalb des Leiters sitzt eine Punktladung q.
x
Im Bereich x > 0 soll das Skalarpotential Lösung der Poisson-Gleichung
(3)
4Φ(~r) = −qδ (~r − ~xq )/0 sein, mit der Randbedingung Φ = Φ0 für
Abbildung VIII.2
x = 0.
Ein passendes, einfach lösbares Problem P2 besteht aus zwei Punktladungen in einem sonst
leeren Raum: q ist immer noch in ~xq , während eine zweite (Spiegel-)Punktladung q 0 im Punkt
−~xq = (−a, 0, 0) sitzt. Diese Ladungen erzeugen das Skalarpotential
Φ(~r) =
Lösung von 4Φ(~r) =
q
q0
+
,
4π0 |~r − ~xq | 4π0 |~r + ~xq |
−q (3)
q0
δ (~r − ~xq ) − δ (3)(~r + ~xq ) im ganzen Raum.
0
0
Dieses Potential stellt auch eine spezielle Lösung der Gleichung 4Φ(~r) = −qδ (3)(~r −~xq )/0 für x ≥ 0
dar, die für q 0 = −q konstant (und Null) bei x = 0 ist. Das Potential Φ ist also auch Lösung für
x ≥ 0 des ursprünglichen Problems P1 .
(41)
Dies ist immer der Fall bei elektrischen Leitern im Gleichgewicht, d.h. ohne Bewegung von Ladungen, wie schon
bei der Beschreibung des Faraday-Käfigs argumentiert wurde.
140
Elektrostatik
VIII.3 Multipolentwicklung
Eine oft auftretende Fragestellung ist die Bestimmung des Einflusses einer gegebenen Ladungsverteilung ρel. mit typischer Größe R auf eine Punktladung — oder eine zweite Ladungsverteilung —
in einem weit entfernten Punkt.
Wie wir schon gesehen haben, erzeugt die Ladungsverteilung das elektrische Skalarpotential in
einem Punkt ~r
Z
ρel.(~r 0 )
Φ(~r) =
d3~r 0 .
(VIII.12a)
r − ~r 0 |
V 4π0 |~
mit V dem durch die Verteilung besetzten Raumgebiet, woraus das elektrische Feld sich ableiten
lässt.
Um die Berechnungen zu vereinfachen wird hiernach angenommen, dass die Ladungsverteilung
um den Ursprung des Bezugssystems sitzt, d.h. |~r 0 | . R für ~r 0 ∈ V . Dagegen soll der Punkt ~r „weit
weg“ sein, entsprechend |~r − ~r 0 | R für ~r 0 ∈ V oder äquivalent |~r| R.
VIII.3.1 Kartesische Multipolmomente
Aus den Ungleichungen |~r| − |~r 0 | ≤ |~r − ~r 0 | ≤ |~r| + |~r 0 | und |~r 0 | . R |~r| folgt, dass der
Abstand |~r − ~r 0 | im Nenner des Integranden in Gl. (VIII.12a) ungefähr gleich r ≡ |~r| ist. Dabei
kann die genaue Abweichung mithilfe einer Taylor-Entwicklung angenähert werden, wobei −~r 0 die
Rolle der „kleinen“ Verschiebung um den Bezugspunkt ~r spielt.
Demgemäß lautet eine Taylor-Entwicklung bis zur zweiten Ordnung
3
3
1
1 X 0i ∂
1
1 X 0i 0j ∂ ∂
1
= −
x
+
x x
+ ··· ,
|~r − ~r 0 |
r
∂xi r
2
∂xi ∂xj r
i=1
i,j=1
mit
bzw. p den kartesischen Komponenten von ~r bzw. ~r 0 in einem Koordinatensystem. Dabei
folgt aus r = (x1 )2 + (x2 )2 + (x3 )2 die erste Ableitung
1
xi
∂
=
−
,
∂xi r
r3
xi
x0i
und nach erneutem Ableiten unter Berücksichtigung der Produktregel
∂ ∂
1
δ ij
3xi xj
=
−
+
.
∂xj ∂xi r
r3
r5
Somit gilt
3
3
1
1 X xi 0i X 3xi xj − δ ij r2 0i 0j
=
+
x
+
x x + ···
|~r − ~r 0 |
r
r3
2r5
i=1
i,j=1
3xi xj −δ ij r2
Die Kombination
ist spurlos, d.h. deren Multiplikation mit δ ij gefolgt von einer Summe
über i, j = 1, 2, 3 ergibt Null.(42) Daher kann der quadratische Term in den x0i gemäß
3
3
X
X
3xi xj − δ ij r2 0i 0j
3xi xj − δ ij r2
δ ij 0 2
0i 0j
x x =
x x −
|~r |
2r5
2r5
3
i,j=1
i,j=1
erweitert werden. Dies führt zur Entwicklung
3
3
1
1 X xi 0i X 3xi xj − δ ij r2
δ ij 0 2
0i 0j
= +
x +
x x −
|~r | + · · · .
|~r − ~r 0 |
r
r3
2r5
3
i=1
i,j=1
Da die Komponente xi bzw. x0i typischerweise der Größenordnung O(r) bzw. O(R) ist, ist der erste
Term der Ordnung (gleich!) 1/r, der zweite der Ordnung O(R/r2 ) und der dritte der Ordnung
(42)
i j
ij 2
Betrachtet man die Matrix
P A mit Elementen aij ≡ 3x x − δ r , so ist die betrachtete Operation genau das
Bilden der Spur Tr A ≡ i aii der Matrix, daher die Bezeichnung.
141
VIII.3 Multipolentwicklung
O(R2 /r3 ). Somit ist jeder neue Term in der Entwicklung um einen Faktor der Ordnung R/r 1
kleiner als der vorige.
Nach Einsetzen in den Ausdruck (VIII.12a) des Skalarpotentials ergibt sich
3
X
Q
~r · P~
3xi xj − δ ij r2 ij
Φ(~r) =
+
+
Q + ··· ,
4π0 r 4π0 r3
8π0 r5
(VIII.23a)
i,j=1
wobei die ersten kartesischen elektrischen Multipolmomente durch
Z
Q≡
ρel.(~r 0 ) d3~r 0
~r 0 ρel.(~r 0 ) d3~r 0
Z δ ij 0 2
x0i x0j −
Qij ≡
|~r | ρel.(~r 0 ) d3~r 0
3
V
P~ ≡
(VIII.23b)
ZV
(VIII.23c)
V
(VIII.23d)
definiert sind. Dabei ist Q die Gesamtladung und P~ das elektrische Dipolmoment der Ladungsverteilung ρel. . Die Zahlen Qij (Quadrupolmomente) sind die Komponenten eines Tensors zweiter
Stufe Q, des elektrischen Quadrupoltensors.
Man sieht sofort,
der Quadrupoltensor symmetrisch — d.h. Qij = Qji für alle i, j — und
P dass
ii
spurlos — d.h.
i Q = 0 —, wobei die letztere Eigenschaft schon beim Integranden auftritt.
Demzufolge sind nur 5 der 9 Komponenten unabhängig.
Bemerkungen:
∗ Der erste Term im Skalarpotential (VIII.23a) ist proportional zu 1/r, der zweite proportional
zu 1/r2 , der dritte proportional zu (oder zumindest der Ordnung) 1/r3 , usw. Somit tragen die
niedrigeren Momente am meisten zu Φ(~r) bei. . . wenn sie nicht Null sind.
∗ Das elektrische Dipolmoment bzw. Quadrupolmoment hat physikalische Dimension [P~ ] = L T I
bzw. [Qij ] = L2 T I, entsprechend der SI-Einheit C m bzw. C m2 .
VIII.3.2 Beispiele von Multipolmomenten
VIII.3.2
a Kugelsymmetrische Ladungsverteilung
:::::::::::::::::::::::::::::::::::::::::::::::::
Ein einfaches Beispiel von Ladungsverteilung ist jenes einer Verteilung ρel. (~r 0 ) Funktion von |~r 0 |
alleine. Dementsprechend ist ρel. eine gerade Funktion von ~r 0 — d.h. ρel. (~r 0 ) = ρel. (−~r 0 ) — bzw.
von jeder der Komponenten x0i .
Abhängig von der Form von ρel. (~r 0 ) wird sich über Gl. (VIII.23b) eine bestimmte Gesamtladung
Q ergeben, die ohne zusätzliche Information nicht präzisiert werden kann.
Bezüglich des Dipolmoments kann man bemerken, dass das Integrand ~r 0 ρel.(~r 0 ) der definierenden Gleichung (VIII.23c) jetzt eine ungerade Funktion von ~r 0 , die über ein symmetrisches Gebiet
integriert wird, woraus sich automatisch Null ergibt, unabhängig von der genauen Form von ρel. .
Ein detaillierterer Beweis besteht in das Ersetzen von ~r 0 durch −~r 0 im zweiten Integral von
Z
Z
1
0
0
3 0
0
0
3 0
~
P =
~r ρel.(~r ) d ~r + ~r ρel.(~r ) d ~r .
2
Diese Substitution gibt dann genau das Negative des ersten Integrals, voraus P~ = ~0 folgt.
2
142
Elektrostatik
Mithilfe einer ähnlichen Argumentation findet man, dass die Quadrupolmomente Qij für i 6= j
verschwinden. In der Tat lauten sie [Gl. (VIII.23d)]
Z
ij
Q = x0i x0j ρel.(~r 0 ) d3~r 0 für i 6= j.
V
Dabei ist das Integrand eine ungerade Funktion von x0i , die über ein symmetrisches Intervall integriert wird, was zu Qij = 0 führt. Somit ist Qij diagonal.
Schließlich sind die drei Koordinatenachsen wegen der angenommenen Kugelsymmetrie äquivalent, so dass Q11 = Q22 = Q33 . Da der Quadrupoltensor spurlos sein soll, ergibt sich Qii = 0 für
jedes i = 1, 2, 3, d.h. insgesamt Q = 0 .
Bemerkung: Einige der obigen Ergebnisse lassen sich auch „geometrisch“ finden. Die angenommene
Symmetrie bedeutet, dass keine Richtung bzw. kein Vektor von R3 eine besondere Rolle spielt,
sondern dass sie alle äquivalent sind. Dementsprechend gibt es keine bevorzugte Richtung für das
Dipolmoment P~ , das deshalb verschwinden muss. Auf ähnlicher Weise darf der Tensor Q keine
eindeutig (bis auf einen multiplikativen Faktor) definierte Eigenvektoren haben, sondern müssen alle
Vektoren von R3 Eigenvektoren sein: somit muss Q proportional zur Identität sein, d.h. Qij ∝ δ ij .
Dann liefert die Spurlosigkeit den Proportionalitätsfaktor.
Da kugelsymmetrische Ladungsverteilungen keine elektrische Dipol- oder Quadrupolmomente
haben — und eigentlich auch keine höhere Momente —, kann man reziprok folgern, dass solche
Multipolmomente Abweichungen von der Kugelsymmetrie signalisieren.
VIII.3.2
b Einfacher Dipol
:::::::::::::::::::::::::
Der einfachste mögliche elektrische Dipol besteht aus zwei um einen
Abstandsvektor ~a getrennten Punktladungen q und −q.
Bezeichnet man mit ~r0 den Ortsvektor des Mittelpunkts, so lautet die
zugehörige Ladungsdichte
~a
~a
0
(3)
0
(3)
0
ρel.(~r ) = qδ
~r − ~r0 −
− qδ
~r − ~r0 +
.
2
2
q•
6
~a
−q •
Abbildung VIII.3
Eingesetzt in die Gl. (VIII.23b)–(VIII.23d) führt diese Verteilung zur Gesamtladung Q = 0, zum
elektrischen Dipolmoment
P~ = q~a
(VIII.24)
und zu einem verschwindenden Quadrupoltensor Q = 0 .
VIII.3.2
c Beispiel eines Quadrupols
::::::::::::::::::::::::::::::::::::
Ein einfaches Beispiel von einer Ladungsverteilung mit nicht-trivialem
elektrischem Quadrupoltensor besteht aus zwei Punktladungen q in den
Punkten ~r0 ± ~a und einer dritten Punktladung −2q im Mittelpunkt ~r0 .
Die zugehörige Ladungsdichte ist
h
i
ρel.(~r 0 ) = q δ (3) ~r 0 − ~r0 − ~a + δ (3) ~r 0 − ~r0 + ~a − 2δ (3) ~r 0 − ~r0 ,
q•
6
~a
−2q •
6
~a
q•
was sofort Q = 0 und P~ = ~0 für die ersten zwei Multipolmomente ergibt.
Abbildung VIII.4
Die x3 -Achse sei entlang ~a.
Die Ladungsdichte ist eine gerade Funktion von x01 und x02 . Für i 6= j muss entweder i oder j
gleich 1 oder 2 sein, z.B. i = 1: dann ist das Integrand x01 x0j ρel.(~r 0 ) von Q1j ungerade in x01 , was
nach Integration über R Q1j = 0 ergibt.
Wegen der Symmetrie um die x3 -Achse sind die x1 - und x2 -Richtungen äquivalent, so dass
11
Q = Q22 . Aus der Spurlosigkeit von Q folgt dann
Q11 = Q22 = −
Q33
.
2
143
VIII.3 Multipolentwicklung
Schließlich kann man Q33 direkt berechnen:
Z Z 1
2(x03 )2 (x01 )2 + (x02 )2
(x03 )2 − |~r 0 |2 ρel.(~r 0 ) d3~r 0 =
Q33 =
ρel.(~r 0 ) d3~r 0
−
3
3
3
und nach Einsetzen der Ladungsdichte kommt
2
2
4
2
33
3
3
3 2
Q =
q x0 − a + q x0 + a − 2q x0
= qa2
3
3
mit x30 der relevanten Komponente von ~r0 .
Bemerkung: Eine andere geometrische Anordnung, die zu einem nicht-verschwindenden Quadrupoltensor bei Q = 0 und P~ = ~0 führt, besteht aus 4 Punktladungen q, −q, q, −q an den Ecken eines
Quadrats. In diesem Fall ist Q aber nicht diagonal.
−q •
•q
6
a
a -• −q
q •?
Abbildung VIII.5
VIII.3.3 Wechselwirkung zwischen zwei Ladungsverteilungen
Die Wechselwirkung zwischen zwei elektrischen Punktladungen ist durch die bekannte CoulombKraft (VIII.14a) gegeben: sie ist proportional zum Produkt der Ladungen und lässt sich aus der
Potentialenergie (VIII.14b) ableiten. In diesem Paragraphen wird die Wechselwirkung zwischen zwei
beliebigen statischen Ladungsverteilungen ρel.,a , ρel.,b untersucht, insbesondere für den Fall, wenn
diese weit von einander sind — d.h. falls deren Abstand viel größer als ihre typische Größe ist.
VIII.3.3
a Wechselwirkungsenergie zweier Ladungsverteilungen
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Sei Φa bzw. Φb das elektrische Skalarpotential erzeugt durch die Verteilung ρel.,a bzw. ρel.,b gemäß
der Poisson-Gleichung (VIII.4). Laut dem schon in § VIII.1.3 b benutzten Superpositionsprinzip
erzeugt die Ladungsverteilung ρel.,a +ρel.,b das Potential Φa +Φb . Unter Verwendung der Gl. (VIII.16)
lautet dann die gesamte Potentialenergie des Systems aus den zwei Verteilungen
Z
1 V =
ρel.,a (~r) + ρel.,b (~r) Φa (~r) + Φb (~r) d3~r.
(VIII.25)
2
Nach einfachem Ausmultiplizieren des Integranden wird diese Energie zu
Z
Z
Z
1
1
1 3
3
V =
ρel.,a (~r)Φa (~r) d ~r +
ρel.,b (~r)Φb (~r) d ~r +
ρel.,a (~r)Φb (~r) + ρel.,b (~r)Φa (~r) d3~r
2
2
2
(VIII.26)
≡ Va + Vb + VW
Die zwei ersten Terme Va , Vb sind der Art (VIII.16) mit im Integranden dem Produkt aus einer
Ladungsdichte und dem dadurch verursachten Skalarpotential. Diese Terme stehen für die jeweiligen
„Selbstenergien“ der Verteilungen a und b, entsprechend deren Potentialenergie in Abwesenheit der
anderen Verteilung.
Dagegen koppelt der dritte Term VW jede Ladungsdichte mit dem Potential erzeugt durch die
andere Verteilung. Dieser Beitrag stellt die Wechselwirkungsenergie der Ladungsverteilungen dar.
Er lässt sich mithilfe eines Tricks umschreiben.
Aus der Kettenregel folgen nämlich (die Variablen werden nicht geschrieben)
~ · Φa ∇Φ
~ b = ∇Φ
~ a · ∇Φ
~ b + Φa 4Φb und ∇
~ · Φb ∇Φ
~ a = ∇Φ
~ b · ∇Φ
~ a + Φb 4Φa ,
∇
144
Elektrostatik
wobei die Skalarprodukte auf der rechten Seite beider Gleichungen gleich sind. Daraus ergibt sich
~ · Φa ∇Φ
~ b − Φb ∇Φ
~ a .
Φa 4Φb = Φb 4Φa + ∇
Integriert man diese Gleichung über ein Volumen, so lässt sich das Integral des letzten Terms dank
dem Gauß’schen Integralsatz in ein Oberflächenintegral transformieren, und zwar
I
~ b − Φb ∇Φ
~ a · d2~S .
Φa ∇Φ
∂V
Sei V eine um den Nullpunkt zentrierte Kugel mit Radius L, welche die zwei Ladungsverteilungen
einschließt. Ist die Kugelfläche ∂ V weit entfernt von den Verteilungen, d.h. für L groß genug, so wird
das Potential Φi mit i = a oder b in einem Punkt von ∂ V durch die Multipolentwicklung (VIII.23a)
gegeben. Insbesondere nimmt Φi in einem solchen Punkt wie 1/L ab, möglicherweise noch schneller
~ i | proportional zu 1/L2 oder kleiner, und |Φj ∇Φ
~ i | profalls Qi = 0. Dementsprechend ist |∇Φ
3
2
2
2
2
portional zu 1/L . Da das Flächenelement d S sich als L d Ω mit d Ω dem Raumwinkelelement
schreiben lässt, findet man, dass das obige Oberflächenintegral proportional zu 1/L3 · L2 = 1/L ist:
es verschwindet im Grenzwert L → ∞, entsprechend V → R3 .(43) Somit gilt
Z
Z
Φb (~r)4Φa (~r) d3~r.
Φa (~r)4Φb (~r) d3~r =
R3
R3
Multipliziert mit −0 und unter Verwendung von −0 4Φi (~r) = ρel.,i (~r) wird dies zu
Z
Z
Φa (~r)ρel.,b (~r) d3~r + Φb (~r)ρel.,a (~r) d3~r,
so dass die in Gl. (VIII.26) definierte Wechselwirkungsenergie als
Z
Z
VW = ρel.,a (~r)Φb (~r) d3~r = ρel.,b (~r)Φa (~r) d3~r
(VIII.27)
geschrieben werden kann.
VIII.3.3
b Wechselwirkungsenergie zweier entfernter Ladungsverteilungen
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Sei jetzt angenommen, dass die zwei Ladungsverteilungen a, b weit entfernt von einander sind,
wobei die Verteilung a in einer Umgebung des Koordinatennullpunkts lokalisiert ist.
ρel.,a
O
ρel.,b
Abbildung VIII.6
Die Taylor-Entwicklung bis zur zweiten Ordnung um den Wert ~r = ~0 von dem Skalarpotential
Φb (~r) erzeugt durch die Verteilung b lautet
Φb (~r) = Φb (~0) +
3
X
i=1
xi
3
∂Φb (~0) 1 X i j ∂ 2 Φb (~0)
+
xx
+ ··· .
∂xi
2
∂xi ∂xj
i,j=1
Im linearen Term sind die Ableitungen von Φb genau die Komponenten dessen Gradienten; dann
erkennt man das Skalarprodukt aus dem letzteren mit dem Vektor ~r. Dazu kann der quadratische
(43)
Die hier verwendete Argumentation ist genau die gleiche wie für den Beweis von Gl. (VIII.17) in § VIII.1.4 c.
145
VIII.3 Multipolentwicklung
Term erweitert werden, um xi xj als die Summe eines spurlosen und eines diagonalen Beitrags zu
schreiben:
2
3 3
2
X
1
~
r
∂ Φb (~0) ~r 2 X ij ∂ 2 Φb (~0)
i
j
ij
~
Φb (~r) = Φb (~0) + ~r · ∇Φb (~0) +
xx − δ
+
+ ··· .
δ
2
3
∂xi ∂xj
6
∂xi ∂xj
i,j=1
i,j=1
Im letzten Term ist die Summe genau gleich dem Laplace-Operator 4Φb (~0): über die PoissonGleichung ist dieser aber proportional zur Ladungsdichte ρel.,b (~0), die per Annahme Null ist, denn
~ b durch −E
~ b , und drückt man dementdie Verteilung b ist anderswo lokalisiert. Ersetzt man dazu ∇Φ
~ b aus, so ergibt sich
sprechend die zweiten Ableitungen von Φb durch erste Ableitungen von E
i
3 X
∂Eb (~0)
~r 2
~ b (~0) − 1
Φb (~r) = Φb (~0) − ~r · E
xi xj − δ ij
+ ··· .
2
3
∂xj
i,j=1
Dieses Skalarpotential kann dann in die Wechselwirkungsenergie (VIII.27) — in der Form mit
~ b (~0) und ∂E i (~0)/∂xj und
dem Integranden ρel.,a (~r)Φb (~r) — eingesetzt werden. Dabei sind Φb (~0), E
b
unabhängig von der Integrationsvariablen ~r, und können deshalb aus den jeweiligen Integralen herausgezogen werden. Unter Verwendung der kartesischen elektrischen Multipolmomente (VIII.23b)–
(VIII.23d) der Verteilung a ergibt sich dann
3
X
∂Ebi (~0)
~ b (~0) − 1
VW = Qa Φb (~0) − P~a · E
+ ··· .
Qij
a
2
∂xj
(VIII.28)
i,j=1
Bemerkungen:
∗ Wegen der Symmetrie der Wechselwirkungsenergie (VIII.27) gegenüber dem Austausch der beiden Systeme kann VW auch durch die elektrischen Multipolmomente der Verteilung b und das
~ a (~r0 ), ∂E i (~r0 )/∂xj , . . . ) in einem Punkt ~r0 des
Skalarpotential Φa (~r0 ) und dessen Ableitungen (E
a
durch die Verteilung b besetzten Raumgebiets:
3
X
∂Eai (~r0 )
~ a (~r0 ) − 1
VW = Qb Φa (~r0 ) − P~b · E
+ ··· .
(VIII.29)
Qij
b
2
∂xj
i,j=1
Dabei sollen die Multipolmomente relativ zum Punkt ~r0 berechnet werden, d.h. mit ~r 0 − ~r0 bzw.
x0i − xi0 statt ~r 0 bzw. x0i in den Vorfaktoren von ρel.(~r 0 ) in Gl. (VIII.23c)–(VIII.23d).
∗ Die sukzessiven Terme in der Formel (VIII.28) werden im Prinzip — d.h. wenn das zugehörige
Multipolmoment nicht Null ist — immer kleiner mit wachsender Ordnung der darin auftretenden
Ableitung von Φ.
Somit ist der führende Beitrag jener der Gesamtladung, der genau gleich der Potentialenergie einer
Punktladung Qa in einem äußeren (d.h. durch andere Ladungen erzeugten) Skalarpotential Φb ist.
∗ Wenn die Verteilung a sich drehen kann, dann wird sie es so machen, dass die Wechswelwirkungsenergie minimiert wird, entsprechend einem stabilen Gleichgewicht. Falls P~a 6= ~0 ist, wird
~ b (~0) ist.
man deshalb zu einer Situation tendieren, in welcher P~a parallel zum elektrischen Feld E
VIII.3.3
c Dipol-Dipol-Wechselwirkung
::::::::::::::::::::::::::::::::::::::
Sei jetzt angenommen, dass beide Verteilungen “reine Dipole“ sind, d.h. nur deren elektrische
Dipolmomente sind nicht Null, während alle anderen Momente, einschließlich der Gesamtladung,
verschwinden. Der elektrische Dipol a befindet sich im Nullpunkt, der Dipol b in einem Punkt ~r.
Unter einem „reinen Dipol“ versteht man eigentlich ein punktförmiges Objekt, versehen mit
einem elektrischen Dipolmoment, jedoch ohne Gesamtladung oder höhere Multipolmomente.
Wegen der verschwindenden Ausdehnung gilt das Skalarpotential (VIII.30a) überall im Raum
(bis auf ~r = ~0, wo der Dipol sitzt), anstatt nur in großem Abstand vom Dipol, wie es beim
einfachen „physikalischen“ Dipol des § VIII.3.2 b der Fall ist.
146
Elektrostatik
BM
P~aB
~r :
P~b
B
Abbildung VIII.7 – Wechselwirkung zweier Dipole.
Dann ist das durch den Dipol a erzeugte Skalarpotential Φa (~r) laut Gl. (VIII.23a) durch
Φa (~r) =
~r · P~a
4π0 r3
(VIII.30a)
gegeben, mit r ≡ |~r| =
6 0. Dieser Ausdruck führt nach Ableitung zum elektrischen Dipolfeld
~a ~r
~a
3
~
r
·
P
P
~ a (~r) = −∇Φ
~ a (~r) = −
+
E
4π0 r3
4π0 r5
d.h.
~a ~r − ~r 2 P~a
3
~
r
·
P
~ a (~r) =
.
E
4π0 r5
(VIII.30b)
Das Einsetzen dieses Feldes in die Wechselwirkungsenergie (VIII.29), in der nur der Dipolterm
betrachtet wird, ergibt
P~a · P~b − 3 ~er · P~a ~er · P~b
VW =
(VIII.31)
4π0 r3
mit ~er ≡ ~r/|~r| dem Einheitsvektor in Richtung ~r. Dies stellt die Potentialenergie der Dipol-DipolWechselwirkung dar.
Bemerkung: Das elektrische Skalarpotential (VIII.30a) bzw. Dipolfeld (VIII.30b) nimmt mit dem
Abstand r zur Quelle wie 1/r2 bzw. 1/r3 ab, d.h. schneller als das Potential bzw. Feld erzeugt durch
eine Punktladung (1/r bzw. 1/r2 , § VIII.1.3 a).
VIII.3.4 Multipolentwicklung in Kugelkoordinaten
Die Multipolentwicklung kann auch in Kugelkoordinaten (r, θ, ϕ) formuliert werden, wobei die
Ladungsverteilung, die das Skalarpotential verursacht, im Nullpunkt des Bezugssystems sitzt.
Diese Entwicklung basiert auf die folgende Formel, die für beliebige Vektoren ~r, ~r 0 gilt, mit den
Bezeichnungen r< ≡ min(r, r0 ) und r> ≡ max(r, r0 ) für r ≡ |~r|, r0 ≡ |~r 0 |:
∞ X
`
`
X
4π r<
1
=
Y ∗ (θ, ϕ)Y`m (θ, ϕ),
`+1 `m
|~r − ~r 0 |
2` + 1 r>
(VIII.32)
`=0 m=−`
wobei die Y`m die Kugelflächenfunktionen (44) sind. Setzt man diese Identität in den Ausdruck für
das Skalarpotential (VIII.12a) in einem Punkt ~r ein, mit |~r| ≥ |~r 0 | für jeden ~r 0 in der Verteilung, so
ergibt sich
r
∞ X
`
X
4π
Y`m (θ, ϕ)
Φ(~r) =
q`m
,
(VIII.33a)
2` + 1
4π0 r`+1
`=0 m=−`
mit den elektrischen Multipolmomenten
r
Z
4π
∗
(r0 )` Y`m
q`m ≡
(θ0 , ϕ0 )ρel.(~r 0 ) d3~r 0 .
2` + 1
(44)
Vgl. Anhang E.
(VIII.33b)
VIII.3 Multipolentwicklung
147
Jeder ganzen Zahl ` ∈ N sind genau 2` + 1 mögliche Werte
√ von m zugeordnet, d.h. 2` + 1
Multipolmomente q`m . Für ` = 0 prüft man mit Y00 (θ, ϕ) = 1/ 4π einfach nach, dass q00 gleich der
Gesamtladung Q ist. Dann sind die 3 bzw. 5 Multipolmomente q1m bzw. q2m Linearkombinationen
der 3 bzw. 5 unabhängigen Komponenten des Dipolmoments P~ bzw. des Quadrupoltensors Q .
Allgemeiner entsprechen die 2` + 1 Momente q`m den 2` + 1 unabhängigen Komponenten des
symmetrischen, spurlosen elektrischen 2` -poltensors, wobei der letztere `-ter Stufe ist.
Bemerkungen:
∗ Für eine kugelsymmetrische Verteilung ist die Ladungsdichte ρel.(~r0 ) winkelunabhängig, d.h. der
Form Y00 (θ0 , ϕ0 )f (r0 ). Aus der Orthogonalität der Kugelflächenfunktionen folgt dann, dass jedes
Moment q`m mit ` 6= 0 Null ist, was sich hier viel schneller als in § VIII.3.2 a beweisen lässt.
∗ Die Entwicklung in Kugelflächenfunktionen (VIII.33a) ist zwar eine exakte Gleichung, während
die kartesische Multipolentwicklung (VIII.23a) eine Näherung für große Abstände darstellt. Die
erstere ist in der Praxis aber nur nützlich, falls die Anzahl der signifikanten Multipolmomente
endlich (und klein) ist, wodurch die Näherung eines großen Abstands wieder auftaucht.
Literatur zum Kapitel VIII
• Fließbach, Elektrodynamik [3] Teil II.
• Greiner, Klassische Elektrodynamik [8] Teil I.
• Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap 2.1–2.4 & 3.
• Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 1.1–1.5, 1.7–
1.11, 2.1, 3.5–3.6 & 4.1–4.2.
• Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 5
§ 36–38 & 41–42
• Nolting, Elektrodynamik [17] Kap. 2.1–2.3.
• Scheck, Klassiche Feldtheorie [19] Kap. 1.5 & 1.7.
K APITEL IX
Magnetostatik
Hier fehlt die obligatorische Einleitung. . .
Im stationären Fall vereinfachen sich die Maxwell–Thomson- und die Maxwell–Ampère-Gleichungen
~ r) — die jetzt zeitunabhängig ist — zu
für die magnetische Flussdichte B(~
~ · B(~
~ r) = 0
∇
~ × B(~
~ r) = µ0~el.(~r).
∇
(IX.1a)
(IX.1b)
IX.1 Grundbegriffe und -ergebnisse der Magnetostatik
Dieser Abschnitt befasst sich mit einigen elementaren Folgerungen der Grundgleichungen (IX.1) der
Magnetostatik.
IX.1.1 Vektorpotential
Aus der (stationären) Maxwell–Thomson-Gleichung (IX.1a) folgt die Existenz eines differenzier~ r) derart, dass die Beziehung
baren Vektorfeldes A(~
~ r) = ∇
~ × A(~
~ r)
B(~
(IX.2)
~ r) heißt (magnetisches) Vektorpotential , mit der physiin jedem Punkt ~r erfüllt wird. Das Feld A(~
−2 −1 (45)
kalischen Dimension [A] = M L T I .
~ auf R3 definiert ist, wird die Existenz von A(~
~ r) unten bewiesen,
Falls das magnetische Feld B
indem es explizit konstruiert wird [Gl. (IX.11)].
~ r) und einer elektrischen Ladung q hat die
Bemerkung: Das Produkt aus dem Vektorpotential A(~
physikalische Dimension M L T−1 eines Impulses.
Eichfreiheit
::::::::::::
~ r) entsprechend einem gegebenen magnetischen Feld B(~
~ r) wird durch
Das Vektorpotential A(~
0
~ über
Gl. (IX.2) nicht eindeutig festgestellt. Definiert man nämlich ein Vektorfeld A
~ 0 (~r) ≡ A(~
~ r) + ∇χ(~
~ r)
A
(IX.3a)
~0
mit χ einer beliebigen kontinuierlich differenzierbaren skalaren Funktion, so ist die Rotation von A
~ 0 (~r) ≡ ∇
~ ×A
~ 0 (~r) = ∇
~ × A(~
~ r) + ∇
~ × ∇χ(~
~ r) = B(~
~ r),
B
(IX.3b)
~ 0 ist auch ein geeignetes Vektorpotential für das Feld B.
~ Die Mehrdeutigkeit in der Wahl des
d.h. A
Vektorpotentials wird als Eichfreiheit bezeichnet, und eine bestimmte Wahl als Eichung.
(45)
Die zugehörige SI-Einheit wird nie benutzt.
149
IX.1 Grundbegriffe und -ergebnisse der Magnetostatik
Um das Vektorpotential eindeutig — möglicherweise bis auf einen konstanten additiven Vektor —
~ r) fordern. Dabei soll diese Eichbedingung
festzulegen, kann man eine zusätzliche Bedingung über A(~
so gewählt sein, dass einige Gleichungen damit einfacher werden, wie es in § IX.1.2 c der Fall sein
wird.
In der Magnetostatik wird meistens die Coulomb-Eichung gewählt, entsprechend der CoulombEichbedingung
~ · A(~
~ r) = 0.
∇
(IX.4)
~ 0 (~r) ein Vektorpotential für die magnetische Induktion B(~
~ r). Falls die Divergenz von A
~0
Sei A
~
~
Null ist, dann erfüllt es schon die Coulomb-Eichbedingung. Wenn ∇ · A0 (~r) nicht identisch
verschwindet, dann hat die Poisson-Gleichung
~ ·A
~ 0 (~r)
4χ(~r) = −∇
~ ≡ A
~ 0 + ∇χ,
~
eine nicht-konstante Lösung χ(~r) auf R3 . Definiert man dann A
so findet man
~
sofort, dass A die Bedingung (IX.4) erfüllt.
IX.1.2 Poisson-Gleichungen der Magnetostatik
Aus den Grundgleichungen (IX.1) können Poisson-Gleichungen für die magnetische Induktion
~ r) oder das Vektorpotential A(~
~ r) abgeleitet werden, wobei sich diese Vektorfelder durch die
B(~
elektrische Stromdichte ~el.(~r) ausdrücken lassen.
IX.1.2
a Poisson-Gleichung für die magnetische Induktion
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Die Rotationsbildung der stationären Maxwell–Ampère-Gleichung (IX.1b) lautet
~ × ∇
~ × B(~
~ r) = 1 ∇
~ × ~el.(~r).
∇
0 c2
Dabei kann auf der linken Seite die Identität
~ × ∇
~ × B(~
~ r)] = ∇
~ ∇
~ · B(~
~ r)] − 4B(~
~ r)
∇
benutzt werden, wobei der erste Term im rechten Glied wegen der Maxwell–Thomson-Gleichung
Null ist. Insgesamt ergibt sich somit
~ r) = −µ0 ∇
~ × ~el.(~r)
4B(~
(IX.5)
d.h. jede (kartesische) Komponente der magnetischen Induktion genügt der Poisson-Gleichung. Die
Lösung dieser Gleichung wurde in Abschn. VIII.2 schon studiert. Ist die elektrische Ladungsstromdichte ~el. bekannt auf R3 — und wenn deren Rotation schnell genug im Unendlichen nach Null
geht, damit das untere Integral definiert ist —, so gilt
~ r) = µ0
B(~
4π
Z ~
∇ × ~el.(~r 0 ) 3 0
d ~r .
|~r − ~r 0 |
(IX.6)
In der Praxis kann das Integral auf ein Raumgebiet V beschränkt werden, wenn es keine Stromdichte
im Unendlichen gibt.
IX.1.2
b Biot–Savart-Gesetz
::::::::::::::::::::::::::::
Unter Einführung eines kartesischen Koordinatensystems mit Basis {~ei } lässt sich die i-te Komponente der Beziehung (IX.6) als
Z
k (~
r 0) 3 0
µ0
ijk ∂jel.
i
B (~r) =
d ~r
4π V |~r − ~r 0 | ∂x0j
umschreiben. Die rechte Seite kann mithilfe einer partiellen Integration transformiert werden. Dabei
150
Magnetostatik
wird angenommen, dass das Integrationsvolumen V groß genug ist, damit die Stromdichte ~el. am
Rand ∂ V verschwindet. Dann ist der integrierte Term aus der partiellen Integration Null, und es
bleibt
Z
µ0
1
i
ijk k
0 ∂
B (~r) = −
jel.(~r ) 0j
d3~r 0 .
4π V
∂x
|~r − ~r 0 |
Das Ersetzen von −ijk durch ikj und die Berechnung der Ableitung liefern
Z
µ0
xj − x0j 3 0
i
k
B (~r) =
ikj jel.
(~r 0 )
d ~r ,
4π V
|~r − ~r 0 |3
d.h.
~ r) = µ0
B(~
4π
~el.(~r 0 ) × (~r−~r 0 ) 3 0
d ~r .
|~r − ~r 0 |3
V
Z
(IX.7)
Diese Beziehung heißt Biot (ag) –Savart (ah) -Gesetz .
IX.1.2
c Poisson-Gleichung für das Vektorpotential
:::::::::::::::::::::::::::::::::::::::::::::::::::
~ r) = ∇
~ × A(~
~ r) in die stationäre Maxwell–Ampère-Gleichung (IX.1b)
Setzt man die Beziehung B(~
ein, so ergibt sich
~ × ∇
~ × A(~
~ r)] = µ0~el.(~r),
∇
d.h. unter Berücksichtigung der Formel für die Rotation einer Rotation
~ r) = −µ0~el.(~r) + ∇
~ ∇
~ · A(~
~ r) .
4A(~
(IX.8)
Unter Verwendung der Coulomb-Eichbedingung (IX.4) vereinfacht sich diese Gleichung erneut
zu einer Poisson-Gleichung
~ r) = −µ0~el.(~r) in der Coulomb-Eichung.
4A(~
(IX.9)
Wie oben kann man die Lösung dieser Gleichung direkt schreiben:
~ r) = µ0
A(~
4π
~el.(~r 0 ) 3 0
d ~r .
r − ~r 0 |
V |~
Z
(IX.10)
Falls ~el. am Rand des Integrationsgebiets V verschwindet — was der Fall ist, wenn V nicht der
ganze Raum R3 ist —, so erfüllt das Vektorpotential (IX.10) die Coulomb-Eichbedingung (IX.4).
~ ~r bzw. ∇
~ ~r 0 den Nabla-Operator bezüglich der Koordinaten des
Beweis: Bezeichnet man mit ∇
Vektors ~r bzw. ~r 0 , so gilt
Z
Z
0
1
~ · A(~
~ r) = µ0 ∇
~ ~r · ~el.(~r ) d3~r 0 = µ0 ~el.(~r 0 ) · ∇
~ ~r
d3~r 0 .
∇
4π V
|~r − ~r 0 |
4π V
|~r − ~r 0 |
~ ~r (1/|~r−~r 0 |) = −∇
~ ~r 0 (1/|~r−~r 0 |) schreiben. Dann lässt sich das daraus
Im Integranden kann man ∇
folgende Integral über partielle Integration berechnen, wobei der integrierte Term, proportional
zur Ladungsstromdichte ausgewertet am Rand des Integrationsgebiets, Null ist:
Z
Z
1
µ0
1 ~
3 0
~ · A(~
~ r) = − µ0 ~el.(~r 0 ) · ∇
~ ~r 0
∇
d
~
r
=
∇~r 0 · ~el.(~r 0 ) d3~r 0 .
4π V
|~r − ~r 0 |
4π V |~r − ~r 0 |
(ag)
~ ~r 0 · ~el.(~r 0 ) = 0, was zu
Aus der stationären Maxwell–Ampère-Gleichung (IX.1b) folgt sofort ∇
~ · A(~
~ r) = 0 führt.
∇
2
J.-B. Biot, 1774–1862
(ah)
F. Savart, 1791–1841
151
IX.1 Grundbegriffe und -ergebnisse der Magnetostatik
Das Biot–Savart-Gesetz (IX.7) kann auch aus der Beziehung (IX.10) wiedergefunden werden.
Bildet man deren Rotation, so ergibt sich
~ × A(~
~ r) = µ0
∇
4π
0
~ ~r × ~el.(~r ) d3~r 0 .
∇
|~r − ~r 0 |
V
Z
In einem kartesischen Koordinatensystems lautet die i-te Komponente dieser Gleichung
µ0
B (~r) =
4π
i
Z
ijk
V
k (~
r 0) 3 0
∂ jel.
µ0
d ~r =
j
0
∂x |~r − ~r |
4π
Z
V
k
ijk jel.
(~r 0 )
∂
∂xj
1
d3~r 0 .
|~r − ~r 0 |
Dabei gibt die Ableitung −(xj − x0j )/|~r − ~r 0 |3 . Mit −ijk = ikj ergibt sich
µ0
B (~r) =
4π
i
Z
V
k
ikj jel.
(~r 0 )
xj − x0j 3 0
d ~r ,
|~r − ~r 0 |
entsprechend genau der i-ten Komponente der Gl. (IX.7).
Bemerkung: Unter Verwendung der stationären Maxwell–Ampère-Gleichung wird die Gl. (IX.10) zu
einem Zusammenhang zwischen dem Vektorpotential (in Coulomb-Eichung) und der magnetischen
Induktion:
Z ~
~ r 0)
∇ × B(~
1
~
d3~r 0 .
(IX.11)
A(~r) =
4π V |~r − ~r 0 |
Dabei handelt es sich um einen Sonderfall der Helmholtz (ai) -Zerlegung, laut welcher jedes Vektorfeld
~ (~r) auf R3 , das sich im Unendlichen „gut verhält“ — d.h. derart, dass die Integrale (IX.12b)–
V
~k (~r) und eines Rotationsfeldes V
~⊥ (~r)
(IX.12c) existieren(46) —, als Summe eines Gradientenfeldes V
schreiben lässt:
~ (~r) = V
~k (~r) + V
~⊥ (~r), wobei
V
Z ~
~ (~r 0 )
∇~r 0 · V
~
~
Vk (~r) = −∇Φ(~r) mit Φ(~r) ≡
d3~r 0
0|
4π|~
r
−
~
r
V
Z ~
~ 0
~⊥ (~r) = ∇
~ × A(~
~ r) mit A(~
~ r) ≡ ∇~r 0 × V (~r ) d3~r 0 .
V
r − ~r 0 |
V 4π|~
(IX.12a)
(IX.12b)
(IX.12c)
Dabei gelten
~ ·V
~⊥ (~r) = 0 und ∇
~ ×V
~k (~r) = ~0,
∇
(IX.12d)
~ ·V
~ (~r) = ∇
~ ·V
~k (~r) und ∇
~ ×V
~ (~r) = ∇
~ ×V
~⊥ (~r).
∇
(IX.12e)
d.h.
~ (~r) = B(~
~ r) mit ∇
~ · B(~
~ r) bzw. ∇
~ × B(~
~ r) gegeben durch Gl. (IX.1a) bzw.
In der Magnetostatik ist V
~
~
~ · E(~
~ r) bzw. ∇
~ × E(~
~ r)
(IX.1b). Für die Elektrostatik soll man V (~r) = E(~r) betrachten, während ∇
durch Gl. (VIII.1a) bzw. (VIII.1b) gegeben sind.
(46)
(ai)
~ (~r)| schneller als 1/r für r → ∞ abnehmen soll.
In Lehrbüchern findet man oft die Forderung, dass der Betrag |V
~ , vgl. z.B. Ref. [28] für eine Diskussion.
Mathematisch gilt das Ergebnis auch mit schwächeren Annahmen über V
H. von Helmholtz, 1821–1894
152
Magnetostatik
IX.1.3 Integrale Formulierung der Grundgleichungen der Magnetostatik
In diesem Paragraphen werden die integralen Formulierungen dargestellt, die den lokalen Grundgleichungen (IX.1) der Magnetostatik entsprechen.
IX.1.3
a Fluss der magnetischen Induktion
:::::::::::::::::::::::::::::::::::::::::::
Sei ∂ V eine geschlossene Fläche, die ein Gebiet V einschließt. Der magnetische Fluss durch die
I
Oberfläche ∂ V wird durch
~ r) · d2 S~
ΦB ≡
B(~
(IX.13)
∂V
d2 S~
d2 S ~en
definiert, mit
=
dem vektoriellen Oberflächenelement, wobei ~en den nach außen ausgerichteten Normaleinheitsvektor zu d2 S bezeichnet.
Unter Verwendung des Integralsatzes von Gauß ist das Oberflächenintegral auf der rechten Seite
gleich dem Volumenintegral der Divergenz des Integranden, d.h.
I
Z
2~
~
~ · B(~
~ r) d3~r.
B(~r) · d S = ∇
V
∂V
Wegen der Maxwell–Thomson-Gleichung (IX.1a) ist die rechte Seite dieser Gleichung immer Null,
unabhängig von V
ΦB = 0.
(IX.14)
Das heißt, der magnetische Fluss durch jede geschlossene Fläche ist immer Null.
IX.1.3 b Ampère-Gesetz
Sei S eine Fläche und ∂S deren Rand. Das Oberflächenintegral über S der stationären Maxwell–
Ampère-Gleichung (IX.1b) lautet
Z
Z
2~
~
~
~
∇ × B(~r) · d S = µ0 ~el.(~r) · d2 S.
::::::::::::::::::::::::
S
S
Dabei ist das Integral auf der rechten Seite genau gleich der Stärke I des elektrischen Stroms durch
S. Wiederum lässt sich auf der linken Seite das Oberflächenintegral einer Rotation über S mit dem
Integralsatz von Stokes in ein Kurvenintegral entlang des geschlossenen Rands ∂S transformieren.
Somit ergibt sich das Ampère-Gesetz
I
Z
~
~
B(~r) · d` = µ0 ~el.(~r) · d2 S~ = µ0 I.
(IX.15)
S
∂S
~ (~r) entlang einer geschlossene Kurve C wird
Bemerkung: Das Kurvenintegral eines Vektorfeldes V
Zirkulation des Feldes längs C genannt. Somit tritt auf der linken Seite des Ampère-Gesetzes (IX.15)
die Zirkulation der magnetischen Induktion längs des Rands ∂S.
Dementsprechend besagt das Ampère-Gesetz, dass die Zirkulation der magnetischen Induktion längs einer geschlossenen Kurve ∂S gleich µ0 mal dem elektrischen Strom durch eine von ∂S
aufgespannte Fläche ist.
IX.1.3
c Erhaltung des elektrischen Stroms
:::::::::::::::::::::::::::::::::::::::::::
Die Divergenzbildung der stationären Maxwell–Ampère-Gleichung (IX.1b) gibt
~ · ~el.(~r) = 0.
∇
Unter Verwendung des Integralsatzes von Gauß ergibt sich dann
Z
I
~ · ~el.(~r) d3~r =
0= ∇
~el.(~r) · d2 S~
V
(IX.16)
(IX.17)
∂V
d.h. der resultierende Ladungsstrom durch die Oberfläche ∂ V eines Volumens V verschwindet: der
153
IX.1 Grundbegriffe und -ergebnisse der Magnetostatik
einströmende Ladungsstrom muss wieder herausströmen, entsprechend der Abwesenheit von Quellen
des elektrischen Stroms.
~ (~r), dessen Divergenz überall verBemerkung: Dementsprechend wird ein allgemeines Vektorfeld V
schwindet, als quellfrei bezeichnet.
Aus dieser Erhaltung des Ladungsstroms folgt die Kirchhoff ’sche (aj) Knotenregel ,(47) laut der die
Summe der an einem Leiterknoten zufließenden elektrischen Ströme gleich der Summe der daraus
abfließenden Ströme ist.
Beweis: Betrachtet man ein Volumen V um den Knoten, so ist der nach außen gerichtete Fluss
der Stromdichte ~el. durch die Fläche ∂ V gleich der algebraischen Summe der Stromstärken in
den Leitern, wobei aus- bzw. einfließende Ströme positiv bzw. negativ gezählt werden. Für das
Beispiel der Abb. IX.1
I
~el.(~r) · d2 S~ = I1 − I2 − I3 − I4 + I5 = 0.
∂V
∂V
I2
I1
•
I5
I3
I4
Abbildung IX.1 – Knotenregel
IX.1.4 Magnetisches Feld induziert durch einfache Ladungsströme
Im Fall eines Ladungsstroms durch einen dünnen Draht vereinfacht sich das Integral im Biot–
Savart-Gesetz (IX.7) oder in den äquivalenten Formeln (IX.6) und (IX.10). Betrachtet man nämlich
ein infinitesimales Volumenelement d3~r 0 um einen Teil des Drahts, so lässt sich dieses als d2 S 0 d`0
d2 S 0
d2 S
d`0
Abbildung IX.2
(47)
(aj)
d.h. auch bekannt als erstes Kirchhoff ’sches Gesetz .
G. Kirchhoff, 1824–1887
154
Magnetostatik
schreiben, mit d`0 der Länge von d3~r 0 entlang des Drahts und d2 S 0 die Fläche des Querschnitts von
d3~r 0 senkrecht dazu.
Sei ~ek der Einheitsvektor in Drahtrichtung — d.h. kollinear zur Stromdichte ~el.(~r 0 ) —, sowie
Vektoren d~` 0 ≡ d`0 ~ek und d2 S~ 0 ≡ d2 S 0 ~ek , im Einklang mit der üblichen Definition des vektoriellen
Flächenelements. Dann gilt
~el.(~r 0 ) d3~r 0 = ~el.(~r 0 ) d2 S 0 d`0 = ~el.(~r 0 ) · d2 S~ 0 d~` 0 .
Daraus folgt
Z
~el.(~r 0 ) d3~r 0 =
Z Z
~el.(~r 0 ) · d2 S~ 0 d~` 0 .
Zum Oberflächenintegral trägt nur der in Abb. (IX.2) Querschnitt d2 S bei, was die Stromstärke I
des Ladungsstroms ergibt. Insgesamt können Volumenintegrale durch Kurvenintegrale entlang des
Drahts ersetzt werden, mit der Substitution
~el.(~r 0 ) d3~r 0 = I d~` 0 .
IX.1.4 a Magnetisches Feld eines dünnen geradlinigen Draht
Durch einen unendlich langen dünnen geradlinigen elektrischen Leiter
fließt ein (stationärer) Ladungsstrom I. Dieser erzeugt in jedem Punkt ~r
~ r).
außerhalb des Drahts eine magnetische Induktion B(~
Wegen der Zylindersymmetrie um den Draht hängt der Betrag des Feldes
in ~r nur vom Abstand R zur Achse des Leiters ab, sei B(R).
Sei C ein Kreis mit Radius R in einer Ebene senkrecht zum Draht,
wo-
~ r)
bei der letztere durch das Zentrum des Kreises durchläuft; dann ist B(~
(IX.18)
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
I
C
~
B
konstant entlang C . Wegen der Symmetrie der Geometrie in Spiegelungen
~ r) in einem Punkt ~r des Kreises in der
bezüglich der Ebene von C muss B(~
~
Ebene liegen; genauer ist B(~r) tangential zum Kreis, denn es orthogonal
zum Abstandsvektor zur Drahtachse ist. Die genaue Richtung folgt aus
Abbildung IX.3
der Rechte-Hand-Regel.
~ r) in jedem Punkt ~r des Kreises tangential dazu ist, lautet die Zirkulation der magnetischen
Da B(~
Induktion entlang C
I
I
~
~
~ r) d` = 2πRB(R),
B(~r) · d` = B(~
C
C
~ r) auf C berücksichtigt. Laut dem Ampèrewobei die zweite Gleichung den konstanten Wert von B(~
Gesetz ist diese Zirkulation gleich µ0 I, woraus sich
B(R) =
µ0 I
2πR
(IX.19)
ergibt.
IX.1.4
b Magnetisches Feld einer Leiterschleife
:::::::::::::::::::::::::::::::::::::::::::::::
Als Ladungsstrom wird jetzt ein stationärer Strom I durch eine kreisförmige Leiterschleife C
~ r) in einem Punkt P auf der
mit Radius R betrachtet. Gesucht ist die magnetische Induktion B(~
Achse des Kreises. Sei O das Zentrum von C und x der Abstand zwischen O und P .
Laut dem Biot–Savart-Gesetz (IX.7) mit der Substitution (IX.18) ist das Feld erzeugt durch die
Leiterschleife durch
I
I d~` 0 × (~r − ~r 0 )
~ r) = µ0
(IX.20)
B(~
4π C
|~r − ~r 0 |3
gegeben. Dabei ist ~r 0 der Ortsvektor des Linienelements d~` 0 entlang des Leiters.
155
IX.1 Grundbegriffe und -ergebnisse der Magnetostatik
d~`
d
I
~
dB
ϕ
α
x
O
C
•
P
R
x2
x1
x3
Abbildung IX.4
~ gegeben durch
Ein solches Leiterelement erzeugt eine infinitesimale magnetische Induktion dB
das Integrand des Kurvenintegrals. Dieses Feld ist senkrecht zum Abstandsvektor ~r −~r 0 von d`0 bis
zum Punkt P , wie in Abb. IX.4 dargestellt wird. Das Problem besitzt aber Zylindersymmetrie um
~
die Achse des Kreises, so dass das durch den ganzen Stromkreis erzeugte Feld B(x)
parallel dazu
sein muss. Dementsprechend wird hiernach nur die Komponente der Gl. (IX.20) entlang der Achse
betrachtet.
Unabhängig von der Position des Linienelements d~` 0 entlang C bleibt dessen Abstand |~r − ~r 0 |
zum Punkt P konstant, sei d, während der Abstandsvektor ~r − ~r 0 und d~` 0 immer orthogonal zu
einander sind. Somit ist der Betrag des Integranden von Gl. (IX.20) konstant gleich I d`0 /d2 .
Gleichfalls ist der Winkel zwischen dem durch den durch d~` 0 fließenden Strom erzeugten Feld
~ und der Achse auch konstant, und zwar gleich π/2 − α, wobei α in Abb. IX.4 definiert ist.
dB
~
Daraus folgert man für den Betrag von B
I
I
I d`0
π
µ0 I
π
µ0 I
π
0
~ = µ0
B(x)
cos
−α =
cos
−α
d` =
cos
− α 2πR.
4π C d2
2
4π d2
2
4π d2
2
C
√
Dabei gilt cos(π/2 − α) = sin α = R/d, mit d = R2 + x2 . Insgesamt kommt
R2
~ = µ0 I
B(x)
2 (R2 + x2 )3/2
~ ist gerichtet nach rechts in Abb. IX.4.
und B
Alternativ kann man ein kartesisches Koordinatensystem einführen (vgl. Abb. IX.4) und damit
arbeiten. Parametrisiert man die Position eines Punkts von C mit einem Winkel ϕ, so gelten
 




0
R cos ϕ
−R cos ϕ
~r =  0  und ~r 0 =  R sin ϕ  d.h. ~r − ~r 0 =  −R sin ϕ  .
x
0
x
Dazu kann man bemerken, dass das Linienelement d~` 0 tangential zum Kreis genau die infinitesimale Variation von ~r 0 darstellt; daher ist


−R sin ϕ
0
0
d~r
d~r
d~` 0 =
dϕ mit
=  R cos ϕ 
dϕ
dϕ
0
und das Kurvenintegral entlang C wird zu einem Integral über ϕ ∈ [0, 2π]. Daraus folgt


xR cos ϕ
 dϕ.
xR sin ϕ
d~` 0 × (~r − ~r 0 ) = 
R2 (cos2 ϕ + sin2 ϕ)
156
Magnetostatik
Das Einsetzen in die Biot–Savart-Formel (IX.20) unter Berücksichtigung von |~r−~r 0 | =
ergibt schließlich

 

Z 2π
xR cos ϕ
0
2
µ
I
µ
I
R
0
0
~ r) =
 xR sin ϕ  dϕ =
0
B(~
4π 0 (R2 + x2 )3/2
2 (R2 + x2 )3/2
R2
1
√
R 2 + x2
im Einklang mit dem schon oben gefundenen Ergebnis.
IX.1.5 Kraft zwischen zwei Stromkreisen
In Abwesenheit eines elektrischen Feldes lautet die Lorentz-Kraftdichte auf eine Ladungsstromdichte ~el. in einem magnetischen Feld
~ r).
f~L (~r) = ~el.(~r) × B(~
(IX.21)
Ausgehend aus dieser Formel kann man die Kraft F~a→b , die ein erster Stromkreis a mit Stromdichte
~el.,a auf einem zweiten Stromkreis b mit Stromdichte ~el.,b ausübt.
Sei V a bzw. V b ein Gebiet, das den Stromkreis a bzw. b beinhaltet, wobei ~el.,i in jedem Punkt
~ a im
des Rands von V i verschwindet. Die Stromdichte ~el.,a erzeugt eine magnetische Induktion B
Raum, insbesondere in jedem Punkt ~rb ∈ V b . Dadurch erfährt der Stromkreis b eine Kraft
Z
~ a (~rb ) d3~rb .
F~a→b = ~el.,b (~rb ) × B
Vb
~ a (~rb ) mithilfe des Biot–Savart-Gesetzes geschrieben werden:
Dabei kann B
Z
Z
~el.,a (~ra ) × (~rb − ~ra ) 3
µ0
~
Fa→b =
~el.,b (~rb ) ×
d ~ra d3~rb .
4π Vb
|~rb − ~ra |3
Va
Diese Formel lässt sich mit Hilfe der Identität
~rb − ~ra
1
~
= −∇b
|~rb − ~ra |3
|~rb − ~ra |
umschreiben
~b
~el.,b (~rb ) × ∇
1
× ~el.,a (~ra ) d3~rb d3~ra
|~rb − ~ra |
Va Vb
Unter Verwendung des doppelten Kreuzprodukts ~a × ~b × ~c = ~a · ~c ~b − ~a · ~b ~c kommt
Z Z
1
µ0
~
~
~el.,a (~ra ) · ~el.,b (~rb ) ∇b
d3~rb d3~ra
Fa→b =
4π Va Vb
|~rb − ~ra |
Z Z µ0
1
~
−
~el.,b (~rb ) · ∇b
~el.,a (~ra ) d3~rb d3~ra .
4π Va Vb
|~rb − ~ra |
µ0
F~a→b =
4π
Z Z
(IX.22)
Wie wir jetzt beweisen werden, ist der Term in der zweiten Zeile Null, denn das darin enthaltene
Integral über ~rb verschwindet. In der Tat gilt unter Einführung der Koordinaten {xkb } von ~rb
Z
Z X
3
∂
1
1
3
k
~
~el.,b (~r) · ∇~rb
d ~rb =
jel.,b (~rb ) k
d3~rb
|~rb − ~ra |
∂xb |~rb − ~ra |
Vb
Vb k=1
k
Z X
Z
3
3
k (~
X
jel.,b (~rb ) 3
∂jel.,b
rb ) 3
∂
1
d ~rb .
=
d
~
r
−
k
k
rb − ~ra |
∂xb |~rb − ~ra |
∂xb
Vb
Vb |~
k=1
k=1
Dabei erkennt man die Divergenz zweier Vektorfelder:
Z
Z
Z
~

(~
r
)
1
1
el.,b
b
3
3
~ ~r
~
~ b · ~el.,b (~rb ) d3~rb .
~el.,b (~rb ) · ∇
d
~
r
=
∇
·
d
~
r
−
∇
b
b
b
b
|~
r
−
~
r
|
|~
r
−
~
r
|
|~
r
−
~
r
|
a
a
a
b
b
Vb
Vb
Vb b
157
IX.2 Multipolentwicklung
Das zweite Integral auf der rechten Seite verschwindet wegen der Quellfreiheit (IX.16) der Stromdichte. Wiederum lässt sich das erste Integral mit dem Satz von Gauß transformieren: daraus kommt
das Oberflächenintegral von ~el.,b (~rb )/|~rb − ~ra | über den Rand ∂ V b , wo ~el.,b Null ist, so dass auch
dieses Term verschwindet.
Insgesamt bleibt somit die Kraft
Z Z
µ0
1
~
~
Fa→b =
~el.,a (~ra ) · ~el.,b (~rb ) ∇b
d3~rb d3~ra .
(IX.23)
4π Va Vb
|~rb − ~ra |
Da der Gradient von 1/|~rb − ~ra | bezüglich ~ra das Negative des Gradienten bezüglich ~rb ist,
kommt ein globales Minus-Zeichen im Austausch der Rollen von a und b, und zwar F~b→a = −F~a→b .
Dies ist genau das dritte Newton’sche Gesetz (I.19).
IX.2 Multipolentwicklung
Ähnlich der in Abschn. VIII.3 studierten Entwicklung des elektrostatischen Skalarpotentials Φ(~r)
einer Ladungsverteilung ρel. als Summe der Potentiale erzeugt durch sukzessive Multipolmomente,
wobei das 2` -te Moment einen Beitrag proportional zu 1/r`+1 liefert, kann das Vektorpotential
~ r) einer Ladungsstromverteilung ~el. ebenfalls als Summe der Effekte von Multipolmomenten
A(~
geschrieben werden.
IX.2.1 Multipolmomente einer Ladungsstromverteilung
Es wird angenommen, dass die Stromverteilung innerhalb eines Volumens V in der Umgebung
des Ursprungs des Bezugssystems lokalisiert ist, wobei ~el. in jedem Punkt des Rands ∂ V von V
Null ist. Das magnetische Feld wird in einem weit entfernten Punkt ~r gesucht, d.h. |~r −~r 0 | R für
jeden ~r 0 ∈ V .
Gemäß der Gl. (IX.9) lautet das Vektorpotential (in Coulomb-Eichung)
Z
µ0
~el.(~r 0 ) 3 0
~
A(~r) =
d ~r .
4π V |~r − ~r 0 |
Dank den Annahmen ist der Abstand |~r − ~r 0 | im Nenner des Integranden ungefähr gleich r ≡ |~r|.
Somit kann der Bruch 1/|~r − ~r 0 | mithilfe einer Taylor-Entwicklung angenähert werden. Zur ersten
Ordnung in ~r0 gilt
3
1
1 ~r · ~r 0
1
1 X xk 0k
1
= + 3 +O 3 = +
x +O 3
0
3
|~r − ~r |
r
r
r
r
r
r
i=k
mit xk bzw. x0k den kartesischen Koordinaten von ~r bzw. ~r 0 . Das Einsetzen dieser Entwicklung in
der Formel für das Vektorpotential ergibt
~ r) = µ0
A(~
4πr
Z
~el.(~r 0 ) d3~r 0 +
V
Z
3
µ0 X k
x
x0k~el.(~r 0 ) d3~r 0 + · · · .
4πr3
V
(IX.24)
k=1
Die Integrale in dieser Entwicklung des Vektorpotentials in Potenzen von 1/r sind die (kartesischen)
magnetischen Multipolmomente der Stromverteilung. Wie wir jetzt sehen werden ist der erste Term
in der Tat Null, so dass der führende ist jener des Dipolmoments.
Lemma: Sei f bzw. J~ eine kontinuierlich differenzierbare skalare Funktion bzw. ein quellfreies
Vektorfeld auf einem Gebiet V , wobei J~ in jedem Punkt des Rands ∂ V von V verschwindet. Dann
gilt
Z
~ r 0 ) · ∇f
~ (~r 0 ) d3~r 0 = 0.
J(~
(IX.25)
V
158
Magnetostatik
~ r 0 ) = ~0 in jedem Punkt ~r 0 ∈ ∂ V gilt
Beweis: Dank der Annahme J(~
I
~ r 0 ) · d2 S~ = 0.
f (~r 0 )J(~
∂V
Transformiert man das Oberflächenintegral auf der linken Seite mit dem Satz von Gauß, so
ergibt sich unter Verwendung der Produktregel
Z
Z
~ · f (~r 0 )J(~
~ r 0 ) d3~r 0 =
~ · J(~
~ r 0 ) + J(~
~ r 0 ) · ∇f
~ (~r 0 ) d3~r 0 .
0= ∇
f (~r 0 ) ∇
V
V
~ woraus
Der erste Term in den eckigen Klammern verschwindet dank der Quellfreiheit von J,
das gesuchte Ergebnis folgt.
2
Wendet man dieses Lemma mit J~ = ~el. und f (~r 0 ) = x0k an, wobei eine triviale Berechnung
~
∇f (~r 0 ) = ~ek ergibt, so kommt für jedes k = 1, 2, 3
Z
Z
k
0
0
3 0
~
(~r 0 ) d3~r 0 = 0,
~el.(~r ) · ∇f (~r ) d ~r = jel.
V
V
d.h. insgesamt
Z
~el.(~r 0 ) d3~r 0 = ~0.
(IX.26)
V
Somit ist der erste Term auf der rechten Seite der Multipolentwicklung (IX.24) Null. Das heißt, es
gibt keine magnetische Monopole — entsprechend der Abwesenheit eines Quellterms auf der rechten
Seite der Maxwell–Thomson-Gleichung (IX.1a).
~ (~r 0 ) = x0l ~ek + x0k ~el und das Lemma (IX.25) gibt
Sei jetzt f (~r 0 ) = x0k x0l ; dann ist ∇f
Z
0l k 0
l
(~r 0 ) d3~r 0 = 0
x jel.(~r ) + x0k jel.
V
für alle k, l ∈ {1, 2, 3}. Diese Gleichung kann verwendet werden, um das Integral des zweiten Terms
in Gl. (IX.24) umzuschreiben:
Z
Z
3
X
l
0k
0
3 0
(~r 0 ) d3~r 0
~el x0k jel.
x ~el.(~r ) d ~r =
V
l=1
3
X
V
Z
Z
3 0 1 0k l 0
3 0
1 0k l 0
0
0
0l k
0l k
x jel.(~r ) + x jel.(~r ) d ~r +
x jel.(~r ) − x jel.(~r ) d ~r
=
~el
2 V
2 V
l=1
Z
3
X
~el 0k l 0
k
=
(~r 0 ) d3~r 0 .
(IX.27)
x jel.(~r ) − x0l jel.
2 V
l=1
Als nächstes kann das Integrand der dritten Zeile als
3
3
X
X
0k l
0
0l k
0
km ln
lm kn 0m n
0
n
x jel.(~r ) − x jel.(~r ) =
δ δ − δ δ x jel.(~r ) =
ikl imn x0m jel.
(~r 0 )
m,n=1
m,n=1
geschrieben werden. Definiert man das magnetische Dipolmoment der Stromverteilung durch
Z
1
(IX.28a)
µ
~≡
~r 0 × ~el.(~r 0 ) d3~r 0
2 V
mit kartesischen Komponenten
Z
3
X
imn
n
µ =
x0m jel.
(~r 0 ) d3~r 0 ,
2 V
i
m,n=1
so gilt
Z
V
x0k~el.(~r 0 ) d3~r 0 =
3
X
i,l=1
ikl µi ~el .
(IX.28b)
159
IX.2 Multipolentwicklung
Nach Multiplikation mit xk und Summe über k = 1, 2, 3 ergibt sich
Z
3
3
X
X
k
x0k~el.(~r 0 ) d3~r 0 =
x
ikl µi xk ~el = µ
~ × ~r.
k=1
V
i,k,l=1
Somit wird die Entwicklung (IX.24) zu
~ × ~r
~ r) = µ0 µ
A(~
+ ···
4π r3
(IX.28c)
~ r) ergibt sich dann aus der Rotation dieses VektorpotenDie zugehörige magnetische Induktion B(~
tials. Insbesondere gilt für das magnetische Feld eines reinen magnetischen Dipols µ
~
3
~
r
·
µ
~
~r − ~r 2 µ
~
µ
0
~ r) =
B(~
.
4π
r5
(IX.29)
Wie erwartet nimmt der Betrag des Vektorpotentials (IX.28c) wie 1/r2 ab, und dementsprechend
sie Stärke des magnetischen Feldes wie 1/r3 .
Bemerkungen:
∗ Die SI-Einheit des magnetischen Dipolmoments ist das A m2 , entsprechend der physikalischen
Dimension [µ] = I L2 .
∗ Die Gleichungen (IX.28c) und (IX.29) für das Potential und das Feld eines magnetischen Dipols
sind analog den Gl. (VIII.30a) und (VIII.30b) für einen elektrostatischen Dipol.
IX.2.2 Magnetisches Dipolmoment einer Leiterschleife
Durch eine Leiterschleife C fließt ein elektrischer Strom I,
entsprechend einer Ladungsstromdichte ~el. . Laut der Substitution (IX.18) lautet das zugehörige magnetische Dipolmoment
Z
I
1
1
3
µ
~=
~r × ~el.(~r) d ~r =
I ~r × d~`
2
2 C
mit d~` dem gerichteten Linienelement längs der Schleife. Im Integranden ist 21~r × d~` ein Vektor senkrecht zur Ebene der Schleife,
dessen Betrag gleich dem Flächeninhalt dS des durch ~r und d~`
aufgespannten Dreiecks ist. In der Integration entlang der Schleife
ergibt sich die gesamte Fläche S aufgespannt durch den Leiter,
und somit
µ
~ = I S~
I
dS
d~`
~r
C
Abbildung IX.5
(IX.30)
wobei der orthogonale Flächenvektor S~ in Richtung des Daumens der rechten Hand zeigt, wenn die
anderen Finger die Richtung des Stroms anzeigen.
Bemerkungen:
∗ Das Ergebnis ist unabhängig von der Wahl des Ursprungspunktes ~r = ~0, der auch außer der
Schleife gewählt werden kann.
∗ Betrachtet man die bewegten Ladungsträger in der Leiterschleife, die für die Stromdichte ~el.
verantwortlich sind, so ist das magnetische Dipolmoment µ
~ proportional zu deren Bahndrehimpuls
~
L.
160
Magnetostatik
IX.2.3 Magnetischer Dipol in einem äußeren magnetischen Feld
Der Einfluss eines magnetischen Feldes auf eine Stromverteilung kann durch die magnetischen
Multipolmomente der letzeren ausgedrückt werden.
IX.2.3
a Kraft auf einen magnetischen Dipol in einem magnetischen Feld
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Sei angenommen, dass sich die Stromverteilung ~el. innerhalb eines Gebiets V in der Umgebung
des Nullpunkts des Koordinatensystems befindet, wo eine nicht-spezifizierte Quelle eine magneti~ erzeugt. Ausgehend aus der Lorentz-Kraftdichte (IX.21) lautet die Kraft auf die
sche Induktion B
Stromverteilung
Z
~ r) d3~r,
~
F = ~el.(~r) × B(~
V
entsprechend der i-ten Komponente
F i = ikl
Z
V
k
jel.
(~r)B l (~r) d3~r.
In diesem Ausdruck kann das magnetische Feld als Taylor-Entwicklung um den Nullpunkt geschrieben werden:
~ l (~0) + · · · .
B l (~r) = B l (~0) + ~r · ∇B
Somit gilt
Z
Z
3
X
i
ikl
k
l~
3
k
l~
3
~
F =
jel.(~r)B (0) d ~r + jel.(~r)~r · ∇B (0) d ~r + · · · .
k,l=1
V
V
Im ersten Term auf der rechten Seite kann B l (~0) aus dem Integral herausgezogen werden: dieser
k , das gemäß Gl. (IX.26) Null ist.
konstante Faktor multipliziert dann das Volumenintegral von jel.
Somit bleibt
Z
Z
3
3
X
X
∂B l (~0) 3
ikl
k
l~
3
ikl
k
i
~
(~r) xj
jel.
jel.(~r)~r · ∇B (0) d ~r + · · · =
F =
d ~r + · · · .
∂xj
V
V
j,k,l=1
k,l=1
Die Ableitung im Integranden ist eine Konstante, die sich aus dem Integral herausziehen lässt. Dann
k , das laut der Formel unten Gl. (IX.28b) als
erkennt man das Integral von xj jel.
Z
3
X
k
(~r 0 ) d3~r 0 =
mjk µm
xj jel.
V
umgeschrieben werden kann, mit
Stromverteilung. Dies gibt
Fi =
3
X
ikl mjk µm
j,k,l,m=1
µm
m=1
der m-ten Komponenten des magnetischen Dipolmoments der
3
X
~ ~0)
m ∂B l (~0)
∂B l (~0)
∂ B(
im jl
ij lm
~ · B(
~ ~0) + µ
=
−δ
δ
+
δ
δ
µ
= −µi ∇
~·
.
j
j
∂x
∂x
∂xj
j,l,m=1
Der erste Term im rechten Glied der Gleichung verschwindet dank der Maxwell–Thomson-Gleichung.
Dazu ist das magnetische Dipolmoment für eine gegebene Stromverteilung eine Konstante, die in
der Ableitung des zweiten Terms mitgenommen werden kann:
∂ ~~ Fi =
µ
~ · B(0) .
∂xj
Somit ergibt sich schließlich für die Kraft auf ein magnetisches Dipolmoment, das sich im Punkt ~r
befindet (~r = ~0 in der obigen Herleitung)
~ µ
~ r) .
F~ = ∇
~ · B(~
(IX.31)
Bemerkung: Laut dieser Formel erfährt ein magnetischer Dipol eine Kraft, wenn er sich in einem
inhomogenen Feld befindet.
161
IX.2 Multipolentwicklung
IX.2.3
b Energie eines magnetischen Dipols in einem magnetischen Feld
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Die Kraft (IX.31) lässt sich trivial als das Negative eines Gradienten schreiben, und zwar
~ W,
F~ = −∇V
(IX.32a)
wobei die Wechselwirkungsenergie zwischen dem Dipol und der magnetischen Induktion, aus der
die Kraft abgeleitet wird, durch
~ r)
VW = −~
µ · B(~
(IX.32b)
gegeben ist.
Diese Wechselwirkungsenergie hat genau die gleiche Form wie jene eines elektrischen Dipols in
einem elektrostatischen Feld, entsprechend dem zweiten Term in Gl. (VIII.27).
Ebenfalls analog zum elektrostatischen Fall ist die Wechselwirkungsenergie zweier magnetischer
Dipole µ
~ a und µ
~ b : unter Verwendung des magnetischen Dipolfeldes (IX.29) und der Gl. (IX.32b)
ergibt sich
~a · µ
~ b − 3 ~er · µ
~ a ~er · µ
~b
µ0 µ
VW =
(IX.33)
4π
r3
mit ~r dem Abstandsvektor zwischen den beiden Dipole und ~er ≡ ~r/|~r| dem zugehörigen Einheitsvektor. Diese Gleichung ist das genaue Pendant der Gl. (VIII.31).
Literatur zum Kapitel IX
• Fließbach, Elektrodynamik [3] Teil III.
• Greiner, Klassische Elektrodynamik [8] Teil III.
• Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap. 5.
• Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 5.1–5.7.
• Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 5
§ 43–44
• Nolting, Elektrodynamik [17] Kap. 3.1–3.3.
• Scheck, Klassiche Feldtheorie [19] Kap. 1.8.
K APITEL X
Zeitabhängige elektromagnetische
Felder
Im Gegensatz zu den stationären Fällen der Elektro- und Magnetostatik sind das elektrische und
das magnetische Feld im allgemeineren zeitabhängigen Fall miteinander gekoppelt. Diese Kopplung
wird durch zusätzliche Terme in den Grundgleichungen berücksichtigt, die zu neuen Phänomenen
führen (Abschn. X.1).
In Abschn. X.2 wird gezeigt, dass sich das elektrische und das magnetische Feld aus elektromagnetischen Potentialen ableiten lassen, die nicht eindeutig bestimmt sind. Darüber hinaus werden
Bewegungsgleichungen für diese Potentiale hergeleitet. Dem elektromagnetischen Feld können noch
eine Energie und ein Impuls zugeordnet werden, oder genauer, entsprechende Dichten und Stromdichten (Abschn. X.3), die ziemlich anschaulichen Bilanzgleichungen genügen.
Der zweite Teil des Kapitels befasst sich mit Anwendungen der zuvor eingeführten Begriffe und
Ergebnisse. Zunächst werden Lösungen zu den Bewegungsgleichungen für die Felder oder Potentiale im Vakuum in Abwesenheit von Quellen untersucht, entsprechend elektromagnetischen Wellen
(Abschn. X.4). Dann wird eine allgemeine Lösung der Maxwell-Gleichungen mit Hilfe sogenannter
retardierter Potentiale dargelegt, die das elektromagnetische Feld erzeugt durch beliebige Ladungsund Stromverteilungen angibt (Abschn. X.5).
X.1 Grundgesetze
In diesem Abschnitt werden zuerst die nicht-stationären Maxwell-Gleichungen dargelegt und die
Deutung der zeitabhängigen Terme diskutiert (§ X.1.1). Dann werden Bewegungsgleichungen zweiter
Ordnung hergeleitet (§ X.1.2), deren Lösung oft einfacher ist.
X.1.1 Maxwell-Gleichungen
Die schon in Kapitel VII eingeführten zeitabhängigen Maxwell-Gleichungen lauten
~ · E(t,~
~ r) = 1 ρel.(t,~r)
∇
0
~ · B(t,~
~ r) = 0
∇
~
~ × E(t,~
~ r) + ∂ B(t,~r) = ~0
∇
∂t
~
~ × B(t,~
~ r) − 0 µ0 ∂ E(t,~r) = µ0~el.(t,~r).
∇
∂t
(X.1a)
(X.1b)
(X.1c)
(X.1d)
Relativ zu den stationären Gleichungen (VIII.1) und (IX.1) der Elektro- und Magnetostatik
treten zwei neue Terme auf, und zwar die Zeitableitungen in den zwei letzten Gleichungen. Natürlich
sind diese Zeitableitungen nötig, um eine mögliche Zeitentwicklung der Felder zu beschreiben.
163
X.1 Grundgesetze
X.1.1
a Faraday-Induktionsgesetz
::::::::::::::::::::::::::::::::::
Schreibt man die Maxwell–Faraday-Gleichung (X.1c) in der Form
~
~ × E(t,~
~ r) = − ∂ B(t,~r) ,
∇
∂t
(X.2)
so kann die Änderung der magnetischen Flussdichte auf der rechten Seite als Quellterm für die
Rotation des elektrischen Feldes gesehen werden.
Zur Interpretation dieser Gleichung kann man eine feste ruhende Fläche S betrachten und
Gl. (X.2) darüber integrieren:
Z
Z ~
2
∂ B(t,~r) 2 ~
~
~
~
(X.3)
∇ × E(t,~r) · d S = −
· d S.
∂t
S
S
Da die Fläche zeitunabhängig ist, dann die Zeitableitung auf der rechten Seite aus dem Integral
herausgezogen werden:
Z ~
Z
∂ B(t,~r) 2 ~ d
~ r) · d2 S~ = d ΦB (t),
B(t,~
·d S =
∂t
dt
dt
S
S
mit ΦB dem Fluss der magnetischen Induktion durch die Fläche S.
Wiederum kann die linke Seite der Gl. (X.3) mit dem Integralsatz von Stokes transformiert
werden: wenn ∂S den Rand der Fläche S bezeichnet, gilt
I
Z
2
~
~ r) · d~`,
~
~
E(t,~
∇ × E(t,~r) · d S =
S
∂S
wobei die orthogonalen elementaren Flächenvektoren d2 S~ in Richtung des Daumens der rechten
Hand zeigen, wenn die anderen Finger entlang der Richtung von d~` sind. Schließlich ergibt sich
I
Z
d
~
~ r) · d` = −
~ r) · d2 S~ = − dΦB (t) .
E(t,~
B(t,~
(X.4)
dt S
dt
∂S
Wendet man nun dieses Ergebnis auf den Fall an, wo die Fläche S durch einen ruhenden geschlossenen Kreisleiter C aufspannt wird (Abb. X.1), so ist das Kurvenintegral entlang C die sog.
elektromotorische Kraft U — die trotz ihrer Bezeichnung keine Kraft ist, sondern eine elektrische
Spannung:
I
~ r) · d~`.
U = E(t,~
C
S
U
C
Abbildung X.1
164
Zeitabhängige elektromagnetische Felder
Dies entspricht der Energie erhalten durch eine Einheitsladung, wenn sie den Kreis einmal umläuft.
(Wird der Kreis irgendwo leicht getrennt, so ist U die elektrische Spannung zwischen den Enden,
wie in Abb. X.1 dargestellt wird.) Dann ergibt sich das Faraday-Induktionsgesetz
U =−
dΦB (t)
.
dt
(X.5)
Bemerkungen:
∗ Wenn die Fläche S, durch welche der magnetische Fluss zeitlich variiert, nicht fest ist, müssen zusätzliche Terme in der obigen Argumentation berücksichtigt werden. Physikalisch bleibt das
Ergebnis das gleiche.
∗ In einem geschlossenen Kreisleiter wird das induzierte elektrische Feld die Ladungsträger in
Bewegung bringen, d.h. es entsteht ein elektrischer Strom. Wiederum wird dieser Strom über die
~ ind. erzeugen, das nach der Lenz’schen (ak) Regel
Maxwell–Ampère-Gleichung ein magnetisches Feld B
der Änderung des magnetischen Flusses durch die Leiterschleife entgegenwirkt.
∗ Das Prinzip des Induktionsgesetzes wird zu Nutze gemacht, um elektrische Ströme zu erzeugen.
X.1.1
b Maxwell’scher Verschiebungsstrom
::::::::::::::::::::::::::::::::::::::::::::
Die zweite Modifikation relativ zum stationären Fall ist die Zeitableitung in der Maxwell–
Ampère-Gleichung (X.1d), die sich auch als
~ r) ∂
E(t,~
~ × B(t,~
~ r) = µ0 ~el.(t,~r) + 0
∇
(X.6)
∂t
schreiben lässt. In dieser Form kann der zweite Term in den eckigen Klammern als eine Ladungsstromdichte interpretiert werden: dieser Term ist der sog. Maxwell’sche Verschiebungsstrom.
Dank diesem Term enthalten die Maxwell-Gleichungen (X.1) automatisch die Ladungserhaltung
für die Quellen. Leitet man nämlich die Maxwell–Gauß-Gleichung (X.1a) nach der Zeit ab, so ergibt
sich
∂ρel.(t,~r)
∂ ~ ~
= 0
∇ · E(t,~r) .
∂t
∂t
Andererseits lautet die Divergenz der Maxwell–Ampère-Gleichung (X.1d)
~
~ · ~el.(t,~r) = 1 ∇
~ · ∇
~ × B(t,~
~ r) − 0 ∇
~ · ∂ E(t,~r) = −0 ∂ ∇
~ · E(t,~
~ r) ,
∇
µ0
∂t
∂t
~ nach der Zeit und nach den
wobei in der zweiten Gleichung die partiellen Ableitungen von E
~
~
~
Ortskoordinaten ausgetauscht wurden, während ∇ · ∇ × B = 0 benutzt wurde. Die Summe der
zwei letzten Gleichungen lautet dann
∂ρel.(t,~r) ~
+ ∇ · ~el.(t,~r) = 0.
∂t
(X.7)
Diese Differentialgleichung wird als Kontinuitätsgleichung bezeichnet. Sie stellt die lokale Formulierung der Erhaltung der elektrischen Ladung dar.
Um die entsprechende Integralform zu finden kann man ein festes Raumgebiet V mit Rand ∂ V
betrachten und die Gl. (X.7) über das Volumen V integrieren:
Z
Z
∂ρel.(t,~r) 3
~ · ~el.(t,~r) d3~r.
d ~r = − ∇
∂t
V
V
(ak)
E. Lenz, 1804–1865
165
X.1 Grundgesetze
Da das Volumen V zeitunabhängig ist, kann die Zeitableitung im linken Glied aus dem Integral
herausgezogen werden. Währenddessen kann das rechte Glied mit dem Integralsatz von Gauß transformiert werden:
Z
Z
∂
~
(X.8)
ρel.(t,~r) d3~r = − ~el.(t,~r) · d2 S.
∂t V
∂V
Jetzt ist der Term auf der linken Seite die (totale) Zeitableitung der Gesamtladung Qin (t) innerhalb
des Volumens V . Das Oberflächenintegral auf der rechten Seite ist der nach außen gerichtete Fluss
der Ladungsstromdichte durch Oberfläche ∂ V . Der physikalische Inhalt der Gl. (X.8) ist, dass die
Änderung der Gesamtladung Qin pro Zeiteinheit gleich der durch die Oberfläche ∂ V „verlorene“
Ladung pro Zeiteinheit ist — entsprechend genau der Bilanzgleichung für eine erhaltene Größe,
nämlich hier die elektrische Ladung.
X.1.2 Bewegungsgleichungen für die elektrischen und magnetischen Felder
Die Maxwell-Gleichungen (X.1) sind gekoppelte partielle Differentialgleichungen erster Ordnung
~ r) und B(t,~
~ r). Mit einigen Umrechnungen lassen sich entkoppelte Bewegungsgleichungen
für E(t,~
erhalten.
~ r) unabhängig von B(t,~
~ r), und umgekehrt
Somit ist die Differentialgleichung (X.9) für E(t,~
~
~
tritt E(t,~r) nicht in der Bewegungsgleichung (X.11) für B(t,~r) auf. Die beiden Felder bleiben
aber miteinander gekoppelt, beispielsweise über die Maxwell–Faraday-Gleichung (X.1c). Das
heißt, man kann zwar entkoppelte Bewegungsgleichungen finden, die aber nicht unabhängig
voneinander sind: physikalisch wird die Kopplung nicht aufgehoben.
X.1.2
a Bewegungsgleichung für das elektrische Feld
::::::::::::::::::::::::::::::::::::::::::::::::::::::
Die Rotationsbildung der Maxwell–Faraday-Gleichung (X.1c) ergibt
~
~ × E(t,~
~ r) + ∇
~ × ∂ B(t,~r) = ~0.
~ × ∇
∇
∂t
~ × ∇
~ ×V
~ =∇
~ ∇
~ ·V
~ − 4V
~ transformiert werden. Im
Der erste Term kann mit der Identität ∇
zweiten Term können partielle Zeit- und Raumableitung ausgetauscht werden, was zu
~ ∇
~ · E(t,~
~ r) − 4E(t,~
~ r) + ∂ ∇
~ × B(t,~
~ r) = ~0
∇
∂t
~ ·E
~ unter Verwendung der Maxwell–Gauß-Gleichung (X.1a) durch die Laführt. Dabei kann ∇
~ ×B
~ mithilfe der Maxwell–Ampèredungsdichte ausgedrückt werden. Währenddessen lässt sich ∇
Gleichung (X.1d) umschreiben. Dies ergibt
~ r) 1~
∂
∂ E(t,~
~
∇ρel.(t,~r) − 4E(t,~r) +
µ0~el.(t,~r) + 0 µ0
= ~0.
0
∂t
∂t
Äquivalent gilt
~ r) ≡ −0 µ0
E(t,~
~ r)
∂ 2E(t,~
~ el.(t,~r).
~ r) = µ0 ∂~el.(t,~r) + 1 ∇ρ
+ 4E(t,~
∂t2
∂t
0
(X.9)
Dabei ist der d’Alembert (al) -Operator gemäß
≡ −0 µ0
∂2
+4
∂t2
definiert.(48)
(48)
(al)
Oft wird der d’Alembert-Operator als das Negative des hier betrachteten Differentialoperators definiert.
J. le Rond D’Alembert, 1717–1783
(X.10)
166
Zeitabhängige elektromagnetische Felder
X.1.2
b Bewegungsgleichung für das magnetische Feld
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Betrachtet man als Anfangspunkt die Maxwell–Ampère-Gleichung (X.1d) und bildet man deren
Rotation, so ergibt sich
~
~ × ∂ E(t,~r) = µ0 ∇
~ × B(t,~
~ r) − 0 µ0 ∇
~ × ~el.(t,~r).
~ × ∇
∇
∂t
~ ×B
~ wegen der Maxwell–Thomson-Gleichung ∇
~ ·B
~ einfach gleich −4B.
~ Dann
~ × ∇
Dabei ist ∇
können Ableitungen bezüglich der Zeit- und Ortsvariablen im zweiten Term ausgetauscht werden,
~ E
~ mithilfe der Maxwell–Faraday-Gleichung (X.1c) umgeschrieben
und die resultierende Rotation ∇×
werden. Insgesamt ergibt sich
2~
~ r) + 0 µ0 ∂ B(t,~r) = µ0 ∇
~ × ~el.(t,~r),
−4B(t,~
∂t2
d.h.
2~
~ r) ≡ −0 µ0 ∂ B(t,~r) + 4B(t,~
~ r) = µ0 ∇
~ × ~el.(t,~r).
(X.11)
B(t,~
∂t2
~ und (X.11) für die magnetische Induktion B
~ sind
Die Gleichungen (X.9) für das elektrische Feld E
anscheinend entkoppelte (inhomogene) lineare partielle Differentialgleichungen zweiter Ordnung. Die
Felder sollen aber noch der Maxwell–Faraday-Gleichung (X.1c) genügen, so dass sie nicht unabhängig
voneinander sind: die Bewegungsgleichungen (X.9) und (X.11) sind also eigentlich redundant.
X.2 Elektrodynamische Potentiale
Wie im stationären Fall können ein Skalar- und ein Vektorpotential eingeführt werden, aus denen sich
das elektrische und das magnetische Feld ableiten lassen (§ X.2.1). Im Gegensatz zu den stationären
~ und B
~ vom Vektorpotential ab. Dementsprechend sind
Potentialen hängen aber jetzt beide Felder E
die Eichtransformationen der Potentiale, welche die elektromagnetischen Felder invariant lassen,
nicht unabhängig voneinander, sondern beide Potentiale müssen gleichzeitig transformiert werden
(§ X.2.2). Schließlich werden in § X.2.3 Bewegungsgleichungen für die Potentiale dargelegt, die aus
den Maxwell-Gleichungen folgen.
X.2.1 Definition
X.2.1
a Vektorpotential
:::::::::::::::::::::::
Die Maxwell–Thomson-Gleichung (X.1b) hat die gleiche Form, wie im stationären Fall der Ma~ r)
gnetostatik. Daher kann man wie in § IX.1.1 die Existenz eines differenzierbaren Vektorfeldes A(~
folgern, mit dem die Beziehung
~ r) = ∇
~ × A(t,~
~ r)
B(t,~
(X.12)
~ r) ist das (elektrodynamische) Vektorpotential .
in jedem Punkt ~r und zu jeder Zeit t erfüllt wird: A(t,~
~ r). Ist
Ähnlich wie in der Magnetostatik existiert eine (Eich)Freiheit in der Auswahl von A(t,~
~
~
ein erstes Vektorpotential A für eine bestimmte magnetische Induktion B geeignet, dann so ist das
~ 0 (t,~r) ≡ A(t,~
~ r) + ∇χ(t,~
~
Vektorfeld A
r), wobei χ(t,~r) eine beliebige skalare Funktion von Zeit und
Ort ist.
X.2.1
b Skalarpotential
:::::::::::::::::::::::
Setzt man die Beziehung (X.12) in die Maxwell–Faraday-Gleichung (X.1c) ein, so kommt
~ × E(t,~
~ r) + ∂ ∇
~ × A(t,~
~ r) = ~0.
∇
∂t
167
X.2 Elektrodynamische Potentiale
Nach Austauschen der Zeit- und Ortsableitungen im zweiten Term kann man einfacher
~ r) ∂ A(t,~
~
~
∇ × E(t,~r) +
= ~0.
∂t
schreiben. Daraus folgt, dass es ein skalares Feld Φ(t,~r) existiert, das (elektrodynamische) Skalarpotential , das die Beziehung
~ r)
∂ A(t,~
~ r) = −∇Φ(t,~
~
E(t,~
r) −
∂t
(X.13)
zu jeder Zeit t und in jedem Punkt ~r erfüllt.
Im stationären Fall findet man die Beziehung (VIII.3) zwischen elektrostatischem Potential und
Feld wieder.
X.2.2 Eichinvarianz
X.2.2
a Eichtransformationen
:::::::::::::::::::::::::::::
~ und A
~0 ≡ A
~ + ∇χ
~ führen zwar über die Beziehung (X.12) zum gleichen
Zwei Vektorpotentiale A
~
~ E
~0
magnetischen Feld B; laut der Gl. (X.13) würden sie zu unterschiedlichen elektrischen Felder E,
führen.
Führt man aber eine gleichzeitige Transformation des Vektor- und des Skalarpotentials, und
zwar die Eichtransformation
∂χ(t,~r)
,
∂t
~ r) → A
~ 0 (t,~r) ≡ A(t,~
~ r) + ∇χ(t,~
~
A(t,~
r),
Φ(t,~r) → Φ0 (t,~r) ≡ Φ(t,~r) −
(X.14a)
(X.14b)
~ r) und
wobei die skalare Funktion χ(t,~r) beliebig ist, so bleiben die zwei abgeleiteten Felder E(t,~
~ r) unverändert.
B(t,~
Beispiel: Dem elektromagnetischen Feld bestehend aus einem stationären und gleichförmigen elek~ r) = E
~ 0 und einer verschwindenden magnetischen Induktion B(t,~
~ r) = ~0 kann
trischen Feld E(t,~
man z.B. die einfachen Potentiale
~ 0,
Φ(t,~r) = −~r · E
~ r) = ~0,
A(t,~
oder
Φ0 (t,~r) = 0,
~ 0 (t,~r) = −E
~0 t
A
~ 0 t (dazu
zuordnen. Eine Funktion χ, die von den ersten zu den zweiten führt, ist χ(t,~r) = −~r · E
darf man natürlich eine additive Konstante hinzufügen).
X.2.2
b Spezielle Eichungen
::::::::::::::::::::::::::::
Die Eichfreiheit kann benutzt werden, um eine Eichung zu benutzen, in welcher einige Gleichungen eine einfachere Form annehmen.
Eine erste oft auftretende Wahl ist die Coulomb-Eichung, die durch die Bedingung
~ · A(t,~
~ r) = 0.
∇
(X.15)
~ und B-Feldern
~
[vgl. Gl. (IX.4)] definiert ist. Bei festen Eist es immer möglich, Potentiale zu finden,
die der Coulomb-Eichbedingung (X.15) genügen.
168
Zeitabhängige elektromagnetische Felder
~ Potentiale für ein gegebenes elektromagnetisches Feld. Wenn A
~ die Bedingung (X.15)
Seien Φ, A
erfüllt, ist der Fall erledigt. Sonst sucht man eine Funktion χ(t,~r) derart, dass die über Gl. (X.14)
~ 0 die Coulomb-Eichbedingung erfüllen. Die Divergenzbildung
eichtransformierten Potentiale Φ0 , A
~
~ lautet
der Beziehung (X.14b) zwischen A0 und A
~ ·A
~ 0 (t,~r) = ∇
~ · A(t,~
~ r) + ∇
~ · ∇χ(t,~
~
~ · A(t,~
~ r) + 4χ(t,~r).
∇
r) = ∇
~ ·A
~ 0 (t,~r) = 0 gilt. Dafür soll man eine Funktion χ finden, die die inhomogene
Das Ziel ist, dass ∇
Poisson-Gleichung
~ · A(t,~
~ r)
4χ(t,~r) = −∇
löst, wobei die rechte Seite eine vorgegebene ist. Laut den Ergebnissen des Abschn. VIII.2
existiert eine solche Lösung immer.
2
Eine andere günstige Eichung ist die Lorenz (am) -Eichung, entsprechend der Bedingung
0 µ0
∂Φ(t,~r) ~ ~
+ ∇ · A(t,~r) = 0.
∂t
(X.16)
Wir werden in § X.2.3 c sehen, dass sich die Bewegungsgleichung für die Potentiale in der LorenzEichung stark vereinfachen. Ein zweiter Vorteil der Eichung wird auch in § XI.1.2 diskutiert.
~
Die Coulomb- und Lorenz-Eichbedingungen legen die elektromagnetischen Potentiale Φ und A
~
nicht vollständig fest, sondern man kann in beiden Fällen unterschiedliche Paare (Φ, A) finden,
welche die zugehörige Bedingung erfüllen.
Dies ist trivial der Fall der Coulomb-Eichung, deren Bedingung (X.15) das Skalarpotential frei
~
lässt. Dass auch die Lorenz-Eichung „unvollständig“ ist, lässt sich einfach beweisen. Seien (Φ, A)
0
0
~
und (Φ , A ) Paare von Potentialen, die der Gl. (X.16) genügen, wobei die gestrichenen Potentiale
mit den nicht-gestrichenen über die Beziehungen (X.14) zusammenhängen. Dann gilt
∂Φ0 (t,~r) ~ ~ 0
∂Φ(t,~r) ~ ~
0 µ0
+ ∇ · A (t,~r) − 0 µ0
+ ∇ · A(t,~r) = 0,
∂t
∂t
d.h. nach einer einfachen Berechnung
∂ 2 χ(t,~r)
+ 4χ(t,~r) = χ(t,~r) = 0.
(X.17)
∂t2
Diese Differentialgleichung hat nicht-triviale Lösungen — die in § X.4.1 unten diskutiert werden —,
so dass die gestrichenen und nicht-gestrichenen Potentiale ungleich sind.
− 0 µ0
X.2.3 Bewegungsgleichungen für die elektrodynamischen Potentiale
X.2.3 a Bewegungsgleichung für das Vektorpotential
Das Einsetzen der Beziehungen (X.12) und (X.13) in die Maxwell–Ampère-Gleichung ergibt
unter Berücksichtigung der Formel für die Rotation einer Rotation
~ r) ∂
∂
A(t,~
~ × ∇
~ × A(t,~
~ r) − 0 µ0
~
µ0~el.(t,~r) = ∇
− ∇Φ(t,~
r) −
∂t
∂t
2~
~ ∇
~ · A(t,~
~ r) − 4A(t,~
~ r) + 0 µ0 ∇
~ ∂Φ(t,~r) + 0 µ0 ∂ A(t,~r) .
=∇
∂t
∂t2
:::::::::::::::::::::::::::::::::::::::::::::::::::::
Nach trivialer Umschreibung lautet dies
~ r)
∂ 2 A(t,~
∂Φ(t,~r) ~ ~
~
~
~
A(t,~r) ≡ −0 µ0
+ 4A(t,~r) = −µ0~el.(t,~r) + ∇ 0 µ0
+ ∇ · A(t,~r) .
∂t2
∂t
(am)
L. Lorenz, 1829–1891
(X.18)
X.3 Energie und Impuls des elektromagnetischen Feldes
169
Diese lineare partielle Differentialgleichung zweiter Ordnung stellt die Bewegungsgleichung für das
~ r) dar.
Vektorpotential A(t,~
Bemerkung: Im zeitunabhängigen Fall vereinfacht sich Gl. (X.18) zur Gleichung (IX.8).
X.2.3 b Bewegungsgleichung für das Skalarpotential
Setzt man in die Maxwell–Gauß-Gleichung (X.1a) die Beziehung (X.13) ein, so kommt
~ r) ρel.(t,~r) ~
∂ A(t,~
∂ ~ ~
~
= ∇ · − ∇Φ(t,~r) −
= −4Φ(t,~r) −
∇ · A(t,~r)
0
∂t
∂t
:::::::::::::::::::::::::::::::::::::::::::::::::::::
oder äquivalent
4Φ(t,~r) = −
ρel.(t,~r) ∂ ~ ~
−
∇ · A(t,~r) .
0
∂t
(X.19)
Man kann noch 0 µ0 ∂ 2 Φ(t,~r)/∂t2 von beiden Seiten dieser Gleichung abziehen, um die Bewegungsgleichung in eine Form ähnlich der Gl. (X.18) zu bringen:
∂ 2 Φ(t,~r)
∂Φ(t,~r) ~ ~
ρel.(t,~r) ∂
Φ(t,~r) ≡ −0 µ0
−
0 µ0
+ 4Φ(t,~r) = −
+ ∇ · A(t,~r) .
∂t2
0
∂t
∂t
(X.20)
Bemerkung: Im stationären Fall vereinfacht sich Gl. (X.20), oder noch einfacher Gl. (X.19), zur
Poisson-Gleichung (VIII.4) der Elektrostatik.
X.2.3
c Bewegungsgleichungen in speziellen Eichungen
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Arbeitet man in der durch die Bedingung (X.16) definierten Lorenz-Eichung, so vereinfachen
sich die Bewegungsgleichungen (X.18) und (X.20) erheblich, und zwar zu

ρ (t,~r)
 Φ(t,~r) = − el.
0
in Lorenz-Eichung
 ~
A(t,~r) = −µ0~el.(t,~r).
(X.21a)
(X.21b)
Somit nehmen die Bewegungsgleichungen für die Potentiale die gleiche Form wie solche (X.9), (X.11)
~ und B-Felder
~
für die daraus abgeleiteten Ean.
X.3 Energie und Impuls des elektromagnetischen Feldes
Genau wie mechanische Systeme trägt das elektromagnetische Feld Energie (§ X.3.1) und Impuls
(§ X.3.2). Lokal lassen sich diese Größen durch entsprechende Dichten und Stromdichten charakterisieren, die dann Bilanzgleichungen genügen.
X.3.1 Energiedichte und -stromdichte des elektromagnetischen Feldes
X.3.1
a Bilanzgleichung für die Energie
:::::::::::::::::::::::::::::::::::::::
Bildet man das Skalarprodukt von der Maxwell–Faraday-Gleichung (X.1c) und der magnetischen
~ r), so kommt
Induktion B(t,~
~
~ r) · ∇
~ × E(t,~
~ r) + B(t,~
~ r) · ∂ B(t,~r) = 0.
B(t,~
∂t
Wiederum lautet das Skalarprodukt aus Maxwell–Ampère-Gleichung (X.1d) und elektrischem Feld
~ r)
E(t,~
~
~ r) · ∇
~ × B(t,~
~ r) − 0 µ0 E(t,~
~ r) · ∂ E(t,~r) = µ0~el. (t,~r) · E(t,~
~ r).
E(t,~
∂t
170
Zeitabhängige elektromagnetische Felder
Die letztere Gleichung kann dann von
Dabei kann man auf der
der ersteren
abgezogen werden.
~
~
~
~
~
~
~
~
~
linken Seite die Identität B · ∇ × E − E · ∇ × B = ∇ · E × B verwenden. Es ergibt sich dann
~
2
2
~
~ · E(t,~
~ r) × B(t,~
~ r) + µ0 ∂ 0 E(t,~r) + B(t,~r) = −µ0~el. (t,~r) · E(t,~
~ r).
∇
(X.22)
∂t
2
2µ0
Die Struktur der linken Seite dieser Gleichung, mit der Summe der Zeitableitung einer skalaren
Größe mit dem Gradienten eines Vektorfeldes, ist ähnlich jener der Kontinuitätsgleichung (X.7),
d.h. allgemeiner einer lokalen Bilanzgleichung. Dies weist darauf hin, dass
ee.m.(t,~r) ≡
~ r)2 B(t,~
~ r)2
0 E(t,~
+
2
2µ0
(X.23a)
der Dichte einer Größe entspricht, während der Poynting (an) -Vektor
~
~
~e.m.(t,~r) ≡ E(t,~r) × B(t,~r)
S
µ0
(X.23b)
die assoziierte Stromdichte ist. Da die Dichte ee.m.(t,~r) im stationären Fall ohne magnetisches Feld
mit der elektrostatischen Energiedichte [vgl. Gl. (VIII.17)] übereinstimmt, möchte man sie gerne als
~e.m.(t,~r) die
Energiedichte des elektromagnetischen Feldes interpretieren. Dementsprechend wäre S
zugehörige Energiestromdichte und die aus Gl. (X.22) folgende Gleichung
∂ee.m.(t,~r) ~ ~
~ r).
+ ∇ · Se.m.(t,~r) = −~el. (t,~r) · E(t,~
∂t
(X.23c)
sollte eine (lokale) Bilanzgleichung für die Energie darstellen.
Bemerkungen:
∗ Die Gleichung (X.23c) wird auch (differentielle Form von dem) Satz von Poynting genannt —
wobei die Integralform die Gl. (X.24) unten ist.
~ r)2 /2µ0 , kann als die im magnetischen Feld gespei∗ Der zweite Term in der Energiedichte, B(t,~
cherte Energiedichte betrachtet werden.
X.3.1
b Interpretation der Energiebilanzgleichung
::::::::::::::::::::::::::::::::::::::::::::::::::
Sei ein Volumen V des Raums mit Oberfläche ∂ V . Das Integrieren der Bilanzgleichung (X.23c)
über dieses Volumen ergibt
Z
I
Z
d
~e.m.(t,~r) · d2 S~ = − ~el. (t,~r) · E(t,~
~ r) d3~r,
ee.m.(t,~r) d3~r +
S
(X.24)
dt V
∂V
V
wobei der Integralsatz von Gauß benutzt wurde, um den zweiten Term umzuschreiben.
Zur Deutung dieser Gleichung, insbesondere des Terms auf deren rechten Seite, kann man einen
elektrischen Strom
bestehend aus bewegten Punktladungen betrachten, entsprechend der LadungsP
stromdichte a qa~va (t)δ (3)(~r − ~ra ). Mit dieser Stromdichte gilt
Z
X0
~ r) d3~r = −
~ ra ),
− ~el. (t,~r) · E(t,~
qa~va (t) · E(t,~
V
a
wobei der Strich neben dem Summenzeichen bedeutet, dass die Summe nur über die Punktladungen
läuft, die sich im Volumen V befinden.
(an)
J. H. Poynting, 1852–1914
X.3 Energie und Impuls des elektromagnetischen Feldes
171
Die gesamte Energie dieser Punktladungen zur Zeit t ist
X0 ma~va (t)2
Emat.(t) =
2
a
entsprechend der Summe deren kinetischen Energien. Daraus folgt
d~va (t)
dEmat.(t) X0
~va (t) · ma
.
=
dt
dt
a
Laut dem zweiten Newton’schen Gesetz (I.14) ist der Term in eckigen Klammern genau gleich der
Kraft auf die Punktladung a. Bei der letzteren handelt es sich um die durch das elektromagnetische
Feld verursachte Lorentz-Kraft, d.h.
io
n h
dEmat.(t) X0
~ ra ) + ~va (t) × B(t,~
~ ra ) .
~va (t) · qa E(t,~
=
dt
a
~ auf der rechten Seite verschwindet, so dass
Das Spatprodukt ~va · ~va × B
dEmat.(t) X0
~ ra )
qa~va (t) · E(t,~
=
dt
a
übrig bleibt. Definiert man dann
Z
Ee.m.(t) ≡
ee.m.(t,~r) d3~r,
(X.25a)
V
die sich als Energie des elektromagnetischen Feldes in V zur Zeit t interpretieren lässt, im Einklang
mit der Deutung von ee.m. , so wird die Gleichung (X.24) zu
I
dEe.m.(t)
~e.m.(t,~r) · d2 S~ − dEmat.(t) .
=−
S
(X.25b)
dt
dt
∂V
Die Interpretation dieser Gleichung ist ziemlich klar: die (Rate der) Änderung der Feldenergie im
Volumen V — Term auf der linken Seite — besteht aus der durch die Oberfläche ∂ V — erster Term
im rechten Glied — und der Energie, die auf die Ladungen übertragen wird.
Somit stellt wirklich Gl. (X.23c) eine lokale Bilanzgleichung für die Energie dar, in welcher
~e.m. die Energiedichte und -stromdichte des
die in Gl. (X.23a) und (X.23b) definierten ee.m. und S
elektromagnetischen Feldes sind.
X.3.2 Impulsdichte und -stromdichte des elektromagnetischen Feldes
Ausgehend aus den Maxwell-Gleichungen lässt sich eine weitere Bilanzgleichung herleiten, wobei die „erhaltene“ Größe jetzt vektoriell ist, und kann als Impuls des elektromagnetischen Feldes
interpretiert werden.
Man definiert das Vektorfeld
~ r) × B(t,~
~ r),
~ge.m.(t,~r) ≡ 0 E(t,~
(X.26a)
das hiernach als Impulsdichte interpretiert wird, und den Maxwell’schen Spannungstensor σ e.m. mit
kartesischen Komponenten(49)
ij
σe.m.
(t,~r)
(49)
i
1 ij h ~
i
j
2 i
j
2
2~
2
≡ 0 E (t,~r)E (t,~r) + c B (t,~r)B (t,~r) − δ E(t,~r) + c B(t,~r) .
2
(X.26b)
Der Maxwell’sche Spannungstensor wird manchmal mit der umgekehrten Zeichenkonvention, also wie der Tensor
T e.m. , definiert, z.B. in den frühen Auflagen (vor etwa 1985) von Landau & Lifschitz [14, 26]. Die hier verwendete
Konvention ist also die der späteren Auflagen von Refs. [14, 26] sowie von Jackson [11, 12, Gl. (6.120)].
172
Zeitabhängige elektromagnetische Felder
σe.m. , mit Komponenten
Dazu kann man noch den Tensor T e.m. = −σ
ij
ij
Te.m.
(t,~r) ≡ −σe.m.
(t,~r),
(X.26c)
einführen: die Komponente ij dieses Tensors wird die Dichte des Stroms in Richtung i von der j-ten
Komponenten des Impulses vom elektromagnetischen Feld modellieren.
Dann gilt die Bilanzgleichung
3
j
ij
∂ge.m.
(t,~r) X ∂Te.m.
(t,~r)
+
= −fLj (t,~r) für j = 1, 2, 3,
∂t
∂xi
(X.26d)
i=1
~ el.× B
~ auf die Ladungen und
mit fLj (t,~r) der j-ten Komponente der Lorentz-Kraftdichte f~L = ρel. E+~
Ströme, die das elektromagnetische Feld verursachen. Da diese Kraftdichte die Dichte des Impulses,
der pro Zeiteinheit auf die Ladungen übertragen wird, darstellt — laut dem zweiten Newton’schen
Gesetz ist nämlich die Kraft gleich der Rate der Impulsänderung —, hat die Gleichung (X.26d) genau
die gleiche Form wie die Energiebilanzgleichung (X.23c): auf der linken Seite steht die Summe aus
der Zeitableitung von Dichte und der Divergenz der Stromdichte, die nur das elektromagnetische
Feld betreffen; auf der rechten liegt ein Term, der die Wechselwirkung zwischen dem Felde und den
Quellen berücksichtigt.
Herleitung der Gl. (X.26d): der Kürze halber werden die Variablen (t,~r) durchaus weggelassen.
Unter Verwendung der Maxwell–Gauß und der Maxwell–Ampère-Gleichungen (X.1a), (X.1d)
lässt sich die Lorentz-Kraftdichte als
~
1 ~
∂E
~
~
~
~
~
~
~
~
fL = ρel. E + ~el. × B = 0 ∇ · E E +
∇ × B − 0
×B
µ0
∂t
umschreiben. Dabei kann der letzte Term gemäß
~
~
∂E
~ = ∂ E
~ ×B
~ −E
~ × ∂B = ∂ E
~ ×B
~ +E
~× ∇
~ ×E
~
×B
∂t
∂t
∂t
∂t
transformiert werden, wobei die letzte Gleichung aus der Maxwell–Faraday (X.1c) folgt. Somit
gilt
h
i
~ ·E
~ E
~ −E
~× ∇
~ ×E
~ − 1B
~× ∇
~ ×B
~ − ∂~ge.m. ,
f~L = 0 ∇
µ0
∂t
wobei Definition (X.26a) benutzt wurde. Mithilfe der Maxwell–Thomson-Gleichung (X.1b) kann
~ und B
~ Feldern erhöhen:
man die Symmetrie der Terme mit den E
h
i
h
i
~ ×B
~ − ∂~ge.m. .
~ −B
~× ∇
~ ·E
~ E
~ −E
~× ∇
~ ×E
~ + 1 ∇
~ ·B
~ B
f~L = 0 ∇
µ0
∂t
~ × ∇×
~ V
~
Betrachte man die i-te Komponente dieser Gleichung. Für die zwei Terme der Form V
gilt(50)
3
3
3
h
m
X
X
X
i i
j ∂V m
ijk j
klm ∂V
il jm
im jl
~
~
~
V × ∇×V
=
V
=
δ
δ
−
δ
δ
V
∂xl
∂xl
j,k=1
3
X
l,m=1
j,l,m=1
~ 2 X
3
i
∂
V
j ∂V
=
V
=
−
V
.
∂xi 2
∂xj
j=1
j=1
~ ·V
~ V
~ kommt
Nach Abziehen der i-ten Komponente von ∇
~ 2 X
3
3
h
i
j
X
ii
∂
V
j ∂V
i ∂V
~
~
~
~
~
~
V × ∇×V − ∇·V V =
−
V
−
V
∂xi 2
∂xj j=1
∂xj
j=1
j
j
i
∂V
∂V
−
∂xi
∂xj
∂
=
∂xi
(50)
~ 2 X
3
∂
V
−
V iV j .
j
2
∂x
j=1
2
~
~ × ∇
~ ×V
~ =∇
~ V
~ ·∇
~ V
~.
In vektorieller Form lautet diese Gleichung V
− V
2
173
X.4 Elektromagnetische Wellen im Vakuum
Daher lautet die i-te Komponente der Lorentz-Kraftdichte
" 3
" 3
~ 2 #
~ 2 #
X ∂
E
B
∂
1 X ∂
∂
∂ge.m.
i
i j
i j
f L = 0
EE −
+
BB −
−
j
i
j
i
∂x
∂x
2
µ
∂x
∂x
2
∂t
0 j=1
j=1
= 0
3
3
X
~2
~ 2 ∂ge.m.
1 X ∂
∂
i j
ij E
i j
ij B
E
B
E
−
δ
+
B
−
δ
−
.
∂xj
2
µ0 j=1 ∂xj
2
∂t
j=1
Unter Berücksichtigung der Identität 0 µ0 c2 = 1 erkennt man den Maxwell’schen Spannungstensor
3
3
ij
X
X
∂ge.m.
∂ge.m.
∂ ij
∂Te.m.
i
fL =
σ
−
−
=
−
.
e.m.
j
j
∂x
∂t
∂x
∂t
j=1
j=1
ij
Wegen der Symmetrie von Te.m.
unter dem Austausch der beiden Indizes ist diese Gleichung,
nach Umbenennung der Indizes i ↔ j, genau die Bilanzgleichung (X.26d).
2
Bemerkungen:
∗ Offensichtlich hängt die Impulsdichte (X.26b) mit dem Poynting-Vektor (X.23b) einfach über
~ge.m.(t,~r) =
1 ~
Se.m.(t,~r).
c2
(X.27)
zusammen.
∗ Die Spur des Maxwell’schen Spannungstensor bzw. des Tensors Te.m. und die Energiedichte (X.23a) genügen der einfachen Beziehung
11
22
33
Tr T e.m.(t,~r) = Te.m.
(t,~r) + Te.m.
(t,~r) + Te.m.
(t,~r) = ee.m.(t,~r).
(X.28)
X.4 Elektromagnetische Wellen im Vakuum
In Abwesenheit von Quellen, ρel. = 0 und ~el. = ~0, nehmen die Bewegungsgleichungen (X.9) und
(X.11) für die elektromagnetischen Felder oder (X.21) für die Potentiale in Lorenz-Eichung die
gleiche Form an, und zwar
im Vakuum

~ r) = ~0 und B(t,~
~ r) = ~0;
 E(t,~

~ r) = ~0 (in Lorenz-Eichung).
Φ(t,~r) = 0 und A(t,~
(X.29a)
(X.29b)
Zur Umschreibung einiger Gleichungen führt man eine positive Zahl c gemäß
c2 ≡
1
0 µ0
(X.29c)
ein. Dann wird der d’Alembert-Operator (X.10) zu
≡−
1 ∂2
+4 .
c2 ∂t2
(X.29d)
Die Bewegungsgleichungen (X.29) sind alle der gleichen Form f (t,~r) = 0, mit f einer skalaren
oder vektoriellen Funktion. Die Lösungen dieser Differentialgleichung — die auch in anderen Bereichen der Physik auftritt — werden zunächst in § X.4.1 vorgestellt. Dann werden die Ergebnisse auf
den Fall des elektromagnetischen Feldes im Vakuum angewandt, wobei die Eigenschaften des Feldes
einer Welle präzisiert werden (§ X.4.2).
174
Zeitabhängige elektromagnetische Felder
X.4.1 Klassische Wellengleichung
Dieses Paragraph befasst sich mit der Herleitung der (genügend regulären) reellen Lösungen der
(klassischen) Wellengleichung (51)
f (t,~r) = 0
(X.30)
für skalare Funktionen f , wobei der d’Alembert-Operator durch Gl. (X.29d) definiert ist.
X.4.1
a Ebene Wellen
:::::::::::::::::::::
Als einfaches aber wichtiges Beispiel kann man zunächst eine Lösung betrachten, die nur von z =
x3 abhängt: f (t, z). Diese ist somit unabhängig von x1 , x2 und daher konstant in der transversalen
(x1 , x2 ) Ebene, weshalb sie als ebene Welle bezeichnet wird.
Unter dieser Annahme wird die klassische Wellengleichung (X.30) zur (1 + 1)-dimensionalen
Differentialgleichung
1 ∂ 2f (t, z) ∂ 2f (t, z)
+
= 0.
(X.31)
− 2
c
∂t2
∂z 2
Der Differentialoperator dieser Gleichung kann faktorisiert werden:
∂
∂
1∂
1∂
f (t, z) = 0.
(X.32)
−
+
∂z
c ∂t
∂z
c ∂t
Zur Lösung dieser partiellen Differentialgleichung lohnt es sich, die Variablenänderung
x+ ≡ z + ct ,
x− ≡ z − ct
(X.33a)
durchzuführen. Die entsprechende Rücktransformation zu den ursprünglichen Variablen lautet
t=
x+ − x−
2c
,
x=
x+ + x−
2
(X.33b)
Die partiellen Ableitungen nach den neuen Variablen lassen sich mit Hilfe der Kettenregel durch
die Ableitungen nach den alten Variablen ausdrücken, und zwar
∂t ∂
∂z ∂
1 1∂
∂
∂
=
+
=
+
(X.34a)
∂x+
∂x+ ∂t ∂x+ ∂z
2 c ∂t ∂z
und
1∂
∂
∂t ∂
∂z ∂
1
∂
−
.
=
+
=
+
∂x−
∂x− ∂t ∂x− ∂z
2
c ∂t ∂z
(X.34b)
Dank diesen Ergebnissen lautet die Bewegungsgleichung (X.32) in den neuen Variablen
1 ∂ ∂
f (x+ , x− ) = 0,
4 ∂x− ∂x+
d.h.
∂ 2f (x+ , x− )
= 0.
(X.35)
∂x− ∂x+
Die allgemeine Lösung dieser partiellen Differentialgleichung zweiter Ordnung ist der Form
f (x+ , x− ) = f− (x+ ) + f+ (x− )
mit f− und f+ zwei beliebigen Funktionen einer einzigen reellen Variablen. Kommt man zu den
ursprünglichen Variablen t, z zurück, so lautet die allgemeine Lösung der Gl. (X.31)
f (t, z) = f− (z + ct) + f+ (z − ct).
(51)
(X.36)
Gleichung (X.30) wird oft als die Wellengleichung bezeichnet. Man findet aber auch andere partielle Differentialgleichungen mit zeit- und ortsabhängigen Lösungen, die als Wellen bezeichnet werden — z.B. für Schwerewellen
in Flüssigkeiten, Stoßwellen in Fluiden, oder Wellenfunktionen in der Quantenmechanik. Deshalb wird hier die
Bezeichnung „klassische Wellengleichung“ verwendet.
175
X.4 Elektromagnetische Wellen im Vakuum
Dieses mathematische Ergebnis lässt sich einfach interpretieren. Betrachte man beispielsweise
die Funktion f+ (z − ct): sie nimmt den gleichen Wert für alle Raumzeitpunkte (t, z) an, für welche
z − ct einen konstanten Wert hat. Somit bleibt das Profil entlang der z-Achse des durch f modellierten Signals zur Zeit t = t0 global unverändert zu einem späteren Zeitpunkt t1 ; es wird jedoch
in positive z-Richtung um ∆z = c(t1 − t0 ) verschoben, entsprechend einer Ausbreitung des Signals
mit Geschwindigkeit +c.
Wiederum modelliert der Term f− ein Signal, das sich in negative z-Richtung mit Ausbreitungsgeschwindigkeit c — will man die Richtung auch in der Geschwindigkeit berücksichtigen, −c —
fortpflanzt.
Solche sich ausbreitenden Signale werden als Wellen bezeichnet.(51) Dann ist die allgemeine
Lösung (X.36) eine Superposition von rechts- und linkslaufenden ebenen Wellen.
Bemerkung: Genauer handelt es sich bei den durch f− oder f+ beschriebenen Signalen um fort-
schreitende Wellen. Betrachtet man aber den Fall mit f− = f+ , so breitet sich die resultierende
Welle f nicht mehr aus: es handelt sich um eine stehende Welle.
X.4.1
b Allgemeine Lösung
:::::::::::::::::::::::::::
Um die allgemeine Lösung der klassischen Wellengleichung (X.30) herzuleiten, ist es günstig, die
Fourier-Darstellung der räumlichen Abhängigkeit von f (t,~r) einzuführen. Somit kann man
Z
d3~k
~
f (t,~r) =
f˜(t, ~k) ei k·~r
(X.37a)
(2π)3
R3
schreiben, wobei die räumlich Fourier-transformierte Funktion f˜(t, ~k) durch
Z
~
˜
~
f (t, k) =
f (t,~r) e−i k·~r d3~r
(X.37b)
R3
gegeben ist.
~ i~k·~r ) = i~k ei~k·~r wird die klassische Wellengleichung (X.30)
Unter Verwendung der Identität ∇(e
angewandt auf die Darstellung (X.37a) zu
Z 1 ∂ 2f˜(t, ~k) ~ 2 ˜ ~ i~k·~r d3~k
− 2
− k f (t, k) e
= 0,
c
∂t2
(2π)3
wobei Integration über ~k und Ableitung nach der Zeit t oder nach den Ortskoordinaten ~r ausgetauscht wurden. Nach inverser Fourier-Transformation soll der Term in den eckigen Klammern
verschwinden. Definiert man
ω~k ≡ c ~k ,
(X.38)
so ergibt sich für jeden Wellenvektor ~k die Differentialgleichung
∂ 2f˜(t, ~k)
+ ω~k2 f˜(t, ~k) = 0.
(X.39a)
∂t2
Man erkennt die Bewegungsgleichung eines harmonischen Oszillators mit Kreisfrequenz ω~k , deren
allgemeinen Lösung
f˜(t, ~k) = f˜+ (~k) e−iω~k t + f˜− (~k) eiω~k t
(X.39b)
ist, mit f˜+ (~k) und f˜− (~k) zwei beliebigen Funktionen.
Wenn die gesuchte Lösung f (t,~r) reell sein soll, stehen f˜+ (~k) und f˜− (~k) in Zusammenhang
miteinander. Die komplexe Konjugation der Beziehung (X.37a) lautet
Z
Z
3~
∗ ~ d3~k
˜(t, −~k) ∗ ei~k·~r d k ,
f (t,~r)∗ =
f˜(t, ~k) e−i k·~r
=
f
(2π)3
(2π)3
R3
R3
wobei die zweite Gleichung aus der Substitution ~k → −~k folgt. f (t,~r) is reellwertig, wenn f (t,~r) =
176
Zeitabhängige elektromagnetische Felder
f (t,~r)∗ , d.h. nach Vergleich des letzten Terms in der obigen Gleichung mit der rechten Seite von
Gl. (X.37a), wenn
f˜(t, ~k) = f˜(t, −~k)∗
für alle t und ~k. Angewandt auf die Lösung (X.39b) lautet diese Bedingung
∗
∗
f˜+ (~k) e−iω~k t + f˜− (~k) eiω~k t = f˜+ (−~k) eiω~k t + f˜− (−~k) e−iω~k t ,
d.h. nach Identifizierung der Terme in eiω~k t
∗
f˜− (~k) = f˜+ (−~k)
∀~k.
(X.40)
Die Terme in e−iω~k t führen zur gleichen Bedingung.
Setzt man schließlich die Lösung (X.39b) der Gl. (X.39a) in die Fourier-Darstellung (X.37a), so
lautet die letztere
Z h
Z h
i 3~
i
d3~k
~
˜+ (~k) e−i(ω~k t−~k·~r) + f˜− (−~k) ei(ω~k t−~k·~r) d k ,
=
f
f (t,~r) =
f˜+ (~k) e−iω~k t + f˜− (~k) eiω~k t ei k·~r
(2π)3
(2π)3
R3
R3
wobei die Substitution ~k → −~k unter Berücksichtigung von ω−~k = ω~k im zweiten Summanden
des
des letzten Integrals gemacht wurde. Ersetzt man in jenem Term f˜− (−~k) durch
Integranden
∗
f˜+ (~k) , wie aus Bedingung (X.40) folgt, so sieht man, dass der Term genau komplex konjugiert
zum ersten Summanden ist. Unter Einführung der Notation a(~k) ≡ 2f˜+ (~k) ergibt sich somit für die
allgemeine reelle Lösung der klassischen Wellengleichung (X.30)
Z
3~
−i(ω~k t−~k·~r) d k
~
f (t,~r) = Re
a(k) e
.
(X.41)
(2π)3
R3
Somit lässt sich die allgemeine Lösung als Superposition von (unendlich vielen) ebenen Wellen
~
a(~k) e−i(ω~k t−k·~r) schreiben. Dabei heißt die Beziehung (X.38) zwischen Kreisfrequenz ω~k und Wellenvektor ~k dieser ebenen Wellen Dispersionsrelation.
Das Verhältnis cϕ (~k) ≡ ω~k /|~k| ist die Phasengeschwindigkeit der Welle mit Wellenvektor ~k —
wobei im Fall der klassischen Wellengleichung (X.30) cϕ (~k) = c für alle ~k.
Bemerkung: Die komplexe Amplitude a(~k) ∈ C lässt sich prinzipiell durch die Angabe von Anfangs-
bedingungen f (t = 0,~r) und ∂f (t = 0,~r)/∂t festlegen.
X.4.2 Elektromagnetische Wellen
X.4.2
a Elektromagnetische Potentiale
::::::::::::::::::::::::::::::::::::::
Gemäß den Ergebnissen des vorigen § X.4.1 lauten die allgemeinen Lösungen der Bewegungsgleichungen (X.29b) für die elektromagnetischen Potentiale im Vakuum
Z
3~
−i(ω~k t−~k·~r) d k
~
Φ(t,~r) = Re
a(k) e
(X.42a)
(2π)3
und
Z
3~
−i(ω~k t−~k·~r) d k
~
~
~
A(t,~r) = Re
b(k) e
(2π)3
mit beliebigen a(~k) ∈ C und ~b(~k) ∈ C3 und mit der Dispersionsrelation
ω~k ≡ c ~k .
~ die Lorenz-Eichbedingung (X.16) erfüllen:
Dabei sollen Φ und A
Z 3~
iω~k ~
1 ∂Φ(t,~r) ~ ~
−i(ω~k t−~k·~r) d k
~
~
~
+ ∇ · A(t,~r) = Re
− 2 a(k) + i k · b(k) e
= 0.
c2 ∂t
c
(2π)3
(X.42b)
(X.42c)
177
X.4 Elektromagnetische Wellen im Vakuum
~ können noch über die Eichtransformation (X.14)
Die elektromagnetischen Potentiale Φ und A
0
0
~
durch äquivalente Potentiale Φ und A ersetzt werden, die ebenfalls der Lorenz-Bedingung genügen,
solange die Funktion χ der Transformation die Gleichung (X.17) — d.h. die klassische Wellengleichung — erfüllt. Mit
Z
3~
d
k
~
t−
k·~
r)
−i(ω
~
k
χ(t,~r) = Re
d(~k) e
(2π)3
gelten
Z h
i
3~
∂χ(t,~r)
0
−i(ω~k t−~k·~r) d k
~
~
Φ (t,~r) = Φ(t,~r) −
= Re
a(k) + iω~k d(k) e
∂t
(2π)3
und
Z h
i
3~
d
k
~
0
t−
k·~
r)
−i(ω
~
~b(~k) + i~kd(~k) e
~ (t,~r) = A(t,~
~ r) + ∇χ(t,~
~
k
.
A
r) = Re
(2π)3
Eine besonders geeignete Wahl ist d(~k) = ia(~k)/ω~ für jeden ~k, die zum einfachen Skalarpotential
k
0
Φ (t,~r) = 0
(X.43a)
führt. Wiederum lautet das entsprechende Vektorpotential
Z
3~
0
−i(ω~k t−~k·~r) d k
~
~
A (t,~r) = Re ~ε(k) e
,
(2π)3
(X.43b)
wobei der Polarisationsvektor ~ε(~k) durch
~ε(~k) ≡ ~b(~k) + i~kd(~k) = ~b(~k) −
a(~k) ~
k
ω~k
gegeben ist. Dabei kann noch ~ε(~k) reell oder komplex sein.
Eine Einschränkung über den Polarisationsvektor folgt aus der Eichbedingung. Mit Φ0 (t,~r) = 0
wird die Lorenz-Eichbedingung automatisch zur Coulomb-Eichbedingung (X.15)
Z
d3~k
~
~ ·A
~ 0 (t,~r) = Re
∇
i ~ε(~k) · ~k e−i(ω~k t−k·~r)
= 0.
(2π)3
Diese Bedingung ist nur dann erfüllt, wenn
~ε(~k) · ~k = 0
(X.44)
für jeden Wellenvektor ~k, d.h. wenn der Polarisationsvektor senkrecht auf die Ausbreitungsrichtung
der entsprechenden ebenen Welle ist. Somit sind elektromagnetische Wellen im Vakuum transversal
polarisiert.
X.4.2
b Elektrisches und magnetisches Feld
:::::::::::::::::::::::::::::::::::::::::::::
Setzt man die elektromagnetischen Potentiale (X.43) in die Beziehungen (X.12) und (X.13), so
lauten die entsprechenden elektrischen und magnetischen Felder
Z
3~
~ 0 (t,~r)
∂A
−i(ω~k t−~k·~r) d k
~
~
E(t,~r) = −
= Re
iω~k ~ε(k) e
(X.45a)
∂t
(2π)3
und
Z
3~
0
−i(ω~k t−~k·~r) d k
~
~
~
~
~
i k × ~ε(k) e
B(t,~r) = ∇ × A (t,~r) = Re
.
(2π)3
(X.45b)
Betrachte man eine monochromatische ebene
Welle, d.h. eine Lösung mit nur einem einzigen
Wellenvektor: ~ε(~k) = N ~ε(~k0 ) (2π)3 δ (3) ~k − ~k0 mit N einer unwesentlichen Normierungskonstanten.
Dann gelten
178
Zeitabhängige elektromagnetische Felder
i
i
h
h
~ r) = Re iω~ ~ε(~k0 ) e−i(ω~k0t−~k0 ·~r)
~ r) = Re i~k0 × ~ε(~k0 ) e−i(ω~k0t−~k0 ·~r) .
und
B(t,~
E(t,~
k0
~ r) und B(t,~
~ r) autoAuf diesen Felder erkennt man die folgenden Eigenschaften. Erstens sind E(t,~
matisch senkrecht aufeinander
~ r) · B(t,~
~ r) = 0.
E(t,~
(X.46)
~ r) und B(t,~
~ r) beide senkrecht zur Bewegungsrichtung ~k0
Dann sind E(t,~
~k0 · E(t,~
~ r) = ~k0 · B(t,~
~ r) = 0.
(X.47)
~ r)
E(t,~
~ r) =
B(t,~
.
c
(X.48)
Schließlich gilt dank |~k0 | = ω~k0 /c
X.4.2
c Energie des elektromagnetischen Feldes
:::::::::::::::::::::::::::::::::::::::::::::::::
Betrachte man der Einfachheit halber die Felder (X.45) für
den Fall einer monochromatischen
~ 0 /(iω0 ) mit E
~ 0 ∈ R3 und ω0 ≡ ω~ :
ebenen Welle mit Polarisationsvektor ~ε ~k = (2π)3 δ (3) ~k − ~k0 E
k0
da die Richtung des elektrischen Feldes — und daher auch der magnetischen Induktion — konstant
bleibt, handelt es sich um eine linear polarisierte Welle. Es gelten dann
~ r) = E
~ 0 cos ω0 t − ~k0 · ~r
E(t,~
(X.49a)
und
~0
~e~k0 × E
~0
~k0 × E
cos ω0 t − ~k0 · ~r =
cos ω0 t − ~k0 · ~r .
(X.49b)
c
ω0
~ 0 folgt ~e~ × E
~ 0 = ~e~ E
~ 0 = E
~ 0 , womit sich die GleiAus der Orthogonalität von ~k0 und E
k0
k0
chung (X.48) wiederfinden lässt.
Setzt man diese Felder in die Energiedichte (X.23a) ein, so ergibt sich
~2
~2 E
0 E0
2
0
~k0 · ~r
+
cos
ω
t
−
ee.m.(t,~r) =
0
2
2µ0 c2
~ r) =
B(t,~
d.h. unter Verwendung der Beziehung 0 µ0 c2 = 1
~ 2 cos2 ω0 t − ~k0 · ~r .
ee.m.(t,~r) = 0 E
0
(X.50)
Interessant ist auch der über die Zeit gemittelte Wert — definiert für eine beliebige periodische
Funktion f durch
Z
1 T
hf i ≡
f (t) dt
(X.51)
T 0
mit T der Periode der Funktion — von der Energiedichte. Im Fall der letzteren ist die Periodendauer
T = 2π/ω0 : da der Mittelwert von cos2 über eine Periode 12 ist, gilt
~2
0 E
0
.
2
Diese zeitgemittelte Energiedichte ist auch unabhängig vom Ort.
hee.m.(~r)i =
Mit den Feldern?(X.49) wird der Poynting-Vektor (X.23b) zu
~0
~ 0 × ~e~ × E
E
k0
~e.m.(t,~r) =
S
cos2 ω0 t − ~k0 · ~r .
µ0 c
(X.52)
179
X.5 Klassische Theorie der Strahlung
~ 0 verschwindet der zweite
~ 0 · ~e~ E
~ 0 2 ~e~ − E
~0 = E
~ 0 × ~e~ × E
Im doppelten Kreuzprodukt E
k0
k0
k0
Term wegen der Transversalität der elektromagnetischen Welle im Vakuum. Somit gilt
~2
~e.m.(t,~r) = E0 cos2 ω0 t − ~k0 · ~r ~e~ .
S
k0
µ0 c
(X.53)
gerichtet entlang der Ausbreitungsrichtung ~e~k0 , wie es intuitiv der Fall sein soll.
Gemittelt über die Zeit ergibt sich
D
E
~2
~2
~e.m.(~r) = E0 ~e~ = 0 E0 c~e~ ,
S
k
k0
2µ0 c 0
2
d.h. nach Vergleich mit der zeitgemittelten Energiedichte (X.52)
D
E
~e.m.(~r) = hee.m.(~r)i c~e~ .
S
k0
(X.54)
Dies entspricht der Stromdichte assoziierte mit einer Dichte hee.m.(~r)i, die sich mit der (gerichteten)
Geschwindigkeit c~e~k0 ausbreitet.
X.5 Klassische Theorie der Strahlung
In diesem Abschnitt werden die Maxwell-Gleichungen in Anwesenheit fester äußerer Quellen mithilfe
von retardierten Potentialen gelöst. Dafür wird zunächst die retardierte Green’sche Funktion des
elektromagnetischen Feldes eingeführt (§ X.5.1). Mit deren Hilfe können für jede beliebige Ladungsund Stromverteilung die dadurch verursachten Potentiale ausgedrückt werden (§ X.5.2). In § X.5.3
wird eine Näherung der Potentiale hergeleitet, die sich weit von den Quellen ergibt. Schließlich
wird das durch ein bewegtes geladenes Punktteilchen erzeugte elektromagnetische Feld bestimmt
(§ X.5.4). Dabei wird insbesondere die durch eine beschleunigte Punktladung abgestrahlte Leistung
berechnet.
X.5.1 Green’sche Funktion der klassischen Wellengleichung
Die Bewegungsgleichungen (X.21) für die elektromagnetischen Potentiale in der Lorenz-Eichung
sind lineare partielle Differentialgleichungen der Form
f (t,~r) = J(t,~r)
(X.55)
mit vorgegebenem rechtem Glied J, d.h. eine inhomogene klassische Wellengleichung.
Die Lösung ist gleich der Summe aus der allgemeinen Lösung der assoziierten homogenen Differentialgleichung — die in § X.4.1 b berechnet wurde — und aus einer speziellen Lösung, die hiernach
bestimmt wird.
Sei G(t,~r) eine Green’sche Funktion der Gleichung (X.55), d.h. G soll der Differentialgleichung
G(t,~r; t0 ,~r 0 ) = δ(t − t0 ) δ (3) (~r − ~r 0 )
genügen. Dann ist die Faltung von G und J eine spezielle Lösung der Gl. (X.55):
Z
f (t,~r) = G(t,~r; t0 ,~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0 .
(X.56a)
(X.56b)
Wenn den d’Alembert-Operator bezüglich der nicht-gestrichenen Variablen t,~r bezeichnet,
gilt tatsächlich
Z
Z
f (t,~r) = G(t,~r; t0 ,~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0 = G(t,~r; t0 ,~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0
Z
= δ(t − t0 ) δ (3) (~r − ~r 0 ) J(t0 ,~r 0 ) dt0 d3~r 0 = J(t,~r).
180
Zeitabhängige elektromagnetische Felder
Hiernach wird gezeigt, dass die Differentialgleichung (X.56a) zwei unabhängige Lösungen hat,
die im Unendlichen verschwinden, und zwar
−1
|~r − ~r 0 |
0
δ
−
(t
−
t
)
,
4π|~r − ~r 0 |
c
|~r − ~r 0 |
−1
0
0
0
Gadv.(t,~r; t ,~r ) ≡
δ
+ (t − t ) .
4π|~r − ~r 0 |
c
Gret.(t,~r; t0 ,~r 0 ) ≡
(X.57a)
(X.57b)
• Gret.(t,~r; t0 ,~r 0 ) ist die retardierte Green’sche Funktion: liegt der „Beobachtungspunkt“ — wo
die Lösung f von Gl. (X.55) gemessen wird — im Raumzeitpunkt P = (t,~r), dann ist der
Träger von Gret. lokalisiert auf der Menge der Punkte (t0 ,~r 0 ) mit |~r −~r 0 | = c(t − t0 ) und somit
t0 ≤ t, entsprechend dem Rückwärtslichtkegel des Punkts P .
• Gadv.(t,~r; t0 ,~r 0 ) ist die avancierte Green’sche Funktion: Gadv. ist lokalisiert auf dem Vorwärtslichtkegel |~r − ~r 0 | = −c(t − t0 ), woraus t0 ≥ t folgt, des Beobachtungspunktes in (t,~r).
Allgemeiner ist jede Funktion der Form
G(t,~r; t0 ,~r 0 ) = AGret.(t,~r; t0 ,~r 0 ) + BGadv.(t,~r; t0 ,~r 0 ) mit A + B = 1
ebenfalls eine im Unendlichen verschwindende Green’sche Funktion der inhomogenen klassischen
Wellengleichung (X.55).
Bemerkung: Bezeichnet man die retardierte bzw. avancierte Green’sche Funktion Gret. bzw. Gadv.
mit G− bzw. G+ , so gilt
G∓ (t,~r; t0 ,~r 0 ) =
−c
Θ ±(t − t0 ) δ −c2 (t−t0 )2 + |~r−~r 0 |2 ,
2π
wobei die einzige Rolle der Heaviside-Funktion Θ darin besteht, den Rückwärts- bzw. Vorwärtslichtkegel des Punkts (t,~r) auszuwählen.
P
Sei τ ≡ t − t0 und % ≡ |~r − ~r 0 |. Aus δ(f (x)) = i δ(x − xi )/|f 0 (xi )|, wobei die Summe über die
Nullstellen xi der Funktion f läuft [Gl. (D.22)], folgt [vgl. auch Gl. (D.23)]
−c
−c
δ(% − cτ ) δ(% + cτ )
−c
−1
%
Θ(±τ ) δ(−c2 t2 + %2 ) =
Θ(±τ )
+
=
δ(% ∓ cτ ) =
δ
∓τ ,
2π
2π
|2cτ |
|2cτ |
4π%
4π%
c
wobei % ≥ 0 und die Skalierungseigenschaft (D.17a) der δ-Distribution benutzt wurden.
2
Bestimmung
der Green’schen Funktionen zur inhomogenen Wellengleichung
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Um eine Lösung der Gleichung (X.56) zu finden, ist es günstig, die Fourier-Darstellungen
Z
Z
d3~k
0
~
0
−iω(t−t0 ) dω
(3)
0
δ(t − t ) = e
,
δ (~r − ~r ) = ei k·(~r−~r )
2π
(2π)3
und
G(t,~r; t0 ,~r 0 ) =
Z
0
~
G̃(ω, ~k) e−i[ω(t−t )−k·(~r−~r
0 )]
dω d3~k
2π (2π)3
der δ-Distributionen und der gesuchten Green’schen Funktion einzuführen. Somit gilt
Z
3~
1 ∂2
0
0
−i[ω(t−t0 )−~k·(~r−~r 0 )] dω d k
~
G(t,~r; t ,~r ) = G̃(ω, k) − 2 2 + 4 e
c ∂t
2π (2π)3
Z 2
3~
ω
~k 2 G̃(ω, ~k) e−i[ω(t−t0 )−~k·(~r−~r 0 )] dω d k .
=
−
c2
2π (2π)3
(X.58)
181
X.5 Klassische Theorie der Strahlung
Dies muss gleich
0
δ(t − t ) δ
(3)
0
Z
(~r − ~r ) =
0
~
e−i[ω(t−t )−k·(~r−~r
0 )]
dω d3~k
2π (2π)3
sein, woraus
ω2 ~ 2
− k G̃(ω, ~k) = 1 bzw.
c2
G̃(ω, ~k) =
−1
~k 2 − ω 2 /c2
folgt. Nach Einsetzen in die Fourier-Darstellung (X.58) ergibt sich dann
Z −i[ω(t−t0 )−~k·(~r−~r 0 )]
e
dω d3~k
0
0
G(t,~r; t ,~r ) = −
.
~k 2 − ω 2 /c2
2π (2π)3
(X.59)
Dieser Ausdruck ist aber mehrdeutig, weil der Nenner des Integranden verschwindet.
Z i~k·R~
e
~ ergibt sich
~ ≡
d3~k. Unter Einführung des Winkels θ zwischen ~k und R
Sei g(k0 , R)
~k 2 − k 2
0
Z ∞ Z 1 ikR cos θ
Z
e
2π ∞ k
2
~ = 2π
k
g(k0 , R)
d(cos
θ)
dk
=
eikR − e−ikR dk,
2
2
2
2
iR 0 k − k0
−1 k − k0
0
~ und k = |~k|. Dies lautet noch
wobei R = |R|
Z ∞
Z ∞ −ikR
Z
2π
k eiR
ke
2π ∞ k eikR
~
g(k0 , R) =
dk −
2 dk = iR
2 dk,
2
2
iR 0 k 2 − k02
0 k − k0
−∞ k − k0
wobei die letzte Gleichung aus der Substitution k → −k im zweiten Integral folgt.
Für k0 ∈ C mit Im k0 6= 0 ist die Funktion g(k0 , ~r) wohldefiniert. Wenn Γ(Λ) die in Abb. X.2
Im k
6
Γ(Λ)
I
k• 0
-
−Λ •
−k0
-
-
Λ Re k
Abbildung X.2 – Integrationskontour für die Berechnung von
∞
k eikR
2 dk mit R > 0.
2
−∞ k − k0
Z
dargestellte Integrationskontour bezeichnet, dann ist für R > 0
Z
Z ∞
k eikR
k eikR
dk
=
lim
dk
2
2
Λ→∞ Γ(Λ) k 2 − k02
−∞ k − k0
laut dem Residuensatz gleich 2πi multipliziert mit dem Residuum von k eikR /(k 2 − k02 ) am Pol in
der Halbebene Im k > 0. Für Im k0 > 0 liegt dieser Pol bei k = k0 und das Residuum ist eik0 R /2.
Für Im k0 < 0 liegt der Pol bei k = −k0 , mit Residuum e−ik0 R /2. Somit gilt
 2
2π ik0 |R|
~


e
wenn Im k0 > 0,

~
|
R|
~
g(k0 , R) =
2π 2 −ik0 |R|

~


e
wenn Im k0 < 0.
~
|R|
Um den Fall k0 ∈ R zu behandeln, werden die Funktionen
~ ≡ lim g(k0 ± i, R)
~ =
g± (k0 , R)
→0+
2π 2 ±ik0 |R|
~
e
~
|R|
182
Zeitabhängige elektromagnetische Felder
definiert. Mit deren Hilfe lassen sich aus Gl. (X.59) zwei Green’schen Funktionen herleiten, und
zwar
Z ∞
Z ∞ 1
ω
dω
−1
0
0
0
0
−iω(t−t0 ) dω
0
G± (t,~r; t ,~r ) = −
e−iω(t−t ∓|~r−~r |/c)
g±
,~r − ~r e
=
,
3
0
(2π) −∞
c
2π
4π|~r − ~r | −∞
2π
d.h.
−1
|~r − ~r 0 |
0
G± (t,~r; t ,~r ) =
δ
∓ (t − t ) ,
4π|~r − ~r 0 |
c
0
0
(X.60)
entsprechend der retardierten (G+ ) und avancierten (G− ) Green’schen Funktionen (X.57).
X.5.2 Retardierte Potentiale
Mit Hilfe der im vorigen Paragraphen eingeführten Green’schen Funktionen können nur spezielle Lösungen der Bewegungsgleichungen (X.21) für die elektromagnetischen Potentiale geschrieben
werden. Somit liefert das Einsetzen der retardierten Green’schen Funktion (X.57a) in die allgemeine
Formel (X.56b) mit Quellterm −ρel.(t0 ,~r 0 )/0 bzw. −µ0~el.(t0 ,~r 0 )
Z
1
Φret.(t,~r) = −
(X.61a)
Gret.(t,~r; t0 ,~r 0 ) ρel.(t0 ,~r 0 ) dt0 d3~r 0
0
bzw.
~ ret.(t,~r) = −µ0
A
Z
Gret.(t,~r; t0 ,~r 0 ) ~el.(t0 ,~r 0 ) dt0 d3~r 0 .
(X.61b)
Diese Ausdrücke sehen offensichtlich sehr ähnlich aus. Daher werden im Folgenden detaillierte Her~ ret. durchgeführt.
leitung nur am Beispiel des Vektorpotentials A
Mit dem expliziten Ausdruck (X.57a) der retardierten Green’schen Funktion gelten
Z
−1
|~r − ~r 0 |
0
~
Aret. (t,~r) = −µ0
δ
− (t − t ) ~el.(t0 ,~r 0 ) dt0 d3~r 0
4π|~r − ~r 0 |
c
Z Z
µ0
1
|~r − ~r 0 |
0
0
0
0
=
δ t−t −
~el.(t ,~r ) dt d3~r 0
4π |~r − ~r 0 |
c
(X.62a)
und für das Skalarpotential
1
Φret. (t,~r) =
4π0
Z
1
|~r − ~r 0 |
Z |~r − ~r 0 |
0
0
0
0
δ t−t −
ρel.(t ,~r ) dt d3~r 0 .
c
(X.62b)
Nach Durchführen des Integrals über die Zeit kommen
Z
1
1
|~r − ~r 0 | 0 3 0
Φret. (t,~r) =
ρel. t −
,~r d ~r
4π0 |~r − ~r 0 |
c
Z
1
|~r − ~r 0 | 0 3 0
~ ret. (t,~r) = µ0
A
~

t
−
,~
r
d ~r
el.
4π |~r − ~r 0 |
c
(X.63a)
(X.63b)
~ ret. heißen retardierte Potentiale. Dabei hängt das Skalar bzw. Vektorpotential am Ort
Φret und A
~r zur Zeit t von der Ladungsdichte ρel. bzw. Stromdichte ~el. am Ort ~r 0 zur früheren, retardierten
Zeit t − |~r − ~r 0 |/c ab. Die Verzögerung entspricht genau der Reisezeit des Lichts von ~r 0 bis zu ~r.
Bemerkungen:
∗ Die retardierten Potentiale genügen automatisch der Lorenz-Eichbedingung X.16.
X.5 Klassische Theorie der Strahlung
183
Das Einsetzen der Gl. (X.61) in die letztere gibt nämlich
0 µ0
∂Φret.(t,~r) ~ ~
+ ∇ · Aret.(t,~r) =
∂t
Z ∂Gret.(t,~r; t0 ,~r 0 )
~ ret.(t,~r; t0 ,~r 0 ) · ~el.(t0 ,~r 0 ) dt0 d3~r 0 .
− µ0
ρel.(t0 ,~r 0 ) + ∇G
∂t
Die Ableitung der retardierten Green’schen Funktion nach t bzw. nach den Komponenten von
~r kann durch das Negative der Ableitung nach t0 bzw. nach den Komponenten von ~r 0 ersetzt
werden:
0 µ0
∂Φret.(t,~r) ~ ~
+ ∇ · Aret.(t,~r) =
∂t
Z ∂Gret.(t,~r; t0 ,~r 0 )
0
0
0
0
0
0
~
ρel.(t ,~r ) + ∇~r 0 Gret.(t,~r; t ,~r ) · ~el.(t ,~r ) dt0 d3~r 0 .
µ0
∂t0
Jetzt können partielle Integrationen über die Zeit t0 (für den ersten Summanden im Integral) oder
die Ortskoordinaten ~r 0 (für den zweiten Summanden) durchgeführt werden. Unter der Annahme,
dass die integrierten Terme verschwinden — entsprechend der Abwesenheit von Ladungen und
Strömen im Unendlichen —, kommt
Z
∂Φret.(t,~r) ~ ~
∂ρel.(t0 ,~r 0 ) ~
0
0
0
+
∇
·
~

(t
,~
r
)
dt0 d3~r 0 .
+ ∇ · Aret.(t,~r) = −µ0 Gret.(t,~r; t0 ,~r 0 )
0 µ0
el.
~r
∂t
∂t0
Der Term in eckigen Klammern stellt genau die linke Seite der Kontinuitätsgleichung (X.7) dar,
d.h. er verschwindet.
2
∗ Wenn die Quellen ρel. (t0 ,~r 0 ), ~el. (t0 ,~r 0 ) des elektromagnetischen Feldes vor einem Zeitpunkt t0
~ ret.(t,~r) für t ≤ t0 ebenfalls Null.
identisch verschwinden, dann sind die Potentiale Φret.(t,~r), A
∗ Mithilfe der avancierten Green’schen Funktion Gadv. lassen sich auch avancierte Potentiale bestimmen. Physikalisch werden solche Potentiale üblicherweise im Namen vom Prinzip der Kausalität
nicht angenommen: das Effekt — Potential am Punkt (t,~r) — könne nicht vor der Ursache — Quelle
am Punkt (t + |~r −~r 0 |/c,~r 0 ) — kommen. Diese Wahl der Lösung mit retardiertem Potential schließt
also einen Unterschied zwischen Vergangenheit und Zukunft („elektromagnetischer Zeitpfeil“) ein,
der in den Maxwell-Gleichungen nicht existiert.
Referenz [29] legt eine „Begründung“ dieser Wahl dar, die aber nicht zwangsläufig ist: beispielsweise haben Wheeler und Feynman [30] lineare Kombinationen von retardierten und avancierten
Potentialen benutzt, um Probleme der klassischen Elektrodynamik von Punktladungen — insbesondere deren Selbstwechselwirkung — zu lösen.
Stationäre
Quellen
:::::::::::::::::::
Falls die Quellen —Ladungs- und Stromverteilungen — des elektromagnetischen Feldes stationär
sind, lauten die retardierten Potentiale (X.63)
Z
1
ρel. (~r 0 ) 3 0
Φret.(~r) =
d ~r ,
(X.64a)
4π0 |~r − ~r 0 |
Z
µ0 ~el. (~r 0 ) 3 0
~
Aret.(~r) =
d ~r .
(X.64b)
4π |~r − ~r 0 |
Man findet also genau die Lösungen (VIII.21) bzw. (IX.10) der Poisson-Gleichungen der Elektrostatik (VIII.4) bzw. der Magnetostatik (IX.9) wieder.
X.5.3 Multipolentwicklung
Die Ergebnisse des vorigen Paragraphen können zuerst auf den Fall von periodisch oszillierenden
Quellen angewandt werden zwar
184
Zeitabhängige elektromagnetische Felder
h
i
ρel.(t,~r) = Re ρ0 (~r) e−iωt
,
h
i
~el.(t,~r) = Re ~0 (~r) e−iωt
(X.65)
mit ρ0 , ~0 gegebenen Amplituden. Dann gilt
∂ρel.(t,~r) ~
~ · ~0 (~r) e−iωt .
+ ∇ · ~el.(t,~r) = Re −iωρ0 (~r) + ∇
∂t
Laut der Kontinuitätsgleichung (X.7) ist die linke Seite dieser Gleichung gleich Null, was nur dann
möglich ist, wenn der Term in rechteckigen Klammern verschwindet, d.h.
~ · ~0 (~r) = 0.
− iωρ0 (~r) + ∇
(X.66)
Mit der Ladungsstromdichte ~el. der Gl. (X.65) wird das retardierte Vektorpotential (X.63b) zu
Z
iω|~r−~r 0 |/c
µ0 e−iωt
0 e
3 0
~
Aret.(t,~r) = Re
~0 (~r )
(X.67)
d ~r .
4π
|~r − ~r 0 |
Sei angenommen, dass die Ladungsstromdichte ~el. innerhalb eines Gebiets V in der Umgebung des
Nullpunkts ~r 0 = ~0 lokalisiert ist, und dass sie am Rand ∂ V des Gebiets verschwindet.
Das elektromagnetische Feld wird in einem „weit entfernten“ Punkt ~r untersucht, d.h. |~r| |~r 0 |
gilt für jeden Punkt ~r 0 ∈ V . Dementsprechend darf man in erster Näherung |~r − ~r 0 | durch r ≡ |~r|
in Gl. (X.67) ersetzen; daraus folgt
Z
µ0 e−iω(t−r/c)
0
3 0
~
Aret.(t,~r) ' Re
~0 (~r ) d ~r .
(X.68)
4πr
V
Zur Berechnung des Terms in eckigen Klammern kann man das Integral
Z X
3
∂ 0l k 0 3 0
x j0 (~r ) d ~r
∂x0k
V
k=1
betrachten. Es lässt sich einerseits direkt integrieren, denn der Integrand eine Ableitung ist: da
j0 (~r 0 ) = 0 für ~r 0 ∈ ∂ V ist das Integral gleich Null. Andererseits kann man die Produktregel
verwenden, woraus sich
Z X
Z X
Z
3
3 k r 0)
l 0
∂ 0l k 0 3 0
kl k 0
0l ∂j0 (~
0
3 0
0l ~
0
x
j
(~
r
)
d
~
r
=
δ
j
(~
r
)
+
x
d
~
r
=
j
(~
r
)
+
x
∇
·
~

(~
r
)
d3~r 0
0
~r
0
0
0
0k
0k
∂x
∂x
V
V
V
k=1
k=1
~ ~r 0 dem Gradient bezüglich der Komponenten von ~r 0 . Daher gilt
ergibt, mit ∇
Z
Z
0
3 0
~ ~r 0 · ~0 (~r 0 ) d3~r 0 .
~0 (~r ) d ~r = − ~r 0 ∇
V
V
Aus der Beziehung (X.66) folgt dann
Z
Z
0
3 0
~0 (~r ) d ~r = −iω ~r 0 ρ0 (~r) d3~r 0 .
V
V
Somit wird das retardierte Potential (X.68) zu
Z
µ0 e−iω(t−r/c)
0
0
3 0
~
Aret.(t,~r) ' Re −iω
~r ρ0 (~r ) d ~r .
4πr
V
Dabei ist das Integral genau das in Gl. (VIII.23c) definierte elektrische Dipolmoment P~0 von der
Ladungsverteilung, die das Potential verursacht. Insgesamt lautet das retardierte Vektorpotential
µ0 ~
r
~
Aret.(t,~r) ' −
ω P0 sin ω t −
.
(X.69)
4πr
c
185
X.5 Klassische Theorie der Strahlung
Dabei handelt es sich um Dipolstrahlung
Aus diesem Vektorpotential leitet man für r c/ω die elektromagnetischen Felder
µ0 2
r
~
~
B(t,~r) '
ω ~er × P0 cos ω t −
4πcr
c
(X.70a)
und
~ r) ' µ0 ω 2~er × ~er × P~0 cos ω t − r
E(t,~
4πr
c
ab, wobei ~er den Einheitsvektor entlang ~r bezeichnet.
(X.70b)
X.5.4 Potentiale und Felder einer bewegten Punktladung
Dieser Paragraph beginnt mit der Berechnung der Potentiale und Felder, die durch eine bewegte Punktladung mit der Bahnkurve ~x(t) erzeugt werden, entsprechend einer Ladungsdichte bzw.
Stromdichte [vgl. Gl. (VII.6)]
ρel.(t,~r) = qδ (3) ~r − ~x(t) bzw. ~el.(t,~r) = q~v (t) δ (3) ~r − ~x(t) .
Danach wird die Leistung, die durch die abgestrahlte Felder transportiert wird, bestimmt.
X.5.4
a Liénard–Wiechert-Potentiale
::::::::::::::::::::::::::::::::::::
Mit dieser Form für die Quellterme lauten die retardierten Potentiale (X.62)
Z
1
|~r − ~r 0 |
0
~ ret.(t,~r) = − µ0 q
δ
t
−
t
−
~v (t0 ) δ (3) ~r 0 − ~x(t0 ) dt0 d3~r 0
A
0
4π |~r − ~r |
c
Z ∞
µ0 q
1
|~r − ~x(t0 )|
0
0
=
~v (t )
δ t−t −
dt0 ,
4π −∞
|~r − ~x(t0 )|
c
wobei das Integral über ~r 0 durchgeführt wurde, und ähnlich
Z ∞
q
1
|~r − ~x(t0 )|
0
Φret.(t,~r) =
δ t−t −
dt0
4π0 −∞ |~r − ~x(t0 )|
c
(X.71a)
(X.71b)
Wie im § X.5.2 werden die Herleitungen hiernach nur im Fall des Vektorpotentials detailliert.
Das Argument f (t0 ) = t − t0 − |~r − ~x(t0 )|/c der δ-Distribution im Integranden verschwindet für
einen einzigen Wert von t0 , der als tret. bezeichnet wird und retardierte Zeit heißt. tret. ist die Zeit,
zu der die Raumzeitlinie — d.h. die Trajektorie in der Raumzeit — t0 , ~x(t0 ) der Punktladung den
Rückwärtslichtkegel des Punkts (t,~r) durchschneidet (Abb. X.3).
t0
~x(t0 )
6
•
(t,~r)
@
@
@
@
•
x2 @
@ x1
@
@
Abbildung X.3 – Retardierte Zeit.
Somit genügt die retardierte Zeit der impliziten Gleichung
tret. = t −
|~r − ~x(tret. )|
.
c
(X.72)
186
Zeitabhängige elektromagnetische Felder
Die Integration nach t0 in Gl. (X.71a) folgt aus der Formel δ f (t0 ) = δ(t0 − tret. )/|f 0 (tret. )|,
wobei hier
1 ~r − ~x(t0 )
f 0 (t0 ) = −1 +
· ~v (t0 ).
c |~r − ~x(t0 )|
Daher gilt
f 0 (tret. ) = −1 + ~eret. · β~ret. ,
mit
~eret. ≡
~ ret.
~r − ~x(tret. )
X
≡
~ ret. |
|~r − ~x(tret. )|
|X
(X.73a)
~ ret. ≡ ~r − ~x(tret. ), d.h. von der Quelle des Potentials bis zu
dem Einheitsvektor in Richtung von X
dessen Beobachtungspunkt, während
~vret.
~v (tret. )
β~ret. =
≡
c
c
(X.73b)
die Geschwindigkeit der Punktladung zur retardierten Zeit bezeichnet. Da der Betrag von β~ret.
streng kleiner als 1 ist, bleibt f 0 (tret. ) immer negativ.
Somit ergeben sich die Liénard (ao) –Wiechert (ap) -Potentiale
~ r) = µ0
A(t,~
4π
und
Φ(t,~r) =
q~vret.
|~r − ~x(tret. )| − [~r − ~x(tret. )] ·
1
4π0
Dabei hängt die Geschwindigkeit ~vret.
implizit von t und ~r ab.
~vret.
c
,
(X.73c)
q
.
(X.73d)
~vret.
c
der Punktladung zur retardierten Zeit von tret. und somit
|~r − ~x(tret. )| − [~r − ~x(tret. )] ·
Bemerkung: Der Nenner dieser Potentiale ist immer positiv.
X.5.4
b Elektrisches und magnetisches Feld
:::::::::::::::::::::::::::::::::::::::::::::
Das elektrische und das magnetische Feld können aus den Gl. (X.13) und (X.12) hergeleitet
werden. Die Liénard–Wiechert-Potentiale (X.73) hängen aber nicht nur explizit von der Raumzeitvariablen t und ~r ab, sondern auch implizit über die retardierte Zeit (X.72). Dementsprechend ist
die Berechnung der Felder etwa mühsam. Letztendlich findet man die retardierten Feldern:
!
~ret. × ~aret.
~ret.
~
e
×
~
e
−
β
q
~
e
−
β
ret.
ret.
ret.
~ r) =
E(t,~
,
(X.74a)
+
2 X
~ ret. ~ ret. 2
c2 X
4π0 (1 − ~eret. · β~ret. )3 γret.
~ r) = 1 ~eret. × E(t,~
~ r),
B(t,~
(X.74b)
c
mit β~ret. bzw. ~aret. der auf c normierten Geschwindigkeit bzw. der Beschleunigung der Punktladung
2 )−1/2 dem entsprechenden Lorentz-Faktor.
zur retardierten Zeit und γret. = (1 − β~ret.
Beweis: Um die retardierten Felder herzuleiten, lohnt es sich, die Potentiale (X.73c)–(X.73d)
umzuschreiben [vgl. Gl. (X.71)]
Z ∞
q
1
|~r − ~x(t0 )|
0
Φ(t,~r) =
δ t−t −
dt0
(X.75a)
4π0 −∞ |~r − ~x(t0 )|
c
Z ∞
~v (t0 )
|~r − ~x(t0 )|
0
~ r) = µ0 q
A(t,~
δ
t
−
t
−
dt0 .
(X.75b)
4π −∞ |~r − ~x(t0 )|
c
(ao)
A.-M. Liénard, 1869–1958
(ap)
E. Wiechert, 1861–1928
187
X.5 Klassische Theorie der Strahlung
~ 0 ) ≡ ~r − ~x(t0 ) mit ~e(t0 ) ≡ X(t
~ 0 )/|X(t
~ 0 )| dem entsprechenden Einheitsvektor. Aus
Sei jetzt X(t
diesen Gleichungen folgen
#
Z ∞"
~ 0 ) ~ 0 ) X(t
X(t
1
q
1
0
0
0
~
−
∇Φ(t,~
r) =
− ~e(t0 ) dt0 ,
δ t−t −
δ t−t −
~ 0 )
4π0 −∞
c
c
~ 0 )2
X(t
cX(t
Z
~ 0 ) X(t
~ r)
∂ A(t,~
µ0 q ∞ ~v (t0 ) 0
0
=
dt0 .
δ t−t −
~ 0 )
∂t
4π −∞ X(t
c
~ 0 )/c gibt ds/dt0 = −1 + ~e · β~ und dadurch
Die Substitution s = f (t0 ) = t − t0 − X(t
#
"
Z ∞
~
q
1
~
e
−
β
~
e
0
~ ~r) =
E(t,
(X.76)
2 δ(s) + δ (s) ds,
~
~ X
4π0 −∞ 1 − ~e · β
~
cX
~ ~v und β~ ≡ ~v /c zur Zeit t0 = f −1 (s) zu betrachten sind. Der Term mit der Ableitung
wobei ~e, X,
der δ-Distribution kann mithilfe partieller Integration berechnet werden:
"
#
Z ∞
Z ∞
~
~e − β~
~e − β
d
0
δ(s)
δ (s) ds = −
ds
~
~
ds c 1 − ~e · β~ X
e · β~ X
−∞ c 1 − ~
−∞
#
"
Z ∞
d
~e − β~
1
=
δ(s)
ds.
~ X
~
1 − ~e · β~ dt0 c 1 − ~e · β
−∞
Die Ableitung nach t0 im Integranden folgt aus den Ableitungen
d 1
~e · ~v
= 2 ,
~
dt0 X
~
X
d~e
(~e · ~v )~e − ~v
,
=
~
X
dt0
d
1
1
~e · ~a (~e · ~v )2 − ~v 2
,
=
+
2
~
dt0 1 − ~e · β~
c
c X
1 − ~e · β~
mit ~a = d~v /dt0 der Beschleunigung der Punktladung. Dies führt zu
#
"
"
~e · ~a ~e − ~a − ~e · ~a β~ + ~e · β~ ~a
1
d
~e − β~
= ~
dt0 c 1 − ~e · β~ X
c2
~ 1 − ~e · β~ 2
X
#
2
~2
2 ~e · β~ − ~e · β~ − β~ 2
1−β
~
~e − β ,
+
~
~
X
X
so dass Gl. (X.76) insgesamt lautet
Z ∞
q
δ(s)
~
E(t, ~r) =
4π0 −∞ X
~ 1 − ~e · β~ 3
!
~ − ~e · ~e − β~ ~a
~e · ~a ~e − β
1 − β~ 2 ~e − β~
+
ds.
~
X
c2
Dann ist der Integrand gleich dem Produkt eines Terms δ(s) mit einer Funktion von s: das
Integral ist einfach der Wert der Letzteren für s = 0, d.h. t0 = tret. . Somit findet man Gl. (X.74a).
~ ~r) lässt sich ähnlich berechnen, ausgehend aus
Das magnetische Feld B(t,
"
#
Z ∞
~ 0 ) ~ 0 ) X(t
X(t
µ
q
−1
1
0
0
0
0
0
0
~ A(t,~
~ r) =
∇×
~e(t )×~v (t ) − dt0 .
δ t−t −
δ t−t −
~ 0 )
4π −∞
c
c
~ 0 )2
X(t
cX(t
Die retardierten elektromagnetischen Felder (X.74) bestehen aus einem Beitrag proportional
~ ret. |2 und einem Term proportional zu 1/|X
~ ret. |. In einem Bezugssystem, das sich mit der
zu 1/|X
~ret. = ~0, lauten sie
Punktladung zur retardierten Zeit mitbewegt, d.h. wo β
"
#
~
e
×
~
e
×
~
a
q
~
e
ret.
ret.
ret.
ret.
~ =
~ = 1 ~eret. × E.
~
E
,
B
2 +
~ ret. ~ ret. 4π0 X
c
c2 X
~ ret. |2 einer ruhenden Punktladung
Das elektrische Feld ist die Summe aus dem Coulomb-Feld in 1/|X
~ Coul. =
E
q
~eret.
,
~ ret. 2
4π0 X
~ Coul. = ~0,
B
188
Zeitabhängige elektromagnetische Felder
und, wenn die retardierte Beschleunigung ~aret. der Punktladung nicht Null ist, aus dem Strahlungsfeld
~ ret. |
in 1/|X
q
~ Strahl. =
~ Strahl. = 1 ~eret. × E
~ Strahl. .
E
B
~eret. × ~eret. × ~aret. ,
~ ret. c
4π0 c2 X
Diese Strahlungsfelder sind senkrecht zu ~eret. .
~ ret. |2 in Gl. (X.74) dem Coulomb-Feld, und der
Ähnlicherweise entspricht der Beitrag in 1/|X
~
Term in 1/|Xret. |, dem Strahlungsfeld.
Bemerkung: Wenn die Punktladung beschleunigt wird, muss sie einer Kraft unterliegen, d.h. sie muss
in einem elektromagnetischen Feld sein: dieses „äußere“ Feld wird hier nicht präzisiert. Dagegen lässt
sich die Kraft F~ (t), die für die Beschleunigung zur Zeit t verantwortlich ist, dank dem Grundgesetz
der Mechanik (VI.14) einfach durch die kinetischen Größen der Punktladung ausdrücken:
d ~ · ~a(t) β(t)
~
F~ (t) =
mγ(t) ~v (t) = γ(t) m ~a(t) + γ 2 (t) β(t)
(X.77)
dt
mit m der Masse der Punktladung.
Beispiel: Punktladung in gleichförmiger geradliniger Bewegung
Wenn ~aret. = ~0 zu jeder retardierten Zeit vereinfacht sich das elektrische Feld (X.74) zu
~ ret. − X
~ ret. ~
~
X
β
q
~
e
−
β
q
ret.
~ r) =
E(t,~
(X.78)
2 =
3 ,
~ ret. ~ ret. − X
~ ret. · β~ 3
4π0 γ 2 X
4π0 1 − ~eret. · β~ γ 2 X
~
mit konstanter Geschwindigkeit β.
~
Aus |Xret. | = |~r − ~x(tret. )| = c(t − tret. ) folgt für die gleichförmige Bewegung der Punktladung
~ − tret. ) = ~x(tret. ) + |X
~
~ ret. |β,
~x(t) = ~x(tret. ) + cβ(t
~ ret. − |X
~ ret. |β~ = ~r − ~x(t): das elektrische Feld zur
d.h. für den Vektor im Zähler der Gl. (X.78) X
Zeit t ist in der momentanen Richtung von der Ladung nach ~r, nicht in der „retardierten“ Richtung
gerichtet.
X.5.4
c Abgestrahlte Leistung
::::::::::::::::::::::::::::::
Sei d2 S ein Flächenelement in einem Punkt ~r im Abstand X einer Punktladung, von der aus
2
d S unter einem Raumwinkelelement d2 Ω gesehen wird. Der Einheitsvektor in Richtung von der
Punktladung nach ~r wird mit ~eret. bezeichnet.
Ein Beobachter B in ~r misst die elektromagnetischen Felder (X.74): die Energie, die pro Einheit
der Eigenzeit t von B durch d2 S strömt, ist die von B empfangene Leistung
~e.m. · ~eret. X 2 d2 Ω,
d2P = S
~e.m. = E
~ × B/µ
~ 0 dem Poynting-Vektor in ~r [Gl. (X.23b)]. Für große Abstände X → ∞
mit S
trägt der Coulomb-Anteil der retardierten Felder nicht bei, und man darf das Strahlungsfeld alleine
betrachten. Dann gilt
h
i
d2P
1
2 ~
~
=
X
E
×
~
e
×
E
eret. .
ret.
Strahl.
Strahl. · ~
d2 Ω
µ0 c
~2
~ Strahl. )E
~ Strahl. , wobei der zweite Term wegen
Das doppelte Kreuzprodukt lautet E
eret.− (~eret.· E
Strahl.~
~ Strahl. und ~eret. Null ist. Damit ergibt sich unter Berücksichtigung des
der Orthogonalität von E
Ausdrucks des Strahlungsfeldes in Gl. (X.74a)
2
d2P
µ0 q 2
~ret. × ~aret. ,
=
~
e
×
~
e
−
β
ret.
ret.
6
d2 Ω
(4π)2 c 1 − ~eret. · β~ret.
189
X.5 Klassische Theorie der Strahlung
wobei ein Faktor 1/(µ0 20 c5 ) in µ0 /c transformiert wurde.
Wegen Energieerhaltung ist die elektromagnetische Energie, welche die Punktladung in Richtung
von d2 S abstrahlt, gleich der Energie, die (später) im Beobachtungspunkt ~r durch d2 S strömt. Die
Leistung, die durch die Punktladung abgestrahlt wird, ist genau diese Energie, bezogen auf die
Einheit der Eigenzeit der Punktladung. Diese Eigenzeit ist gerade die retardierte Zeit tret. , so dass
die pro Raumwinkelelement abgestrahlte Leistung durch
2
d2P0
µ0 q 2
d2P ∂t
~
=
~
e
×
~
e
−
β
×
~
a
=
ret.
ret.
ret.
ret. ~ret. 5
d2 Ω
d2 Ω ∂tret.
(4π)2 c 1 − ~eret. · β
(X.79)
gegeben wird, wobei ∂t/∂tret. = 1 − ~eret. · β~ret. benutzt wurde.
Um die letztere partielle Ableitung zu erhalten, kann man Gl. (X.72) differenzieren, was zu
~ ret. · dX
~ ret.
1X
1
= dtret. − dt + ~eret. · (d~r − ~vret. dtret. ) = 0
~ ret. X
c
c
führt, d.h. 1 − ~eret. · β~ret. dtret. = dt − eret.
~ · d~r/c. Dann gelten
dtret. − dt +
1
∂tret.
=
,
∂t
1 − ~eret. · β~ret.
~ ret. = −
∇t
~eret.
c 1 − ~eret. · β~ret.
.
Bemerkungen:
∗ Eine nicht-beschleunigte Punktladung strahlt keine Energie ab!
∗ Aus Sicht der Punktladung entspricht die als elektromagnetisches Feld abgestrahlte Energie bzw.
Leistung einem Strahlungsverlust.
Dieser Verlust liegt einem wichtigen Problem der klassischen Physik zugrunde, und zwar der Frage
der Stabilität von Atomen: die an den Atomkern gebundenen Elektronen unterliegen einer anziehenden Kraft, und werden daher beschleunigt. Wenn sie teil ihrer Energie als Strahlung verlieren,
sollte ihre kinetische Energie allmählich kleiner werden, d.h. sie sollten irgendwann auf den Atomkern fallen. Dies ist aber nicht der Fall, was im Rahmen der klassischen Physik nicht erklärbar ist,
und stellt damit eine wichtige Begründung für die Quantenmechanik — oder zumindest für etwas
jenseits der klassischen Physik — dar.
Nicht-relativistischer Grenzfall
~ret. | |~eret. | = 1 vereinfacht sich Gl. (X.79) zu
Im Fall |β
2
d2P0
µ0 q 2 .
=
~
e
×
~
e
×
~
a
ret.
ret.
ret.
d2 Ω
(4π)2 c
Sei θ der Winkel zwischen der retardierten Beschleunigung ~aret. und der Beobachtungsrichtung ~eret. ;
dann gilt
µ0 q 2
q 2 |~aret. |2 sin2 θ
d2P0
2
2
=
|~
a
|
sin
θ
=
.
ret.
d2 Ω
(4π)2 c
4π0 c3 4π
Die Strahlungsleistung ist maximal für θ = π2 , d.h. senkrecht zur Richtung der Beschleunigung.
Die gesamte abgestrahlte Leistung ergibt sich durch Integration dieser Formel über den Raumwinkel: mit d2 Ω = sin θ dθ dϕ erhält man die Larmor (aq) -Formel
P0 =
(aq)
J. Larmor, 1857–1942
Z
d2P0 2
2 q 2 |~aret. |2
d
Ω
=
.
d2 Ω
3 4π0 c3
(X.80)
190
Zeitabhängige elektromagnetische Felder
Allgemeiner Fall
Die Larmor-Formel (X.80) gilt in einem mitbewegten Inertialsystem B0 , relativ zu welchem die
retardierte Geschwindigkeit der Punktladung momentan verschwindet. In einem Bezugssystem B~v ,
wo die retardierte Geschwindigkeit der Punktladung den Wert ~v annimmt, gilt
P0 =
2 q2
aµ aret.µ ,
3 4π0 c3 ret.
(X.81)
mit aµ ≡ duµ /dτ ≡ d2 xµ /dτ 2 den kontravarianten Komponenten der Viererbeschleunigung (VI.15)
der Punktladung, die hier zur retardierten Zeit betrachtet werden soll.
Diese Formel lässt sich noch umschreiben als
h
2
i
2 q2
6
~ret. × ~aret. 2 .
P0 =
γ
~
a
−
β
(X.82)
ret.
ret.
3 4π0 c3
Beweis der relativistischen Formeln (X.81)–(X.82):
Der erste Schritt besteht in der Beobachtung, dass die abgestrahlte Leistung Lorentz-invariant
ist. Es seien dE0 bzw. dE das Differential der Energie im Bezugssystem B0 bzw. B~v , und dt0
bzw. dtpdie entsprechenden Differentiale der Zeit. Dann gelten dE = γ dE0 und dt = γ dt0 , mit
γ = 1/ 1 − ~v 2 /c2 dem Lorentz-Faktor. Daraus folgt
dE
dE0
=
= P0 .
dt
dt0
Berechnet man dann das Lorentz-Skalar aµ aµ der Viererbeschleunigung, so kommt erstens
duµ
duµ
~ · ~a)β~
=γ
= γ 4 β~ · ~a, γ 2~a + γ 4 (β
dτ
dt
mit ~a = d~v /dt der Beschleunigung der Punktladung, und daher
2 aµ aµ = γ 4 ~a 2 + γ 2 β~ · ~a .
aµ =
(X.83)
Im Bezugssystem B0 , wo β~ = ~0 bzw. γ = 1, stimmen die Formeln (X.80) und (X.81) miteinander
überein. Da der Ausdruck auf der rechten Seite von Gl. (X.81) ein Lorentz-Skalar ist, erhält er
den gleichen Wert in allen Inertialsystemen, d.h. die Formel gilt in allen solchen Bezugssystemen.
Sei ϑ der Winkel zwischen β~ und ~a. Aus
2
2
2
1
~a 2 − β~ × ~a = ~a 2 − β~ 2~a 2 (1 − cos2 ϑ) = 1 − β~ 2 ~a 2 + β~ · ~a = 2 ~a 2 + β~ · ~a
γ
und dem Viererquadrat (X.83) folgt dann die Identität der rechten Gliedern der Gl. (X.81)
und (X.82).
2
Beschleunigung parallel zur Geschwindigkeit
Wenn Beschleunigung und Geschwindigkeit parallel zueinander sind, gelten ~aret. × β~ret. = ~0 und
~eret. · β~ret. = |β~ret. | cos θ. Dann lautet Gl. (X.79)
d2P0
µ0 q 2 |~aret. |2
sin2 θ
=
5 .
d2 Ω
(4π)2 c
1 − |β~ret. | cos θ
(X.84)
Für |β~ret. | → 1 wird also d2P0 /d2 Ω groß in der Vorwärtsrichtung cos θ = 1.
Genauer kann man prüfen, dass das Maximum von d2P0 /d2 Ω im Fall 1−|β~ret. | 1 für θ ' 1/2γ
erreicht wird.
Die Integration der Leistung (X.84) über den ganzen Raumwinkel führt zu
P0 =
2 µ0 q 2 |~aret. |2 6 2 q 2 |~aret. |2 6
γ =
γ ,
3
4πc
3 4π0 c3
(X.85)
191
X.5 Klassische Theorie der Strahlung
mit γ dem Lorentz-Faktor assoziiert mit der Geschwindigkeit der Punktladung. Dieses Resultat folgt
auch direkt aus der relativistischen Formel (X.82).
Die Leistung (X.85) wird also unendlich groß, wenn die Geschwindigkeit der Punktladung gegen c
strebt. Dieses Resultat zeigt, dass es nicht möglich ist, eine Punktladung bis zur Lichtgeschwindigkeit
zu beschleunigen: dies würde eine unendliche Energie erfordern, um die abgestrahlte Leistung zu
kompensieren.
Wenn Beschleunigung und Geschwindigkeit parallel zueinander sind, nimmt die Kraft (X.77),
die für die Beschleunigung der Punktladung verantwortlich ist, die Form
F~ (t) = γ(t)3 m~a(t)
an. Somit lässt sich die Leistung (X.85) als
P0 =
2 2
2 µ0 q 2 ~
q2
F~ (tret. )2
=
F
(t
)
ret.
2
2
3
3 4πm c
3 4π0 m c
schreiben.
Beschleunigung senkrecht zur Richtung der Geschwindigkeit
Wenn Beschleunigung und Geschwindigkeit orthogonal sind, entsprechend einer Kreisbewegung,
lautet die abgestrahlte Leistung (X.82)
P0 =
2
2 q2
6
~ 2 |~aret. |2 = 2 q
γ
1
−
β
γ 4 |~aret. |2 .
ret.
3 4π0 c3 ret.
3 4π0 c3 ret.
(X.86)
Dazu lautet die Kraft (X.77) auf die Punktladung F~ (t) = γ(t)m~a(t), so dass diese Leistung
dadurch noch als
2
q2
2
2 ~
.
γ
F
(t
)
P0 =
ret.
ret.
3 4π0 m2 c3
ausgedrückt werden kann. Die abgestrahlte Leistung ist also größer um einen Faktor γ 2 relativ zum
Fall einer Linearbewegung mit der gleichen Kraft. Somit wird mehr Energie als sog. Synchrotronstrahlung in einem kreisförmigen Teilchenbeschleuniger (einem „Speicherring“, wie z.B. das LHC am
CERN) verloren,(52) als in einem Linearbeschleuniger.
Bemerkung: Wenn ein geladenes Teilchen auf Materie stößt und dort von Wechselwirkungen mit den
Atomen abgebremst wird, strahlt es ab. Die entsprechende Strahlung wird Bremsstrahlung (auch
auf Englisch!) genannt.
Literatur zum Kapitel X
• Feynman, Vorlesungen über Physik. Band 2 [20] = Lectures on Physics. Vol. II [21] Kap. 18,
20–21, 27 & 29;
Vorlesungen über Physik. Band 1 [22] = Lectures on Physics. Vol. I [23] Kap. 34.
• Fließbach, Elektrodynamik [3] Teil IV Kap. 16–17 & Teil V Kap. 20, 23–24.
• Greiner, Klassische Elektrodynamik [8] Teil IV Kap. 12–13, 15, 20–21.
• Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap. 7–11.
• Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 6.1–6.5, 6.7,
7.1–7.2, 9.1–9.2 & 14.1–14.4.
(52)
Oder genauer, abgestrahlt: die emittierte Strahlung kann benutzt werden, um Materie zu untersuchen.
192
Zeitabhängige elektromagnetische Felder
• Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 4
§ 26, 29–31, 33, Kap. 6 § 46–48, Kap. 8 § 62–64 & Kap. 9 § 66–67 & 73–76.
• Nolting, Elektrodynamik [17] Kap. 4.1, 4.3 & 4.5.
• Scheck, Klassiche Feldtheorie [19] Kap. 1.3–1.6, 2.3, 3.5–3.6 & 4.1–4.2.
K APITEL XI
Relativistisch kovariante Formulierung
der Elektrodynamik
Die spezielle Relativitätstheorie wurde entwickelt, um die Invarianz der Geschwindigkeit im Vakuum von Licht, d.h. allgemeiner von elektromagnetischen Wellen, in Transformationen zwischen
Inertialsystemen zu berücksichtigen. Dementsprechend ist Elektrodynamik automatisch eine „relativistische“ Theorie, was aber an den Maxwell-Gleichungen nicht sofort erkennbar ist.
In diesem Kapitel werden die Gesetze und einige Resultate der Elektrodynamik in relativistisch
kovarianter Notation formuliert. Somit werden erstens Lorentz-Vierervektoren und -tensoren eingeführt, welche die unterschiedlichen elektromagnetischen Größen beschreiben (Abschn. XI.1). Diese
werden dann in Abschn. XI.2 benutzt, um die Grundgleichungen der Elektrodynamik auszudrücken.
Schließlich werden weitere Ergebnisse des Kapitels X in relativistisch kovarianter Schreibweise angegeben (Abschn. XI.3).
Hiernach bezeichnet x einen Punkt der Raumzeit mit kontravarianten Koordinaten xµ , und der
metrische Tensor η hat die Signatur −, +, +, + (vgl. § V.3.3 a). Die Einsteinsche Summenkonvention
über doppelt auftretende Lorentz-Indizes wird durchaus benutzt.
XI.1 Lorentz-kovariante elektromagnetische Größen
Zur Formulierung der Elektrodynamik in relativistisch kovarianter Notation sollen zuerst passende
Lorentz-kovariante Größen — Viererskalare, -vektoren oder -tensoren — definiert werden, welche
das elektromagnetische Feld (§ XI.1.1) mit den zugehörigen Potentialen (§ XI.1.2), dessen Quellen
(§ XI.1.3), sowie dessen Energie und Impuls (§ XI.1.4) beschreiben.
XI.1.1 Elektromagnetischer Feldstärketensor
In relativistisch kovarianter Schreibweise gewinnt die Bezeichnung „elektromagnetisches Feld“
ihre volle Bedeutung, indem die elektrische und magnetische Dreiervektorfelder miteinander in ein
einzelnes mathematisches Objekt kombiniert werden.
XI.1.1
a Definition
::::::::::::::::::
Um eine relativistisch kovariante Größe zu erhalten, werden das elektrische und das magnetische
~ und B
~ zum elektromagnetischen Feldstärketensor zweiter Stufe F kombiniert. Letzterer kann
Feld E
durch die Angabe seiner kontravarianten Komponenten
F 00 (x) = F ii (x) = 0,
E i (x)
,
c
3
X
F ij (x) = −F ji (x) ≡
ijk B k (x)
F 0i (x) = −F i0 (x) ≡
(XI.1a)
k=1
bezüglich eines gegebenen Inertialsystems B definiert werden. Dabei sind i, j ∈ {1, 2, 3}, während
194
Relativistisch kovariante Formulierung der Elektrodynamik
ijk das dreidimensionale völlig antisymmetrische Levi-Civita-Symbol bezeichnet. Die Komponenten
~ und B
~ sind solche, die ein bezüglich B ruhender Beobachter messen würde.
E i , B j der Felder E
Die Matrixdarstellung des elektromagnetischen Feldstärketensors F lautet


E 3 (x)
c 


3
2
0
B (x) −B (x)

,

3
1
−B (x)
0
B (x) 



B 2 (x) −B 1 (x)
0
E 2 (x)
c
E 1 (x)
c
 0

 E 1 (x)
−

c
µν
F (x) = 
 E 2 (x)
−

c

 E 3 (x)
−
c
(XI.1b)
wobei der erste bzw. zweite Index des Tensors dem Zeilen- bzw. Spaltenindex der Matrix entspricht.
F µν (x) ist offensichtlich antisymmetrisch unter dem Austausch der zwei Indizes
F µν (x) = −F νµ (x)
∀µ, ν ∈ {0, 1, 2, 3}.
(XI.2)
0
0
Unter Lorentz-Transformationen xµ → xµ = Λµµ xµ zwischen Inertialsystemen bzw. MinkowskiKoordinaten transformiert sich der Feldstärketensor wie jeder Tensor zweiter Stufe, d.h. gemäß
0 0
0
0
F µν → F µ ν = Λµµ Λν ν F µν .
~ und B
~ folgern.
Daraus kann man die entsprechenden Transformationen für die Felder E
Für einen drehungsfreien Boost (§ V.2.2 b) mit Geschwindigkeit ~v = v~e findet man
~ × ~e − ~v × B
~
~e × E
0
~
~
p
E = ~e · E ~e +
1 − ~v 2/c2
~ × ~e + ~v × E/c
~ 2
~e × B
0
~
~
p
B = ~e · B ~e +
1 − ~v 2/c2
mit ~e dem Einheitsvektor in Richtung des Boosts.
Sei u = {uµ }µ=0...3 die Vierergeschwindigkeit eines Beobachters B 0 relativ zum Inertialsystem
B. Man kann Vierervektoren Eu (x) und Bu (x) durch die Angabe ihrer jeweiligen kontravarianten
Komponenten
Euµ (x) ≡ F µν(x)uν
Buµ (x) ≡
1 µνρσ
uν Fρσ(x)
2c
(XI.3a)
(XI.3b)
bezüglich B definieren, wobei µνρσ den vierdimensionalen Levi-Civita-Tensor (V.46) bezeichnet.
Falls B 0 in B ruht — d.h. u0 = −u0 = 1 und ui = 0 für i = 1, 2, 3 —, dann sind die räumlichen
Komponenten der entsprechenden Vierervektoren E0 (x) bzw. B0 (x) gleich den Komponenten in B
~
~
der Dreiervektoren E(x)
bzw. B(x),
während die 0-Komponenten von E0 (x) und B0 (x) Null sind.
Allgemeiner stellt Eu (x) bzw. Bu (x) das elektrische bzw. magnetische Feld relativ zum Ruhesystem
des Beobachters B 0 dar, wie es vom Bezugssystem B aus gesehen aussieht.
XI.1.1
b Dualer Feldstärketensor
:::::::::::::::::::::::::::::::::
Mithilfe des vierdimensionalen Levi-Civita-Tensors definiert man noch den dualen elektromagnetischen Feldstärketensor F̃
F̃, dessen kontravariante Komponenten durch
1
F̃ µν (x) ≡ µνρσ Fρσ (x)
2
(XI.4a)
195
XI.1 Lorentz-kovariante elektromagnetische Größen
definiert sind. In Matrixdarstellung ergibt sich(53)

0
B 1 (x)


−B 1 (x)
0

µν

F̃ (x) = 
E 3 (x)
−B 2 (x)

c

E 2 (x)
3
−B (x) −
c
B 2 (x)
−
E 3 (x)
c
0
E 1 (x)
c
B 3 (x)


E 2 (x) 


c

E 1 (x)  .

−
c 

(XI.4b)
0
Relativ zu den Komponenten F µν von F folgen die F̃ µν aus den Substitutionen E i /c → B i und
B i → −E i /c.
Der duale Feldstärketensor ist deutlich antisymmetrisch.
Bemerkungen:
∗ Die Komponenten des in Gl. (XI.3) eingeführten Vierervektors Bu (x) lassen sich einfacher als
1
Buµ (x) ≡ F̃ µν(x)uν
c
schreiben. Wiederum gilt Euµ (x) ≡ − 21 µνρσ uν F̃ρσ(x).
F.
∗ Der „biduale“ Feldstärketensor mit Komponenten F̃˜ µν = 21 µνρσ F̃ρσ ist einfach −F
XI.1.1
c Invarianten des elektromagnetischen Feldes
:::::::::::::::::::::::::::::::::::::::::::::::::::::
Aus dem Feldstärketensor (XI.1) und seinem Dual (XI.4) lassen sich durch Kontraktionen zwei
unabhängige Größen finden, die sich unter Transformationen zwischen Inertialsystemen nicht ändern, d.h. zwei Lorentz-Skalaren, und zwar
~ 2
E(x)
µν
2
~
Fµν (x)F (x) = 2 B(x) −
(XI.5a)
c2
und
~
~
E(x)
· B(x)
.
(XI.5b)
c
Die dritte natürliche Möglichkeit F̃µν (x)F̃ µν (x) ist nicht unabhängig von den zwei ersten, sondern
gleich −Fµν (x)F µν (x).
F̃µν (x)F µν (x) = −4
XI.1.2 Viererpotential
~ bilden einen Vierervektor, das Viererpotential ,
Das Skalarpotential Φ und das Vektorpotential A
mit den kontravarianten Komponenten


Φ(x)
A(x) =  c  .
(XI.6)
~
A(x)
Der elektromagnetische Feldstärketensor (XI.1) lässt sich dadurch ausdrücken gemäß
F µν(x) = ∂ µAν (x) − ∂ νAµ (x),
(XI.7)
wobei ∂ µ ≡ ∂ /∂xµ , d.h. ∂ 0 = −(1/c)∂ /∂t während ∂ i die i-te Komponente des Gradienten ist.
(53)
Dabei muss die Leserin darauf aufpassen, dass numerisch F0i = −Fi0 = −F 0i = −E i /c und Fij = F ij gelten, wie
sich aus Fρσ = ηρµ ησν F µν berechnen lässt.
196
Relativistisch kovariante Formulierung der Elektrodynamik
Dementsprechend stellen die Beziehungen
Ei
1 ∂Ai ∂
= F 0i = ∂ 0 Ai − ∂ i A0 = −
− i
c
c ∂t
x
Bi =
Φ
c
3
3
3
1 X ijk jk X ijk j k X ijk ∂Ak
F =
∂A =
2
∂xj
j,k=1
j,k=1
j,k=1
jeweils die i-te Komponente der Gleichung (X.13) und (X.12) dar.
Eichinvarianz
In relativistisch kovarianter Schreibweise lautet die Eichtransformation (X.14)
::::::::::::::
µ
Aµ (x) → A0 (x) = Aµ (x) + ∂ µ χ(x),
(XI.8)
mit χ(x) einer zweimal kontinuierlich differenzierbaren skalaren Funktion. Für solche Funktionen
gilt ∂ µ ∂ ν χ(x) = ∂ ν ∂ µ χ(x), so dass die Viererpotentiale A und A0 über Beziehung (XI.7) zum gleichen
Feldstärketensor F führen, wie zu erwarten war.
Unter Berücksichtigung der Beziehung 0 µ0 = 1/c2 [Gl. (X.29c)] wird die Bedingung (X.16),
welche die Lorenz-Eichung definiert, zu
∂µ Aµ (x) = 0.
(XI.9)
Dabei ist deutlich, dass diese Eichbedingung Lorentz-invariant ist, d.h. sie bleibt in allen Inertialsystemen erfüllt. Dagegen gilt diese Eigenschaft nicht für die Coulomb-Eichbedingung, für die es
keine Lorentz-kovariante Formulierung gibt.
XI.1.3 Elektrischer Viererstrom
Die elektrischen Ladungs- und Stromdichte bilden einen Vierervektor Jel.(x), der als elektrischer
Viererstrom bzw. Viererstromdichte — was genauer ist — bezeichnet wird:
Jel.(x) =
ρel.(x)c
.
~el.(x)
(XI.10a)
Komponentenweise entspricht dies
0
(x) = ρel.(x)c,
Jel.
i
i
(x) = jel.
(x) für i = 1, 2, 3.
Jel.
(XI.10b)
Dabei bezeichnen ρel. und ~el. die bekannten „nicht-relativistischen“ Größen in einem festen Bezugssystem, das sich möglicherweise relativ zu den Ladungen bewegt.
Für eine Punktladung q mit Weltlinie bzw. Vierergeschwindigkeit t, ~x(t) bzw. u(τ ) = dx(τ )/dτ ,
mit τ der Eigenzeit der Punktladung, gilt
Jel.(x) = qδ (3) ~r − ~x(t) u(x) = %0 (x) u(x),
(XI.11a)
wobei %0 (x) die Ladungsdichte im Ruhesystem der Punktladung bezeichnet. Unter Berücksichtigung
des Ausdrucks (V.27) der Vierergeschwindigkeit lautet dies noch
%0 (x)γc
Jel.(x) =
(XI.11b)
%0 (x)γ~v
p
mit γ = 1/ 1 − ~v 2/c2 dem Lorentz-Faktor.
XI.2 Relativistisch kovariante Formulierung der Grundgesetze
197
XI.1.4 Energieimpulstensor
~e.m. [Gl. (X.23b)], die Impulsdichte
Die Energiedichte ee.m. [Gl. (X.23a)], der Poynting-Vektor S
σe.m. [Gl. (X.26b)–(X.26c)] des elektro~ge.m. [Gl. (X.26a)] und die Impulsstromdichte T e.m. = −σ
magnetischen Feldes lassen sich in einen Vierertensor zweiter Stufe T e.m. , den Energieimpulstensor
des Feldes, kombinieren. In Matrixdarstellung lautet dieser


ee.m.(x)
c~ge.m.(x)




µν
.
Te.m.(x) = 
(XI.12a)
~e.m.(x)
 S


T e.m.(x) 
c
Der Energieimpulstensor lässt sich auch durch den Feldstärketensor (XI.1) ausdrücken, und zwar
komponentenweise
1
1 µν
µν
µ
ρν
ρσ
Te.m.(x) =
−F ρ (x)F (x) − η Fρσ (x)F (x) ,
(XI.12b)
µ0
4
mit η µν den Komponenten des inversen metrischen Tensors. In dieser Form prüft man einfach, dass
der Energieimpulstensor symmetrisch ist.
XI.2 Relativistisch kovariante Formulierung der Grundgesetze
Mit den in Abschn. XI.1 eingeführten Größen lassen sich die Maxwell-Gleichungen (§ XI.2.1), die
Kontinuitätsgleichung (§ XI.2.2), die Lorentz-Kraftdichte (§ XI.2.3) und die Energie- und Impulsbilanz (§ XI.2.4) in relativistisch kovarianter Form schreiben.
XI.2.1 Maxwell-Gleichungen
Mit dem elektromagnetischen Feldstärketensor (XI.1) und dem elektrischen Viererstrom (XI.10)
lauten die Maxwell-Gleichungen
µ
(x) ∀µ ∈ {0, 1, 2, 3},
∂ν F µν(x) = µ0 Jel.
(XI.13a)
∂ µF νρ(x) + ∂ νF ρµ(x) + ∂ ρF µν(x) = 0 ∀µ, ν, ρ ∈ {0, 1, 2, 3}.
(XI.13b)
Dabei stellen die Gl. (XI.13a) mit einem Quellterm die inhomogenen Maxwell–Gauß- und Maxwell–
Ampère-Gleichungen (X.1a) und (X.1d) dar.
Wiederum stehen die Gl. (XI.13b) — wobei nur die vier Fälle (µ, ν, ρ) = (0, 1, 2), (0, 1, 3),
(0, 2, 3) und (1, 2, 3) unterschiedlich sind — für die homogenen Maxwell-Gleichungen (X.1b) und
(X.1c). Unter Verwendung des dualen elektromagnetischen Feldstärketensors (XI.4) lassen sich die
homogenen Maxwell-Gleichungen noch als
∂µ F̃ µν(x) = 0 ∀ν ∈ {0, 1, 2, 3}
(XI.13c)
umschreiben. In dieser Form ist sofort klar, dass es nur vier Gleichungen gibt.
XI.2.2 Kontinuitätsgleichung
Ausgedrückt durch den elektrischen Viererstrom (XI.10) lautet die Kontinuitätsgleichung (X.7)
µ
∂µ Jel.
(x) = 0.
(XI.14)
198
Relativistisch kovariante Formulierung der Elektrodynamik
Genau wie in § X.1.1 b lässt sich diese Bilanzgleichung aus den homogenen Maxwell-Gleichungen
herleiten: somit lautet die Viererdivergenz der Gl. (XI.13a)
µ
∂µ ∂ν F µν(x) = µ0 ∂µ Jel.
(x).
Dabei sind auf der linke Seite ∂µ ∂ν symmetrisch und F µν antisymmetrisch unter dem Austausch von
µ und ν, so dass die zweifache Kontraktion ∂µ ∂ν F µν automatisch Null ist, entsprechend Gl. (XI.14).
XI.2.3 Lorentz-Kraft und -Kraftdichte
Das elektromagnetische Feld übt auf eine elektrische Ladungs- und Stromverteilung eine LorentzKraftdichte f~L [Gl. (VII.2)] aus. Mit dieser kann man eine Viererkraftdichte fL assoziieren, die sich
durch den elektromagnetischen Feldstärketensor (XI.1) und den elektrischen Viererstrom (XI.10)
ausdrücken lässt. Komponentenweise gilt
fLν (x) = Jel.,µ (x)F µν(x).
(XI.15a)
Mit den Ausdrücken des Feldstärketensors und des Viererstroms prüft man nämlich schnell, dass
die räumlichen Komponenten
fLi (x) = ρel.(x)E i (x) +
3
X
k
ikl jel.
(x)B l (x) für i = 1, 2, 3
(XI.15b)
k,l=1
betragen. Wiederum lautet die zeitliche Komponente
1
~
fL0 (x) = ~el.(x) · E(x).
c
(XI.15c)
Im Fall einer Punktladung q mit Vierergeschwindigkeit u = (γc, γ~v ), entsprechend dem elektrischen Viererstrom (XI.11a), kann die Lorentz-Kraftdichte sofort über die Ortskoordinaten integriert
werden. Daraus ergibt sich die Lorentz-Viererkraft
FLν = quµ F µν(x).
(XI.16)
Mit dieser Viererkraft lautet die relativistisch kovariante Verallgemeinerung (VI.14) des zweiten
Newton’schen Gesetzes
dpν
= quµ F µν(x)
(XI.17)
dτ
mit τ = t/γ der Eigenzeit der Punktladung und p = mu ihrer (kinetischen) Viererimpuls. Dabei
~
~ · ~v : auf der linken Seite
lautet die zeitliche Komponente dp0 /dτ = qγ~v · E/c,
d.h. d(p0 c)/dt = q E
0
steht die Rate der zeitlichen Änderung von der Energie p c der Punktladung; auf der rechten, die
instantane Leistung der Lorentz-Kraft.
Bemerkung: Die Lorentz-Viererkraft (XI.16) ist „orthogonal“ zur Vierergeschwindigkeit, uν FLν = 0.
Dies folgt aus der Antisymmetrie des elektromagnetischen Feldstärketensors und der Symmetrie
des Produkts uν uµ .
XI.2.4 Energie- und Impulsbilanzgleichungen
Schließlich lassen sich die lokalen Bilanzgleichungen (X.23) und (X.26d) für die Energie und den
Impuls des elektromagnetischen Feldes unter Verwendung des Energieimpulstensors (XI.12) und der
Lorentz-Viererkraftdichte (XI.15a) in kompakter Form ausdrücken:
µν
∂µ Te.m.
(x) = −fLν (x).
(XI.18)
XI.3 Weitere Resultate in relativistisch kovarianter Form
199
XI.3 Weitere Resultate in relativistisch kovarianter Form
XI.3.1 Bewegungsgleichung für das Viererpotential
Setzt man den Ausdruck (XI.7) des Feldstärketensors durch das Viererpotential in die inhomogenen Maxwell-Gleichungen (XI.13a) ein, so findet man
µ
∂ν ∂ µAν(x) − ∂ν ∂ νAµ (x) = µ0 Jel.
(x).
Dabei ist ∂ν ∂ ν gerade der d’Alembert-Operator [Gl. (X.10)], so dass diese Gleichung in der Form
µ
Aµ (x) = −µ0 Jel.
(x) + ∂ µ ∂ν Aν (x) ∀µ ∈ {0, 1, 2, 3}
(XI.19)
umgeschrieben werden kann. Dies stellt die Bewegungsgleichung für das Viererpotential A(x) dar.
Die Komponente ν = 0 und ist äquivalent zur Bewegungsgleichungen (X.20) des Skalarpotentials,
die räumlichen Komponenten entsprechend der Gl. (X.18) für das Vektorpotential.
Bemerkung: Aus der Beziehung (XI.7) folgt
1
F̃ µν(x) = µνρσ Fρσ (x) = µνρσ ∂ρ Aσ (x),
2
woraus die homogene Gleichung ∂µ F̃ µν(x) = µνρσ ∂µ ∂ρ Aσ (x) = 0 sofort folgt, da µνρσ antisymmetrisch und ∂µ ∂ρ symmetrisch unter dem Austausch von µ und ρ ist.
XI.3.2 Klassische Wellengleichung und ebene Wellen
In Abwesenheit von äußeren Quellen des Feldes und in der Lorenz-Eichung ∂ν Aν (x) = 0 wird
die Bewegungsgleichung (XI.19) zur klassischen Wellengleichung (vgl. § X.4.1)
Aµ (x) = 0 ∀µ ∈ {0, 1, 2, 3}
(XI.20a)
oder äquivalent, in geometrischer Form
A(x) = 0.
(XI.20b)
Eine ebene Welle ist eine Lösung dieser partiellen Differentialgleichung der Form [vgl. § X.4.1 a]
Aµ (x) = εµ f ~k · ~r − ω~k t
(XI.21a)
wobei ω~k = c ~k [Gl. (X.42c)]. Dabei ist ~k ein Vektor, der die Propagationsrichtung angibt, und εµ
die Komponente eines Polarisationsvierervektors ε. Definiert man einen (lichtartigen) Vierervektor
k = (k 0 ≡ ω~k /c, ~k), so lässt sich diese Lösung als
Aµ (x) = εµ f (k · x)
(XI.21b)
A(x) = εf (k · x).
(XI.21c)
schreiben, oder auch geometrisch
Wegen der Lorenz-Eichbedingung (XI.9) sollen ε und k i Allgemeinen orthogonal zueinander sein,
k · ε = 0. In einem Bezugssystem, wo A0 verschwindet,(54) gilt automatisch ε0 = 0 — woraus man
erkennt, dass der Polarisationsvierervektor raumartig ist, ε2 = εµ εµ > 0. In diesem Bezugssystem
gilt somit k · ε = ~k · ~ε = 0, und man findet die Transversalität des Polarisationsvektors wieder.
(54)
(ar)
Diese Bedingung definiert die temporale Weyl (ar) -Eichung, die hier, kombiniert mit der Lorenz-Eichung ∂µ Aµ = 0,
~ ·A
~ = 0 ist.
äquivalent zur Coulomb-Eichung ∇
H. Weyl, 1885–1955
200
Relativistisch kovariante Formulierung der Elektrodynamik
XI.3.3 Retardiertes Viererpotential
In der Lorenz-Eichung (XI.9) verschwindet der letzte Term der Bewegungsgleichung (XI.19) für
das Viererpotential, die sich somit zu
µ
Aµ (x) = −µ0 Jel.
(x) ∀ν
(XI.22)
vereinfacht.
Wie im § X.5.2 führt die Lösung dieser inhomogenen partiellen Differentialgleichung mithilfe
der retardierten Green’schen Funktion (X.57a) für die klassische Wellengleichung zum retardierten
Viererpotential
Z
1
µ0
|~r − ~r 0 | 0 3 0
d ~r ,
(XI.23)
Aret. (x) =
J
t
−
,~
r
el.
4π |~r − ~r 0 |
c
entsprechend den Gl. (X.63).
Im Fall des elektrischen Viererstroms einer bewegten Punktladung mit Weltlinie xq (t) = t, ~x(t)
ergibt sich das Liénard–Wiechert-Viererpotential
µ0 dxq (tret. )
q
A(x) =
,
(XI.24a)
~vret.
4π
dt
|~r − ~x(tret. )| − [~r − ~x(tret. )] ·
c
mit tret. der retardierten Zeit und ~vret. der entsprechenden Dreiergeschwindigkeit der Punktladung,
vgl. § X.5.4 a.
Man kann eine relativistisch kovariante Form dieses Viererpotentials finden. Sei uret. die Vierer
geschwindigkeit im retardierten Punkt xret. ≡ xq (tret. ) und X ≡ x − xret. = c(t − tret. ), ~r − ~x(tret. ) .
Dann gilt der deutlich kovariante Ausdruck
µ0 c q uret.
A(x) =
.
(XI.24b)
4π X · uret.
Beweis: Im Inertialsystem B0 , das sich zur retardierten Zeit mit der Geschwindigkeit ~vret. bewegt,
d.h. in welchem ~vret. = ~0, vereinfacht sich der Nenner des Viererpotentials (XI.24a) zu
X · uret.
|~r − ~x(tret. )| = c(t − tret. ) =
,
c
wobei die erste Gleichung der Definition der retardierten Zeit entspricht. Die Zeit t in B0 ist die
Eigenzeit τ der Punktladung, so dass dxq (tret. )/dt genau dxq (tret. )/dτ = uret. entspricht. Somit
stimmt Gl. (XI.24a) in B0 mit Gl. (XI.24b) überein. Da die letztere eine Gleichung zwischen
Vierervektoren ist, bleibt sie in jedem Inertialsystem gültig.
2
Literatur zum Kapitel XI
• Feynman, Vorlesungen über Physik. Band 2 [20] = Lectures on Physics. Vol. II [21] Kap. 25,
26 & 31.8
• Fließbach, Elektrodynamik [3] Teil IV Kap. 18 & Teil V Kap. 22
• Greiner, Klassische Elektrodynamik [8] Teil IV Kap. 22.
• Griffiths, Elektrodynamik [9] = Introduction to Electrodynamics [10] Kap. 12.3
• Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 11.9–11.10 &
12.11.
• Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. III
§ 16–18 & 23–25.
• Nolting, Spezielle Relativita?tstheorie, Thermodynamik [27] Erster Teil, Kap. 2.3.
• Scheck, Klassiche Feldtheorie [19] Kap. 2.2.
K APITEL XII
Lagrange-Formulierung der
Elektrodynamik
Die Gesetze der Elektrodynamik — und zwar die Maxwell-Gleichungen und die Form der LorentzKraft — sind dadurch motiviert, dass die daraus folgenden Vorhersagen im Einklang mit experimentellen Ergebnissen sind. Diese Gesetze können aber auch hergeleitet werden, und zwar aus einem
Extremalprinzip: ähnlich wie in Kap. II führt die Forderung, dass eine Wirkung ihr Extremum
für die physikalisch realisierte Konfiguration von Feld und Quellen erreicht, zu Euler–LagrangeGleichungen, die genau die üblichen Bewegungsgleichungen sind. Hiernach wird einem System aus
bewegten Punktladungen — oder allgemeiner aus elektrischen Ladungs- und Stromverteilungen —
und einem elektromagnetischen Feld eine Lagrange-Funktion zugeordnet. Die Letztere besteht aus
drei Beiträgen, die jeweils die freien Ladungen, das freie elektromagnetische Feld und deren Wechselwirkungsterm beschreiben.
XII.1 Ladungen und Ströme in einem elektromagnetischen Feld
Wir betrachten zuerst die Lagrange-Formulierung der Dynamik einer Punktladung, oder allgemeiner
von Punktladungen bzw. von einer Ladungs- und Stromverteilung, in einem nicht-dynamischen
elektromagnetischen Feld.
XII.1.1 Wiederholung: Lagrange-Funktion einer freien Punktladung
Die Lagrange-Funktion eines freien punktförmigen Teilchens der Masse m wurde in früheren
Kapiteln dieser Vorlesung schon diskutiert. Sei ~x(t) bzw. ~v (t) die Position bzw. die Geschwindigkeit
des Teilchens relativ zu einem festen Bezugssystem.
Falls das Teilchen nicht-relativistisch ist (§ II.2.3 a) lautet seine Lagrange-Funktion [Gl. (II.13)]
(n.-r.)
LM
m
t, ~x(t), ~v (t) = ~v (t)2 ,
2
(XII.1a)
wobei das tiefgestellte Kürzel M für Materie steht. Für ein relativistisches Teilchen gilt [§ VI.1.1,
Gl. (VI.3a)]
r
~v (t)2
(rel.)
LM t, ~x(t), ~v (t) = −mc2 1 − 2 .
(XII.1b)
c
Entsprechend diesen Lagrange-Funktionen wird der kanonisch konjugierte Impuls ~p ≡ ∂LM /∂~v
definiert, und zwar
~p = m~v
(XII.2a)
im nicht-relativistischen Fall bzw.
m~v
~p = p
1 − ~v 2/c2
[Gl. (VI.4)] für das relativistische Teilchen.
(XII.2b)
202
Lagrange-Formulierung der Elektrodynamik
Das Integral der Lagrange-Funktion (XII.1) über die Zeit entlang einer Bahn ~x(t) gibt die
zugehörige Wirkung
Z tb
(n.-r.)
SM =
LM
t, ~x(t), ~v (t) dt
(XII.3a)
ta
bzw.
Z
tb
SM =
ta
(rel.)
LM
Z
t, ~x(t), ~v (t) dt = −mc2
τb
dτ,
(XII.3b)
τa
wobei τ die Eigenzeit im des Teilchens bezeichnet.
Die physikalisch realisierte Bahnkurve ergibt sich laut dem Hamilton-Prinzip (II.8) aus der
Extremierung der Wirkung. Dies führt zu den üblichen Euler–Lagrange-Gleichungen (II.9)
∂LM t, ~x(t), ~v (t)
d ∂LM t, ~x(t), ~v (t)
=
,
(XII.4a)
∂~x
dt
∂~v
wobei die Schreibweise mit Ableitungen nach Vektoren eine günstige Notation für
∂LM t, ~x(t), ~v (t)
d ∂LM t, ~x(t), ~v (t)
=
für i = 1, 2, 3,
(XII.4b)
∂xi
dt
∂v i
darstellt. Für die Lagrange-Funktionen (XII.1) ergibt sich einfach
d~p(t) ~
=0
dt
mit ~p dem kanonisch konjugierten Impuls (XII.2).
(XII.5)
XII.1.2 Punktladung in einem äußeren elektromagnetischen Feld
Sei jetzt angenommen, dass sich die Punktladung mit Masse m und elektrischer Ladung q in
einem äußeren, vorgegebenen elektromagnetischen Feld befindet. Das Letztere wird durch Potentiale
~ r) oder äquivalent ein Viererpotential A(t,~r) [Gl. (XI.6)] beschrieben.
Φ(t,~r) und A(t,~
XII.1.2
a Lagrange-Funktion und Wirkung
::::::::::::::::::::::::::::::::::::::::::
Der Beitrag zur Lagrange-Funktion zur Beschreibung der Wechselwirkung zwischen Punktladung
und elektromagnetischem Feld lautet [31]
~ t, ~x(t)
LM+F t, ~x(t), ~v (t) = −qΦ t, ~x(t) + q~v (t) · A
(XII.6a)
oder äquivalent, unter Einführung der Komponenten xµ (t) bzw. Aµ (t,~r) der Weltlinie der Punktladung bzw. des Viererpotentials
dxµ (t) µ
LM+F t, ~x(t), ~v (t) = q
A t, ~x(t) .
dt
(XII.6b)
Dabei steht das Kürzel M+F für die Wechselwirkung zwischen Materie und Feld.
Aus dieser Lagrange-Funktion folgt die Wirkung
Z tb
Z b
Z
µ
SM+F =
LM+F t, ~x(t), ~v (t) dt = q A t, ~x(t) dxµ = q
ta
a
τb
uµ (t)Aµ t, ~x(t) dτ,
(XII.7)
τa
mit uµ (t) den kovarianten Koordinaten der Vierergeschwindigkeit des Teilchens. Diese Wirkung ist
deutlich Lorentz-invariant, wie die Wirkung (XII.3b) des relativistischen freien Teilchens. Dagegen
ist die Lagrange-Funktion (XII.6) nicht Lorentz-invariant.
Die Lagrange-Funktion (XII.6) ist auch nicht invariant unter Eichtransformationen der Potentiale. Unter einer Transformation (X.14) — oder äquivalent (XI.8) für das Viererpotential — ändert
sich die Lagrange-Funktion gemäß
XII.1 Ladungen und Ströme in einem elektromagnetischen Feld
LM+F
203
∂χ t, ~x(t)
0
~
+ ~v (t) · ∇ χ t, ~x(t)
~x(t), ~v (t) → LM+F ~x(t), ~v (t) = LM+F ~x(t), ~v (t) + q
∂t
dχ t, ~x(t)
= LM+F ~x(t), ~v (t) + q
.
dt
Da LM+F und L0M+F nur um eine totale Zeitableitung abweichen, unterscheiden sich die zugehörigen
Wirkungen (XII.7) nur um eine Konstante, die später keine Rolle für die Bewegungsgleichungen
spielt [vgl. Gl. (II.10) und den entsprechenden Beweis]. Daher werden die Bewegungsgleichungen in
§ XII.1.2 c eichinvariant sein.
XII.1.2 b Kanonischer Impuls und Hamilton-Funktion
Der kanonische Impuls der Punktladung im elektromagnetischen Feld folgt aus der üblichen
Definition, angewandt auf die gesamte Lagrange-Funktion L(1) = LM + LM+F :
∂L(1) t, ~x(t), ~v (t)
~ = p~ + q A
~ t, ~x(t) ,
(XII.8)
≡ Π
∂~v
:::::::::::::::::::::::::::::::::::::::::::::::::::::
wobei der erste Term im rechten Glied der Impuls (XII.2) der freien Punktladung ist, entsprechend
deren kinetischen Impuls. Somit sind kanonischer und kinetischer Impuls einer Punktladung in
Anwesenheit eines elektromagnetischen Feldes unterschiedlich.
Die Hamilton-Funktion für eine Punktladung in einem äußeren elektromagnetischen Feld ist
~ · ~v − L(1) .
H≡Π
(XII.9a)
Dies ergibt für ein nicht-relativistisches Teilchen
m~v (t)2
+ qΦ(t,~r)
2
und im allgemeineren Fall einer möglicherweise relativistischen Punktladung
H (n.-r.) =
mc2
H (rel) = p
+ qΦ(t,~r).
1 − ~v (t)2 /c2
(XII.9b)
(XII.9c)
~
Dabei wird die Hamilton-Funktion aber noch nicht durch die kanonisch konjugierten Variablen (~r, Π)
ausgedrückt, wie es für den Hamilton-Formalismus nötig ist.
~ ein, so lautet
Führt man den Vierervektor Π mit kontravarianten Komponenten Πµ ≡ (H/c, Π)
der kinetische Viererimpuls der Punktladung, bestehend aus ihrer Energie und ihrem kinetischen
Impuls, p = Π − q A(x) bzw. komponentenweise pµ = Πµ − qAµ (x).(55) Bildet man den LorentzQuadrat dieser Identität, so kommt
2 1
~ − q A(t,~
~ r) 2 ,
−m2 c2 = pµ pµ = − 2 H − qΦ(t,~r) + Π
c
d.h. nach trivialer Umformung
q ~
~ − q A(t,
~ ~r) 2 + m2 c4 + qΦ(t, ~r).
H(~r, Π) = c2 Π
(XII.10)
~ ausgedrückt.
Nun wird die Hamilton-Funktion durch die Variablen (~r, Π)
XII.1.2
c Bewegungsgleichungen
:::::::::::::::::::::::::::::::::
Kombiniert man die aus der Kettenregel folgende Identität
~ t, ~x(t)
~ t, ~x(t)
dA
∂A
~ A
~ t, ~x(t)
=
+ ~v (t) · ∇
dt
∂t
(55)
Diese Gleichungen zeigen im Nachhinein, dass Π ein wohldefinierter Vierervektor ist.
204
Lagrange-Formulierung der Elektrodynamik
mit der Ableitung
∂L(1) t, ~x(t), ~v (t)
~
~ ~v (t) · A
~ t, ~x(t) ,
= −q ∇Φ(t,
~x) + q ∇
∂~x
so führt die Euler–Lagrange-Gleichung
∂L(1) t, ~x(t), ~v (t)
d ∂L(1) t, ~x(t), ~v (t)
=
∂~x
dt
∂~v
zu
~ t, ~x(t)
∂A
d~p(t)
~
~
~
~
~
=q −
− ~v (t) · ∇ A t, ~x(t) − ∇Φ t, ~x(t) + ∇ ~v (t) · A t, ~x(t) .
dt
∂t
~ × A)
~ = ∇(~
~ v · A)
~ − (~v · ∇)
~ A
~ und den Beziehungen (X.12) und (X.13) ergibt
Aus der Formel ~v × (∇
sich dann die Bewegungsgleichung
h
i
d~p(t)
~ t, ~x(t) + ~v (t) × B
~ t, ~x(t) .
=q E
(XII.11)
dt
Auf der linken Seite steht die Zeitableitung des kinetischen Impulses der Punktladung, auf der
rechten Seite erkennt man die darauf wirkende Lorentz-Kraft: man findet die übliche Bewegungsgleichung wieder.
Bemerkung: Ausgehend aus der Hamilton-Funktion (XII.10) führen die Hamilton-Gleichungen(56)

∂H


= ẋi = v i ,

∂Πi
∂H



= −Π̇i
∂xi
für i = 1, 2, 3
zur gleichen Bewegungsgleichung.
XII.1.3 Ladungs- und Stromverteilungen in einem elektromagnetischen Feld
Die Lagrange-Funktion (XII.6) bzw. die Wirkung (XII.7) lässt sich auf den Fall mehrerer Punktladungen {qa } in einem elektromagnetischen Feld sofort verallgemeinern. Somit gilt
X
X
~ t, ~xa (t)
LM+F t, {~xa (t)}, {~va (t)} = −
qa Φ t, ~xa (t) +
qa~va (t) · A
(XII.12a)
a
=
X
a
a
dxa,µ (t) µ
qa
A t, ~xa (t) .
dt
(XII.12b)
Dabei sind die {~xa (t)} die Bahnkurven der Punktladungen, die {xa,µ (t)} die kovarianten Koordinaten der entsprechenden Weltlinien, und die {~va (t)} ihre Geschwindigkeiten.
Eine Integration über die Zeit liefert die zugehörige Wirkung
Z tb X h
i
~ t, ~xa (t) dt
SM+F = −
qa Φ t, ~xa (t) − ~va (t) · A
(XII.13a)
ta
Z
tb
=
a
X
ta
a
qa
dxa,µ (t) µ
A t, ~xa (t) dt.
dt
Diese Ausdrücke können noch transformiert werden, und zwar in der Form
Z tbZ X
i
h
~ r) d3~r dt.
SM+F = −
qa δ (3) ~r − ~xa (t) Φ(t,~r) − ~va (t) · A(t,~
ta
(56)
R3 a
Die Position der Indizes in diesen Gleichungen ist nicht willkürlich!
(XII.13b)
205
XII.2 Elektromagnetisches Feld mit Quellen
Unter Verwendung der elektrischen Ladungsdichte ρel. und -stromdichte ~el. [Gl. (VII.6)] der Punktladungen ergibt sich dann
SM+F
Z tbZ
=−
ta
h
i
~ r) d3~r dt.
ρel.(t,~r)Φ(t,~r) − ~el.(t,~r) · A(t,~
(XII.14a)
R3
Ausgedrückt durch den aus Gl. (XI.11) folgenden elektrischen Viererstrom Jel. lautet dies noch
Z
SM+F =
Jel.(x) · A(x)
d4 x
,
c
(XII.14b)
wobei d4 x das Vierervolumenelement bezeichnet [Gl. (V.21)], während das Integrationsgebiet nicht
präzisiert wurde.
Diese Ausdrücke der Wirkung — und dabei der Lagrange-Funktion, die als Integrand des Integrals über die Zeit in Gl. (XII.14a) auftaucht — gelten noch für beliebige elektrische Ladungs- und
Stromverteilungen ρel. , ~el. in einem elektromagnetischen Feld.
Man prüft ähnlich wie in § XII.1.2 a nach, dass die Wirkung (XII.14) eichinvariant ist. An der
Gl. (XII.14b) erkennt man auch deren Invarianz unter Lorentz-Transformationen.
Das Integrand Jel.(x) · A(x) ist nämlich ein Lorentz-Skalar, und so ist das Integrationsmaß d4 x.
XII.2 Elektromagnetisches Feld mit Quellen
In diesem Abschnitt werden zuerst Elemente der klassischen Feldtheorie — Lagrange-Dichte, mit
den zugehörigen Euler–Lagrange-Gleichungen, Noether-Theorem. . . — eingeführt (§ XII.2.1). Diese
Ideen werden dann auf das Beispiel des elektromagnetischen Feldes angewandt (§ XII.2.2–XII.2.3).
Hiernach werden die relativistisch kovarianten Notationen durchaus benutzt.
XII.2.1 Einführung in die klassische Feldtheorie
Es seien ϕk (x), k = 1, . . . , N die Komponenten in einem gegebenen Bezugssystem von einem
Feld bzw. von einem System von Feldern auf dem Minkowski-Raum,(57) wobei N von der tensoriellen
Natur des Feldes abhängt: N = 1 für ein einzelnes Skalarfeld, N = 4 für ein Vierervektorfeld, usw.
Die in diesem Paragraph eingeführten Begriffe und Ergebnisse stellen eine Verallgemeinerung
jener des § II.2 auf den Fall einer unendlichen Anzahl von Freiheitsgraden dar.
XII.2.1
a Definitionen
:::::::::::::::::::::
Diesem Feld wird ein Funktional der Komponenten ϕk (x) und deren Ableitungen ∂µ ϕk (x) zugeordnet, die Lagrange-Dichte
L ϕk (x), ∂µ ϕk (x) .
(XII.15a)
Dieses Funktional bestimmt die ganze Dynamik des Feldes. Die entsprechende Lagrange-Funktion
ist durch
Z
L = L ϕk (x), ∂µ ϕk (x) d3~r,
(XII.15b)
gegeben, wobei die Integration auf den ganzen dreidimensionalen Raum durchgeführt wird — wes(57)
Tatsächlich darf man auch Felder auf einem beliebigen Zeitraum betrachten.
206
Lagrange-Formulierung der Elektrodynamik
halb L als Dichte bezeichnet wird. Die resultierende Wirkung lautet
Z
tb
S=
ta
Z
d4 x
L dt = L ϕk (x), ∂µ ϕk (x)
c
(XII.15c)
mit d4 x dem Vierervolumenelement (V.21).
Bemerkungen:
∗ Ist die Lagrange-Dichte eines Systems von Feldern ein Lorentz-Skalar, so ist die resultierende
Wirkung automatisch Lorentz-invariant.
∗ Zwei Lagrange-Dichten L und L 0 , die nur um eine Viererdivergenz 6 · M(x) = ∂µ Mµ (x) abweichen, wobei M ein Vierervektorfeld bezeichnet, führen jeweils zu Wirkungen S und S 0 , die dieselben
Bewegungsgleichungen liefern. Daher sind solche Lagrange-Dichten äquivalent: die Lagrange-Dichte
eines gegebenen Systems von Feldern ist nicht eindeutig.
XII.2.1
b Hamilton-Prinzip. Euler–Lagrange-Gleichungen
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Wie im § II.2.2 gilt das Hamilton-Prinzip, laut welchem die physikalisch realisierte „Konfiguration“ der Felder solche ist, welche die Wirkung extremal macht — wobei die Konfiguration in der
Raumzeit zu betrachten ist, d.h. sie entspricht der Zeitentwicklung einer räumlichen Anordnung.
Betrachtet man die Variation der Wirkung (XII.15c) für eine Variation δϕk des Feldes, so lautet
4
sie
Z ∂L
∂L
d x
δS =
δϕk +
δ∂µ ϕk
,
∂ϕk
∂(∂µ ϕk )
c
wobei über doppelt auftretende Indizes k = 1 . . . N und µ summiert wird.
Da δ∂µ ϕk = ∂µ δϕk , kann der zweite Term im Integranden durch partielle Integration berechnet
werden. Der resultierende integrierte Term verschwindet(58) und es bleibt
Z ∂L
∂L
d4 x
δS =
− ∂µ
δϕk
∂ϕk
∂(∂µ ϕk )
c
übrig.
Die Wirkung ist extremal wenn δS = 0 für beliebige Variationen δϕk , d.h. wenn das Feld und
seine Ableitungen den Euler–Lagrange-Gleichungen
∂L ϕk , ∂ν ϕk
∂L ϕk , ∂ν ϕk
= ∂µ
∂ϕk
∂(∂µ ϕk )
(XII.16)
genügen. Diese stellen die Bewegungsgleichungen des Feldes dar.
XII.2.2 Elektromagnetisches Feld in Anwesenheit fester Quellen
XII.2.2
a Lagrange-Dichte des elektromagnetischen Feldes
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Der Vergleich der Gl. (XII.14b) und (XII.15c) zeigt, dass die Lagrange-Funktion für den Wechselwirkungsterm zwischen einem elektrischen Strom und dem elektromagnetischen Feld als Integral
der Lagrange-Dichte
ν
LM+F ≡ Jel.
(x)Aν (x) = Jel.(x) · A(x)
(XII.17)
betrachtet werden kann.
(58)
An den „Endpunkten“, entsprechend in der Raumzeit einem Oberflächenterm, werden die Felder nicht variiert.
207
XII.2 Elektromagnetisches Feld mit Quellen
In dieser Lagrange-Dichte tritt das elektromagnetische Feld in der Form des Viererpotentials
eher als des Feldstärketensors auf: die relevanten Freiheitsgrade sind also die Komponenten Aν (x).
Dazu kann die Lagrange-Dichte auch Funktion der Ableitungen ∂µ Aν (x) sein.
Die „Standard“-Lagrange-Dichte für das freie elektromagnetische Feld ist
LF [Aν , ∂µ Aν ] = −
i
1
0 h ~
~ ~r)2
Fµν (x)F µν (x) =
E(t, ~r)2 − c2 B(t,
4µ0
2
(XII.18)
mit Fµν (x) den kovarianten Komponenten des elektromagnetischen Feldstärketensors (XI.1).
Bemerkungen:
∗ Da die Lagrange-Dichte (XII.18) des freien elektromagnetischen Feldes nur vom Feldstärketensor
abhängt, ist sie wie dieser eichinvariant.
Im Gegensatz hängt die Lagrange-Dichte (XII.17) für den Wechselwirkungsterm zwischen Feld und
Punktladung von der Eichung ab. Wie oben schon bemerkt wurde ist die entsprechende Wirkung
aber eichinvariant.
∗ Wie immer kann man andere Lagrange-Dichten für das freie elektromagnetische Feld postulieren,
die zu den gleichen Bewegungsgleichungen führen. Daher wird die Wahl (XII.18) oft als Standard
bezeichnet.
XII.2.2 b Bewegungsgleichungen
Ein dynamisches elektromagnetisches Feld in Anwesenheit von festen Quellen lässt sich dann
durch die Lagrange-Dichte L (2) [Aν , ∂µ Aν ] = LF [Aν , ∂µ Aν ] + LM+F [Aν , ∂µ Aν ] beschreiben.
Die entsprechenden Euler–Lagrange-Gleichungen folgen aus
∂LF
∂LM+F
∂LM+F
ν
= 0,
= Jel.
(x),
=0
∂Aν
∂(∂µ Aν )
∂Aν
:::::::::::::::::::::::::::::::::
und
1
∂
1
∂
1
∂LF
=−
Fµν (x)F µν (x) = −
∂µ Aν (x)F µν (x) = − F µν (x).
∂(∂µ Aν )
4µ0 ∂(∂µ Aν )
2µ0 ∂(∂µ Aν )
µ0
Laut Gl. (XII.16) ergibt sich
1
∂µ F µν (x),
µ0
d.h. unter Berücksichtigung der Antisymmetrie des Feldstärketensors (∂µ F µν = −∂ν F µν )
ν
(x) = −
Jel.
µ
∂ν F µν (x) = µ0 Jel.
(x).
(XII.19)
Das heißt, man findet die inhomogenen Maxwell-Gleichungen (XI.13a) wieder, was die Wahl der
Lagrange-Dichte (XII.18) rechtfertigt.(59)
Bemerkung: In der obigen Herleitung der Bewegungsgleichungen wurde angenommen, dass die Komponenten Aν (x) mit ν = 0, 1, 2, 3 unabhängig voneinander sind. Wegen der Eichinvarianz der Elektrodynamik ist dies aber nicht der Fall: das elektromagnetische Feld im Vakuum besitzt nicht vier
Freiheitsgrade, sondern nur zwei — entsprechend den zwei möglichen linearen Polarisationen. Die
Eichinvarianz der Theorie kann später durchgesetzt werden, wie sich am folgenden Beispiel des
Energieimpulstensors beobachten lässt.
XII.2.3 Energieimpulstensor
Aus der Invarianz der Elektrodynamik unter einer beliebigen Translation xµ → x0µ = xµ + aµ
in der Raumzeit folgt die Existenz einer Erhaltungsgröße, des Energieimpulstensors.
(59)
Wie schon in § XI.3.1 bemerkt folgen die homogenen Maxwell-Gleichungen (XI.13b) automatisch aus der Beziehung
Fµν (x) = ∂µ Aν (x) − ∂ν Aµ (x), d.h. sie sind nicht dynamisch.
208
Lagrange-Formulierung der Elektrodynamik
XII.2.3
a Noether-Theorem
::::::::::::::::::::::::::
Betrachten wir wieder die allgemeine Lagrange-Dichte L ϕk (x), ∂µ ϕk (x) des § XII.2.1.
Es wird angenommen, dass die resultierende Wirkung
Z
d4 x
S = L ϕk (x), ∂µ ϕk (x)
(XII.20)
c
Ω
invariant ist unter den gleichzeitigen infinitesimalen Transformationen
xµ → x0µ = xµ + δxµ ,
ϕk (x) →
ϕ0k (x)
= ϕk (x) + δ̃ϕk (x).
(XII.21a)
(XII.21b)
Unter diesen Transformationen ändert sich das vierdimensionale Integrationsvolumen in Gl. (XII.20)
gemäß Ω → Ω0 . Dann lautet die transformierte Wirkung (XII.20)
Z
I
Z
d4 x
d4 x0
d3 σµ
= L ϕ0k (x), ∂µ ϕ0k (x)
+
L ϕ0k (x), ∂µ ϕ0k (x) δxµ
,
S0 =
L ϕ0k (x0 ), ∂µ ϕ0k (x0 )
c
c
c
Ω
∂Ω
Ω0
mit ∂Ω der dreidimensionalen Oberfläche („Hyperfläche“) des Integrationsvolumens Ω und d3 σµ
einem Hyperflächenelement.
Die Taylor-Entwicklung zur ersten Ordnung der rechten Seite dieser Gleichung liefert die Variation der Wirkung
4
Z I
d3 σµ
∂L
d x
∂L
0
S −S =
∂µ δ̃ϕk
+
L δxµ
δ̃ϕk +
∂(∂µ ϕk )
c
c
Ω ∂ϕk
∂Ω
3
Z I 4
∂L
∂L
d x
∂L
µ d σµ
=
− ∂µ
δ̃ϕk
+
δ̃ϕk + L δx
,
∂(∂µ ϕk )
c
c
Ω ∂ϕk
∂Ω ∂(∂µ ϕk )
wobei der Übergang von der ersten zur zweiten Zeile einer partiellen Integration entspricht. In allen
Termen ist das nicht-geschriebene Argument der Lagrange-Dichte [ϕk (x), ∂µ ϕk (x)].
Wegen der Euler–Lagrange-Gleichungen (XII.16) ist das Volumenintegral in der zweiten Zeile
gleich Null. Somit ist die Wirkung nur dann invariant unter der Transformation (XII.21), wenn
das Oberflächenintegral ebenfalls verschwindet. Im Letzteren kann δ̃ϕk (x) durch die Variation des
Feldes
(XII.22)
δϕk ≡ ϕ0k (x0 ) − ϕk (x) ' δ̃ϕk (x) + δxν ∂ νϕk (x)
ausgedrückt werden. Dann gilt
3
I ∂L
ν
µ d σµ
δϕk − δxν ∂ ϕk + L δx
=
c
∂Ω ∂(∂µ ϕk )
3
I d σµ
∂L
∂L
µν
ν
δϕk + η L −
∂ ϕk δxν
= 0.
∂(∂µ ϕk )
c
∂Ω ∂(∂µ ϕk )
Man definiert den (kanonischen) Energieimpulstensor T kan. durch seine Komponenten
∂L
∂ νϕk
∂(∂µ ϕk )
(XII.23a)
∂L
µν
δϕk + Tkan.
δxν ,
∂(∂µ ϕk )
(XII.23b)
µν
Tkan.
≡ η µν L −
sowie den Noether-Strom N mit Komponenten
Nµ ≡
wobei es sich eigentlich um eine Stromdichte handelt. Dann liefert der Satz von Stokes
I
Z
N µ (x) d3 σµ = 0 = ∂µ N µ (x) d4 x.
∂Ω
Ω
(XII.23c)
209
XII.2 Elektromagnetisches Feld mit Quellen
Sei Ω das Volumen zwischen den Hyperflächen t1 = Konstante und t2 = Konstante, entsprechend dem zeitartigen Hyperflächenelement
d3 σµ = (−d3~r, ~0). Wenn die Felder ϕk im räumlichen
R 0
Unendlichen verschwinden, dann ist N (x) d3~r eine Konstante der Bewegung.
Dies gilt insbesondere für jede der vier Komponenten
Z
0ν
ν
(x) d3~r für ν = 0, 1, 2, 3,
P ≡ Tkan.
t
die sich aus dem Einsetzen von δϕk = 0 und δxν = aν — entsprechend der Invarianz der LagrangeDichte unten Translationen in der Raumzeit — in den Ausdruck (XII.23b) des Noether-Stroms
ergeben.
Die Erhaltung der vier Größen P ν stellt einen Sonderfall des Noether-Theorems dar, laut dem
zu jeder kontinuierlichen Gruppe von Transformationen der Felder und Koordinaten, welche die
Wirkung invariant lassen, eine Erhaltungsgröße zugeordnet werden kann.
Bemerkungen:
∗ Die Invarianz der Wirkung unter Translationen der Raumzeit ist nur Teil der nötigen Invarianz
relativistischer Theorien unter allen Elementen [Gl. (V.24)] der Poincaré-Gruppe. Aus der Invarianz
unter Lorentz-Transformationen der Koordinaten folgt die Erhaltung des Tensors dritter Stufe mit
µνρ
µρ
µν
Komponenten M
= xν Tkan.
− xρ Tkan.
— entsprechend einem „verallgemeinerten Drehimpuls“ —,
µν
mit Tkan.
dem kanonischen Energieimpulstensor (XII.23a).
∗ In manchen Büchern wird statt der Invarianz der Wirkung unter den Transformationen (XII.21)
die strengere Invarianz der Lagrange-Dichte erfordert. Diese Bedingung ist aber zu beschränkend und
gilt beispielsweise nicht für die Lagrange-Dichte einer Punktladung in einem elektromagnetischen
Feld! Für eine Diskussion s. Lévy-Leblond [32].
∗ In Analogie zur Mechanik einer endlichen Zahl von Freiheitsgraden ordnet man dem Feld ϕk mit
der Lagrange-Dichte L einen kanonisch konjugierten Impuls
πk ≡
∂L
∂(∂0 ϕk )
(XII.24)
zu. Damit ergibt sich die Hamilton-Dichte
H[πk , ϕk ] = πk ∂0 ϕk − L ,
(XII.25)
dessen Integral über den Raum die Hamilton-Funktion liefert. Aus Gl. (XII.23a) mit η 00 = −1 und
∂ 0 ϕk = −∂0 ϕk folgt die Identität der Hamilton-Dichte mit der 00-Komponente des kanonischen
00 .
Energieimpulstensors, H = Tkan.
XII.2.3
b Elektromagnetischer Energieimpulstensor
::::::::::::::::::::::::::::::::::::::::::::::::::::
Im Vakuum, d.h. in Abwesenheit von Quellen, ist die Wirkung des (freien) elektromagnetischen Feldes invariant unter Raumzeittranslationen. Aus Gl. (XII.23a) und der Standard-LagrangeDichte (XII.18) des freien elektromagnetischen Felds ergibt sich der kanonische Energieimpulstensor
µν
Tkan.
= η µν LF −
∂LF
1
∂ νAρ = η µν LF + F µρ ∂ νAρ ,
∂(∂µ Aρ )
µ0
(XII.26)
der laut den Ergebnissen des vorigen Paragraphen „erhalten“ sein soll:(60) damit Gl. (XII.23c) für
ein beliebiges Ω erfüllt ist, soll
µν
∂µ Tkan.
(x) = 0
(XII.27)
in jedem Punkt x und für jedes ν = 0, 1, 2, 3 gelten.
(60)
Eigentlich ist die zugehörige Noether-Ladung erhalten.
210
Lagrange-Formulierung der Elektrodynamik
Der Tensor (XII.26) ist aber nicht eichinvariant! Ersetzt man Aµ durch A0µ = Aµ + ∂ µ χ, so
µν
0µν
µν
transformiert sich Tkan.
in Tkan.
= Tkan.
+ (1/µ0 )F µρ ∂ ν ∂ρ χ.
Allgemein existieren neben dem kanonischen Tensor (XII.23a) weitere Energieimpulstensoren,
die ebenfalls erhalten sind, und zwar der Art
µν
T µν(x) = Tkan.
(x) + ∂ρ K µρν(x),
wobei K µρν antisymmetrisch in µ und σ ist: K µρν = −K ρµν . Man überprüft einfach
µν
∂µ T µν(x) = ∂µ Tkan.
(x) + ∂µ ∂ρ K µρν(x) = 0,
wobei der zweite Term wegen der Symmetrie von ∂µ ∂ρ und der Antisymmetrie von K µρν Null
ist. Für das elektromagnetische Feld liefert die Wahl K µρν = −(1/µ0 )F µρ Aν einen eichinvarianten
Energieimpulstensor
i
1 h µρ
µν
Te.m.
(x) = η µν LF +
F (x)∂ νAρ (x) − ∂ρ F µρ (x)Aν(x)
µ0
i
1 h µρ
F (x)∂ νAρ (x) − F µρ (x)∂ρ Aν(x) ,
= η µν LF +
µ0
wobei die Maxwell-Gleichung ∂ρ F µρ = 0 in der letzten Gleichung benutzt wurde. Mit dem Ausdruck (XII.18) der Lagrange-Dichte lässt sich dieser Tensor noch als
µν
Te.m.
(x)
1
1 µν
µρ
ν
ρσ
=−
F (x)Fρ (x) + η Fρσ (x)F (x)
µ0
4
(XII.28a)
umschreiben. Somit findet man Gl. (XI.12b) wieder, und die Gleichung
µν
∂µ Te.m.
(x) = 0
(XII.28b)
stellt einen Spezialfall der Bilanzgleichung (XI.18) mit Jel.(x) = 0 dar.
Literatur zum Kapitel XII
• Fließbach, Elektrodynamik [3] Teil IV Kap. 19.
• Greiner, Klassische Elektrodynamik [8] Teil IV Kap. 23.
• Jackson, Klassische Elektrodynamik [11] = Classical Electrodynamics [12] Kap. 12.1, 12.7,
12.10.
• Landau & Lifschitz, Klassische Feldtheorie [14] = The classical theory of fields [26] Kap. 4
§ 27–33.
• Nolting, Spezielle Relativita?tstheorie, Thermodynamik [27] Erster Teil, Kap. 2.4.
• Scheck, Klassiche Feldtheorie [19] Kap. 3.
Anhang
A NHANG A
Tensoren auf einem Vektorraum
In diesem Anhang werden einige Definitionen und Ergebnisse betreffend Tensoren ohne Anspruch
auf mathematische Strenge zusammengestellt. Das Ziel ist, den „modernen“ geometrischen Gesichtspunkt einzuführen. Somit werden Tensoren über ihre Operation auf Vektoren oder Linearformen
definiert, d.h. auf koordinatenunabhängiger Weise (Abschn. A.1), im Gegensatz zur „alten“ Charakterisierung durch ihr Verhalten unter Basistransformationen (Abschn. A.2).
Dabei wird von der Leserin erwartet, dass sie schon einige Grundkenntnisse in Linearalgebra hat,
wie z.B. was Linearität, Linearkombinationen, (multi)lineare Abbildungen, Vektoren, Matrizen. . .
sind. Auf ähnlicher Weise werden Begriffe wie Gruppe, Körper, Abbildung/Funktion. . . ohne weitere
Erklärung benutzt.
Dem durchschnittlichen Physik-Studierenden werden die in Abschn. A.1 eingeführten Begriffe
vielleicht auf erster Sicht unnötig abstrakt erscheinen, während die Formeln des Abschn. A.2
mehr praktischer Natur sind. Dem Autor scheint(61) die hier adoptierte Darstellung die natürlichste zu sein, welche die Existenz von Tensoren „mit Indizes oben oder unten oder sogar beides“
irgendwie erklärt. Und auch wenn der Unterschied anscheinend unwichtig ist für die Physik im
drei-dimensionalen euklidischen Raum der nicht-relativistischen klassischen Mechanik — solange
man in kartesischen Koordinaten arbeitet —, wird er unvermeidbar im relativistischen Kontext,
oder wenn man krummlinige Koordinaten benutzt.
In den Physik-Kapiteln dieses Skripts werden in der Tat nur Tensoren auf reellen Vektorräumen
betrachtet, d.h. der Körper K der Skalaren die Menge R ist; in diesem Anhang wird dies nicht angenommen. Die Einstein’sche Summenkonvention über doppelt auftretende Indizes wird durchgehend
verwendet.
A.1 Vektoren, Linearformen und Tensoren
A.1.1 Vektoren
. . . sind definitionsgemäß die Elemente ~c eines Vektorraums V , d.h. einer Menge mit 1) einer inneren zweistelligen Operation („Vektoraddition“), für welche die Menge eine Abel’sche(as) Gruppe(62)
bildet, und 2) einer äußeren Verknüpfung („Skalarmultiplikation“) mit „Skalaren“ — den Elementen
eines Körpers K —, die assoziativ ist, eine Einheit besitzt, und distributiv bezüglich der Additionen
in V und in K ist.
Sei B = {~ei } eine Basis, d.h. eine Teilmenge von linear unabhängigen Vektoren(63) , welche auch
ein Erzeugendensystem(64) des gesamten Vektorraums V bilden. Jedem Vektor ~c von V werden
(61)
erstaunlicherweise!
Eine Gruppe ist eine Menge mit einer assoziativen zweistelligen inneren Operation, für die es ein Neutralelement
gibt, und derart, dass jedes Gruppenelement ein inverses Element besitzt. Die Gruppe heißt kommutativ oder
abel’sch, wenn die Operation auch kommutativ ist
(63)
. . . d.h. keiner ~ei0 kann als Linearkombination der anderen Basisvektoren ~ei mit i 6= i0 ausgedrückt werden.
(64)
. . . d.h. jeder Vektor von V kann als Linearkombination der Basisvektoren geschrieben werden.
(62)
(as)
N. Abel, 1802–1829
214
Tensoren auf einem Vektorraum
dann Zahlen {ci } des Körpers K eindeutig zugeordnet, seine Koordinaten bezüglich der Basis, die
derart sind, dass
~c = ci~ei .
(A.1)
Ist die Anzahl der Vektoren einer Basis endlich — was dann der Fall aller Basen des Vektorraums
ist — und gleich einer ganzen Zahl D — welche die gleiche für alle Basen ist —, so wird der
Vektorraum V endlich-dimensional genannt und D ist seine Dimension (über K): D = dim V . Wir
werden ab jetzt annehmen, dass die betrachteten Vektorräume endlich-dimensional sind.
A.1.2 Linearformen
. . . auf einem Vektorraum V sind die linearen Abbildungen von V in den zugrundeliegenden
Körper K von Skalaren. Hiernach werden diese Linearformen mit h bezeichnet.
e
Die Menge der Linearformen auf V , mit den „natürlichen“ Addition
und Skalarmultiplikation,
∗
ist selbst ein Vektorraum über K. Dieser wird mit V bezeichnet und heißt Dualraum zu V .
Wenn V endlich-dimensional ist, dann ist es auch der Fall von V ∗ und dim V ∗ = dim V . Gegeben
eine Basis B = {~ei } von V , so kann man die duale Basis B ∗ = {j } auf V ∗ derart definieren, dass
e
j (~ei ) = δij ,
(A.2)
e
wobei δij das übliche Kronecker-Symbol bezeichnet.
Die Komponenten einer Linearform h bezüglich einer gegebenen Basis werden im Folgenden mit
e
{hj } bezeichnet:
h = hj j .
(A.3)
e
e
Bemerkungen:
∗ Die Wahl der Notationen, insbesondere die Position der Indizes, ist nicht unbedeutend! Somit
lässt sich trivial nachprüfen, dass wenn {j } die duale Basis zu {~ei } bezeichnet, gelten
e
i
i
c = (~c)
und
hj = h(~ej ).
(A.4)
e
e
∗ Oft werden die Vektoren von V bzw. die Linearformen von V ∗ „kontravariante Vektoren“ bzw.
„kovariante Vektoren“ oder „Kovektoren“ genannt, und demententsprechend ihre Komponenten als
„kontravariante“ bzw. „kovariante“ Koordinaten bezeichnet.
Die letzteren zwei, betreffend den Komponenten, sind zwar nützliche kurze Bezeichnungen, insbesondere wenn sie sich auf Tensoren beziehen (vgl. unten). Sie sind aber gleichzeitig verwirrend, denn
sie sind nicht unterschiedliche Koordinaten einer einzigen mathematischen Größe, sondern Komponenten von unterschiedlichen Objekten, zwischen denen ein „natürlicher“ Zusammenhang eingeführt
wurde, insbesondere mithilfe eines metrischen Tensors wie in § A.1.4.
∗ Werden die Vektoren von V in Matrixdarstellung mit Spaltenvektoren bezeichnet, so lassen sich
die Linearformen von V ∗ durch Zeilenvektoren darstellen.
A.1.3 Tensoren
A.1.3
a Erste Definitionen und Resultate
:::::::::::::::::::::::::::::::::::::::::
Sei V ein Vektorraum über dem Körper K, und m, n zwei nicht-negative ganze Zahlen.
Definition: Man nennt Tensoren vom Typ m
n auf V die multilinearen Abbildungen, die m Linearformen — Elemente von V ∗ — und n Vektoren — Elemente von V — auf Skalare des Körpers K
abbilden, wobei Linearität bezüglich jedes Arguments gelten soll. Die ganze Zahl m + n heißt Stufe
(oder manchmal Rang, was aber relativ inkorrekt ist) des Tensors.
A.1 Vektoren, Linearformen und Tensoren
215
Schon bekannte Objekte sind Sonderfälle dieser Definition mit entweder m oder n gleich Null:
• die 00 -Tensoren sind einfach die Skalaren des zugrundeliegenden Körpers K;
• die 10 -Tensoren stimmen mit den Vektoren überein;
Genauer sind sie die Elemente des Bidualraums V ∗∗ , die sich im endlich-dimensionalen Fall
mit den Elementen von V dank einem „natürlichen“ Isomorphismus identifizieren lassen.
• die Tensoren vom Typ 01 sind die Linearformen. Allgemeiner werden die n0 -Tensoren auch
n-Multilinearformen genannt.
• Schließlich werden Tensoren vom Typ 20 manchmal — in der älteren Literatur — “Bivektoren”
or “Dyaden” genannt.
In diesem Skript werden Tensoren allgemein mit T bezeichnet, unabhängig von ihrer Stufe, so lange
die letztere weder 0 noch 1 ist.
Bemerkungen:
∗ Tensoren vom Typ
m
n
werden oft als „m-fach kontravariant und n-fach kovariant“ bezeichnet.
∗ Falls sowohl m als n ungleich Null sind, spricht man von einem gemischten Tensor .
0
0
∗ Sei T : (V ∗ )m × (V ∗ )n → K ein Tensor vom Typ m
n und m ≤ m, n ≤ n zwei nicht-negative
0
0
ganze Zahlen. Für jedes m -Tupel von Linearformen {hi } und n -Tupel von Vektoren {~cj } — und
für zugehörige Tupeln von Positionen der Argumente,eobwohl wir hier der Einfachheit halber die
ersten Positionen annehmen — betrachtet man das Objekt
T h1 , . . . , hm0 , · , . . . , · ; ~c1 , . . . , ~cn0 , · , . . . , · ,
e
e
wobei die Punkte „leere“ Argumente bezeichnen. Dieses Objekt bildet m−m0 Linearformen und n−n0
Vektoren auf ein Skalar ab. Anders gesagt induziert der Tensor T
eine multilineare Abbildung(65)
0
0
0
von (V ∗ )m × (V ∗ )n in die Menge der Tensoren vom Typ m−m
.
n−n0
1
Beispielsweise hängen die 1 -Tensoren natürlich mit den linearen Abbildungen von V nach V
zusammen, d.h. wiederum mit den quadratischen Matrizen der Ordnung dim V . Aus diesem Grund
werden solche Tensoren oft als Matrizen dargestellt.
Ein Tensor kann symmetrisch oder antisymmetrisch unter dem Austausch von zwei seiner Argumente sein, wobei diese entweder beide Vektoren oder beide Linearformen sind. Nach einer direkten
Verallgemeinerung kann ein Tensor total symmetrisch — wie z.B. der metrische Tensor, den wir
unten weiter diskutieren werden — oder total antisymmetrisch sein. Ein Beispiel für die letztere
Möglichkeit ist die Determinante (von D D-dimensionalen Vektoren), welche die einzige (bis auf
einem multiplikativen Faktor) total antisymmetrische D-Multilinearform auf einem Vektorraum von
Dimension D ist.
A.1.3
b Operationen auf Tensoren
::::::::::::::::::::::::::::::::::
Versehen mit der Addition und der Skalarmultiplikation, die sich aus den entsprechenden Operationen auf den Körper K induzieren lassen, bilden die Tensoren eines gegebenen Typs auf einem
Vektorraum V selbst einen Vektorraum über K.
Neben diesen zwei Verknüpfungen lassen sich weitere Operationen auf Tensoren definieren, insbesondere das äußere Produkt oder Tensorprodukt — welches zu Tensoren höherer Stufe führt —
und die Kontraktion oder Tensorverjüngung, welche die Stufe reduziert.
(65)
Genauer, so viele solche Abbildungen, wie es unabhängige Kombinationen — unter Betrachtung der möglichen
Symmetrien von T — aus m0 bzw. n0 Linearform bzw. Vektor Argumenten gibt.
216
Tensoren auf einem Vektorraum
m0
Es seien zunächst zwei Tensoren T und T0 von den jeweiligen Typen m
n und n0 . Ihr äußeres
0
T0 ist ein Tensor vom Typ m+m
Produkt T ⊗T
, der für jedes (m+m0 )-Tupel (h1 , . . . , hm , . . . , hm+m0 )
n+n0
e
e
e
von Linearformen und jedes (n + n0 )-Tupel (~c1 , . . . , ~cn , . . . , ~cn+n0 ) von Vektoren die Gleichung
T ⊗ T0 h1 , . . . , hm+m0 ; ~c1 , . . . , ~cn+n0 =
e
e
T h1 , . . . , hm ; ~c1 , . . . , ~cn T0 hm+1 , . . . , hm+m0 ; ~cn+1 , . . . , ~cn+n0
e
e
e
e
erfüllt. Dieses äußere Produkt ist assoziativ und distributiv bezüglich der Addition von Tensoren.
Zum Beispiel ist das äußere Produkt zweier Linearformen h, h0 eine Bilinearform h ⊗ h0 derart,
e Wiederum gibt die
e Tensormule
dass für jedes Paar (~c, ~c 0 ) von Vektoren h⊗h0 (~c, ~c 0 ) = h(~c) h0 (~c 0e) gilt.
e
e
e
e
0
0
0
2
tiplikation zweier Vectoren ~c, ~c einen 0 -Tensor ~c ⊗ ~c , der für jedes Paar (h, h ) von Linearformen
e e
~c ⊗ ~c0 (h, h 0 ) = h(~c) h0 (~c 0 ) erfüllt.
e e vom
e Typ
e m , die sich als Tensorprodukt aus m Vektoren und n Linearformen schreiben
Tensoren
n
lassen, werden manchmal elementare Tensoren genannt.
Sei nun T ein gemischter Tensor vom Typ m
n mit positiven m und n und seien 1 ≤ j ≤ m
und 1 ≤ k ≤ n. In der einfachsten koordinatenunabhängigen Definition der Kontraktion bezüglich
des j-ten Linearform-Arguments und des k-ten vektoriellen Arguments wird T als Summe von
elementaren Tensoren geschrieben. Wird dann in jedem Summanden die k-te Linearform auf den
j-ten Vektor angewandt, was eine Zahl (ein Skalar) gibt, so erhält man eine Summe aus elementaren
Tensoren vom Typ m−1
n−1 , d.h. ein Tensor dieses Typs, welcher das Ergebnis der Verjüngung ist.
Beispiele von Kontraktionen werden hiernach in § A.1.4 nach der Einführung des metrischen
Tensors angegeben.
A.1.3 c Komponenten von Tensoren
Sei {~ei } bzw. {j } eine Basis auf einem Vektorraum V der Dimension D bzw. auf dessen Duale
raum V ∗ — prinzipiell
sind die Basen nicht dual zueinander, in der Praxis wird das aber implizit
fast immer angenommen — und seien m, n zwei nicht-negative ganze Zahlen.
Die Dm+n elementaren Tensoren {~ei1 ⊗ · · · ⊗~eim ⊗ j1 ⊗ · · · ⊗ jn }, wobei jeder Index
ik oder jk jeden
e der Tensoren
e
Wert zwischen 1 und D annimmt, bilden eine Basis
vom Typ m
.
Die
Komponenten
n
i
...i
m
1
T
eines Tensors T bezüglich dieser Basis werden hiernach mit {T
j1 ...jn } bezeichnet:
::::::::::::::::::::::::::::::::::::
T = T i1 ...im j1 ...jn ~ei1 ⊗ · · · ⊗ ~eim ⊗ j1 ⊗ · · · ⊗ jn
e
e
(A.5a)
mit
Ti1 ...im j1 ...jn = T(i1 , . . . , im ;~ej1 , . . . ,~ejn ).
(A.5b)
e
e
Die mögliche Symmetrie oder Antisymmetrie eines Tensors unter dem Austausch zweier Argumente spiegelt sich in der Symmetrie oder Antisymmetrie seiner Komponenten unter dem Austausch
der entsprechenden Indizes wider.
Komponentenweise liefert die Kontraktion von T bezüglich seines j-ten Linearform-Arguments
und seines k-ten vektoriellen Arguments den Tensor mit Komponenten T ...ij−1 ,`,ij+1 ,... ...jk−1 ,`,jk+1 ,... ,
mit Summe über den doppelt auftretenden Index `.
A.1.4 Metrischer Tensor
Nicht-entartete(66) symmetrische Bilinearforme spielen eine wichtige Rolle, denn sie erlauben die
Einführung einer weiteren Struktur auf dem Vektorraum V , indem sie ein inneres Produkt definieren.
hier genauer sein: Bilinearform auf reellen Vektorräumen, Sesquilinearform auf komplexen Vektorräumen.
(66)
Das heißt, für jeden Vektor ~a 6= ~0 kann man einen Vektor ~b finden, der g(~a, ~b) 6= 0 erfüllt. Dies kann auch
äquivalent als Bedingung über die Matrix mit Elementen gij formuliert werden, wie 4 Zeilen unten zu finden ist.
217
A.1 Vektoren, Linearformen und Tensoren
Sei {j } eine Basis des Dualraums V ∗ . Eine Bilinearform g = gij i ⊗ j heißt metrischer Tensor
e
e e
auf V , wenn sie symmetrisch ist — d.h. g(~a, ~b) = g(~b, ~a) für alle Vektoren ~a, ~b, oder äquivalent
gij = gji für alle i, j —, und wenn die quadratische Matrix mit Elementen gij regulär ist. Das Skalar
g(~a, ~b) wird dann auch als ~a · ~b bezeichnet, was insbesondere
gij = g ~ei ,~ej = ~ei · ~ej
(A.6)
ergibt, wobei {~ei } die Basis von V dual zu {j } ist.
e
Da die D × D-Matrix mit Elementen gij regulär ist, kann sie invertiert werden. Die Elemente der
inversen Matrix seien mit g ij bezeichnet: dann gelten
gij g jk = δik und g ij gjk = δki . Die D2 Skalaren
ij
ij
2
g definieren einen Tensor g ~ei ⊗~ej vom Typ 0 , der als inverser metrischer Tensor und mit g−1
bezeichnet wird.
Unter Verwendung eines Satzes über symmetrische Matrizen ist die quadratische Matrix mit
Elementen
gij diagonalisierbar — d.h. man kann eine geeignete Basis {~ei } von V finden, für welche
g ~ei ,~ej = 0 für alle i 6= j gilt. Da g nicht-entartet ist, sind die Eigenwerte nicht Null: auf Kosten
der möglichen
Multiplikation der Basisvektoren {~ei } mit einem Skalar kann man fordern, dass jede
Zahl g ~ei ,~ei gleich entweder +1 oder −1 sei, was die sog. kanonische Form
gij = diag(−1, . . . , −1, 1, . . . , 1)
(A.7)
der Matrixdarstellung der Komponenten des metrischen Tensors ergibt.
In dieser speziellen Basis stimmen die Komponenten g ij von g−1 mit den gij , was aber in einer
beliebigen Basis nicht der Fall ist.
Rolle
von g als Abbildung zwischen Tensoren unterschiedlicher Typen
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Sei ~c = ci~ei ein beliebiger Vektor von V . In Übereinstimmung mit der dritten Bemerkung vom
§ A.1.3 a bildet das Objekt g(~c, · ) die Vektoren von V auf den zugrundeliegenden Körper K ab,
d.h. es entspricht einer Linearform c = cj j , mit Komponenten
e
e
cj = c(~ej ) = g(~c,~ej ) = g(ci~ei ,~ej ) = ci gij .
(A.8a)
e
Das heißt, ein metrischer Tensor g stellt eine Abbildung zwischen Vektoren und Linearformen dar.
Umgekehrt bildet der inverse metrische Tensor g−1 eine Linearformen auf einen Vektor, dessen
Komponenten durch die Beziehungen
ci = g ij cj
(A.8b)
gegeben sind.
Die Zusammenhänge der Gl. (A.8a)–(A.8b) lassen sich auf Tensoren höherer Stufe verallgemeinern: der metrische Tensor und sein Inverser werden dann für das „Herunterstellen
oder Hochstellen
m
von Indizes“ benutzt,
d.h.
für
Operationen,
die
einen
Tensor
vom
Typ
auf
einen
Tensor vom
n
m∓1
jeweiligen Typ n±1 abbilden.
Bemerkungen:
∗ Das Herunterstellen bzw. Hochstellen eines Index entspricht eigentlich dem sukzessiven Durchführen eines äußeren Produkts mit g bzw. g−1 gefolgt durch die Kontraktion zweier Indizes. Zum
Beispiel
~c = ci~ei
äußeres Produkt
Kontraktion
~c ⊗ g = ci gjk ~ei ⊗ j ⊗ k
7−→
c = ci gik k = ck k
e e
e
e
e
wobei die Verjüngung über das erste und zweite Argumente von ~c ⊗ g operiert.
7−→
∗ Die Notation mithilfe eines Punkts des durch den metrischen Tensors induzierten Skalarprodukts
von Vektoren wird oft auf Tensoren verallgemeinert, deren Kontraktion ebenfalls mit einem Punkt
bezeichnet wird. Beispielsweise schreibt man für die Verjüngung einer Bilinearform T und eines
Vektors ~c
T · ~c = T ij i ⊗ j · ck~ek = T ij cj i ,
e e
e
218
Tensoren auf einem Vektorraum
wobei Gl. (A.2) benutzt wurde. Die Notation ist meistens nützlich wenn sie eindeutig ist, d.h. wenn
der Tensor T symmetrisch ist, sodass alle seine Indizes die gleiche Rolle spielen.
Auf ähnlicher Weise, für einen 20 -Tensor T und eine Bilinearform T0
T · T0 = T ij ~ei ⊗ ~ej · T0kl k ⊗ l = T ij T0jl ~ei ⊗ l .
e
e
e
Dies ist unterschiedlich von T0 · T wenn die Tensoren nicht symmetrisch sind.
Die Leserin kann so gar in der Literatur die Notation
T : T0 ≡ T ij T0ji
finden, entsprechend zwei sukzessiven Kontraktionen.
∗ Wichtige Rolle: Struktur eines metrischen Raums
A.1.5 Warum Tensoren?
hier ein kurzes Essay über die Notwendigkeit von Tensoren in der Physik...
A.2 Basistransformation
0
Seien B = {~ei } und B 0 = {~ej 0 } zwei Basen des Vektorraums V , und B ∗ = {i }, B 0∗ = {j } die
e von B mithilfe
e
zugehörigen Dualbasen auf V ∗ . Die Basisvektoren von B 0 lassen sich durch jene
einer regulären Matrix Λ mit Elementen Λi j 0 ausdrücken, gemäß
~ej 0 = Λi j 0~ei .
(A.9)
Bemerkung: Die Matrix Λ ist nicht die Matrixdarstellung eines Tensors, denn die zwei Indizes
seiner Elemente beziehen sich auf zwei unterschiedliche Basen — was mit der Verwendung eines
gestrichenen und eines ungestrichenen
Index betont wird. Im Gegensatz sind beide Komponenten
eines Tensors vom Typ 11 bezüglich der „gleichen“ Basis.(67)
0
Die Elemente der inversen Matrix Λ−1 seien mit Λk i bezeichnet, das heißt
0
0
Λk i Λi j 0 = δjk0
0
und Λi k0 Λk j = δji .
0
Man kann dann einfach nachprüfen, dass die Zahlen Λk i die Basistransformation von B ∗ nach B 0∗
angeben, und zwar
0
0
j = Λj i i .
(A.10)
e
e
Dementsprechend wird jede „Vektor“-Komponente(68) mit Λ−1 transformiert:
0
0
cj = Λj i ci ,
0
0
0
0
T j1 ...jm = Λj1i1 · · · Λjmim T i1 ...im .
(A.11)
Wiederum transformiert sich jede „Linearform“-Komponente(69) mit Λ:
hj 0 = Λi j 0 hi ,
T j10 ...jn0 = Λi1j10 · · · Λinjn0 T i1 ...in .
(A.12)
Somit lassen sich die Komponenten eines beliebigen Tensors in irgendeiner Basis erhalten, wenn
man die Transformationen der (Basis-)Vektoren und Linearformen kennt.
Wichtiges Beispiel von Basistransformation: Drehmatrix
(67)
Genauer beziehen sie sich auf eine Basis und ihre Dualbasis.
Hier ist die Bezeichnung kontravariante Komponente nützlich.
(69)
... oder kovariante Komponente.
(68)
A.2 Basistransformation
219
Literatur zum Anhang A
• Ihr bevorzugtes Lehrbuch zur Linearalgebra.
• Eine ziemlich ausführliche jedoch noch einfache Darstellung mit einem Schwerpunkt auf die
geometrischen Anwendungen der Linearalgebra ist in Postnikov, Lectures in Geometry [34](70)
zu finden, insbesondere in Lectures 1 (Anfang), 4–6 & 18.
(70)
Manchmal werden die verwendeten mathematischen Bezeichnungen, zumindest in der englischen Übersetzung,
relativ nicht Standard, z.B. (linear, bilinear) „functional“ anstatt „form“ oder „conjugate“ (space, basis) statt
„dual“.
A NHANG B
Drehungen
In diesem Anhang wird erstens der Zusammenhang zwischen Isometrien, insbesondere Drehungen,
im euklidischen Raum und orthogonalen Matrizen, die den Gl. (B.3) genügen, präzisiert. Dann werden infinitesimale Drehungen diskutiert, wobei einige Begriffe und Ergebnisse der Gruppentheorie
eingeführt und ohne Beweis verwendet werden.
Der Anhang bezieht sich auf Transformationen in einem dreidimensionalen Raum. Isometrien,
orthogonale Abbildungen, Drehungen, usw. können aber auch in einem D-dimensionalen euklidischen Raum betrachtet werden. Die zugehörige Verallgemeinerung der Ergebnisse des Abschn. B.1
ist trivial, während jene des Abschn. B.2 mehr Arbeit erfordern.
B.1 Isometrien im euklidischen Raum
Definition: Eine lineare Abbildung des dreidimensionalen (affinen) euklidischen Punktraums E 3 in
sich selbst heißt Isometrie, wenn sie den Abstand zwischen zwei Punkten invariant lässt.
Darunter sind z.B. die Translationen sowie Transformationen mit mindestens einem Fixpunkt, wie
die Drehungen oder die Punktspiegelungen.
Die Verkettung zweier Isometrien gibt wieder eine Isometrie. Da die Identitätstransformation in
E 3 selbst eine Isometrie ist, während jede Isometrie bijektiv ist — und somit eine inverse Transformation besitzt, die eine Isometrie ist —, bilden die Menge der Isometrien, versehen mit der
Verkettung, eine Gruppe, die mit ISO(3) bezeichnet wird.
Bemerkung: Statt von Isometrien spricht man auch oft von Bewegungen und dementsprechend von
der Bewegungsgruppe.(71)
Beschränkt man die Diskussion auf die Transformationen mit einem Fixpunkt, der als Ursprungspunkt eines kartesischen Koordinatensystems gewählt wird, so ist eine solche Isometrie äquivalent
zu einer linearen Abbildung O im euklidischen Vektorraum R3 der Form
~x ∈ R3 7→ ~x 0 = O(~x) ∈ R3 ,
(B.1)
die das euklidische Skalarprodukt ~x · ~x invariant lässt, d.h. ~x 0 · ~x 0 = ~x · ~x. Diese Abbildung O wird
orthogonale Transformation genannt.
Da die orthogonalen Transformationen linear sind, können sie in Matrixform dargestellt werden.
Gegeben sei ein System von kartesischen Koordinaten. Ordnet man den Vektoren ~x, ~x 0 von R3 bzw.
der orthogonalen Abbildung O die reellen dreikomponentigen Spaltenvektoren ihrer Komponenten
bzw. eine 3×3-Matrix zu, die ebenfalls mit ~x, ~x 0 bzw. O bezeichnet werden, so lässt sich Gl. (B.1)
als
~x 7→ ~x 0 = O~x
(B.2a)
umschreiben. Unter Verwendung der jeweiligen Koordinaten xi , x0i mit i = 1, 2, 3 der Vektoren und
(71)
Im Rahmen einer Mechanik-Vorlesung könnten diese Bezeichnungen aber verwirrend sein!
221
B.1 Isometrien im euklidischen Raum
der Matrixelemente O ij mit i, j = 1, 2, 3 der Abbildungsmatrix O lautet dies auch
xi 7→ x0i = O ij xj
für i = 1, 2, 3
(B.2b)
wobei die Einstein’sche Summenkonvention benutzt wurde.
In Matrixdarstellung lautet das Skalarprodukt ~xT ~x, mit ~xT dem zu ~x transponierten Zeilenvektor. Damit die Matrix O eine orthogonale Transformation darstellt, muss für jeden ~x ∈ R3
~xT ~x = ~x 0T ~x 0 = (O~x)T O~x = ~xT O TO~x
gelten, d.h. die Matrix muss der Eigenschaft
O T O = 13
(B.3a)
genügen, mit 13 der 3×3-Einheitsmatrix. Alternativ kann man
O T = O −1
(B.3b)
schreiben. Umgekehrt stellt jede Matrix O, die diese Gleichung erfüllt, eine orthogonale Transformation des dreidimensionalen Raums dar.
Eine solche Matrix wird orthogonale 3×3-Matrix genannt. Diese Matrizen bilden eine Gruppe,
die sog. orthogonale Gruppe O(3).
Bemerkungen:
∗ Dank der Beschränkung auf Isometrien vonE 3 mit einem festen Fixpunkt ist die Korrespondenz
zwischen solchen Isometrien und den Matrizen von O(3) bijektiv.
Mathematisch gesagt ist diese Korrespondenz eine sog. lineare Darstellung der Isometrien mit
einem Fixpunkt — d.h. ein Homomorphismus von der Gruppe solcher Isometrien in die Gruppe
GL(V ) der Automorphismen (d.h. der bijektiven linearen Abbildungen) eines Vektorraums V ,
des Darstellungsraums, in sich selbst. Da die O(3)-Matrizen den Automorphismen eines dreidimensionalen Vektorraums (R3 ) entsprechen, ist die Darstellung „vom Grad 3“. Diese wird noch
als unitär bezeichnet, denn die Matrizen der Darstellung sind unitär — sie sind reell und erfüllen
Gl. (B.3). Schließlich ist die Darstellung irreduzibel , weil es keinen nicht-trivialen Unterraum des
Darstellungsraums gibt, der invariant unter der Wirkung der ganzen Gruppe O(3) ist.
∗ In diesem Anhang werden aktive Transformationen der Vektoren betrachtet, entsprechend der
eigentlichen Operation (Drehen. . . ) auf ein Objekt, nicht der Änderung des Gesichtspunkts. Dementsprechend beziehen sich die Komponenten xi , x0i auf zwei unterschiedliche geometrische Vektoren
beobachtet in demselben Koordinatensystem. Somit unterscheidet sich Gl. (B.2b) von der ersten
Beziehung in Gl. (A.11), die den Zusammenhang zwischen Koordinaten eines einzigen Vektoren in
zwei verschiedenen Koordinatensystemen angibt.
Bildet man die Determinante der Gleichung (B.3a), so erhält man (det O)2 = 1, d.h. det O = ±1.
Die Matrizen mit Determinante +1 formen die spezielle orthogonale Gruppe SO(3), deren Elemente,
die Drehmatrizen — die in diesem Skript meistens mit dem Buchstaben R bezeichnet werden —,
die dreidimensionalen Drehungen um den Ursprungspunkt darstellen. Beispielsweise entspricht der
Drehung um einen Winkel θ ∈ R um die x3 -Achse die Drehmatrix


cos θ − sin θ 0
R =  sin θ cos θ 0 .
(B.4)
0
0
1
Wiederum ergeben sich die Isometrien(72) mit Determinante −1 durch Komposition der Drehungen mit der Raumspiegelung ~x 7→ ~x 0 = −~x, d.h. der Punktspiegelung bezüglich des Ursprungspunktes des Koordinatensystems, die der Abbildungsmatrix −13 entspricht.
(72)
Genauer, die durch eine orthogonale Matrix mit Determinante −1 dargestellten Isometrien.
222
Drehungen
Bemerkung: Die Bijektivität der Korrespondenz zwischen Isometrien vonE 3 mit einem festen Fix-
punkt und orthogonalen 3×3-Matrizen wird benutzt, um die letzteren ebenfalls als „Isometrien“ zu
nennen. Dementsprechend werden die Matrizen von SO(3) oft als „Drehungen“ bezeichnet, obwohl
sie eigentlich nur eine der möglichen Matrixdarstellungen der Drehungen sind.
B.2 Infinitesimale Drehungen
Die Resultate dieses Abschnitts werden nirgendwo in der Vorlesung benutzt. Sie lassen sich aber
problemlos nachprüfen, und werden in weiteren Vorlesungen auftauchen.
Eine Drehung um den infinitesimal kleinen Winkel dθ um die j-te Koordinatenachse transformiert einen Vektor ~x von R3 in
~x 0 = R(~x) = ~x + dθ~ej × ~x
(B.5a)
mit ~ej dem Einheitsvektor in Richtung j. Unter Verwendung kartesischer Koordinaten lautet diese
Transformation
(B.5b)
x0k = R kl xl = xk + dθkjl xl = xk − dθjkl xl ,
wobei kjl ≡ δ ki ijl bzw. jkl ≡ δ ki jil , d.h. numerisch kjl = −jkl = −jkl .(73) Nach Identifikation
sind die Elemente der Darstellungsmatrix R durch
R kl = δlk − dθjkl
(B.5c)
gegeben. Die Drehmatrix lässt sich somit als
R = 13 − i dθJj
(B.5d)
umschreiben, wobei Jj eine 3 × 3-Matrix ist, die als Generator oder Erzeuger der Gruppe SO(3)
bezeichnet ist, und deren Matrixelemente
(Jj )kl = −ijkl
sind. In Matrixdarstellung

0
J1 = 0
0
(B.6a)
lauten die drei Generatoren von SO(3)





0 0
0 0 i
0 −i 0
0 −i , J2 =  0 0 0 , J3 =  i 0 0 .
i 0
−i 0 0
0 0 0
Beispielsweise ist die Matrix einer infinitesimalen Drehung

1 −dθ

1
R = 13 − i dθJ3 = dθ
0
0
um die x3 -Achse

0
0 ,
1
(B.6b)
(B.6c)
wobei der letzte Ausdruck auch aus einer Taylor-Entwicklung von Gl. (B.4), mit Winkel dθ statt θ,
bis zur Ordnung O(dθ) folgt.
Die Matrizen (B.6b) besitzen einige wichtigen Eigenschaften. Erstens sind sie offensichtlich hermitesch.(74) Dazu prüft man einfach nach, dass die Generatoren Jj den Vertauschungsrelationen
[Ji , Jj ] = iijk Jk
für alle i, j ∈ {1, 2, 3}
(B.6d)
genügen, wobei die rechteckigen Klammer den Kommutator zweier Matrizen bezeichnet.(75)
(73)
In kartesischen Koordinaten spielt die Stelle der Indizes, oben oder unten, keine Rolle. In einem System beliebiger Koordinaten wird sie aber wichtig; dann sollten die Faktoren δ ki durch die Komponenten g ki des inversen
metrischen Tensors ersetzt werden.
(74)
D.h., die komplex konjugierte Matrix Jj∗ ist gleich der Transponierten JjT .
(75)
[A, B] ≡ AB − BA.
B.2 Infinitesimale Drehungen
223
Allgemein lautet die 3×3-Matrixdarstellung der infinitesimalen Drehung um den Winkel dθ um
die Achse mit Einheitsvektor ~e
R = 13 − i dθ~e ·J~ ,
(B.7)
wobei zu beachten ist, dass das Punktprodukt ~e ·J~ eine 3×3-Matrix bezeichnet.
Eine Drehung um einen beliebigen Winkel θ kann dann als Produkt von N Drehungen um den
Winkel θ/N um die gleiche Achse ausgedrückt werden. Somit erhält man die Exponentialdarstellung
N
θ
~
R = lim 13 − i ~e ·J
= exp −iθ~e ·J~ .
(B.8)
N →∞
N
Bemerkungen:
∗ Die Einführung eines Faktors i in Gl. (B.5d), und entsprechend in die Matrizen Jj Gl. (B.6),
ist zwar überraschend, denn die SO(3)-Matrizen sind reell. Dieser Faktor erlaubt aber eine einfache
Verallgemeinerung auf Gruppen komplexer Matrizen.
∗ Das Minus-Zeichen in Gl. (B.8) — und in den vorigen Gleichungen — gilt für eine aktive Drehung;
für eine passive Drehung, entsprechend einer Basistransformation, kommt ein Plus-Zeichen.
∗ Die Generatoren werden oft mit Tj statt Jj bezeichnet.
A NHANG C
Legendre-Transformation
C.1 Legendre-Transformation einer Funktion einer Variablen
Sei f (x) eine strikt konvexe reelle Funktion einer reellen Variablen x auf einem Definitionsintervall
I, d.h. für alle x1 , x2 ∈ I mit x1 6= x2 und λ ∈ ]0, 1[ gilt
f λx1 + (1 − λ)x2 < λf (x1 ) + (1 − λ)f (x2 ).
Sei zudem angenommen, dass f zweimal stetig differenzierbar ist.
Dann ist die erste Ableitung f 0 streng monoton wachsend und demzufolge die zweite Ableitung
00
f (x) positiv für alle x ∈ I. Die Funktion y auf I definiert durch y(x) ≡ f 0 (x) für alle x ∈ I ist
eine bijektive Abbildung von I nach ihrer Wertemenge J ; daher ist sie invertierbar. Hiernach wird
die Umkehrfunktion als x(y) bezeichnet.
Die Legendre-Transformierte der Funktion f ist eine Funktion g auf J , die für alle y ∈ J durch
g(y) ≡ yx(y) − f x(y)
(C.1)
definiert ist.
Da die Ableitung von g nach der Variablen y gleich x(y) ist, findet man, dass eine zweite
Legendre-Transformation von g genau f gibt. Das heißt, die Legendre-Rücktransformation nimmt
die gleiche Form wie die direkte Transformation an.
Sei h(z) = zy(z) − g y(z) mit z(y) = g 0 (y). Die Anwendung der Kettenregel an Gl. (C.1) gibt
g 0 (y) = x(y) + yx0 (y) − f 0 x(y) x0 (y) = x(y),
d.h. z(y) = x(y). Daher gilt h(x) = xy(x) − g y(x) = f (x), wobei Gl. (C.1) benutzt wurde. 2
Zudem gelten Beziehungen zwischen den Ableitungen von f und g nach ihrer jeweiligen Variablen
ab der zweiten Ordnung, insbesondere
f 00 (x) g 00 y(x) = f 00 x(y) g 00 (y) = 1.
(C.2)
C.2 Legendre-Transformation einer Funktion mehrerer Variablen
Sei jetzt eine Funktion f (x1 , . . . , xn , t1 , . . . , tp ) von n + p reellen Variablen, mit
∂2f
>0
∂xj ∂xk
für alle j, k = 1, . . . n. Für jedes j = 1, . . . , n wird eine Funktion yj durch
yj ({xi }, {tk }) ≡
∂f
({xi }, {tk })
∂xj
definiert, mit xi ({yj }, {tk }) den Umkehrfunktionen, deren Existenz durch die Forderungen an die
zweiten Ableitungen gewährleistet wird.
C.2 Legendre-Transformation einer Funktion mehrerer Variablen
225
Die Legendre-Transformierte g von f bezüglich der Variablen {xi } wird durch
n
X
g(y1 , . . . , yn , t1 , . . . , tp ) ≡
yj xj − f (x1 , . . . , xn , t1 , . . . , tp )
(C.3)
j=1
definiert, wobei die (y1 , . . . , yn , t1 , . . . , tp )-Abhängigkeit der Funktionen xi der Kürze halber nicht
geschrieben wurde. Hier auch ist die Rücktransformation gleich der direkten Transformation, d.h.
eine zweite Legendre-Transformation von g genau f wiedergibt.
Man sieht sofort, dass die ersten Ableitungen von f und g nach tk negativ zueinander sind:
∂f
∂g
({yi }, {tk }) = −
({xi }, {tk })
∂tj
∂tj
(C.4)
Für die zweiten Ableitungen von f und g nach ihren jeweiligen natürlichen Variablen ergeben
sich mehrere Beziehungen
n
X
∂2g
∂2f
δik =
(C.5a)
∂yi ∂yj ∂xj ∂xk
j=1
analog zur Gl. (C.2), sowie
n
X ∂2g
∂2g
∂2f
=
,
∂yi ∂tk
∂yi ∂yj ∂xj ∂tk
∂2g
∂ti ∂tk
=
∂2f
∂ti ∂tk
j=1
n
X
+
j,l=1
∂2f
∂2g
∂2f
.
∂ti ∂xj ∂yj ∂yl ∂xl ∂tk
(C.5b)
(C.5c)
Bemerkung: Manchmal, insbesondere in der Thermodynamik und Statistischen Physik, nennt man
−g die Legendre-Transformierte von f anstatt g.
Literatur zum Anhang C
• Arnold, Mathematical methods of classical mechanics [1] Kap. 3 § 14.
• Nolting, Analytische Mechanik [16] Kap. 2.1.
• Scheck, Mechanik [18] Kap. 2.13–1.14.
A NHANG D
Die δ -Distribution
Physiker verwenden in ihren Modellierungen oft punktförmige Objekte, wie Massenpunkte oder
Punktladungen. Zur Beschreibung solcher Objekte wurde die δ-Distribution eingeführt, die in diesem
Anhang samt ihrer Eigenschaften kurz dargestellt wird.
D.1 Definition und erste Ergebnisse
D.1.1 Definition
Definition: Als Testfunktion auf einem Raum Ω wird eine Funktion T bezeichnet, die einerseits
glatt — d.h. beliebig oft differenzierbar — ist, und andererseits einen kompakten Träger besitzt —
d.h. T verschwindet außerhalb eines beschränkten Gebiets von Ω.
Sei C0∞ (Ω) der Raum der Testfunktionen auf Ω. In diesem und dem folgenden Abschnitt ist
Ω = R, in Abschn. D.3 ist Ω = Rn mit n ≥ 1.
Definition: Die δ-Distribution, auch Dirac-Distribution oder Dirac-δ genannt,(76) ist eine stetige
lineare Abbildung auf C0∞ (R), die einer Testfunktion T ihren Wert T (0) zuordnet.
Für die Operation der δ-Distribution auf eine Testfunktion T existieren mehrere Notationen:
Mathematiker schreiben entweder hδ, T i = T (0) oder, selten, δ[T ] = T (0). Physiker verwenden aber
die (inkorrekte!) Schreibweise
Z
T (x)δ(x) dx = T (0),
(D.1)
wobei das Integrationszeichen ohne Grenzen eine Integration von −∞ bis ∞ bedeuten soll. Diese
Notation wird hiernach weiter motiviert, muss aber mit Vorbehalt genommen werden.
Insbesondere handelt es sich beim Integrationszeichen nicht um ein (Lebesgue-)Integral mit dem
üblichen Integrationsmaß, wie bei der Integration von Funktionen.
Bemerkungen:
∗ Die δ-Distribution ist ein Beispiel von. . . Distribution, d.h. von einem stetigen linearen Funktional
auf einem Raum von Testfunktionen sind, das den üblichen Begriff einer Funktion verallgemeinert —
weshalb Distributionen auch als verallgemeinerte Funktionen bezeichnet werden.
∗ Die Beschränkung auf (Test)Funktionen mit einem kompakten Träger kann aufgehoben werden.
∗ Die mithilfe einer δ-Distribution modellierten physikalischen Größen sind meistens Verteilungen,
die als Gewicht in Integralen dienen, was eine erste Motivation die Schreibweise (D.1) gibt.
Wichtig dabei ist, dass wenn die Variable x eine physikalische Dimension X hat, dann hat δ(x) die
Dimension X−1 , so dass δ(x) dx dimensionslos ist.
(76)
oder noch, fehlerhaft, δ- bzw. Dirac-Funktion, da es sich nicht um eine „Funktion“ handelt.
227
D.1 Definition und erste Ergebnisse
D.1.2 Erste Eigenschaften
Definitionsgemäß ist die δ-Distribution linear, d.h. gegeben zwei beliebige Testfunktionen T1 , T2
und zwei Zahlen λ1 , λ2 , sie erfüllt die Bedingung hδ, λ1 T1 +λ2 T2 i = λ1 hδ, T1 i + λ2 hδ, T2 i, d.h. mit
der Notation der Physiker
Z
Z
Z
λ1 T1 (x) + λ2 T2 (x) δ(x) dx = λ1 T1 (x)δ(x) dx + λ2 T2 (x)δ(x) dx.
(D.2)
Schließlich ist dies noch gleich λ1 T1 (0) + λ2 T2 (0). Diese Eigenschaft ist eine der Motivationen hinter
der Schreibweise (D.1), denn sie gilt für das übliche Integral von Funktionen.
Unter Verwendung der Integralschreibweise sieht auch die folgende Faltungseigenschaft trivial
aus. Sei ξ ∈ R; dann gilt
Z
T (x)δ(x − ξ) dx = T (ξ).
(D.3)
Die unterliegende mathematische Konstruktion ist etwa aufwändig: dabei wird eine translatierte
δ-Distribution δ(ξ) definiert, die auf eine Testfunktion gemäß hδ(ξ) , T i = T (ξ) operiert. Dann
gilt symbolisch hδ(ξ)(x), T (x)i ≡ hδ(x), T (x + ξ)i ≡ hδ(x − ξ), T (x)i, wobei die letzte Gleichung
als Definition von δ(x − ξ) zu betrachten ist.
Wird die „definierende“ Beziehung (D.1) auf T (x) = e−ikx angewandt — wobei es sich natürlich
nicht um eine Testfunktion von C0∞ (R) handelt —, so ergibt sich
Z
e−ikx δ(x) dx = 1.
(D.4a)
Diese Gleichung sieht wie eine Formel für die Fourier-Transformation der δ-Distribution aus, und
die entsprechende Rücktransformation lautet
Z
dk
δ(x) = eikx
.
(D.4b)
2π
Diese Formel stellt die sog. Fourier-Darstellung der δ-Distribution dar.
Wieder lassen sich diese Ergebnisse mathematisch korrekt begründen, indem die herkömmliche
Fourier-Transformation auf Distributionen verallgemeinert wird.
D.1.3 Darstellungen der δ -Distribution
Die δ-Distribution lässt sich als Grenzwert einer Funktionenfolge darstellen, d.h. symbolisch
δ(x) = lim δε (x)
ε→0
(D.5a)
mit δε eine (integrierbare) Funktion im üblichen Sinn, die von einem reellen Parameter ε > 0
kontinuierlich abhängt. Dabei bedeutet der obige Grenzwert
Z
Z
f (x)δ(x) dx = lim f (x)δε (x) dx
(D.5b)
ε→0
für jede Funktion f mit bestimmten Eigenschaften — z.B. jede Testfunktion von C0∞ (R).(77) Dann
bilden die Funktionen δε eine Darstellung der δ-Distribution.
Da δε eine Funktion ist, ist das Integral auf der rechten Seite von Gl. (D.5b) ein übliches
(Lebesgue)-Integral. Somit wird das Verwenden der Integralnotation für die Operation auf f
der δ-Distribution, auf der linken Seite von Gl. (D.5b), weiter motiviert.
(77)
Je nach der gewählten Klasse von Funktionen f können die Funktionen δε eine passende Darstellung bilden oder
nicht.
Die δ -Distribution
228
Die Funktionen δε werden oft so gewählt, dass sie die folgenden Eigenschaften haben:
• sie haben einen Peak bei x = 0, der mit abnehmenden ε schmaler und höher wird;
• für jeden x 6= 0 gilt lim δε (x) = 0;
ε→0
Z
• δε (x) dx = 1.
Die Leserin kann nachprüfen, dass die hiernach angegebenen Beispiele diese Eigenschaften erfüllen.
D.1.3
a Skalierte Rechteckfunktionen
:::::::::::::::::::::::::::::::::::::
Eine einfache Darstellung, jedoch durch unstetige Funktionen, ist

 1 für |x| < ε
δε (x) = 2ε

0 für |x| > ε.
D.1.3
b Skalierte Dreieckfunktionen
::::::::::::::::::::::::::::::::::::
Eine stetige, aber nicht überall differenzierbare Darstellung, ist

 ε − |x| für |x| ≤ ε
ε2
δε (x) =

0
für |x| > ε.
(D.6)
(D.7)
D.1.3
c Exponentialfunktionen
:::::::::::::::::::::::::::::::
Ebenfalls nicht überall differenzierbar — diesmal liegt das Problem in x = 0 — ist die Darstellung
durch Exponentialfunktionen
1 −|x|/ε
δε (x) =
e
.
(D.8)
2ε
D.1.3
d Gaußsche Verteilungen
:::::::::::::::::::::::::::::::
Gaußsche Verteilungen liefern eine unendlich differenzierbare Darstellung:
1
2
2
δε (x) = √ e−x /2ε .
ε 2π
(D.9)
D.1.3
e Lorentz-Verteilungen
:::::::::::::::::::::::::::::
Mithilfe von Lorentz-Verteilungen ergibt sich die Darstellung:
δε (x) =
1
ε
1
1
= Im
.
2
2
π x +ε
π
x − iε
(D.10)
D.1.3
f Kardinalsinus
:::::::::::::::::::::
Ebenfalls nützlich ist die Darstellung

sin(x/ε)


πx
δε (x) =
1


πε
für x 6= 0
(D.11)
für x = 0,
wobei die Definition des Zahlenwerts in x = 0 die Stetigkeit der Funktion δε gewährleistet. Für
x 6= 0 gilt nämlich
Z 1/ε
dk
δε (x) =
eikx
,
2π
−1/ε
und der Limes → 0 gibt die Fourier-Darstellung (D.4b) wieder.
229
D.2 Rechenregeln
D.1.4 Heaviside-Funktion
Definition: Die Heaviside- oder Stufenfunktion wird durch
Θ(x) =

1 für x > 0
(D.12)
0 für x < 0
definiert, wobei ihr Wert für x = 0 irrelevant ist.
Für diese Funktion kann man, genau wie für die δ-Distribution, Darstellungen Θε finden, mit
Θ(x) = lim Θε (x)
(D.13a)
ε→0
oder genauer
Z
lim
∞
ε→0 −∞
Z
∞
Z
∞
f (x) dx
f (x)Θ(x) dx =
f (x)Θε (x) dx =
−∞
(D.13b)
0
für jede passende Funktion f , wobei die zweite Gleichung aus der Definition der Heaviside-Funktion
folgt.
Dann liefert die Ableitung jeder (differenzierbaren!) Darstellung Θε der Heaviside-Funktion eine
Darstellung δε der δ-Distribution: symbolisch schreibt man Θ0ε = δε oder noch
Θ0 (x) = δ(x).
(D.14)
Dabei handelt es sich um eine Ableitung „im Sinne der Distributionen“.
Beispiele von Darstellungen der Heaviside-Funktion sind

0
für x < −ε



x+ε
Θε (x) =
für |x| ≤ ε


 2ε
1
für x > ε,
entsprechend der Darstellung (D.6) der δ-Distribution, oder
x
1 1
,
Θε (x) = + arctan
2 π
ε
(D.15)
(D.16)
deren Ableitung die Darstellung (D.10) der δ-Distribution wiedergibt.
D.2 Rechenregeln
Neben den schon in § D.1.2 angegebenen Eigenschaften gelten noch weitere, die hiernach ohne
Beweis(78) aufgelistet werden.
D.2.1 Skalierung
Sei a ∈ R (oder allgemeiner a ∈ C); dann gilt eine Skalierungseigenschaft, die sich symbolisch
als
δ(ax) =
1
δ(x)
|a|
(D.17a)
schreiben lässt, was eigentlich
Z
T (x)δ(ax) dx =
1
T (0),
|a|
(D.17b)
für jede Testfunktion T bedeutet.
(78)
Die interessierte Leserin kann die verschiedenen Gleichungen relativ leicht prüfen, indem sie die δ-Distribution als
Grenzwert einer Darstellung schreibt.
Die δ -Distribution
230
Für eine Darstellung δε folgt die entsprechende Gleichung einfach aus einer Substitution der
Integrationsvariablen.
Insbesondere gilt für a = −1
δ(−x) = δ(x),
(D.18)
d.h. die δ-Distribution ist gerade.
D.2.2 Ableitung
Man definiert eine Distribution δ 0 , die sich bezüglich der δ-Distribution wie die Ableitung f 0
bezüglich einer (Stamm)Funktion f verhält.
Dann gilt für jede Testfunktion T
Z
T (x)δ 0 (x) dx = −T 0 (0).
(D.19)
Nimmt man die Integralschreibweise ernst und führt man eine partielle Integration durch, so
ergibt sich
Z
Z
h
i∞
− T 0 (x)δ(x) dx,
T (x)δ 0 (x) dx = T (x)δ(x)
−∞
woraus das gesuchte Ergebnis „folgt“, denn T verschwindet im Unendlichen.
Auf ähnlicher Weise wird eine zweite Ableitung δ 00 definiert, für die
Z
T (x)δ 00 (x) dx = T 00 (0)
2
(D.20)
gilt, und so weiter für die höheren Ableitungen.
D.2.3 Substitution der Integrationsvariablen
Sei f eine differenzierbare reelle Funktion auf R, mit einer einzigen Nullstelle in x0 : f (x0 ) = 0,
wo ihre Ableitung nicht Null ist, f 0 (x0 ) 6= 0. Dann gilt für die Verkettung von der δ-Distribution
mit f
1
δ f (x) = 0
δ(x − x0 ),
(D.21a)
|f (x0 )|
entsprechend für jede Testfunktion T
Z
Z
1
1
T (x)δ(x − x0 ) dx = 0
T (x0 ).
(D.21b)
T (x)δ f (x) dx = 0
|f (x0 )|
|f (x0 )|
Dank den Annahmen über f gilt in der Nachbarschaft von x0
f (x) ∼ f (x0 ) + f 0 (x0 )(x − x0 ) + O (x − x0 )2 = f 0 (x0 )(x − x0 ) + O (x − x0 )2 .
Das Ergebnis folgt dann aus der Skalierungseigenschaft (D.17).
2
Für eine Funktion f mit mehreren Nullstellen xi , in denen die Ableitung f 0 nicht verschwindet,
gilt die Verallgemeinerung
δ f (x) =
X
Nullstellen xi
1
|f 0 (x
i )|
δ(x − xi ).
(D.22)
Beispiel 1: Sei f (x) = arctan x, mit einer einzigen Nullstelle in x0 = 0, während die Ableitung
f 0 (x) = 1/(1 + x2 ) nirgendwo verschwindet. Da f 0 (0) = 1 lautet wird Gl. (D.21a) zu
δ(arctan x) = δ(x).
D.3 Mehrdimensionale δ -Distributionen
231
Beispiel 2: Sei f (x) = x2 − a2 mit a ∈ R+ ; f hat zwei Nullstellen in −a und a. Aus f 0 (x) = 2x
folgen f 0 (−a) = −2a, f 0 (a) = 2a, und somit |f 0 (−a)| = |f 0 (a)| = 2a. Somit ergibt Gl. (D.22)
1
δ(x2 − a2 ) =
δ(x − a) + δ(x + a) .
(D.23)
2a
Bemerkung: Falls eine Funktion f eine Nullstelle x0 mit f 0 (x0 ) = 0 hat, kann man die Funktion oft
leicht „verformen“, um statt nur x0 zwei (oder mehr) Nullstellen zu erhalten, in denen die Ableitung
nicht verschwindet.
Beispielsweise würde man δ(x2 ) durch δ(x2 − η) ersetzen, den letzteren Ausdruck mithilfe der
Gl. (D.23) umschreiben, die daraus folgenden Berechnungen durchführen, und schließlich den Limes
η → 0 betrachten. . . und hoffen, dass das Ergebnis sinnvoll ist!
D.3 Mehrdimensionale δ -Distributionen
Seien x1 , x2 , . . . , xn unabhängige Variablen, die in einen n-dimensionalen Vektor x zusammengefasst
werden. Betrachtet man Testfunktionen T (x) dieser n-Variablen, so kann man eine n-dimensionale
δ-Distribution, die oft mit δ (n) bezeichnet wird, gemäß
Z
(D.24)
T (x)δ (n)(x) dn x = T (0),
wobei das Integral über Rn ist. Anders gesagt gilt
δ
(n)
1
n
(x) = δ(x ) · · · δ(x ) =
n
Y
δ(xk ).
(D.25)
k=1
Die für die eindimensionale δ-Distribution angegebenen Eigenschaften lassen sich einfach auf
δ (n) verallgemeinern. Beispielsweise gelten die Faltungseigenschaft
Z
(D.26)
T (x)δ (n)(x − ξ) dn x = T (ξ),
wobei ξ ∈ Rn , sowie die Fourier-Darstellung
δ
(n)
Z
(x) =
eik·x
dn k
(2π)n
(D.27)
mit k · x dem euklidischen Skalarprodukt k 1 x1 + · · · + k n xn .
Die Skalierungseigenschaft lautet jetzt
δ (n)(ax) =
1 (n)
δ (x)
|a|n
(D.28)
für a ∈ R, und kann erweitert werden: wenn A eine invertierbare n×n-Matrix ist, dann ist
δ (n)(A x) =
1
δ (n)(x).
| det A |
(D.29)
Ähnlich gilt im Fall einer Variablenänderung (x1 , . . . , xn ) → (y 1 , . . . , y n ) bzw. x → y
δ (n)(y) =
1
δ (n)(x)
| det J|
(D.30)
mit J der Jacobi-Matrix der Substitution, mit Elementen ∂y i /∂xj . Aus dieser letzten Gleichung
lässt sich die Verallgemeinerung der Formel (D.22) ableiten.
232
Literatur zum Anhang D
• Gelfand & Shilov, Verallgemeinerte Funktionen. Band 1 [35], Kap. I.
• Schwartz, Mathematische Methoden der Physik. Band 1 [36], Kap. II.
Die δ -Distribution
A NHANG E
Kugelflächenfunktionen
Betrachte man (zweimal kontinuierlich differenzierbare) Funktionen auf der Einheitskugelfläche S2
von R3 , d.h. Funktionen des Polarwinkels θ ∈ [0, π] und des Azimutwinkels ϕ ∈ [0, 2π].
Unter diesen Funktionen lassen sich sog. Kugelflächenfunktionen Y`m (θ, ϕ) ∈ C mit ` = 0, 1, . . .
einer beliebigen ganzen Zahl und m ∈ {−`, −` + 1, . . . , 0, . . . , `} mit folgenden Eigenschaften finden:
• Die Kugelflächenfunktionen sind gleichzeitige Eigenfunktionen der zwei hiernach über ihre
~ˆ2
Operation auf eine zweimal differenzierbare Funktion f definierten Differentialoperatoren L
und L̂3
−1 ∂
∂f (θ, ϕ)
1 ∂ 2f (θ, ϕ)
ˆ2
~
L f (θ, ϕ) ≡
sin θ
−
(E.1a)
sin θ ∂θ
∂θ
sin2 θ ∂ϕ2
und
L̂3 f (θ, ϕ) ≡ −i
∂f (θ, ϕ)
.
∂ϕ
(E.1b)
Genauer gelten
~ˆ2 Y`m (θ, ϕ) = `(` + 1)Y`m (θ, ϕ) und L̂3 Y`m (θ, ϕ) = mY`m (θ, ϕ).
L
• Die Kugelflächenfunktionen genügen der Beziehung
Z π Z 2π
∗
Y`m (θ, ϕ) Y`0 m0 (θ, ϕ) dϕ sin θ dθ = δ``0 δmm0 .
0
(E.2)
(E.3)
0
• Jede zweimal kontinuierlich differenzierbare Funktion f auf S2 lässt sich als Summe
f (θ, ϕ) =
∞ X
`
X
a`m Y`m (θ, ϕ)
(E.4a)
`=0 m=−`
von Kugelflächenfunktionen schreiben, wobei die Koeffizienten a`m eindeutig durch
Z π Z 2π
∗
a`m =
Y`m (θ, ϕ) f (θ, ϕ) dϕ sin θ dθ
0
(E.4b)
0
gegeben sind.
Diese Eigenschaften werden beispielsweise durch die folgenden Funktionen erfüllt: für ` = 0
1
Y00 (θ, ϕ) = √ ;
4π
(E.5a)
für ` = 1
r
3
cos θ
4π
r
3
Y1±1 (θ, ϕ) = ∓
sin θ e±iϕ ;
8π
Y10 (θ, ϕ) =
(E.5b)
(E.5c)
234
Kugelflächenfunktionen
für ` = 2
r
5
(cos2 θ − 1)
16π
r
15
Y2±1 (θ, ϕ) = ∓
sin θ cos θ e±iϕ
8π
r
15
Y2±2 (θ, ϕ) =
sin2 θ e±2iϕ ;
32π
Y20 (θ, ϕ) =
(E.5d)
(E.5e)
(E.5f)
usw.
Bemerkungen:
~ˆ2 ist in der Tat der Winkelanteil des Laplace-Operators in Kugelkoor∗ Der Differentialoperator L
dinaten (r, θ, ϕ):
~ˆ2 f (~r)
L
1 ∂2 4f (~r) =
rf
(~
r)
−
(E.6)
r ∂r2
r2
∗ Die dritte Eigenschaft [Gl. (E.4)] bedeutet, dass die Kugelflächenfunktionen eine (Hilbert-)Basis
des Raums der zweimal kontinuierlich differenzierbaren Funktionen auf S2 bilden. Die Koeffizienten
a`m sind dann die Komponenten einer Funktion f auf dieser Basis.
∗ Führt man eine Abbildung über Funktionen auf S2
Z π Z 2π
∗
(f, g) 7→ hf, gi ≡
f (θ, ϕ) g(θ, ϕ) dϕ sin θ dθ
0
0
ein, so ist diese eine hermitesche Sesquilinearform,(79) die ein Skalarprodukt auf dem Raum der
Funktionen definiert. Dann ist die Basis der {Y`m } laut Gl. (E.3) eine Orthonormalbasis für dieses Skalarprodukt. Einerseits sind unterschiedliche Kugelflächenfunktionen orthogonal zueinander
(hY`m , Y`0 m0 i = 0 falls ` 6= `0 und m 6= m0 ); andererseits ist jede Y`m auf 1 normiert (hY`m , Y`m i = 1).
∗ Manchmal werden reellwertige Kugelflächenfunktionen√anstatt komplexwertiger
√ Funktionen definiert. Diese reellen Varianten — wie z.B. (Y11 + Y1−1 )/ 2 oder (Y11 − Y1−1 )/ 2 — bilden noch
~ˆ2 ; sie sind aber nicht mehr Eigeneine Orthonormalbasis und sind Eigenfunktionen zum Operator L
funktionen zu L̂3 .
(79)
D.h. die Abbildung h · , · i erfüllt für alle Funktionen f , g, h die Bedingungen i. hf, f i ≥ 0; ii. hf, f i = 0 nur für
f = 0; iii. hf, gi = hg, f i∗ ; iv. hf, λg + µhi = λ hf, gi + µ hf, hi für alle λ, µ ∈ C.
Literaturverzeichnis
[1] V. I. Arnold, Mathematical methods of classical mechanics, 2nd Aufl. (Springer, New York,
1989).
[2] T. Fließbach, Lehrbuch zur theoretischen Physik I. Mechanik , 7. Aufl. (Springer-Verlag, Berlin
& Heidelberg, 2015).
[3] T. Fließbach, Lehrbuch zur theoretischen Physik II. Elektrodynamik , 6. Aufl. (Springer-Verlag,
Berlin & Heidelberg, 2012).
[4] H. Goldstein, C. Poole, J. Safko, Classical mechanics, 3. Aufl. (Wiley-VCH, Weinheim, 2012).
[5] H. Goldstein, C. Poole, J. Safko, Classical mechanics, 3rd Aufl. (Addison-Wesley, Reading,
MA, 2001).
[6] W. Greiner, Klassische Mechanik I , 8. Aufl. (Harri Deutsch, Frankfurt am Main, 2007).
[7] W. Greiner, Klassische Mechanik II , 8. Aufl. (Harri Deutsch, Frankfurt am Main, 2008).
[8] W. Greiner, Klassische Elektrodynamik , 7. Aufl. (Harri Deutsch, Frankfurt am Main, 2008).
[9] D. J. Griffiths, Elektrodynamik , 3. Aufl. (Pearson, München, 2011).
[10] D. J. Griffiths, Introduction to Electrodynamics, 3rd Aufl. (Prentice-Hall, Upper Suddle River,
NJ, 1999).
[11] J. D. Jackson, Klassische Elektrodynamik , 4. Aufl. (de Gruyter, Berlin, 2013).
[12] J. D. Jackson, Classical electrodynamics, 3. Aufl. (John Wiley & Sons, New York, 1999).
[13] L. Landau, E. Lifschitz, Lehrbuch der theoretischen Physik. Band I : Mechanik , 14. Aufl. (Harri
Deutsch, Frankfurt am Main, 1997).
[14] L. Landau, E. Lifschitz, Lehrbuch der theoretischen Physik. Band II : Klassische Feldtheorie,
12. Aufl. (Harri Deutsch, Frankfurt am Main, 1997).
[15] W. Nolting, Grundkurs Theoretische Physik. Band 1 : Klassische Mechanik , 8. Aufl. (Springer,
Berlin & Heidelberg, 2006).
[16] W. Nolting, Grundkurs Theoretische Physik. Band 2 : Analytische Mechanik , 7. Aufl. (Springer,
Berlin & Heidelberg, 2006).
[17] W. Nolting, Grundkurs Theoretische Physik. Band 3 : Elektrodynamik , 8. Aufl. (Springer, Berlin & Heidelberg, 2007).
[18] F. Scheck, Theoretische Physik 1 : Mechanik , 8. Aufl. (Springer, Berlin & Heidelberg, 2007).
[19] F. Scheck, Theoretische Physik 3 : Klassische Feldtheorie, 2. Aufl. (Springer, Berlin & Heidelberg, 2006).
236
Literaturverzeichnis
[20] R. P. Feynman, R. B. Leighton, M. Sands, Feynman-Vorlesungen über Physik. Band 2 : Elektromagnetismus und Struktur der Materie, 5. Aufl. (Oldenbourg Wissenschaftsverlag, München,
2007).
[21] R. P. Feynman, R. B. Leighton, M. Sands, The Feynman Lectures on Physics. Volume II :
Mainly Electromagnetism and Matter , definitive Aufl. (Addison-Wesley, Reading, MA, 2005).
[22] R. P. Feynman, R. B. Leighton, M. Sands, Feynman-Vorlesungen über Physik. Band 1 : Mechanik, Strahlung, Wärme, 5. Aufl. (Oldenbourg Wissenschaftsverlag, München, 2007).
[23] R. P. Feynman, R. B. Leighton, M. Sands, The Feynman Lectures on Physics. Volume I : Mainly Mechanics, Radiation, and Heat, definitive Aufl. (Addison-Wesley, Reading, MA, 2005).
[24] L. Landau, E. Lifshitz, Course of Theoretical Physics. Vol. 1 : Mechanics, 3rd Aufl.
(Butterworth-Heinemann, Oxford, 1976).
[25] A. Einstein, Ann. Phys. (Leipzig) 17 (1905) 891–921.
[26] L. Landau, E. Lifschitz, Course of Theoretical Physics. Vol. 2 : The classical theory of fields,
4th Aufl. (Butterworth-Heinemann, Oxford, 1975).
[27] W. Nolting, Grundkurs Theoretische Physik. Band 4 : Spezielle Relativitätstheorie. Thermodynamik , 6. Aufl. (Springer, Berlin & Heidelberg, 2005).
[28] D. Petrascheck, Eur. J. Phys. 37 (2016) 015201.
[29] P. Aichelburg, R. Beig, Ann. Phys. (NY) 98 (1976) 264–283.
[30] J. A. Wheeler, R. P. Feynman, Rev. Mod. Phys. 17 (1945) 157–181.
[31] K. Schwarzschild, Nachr. Ges. Wiss. Göttingen (1903) 126–131.
[32] J.-M. Lévy-Leblond, Am. J. Phys. 39 (1971) 502–506.
[33] J. Schwinger, L. L. DeRaad, Jr., K. A. Milton, W.-y. Tsai, Classical electrodynamics (Perseus,
Reading, MA, 1998).
[34] M. Postnikov, Lectures in Geometry. Semester II : Linear Algebra and Differential Geometry
(Mir Publishers, Moscow, 1982).
[35] I. M. Gelfand, G. E. Shilov, Verallgemeinerte Funktionen (Distributionen) Band 1 , Band 47
von Hochschulbücher für Mathematik , 2. Aufl. (Deutscher Verlag der Wissenschaft, Berlin,
1967).
[36] L. Schwartz, Mathematische Methoden der Physik. Band 1 (Bibliographisches Institut, Mannheim, 1974).
Zugehörige Unterlagen
Herunterladen