Analytische Mechanik - komet 337

Werbung
Analytische Mechanik
Prof. Dr. Peter van Dongen
WS 2009/10
Institut für Physik
Staudingerweg 7, 55128 Mainz
c
Copyright 2004
Peter van Dongen, Mainz, Germany
letzte Aktualisierung: 5. Februar 2010
Inhaltsverzeichnis
Vorwort
1
1 Spezielle Relativitätstheorie
1.1 Erste Konsequenzen der Postulate . . . . . . . . . . . . .
1.2 Der Abstand und die Eigenzeit . . . . . . . . . . . . . .
1.3 4-Schreibweise und Lorentz-Transformationen . . . . . . . .
1.3.1 Poincaré- und Lorentz-Transformationen . . . . . . .
1.4 Physikalische Konsequenzen der Lorentz-Invarianz . . . . . .
1.5 4-Vektoren . . . . . . . . . . . . . . . . . . . . . . .
1.6 Masse und Energie . . . . . . . . . . . . . . . . . . . .
1.7 Die Lorentz-Kraft und elektromagnetische Felder . . . . . .
2
4
6
10
12
13
16
21
23
2 Lagrange-Formalismus
2.1 Die Newton’sche Mechanik . . . . . . . . . . . . . . . .
2.2 Die Lagrange-Funktion . . . . . . . . . . . . . . . . . .
2.3 Das Hamilton’sche Extremalprinzip . . . . . . . . . . . . .
2.3.1 Einfache Beispiele aus der Variationsrechnung . . . .
2.4 Invarianzen der Lagrange-Gleichung . . . . . . . . . . . .
2.4.1 Addition einer vollständigen Zeitableitung . . . . . .
2.4.2 Galilei-Invarianz . . . . . . . . . . . . . . . . . .
2.4.3 Eichinvarianz . . . . . . . . . . . . . . . . . . .
2.4.4 Invarianz unter „Zeitumkehr“ . . . . . . . . . . . .
2.5 Zwangsbedingungen . . . . . . . . . . . . . . . . . . .
2.6 Verallgemeinerte Koordinaten . . . . . . . . . . . . . . .
2.6.1 Die Bewegungsgleichung in verallgemeinerten Koordinaten
2.6.2 Verallgemeinerte Kräfte . . . . . . . . . . . . . . .
2.7 Das Hamilton’sche Prinzip in verallgemeinerten Koordinaten .
2.8 Die Lagrange-Gleichungen der ersten Art . . . . . . . . . .
2.9 Beispiel einer rheonomen Zwangsbedingung . . . . . . . . .
2.10 Erhaltungsgrößen . . . . . . . . . . . . . . . . . . . . .
2.10.1 Elimination von zyklischen Koordinaten . . . . . . .
2.11 Das Noether-Theorem . . . . . . . . . . . . . . . . . .
25
26
28
34
38
42
42
42
44
45
47
51
53
55
61
62
66
70
72
74
3 Hamilton-Formalismus
3.1 Die Legendre-Transformation . . . . . . . . . . . . . . .
3.1.1 Funktionen mehrerer Variabler . . . . . . . . . . . .
3.1.2 Funktionen mit zusätzlichen „Dummy“-Variablen . . .
79
80
83
85
------------------------------------------------------------------------------------------------------------------ INHALTSVERZEICHNIS
3.2
3.3
3.4
3.5
3.1.3 Anwendung auf die Lagrange-Funktion . . . . . . . . 86
Beispiele für die Wirkung des Hamilton- Formalismus . . . .
91
3.2.1 Geschwindigkeitsunabhängige Kräfte . . . . . . . . . 91
3.2.2 Lorentz-Kräfte . . . . . . . . . . . . . . . . . .
93
Ein Variationsprinzip für die Hamilton-Gleichungen . . . . . . 94
Erhaltungsgrößen und Poisson-Klammern . . . . . . . . .
96
3.4.1 Beispiel: Vektoren . . . . . . . . . . . . . . . . . 99
Kanonische Transformationen . . . . . . . . . . . . . . . 100
3.5.1 Alternative Formulierungen der Berührungstransformation . . . . . . . . . . . . . . . . . . . . . . . . 104
3.5.2 Berührungstransformationen als Gruppe . . . . . . . 105
4 Relativistische Dynamik
4.1 Kräftefreie Teilchen . . . . . . . . . . . . . . . . . . . .
4.2 Wechselwirkung mit dem elektromagnetischen Feld . . . . . . . . . . . . . . . . . . . . . . .
4.3 Das Coulomb-Problem für ein einzelnes Teilchen . . . . . . .
106
107
Literaturverzeichnis
120
111
114
ii
Vorwort
Dieses Theorie-2-Skript ist eine überarbeitete Version der geTEXten Notizen,
die ich im Laufe des SS 2004 zur Vorbereitung einer Kursvorlesung Theorie II:
Allgemeine Mechanik vor Mainzer Studierenden geschrieben habe. Für die Fertigstellung dieses „Compuskripts“ möchte ich mich zunächst ganz herzlich bei
meinen zwei Stützen, Elvira Helf und Albrecht Seelmann, bedanken. Frau Helf
hat sich um den Text gekümmert, Herr Seelmann um die Formeln, die Grafiken
und das Stichwortverzeichnis. Herrn Jun.-Prof. Nils Blümer bin ich dankbar für
seine Kommentare zum Skript. Die Verantwortung für den Inhalt liegt natürlich bei mir. Sollte der Leserin oder dem Leser eine Unstimmigkeit auffallen,
bitte ich um eine Mitteilung ([email protected]). Die aktuelle
Version dieses Skripts findet man auf der Homepage meiner Gruppe:
http://komet337.physik.uni-mainz.de/Group/.
Bei der Themenwahl habe ich mich sowohl am Mainzer Theoriekanon als
auch an den Inhalten der Vorlesungen, die die Studierenden bereits gehört hatten, orientiert.
Als allgemeine Hintergrundinformation seien die Referenzen [1] – [8] empfohlen, wobei ich anmerken muss, dass die Darstellungen in [6] oft sehr „physikalisch“, diejenigen in [7] für Studierende im dritten Semester dagegen vielleicht allzu „mathematisch“ sind; Referenz [8] ist eine Fundgrube voller Ideen
und Ergebnisse für den eher mathematisch interessierten Leser, mutet jedoch
manchmal etwas altmodisch an. Ebenfalls eine Fundgrube ist das herrliche Buch
„Über die Theorie des Kreisels“ von Klein und Sommerfeld [9]. Die Referenzen
[10] und [11] sind insbesondere als weiterführende Literatur über die Spezielle
Relativitätstheorie von Interesse. Speziell für astronomische Anwendungen der
Mechanik seien die Bücher [12] und [13] empfohlen. Für konkrete Rechnungen
liefern die mathematischen Handbücher [14] und [15] wertvolle Hilfestellungen.
Ich hoffe, dass dieses Skript sich zumindest für Mainzer Studierende als nützlich erweist, und wünsche ihnen viel Erfolg und auch Spaß bei ihrer Erkundung
der Analytischen Mechanik, die ja die Basis bildet für nahezu die gesamte Theoretische Physik.
Mainz, im Oktober 2009
P. G. J. van Dongen
Kapitel
1
Spezielle Relativitätstheorie
Die Struktur der speziellen Relativitätstheorie ist derjenigen der nicht-relativistischen Klassischen Mechanik sehr ähnlich: In beiden Fällen beschreibt man
die Dynamik von Körpern mit Hilfe einer (nicht-gekrümmten) vierdimensionalen Raum-Zeit. In beiden Fällen ist es sehr hilfreich, sich bei der Beschreibung
dieser Dynamik zunächst auf Punkt teilchen zu konzentrieren. In beiden Fällen
gilt das Relativitätsprinzip, das die Existenz von Inertialsystemen postuliert.
Genau wie in der nicht-relativistischen Mechanik sind Inertialsysteme auch in
der Relativitätstheorie durch die zwei Eigenschaften charakterisiert, dass alle physikalischen Gesetze in allen Inertialsystemen zu jedem Zeitpunkt gleich
sind und dass alle Koordinatensysteme, die sich relativ zu einem Inertialsystem
in geradlinig-gleichförmiger Bewegung befinden, selbst ebenfalls Inertialsysteme
sind. Die Äquivalenz aller Inertialsysteme impliziert insbesondere auch die Homogenität und die Isotropie des Raums und der Zeit. Schließlich gilt sowohl für
die Relativitätstheorie als auch für die nicht-relativistische Klassische Mechanik
das deterministische Prinzip, das besagt, dass die auf ein Teilchen einwirkenden
Kräfte nur vom Ortsvektor und von der Geschwindigkeit dieses Teilchens sowie
von der Zeit abhängig sein können.
Neben diesen Gemeinsamkeiten, von denen das Relativitätspostulat besonders wichtig ist, gibt es zwischen der relativistischen (R) und der nicht-relativistischen (NR) Mechanik auch einen wesentlichen Unterschied, der durch ein zweites Postulat zum Ausdruck gebracht wird:
(R): Die Lichtgeschwindigkeit im Vakuum hat in allen Inertialsystemen denselben Wert c = 2, 997925 · 108 m/s.
(NR): Die Lichtgeschwindigkeit ist effektiv unendlich groß im Vergleich zu allen
anderen in der Theorie auftretenden Geschwindigkeiten.
Das zweite Postulat bedeutet physikalisch, dass die Wechselwirkung zwischen
Teilchen (z. B. durch Austausch von Strahlungsenergie oder Einwirkung von
elektromagnetischen Kräften) in der nicht-relativistischen Theorie instantan erfolgt, während die Ausbreitungsgeschwindigkeit c der Wechselwirkung in der
relativistischen Theorie eine endliche universelle Konstante (gültig in jedem Inertialsystem) ist. Das zweite Postulat der NR-Mechanik kann bekanntlich auch
in der folgenden Weise formuliert werden:
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
(NR): Die Länge eines Zeitintervalls und der Abstand zweier gleichzeitiger
Ereignisse sind in der nicht-relativistischen klassischen Mechanik absolute
(d. h. beobachterunabhängige) Größen.
Mathematisch bedeutet das zweite Postulat, dass die Newton’sche nicht-relativistische Mechanik kovariant unter Galilei-Transformationen und die Einstein’sche
relativistische Mechanik kovariant unter Lorentz-Transformationen ist. Das relativistische Pendant der absoluten Größen „Zeit“ und „Abstand“ in der Newton’schen Mechanik ist der beobachterunabhängige „infinitesimale Abstand “
ds = [c2 (dt)2 − (dx)2 ]1/2 infinitesimal benachbarter Ereignisse, der somit eine der zentralen Größen der Relativitätstheorie darstellt.
Eine Bemerkung noch zum Anwendungsbereich der speziellen Relativitätstheorie: Die nicht-relativistische Klassische Mechanik beschreibt die Dynamik
physikalischer Objekte unter der Einwirkung von Kräften, die mikroskopisch
auf Gravitationswechselwirkung oder elektromagnetische Wechselwirkung zurückgeführt werden können. Da die spezielle Relativitätstheorie Gravitationskräfte bekanntlich nicht beschreiben kann (hierfür benötigt man die allgemeine
Relativitätstheorie), bleiben als ihr Anwendungsbereich nur elektromagnetische
Kräfte übrig. Im Rahmen der speziellen Relativitätstheorie beschreibt man also
typischerweise die Dynamik elektromagnetischer Felder bei vorgegebenen Ladungen und Strömen oder die Dynamik von Ladungen und Strömen bei vorgegebenen elektromagnetischen Feldern. Die zentralen Gleichungen der speziellen
Relativitätstheorie sind daher die Maxwell-Gleichungen und die Lorentz’sche
Bewegungsgleichung. Da diese beiden Pfeiler der Elektrodynamik Teilsysteme
beschreiben und das Relativitätsprinzip für Teilsysteme - wie wir wissen - nur
dann Sinn macht, wenn zusätzlich angegeben wird, wie die „Außenwelt“ mittransformiert wird, ist klar, dass die Bestimmung des Transformationsverhaltens von Ladungen, Strömen und Feldern unter Lorentz-Transformationen im
Folgenden von großer Bedeutung sein wird.
Etliche Ergebnisse der speziellen Relativitätstheorie waren bereits vor Einsteins Arbeit (1905) bekannt. Erwähnt seien insbesondere die Lorentz-Transformation in linearer (Lorentz, 1895) und in beliebiger Ordnung (Larmor, 1898;
Lorentz 1899; Poincaré, 1905), die Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion (Fitzgerald, 1889; Lorentz, 1892), die Lorentz-Kraft (Lorentz, 1895), die
Gruppenstruktur der Lorentz-Transformationen, das Relativitätsprinzip, die Invarianz der Eigenzeit und das Additionsgesetz für Geschwindigkeiten (Poincaré,
1905). Das Großartige von Einsteins Beitrag (1905) ist die Reduktion der Theorie auf zwei Postulate und die Herleitung von alten und auch neuen Ergebnissen aus diesen Postulaten.1 Interessant ist noch, dass neben Lorentz’ Arbeit
(1895) das Fizeau’sche Experiment (1851) und die Aberration von Sternenlicht
(Bradley, 1729) Einsteins Denken beeinflusst haben, das oft zitierte MichelsonMorley-Experiment jedoch kaum. Für mehr Details sei auf die ausgezeichnete
Einstein-Biografie „Subtle is the Lord“ von Abraham Pais (Oxford University
Press, 1982) verwiesen.
1 Neu
sind z. B. der transversale Doppler-Effekt , die Fresnel-Formel c′ =
und das sogenannte „Zwillingsparadoxon“.
c
n
+v 1−
1
n2
3
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
1.1
Erste Konsequenzen der Postulate
Eine sofortige Konsequenz aus den Postulaten der speziellen Relativitätstheorie
ist, dass die Zeit (anders als in der Newton’schen Mechanik) keine absolute
Größe ist. Betrachten wir nämlich zwei Bezugssysteme K ′ und K, wobei K ′ die
Geschwindigkeit vrel (K ′ , K) = v relativ zu K hat, und nehmen wir an, dass in
K ′ entlang der x′ · v̂-Achse ein Sender S und (in gleichem Abstand von S) zwei
Empfänger E1 und E2 ruhen (siehe Abbildung 1.1). Zur Zeit t = 0 sendet S
zwei Lichtsignale aus, eins zu E1 und eins zu E2 . Beide Empfänger werden ihre
Signale (wegen der Isotropie des Raums) in K ′ gleichzeitig erhalten. Für einen
Beobachter in K jedoch wird der Empfänger E1 sein Signal zuerst erhalten, da
E1 sich auf das Licht, das sich auch in K mit der Geschwindigkeit c ausbreitet,
zubewegt. Ereignisse, die also gleichzeitig sind in K ′ , müssen nicht gleichzeitig
sein in K, und Zeitintervalle, die gleich sind in K ′ , sind im Allgemeinen ungleich
in K.
S
E1
K
E2
0
x v
^
v
0
K
xv
^
Abbildung 1.1: Gleichzeitigkeit von Ereignissen in zwei Inertialsystemen
Betrachten wir das Transformationsverhalten von Längen im Ortsraum und
von Zeitintervallen etwas genauer. Abstände senkrecht zur Geschwindigkeitsrichtung werden in beiden Systemen K und K ′ als gleich groß empfunden. Nehmen
wir z. B. an, im Ursprung 0 von K und im Ursprung 0′ von K ′ stehen zwei
parallel zueinander (und senkrecht zur x · v̂-Achse) ausgerichteten Latten, beide
mit einer Länge ℓ in ihrem Ruhesystem und beide mit einer Kreissäge an ihrem
oberen Ende (siehe Abbildung 1.2). Wir nehmen des Weiteren an, dass 0 und
0′ für t = t′ = 0 zusammenfallen. Nun kann L′ aus der Sicht eines Beobachters
im System K nicht kürzer als L selbst sein, da sonst (im Widerspruch zum
Relativitätsprinzip) L durchgesägt wird und L′ unversehrt bleibt. Umgekehrt
kann L′ aus der Sicht des Beobachters in K auch nicht länger sein. Also sind
beide (aus der Sicht von Beobachtern in K oder K ′ ) gleich lang.
L
0
K
0
K
00
L
0
Abbildung 1.2: Invarianz einer Länge senkrecht zur Geschwindigkeitsrichtung
Befestigen wir nun statt der Kreissäge jeweils zwei Spiegel an den beiden
4
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Latten, einen am oberen und einen am unteren Ende, und senden wir einen
Lichtstrahl hin und her zwischen beiden Spiegeln (siehe Abbildung 1.3). Wir
haben in dieser Weise zwei identische Uhren konstruiert, die in ihrem jeweiligen
Ruhesystem durch die Periode T = 2ℓ/c charakterisiert werden. Berechnen wir
nun die Periode T ′ der bewegten Uhr in K ′ aus der Sicht eines Beobachters
in K. In einer Periode legt der Lichtstrahl in der an L′ befestigten Uhr – wie
inqAbbildung 6.4 dargestellt – aus der Sicht des Beobachters in K einen Weg
€
Š2
2 ℓ2 + 12 vT ′ zurück. Da das Licht in K aufgrund des zweiten Postulats die
Geschwindigkeit c hat, muss
T′ =
2
c
É
ℓ2 +
€
1
′
2 vT
Š2
d. h.
T
≡ γT
1 − β2
2ℓ/c
T′ = q
1−
€ Š2 = p
v
c
gelten. Aus der Sicht des Beobachters in K dauert die Periode einer bewegten
Uhr also länger als diejenige einer identischen Uhr in K, laufen bewegte Uhren
demnach generell langsamer. Diese Konsequenz der Postulate der Relativitätstheorie wird als Zeitdilatation bezeichnet.
L
0
K
0
00
L
K
0
Abbildung 1.3: Zwei identische Uhren in den Inertialsystemen K und K ′
x?
`
0
0
1 0
vT
2
vT
0
xk
Abbildung 1.4: Berechnung der Periode einer sich relativ zum Beobachter mit
der Geschwindigkeit v bewegenden Uhr
Kippen wir nun die Uhr in K ′ , so dass die Latte L′ in Geschwindigkeitsrichtung zeigt (siehe Abbildung 1.5). Die Länge und die Periode der Uhr in K ′ sind
5
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
nach wie vor ℓ bzw. T , und die Periode aus der Sicht eines Beobachters in K
ist T ′ . Bestimmen wir nun die Länge ℓ′ der bewegten Uhr in K ′ aus der Sicht
des Beobachters in K. Diese Uhr bewegt sich (aus der Sicht von K) mit einer
Geschwindigkeit v nach rechts. Nehmen wir an, dass ein Lichtstrahl eine Zeit
t′LR bzw. t′RL benötigt, um sich von links nach rechts oder rechts nach links zu
bewegen. Aus der Sicht von K gilt:
t′LR =
ℓ′ + vt′LR
c
,
t′LR =
ℓ′ /c
1−β
t′RL =
t′RL =
ℓ′ − vt′RL
c
d. h.
und daher
,
γT = T ′ = t′LR + t′RL =
Es folgt also:
ℓ′ =
ℓ′ /c
1+β
ℓ′
c

1
1
+
1−β
1+β
‹
=
2ℓ′ /c
2γ 2 ℓ′
=
.
1 − β2
c
ℓ
Tc
= ,
2γ
γ
so dass die Länge eines bewegten Körpers in der Geschwindigkeitsrichtung verkürzt ist (im Vergleich zur Ruhelänge). Diese Konsequenz der Relativitätstheorie
wird Lorentz- (oder Fitzgerald-Lorentz-)Kontraktion genannt.
L
0
K
0
v
K
Abbildung 1.5: Zur Lorentz- bzw. Längenkontraktion
1.2
Der Abstand und die Eigenzeit
In der Einführung wurde bereits darauf hingewiesen, dass die nicht-relativistischen absoluten Größen „Zeit“ und „Abstand“ in der Relativitätstheorie durch
den beobachterunabhängigen „infinitesimalen Abstand“ ersetzt werden. Der infinitesimale Abstand ist in der Relativitätstheorie von zentraler Bedeutung, da
seine Invarianz unter Koordinatentransformationen zwischen Inertialsystemen
zeigt, dass die physikalischen Gesetze Lorentz-kovariant sind. Im Folgenden führen wir die Begriffe „Abstand“ und „Eigenzeit“ ein und leiten ein Theorem (Einstein, 1905) über die Eigenzeit bewegter Bezugssysteme ab.
Betrachten wir die Emission eines Lichtsignals am Ort x1 zur Zeit t1 im Bezugssystem K und seine Absorption am Ort x2 zur späteren Zeit t2 , ebenfalls in
K. Da das Signal sich in K gemäß dem zweiten Postulat mit der Geschwindigkeit
c ausbreitet, gilt offensichtlich
c2 (t2 − t1 )2 − (x2 − x1 )2 = 0 .
6
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Seien die entsprechenden Koordinaten im Inertialsystem K ′ mit vrel (K ′ , K) = v
durch (x′1 , t′1 ) und (x′2 , t′2 ) gegeben, dann gilt analog:
c2 (t′2 − t′1 )2 − (x′2 − x′1 )2 = 0 ,
da das Lichtsignal in K ′ nach dem zweiten Postulat ebenfalls die Geschwindigkeit c hat. Die Größe
1
s ≡ [c2 (t2 − t1 )2 − (x2 − x1 )2 ] 2
wird als Abstand zwischen den Ereignissen bei (x1 , t1 ) und (x2 , t2 ) bezeichnet.
Das obige Argument zeigt, dass die Aussage s = 0 in allen Inertialsystemen
gilt, falls sie in irgendeinem Inertialsystem zutrifft. Der Abstand infinitesimal
benachbarter Ereignisse (x, t) und (x + dx, t + dt) in K ist durch
ds =
È
(1.1)
c2 (dt)2 − (dx)2
gegeben. Analog gilt in einem beliebigen Inertialsystem
K ′ für den Abstand
È
′
infinitesimal benachbarter Ereignisse: ds = c2 (dt′ )2 − (dx′ )2 , und wiederum
impliziert ds = 0 in K die Identität ds′ = 0 für alle K ′ . Das negative Vorzeichen
von (dx)2 in (1.1) zeigt, dass der Abstand hier nicht gemäß der euklidischen,
sondern nach einer (von Hermann Minkowski eingeführten) pseudoeuklidischen
Geometrie definiert wird. Der Abstand infinitesimal benachbarter Ereignisse
ds wird alternativ auch als Linienelement oder als differentielles (Raum-Zeit-)
Intervall bezeichnet. Es ist übrigens zu beachten, dass die infinitesimale Größe
ds kein
H exaktes Differential darstellt, so dass die Auswertung von Integralen der
Form ds entlang einer geschlossenen Schleife im Allgemeinen nicht Null ergibt.
Die Invarianz der Aussage ds = 0 unter Koordinatentransformationen, d. h.
die Äquivalenz der Aussagen ds = 0 im Inertialsystem K und ds′ = 0 in K ′ , hat
weitreichende Konsequenzen. Um dies zu sehen, versuchen wir, diese Gleichunu
gen geometrisch zu interpretieren. Mit den Notationen dx
dt ≡ u und c ≡ β u gilt
in K:
u2
) = c2 (dt)2 (1 − β 2u ) .
c2
Die geometrische Interpretation von ds = 0 in K ist daher, dass der dimensionslose Geschwindigkeitsvektor βu auf einer Kugel mit Radius 1 und Mittelpunkt
0 liegt, so dass |u| = c gilt. Da die Gleichung ds = 0 die Ausbreitung von Lichtsignalen beschreibt, kann dieses Ergebnis nicht erstaunen. Wir betrachten nun
die Interpretation von ds′ = 0 in K ′ : Hierzu nehmen wir an, dass die Orts- und
Zeitkoordinaten (x′ , t′ ) in K ′ gemäß x′ = x′ (x, t; v) und t′ = t′ (x, t; v) mit den
Koordinaten (x, t) in K verknüpft sind. In diesem Fall gilt die lineare Beziehung
0 = (ds)2 = c2 (dt)2 − (dx)2 = c2 (dt)2 (1 −

‹

c dt′
c dt
=Λ
dx′
dx
„
‹
,
Λ(x, t; v) ≡
∂t′
∂t
1 ∂x′
c ∂t
c
€
∂t′
∂x
ŠT Ž
∂x′
∂x
,
wobei die Matrix Λ offensichtlich reell ist.2 Die Gleichung
0 = (ds′ )2 = c2 (dt′ )2 − (dx′ )2
2 Die Transformationsmatrix Λ, die (c dt, dx) in K mit (c dt′ , dx′ ) in K ′ verknüpft, wird
als Lorentz-Transformation bezeichnet. Wir werden später sehen, dass Λ(x, t; v) zwar explizit
von v abhängt, aber unabhängig von (x, t) ist.
7
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
in K ′ kann daher in der Form

c dt′
0=
dx′
‹T 
1
0
mit
∼
‹
0T
−11

B(x, t; v) ≡ Λ
1
0
‹

c dt′
c dt
=
dx′
dx
‹T

‹

c dt
1
B
= c2 (dt)2
dx
βu
‹T

1
B
βu
‹
‹
0T
Λ
−11
(1.2)
geschrieben werden, wobei die Matrix B reell und symmetrisch ist. Diese Gleichung für β u in K ′ stellt nur dann eine Kugel mit Radius 1 und Mittelpunkt 0
dar, wenn die Matrix B die Form

1 1
ε 0
B=
‹
0T
−11
,
(1.3)
ε = ε(x, t; v)
hat, wobei ε reellwertig (mit ε 6= 0) ist. Es folgt:
(ds′ )2 =
1 2
1
c (dt)2 (1 − β 2u ) = (ds)2
ε
ε
und daher:

ds
ds′
‹2
= ε(x, t; v)
.
Hierbei kann ε jedoch wegen der Homogenität des Raums und der Zeit nicht von
(x, t) oder (x′ , t′ ) und wegen der Isotropie des Raums nicht von v̂ abhängen.
Somit ist nur eine Abhängigkeit vom Geschwindigkeitsbetrag v möglich:
(ds)2 = ε(v)(ds′ )2 .
Betrachten wir nun umgekehrt eine Koordinatentransformation vom Inertialsystem K ′ zum Inertialsystem K, so dass vrel (K, K ′ ) = −v gilt, dann erhält man
analog
(ds′ )2 = ε(v)(ds)2
.
Kombination der beiden Transformationen liefert
(ds)2 = ε(v)(ds′ )2 = [ε(v)]2 (ds)2
bzw. [ε(v)]2 = 1
.
Wegen ε(0) = 1 und der Kontinuität von ε(v) als Funktion der Relativgeschwindigkeit v kommt nur die Wurzel ε(v) = ε(0) = 1 in Betracht. Wir erhalten somit:
(ds)2 = (ds′ )2
(1.4)
und nach einer Integration auch: s = s′ . Der Abstand ist also invariant unter
Koordinatentransformation von einem Inertialsystem in ein anderes:
(s21 )2 = c2 (t21 )2 − (x21 )2 = c2 (t′21 )2 − (x′21 )2 = (s′21 )2 ,
(1.5)
wobei t21 ≡ t2 − t1 definiert wurde, usw. Durch Einsetzen des Ergebnisses
ε = 1 in (1.2) und (1.3) können wir außerdem schließen, dass die LorentzTransformation Λ die Matrixgleichung

1
0
‹

∼ 1
0T
=Λ
−11
0
‹
0T
Λ
−11
(1.6)
8
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
erfüllen muss. Diese Konsistenzgleichung schränkt die mögliche Form der Transformationsmatrix Λ stark ein.
Aus (1.5) wird klar, dass man nur dann zu zwei Ereignissen im System K
ein anderes Bezugssystem K ′ finden kann, in dem diese Ereignisse am selben
Ort auftreten (x′21 = 0), wenn
(s21 )2 = c2 (t′21 )2 > 0
ist. Man bezeichnet reelle Abstände, (s21 )2 > 0, als zeit artig. Analog kann man
nur dann zu zwei Ereignissen in K ein Bezugssystem K ′ finden, in dem diese
Ereignisse gleichzeitig auftreten (t′21 = 0), falls
(s21 )2 = −(x′21 )2 < 0
gilt. Imaginäre Abstände, (s21 )2 < 0, heißen raumartig. Nullabstände, (s21 )2 =
0, werden als licht artig bezeichnet. Diese Einteilung ist invariant unter Koordinatentransformationen und daher absolut. Sie wird häufig mit Hilfe eines einfachen „Weltbilds“ (oder auch „Minkowski-Diagramm“) dargestellt. Neben dem
Lichtkegel (s21 )2 = 0, der lichtartige Abstände zwischen Ereignissen repräsentiert, unterscheidet man die absolute Zukunft, (s21 )2 > 0 mit t21 > 0, die
absolute Vergangenheit, (s21 )2 > 0 mit t21 < 0, und das absolut Entfernte,
(s21 )2 < 0. Eine kausale Beziehung zwischen zwei Ereignissen ist nur dann möglich, wenn ihr Abstand zeit- oder eventuell lichtartig ist, d. h. wenn (s21 )2 ≥ 0
gilt.
t21
Zukunft
entfernt
entfernt
x21
Vergangenheit
Abbildung 1.6: Weltbild mit Lichtkegel
Mit dem invarianten infinitesimalen Abstand ds ist offensichtlich eine invariante infinitesimale Zeit dτ verknüpft:
Ê
ds
dτ ≡
=
c
1
1− 2
c

dx
dt
r
‹2
dt =
1−
u 2
c
dt =
È
1 − βu2 dt =
dt
. (1.7)
γu
Diese Gleichung besagt, dass in einem bewegten Bezugssystem (z. B. für ein
Teilchen), das sich mit der Geschwindigkeit u(t) relativ zum Inertialsystem K
9
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
bewegt, die Zeit dτ = γdtu vergeht, wenn die unbewegte Uhr in K die Zeitdauer dt anzeigt. Nur wenn das bewegte Bezugssystem und das Inertialsystem K
identisch sind, so dass ihre Relativgeschwindigkeit verschwindet: u(t) = 0, gilt
dτ = dt; aus diesem Grund wird τ als die „Eigenzeit“ des bewegten Bezugssystems bezeichnet. Integration von (1.7) liefert:
Zt2
τ2 − τ1 =
dt
Zt2
È
1 − βu (t)2 =
t1
dt
t1
1
.
γu (t)
(1.8)
Man sieht wiederum, dass bewegte Uhren langsamer laufen als ruhende. Wenn
also zwei Uhren U1 und U2 anfangs im Inertialsystem K zusammen sind, U1 auch
weiterhin in K verbleibt und U2 sich entlang einer geschlossenen Schleife bewegt,
so dass beide Uhren schließlich wieder zusammen sind, dann ist U2 aufgrund von
(1.7) und (1.8) im Vergleich zu U1 zurückgeblieben. Dieses Resultat geht auf
Einstein (1905) zurück, der es als „Theorem“ bezeichnete. Die Fehlbezeichnung
Uhren- oder Zwillingsparadoxon ist jüngeren Datums (Langevin, 1911).
1.3
4-Schreibweise und Lorentz-Transformationen
Aufgrund der fundamentalen Bedeutung des invarianten Abstands infinitesimal
benachbarter Ereignisse:

d(ct)
(ds) = c (dt) − (dx) =
dx
2
2
2
‹T 
2
1
0
‹
0T
−11
‹

‹ 
d(ct)
d(ct)
d(ct)
=
·
dx
d(−x)
dx
‹
ist klar, dass es vorteilhaft ist, einen kontravarianten 4-Vektor
xµ ≡ (ct, x)
(µ = 0, 1, 2, 3) ,
den metrischen Tensor

gµν = g µν ≡
1
0
‹
0T
−11
und den mit xµ assoziierten kovarianten 4-Vektor
xµ ≡ gµν xν = (ct, −x)
einzuführen.3 Generell kann man den metrischen Tensor dazu verwenden, Indizes herunter- oder heraufzuziehen. Es gilt z. B.:
gµν g νρ = gµρ ≡ δµρ
,
g µν gνρ = g µρ = δ µρ ,
wobei δµρ oder δ µρ das übliche Kronecker-δ bezeichnet. Hierbei wird implizit
über zweimal (einmal unten und einmal oben) auftretende Indizes summiert
(Einstein-Konvention). Wir führen die ko- bzw. kontravarianten Ableitungen
3 Hierbei sollte man den Namen „kontravariant“ und „kovariant“ nicht zu viel Gewicht beimessen: In seiner „Theory of Relativity“ plädiert Pauli dafür, diese Bezeichnungen zu vertauschen, bzw. sie durch die älteren Namen „kogredient“ und „kontragredient“ zu ersetzen. Wie
man sieht: That which we call a rose by any other name would smell as sweet.
10
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
nach den Raum-Zeit-Koordinaten wie folgt ein:
∂µ ≡
∂
∂xµ
;
∂ µ = g µν ∂ν =
∂
.
∂xµ
Der d’Alembert-Operator kann dementsprechend als Skalarprodukt ∂µ ∂ µ geschrieben werden:
=
1 ∂2
− ∆ = g µν ∂µ ∂ν = ∂µ ∂ µ .
c2 ∂t2
Das Quadrat der infinitesimalen Eigenzeit bzw. des Raum-Zeit-Intervalls ds ist
ebenfalls als Skalarprodukt darstellbar:
c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = gµν dxµ dxν = dxµ dxµ .
Die linearen Transformationen des 4-Vektors xµ , die die Eigenzeit dτ invariant
lassen, werden als Poincaré-Transformationen oder als inhomogene LorentzTransformationen bezeichnet:
xµ → (x′ )µ = Λµν xν + aµ .
(1.9)
Hierbei gilt ΛT gΛ = g, denn die Invarianz der Eigenzeit erfordert:
c2 (dτ )2 = gµν dxµ dxν = gµν d(x′ )µ d(x′ )ν = gµν Λµρ Λν σ dxρ dxσ
d. h. gρσ = (ΛT )ρ µ gµν Λν σ oder kurz: g = ΛT gΛ . Die Inverse der Lorentz-Transformation folgt als Λ−1 = gΛT g, oder explizit:
(Λ−1 )µν = (gΛT g)µν = g µρ (ΛT )ρσ g σν = (ΛT )µν = Λν µ .
Hierbei ist zu beachten, dass die transponierte Lorentz-Transformation (ΛT )µν ≡
Λν µ = gνρ g µσ Λρ σ nicht (wie im Falle einer dreidimensionalen Drehung) der
gespiegelten Matrix (Λ̃)µν ≡ Λν µ entspricht; die gemischt räumlich-zeitlichen
Matrixelemente erhalten ein zusätzliches Minuszeichen. Aufgrund der Identität
∼
gµν = (ΛT gΛ)µν = (ΛT )µρ gρσ Λσν = Λρµ gρσ Λσν = (Λ)µρ gρσ Λσν
ist klar, dass die Bestimmungsgleichung g = ΛT gΛ für Lorentz-Transformationen
in 4-Schreibweise genau dem Resultat (1.6) in konventioneller Matrixnotation
entspricht.
Wir haben bisher zwar gezeigt, dass das Skalarprodukt (1.1) invariant ist
unter linearen Transformationen, die dann unbedingt die Form einer PoincaréTransformation haben müssen, aber man kann umgekehrt auch leicht zeigen,
dass nicht-lineare Transformationen das Skalarprodukt nicht invariant lassen.
Hierzu gibt es ein physikalisches und ein mathematisches Argument. Das physikalische Argument ist, dass eine nicht-lineare Transformation eine geradliniggleichförmige Bewegung in einem Inertialsystem in eine nicht-geradlinige oder
nicht-gleichförmige Bewegung in einem anderen Koordinatensystem transformiert, das daher kein Inertialsystem sein kann. Das mathematische Argument
basiert auf der Invarianz der Eigenzeit,
gµν dxµ dxν = c2 (dτ )2 = c2 (dτ ′ )2
=
=
gαβ dx′α dx′β
gαβ ∂µ (x′α )∂ν (x′β )dxµ dxν .
11
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Da diese Gleichung für alle dxµ gelten soll, gilt die Identität
gµν = gαβ ∂µ (x′α )∂ν (x′β ) ,
die Gleichung (1.6) in 4-Schreibweise darstellt, und daher, nach der Differentiation bezüglich xγ :
0 =
≡
gαβ [∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β )]
gαβ Γαβ
γµν .
0 =
αβ
αβ
gαβ (Γαβ
γµν + Γµγν − Γνµγ )
Folglich ist auch:
=
=
gαβ [2∂γ ∂µ (x′α )∂ν (x′β ) + ∂µ (x′α )∂γ ∂ν (x′β ) + ∂γ (x′α )∂µ ∂ν (x′β )
−∂ν ∂µ (x′α )∂γ (x′β ) − ∂µ (x′α )∂ν ∂γ (x′β )]
2gαβ ∂γ ∂µ (x′α )∂ν (x′β ) .
Da die Matrizen gαβ und ∂ν (x′β ) beide nicht-singulär sind, folgt sofort
∂γ ∂µ (x′α ) = 0 ,
so dass x′α notwendigerweise eine lineare Funktion der Koordinaten xµ ist, d. h.:
x′α = Λαµ xµ +aµ . Einsetzen in (1.4) ergibt die Relation ΛT gΛ = g in (1.9). Hiermit ist auch bewiesen, dass die Matrix Λ in (1.6) tatsächlich (x, t)-unabhängig
ist, wie angekündigt.
1.3.1
Poincaré- und Lorentz-Transformationen
Poincaré-Transformationen bestehen - wie gesagt - aus einem homogenen Anteil, der als Lorentz-Transformation Λ bezeichnet wird, und einem inhomogenen
Anteil
(d.h. einer
Translation). Die Gesamtheit aller Lorentz-Transformationen
Λ|ΛT gΛ = g bildet eine Gruppe, die Lorentz-Gruppe L. Die Gruppenstruktur
der Lorentz-Gruppe folgt direkt aus der Relation ΛT gΛ = g, denn wenn Λ1 und
Λ2 zur Lorentz-Gruppe gehören, gilt dasselbe für das Produkt Λ1 Λ2 :
T
T
T
T
(ΛT
2 Λ1 )g(Λ1 Λ2 ) = Λ2 (Λ1 gΛ1 )Λ2 = Λ2 gΛ2 = g .
2
Außerdem folgt aus ΛT gΛ = g, dass [det(Λ)] = 1 und daher det(Λ) = ±1
gilt. Innerhalb der Lorentz-Gruppe L ist die eigentliche orthochrone LorentzGruppe L↑+ , deren Elemente die Bedingungen Λ00 ≥ 1 und det(Λ) = 1 erfüllen,
am wichtigsten. Zu dieser Untergruppe L↑+ von L gehören die gewöhnlichen
Drehungen ΛR (α) um eine feste Achse α̂:

ΛR (α) =
1
0
0T
R(α)
‹
mit
R(α)x = α̂(α̂ · x) − α̂ × (α̂ × x) cos(α) + (α̂ × x) sin(α)
und die Geschwindigkeitstransformationen ΛB (φ, β̂) im Orts-Zeit-Raum, die
auch als „boosts“, bezeichnet werden:
ΛB (φ, β̂) = 11 +
[cosh(φ) − 1]
− sinh(φ)β̂
− sinh(φ)β̂
!
T
[cosh(φ) − 1]β̂β̂
T
.
(1.10)
12
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Hierbei hängen der Einheitsvektor β̂ und der Parameter φ über die Beziehung
v = c tanh(φ)β̂ mit der Relativgeschwindigkeit v der Bezugssysteme zusammen.
T
Das Produkt β̂ β̂ ist als Dyade aufzufassen. Im Falle der Geschwindigkeitstransformation lautet die Beziehung zwischen x′ und x also explizit:

‹
ct′
=
x′
”
—−1/2
Mit der Relation cosh(φ) = 1 − tanh2 (φ)

′‹
ct
x′

=
cosh(φ)ct − sinh(φ)(x · β̂)
− sinh(φ)ctβ̂ + [x − (x · β̂)β̂] + cosh(φ)(x · β̂)β̂
‹
ct − βxk
0
+γ
x⊥
(xk − vt)β̂
= 1 − β2
−1/2
.
= γ folgt:
wobei xk ≡ x · β̂ die Projektion von x auf die β̂-Richtung und x⊥ ≡ x − xk β̂ den
senkrechten Anteil darstellt. Bei fester Geschwindigkeit v erhält man im Limes
c → ∞ offensichtlich die Galilei-Transformation zurück: t′ = t , x′ = x − vt.
Die Untergruppe L↑+ der Lorentz-Gruppe ist eine kontinuierliche Gruppe
(Lie-Gruppe) und hat dann auch die entsprechende Struktur: Aufgrund der
expliziten Darstellung von Drehungen und Boosts, s. Gleichung (1.10), zeigt
man leicht, dass mehrmalige Anwendung kleiner Drehungen eine große Drehung
ergibt:
h
ΛR (α) = ΛR
•
α in
,
n

ΛB (φ, β̂) = ΛB
φ
, β̂
n
‹˜n
(n ∈ N) . (1.11)
Da der Definitionsbereich von φ = artanh(v/c) unbegrenzt ist, ist die LorentzGruppe nicht kompakt. Außerdem folgt aus (1.10) und (1.11), dass man allgemeine eigentliche, orthochrone Lorentz-Transformationen als

Λ = e−iα·L−φ·M , φ ≡ φβ̂ , Lk =
0
0
0T
ℓk
‹

, Mk =
êTk
∅3
0
êk
‹
(1.12)
darstellen kann, wobei ∅3 die 3 × 3-Nullmatrix ist und ℓ = (ℓ1 , ℓ2 , ℓ3 ) die Drehmatrizen sind:
„
ℓ1 =
0
0
0
0 0
0 −i
i 0
Ž
„
,
ℓ2 =
0 0
0 0
−i 0
Ž
i
0
0
„
,
ℓ3 =
0
i
0
Ž
−i 0
0 0
0 0
.
Die Erzeuger L und M der Lie-Gruppe L↑+ erfüllen die Vertauschungsrelationen
[Li , Lj ] = iεijk Lk
,
[Mi , Mj ] = iεijk Lk
,
[Li , Mj ] = iεijk Mk .
Aus der Darstellung (1.12) folgt sofort Λ† 6= Λ−1 , so dass die (nicht-kompakte!)
Lie-Gruppe L↑+ offensichtlich nicht-unitär ist.
1.4
Physikalische Konsequenzen der
Lorentz-Invarianz
Wir haben oben festgestellt, dass das zweite Einstein’sche Postulat (in Kombination mit weiteren Annahmen über die Homogenität und Isotropie von Raum
und Zeit) die Lorentz-Invarianz des Skalarprodukts
c2 (dτ )2 = (ds)2 = c2 (dt)2 − (dx)2 = dxµ dxµ
(1.13)
13
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
bedingt. Umgekehrt impliziert die Invarianz dieses Skalarprodukts das zweite Postulat, also kann (1.13) als die zentrale Gleichung der Relativitätstheorie
angesehen werden. Die Invarianz von (1.13) unter Lorentz-Transformationen bedeutet, dass alle physikalisch messbaren Größen entweder gemäß der LorentzGruppe oder zumindest einer geeigneten Darstellung dieser Gruppe transformiert werden. Da Rotationen in der Relativitätstheorie meist unwesentlich sind,
konzentrieren wir uns im Folgenden überwiegend auf Geschwindigkeitstransformationen, so dass die Koordinaten zweier Inertialsysteme K und K ′ mit
vrel (K ′ , K) = v, deren Ursprünge zur Zeit t = t′ = 0 zusammenfallen, durch

ct′
x′
‹

‹

‹
− sinh(φ)
cosh(φ)β̂
cosh(φ)
0
+
x⊥
− sinh(φ)β̂
=
1
0
+γ
x⊥
−β
=
−β
β̂

ct
xk
‹

ct
xk
‹
(1.14)
verknüpft sind. Da die x⊥ -Komponenten invariant sind unter Lorentz-Transformationen, ist es oft sinnvoll, die zweidimensionale Darstellung
ct′
x′k

=γ
−β
1
1
−β
‹
ct
xk
‹
(1.15)
einzuführen. Explizit lautet (1.15):
′
t
′
x
k
γ(t − cv2 xk )
γ(xk − vt)
=
=
t
xk
bzw.
=
=
γ(t′ + cv2 x′k )
.
γ(x′k + vt′ )
(1.16)
Gleichung (1.14) zeigt, dass ein Maßstab, der im Inertialsystem K senkrecht
zu β̂ aufgestellt ist und dort die Länge ℓ hat, in K ′ genauso lang ist. Andererseits
hat ein Maßstab, parallel zu β̂ in K, aus der Sicht von K ′ eine kleinere Länge:
(1)
ℓ′ < ℓ. Nehmen wir nämlich an, der Stab befinde sich in Ruhe zwischen xk und
(1)
(2)
(2)
xk , so dass xk − xk = ℓ gilt. Eine Messung der Länge des Stabs zur Zeit t′
in K ′ ergibt dann:
′(2)
ℓ′ = xk
′(1)
− xk

=
‹
1 (2)
x − vt′ −
γ k

‹
1 (1)
ℓ
xk − vt′ = .
γ
γ
(1.17)
Dies ist die bereits bekannte Lorentz-Kontraktion. In der Herleitung geht also
entscheidend ein, dass die Koordinaten x′(1) und x′(2) der Endpunkte bei dieser
Längenmessung in K ′ gleichzeitig (zur selben Zeit t′ ) bestimmt werden. Aus
(1.17) folgt noch, dass das Volumen V eines
p beliebigen Körpers, der in K ruht,
aus der Sicht von K ′ um einen Faktor γ1 = 1 − β 2 kleiner ist, da es sich bei der
Geschwindigkeitstransformation in der β̂-Richtung um diesen Faktor verringert.
Auch die Zeitdilatation lässt sich mit Hilfe der Lorentz-Transformation leicht
nachweisen. Betrachten wir z. B. eine Uhr, die in K ′ ruht und anzeigt, dass
zwischen zwei Ereignissen, die beide am Ort (x′k , x′⊥ ) in K ′ stattfanden, die
Zeit ∆t′ = t′2 − t′1 vergangen ist. Für einen Beobachter in K ist zwischen beiden
Ereignissen sogar
∆t = t2 − t1 = γ(t′2 +
v ′
v
x ) − γ(t′1 + 2 x′k ) = γ∆t′
c2 k
c
14
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
vergangen, so dass er zum Schluss kommt, dass die Uhr in K ′ nachgeht: Bewegte
Uhren laufen langsamer.
Lorentz-Transformationen sind im Allgemeinen nicht-kommutativ, und das
Gleiche gilt für Geschwindigkeitstransformationen. Man überprüft zum Beispiel
leicht, dass
ΛB (φ1 , ê1 )ΛB (φ2 , ê2 ) 6= ΛB (φ2 , ê2 )ΛB (φ1 , ê1 )
gilt. Eine Ausnahme sind Boosts in derselben Richtung:
ΛB (φ2 , β̂)ΛB (φ1 , β̂) = ΛB (φ1 + φ2 , β̂) ,
denn Matrixmultiplikation zeigt:
cosh(φ2 ) − sinh(φ2 )
− sinh(φ2 ) cosh(φ2 )
cosh(φ1 ) − sinh(φ1 )
− sinh(φ1 ) cosh(φ1 )
=
cosh(φ1 +φ2 ) − sinh(φ1 +φ2 )
− sinh(φ1 +φ2 ) cosh(φ1 +φ2 )
.
Die entsprechenden Geschwindigkeiten β1 , β2 und β1+2 sind also durch
β1+2
= tanh(φ1 + φ2 ) = tanh[artanh(β1 ) + artanh(β2 )]
β1 + β 2
=
1 + β 1 β2
(1.18)
miteinander verknüpft. Hiermit haben wir das Additionsgesetz für (parallel ausgerichtete) Geschwindigkeiten erhalten.
Wir betrachten - etwas allgemeiner und aus einem anderen Blickwinkel zwei Inertialsysteme K und K ′ mit vrel (K ′ , K) = v, deren Koordinaten durch
eine Lorentz-Transformation verbunden sind:
 ‹

‹
1
ct
0
=
+γ
x
x′⊥
β
β
β̂
ct′
x′k
(1.19)
.
Führen wir noch die Geschwindigkeiten
u≡
dx
dt
dx′
dt′
u′ ≡
,
mit den Geschwindigkeitskomponenten uk = u· β̂ und u⊥ = u−uk β̂ und analog
für u′ ein. Aus der ersten Zeile in (1.19) folgt:
dt
=γ
dt′
‚
′
β dxk
1+
c dt′
Œ
dt′
1
Š ,
= €
dt
γ 1 + c12 vu′k
bzw.
und die zweite Zeile impliziert:
–
dx
dx′⊥
+γ
=
u=
dt
dt′
‚
βc +
dx′k
Œ ™
β̂
dt′
u′⊥ + γ(v + u′k )β̂
dt′
€
Š .
=
dt
γ 1 + c12 vu′k
(1.20)
Komponentenweise erhält man also:
uk =
u′k + v
1+
1
′
c2 vuk
,
u⊥ =
€
u′⊥
γ 1+
1
′
c2 vuk
Š .
(1.21)
Die Nichtkommutativität der Lorentz-Transformationen ist auch in (1.20) klar
ersichtlich, denn u hängt nicht-symmetrisch von u′ und v ab.
15
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Aus (1.21) kann auch das Transformationsverhalten von Winkeln bestimmt
werden. Nehmen wir an, ein Teilchen bewegt sich in K mit der Geschwindigkeit
u, die einen Winkel ϑ mit der β̂-Richtung einschließt: uk = u cos(ϑ) , u⊥ =
u sin(ϑ)û⊥ ; analog gilt dann u′k = u′ cos(ϑ′ ) und u′⊥ = u′ sin(ϑ′ )û⊥ . Einsetzen
in (1.21) liefert:
u cos(ϑ) =
u′ cos(ϑ′ ) + v
1 + c12 vu′ cos(ϑ′ )
,
u sin(ϑ) =
”
u′ sin(ϑ′ )
γ 1+
1
′
c2 vu
— ,
cos(ϑ′ )
und daher:
tan(ϑ) =
u′ sin(ϑ′ )
.
γ[u′ cos(ϑ′ ) + v]
Falls das „Teilchen“ ein Photon, oder klassisch: ein Lichtstrahl, ist und sich mit
der Geschwindigkeit c bewegt, vereinfacht sich diese Formel auf
tan(ϑ) =
sin(ϑ′ )
.
γ[cos(ϑ′ ) + β]
(1.22)
Diese Richtungsänderung des Lichts beim Übergang auf ein anderes Inertialsystem ist als Aberration bekannt und wurde erstmals 1725 von dem britischen
Astronomen James Bradley beobachtet. Bradley entdeckte, dass die Position
der Sterne sich ändert aufgrund der Bewegung der Erde in ihrer Umlaufbahn
um die Sonne. Für kleine β-Werte erhält man aus (1.22):
ϑ − ϑ′
∼ [tan(ϑ) − tan(ϑ′ )] ∼ tan(ϑ′ )
cos2 (ϑ′ )
•
1−
β
cos(ϑ′ )
‹
˜
−1 ,
und daher:
∆ϑ ≡ ϑ′ − ϑ ∼ β sin(ϑ′ ) + O(β 2 ) ,
in Übereinstimmung mit Bradleys Ergebnissen.
1.5
4-Vektoren
Jede physikalische Größe aµ = (a0 , a1 , a2 , a3 ), die unter Lorentz-Transformationen genauso transformiert wird wie der 4-Ortsvektor xµ ,
(a′ )µ = Λµν aν ,
heisst kontravarianter 4-Vektor, jede Größe aµ , die wie xµ transformiert wird,
(a′ )µ = Λµν aν
,
Λµν = gµρ g νσ Λρσ
,
ein kovarianter 4-Vektor. Mit Hilfe des metrischen Tensors kann man aus einem kovarianten 4-Vektor immer einen kontravarianten 4-Vektor machen, aµ =
g µν aν , und umgekehrt. Das Quadrat eines 4-Vektors ist als
a2 ≡ aµ aµ
16
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
definiert; es ist offensichtlich invariant unter Lorentz-Transformationen. Vektoren mit a2 > 0, a2 = 0 oder a2 < 0 werden zeit-, licht- oder raumartig genannt.
Eine Größe, die invariant ist unter Lorentz-Transformationen, wird allgemein
ein (Lorentz-)Skalar genannt. Auch das Skalarprodukt zweier unterschiedlicher
4-Vektoren,
a · b ≡ aµ b µ = aµ b µ
ist Lorentz-invariant und daher ein Skalar:
(a′ )µ (b′ )µ = gµν (a′ )ν (b′ )µ = Λµσ gµν Λν ρ bσ aρ
= (ΛT gΛ)σρ bσ aρ = gσρ bσ aρ = aσ bσ
.
Falls ϕ(x) ein Skalar ist, dann ist der 4-Gradient
∂ϕ
=
∂µ ϕ =
∂xµ

‹
1 ∂ϕ
, ∇ϕ
c ∂t
ein kovarianter 4-Vektor. Dies folgt aus der Form der Poincaré-Transformation:
(x′ )µ = Λµν xν + aµ
bzw. xµ = (Λ−1 )µν [(x′ )ν − aν ] ,
die das Transformationsverhalten der Ableitungen:
∂ν′ =
∂xµ
∂µ = (Λ−1 )µν ∂µ = Λν µ ∂µ
∂(x′ )ν
impliziert. Analog ist ∂ µ ϕ wegen (∂ ′ )ν = Λν µ ∂ µ ein kontravarianter 4-Vektor.
Das Skalarprodukt
∂aµ
= ∂µ aµ = ∂ µ aµ ≡ ∂ · a
∂xµ
wird als 4-Divergenz bezeichnet; die 4-Divergenz ist also invariant unter LorentzTransformationen.
Ein weiterer 4-Vektor ist die 4-Geschwindigkeit uµ eines Teilchens, das sich
mit der 3-Geschwindigkeit u(t) im Inertialsystem K bewegt,
dxµ
u ≡
ds
µ
r
,
ds = cdt
1−
u 2
c
.
Es ist zu beachten, dass die so definierte 4-Geschwindigkeit dimensionslos ist,4
da sowohl xµ als auch s die Dimension einer Länge besitzen. Da uµ also als
Ableitung von xµ (einem 4-Vektor) nach dem Abstand s des Teilchens (einem
Skalar) definiert ist, wird uµ selbst ebenfalls wie ein 4-Vektor transformiert. Die
explizite Form von uµ ist:
d
u
(ct, x)
1
uµ = qdt € Š2 = q
€ Š2 1, c ≡ γu (1, β u ) .
1 − uc
c 1 − uc
4 Wir übernehmen hiermit die Notation von Landau und Lifschitz, Band II. Auch die Konµ
ist üblich. In vielen Büchern sind beide Konventionen sowieso ununtervention uµ = dx
dτ
scheidbar, da c = 1 gesetzt wird.
17
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Entweder aus dieser expliziten Form oder direkt aus dxµ dxµ = (ds)2 kann man
nun u2 = uµ uµ = 1 folgern. Das Quadrat der 4-Geschwindigkeit ist also auf
Eins normiert; ihre Komponenten sind daher nicht unabhängig.
µ
Analog definiert man die 4-Beschleunigung du
ds , die ebenfalls ein 4-Vektor ist
und die physikalische Dimension [Länge−1 ] hat. Durch Ableiten von uµ uµ = 1
findet man, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit
µ
steht: du
ds uµ = 0.
Wir untersuchen nun das Transformationsverhalten einiger Größen, die in
der Elektrodynamik relevant sind. Als erste Größe betrachten wir die elektrische
Ladung von Elementarteilchen oder ganzen Körpern. Es ist ein experimentelles
Faktum, dass die elektrische Ladung ein Lorentz-Skalar ist. Alles andere würde unserer Alltagserfahrung widersprechen: Obwohl die Ionen und Elektronen
in Festkörpern sehr unterschiedliche Geschwindigkeiten haben und diese außerdem temperatur- und materialabhängig sind, sind Alltagsgegenstände - wie wir
wissen - elektrisch neutral.
Es folgt, dass die Ladungsdichte wie ρ′ = γv ρ0 transformiert wird, wenn
ρ0 die Ladungsdichte im Ruhesystem K darstellt und ρ′ die Ladungsdichte in
einem Inertialsystem K ′ mit vrel (K ′ , K) = v. Dies folgt sofort daraus, dass die
Gesamtladung in einem Volumenelement erhalten ist, ρ0 dV = ρ′ dV ′ , und das
Volumenelement gemäß dV ′ = dV
γv transformiert wird.
Nehmen wir nun an, die Ladungsdichte ruht nicht in K, sondern bewegt
sich mit der Geschwindigkeit u in diesem Inertialsystem. Sie befindet sich somit offensichtlich in Ruhe im Inertialsystem K ′ mit vrel (K ′ , K) = u. Die in K
2
gemessene Ladungsdichte ist daher ρ = γu ρ0 mit γu ≡ (1 − uc2 )−1/2 . Neben
der Ladungsdichte misst K auch eine Stromdichte j = ρu = γu ρ0 u. Insgesamt
verhält
j µ ≡ (cρ, j) = ρ0 cγu 1,
u
= ρ0 cγu (1, βu ) = ρ0 cuµ
c
sich also wie ein 4-Vektor und wird dementsprechend als 4-Stromdichte bezeichnet. Folglich wird j µ gemäß der Lorentz-Gruppe transformiert.
In diesem Argument wurde vorausgesetzt, dass alle an ρ beteiligten Einzelladungen die gleiche Geschwindigkeit u haben. Im allgemeinen Fall, in dem
die Ladungsdichte aus Ladungen unterschiedlicher Geschwindigkeit aufgebaut
ist, erreicht man denselben Schluss, dass j µ = (cρ, j) wie ein kontravarianter
4-Vektor transformiert wird, indem man sich die Gesamtladungsdichte aus Teilladungsdichten uniformer Geschwindigkeit aufgebaut denkt. Das Erhaltungsgesetz für die Gesamtladung, das in differentieller Form als Kontinuitätsgleichung
darstellbar ist, lautet in der 4-Schreibweise
0=
∂ 0
∂
∂(cρ)
∂
∂ρ
j + i j i = ∂µ j µ .
+∇·j =
+ i ji =
∂t
∂(ct)
∂x
∂x0
∂x
Die manifeste Lorentz-Invarianz dieser Gleichung zeigt, dass die Gesamtladung
in allen Inertialsystemen erhalten ist, falls sie in irgendeinem Inertialsystem
erhalten ist.
Wir zeigen nun, dass auch das skalare Potential Φ und das Vektorpotential A
zu einem 4-Vektor, dem 4-Potential Aµ = (Φ, cA), kombiniert werden können.
Aus den homogenen Maxwell-Gleichungen ∇ · B = 0 und ∇ × E + ∂B
∂t = 0 folgt
18
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
bekanntlich:
E = −∇Φ −
∂A
∂t
,
B=∇×A.
Die inhomogenen Maxwell-Gleichungen liefern daher:
1
(cρ)
ε0 c
∂
1
ρ = ∇ · E = −∆Φ − ∇ · A
ε0
∂t

‹
1 ∂2
∂
1 ∂Φ
=
−
∆
Φ
−
∇
·
A
+
c2 ∂t2
∂t
c2 ∂t
•
˜
∂
∂Φ
∂
= Φ −
∇ · (cA) +
= Φ −
(∂ν Aν )
∂(ct)
∂(ct)
∂(ct)
=
und
1
j
ε0 c

= µ0 cj = c ∇ × B − ε0 µ0
∂E
∂t
‹
∂Φ ∂ 2 A
−∇
−
∂t
∂t2
2
1 ∂ A
1 ∂Φ
= c ∇(∇ · A) − ∆A + 2 2 + 2 ∇
c ∂t
c
∂t
•
˜
∂Φ
∂
= ∇ ∇ · (cA) +
+ (cA) = (cA) −
(∂ν Aν ) .
∂(ct)
∂(−x)
1
= c ∇ × (∇ × A) − 2
c
Die Kombination dieser beiden Gleichungen liefert in 4-Schreibweise:
1 µ
j = Aµ − ∂ µ (∂ν Aν ) .
ε0 c
(1.23)
Die linke Seite dieser Gleichung ist ein 4-Vektor, also muss auch die rechte Seite
wie ein 4-Vektor transformiert werden. Wegen der Eichfreiheit bei der Wahl von
Aµ bedeutet dies noch keineswegs, dass die einzelnen Terme Aµ und ∂ µ (∂ν Aν )
in (1.23) wie 4-Vektoren transformiert werden; um dies zu erreichen, muss man
die Eichung festlegen. Die Eichtransformation hat in 4-Schreibweise die Form
Aµ −→ õ ≡ Aµ + ∂ µ Λ ,
wobei Λ eine zunächst beliebige Funktion des 4-Ortsvektors xν ist. Um diese
Eichfreiheit zu eliminieren, wird häufig die Lorenz-Eichung,
∂ν Aν = 0 ,
(1.24)
auferlegt. Die Bestimmungsgleichung für das 4-Potential reduziert sich in dieser
Eichung auf:
Aµ =
1 µ
j .
ε0 c
(1.25)
Die Lorenz-Eichung läßt sich immer realisieren, denn wenn ∂ν Āν 6= 0 gilt, kann
man immer eine Funktion χ und ein neues 4-Potential Aµ einführen:
χ ≡ −∂µ Āµ
19
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Aµ ≡ Āµ + ∂ µ χ ,
so dass Aµ dieselben physikalischen Felder wie Āµ beschreibt und außerdem
die Lorenz-Bedingung ∂µ Aµ = 0 erfüllt. Die Lorenz-Bedingung (1.24) legt das
4-Potential nicht eindeutig fest, da auch das alternative Potential
õ = Aµ + ∂ µ Λ ,
(1.26)
Λ = 0
die gleichen physikalischen Felder beschreibt und die Lorenz-Bedingung erfüllt.
Das 4-Potential ist in der Lorenz-Eichung also bis auf eine Lösung der Wellengleichung bestimmt. Für alle möglichen Lorentz-Skalare Λ in (1.26) sind sowohl
Aµ als auch õ physikalisch äquivalente 4-Vektoren.
Gleichung (1.25) zeigt, dass das 4-Potential in der Lorenz-Eichung eine inhomogene Wellengleichung erfüllt. Genau wie bei der alternativen (und äquivalenten) Formulierung mit Hilfe der Coulomb-Eichung stellen wir fest, dass die
Maxwell-Theorie elektromagnetische Wellen vorhersagt. Falls keine Quellen des
elektromagnetischen Feldes vorhanden sind, also für j µ = 0, genügt Aµ (x) der
homogenen Wellengleichung Aµ = 0 und kann somit als Überlagerung ebener
Wellen der Form
Aµ (x)
=
=
ω
(A0 )µ ei(k·x−ωt) = (A0 )µ e−i( c ct−k·x)
ν
(A0 )µ e−ikν x = (A0 )µ e−iϕ(x)
(1.27)
geschrieben
werden, wobei die Phase ϕ(x) = kν xν und der 4-Wellenvektor k ν =
€
Š
ω
c,k
mit der Frequenz ω = c|k| eingeführt wurden. Nehmen wir an, (1.27)
gilt im Inertialsystem K. Im Inertialsystem K ′ mit vrel (K ′ , K) = v gilt dann:
′
′
(A′ )µ (x′ ) = Λµν Aν (x) = Λµν (A0 )ν e−iϕ(x) = (A′0 )µ e−iϕ (x )
mit
(A′0 )µ ≡ Λµν (A0 )ν
und
ϕ′ (x′ ) ≡ ϕ(x) = kν xν = kν (Λ−1 )ν µ (x′ )µ = kν Λµν (x′ )µ ≡ (k ′ )µ (x′ )µ .
Wir stellen also fest, dass die Amplitude des 4-Potentials wie ein 4-Vektor und
die Phase wie ein Lorentz-Skalar transformiert werden. Außerdem haben wir
die wichtige Entdeckung gemacht, dass auch der 4-Wellenvektor k ν ein echter
4-Vektor ist, d. h. gemäß der Lorentz-Gruppe transformiert wird: (k ′ )µ = Λµν kν
bzw. (k ′ )µ = Λµν k ν . Im Falle von Wellenpaketen, d. h. von Überlagerungen
ebener Wellen, gelten diese Schlussfolgerungen auch für jede einzelne FourierKomponente.
Aus der Quantenmechanik ist bekannt, dass ein Photon mit dem Wellenvektor k und der Frequenz ω einen Impuls p = ~k und eine Energie E = ~ω
besitzt. Für den Spezialfall des Photons stellen wir hier also erstmals fest, dass
Impuls und€ Energie
in€ der ŠRelativitätstheorie zu einem 4-Vektor vereint werŠ
den: pµ ≡ Ec , p = ~ ωc , k = ~k µ . Wir werden später sehen, dass diese enge
Verflechtung von Energie und Impuls auch allgemeiner gilt.
20
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
Die Lorentz-Transformation für den 4-Wellenvektor k µ =
€
Š
ω
c,k
k · β̂ ≡ k cos(ϑ) und k⊥ ≡ k − kk β̂ ≡ k sin(ϑ)k̂⊥ :

‹

‹
1
ω ′ /c
0
=
+γ
′
k
k⊥
−β
−β
β̂

mit kk ≡
‹
ω/c
kk
zeigt, dass die Frequenz ω der Welle abhängig vom Einfallswinkel ϑ wie folgt
transformiert wird:

ω ′ = γ(ω − βckk ) = γω 1 − β
kk
k
‹
= γω[1 − β cos(ϑ)] .
(1.28)
Hierbei ist das Transformationsgesetz für den Winkel,
|k′⊥ |
|k⊥ |/k
sin(ϑ)
|k⊥ |
Š = €k
Š =
= €
ω
k
kk′
γ[cos(ϑ)
− β]
γ kk − β c
γ k −β
tan(ϑ′ ) =
oder umgekehrt
tan(ϑ) =
sin(ϑ′ )
,
γ[cos(ϑ′ ) + β]
natürlich gleich dem Gesetz (1.22) für die Transformation von Winkeln, das wir
im Rahmen unserer Untersuchung von Aberration von Sternenlicht erhielten.
Gleichung (1.28) beschreibt den relativistischen Doppler-Effekt : Die Frequenz ω
wird nicht nur mit dem winkelabhängigen Faktor 1 − βv cos(ϑ) multipliziert, der
bereits vom nicht-relativistischen Doppler-Effekt bekannt ist, sondern auch mit
dem Faktor γv , der also eine relativistische Korrektur darstellt und sogar für
transversal einfallendes Licht (ϑ = π2 ) einen Doppler-Effekt hervorruft („transversaler Doppler-Effekt“). Beim longitudinalen Doppler-Effekt (ϑ = 0 bzw. ϑ =
π) wird die Frequenz ω wie folgt transformiert:
Ê
′
ω =
1−β
ω
1+β
Ê
(ϑ = 0)
,
′
ω =
1+β
ω
1−β
(ϑ = π) .
Beim transversalen Doppler-Effekt (ϑ = π2 ) tritt offensichtlich eine Rotverschiebung auf: ω = γ1v ω ′ < ω ′ . Als typische Anwendung des transversalen DopplerEffekts betrachten wir einen Stern, der im Inertialsystem K ′ ruht und dort Licht
mit der Frequenz ω ′ ausstrahlt. Ein Beobachter auf der Erde („Inertialsystem
K“), für den dieses Licht unter dem Winkel ϑ = π2 relativ zur v-Richtung einfällt,
wird die kleinere Frequenz ω = ω ′ /γv messen. Der transversale Doppler-Effekt
ist eine Konsequenz der Zeitdilatation, denn für den Beobachter auf der Erde
wird eine in K ′ ruhende Uhr (in diesem Fall also der Licht ausstrahlende Stern)
um einen Faktor γ1v langsamer laufen als eine Uhr, die im Inertialsystem K ruht.
1.6
Masse und Energie
Wegen der einfachen quantenmechanischen Relation E = ~ω für die Energie
eines Photons mit der Frequenz ω kann man aufgrund des Doppler-Effekts,
Gleichung (1.28), sofort das Transformationsgesetz für die Energie elektromagnetischer Strahlung angeben: Sendet ein Körper in seinem Ruhesystem K insgesamt N Photonen der Frequenz ω unter einem Winkel ϑ zur β̂-Achse aus,
21
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
so misst ein Beobachter im Inertialsystem K ′ mit vrel (K ′ , K) = v = v β̂ die
ausgestrahlte Energie
E ′ = N ~ω ′ = γN ~ω[1 − β cos(ϑ)] = γE[1 − β cos(ϑ)] .
(1.29)
Betrachten wir nun einen Körper der Masse m0 in seinem Ruhesystem K, der
in den Richtungen ϑ und ϑ − π jeweils N Photonen der Frequenz ω ausstrahlt,
stets zwei Photonen (eins in jeder Richtung) zur gleichen Zeit. Die Energie des
Körpers vor und nach dem Ausstrahlen sei E(0) bzw. E (0) (0). Schreiben wir
noch: 2N ~ω = ε, dann lautet das Gesetz der Energieerhaltung in K:
E(0) = E (0) (0) + 21 ε + 21 ε = E (0) (0) + ε .
!
N h
m0
!
N h
#
(#
)
^
Abbildung 1.7: Ausstrahlung von Photonen in zwei entgegengesetzte Richtungen
Auch in K ′ gilt Energieerhaltung, nun für die Energien des bewegten Körpers
und der Strahlung:
E(v)
= E (0) (v) + 21 εγ[1 − β cos(ϑ)] + 21 εγ[1 − β cos(ϑ − π)]
= E (0) (v) + εγ .
Zieht man die Energieerhaltungsgesetze in K und K ′ unter Verwendung von
(0)
Ekin (v) ≡ E (0) (v) − E (0) (0)
Ekin (v) ≡ E(v) − E(0) ,
voneinander ab, so folgt für β =
v
c
≪ 1:
(0)
2
2
1
1
2 m0 v − 2 εβ
€
Š
2
ε
1
2 m0 − c 2 v
Ekin (v) = Ekin (v) − ε(γ − 1) ∼
=
(0)
Das Massendefizit µ0 ≡ m0 − m0 =
ε
c2
(0)
= 21 m0 v 2 .
entspricht also einer Energie ε:
ε = µ0 c2 .
Da man prinzipiell die ganze Ruhemasse eines Körpers in Strahlung umwandeln
kann (z. B. durch Annihilation von Materie und Antimaterie), folgt für E (0) (0) =
E (0) (v) = 0 aus den beiden Energieerhaltungsgesetzen:
E(0) = ε = m0 c2
,
E(v) = εγ = γm0 c2 = mc2 .
Hierbei wurde die relativistische Masse m ≡ γm0 eingeführt. Masse und Energie
sind demnach äquivalent. Außerdem folgt nun auch für Teilchen, dass der 4Impulsvektor

pµ ≡
‹
u
E
= m0 cγu (1, β u ) = m0 cuµ
, mu = mc 1,
c
c
22
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
ein 4-Vektor ist, der die physikalischen Größen Energie E und Impuls p = mu =
γu m0 u untrennbar miteinander verknüpft.
Das hier dargestellte Argument stammt aus einer Arbeit von A. Einstein
(Annalen der Physik, 17, 639 (1905)), in der er übrigens interessanterweise eine
klassische (d. h. nicht-quantenmechanische) Herleitung des Transformationsgesetzes (1.29) für die Strahlungsenergie gab. Das Konzept des Photons, das er ja
selbst wenige Monate zuvor in seiner Arbeit über den photoelektrischen Effekt
vorgeschlagen hatte, muss ihm wohl noch zu spekulativ erschienen sein.
1.7
Die Lorentz-Kraft und elektromagnetische
Felder
Bevor wir uns der Formulierung des relativistischen Kraftgesetzes, d.h. der Lorentz’schen Bewegungsgleichung widmen, betrachten wir die folgenden Ableitungen des 4-Potentials nach dem 4-Ortsvektor:
F µν ≡ ∂ µ Aν − ∂ ν Aµ
.
Diese Ableitungen sind physikalisch äußerst relevant, da sie die Komponenten
der elektrischen und magnetischen Felder bilden. Wir werden sie daher bei der
relativistischen Formulierung der Lorentz-Kraft benötigen. Aus der Definition
folgt sofort, dass F µν antisymmetrisch unter Vertauschung der Indizes (µν) ist;
insbesondere gilt also F µµ = 0. Die explizite Form von F µν folgt aus F µµ = 0
und
•
F
i0
F ij
=
=
∂A
∂ A − ∂ A = −∇Φ −
∂t
εijk (−cBk ) = −cεijk Bk
i
0
0
˜
i
= Ei
i
als
†
F µν =
0
E1
E2
E3
−E1
0
cB3
−cB2
−E2
−cB3
0
cB1
−E3
cB2
−cB1
0

.
(1.30)
Da die Elemente von F µν vollständig durch (E, B) bestimmt werden, heißt F µν
auch elektromagnetischer Feldtensor.
Die relativistische Variante der Lorentz-Kraft ist nun durch
K µ ≡ qF µν uν = quν (∂ µ Aν − ∂ ν Aµ )
definiert. Da die 4-Geschwindigkeit uµ , das 4-Potential Aµ und die Ableitungen ∂ µ alle 4-Vektoren sind, werden sowohl uν Aν als auch der Differentialoperator uν ∂ ν unter Lorentz-Transformationen als Skalare und K µ selbst daher
als kontravarianter 4-Vektor transformiert. Durch explizite Berechnung sieht
man außerdem, dass K µ in der Tat eine relativistische Verallgemeinerung der
Lorentz-Kraft darstellt:
Kµ
= q(F µ0 u0 + F µj uj ) = qγu [F µ0 + F µj (−βj )]
= qγu (E · β , E + u × B) ,
(1.31)
23
------------------------------------------------------------------------------- 1. SPEZIELLE RELATIVITÄTSTHEORIE
wobei benutzt wurde:
F ij (−βj ) = (−εijk cBk )(−βj ) = c(β × B)i = (u × B)i
.
Der Zeitanteil von K µ in (4.2) ist genau die Leistung, die das elektromagnetische
Feld am Teilchen verrichtet. Betrachten wir nun die Gleichung
m 0 c2
d2 xµ
d2 xµ
=
m
= Kµ
0
ds2
dτ 2
,
dτ =
dt
γu
,
(1.32)
die K µ mit einem anderen 4-Vektor, der 4-Beschleunigung, in Verbindung bringt.
Gleichung (4.3) ist sicherlich korrekt im momentanen Ruhesystem des Teilchens,
denn dann lautet sie:
0 , m0
d2 x
dt2
= (0 , qE)
.
Da das Gesetz (4.3) in diesem speziellen Inertialsystem gilt und Lorentzkovariant formuliert wurde, muss es nach dem Relativitätsprinzip in jedem Inertialsystem gelten. Wir haben somit in der Form von Gleichung (4.3) die relativistische Formulierung der Lorentz’schen Bewegungsgleichung gefunden. Es
ist klar, dass das Kraftgesetz (4.3) in der Speziellen Relativitätstheorie von
zentraler Bedeutung ist, da es die Dynamik geladener Teilchen in beliebigen
elektromagnetischen Feldern vollständig festlegt.
Es sei schließlich noch daran erinnert, dass die 4-Beschleunigung stets senkrecht auf der 4-Geschwindigkeit stehen muss. Das Gleiche muss gemäß (4.3)
dann natürlich auch für die 4-Kraft K µ gelten. Aufgrund der Antisymmetrie
von F µν folgt tatsächlich:
duµ
uµ
= uµ
dτ

‹
q
1
Kµ =
uµ F µν uν = 0 ,
m0 c
m0 c
so dass diese Konsistenzbedingung automatisch erfüllt ist.
24
Kapitel
2
Lagrange-Formalismus
Während sich die „Einführung in die Theoretische Physik“ (Theorie 1) überwiegend mit der Newton’schen Bewegungsgleichung, ihren Invarianzeigenschaften
und ihren physikalischen Vorhersagen befasste, werden wir uns im Folgenden
(im Rahmen der Theorie-2-Vorlesung) mit dem Gedankengut von Newtons Erben auseinandersetzen. Die analytische Mechanik wurde im 18. und 19. Jahrhundert insbesondere von d’Alembert, Euler, Lagrange, Hamilton und Jacobi
vorangetrieben, wobei allerdings auch viele andere (Johann Bernoulli, Maupertuis, Gauß, Cauchy, Poisson, Poincaré, . . . ) wichtige Beiträge geliefert haben.
Als wichtigste Weiterentwicklungen im 20. Jahrhundert können wohl die Theorie dynamischer Systeme (mit Anwendungen in der Himmelsmechanik) und - im
weiteren Sinne - die spezielle und allgemeine Relativitätstheorie, die Statistische
Mechanik und die Quantenmechanik angesehen werden. Die Verzweigungen der
Mechanik sind mittlerweile so zahlreich und ihre Methoden auch in anderen Bereichen so wertvoll, dass sie ohne Übertreibung als Fundament der Theoretischen
Physik angesehen werden kann.
In der Theorie-1-Vorlesung haben wir die Newton’sche Bewegungsgleichung,
ṗi = Fi (X, Ẋ, t) ,
pi ≡ mi ẋi
,
mit
X ≡ (x1 , x2 , . . . , xN ) ,
Ẋ ≡ (ẋ1 , ẋ2 , . . . , ẋN )
als Kern einer recht aussagekräftigen Theorie kennen gelernt, mit deren Hilfe sich
grundsätzlich jedes Problem der Mechanik beschreiben lässt. Die Frage, warum
die Theorie hiermit nicht bereits abgeschlossen ist, ja: warum sie überhaupt
weiterentwickelt werden soll, ist daher durchaus berechtigt.
Ein offensichtlicher Grund, weshalb die bisher vorgestellte Theorie nicht als
abgeschlossen gelten kann, ist, dass sie nur für einzelne Teilchen (Massenpunkte)
formuliert und untersucht wurde. Im Hinblick auf die Anwendung der Theorie in
der realen Welt muss die Newton’sche Mechanik unbedingt auch für starre und
elastische Körper und für ideale und zähe Flüssigkeiten weiterentwickelt werden.
Zur Lösung dieser Aufgabe hat insbesondere Euler sehr viel beigetragen; auch
die Arbeiten von Cauchy (über elastische Körper) und Navier und Stokes (über
zähe Flüssigkeiten) waren auf diesem Gebiet von großer Bedeutung.
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Es gibt jedoch noch viele andere Fragen, die von der Newton’schen Mechanik nicht beantwortet werden. Man möchte z. B. besser verstehen, warum die
Newton’sche Bewegungsgleichung, die ja die physikalische Bahn eines Systems
bestimmt, überhaupt gilt: Ist die physikalische Bahn in irgendeinem Sinne (im
Vergleich zu anderen denkbaren Bahnen zwischen den gleichen Anfangs- und
Endpunkten) ausgezeichnet? Ist sie in irgendeinem Sinne „optimal“? Diese Frage konnte – wie wir sehen werden – in sehr eleganter Weise von Euler, Lagrange
und Hamilton beantwortet werden.
Des Weiteren ist die Newton’sche Bewegungsgleichung zunächst einmal in
kartesischen Koordinaten formuliert und gilt zunächst nur in Inertialsystemen.
Man möchte daher wissen, welche Bewegungsgleichungen für nicht-kartesische
Koordinaten und Nicht-Inertialsysteme gelten und natürlich auch, welche Symmetrie- und Invarianzeigenschaften diese neuen Gleichungen besitzen. Eine ähnliche Frage drängt sich auf für die große und wichtige Klasse von Systemen mit
Zwangsbedingungen (man denke z. B. an das sphärische und das mathematische
Pendel oder an Hantelmoleküle). Außerdem stellt sich generell die Frage nach
allgemeinen Lösungsverfahren für mechanische Probleme: Welche Form der Bewegungsgleichung ist am besten als Startpunkt für formale Untersuchungen geeignet? Wie ist die Bewegungsgleichung zu transformieren, damit sie sich wesentlich vereinfacht? Zur Beantwortung dieser Frage haben insbesondere Hamilton
und Jacobi viel beigetragen. Schließlich hat sich herausgestellt, dass die Newton’sche Theorie für bestimmte Anwendungen und Weiterentwicklungen nicht
die optimale Formulierung ist; Beispiele sind die Durchführung der Störungstheorie in der Himmelsmechanik und die Entwicklung der Quantenmechanik.
Aus allen diesen Gründen brauchen wir ein wesentlich tieferes Verständnis der Struktur der klassischen Mechanik, und wir müssen uns mit weiteren
wichtigen Anwendungen (z. B. mit der Physik starrer bzw. elastischer Körper)
auseinander setzen. Dementsprechend werden wir uns im Folgenden sowohl mit
den Grundlagen als auch mit der Anwendung befassen, wobei wir allerdings sehen werden, dass Grundlage und Anwendung in der analytischen Mechanik oft
Hand in Hand gehen.
In diesem zweiten Kapitel der Theorie-2-Vorlesung versuchen wir, einige der
oben angesprochenen Fragen zu beantworten. Wir werden klären, inwiefern die
physikalische Bahn in irgendeinem Sinne ausgezeichnet ist, und wir betrachten
Nicht-Inertialsysteme, nicht-kartesische Koordinatensysteme und Systeme mit
Zwangsbedingungen. Außerdem untersuchen wir die Beziehung zwischen den
Symmetrien eines physikalischen Systems und seinen Erhaltungsgrößen. Der
Formalismus, der uns die Beantwortung aller dieser Fragen ermöglicht, wurde – wie bereits angedeutet – insbesondere von d’Alembert, Euler, Lagrange,
Hamilton und Jacobi geprägt und ist aufgrund von dessen herausragender Rolle
zu Recht nach dem größten Mathematiker des 18. Jahrhunderts, Joseph Louis
Lagrange, benannt worden.
2.1
Die Newton’sche Mechanik
Bevor wir uns mit der Weiterentwicklung der Newton’schen Theorie befassen,
rufen wir zuerst ihre wichtigsten Ausgangspunkte und Resultate in Erinnerung.
Aufgrund des deterministischen Prinzips der klassischen Mechanik ist die
physikalische Bahn X(t) = (x1 (t), . . . , xN (t)) eines N -Teilchen-Systems voll-
26
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
ständig durch die Anfangswerte der Koordinaten und Geschwindigkeiten festgelegt. Die entsprechende (nach Newton benannte) Bewegungsgleichung lautet
für den Spezialfall zeitunabhängiger träger Massen mi :
mi ẍi = Fi (X, Ẋ, t)
(2.1)
(i = 1, 2, . . . , N ) ,
wobei Fi die auf das i-te Teilchen einwirkende Kraft darstellt. Die Newton’sche
Bewegungsgleichung (2.1) wird in kartesischen Koordinaten formuliert und gilt
zunächst nur für Inertialsysteme. Die Gesamtkraft Fi in (2.1) ist im Allgemeinen
(in)
aufgebaut aus inneren Kräften Fi , die aufgrund von Wechselwirkung mit
(ex)
anderen Teilchen auf das i-te Teilchen wirken, und äußeren Kräften Fi , die
die Wechselwirkung des N -Teilchen-Systems mit der „Außenwelt“ darstellen:
(in)
Fi = Fi
(ex)
({xji }, {ẋji }) + Fi
(X, Ẋ, t) .
Hierbei kann man häufig annehmen, dass die inneren Kräfte das dritte Newton’sche Gesetz erfüllen:
(in)
Fi
=
X
,
fji
j6=i
fji = fji (|xji |)x̂ji
.
Für solche Kräfte, die das Gesetz „actio = −reactio“ erfüllen und konservativ
sind, gilt
(in)
Fi
= −∇i Vin
(i = 1, 2, . . . , N ) ,
wobei das Potential der inneren Kräfte durch
Vin (X) =
X
i<j
Vji (|xji |) ,
Z
x
Vji (x) = Vji (x0 ) +
dx′ fji (x′ )
x0
gegeben ist. Analog gilt für konservative äußere Kräfte:
(ex)
Fi
= −∇i Vex
(i = 1, 2, . . . , N ) ,
(ex)
so dass auch Fi in diesem Fall aus einem Potential Vex (X) abgeleitet werden
kann. Definieren wir also ein Gesamtpotential
V (X) ≡ Vin (X) + Vex (X)
,
so gilt
Fi = −(∇i V )(X)
.
Es ist bemerkenswert, dass Fi in diesem Fall weder von den Geschwindigkeiten
{ẋj } noch explizit von der Zeitvariablen t abhängig ist.
Bei der weiteren Diskussion gibt es einen wesentlichen Unterschied zwischen
abgeschlossenen mechanischen Systemen und Teilsystemen.
Abgeschlossene mechanische Systeme sind dadurch definiert, dass keine äußeren Kräfte auftreten bzw. dass diese für alle praktischen Zwecke vernachlässigt
werden können:
(ex)
Fi
=0
(i = 1, 2, . . . , N ) .
27
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
In diesem Fall gilt das Relativitätsprinzip, das die Existenz von Inertialsystemen postuliert. Es sei daran erinnert, dass Inertialsysteme durch die zwei Eigenschaften charakterisiert sind, dass alle physikalischen Gesetze in allen Inertialsystemen gleich sind und dass alle Koordinatensysteme, die sich relativ
zu einem Inertialsystem in geradlinig-gleichförmiger Bewegung befinden, selbst
auch Inertialsysteme sind. Inertialsysteme sind durch Galilei-Transformationen
der Form
x′ (x, t) = σR(α)−1 x − vt − ξ
,
t′ (x, t) = t − τ
verbunden; unter solchen Transformationen ist die Newton’sche Bewegungsgleichung also forminvariant. Für abgeschlossene Systeme gilt allgemein, dass der
Gesamtimpuls, der Gesamtdrehimpuls und die Gesamtenergie erhalten sind.
Beispiele von abgeschlossenen mechanischen Systemen sind das allgemeine Zweiteilchenproblem (mit dem Kepler-Problem als Spezialfall) und das allgemeine
N -Teilchen-Problem (mit den „kleinen Schwingungen“ als Spezialfall). Das Sonnensystem kann in guter Näherung als abgeschlossenes System angesehen werden.
(ex)
Teilsysteme sind an die Außenwelt gekoppelt; für sie gilt Fi 6= 0 für mindestens ein i ∈ {1, 2, . . . , N }. Die Bewegungsgleichung für Teilsysteme ist nicht
ohne Weiteres forminvariant unter Galilei-Transformationen. Ihre Forminvarianz setzt voraus, dass das Transformationsverhalten der äußeren Kräfte explizit
bekannt ist und dass sie bei der Galilei-Transformation mittransformiert werden. Von den vorher für abgeschlossene Systeme erwähnten Erhaltungsgrößen
ist für Teilsysteme nur die Gesamtenergie erhalten, vorausgesetzt, dass sowohl
die inneren als auch die äußeren Kräfte konservativ sind. Für den Gesamtimpuls
und den Gesamtdrehimpuls erhält man jedoch die Bewegungsgleichungen
dP X (ex)
=
Fi (X, Ẋ, t) ≡ F(ex) (X, Ẋ, t)
dt
i=1
N
und
dL X
(ex)
=
xi × Fi ≡ N(ex) (X, Ẋ, t) ,
dt
i=1
N
die zeigen, dass diese physikalischen Größen für Teilsysteme im Allgemeinen
nicht erhalten sind. Da diese Bewegungsgleichungen Vektor identitäten sind, ist
es jedoch durchaus möglich, dass eine der Komponenten von F(ex) oder eine
Komponente des Gesamtdrehmoments N(ex) Null ist; in diesem Fall wäre die
entsprechende Komponente von P bzw. L erhalten. Bekannte Beispiele von Teilsystemen sind der harmonische Oszillator mit Reibung und einer antreibenden
Kraft, das sphärische Pendel (mit dem mathematischen Pendel als Spezialfall)
und das geladene Teilchen in einem elektromagnetischen Feld, auf das also die
Lorentz-Kraft FLor = q(E + ẋ × B) wirkt.
2.2
Die Lagrange-Funktion
Bemerkenswert an der Newton’schen Mechanik ist, dass die Bewegungsgleichung
mi ẍi = Fi Vektorcharakter hat und die Gesamtenergie durch zwei skalare
28
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
P
Größen, die kinetische Energie Ekin = i 12 mi ẋ2i und die potentielle Energie
V ({xj }), bestimmt ist. Wir nehmen hierbei an, dass die Kräfte konservativ
sind. Die Begriffe „Vektor“ und „Skalar“ werden hierbei – im Sinne der Tensorrechnung – durch das Transformationsverhalten der Kräfte bzw. der Energien
unter orthogonalen Transformationen bestimmt. Im Folgenden zeigen wir – zunächst nur für einige Spezialfälle –, dass sowohl die Bewegungsgleichung als auch
die Gesamtenergie in vielen Fällen durch eine einzelne skalare Funktion, die sogenannte Lagrange-Funktion, bestimmt werden. Aufgrund der Tatsache, dass
die Kenntnis einer einzelnen skalaren Funktion die Dynamik komplizierter Vielteilchensysteme vollständig festlegt, vereinfacht sich der Formalismus in hohem
Maße. Im Verlauf dieses Kapitels werden wir sehen, dass diese Vereinfachung
nicht nur für die Newton’sche Mechanik in kartesischen Koordinaten zutrifft,
sondern weitgehend verallgemeinert werden kann.
Ein Wort vorab über Ableitungen. Wir werden im Folgenden Energien und
Kräfte betrachten, die – in einem N -Teilchen-System – von den Variablen
(X, Ẋ, t), d. h. von den Koordinaten der Teilchen, ihren Geschwindigkeiten und
eventuell explizit von der Zeitvariablen t abhängen können. Diese physikalischen
Größen sind für beliebige Werte der Variablen X, Ẋ und t definiert und werden dementsprechend auch als Funktionen von 6N + 1 unabhängigen Variablen
∂
(X, Ẋ, t) aufgefasst. Dies bedeutet konkret, dass bei der Ableitung ∂xjα bzw.
∂
∂ ẋjα
∂
die
(mit j = 1, 2, . . . , N und α = 1, 2, 3) oder bei der Zeitableitung ∂t
anderen 6N Variablen festzuhalten sind.
Neben den 6N +1 unabhängigen Variablen (X, Ẋ, t) werden wir zur Beschreibung der physikalischen Bahn, die die Lösung der Newton’schen Bewegungsgleichung zu vorgegebenen Anfangsbedingungen {xj (0)} und {ẋj (0)} darstellt,
die Notation {xφj (t)} bzw. Xφ (t) einführen. Generell werden die Eigenschaften
(z. B. die Energien, Kräfte, usw.) der physikalischen Bahn im Folgenden mit
Hilfe des Index „φ“ bezeichnet. In der Literatur sind Aussagen, die für allgemeine Bahnen {xj (t)} zutreffen, und solche, die nur für die physikalische Bahn
{xφj (t)} gelten, oft nicht klar getrennt. In diesem Abschnitt werden wir den
Unterschied explizit angeben; falls Missverständnisse ausgeschlossen sind, wird
der Index „φ“ in späteren Abschnitten unterdrückt.
Betrachten wir zunächst den einfachen Fall eines einzelnen Teilchens unter
der Einwirkung einer konservativen äußeren Kraft. Die kinetische Energie kann
(für allgemeine Bahnen und insbesondere auch für die physikalische Bahn) mit
Hilfe einer Funktion T (ẋ) beschrieben werden, die nur von der Geschwindigkeit
des Teilchens abhängt:
T (ẋ) = 21 mẋ2
,
2
Ekin (t) ≡ 21 m [ẋφ (t)] = T (ẋφ (t))
,
und die äußere Kraft kann aus einem Potential abgeleitet werden:
F(x) = F(ex) (x) = −(∇V )(x)
.
Mit Hilfe der Definition
L(x, ẋ) ≡ T (ẋ) − V (x)
kann die Bewegungsgleichung mẍφ = − ∂V
∂x (xφ ) daher in der Form einer Lagrange-
29
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Gleichung,1
d
∂V
∂V
(xφ ) = (mẋφ ) +
(xφ )
∂x ˜
dt
∂x
•
•
˜
∂V
∂L
d ∂L
d ∂T
(ẋφ ) +
(xφ ) =
(xφ , ẋφ ) −
(xφ , ẋφ )
=
dt ∂ ẋ
∂x
dt ∂ ẋ
∂x
0 = mẍφ +
,
d. h. als
•
˜
∂L
d ∂L
(xφ , ẋφ ) −
(xφ , ẋφ ) = 0
dt ∂ ẋ
∂x
geschrieben werden. Auch die Gesamtenergie des Teilchens in der physikalischen
Bahn lässt sich mit Hilfe der Funktion L ausdrücken:
E = T (ẋφ ) + V (xφ ) = mẋ2φ − [T (ẋφ ) − V (xφ )]
∂T
∂L
= ẋφ ·
(ẋφ ) − L(xφ , ẋφ ) = ẋφ ·
(xφ , ẋφ ) − L(xφ , ẋφ )
∂ ẋ
∂ ẋ
.
Wir stellen fest, dass die Dynamik dieses einfachen Systems in der Tat vollständig durch eine einzelne skalare Funktion L(x, ẋ) beschrieben werden kann. Die
Funktion L wird als die Lagrange-Funktion für dieses Problem bezeichnet. Wir
werden im Folgenden sehen, dass die Darstellung der Bewegungsgleichung und
der Gesamtenergie E mit Hilfe einer Lagrange-Funktion L auch auf komplexere
physikalische Systeme übertragen werden kann.
Die Verallgemeinerung auf N -Teilchen-Systeme mit konservativen inneren
und äußeren Kräften ist einfach. Die kinetische Energie ist nun durch
T (Ẋ) =
N
X
2
1
2 mi ẋi
,
i=1
Ekin ≡ T (Ẋφ )
und das Potential durch
V (X) = Vin (X) + Vex (X)
gegeben. Die Bewegungsgleichung lautet
•
0 = mi ẍφi − Fφi = mi ẍφi +
˜
∂V
∂V
d ∂T
(Xφ ) =
(Ẋφ ) +
(Xφ ) ,
∂xi
dt ∂ ẋi
∂xi
so dass mit der Definition
L(X, Ẋ) ≡ T (Ẋ) − V (X)
nun die Lagrange-Gleichung
•
˜
∂L
d ∂L
(Xφ , Ẋφ ) −
(Xφ , Ẋφ ) = 0
dt ∂ ẋi
∂xi
1 Diese
(i = 1, 2, . . . , N )
Gleichung wird in der Variationsrechnung als Euler-Lagrange-Gleichung bezeichnet.
Der Sprachgebrauch in der Physik ist differenzierter: Die Bestimmungsgleichung extremaler
Lösungen von Variationsprinzipien wird in der Punktmechanik als Lagrange-Gleichung bezeichnet und nur in der Kontinuumsmechanik bzw. klassischen Feldtheorie als Euler-LagrangeGleichung.
30
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
oder auch kurz
•
˜
∂L
d ∂L
(Xφ , Ẋφ ) = 0
(Xφ , Ẋφ ) −
dt ∂ Ẋ
∂X
gilt. Für die erhaltene Gesamtenergie erhält man den Ausdruck:
X
E = T (Ẋφ ) + V (Xφ ) =
=
X
i
i
”
—
mi ẋ2φi − T (Ẋφ ) − V (Xφ )
∂L
∂L
(Xφ , Ẋφ ) − L(Xφ , Ẋφ ) ,
ẋφi ·
(Xφ , Ẋφ ) − L(Xφ , Ẋφ ) = Ẋφ ·
∂ ẋi
∂ Ẋ
so dass die skalare Lagrange-Funktion L wiederum ausreicht, die Dynamik des
Systems vollständig zu beschreiben.
Als nächste Stufe der Verallgemeinerung betrachten wir ein N -TeilchenSystem mit inneren Kräften, die – wie vorher – das dritte Newton’sche Gesetz
erfüllen, und äußeren Kräften, die zwar aus einem Potential abgeleitet werden
können, nun aber explizit zeitabhängig sind:
(ex)
Fi
wf
= −(∇i Vex
)(X, t)
.
Solche Kräfte, die im Allgemeinen nicht-konservativ sind, werden als wirbelfrei bezeichnet. Da die Kräfte nicht konservativ sind, ist die Gesamtenergie des
Systems im Allgemeinen nicht erhalten. Wir konzentrieren uns im Folgenden
daher auf die Formulierung der Bewegungsgleichung mit Hilfe einer LagrangeFunktion. Aus der Definition
L(X, Ẋ, t) ≡ T (Ẋ) − V (X, t)
mit
wf
V (X, t) ≡ Vin (X) + Vex
(X, t)
folgt nun:
•
0 = mi ẍφi − Fφi
d
=
dt

∂T
∂ ẋi
‹
∂V
+
∂xi
˜
φ
•
d
=
dt

∂L
∂ ẋi
‹
∂L
−
∂xi
˜
,
φ
so dass die Bewegungsgleichung sogar für diesen recht allgemeinen zeitabhängigen Fall die Form einer Lagrange-Gleichung,
•
d
dt

∂L
∂ ẋi
‹
−
∂L
∂xi
˜
=0
,
φ
hat und somit vollständig durch die skalare Funktion L = T − V bestimmt
wird. Der Index „φ“ deutet wie üblich an, dass die entsprechenden Größen für
die physikalische Bahn auszuwerten sind. Beispiele von wirbelfreien Kraftfeldern wären langsam veränderliche elektrische Felder oder zeitlich veränderliche
Gravitationskräfte.
Da wir nun sowohl konservative (ortsabhängige) als auch wirbelfreie (ortsund zeitabhängige) Kräfte mit Hilfe einer Lagrange-Funktion beschreiben können, stellt sich die Frage, ob sich das Konzept der Lagrange-Funktion auch auf
31
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
geschwindigkeitsabhängige Kräfte übertragen lässt. Wir untersuchen diese Frage zuerst für den wichtigen Spezialfall elektromagnetischer Kräfte. Falls sich im
elektromagnetischen Feld nur ein einzelnes geladenes Teilchen der Masse m und
Ladung q befindet, lautet die Bewegungsgleichung
mẍφ = FLor (xφ , ẋφ , t) = q [E(xφ , t) + ẋφ × B(xφ , t)]
,
wobei die (E, B)-Felder bekanntlich (siehe Kapitel 2 der Rechenmethoden-2Vorlesung) aus den elektromagnetischen Potentialen (Φ, A) abgeleitet werden
können:
E = −∇Φ −
∂A
∂t
,
B=∇×A .
Aufgrund dieser Darstellung der Felder mit Hilfe von Potentialen sieht man
leicht ein, dass auch die Lorentz-Kraft FLor aus einem Potential
VLor (x, ẋ, t) ≡ q [Φ(x, t) − ẋ · A(x, t)]
abgeleitet werden kann, wobei das Potential nun allerdings nicht nur orts- und
zeit- sondern auch geschwindigkeitsabhängig ist. Aus der Vektoridentität
ẋ × (∇ × A) = ∇(ẋ · A) − (ẋ · ∇)A
folgt nämlich:
•
˜
FLor (x, ẋ, t) = q(E + ẋ × B) = q −∇Φ −
§
•
∂A
+ ẋ × (∇ × A)
∂t
˜ª
∂A
∂
+ (ẋ · ∇)A
= q − (Φ − ẋ · A) −
∂x
∂t
∂
d
∂VLor
d ∂VLor
= − VLor − q A = −
+
∂x
dt
∂x
dt ∂ ẋ
.
Mit Hilfe der Definition
L(x, ẋ, t) ≡ T (ẋ) − VLor (x, ẋ, t)
vereinfacht sich die Bewegungsgleichung also zu
•

‹
d ∂T
0 = mẍφ − FLor (xφ , ẋφ , t) =
−
dt ∂ ẋ
• 
‹
d ∂L
−
=
dt ∂ ẋ

d ∂VLor
dt
∂ ẋ
˜
∂L
,
∂x φ
‹
∂VLor
+
∂x
˜
φ
so dass die Dynamik des Systems auch in diesem Fall vollständig durch eine
einzelne skalare Lagrange-Funktion bestimmt ist. Diese Schlussfolgerung lässt
sich leicht verallgemeinern: Für N geladene Teilchen kann die Lorentz-Kraft
nämlich als
FLor
i
d
= qi [E(xi , t) + ẋi × B(xi , t)] =
dt
Lor
∂Vex
∂ ẋi
mit
Lor
Vex
(X, Ẋ, t) =
N
X
i=1
qi [Φ(xi , t) − ẋi · A(xi , t)]
−
Lor
∂Vex
∂xi
32
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
geschrieben werden. Falls die inneren Kräfte des N -Teilchen-Systems das dritte
Newton’sche Gesetz erfüllen und die eventuell vorliegenden nicht-elektromagnetischen Kräfte wirbelfrei sind, kann die Gesamtkraft
(in)
Fi = Fi
(wf)
+ Fi
+ FLor
=
i
d
dt

∂V
∂ ẋi
‹
−
∂V
∂xi
aus dem Potential
wf
Lor
V (X, Ẋ, t) ≡ Vin + Vex
+ Vex
abgeleitet werden, und es folgt wiederum
•
d
dt

∂L
∂ ẋi
‹
∂L
−
∂xi
˜
=0
L(X, Ẋ, t) ≡ T − V
,
φ
.
Sogar in diesem recht allgemeinen und komplexen Fall kann die Dynamik in der
Form einer einzelnen Funktion zusammengefasst werden.
Es ist übrigens nicht so, dass alle möglichen Kraftgesetze mit Hilfe einer geeigneten Lagrange-Funktion in der Form einer Lagrange-Gleichung geschrieben
werden können. Eine wichtige Ausnahme, für die keine Lagrange-Funktion existiert, sind Reibungskräfte: Zum Beispiel lässt sich die Bewegungsgleichung für
ein einzelnes Teilchen,
wf
mẍφ = −(∇Vex
)(xφ , t) + FR (ẋφ )
mit
FR = −k ẋφ
,
nicht als €Lagrange-Gleichung
schreiben, da die Reibungskraft FR (ẋ) nicht in der
Š
∂VR
∂VR
d
mit
V
−
Form dt
R = VR (x, ẋ, t) dargestellt werden kann. In diesem
∂ ẋ
∂x
Fall benötigt man zwei skalare Funktionen, um die Dynamik des Systems zu
beschreiben. Neben der Lagrange-Funktion
wf
L(x, ẋ, t) = T (ẋ) − Vex
(x, t)
,
die den Einfluss der wirbelfreien äußeren Kraft beschreibt, führt man üblicherweise noch eine Dissipationsfunktion F ein:
FR = −
∂F
∂ ẋ
,
F(ẋ) ≡ 21 k ẋ2
.
Mit Hilfe dieser zwei skalaren Funktionen L und F kann die Bewegungsgleichung
nun als
• 
‹
˜
d ∂L
∂L ∂F
+
=0
−
dt ∂ ẋ
∂x
∂ ẋ φ
geschrieben werden. Das Konzept der Dissipationsfunktion, das erstmals von
Rayleigh eingeführt wurde, kann problemlos für N -Teilchen-Systeme verallgemeinert werden.
Abschließend stellen wir fest, dass die Newton’sche Bewegungsgleichung für
viele Systeme (jedoch nicht für alle) als Lagrange-Gleichung darstellbar ist. Im
Folgenden zeigen wir, dass, falls eine Darstellung als Lagrange-Gleichung möglich ist, die physikalische Bahn aus einem Extremalprinzip bestimmt werden
kann. Das Extremalprinzip liefert eine präzise Antwort auf die am Anfang dieses
Kapitels gestellte Frage, wodurch die physikalische Bahn unter allen denkbaren
Bahnen zwischen fest vorgegebenen Anfangs- und Endpunkten ausgezeichnet
ist.
33
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
2.3
Das Hamilton’sche Extremalprinzip
Der Einfachheit halber betrachten wir zunächst nur ein einzelnes Teilchen,
dessen Dynamik durch die Lagrange-Funktion L(x, ẋ, t) bestimmt wird. Die
Anfangsbedingungen seien so, dass das Teilchen sich zur Zeit t1 am Ort x1 und
zur späteren Zeit t2 am Ort x2 befindet. Unsere Aufgabe ist also, zu klären, in
welcher Hinsicht die physikalische Bahn xφ , die die Lagrange-Gleichung
d
dt

∂L
∂ ẋ
‹
−
∂L
=0
∂x
und die Anfangs- und Endbedingungen xφ (t1 ) = x1 und xφ (t2 ) = x2 erfüllt,
unter allen denkbaren Bahnen x(t) mit x(t1 ) = x1 und x(t2 ) = x2 ausgezeichnet ist. Die Antwort auf eine solche Frage nach tieferem Verständnis ist – wie
immer – nur dann hilfreich, wenn sie konzeptionell einfacher als die ursprüngliche Formulierung (d. h. in diesem Fall also die Lagrange-Gleichung) ist. Das
Hamilton’sche Extremalprinzip ist in diesem Sinne äußerst hilfreich, da es alle
möglichen Probleme der Lagrange’schen Mechanik und somit – wie wir gesehen
haben – sehr viele Probleme der Newton’schen Mechanik in der einfachen (oder
zumindest kurzen und eleganten) Formel
(2.2)
δS = 0
zusammenfasst. Die Kürze dieser Formel ist jedoch trügerisch: Konzeptionell ist
sie keineswegs trivial. Im Folgenden wird erklärt, was die Symbole δ und S und
die Null im rechten Glied genau bedeuten und in welchem Sinne beide Glieder
gleich sind.
Eine zentrale Rolle im Hamilton’schen Extremalprinzip spielt das sogenannte Wirkungsfunktional
(x ,t )
S(x12,t12) [x]
Zt2
=
dt L(x(t), ẋ(t), t)
,
t1
das meistens kurz als S[x] oder S geschrieben und als die Wirkung bezeichnet
wird. Das Wirkungsfunktional S[x] ist in der Tat ein Funktional , da es Funktionen (nämlich alle möglichen Bahnen x(t) mit x(t1 ) = x1 und x(t2 ) = x2 ,
insbesondere also auch die physikalische Bahn xφ (t)) auf reelle Zahlen abbildet:
(x ,t )
S[x] ∈ R. Außerdem ist das Wirkungsfunktional S(x12,t12) in ihrer Abhängigkeit von den Anfangs- und Endkoordinaten (x1 , t1 ) bzw. (x2 , t2 ) eine normale
Funktion. Das Wirkungsfunktional hat die physikalische Dimension [Energie]
× [Zeit] = [Wirkung] . Hiermit ist die Bedeutung des Symbols S in (2.2)
geklärt.
Wir betrachten das Wirkungsfunktional im Folgenden für die physikalische
Bahn xφ (t) und auch für benachbarte Bahnen x(t), die also nur geringfügig von
der physikalischen Bahn abweichen:
x(t) = xφ (t) + εξ(t)
(ξ(t) ∈ R3 fest, ε ≪ 1) .
(2.3)
Wir sind hierbei insbesondere am Verhalten der Wirkung im Limes ε → 0
interessiert. Wegen der Bedingungen x(t1 ) = x1 und x(t2 ) = x2 muss
ξ(t1 ) = ξ(t2 ) = 0
34
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
gelten; ansonsten ist die Funktion ξ(t) beliebig. Um die Variation der Bahn nahe
xφ untersuchen zu können, führen wir die Notation δx ein:
(δx)(t) ≡ x(t) − xφ (t) = εξ(t)
und bezeichnen den Operator δ als Variation. Wir werden diesen Operator auch
allgemeiner verwenden, um die Abweichung von physikalischen Größen von ihrem Wert für die physikalische Bahn zu beschreiben. Betrachten wir ein paar
Beispiele: Die Variation δ ẋ der Geschwindigkeit ist durch
(δ ẋ)(t) ≡ ẋ(t) − ẋφ (t) = εξ̇(t)
definiert. Sei G(x, ẋ, t) allgemein eine Größe, die von den Bahnkoordinaten, der
Geschwindigkeit und der Zeit abhängig ist. Ihre Variation δG ist dann durch
(δG)(x, ẋ, t) ≡ G(x(t), ẋ(t), t) − G(xφ (t), ẋφ (t), t)
gegeben, wobei x(t) die benachbarte Bahn (2.3) von xφ darstellt. Es ist wichtig,
zu beachten, dass hierbei nur die Bahnvariablen (x(t), ẋ(t)) und nicht die Zeit t
variiert werden. Die Variation δS des Wirkungsfunktionals ist schließlich durch
(x ,t )
(x ,t )
(x ,t )
(δS)(x21 ,t21 ) [x] ≡ S(x12,t12) [x] − S(x12,t12) [xφ ]
(x ,t )
(x ,t )
= S(x12,t12) [xφ + εξ] − S(x12,t12) [xφ ]
gegeben. Die Variation δ hat die Eigenschaft, dass sie mit der Zeitableitung
kommutiert:

‹
δ
dxφ
d(x − xφ )
d
dx
x (t) =
(t) −
(t) =
(t) =
dt
dt
dt
dt

‹
d
δx (t)
dt
oder kurz:
d
d
= δ
dt
dt
δ
.
Außerdem kommutiert die Variation δ mit bestimmten Integralen:
Zt2
Zt2
dt L(x(t), ẋ(t), t) =
δ
t1
t1
Zt2
=
t1
Zt2
dt L(x(t), ẋ(t), t) −
dt L(xφ (t), ẋφ (t), t)
t1
”
Zt2
dt (δL)(x(t), ẋ(t), t)
=
t1
oder kurz:
Zt2
δ
Zt2
dt =
t1
dt δ
t1
.
—
dt L(x(t), ẋ(t), t) − L(xφ (t), ẋφ (t), t)
d
dt
35
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
36
Hiermit sind auch die Bedeutung und einige der Eigenschaften des Symbols δ
in (2.2) geklärt.
Das Hamilton’sche Extremalprinzip besagt nun, dass das Wirkungsfunktional für x = xφ extremal ist. Dies bedeutet mathematisch, dass
(x ,t )
(δS)(x12 ,t12 ) [xφ + εξ] = O(ε2 )
(ε → 0)
und daher auch
1
(x ,t )
lim (δS)(x21 ,t21 ) [xφ + εξ] = 0
ε
(2.4)
ε→0
gilt. Da das linke Glied von (2.4) ein lineares Funktional von ξ darstellt, ist
auch die Null im rechten Glied von (2.4) oder (2.2) als Funktional zu interpretieren, und das Gleichheitszeichen in diesen beiden Gleichungen deutet daher
die Identität zweier Funktionale an.
Wir zeigen nun, dass das Hamilton’sche Extremalprinzip äquivalent zur
Lagrange-Gleichung ist. Hierzu berechnen wir 1ε δS und fordern, dass diese Größe im Limes ε → 0 Null ist:
1
1
δS = δ
ε
ε
1
=
ε
Zt2
t1
Zt2
t1
=
Zt2
dt (δL)(x(t), ẋ(t), t)
t1
”
—
dt L(xφ (t) + εξ(t), ẋφ (t) + εξ̇(t), t) − L(xφ (t), ẋφ (t), t)
Zt2
•
dt
t1
=
1
dt L(x(t), ẋ(t), t) =
ε
˜
∂L
∂L
(xφ (t), ẋφ (t), t) · ξ(t) +
(xφ (t), ẋφ (t), t) · ξ̇(t) + O(ε)
∂x
∂ ẋ
t
2
∂L
(xφ (t), ẋφ (t), t) · ξ(t)
∂ ẋ
t1
Zt2
§
dt
+
t1
•
˜ª
d ∂L
∂L
(xφ (t), ẋφ (t), t) −
(xφ (t), ẋφ (t), t)
∂x
dt ∂ ẋ
· ξ(t) + O(ε)
Der erste Term im rechten Glied ist Null wegen der Bedingung ξ(t1 ) = ξ(t2 ) = 0,
und die O(ε)-Korrektur ist im Limes ε → 0 vernachlässigbar. Das Hamilton’sche
Prinzip (2.4) kann also nur dann gelten, wenn für alle möglichen Funktionen ξ(t)
mit ξ(t1 ) = ξ(t2 ) = 0:
Zt2
§
dt
t1
•
˜ª
d ∂L
∂L
(xφ (t), ẋφ (t), t) −
(xφ (t), ẋφ (t), t)
∂x
dt ∂ ẋ
· ξ(t) = 0
gilt, und dies ist wiederum nur dann möglich, wenn die physikalische Bahn xφ
die Lagrange-Gleichung erfüllt:
•
˜
∂L
d ∂L
(xφ (t), ẋφ (t), t) −
(xφ (t), ẋφ (t), t) = 0 .
∂x
dt ∂ ẋ
(2.5)
Umkehrung dieser Argumentenkette zeigt, dass aus der Lagrange-Gleichung das
Hamilton’sche Prinzip folgt, so dass beide Gleichungen äquivalent sind.
.
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Um den mathematischen Inhalt der Lagrange-Gleichung (2.5) besser zu verstehen, schreiben wir die Variation δS der Wirkung in der Form
Zt2
•
dt
δS =
t1
d
∂L
−
∂x
dt

∂L
∂ ẋ
‹˜
φ
· (δx)(t) + O(ε2 ) ,
wobei der Index „φ“ wiederum andeutet, dass die entsprechende Größe an der
Stelle der physikalischen Bahn auszuwerten ist. Vergleicht man diesen Ausdruck
für δS nun mit der Variation einer normalen Funktion S({xi }) in der Nähe eines
Punktes {xφi }:
δS ≡ S({xφi + dxi }) − S({xφi }) =
X ∂S
i
∂xi
({xφi }) · dxi + . . .
,
wobei die Rolle der kontinuierlichen Variablen t also durch die diskrete Variable
i übernommen wird, so wird klar, dass das linke Glied der Lagrange-Gleichung
(2.5) als Ableitung des Funktionals S nach der Bahn x an der Stelle (xφ , t) zu
interpretieren ist:
•
d
∂L
−
∂x
dt

∂L
∂ ẋ
‹˜
=
φ
δS
[xφ ] .
δx(t)
δS
δx(t)
wird dementsprechend als Funktionalableitung bezeichnet.
Die Ableitung
Die Lagrange-Gleichung (2.5) impliziert daher, dass die Funktionalableitung des
Wirkungsfunktionals an der Stelle der physikalischen Bahn Null ist:
δS
[xφ ] = 0 .
δx(t)
Hiermit ist die genaue Bedeutung der Formel δS = 0 in (2.2) geklärt.
Der Deutlichkeit halber sollte betont werden, dass wir nur gezeigt haben,
dass das Wirkungsfunktional für die physikalische Bahn extremal, und nicht,
dass es „optimal“ (minimal oder maximal) ist. Um zu entscheiden, ob xφ einem
Minimum, Maximum oder Sattelpunkt von S[x] entspricht, müsste man offensichtlich die zweite Ableitung von S[x] an der Stelle x = xφ bestimmen. Da die
physikalische Bahn jedoch durch die Nullstellen der ersten Ableitung des Wirkungsfunktionals bestimmt wird, unerachtet, ob ein Minimum, Maximum oder
Sattelpunkt vorliegt, ist im Voraus schon klar, dass die Frage nach der Natur
des Extremums mathematisch zwar interessant, physikalisch jedoch vollkommen
irrelevant ist. Anhand konkreter Beispiele zeigt man außerdem leicht, dass die
physikalische Bahn (abhängig von den Anfangsbedingungen) sowohl ein Minimum als auch ein Maximum von S[x] darstellen kann, so dass das „Vorzeichen“
der zweiten Ableitung an der Stelle x = xφ offenbar unerheblich ist.
Die Verallgemeinerung des Hamilton’schen Prinzips auf beliebige N -TeilchenSysteme unter der Einwirkung innerer und äußerer Kräfte ist sehr einfach, vorausgesetzt zumindest, dass die Dynamik dieser Systeme mit Hilfe einer LagrangeFunktion beschrieben werden kann. Die physikalische Bahn kann nun als
Xφ (t) ≡ (xφ1 (t), . . . , xφN (t)) dargestellt werden, und das Wirkungsfunktional
ist durch
(X ,t )
S(X12,t12) [X]
Zt2
=
dt L(X(t), Ẋ(t), t)
t1
37
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
mit X(t) = (x1 (t), . . . , xN (t)), usw. gegeben. Das Hamilton’sche Prinzip lautet
1
(X ,t )
lim (δS)(X12 ,t12 ) [Xφ + εΞ] = 0 ,
ε
Ξ(t) ≡ {ξi (t)}
ε→0
mit ξi (t1 ) = ξ i (t2 ) = 0 für alle i = 1, 2, . . . , N , und aus dem Hamilton’schen
Prinzip folgt nun die Lagrange-Gleichung
•
˜
d ∂L
∂L
(Xφ , Ẋφ , t) −
(Xφ , Ẋφ , t) = 0
∂xi
dt ∂ ẋi
(i = 1, 2, . . . , N ) ,
bzw.
•
˜
∂L
d ∂L
(Xφ , Ẋφ , t) = 0
(Xφ , Ẋφ , t) −
∂X
dt ∂ Ẋ
,
die umgekehrt wiederum das Hamilton’sche Prinzip impliziert und auch als Bedingung für die Funktionalableitung der Wirkung,
δS
[Xφ ] = 0
δX(t)
,
geschrieben werden kann.
Zusammenfassend haben wir also gezeigt, dass die in der Lagrange-Gleichung
enthaltene Dynamik generell aus einem Variationsprinzip abgeleitet werden kann.
2.3.1
Einfache Beispiele aus der Variationsrechnung
Wir übersetzen einige altbekannte Variationsprobleme in die Sprache des Lagrange-Formalismus. Da diese Probleme allerdings statischer Natur sind, wird
die Rolle der Zeitvariablen hierbei durch eine relevante Länge übernommen, die
wir – um die Analogie zu verdeutlichen – mit dem Symbol t bezeichnen werden.
Kürzeste Verbindung zwischen zwei Punkten
Nehmen wir an, die Punkte (x1 , y1 , z1 ) und (x2 , y2 , z2 ) im dreidimensionalen
Raum sind durch eine Kurve K miteinander verbunden, die durch die Variable
x parametrisiert werden kann:
K=
€
Š
x, y(x), z(x) | x1 ≤ x ≤ x2
©
.
Gesucht ist die kürzeste Verbindung
È zwischen beiden Punkten. Da die infinitesimale Bogenlänge durch ds = (dx)2 + (dy)2 + (dz)2 gegeben ist, folgt die
Gesamtlänge der Kurve als
Zx2
S=
Zx2
ds =
x1
dx
È
1 + [y ′ (x)]2 + [z ′ (x)]2
.
x1
Wechselt man an dieser Stelle die Notation:
(x, y, z) → (t, x1 , x2 ) ≡ (t, x)
;
(xi , yi , zi ) → (ti , xi ) (i = 1, 2) ,
38
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
so entsteht ein Ausdruck für die Länge der Kurve:
Zt2
dt L(ẋ(t))
S=
L(ẋ) ≡
,
t1
È
1 + ẋ21 + ẋ22 =
p
1 + ẋ2
,
der die Form eines Wirkungsfunktionals für die Dynamik eines Teilchens im
zweidimensionalen x-Raum hat. Die Lagrange-Gleichung für ein Extremum dieser Wirkung (d. h. in der ursprünglichen Formulierung: für die kürzeste Verbindung) lautet

‹

‹
d
d ∂L
ẋ
∂L
√
=
−
,
dt ∂ ẋ
∂x
dt
1 + ẋ2
√
so dass ẋ/ 1 + ẋ2 und somit auch die „Geschwindigkeit“ ẋ selbst eine Erhaltungsgröße darstellt. Die Lösung des Minimierungsproblems ist daher:
0=
(t, x(t)) = (t1 , x1 ) + (1, ẋ1 )(t − t1 ) ,
ẋ1 ≡
x2 − x1
t2 − t1
,
und diese Lösung stellt in der ursprünglichen Formulierung genau eine Gerade
dar.
Die Brachystochrone
Gesucht ist nun nicht der kürzeste, sondern der schnellste Weg K im Schwerkraftfeld g = −gêz von (x1 , y1 , z1 ) nach (x2 , y2 , z2 ). Wir können o. B. d. A. annehmen, dass (x1 , y1 , z1 ) = 0 gilt, und wir wählen y2 = 0, so dass die physikalische Situation spiegelsymmetrisch bezüglich der (x, z)-Ebene ist und der Weg K
somit gänzlich in dieser Ebene verlaufen wird. Aus dem Energieerhaltungssatz
2
1
2 mv
+ mgz = E
folgt,Èdass die Geschwindigkeit des Teilchens energie- und höhenabhängig ist:
v = 2g(zE − z) mit zE ≡ E/mg. Die für den Weg K benötigte Zeitdauer ist
daher
Zt2
T =
Zs2
dt =
t1
0
ds
=
v
Ê
Zx2
dx
0
1 + (dz/dx)2
2g(zE − z)
.
Wechseln wir nun wie folgt die Notation:
(T, x, x2 , z − zE ) → (S, t, T, x) ,
so ist die zu minimierende Größe
Z
S[x] =
Ê
T
dt L(x, ẋ) ,
0
L(x, ẋ) =
1 + ẋ2
−2gx
formal äquivalent zum Wirkungsfunktional für ein Teilchen in einem eindimensionalen Raum. Start- und Endpunkt der Bahn x(t) sind hierbei durch
39
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
x(0) = −zE ≡ x1 ≤ 0 und x(T ) = z2 − zE ≡ x2 ≤ 0 gegeben. Die LagrangeGleichung für die Bahn des Teilchens,
d
dt

∂L
∂ ẋ
‹
−
∂L
=0 ,
∂x
kann nach einigen Umformungen auf
—
d ”
1
x(1 + ẋ2 ) = 0 bzw. x(1 + ẋ2 ) = − l
dt
2
vereinfacht werden, wobei − 21 l eine Integrationskonstante ist. Die Lösung dieser Differentialgleichung kann mit Hilfe einer Winkelvariablen ξ parametrisiert
werden,
t − t0 =
1
l[ξ − sin(ξ)]
4
,
1
x = − l[1 − cos(ξ)]
4
,
und hat somit die Form einer Zykloide (siehe auch § 4.4 des Theorie-1-Skripts).
Die Kettenlinie
Das Problem der „Kettenlinie“, also der von einer Kette (oder einem Seil) im
Schwerkraftfeld nahe der Erde beschriebenen Kurve, weicht insofern von den
beiden vorigen Problemen ab, als das „Wirkungsfunktional“ nun unter einer
Zwangsbedingung variiert werden soll. Im Falle der Kette ist das „Wirkungsfunktional“ durch die potentielle Energie der Kette im Schwerkraftfeld und die
Zwangsbedingung durch die konstante und vorgegebene Länge L der Kette gegeben. Wir bezeichnen die (konstant angenommene) Massendichte der Kette als
ρ, die Schwerkraftbeschleunigung als g und die kartesische Koordinate der Kette
parallel zur Erdoberfläche als t, so dass die Kette sich in der t-z-Ebene befindet.
Gesucht ist die Form z(t) der Kette mit minimaler potentieller Energie. Wir
nehmen der Einfachheit halber an, dass
Aufhängepunkte
der Kette
€ sich beide
Š
€
Š
auf gleicher Höhe befinden und durch − 12 ℓ, R bzw. + 21 ℓ, R , natürlich mit
ℓ ≤ L, gegeben sind.
Da die potentielle Energie der Kette und die Zwangsbedingung vorgegebener
Länge durch
1
Z2 ℓ
È
dt ρg z(t) 1 + [z ′ (t)]2
Epot =
− 12 ℓ
1
Z2 ℓ
,
dt
È
1 + [z ′ (t)]2 = L
− 21 ℓ
gegeben sind, kann das zu minimierende Wirkungsfunktional mit Hilfe eines
Lagrange-Parameters λ als
2
1
Z2 ℓ
S[z, λ] =
È
dt ρg z
− 12 ℓ
6
1 + (z ′ )2 − ρgλ 4
− 12 ℓ
1
2ℓ
Z
dt L (z(t), z ′ (t)) + ρgλL ,
=
− 12 ℓ
3
1
Z2 ℓ
È
dt
7
1 + (z ′ )2 − L5
È
L = ρg[z(t) − λ] 1 + [z ′ (t)]2
40
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
geschrieben werden. Die Stationarität von S als Funktion von λ und Funktional
von z impliziert nun:
1
1 ∂S
=L−
0=
ρg ∂λ
Z2 ℓ
dt
È
− 12 ℓ
•
1 ∂L
d
1 δS
=
−
0=
ρg δz(t)
ρg ∂z
dt
È
=
1 + (z ′ )2 −
(2.6)
1 + [z ′ (t)]2

∂L
∂z ′
‹˜
d
z′
(z − λ) È
dt
1 + (z ′ )2
(2.7)
.
Multiplikation von Gleichung (2.7) mit 2(z − λ)z ′ /
einmal:
2
È
1 + (z ′ )2 liefert zunächst
3
′
′
(z − λ)z d 4 (z − λ)z 5
È
0 = 2(z − λ)z ′ − 2 È
1 + (z ′ )2 dt
1 + (z ′ )2
8
2
32 9
<
′
(z − λ)z 5 =
d
=
(z − λ)2 − 4 È
dt :
1 + (z ′ )2 ;
und daher nach einer ersten Integration:
(z ′ )2
(z − λ)2
=
= a2 ≥ 0
′
2
1 + (z )
1 + (z ′ )2
(z − λ)2 1 −
Die Differentialgleichung z ′ = ±
€
t0 ±t
a
h€
Š
z−λ
a
Š2
i1/2
−1
hat im Allgemeinen die Lösun-
mit beliebigem t0 ∈ R. Die Symmetrie z(± 21 ℓ) = R
gen z(t) = λ + a cosh
erlaubt jedoch nur t0 = 0 €bzw.
Š z(t) = λ + a cosh(t/a), wobei λ und a außerdem
ℓ
die Bedingung λ + a cosh 2a = R erfüllen müssen.
Eine weitere Beziehung zwischen λ und a folgt aus Gleichung (2.6) als:
r
1
Z2 ℓ
L=
dt
ℓ/2a
Z
 ‹
1 + sinh
2
t
a
− 12 ℓ

dτ cosh(τ ) = 2a sinh
= 2a
0
ℓ
2a
‹
,
so dass der Parameter y ≡ 2a
ℓ (und somit a) durch die Bedingung L/ℓ =
y sinh(y −1 ) festgelegt ist. Hiermit folgt der Lagrange-Parameter λ als

λ = R − a cosh
ℓ
2a
‹
= R − 21 ℓy cosh(y −1 ) .
Die gesuchte Kettenlinie ist daher schließlich durch
•
z(t) = R + 12 ℓy cosh

2t
ℓy
‹
˜
− cosh(y −1 )
gegeben und hat offensichtlich die Form eines Kosinus-hyperbolicus.
41
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
2.4
Invarianzen der Lagrange-Gleichung
Wir diskutieren die Invarianz der Lagrange’schen Bewegungsgleichung unter
Galilei-Transformationen, unter Eichtransformationen (und allgemeiner: unter
Addition einer vollständigen Zeitableitung zur Lagrange-Funktion) und unter
„Zeitumkehr“. Wir betrachten zunächst die Addition einer vollständigen Zeitableitung zur Lagrange-Funktion.
2.4.1
Addition einer vollständigen Zeitableitung
Die Invarianz der Lagrange-Gleichung unter Hinzufügen einer vollständigen Zeitableitung einer beliebigen Funktion der Koordinaten und der Zeit:
L → L′ = L +
X
∂λ
d
ẋj · (∇j λ)({xi }, t) +
λ({xi }, t) = L +
({xi }, t)
dt
∂t
j
folgt daraus, dass der Zusatzterm
liefert:
d
dt

∂ dλ
∂ ẋi dt
‹
dλ
dt
"
keinen Beitrag zur Lagrange-Gleichung
∂
∂ dλ
d
−
=
∂xi dt
dt ∂ ẋi
=
X
j
∂λ
∂λ
ẋj ·
+
∂xj
∂t
!#
−
∂ dλ
∂xi dt
∂ dλ
d ∂λ
−
=0 .
dt ∂xi
∂xi dt
Noch klarer geht die Invarianz der Bewegungsgleichung unter Addition einer
vollständigen Zeitableitung daraus hervor, dass der Zusatzterm dλ
dt das Wirkungsfunktional nur um eine Konstante ändert:
(X ,t )
S ′ (X21 ,t21 )
Zt2
” —
dt L′ (X(t), Ẋ(t), t)
X =
t1
Zt2
•
˜
dt L(X(t), Ẋ(t), t) +
=
t1
(X ,t )
” —
d
λ(X(t), t)
dt
= S(X12,t12) X + λ(X2 , t2 ) − λ(X1 , t1 )
.
Da diese zusätzliche Konstante in der Wirkung für alle möglichen Bahnen X(t) =
{xi (t)} mit festen Anfangs- und Endpunkten X(t1 ) = X1 und X(t2 ) = X2 gleich
ist, spielt sie bei der Bestimmung der extremalen Lösung keine Rolle.
2.4.2
Galilei-Invarianz
Wir betrachten zunächst abgeschlossene mechanische Systeme, für die die Bewegungsgleichung automatisch forminvariant unter Galilei-Transformationen ist.
Um das Transformationsverhalten der Lagrange-Funktion bestimmen zu können, benötigen wir Information über die potentielle und die kinetische Energie.
Das Transformationsverhalten dieser beiden Größen ist bereits aus Abschnitt
3.2 des Theorie-1-Skripts bekannt: Die potentielle Energie ist invariant unter
Galilei-Transformationen:
V ′ = V (X′ ) = V (X) = V
,
42
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
vorausgesetzt, dass die inneren Kräfte das dritte Newton’sche Gesetz erfüllen.
Die kinetische Energie T wird wie folgt transformiert:
T′ =
X1
2
i
=
X1
2
i
=T +
mi (ẋ′i )2 =
X1
i
2
”
mi (ẋi − vα )2 = T +
d
λ(X, t)
dt
,
—2
mi σR(α)−1 (ẋi − vα )
λ≡
X 1
2
i
X
i
‹
2
mi vα
− mi ẋi · vα
1
2
mi vα
t − mi xi · vα
2
‹
.
Insgesamt ändert die Lagrange-Funktion sich also um eine vollständige Zeitableitung:
d
λ(X, t) ,
dt
und wir wissen bereits aus dem vorigen Abschnitt, dass dies die Bewegungsgleichung nicht beeinflusst.
Das Argument für die Invarianz der Bewegungsgleichung eines Teil systems
verläuft sehr ähnlich: Nun ist auch der Beitrag äußerer Kräfte mitzuberücksichtigen, und die Invarianz der Bewegungsgleichung erfordert, dass diese äußeren
Kräfte (die „Außenwelt“) bei der Galilei-Transformation explizit mittransformiert werden. Wir unterscheiden wieder nicht-elektromagnetische äußere Kräfte
und Lorentz-Kräfte . Damit die Bewegungsgleichung mi ẍi = Fi Galilei-invariant
ist, muss in beiden Fällen das vierte Newton’sche Gesetz (siehe Abschnitt [??]
des Theorie-1-Skripts) erfüllt sein:
L′ = T ′ − V ′ = L +
F′i = σR(α)−1 Fi
.
Betrachten wir nun zuerst die recht große Klasse von wirbelfreien (nicht-elektromagnetischen) äußeren Kräften. In diesem Fall muss das Potential invariant
sein, damit die Kräfte als echte Vektoren transformiert werden:
€
Š′
wf
wf
Vex
(X′ , t′ ) = Vex
(X, t)
€
wf
= Vex
{σR(α)x′i + vα (t′ + τ ) + ξ α } , t′ + τ
Š
,
denn dies impliziert:
′
Fiγ
=−
wf
€
Š
∂
∂
∂xiβ ∂Vex
wf ′
wf
Vex
=− ′
= − ′ Vex
′
∂xiγ
∂xiγ
∂xiγ ∂xiβ
= σR(α)βγ Fiβ = σ R̃(α)γβ Fiβ
oder in Vektorschreibweise: F′i = σR(α)−1 Fi . Da die potentielle Energie also
invariant ist unter Galilei-Transformationen und die Lagrange-Funktion sich
auch in Anwesenheit wirbelfreier äußerer Kräfte nur um eine vollständige Zeitableitung ändert, ist die Bewegungsgleichung für die Gesamtdynamik des N Teilchen-Systems nach wie vor invariant. Berücksichtigen wir schließlich auch
mögliche elektromagnetische äußere Kräfte (Lorentz-Kräfte), die zusätzlich auf
die Teilchen wirken können, so müssen wir das Transformationsverhalten des
Potentials
VLor =
X
i
qi [Φ(xi , t) − ẋi · A(xi , t)]
43
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
unter Galilei-Transformationen und somit auch dasjenige der elektromagnetischen Potentiale (Φ, A) kennen. Das Transformationsverhalten der E, B-Felder
unter Galilei-Transformationen ist bereits aus der Theorie-1-Vorlesung bekannt
(s. Abschnitt 5.5):
E′ (x′ , t′ ) = σR(α)−1 [E(x, t) + vα × B(x, t)]
B′ (x′ , t′ ) = R(α)−1 B(x, t)
.
Diese Beziehung zwischen den Feldern ist erfüllt, falls die elektromagnetischen
Potentiale (Φ, A) und (Φ′ , A′ ) in den beiden Inertialsystemen wie folgt miteinander verknüpft sind:
A′ (x′ , t′ ) = σR(α)−1 A(x, t)
Φ′ (x′ , t′ ) = Φ(x, t) − vα · A(x, t)
,
vα ≡ σR(α)v
.
Da nun für alle Teilchen Φ(xi , t) − ẋi · A(xi , t) invariant unter Galilei-Transformationen ist:
”
— ”
—
Φ′ − ẋ′ · A′ = Φ − vα · A − σR(α)−1 (ẋ − vα ) · σR(α)−1 A
= Φ − vα · A − (ẋ − vα ) · A = Φ − ẋ · A
,
′
gilt insgesamt VLor
= VLor , so dass auch der Beitrag der Lorentz-Kräfte zum Gesamtpotential invariant ist. Auch unter Berücksichtigung von Lorentz-Kräften
ändert sich die Lagrange-Funktion also lediglich um eine vollständige Zeitableitung, so dass die Bewegungsgleichung für die Gesamtdynamik nach wie vor
invariant ist.
2.4.3
Eichinvarianz
Bei einer Eichtransformation werden die elektromagnetischen Potentiale (A, Φ)
wie folgt transformiert:
1
à ≡ A − ∇Λ
c
,
Φ̃ ≡ Φ +
1 ∂Λ
c ∂t
,
wobei die orts- und zeitabhängige Funktion Λ(x, t) beliebig ist. Die Felder E und
B und somit auch die Maxwell-Gleichungen und die Lorentz’sche Bewegungsgleichung sind invariant unter einer solchen Eichtransformation. Da die Größe
Φ − ẋ · A sich nur um eine vollständige Zeitableitung ändert:

1 ∂Λ
+ ẋ · ∇Λ
c ∂t
1 d
= Φ − ẋ · A +
Λ(x, t) ,
c dt
‹
Φ′ − ẋ · A′ = Φ − ẋ · A +
gilt dasselbe für den Beitrag der Lorentz-Kräfte zur potentiellen Energie:
′
VLor
=
X
i
qi [Φ′ (xi , t) − ẋi · A′ (xi , t)] = VLor +
und für die Lagrange-Funktion:
L′ = L −
d X qi
Λ(xi , t)
dt i c
.
d X qi
Λ(xi , t)
dt i c
44
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Hiermit kann die Invarianz der Bewegungsgleichung unter Eichtransformationen
wiederum aufgrund der Addition einer vollständigen Zeitableitung zur LagrangeFunktion verstanden werden.
2.4.4
Invarianz unter „Zeitumkehr“
Es ist wohl klar, dass es physikalisch vollkommen unmöglich ist, die Zeit rückwärts verlaufen zu lassen, so dass der Begriff „Zeitumkehr“ streng genommen
keinen Sinn hat. Unter „Zeitumkehr“ versteht man in der Klassischen Mechanik
dann auch eher das instantane Umkehren aller Geschwindigkeiten, wobei die
Zeit in üblicher Weise weiter vorwärts verläuft. Dementsprechend bedeutet die
„Invarianz unter Zeitumkehr“ der Dynamik eines Teilchens oder eines Mehrteilchensystems, das dieses Teilchen bzw. dieses System seine Bahn bei Umkehrung
aller Geschwindigkeiten noch einmal durchläuft, nun aber in entgegengesetzter
Richtung.
x
x2
x1
t1
t2
t
Abbildung 2.1: Invarianz unter Zeitumkehr
Startet das Teilchen z. B. zur Zeit t1 am Ort x1 mit der Geschwindigkeit ẋ1
und erreicht es den Ort x2 zur Zeit t2 , so muss die Umkehrung seiner Geschwindigkeit zur Zeit t2 dazu führen, dass es zur Zeit 2t2 − t1 den Ort x1 wieder
erreicht, nun aber mit der Geschwindigkeit −ẋ1 . Falls x(t) die für t1 ≤ t ≤ t2
durchlaufene Bahn darstellt, so bedeutet Invarianz unter Zeitumkehr, dass die
für t2 ≤ t′ ≤ 2t2 − t1 (nach einer Umkehrung der Geschwindigkeit zur Zeit t2 )
durchlaufene Bahn durch x(2t2 − t′ ) ≡ x′ (t′ ) gegeben ist. Mutatis mutandis gilt
für ein N -Teilchensystem, das invariant unter Zeitumkehr ist, dass die Bahn für
t2 ≤ t′ ≤ 2t2 − t1 durch {xi (2t2 − t′ )} ≡ {x′i (t′ )} gegeben ist.
Der Einfachheit halber führen wir wieder die Schreibweise
X(t) ≡ (x1 (t), x2 (t), . . . , xN (t))
,
Ẋ(t) ≡ (ẋ1 (t), ẋ2 (t), . . . , ẋN (t))
und analog für X′ (t′ ) und Ẋ′ (t′ ) ein. Allgemein lautet die Newton’sche Bewegungsgleichung:
mi
d2 xi
(t) = Fi (X, Ẋ, t) ,
dt2
mi
d2 x′i ′
(t ) = Fi (X′ , Ẋ′ , t′ )
(dt′ )2
.
45
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Invarianz unter Zeitumkehr bedeutet
Fi (X′ , Ẋ′ , t′ ) = mi
d2 xi
d2 x′i ′
(t
)
=
m
(2t2 − t′ )
i
(dt′ )2
dt2
= Fi (X(2t2 − t′ ), Ẋ(2t2 − t′ ), 2t2 − t′ ) = Fi (X′ , −Ẋ′ , 2t2 − t′ ) ,
so dass das Kraftgesetz für alle (X, Ẋ, t) die Bedingung
(2.8)
Fi (X, Ẋ, t) = Fi (X, −Ẋ, 2t2 − t)
erfüllen muss. Für das Gesamtpotential des N -Teilchen-Systems impliziert Gleichung (2.8):
V (X, Ẋ, t) = V (X, −Ẋ, 2t2 − t) .
Dies bedeutet, dass die Lagrange-Funktion die Bedingung
L(X, Ẋ, t) = L(X, −Ẋ, 2t2 − t)
erfüllen soll, und daher auch, dass die Wirkung invariant unter „Zeitumkehr“
ist:
2tZ2 −t1
′
′
€
′
′
′
′
dt L X (t ), Ẋ (t ), t
S =
′
Š
2tZ2 −t1
=
t2
Zt2
=
t1
t2
€
Š
dt L X(t), −Ẋ(t), 2t2 − t =
€
dt′ L X(2t2 − t′ ), −Ẋ(2t2 − t′ ), t′
Zt2
€
Š
dt L X(t), Ẋ(t), t = S
Š
.
t1
Hiermit ist auch das Transformationsverhalten des Wirkungsfunktionals unter
„Zeitumkehr“ geklärt.
Für innere Kräfte in einem N -Teilchen-System, die das dritte Newton’sche
Gesetz erfüllen und somit zeit- und geschwindigkeitsunabhängig sind, ist die
Bedingung (2.8) automatisch erfüllt. Damit (2.8) für wirbelfreie äußere Kräfte
nicht-elektromagnetischer Natur gilt, die ja ebenfalls geschwindigkeitsunabhängig sind, muss der entsprechende Beitrag zum Potential die Eigenschaft
wf
wf
Vex
(X, t) = Vex
(X, 2t2 − t)
(2.9)
besitzen. Physikalisch bedeutet (2.9), dass auch alle Geschwindigkeiten der Teilchen in der „Außenwelt“ zur Zeit t2 umgekehrt werden müssen, damit die Gesamtdynamik invariant unter einer „Zeitumkehr“ zur Zeit t2 ist. Im Falle der
Lorentz-Kraft impliziert (2.8) für die E- und B-Felder:
E(x, 2t2 − t) = E(x, t)
,
(2.10)
B(x, 2t2 − t) = −B(x, t)
bzw. für die elektromagnetischen Potentiale:
Φ(x, 2t2 − t) = Φ(x, t)
,
A(x, 2t2 − t) = −A(x, t)
.
(2.11)
Man sieht, dass Zeitumkehrinvarianz nur dann gegeben ist, wenn das Magnetfeld
zur Zeit t2 das Vorzeichen wechselt. Wiederum bedeutet dies physikalisch, dass
46
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
auch die Geschwindigkeiten aller Teilchen in der Außenwelt (und somit auch alle
Ströme), die ja das Magnetfeld erzeugen, zur Zeit t2 umgekehrt werden müssen.
Bisher haben wir lediglich die Forderung auferlegt, dass das System invariant
unter Zeitumkehr bezüglich eines festen Zeitpunkts t2 sein soll. Wird nun die
strengere Forderung auferlegt, dass die Zeitumkehrinvarianz zu jedem Zeitpunkt
wf
t2 vorliegen soll, so zeigt (2.9), dass das Potential Vex
zeitunabhängig sein muss,
so dass die entsprechende Kraft nicht nur wirbelfrei sondern auch konservativ
ist. Für den elektromagnetischen Fall zeigen (2.10) und (2.11), dass nur statische
elektrische Felder, E = E(x) bzw. Φ = Φ(x) mit A = 0 und B = 0, mit der
Zeitumkehrinvarianz zu jedem Zeitpunkt verträglich sind.
2.5
Zwangsbedingungen
Bei den bisher diskutierten mechanischen N -Teilchen-Systemen waren die 3N
kartesischen Koordinaten X ≡ (x1 , x2 , . . . , xN ) grundsätzlich unabhängig voneinander, so dass der ganze 3N -dimensionale X-Raum dem System zur Verfügung stand oder zumindest der verfügbare Raumbereich 3N -dimensional war.
Unabhängig variierbare Ortskoordinaten werden allgemein als Freiheitsgrade
eines mechanischen Systems bezeichnet; die bisher behandelten Systeme haben
somit 3N Freiheitsgrade.
Die Anzahl der Freiheitsgrade eines N -Teilchen-Systems kann durchaus (viel)
kleiner als 3N sein. Dies ist immer dann der Fall, wenn Beziehungen der Form
fm (X, t) = fm (x1 , x2 , . . . , xN , t) = 0
(m = 1, 2, . . . , Z)
(2.12)
zwischen den kartesischen Koordinaten des Systems vorliegen. Solche Einschränkungen der Beweglichkeit eines Systems sind uns schon bei der Behandlung
des sphärischen Pendels (s. § 4.3 des Theorie-1-Skripts) begegnet. Sie werden
allgemein als Zwangsbedingungen, oder genauer: als holonome Zwangsbedingungen bezeichnet. Ist die Zwangsbedingung explizit zeitabhängig oder gerade
zeitunabhängig, so kann sie zusätzlich als „rheonom“ bzw. „skleronom“ bezeichnet werden. Wir nehmen im Folgenden an, dass jede der Z holonomen Zwangsbedingungen (2.12) die Anzahl der unabhängig variierbaren Ortskoordinaten
des Systems um Eins reduziert, so dass die Gesamtzahl f der Freiheitsgrade
genau gleich 3N − Z ist. Natürlich hätte man alle Z Zwangsbedingungen in
Gleichung (2.12) mit Hilfe einer einzelnen Bedingung der Form
f (X, t) ≡
Z
X
2
[fm (X, t)] = 0
m=1
zusammenfassen können. Wir werden eine solche Kompaktschreibweise im Folgenden jedoch nicht verwenden, um die eindeutige Relation f = 3N −Z zwischen
der Anzahl der Freiheitsgrade und der Zahl der holonomen Zwangsbedingungen
nicht zu verlieren. Hierzu reicht es, zusätzlich anzunehmen, dass die Funktionen
fm , die die Zwangsbedingungen charakterisieren, für alle X mit fm (X, t) = 0
stetig differenzierbar und die Gradienten ∂fm /∂X (m = 1, . . . , Z) linear unabhängig sind.
Da die Anzahl der Freiheitsgrade eines N -Teilchen-Systems, das den Zwangsbedingungen (2.12) unterliegt, also durch f = 3N − Z gegeben ist, kann jede
47
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
mögliche Konfiguration X = (x1 , . . . , xN ) des Systems mit Hilfe von 3N − Z
unabhängigen neuen Koordinaten (q1 , q2 , . . . , qf ) ≡ q beschrieben werden:
xi = xi (q1 , q2 , . . . , qf , t) = xi (q, t)
(i = 1, 2, . . . , N ) .
(2.13)
Die unabhängig variierbaren Koordinaten {qk } werden als verallgemeinerte Koordinaten bezeichnet; die Menge aller dem System zur Verfügung stehenden
q-Werte heisst der Konfigurationsraum des Systems und wird im Folgenden als
Q bezeichnet. Die Menge aller dem System zur Verfügung stehenden X-Werte
{X(q, t) | q ∈ Q} bildet eine (im Allgemeinen zeitabhängige) f -dimensionale
Mannigfaltigkeit, die wir als die Bewegungsmannigfaltigkeit des Systems bezeichnen werden. Wir werden den Spezialfall einer eindimensionalen Mannigfaltigkeit
(f = 1) als Kurve bezeichnen, den einer (3N − 1)-dimensionalen Mannigfaltigkeit (Z = 1) als Fläche.
Betrachten wir ein paar Beispiele: Das sphärische Pendel bewegt sich bekanntlich über eine Kugelfläche. In diesem Fall ist die „Bewegungsmannigfaltigkeit“ also zweidimensional. Falls der Aufhängepunkt des Pendelstabs, dessen
Länge wir als l bezeichnen, als Ursprung des Koordinatensystems gewählt wird,
lautet die (skleronome) holonome Zwangsbedingung für das sphärische Pendel:
f (x, t) ≡ x2 − l2 = 0
.
Wählen wir als unsere verallgemeinerten Koordinaten die üblichen Winkelvariablen (ϑ, ϕ), so ist der Konfigurationsraum durch Q = [0, π] × [0, 2π) gegeben.
Um die Stetigkeit der Variablen ϕ(t) über mehrere Umläufe hinweg zu gewährleisten, ist es zweckmäßig, den Konfigurationsraum auf [0, π] × R auszudehnen,
wobei identifiziert wird: x(ϑ, ϕ) = x(ϑ, ϕ + 2π).
Man erhält das mathematische Pendel entweder als Spezialfall des sphärischen Pendels (für spezielle Anfangsbedingungen) oder durch Auferlegen einer
zusätzlichen (skleronomen, holonomen) Zwangsbedingung:
f1 (x, t) ≡ x2 − l2 = 0
,
f2 (x, t) ≡ x2 = 0 .
Die Bewegungsmannigfaltigkeit ist nun eine Kurve (und zwar ein Kreisrand).
Falls wir als verallgemeinerte Koordinate den üblichen Winkel ϕ wählen, ist der
Konfigurationsraum durch Q = [0, 2π) oder [bei periodischer Fortsetzung mit
x(ϕ) = x(ϕ + 2π)] durch R gegeben. Wird am Aufhängepunkt des mathematischen Pendels gerüttelt, so dass er sich nicht im Ursprung, sondern am zeitlich
veränderlichen Ort a(t) = (a1 (t), 0, a3 (t)) befindet, so liegen zwei holonome
Zwangsbedingungen vor:
f1 (x, t) ≡ |x − a(t)|2 − l2 = 0
,
f2 (x, t) ≡ x2 = 0
,
(2.14)
wobei die erste rheonom und die zweite nach wie vor skleronom ist. Die Bewegungsmannigfaltigkeit ist wiederum eine Kurve, die nun allerdings explizit
zeitabhängig ist.
Als weiteres Beispiel einer Zwangsbedingung betrachten wir ein Hantelmolekül , d. h. zwei Atome (mit den Massen m1 bzw. m2 ), die durch einen starren
Stab (der Länge l) miteinander verbunden sind. Ein solches Hantelmolekül ist
ein einfaches klassisches Modell für reale zweiatomige Moleküle wie O2 , N2 oder
CO. Eine makroskopische Anzahl solcher Hantelmoleküle könnte daher dazu
48
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
verwendet werden, einige der wichtigsten atmosphärischen Gase zu beschreiben. Die (skleronome, holonome) Zwangsbedingung für die Koordinaten x1 und
x2 der zwei Atome eines Hantelmoleküls lautet
|x1 − x2 |2 − l2 = 0
,
und für N Atome (mit N gerade), die insgesamt
erhält man:
fm (X, t) ≡ |x2m − x2m−1 |2 − l2 = 0
1
2N
Hantelmoleküle formen,
(m = 1, 2, . . . , 21 N ) .
Die Anzahl der Freiheitsgrade ist in diesem Fall durch
f = 3N − Z = 3N − 21 N = 25 N
gegeben.
Ein einfaches Modell für ein lineares Polymer entsteht, wenn man die Atome
mit den Indizes m und m + 1 für 1 ≤ m ≤ N − 1 durch N − 1 Stäbe mit den
Längen lm verbindet. Die Zwangsbedingung lautet in diesem Fall:
2
fm (X, t) ≡ |xm+1 − xm |2 − lm
=0
(m = 1, . . . , N − 1) ,
und die Anzahl der Freiheitsgrade ist f = 3N − (N − 1) = 2N + 1. Selbstverständlich kann man auch Modelle für verzweigte Polymere konstruieren, wobei
jedes Atom nun mit mehr als zwei Partnern verbunden sein darf.
Außerdem sei der starre Körper erwähnt, der insgesamt nur f = 6 Freiheitsgrade hat. Dies folgt sofort daraus, dass der Massenschwerpunkt des Körpers
beweglich ist und der Körper sich um eine Achse drehen kann, d. h. dass der
Gesamtimpuls P und der Gesamtdrehimpuls L des starren Körpers a priori beliebige Werte annehmen können. Dementsprechend wird der starre Körper i. A.
durch Z = 3N − f = 3N − 6 Zwangsbedingungen charakterisiert.2
Als letztes Beispiel einer (skleronomen) holonomen Zwangsbedingung diskutieren wir die Bewegung einer Kugel3 mit dem Radius R über eine ideale glatte
Ebene. Wir wählen das Koordinatensystem so, dass die Ebene durch {x3 = 0}
gegeben ist. Da zwischen der Kugel und der idealen glatten Ebene keine Reibung
stattfindet, bewirkt die Ebene lediglich, dass sich der Mittelpunkt xM der Kugel
in der (x3 = R)-Ebene befindet. Die Zwangsbedingung lautet dementsprechend:
f (xM , t) ≡ ê3 · xM − R = 0 ,
(2.15)
und von den 6 Freiheitsgraden eines freien starren Körpers bleiben für die Kugel
auf der idealen glatten Ebene nur noch 5 übrig. Man könnte diese 5 Freiheitsgrade z. B. durch die zwei freien Komponenten xM1 und xM2 des Mittelpunkts
und durch drei Winkelvariablen (ϑ, ϕ, ψ) charakterisieren, wobei die Winkelvariablen z. B. die Richtung der Achse durch xM und einen fest gewählten Punkt
2 Diese Zählung der Freiheitsgrade und Zwangsbedingungen trifft nur für N ≥ 3 zu: Für
N = 2 ist die Drehimpulskomponente in Richtung des Stabs gleich Null (f = 5, Z = 1), für
N = 1 gilt L = 0 (und somit f = 3, Z = 0).
3 In konkreten Untersuchungen solcher Kugeln (siehe z. B. Abschnitt [??]) werden wir (der
Einfachheit halber) eine sphärisch symmetrische Massenverteilung voraussetzen, so dass der
Kugelmittelpunkt zugleich auch Massenschwerpunkt ist. Deshalb die Notation xM .
49
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
xP der Kugeloberfläche und die Orientierung der Kugel relativ zu dieser Achse
festlegen.
Jede Zwangsbedingung, die nicht holonom ist, heisst nicht-holonom. Eine
mögliche Form einer nicht-holonomen Zwangsbedingung ist eine Einschränkung
der Beweglichkeit, die nur als Ungleichung darstellbar ist:
f (X, t) = f (x1 , x2 , . . . , xN , t) ≥ 0
.
Als einfaches Beispiel mit N = 1 sei die Kugel auf der idealen glatten Ebene
erwähnt, die nun auch über die Ebene hüpfen kann, so dass der Mittelpunkt xM
die Ungleichung
f (xM , t) ≡ ê3 · xM − R ≥ 0
erfüllt.
Eine andere mögliche Form einer nicht-holonomen Zwangsbedingung ist eine
Beziehung zwischen Koordinaten, Geschwindigkeiten und eventuell der Zeit, die
nicht in der Form
(2.16)
f (x1 , x2 , . . . , xN , t) = 0
darstellbar ist. Hierzu zunächst Folgendes: Obwohl jede holonome Zwangsbedingung der Form (2.16) für alle möglichen Bahnen X(t) die Beziehung
df =
N
X
∂f
i=1
∂xi
· dxi +
X ∂f
∂f
df
· ẋi +
=
=0
dt
∂xi
∂t
i=1
N
∂f
dt = 0
∂t
,
(2.17)
zwischen Koordinaten, Geschwindigkeiten und der Zeit impliziert, können umgekehrt nicht alle Beziehungen
N
X
ϕi (X, t)·dxi +ϕ0 (X, t)dt = 0
,
i=1
N
X
ϕi (X, t)· ẋi +ϕ0 (X, t) = 0
(2.18)
i=1
auch in der Form (2.16) geschrieben werden. Die genaue Bedingung dafür, dass
Gleichung
P (2.18) in der Form (2.16) darstellbar ist, ist, dass das Differential
dΦ ≡ ϕi · dxi + ϕ0 dt exakt ist, d. h. dass für alle i, j = 1, 2, . . . , N :
i
∂ϕiα
∂ϕjβ
=
∂xjβ
∂xiα
(α, β = 1, 2, 3) ,
∂ϕi
∂ϕ0
=
∂t
∂xi
gilt. Falls dΦ nicht exakt ist, aber γ(X, t) dΦ wohl, heißt γ(X, t) ein integrierender Faktor . Die Beziehung (2.17) für das exakte Differential df wird dementsprechend als integrabel bezeichnet, und Beziehungen der Form (2.18), die sogar
nach Multiplikation mit beliebigen Funktionen γ(X, t) nicht integrabel sind,
heißen nicht-integrabel . Nicht-integrable Beziehungen zwischen den Koordinaten, den Geschwindigkeiten und der Zeit sind ein weiteres wichtiges Beispiel für
nicht-holonome Zwangsbedingungen.
Als konkrete Anwendung betrachten wir wiederum die Kugel mit dem Radius R auf der (x3 = 0)-Ebene, wobei wir nun allerdings annehmen, dass diese
Ebene ideal rau ist. Dies bedeutet, dass die Kugel nur rollen kann, jedoch nicht
50
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
gleiten. Die Geschwindigkeit des Kontaktpunkts der Kugel mit der (x3 = 0)Ebene ist daher zu jeder Zeit genau Null. Für die Geschwindigkeitskomponente
in ê3 -Richtung kann diese Einschränkung nach wie vor mit Hilfe der holonomen
Zwangsbedingung (2.15) beschrieben werden. Die Einschränkung der Geschwindigkeitskomponenten in ê1 - und ê2 -Richtung führt auf zwei Beziehungen zwischen den Winkelgeschwindigkeiten (ϑ̇, ϕ̇, ψ̇), die nicht-integrabel und daher
nicht-holonom sind. Die explizite Form dieser zwei nicht-holonomen Zwangsbedingungen wird später (im Rahmen der Untersuchung der Dynamik starrer
Körper) im Detail hergeleitet. Auf jeden Fall sollte klar sein, dass die Untersuchung der Dynamik einer realen Kugel (z. B. derjenigen eines Fußballs) auf einer
realen Ebene (z. B. auf einem Rasen) im Allgemeinen sehr schwierig ist: Der Ball
kann rollen, gleiten und hüpfen, und der Rasen ist weder ideal glatt noch ideal
rau. Da außerdem noch Luftreibung zu berücksichtigen ist, durch inelastische
Stöße Dissipation auftritt und der Ball nur näherungsweise als „rund“ angesehen
werden kann, ist klar, dass eine detaillierte physikalische Untersuchung realer
Ballspiele äußerst kompliziert wäre. Die gleiche Aussage trifft wohl für nahezu
alle makroskopischen Vorgänge zu.
2.6
Verallgemeinerte Koordinaten
Wir beschränken uns im Folgenden auf N -Teilchen-Systeme mit holonomen
Zwangsbedingungen der Form (2.12), so dass der Konfigurationsraum des Systems, wie in (2.13) dargestellt, mit Hilfe von f = 3N − Z verallgemeinerten
Koordinaten {qk } beschrieben werden kann:
xi = xi (q1 , q2 , . . . , qf , t) ≡ xi (q, t)
(i = 1, 2, . . . , N ) .
(2.19)
Neben q ≡ (q1 , . . . , qf ) und X = (x1 , . . . , xN ) führen wir auch Kürzel q̇ und Ẋ
für die Geschwindigkeiten (q̇1 , . . . , q̇f ) bzw. (ẋ1 , . . . , ẋN ) ein. Damit sowohl die
Bewegungsmannigfaltigkeit {X(q, t) | q ∈ Q} als auch der Konfigurationsraum
f -dimensional sind, muss die Darstellung (2.19) unbedingt nicht-singulär sein,
∂X
(q, t) an der Bewegungsmannigfaltigkeit im
d. h. die f Tangentialvektoren ∂q
k
Punkte q zur Zeit t müssen linear unabhängig sein. Aus (2.19) folgt für die
Differentiale dxi :
dxi =
f
X
∂xi
k=1
∂qk
(q, t)dqk +
∂xi
(q, t)dt
∂t
(2.20)
und daher auch für die Geschwindigkeiten ẋi :
ẋi (q, q̇, t) =
f
X
∂xi
k=1
∂qk
(q, t)q̇k +
∂xi
(q, t)
∂t
(i = 1, 2, . . . , N ) .
(2.21)
Hiermit sind die Beziehungen zwischen den kartesischen Koordinaten und Geschwindigkeiten und den verallgemeinerten Koordinaten und Geschwindigkeiten
vollständig bekannt. Diese Beziehungen können dazu verwendet werden, physikalische Größen, die bereits als Funktion der kartesischen Koordinaten und Geschwindigkeiten bekannt sind, nun als Funktion der verallgemeinerten Variablen
(q, q̇) zu bestimmen. Um diese (im Allgemeinen unterschiedlichen) Funktionen
51
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
unterscheiden zu können, wird die kartesische Variante im Folgenden stets durch
einen Index „K“ gekennzeichnet.
Als Beispiel betrachten wir die kinetische Energie:
TK (X, Ẋ, t) =
N
X
2
1
2 mi ẋi
i=1
=
N
X
1
2 mi
i=1
X ∂xi
∂xi
q̇k +
∂qk
∂t
k
(2.22)
!2
≡ T (q, q̇, t) .
Es ist klar, dass T (q, q̇, t) auch als Funktion der verallgemeinerten Geschwindigkeiten im Allgemeinen quadratisch (jedoch nicht unbedingt homogen quadratisch) ist:
1
2
T (q, q̇, t) =
X
akl q̇k q˙l +
X
kl
(2.23)
ak q̇k + a0
k
mit
akl (q, t) ≡
ak (q, t) ≡
a0 (q, t) ≡
N
X
mi
∂xi
∂xi
(q, t) ·
(q, t)
∂qk
∂ql
mi
∂xi
∂xi
(q, t) ·
(q, t)
∂qk
∂t
i=1
N
X
i=1
1
2
N
X
i=1
•
mi
˜2
∂xi
(q, t)
∂t
.
Nur wenn die holonomen Zwangsbedingungen zeitunabhängig (skleronom) sind
i
und die verallgemeinerten Koordinaten so gewählt werden, dass ∂x
∂t (q, t) = 0
gilt, hat T (q, q̇, t) also im Allgemeinen eine homogen quadratische Form als
Funktion der {q̇k }.
Aus der allgemeinen Form (2.23) der kinetischen Energie folgt, dass T (q, q̇, t)
strikt konvex als Funktion der Geschwindigkeiten ist, d. h. dass die Matrix
∂2T
∂ q̇2 = (akl ) ≡ A positiv definit ist. Der Begriff positiv definit wurde bereits in
§ 3.5.1 des Theorie-1-Skripts definiert: Für jeden Vektor u = (u1 , u2 , . . . , uf ) 6=
√
0 gilt in diesem Fall uT Au > 0. Führen wir noch die Definitionen yi ≡ mi xi
und Y ≡ (y1 , y2 , . . . , yN ) ein, so folgt für die Matrix (akl ) in (2.23) in der Tat:
uT Au =
X
k,l
uk akl ul =
X
uk
k,l
∂Y 2
∂Y ∂Y
·
ul = u > 0 .
∂qk ∂ql
∂q Im letzten Schritt geht entscheidend ein, dass die f Tangentialvektoren
©
∂X
∂qk
©
∂Y
und somit auch die f Vektoren ∂q
linear unabhängig sind, so dass für alle
k
∂Y
u 6= 0 auch ∂q u 6= 0 gilt. Es folgt, dass der „Massentensor “ (akl ) positiv definit
und T (q, q̇, t) somit strikt konvex als Funktion von q̇ ist. Dieses Faktum wird
von entscheidender Bedeutung bei der Formulierung der Hamilton-Theorie in
Kapitel 2 sein.
Es sei noch einmal darauf hingewiesen, dass die Argumente (q, q̇, t) der kinetischen Energie T als unabhängige Variablen anzusehen sind, da die Argumente
52
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
(X, Ẋ, t) von TK (soweit die Zwangsbedingung dies zulässt) unabhängig sind.
Die Unabhängigkeit der Variablen (q, q̇, t) geht auch klar aus Gleichung (2.20)
hervor, da die Differentiale {dqk } und dt hier unabhängig von (q, t) sind. Wegen
der Unabhängigkeit der (q, q̇, t) folgt z. B. aus (2.21):
∂xi
∂ ẋi
(q, t) =
(q, t)
∂ q̇k
∂qk
(2.24)
.
Wir werden diese Beziehung im Folgenden mehrmals verwenden.
2.6.1
Die Bewegungsgleichung in verallgemeinerten Koordinaten
Die Newton’sche Bewegungsgleichung stellt nach dem zweiten Newton’schen
Gesetz eine Beziehung zwischen der Trägheitskraft mi ẍi des i-ten Teilchens
und der auf das i-te Teilchen einwirkenden Kraft Fi her, die eine Funktion der
kartesischen Koordinaten, der Geschwindigkeiten und der Zeit ist:
Z
mi ẍi = Fi (X, Ẋ, t) = FK
i + Fi
(i = 1, 2, . . . , N ) .
(2.25)
Hierbei kann die explizite Form der Kraft Fi natürlich sehr kompliziert sein;
im Folgenden wird jedoch nur wichtig sein, zwei Beiträge zur Gesamtkraft Fi
zu unterscheiden: Kräfte FZi , die (z. B. von Stäben, Drähten, Oberflächen usw.)
auf das i-te Teilchen ausgeübt werden, um die Einhaltung der Zwangsbedingung
zu erzwingen, und daher als Zwangskräfte bezeichnet werden, und alle anderen
Kräfte, die wir - da sie Funktionen der kartesischen Koordinaten und GeschwinK
digkeiten (und eventuell der Zeit) sind - als FK
i bezeichnen werden. In Fi sind
also die üblichen inneren und äußeren Kräfte enthalten, die auch in Abwesenheit
der Zwangsbedingung auf das i-te Teilchen einwirken würden.
Die Grundidee hinter der Herleitung der Bewegungsgleichung in verallgemeinerten Koordinaten ist besonders einfach: Statt der 3N nicht-unabhängigen
Gleichungen (2.25) für die kartesischen Koordinaten {xφi (t)} der physikalischen Bahn erwartet man f unabhängige Bewegungsgleichungen (d. h. gewöhnliche Differentialgleichungen zweiter Ordnung) für die verallgemeinerten Koordinaten {qφk (t)}. Andererseits wissen wir, dass die Bewegungsmannigfaltigkeit des N -Teilchen-Systems (und daher auch die Tangentialebenen an dieser
Bewegungsmannigfaltigkeit) f -dimensional sind. Die Idee ist nun, den Gleichungssatz (2.25) auf f voneinander unabhängige Tangentialvektoren im Punkte Xφ (t) = X(qφ (t), t) der Bewegungsmannigfaltigkeit zu projizieren. Jede dieser Projektionen liefert eine Bewegungsgleichung, so dass man insgesamt genau
f unabhängige Bewegungsgleichungen für die verallgemeinerten Koordinaten
{qφk (t)} erhält.
Konkret funktioniert dieses Verfahren wie folgt: Wir betrachten nun den
Punkt Xφ (t) = X(qφ (t), t) der physikalischen Bahn, die durch (2.25) beschrieben wird, sowie beliebige Vektoren δq ≡ (δq1 , δq2 , . . . , δqf ) ∈ Rf . Der Vektor
Ξ≡
f
X
∂X
k=1
∂qk
(qφ (t), t)δqk =
∂X
(qφ (t), t) δq
∂q
stellt also geometrisch einen Tangentialvektor an der Bewegungsmannigfaltigkeit im Punkte Xφ (t) zur Zeit t dar. Folglich bildet die Menge aller Vektoren X
53
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
der Form

X = Xφ (t) + Ξ = Xφ (t) +
∂X
∂q
‹
(δq ∈ Rf )
δq
φ
die Tangentialebene an der Bewegungsmannigfaltigkeit im Punkte Xφ (t) zur
Zeit t.
Wir führen nun die Notation δxi für den Beitrag des i-ten Teilchens zum
Tangentialvektor Ξ ein:
Ξ = X − Xφ (t) ≡ δX ≡ (δx1 , δx2 , . . . , δxN )
und projizieren das rechte und auch das linke Glied von (2.25) auf die ΞRichtung. Projektion der Kräfte (F1 , F2 , . . . , FN ) auf die Ξ-Richtung liefert
eine Größe mit der Dimension einer Energie:
N
X
i=1
Fi (Xφ (t), Ẋφ (t), t) · δxi ≡ δW
(2.26)
.
Die Größe δW stellt formal die Arbeit dar, die die in der physikalischen Bahn
wirkenden Kräfte Fi (Xφ (t), Ẋφ (t), t) zum Zeitpunkt t entlang der Variationen {δxi } verrichten würden.4 Aufgrund der Newton’schen Bewegungsgleichung
(2.25) ist die Hilfsgröße δW alternativ auch durch
δW =
N
X
i=1
(2.27)
mi ẍφi (t) · δxi
gegeben. Wir werden im Folgenden zuerst (2.27) und dann (2.26) mit Hilfe der
verallgemeinerten Koordinaten umformulieren. Aus der Äquivalenz der beiden
Ausdrücke und der Beliebigkeit des Tangentialvektors Ξ folgt dann die Bewegungsgleichung in verallgemeinerten Koordinaten.
Der Ausdruck (2.27) lässt sich mit Hilfe der Identitäten (2.21) und (2.24)
und der in (2.22) eingeführten Funktionen TK und T wie folgt umformulieren:
δW =
N
X
i=1
=
X
i,k
=
X
"
mi ẍφi ·
•
mi
"
k

f
X
∂xi
k=1
∂qk
∂ ẋi
d
ẋi ·
dt
∂ q̇k
d ∂
dt ∂ q̇k
X
#
(qφ (t), t)δqk
‹
− ẋi ·
!
2
1
2 mi ẋi
i
d ∂xi
dt ∂qk
∂
−
∂qk
˜
δqk
φ
X
i
!#
2
1
2 mi ẋi
δqk
.
φ
Im letzten Schritt wurde die Unabhängigkeit der Ableitungen nach den Variablen q und q̇ verwendet:
X ∂ 2 xi
d ∂xi
∂ 2 xi
=
q̇l +
dt ∂qk
∂ql ∂qk
∂t∂qk
l
∂
=
∂qk
X ∂xi
l
∂xi
q̇l +
∂ql
∂t
!
∂ ẋi
=
∂qk
(2.28)
.
4 Es ist klar, dass δW lediglich eine mathematische Hilfsgröße ist, die nicht experimentell gemessen werden kann, da die Variation δX = Ξ vollkommen unabhängig von der tatsächlichen
Bewegungsrichtung Ẋφ (t) des Systems ist.
54
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Aus der Definition T (q, q̇, t) ≡ TK =
δW =
X • d  ∂T ‹
dt
k
∂T
−
∂qk
∂ q̇k
P
i
1
2 mi
ẋ2i folgt nun:
˜
δqk
(2.29)
.
φ
Betrachten wir nun andererseits den Ausdruck (2.26), so folgt
δW =
N
X
i=1
"
Fφi ·
f
X
∂xi
k=1
∂qk
#
(qφ (t), t)δqk =
f
X
k=1
Fφk δqk
,
(2.30)
wobei die verallgemeinerten Kräfte
Fk (q, q̇, t) ≡
N
X
i=1
Fi ·
∂xi
∂qk
Fφk ≡ Fk (qφ , q̇φ , t)
,
eingeführt wurden. Der Vergleich von (2.29) und (2.30) liefert nun sofort die
Identität
X • d  ∂T ‹
k
dt
∂ q̇k
−
∂T
− Fk
∂qk
˜
δqk = 0
.
φ
Da diese Identität für beliebige Tangentialvektoren Ξ (und somit für beliebige
Variationen δq) gelten soll, folgt
•
d
dt

∂T
∂ q̇k
‹
−
∂T
− Fk
∂qk
˜
=0
(k = 1, 2, . . . , f ) .
(2.31)
φ
Dies ist die allgemeine Form der Lagrange’schen Bewegungsgleichung in verallgemeinerten Koordinaten. Wir werden im Folgenden sehen, dass sie sich durch
eine nähere Betrachtung der verallgemeinerten Kräfte Fk noch erheblich vereinfachen lässt.
2.6.2
Verallgemeinerte Kräfte
Die in (2.31) verbleibenden verallgemeinerten Kräfte Fk stellen insofern ein
Problem dar, als sie neben den explizit bekannten inneren und äußeren Kräften
Z
FK
i auch die (zunächst unbekannten) Zwangskräfte Fi enthalten:
Fk =
N
X
i=1
X
∂xi
∂xi X Z ∂xi
=
+
FK
F ·
i ·
∂qk
∂qk i=1 i ∂qk
i=1
N
Fi ·
N
.
(2.32)
Ein Beispiel kann hier hilfreich sein: In Abschnitt 4.3 des Theorie-1-Skripts
konnten wir die auf das sphärische Pendel einwirkende Zwangskraft explizit
berechnen:
FZ (x, ẋ) = −λ(x, ẋ)x̂
,
λ=
mẋ2
− mg(x̂ · ê3 ) .
x
Die Zwangskraft wirkt somit in Richtung des Stabes, steht also senkrecht auf
der durch die Zwangsbedingung f (x, t) = x2 − l2 = 0 definierten Fläche und
verrichtet daher keine Arbeit. Es ist nun plausibel (und lässt sich für konkrete
55
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Modelle auch beweisen), dass dieses Ergebnis verallgemeinert werden kann: Falls
eine (skleronome oder rheonome) holonome Zwangsbedingung keine Reibungskräfte hervorruft, gilt generell, dass die Zwangskraft FZ1 , FZ2 , . . . , FZN senkrecht
auf der Bewegungsmannigfaltigkeit steht und daher keinen Beitrag zu Fk liefert:
FkZ ≡
N
X
i=1
FZi ·
∂xi
=0
∂qk
(2.33)
(k = 1, 2, . . . , f ) .
Im Falle einer zeitabhängigen (rheonomen) Zwangsbedingung bedeutet dies natürlich nicht, dass diese Zwangsbedingung bei einer realen Bewegung dXφ (t) =
Ẋφ (t)dt überhaupt keine Arbeit verrichtet. In diesem Fall ist der Beitrag der
Zwangskräfte zur Leistung (d. h. zur Arbeit pro Zeiteinheit) durch
X
X
dxi
dW Z
=
=
FZi ·
FZi ·
dt
dt
i=1
i=1
N
=
f
X
k=1
f
X
∂xi
N
FkZ q̇k
+ Ft = Ft
k=1
,
∂xi
q̇k +
∂qk
∂t
Ft ≡
N
X
i=1
!
FZi ·
∂xi
∂t
gegeben. Obwohl die verallgemeinerten Kräfte FkZ (in Abwesenheit von Reibung)
alle gleich Null sind, muss die mit der Zeitvariablen t verknüpfte verallgemeinerte Kraft Ft keineswegs Null sein.
In der analytischen Mechanik (d. h. bei der Formulierung des Lagrange- und
des Hamilton-Formalismus) beschränkt man sich üblicherweise auf Systeme, die
die Bedingung FkZ = 0 exakt oder zumindest in genügend guter Näherung erfüllen. Da im Wesentlichen keine anderen Annahmen gemacht werden, kann
Gleichung (2.33) als zentrales Postulat der Analytischen Mechanik angesehen
werden. Es ist kein Postulat im Sinne eines fundamentalen, jedoch unbeweisbaren Naturgesetzes, sondern eher im Sinne einer Annahme, Voraussetzung oder
Einschränkung: Wir wissen ja, dass Gleichung (2.33) in Anwesenheit von Reibung sicherlich nicht gilt.
Da die Zwangskräfte aufgrund des zentralen Postulats (2.33) also nicht zur
verallgemeinerten Kraft Fk beitragen, vereinfacht sich (2.32) zu
Fk (q, q̇, t) =
N
X
i=1
FK
i ·
∂xi
∂qk
.
(2.34)
Wir haben hiermit ein großartiges Resultat erzielt: Da das rechte Glied von
(2.34) nur noch von den (explizit bekannten) inneren und äußeren Kräften abhängig und auch Fk somit explizit als Funktion von (q, q̇, t) bekannt ist, hängt
die Bewegungsgleichung (2.31),
d
dt

∂T
∂ q̇k
‹
−
∂T
= Fk
∂qk
(k = 1, 2, . . . , f ) ,
überhaupt nicht mehr von den Zwangskräften ab! Dies vereinfacht die Lösung
der Bewegungsgleichung natürlich enorm und stellt einen der großen Vorteile
des Lagrange-Formalismus dar.5 Ein weiterer Vorteil ist offensichtlich, dass der
5 Spätestens
an dieser Stelle wird der Sinn der Projektion auf die Tangentialebene in Ab-
56
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Lagrange-Formalismus weitgehend unabhängig von der Wahl der verallgemeinerten Koordinaten {qk } ist: Hätten wir statt {qk } andere Koordinaten {q̄k }
gewählt:
xi = x̄i (q̄1 , q̄2 , . . . , q̄k , t) = x̄i (q̄, t)
(i = 1, 2, . . . , N ) ,
so hätte man ebenfalls eine Gleichung der Form (2.31) erhalten, allerdings mit
anderen Ausdrücken für die kinetische Energie und die verallgemeinerten Kräfte:
(T, Fk ) → (T̄ , F̄k ). Die Struktur (nicht aber die explizite Form) der LagrangeGleichung (2.31) ist daher invariant unter allgemeinen Punkttransformationen
der Koordinaten,
bzw. q̄ = q̄(q, t)
q̄k ≡ q̄k (q, t)
.
Hierbei muss €man Šnatürlich fordern, dass die Transformation nicht-singulär ist,
d. h. dass det ∂∂qq̄kl 6= 0 gilt.
Geschwindigkeitsunabhängige Kräfte
Innere Kräfte, die das dritte Newton’sche Gesetz erfüllen, sowie wirbelfreie nichtelektromagnetische äußere Kräfte können bekanntlich aus einem Potential hergeleitet werden:
K
FK
i = −(∇i V )(X, t)
,
wobei der Index „K“ wie üblich physikalische Größen in kartesischen Koordinaten
bezeichnet. Die verallgemeinerte Kraft Fk folgt daher als:
Fk =
N
X
i=1
X ∂V K ∂xi
∂V
∂xi
=−
·
=−
(q, t)
∂qk
∂x
∂q
∂q
i
k
k
i=1
N
FK
i ·
(2.35)
,
wobei das Potential V (q, t) als Funktion der verallgemeinerten Koordinaten
durch
V (q, t) ≡ V K (X(q, t), t)
definiert ist. Definieren wir nun die Lagrange-Funktion (wie üblich) als
L(q, q̇, t) ≡ T (q, q̇, t) − V (q, t)
(2.36)
,
so folgt aus (2.31) und (2.35):
0=
d
dt

∂T
∂ q̇k
‹
−
∂T
∂V
d ∂(T − V ) ∂(T − V )
+
=
−
∂qk
∂qk
dt
∂ q̇k
∂qk
−
∂L
∂qk
,
d. h.
d
0=
dt

∂L
∂ q̇k
‹
(k = 1, 2, . . . , f ) .
(2.37)
schnitt [2.6.1] klar: Durch diese Projektion werden die Zwangskräfte, die senkrecht auf der
Bewegungsmannigfaltigkeit stehen, herausprojiziert und somit aus der Lagrange-Gleichung in
verallgemeinerten Koordinaten eliminiert.
57
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Es muss wohl kaum darauf hingewiesen werden, dass die letzten beiden Gleichungen nur für die physikalische Bahn qφ (t) gelten. Die Bewegungsgleichung
(2.37) hat also genau dieselbe Struktur wie diejenige, die wir für den einfachen
Fall ohne Zwangsbedingungen in kartesischen Koordinaten hergeleitet haben!
Gleichung (2.37) wird als die Lagrange-Gleichung der 2. Art bezeichnet.
Aus Gleichung (2.36) folgt noch, dass die Lagrange-Funktion eines Systems
mit geschwindigkeitsunabhängigen Kräften im Allgemeinen strikt konvex als
Funktion der Geschwindigkeit q̇ ist, denn das Potential V (q, t) in (2.36) ist
geschwindigkeitsunabhängig und die kinetische Energie T (q, q̇, t) ist bekanntlich
strikt konvex als Funktion von q̇ (siehe Abschnitt [2.6]).
Lorentz-Kräfte
Nehmen wir an, die Teilchen sind geladen und spüren nicht nur die vorher diskutierten geschwindigkeitsunabhängigen Kräfte, sondern auch äußere elektromagnetische Kräfte (Lorentz-Kräfte). Solche Lorentz-Kräfte können bekanntlich
(siehe Abschnitt [2.2], Seite 32) ebenfalls aus einem (nun jedoch geschwindigkeitsabhängigen) Potential hergeleitet werden:
FLor
=
i
d
dt
K
∂VLor
∂ ẋi
−
K
∂VLor
∂xi
,
K
wobei VLor
durch
K
VLor
(X, Ẋ, t) =
N
X
i=1
q̂i [Φ(xi , t) − ẋi · A(xi , t)] ≡ VLor (q, q̇, t)
(2.38)
definiert ist und die Ladung des i-ten Teilchens (um Verwechslung mit den verallgemeinerten Koordinaten {qk } zu vermeiden) vorübergehend als q̂i bezeichnet
wird. Die Einführung des Potentials VLor (q, q̇, t) als Funktion der verallgemeinerten Koordinaten ist sehr sinnvoll, da man unter Verwendung von (2.24) und
(2.28) leicht
d
dt

∂VLor
∂ q̇k
=
N
X
‹
i=1
=
N
X
i=1
•
X d
∂VLor
=
∂qk
dt
i=1
N
−
d
dt
FLor
·
i
K
∂VLor
∂ ẋi

∂VLor ∂ ẋi
·
∂ ẋi ∂ q̇k
‹
−
∂VLor ∂xi
∂VLor ∂ ẋi
·
−
·
∂xi ∂qk
∂ ẋi ∂qk
•
K
K
∂VLor
∂xi
∂VLor
d
−
·
+
·
∂xi
∂qk
∂ ẋi
dt

∂xi
∂qk
‹
∂ ẋi
−
∂qk
˜
˜
∂xi
= FkLor
∂qk
zeigen kann. Die verallgemeinerte Gesamtkraft FkG ≡ Fk + FkLor ist somit durch
FkG
d
=
dt

∂VG
∂ q̇k
‹
−
∂VG
∂qk
,
VG ≡ V + VLor
gegeben, und mit der Definition L = T − VG der Lagrange-Funktion erhält man
auch unter Berücksichtigung zusätzlicher Lorentz-Kräfte eine Bewegungsgleichung der Form (2.37).
58
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Wir zeigen nun, dass man auch für den Fall verallgemeinerter Koordinaten elektromagnetische Potentiale definieren kann und dass das Konzept der
Eichinvarianz vollständig auf die verallgemeinerte Darstellung übertragbar ist.
Elektromagnetische Potentiale lassen sich aufgrund von (2.38) definieren:
VLor (q, q̇, t) =
N
X
i=1
"
q̂i ΦK (xi , t) −
≡ Φ(q, t) −
X
X ∂xi
k
∂xi
q̇k +
∂qk
∂t
!
#
· AK (xi , t)
q̇k Ak (q, t)
k
mit
Φ(q, t)
N
X
=
i=1
Ak (q, t)
N
X
=
•
˜
q̂i ΦK (xi , t) −
q̂i
i=1
∂xi
· AK (xi , t)
∂t
∂xi
· AK (xi , t) .
∂qk
Es ist zu beachten, dass die Lagrange-Funktion auch für Systeme mit zusätzlichen Lorentz-Kräften strikt konvex als Funktion der Geschwindigkeit q̇ ist;
dies folgt sofort daraus, dass die kinetische Energie strikt konvex ist (siehe Abschnitt [2.6]) und das Potential VLor (q, q̇, t) linear von der Geschwindigkeit abhängt. Es folgt außerdem, dass die verallgemeinerte Lorentz-Kraft FkLor in der
üblichen Art und Weise mit Hilfe verallgemeinerter elektrischer und magnetischer Felder dargestellt werden kann:
FkLor
d
=
dt
=−

∂VLor
∂ q̇k
X
= Ek +
q̇l
l
X
l
‹

−
∂VLor
∂qk
∂Ak
∂Ak
+
∂ql
∂t
Bkl q̇l
‹
=
d
∂Φ X ∂Al
q̇l
+
(−Ak ) −
dt
∂qk
∂qk
l
!
−
∂Φ
+
∂qk
X
q̇l
l
∂Al
∂qk
,
wobei definiert wurde:6
Ek ≡ −
∂Φ
∂Ak
−
∂qk
∂t
Bkl ≡
,
∂Ak
∂Al
−
∂qk
∂ql
.
Eichinvarianz bedeutet in kartesischen Koordinaten, dass die Eichtransformation
1
ÃK ≡ AK − ∇ΛK
c
,
Φ̃K ≡ ΦK +
1 ∂ΛK
c ∂t
6 Die Analogie wird klarer, wenn man bedenkt, dass die Lorentz-Kraft FLor = q(E + ẋ × B)
in kartesischen Koordinaten alternativ auch als
FLor
= q(Ek +
k
X
ekl ẋl )
B
(k, l = 1, 2, 3)
l
ekl mittels einer Dualidarstellbar ist. Hierbei ist der antisymmetrische echte Tensor B
ekl ≡ εklm Bm . Umgekehrt
tätstransformation eindeutig mit dem Pseudovektor B verknüpft: B
elm , so dass B und B
e in der Tat „dual“ sind.
gilt auch Bk = 21 εklm B
59
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
die Lagrange-Funktion lediglich um eine vollständige Zeitableitung ändert,
d X q̂i K
Λ (xi , t) ,
dt i=1 c
N
L̃K = LK −
und somit die Lagrange-Gleichung invariant lässt. In verallgemeinerten Koordinaten erhält man mit Hilfe der Definition
Λ(q, t) ≡
N
X
q̂i ΛK (xi , t)
i=1
für die elektromagnetischen Potentiale:
1 X ∂xi
1 ∂Λ
· (∇ΛK )(xi , t) = Ak −
q̂i
c i=1 ∂qk
c ∂qk
N
Ãk = Ak −
Š
1X
∂xi €
∂ΛK
1 ∂Λ
Φ̃ = Φ +
(xi , t) +
· ∇ΛK (xi , t) = Φ +
q̂i
c i=1
∂t
∂t
c ∂t
N
und somit für die Lagrange-Funktion:
∂Λ X ∂Λ
+
q̇k
∂t
∂qk
1
L̃ = L −
c
!
k
=L−
1 dΛ
c dt
(2.39)
,
so dass auch in diesem Fall die Lagrange-Gleichung der 2. Art invariant ist:
Der Beweis, dass die Addition einer vollständigen Zeitableitung die Bewegungsgleichung nicht ändert, verläuft für verallgemeinerte Koordinaten vollkommen
analog zum kartesischen Fall (s. Abschnitt 1.4.1).
Reibungskräfte
Wir wissen bereits, dass Reibungskräfte im Allgemeinen nicht mit Hilfe einer
Lagrange-Funktion beschrieben werden können und die Einführung einer Dissipationsfunktion erfordern. In kartesischen Koordinaten („K“) gilt für die Reibungskraft („R“), die auf das i-te Teilchen wirkt:
FK
i,R = −
∂F K
∂ ẋi
,
P
1
2
wobei z. B. die Wahl F K (Ẋ) =
i 2 ki ẋi für die Dissipationsfunktion dem
ẋ
entspricht.
Allgemein erhält man mit
einfachen Reibungsgesetz FK
=
−k
i i
i,R
der Definition
F(q, q̇, t) ≡ F K (Ẋ)
für die verallgemeinerte Reibungskraft:
Fk,R =
N
X
i=1
X ∂F K ∂ ẋi
∂F
∂xi
=−
·
=−
∂qk
∂
ẋ
∂
q̇
∂
q̇k
i
k
i=1
N
FK
i,R ·
so dass die Lagrange-Gleichung der 2. Art die Form
d
0=
dt

∂L
∂ q̇k
‹
−
∂F
∂L
+
∂qk
∂ q̇k
,
60
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
annimmt. Fazit ist also, dass auch Reibungskräfte sich problemlos mit Hilfe von
verallgemeinerten Koordinaten beschreiben lassen.
Einige historische Begriffe
Das zentrale Postulat (2.33) der Analytischen Mechanik impliziert für beliebige
Variationen {δqk } der physikalischen Bahn im Konfigurationsraum:
0=
f
X
k=1
FkZ δqk =
N
X
i=1
FZi · δxi
.
(2.40)
Setzt man nun die Newton’sche Bewegungsgleichung (2.25) in (2.40) ein, so
entsteht die Identität
N €
X
i=1
Š
mi ẍi − FK
· δxi = 0 .
i
(2.41)
Es ist klar, dass man ausgehend von (2.41) die Bewegungsgleichung (2.31) mit
Fk in der Form (2.34) herleiten könnte. In der Tat hat die Identität (2.41)
Lagrange als Startpunkt für die Herleitung seiner „Lagrange-Gleichung“ (2.31)
gedient, so dass Gleichung (2.41), die ursprünglich von Bernoulli und d’Alembert
aufgestellt wurde und als d’Alembert’sches Prinzip bekannt ist, historisch sehr
wichtig war.7
Des Weiteren sollte erwähnt werden, dass die Variation δxi in (2.26) und
(2.27) in der Literatur oft als virtuelle Verrückung bezeichnet wird. Dementsprechend wird (2.40) im Jargon so interpretiert, dass die virtuelle Arbeit der
Zwangskräfte stets Null ist. Da die Größe δW in (2.26) und (2.27) jedoch lediglich ein mathematisches Hilfsmittel darstellt, weder real noch virtuell etwas
„verrückt“ und weder real noch virtuell „Arbeit“ geleistet wird, scheinen solche
historischen Begriffe eher irreführend als hilfreich zu sein.
2.7
Das Hamilton’sche Prinzip in verallgemeinerten Koordinaten
Die Formulierung des Hamilton’schen Prinzips und die Herleitung der Bewegungsgleichung aus dem Variationsprinzip erfolgen für verallgemeinerte Koordinaten völlig analog zum kartesischen Fall. Wir fassen die wichtigsten Schritte
kurz zusammen.
Wir bezeichnen die physikalische Bahn im Konfigurationsraum als qφ (t) =
{qφk (t)} und betrachten allgemein benachbarte Bahnen q(t) = {qk (t)}, die zur
Anfangs- und zur Endzeit mit der physikalischen Bahn zusammenfallen: q(t1 ) =
qφ (t1 ) ≡ q1 , q(t2 ) = qφ (t2 ) ≡ q2 . Definieren wir also die Variationen
(δqk )(t) ≡ qk (t) − qφk (t) = εκk (t) ,
(δq)(t) ≡ q(t) − qφ (t) = εκ(t)
7 Für den Spezialfall, dass keine Zwangskräfte vorliegen und somit FZ = 0 gilt, reduziert
i
sich (2.41) zum üblichen zweiten Newton’schen Gesetz.
61
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
mit κ(t) = {κk (t)}, so gilt κ(t1 ) = κ(t2 ) = 0. Die Wirkung wird auch für
verallgemeinerte Koordinaten als Zeitintegral der Lagrange-Funktion definiert:
Zt2
(q ,t )
S(q12,t12) [q]
dt L(q(t), q̇(t), t)
=
(2.42)
,
t1
und das Hamilton’sche Prinzip lautet:
1
(q ,t )
lim (δS)(q21 ,t21 ) [qφ + εκ] = 0
ε
ε→0
(∀κ mit κ(t1 ) = κ(t2 ) = 0) .
Die Variation der Wirkung nahe der physikalischen Bahn kann leicht berechnet
werden:
1
1
δS = δ
ε
ε
1
=
ε
Zt2
dt L(q(t), q̇(t), t)
t1
Zt2
dt [L(qφ (t) + εκ(t), q̇φ (t) + εκ̇(t), t) − L(qφ (t), q̇φ (t), t)]
t1
Zt2
§
dt
=
t1
•
˜ª
d ∂L
∂L
(qφ (t), q̇φ (t), t) −
(qφ (t), q̇φ (t), t)
∂q
dt ∂ q̇
· κ(t)
+ O(ε)
,
so dass man als Konsequenz des Hamilton’schen Prinzips die Lagrange-Gleichung
(der zweiten Art) erhält:
•
0=
δS
δq(t)
˜
•
=
φ
˜
∂L
d ∂L
(qφ (t), q̇φ (t), t) −
(qφ (t), q̇φ (t), t)
∂q
dt ∂ q̇
. (2.43)
Da die Wirkung S in (2.42) auch in der allgemeinen Formulierung die Form eines
Zeitintegrals hat und die Anfangs- und Endpunkte bei der Variation festgehalten
werden, ist klar, dass die Bewegungsgleichung invariant ist unter der Addition
einer vollständigen Zeitableitung zur Lagrange-Funktion:
L → L′ ≡ L +
∂λ
∂λ
d
λ(q, t) = L + q̇ ·
(q, t) +
(q, t)
dt
∂q
∂t
,
da diese Transformation die Wirkung lediglich um eine additive Konstante ändert:
S → S ′ = S + λ(q2 , t2 ) − λ(q1 , t1 ) = S + Konstante .
Ein Beispiel einer Transformation, die die Lagrange-Funktion lediglich um eine
vollständige Zeitableitung ändert, ist die Eichtransformation in verallgemeinerten Koordinaten, s. Gleichung (2.39).
2.8
Die Lagrange-Gleichungen der ersten Art
Die Lagrange-Gleichungen der zweiten Art haben den Vorteil, dass sie (wegen
der Eliminierung aller Zwangskräfte) eine sehr einfache Struktur besitzen, und
62
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
den Nachteil, dass man überhaupt keine Information über eben diese Zwangskräfte erhält. Manchmal benötigt man als Physiker jedoch unbedingt Information über die Zwangskräfte, z. B. wenn geklärt werden muss, ob ein Seil, dessen
Seilspannung einen gewissen Wert nicht überschreiten darf, einen bestimmten
dynamischen Vorgang ohne zu reißen übersteht. Zur Berechnung von Zwangskräften verwendet man die Lagrange-Gleichungen der ersten Art. Der Einfachheit halber betrachten wir im Folgenden nur holonome Zwangsbedingungen.
Nehmen wir an, ein N -Teilchen-System unterliegt insgesamt Z holonomen
Zwangsbedingungen der Form
f¯m (x1 , x2 , . . . , xN , t) = 0
(m = 1, 2, . . . , Z) ,
die also Z Zwangskräfte erzeugen, von denen man allerdings nur die ersten z ≤ Z
kennen möchte. Die auf das i-te Teilchen wirkende Kraft hat somit, analog zu
Gleichung (2.25), die allgemeine Form
Z−z
+ Fzi
Fi = FK
i + Fi
,
wobei FK
i die inneren und äußeren Kräfte (in kartesischen Koordinaten) darstellt, die nicht auf Zwangskräfte zurückzuführen sind, und Fzi und FZ−z
die
i
Wirkung der ersten z bzw. der letzten Z −z Zwangsbedingungen repräsentieren.
Analog zum Vorgang in Abschnitt [2.6] führen wir nun 3N − (Z − z) = f + z verallgemeinerte Koordinaten q = (q1 , q2 , . . . , qf +z ) ein, mit deren Hilfe die Z − z
Zwangsbedingungen mit den Indizes z + 1 ≤ m ≤ Z automatisch berücksichtigt
werden können. Unter den üblichen Annahmen (innere Kräfte, die das dritte
Newton’sche Gesetz erfüllen, usw.) erhält man die Bewegungsgleichung
•
d
dt

∂L
∂ q̇k
‹
−
∂L
− Fkz
∂qk
˜
=0
(k = 1, 2, . . . , f + z) ,
(2.44)
φ
wobei die verallgemeinerte Kraft Fkz die Wirkung der Zwangskräfte Fzi darstellt,
Fkz =
N
X
i=1
Fzi ·
∂xi
∂qk
,
die von den verbleibenden z Zwangsbedingungen hervorgerufen werden:
fm (q, t) ≡ f¯m (X(q, t), t) = 0
(m = 1, 2, . . . , z) .
(2.45)
Aufgrund von (2.45) ist der Konfigurationsraum der Lösungen von (2.44) effektiv f -dimensional. Für alle möglichen Variationen δqk in der f -dimensionalen
Tangentialebene an der Bewegungsmannigfaltigkeit muss gelten:
F z · δq =
f
+z
X
k=1
Fkz δqk = 0 ,
so dass die Zwangskraft F z ≡ (F1z , . . . , Ffz+z ) stets senkrecht auf der Mannigfaltigkeit {fm (q, t) = 0 | m = 1, 2, . . . , z} steht. Da das orthogonale Komplement
der Tangentialebene an {fm (q, t) = 0} im Punkte (qφ , t) durch die Gradienten
∂fm
∂q (qφ , t) mit 1 ≤ m ≤ z aufgespannt wird:
(δfm )(q, t) =
∂fm
(qφ , t) · (δq)(t) = 0
∂q
(m = 1, 2, . . . , z) ,
63
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
muss für gewisse Proportionalitätskonstanten λm (t):
F zφ
=
z
X
λm (t)
m=1
∂fm
(qφ , t)
∂q
gelten. Einsetzen in (2.44) liefert für die Bewegungsgleichung:
•
d
dt

∂L
∂ q̇k
‹
−
∂L
∂qk
˜
=
φ
z
X
λm (t)
m=1
fm (qφ (t), t) = 0
∂fm
(qφ , t)
∂qk
(k = 1, 2, . . . , f +z)
(2.46)
(2.47)
(m = 1, 2, . . . , z) .
Der Gleichungssatz (2.46) + (2.47) enthält insgesamt f + 2z unabhängige Gleichungen für die f +2z Unbekannten {qφk }, {λm } und ist somit vollständig lösbar.
Die mit den Zwangsbedingungen fm = 0 (1 ≤ m ≤ z) verknüpften Zwangskräfte sind also im Unterraum {f¯m = 0 | z + 1 ≤ m ≤ Z} durch
(m)
Fφ
= λm (t)
∂fm
(qφ , t)
∂q
(2.48)
(m = 1, 2, . . . , z)
gegeben. Ein wichtiger Spezialfall tritt auf für z = Z. In diesem Fall gilt
f = 3N − z bzw. f + z = 3N , so dass (2.48) die vollständige Zwangskraft
(zum Beispiel: die vollständige Seilspannung) im 3N -dimensionalen Raum darstellt. Die Form der Bewegungsgleichung (2.46) kann hierbei durch eine geeignete Wahl der verallgemeinerten Koordinaten im 3N -dimensionalen Raum
optimiert werden. Gleichung (2.46) wird allgemein (nicht nur für z = Z) als die
Lagrange-Gleichung der ersten Art bezeichnet.
Die Lagrange-Gleichung der ersten Art (2.46) kann auch leicht aus einem
Variationsprinzip hergeleitet werden. Die entsprechende Verallgemeinerung des
Hamilton’schen Prinzips hat die Form
1
(q ,t )
lim (δ S̄)(q12 ,t12 ) [qφ + εκ] = 0
ε
(∀κ mit κ(t1 ) = κ(t2 ) = 0)
ε→0
mit
(q ,t )
S̄(q12,t12) [q]
"
Zt2
≡
dt
L (q(t), q̇(t), t) +
z
X
#
λm (t)fm (q(t), t)
,
(2.49)
m=1
t1
denn für die stationäre Lösung von S̄ gilt genau (2.46):
δ S̄
0=
δq(t)
"
φ
d
∂L
−
=
∂q dt

∂L
∂ q̇
‹
z
X
∂fm
+
λm (t)
∂q
m=1
#
.
φ
Alternativ, und vielleicht noch eleganter, kann man den vollständigen Gleichungssatz (2.46) + (2.47) aus einem Variationsprinzip der Form
1
(q ,t )
lim (δ S̄)(q12 ,t12 ) [q, λ] = 0 ,
ε
ε→0
herleiten, wobei S̄[q, λ] formal dieselbe Struktur wie S̄[q] in (2.49) hat, die Variation (δq)(t) denselben Einschränkungen (δq)(t1 ) = (δq)(t2 ) = 0 unterworfen
64
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
ist wie vorher und die Variation (δλ)(t) mit λ ≡ {λm } auch zu den Anfangsund Endzeiten t1 bzw. t2 keinerlei Einschränkungen unterworfen ist. Die EulerLagrange-Gleichungen für den stationären Punkt der Wirkung S̄[q, λ], betrachtet als Funktional von q und λ, liefern nun sowohl die Lagrange-Gleichung der
ersten Art (2.46) als auch die Zwangsbedingungen (2.47). Hiermit ist gezeigt,
dass man auch Zwangskräfte aus einem Variationsprinzip berechnen kann, vorausgesetzt, dass die entsprechenden Zwangsbedingungen holonom sind.
Es sollte hinzugefügt werden, dass die Lagrange-Gleichungen der 1. Art
(2.46) + (2.47) nicht immer explizit gelöst werden müssen, um die Zwangskräfte zu berechnen. Manchmal erhält man die Lösung (einschließlich der Zwangskräfte) nämlich einfacher über einen kleinen Umweg: Eliminiert man die verbleibenden z Zwangsbedingungen, indem man verallgemeinerte Koordinaten
q̄ = (q̄1 , q̄2 , . . . , q̄f ) einführt, die die f -dimensionale Fläche parametrisieren, auf
der sich das System im q-Raum bewegt, und löst man die Lagrange-Gleichungen
der zweiten Art im q̄-Raum, so erhält man die physikalische Bahn des Systems in
der Form q̄φ (t) im q̄- bzw. qφ (t) = q(q̄φ (t), t) im q-Raum. Einsetzen dieser Lösung qφ (t) in das linke Glied von (2.46) liefert einen expliziten Ausdruck für die
Gesamtzwangskraft im rechten Glied von (2.46). Die Gesamtzwangskraft
lässt
©
m
|
m
=
1,
2,
.
.
.
,z
sich eindeutig als Linearkombination der Gradienten ∂f
∂q
m
schreiben; die Komponente in Richtung ∂f
∂q stellt hierbei die mit der m-ten
Zwangsbedingung verknüpfte Zwangskraft (2.48) dar.
Ob die Lagrange-Gleichungen der ersten Art (2.46) + (2.47) für (qφ (t), λφ (t))
oder diejenigen der zweiten Art für q̄φ (t) technisch einfacher lösbar sind, lässt
sich im Voraus nicht immer entscheiden; die Antwort hängt in konkreten Anwendungen natürlich auch stark von der Wahl der verallgemeinerten Koordinaten
q̄ ab.
Beispiel: das sphärische Pendel
Als Beispiel für die Beschreibung von Zwangskräften im Rahmen des LagrangeFormalismus betrachten wir noch einmal das sphärische Pendel, das ausführlich
in § 4.3 des Theorie-1-Skripts untersucht wurde. Die Lagrange-Funktion und
die relevante (skleronome, holonome) Zwangsbedingung sind durch
L(x, ẋ, t) = 12 mẋ2 − mgx3
,
f (x) ≡ l − |x| = 0
gegeben. Die Bahn x(t), die das Wirkungsfunktional
(x ,t )
S̄(x12,t12) [x]
Z
t2
=
dt [L (x(t), ẋ(t), t) + λ(t)f (x(t))]
t1
stationär macht, erfüllt die Lagrange-Gleichung der ersten Art,
0=
∂L
d
−
∂x
dt

∂L
∂ ẋ
‹
+ λ(t)
∂f
= −mgê3 − mẍ − λ(t)x̂
∂x
,
und außerdem die Zwangsbedingung |x| = l. Ausgehend von diesen Gleichungen
findet man - genau wie früher - , dass der Lagrange-Multiplikator λ(t) die Form
λ(t) =
m[ẋφ (t)]2
− mgê3 · x̂φ (t)
l
(2.50)
65
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
hat und dass Lösungen nur für Anfangsbedingungen mit |x(0)| = l und
x(0) · ẋ(0) = 0 möglich sind.
Für den Spezialfall des mathematischen Pendels erhält man relativ einfache
und explizite Ergebnisse. In diesem Fall kann die Dynamik bequem mit Hilfe
einer verallgemeinerten Koordinate ψ(t) beschrieben werden:
„
sin(ψ)
0
− cos(ψ)
xφ (t) = l
Ž
„
,
ẋφ (t) = lψ̇
cos(ψ)
0
sin(ψ)
Ž
.
Aus der Bewegungsgleichung ψ̈ = − gl sin(ψ) folgt durch einmalige Integration
die Beziehung ψ̇ 2 = 2 gl [cos(ψ) − cos(ψmax )]. Einsetzen dieser Resultate in (2.50)
liefert:
λ(t) = mg
”
l 2
g ψ̇
—
”
+ cos(ψ) = 3mg cos(ψ) −
2
3
—
cos(ψmax )
,
(2.51)
wobei ψ(t) explizit mit Hilfe spezieller Funktionen bestimmt werden kann (siehe
§ 4.3.1 des Theorie-1-Skripts). Die vom Stab auf den Massenpunkt ausgeübte
Zwangskraft ist durch −λ(t)x̂ gegeben. Gleichung (2.51) zeigt, dass die Winkelabhängigkeit dieser Zwangskraft für das mathematische Pendel sehr einfach
ist.
2.9
Beispiel einer rheonomen Zwangsbedingung
In diesem Abschnitt zeigen wir, dass die Zeitabhängigkeit einer Zwangsbedingung das physikalische Verhalten eines Systems in dramatischer Weise beeinflussen kann, sogar dann, wenn die Amplitude der zeitlichen Änderungen sehr
gering ist. Als konkretes Beispiel betrachten wir ein mathematisches Pendel in
der x1 − x3 − Ebene, dessen Aufhängepunkt a(t) mit kleiner Amplitude, jedoch
hoher Frequenz periodisch bewegt wird:
„
Ž
a(t) =
a1 cos(ωt)
0
a2 sin(ωt)
≡
„
È
(a1 )2 + (a2 )2
a(t)
Ž
ā1 cos(ωt)
0
ā2 sin(ωt)
.
x3
g
ϕ l
x1
m, x(t)
Abbildung 2.2: Mathematisches Pendel mit kleiner Amplitude des Aufhängepunkts
Hierbei soll „kleine Amplitude“ bedeuten, dass der dimensionslose Parameter
ε≡
È
(a1 )2 + (a2 )2 /l
66
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
klein ist: ε ≪ 1, während „hohe Frequenz“ andeutet, dass
È die Frequenz ω der
g/l des ungestörten
Störung sehr viel größer als die Pendelfrequenz ω0 ≡
mathematischen Pendels ist: ω/ω0 ≫ 1.
Die kartesischen Koordinaten der Pendelmasse m in der x1 − x3 -Ebene sind
der rheonomen Zwangsbedingung |x(t)−a(t)| = l unterworfen und können somit
in der Form
„
x(t) = a(t) + l
sin(ϕ)
0
− cos(ϕ)
Ž
dargestellt werden; hierbei spielt ϕ die Rolle einer verallgemeinerten Koordinate.
Die Lagrange-Funktion L(ϕ, ϕ̇, t) ist offensichtlich durch
„
Ž2
cos(ϕ) 1
− mg [a2 sin(ωt) − l cos(ϕ)]
0
L(ϕ, ϕ̇, t) = m ȧ(t) + lϕ̇
2 sin(ϕ) bzw. (nach der Elimination einer vollständigen Zeitableitung) durch
L(ϕ, ϕ̇, t) = 21 ml2 ϕ̇2 +εω 2 ml2 [ā1 cos(ωt) sin(ϕ) − ā2 sin(ωt) cos(ϕ)]+mgl cos(ϕ)
gegeben. Die Lagrange-Gleichung lautet
ϕ̈ = −ω02 sin(ϕ) + εω 2 F (ϕ, ωt) ,
(2.52)
wobei die schnell variierende äußere Kraft F (ϕ, τ ) durch
F (ϕ, τ ) ≡ ā1 cos(τ ) cos(ϕ) + ā2 sin(τ ) sin(ϕ)
,
τ ≡ ωt
definiert wird. Es ist klar, dass die Amplitude εω 2 der schnell variierenden Kraft
für genügend hohe Frequenzen auch für ε ≪ 1 recht groß sein kann.
Um die Wirkung einer schnell variierenden Kraft mit (möglicherweise) recht
großer Amplitude besser einschätzen zu können, betrachten wir ein einfaches,
exakt lösbares Modell, das man durch Linearisierung aus (2.52) erhält:
ϕ̈ = −ω02 ϕ + ε̄ω 2 cos(ωt)
,
ε̄ ≡ εā1 ≪ 1 .
Diese Gleichung beschreibt genau den harmonischen Oszillator mit einer antreibenden Kraft (jedoch ohne Reibung), der in § 4.2.2 des Theorie-1-Skripts
untersucht wurde. Wir können die dort berechnete Lösung (mit geringen Änderungen in der Notation) übernehmen:
ϕ(t) = ϕ(0) cos(ω0 t) +
ε̄ω 2
ϕ̇(0)
sin(ω0 t) + 2
[cos(ωt) − cos(ω0 t)]
ω0
ω0 − ω 2
.
Für ω ≃ ω0 wird der letzte Term im rechten Glied bekanntlich sehr groß (Resonanz). Im Falle der schnell variierenden Kraft sind wir jedoch primär an relativ
großen ω-Werten interessiert; man erhält für ω ≫ ω0 :
ω2
ϕ̇(0)
sin(ω0 t) − ε̄ [cos(ωt) − cos(ω0 t)] + O ε̄ 02
ω0
ω
2
ϕ̇(0)
ω
= [ϕ(0) + ε̄] cos(ω0 t) +
sin(ω0 t) − ε̄ cos(ωt) + O ε̄ 02
ω0
ω
2
ω
≡ Φ(t) − ε̄ cos(ωt) + O ε̄ 02
.
ω
ϕ(t) = ϕ(0) cos(ω0 t) +
67
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Wir lernen somit, dass die Lösung ϕ(t) durch rapide Oszillationen mit kleiner Amplitude (ε̄ ≪ 1) um die Funktion Φ(t) charakterisiert wird, wobei Φ(t)
langsam variiert und das mittlere Verhalten von ϕ(t) widerspiegelt.
Allgemeiner erwartet man daher physikalisch, dass die Überlagerung der
langsam variierenden Kraft −ω02 sin(ϕ) und der schnell variierenden Kraft
F (ϕ, ωt) in (2.52) eine Pendelbewegung hervorruft, die durch kleine Oszillationen um ein wohldefiniertes mittleres Verhalten charakterisiert ist. Dies entspricht dem Ansatz:
ϕω (t) = Φ(t) + ε
∞
X
εm
ωn
ξmn (t, τ )
(2.53)
ε
= Φ(t) + εξ00 (t, τ ) + ε2 ξ10 (t, τ ) + ξ01 (t, τ ) + . . . ,
ω
wobei die Funktionen ξmn der Variablen t und τ 2π-periodisch als Funktion
von τ und unabhängig von den Parametern ε und ω sind. Die Funktion Φ(t)
bestimmt das mittlere Verhalten der Bahn ϕω (t) und wird als das Leitzentrum
bezeichnet. Um die Worte „mittleres Verhalten“ zu präzisieren, führen wir die
Zeitmittelung einer Funktion f (t, τ ) ein, die 2π-periodisch in der Variablen τ
ist:
m,n=0
1
f¯(t) ≡
2π
τZ
0 +π
dτ f (t, τ )
,
f (t, τ + 2π) = f (t, τ )
.
(2.54)
τ0 −π
Bei dieser Zeitmittelung werden die Variablen t und τ als formal unabhängig
aufgefasst. Wegen der 2π-Periodizität ist f¯(t) unabhängig von τ0 . Wir fordern
nun, dass Φ(t) den Zeitmittelwert der Lösung ϕω (t) beschreibt:
bzw. ξmn (t) = 0
Φ(t) = ϕω (t)
(m, n ∈ N)
(2.55)
.
Da Φ langsam variiert als Funktion der Zeit und ξmn schnell, wird Φ im Jargon
als „langsame Variable“ und ξmn entsprechend als „schnelle Variable“ bezeichnet.
Wir werden im Folgenden versuchen, die „schnellen Variablen“ zu eliminieren
und eine geschlossene Gleichung für Φ(t) aufzustellen.
Einsetzen des Ansatzes (2.53) in die Lagrange-Gleichung (2.52) liefert unter
Vernachlässigung von Termen höherer Ordnung in den Parametern ε oder ω1 :
∂ 2 ξ10
1 ∂ 2 ξ01
2 ∂ 2 ξ00
∂ 2 ξ00
+
ε
+
+
Φ̈ + εω
∂τ 2
∂τ 2
ω ∂τ 2
ω ∂t∂τ
•
˜
∂F
(Φ, τ )
= −ω02 sin(Φ) + εω 2 F (Φ, τ ) + εξ00
.
(2.56)
∂Φ
Ein Vergleich der führenden τ -abhängigen Terme in beiden Gliedern zeigt, dass
ξ00 in einfacher Weise mit der schnell variierenden Kraft zusammenhängt:
2
∂ 2 ξ00
(t, τ ) = F (Φ(t), τ ) bzw. ξ00 (t, τ ) = −F (Φ(t), τ ) .
∂τ 2
Eine Zeitmittelung (2.54) liefert nun aufgrund von (2.55) und der 2π-periodischen
τ -Abhängigkeit der Funktionen ξmn :
Φ̈
∂F
∂F
= −ω02 sin(Φ) − ε2 ω 2 F
∂Φ
∂Φ
2
∂Vf
1
∂F
=−
(Φ)
= −ω02 sin(Φ) − ε2 ω 2
2
∂Φ
∂Φ
= −ω02 sin(Φ) + ε2 ω 2 ξ00
(2.57)
68
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
mit
Vf (Φ)
≡
=
ω02 [1 − cos(Φ)] + 21 ε2 ω 2 F 2
”
—
ω02 [1 − cos(Φ)] + 41 ε2 ω 2 ā21 cos2 (Φ) + ā22 sin2 (Φ)
(2.58)
.
Bei Bedarf kann man durch den Vergleich der höheren Ordnungen in (2.56)
weitere Korrekturen ausrechnen:
∂ξ00
∂ξ01
= −2
,
∂τ
∂t
ξ01 = −2Φ̇ [ā1 sin(τ ) sin(Φ) + ā2 cos(τ ) cos(Φ)]
∂ 2 ξ10
∂
= − 21
(F 2 − F 2 ) ,
∂τ 2
∂Φ
1
ξ10 = − [cos(2τ ) sin(2Φ) − 2ā1 ā2 sin(2τ ) cos(2Φ)]
16
.
Die Bewegungsgleichung (2.57) stellt ein hochinteressantes Ergebnis dar: Das
Leitzentrum Φ(t) des Pendels bewegt sich offenbar im effektiven Potential Vf (Φ),
dessen Form explizit von der Amplitude und der Frequenz der oszillierenden
Bewegung des Aufhängepunktes abhängig ist!
Wir betrachten das effektive Potential Vf (Φ) in (2.58) nun etwas genauer:
Für eine kreisförmige Bewegung des Aufhängepunktes (ā1 = ā2 = √12 ) passiert
offenbar nichts Interessantes, da der Zusatzterm im rechten Glied von (2.58) in
diesem Fall konstant (d. h. Φ-unabhängig) ist. Für ā1 6= ā2 folgen die stationären
Punkte des Potentials aus
0 = Vf′ (Φ) = ω02 sin(Φ) [1 − Ω cos(Φ)]
,
Ω≡
ε2 ω 2 (ā21 − ā22 )
2ω02
als Φ = 0, π, Φ± mit Φ± ≡ ± arccos(Ω−1 ). Um die Stabilität dieser stationären
Punkte zu untersuchen, berechnen wir die zweite Ableitung des Potentials:
”
Vf′′ (Φ) = ω02 cos(Φ) − Ω 2 cos2 (Φ) − 1
—©
.
Es folgt:

Vf′′ (0) = ω02 (1−Ω) ,
Vf′′ (π) = −ω02 (1+Ω) ,
Vf′′ (Φ± ) = ω02 Ω −
1
Ω
‹
.
Für eine überwiegend horizontale Bewegung des Aufhängepunktes (ā1 > ā2
bzw. Ω > 0) folgt also, dass die übliche Ruhelage Φ = 0 nur für niedrige
Frequenzen (Ω < 1) stabil ist; für höhere Frequenzen (Ω > 1) ist die stabile
Ruhelage durch Φ± gegeben, so dass das Pendel in der Ruhelage schräg zur
Seite ausgelenkt ist. Für eine überwiegend vertikale Bewegung (ā1 < ā2 bzw.
Ω < 0) ist die übliche Ruhelage Φ = 0 immer stabil, die stationären Punkte Φ±
(die nur für |Ω| > 1 existieren) sind immer instabil, und die senkrechte Lage
(Φ = π) ist instabil für niedrige (−1 < Ω < 0) und stabil für hohe (Ω < −1)
Frequenzen. Bei einer überwiegend vertikalen Oszillation des Aufhängepunktes
und genügend hohen Frequenzen kann ein Pendel also durchaus Kopf stehen!
69
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
2.10
Erhaltungsgrößen
Bei der Untersuchung eines mechanischen Systems ist es sehr wichtig, möglichst
viele (falls möglich: alle) Erhaltungsgrößen zu bestimmen, da diese zum einen
zur Klassifizierung der Lösungen verwendet werden können und zum anderen die
konkrete Berechnung dieser Lösungen stark vereinfachen. Wir diskutieren einige
naheliegende Methoden, ausgehend von einer vorgegebenen Lagrange-Funktion
L(q, q̇, t) Erhaltungsgrößen zu konstruieren.
Falls die Lagrange-Funktion nicht explizit von der Zeitvariablen abhängt, ist
das Jacobi-Integral
J(q, q̇, t) ≡
X ∂L
∂ q̇k
k
q̇k − L
für die physikalische Bahn erhalten. Dies folgt sofort aus

dJ
dt
‹
=
φ
(
X • d  ∂L ‹
dt
k
=
˜
∂ q̇k
(
X • d  ∂L ‹
dt
k
•
∂L
∂L X ∂L
∂L
q̇k +
q̈k −
q̇k +
q̈k
−
∂ q̇k
∂t
∂qk
∂ q̇k
˜
−
∂ q̇k
∂L
∂L
q̇k −
∂qk
∂t
˜)
k
)

=−
φ
∂L
∂t
‹
φ
.
φ
Um die Bedeutung des Jacobi-Integrals besser zu verstehen, betrachten wir als
Beispiel ein System, das skleronomen Zwangsbedingungen unterworfen ist, und
wir nehmen an, dass die verallgemeinerten Koordinaten zeitunabhängig gewählt
wurden: xi = xi (q). In diesem Fall hängt auch die kinetische Energie nicht
explizit von der Zeit ab und hat nach (2.23) die allgemeine Form
T (q, q̇) =
1
2
X
akl (q)q̇k q̇l
,
akl = alk
.
kl
Wir nehmen außerdem an, dass die verallgemeinerten Kräfte Fk konservativ sind
und somit nach (2.35) aus einem zeitunabhängigen Potential V (q) hergeleitet
werden können. Für ein solches System gilt:
"
Jφ =
X ∂T
k
∂ q̇k
#
q̇k − (T − V )
φ
= [2T − (T − V )]φ = (T + V )φ = E
,
so dass das Jacobi-Integral gleich der Energie des Systems ist. In diesem Fall
dE
∂L
impliziert ∂L
∂t = 0 also dt = 0. Umgekehrt ist es nicht so, dass ∂t 6= 0 notwendigerweise bedeutet, dass die Energie des Systems nicht erhalten ist. Als Beispiel
betrachten wir zwei äquivalente Lagrange-Funktionen L und L′ , die gemäß
d
L′ = L + λ(q, t) = L +
dt
X ∂λ
l
∂λ
q̇l +
∂ql
∂t
!
miteinander verknüpft sind; außerdem soll ∂L
∂t = 0 und Jφ = E = konstant
gelten. Da die Energie für L erhalten ist, muss das Gleiche für die äquivalente
70
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Lagrange-Funktion L′ gelten. Da das Jacobi-Integral für L′ durch
J′ =
X ∂L′
∂ q̇k
k
=J+
X
k
q̇k − L′ = J +
X
q̇k
k
∂
∂ q̇k

X ∂λ
∂λ
−
q̇k
∂qk
∂λ
q̇l +
∂ql
∂t
l
dλ
dt
‹
−
!
dλ
dt
=J−
∂λ
∂t
gegeben ist, hat die Erhaltungsgröße Energie in diesem Fall die Form

∂λ
E= J +
∂t
‹
′
=
"
X ∂L′
φ
k
∂λ
q̇k − L +
∂ q̇k
∂t
#
′
.
φ
Wir stellen fest, dass die Energie für L′ im Allgemeinen nicht gleich dem JacobiIntegral J ′ ist, obwohl das Jacobi-Integral auch in diesem Fall wertvolle Hinweise
auf die Existenz einer Erhaltungsgröße liefert.
Falls die Lagrange-Funktion L(q, q̇, t) nicht explizit von der verallgemeinerten Koordinate ql abhängt (für irgendein l ∈ {1, 2, . . . , f }), so wird diese
Koordinate als zyklisch bezeichnet. Die Existenz einer zyklischen Koordinate,
•
d
dt

∂L
∂ q̇l
‹
−
∂L
∂ql
˜
•
=
φ
d
dt

∂L
∂ q̇l
‹˜
=0
,
φ
impliziert unmittelbar die Existenz einer Erhaltungsgröße:
∂L
(qφ , q̇φ , t) = konstant .
∂ q̇l
Die physikalische Größe pl (q, q̇, t) ≡ ∂∂L
q̇l (q, q̇, t) wird generell (d. h. nicht nur,
wenn sie für die physikalische Bahn erhalten ist) als der mit ql assoziierte verallgemeinerte Impuls (auch: als der „konjugierte“ oder „kanonische“ Impuls) bezeichnet.8 Diese Bezeichnung ist naheliegend, da z. B. für den einfachen Fall
L = 21 mẋ2 − V (x) in der Tat ∂L
∂ ẋ = mẋ = p folgt.
In allgemeineren Beispielen muss ∂∂L
q̇l (q, q̇, t) jedoch nicht unbedingt die physikalische Dimension [Impuls] haben. Zum Beispiel hängt die Lagrange-Funktion
des Zweiteilchenproblems in Relativkoordinaten (s. Gleichung (3.26) des Theorie1-Skripts) nicht explizit von der Variablen ϕ ab:
L(x, ẋ, ϕ, ϕ̇, t) = 21 µ(ẋ2 + x2 ϕ̇2 ) − V (x)
(2.59)
,
2
so dass der verallgemeinerte Impuls ∂L
∂ ϕ̇ = µx ϕ̇ , den wir in § 3.3 des Theorie-1Skriptes als Drehimpuls identifizieren konnten, eine Erhaltungsgröße darstellt.
(S)
Als weitere Erhaltungsgröße folgt wegen ∂L
=
∂t = 0 die Gesamtenergie E
1
2
2 2
µ(
ẋ
+
x
ϕ̇
)
+
V
(x).
2
8 Es ist zu beachten, dass der verallgemeinerte Impuls p = (p , p , . . . , p ) eines physi1 2
f
kalischen Systems, wie auch die Lagrange-Funktion, nicht eindeutig definiert ist. Die zu L
liefert nämlich den verallgemeinerten Impuls
äquivalente Lagrange-Funktion L′ = L + dλ
dt
p′ =
∂L′
∂
=
∂ q̇
∂ q̇
L+
∂λ
∂λ
· q̇ +
∂q
∂t
=
∂L
∂λ
∂λ
+
= p+
(q, t)
∂ q̇
∂q
∂q
der um eine orts- und zeitabhängige Funktion von p abweicht.
,
71
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Ein anderes Beispiel für eine Lagrange-Funktion mit einer zyklischen Koordinate und einem assoziierten erhaltenen verallgemeinerten Impuls ist das
geladene Teilchen in einem elektromagnetischen Feld,
L(x, ẋ, t) = 21 mẋ2 − q̂ [Φ(x, t) − ẋ · A(x, t)]
,
∂A
∂Φ
= 0 und ∂x
= 0. In diesem Fall ist die 3-Komponente des verallmit z. B. ∂x
3
3
gemeinerten Impulses p = ∂L
∂ ẋ erhalten:
d
dp3
=
dt
dt

∂L
∂ ẋ3
‹
=
d
∂L
=0
[mẋ3 + q̂A3 (x1 , x2 , t)] =
dt
∂x3
.
Die Interpretation ist, dass unter diesen Bedingungen der Gesamtimpuls der
Materie und des Feldes in 3-Richtung erhalten ist.
Ähnlich wie vorher bei der Diskussion des Jacobi-Integrals, muss auch nun
angemerkt werden, dass die Abwesenheit offensichtlicher zyklischer Koordinaten
nicht notwendigerweise die Nicht-Existenz von Impulsintegralen impliziert. Zum
Beispiel enthält die Lagrange-Funktion (2.59) für das Zweiteilchenproblem in
kartesischen Koordinaten,
È
L(x1 , x2 , ẋ1 , ẋ2 , t) = 21 µ(ẋ21 + ẋ22 ) − V ( x21 + x22 ) ,
keine offensichtlichen zyklischen Ortskoordinaten. Dennoch wissen wir, dass die
3-Komponente µ(x1 ẋ2 − x2 ẋ1 ) des Drehimpulses eine Erhaltungsgröße darstellt.
Aus diesem Beispiel lernen wir erstens, dass die Existenz zyklischer Koordinaten
von der Wahl des Koordinatensystems abhängt, und zweitens, dass es vorteilhaft
ist, die verallgemeinerten Koordinaten so zu wählen, dass die Lagrange-Funktion
möglichst viele zyklische Koordinaten enthält. Letzteres, also die Bestimmung
des optimalen Koordinatensystems, ist das Ziel der Transformationstheorie.
2.10.1
Elimination von zyklischen Koordinaten
Betrachten wir eine Lagrange-Funktion L(f +1) , die nicht explizit von der Koordinate qf +1 abhängt:
L(f +1) = L(f +1) (q, q̇, q̇f +1 , t)
,
q ≡ (q1 , . . . , qf ) .
(2.60)
Da qf +1 also zyklisch ist, stellt der assoziierte Impuls
pf +1 =
∂L(f +1)
∂ q̇f +1
(2.61)
für die physikalische Bahn eine Erhaltungsgröße dar, die dazu verwendet werden
kann, q̇f +1 als Funktion von (q, q̇, t) sowie der Konstanten pf +1 zu bestimmen:
q̇f +1 = f (q, q̇, t; pf +1 ) .
(2.62)
Diese Beziehung erlaubt es uns offensichtlich, q̇f +1 gänzlich aus den Bewegungsgleichungen für qφ (t) zu eliminieren. Durch Elimination einer zyklischen Variablen kann man daher die Dimensionalität eines Problems reduzieren und es
somit (unter Umständen: erheblich) vereinfachen.
72
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Man kann sich nun fragen, ob die zyklische Koordinate qf +1 nicht auch sofort
in der Lagrange-Funktion (statt erst in der Bewegungsgleichung) eliminiert werden kann. Im Wesentlichen haben wir dies bereits einmal stillschweigend getan,
als wir (in Gleichung (3.26) des Theorie-1-Skripts) die zyklische Winkelvaria|L|2
ble ϕ eliminierten und die Energie als 21 µẋ2 + Vf (x) mit Vf (x) ≡ V (x) + 2µx
2
schrieben. Hier wurde also effektiv die neue Lagrange-Funktion
L(x, ẋ, t) ≡ 12 µẋ2 − Vf (x)
eingeführt, die die Dynamik eines eindimensionalen Teilchens im Potential Vf (x)
beschreibt. Wir zeigen nun, dass diese Elimination auch für die allgemeine
Lagrange-Funktion (2.60) durchgeführt werden kann und dass die LagrangeFunktion nach der Elimination die Form
L(f ) (q, q̇, t; pf +1 ) ≡ L(f +1) (q, q̇, q̇f +1 , t) − pf +1 q̇f +1
(2.63)
hat. Da wir bereits wissen, dass der verallgemeinerte Impuls pf +1 in (2.61) für
die physikalische Bahn (qφ , qφ,f +1 ) erhalten ist, beschränken wir uns hierbei
auf solche Bahnen (q, qf +1 ), für die (2.61) mit konstantem pf +1 und somit auch
(2.62) gilt. Dies bedeutet also, dass die Größe pf +1 in (2.63) für alle betrachteten
Bahnen (q, qf +1 ) den gleichen Wert hat und zeitunabhängig ist, und folglich
auch, dass q̇f +1 in (2.63) stets durch das rechte Glied von (2.62) zu ersetzen ist.
Um zu zeigen, dass die Lagrange-Funktion L(f ) in (2.63) die korrekte Bewegungsgleichung für qφ (t) erzeugt, betrachten wir die mit L(f ) verknüpfte Wirkung:
(q ,t )
S(q12,t12) [q]
Zt2
dt L(f ) (q, q̇, t; pf +1 ) .
=
t1
Für die physikalische Bahn qφ muss unbedingt δS = 0 gelten. Wir überprüfen, dass die in (2.63) angegebene Lagrange-Funktion L(f ) in der Tat diese
Bedingung erfüllt. Der zentrale Punkt hierbei ist, dass die Zeitabhängigkeit von
qf +1 (t) hierbei aufgrund von (2.62) durch
Zt
dt′ f (q(t′ ), q̇(t′ ), t′ ; pf +1 )
qf +1 (t) = qf +1 (t1 ) +
t1
festgelegt ist und keineswegs δqf +1 (t1 ) = δqf +1 (t
R 2 ) = 0 gelten muss. Aus diesem
Grunde entstehen bei der Variation des Terms dt L(f +1) in der Wirkung S[q]
zusätzliche Randterme, die vom zweiten Term −pf +1 q̇f +1 in (2.63) kompensiert
werden müssen:
Zt2
t2
dt L(f +1) (q,q̇, q̇f +1 , t) = (pf +1 δqf +1 )
δ
t1
t1
+
f
+1 Zt2
X
dt
k=1 t1
∂L(f +1)
d
−
∂qk
dt
∂L(f +1)
∂ q̇k
Zt2
t1
φ
(δqk )(t) + O(ε2 )
Zt2
2
= pf +1 δ
dt q̇f +1 + O(ε ) = δ
t1
dt pf +1 q̇f +1 + O(ε2 ) .
73
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Hierbei wurde verwendet, dass pf +1 bei der Variation für alle betrachteten Bahnen (q(t), qf +1 (t)) gleich und zeitunabhängig ist. Es folgt nun sofort, dass für
L(f ) in (2.63) in der Tat δS = 0 gilt, so dass die physikalische Bahn qφ die
mit L(f ) assoziierte Lagrange-Gleichung erfüllt. Für das vorher angesprochene
Zweiteilchenproblem folgt z. B.
L(1) (x, ẋ, t) = L(2) (x, ẋ, ϕ, ϕ̇, t) − pϕ ϕ̇
1
= µ(ẋ2 + x2 ϕ̇2 ) − V (x) − µx2 ϕ̇2
2
|L|2
1
= µẋ2 − Vf (x) , Vf (x) = V (x) +
2
2µx2
,
|L|
wobei ϕ̇ = µx
2 verwendet wurde.
Bisher haben wir nur den Fall betrachtet, dass die Lagrange-Funktion eine
einzelne zyklische Koordinate qf +1 aufweist. Falls mehrere zyklische Variablen
qz ≡ (qf +1 , qf +2 , . . . , qf +n ) vorliegen,
L(f +n) = L(f +n) (q, q̇, q̇z , t) ,
sind alle Komponenten des assoziierten Impulses pz = (pf +1 , pf +2 , . . . , pf +n )
erhalten:
pz =
∂L(f +n)
(q, q̇, q̇z , t) bzw. q̇z = f (q, q̇, t; pz ) .
∂ q̇z
(2.64)
Die gleichen Argumente wie vorher zeigen nun, dass die Lagrange-Funktion nach
der Elimination aller qz -Variablen die Form
L(f ) (q, q̇, t; pz ) ≡ L(f +n) (q, q̇, q̇z , t) − pz · q̇z
(2.65)
hat, wobei q̇z durch die Funktion f (q, q̇, t; pz ) in (2.64) zu ersetzen ist und
der Impuls pz für alle betrachteten Bahnen den gleichen Wert hat und zeitunabhängig ist. Die Lagrange-Funktion nach der Elimination der zyklischen
qz -Variablen, also L(f ) in (2.65), wird üblicherweise als die Routh-Funktion bezeichnet.9
2.11
Das Noether-Theorem
In Abschnitt [2.10] konnten wir einige wichtige Erhaltungsgrößen identifizieren,
deren Existenz darauf beruhte, dass entweder die Zeitvariable t oder eine der
verallgemeinerten Koordinaten qk zyklisch ist, so dass die Lagrange-Funktion
eine Invarianz unter Translationen der Form
t′ = t + α bzw. qk′ = qk + α
(α ∈ R)
9 Bei der Behandlung der Hamilton-Mechanik werden wir sehen, dass die Elimination der
verallgemeinerten Geschwindigkeiten q̇z zugunsten der Impulse pz , oder genauer: die Transformation von L(f +n) (q, q̇, q̇z , t) auf −L(f ) (q, q̇, t; pz ), mathematisch gesprochen eine LegendreTransformation darstellt. Die Anwendung einer solchen Transformation ist hier besonders
geschickt, da die Variablen qz zyklisch und die Impulse pz somit erhalten sind.
74
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
aufweist. Wir versuchen nun, einen allgemeineren Zusammenhang zwischen Invarianzen der Lagrange-Funktion und Erhaltungsgrößen herzustellen und betrachten hierzu allgemein Punkttransformationen der Form
t′ = t′ (t; α)
,
q′ = q′ (q, t; α) ,
(2.66)
die von einem kontinuierlich variierbaren Parameter α abhängig sind. Der Parameter α kann hierbei ein- oder mehrdimensional sein. Die Umkehrung von
(2.66) ist:
t = t(t′ ; α)
,
q = q(q′ , t′ ; α) .
Wir nehmen im Folgenden an, dass der Parameterwert α = 0 der Identität
entspricht:
t′ (t; 0) = t
t(t′ ; 0) = t′
, q′ (q, t; 0) = q
, q(q′ , t′ ; 0) = q′
,
so dass die Raum-Zeit-Koordinaten für kleine Parameterwerte nur geringfügig
abgeändert werden: (q′ , t′ ) = (q, t) + O(|α|).
Wir definieren nun die neue Lagrange-Funktion L′ (q′ , q̇′ , t′ ) durch
L(q, q̇, t)dt ≡ L′ (q′ , q̇′ , t′ ; α)dt′
,
q̇′ ≡
dq′
dt′
(2.67)
,
d. h. explizit:
€
Š dt
L′ (q′ , q̇′ , t′ ; α) = L q(q′ , t′ ; α), q̇(q′ , q̇′ , t′ ; α), t(t′ ; α)
(t′ ; α) .
dt′
Die Forminvarianz der Bewegungsgleichung ist – wie wir wissen – gewährleistet,
falls eine Beziehung der Form
dλ ′ ′
(q , t ; α)
(2.68)
dt′
zwischen der „neuen“ und der „alten“ Lagrange-Funktion und somit eine Beziehung der Form
L′ (q′ , q̇′ , t′ ; α) = L(q′ , q̇′ , t′ ) +
t′2
S ′ [q′ ] = S[q′ ] + λ(q′ , t′ ; α)
t′1
zwischen der neuen und der alten Wirkung vorliegt: Wir wissen ja, dass die
Addition einer vollständigen Zeitableitung zur Lagrange-Funktion die Bewegungsgleichung invariant lässt. Damit α = 0 der Identität entspricht, muss
λ(q′ , t′ ; 0) = 0 gelten. Kombination von (2.67) und (2.68) liefert nun:
L(q, q̇, t)dt = L(q′ , q̇′ , t′ )dt′ + (dλ)(q′ , t′ ; α) .
(2.69)
Wir nehmen im Folgenden an, dass die Transformation (2.66) die Bewegungsgleichung invariant lässt, so dass (2.69) gilt, und untersuchen die entsprechenden
Konsequenzen.
Der Einfachheit halber führen wir die Notation (q′ , t′ ) = Tα (q, t) ein, die die
Wirkung des Operators Tα definiert, und wir schreiben α = αα̂. Wir beschränken uns im Folgenden auf Transformationen, die eine 1-Parameter-Gruppe bilden:
T(α1 +α2 )α̂ = Tα1 α̂ Tα2 α̂
(α̂ fest, α1,2 ∈ R) .
75
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Da eine beliebige Transformation Tα in diesem Fall aus Transformationen Tα/N
aufgebaut werden kann, die für N → ∞ nur geringfügig von der Identität abweichen:
Tα = (Tα/N )N
(N = 1, 2, . . .)
,
reicht es aus, die Wirkung von Tα für |α| → 0 zu untersuchen. Man kann sich
diese Wirkung im Limes |α| → 0 beschaffen, indem man die interessierenden
physikalischen Größen bis zur linearen Ordnung in α um α = 0 entwickelt. Um
den linearen Beitrag zu einer physikalischen Größe anzugeben, führen wir die
Notation „D“ ein. Zum Beispiel gilt
t′ = t′ (t; α) = t + Dt + O(α2 ) ,
Dt ≡
∂t′
(t; 0) · α
∂α
und
q′ = q′ (q, t; α) = q + Dq + O(α2 ) ,
und daher
Á
•
Dq ≡
∂q′
(q, t; 0) · α
∂α
˜Á •
˜
dt′
d
d
1 + (Dt) + O(α2 )
= q̇ + (Dq)
dt
dt
dt
d
d
= q̇ + Dq̇ + O(α2 ) , Dq̇ ≡ (Dq) − q̇ (Dt) .
dt
dt
dq′
dq′
=
′
dt
dt
q̇′ =
(2.70)
Außerdem gilt
λ(q′ , t′ ; α) = (Dλ)(q, t) + O(α2 ) ,
(Dλ)(q, t) ≡
∂λ
(q, t; 0) · α .
∂α
Für das Differential dt benötigen wir noch die Beziehung dt′ = dt+D(dt)+O(α2 )
mit
D(dt) ≡
∂ 2 t′
(t; 0) · αdt = d(Dt)
∂t∂α
.
Einsetzen dieser Beziehungen in (2.69) liefert nun:
0 = L(q + Dq, q̇ + Dq̇, t + Dt)d(t + Dt)
− L(q, q̇, t)dt + d [(Dλ)(q, t)]
•
∂L
∂L
=
(q, q̇, t) · Dq +
(q, q̇, t) · Dq̇
∂q
∂ q̇
˜
∂L
+ (q, q̇, t)Dt dt + L(q, q̇, t)d(Dt) + d [(Dλ)(q, t)]
∂t
und daher:
0=
∂L d(Dq) ∂L
d(Dt) d(Dλ)
∂L
· Dq +
·
+
Dt − J
+
∂q
∂ q̇
dt
∂t
dt
dt
.
(2.71)
Hierbei wurden (2.70) und die Definition J ≡ q̇ · ∂L
∂ q̇ − L des Jacobi-Integrals
verwendet. Die Lagrange-Funktion muss also für eine bestimmte Funktion λ die
76
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Bedingungsgleichung (2.71) erfüllen, damit Forminvarianz der Bewegungsgleichung vorliegen kann.
Wir betrachten Gleichung (2.71) nun speziell für die physikalische Bahn
qφ (t). In diesem Fall gilt

∂L
∂q
‹
=
φ
d
dt

∂L
∂ q̇
‹

,
φ
dJφ
∂L
=−
dt
∂t
‹
,
φ
so dass (2.71) auch in der Form
0=
d
dt

‹
∂L
· Dq − JDt + Dλ
∂ q̇
(2.72)
φ
darstellbar ist. Wir haben hiermit ein sehr wichtiges Ergebnis erhalten: Falls
eine Transformation durchgeführt wird, die die Bewegungsgleichung invariant
lässt und somit die Bedingungsgleichung (2.71) erfüllt, ist

‹
∂L
· Dq − JDt + Dλ
∂ q̇
= konstant
(2.73)
φ
eine Erhaltungsgröße! Dieser Zusammenhang zwischen kontinuierlichen Symmetrien der Lagrange-Funktion und Erhaltungsgrößen ist als das Noether-Theorem
bekannt. Wir diskutieren im Folgenden einige Beispiele.
Zeittranslation
Zeittranslationen der Form t′ = t + α mit α ∈ R bilden eine 1-Parameterd
Gruppe. Es folgt Dt = α, Dq = 0 und daher auch dt
(Dq) = 0. Wir zeigen,
dass sich auch unter der Annahme Dλ = 0 eine nicht-triviale Erhaltungsgröße
finden lässt: Die Bedingungsgleichung (2.71), die die Invarianz der Bewegungsgleichung gewährleisten soll, vereinfacht sich in diesem Fall auf ∂L
∂t = 0. Nur
wenn die Lagrange-Funktion nicht explizit zeitabhängig ist, liegt also eine Invarianz vor. Die assoziierte Erhaltungsgröße folgt aus (2.72) als Jφ , d. h. (falls
auch die Zwangsbedingungen zeitunabhängig sind) als die Energie. Die Tatsache, dass Jφ eine Erhaltungsgröße darstellt, falls die Zeitvariable zyklisch ist, ist
natürlich schon aus Abschnitt [2.10] bekannt.
Translationen im Konfigurationsraum
Wir betrachten nun Translationen der Form q′ = q + α, wobei α = αα̂ ein
f -dimensionaler Vektor im Konfigurationsraum ist und α̂ zunächst festgehalten wird. Wir suchen wiederum Erhaltungsgrößen für Dλ = 0. Es gilt Dt = 0,
d
(Dq) = 0, so dass sich die Bedingungsgleichung (2.71)
Dq = αα̂ und daher dt
∂L
auf ∂q · α̂ = 0 reduziert; die entsprechende Erhaltungsgröße ist dann ∂L
∂ q̇ · α̂.
Wiederum reproduzieren wir also ein bereits aus Abschnitt [2.10] bekanntes
Ergebnis: Falls eine der verallgemeinerten Koordinaten zyklisch ist, ist der assoziierte verallgemeinerte Impuls erhalten. Für den Spezialfall, dass ∂L
∂q · α̂ = 0
für mehrere oder gar alle Einheitsvektoren α̂ gilt, folgt, dass mehrere oder gar
alle Komponenten des verallgemeinerten Impulses ∂L
∂ q̇ erhalten sind.
77
-------------------------------------------------------------------------------------------------- 2. LAGRANGE-FORMALISMUS
Drehungen im Ortsraum
Für Drehungen gilt R(α)xi = xi + α × xi + O(α2 ), s. Gleichung (2.18) des
Theorie-1-Skripts, so dass unter der Annahme Dλ = 0 nun Dxi = α × xi ,
d
dt (Dxi ) = α × ẋi und Dt = 0 folgt. Die Bedingungsgleichung (2.71) für die
Existenz einer Invarianz lautet nun:
0 = α̂ ·
X
xi ×
i
∂L
∂L
+ ẋi ×
∂xi
∂ ẋi
‹
,
und die assoziierte Erhaltungsgröße ist diePentsprechende Komponente des verallgemeinerten Gesamtdrehimpulses L = i xi × pi mit pi ≡ ∂∂L
ẋi :
X ∂L
i
∂ ẋi
· (α̂ × xi ) = α̂ ·
X
i
∂L
xi ×
∂ ẋi
!
= α̂ · L = konstant .
Dies ergänzt einige Resultate für den Gesamtdrehimpuls aus Kapitel 3 und 4
des Theorie-1-Skripts.
Geschwindigkeitstransformationen
Betrachten wir schließlich den letzten Baustein der allgemeinen Galilei-Transformation, die Geschwindigkeitstransformation x′i = xi − vt, wobei die Geschwindigkeit v die Rolle des Parameters α aus dem allgemeinen Formalismus
spielt und daher vorübergehend mit α bezeichnet wird: x′i = xi − αt. Es folgt
d
(Dxi ) = −α und Dt = 0. Wir konzentrieren uns auf abgeschlosDxi = −αt, dt
sene mechanische Systeme, die also invariant
P ∂L unter Translationen der Form
x′i = xi − ξ sind und die Eigenschaft
i ∂xi = 0 besitzen. In diesem Fall
vereinfacht sich die Bedingungsgleichung (2.71) auf
0 = (−α) ·
X ∂L
i
d(Dλ)
d
+
=
∂ ẋi
dt
dt
Dλ − α ·
X
!
mi xi
,
i
so dass Dλ nun ungleich Null ist und in einfacher Weise mit dem Massenschwerpunkt zusammenhängt: Dλ = α · M xM (t). Die assoziierte Erhaltungsgröße folgt
nun aus (2.72) als
Dλ − αt ·
X ∂L
i
∂ ẋi
•
= M α · xM (t) −
˜
1
P(t)t = konstant ,
M
(2.74)
wobei für translationsinvariante Systeme natürlich auch der Gesamtimpuls erhalten ist: P(t) = P(0). Da (2.74) für abgeschlossene mechanische Systeme für
alle Geschwindigkeitsrichtungen α̂ gelten soll, folgt:
xM (t) −
1
P(t) · t = konstant .
M
Dass es in abgeschlossenen Systemen generell mindestens zwei Erhaltungsgrößen
1
gibt, P(t) und xM (t) − M
P(t)t, konnten wir auch bereits in § 3.1 des Theorie1-Skripts feststellen.
78
Kapitel
3
Hamilton-Formalismus
Die Behandlung des Lagrange-Formalismus im vorigen Kapitel hat gezeigt, dass
man die Dynamik komplizierter wechselwirkender Vielteilchensysteme in äußeren Kraftfeldern auch dann, wenn diese Systeme Zwangsbedingungen unterworfen sind, vollständig mit Hilfe einer einzelnen skalaren Funktion L(q, q̇, t), der
Lagrange-Funktion, beschreiben kann. Für nahezu alle praktischen Zwecke ist
die Lagrange-Theorie völlig ausreichend und wegen ihrer einfachen Struktur und
ihrer direkteren Verbindung mit der Newton’schen Theorie dem in diesem Kapitel zu behandelnden (und grundsätzlich äquivalenten) Hamilton-Formalismus
vorzuziehen. Wie bereits in der Einführung zu Kapitel 1 erklärt wurde, gibt
es dennoch gute Gründe für die Behandlung der Hamilton’schen Formulierung
der Klassischen Mechanik: Die Hamilton-Theorie ist hochelegant und gibt die
tiefsten Einblicke in die Struktur der Klassischen Mechanik. Für bestimmte,
historisch sehr wichtige Anwendungen, insbesondere für die Durchführung der
Störungstheorie in der Himmelsmechanik, ist die Hamilton’sche Formulierung
besser geeignet als die Lagrange-Theorie. Die Hamilton-Theorie ist auch ein
besserer Startpunkt für formale (mathematische) Untersuchungen. Die Struktur der Hamilton’schen Bewegungsgleichungen ist invariant unter einer weitaus
größeren Klasse von Transformationen als diejenige der Lagrange-Gleichungen.
Dementsprechend ist der Hamilton-Formalismus ein besserer Startpunkt für die
Transformationstheorie, die bezweckt, die Bewegungsgleichungen mittels geeigneter Transformationen möglichst stark zu vereinfachen. Und selbstverständlich
ist auch sehr wichtig, dass die Hamilton-Theorie die Basis für die theoretische
Beschreibung der Quantenmechanik liefert, nicht nur im nicht-relativistischen
Fall, der mit Hilfe der Schrödinger-Gleichung beschrieben wird, sondern auch
bei der Formulierung der Klein-Gordon- und Dirac-Gleichungen in der relativistischen Theorie.
Zur Motivation für die Entwicklung eines neuen Formalismus zunächst Folgendes: Die Lagrange-Theorie (der zweiten Art) hat ganz allgemein gezeigt, dass
das Jacobi-Integral
J(q, q̇, t) =
∂L
· q̇ − L
∂ q̇
(3.1)
für Systeme, deren Lagrange-Funktion nicht explizit von der Zeitvariablen abhängt, eine Erhaltungsgröße darstellt und (falls auch die Zwangsbedingungen
und die Transformationsvorschrift xi (q) zeitunabhängig sind) als die Energie
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
interpretiert werden kann. Außerdem haben wir gelernt, dass der verallgemeinerte Impuls
pk (q, q̇, t) ≡
∂L
(q, q̇, t)
∂ q̇k
(3.2)
eine Erhaltungsgröße ist, falls L nicht explizit von der Koordinate qk abhängt.
Aus diesen Gründen spielen die physikalischen Größen J und p ≡ (p1 , p2 , . . . , pf )
auch dann eine prominente Rolle im Lagrange-Formalismus, wenn sie nicht exakt erhalten sind. Man könnte sich daher fragen, ob es nicht hilfreich wäre, die
Lagrange-Funktion L durch J in (3.1) und die verallgemeinerte Geschwindigkeit
q̇ durch p in (3.2) zu ersetzen. Dies würde u.a. erfordern, die Geschwindigkeit
q̇ durch Inversion der Beziehung (3.2) zu bestimmen:
q̇ = q̇(q, p, t)
und diese in (3.1) einzusetzen. Man erhält in dieser Weise eine Funktion
H(q, p, t), die von den verallgemeinerten Koordinaten, verallgemeinerten Impulsen und von der Zeit abhängig ist. Hierbei sind nun (q, p, t) als unabhängige
Variablen anzusehen:
H(q, p, t) ≡ J(q, q̇(q, p, t), t)
.
(3.3)
Eine solche Beschreibung mit Hilfe einer Funktion H(q, p, t) hätte mindestens
dann Vorteile, wenn die Energie oder eine Komponente des verallgemeinerten
Impulses eines Systems erhalten ist. Wir werden im Laufe dieses Kapitels sehen,
dass die Idee, von L auf H zu transformieren, auch in vielerlei anderer Hinsicht
äußerst fruchtbar ist. Die Funktion H(q, p, t) bildet die Basis der HamiltonTheorie und wird als die Hamilton-Funktion bezeichnet.
Bevor wir uns im Detail mit den physikalischen Eigenschaften der HamiltonFunktion und mit der Herleitung entsprechender Bewegungsgleichungen befassen, untersuchen wir zunächst die mathematischen Eigenschaften der Transformation, die durch die Gleichungen (3.1) - (3.3) beschrieben wird und von
L(q, q̇, t) auf H(q, p, t) führt. Eine solche Transformation wird als LegendreTransformation bezeichnet; sie findet in nahezu allen Bereichen der Physik
wichtige Anwendungen. Legendre-Transformationen verknüpfen zum Beispiel
die verschiedenen thermodynamischen Potentiale (wie die Freie Energie und die
Entropie) in der Thermodynamik und der Statistischen Physik. Außerdem sind
Legendre-Transformationen von großer Bedeutung in klassischen Feldtheorien
und auch in der Quantenfeldtheorie. Feldtheorien können gewissermaßen als
Verallgemeinerung der Klassischen Mechanik angesehen werden: Während Teilchensysteme in der Klassischen Mechanik durch endlich viele Freiheitsgrade und
durch Lagrange- und Hamilton-Funktionen charakterisiert sind, besitzt ein Feld
ein Kontinuum von Freiheitsgraden und wird durch Lagrange- und HamiltonDichten beschrieben. Hierbei sind die Lagrange- und die Hamilton-Variante in
beiden Theorien durch Legendre-Transformationen miteinander verknüpft.
3.1
Die Legendre-Transformation
Wir betrachten zuerst die Legendre-Transformation einer Funktion F (u) einer
eindimensionalen reellen Variablen u ∈ R, die in ihrem Definitionsbereich zweimal differenzierbar ist und eine streng positive zweite Ableitung hat: F ′′ (u) > 0.
80
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
Wir werden solche Funktionen als strikt konvex bezeichnen.1 Die strikte Konvexität von F (u) wird im Folgenden wesentlich sein.2
Bevor wir die Legendre-Transformierte G(v) von F (u) definieren, führen wir
zunächst die Hilfsfunktion
Ü u) ≡ vu − F (u)
G(v,
(3.4)
ein, die (neben u) auch noch von einer zweiten Variablen v abhängig ist. Als
Ü u) strikt konkav:
Funktion von u ist die Hilfsfunktion G(v,
Ü
∂ 2G
= −F ′′ (u) < 0
∂u2
,
so dass sie für den Wert v der neuen Variablen entweder kein Maximum oder
ein eindeutiges Maximum bei um (v) besitzt, wobei um (v) durch
0=
Ü
∂G
(v, um (v)) = v − F ′ (um (v))
∂u
(3.5)
bestimmt wird. Wir betrachten im Folgenden nur solche v-Werte, für die ein
eindeutiges Maximum um (v) existiert. Das Maximum um (v) steigt streng monoton an als Funktion von v, denn aus (3.5) folgt durch Ableiten: u′m (v) =
[F ′′ (um (v))]−1 > 0.
Die Legendre-Transformierte G(v) von F (u) wird nun durch
Ü um (v))
G(v) ≡ G(v,
,
d. h. durch Einsetzen von um (v) in (3.4) definiert.
Wir diskutieren einige Eigenschaften der Legendre-Transformierten G(v) von
1 Es ist vielleicht interessant, darauf hinzuweisen, dass die in der Mathematik verwendete
Definition der strikten Konvexität geringfügig allgemeiner ist; sie lautet:
F (λu1 + (1 − λ)u2 ) < λF (u1 ) + (1 − λ)F (u2 )
(0 < λ < 1)
.
Diese Definition ist insofern allgemeiner, als nicht gefordert wird, dass F (u) zweimal differenzierbar ist. Außerdem gibt es Funktionen, wie z.B. F (u) = u4 (u ∈ R), die nach der
mathematischen Definition strikt konvex sind und das Kriterium F ′′ (u) > 0 für einzelne uWerte (im Beispiel: für u = 0) verletzen. Umgekehrt zeigt man leicht, dass das Kriterium
F ′′ (u) > 0 die obige Ungleichung impliziert, so dass unsere „strikt konvexen“ Funktionen auch
nach der mathematischen Definition strikt konvex sind.
2 Natürlich darf F (u) auch strikt konkav sein, so dass im Definitionsbereich der Funktion
F nun F ′′ (u) < 0 gilt, da in diesem Fall −F (u) strikt konvex ist.
Genauer formuliert: Mit Hilfe der Definitionen
F̄ (u) ≡ −F (u)
,
Ḡ(v) ≡ −G(−v)
,
v̄ ≡ −v
,
ūm (v̄) ≡ um (v)
kann man die Bestimmungsgleichungen G(v) = vum (v) − F (um (v)) und v = F ′ (um (v)) auch
als Legendre-Transformation der strikt konvexen Funktion F̄ (u) darstellen:
Ḡ(v̄) = v̄ ūm (v̄) − F̄ (ūm (v̄))
,
v̄ = F̄ ′ (ūm (v̄)) .
Wir werden uns im Folgenden überwiegend mit strikt konvexen und eher weniger mit konkaven
Funktionen befassen.
81
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
Ü
G(v,
u)
G(v)
vu
F (u)
u
Abbildung 3.1: Konstruktion der Legendre-Transformierten G(v) von F (u) .
F (u): Die Funktion G(v) ist ebenfalls strikt konvex; dies folgt aus
d2
[vum (v) − F (um (v))]
dv 2
d
{um (v) + [v − F ′ (um (v))] u′m (v)}
=
dv
= u′m (v) > 0 .
G′′ (v) =
Außerdem ist die Legendre-Transformierte von G wiederum durch F gegeben;
aus diesem Grund heißen F und G „dual“ und wird die Legendre-Transformation
auch als „Dualitätstransformation“ bezeichnet. Um die Legendre-Transformierte
von G zu bestimmen, definieren wir zunächst die Hilfsfunktion
Ü(u, v) ≡ uv − G(v) = uv − [vum (v) − F (um (v))]
F
.
Ü strikt konkav als Funktion von v und hat daher
Da G strikt konvex ist, ist F
′
entweder kein Maximum oder ein eindeutiges Maximum vm (u) mit vm
(u) > 0,
das durch
0=
Ü
∂F
(u, vm (u)) = u − G′ (vm (u)) = u − um (vm (u))
∂v
bestimmt wird. Wir stellen fest, dass vm durch Inversion aus um folgt und um−1
gekehrt: vm = u−1
m bzw. um = vm . Die Legendre-Transformierte von G(v) ist
daher durch
Ü(u, vm (u)) = vm (u) [u − um (vm (u))] + F (um (vm (u))) = F (u)
F ∗ (u) ≡ F
gegeben, so dass F ∗ = F gilt und F und G in der Tat dual sind. Als letzte
Eigenschaft der Legendre-Transformierten G(v) sei die Young’sche Ungleichung
erwähnt:
vu ≤ F (u) + G(v)
,
(3.6)
82
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
Ü u) ihr globales Maximum als
die sofort daraus folgt, dass die Hilfsfunktion G(v,
Funktion von u für u = um (v) annimmt:
Ü u) ≤ G(v,
Ü um (v)) = G(v)
vu − F (u) = G(v,
.
Wir werden im Folgenden einige Beispiele von Legendre-Transformationen behandeln.
Als erstes Beispiel betrachten wir die (strikt konvexe) Funktion F (u) =
1 2
Ü u) = vu − 1 u2 hat ihr Maximum als
u
. Die entsprechende Hilfsfunktion G(v,
2
2
Funktion von u bei u = um (v) = v, so dass die Legendre-Transformierte G von
F durch
G(v) = vum (v) −
1
2
[um (v)]2 = v 2 − 21 v 2 = 21 v 2
gegeben ist. Wir stellen fest, dass G und F in diesem Fall dieselbe funktionale Form haben, so dass diese Funktionen selbstdual sind. Die Gültigkeit der
Young’schen Ungleichung,
uv ≤ 21 (u2 + v 2 )
bzw.
0 ≤ 21 (u − v)2
,
ist in diesem Fall leicht nachvollziehbar. Als zweites Beispiel betrachten wir die
Funktion F (u) = p1 up mit u > 0, p ∈ R und p > 1, die ebenfalls strikt konvex
Ü u) = vu − 1 up und daher um (v) = v 1/(p−1) . Definieren wir nun
ist. Es folgt G(v,
p
p
die reelle Zahl q ∈ R durch q ≡ p−1
> 1, so ist die Legendre-Transformierte G
von F durch
—p
1
1
1 ” p−1
1
v
= v q (v > 0)
G(v) = vum (v) − F (um (v)) = v 1+ p−1 −
p
q
gegeben, und die Young’sche Ungleichung:
uv ≤
1 p 1 q
u + v
p
q
(p, q > 1 ,
1 1
+ = 1)
p q
ist in diesem Fall weitaus weniger trivial.
3.1.1
Funktionen mehrerer Variabler
Auch bei der Legendre-Transformation von Funktionen F (u), die von mehreren
Variablen u = (u1 , u2 , . . . , un ) abhängig sind, müssen wir strikte Konvexität
fordern.3 Für mindestens zweimal differenzierbare Funktionen F (u) bedeutet
dies nun, dass die Matrix der zweiten Ableitungen von F positiv definit ist, d. h.
dass für alle Vektoren h 6= 0:
hT
∂2F
(u) h > 0
∂u2
Ü u) ein:
gilt.4 Wir führen die Hilfsfunktion G(v,
Ü u) ≡ v · u − F (u) ,
G(v,
3 Selbstverständlich darf die Funktion F (u) auch strikt konkav sein, aber konkave Funktionen sind für uns zunächst weniger relevant.
4 Die in der konvexen Analysis übliche, geringfügig allgemeinere Definition lautet für Funktionen mehrerer Variablen:
F (λu1 + (1 − λ)u2 ) < λF (u1 ) + (1 − λ)F (u2 )
(0 < λ < 1)
.
Es ist wiederum sehr einfach, zu zeigen, dass unsere Definition diese Ungleichung impliziert.
83
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
die strikt konkav als Funktion von u ist und deshalb als Funktion von u entweder
kein Maximum oder ein eindeutiges Maximum um (v) hat, das im letzteren Fall
durch
0=
Ü
∂F
∂G
(v, um (v)) = v −
(um (v))
∂u
∂u
(3.7)
definiert ist. Wir fügen zwei Bemerkungen hinzu: Erstens folgt durch Ableiten
m
von (3.7) bezüglich v, dass die Matrix ∂u
∂v (v) positiv definit ist:
−1
∂um
∂2F
(um (v))
(v) =
∂v
∂u2
,
2
da ∂∂uF2 positiv definit ist. Zweitens zeigt man leicht, dass die Lösung um (v) von
(3.7), falls sie existiert, eindeutig ist, denn die Annahme zweier unterschiedlicher
Lösungen u1 und u2 mit u2 − u1 ≡ u21 6= 0 führt sofort zu einem Widerspruch:
•
0=
∂F
∂u
‹

(u2 ) −
Z1
dλ
=
0
uT
21
∂2F
∂u2
∂F
∂u
‹
˜
(u1 ) · u21 =
Zu2
u1
du ·
∂2F
∂u2
(u) u21
(u1 + λu21 ) u21 > 0
.
Hierbei wurde der Integrationsweg von u1 nach u2 durch u = u1 + λu21 parametrisiert. Die Legendre-Transformierte G von F folgt nun als
Ü um (v)) = v · um (v) − F (um (v))
G(v) ≡ G(v,
,
2
und zweifache Ableitung nach v zeigt nun, dass ∂∂vG2 positiv definit und G selbst
somit strikt konvex ist.
Zur Berechnung der Legendre-Transformierten von G benötigen wir zuerst
wiederum die Hilfsfunktion
Ü(u, v) ≡ u · v − G(v) = u · v − [v · um (v) − F (um (v))]
F
,
die strikt konkav ist als Funktion von v und (falls dieses existiert) ein eindeutiges
Maximum hat für v = vm (u) mit
0=
Ü
∂F
∂G
(u, vm (u)) = u −
(vm (u)) = u − um (vm (u))
∂v
∂v
.
−1
Es folgt daher wiederum, dass vm = u−1
m bzw. um = vm gilt. Die LegendreTransformierte von G ist nun:
Ü(u, vm (u)) = vm (u)·[u − um (vm (u))] + F (um (vm (u))) = F (u) ,
F ∗ (u) = F
so dass F und G auch im mehrdimensionalen Fall dual sind: F ∗ = F . Die
Young’sche Ungleichung folgt aus
Ü u) ≤ G(v,
Ü um (v)) = G(v)
v · u − F (u) = G(v,
84
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
als
v · u ≤ F (u) + G(v)
.
Wir beschränken uns auf ein einzelnes Beispiel: Die Legendre-Transformierte
von F (u) = 21 u2 ist G(v) = 21 v2 , so dass die Funktion F (u) = 12 u2 auch für
u ∈ Rn selbstdual ist; die Young’sche Ungleichung ist in diesem Fall durch
u · v ≤ 12 (u2 + v2 ) gegeben.
3.1.2
Funktionen mit zusätzlichen „Dummy“-Variablen
Als nächste Stufe der Verallgemeinerung betrachten wir Funktionen F (u, w),
die von mehreren Variablen u ≡ (u1 , u2 , . . . , un ) und w ≡ (w1 , w2 , . . . , wn′ ) abhängig sind und nur bezüglich der u-Variablen Legendre-transformiert werden.
Diese Verallgemeinerung ist physikalisch äußerst relevant, da wir im Folgenden
Legendre-Transformationen bezüglich der Geschwindigkeiten q̇, jedoch nicht bezüglich der Koordinaten q und der Zeit t durchführen werden.
Für Funktionen F (u, w), die nur bezüglich der Variablen u Legendre-transformiert werden, können wir grundsätzlich alle Ergebnisse von Abschnitt [3.1.1]
Ü u) durch G(v,
Ü u, w), um (v)
übernehmen, falls F (u) überall durch F (u, w), G(v,
durch um (v, w), G(v) durch G(v, w) und vm (u) durch vm (u, w) ersetzt wird.
Insbesondere gilt also:
v=
∂F
(um (v, w), w)
∂u
G(v, w) = v · um (v, w) − F (um (v, w), w)
,
.
Im Folgenden sind u. a. die Ableitungen und Differentiale von G(v, w) relevant.
Für die partiellen Ableitungen von G bezüglich v und w erhält man
•
˜T •
∂G
∂um
(v, w) = um (v, w) +
(v, w)
∂v
∂v
v−
˜
∂F
(um (v, w), w) = um (v, w)
∂u
bzw.
•
˜ •
˜
T
∂um
∂F
∂F
∂G
v−
(v, w) =
(v, w)
(um (v, w), w) −
(um (v, w), w)
∂w
∂w
∂u
∂w
∂F
(um (v, w), w) .
=−
∂w
Es folgt für das Differential dG:
dG = um (v, w) · dv −
∂F
(um (v, w), w) · dw
∂w
,
(3.8)
und umgekehrt gilt natürlich auch:
dF = vm (u, w) · du −
für das Differential dF .
∂G
(vm (u, w), w) · dw
∂w
(3.9)
85
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
3.1.3
Anwendung auf die Lagrange-Funktion
Wir untersuchen nun die Legendre-Transformation der Lagrange-Funktion
L(q, q̇, t) bezüglich der Geschwindigkeiten q̇, wobei zu beachten ist, dass die
Koordinaten q und die Zeit t bei dieser Transformation nur als Parameter auftreten und somit „Dummy“-Variablen sind. Die Legendre-Transformation bezüglich q̇ ist nur deshalb möglich, weil die Lagrange-Funktion L(q, q̇, t), wie wir
aus Abschnitt [2.6.2] wissen, für alle uns interessierenden Probleme eine strikt
konvexe Funktion der Geschwindigkeiten ist.
Wir wenden nun die Ideen und Ergebnisse der letzten beiden Abschnitte
an und führen eine neue Variable p = (p1 , p2 , . . . , pf ), den kanonisch zu q
konjugierten Impuls, und eine Hilfsfunktion
Ü
H(q,
p, q̇, t) ≡ p · q̇ − L(q, q̇, t)
Ü ist strikt konkav als Funktion von q̇ und hat daher (als
ein. Die Hilfsgröße H
Funktion von q̇) ein eindeutiges Maximum für q̇ = q̇m (q, p, t), wobei q̇m durch
0=
Ü
∂H
∂L
(q, p, q̇m , t) = p −
(q, q̇m , t)
∂ q̇
∂ q̇
(3.10)
definiert ist. Die Legendre-Transformierte von L(q, q̇, t) ist nun durch
H(q, p, t) ≡ p · q̇m (q, p, t) − L(q, q̇m (q, p, t), t)
(3.11)
gegeben und wird, wie wir bereits aus der Einführung zu diesem Kapitel wissen,
als die Hamilton-Funktion bezeichnet. Da die Lagrange-Funktion strikt konvex
ist als Funktion von q̇, ist H strikt konvex als Funktion des kanonisch zu q
konjugierten Impulses p. Auch die Rücktransformation kann daher problemlos
durchgeführt werden: Die Hilfsfunktion
e
L(q,
q̇, p, t) ≡ q̇ · p − H(q, p, t)
(3.12)
ist strikt konkav als Funktion von p und hat ein eindeutiges Maximum für
p = pm (q, q̇, t), wobei pm durch
0=
e
∂H
∂L
(q, q̇, pm , t) = q̇ −
(q, pm , t)
∂p
∂p
definiert ist. Die Legendre-Transformierte der Hamilton-Funktion,
e
q̇, pm (q, q̇, t), t)
L∗ (q, q̇, t) ≡ L(q,
= pm · [q̇ − q̇m (q, pm , t)] + L(q, q̇m (q, pm , t), t)
ist aufgrund der Beziehungen
q̇ = q̇m (q, pm (q, q̇, t), t) ,
p = pm (q, q̇m (q, p, t), t)
wieder gleich der ursprünglichen Lagrange-Funktion:
L∗ (q, q̇, t) = L(q, q̇, t) ,
(3.13)
86
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
so dass L und H in diesem Sinne dual sind. Die Differentiale von H und L sind
aufgrund von (3.8) und (3.9) wie
∂L
∂L
(q, q̇m , t) · dq −
(q, q̇m , t)dt
∂q
∂t
∂H
∂H
dL = pm (q, q̇, t) · dq̇ −
(q, pm , t) · dq −
(q, pm , t)dt
∂q
∂t
dH = q̇m (q, p, t) · dp −
(3.14)
miteinander verknüpft, und als Kuriosum sei noch die Young’sche Ungleichung
erwähnt:
p · q̇ ≤ L(q, q̇, t) + H(q, p, t) ,
die in der Physik allerdings weniger Anwendung findet.
Wir fügen einige Bemerkungen hinzu.
Nicht-Eindeutigkeit der Hamilton-Funktion
Zuerst sei darauf hingewiesen, dass die Hamilton-Funktion eines physikalischen
Systems nicht eindeutig definiert ist. Dies folgt direkt daraus, dass die LagrangeFunktion nicht eindeutig festgelegt ist, da man immer durch Addition einer
vollständigen Zeitableitung eine äquivalente Lagrange-Funktion erzeugen kann:
L′ = L +
∂λ
∂λ
d
λ(q, t) = L +
(q, t) · q̇ +
(q, t)
dt
∂q
∂t
.
Ü
Dies hat zur Konsequenz, dass sich auch die Hilfsfunktion H(q,
p, q̇, t) ändert
′
und das Maximum dieser Hilfsfunktion sich von q̇m nach q̇m verschiebt:
p=
∂L
∂λ
∂L′
(q, q̇′m , t) =
(q, q̇′m , t) +
(q, t) .
∂ q̇
∂ q̇
∂q
(3.15)
Hieraus folgt sofort:
q̇′m (q, p, t) = q̇m (q, p −
∂λ
, t) .
∂q
Die neue Hamilton-Funktion folgt nun als
∂λ
∂λ ′
· q̇ −
∂q m
∂t

‹
∂λ
∂λ
(q, t)
= p−
· q̇′m − L(q, q̇′m , t) −
∂q
∂t
∂λ
∂λ
= H(q, p −
, t) −
(q, t) .
∂q
∂t
H ′ (q, p, t) = p · q̇′m − L′ = p · q̇′m − L −
(3.16)
Da die beiden Hamilton-Funktionen H und H ′ dasselbe physikalische Problem
beschreiben, sind sie vollständig äquivalent.
Die Hamilton-Gleichungen
Als zweite Bemerkung fügen wir hinzu, dass die Koordinaten, Impulse und
die Zeit (q, p, t) in der Hamilton-Funktion grundsätzlich unabhängige Variablen
87
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
sind und erst durch die Bewegungsgleichung, d. h. für die physikalische Bahn,
miteinander verknüpft werden. Führen wir noch einmal den verallgemeinerten
Impuls p(q, q̇, t) der Lagrange-Theorie ein:
p(q, q̇, t) =
∂L
(q, q̇, t) ,
∂ q̇
so kann die Lagrange’sche Bewegungsgleichung für qφ (t) auch als
ṗφ (t) =
∂L
(qφ (t), q̇φ (t), t)
∂q
,
(3.17)
pφ (t) ≡ p (qφ (t), q̇φ (t), t)
geschrieben werden. Inversion der Beziehung pφ =
dass
∂L
∂ q̇ (qφ , q̇φ , t)
zeigt zunächst,
(3.18)
q̇φ = q̇m (qφ , pφ , t)
und daher aufgrund von (3.13) auch pφ = pm (qφ , q̇φ , t) gilt. Nun wissen wir
bereits aus (3.14), dass allgemein die Beziehungen
∂H
∂L
(q, p, t) = −
(q, q̇m , t) ,
∂q
∂q
∂H
(q, p, t) = q̇m (q, p, t)
∂p
gelten. Insbesondere findet man daher für die physikalische Bahn:
∂L
∂H
(qφ , q̇φ , t) = −
(qφ , pφ , t)
∂q
∂q
,
q̇m (qφ , pφ , t) =
∂H
(qφ , pφ , t)
∂p
.
Einsetzen dieser Resultate in (3.17) und (3.18) liefert nun ein sehr wichtiges
Ergebnis:
ṗφ = −
∂H
(qφ , pφ , t) ,
∂q
q̇φ =
∂H
(qφ , pφ , t)
∂p
(3.19)
oder, wie diese Gleichungen meist kurz dargestellt werden:
ṗ = −
∂H
∂q
,
q̇ =
∂H
∂p
.
Der Gleichungssatz (3.19) enthält insgesamt 2f Gleichungen für die 2f Unbekannten pφ (t) und qφ (t) und ist somit für vorgegebene Anfangsbedingungen
pφ (0) und qφ (0) vollständig und eindeutig lösbar. Der Satz (3.19) stellt die Bewegungsgleichungen des Systems in der Hamilton-Formulierung dar und wird
somit als die Hamilton-Gleichungen bezeichnet. Sie bilden die Basis für alles
Weitere in diesem Kapitel.
Aus den Hamilton-Gleichungen für die physikalische Bahn folgt sofort, dass
die Größe
Hφ (t) ≡ H(qφ (t), pφ (t), t)
erhalten ist, falls H und somit auch L nicht explizit zeitabhängig sind:

‹

‹

d
d
∂H
∂H
∂H
Hφ (t) = H(qφ , pφ , t) =
· q̇φ +
· ṗφ +
dt
dt
∂q φ
∂p φ
∂t

‹ 
‹

‹ 
‹

‹
∂H
∂H
∂H
∂H
∂H
·
−
·
+
=
∂q φ
∂p φ
∂p φ
∂q φ
∂t φ

‹

‹
∂H
∂L
=−
,
=
∂t φ
∂t φ
‹
φ
88
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
wobei im letzten Schritt (3.14) verwendet wurde. Da Hφ gleich dem JacobiIntegral Jφ ist:

Hφ = pφ · q̇φ − Lφ =
∂L
· q̇ − L
∂ q̇
‹
(3.20)
= Jφ
φ
und Jφ für Lagrange-Funktionen, die nicht explizit von der Zeit abhängen, gleich
der Energie des Systems ist,5 kann auch Hφ mit der Energie identifiziert werden,
∂L
falls ∂H
∂t = − ∂t = 0 gilt. Wie bereits in Abschnitt [2.10] gezeigt wurde, gilt
umgekehrt sicherlich nicht, dass die Energie eines Systems notwendigerweise
∂L
nicht erhalten ist, falls ∂H
∂t = − ∂t 6= 0 gilt. In diesem Fall kann die Energie
nicht unbedingt mit Hφ bzw. Jφ identifiziert werden.
Observablen und Messgrößen
Gleichung (3.20) kann auch so interpretiert werden, dass die Hamilton-Funktion
im Hamilton-Formalismus dem Jacobi-Integral in der Lagrange-Theorie entspricht:
H(q, p, t) = J(q, q̇m (q, p, t), t)
,
J(q, q̇, t) = H(q, pm (q, q̇, t), t)
und dass beide Größen für alle möglichen physikalischen Bahnen gleich sind:
Hφ (t) = H(qφ , pφ , t) = J(qφ , q̇φ , t) = Jφ (t)
.
Dies ist nur ein Beispiel dafür, dass jede Messgröße A eines physikalischen Systems in der Lagrange-Theorie mit Hilfe einer Observablen AL (q, q̇, t) und im
Hamilton-Formalismus mit Hilfe einer Observablen AH (q, p, t) beschrieben werden kann, wobei AL und AH gemäß
AH (q, p, t) = AL (q, q̇m (q, p, t), t)
,
AL (q, q̇, t) = AH (q, pm (q, q̇, t), t)
miteinander verknüpft sind und für alle möglichen physikalischen Bahnen den
gleichen Messwert für A vorhersagen:
AH (qφ , pφ , t) = AL (qφ , q̇φ , t) ≡ Aφ (t)
.
Analog gibt es einen einfachen Zusammenhang zwischen Observablen AL (q, q̇, t)
in der Lagrange-Theorie und Observablen AN (X, Ẋ, t) in der Newton’schen Mechanik:
AL (q, q̇, t) = AN (X(q, t), Ẋ(q, q̇, t), t) ,
denn bei einer „Messung“ liefern auch diese beiden Größen dasselbe Ergebnis:
AN (Xφ , Ẋφ , t) = AL (qφ , q̇φ , t) = Aφ (t)
.
Betrachten wir zwei Beispiele: Für ein Teilchen der Masse m im Potential V (x)
sind die Messgrößen „Impuls“, „Drehimpuls“ und „Energie“ in den verschiedenen
Darstellungen durch
8
< mẋ
AL,N (x, ẋ, t) =
:
mx × ẋ
,
1
2
m
ẋ
+
V
(x)
2
8
< p
AH (x, p, t) =
:
x×p
p2 /2m + V (x)
5 Wie wir wissen, gilt dies genau genommen nur dann, wenn neben der Lagrange-Funktion
auch die Zwangsbedingungen und die Transformationsvorschrift {xi (q)} nicht explizit zeitabhängig sind.
89
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
gegeben. Für ein geladenes Teilchen der Masse m und Ladung q̂ muss man den
verallgemeinerten Impuls ∂L
∂ ẋ = mẋ + q̂A(x, t), der nicht eichinvariant ist, klar
vom (offensichtlich eichinvarianten) kinetischen Impuls mẋ unterscheiden. Für
die Messgrößen „kinetischer Impuls“, „kinetischer Drehimpuls“ und „kinetische
Energie“ erhält man nun:
8
< mẋ
AL,N (x, ẋ, t) =
:
mx × ẋ ,
1
2
2 mẋ
AH (x, p, t) =
8
< p − q̂A(x, t)
:
x × (p − q̂A)
1
2
2m (p − q̂A)
,
und alle diese Observablen sind eichinvariant.
Forminvarianz der Hamilton-Gleichungen?
Wir konnten vorher feststellen, dass die Hamilton-Funktion, ähnlich wie die
Lagrange-Funktion, nicht eindeutig definiert ist, da sie unter Addition einer vollständigen Zeitableitung zu L ihre Form ändert. Einerseits ist daher klar, dass
auch die Hamilton-Gleichungen für (qφ , pφ ) ihre Form ändern werden, andererseits ist ebenso offensichtlich, dass die Lösung qφ (t), eine Messgröße, unter einer
solchen Transformation invariant sein muss. Wir vergleichen die Bewegungsgleichungen vor und nach der Transformation: Vor der Transformation werde das
System durch die Hamilton-Funktion H(q, p, t) beschrieben; die entsprechenden
Hamilton-Gleichungen
q̇φ =
∂H
(qφ , pφ , t) ,
∂p
ṗφ = −
∂H
(qφ , pφ , t)
∂q
(3.21)
sind unter Berücksichtigung der Anfangsbedingungen qφ (0) ≡ q0 und
d
pφ (0) ≡ p0 zu lösen. Durch Addition einer vollständigen Zeitableitung dt
λ(q, t)
zu L ändert sich der Impuls gemäß (3.15), so dass nach der Transformation
p′φ (t) =
∂λ
∂λ
∂L
(qφ , q̇φ , t) +
(qφ , t) = pφ (t) +
(qφ , t)
∂ q̇
∂q
∂q
(3.22)
gilt. Die Hamilton-Gleichungen nach der Transformation folgen aus (3.16) als

‹
∂H
∂λ
(qφ , t), t
qφ , p′φ −
∂p
∂q

‹
∂H
∂λ
d ∂λ
(qφ , t), t +
(qφ , t) ,
ṗ′φ = −
qφ , p′φ −
∂q
∂q
dt ∂q
q̇φ =
(3.23)
die mit den Anfangsbedingungen
qφ (0) = q0
,
p′φ (0) = p0 +
∂λ
(q0 , 0)
∂q
zu lösen sind. In der Tat sind die Hamilton-Gleichungen selbst also nicht forminvariant; man sieht jedoch auch sofort, dass sich (3.23) auf (3.21) reduziert,
wenn die Relation (3.22) verwendet wird, d. h. wenn p′φ − ∂λ
∂q in (3.23) durch pφ
ersetzt wird. Die Lösung qφ (t) ist daher unabhängig von der Wahl der Funktion
λ(q, t), wie es natürlich auch sein sollte.
90
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
3.2
Beispiele für die Wirkung des HamiltonFormalismus
Um die Wirkung der Hamilton-Theorie zu illustrieren, behandeln wir nun einige Beispiele. Wir diskutieren insbesondere Systeme mit konservativen (oder
allgemeiner: wirbelfreien) Kräften und Systeme unter der Einwirkung elektromagnetischer Kräfte. Als spezielle Anwendung betrachten wir noch einmal das
Problem der kleinen Schwingungen.
3.2.1
Geschwindigkeitsunabhängige Kräfte
Wir behandeln zuerst Systeme mit konservativen oder wirbelfreien Kräften, die
also durch ein Potential V (q, t) und eine Lagrange-Funktion der Form
(3.24)
L(q, q̇, t) = T (q, q̇, t) − V (q, t)
beschrieben werden können. Hierbei ist die kinetische Energie T (q, q̇, t) allgemein quadratisch als Funktion der Geschwindigkeiten:
T (q, q̇, t) =
1
2
X
akl (q, t)q̇k q̇l +
k,l
X
ak (q, t)q̇k + a0 (q, t)
k
≡ 21 q̇T M (q, t)q̇ + a(q, t) · q̇ + a0 (q, t)
,
wobei der Massentensor M (q, t) symmetrisch und positiv definit ist und T und
daher auch L somit strikt konvex als Funktionen von q̇ sind. Ein wichtiger Spezialfall von (3.24) tritt auf, wenn die Zwangsbedingungen und die Transformation
xi (q, t) in (2.19) und daher auch T nicht-explizit zeitabhängig sind:
(3.25)
L(q, q̇, t) = T (q, q̇) − V (q, t) .
Wie bereits in Abschnitt [2.6] bemerkt wurde, hat T in diesem Fall die einfachere, homogen quadratische Form
T (q, q̇) =
1
2
X
k,l
akl (q)q̇k q̇l ≡ 21 q̇T M (q)q̇
mit zeitunabhängigem Massentensor M (q). Wir betrachten im Folgenden zuerst
den Spezialfall (3.25) und dann den allgemeineren Fall (3.24).
Für die Legendre-Transformation der Lagrange-Funktion in (3.25) benötigen
wir die Funktion q̇m (q, p), die durch (3.10) definiert wird:
p=
∂L
(q, q̇m , t) = M (q)q̇m
∂ q̇
,
q̇m (q, p) = M (q)−1 p .
Die Hamilton-Funktion folgt nun aus (3.11) als
H(q, p, t) =
=
=
=
p · q̇m − L(q, q̇m , t)
pT M −1 p −
”
”
−1
1
p)T M (M −1 p)
2 (M
—
pT M −1 − 21 (M −1 )T M M −1 p + V (q, t)
−1
1 T
p
2 p M (q)
+ V (q, t)
—
− V (q, t)
(3.26)
91
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
und die Hamilton-Gleichungen lauten q̇ =
∂M −1
∂H
ṗk = −
= 12 pT −
∂qk
∂qk
p−
∂H
∂p
= M −1 p bzw.

‹
∂V
∂M −1
∂V
p−
= 12 pT M −1
M
∂qk
∂qk
∂qk
.
Das Ergebnis (3.26) zeigt, dass die Hamilton-Funktion auch in der Form
H(q, p, t) = T (q, q̇m (q, p)) + V (q, t)
darstellbar ist. Wir stellen also fest, dass eine Lagrange-Funktion der Form
L = T − V auf eine Hamilton-Funktion der Form H = T + V führt, falls die kinetische Energie zeit- und das Potential geschwindigkeitsunabhängig sind. Zum
Beispiel erhält man für ein einzelnes Teilchen der Masse m unter der Einwirkung
wirbelfreier Kräfte, das durch die Lagrange-Funktion
L(x, ẋ, t) = 21 mẋ2 − V (x, t)
beschrieben wird, den einfachen Ausdruck
H(x, p, t) = p2 /2m + V (x, t)
für die Hamilton-Funktion und dementsprechend
∂V
(x, t)
∂x
für die Hamilton-Gleichungen. Ein wichtiger Spezialfall ist der (isotrope) harmonische Oszillator mit zeitunabhängigem Potential V (x) = 21 mω 2 x2 , der der
folgenden Form für die Lagrange- bzw. Hamilton-Funktion entspricht:
ẋ = p/m
,
ṗ = −
L(x, ẋ) = 21 mẋ2 − 21 mω 2 x2
,
H(x, p) = p2 /2m + 21 mω 2 x2
(3.27)
.
2
Die Lagrange-Gleichung ẍ = −ω x ist uns aus der Theorie I gut vertraut; die
Hamilton-Gleichungen lauten:
ẋ = p/m
,
ṗ = −mω 2 x
.
Es ist zu beachten, dass die Hamilton-Funktion des harmonischen Oszillators
eine hohe Symmetrie aufweist, da beide Terme die gleiche homogen quadratische Struktur besitzen. Diese hohe Symmetrie hat z. B. zur Konsequenz, dass
das Energiespektrum des quantenmechanischen 3-dimensionalen harmonischen
Oszillators eine hohe Entartung aufweist.
Die Legendre-Transformation der allgemeinen geschwindigkeitsunabhängigen Lagrange-Funktion L(q, q̇, t) in (3.24) erfolgt vollkommen analog: Die Funktion q̇m (q, p, t) folgt nun aus (3.10) und (3.24) als
p=
∂L
(q, q̇m , t) = M (q, t)q̇m + a(q, t)
∂ q̇
,
q̇m = M −1 (p − a)
.
Einsetzen in (3.11) liefert nun:
H(q, p, t) =
=
p · q̇m − L(q, q̇m , t)
•
pT M −1 (p − a) −
1
2 (p
− a)T M −1 (p − a)
˜
+aT M −1 (p − a) + a0 (q, t) − V (q, t)
=
1
2 (p
− a)T M −1 (p − a) + [V (q, t) − a0 (q, t)] ,
(3.28)
92
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
ein Ergebnis, das zeigt, dass die Hamilton-Funktion für Lagrange-Funktionen
der Form (3.24) im Allgemeinen gewiss nicht die Struktur H = T + V hat. Die
−1
(p − a) und
Hamilton-Gleichungen sind für H in (3.28) durch q̇ = ∂H
∂p = M
ṗk = −
∂H
∂M −1
∂a ∂a0 ∂V
= 12 (p− a)T M −1
M (p− a)+ (p− a)T M −1
+
−
∂qk
∂qk
∂qk ∂qk ∂qk
gegeben.
3.2.2
Lorentz-Kräfte
Für Systeme geladener Teilchen, die (zusätzlich) unter der Einwirkung äußerer
elektromagnetischer Kräfte stehen, ist aus Abschnitt [2.6.2] bekannt, dass die
Lagrange-Funktion die Struktur
L(q, q̇, t) = T (q, q̇, t) − VG (q, q̇, t)
mit
VG = V + VLor
,
VLor (q, q̇, t) = Φ(q, t) − A(q, t) · q̇
hat, wobei A(q, t) = (A1 , A2 , . . . , Af ) eine Kurzform für die verschiedenen Komponenten Ak (q, t) des verallgemeinerten Vektorpotentials ist. Es folgt:
L = T − VG = T − V − VLor
=
=
€
Š
1 T
2 q̇ M q̇ + a · q̇ + a0
1 T
2 q̇ M q̇ + (a + A) · q̇
− V − (Φ − A · q̇)
− (V − a0 + Φ) ,
so dass die Lagrange-Funktion genau die Form (3.24) hat, falls man dort a
durch a + A und a0 durch a0 − Φ ersetzt. Mit diesen Änderungen folgt die
Hamilton-Funktion direkt aus (3.28) als
H(q, p, t) = 21 (p−a−A)T M −1 (p−a−A)+V (q, t)−a0 (q, t)+Φ(q, t)
. (3.29)
Falls nur äußere elektromagnetische Kräfte wirken, entfällt der Term V (q, t),
der die inneren Kräfte und die äußeren Kräfte nicht-elektromagnetischer Natur
beschreibt. Als einfaches Beispiel betrachten wir ein System N nicht-wechselwirkender Teilchen unter der Einwirkung von Lorentz-Kräften; wir beschreiben
das System
in kartesischen Koordinaten, so dass die kinetische Energie die Form
P
T = i 12 mi ẋ2i hat und das verallgemeinerte Vektorpotential durch
A(q, t) = (q̂1 A(x1 , t), q̂2 A(x2 , t), . . . , q̂N A(xN , t))
gegeben ist. Außerdem hat das verallgemeinerte skalare Potential Φ(q, t) die
Form
Φ(q, t) =
N
X
q̂i ΦK (xi , t) ,
i=1
wobei ΦK das skalare Potential in kartesischen Koordinaten bezeichnet. In diesem Fall reduziert sich (3.29) auf die Form
H(X, P, t) =
N §
X
1
i=1
2mi
2
ª
K
[pi − q̂i A(xi , t)] + q̂i Φ (xi , t)
93
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
mit P = (p1 , p2 , . . . , pN ). Für ein einzelnes geladenes Teilchen im elektromagnetischen Feld erhält man also
H(x, p, t) =
1
2
[p − q̂A(x, t)] + q̂ΦK (x, t)
2m
.
Die Kombination p − q̂A des kanonisch zu x konjugierten Impulses p und
des Vektorpotentials A ist sehr allgemein: Sie tritt z. B. auch in der Quantenmechanik und der Quantenfeldtheorie auf und hat sich daher einen eigenen
Namen (die „minimale Kopplung“) verdient. Um die Wirkung elektromagnetischer Felder beschreiben zu können, muss man in der Hamilton-Funktion eines
Teilchens (oder quantenmechanisch: im Hamilton-Operator ) lediglich einen Potentialterm q̂ΦK (x, t) hinzufügen und den Impuls p (quantenmechanisch: den
Impulsoperator ) durch p − q̂A(x, t) ersetzen.
3.3
Ein Variationsprinzip für die HamiltonGleichungen
Aus den Abschnitten [2.7] und [2.8] wissen wir, dass die Lagrange-Gleichungen
der zweiten bzw. ersten Art allgemein aus einem Variationsprinzip, dem „Hamilton’schen Prinzip“, hergeleitet werden können. Wir zeigen nun, dass man
die Hamilton-Gleichungen (3.19) ebenfalls aus einem Wirkungsprinzip herleiten
kann.
Hierzu betrachten wir neben der physikalischen Bahn (qφ (t), pφ (t)) im Phasenraum auch allgemeine benachbarte Bahnen (q(t), p(t)), deren q-Werte zur
Anfangs- und zur Endzeit mit denjenigen der physikalischen Bahn zusammenfallen: q(t1 ) = qφ (t1 ) ≡ q1 und q(t2 ) = qφ (t2 ) ≡ q2 . Es wird also ausdrücklich nicht gefordert, dass auch die kanonisch zu q konjugierten Impulse p zur
Anfangs- und zur Endzeit für alle Bahnen gleich sind. Definieren wir also die
Variationen
(δq)(t) ≡ q(t) − qφ (t) ≡ εκ(t)
,
(δp)(t) ≡ p(t) − pφ (t) ≡ επ(t)
, (3.30)
so gilt κ(t1 ) = κ(t2 ) = 0, während π(t1 ) und π(t2 ) beliebig (aber endlich)
sind. Als Wirkungsfunktional betrachten wir nun das Zeitintegral der in Abe
schnitt [3.1.3] eingeführten Hilfsfunktion L(q,
q̇, p, t):
(q ,t )
Se(q12,t12) [q, p]
Zt2
≡
e (q(t), q̇(t), p(t), t)
dt L
t1
Zt2
=
t1
dt [q̇(t) · p(t) − H(q(t), p(t), t)]
,
(3.31)
94
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
und wir bestimmen den stationären Punkt dieser Wirkung:
0 =
1 e (q2 ,t2 )
lim (δ S)
(q1 ,t1 ) [qφ + εκ, pφ + επ]
ε↓0 ε
"‚
Zt2
=
dt
t1
(–
Zt2
=
dt
t1
e
∂L
∂q
Œ
‚
φ
· κ(t) +
e
d
∂L
−
∂q dt
‚
e
∂L
∂ q̇
e
∂L
∂ q̇
(3.32)
Œ
φ
‚
· κ̇(t) +
Ϊ
‚
· κ(t) +
φ
e
∂L
∂p
e
∂L
∂p
#
Œ
φ
· π(t)
)
Œ
φ
· π(t)
.
Das rechte Glied kann nur dann für alle κ(t) mit κ(t1 ) = κ(t2 ) = 0 und für alle
π(t) gleich Null sein, wenn die beiden Bedingungen
‚
0=
‚
0=
e
∂L
∂q
e
∂L
∂p
Œ
Œ
d
−
dt
φ
φ
‚
e
∂L
∂ q̇
= q̇φ −
Œ
φ
=−
∂H
(qφ , pφ , t) − ṗφ
∂q
∂H
(qφ , pφ , t)
∂p
erfüllt sind, d. h. wenn die Hamilton-Gleichungen (3.19) gelten. Hiermit ist gezeigt, dass auch die Hamilton-Gleichungen als Bedingungsgleichungen für die
Existenz eines stationären Punktes eines entsprechenden Wirkungsfunktionals
angesehen werden können.
Die Nomenklatur in der Literatur ist nicht einheitlich: Das Wirkungsfunktional (3.31) wird manchmal als „kanonisches Integral“ und das Variationsprinzip
(3.32) manchmal als „modifiziertes Hamilton’sches Prinzip“ bezeichnet.
Es ist auch nicht besonders schwierig, die Lagrange- und Hamilton-Gleichungen gleichzeitig aus einem Wirkungsfunktional abzuleiten. Hierzu führen wir drei
unabhängig variierbare Größen q(t), p(t) und v(t) ein, die die Koordinaten, Impulse und Geschwindigkeiten der möglichen Bahnen darstellen. Die Variationen
sind nun durch (3.30) mit κ(t1 ) = κ(t2 ) = 0 und beliebigem π(t1 ) und π(t2 )
gegeben; zusätzlich definieren wir:
(δv)(t) ≡ v(t) − vφ (t) ≡ εϕ(t)
[ϕ(t1 ), ϕ(t2 ) beliebig]
.
Wir betrachten das Wirkungsfunktional
Ü
Ü(q2 ,t2 ) [q, p, v] ≡
S
(q1 ,t1 )
Zt2
e
e (q(t), p(t), v(t), q̇(t), t)
dt L
t1
mit
e
e (q, p, v, q̇, t) ≡ L(q, v, t) + p · (q̇ − v)
L
.
Dieses Wirkungsfunktional kann auch so interpretiert werden, dass die Größe
R
dt L(q, v, t) mit der Zwangsbedingung v = q̇ zu variieren ist; die Impulse p(t)
treten in dieser Interpretation als Lagrange-Parameter auf, die die Einhaltung
dieser Zwangsbedingung gewährleisten sollen. Man erhält nun drei Bedingungs-
95
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
gleichungen für den stationären Punkt des Wirkungsfunktionals:
e
0 =
e
∂L
= q̇ − v
∂p
e
„
(3.33a)
e
e
∂L
∂ q̇
Ž
0 =
e
∂L
d
−
∂q dt
0 =
e
∂L
∂L
=
(q, V, t) − p ,
∂V
∂ q̇
=
∂L
d
(q, v, t) − p
∂q
dt
(3.33b)
e
(3.33c)
aus denen unmittelbar hervorgeht, dass dieser stationäre Punkt in der Tat
mit der physikalischen Bahn zu identifizieren ist. Kombination von (3.33a) und
(3.33c) liefert die Gleichungen
pφ (t) =
∂L
(qφ , q̇φ , t) ,
∂ q̇
(3.34)
q̇φ = q̇m (qφ , pφ , t) ,
mit deren Hilfe sich (3.33b) auf die Standardform der Lagrange-Gleichung reduzieren lässt:
•
˜
d ∂L
∂L
(qφ , q̇φ , t) = ṗφ (t) =
(qφ , q̇φ , t) .
dt ∂ q̇
∂q
Außerdem impliziert die zweite Gleichung in (3.34) einerseits wegen q̇m =
q̇φ = q̇m (qφ , pφ , t) =
∂H
∂p :
∂H
(qφ , pφ , t)
∂p
und andererseits durch Einsetzen in (3.33b):
∂L
∂L
(qφ , Vφ , t) =
(qφ , q̇φ , t)
∂q
∂q
∂L
∂H
=
(qφ , q̇m (qφ , pφ , t), t) = −
(qφ , pφ , t)
∂q
∂q
ṗφ =
,
so dass auch die Hamilton-Gleichungen erfüllt sind.
3.4
Erhaltungsgrößen und Poisson-Klammern
Eine Observable in der Hamilton-Theorie ist – wie wir wissen – eine Funktion
A(q, p, t), die, ausgewertet für die physikalische Bahn,
€
Aφ (t) = A qφ , pφ , t
Š
,
eine experimentell messbare Eigenschaft A des Systems quantitativ beschreibt.
Beispiele sind neben dem (kinetischen) Impuls, dem (kinetischen) Drehimpuls
und der (kinetischen) Energie der Massenschwerpunkt, das magnetische Moment
oder das elektrische Dipolmoment. Die Zeitentwicklung einer Observablen folgt
sofort aus den Hamilton-Gleichungen:

Š
d
d €
Aφ = A qφ , pφ , t =
dt
dt

∂A ∂H
∂A
=
·
−
·
∂q ∂p
∂p
‹

‹

‹
∂A
∂A
∂A
· q̇φ +
· ṗφ +
∂q φ
∂p φ
∂t φ
‹

‹

‹
∂A
∂A
∂H
+
= {A, H}φ +
∂q φ
∂t φ
∂t φ
(3.35)
,
96
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
wobei wir die Poisson-Klammer {A, B} zweier Funktionen A(q, p, t) und
B(q, p, t) allgemein als

{A, B} ≡
X ∂A ∂B
∂A ∂B
∂A ∂B
∂A ∂B
−
·
−
·
=
∂q ∂p
∂p ∂q
∂qk ∂pk
∂pk ∂qk
‹
(3.36)
k
definieren. Besonders wichtige Observablen sind die sogenannten Erhaltungsgrößen, deren Wert sich im Laufe der Bewegung des Systems nicht ändert, für die
d
Aφ = 0 gilt. Erhaltungsgrößen werden alternativ auch als Bewegungsinalso dt
tegrale oder als Integrale der Bewegung bezeichnet. Es folgt aus (3.35), dass für
eine Erhaltungsgröße
d
Aφ = {A, H}φ +
dt

∂A
∂t
‹
(3.37)
=0
φ
gilt. Falls diese Erhaltungsgröße also nicht explizit von der Zeit abhängt, ∂A
∂t = 0,
vereinfacht sich (3.37) auf {A, H}φ = 0. Poisson-Klammern {A, H} von Observablen A mit der Hamilton-Funktion sind also sehr wichtig, da sie die Zeitentwicklung dieser Observablen (mit)bestimmen und Hinweise darauf liefern, ob
die Observable eventuell erhalten ist. Aus diesem Grund untersuchen wir die
Eigenschaften der allgemeinen Poisson-Klammer {A, B} in (3.36) im Folgenden
etwas detaillierter.
Einige Eigenschaften der Poisson-Klammer sind offensichtlich: Sie ist schiefsymmetrisch,
{A, B} = −{B, A} ,
bilinear:
{α1 A1 + α2 A2 , B} = α1 {A1 , B} + α2 {A2 , B}
{A, β1 B1 + β2 B2 } = β1 {A, B1 } + β2 {A, B2 }
und hat die Eigenschaften
{A, C}
{A1 A2 , B}
∂
{A, B}
∂t
= 0
[für C = C(t)]
= A1 {A2 , B} + A2 {A1 , B}
§
ª §
ª
∂A
∂B
.
=
, B + A,
∂t
∂t
(3.38)
Außerdem gilt die Jacobi-Identität
(3.39)
{A, {B, C}} + {B, {C, A}} + {C, {A, B}} = 0 ,
die weniger offensichtlich ist und wie folgt bewiesen werden kann: Mit Hilfe der
Definitionen
…
„ ∂A Ž
ak ≡
∂pk
Akl ≡
,
∂A
∂qk
∂2A
∂qk ∂ql
2
A
− ∂p∂k ∂q
l
2
A
− ∂q∂k ∂p
l
Ǒ
∂2A
∂pk ∂pl
(und analog für die Observablen B und C) zeigt man leicht durch explizite
Berechnung:
{A, {B, C}} =
1
2
X€
k,l
T
T
T
aT
k Ckl bl + bk Ckl al − ak Bkl cl − ck Bkl al
Š
.
97
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
Den zweiten und dritten Term im linken Glied von (3.39) bestimmt man durch
zyklische Vertauschung. Einsetzen dieser Ergebnisse in (3.39) zeigt nun, dass
jeder Beitrag zweimal vorkommt, allerdings mit unterschiedlichem Vorzeichen,
so dass das linke Glied von (3.39) insgesamt Null ergibt. Hiermit ist die JacobiIdentität bewiesen. Aus der Jacobi-Identität (3.39) und der Rechenregel (3.38)
folgt noch das Poisson’sche Theorem, das besagt, dass auch die Poisson-Klammer
zweier Erhaltungsgrößen eine Erhaltungsgröße darstellt. Erfüllen die Observablen A und B nämlich die Bewegungsgleichungen:
d
Aφ = {A, H}φ +
dt

∂A
∂t
‹
=0 ,
φ
d
Bφ = {B, H}φ +
dt

∂B
∂t
‹
=0
,
φ
so folgt aufgrund von (3.38) und (3.39):
•
∂
d
{A, B}φ = {{A, B}, H}φ +
{A, B}
dt
∂t
˜
φ
§
= −{{B, H}, A}φ − {{H, A}, B}φ +
§
= {A, H} +
∂A
,B
∂t
ª
§
φ
− {B, H} +
∂A
,B
∂t
ª
ª
§
+ A,
φ
∂B
∂t
ª
φ
∂B
,A = 0 ,
∂t
so dass in der Tat auch {A, B}φ erhalten ist. Man hat hiermit eine Methode
gefunden, aus zwei bekannten Erhaltungsgrößen A und B eine dritte (nämlich
{A, B}) herzuleiten. Dass die Erhaltungsgröße {A, B} dann auch nicht-trivial
(d. h. ungleich Null und unabhängig von A und B) ist, ist im Voraus natürlich
nicht garantiert.
Wir betrachten ein paar Spezialfälle der allgemeinen Poisson-Klammer: Für
die Poisson-Klammer {A, q} einer beliebigen Observablen A(q, p, t) mit den
verallgemeinerten Koordinaten q ergibt sich:
{A, q} =
∂A
∂A
∂q ∂A ∂q ∂A
−
= −11
=−
∂p ∂q
∂q ∂p
∂p
∂p
,
und für die Klammer mit den verallgemeinerten Impulsen p erhält man:
{A, p} =
∂p ∂A ∂p ∂A
∂A
∂A
−
= 11
=
∂p ∂q
∂q ∂p
∂q
∂q
.
Falls A selbst auch eine der Koordinaten oder einen der Impulse darstellt, ergibt
sich:
{qk , ql } = 0 ,
{pk , pl } = 0 ,
{qk , pl } = δkl
.
(3.40)
Die Beziehungen (3.40) werden als die fundamentalen Poisson-Klammern bezeichnet. In der Tat haben sie grundlegende Bedeutung, da sie – wie wir später
feststellen werden – invariant unter kanonischen Transformationen sind.
Außerdem sollte darauf hingewiesen werden, dass es einen engen Zusammenhang zwischen der Poisson-Klammer in der Klassischen Mechanik und dem
quantenmechanischen Kommutator gibt. Genauer formuliert: Man kann zeigen,
dass Erwartungswerte von Kommutatoren sich im klassischen Limes auf PoissonKlammern reduzieren.
98
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
3.4.1
Beispiel: Vektoren
In der Newton’schen Mechanik (Abschnitt [??]) haben wir Vektoren kennengelernt als physikalische Größen, die unter Drehungen im dreidimensionalen
Raum genau so transformiert werden wie der Ortsvektor x oder der Impulsvektor p = mẋ. Hierbei wurde zwischen echten Vektoren und Pseudovektoren
unterschieden, abhängig davon, ob sich die Größe unter Raumspiegelungen genau so wie der Ortsvektor oder gerade entgegengesetzt verhielt.
Man kann „Vektoren“ auch anders (und, wie wir später sehen werden, äquivalent) definieren mit Hilfe von Poisson-Klammern. Hierzu betrachten wir zunächst die Poisson-Klammer des Ortsvektors mit dem Bahndrehimpuls L =
x × p:
{Lk , xl } = εkmn {xm pn , xl } = εkmn xm (−δnl ) = εklm xm
,
wobei die fundamentale Poisson-Klammer {xl , pn } = δnl eingesetzt wurde. Analog folgt für die Poisson-Klammer des Impulsvektors mit dem Bahndrehimpuls:
{Lk , pl } = εklm pm
und für die Klammer des Bahndrehimpulses mit sich selbst:
{Lk , Ll } = εklm Lm
(3.41)
.
Es ist bemerkenswert, dass die Poisson-Klammern von L mit den drei Vektoren
x, p und L alle die gleiche Struktur besitzen:
{Lk , vl } = εklm vm
(3.42)
.
Allgemeiner können wir daher einen Vektor v alternativ dadurch definieren, dass
diese Größe die Eigenschaft (3.42) haben soll. In Abschnitt [??] zeigen wir, dass
diese alternative Definition eines Vektors äquivalent zur in der Newton’schen
Mechanik üblichen Definition ist. Keine Aussage wird in (3.42) darüber gemacht, ob der Vektor v ein echter oder ein Pseudovektor ist, d. h. wie v unter
Raumspiegelungen transformiert wird. Falls v1 und v2 beide Vektoren im Sinne von (3.42) sind, ist übrigens auch das Kreuzprodukt v1 × v2 ein Vektor in
diesem Sinne:
{Lk , (v1 × v2 )l } = εklm (v1 × v2 )m
und zeigt das Skalarprodukt v1 · v2 das typische Verhalten
{Lk , v1 · v2 } = 0
eines Skalars. Aus diesen Regeln kann man sofort schließen, dass auch eine
zusammengesetzte Größe wie z. B. der Lenz’sche Vektor
a=
1
p × L + V (x)x
µ
,
V (x) = −
GµM
x
,
L=x×p
die Vertauschungsbeziehungen
{Lk , al } = εklm am
aufweist und somit wie ein Vektor transformiert wird.
(3.43)
99
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
3.5
Kanonische Transformationen
Wie bereits in der Einführung zu diesem Kapitel betont, hat man im HamiltonFormalismus grundsätzlich viel mehr Freiheit, Transformationen durchzuführen,
als in der Lagrange-Theorie. Die Struktur der Lagrange-Gleichungen ist, wie wir
wissen, invariant unter Punkttransformationen der Form q̄ = q̄(q, t). Die Transformation der Hamilton-Gleichungen erfolgt jedoch im Phasenraum {(q, p)}, so
dass sich neben den Koordinaten q im Allgemeinen auch die Impulse p ändern
werden: (q, p) → (q̄, p̄) mit
q̄ = q̄(q, p, t)
,
p̄ = p̄(q, p, t) .
(3.44)
Wir werden eine solche Transformation im Phasenraum als eine kanonische
Transformation bezeichnen, falls die Struktur der Hamilton-Theorie unter dieser Transformation invariant ist, so dass die transformierten Bewegungsgleichungen wiederum aus einer Hamilton-Funktion H̄(q̄, p̄, t) hergeleitet werden
können und somit „echte“ Hamilton-Gleichungen sind. Aus den ursprünglichen
Hamilton-Gleichungen
q̇ =
∂H
∂p
,
ṗ = −
∂H
∂q
werden durch eine kanonische Transformation also neue Bewegungsgleichungen
der Form
q̄˙ =
∂ H̄
∂ p̄
,
p̄˙ = −
∂ H̄
∂ q̄
erzeugt. Neben dem ursprünglichen Variationsprinzip:
δ Se = 0
,
(q ,t )
Se (q12,t12) [q, p] =
Zt2
e
q̇, p, t)
dt L(q,
(3.45)
t1
e ≡ q̇ · p − H(q, p, t) gilt daher auch nach der Transformation:
mit L
Ǖ = 0
δS
,
Ǖ(q̄2 ,t2 ) [q̄, p̄] =
S
(q̄1 ,t1 )
Zt2
ē
˙ p̄, t)
dt L(q̄,
q̄,
(3.46)
t1
ē ≡ q̄˙ · p̄ − H̄(q̄, p̄, t). Es ist wichtig, darauf zu achten, dass die Randbemit L
dingungen der Variationsprinzipien (3.45) und (3.46) nicht äquivalent sind: In
(3.45) gilt (δq)(t1 ) = (δq)(t2 ) = 0 mit (δp)(t1 ) und (δp)(t2 ) beliebig, während
beim Variationsprozess (3.46) q̄(t1 ) und q̄(t2 ) festgehalten werden und p̄(t1 )
und p̄(t2 ) beliebig sind. Dass diese Bedingungen nicht äquivalent sind, folgt sofort aus (3.44). Des Weiteren sei darauf hingewiesen, dass man (3.44) im Prinzip
um eine Gleichung der Form t̄ = t̄(t) ergänzen könnte, so dass auch die Zeit bei
der kanonischen Transformation mittransformiert wird;6 da solche Verallgemei6 Ein einfaches Beispiel einer kanonischen Transformation, bei der sich auch die Zeit ändert, ist die in Abschnitt [2.11] diskutierte Gleichförmigkeitstransformation x̄i = λxi mit
1
1
˙ = λ 21 γ−1 L(X, Ẋ)
t̄ = λ1− 2 γ t und daher auch x̄˙ i = λ 2 γ ẋi . In diesem Fall gilt L̄(X̄, X̄)
und daher mit der Definition P ≡ (p1 , p2 , . . . , pN ) auch P̄ = λ−1 P, so dass H̄(X̄, P̄) =
1
˙ P̄) = λ 12 γ−1 L
ē X̄, X̄,
e(X, Ẋ, P) folgt. Das Wirkungsfunktional ist unλ 2 γ−1 H(X, P) bzw. L(
ē = Se.
ter der Gleichförmigkeitstransformation interessanterweise invariant: S
100
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
nerungen in der Physikliteratur jedoch eher unüblich sind, beschränken wir uns
im Folgenden auf Transformationen der Form (3.44).
Aus der gleichzeitigen Gültigkeit der Variationsprinzipien (3.45) und (3.46)
e und L
ē in diesen
kann man keineswegs schließen, dass die Hilfsfunktionen L
beiden Fällen gleich sind. Wir betrachten zwei Beispiele, aus denen hervorgeht,
e und L
ē im Allgemeinen ungleich sind: Als erstes Beispiel betrachten wir
dass L
eine einfache Reskalierung der Impulsvariablen:
q̄ = q ,
p̄ = λ−1 p ,
H̄(q̄, p̄, t) = λ−1 H(q̄, λp̄, t) .
Man überprüft leicht, dass die kanonische Struktur unter dieser Transformation
erhalten ist:
∂ H̄
∂H
=
(q, p, t) = q̇ = q̄˙
∂ p̄
∂p
∂ H̄
∂H
−
= −λ−1
(q, p, t) = λ−1 ṗ = p̄˙ .
∂ q̄
∂q
ē = q̄˙ · p̄ − H̄(q̄, p̄, t) = λ−1 L
e und daher auch S
Ǖ = λ−1 S.
e
Außerdem folgt L
Diese Reskalierung der Impulse weist eine gewisse Ähnlichkeit mit der in der
Fußnote diskutierten Gleichförmigkeitstransformation auf, nur werden bei der
Gleichförmigkeitstransformation auch die Koordinaten und die Zeit reskaliert.
Als zweites, wesentlich weniger triviales und wesentlich wichtigeres Beispiel
ē 6= L
e diskutieren wir die Berührungsfür eine kanonische Transformation mit L
7
transformation, die durch die Gleichung
e
ē
˙ p̄, t) +
q̄,
L(q,
q̇, p, t) = L(q̄,
d
F1 (q, q̄, t)
dt
(3.47)
mit einer zunächst beliebigen Funktion F1 (q, q̄, t) der alten und neuen Koore 6= L.
ē Es
dinaten definiert ist. Offensichtlich gilt auch nun im Allgemeinen L
ist zu bedenken, dass die alten und neuen Variablen (q, p) und (q̄, p̄) in (3.47)
durch (3.44) verknüpft sind, so dass nur jeweils zwei dieser vier Vektoren (oder
genauer: nur 2f deren 4f Komponenten) als unabhängig angesehen werden können. Wir zeigen im Folgenden, in welcher Weise die Berührungstransformation
(q, p) → (q̄, p̄) durch die Wahl von F1 festgelegt wird; da die Funktion F1
diese Transformation erzeugt, wird sie als die erzeugende Funktion der Berührungstransformation bezeichnet. Wir zeigen außerdem, dass die Transformation
(3.47) kanonisch ist, so dass die Bewegungsgleichungen für die neue physikalische Bahn (q̄φ , p̄φ ) wiederum die Form von Hamilton-Gleichungen besitzen;
e und L
ē zur Zeit t1 bzw. t2
wegen der unterschiedlichen Randbedingungen für L
ist diese Invarianz der kanonischen Struktur keineswegs trivial.8
7 Der Name „Berührungstransformation“ (engl.: contact transformation) stammt aus der
projektiven Geometrie und ist bei der hier diskutierten Anwendung einer solchen Transformation in der Physik weniger anschaulich.
8 In vielen Lehrbüchern wird inkorrekterweise behauptet, dass die Invarianz der kanonischen
e und L
ē sich „nur“ um eine vollständige Zeitableitung unterStruktur sofort daraus folgt, dass L
scheiden, so wie auch die Addition einer vollständigen Zeitableitung in der Lagrange-Theorie
die Bewegungsgleichung invariant lässt. Die Subtilität bei den Randbedingungen wird in diesem Argument völlig übersehen. Im Unterschied zur Lagrange-Theorie liefert die vollständige
Zeitableitung in (3.47) zum Beispiel einen nicht-verschwindenden Beitrag zur Variation der
e, s. Gleichung (3.53).
Wirkung δS
101
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
Wir untersuchen nun zuerst, in welcher Weise die Berührungstransformation
(q, p) → (q̄, p̄) durch die erzeugende Funktion F1 festgelegt wird. Aus der
1
expliziten Form der vollständigen Ableitung dF
dt in (3.47),
d
∂F1
∂F1
∂F1
F1 (q, q̄, t) =
· q̇ +
· q̄˙ +
dt
∂q
∂ q̄
∂t
,
e und L
ē folgt sofort:
und der Definition von L

q̇ · p − H(q, p, t) = q̄˙ · p̄ − H̄(q̄, p̄, t) +
bzw.

p−
∂F1
∂q
‹

· dq − p̄ +
∂F1
∂ q̄
‹
∂F1
∂F1
∂F1
· q̇ +
· q̄˙ +
∂q
∂ q̄
∂t

· dq̄ + H̄ − H −
∂F1
∂t
‹
‹
dt = 0 .
Da die Variablen (q, q̄, t) in (3.47) als unabhängig anzusehen sind, muss gelten:
p=
∂F1
∂q
,
p̄ = −
∂F1
∂ q̄
,
H̄ = H +
∂F1
∂t
(3.48)
.
Die Berührungstransformation (q, p) → (q̄, p̄) wird durch die erzeugende Funktion F1 (q, q̄, t) also eindeutig festgelegt: Falls (q, p) vorgegeben ist, kann q̄(q, p, t)
durch Inversion der ersten Gleichung in (3.48) bestimmt werden; der neue Impuls p̄ folgt dann aus der zweiten und die neue Hamilton-Funktion H̄ aus der
dritten Gleichung in (3.48). Falls umgekehrt (q̄, p̄) vorgegeben ist, folgt q(q̄, p̄, t)
analog durch Inversion der zweiten Gleichung in (3.48).
Diese Inversionen sind
allerdings nur dann möglich, wenn det ∂ 2 F1 /∂q∂ q̄ 6= 0 gilt. Dies zeigt bereits,
dass F1 in der Praxis keineswegs beliebig ist.
Weitere Einschränkungen werden klar, wenn man allgemein Invertierbarkeit
der Gleichungen p = ∂F1 /∂q und p̄ = −∂F1 /∂ q̄ fordert, so dass diese Gleichungen eindeutig nach zwei der vier Variablen (q, p, q̄, p̄) aufgelöst werden können,
falls die anderen zwei Variablen vorgegeben sind. Sind beispielsweise (p, q̄) vorgegeben, so kann q eindeutig bestimmt werden, falls F1 eine strikt konvexe (oder
konkave) Funktion der Variablen q ist:
q = qm (p, q̄, t)
p≡
,
∂F1
(qm , q̄, t) .
∂q
(3.49)
Sind andererseits die Variablen (q, p̄) vorgegeben, dann kann die Gleichung
p̄ = −∂F1 /∂ q̄ eindeutig nach q̄ aufgelöst werden, falls F1 strikt konvex (oder
konkav) als Funktion von q̄ ist:
q̄ = q̄m (q, p̄, t)
p̄ ≡ −
,
∂F1
(q, q̄m , t) .
∂ q̄
(3.50)
Sind schließlich die Variablen (p, p̄) vorgegeben, so können die beiden Gleichungen p = ∂F1 /∂q und p̄ = −∂F1 /∂ q̄ nach (q, q̄) aufgelöst werden, falls F1 strikt
konvex oder konkav in diesen Variablen ist:
„ Ž
„
q
Ž
=
q̄
„
qmm (p, p̄, t)
p
Ž
,
q̄mm (p, p̄, t)
−p̄
„ ∂F1
∂q
≡
Ž
(qmm , q̄mm , t)
.
∂F1
∂ q̄ (qmm , q̄mm , t)
102
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
(3.51)
Diese Formeln zeigen außerdem, dass die erzeugende Funktion F1 genügend glatt
(d. h. differenzierbar) sein muss.
Wir zeigen schließlich, dass die Berührungstransformation (3.47) kanonisch
ist, d. h. die Struktur der Hamilton-Gleichungen invariant lässt. Wir verwenden
die übliche Notation: δq = εK, δp = επ, δq̄ = εK̄, δ p̄ = επ̄. Das Wirkungsfunktional Se folgt aus (3.47) als
Zt2
(q ,t )
Se 2 2 [q, p]
=
(q1 ,t1 )
t1
Zt2
=
t1
dt [p · q̇ − H(q, p, t)]
t2
dt p̄ · q̄˙ − H̄(q̄, p̄, t) + F1 (q(t), q̄(t), t)
. (3.52)
t1
Es ist wichtig, zu bedenken, dass beim Variationsprinzip δ Se = 0 zwar K(t1 ) =
K(t2 ) = 0, jedoch im Allgemeinen nicht K̄(t1 ) = K̄(t2 ) = 0 gilt. Es folgt aus
(3.52):
0 =
1 e (q2 ,t2 )
lim (δ S)
(q1 ,t1 ) [q, p]
ε
ε→0
Zt2
=
t1
=
t2
˙ − ∂ H̄ · K̄ − ∂ H̄ · π̄ + ∂F1 · K̄
dt q̄˙ · π̄ + p̄ · K̄
∂ q̄
∂ p̄
∂ q̄
t1
t2 Zt2

‹
∂F1
∂ H̄
∂ H̄
˙
˙
p̄ +
· K̄ + dt
· π̄ − p̄ +
· K̄
q̄ −
∂ q̄
∂ p̄
∂ q̄
t1
Zt2
=
∂ H̄
q̄˙ −
∂ p̄
dt
t1
.
t1
∂ H̄
· π̄ − p̄˙ +
∂ q̄
· K̄
.
(3.53)
Im letzten Schritt wurde (3.48) verwendet. Man sieht, dass die vollständige
Zeitableitung in (3.47) sehr wohl zur Variation der Wirkung beiträgt und genau
gegen einen weiteren, bei der partiellen Integration erzeugten Randterm wegfällt. Des Weiteren ist klar, dass das rechte Glied von (3.53) nur dann für alle
(π, K), oder äquivalent: für alle (π̄, K̄), Null sein kann, falls
q̄˙ =
∂ H̄
∂ p̄
,
p̄˙ = −
∂ H̄
∂ q̄
gilt, d. h. falls die kanonische Struktur der Bewegungsgleichungen invariant ist.
Hiermit ist gezeigt, dass jede Berührungstransformation in der Tat auch kanonisch ist.
Als einfaches Beispiel einer Berührungstransformation betrachten wir (3.47)
mit F1 (q, q̄, t) = −q · q̄. Es folgt aus (3.48), dass die alten und neuen Variablen
gemäß p = −q̄, p̄ = q miteinander verknüpft sind, so dass bei der Transformation (q, p) durch (p̄, −q̄) ersetzt wird und „Koordinaten“ und „Impulse“
somit ihre Rollen vertauschen. Der Unterschied zwischen Koordinaten und Impulsen geht daher im Hamilton-Formalismus vollständig verloren. Die Freiheit,
103
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
die man hiermit gewinnt, hat allerdings auch einen Preis, da die klare Struktur
der Hamilton-Funktion als duale Funktion der Lagrange-Funktion, insbesondere
die strikte Konvexität als Funktion der Impulse, bei kanonischen Transformationen im Allgemeinen ebenfalls verloren geht.
3.5.1
Alternative Formulierungen der Berührungstransformation
Die zweite Gleichung in (3.48), p̄ = ∂(−F1 )/∂ q̄, zeigt in Kombination mit (3.50),
dass man statt der erzeugenden Funktion F1 auch die Legendre-Transformierte
F2 (q, p̄, t) von F1 (genauer: von −F1 ) bezüglich der Variablen q̄ einführen kann:
F2 (q, p̄, t) ≡ p̄ · q̄m (q, p̄, t) − [−F1 (q, q̄m (q, p̄, t), t)]
.
Es folgt aus dem allgemeinen Ergebnis (3.8) für Differentiale von LegendreTransformierten mit Dummy-Variablen und aus (3.50), dass
∂F2
=p ,
∂q
∂F2
∂ p̄
= q̄m (q, p̄, t) = q̄ ,
∂F2
= H̄ − H
∂t
gilt, so dass man auch F2 als erzeugende Funktion der Berührungstransformation
verwenden kann.
1
Eine dritte mögliche Formulierung ergibt sich aus der Gleichung p = ∂F
∂q in
Kombination mit (3.49), da man aufgrund dessen die Legendre-Transformierte
−F3 (p, q̄, t) von F1 bezüglich der Variablen q einführen kann:
€
−F3 (p, q̄, t) ≡ p · qm (p, q̄, t) − F1 qm (p, q̄, t), q̄, t
Š
.
Die Ableitungen von F3 folgen sofort aus (3.8) und (3.49):
−
∂F3
= qm (p, q̄, t) = q ,
∂p
∂F3
∂ q̄
= −p̄ ,
∂F3
= H̄ − H
∂t
,
und wiederum kann man statt F1 auch F3 als erzeugende Funktion verwenden.
Als vierte Möglichkeit kann man aufgrund von (3.48) und (3.51) auch die
Legendre-Transformierte −F4 (p, p̄, t) von F1 (q, q̄, t) bezüglich der Variablen
(q, q̄) einführen:
„
−F4 (p, p̄, t) ≡
p
Ž „
−p̄
·
Ž
qmm (p, p̄, t)
q̄mm (p, p̄, t)
− F1 (qmm , q̄mm , t) .
Die Ableitungen der Legendre-Transformierten F4 folgen wiederum aus (3.8),
nun in Kombination mit (3.51):
∂F4
= −qmm (p, p̄, t) = −q ,
∂p
∂F4
= H̄ − H ,
∂t
∂F4
∂ p̄
= q̄mm (p, p̄, t) = q̄
,
und das Ergebnis zeigt, dass man äquivalent auch F4 als erzeugende Funktion
verwenden kann.
104
---------------------------------------------------------------------------------------------------- 3. HAMILTON-FORMALISMUS
Typische Beispiele für die drei alternativen Formulierungen der Berührungstransformation sind die Identität (q, p) → (q, p), die durch die erzeugenden
Funktionen F2 (q, p̄, t) = q · p̄ bzw. F3 (p, q̄, t) = −p · q̄ beschrieben wird,
die Vertauschung (q, p) → (−p, q), die auch durch die erzeugende Funktion
F4 (p, p̄, t) = −p · p̄ hervorgerufen wird, und die Punkttransformation q →
q′ (q, t), die durch F2 (q, p̄, t) = q′ (q, t) · p̄ erzeugt wird. Bemerkenswert an
diesen Beispielen ist, dass die erzeugenden Funktionen alle linear (und somit
konvex, aber nicht strikt konvex) in mindestens einem ihrer Argumente sind;
zumindest in diesen Beispielen führt dies nicht zu Problemen.
3.5.2
Berührungstransformationen als Gruppe
Man sieht sehr leicht ein, dass die Berührungstransformationen eine Gruppe
bilden. Erstens gehört die Identität zur Gruppe, denn sie wird z. B. durch F2 =
q· p̄ dargestellt. Zweitens gibt es zu jeder erzeugenden Funktion F1 , die (q, p, H)
in (q̄, p̄, H̄) überführt und durch
(3.54)
dF1 = p · dq − p̄ · dq̄ + (H̄ − H)dt
charakterisiert wird, eine Inverse F1′ , die (q̄, p̄, H̄) auf (q, p, H) abbildet und
das Differential
dF1′ = p̄ · dq̄ − p · dq + (H − H̄)dt
hat; konkret ist diese Inverse durch F1′ (q̄, q, t) = −F1 (q, q̄, t) gegeben. Drittens
gehört auch das Produkt zweier Berührungstransformationen zur Gruppe: Falls
F1 (q, q̄, t) durch (3.54) gegeben ist und (q, p, H) auf (q̄, p̄, H̄) abbildet und
¯ , t) das Differential
F1′ (q̄, q̄
¯ − H̄)dt
¯ + (H̄
¯ · dq̄
dF1′ = p̄ · dq̄ − p̄
¯ ) abbildet, gilt auch
¯ , H̄
¯ , p̄
hat und (q̄, p̄, H̄) auf (q̄
€
Š
¯ − H dt = dF ′′
¯ + H̄
¯ · dq̄
d (F1 + F1′ ) = p · dq − p̄
1
,
¯ ) erzeugt.
¯ , H̄
¯ , p̄
¯ , t) ≡ F1 + F1′ die Transformation (q, p, H) → (q̄
so dass F1′′ (q, q̄
Viertens ist die Assoziativität dreier Berührungstransformationen
F1 (q, q̄, t) ,
¯ , t) ,
F1′ (q̄, q̄
¯ , t)
¯ , q̄
F1′′ (q̄
dadurch gewährleistet, dass
(F1 + F1′ ) + F1′′ = F1 + (F1′ + F1′′ )
gilt. Alle Gruppeneigenschaften sind somit erfüllt. Die Gruppe der Berührungstransformationen ist kontinuierlich und zusammenhängend. Dies sieht man noch
am einfachsten daraus, dass jede Transformation stetig mit der Identität verbunden werden kann, denn für alle F2 (q, p̄, t) und alle λ ∈ [0, 1] stellt auch
F2 (q, p̄, t; λ) ≡ q · p̄ + λ [F2 (q, p̄, t) − q · p̄]
eine mögliche erzeugende Funktion einer Berührungstransformation dar.
105
Kapitel
4
Relativistische Dynamik
Nachdem in den vorigen beiden Kapiteln die analytische Struktur der nichtrelativistischen klassischen Mechanik erforscht wurde, lautet unsere nächste
Aufgabe, zu bestimmen, ob und inwiefern die neuen Einsichten und Zusammenhänge auch auf die relativistische klassische Mechanik (d.h. auf die Spezielle
Relativitätstheorie) übertragbar sind. Hierzu rufen wir in Erinnerung, dass das
relativistische Kraftgesetz durch
K µ ≡ qF µν uν = quν (∂ µ Aν − ∂ ν Aµ )
mit
†
F µν =
0
E1
E2
E3
−E1
0
cB3
−cB2
−E2
−cB3
0
cB1
−E3
cB2
−cB1
0

(4.1)
.
gegeben ist. Da die Elemente von F µν vollständig durch (E, B) bestimmt werden, heißt F µν bekanntlich auch elektromagnetischer Feldtensor. Durch explizite
Berechnung sieht man, dass K µ in der Tat eine relativistische Verallgemeinerung
der Lorentz-Kraft darstellt:
Kµ
= q(F µ0 u0 + F µj uj ) = qγu [F µ0 + F µj (−βj )]
= qγu (E · β , E + u × B)
(4.2)
,
wobei benutzt wurde:
F ij (−βj ) = (−εijk cBk )(−βj ) = c(β × B)i = (u × B)i
.
Der Zeitanteil von K µ in (4.2) ist genau die Leistung, die das elektromagnetische
Feld am Teilchen verrichtet. Die Gleichung
d2 xµ
d2 xµ
dt
,
(4.3)
= m0
= K µ , dτ =
2
ds
dτ 2
γu
bringt K µ mit einem anderen 4-Vektor, der 4-Beschleunigung, in Verbindung.
Nachdem die Form des relativistischen Kraftgesetzes nun geklärt ist, widmen
wir uns im Folgenden der Frage nach der Existenz eines Wirkungsprinzips, aus
dem die Lorentz’sche Bewegungsgleichung hergeleitet werden kann, zunächst für
kräftefreie Teilchen (K µ = 0) und dann auch für Teilchen in Wechselwirkung
mit einem elektromagnetischen Feld.
m 0 c2
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
4.1
Kräftefreie Teilchen
Der gesuchte kanonische Formalismus (mit einem entsprechenden Wirkungsfunktional, einer Lagrange-Funktion, einer Hamilton-Funktion, usw.) muss natürlich vor allem imstande sein, die Dynamik des kräftefreien Teilchens zu reproduzieren. Die Bewegungsgleichung eines Teilchens in Abwesenheit von Feldern
(F µν = 0) folgt sofort aus (4.3) mit K µ = 0 als
dxµ
d2 xµ
=
0
bzw.
γ
= konstant
u
dτ 2
dt
und hat die Lösung
m0
γu u = konstant bzw. u = konstant .
In diesem Spezialfall liegt also erwartungsgemäß eine geradlinig-gleichförmige
Bewegung vor. Die Energie eines kräftefreien Teilchens folgt aus Einsteins berühmter Formel als E = γu m0 c2 = mc2 . Auch dieses Resultat ist zu reproduzieren, wobei „Energie“ im kanonischen Formalismus (zumindest für nicht explizit
zeitabhängige Lagrange-Funktionen) mit der Hamilton-Funktion der physikalischen Bahn zu identifizieren ist. Schließlich sollen sich alle neuen (relativistischen) Ergebnisse im nicht-relativistischen Limes auf die altbekannten Formeln
reduzieren.
Ein geeignetes Wirkungsfunktional, das alle diese Bedingungen erfüllt und
außerdem Lorentz-invariant ist1 , wurde bereits 1906 von Max Planck angegeben:
Z2
SM =
S12 [x]
= −m0 c
1
Zt2
ds = −m0 c
dt′
2
t1
1
γu (t′ )
.
(4.4)
Hierbei sind „1“ und „2“ zwei Ereignisse, die wir einfachheitshalber als „Beginn“
und „Ende“ bezeichnen werden und die in jedem Inertialsystem durch wohldefinierte Orts- und Zeitkoordinaten xµ1 = (ct1 , x1 ) und xµ2 = (ct2 , x2 ) festgelegt
sind. Bei der Variation von S sind xµ1 und xµ2 - wie üblich - festzuhalten. Die
physikalische Bahn ist - wie üblich - durch den stationären Punkt von SM gegeben,
0=
δSM
δx(t)
,
und man kann SM in (4.4) - wiederum wie üblich - mit Hilfe einer LagrangeFunktion formulieren:
Zt2
dt′ L (x(t′ ), ẋ(t′ ); t′ )
SM =
,
t1
1 In diesem Kapitel wird die Wirkung stets eine Lorentz-invariante Größe sein. Dennoch ist
es vielleicht gut zu beachten, dass die Lorentz-Invarianz der Wirkung logisch nicht zwingend
erforderlich ist: Nur die Bewegungsgleichungen (und somit alle Messgrößen) müssen unbedingt
Lorentz-invariant sein. Wie in der nicht-relativistischen Mechanik gilt auch in der Relativitätstheorie, dass die Bewegungsgleichungen invariant sind unter Transformationen der Lagranged
λ(x, t), da in diesem Fall S → S ′ = S+λ(x2 , t2 )−λ(x1 , t1 )
Funktion der Form L → L′ = L+ dt
gilt. Durch eine „geeignete“ Wahl von λ(x, t) könnte man die Lorentz-Invarianz von S also
prinzipiell zerstören. Es sei auch daran erinnert, dass die Lagrange-Funktion und daher auch
die Wirkung in der nicht-relativistischen Mechanik, trotz der Galilei-Invarianz aller
Bewed
1
mv2 t − mv · x .
gungsgleichungen, selbst nicht Galilei-invariant sind: L′ = L + dt
2
107
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
wobei die Lagrange-Funktion L explizit durch
m 0 c2
= −m0 c2
L(x, ẋ; t) = −
γu (t)
Ê

1−
u(t)
c
Ê
‹2
= −m0 c2

1−
ẋ(t)
c
‹2
(4.5)
gegeben ist. Im nicht-relativistischen Limes erhält man:
–
L(x, ẋ; t) ∼
∼
−m0 c
1
1−
2
2
 ‹2
ẋ
c
1
−
8
ẋ2
c2
™
2
+ ···
”
—
1
m0 ẋ2 1 + O(βu2 ) + vollständige Zeitableitung
2
,
so dass sich die Lagrange-Funktion des freien Teilchens (abgesehen von physikalisch irrelevanten Termen) auf das altbekannte Ergebnis L = 21 m0 ẋ2 reduziert.
Die Bewegungsgleichung des relativistischen kräftefreien Teilchens folgt aus (4.5)
als:
0=
∂L d
−
∂x dt

∂L
∂ ẋ
2
‹
3
2
=−

d
dx
d 4
(−ẋ/c ) 5
−m0 c2 È
= −m0
γu
dt
dt
dt
2
2
1 − (ẋ /c )
‹
. (4.6)
Die Lösung von (4.6) lautet offensichtlich, dass u = dx
dt und daher auch γu
konstant (d. h. zeitunabhängig) sein müssen, so dass (4.6) auch in der Form
•
˜
d
d
d
0 = γu
γu (ct, x) =
dt
dt
dτ

dxµ
dτ
‹
=
d2 xµ
dτ 2
geschrieben werden kann. Das Wirkungsfunktional (4.4) reproduziert also tatsächlich die Bewegungsgleichung des relativistischen kräftefreien Teilchens.
Nach dem Hamilton’schen Prinzip soll die Wirkung für die physikalische
Bahn bekanntlich extremal sein, und wir konnten diese Eigenschaft von SM für
die „echte“ (geradlinig-gleichförmige) Bewegung eines freien Teilchens in der Tat
nachweisen. Im Falle des Wirkungsfunktionals (4.4) kann man sogar relativ leicht
zeigen, dass die Wirkung für die physikalische Bahn auch minimal ist. Dies folgt
unschwer aus der Lorentz-Invarianz von SM : Wir nehmen an, dass der Abstand
zwischen den Ereignissen 1 und 2 zeitartig ist (sonst gäbe es keine Bahn zwischen
beiden). In diesem Fall gibt es ein Inertialsystem K ′ , in dem beide Ereignisse
am selben Ort auftreten (x′1 = x′2 ). Der Gesamtabstand zwischen 1 und 2,
′
Z2
Zt2
dt′
ds = c
1
t′1
1
γ (t′ )
,
u′
wird nun sicherlich durch ein in K ′ am Ort x′1 = x′2 ruhendes Teilchen (mit
u′ = 0 und daher γu′ = 1) maximiert, denn jede Bewegung (mit u′ 6= 0 und
daher γu′ > 1) führt zu einem kleineren Wert des Gesamtabstands. Folglich
minimiert das in K ′ ruhende Teilchen das Wirkungsfunktional, zumindest in
diesem speziellen Bezugssystem. Aus der Lorentz-Invarianz der Wirkung (4.4)
und dem gerade hergeleiteten Ergebnis in K ′ folgt nun mittels einer LorentzTransformation, dass die optimale Bahn in jedem Inertialsystem geradliniggleichförmig sein muss. Hiermit ist gezeigt, dass SM in (4.4) tatsächlich in allen
Inertialsystemen durch die physikalische Bahn minimiert wird.
108
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
Der verallgemeinerte Impuls eines Teilchens ist in der üblichen Art und Weise, nämlich gemäß
p=
m0 ẋ
∂L
= È
= γu m0 u ,
∂ ẋ
1 − (ẋ2 /c2 )
mit seiner Geschwindigkeit u verknüpft. Folglich gibt es auch eine einfache
Beziehung zwischen dem 3-Impuls und den räumlichen Komponenten der 4Geschwindigkeit uµ = γu (1, β u ):
pi = m0 γu ui = m0 cui
(i = 1, 2, 3) ,
wobei pi , ui und ui nun die i-te Komponente der 3-Vektoren p und u bzw.
des kontravarianten 4-Vektors uµ darstellen. Da die Lagrange-Funktion nicht
explizit von der Zeitvariablen abhängt, ist die Energie des Teilchens eine Erhaltungsgröße; sie ist wie üblich durch das Jacobi-Integral gegeben:
−
= p · ẋ − L = È
1 − (ẋ2 /c2 )
E(ẋ)
r
‚
m0 ẋ · ẋ
−m0 c
2
ẋ2
1− 2
c
= γu m0 c2 [β 2 + (1 − β2 )] = γu m0 c2 = m0 c2 u0
Œ
(4.7)
.
Kombination mit unserem Ergebnis für den 3-Impuls zeigt, dass der 4-Impuls
nun durch den kontra- bzw. kovarianter 4-Vektor
pµ ≡
€
E
c,
Š
p = m0 cuµ
,
pµ =
€
E
c,
Š
−p = m0 cuµ
dargestellt wird. Aus der Normierung der 4-Geschwindigkeit, uµ uµ = 1, folgt
noch
(m0 c)2 = (m0 c)2 uµ uµ = pµ pµ =
€ Š2
E
c
− p2
und daher für die Energie eines freien Teilchens als Funktion seines verallgemeinerten Impulses:
E(p) =
È
p2 c2 + m20 c4
(4.8)
.
Im nicht-relativistischen Limes reduzieren sich (4.7) und (4.8) auf die Ausdrücke
E(ẋ) = m0 c2 + 12 m0 ẋ2 + · · ·
,
E(p) = m0 c2 +
p2
+ ···
2m0
,
die neben der altbekannten kinetischen Energie auch die Ruheenergie m0 c2 enthalten. Es sei noch einmal darauf hingewiesen (s. Abschnitt 6.6 des Theorie-1Skripts), dass der Energienullpunkt eines Teilchens oder eines Körpers in der
Relativitätstheorie exakt festgelegt ist: Wird die Ruhemasse eines Teilchens vollständig in Strahlung umgewandelt, so ist die Restenergie per definitionem Null.
Dies steht im Gegensatz zur nicht-relativistischen Klassischen Mechanik, in der
der Energienullpunkt eines Körpers beliebig gewählt werden kann. Die Energie eines ultrarelativistischen Teilchens oder eines „Teilchens“ der Ruhemasse
m0 = 0 (z. B. eines Photons) folgt aus (4.8) als E = pc; der entsprechende
Impuls ist daher p = E/c.
109
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
Wir betrachten nun die Hamilton’sche Variante des kanonischen Formalismus. Mit der Energie-Impulsrelation (4.8) hat man auch bereits die Form der
Hamilton-Funktion eines kräftefreien Teilchens bestimmt:
È
p2 c2 + m20 c4
H(x, p; t) =
.
Die Hamilton-Gleichungen lauten:
ṗ = −
∂H
=0
∂x
,
ẋ =
∂H
pc2
= È
∂p
p2 c2 + m20 c4
.
Wir schließen hieraus wiederum, dass u = ẋ für das kräftefreie Teilchen konstant
ist, so dass eine geradlinig-gleichförmige Bewegung vorliegt.
Es sei noch darauf hingewiesen, dass der kanonische Formalismus nicht nur
für einzelne Punktteilchen („Elementarteilchen“), sondern auch für ausgedehnte
Körper anwendbar ist.
Wir zeigen nun, dass der kanonische Formalismus auch in manifest kovarianter Form darstellbar ist. Hierzu gehen wir von der Wirkung
Z2
SM = −m0 c
ds
1
aus und wenden das Prinzip der kleinsten Wirkung an, nach dem die Variation
der Wirkung bei festgehaltenen Endpunkten (δxµ1 = δxµ2 = 0),
Z2
δSM
=
−m0 c
δ(ds) = −m0 c
1
Z2
=
=
−m0 c
1
Z2
È
δ( dxµ dxµ )
1
dxµ
δ(dxµ ) = −m0 c
ds
Z2
2
−m0 cuµ δxµ + m0 c
δxµ
1
1
Z2
uµ d(δxµ )
1
duµ
ds
ds
(4.9)
Null sein soll für beliebige Variationen δxµ :
Z2
δxµ
δSM = m0 c
1
duµ
ds = 0 .
ds
µ
µ
Es folgt du
ds = 0, so dass die physikalische Bahn xφ wiederum einer geradliniggleichförmigen Bewegung entspricht.
Aus der nicht-relativistischen Mechanik ist bekannt, dass neben dem Impuls
und der Energie auch der Drehimpuls eines kräftefreien Teilchens (oder eines
Teilchens unter der Einwirkung von Zentralkräften) erhalten ist: Es gilt dL
dt = 0
mit
„
L≡x×p=
x2 p3 − x3 p2
x3 p1 − x1 p3
x1 p2 − x2 p1
Ž
,
Li = εijk xj pk
.
110
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
Man erwartet natürlich, dass dieses Erhaltungsgesetz in irgendeiner Form auch
in der Relativitätstheorie überlebt. Aufgrund der expliziten Gestalt des Pseudovektors L erscheint es plausibel, dass seine Komponenten den räumlich-räumlichen Anteil eines antisymmetrischen Tensors bilden könnten, ähnlich der Rolle
des B-Felds im elektromagnetischen Feldtensor F µν . Der Ansatz
Lµν = xµ pν − xν pµ
führt tatsächlich sofort zum Erfolg:
dLµν
ds
dxµ ν
dpν
dxν µ
dpµ
p + xµ
−
dp − xν
ds
ds
ds
ds
uµ pν − uν pµ = m0 c(uµ uν − uν uµ ) = 0
=
=
.
Der (echte) antisymmetrische Tensor 2. Stufe Lµν ist daher (im Falle des kräftefreien Teilchens) eine Erhaltungsgröße:
†
Lµν =
0
ℓ
0
−L3
L2
−ℓT
L3 −L2
0
L1
−L1
0

,
ℓ≡
E
x − pct .
c
Neben dem Drehimpuls ist also auch der Vektor ℓ erhalten, was lediglich bedeutet, dass das Teilchen sich mit konstanter Geschwindigkeit bewegt:
x=
c
ℓ + ut ,
E
u=
c2
p
p=
E
γu m0
.
Auch der Begriff des relativistischen Drehimpulses läßt sich auf Systeme mehrerer Teilchen verallgemeinern.
Wie üblich sind die hier hergeleiteten Erhaltungsgesetze mit Invarianzen
der Wirkung verknüpft. Die Impulserhaltung folgt aus der Translationsinvarianz im Ortsraum und die Energieerhaltung aus der Translationsinvarianz in der
Zeit. Die Erhaltung des Drehimpuls-4-Tensors ist eine Konsequenz der LorentzInvarianz. Zusammenfassend läßt sich also sagen, dass die hergeleiteten Erhaltungsgesetze die Invarianz des Systems unter Poincaré-Transformationen widerspiegeln.
4.2
Wechselwirkung mit dem elektromagnetischen Feld
Wir versuchen nun, ein Wirkungsfunktional für die Ankopplung der Teilchen
an das elektromagnetische Feld zu konstruieren. Wir wissen bereits aus unserer
Untersuchung der Dynamik nicht -relativistischer Teilchen, s. Abschnitt [2.2],
dass die Lagrange-Funktion in der nicht-relativistischen Theorie durch
L = LM + LWW
mit
LM =
1
mẋ2
2
,
LWW = q[ẋ · A(x, t) − Φ(x, t)]
(4.10)
111
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
gegeben ist, so dass der Wechselwirkungsterm in der nicht-relativistischen Wirkung die Form
Zt2
(4.11)
dt [u · A(x, t) − Φ(x, t)]
SWW = q
t1
hat. Andererseits ist es aufgrund unserer Erfahrungen mit kräftefreien relativistischen Teilchen naheliegend, zu fordern, dass auch der Wechselwirkungsterm
im Wirkungsfunktional Lorentz-invariant sein soll. Interessanterweise ist die
Wechselwirkung SWW in (4.11) bereits Lorentz-invariant. Mit uµ = γu (1, −β)
und Aµ = (Φ, cA) folgt nämlich, dass
Zt2
SWW = q
t1
dt
q
[γu β · (cA) − γu Φ] = −
γu
c
Z2
ds uν Aν
1
manifest Lorentz-invariant ist und somit auch den korrekten relativistischen
Ausdruck darstellt. Die Gesamtwirkung für das Wechselwirkungsproblem lautet
also:
Z2
SM+WW
q
−m0 c − uν Aν
c
ds
=
1
Zt2

dt
=
t1
q
−m0 c
2
1−
u2
c2
‹
+ qu · A − qΦ
(4.12)
,
wobei (4.11) mit dem Planck’schen Wirkungsfunktional (4.4) für das kräftefreie
Teilchen kombiniert wurde. Der Integrand in (4.12) stellt die Lagrange-Funktion
eines geladenen Teilchens in Wechselwirkung mit elektromagnetischen Feldern
dar.
Wir bestimmen zunächst die relevanten Ausdrücke für den kanonischen Impuls, die Energie und die Hamilton-Funktion. Der verallgemeinerte oder kanonische Impuls folgt aus der Lagrange-Funktion in (4.12) als
p=
∂L
= γu m0 u + qA = π + qA
∂u
,
wobei wir außerdem den kinetischen Impuls π ≡ p − qA = γu m0 u eingeführt
haben. Die entsprechenden 4-Vektoren sind durch
q
q
pµ = m0 cuµ + Aµ = π µ + Aµ
c
c
,
q
π µ ≡ pµ − Aµ = m0 cuµ
c
(4.13)
gegeben. Die Hamilton-Funktion folgt in gewohnter Weise durch eine LegendreTransformation aus der Lagrange-Funktion:
H
∂L
−L
∂u
=
u·
=
u · (γu m0 u + qA) −
=
γu m0 c
2
u2
1
+ 2
c2
γu
−m0 c2
+ qu · A − qΦ
γu
+ qΦ = γu m0 c2 + qΦ(x, t)
,
(4.14)
112
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
wobei allerdings (analog zum nicht-wechselwirkenden Fall) die Geschwindigkeit
u durch den kanonischen Impuls p zu ersetzen ist:
È
H(x, p; t) =
π2 c2 + m20 c4 + qΦ
É
€
Š2
p − qc A
=
c2 + m20 c4 + qΦ
(4.15)
.
0
Ein Vergleich von (4.14) und (4.13) zeigt, dass die zeitliche
€
ŠKomponente p des
4-Impulses nun durch H/c gegeben ist, so dass pµ = Hc , p gilt. Die HamiltonFunktion (4.14) oder (4.15) darf nun jedoch nicht als die Energie des Teilchens
interpretiert werden: Der erste Term im rechten Glied von (4.14) oder (4.15)
stellt zwar - wie im nicht-wechselwirkenden Fall - die kinetische Energie inklusive
der Ruheenergie dar, aber der zweite Term kann nicht als potentielle Energie
interpretiert werden (er ist nicht einmal eichinvariant). Wir folgern hieraus, dass
die Summe von kinetischer Energie und Ruheenergie nach wie vor durch
E(u) = γu m0 c2 = È
È
m 0 c2
1 − u2 /c2
=
π 2 c2 + m20 c4
(4.16)
gegeben ist, nun aber im Allgemeinen (wegen der Wechselwirkung mit dem elektromagnetischen Feld) keine Erhaltungsgröße sein kann. Dies alles ist natürlich
vollkommen analog zur nicht-relativistischen Theorie.
Wir betrachten noch einmal die Wirkung (4.12) in manifest kovarianter Form
und leiten die Bewegungsgleichung für ein relativistisches geladenes
Teilchen im
È
elektromagnetischen Feld her. Mit Hilfe der Identität ds = dxµ dxµ erhalten
wir aufgrund des Hamilton’schen Prinzips:
Z2
0 =
δSM+WW = δ
1
Z2 •
=
1
=
−m0 c
(−m0 c ds − qc Aν dxν )
dxµ
d(δxµ ) − qc Aν d(δxν ) − qc (∂ µ Aν )(δxµ )dxν
ds
˜
2
−(m0 cuµ + qc Aµ )δxµ 1
Z2
+
δxµ
1
2 µ
dxν
dxν
d x
− qc (∂ µ Aν )
m0 c 2 + qc (∂ ν Aµ )
ds . (4.17)
ds
ds
ds
Man erhält die Bewegungsgleichung des geladenen Teilchens wie gewohnt als Bestimmungsgleichung für den stationären Punkt von SM+WW bei einer Variation
mit festgehaltenen Endpunkten:
2 µ
d2 xµ
2d x
=
m
c
= quν (∂ µ Aν − ∂ ν Aµ ) = quν F µν = K µ .
0
dτ 2
ds2
Die Wirkung (4.12) beschreibt also tatsächlich die relativistische Dynamik eines
geladenen Teilchens unter der Einwirkung der Lorentz-Kraft.
Die relativistische Bewegungsgleichung kann alternativ auch in der Form
m0
m0
d2 xµ
dτ 2
=
=
d
dπ µ
(cuµ ) = γu
dt
dt
K µ = qγu (E · βu , E + u × B)
m0 γu
113
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
geschrieben werden. Mit π µ = m0 cuµ = γu m0 c(1, βu ) folgt daher einerseits für
den dreidimensionalen kinetischen Impuls:
dπ
= q(E + u × B) ,
dt
(4.18)
π = γu m 0 u
und andererseits für die zeitliche Änderung der Energie (4.16) des Teilchens
durch Wechselwirkung mit dem elektromagnetischen Feld:
d
d
dE
= (γu m0 c2 ) = (π 0 c) = qE · u ,
(4.19)
dt
dt
dt
wobei das rechte Glied die Leistung darstellt, die das elektromagnetische Feld
am Teilchen verrichtet. Da die Energieänderung unmittelbar aus (4.16) und der
Bewegungsgleichung für den kinetischen Impuls folgt,
c2 π · dπ
dE
q
dt
π · (E + u × B) = qE · u ,
= È
=
2
dt
γ
2
2
4
u m0
π c + m0 c
und die zweite der beiden Gleichungen (4.18) und (4.19) daher redundant ist,
reicht es, sich bei der Untersuchung der Dynamik eines geladenen Teilchens auf
die erste dieser beiden Gleichungen zu beschränken.
Interessant ist noch, dass auch die relativistischen Bewegungsgleichungen
(4.18) und (4.19) invariant sind unter Zeitumkehr, da in diesem Fall (π, t, u, B)
das Vorzeichen wechseln und q und E invariant sind. Analog findet man, dass
(4.18) und (4.19) invariant sind unter einer Raumspiegelung am Ursprung, wobei
die Felder gemäß E → −E und B → B transformiert werden.
Abgesehen von diesen diskreten Symmetrien weist die Theorie zwei kontinuierliche Symmetrien auf, denn abgesehen von der offensichtlichen LorentzInvarianz der Wirkung liegt wiederum eine Eichinvarianz vor: Ersetzt man das
4-Potential Aµ durch (A′ )µ ≡ Aµ + ∂ µ Λ, wobei Λ - wie wir in der Theorie-1Vorlesung gesehen haben - unbedingt ein Lorentz-Skalar sein muss, damit der
4-Vektorcharakter von Aµ erhalten bleibt, dann wird die Wirkung gemäß
S→S
′
=
Z2 ”
1
—
−m0 c ds − qc dxν (Aν + ∂ ν Λ)
Z2
=
S−
q
c
Z2
ν
1
(∂ Λ)dxν = S −
q
c
1
dΛ = S − qc [Λ(2) − Λ(1)]
transformiert. Man sieht also einerseits, dass sich bei einer Variation der Wirkung bei festgehaltenen Endpunkten nichts ändert: Die von S und S ′ vorhergesagten physikalischen Bahnen sind identisch. Andererseits ist klar, dass die
Transformationseigenschaften der Wirkung sich nicht durch die Eichtransformation ändern: Die Wirkung S ′ ist Lorentz-invariant, wenn S dies ist, da die
Funktion Λ in der Eichtransformation ein Lorentz-Skalar sein muss.
4.3
Das Coulomb-Problem für ein einzelnes Teilchen
Wir betrachten nun die Dynamik eines geladenen relativistischen Teilchens (mit
der Ladung q und der Ruhemasse m0 ) in einem Zentralpotential der Form
114
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
q0
mit x ≡ |x|; das Vektorpotential sei A(x) = 0. Dieses Modell
Φ(x) = 4πε
0x
beschreibt die Bewegung eines geladenen Teilchens im Coulomb-Feld eines anderen, immobilen Teilchens der Ladung q0 , das sich im Ursprung x = 0 befindet.
Das 4-Potential Aµ = (Φ, cA) erfüllt im Ruhesystem der immobilen Masse sowohl die Coulomb- als auch die Lorenz-Eichung. Die Wirkung dieses Problems
ist
É
Zt2
dt −m0 c
S=
t1
2
1−
€ Š2
ẋ
c
− qΦ(x)
,
die Bewegungsgleichung lautet
dπ
= qE
dt
,
E = −∇Φ =
π = γu m 0 u ,
q0 êx
4πε0 x2
,
und es gibt zwei offensichtliche Erhaltungsgrößen, nämlich erstens den Drehimpuls L = x × π:
d
dπ
dL
= (x × π) = u × π + x ×
= x × (qE) = 0
dt
dt
dt
È
0
und zweitens die Gesamtenergie Eg =
π 2 c2 + m20 c4 − xa (mit a ≡ −qq
4πε0 ),
die wegen der Zeitunabhängigkeit der Lagrange-Funktion gleich der HamiltonFunktion ist:
dEg
dt
=
dπ
dt
c2 π ·
È
π 2 c2 + m20 c4
= u· −
+
a dx
c2 π · (qE)
a dx
+ 2
=
2
2
x dt
γm0 c
x dt
a
a a dx
êx + 2
= 2
2
x
x dt
x

‹
dx
− u · êx = 0
dt
.
Im nicht-relativistischen Grenzfall,
Zt2
dt
SNR =
”
2
1
2 m0 ẋ
t1
—
− qΦ(x)
,
in dem π = m0 u gilt, existiert noch eine dritte Erhaltungsgröße, der „Lenz’sche
Vektor“
a ≡ u × L − aêx
,
da
=0 ,
dt
a·L=0 ,
der vom Brennpunkt der elliptischen Bahn zum „Perihel“ (also zum Punkt der
Umlaufbahn, der dem Zentrum am nächsten liegt) zeigt. Für EgNR < 0 sind alle
Bahnen im nicht-relativistischen Grenzfall bekanntlich geschlossen.
Wir bestimmen nun die Lösung der relativistischen Bewegungsgleichungen.
Genau wie im nicht-relativistischen Fall ist es hierbei vorteilhaft, den Drehimpuls in ê3 -Richtung zu wählen und die Umlaufbahn, die nun in der (x1 , x2 )Ebene verläuft, mit Hilfe von Polarkoordinaten zu beschreiben:
L = −m0 c2
È
1−
1
2
c2 (ẋ
+ x2 ϕ̇2 ) +
a
x
.
115
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
Die zu x und ϕ konjugierten Impulse sind
∂L
= γm0 ẋ ≡ πx
∂ ẋ
,
∂L
= γm0 x2 ϕ̇ ≡ πϕ
∂ ϕ̇
,
und die Euler-Lagrange-Gleichungen lauten

‹
d ∂L
=
dt ∂ ẋ

‹
d ∂L
=
dt ∂ ϕ̇
dπx
∂L
a
=
= γm0 xϕ̇2 − 2
dt
∂x
x
dπϕ
∂L
=
=0 .
dt
∂ϕ
Da die Lagrange-Funktion ϕ-unabhängig (und ϕ daher eine zyklische Variable) ist, stellt πϕ eine Erhaltungsgröße dar; im Wesentlichen ist πϕ durch den
Drehimpuls gegeben:
L = x × π = γm0 x × u = γm0 x × (ẋêx + xϕ̇êϕ )
= γm0 x2 ϕ̇(êx × êϕ ) = πϕ ê3
,
so dass (wie im nicht-relativistischen Fall) πϕ = |L| gilt.
Man zeigt nun leicht, dass Kreisbahnen nur dann möglich sind, wenn der
dimensionslose Parameter ā ≡ πaϕ c Werte im Intervall 0 < ā < 1 annimmt: Für
eine Kreisbahn (mit πx = γm0 ẋ = 0 und daher
a = γm0 x3 ϕ̇2 > 0 und andererseits
a = γm0 x3 ϕ̇2 = πϕ xϕ̇ = πϕ |u| = βu πϕ c
dπx
dt
= 0) gilt nämlich einerseits
,
so dass insgesamt 0 < ā = βu < 1 gilt. Man sollte hierbei bedenken, dass der
Parameter ā bei geeigneter Wahl der Ladungen q und q0 grundsätzlich jeden
reellen Wert annehmen kann (ā ∈ R). Der Radius der Kreisbahn folgt für 0 <
ā < 1 als:
x=
a
ā|L|c
|L| p
1 − ā2
=
=
γm0 |u|2
γm0 c2 βu2
m0 cā
,
so dass für ā ↑ 1 bei festem |L| offenbar x ↓ 0 gilt.
Um die Form allgemeiner Bahnen zu bestimmen, verwenden wir die Erhaltungsgesetze für die Gesamtenergie Eg und den Drehimpuls L. Wegen
π = γm0 (ẋêx + xϕ̇êϕ ) = πx êx +
πϕ
êϕ
x
gilt für die (erhaltene) Gesamtenergie:
q
È
2
a
a
+
− = c (πx )2 + Lx2 + (m0 c)2 −
Eg =
x
x
und daher für den Impuls in radialer Richtung:
π 2 c2
m20 c4
(πx )2 = (γm0 ẋ)2 =
1 a 2 L2
− 2 − (m0 c)2
E
+
g
c2
x
x
.
Dividiert man das linke und das rechte Glied nun durch (πϕ )2 = L2 , so erhält
1
man eine gewöhnliche Differentialgleichung für x(ϕ)
:
d(x−1 )
dϕ
2

=
γm0 ẋ
γm0 x2 ϕ̇
‹2
=
πx
πϕ
2
=
2
m0 c
1 a 2 1
−
E
+
−
g
πϕ2 c2
x
x2
πϕ
.
116
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
Mit Hilfe des dimensionslosen Parameters ā ≡
d(x−1 )
dϕ
2
a
πϕ c
erhalten wir den Ausdruck:
=
Eg2 − (m0 c2 )2
1
Eg ā 1
− (1 − ā2 ) 2 + 2
2
(πϕ c)
x
πϕ c x
=
Eg2 − (m0 c2 )2
Eg ā
1
− (1 − ā2 )
−
(πϕ c)2
x πϕ c(1 − ā2 )
(4.20)
2
+
Eg2 ā2
(πϕ c)2 (1 − ā2 )
Eg2 − (m0 c2 )2 (1 − ā2 )
1
Eg ā
− (1 − ā2 )
−
2
2
(πϕ c) (1 − ā )
x πϕ c(1 − ā2 )
=
2
.
(4.21)
Führen wir noch die dimensionslose Länge
ξ≡
|a|m0 x
|ā|m0 cx
=
2
πϕ
πϕ
und die dimensionslosen Parameter
r
Eg
η≡
m 0 c2
,
1−
ε≡
1 − η2
ā2
ein, dann erhalten wir für ā2 = 1 aus (4.20):
dξ −1
dϕ
2
= sgn(ā)
2η
+ η2 − 1
ξ
und für ā2 6= 1 aus (4.21):
dξ −1
dϕ
2
=
•
1 sgn(ā)η
ε2
− (1 − ā2 )
−
1 − ā2
ξ
1 − ā2
˜2
.
Im Folgenden konzentrieren wir uns auf attraktive Coulomb-Wechselwirkung
zwischen den beiden Ladungen, d. h. wir betrachten ā > 0. In diesem Fall erhalten wir die Gleichungen:
dξ −1
dϕ
dξ −1
dϕ
2
=
2η
− (1 − η 2 )
ξ
=
η
ε2
1
− (1 − ā2 )
−
1 − ā2
ξ
1 − ā2
2
(4.22)
(ā = 1)

‹2
(0 < ā 6= 1) , (4.23)
die leicht mit Standardmethoden lösbar sind.
Die Lösung von (4.22) folgt aus
È
d(ξ −1 )
2η
ξ
− (1 − η 2 )
• q
=d
1
η
2η
ξ
˜
− (1 − η 2 ) = ±dϕ = d[±(ϕ − ϕ0 )]
als
2η
= η 2 (ϕ − ϕ0 )2 + (1 − η 2 ) bzw.
ξ
ξ=
η 2 (ϕ
2η
. (4.24)
− ϕ0 )2 + (1 − η 2 )
Für η < 1 folgt ξ ↓ 0 für ϕ → ∞, so dass sich das Teilchen mit der Ladung q im
Falle ā = 1 spiralförmig in das Anziehungszentrum im Ursprung hineinbewegt!
117
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
Das gleiche Ergebnis erhält man für η > 1, falls ẋ(0) < 0 (oder äquivalent:
ϕ(0) > ϕ0 ) gilt. Falls η > 1 und ẋ(0) > 0 (oder äquivalent: ϕ(0) < ϕ0 ) gilt,
verschwindet das Teilchen ins Unendliche (ξ → ∞ für t → ∞).
Um Gleichung (4.23) für ξ(ϕ) mit ā 6= 1 zu lösen, führen wir die Hilfsvariablen
X
−1
|1 − ā2 |
≡
ε

1
η
−
ξ
1 − ā2
‹
,
Φ≡
È
|1 − ā2 | ϕ
ein und erhalten die Differentialgleichung
dX −1
dΦ
2
= sgn(1 − ā2 )(1 − X −2 ) ,
deren Lösung für schwache Coulomb-Anziehung (0 < ā < 1) die Form
X −1 = cos(Φ − Φ0 )
bzw.
”p
—©
1 1
2 (ϕ − ϕ )
η
+
ε
cos
1
−
ā
=
0
ξ
1 − ā2
(4.25)
und für starke Coulomb-Anziehung (ā > 1) die Form
X −1 = cosh(Φ − Φ0 )
bzw.
”p
—©
1 1
= 2
−η + ε cosh
ā2 − 1 (ϕ − ϕ0 )
ξ
ā − 1
(4.26)
hat. Die Lösung (4.26) im Falle starker Anziehung zeigt also dasselbe Phänomen
ξ ↓ 0 für ϕ → ∞, das auch bereits aus der Lösung (4.24) für ā = 1 hervorging,
allerdings sagt (4.26) keine algebraische
Spirale (mit ξ ∝ ϕ−2 ), sondern exponen√
2
tielles Verhalten voraus: ξ ∝ e− ā −1ϕ . Interessant an den Lösungen (4.24) und
(4.26) für ā ≥ 1 ist noch, dass die Zeit, die das Teilchen der Ladung q benötigt,
um in den Ursprung hineinzufallen, endlich ist. Außerdem ist interessant, dass
für ā ≥ 1 und η ≥ 1 zwar ξ → ∞ gilt (wie man für einen Streuzustand erwartet),
falls anfangs ϕ < ϕ0 ist; für einen Anfangswert ϕ > ϕ0 folgt jedoch ξ ↓ 0 für
ϕ → ∞. Wir schließen hieraus, dass Zustände, die man nicht-relativistisch als
Streuzustände klassifizieren würde, in der Relativitätstheorie durchaus gebunden sein können.
Die Lösung für schwache Coulomb-Anziehung (ā < 1) zeigt einige Gemeinsamkeiten mit der nicht-relativistischen Lösung, aber auch drastische Unterschiede. Im nicht-relativistischen Limes (ā → 0, η → 1) reduziert sich die Lösung (4.25) auf die bekannte Form der nicht-relativistischen Umlaufbahn,
ξ=
x
1
=
p
1 + ε cos(ϕ − ϕ0 )

p=
L2
m0 a
q
,
ε=
1+
2ENR L2
m0 a2
‹
,
die für ε < 1 eine Ellipse, für ε = 1 eine Parabel und für ε > 1 eine Hyperbel
beschreibt. Allgemein gilt für ā < 1 die von der nicht-relativistischen Lösung
118
---------------------------------------------------------------------------------------------- 4. RELATIVISTISCHE DYNAMIK
bekannte Klassifizierung nach Bindungszuständen (η < 1), für die ξ immer endlich bleibt, und Streuzuständen (η ≥ 1), für die im Langzeitlimes ξ → ∞ gilt.
Im Gegensatz zur nicht-relativistischen Lösung sind die relativistischen Umlaufbahnen jedoch im Allgemeinen nicht geschlossen und somit nicht-periodisch als
Funktion der Zeit2 :
ξ(ϕ + 2π) 6= ξ(ϕ)
.
Es ist klar, dass mit der Nicht-Geschlossenheit der Umlaufbahn auch der Verlust
der dritten Erhaltungsgröße (also des Lenz’schen Vektors) einhergeht, denn der
Lenz’sche Vektor markiert ja gerade die räumliche Ausrichtung der periodisch
durchlaufenen Umlaufbahn.
√
in Ausnahmefällen, z. B. wenn 1 − ā2 = m
< 1 (mit m, n ∈ N+ teilerfremd)
n
gilt, erhält man geschlossene Bahnen; im angegebenen Beispiel enthält eine Periode genau n
Umläufe um den Ursprung.
2 Nur
119
Literaturverzeichnis
[1] Dare A. Wells, Lagrangian Dynamics, McGraw-Hill (New York, 1967).
[2] Herbert Goldstein, Classical Mechanics, Addison-Wesley (Reading, 1978).
[3] F. Scheck, Mechanik - Von den Newton’schen Gleichungen zum deterministischen Chaos, Springer Verlag (7. Auflage, 2002).
[4] H. C. Corben, Philip Stehle, Classical Mechanics, Dover (New York, 1994).
[5] Cornelius Lanczos, The variational principles of mechanics, Fourth Edition,
Dover (New York, 1986).
[6] L. D. Landau, E. M. Lifschitz, Lehrbuch der Theoretischen Physik, Band I,
Akademie-Verlag (Berlin, 1981).
[7] V. I. Arnold, Mathematical Methods of Classical Mechanics, SpringerVerlag (New York, 1978).
[8] E. T. Whittaker, A treatise on the analytical dynamics of particles and rigid
bodies, Cambridge Univ. Press (Cambridge, 1965).
[9] F. Klein, A. Sommerfeld, Über die Theorie des Kreisels, B. G. Teubner
(Stuttgart, 1965).
[10] W. Rindler, Introduction to Special Relativity, Oxford University Press (Oxford, 1991).
[11] R. U. Sexl, H. K. Urbantke, Relativity, Groups, Particles, Springer-Verlag
(Berlin, 2001).
[12] Carl D. Murray, Stanley F. Dermott, Solar System Dynamics, Cambridge
University Press (Cambridge, 1999).
[13] J. M. A. Danby, Fundamentals of Celestial Mechanics, Willmann-Bell
(Richmond, Virginia, 1988).
Mathematische Handbücher:
[14] M. Abramowitz, I. A. Stegun, Handbook of Mathematical Functions, Dover
(New York, 1970)
------------------------------------------------------------------------------------------------------------ LITERATURVERZEICHNIS
[15] I. S. Gradshteyn, I. M. Ryzhik, Table of Integrals, Series and Products,
Academic Press (New York, 1980)
121
Herunterladen